Handbuch Satz, Äußerung, Schema 9783110295719, 9783110296037, 9783110393859

New Handbook Series HSW What is the level of complexity of sentences and utterances? How do they relate to schemata? I

255 70 3MB

German Pages 596 Year 2015

Report DMCA / Copyright

DOWNLOAD PDF FILE

Table of contents :
Inhaltsverzeichnis
Einleitung
I Grundfragen
1. System und Performanz
2. Grundeinheiten der Sprache und des Sprechens
3. Grammatik und Multimodalität
4. Zum Erwerb syntaktischer Konstruktionen
5. Syntaktische Einheitenbildung ? typologisch und diachron betrachtet
6. Syntaktische Schemabildung – zeichentheoretisch betrachtet
II Satz
7. Satz – oberflächennah
8. Sentences and clauses – from the perspective of Interactional Linguistics
9. Satz – aus Sicht der Generativen Grammatik
10. Satz in der Schulgrammatik
11. Satzaufbau und Verbvalenz
12. Ellipsen
III Äußerung
13. Syntax und moderne Pragmatik
14. Einheiten des pragmatischen Standards
15. Einheiten der gesprochenen und der geschriebenen Sprache
16. Syntaktische Phänomene in der gesprochenen Sprache
17. Einheitenbildung in der Deutschen Gebärdensprache
18. Repetition als Mittel der Musterbildung bei redebegleitenden Gesten
IV Schema
19. Schema – Muster – Konstruktion
20. Muster – kulturanalytisch betrachtet
21. Muster aus korpuslinguistischer Sicht
22. Konstruktionen in der geschriebenen Sprache
23. Konstruktionen in unterschiedlichen medialen Kontexten
24. Was ist (k)eine Konstruktion?
Sachregister
Recommend Papers

Handbuch Satz, Äußerung, Schema
 9783110295719, 9783110296037, 9783110393859

  • 0 0 0
  • Like this paper and download? You can publish your own PDF file online for free in a few minutes! Sign Up
File loading please wait...
Citation preview

Handbuch Satz, Äußerung, Schema HSW 4

Handbücher Sprachwissen

Herausgegeben von Ekkehard Felder und Andreas Gardt

Band 4

Handbuch Satz, Äußerung, Schema Herausgegeben von Christa Dürscheid und Jan Georg Schneider

ISBN 978-3-11-029571-9 e-ISBN [PDF] 978-3-11-029603-7 e-ISBN [EPUB] 978-3-11-039385-9 Library of Congress Cataloging-in-Publication Data A CIP catalog record for this book has been applied for at the Library of Congress. Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen National­ bibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.dnb.de abrufbar. © 2015 Walter de Gruyter GmbH, Berlin/Boston Typesetting: fidus Publikations-Service GmbH, Nördlingen Printing and binding: CPI books GmbH, Leck ♾ Printed on acid-free paper Printed in Germany www.degruyter.com

Inhaltsverzeichnis Christa Dürscheid/Jan Georg Schneider Einleitung   IX

I Grundfragen Christian Stetter 1. System und Performanz 

 3

Arnulf Deppermann/Nadine Proske 2. Grundeinheiten der Sprache und des Sprechens  Ellen Fricke 3. Grammatik und Multimodalität 

 17

 48

Clemens Knobloch/Josephine Krüger 4. Zum Erwerb syntaktischer Konstruktionen  

 77

Renata Szczepaniak 5. Syntaktische Einheitenbildung ‒ typologisch und diachron betrachtet   104 Jan Georg Schneider 6. Syntaktische Schemabildung – zeichentheoretisch betrachtet 

II Satz Gisela Zifonun 7. Satz – oberflächennah 

 155

Margret Selting 8. Sentences and clauses – from the perspective of Interactional Linguistics   180 Peter Öhl Satz – aus Sicht der Generativen Grammatik  9.

 205

 125

VI 

 Inhaltsverzeichnis

Mechthild Habermann 10. Satz in der Schulgrammatik 

 231

Klaus Welke 11. Satzaufbau und Verbvalenz 

 255

Mathilde Hennig 12. Ellipsen 

 279

III Äußerung Frank Liedtke 13. Syntax und moderne Pragmatik 

 299

Sven Staffeldt 14. Einheiten des pragmatischen Standards 

 326

Stephan Stein 15. Einheiten der gesprochenen und der geschriebenen Sprache  Reinhard Fiehler 16. Syntaktische Phänomene in der gesprochenen Sprache  Gisela Fehrmann 17. Einheitenbildung in der Deutschen Gebärdensprache 

 370

 396

Jana Bressem 18. Repetition als Mittel der Musterbildung bei redebegleitenden Gesten   422

IV

Schema

Jörg Bücker 19. Schema – Muster – Konstruktion 

 445

Susanne Tienken Muster – kulturanalytisch betrachtet  20. Noah Bubenhofer Muster aus korpuslinguistischer Sicht  21.

 464

 485

 345

Inhaltsverzeichnis 

Alexander Lasch Konstruktionen in der geschriebenen Sprache  22.

 503

Georg Albert 23. Konstruktionen in unterschiedlichen medialen Kontexten  Wolfgang Imo 24. Was ist (k)eine Konstruktion?  Sachregister 

 577

 551

 527

 VII

Christa Dürscheid/Jan Georg Schneider

Einleitung

Das vorliegende Handbuch ist drei zentralen Konzepten der Sprachwissenschaft gewidmet, die zwischen der Wort- und der Text- bzw. Gesprächsebene liegen. Es geht – so könnte man es formulieren – um die ‚Syntax der mittleren Ebene‘: den Satz, die Äußerung und das Schema. Wie es der Grundintention der gesamten Reihe entspricht, sollen diese drei Begriffe vor dem Hintergrund aktueller Forschungsdiskurse und unabhängig von disziplinären Zwängen reflektiert werden. In diesem Kontext stellen sich u. a. die folgenden Fragen, die wir bereits in unserem Beitrag zum Auftaktband der HSW-Reihe diskutiert haben: „Auf welcher Komplexitätsebene liegen Sätze und Äußerungen? In welcher Relation stehen beide zu Schemata? Und wie verhalten sich diese Analysekategorien zu den drei sprachlichen Modalitäten, der geschriebenen, gesprochenen und gebärdeten Sprache?“ (Dürscheid/Schneider 2015, 168). Damit einher geht die grundsätzliche Frage, wie sich traditionelle grammatische Beschreibungskategorien, die gemeinhin auf die geschriebene Sprache bezogen sind, zu den Grundeinheiten der gesprochenen und gebärdeten Sprache verhalten. Ist z. B. der Satzbegriff für die Analyse gesprochener Sprache überhaupt relevant, sind die Gliederungsprinzipien im Gesprochenen und Gebärdeten nicht andere als im Geschriebenen? Diese und andere Fragen werden in den Teilen II (Satz), III (Äußerung) und IV (Schema) des vorliegenden Bandes behandelt. Hier wird auch deutlich werden, dass die drei Modalitäten von Sprache unterschiedlichen Produktions- und Rezeptionsbedingungen unterliegen, die dazu führen, dass sie ihre je eigene Syntax herausbilden. Vorweg aber werden in Teil I grundsätzliche Überlegungen angestellt, die sich auf den Erwerb syntaktischer Konstruktionen, auf das Verhältnis von System und Performanz, Grammatik und Multimodalität sowie Aspekte der linguistischen Einheitenbildung beziehen. In diesem Zusammenhang wird die grundsätzliche Frage gestellt, ob ‚Satz‘ als eine Kompetenz/Langue- oder als eine Performanz/Parole-Kategorie zu betrachten ist. Generative Ansätze neigen zu Ersterem; andere Zugänge sehen ‚Satz‘ eher als Einheit der geschriebenen Sprache, ‚Äußerung‘ als Einheit der gesprochenen Sprache (und somit beide als Parole-Kategorien). Wie es die Schrägstrichschreibung in dem Begriffspaar Kompetenz/Langue bzw. Performanz/Parole bereits andeutet, wird in dieser Einleitung zwischen den Begriffen ‚Kompetenz‘ und ‚Langue‘ bzw. ‚Performanz‘ und ‚Parole‘ bewusst changiert. Der Grund ist darin zu sehen, dass wir uns nicht auf eine bestimmte Schule festlegen wollen. Dennoch können einige basale Definitionsmerkmale wohl als unstrittig gelten: Der Ausdruck Kompetenz betont den Aspekt des Könnens (Knowing-how) bzw. des sprachlichen ‚Wissens‘ im Chomsky’schen Sinne, der Ausdruck Langue den Systemaspekt von Sprache; beide betreffen in jedem Fall die Ebene der sprachlichen Potenzialität. Auch die Termini Performanz und Parole stammen fachgeschichtlich aus

X 

 Christa Dürscheid/Jan Georg Schneider

unterschiedlichen Diskursen, lassen sich aber – systematisch betrachtet – synonym verwenden: Sie beziehen sich auf die Ebene der Aktualisierung von Sprache, d. h. auf den (mündlichen, schriftlichen oder gebärdeten) Sprachgebrauch. Zusätzlich zu dieser Zweiteilung in Langue (Sprachsystem) und Parole (individuelles Verwenden von Sprache) wurde von Eugenio Coseriu eine dritte Ebene eingefügt, die hier ebenfalls Erwähnung finden soll: die Norm (vgl. Coseriu 2007, 52–57). Aus mehreren Gründen vertritt Coseriu die Auffassung, dass die Saussure’sche Zweiteilung in Langue und Parole „unzulänglich“ sei (ebd., 60). Zum einen handle es sich dabei seiner Auffassung nach um eine asymmetrische Relation, da Parole die „gesamte Tätigkeit des Sprechens“ bezeichne, Langue sich aber nur auf die einzelsprachlichen Systeme (Französisch, Niederländisch usw.) beziehe und universale Aspekte des „Sprechenkönnens“ ausklammere (ebd., 60). Da die Langue zudem alles umfasse, was im jeweiligen Sprachsystem möglich ist, müsse auf der Ebene der Sprachkompetenz (im Coseriu’schen Sinne) zusätzlich der Aspekt der „Annehmbarkeit“ (Akzeptabilität) berücksichtigt werden (vgl. hierzu auch Hymes 1972, 284–286). So gebe es sprachliche Äußerungen, z. B. in den Texten von Christian Morgenstern (vgl. Coseriu 2007, 46 und 52), die zwar sprachlich „korrekt“ seien, jedoch im Deutschen „nicht üblich“ und darum „in gewissen Kontexten und außerhalb von Kontexten nicht annehmbar“. Für Coseriu sind Korrektheit und Annehmbarkeit folglich „zwei Ebenen der Kompetenz, die beide in der Performanz realisiert werden“ (ebd., 52). Nicht bei allen Äußerungen, die dem System nach ‚möglich‘ und in diesem Sinne korrekt sind, handelt es sich, so Coserius Argumentation, um gebräuchliche und akzeptierte Formen. Mit anderen Worten: Manche Formulierungen sind zwar vom System her möglich, entsprechen aber nicht der Norm (ebd., 52 f.), also dem, was in einem bestimmten Kontext die übliche, normale Realisierung eines sprachlichen Phänomens darstellt. Die Kategorie ‚Norm‘ bildet damit in gewisser Weise ein Bindeglied zwischen Langue und Parole, denn sie bezieht sich auf soziale – diatopisch, diastratisch und diaphasisch differenzierte – Gepflogenheiten, von denen im individuellen Sprechen, Gebärden oder Schreiben immer wieder, bewusst oder unbewusst, abgewichen wird. Und solche Abweichungen, die zunächst oft als Fehler, möglicherweise aber auch als kreative Eigenheiten empfunden werden, stellen einen wichtigen Faktor im Sprachwandel dar. Mit der Einführung der Normebene bringt Coseriu einen relevanten Aspekt ins Spiel, der in der strukturalistisch rezipierten Unterscheidung zwischen Sprachsystem und -verwendung kaum berücksichtigt wird: Im „Cours de linguistique générale“, der von den Herausgebern Sechehaye und Bally bekanntlich stark bearbeitet wurde, wird die Parole als rein individuell, die Langue als rein sozial beschrieben (GRF, 16/CLG, 30); die jeweilige Parole erscheint als bloße „Aufführung“ der „Symphonie“ Langue (GRF, 21/CLG, 36); Wechselwirkungen zwischen beiden werden bei dieser Metaphorik nicht in Rechnung gestellt. Dass Saussure das Verhältnis von Parole und Langue demgegenüber sehr wohl als ein differenziertes dialektisches Wechselspiel auf indi-

Einleitung 

 XI

vidueller und sozialer Ebene betrachtete, zeigen die Mitschriften seiner Vorlesungen sowie die von Saussure selbst verfassten Notizen, die in seinem Nachlass gefunden wurden (vgl. Jäger 2010; Schneider in diesem Band). Ob bei einer solchen Konzeption die dritte Ebene, die der ‚Norm‘, noch notwendig ist oder in der komplexen Wechselwirkung von Langue und Parole bereits erfasst wird, sei hier dahingestellt; Coserius Kritik am überlieferten Cours scheint jedenfalls berechtigt zu sein. Wie auch immer man im Einzelnen zur Langue-Parole- bzw. zur KompetenzPerformanz-Unterscheidung stehen mag – es kann in der Linguistik als weitgehend unstrittig gelten, dass konzeptionell zwischen einer Ebene der Potenzialität und einer Ebene der Aktualisierung unterschieden werden muss. Wenn alles in der Sprache nur Performanz wäre, dann gäbe es keine Schematisierung bzw. Muster- oder Typenbildung und auch keine Möglichkeit, auf Regelwissen oder verfestigte Konstruktionen zurückzugreifen. Ein solches Bild menschlicher Sprache wäre in hohem Maße unplausibel und könnte eine Vielzahl von Phänomenen nicht erklären. Ein Ziel unseres Bandes ist es, dieses komplexe Verhältnis von Langue, Parole und Schematisierung auf syntaktischer Ebene schulenübergreifend auszuloten und damit nicht zuletzt auch die traditionelle Zweiteilung von ‚System-‘ und ‚Prag­­ma­linguistik‘ zur Disposition zu stellen. Statt tradierte Gräben zwischen den verschiedenen linguistischen Schulen weiter zu zementieren, wollen wir auf diese Weise Brücken zwischen eher ‚kompetenzorientierten‘ und eher ‚performanzorientierten‘ Ansätzen bauen und das Aktuelle oder Bedenkenswerte an den unterschiedlichen Herangehensweisen zur Diskussion stellen. Neue Impulse erwarten wir uns auch davon, die Gesten- und die Gebärdensprachforschung systematisch in die Diskussion einzubeziehen und die im Titel genannten Begriffe somit nicht nur – wie traditionell üblich – auf die gesprochene und geschriebene Sprache zu beziehen. Damit kommen wir zur Gliederung des vorliegenden Bandes: Unsere Absicht war es, die 24 Beiträge so zusammenzustellen, dass sie eine möglichst große Bandbreite an Perspektiven berücksichtigen und zueinander in Beziehung gesetzt werden können. Das war auch der Leitgedanke in der Auswahl der Beiträgerinnen und Beiträger. Sie sollten in der Lage sein, die oben genannten Fragestellungen vor dem Hintergrund neuerer und neuester Entwicklungen in der Syntax- und Multimodalitätsforschung zu behandeln, eine Einführung in die jeweilige Thematik zu geben und mit ihren Überlegungen zu weiteren Forschungsdiskussionen anzuregen. An dieser Stelle möchten wir die Gelegenheit dazu nutzen, allen Beteiligten für ihr Engagement in der Bearbeitung des jeweiligen Themas ganz herzlich zu danken. Nicht zuletzt daran hat sich im Nachhinein gezeigt, dass die hier getroffene Auswahl der Beiträgerinnen und Beiträger die richtige war. Kommen wir nun also zur Übersicht über den Inhalt des Bandes: In Teil I orientieren sich die Beiträge vor allem an folgenden Fragen: Wie lässt sich die Langue vor dem Hintergrund gebrauchsbasierter und medialitätstheoretischer Ansätze neu konzeptualisieren? Welchen Einfluss hat die Performanz auf das Sprach-

XII 

 Christa Dürscheid/Jan Georg Schneider

system und umgekehrt? In dem Beitrag von Christian Stetter wird das Verhältnis von System und Performanz vor dem Hintergrund des Induktionsproblems erörtert. Arnulf Deppermann und Nadine Proske widmen sich der Frage, nach welchen Einheiten das Sprechen in Interaktion auf der ‚mittleren Ebene‘ (s. o.) strukturiert ist, und nehmen dabei auch auf Aspekte sprachlicher Multimodalität Bezug. Ellen Fricke stellt die grundlagentheoretische Frage nach der systemlinguistischen Relevanz von Gesten. Für sie sind Gesten keine ‚paraverbalen‘ Zeichen, sondern integraler Bestandteil gesprochener Sprache, die sie als multimodales Medium begreift. Clemens Knobloch und Josephine Krüger beschreiben den Erwerb syntaktischer Konstruktionen am Beispiel der Nominalphrasen. Dabei argumentieren sie aus der Perspektive der Grammatikalisierungsforschung sowie der Konstruktionsgrammatik. Im Beitrag von Renata Szczepaniak wird die historische Dimension syntaktischer Einheitenbildung in den Mittelpunkt gerückt. Sie betrachtet den Wandel im deutschen Satzbau und in diesem Zusammenhang auch den historischen Übergang von Mündlichkeit zu Schriftlichkeit. Teil I wird mit einem Beitrag von Jan Georg Schneider abgeschlossen, in dem die syntaktische Schemabildung in der Ontogenese zeichentheoretisch und konstruktionsgrammatisch diskutiert wird. Hier wird dafür argumentiert, dass das semiotische Potenzial der Konstruktionsgrammatik theoretisch noch nicht ausgeschöpft ist und eine Re-Lektüre Saussure’scher Quellentexte systematisch ergiebig sein kann. Teil II umfasst zum einen Beiträge, die den Satzbegriff aus unterschiedlichen Perspektiven reflektieren (‚oberflächennah‘, ‚interaktional‘, ‚generativ‘, ‚schulgrammatisch‘); zum anderen Beiträge zu Valenz und Ellipse. Den Auftakt macht Gisela Zifonun, die den Satz im Anschluss an die IDS-Grammatik als Verbindung einer finiten Verbform mit ihren Komplementen bestimmt. Sodann gibt Margret Selting einen Überblick über wichtige Forschungsarbeiten zum Satzbegriff im Rahmen der Interaktionalen Linguistik und legt dar, dass Sätze als Konstruktionseinheiten aufgefasst werden, an denen sich die Interaktionsbeteiligten orientieren. Auch im Beitrag von Peter Öhl wird ein Forschungsüberblick gegeben; hier sind es die theoretischen Annahmen und Methoden der generativen Syntaxtheorie, die im Zentrum stehen. Mechthild Habermann betrachtet den Satz aus sprachdidaktischer Sicht und zeigt auf, dass sich das Satzverständnis im Kontext der pragmatischen Wende grundlegend geändert hat. Der Beitrag von Klaus Welke befasst sich mit dem Verhältnis von Valenz und Projektion, referiert die wichtigsten Grundannahmen der Valenztheorie und nimmt abschließend Bezug auf die Konstruktionsgrammatik. Mathilde Hennig beschließt den zweiten Teil des Bandes. Ihr Beitrag schlägt einen weiten Bogen vom Verhältnis der Ellipse zum Satz über die Ellipsenklassifikation bis hin zu neueren Tendenzen der Theoriebildung. In Teil III wird der Terminus Äußerung als Oberbegriff für die verschiedenen Einheitenbildungen in allen drei Modalitäten von Sprache verwendet. Einleitend stellt Frank

Einleitung 

 XIII

Liedtke das Verhältnis von Pragmatik und Syntax auf der Grundlage des Begriffs des illokutionären Indikators dar, dann erläutert er verschiedene Ansätze zur Untersuchung der Informationsstruktur im Satz. Im Anschluss daran beschäftigt sich Sven Staffeldt mit der Frage, was unter dem Terminus pragmatischer Standard zu fassen ist und welche kommunikativen Einheiten als zum pragmatischen Standard gehörig angesehen werden können. Der Beitrag von Stephan Stein, der den Titel „Einheiten der gesprochenen und geschriebenen Sprache“ trägt, betont die Notwendigkeit einer prozessbezogenen Perspektive auf die Beschreibung der linguistischen Einheitenbildung. Reinhard Fiehler legt den Schwerpunkt auf die Syntax der gesprochenen Sprache. Dabei geht es ihm vor allem um das Vorkommen spezifischer syntaktischer Konstruktionen im Formulierungsprozess und um die Syntax ‚elliptischer‘ Gesprächsbeiträge. Auch Gisela Fehrmann geht Fragen der linguistischen Einheitenbildung nach und stellt dabei die Gebärdensprache ins Zentrum, in der Konstruktionen im visuell-gestischen Modus oftmals nicht Effekt linearer, sondern simultaner Zeichenprozessierung sind. Abgerundet wird Teil III mit einem Beitrag von Jana Bressem zur Gestenforschung. Darin vertritt sie die These, dass Wiederholungen bei redebegleitenden Gesten ein zentrales Verfahren der Musterbildung darstellen. Der abschließende Teil IV behandelt grundsätzliche Fragen der Schemabildung: Bestehen Äußerungen der geschriebenen, gesprochenen oder gebärdeten Sprache aus Einheiten, die in der Interaktion als mehr oder weniger fixe Form-Funktions-Paare (Konstruktionen) abgerufen werden? Oder handelt es sich dabei um Einheiten, die im Gebrauch jeweils ad hoc, auf der Basis von Regeln gebildet werden? Zu Beginn gibt Jörg Bücker einen Überblick über die Konzepte ‚Schema‘, ‚Muster‘ und ‚Konstruktion‘. Er unterbreitet einen eigenen Vorschlag zur Terminologie und macht auf aktuelle Entwicklungen in der gebrauchsbasierten Linguistik aufmerksam. Susanne Tienken zeigt in ihrem Beitrag auf, wie sich Sprachgebrauchsmuster – als Teil intersubjektiver Verständigungsprozesse – in der linguistischen Kulturanalyse beschreiben lassen und welchen Anteil diese Muster an der Festigung von Wahrnehmungsweisen haben. Im Anschluss daran stellt Noah Bubenhofer Ansätze aus der Korpuslinguistik vor, die mit quantitativen Methoden die Musterhaftigkeit in Textdaten testen oder entdecken. Die Frage nach dem Verhältnis zwischen den Konzepten ‚Satz‘, ‚Konstruktion‘, ‚Aussagekomplex‘ und ‚Schema‘ stellt Alexander Lasch in den Mittelpunkt seiner Ausführungen. Daran anschließend geht Georg Albert der Frage nach, wie die zunehmende Popularität bestimmter Konstruktionen (z. B. Wer kann Papst?) zu erklären ist und welche Rolle dabei spezifische Kontexte des Gebrauchs spielen. Den Schluss von Teil IV – und damit des vorliegenden Bandes – bildet der Beitrag von Wolfgang Imo, in dem der Konstruktionsbegriff vor dem Hintergrund alternativer Ansätze (wie z. B. der Valenzgrammatik) diskutiert wird und in diesem Zusammenhang auch gezeigt wird, wo die Grenzen konstruktionsgrammatischer Ansätze liegen.

XIV 

 Christa Dürscheid/Jan Georg Schneider

Literatur CLG = Saussure, Ferdinand de (1972): Cours de linguistique générale. Édition critique préparée par Tullio de Mauro. Paris. Coseriu, Eugenio (2007): Sprachkompetenz. Grundzüge der Theorie des Sprechens. 2. Auflage. Tübingen. Dürscheid, Christa/Jan Georg Schneider (2015): Satz – Äußerung – Schema. In: Ekkehard Felder/Andreas Gardt (Hg.): Handbuch Sprache und Wissen. Berlin/Boston (Handbücher Sprachwissen, 1), 167–194. GRF = Saussure, Ferdinand de (2001): Grundfragen der allgemeinen Sprachwis­senschaft. Herausgegeben von Charles Bally und Albert Sechehaye unter Mitwirkung von Albert Riedlinger. Übersetzt von Herman Lommel. Berlin/New York. Hymes, Dell (1972): On communicative competence. In: John Bernard Pride/Janet Holmes (Hg.): Sociolinguistics. Hammondsworth, 269–293. Jäger, Ludwig (2010): Ferdinand de Saussure zur Einführung. Hamburg.

I Grundfragen

Christian Stetter

1. System und Performanz Abstract: Gegenstand dieses Beitrags ist die Frage, wie sich der linguistische Zentralbegriff des Sprachsystems sachlich wie logisch auf den Bereich der aktualen Sprachperformanz beziehen lässt. Ausgangspunkt ist das Problem der Induktion, denn jede Systembeschreibung beruht auf einer solchen. Chomskys These, der kindliche Sprach­erwerb könne nicht induktiv erfolgen, beruhte – wie Nelson Goodmans Lösung des Problems gezeigt hat – auf einem unzutreffenden Begriff von Induktion. In den beiden folgenden Abschnitten wird das Konzept des Sprachsystems unter verschiedenen Gesichtspunkten knapp resümiert. Daraus werden einige Grundsätze abgeleitet, die für das Format gegenwärtiger linguistischer Theorien bestimmend sind. Anschließend wird kurz der sogenannte Individuenkalkül erläutert, der die Logik der Bildung von Summengegenständen beschreibt, damit auch die der Bildung von Phrasen aus ihren Konstituenten. Damit kann die logische Qualität der individuellen Sprachkompetenz beschrieben werden, die in Produktion wie Rezeption analog verfährt, während technisch erzeugte Texte logisch digital sind. Auf dieser Basis werden schließlich ‚natürliche‘ Sprachen als virtuelle Systeme charakterisiert, damit als Wesen der Popper’schen Welt 3. 1 Das wissenschaftstheoretische Problem 2 Das Konzept des Sprachsystems 3 Systemebenen 4 Sprachwissenschaftliche Grundsätze 5 Zur Logik der linguistischen Theorie 6 System-Subjekte 7 Kompetenzbegriffe 8 Sprache: ein virtuelles System 9 Literatur

1 Das wissenschaftstheoretische Problem Das Konzept des Sprachsystems definiert gleichsam die Sprachwissenschaft seit Ferdinand de Saussures „Cours de linguistique générale“. Das Paradigma der generativen Linguistik hat dies zunächst grundsätzlich beibehalten. Allerdings haben die späteren Arbeiten N. Chomskys, der Forderung nach explanativer Adäquatheit linguistischer Theorie folgend, die Anlage dieses Konzepts in einem dem Menschen angeborenen Spracherwerbsmodul verortet – ‚language acquisition device‘, im Weiteren als LAD abgekürzt –, dessen Funktion darin bestehen soll, aus der Menge ‚möglicher‘ menschlicher Sprachen diejenige zu identifizieren, die in der Umgebung des neu-

4 

 Christian Stetter

geborenen Kindes gesprochen wird. Die Linguistik würde – man muss hier im Konjunktiv sprechen – damit in ihrem theoretischen ‚Kern‘ zu einer Naturwissenschaft mutieren. Der empirische Nachweis einer solchen biologischen Anlage menschlicher Neugeborener fehlt jedoch bis heute. Hintergrund dieses Theorems der generativen Linguistik ist eine weitere, diese Schule charakterisierende Annahme: die für ein Faktum genommene These, der kindliche Spracherwerb sei per inductionem nicht möglich. Diese Annahme ­Chomskys ist wohl Resultat seiner frühen Rezension von B. F. Skinners „Verbal Behavior“. In der hatte er zu Recht Skinners ‚Hochrechnung‘ von seinen Studien tierischen Verhaltens in definierten Versuchsszenarien auf den kindlichen Spracherwerb in nicht definierten sozialen Umgebungen als ungültige Induktion erwiesen. Doch daraus auf ein dem Menschen angeborenes LAD zu schließen ist, Ironie der Geschichte, selbst eine ungültige Induktion: Denn sie überträgt ein theoretisches Modell auf einen kategorial andersartigen Bereich, wo dieses Modell nicht greift. Nun ist die linguistische Beschreibung des Systems eines oralen Dialekts wie einer literalen Sprache selbst und notwendigerweise stets eine ‚Hochrechnung‘ aus den Eigenschaften dessen, wofür die Texte als Muster genommen werden, auf denen die Beschreibung beruht. Entscheidend ist somit letztlich die Frage, was eine Induktion eigentlich ist. Diese Frage ist von Nelson Goodman geklärt worden – und zwar schon anno 1953, in seinen „London Lectures“ (vgl. Goodman 1988). Goodmans Analyse des Problems kann hier nicht im Einzelnen nachvollzogen werden. In aller Kürze sei das Wesentliche referiert: Die verbreitete Annahme, die Induktion sei sozusagen der spiegelbildliche Prozess einer Deduktion, der Schluss von dem Item einer Menge von Sachverhalten SMi auf die Gesamtmenge SM – diese Annahme ist schlicht falsch, wenn nicht sogar unsinnig: Wenn an einigen Tagen i des Monats j des Jahres k sich an dem und dem Ort y der Stadt z ein Unfall ereignet hat, dann wäre nicht unbedingt darauf zu schließen, dass stets am Tag i des Monats j eines Jahres sich dort ein Unfall ereignet. Dieser Schluss wäre logisch selbst dann nicht gerechtfertigt, wenn sich das Faktum im Verlauf einer längeren Zeitperiode mehrfach wiederholt hätte. Denn die betreffenden Fakten könnten auf verschiedene kontingente Umstände zurückzuführen sein. Andererseits kann die Frage, ob eine Induktion ‚gültig‘ zu nennen sei, nicht abhängig gemacht werden davon, ob die betreffende Prognose sich faktisch bewahrheitet hatte oder nicht. Denn eine Prognose im Bereich des Kontingenten muss sich nicht erfüllen, so zuverlässig die Datenbasis auch sein möge. Nie sind alle Rahmenbedingungen oder Daten bekannt, die auf das prognostizierte Ergebnis Einfluss haben. Die einzelne Prognose ist daher, logisch genau genommen, weder wahrscheinlich noch unwahrscheinlich. Es kommt erstens auf den einzelnen Sachverhalt und dessen besondere Bedingungen wie auf weitere Rahmenbedingungen an: Insbesondere muss die Beschreibung des Sachverhalts a) kategorial einschlägig sein, und b) muss sie sich über längere Zeiträume empirisch bewährt haben. Selbst dies aber sind lediglich notwendige Voraussetzungen dafür, dass sich eine Prognose als ‚gültig‘ im

System und Performanz 

 5

logischen Sinn erweisen kann, keineswegs aber hinreichende. Entscheidend für die logische Gültigkeit einer Induktion ist vielmehr – das hat Goodmans Analyse des Problems gezeigt –, ob das Problem der Fortsetzung der Beschreibung des Ist-Zustands in die Zukunft, also der Schluss vom gegenwärtigen Zustand z auf einen zukünftigen Zustand z+1 logisch gerechtfertigt ist. Jeder Fahrer eines Linienbusses vollzieht ihn tagtäglich, und meist mit Erfolg, aber eben nicht immer. In der Sportreportage ist – allen sprachlichen Analogien zum Trotz – irgendwann aus dem Vorsprung vor der Vorsprung auf geworden, während es beim Rückstand auf geblieben ist – Beleg dafür, dass die Entwicklung einer Sprache logisch plausiblen Prognosen gelegentlich widerspricht. Denn die ist ihrer Natur nach ein Invisible-hand-Prozess (vgl. hierzu Keller 2003). Synchrone Sprachbeschreibungen  – wie etwa die der Duden-Grammatik  – beruhen daher in der Praxis auf der kontrafaktischen Unterstellung, dass sich die darin beschriebene Sprache zumindest ‚bis auf Weiteres‘ nicht oder nicht relevant verändert. In der Tat bilden ja historische Ereignisse wie der Fall der Berliner Mauer – der auf einen Schlag viele bis dahin geläufige Sprachregeln hüben wie drüben außer Kraft gesetzt hat – die Ausnahme von der Regel, auch wenn dieses Ereignis in kurzer Zeit viele andere zur Folge hatte, die manche bis dahin so oder so geltende Regelung des alltäglichen wie des politischen Sprachgebrauchs tangierten. Doch das, was in linguistischem Sinn das ‚System‘ der deutschen Gegenwartssprache genannt wird, hat dieses historische Großereignis, wenn überhaupt, bestenfalls unmerklich verändert. Keine vor 1989 publizierte Beschreibung des linguistischen Systems der deutschen Gegenwartssprache hat neu geschrieben werden müssen. Mehr oder weniger marginale Änderungen haben es getan – was nur unterstreicht, dass sich das Geschäft von Sprachbeschreibung in der Gegenwartslinguistik im Wesentlichen auf bestimmte für relevant genommene Aspekte bzw. Ausschnitte des sogenannten Sprachsystems konzentriert. Per se wird dem eine andere Beschaffenheit zugestanden als den unkalkulierbaren Veränderungen oder Schwankungen im alltäglichen Sprachgebrauch. Doch wie kommt man nun zu einem auch nur näherungsweise aussagekräftigen Bild von ‚der‘ Sprache etwa des Sprechers X oder der Stadt Berlin oder gar der gesamten deutschen Sprachgemeinschaft? Die Antwort ist so schlicht wie desillusionierend: Per Generalisierung von sprachlichen Proben, die erhoben und gesammelt werden von Institutionen wie dem Duden, welche die sprachlichen Muster gewinnen, indem sie sie aus dem jeweiligen Gebrauchskontext extrahieren und damit isolieren. Eine andere Weise der Datensammlung wie -verarbeitung ist, pragmatisch betrachtet, kaum möglich, wenn das Datenmaterial auch nur halbwegs repräsentativ sein soll. Jede noch so sorgfältig erstellte Beschreibung der Grammatik oder des Wortschatzes einer ‚natürlichen‘ Sprache veraltet im Verlauf von einigen Generationen, auch wenn sich bestimmte Züge des Systems erst in wesentlich längeren Zeiträumen merklich verändern. Das oben beschriebene Fortsetzungsproblem wird gleichsam weggekürzt durch die normative Geltung, die dem Duden oder ähnlichen ‚Institutionen‘ im öffentlichen Gebrauch wie Bewusstsein zuerkannt wird.

6 

 Christian Stetter

Jede ‚natürliche‘ Sprache hat dessen ungeachtet als solche eine allerdings nur in anthropologischen Dimensionen erkennbare Existenzdimension. Wir unterscheiden ja ‚lebende‘ von ‚toten‘ bzw. ‚ausgestorbenen‘ Sprachen. Eine Sprache ‚lebt‘, solange es Menschen gibt, für die sie das Medium ihrer Kommunikation und sozialen Organisation ist. Und das sind sich langsam, aber kontinuierlich verändernde Größen. Dies gilt für jedes Sprachsystem, für das der individuellen Kompetenz ebenso wie für das eines regionalen Dialekts oder einer nationalen Schriftsprache. Das erfordert immer auch die Anpassung des gegebenen Zustandes an sich verändernde Anforderungen individueller wie gegebenenfalls auch kollektiver Art, ein meist unmerklicher, aber nie unterbrochener Prozess. Die in der linguistischen Theorie gelegentlich als Gegensätze aufgefassten oder gar als solche konstruierten ‚Dimensionen‘ von Synchronie und Diachronie erweisen sich so als die beiden, untrennbar miteinander verbundenen ‚Aggregatzustände‘ eines umfassenden Ganzen, das eben in der Zeit existiert wie alles Reale physischer oder psychischer, d. h. nicht-ideeller Art. So lässt sich eine erste Paradoxie des Verhältnisses von System und Performanz festhalten: Jeder einzelne Performanzakt belässt das System in dem Zustand, in dem es sich aktuell befindet. Alle zusammen verändern es. Daher der Schein der Homöostase des alltäglichen Sprachgebrauchs.

2 Das Konzept des Sprachsystems Wohl aus dem zuletzt genannten Grund ist das Konzept des Sprachsystems qua Sprachkompetenz für die kontemporäre Linguistik zum zentralen Begriff der gesamten Disziplin geworden: Mit mehr oder weniger vollständigen Beschreibungen der Syntax, Morphologie und Phonologie bzw. Graphematik einer ‚natürlichen‘ Sprache L werden Ausschnitte eines Bildes von L gefertigt, die zusammen eine Art Totalansicht ergeben – so fragmentarisch jede noch so detailreiche Beschreibung dieser Sprache angesichts der ungeheuren Fülle von oralen Äußerungen wie literalen Texten auch sein mag, die Tag für Tag im Gebrauchsbereich von L geäußert oder geschrieben, vernommen oder gelesen werden. Auf die einzelne Sprachkompetenz wird dieses Bild von L allenfalls besser oder schlechter passen, aber es genügt für den Zweck. Der klassische Topos spricht vom unendlichen Gebrauch, den die Menschen von ihrer Sprache machen. Doch deren ‚Mittel‘ sind endlich, angefangen vom Phonembzw. Graphembestand einer Sprache über die Morphologie bis hin zur Syntax. Demgemäß sind sie auch mehr oder weniger vollständig beschreibbar. Andererseits veraltet, wie schon bemerkt, jede noch so systematische Beschreibung von L je nach den Zeitumständen, den dokumentierten Verwendungsfällen, Textsorten usw. mehr oder weniger schnell, paradoxerweise um so schneller, je detailreicher und genauer die betreffende Beschreibung bzw. Dokumentation ist. Immer ist in einer Sprachgemeinschaft irgendwo etwas in Bewegung, und so ähnelt die Arbeit etwa der Dudenredak-

System und Performanz 

 7

tion, so professionell und auf umfangreichstes Datenmaterial gestützt sie auch ist, ein wenig einem Sisyphusunternehmen: Je mehr sie auf Vollständigkeit bedacht ist, desto schneller veraltet sie im einen oder anderen Detail – ein Dilemma, das in einer seiner Erscheinungsweisen unter den Begriff des Skriptizismus gefasst worden ist: Zwar wird in jeder neu erscheinenden Ausgabe ein bestimmter ‚Zustand‘ einer, hier der deutschen Sprache gleichsam protokollarisch festgehalten. Doch dieses Protokoll ist als solches schon in kurzer Zeit überholt. In der generativen Linguistik ist daher dieser Sachlage durchaus angemessen der Blick von den Resultaten oraler wie literaler Performanzen auf die diese generierende Kompetenz gelenkt worden. Dies heißt zugleich aber auch: vom Wirklichen auf das Mögliche, genauer gesagt auf das Virtuelle, und dessen ontologischer Status schwankt zwischen Realität und Fiktion eigenartig hin und her (vgl. Esposito 1998). Denn das menschliche Sprachvermögen ist eine Realität besonderer Art: Es charakterisiert einerseits die Gattung im Unterschied zu allen anderen Lebewesen (vgl. LeroiGourhan 1984). Andererseits ist es integrales Vermögen jedes menschlichen Individuums und innerhalb jeder noch so begrenzten Sprachgemeinschaft bei allen, die ihr angehören, in besonderer Weise entwickelt, auch wenn nach landläufiger Auffassung alle Angehörigen dieser Gemeinschaft dieselbe Sprache sprechen – was ebenso wahr wie falsch ist. Das linguistische Konzept des oder eines Sprachsystems impliziert daher stets und notwendiger Weise Abstraktionen, je nachdem, in welchen Kontexten oder pragmatischen Zusammenhängen von einem solchen die Rede ist: Es wird von der Sprache eines Individuums in einer besonderen Phase seiner Entwicklung ebenso gesprochen wie von der einer bestimmten sozialen oder regionalen Population. Die Rede von dem System einer Sprache ist und bleibt bezogen auf bestimmte Vorannahmen. Das Sprachsystem eines sechsjährigen Kindes lässt sich ebenso beschreiben wie das einer ganzen Epoche. Das Konzept gilt somit je nur relativ zu bestimmten Extensionen seiner Anwendung. Man kann, anders ausgedrückt, das System einer Sprache, einer bestimmten Person oder Gesellschaft stets nur näherungsweise und in den bereichsspezifisch wesentlichen Hinsichten beschreiben. Dies auf der Basis hinreichender Mengen von Stichproben aktualer Verwendungen oralen wie literalen Sprachgebrauchs. Finden kann man es somit je nur in Dokumentationen individueller Performanzen von sprachlicher Kompetenz wessen auch immer, und das heißt in letzter Instanz: in schriftlichen Dokumenten, und seien dies auch Verschriftungen von technischen Aufzeichnungen oraler Äußerungen. Der sogenannte Skriptizismus ist einerseits ein kardinales methodisches wie methodologisches Problem der Sprachwissenschaft, erweist sich andererseits jedoch als die Bedingung der Möglichkeit der gesamten Disziplin. Das Problem, das sich hier andeutet, verweist auf das Besondere einer Wissenschaft von der Sprache: Man betrachte die beiden im Deutschen gewiss geläufigen Redewendungen

8 

 Christian Stetter

(R1) Wir sprechen dieselbe Sprache  – in der ‚buchstäblichen‘ Lesart: nämlich Deutsch oder Englisch oder …, etwa in einer Situation, wo zwei Personen in einem für beide fremdsprachlichen Kontext feststellen, dass sie dieselbe Sprache sprechen, nicht in der metaphorischen Lesart also, deren Sinn man mit ‚wir verstehen uns‘ wiedergeben könnte. Und (R2) Jeder spricht seine eigene Sprache – in der Lesart: … hat seine eigene Weise, sich verbal auszudrücken. In R2 kann man den Sinn wie die Extension des Ausdrucks seine eigene Sprache mit seinen besonderen Sprachgebrauch wiedergeben – was die Frage offen lässt oder als hinreichend geklärt voraussetzt, was das denn sei, das da als ‚Sprache‘ bezeichnet wird. In R1 ist diese Lesart ausgeschlossen, was wäre hier also die Extension des Wortes ‚Sprache‘? Was wäre also ‚das‘ Deutsche oder Englische oder … Japanische oder …? Die Antwort ‚eine Sprache‘ scheidet hier aus, so selbstverständlich sie scheint – und es in manchen Gesprächssituationen auch sein mag, etwa wenn man einem Kind oder einer Person, die gerade erst begonnen hatte, Deutsch zu lernen, an einem Beispiel erklären will, was man im Deutschen unter dem Wort japanisch versteht. Über Sprache zu sprechen setzt immer voraus, dass man in bestimmtem Sinn schon genauestens weiß, was eine Sprache ist – nämlich als Knowing-how. Pragmatisch kann dies ein Vorteil sein, methodisch wie erkenntnistheoretisch ist es zweifellos ein Handicap, das die Linguistik mit keiner anderen Disziplin teilt. Das Sprachspiel der Linguistik ist seit der Rezeption des „Cours de linguistique générale“ F. de Saussures durch die strukturale Linguistik dadurch gekennzeichnet, dass man die philosophische Frage ‚Was ist eine Sprache?‘ vermeidet, wie sie etwa von Wilhelm von Humboldt gestellt worden war. Desgleichen eine geistes- oder kulturwissenschaftliche Sicht auf das Objekt. Vielmehr werden die ‚technischen‘ Verfahren einzelner Sprachen oder Dialekte beschrieben, sodass sie sich in diesen Hinsichten miteinander vergleichen lassen  – ein in bestimmtem Sinn minimalistisches Konzept der Differenz. Der in der Linguistik wohl allgemein akzeptierte theoretische Rahmen lässt sich etwa wie folgt beschreiben: Eine jede ‚natürliche‘ Sprache ist als solche dadurch charakterisiert, dass sie aus genau drei Teilsystemen besteht, nämlich Syntax, Morphologie und Phonologie bzw. Graphematik (die hier aber vernachlässigt werden kann). Diese Teilsysteme greifen ineinander und bilden insofern ein Ganzes: Ein Sprecher S kann im Medium einer ‚natürlichen‘ Sprache mit einem Hörer H nur dann kommunizieren, wenn er weiß, wie Wörter dieser Sprache gebildet und zu Sätzen oder anderen Phrasen zusammengefügt werden und wie das Ganze lautlich artikuliert wird. Auch wenn dies für das Gelingen der Kommunikation nicht hinreicht, so sind es doch in der Regel dafür notwendige Bedingungen.

System und Performanz 

 9

3 Systemebenen Das sogenannte System einer ‚natürlichen‘ Sprache ist also kein ‚Ding‘, auch kein Zustand, sondern ein Komplex von Verfahren zur Bildung von Äußerungen oder Texten aus Phrasen, diese schließlich aus Wörtern. Dargestellt wird ein solches üblicherweise durch eine ‚generative‘ Grammatik. Diese erzeugt die Konstituentenstruktur von Phrasen mittels Phrasenstruktur- und Lexikonregeln und beschreibt sie dergestalt. Es handelt sich dabei um ein rein extensionales Verfahren: Was ein Ausdruck wie S bedeutet, ergibt sich ausschließlich aus dem folgenden Regelapparat, der diesen Ausdruck etwa durch HK1 + HK2 ‚interpretiert‘, symbolisch dargestellt z. B. durch S → HK1 + HK2. Was HK1 bedeutet, ergibt sich wiederum durch eine Regel der Form P → A + B + … + C, etwa HK1 → DET + N usw., bis man bei syntaktisch nicht weiter analysierbaren End-, d. h. Wortkategorien angelangt ist, hier etwa DET und N, denen durch eine Lexikonregel eine Lesart zugeordnet wird, etwa N: Regel, DET: eine. Es ist unmittelbar zu sehen, dass sich mit einem derartigen Apparat‚ der aus einer zweckmäßig gewählten Menge von syntaktischen Kategorien, End-, d. h. Wortkategorien, Ersetzungsregeln der Form A → B + C + … + D und Lexikonregeln der Form W : xyz besteht, beliebig viele beliebig komplexe Phrasen ‚erzeugen‘ und so beschreiben lassen: Die Rechtselemente der Lexikonregeln der Syntax bilden den ‚Input‘ für die Morphologie-Komponente der betreffenden Grammatik, und deren Resultat liefert schließlich das Material für Phonologie bzw. Graphematik. Jedes nach derartigen Prinzipien aufgebaute Beschreibungssystem – im Folgenden ‚K(onstitutions)-System‘ genannt – expliziert also in seinem Regelapparat jeweils die Anfangskategorie wie die Zwischen- und Endkategorien: die Syntaxkomponente der betreffenden Grammatik demgemäß ihre Anfangskategorie, als die traditionell der Satz gilt – und dies zurecht: Natürlich lassen sich auch für umfassendere Texteinheiten Aufbau- oder Gliederungsschemata definieren: für eine wissenschaftliche Abhandlung, für eine Anklage- oder Verteidigungsschrift usw. Doch für Kategorien wie ‚Einleitung‘, ‚Sachverhalt‘, ‚Begründung‘ o. ä. gibt es keine formal explizierbaren Definitionen. Es sind rhetorische, nicht linguistische Kategorien. Alles, was über sie formal ausgesagt werden kann, ist die Tatsache, dass ihre Konstituenten stets Phrasen sind, meist Sätze, und sei es auch nur ein einziger. Es ist der empirische Gebrauch eines K-Systems mit seinen expliziten Regeln, der die Linguistik als eine theoretisch formale Disziplin definiert – im Unterschied etwa zur Rhetorik. Der oben angedeutete Regelapparat, der  – in welchen Varianten auch immer  – längst zum Standard der Linguistik geworden ist, gibt der Disziplin die Möglichkeit, alle empirisch nachgewiesenen wie sonst denkbaren Definitionen von ‚Satz‘ bzw. ‚Phrase‘ in einem einzigen Beschreibungsmodul, das aus Phrasenstruktur- und Lexikonregeln besteht, nach Belieben detailgenau darzustellen. Allerdings ist jede derartige Darstellung, wie bereits angedeutet, nur die ‚Momentaufnahme‘ eines mehr oder weniger schnell, aber kontinuierlich sich wandelnden Ganzen.

10 

 Christian Stetter

Warum aber haben im linguistischen Diskurs weder Semantik noch Pragmatik sich als Systemebenen mit Aussicht auf allgemeine Akzeptanz etablieren können (etwa in der forensischen Linguistik) – so wichtig semantische oder pragmatische Fragen in praxi auch sein können? Die Antwort auf die erste Frage kann mit Frege gegeben werden: Die Bedeutung, nach Frege der (sprachliche) Sinn eines Wortes, ergibt sich aus dem Zusammenhang seiner Verwendung („Über Sinn und Bedeutung“, 42); auf die zweite wäre mit Wittgenstein zu entgegnen, dass die Bedeutung des Wortes sein Gebrauch in der Sprache sei („Philosophische Untersuchungen“ I, 138 ff., 664 ff.). Diese beiden Grundsätze grenzen das Feld jeder auf Systembeschreibung konzentrierten Linguistik einerseits ‚nach außen‘ ab, andererseits ermöglichen sie eine solche auch erst, jedenfalls dann, wenn man das Wort System in diesem Zusammenhang ernst nimmt. Denn ein System ist, falls überhaupt, dann ein Aggregat, in welchem die einzelnen Bestandteile funktional entweder wechselseitig oder auch einseitig logisch oder real voneinander abhängig sind. Daher das Konzept des Wertes (valeur), das die linguistische wie philosophische Sprachauffassung F. de Saussures geprägt hat (vgl. Wunderli 2013, 242 ff.). Die einzelne Wortwahl im Sprachgebrauch ist, mit Kant zu sprechen, eine Sache der Urteilskraft. Die individuelle Sprachkompetenz ist dafür je schon vorausgesetzt. Die Frage, was man zu Recht als das System einer ‚natürlichen‘ Sprache ansprechen kann, muss somit eine Größe betreffen, die jenseits dessen angesiedelt ist, was von welchem Kompetenzbegriff auch immer beschrieben wird. Die Gleichsetzung von Sprachkompetenz und Sprachsystem, so geläufig sie auch in der Linguistik geworden ist, erweist sich aus dieser Perspektive als Kategorienfehler.

4 Sprachwissenschaftliche Grundsätze Insofern ergeben sich für die logische Organisation der Linguistik eine Reihe von Grundsätzen, die hier der Reihe nach in aller Kürze abzuhandeln sind. Natürlich sind derartige Prinzipien nicht in praxi für Denken oder Handeln im Fach maßgeblich. Sinnvoll sind sie bestenfalls dann, wenn sie längerfristig zur ‚Justierung‘ von Theorie wie Praxis der Sprachwissenschaft dienen. Seien also die beiden schon erwähnten Grundsätze als ‚Frege-‘‚ bzw. ‚Wittgenstein-Prinzip‘ getauft (die der Sache nach in das Gebiet der Philosophie fallen), so wäre als nächstes in einer Hierarchie solcher forschungsleitender Prinzipien für die Linguistik ein weiteres zu nennen, das man ‚Humboldt-Prinzip‘, der Sache nach ‚Authentizitätsprinzip‘ nennen könnte: (4.1) Jede Sprache hat ihr eigenes autochthones Prinzip, wie Syntax, Morphologie und Phonologie intern organisiert sind. Grammatische Kategorien wie ‚Perfekt‘, ‚Passiv‘ oder gar ‚Medium‘ passen zwar auf das Latein oder antike Griechisch, aber nicht auf das Neuhochdeutsche, geschweige denn auf das Englische oder gar Chinesische. Hier steht uns die Jahrtausende alte Tradition der Schulgrammatik noch immer

System und Performanz 

 11

im Weg. Man betrachte etwa Bildungen wie sie ist nach Hause gegangen oder er wird operiert  – usw., semantisch betrachtet beides Zustandsbeschreibungen im Präsens wie sie ist krank oder es wird dunkel. Um dies logisch besser fassen zu können, sei hier ein weiteres allgemeines Prinzip zur Organisation von Sprachbeschreibung bzw. Sprachtheorie aufgeführt, (4.2) das Oberflächenprinzip: Die Grammatik bzw. Strukturbeschreibung einer Sprache hat eine einzige ‚Ebene‘: die sogenannte Oberflächenstruktur. Der Begriff einer Tiefenstruktur grammatischer Konstruktionen  – oder wie auch immer man ähnliche theoretische Konstrukte benennen möchte – ist, empirisch betrachtet, leer. Neurobiologisch wie -psychologisch gibt es für derartige Konzepte bis heute keine hinreichenden Belege. Der Prozess der mentalen Sprachproduktion, also der neuronalen Generierung von sprachlichen Äußerungen, ist nicht und kann nicht Gegenstand linguistischer Theorie sein. Vielmehr setzt diese entweder neurobiologische und psychologische Erkenntnisse voraus – dann muss sie solche gegebenenfalls zur Kenntnis nehmen und eigene theoretische Konstrukte damit explizit in Übereinklang bringen – oder sie verfährt davon unabhängig, dann haben Konstrukte wie Tiefenstruktur oder Operationen wie ‚Move-α‘ oder ähnliche keine ausweisbare Extension. Als nächstes wäre in einer sachlich organisierten Hierarchie linguistischer Grundsätze zu benennen: (4.3) das Kopfprinzip: Jede Phrase P hat genau einen Kopf K. Dieser ist stets eine lexikalische Kategorie. Von ihm aus wird die Position der übrigen Konstituenten von P relativ zu K festgelegt. Das Kopfprinzip ist somit das Grundprinzip der Organisation der Syntax einer jeden ‚natürlichen‘ Sprache. Diese enge Fassung des Kopf-Begriffs schließt einerseits ein Kopf-Vererbungs-Prinzip o. ä. aus. Denn es gilt ja für jede Phrase, und sei sie noch so ‚tief‘ in andere eingebettet. Andererseits vereinfacht es genau deshalb die syntaktische Beschreibung auch komplexester Phrasen erheblich. Schließlich hängt damit ein weiterer Grundsatz zusammen, der gleichfalls geeignet wäre, die syntaktische Beschreibung etwa des Deutschen oder typologisch ähnlicher Sprachen zu vereinfachen: (4.4) das Phrasen-Kontinuitätsprinzip: Es schließt die Annahme diskontinuierlicher Konstituenten wie bin … nach Hause gegangen, wurde … noch spät gesehen usw. aus. Auch hier zeigt sich das Problem der grammatischen Tradition, insbesondere die Rolle des Latein als der ‚klassischen‘ Bildungssprache, denn erst die Übersetzung solcher Phrasen ins Latein ‚ergibt‘ ja ein formales Perfekt bzw. Passiv.

5 Zur Logik der linguistischen Theorie Soweit zu ‚Grundsätzen‘ linguistischer Theorie. Aber was ist falsch bzw. irrig an grammatischen Kategorisierungen wie den eben diskutierten? Um dies zu begründen, ist ein kurzer Blick auf die Logik vonnöten, die in einer jeden Phrasenstrukturgrammatik

12 

 Christian Stetter

obwaltet. Das Wort Logik ist hier nicht metaphorisch verwendet. Was hat also Phrasenbildung mit Logik zu tun? Betrachten wir dazu ein einfaches Beispiel: eben diesen letzten Satz. Er besteht aus vier (Haupt-)Konstituenten: Betrachten + wir + dazu + ein einfaches Beispiel. Sein Sinn ist aber nicht zusammengesetzt. Er ist eine Einheit, die sofort zerstört wird, sobald einer oder gar mehrere seiner ‚Teile‘ getilgt werden: *wir + dazu + ein einfaches Beispiel. *Betrachten + dazu + einfaches Beispiel usw. Die Phrase als eine Einheit von signifiant und signifié ist somit, logisch betrachtet, ein sogenannter Summengegenstand. Beschrieben worden ist die hierfür einschlägige Logik im sogenannten Individuenkalkül (vgl. Goodman 1988; zu weiteren Erläuterungen und Verweisen Stetter 2005). Betrachtet man unter diesem Gesichtspunkt die oben angeführten Beispiele, so stellt sich die Frage, wie sie ‚geklammert‘ werden, wie also die Ausdrücke intern aufgebaut sind. Und da ergibt sich bin + [… (nach Hause) gegangen], ist + [… (noch spät) gesehen] worden usw. Die Ausdrücke nach Hause und noch spät sind also nicht Adverbiale zu bin … gegangen bzw. ist … gesehen worden, sondern Attribute zu gegangen bzw. gesehen. Im Licht der logischen Summenbildung erweist sich somit die ehrwürdige grammatische Tradition (hier) als algebraisch falsch.

6 System-Subjekte Wem wird nun das System als sein System zugesprochen? Einer Einzelperson oder einer Sprachgemeinschaft? Die Linguistik hat versucht, diesem Problem mit Konzepten wie dem Idiolekt oder dem idealen Sprecher/Hörer u. ä. aus dem Weg zu gehen, in der Praxis unterstützt im Deutschen insbesondere durch Grammatiken, Wörterbücher und ähnlichen Kompendien aus dem Duden-Verlag und dessen Konkurrenzprodukten. Deren Erstellung und Pflege wiederum basiert auf kontinuierlich gepflegten Datenbanken, die genuin literale Dokumente ebenso auswerten wie verschriftete Aufzeichnungen oraler Rede. Als Subjekt der so erfassten Daten wird damit implicite etwas konstruiert, das man den ‚normierten Schreiber/Leser‘ nennen könnte. Diese  – nicht mentalistisch zu lesende  – Bezeichnung hat ihren Grund in Folgendem: Die betreffenden Quellen folgen erstens in aller Regel der Norm-Orthographie. Qua buchstabenschriftliche Dokumente weisen sie zweitens die Eigenschaft auf, weitestgehend logisch digital zu sein, selbst Transkriptionen oraler Rede. Schließlich ist dieses Verfahren – wie leicht zu sehen ist – tautologischer Natur: Die Instanz, die man konsultiert, gewinnt ihr Material aus der Produktion derer, die die Instanz konsultieren. Insofern kommt hier eine ‚Metainstanz‘ ins Spiel, die de facto wenn nicht Herr des Verfahrens ist, so zumindest auf dieses wesentlichen Einfluss hat: die de facto respektierte literale Kompetenz in Form von deren Agenten: den Verlags-Lektoraten, von denen wiederum viele sich an anderen orientieren mögen, usw. ad infinitum. Das ‚Subjekt‘, welches das Resultat die Schriftsprache Deutsch (oder Englisch oder Fran-

System und Performanz 

 13

zösisch oder …) zuwege bringt, ist also selbst keine Person, sondern wiederum ein Invisible-hand-Prozess, an dem viele ‚Agenten‘ beteiligt sind, und der solange ‚läuft‘, solange diese Schriftsprache in welcher Weise auch immer noch in Verwendung ist. Hier ist wohl eine technische Erläuterung angebracht: ‚Logisch digital‘ im strengen Sinn ist jede Inskription, Wort oder ganzer Text, wenn sie durchgängig ‚effektiv differenziert‘ ist, wenn also jede einzelne Inskription, Buchstabe oder sonstiges Zeichen, eindeutig genau einem Typ zuzuordnen ist. Bei einem technisch digital erzeugten Text ist dies trivialerweise der Fall. Im Fall von Handschriften in Buchstabenschrift kommen insbesondere bei älteren Quellen mehr oder weniger häufig LeseAlternativen vor, die nicht eindeutig zu entscheiden sind. Doch ist eine Buchstabenbzw. Zeichenfolge eindeutig zu identifizieren, dann ist sie eben  – und stamme sie auch aus dem 2. Jahrtausend v. Chr. – logisch digital. Im Fall etwa der chinesischen literalen Tradition ist dies seltener der Fall, denn das Schriftsystem des Chinesischen ist logisch weitgehend analog: Bei einer (geschätzten) Menge von 80 000–100 000 Hanzì ist mit Blick auf die gesamte nicht-technische Textproduktion häufig nicht eindeutig zu entscheiden, welchem Typ eine Inskription zuzuordnen ist, selbst wenn eine Lesart eindeutig scheint.

7 Kompetenzbegriffe Doch die Orthographie einer jeden Schriftsprache ändert sich, erkennbar allerdings nur in Publikationen oder Orthographiewerken, die zeitlich hinreichend weit ausein­ ander liegen. Wie ist dies aber in einem ‚an sich‘ logisch digitalen System möglich? Die Antwort lautet: Weil sich insbesondere ‚kompetente‘ Schreiber beim Schreiben in der Regel nicht am Duden orientieren, sondern eben an dieser ihrer Kompetenz. Die aber funktioniert nicht digital, sondern analog, d. h.: sie orientiert sich nicht am Identischen, sondern am Ähnlichen. Dies macht plausibel, wieso sich selbst im ‚digitalen‘ Zeitalter ein System wie das einer jeden Buchstabenschrift unmerklich, aber doch unaufhaltsam ändert, selbst wenn das ‚Tempo‘ dieses Prozesses kaum wahrnehmbar ist. Mag auch das System einer Buchstabenschrift logisch – wie dargestellt – digital sein: Die Praxis gerade ‚routinierter‘ Schreiber ist und bleibt analog – je routinierter die Schreiber sind. Denn diese schreiben, salopp gesagt, nicht nach Duden, sondern nach Gefühl. Hier obwaltet, um dies noch einmal logisch zu fassen, kein digitaler, sondern ein analoger Typenbegriff: Ersterer ist dadurch definiert, dass jede Kopie eines Originals O eine exakte Kopie O‘ von O ist. Dies ist nur dann möglich, wenn O selbst logisch digital ist. Ein analoger Typ T besteht dagegen aus einer Menge von Kopien, die einander nur hinreichend ähnlich sind, sodass sie (in aller Regel) eindeutig T und keinem anderen Typ T‘ zugeordnet werden können. Die Wörter eines in ‚ausgeschriebener‘ Handschrift verfassten Textes sind in diesem Sinne analog geschrieben und haben daher meist auch diese

14 

 Christian Stetter

logische Qualität  – dennoch ist es durchaus möglich, dass sie ‚buchstaben-‘ und ‚wortgenau‘ gelesen werden können, etwa bei gut erhaltenen mittelalterlichen Dokumenten. Hier aber ist – im Gegensatz zu logisch digitalen Texten – auch die spezifische Qualität der Schreibperformanz in die ästhetische Qualität des Geschriebenen eingeflossen. Ein berühmtes Beispiel dafür aus einem anderen Bereich sind etwa die Autographen von Bachs Solosonaten und -partiten für Violine. Geht man nun davon aus, dass das System einer ‚natürlichen‘ Sprache in der Kompetenz eines jeden ‚native speaker‘ dieser Sprache mehr oder weniger vollständig repräsentiert ist, so kann es sich dabei nur um mehr oder weniger ähnliche Versionen handeln, die sich zudem im Verlauf eines Lebens unmerklich, aber stetig verändern, indem sie sich an den Wandel von Lebensumständen, an Kommunikationspartner, Lernprozesse, Arbeitsumstände usw. anpassen. Dies ist gleichsam die ‚Ursituation‘, in der sich System und Performanz treffen, und diese dauert, so paradox es klingt, ein Leben lang an, solange noch neue kognitive wie Kommunikationssituationen zu bewältigen sind. Der ‚Betriebsmodus‘ der Sprachkompetenz besteht aus Anpassung und Lernen, was wohl nur verschiedene Aspekte ein und desselben Prozesses sind.

8 Sprache: ein virtuelles System So betrachtet scheinen wir noch auf der Ebene der individuellen Kompetenzen zu verbleiben. Doch dies ist eine Illusion, die gerade die Fälle der sogenannten ‚wilden‘ Kinder verdeutlichen (vgl. Malson u. a. 1972). Der Grundmodus der Sprachkompetenz ist Interaktion, nicht Monolog. Und wenn dies gilt und Sprachkompetenz die ‚erste Instanz‘ ist, wo jedes System einer ‚natürlichen‘ Sprache zu verorten ist, dann stellt sich die Frage nach dem realen wie logischen Status dessen, was wir ein ‚Sprachsystem‘ nennen: Es kann nur ein virtuelles System sein – und zwar als solches ein auf individueller wie gesellschaftlicher Ebene real existierendes System. Was ist nun der Modus dieser Existenz? Es ist die Funktion als das elementare Medium der Koordination sozialen Handelns, ohne die menschliche Existenz undenkbar wäre. Und dies bedeutet: Die ‚natürliche‘ Sprache fungiert ebenso als Sprachgemeinschaften konstituierendes System wie als Medium im alltäglichen Gebrauch. De facto fällt dies zusammen, anthropologisch betrachtet in ersterem, für den Historiker im Gebrauch ebenso wie in literalen Dokumenten. Doch ersterer Modus ist der kategorial entscheidende. Daraus folgen Konsequenzen. Deren wichtigste ist oben schon in anderem Zusammenhang gestreift worden: Der Existenzmodus einer ‚natürlichen‘ Sprache kann nicht auf den Begriff individueller Sprachkompetenz reduziert werden. Denn eine jede solcher ‚natürlichen‘ Sprachen tradiert sich von Generation zu Generation fort, insofern sie als Medium sozialer Kommunikation und kognitiver wie künstlerischer Arbeit fun-

System und Performanz 

 15

giert wie sonstigen menschlichen Lebens, solange irgend jemand auf der Welt sie noch spricht oder liest – wie rudimentär dies auch immer sei. Und dies heißt in letzter Instanz: Jede ‚natürliche‘ Sprache, orale, Gebärden- oder Schriftsprache, existiert im beschriebenen Sinn als ein virtuelles System, gebildet, ‚gepflegt‘ und fortentwickelt von der alltäglichen Kommunikation ebenso wie von wirkungsmächtigen Neuerungen einzelner Gebrauchsweisen, seien diese nun sinnvoll oder trivial. Denn das Virtuelle hat das Besondere an sich, das Mögliche und Faktische in sich zu vereinen. Und auf diese Kombination kommt es an. Als ein solches virtuelles System ‚lebt‘ die ‚natürliche‘ Sprache in jeder menschlichen Gesellschaft: als das Medium ihrer Kommunikation, sei diese oral oder literal oder vollziehe sie sich im Modus der Gebärdensprache. Und als solches ist sie ein Wesen der Popper’schen Welt 3 (vgl. Popper/Eccles 1989, 61 ff.), von jedem einzelnen Menschen unabhängig, wiewohl sie an das Leben der sie sprechenden oder schreibenden Menschen gebunden ist, und im beschriebenen Sinn buchstäblich existierend, solange auf der Welt noch ein Mensch lebt.

9 Literatur Esposito, Elena (1998): Fiktion und Virtualität. In: Krämer, 269–296. Frege, Gottlob (1969): Über Sinn und Bedeutung. In: Funktion, Begriff, Bedeutung. Fünf logische Studien. Herausgegeben und eingeleitet von Günther Patzig. 7., bibliographisch ergänzte Auflage. Göttingen, 40–65. Goodman, Nelson (1968): Languages of Art. An Approach to a Theory of Symbols. Indianapolis/New York. Goodman, Nelson (1984): Weisen der Welterzeugung. Frankfurt a. M. Goodman, Nelson (1988): Tatsache, Fiktion, Voraussage. Übersetzt von Hermann Vetter. Mit einem Vorwort von Hilary Putnam. Frankfurt a. M. Goodman, Nelson (1997): Sprachen der Kunst. Entwurf einer Symboltheorie. Übersetzt von Bernd Philippi. Frankfurt a. M. Goodman, Nelson/Henry S. Leonard (1940): The calculus of individuals and its uses. In: The Journal of Symbolic Logic 5, 45–55. Keller, Rudi (2003): Sprachwandel. Von der unsichtbaren Hand in der Sprache. 3., überarbeitete und erweiterte Auflage. Tübingen u. a. Krämer, Sybille (Hg.) (1998): Medien, Computer, Realität. Wirklichkeitsvorstellungen und neue Medien. Frankfurt a. M. Leroi-Gourhan, André (1984): Hand und Wort. Die Evolution von Technik, Sprache und Kunst. 3. Auflage. Frankfurt a. M. Malson, Lucien/Jean Itard/Octave Mannoni (1972): Die wilden Kinder. Frankfurt a. M. Popper, Karl R./John C. Eccles (1989): Das Ich und sein Gehirn. München. Stetter, Christian (2005): System und Performanz. Symboltheoretische Grundlagen von Medientheorie und Sprachwissenschaft. Weilerswist. Wittgenstein, Ludwig (1984): Werkausgabe in acht Bänden. Tractatus logico-philosophicus, Tagebücher 1914–1916. Philosophische Untersuchungen. 1. Band. Frankfurt a. M.

16 

 Christian Stetter

Wunderli, Peter (2013): Ferdinand de Saussure: Cours de linguistique générale. Zweisprachige Ausgabe französisch-deutsch mit Einleitung, Anmerkungen und Kommentar. Tübingen.

Arnulf Deppermann/Nadine Proske

2. Grundeinheiten der Sprache und des Sprechens Abstract: Der Beitrag widmet sich der Frage, nach welchen Einheiten das Sprechen in der Interaktion auf der ‚mittleren Ebene‘ strukturiert ist. Die Diskussion geht aus von für die gesprochene Sprache typischen bzw. spezifischen Phänomenen, die Kriterien normgrammatisch vollständiger Sätze zuwider laufen, wie z. B. Ellipsen, Expansionen und Diskursmarkern. Anschließend werden die in der Literatur der vergangenen etwa 40 Jahre theoretisch entwickelten und empirisch untersuchten Einheitenkonzepte diskutiert und im Hinblick auf ihre Leistungsfähigkeit zur Beschreibung und Erklärung nicht-normgrammatischer Phänomene evaluiert. 1 Einleitung 2 Die Unzulänglichkeit der Kategorie ‚Satz‘ für das Sprechen 3 Einheitenkonzepte 4 Problemfälle 5 Fazit 6 Literatur

1 Einleitung Dieser Beitrag widmet sich der Frage, in welchen Einheiten das Sprechen in der Interaktion (ab hier: ‚Sprechen‘) auf der ‚mittleren Ebene‘ strukturiert ist. In Anlehnung an Fiehler u. a. (2004) können wir in Bezug auf das Sprechen folgende Ebenen unterscheiden: – Phoneme, – Wörter, – die hier interessierende ‚mittlere Ebene‘, – Sequenzen bzw. Themen, – kommunikative Gattungen, – Interaktionen. Jeder dieser Einheitentypen ist durch eigene autonome Organisationsprinzipien charakterisiert und sie sind jeweils konstitutiv für Einheiten der nächsthöheren Ebene. In unserem Beitrag geht es um Einheiten oberhalb der Wortebene und unterhalb der Sequenz- und Themenebene. Für die traditionelle, monologische konzeptionelle Schriftsprache (Koch/Oesterreicher 1985) ist wohl unstrittig, dass die Einheiten dieser Ebene kanonisch Sätze sind bzw. dass nicht kanonische Strukturen (Ellipsen)

18 

 Arnulf Deppermann/Nadine Proske

in Bezug auf das Modell des Satzes analysiert und verstanden werden können. Dieser Beitrag will zunächst anhand eines exemplarischen Beispiels zeigen, dass und warum die Strukturierung des Sprechens vielfach nicht der Kategorie ‚Satz‘ folgt und dass diese folglich nicht als Grundeinheit zur Beschreibung und Analyse des Sprechens taugt (2.). Anschließend stellen wir alternative Konzepte vor, die für die Beschreibung der Einheitenkonstitution im Sprechen entwickelt wurden (3.). Wir diskutieren die jeweiligen Einheitenbildungskriterien, ihre Motivation, ihre Leistungsfähigkeit und ihre Probleme. Schließlich gehen wir auf Strukturen des Sprechens in der Interaktion ein, die von keiner der bisher vorgeschlagenen Einheitenkonzeptionen befriedigend behandelt werden können (4.). Wir schließen mit einer kritischen Reflexion der Leistungsfähigkeit und Notwendigkeit von Einheitenkonzepten für die Analyse des Sprechens (5.).

2 Die Unzulänglichkeit der Kategorie ‚Satz‘ für das Sprechen Unserer Untersuchung legen wir zugrunde, dass ‚Satz‘ dadurch definiert sei, dass eine syntaktische Struktur mindestens eine finite Verbform und in der Regel ein Subjekt sowie die Realisierung der obligatorischen verbgebundenen Ergänzungen beinhalte (Forsgren 1992). Das schließt regelhaft subjektlose Strukturen wie z. B. das unpersönliche Passiv ein. Sätze zeichnen sich dadurch aus, dass sie (etwa im Gegensatz zu Turns und Intonationsphrasen, vgl. Abschnitt 3) kontextfrei als solche feststellbar sind und ausschließlich durch Verhältnisse auf der syntaktischen Ebene definiert sind (Deppermann 2012). Ein erheblicher Teil der Strukturen des Sprechens ist nicht satzförmig. Dabei handelt es sich keineswegs nur um ‚Performanzphänomene‘ im Sinne der generativen Grammatik, d. h. um Abbrüche oder andere defektive Strukturen (Anakoluthe), die durch kommunikativ nicht systematisch eingesetzte Planänderungen, Aufmerksamkeitsprobleme oder Störungen durch nicht vom Sprecher zu verantwortende Ereignisse verursacht sind. Vielmehr ist ein großer Teil der sprachlich-kommunikativen Praktiken, die routinemäßig zur Bearbeitung bestimmter Kommunikationsaufgaben eingesetzt werden, nicht satzförmig. Diskurspartikeln (Rückmelder, Diskursmarker, Häsitationssignale, Interjektionen usw.), Ellipsen, Analepsen, Links- und Rechtsversetzungen, freie Themen, Apokoinukonstruktionen oder Vokative sind Beispiele für nicht-satzförmige, usuelle Strukturen des Sprechens im Deutschen, die kommunikativ systematisch eingesetzt werden (im Überblick: Schwitalla 2012). Andere Konstruktionen wie z. B. viele Arten von Expansionen im Nachfeld, Selbstkorrekturen und -reformulierungen genügen ebenfalls nicht dem Satzkriterium, da sie topologisch und/oder rektionsbezogen nicht auf die zuvor etablierte Satzstruktur bezogen sind (Auer 1991). Deppermann (2012) stellte in einer Untersuchung von 6 mal 10 Minuten zufällig ausgewählter Ausschnitte von Sprechen

Grundeinheiten der Sprache und des Sprechens 

 19

in unterschiedlichen Interaktionstypen (informelle Freizeitgespräche, Rettungsübungen, Sprechen während eines Tischfußballspiels, biographisches Interview, Psychotherapie, Arzt-Patient-Gespräche) fest, dass nur 18,4 % der in den 60 Minuten produzierten 1010 Gesprächsbeiträge (Turns) mit einem Satz begannen bzw. aus einem oder mehreren Sätzen bestanden. 56 % der Beiträge begannen dagegen mit einer syntaktisch nicht eingebundenen Diskurspartikel (Schwitalla 2002; Fischer 2006) bzw. bestanden lediglich aus einer oder mehreren Diskurspartikeln. An einem Beispiel wollen wir zeigen, auf welche Probleme der Versuch, Interaktionen in Satzstrukturen (exhaustiv) zu segmentieren, stößt, und einige der nicht-satzförmigen Strukturen zeigen, die systematisch in der Interaktion eingesetzt werden. In #1 spricht PA mit JO und UD darüber, wie er seine Kopfschmerzen behandelt hat. #1 FOLK_E_00066_SE_01_T_01, Gartengespräch, 00:12:16 01 PA hab dann heut ma mein KRÄUterbuch, 02 (0.51) zu RAte gezogen, 03 die ha:m waCHOLdertee und LÖwenzahntee empfohlen, 04 (0.76) [ich hab mir dann] bEIdes geMACHT, 05 JO [HM_m. ] 06 PA und außerdem noch mit (.) frühmesner BAdeöl– 07 wo lavendel und rOsmarin drin is EINgeschmiert, 08 (0.98) 09 JO nIch gleich die rauWOLfia. 10 (0.95) 11 PA ä:h sagt mir jetz NIX. 12 (1.67) 13 PA nee aber ä:hm 14 (.) 15 UD was IS das denn. 16 (0.59) 17 JO die rauWOLfia? 18 (0.34) 19 UD ne PFLANze oder [was. ] 20 JO [isch ne] PFLANze:– 21 sO wie:– 22 (0.55) 23 PA un is auch [bei Ischiasn]erv gut oder wie. 24 JO [TOLLkirsche.] 25 (0.29) is einfach n: (0.35) beTÄUbungsmittel. 26 (0.49) 27 PA ah. 28 (0.38) nee dis dis waCHOLdertee, 29 un LÖwenzahntee, 30 dis soll wohl irgendwie gut für_n Ischiasnerv sein,

20 

 Arnulf Deppermann/Nadine Proske

In diesem Interaktionsausschnitt finden wir viele übliche Strukturen, die im Sinne der o. g. Definition nicht satzförmig sind: – Sprecherellipse (Hoffmann 1999): Topik-drop: „ø hab dann heut…“, S01; – Objektellipse (Hoffmann 1999): „und außerdem ø noch mit (…) eingeschmiert“, S06-07; – Ellipse von Subjekt, Verbalkomplex und ggfs. Fragepronomen: „ø nIch gleich die rauWOLfia.“, S09; – Analepse: Topik-drop (Helmer i. V.): „ø sagt mir jetz NIX.“, S11, ebenso in S20 und S23; Verstehensprüfung durch Formulierung nur des kritischen Elements (Selting 1987): „die rauWOLfia?“, S17 und „ne PFLANze oder was.“, S19; – Rückmeldepartikeln: „HM_m“, S05 (Ehlich 1986; Schmidt 1988); „ah.“, S27 (Golato/Betz 2008); – Antwortpartikeln (Sorjonen 2001): „nee“, S13 und S28; – Häsitationssignal (Clark/Fox-Tree 2002): „äh“, S11; – Rückversicherungspartikel (Rehbein 1979): „oder wie.“, S23; – Linksversetzung: In S28-30 werden zunächst zwei nominale Elemente thematisiert: „dis dis waCHOLdertee, un LÖwenzahntee,“, die anschließend pronominal im Satzrahmen wiederaufgenommen werden „dis soll wohl […]“ („Referenz-/ Thematisierungs-Aussage-Struktur“, Fiehler u. a. 2004); – Abbruch (S13; Selting 2001); – Diskontinuierliche Strukturen: In S17-24 produziert JO in vier inkrementellen Schüben die Aussage „die rauWOLfia? isch ne PFLANze:– sO wie:– TOLLkirsche.“. Die Produktion dieser Aussage geschieht aber nicht autonom, sondern sie reagiert auf UDs Frage in S19 „ne PLFANze oder was.“, und die Aussage wird fortgeführt, während bereits ein anderer Sprecher (PA) das Rederecht übernommen hat (S23). Die Produktion eines Satzes geschieht hier also über mehrere Turnkonstruktionseinheiten, Turns und Sprecherwechsel hinweg und bezieht Beiträge des Adressaten in die Satzkonstruktion ein (Goodwin 1979); – Reanalysierte Strukturen: „die rauWOLfia“ wird in S17 zunächst als Verstehens­ prüfung formuliert, durch die Fortsetzung „isch ne planze“ in S20 dann aber retrospektiv als Referenz einer als Antwort produzierten Aussage reinterpretiert. Wir sehen hier, dass der einheitenbezogene Status eines Elements und die Einheitenextension ambig sein kann, da sie durch folgende Interaktionsbeiträge neu interpretiert werden kann, ohne dass dadurch die vorangegangene Interpretation (etwa als auf einem Missverständnis beruhend) ungültig werden muss (Auer 2010). Aufgrund der Usualität dieser Strukturen ist die Kategorie ‚Satz‘ als Grundkonzept für die exhaustive Analyse von Einheiten des Sprechens untauglich. Damit soll weder behauptet werden, dass Sprecher keine Sätze produzieren noch dass sie sich bei der Produktion und Rezeption von Äußerungen in der Interaktion nicht oftmals an Satzförmigkeitskriterien und damit verbundenen Fortsetzungs- und Gestaltschlusser-

Grundeinheiten der Sprache und des Sprechens 

 21

wartungen orientieren (Selting 1995a und in diesem Band). Im Gegenteil, es ist eine empirisch noch keineswegs gut geklärte Frage, welche spezifischen Leistungen Sätze in der Interaktion im Vergleich zu anderen interaktiv möglichen und usuellen Strukturen erbringen (Deppermann 2012). In Bezug auf die Frage nach den Grundeinheiten des Sprechens aber stellt sich die Frage, welcher Logik die Konstruktion von kommunikativ vollständigen, für die Interaktionsteilnehmer erkennbaren und als solche verstandenen Einheiten folgt. Damit verbinden sich folgende Fragen: – Sind die relevanten Einheiten linguistisch (prosodisch, syntaktisch), pragmatisch (handlungs- oder intentionsbezogen), interaktionsorganisatorisch (mit Bezug auf den Sprecherwechsel) oder semantisch (propositional oder konzeptuell) konstituiert? – In welchem Verhältnis stehen die verschiedenen potenziell einschlägigen Ebenen und Phänomene der Einheitenbildung zueinander, d. h. prosodische, grammatische, semantische, pragmatische, turnkonstruktionale und interaktionale (sequenziell-responsive) Strukturen? – Wie zeigen Gesprächsteilnehmer in Produktion und Rezeption an, wann sie Äußerungsstrukturen als abgeschlossene Einheiten betrachten und welche Kriterien sie dafür ansetzen?

3 Einheitenkonzepte Alle spezifisch für die analytische Gliederung des Sprechens entwickelten Einheitenkonzepte streben eine Segmentierung von Interaktionen in Einheiten der ‚mittleren Ebene‘ an. Anders als in diesem Artikel (vgl. Abschnitt 1) werden Gattungen und Sequenzen oft nicht als systematische Organisationsebene berücksichtigt. Stattdessen wird als „nächstniedrige Einheit unterhalb des Gesprächs“ (Fiehler u. a. 2004, 200) der Turn (auf Deutsch meist: (Gesprächs-/Rede-)Beitrag (zur Begriffsgeschichte vgl. Rath 2001)) bzw. der „Gesprächsschritt“ (Brinker/Sager 2010; Henne/Rehbock 1995) angesehen – eine mit Rederecht gemachte Äußerung eines Sprechers, die durch vorangehenden und folgenden Rederechtswechsel oder durch den Beginn oder das Ende des Gesprächs begrenzt wird. Äußerungen, für die kein Rederecht beansprucht wird, z. B. Rückmeldesignalen, kommt kein Turn-Status zu (vgl. Schegloff 1981). Entsprechend sind Sprecherwechsel ohne Rederechtswechsel möglich. Dabei ist die Grenzziehung zwischen einem bloßen Rückmeldesignal und einem eigenständigen minimalen Turn nicht immer eindeutig (vgl. 4.2); außerdem können Turns kollaborativ entstehen (vgl. 4.3). Die gesprächsanalytische Kategorie des Turns hat sich auch in linguistischen Darstellungen wie z. B. der IDS-Grammatik etabliert, wo ihr als zusätzliche Eigenschaft propositionaler und illokutiver Gehalt zugeschrieben wird (vgl. Zifonun u. a. 1997, 469), was im Hinblick auf nicht-propositionswer­tige Turns wie Begrüßungen und andere Arten von Performativa allerdings problematisch ist.

22 

 Arnulf Deppermann/Nadine Proske

Es herrscht kein Konsens darüber, wie die untergeordneten Einheiten, aus denen sich ein Turn zusammensetzt, analytisch erfasst werden sollten. Einige Einheitenkonzepte beschränken sich auf eine sprachliche Ebene (z. B. Syntax, Prosodie, Pragmatik). Sie segmentieren Turns entsprechend anhand von Grenzmerkmalen nur auf dieser Ebene in ebenenspezifische Einheiten (vgl. 3.1). Die meisten Ansätze dagegen favorisieren, explizit oder implizit, holistische, ebenenübergreifende Einheitenkonzepte. Sie beziehen bei der Segmentierung Abschlusssignale auf verschiedenen Ebenen ein (vgl. 3.2).

3.1 Ebenenspezifische Einheitenkonzepte Obwohl der Satz, wenn er wie unter 2. vom finiten Verb und dem Vorhandensein obligatorischer Argumente ausgehend definiert wird, für die exhaustive Segmentierung von Interaktionen ungeeignet ist, haben auch Ansätze der Gesprochene-SpracheForschung häufig mit diesem als Grundeinheit gearbeitet. Dabei wurden besondere Kriterien für eigentlich nicht satzförmige Einheiten hinzugenommen. Ein Beispiel ist Kindt (1994), dessen „weitgehend grammatikunabhängiger Satzbegriff“ auch isolierte Phrasen, die kaum als Ellipsen rekonstruierbar sind, umfasst. Einen Überblick über entsprechende Konzepte geben Fiehler u. a. (2004, 175 ff.). Die Relevanz syntaktischer Fortsetzungserwartungen und die Orientierung Interagierender an syntaktischen Mustern, auch solchen unterhalb der Satzebene, betont Auer (2000, 2007a) mit seiner Konzeption der „Online-Syntax“. Die Sprechakttheorie zieht sprachliche Handlungen für die Gliederung des Sprechens heran. Die funktionale Segmentierung geschieht hier unabhängig von formalen Einheiten. Auf Interaktionen angewandt hat dies v. a. die Funktionale Pragmatik (vgl. Ehlich 2010a), die auf der Sprechakttheorie aufbauend eine eigene Sprechhandlungstheorie mit sog. Prozeduren als kleinsten Handlungseinheiten entwirft. Entsprechend sieht das für diesen Ansatz verwendete Transkriptionssystem HIAT (vgl. Rehbein u. a. 2004) eine Segmentierung in auf Prozeduren, aber auch auf formale Merkmale bezogene Einheiten vor (vgl. 3.2), denen dann im Analyseprozess Handlungen zugewiesen werden (vgl. Ehlich 2010b). Traditionelle Sprechakttheorie wird dagegen nur vereinzelt auf Interaktionen angewandt (z. B. Hagemann/Rolf 2001; Staffeldt 2014). Problematisch ist dabei die semantische Bedingung für Sprechakte. Der illokutionäre Akt, d. h., die Handlung, die durch eine Äußerung vollzogen wird, ist fast immer an einen propositionalen Akt gebunden. Dieser wird oft durch Sätze, aber auch durch Ellipsen und Analepsen realisiert. Für Gesprächspartikeln  – mit Ausnahme von Responsiven und Interjektionen, denen oft trotz der Nichtpropositionalität illokutiver Gehalt zugesprochen wird – kann Propositionalität nicht angenommen werden. Daher kann einigen mit nicht-propositionalen Einheiten (z. B. Diskursmarkern) ausgeführten Handlungen so nicht Rechnung getragen werden, ganz zu schweigen von non-verbalen Interaktionsbestandteilen.

Grundeinheiten der Sprache und des Sprechens 

 23

Darüber hinaus ist es generell unklar, welches Inventar an Handlungen man ansetzen sollte, um eine exhaustive Segmentierung zu ermöglichen: Sprechakte, durch Adjazenzpaare repräsentierte Handlungen oder ein anderes (grob- oder feinkörnigeres) Inventar? Außerdem werden, wie schon Levinson (1981) aus theoretischer Perspektive problematisiert, durch eine Äußerung häufig mehrere Handlungen gleichzeitig ausgeführt (vgl. z. B. #1, S19 „ne PLFANze oder was.“ – zugleich ‚Frage‘ und ‚Verstehensprüfung‘). Unabhängig vom Inventar stellt sich die Frage, anhand welcher Kriterien Handlungen analytisch identifiziert werden können. Einen aktuellen Überblick über die Problematik gibt Levinson (2013). Eine für das Sprechen spezifische formale Segmentierung ermöglicht die Prosodie: Die Gliederung in aufeinanderfolgende Abschnitte mit einem „als kohäsiv wahrgenommenen Tonhöhenverlauf“ (Selting u. a. 2009, 370) wird anhand des Konzepts der Intonationsphrase erfasst. Diese bzw. ihre Vorläufer, die nicht alle anhand authentischer Daten konzipiert worden sind, sind in der Literatur unter verschiedenen anderen Bezeichnungen wie z. B. tone group (z. B. Halliday 1967), intonation-group (Cruttenden 1997) oder intonation unit (z. B. Chafe 1994) bekannt (einen Überblick über die Forschungsgeschichte geben z. B. Barth-Weingarten 2011; Couper-Kuhlen 1986; Selting 1995b und Szczepek Reed 2010). Allen Konzeptualisierungen ist im Wesentlichen gemein, dass von obligatorischen und fakultativen Identifikationskriterien für das Vorhandensein einer prosodischen Einheit ausgegangen wird: Es muss mindestens ein Fokusakzent und eine finale Tonhöhenbewegung vorliegen. Darüber hinaus können Intonationsphrasen durch Tonhöhensprünge, Tempoveränderungen (v. a. finale Dehnung und beschleunigt gesprochene Silben am Anfang), Rhythmusveränderungen, hörbares Einatmen, Glottisverschluss, Knarrstimme sowie Pausen abgegrenzt sein. Da diese Merkmale optional sind und außerdem zum Teil auch innerhalb von Intonationsphrasen vorkommen können, ist eine eindeutige Segmentierung oft schwierig. Angelehnt an Auer (2010) (vgl. 3.2) hat Barth-Weingarten (2011, 2013) daher vorgeschlagen, nicht von Einheiten mit klaren Grenzen, sondern von Zäsuren auszugehen, die mehr oder weniger stark ausgeprägt sein können, je nach Anzahl der vorhandenen Merkmale, und Einheiten als Epiphänomene zu verstehen. Für englischsprachige Telefongespräche zeigt sich, dass Sprecherwechsel an Stellen mit starken Zäsuren bzw. einem ganz bestimmten Bündel prosodischer und phonetischer Merkmale stattfinden. Die Stärke von Hörerrückmeldungen richte sich nach der Stärke der Zäsur (vgl. Barth-Weingarten 2013), was ein emischer Beleg für das Verständnis von Einheiten bzw. Zäsuren aus Teilnehmersicht sei. Da es zu anderen Sprachen und vor allem zu anderen Settings mit anderen pragmatischen Voraussetzungen noch keine Untersuchungen gibt, soll anhand des folgenden Beispiels angedeutet werden, wie sich die Orientierung der Interagierenden an der Stärke der prosodischen Zäsuren zeigt. Das Beispiel stammt aus einer Schichtübergabe in einer psychiatrischen Klinik, in der über Patienten gesprochen wird.

24 

 Arnulf Deppermann/Nadine Proske

#2 FOLK_E_00111_SE_01_T_01, Schichtübergabe, 00:06:56 01 MO ich finde das müsste man zeitlich EINschränken;= 02 = gestern WIEder, 03 °h der war KNACke floride psyCHOtisch;= 04 =WAHNhaft;= 05 =als er REINkam. 06 MA [hm:.] 07 MO [°h ] der hat die AUgen zugemacht,= 08 = DARF sie jetzt grad nich AUFmachen? 10 (0.2) 11 MO j[a,] 12 MC [oH]A.

Alle bis auf zwei Zäsuren in MOs Erzählung sind sehr schwach. Durch Beschleunigungen nach einer finalen Tonhöhenbewegung (S01-02), schnelles Sprechen über einen intonatorischen Abschlusspunkt hinweg (S08-09, rush through, vgl. z. B. Schegloff 1987, 106 f.; Selting 1995b, 92) und durch latching (vgl. z. B. Du Bois u. a. 1993, 59), das Fehlen von (Mikro-)Pausen zwischen den (potenziellen) Intonationsphrasen (S01-02, 03-05, 07-09), werden Zäsuren minimiert. Zwei Zäsuren (S03 und 07) sind relativiert durch hörbares Einatmen, das zwar zur Zäsurenstärke beiträgt, aber zugleich die Absicht anzeigt, noch weiterzusprechen. Nur an der zweiten dieser beiden Stellen (S07), an der wir vorausgehend eine deutlich terminale, tief fallende Grenzintonation feststellen können, gibt MA in Überlappung mit dem Einatmen eine leise, nicht akzentuierte Rückmeldung („hm:.“, S06). Im ersten Fall (S03) dagegen geht ein nur leicht steigender Tonhöhenverlauf voraus. Eine stärkere Zäsur als zwischen S05 und S07 findet sich in S09. Sie ist markiert u. a. durch den stark steigenden finalen Tonhöhenverlauf und die anschließende Pause (S10). Hier erfolgt eine stärkere Hörerrückmeldung: kein reines Fortsetzungssignal (vgl. 4.2), sondern die potenziell turnwertige Partikel „oHA.“ (S12). Deren Relevanz auch für den Sprecher wird durch dessen Vergewisserungssignal („ja,“, S11) deutlich, das in teilweiser Überlappung mit dieser geäußert wird. Die Qualität der Rückmeldung richtet sich dabei natürlich grundsätzlich nach den semantisch-pragmatischen Merkmalen der vorausgehenden Einheit, das prosodische Format, das im Zäsurierungsansatz gezielt isoliert betrachtet wird, unterstützt diese. Am Konzept der Intonationsphrase ist von Fiehler u. a. (2004, 193) die Formorientierung kritisiert worden, da diese zu einer Aufspaltung von funktionalen Einheiten führe. Aber auch die Behandlung von Intonationsphrasen als funktionale Einheiten, die aus Chafes (1994) Gleichsetzung der intonation unit mit einer kognitiv relevanten Verarbeitungseinheit (einer dem Arbeitsgedächtnis entsprechenden Zeitspanne, innerhalb der nur eine bestimmte Menge an Information verarbeitet werden kann) resultiert, ist problematisiert worden (vgl. Auer 2010). Andererseits ist die Formorientierung positiv gewertet worden. Sie ermöglicht eine objektivierbarere Segmentierung als eine handlungs- oder TCU-basierte Gliederung. Außerdem erlaubt sie es, ausge-

Grundeinheiten der Sprache und des Sprechens 

 25

hend von der genauen Repräsentation der Form, Form-Funktions-Zusammenhänge zu identifizieren und diesbezügliche Generalisierungen zu prüfen. Das Transkriptionssystem GAT2 setzt daher die Intonationsphrase als Segmentierungseinheit an (Selting u. a. 2009). Die prosodische Segmentierung verdeutlicht, an welchen formalen Merkmalen neben den syntaktischen sich Interagierende orientieren: Intonationsphrasengrenzen müssen nicht mit syntaktischen Grenzen zusammenfallen. Nicht selten verteilen sich empirisch gesehen Sätze auf mehrere Intonationsphrasen, was durch die Verteilung der Fokusakzente eine informationsstrukturelle Portionierung ermöglicht: aus #1

28 29 30

UD

(0.38) nee dis dis waCHOLdertee, un LÖwenzahntee, dis soll wohl irgendwie gut für_n Ischiasnerv sein,

Umgekehrt können mehrere (Teil-)Sätze als eine Einheit präsentiert werden, wenn syntaktische Grenzen nicht prosodisch markiert werden (vgl. #3, S01). #3 FOLK_E_00066_SE_01_T_02, Gartengespräch, 00:53:11 01 UD un KRATZt_s schon wenn de brEmsch. 02 (0.25) [n KRATZgeräu][sch.] 03 JO [na ja pff: ] 04 [ ne]e.

Manchmal ist eine rein prosodische Abgrenzung zwischen solchen Fällen einer Intonationsphrase mit zwei Akzenten und dem Anschluss einer neuen Intonationsphrase durch rush through wie in #2 (S08-09) schwierig: Wenn zwei (potenzielle) Fokusakzente vorliegen und dazwischen nur schwach ausgeprägte prosodische Zäsurierungsmerkmale zu finden sind, dann ist die Entscheidung zwischen der Annahme von ein oder zwei Intonationsphrasen willkürlich, zumal es auch Intonationsphrasen mit mehr als einem Fokusakzent gibt (vgl. z. B. #1, S03). Hinzu kommt, dass die Konzeptualisierung des rush through syntaktische (und pragmatische) Grenzen als potenzielle prosodische Grenzen voraussetzt, obwohl die Syntax für die prosodische Ebene definitorisch nicht als einheitenbildend vorgesehen ist (vgl. aber Walker 2010 zur tatsächlichen prosodischen Abgeschlossenheit der ersten Intonationsphrase beim rush through).

3.2 Ebenenübergreifende Einheitenkonzepte Mit ihrem für die Konversationsanalyse grundlegenden Aufsatz zum Turn-Taking etablierten Sacks/Schegloff/Jefferson (1974) die Turnkonstruktionseinheit (turn-constructional unit, kurz: TCU) als Grundbaustein für Turns. Der mögliche Umfang dieser wird zunächst anhand syntaktischer Einheiten (Sätze, Teilsätze, Phrasen, Wörter) definiert.

26 

 Arnulf Deppermann/Nadine Proske

Jede TCU endet mit einem möglichen Abschlusspunkt bzw. einer übergaberelevanten Stelle (transition relevance place, kurz: TRP). Die nachfolgende Forschung betont neben der Syntax stärker auch die Rolle der Prosodie, der Handlungsebene und auch nonverbaler Aspekte (z. B. Blickverhalten und Gesten, vgl. 4.4 und 4.5) für die Identifikation von TRPs (vgl. z. B. Ford/Thompson 1996; Ford/Fox/Thompson 1996; Schegloff 1996, 2007; Selting 1995b, 2000; einen aktuellen Überblick gibt Clayman 2013). Die TCU als potenziell selbständiger Turn kann nur im Sprechen gebildet werden und ist so keine allein durchs Sprachsystem bzw. kontextfrei beschreibbare Einheit. Da für die Bestimmung von TRPs mögliche Abschlusspunkte auf verschiedenen Ebenen herangezogen werden, stellt sich in Fällen, in denen diese Grenzsignale auf den verschiedenen Ebenen nicht zusammenfallen, die Frage, ob auch Einheiten ohne TRP, aber mit einem funktional relevanten Abschluss, eine TCU bilden können. Zum Beispiel lässt sich diskutieren, wie viele TCUs in den Segmenten 28-30 von #1 (hier mit Fortsetzung wiedergegeben) vorliegen: #1a FOLK_E_00066_SE_01_T_01, Gartengespräch, 00:12:46 27 PA ah. 28 (0.38) nee dis dis waCHOLdertee, 29 un LÖwenzahntee, 30 dis soll wohl irgendwie gut für_n Ischiasnerv sein, 31 °hhh u:nd 32 (0.68) n hab i noch frühmesner BAdeöl drauf geschmiert, 33 weil da au noch stand man könnt_s mit laVENdelgeist oder ROSmaringeist einschmieren, 34 (.)°hhh dis hatt ich nich zur HAND, 35 n da hab ich frühmesner BAdeöl genommen– 36 weil da beides DRIN is, 37 lavEndel und ROSmarin; 38 °hhh im moment is es auf jeden fall BESser; 39 sa_mer ma SO.

Auf die Antwortpartikel nee (S28) folgen ohne prosodische Grenze zwei koordi­nierte linksversetzte Nominalphrasen („dis dis waCHOLdertee, un Löwenzahn­tee,“), die sich auf zwei Intonationsphrasen verteilen, sowie ein V2-Satz („dis soll wohl irgendwie gut für_n Ischiasnerv sein,“), ebenfalls in einer separaten Intonationsphrase. Die linksversetzten NPs weisen zwar jeweils eine prosodische Grenze auf, sie können auch als separate Referenz-Handlungen angesehen werden (vgl. Fiehler u. a. 2004) und syntaktisch ist zumindest das Ende einer Phrase erreicht. Diese Grenzen stellen jedoch aus pragmatischen Gründen keine übergaberelevanten Stellen dar. Obwohl eine isolierte NP durchaus einen Turn konstituieren kann, z. B. als Antwort, reicht sie im gegebenen Kontext nicht aus, da der Sprecher durch sie hier nach Beendigung einer Nebensequenz (#1, S09-25) zuvor thematisierte Referenten refokussiert, so dass diese Referenz eine Prädikation projiziert. Das folgende Syntagma endet mit einer möglichen Satzgrenze (rechte Satzklammer), stellt eine vollständige Proposition dar

Grundeinheiten der Sprache und des Sprechens 

 27

und weist auch eine prosodische Grenze auf. Allerdings liegt ein leicht steigender finaler Tonhöhenverlauf vor, was im Deutschen als „progredient“ interpretiert wird (vgl. Auer/Selting 2001, 1124; s. aber Szcepek Reed 2004 für abweichende Befunde zum Englischen). Deshalb ist auch hier fraglich, ob ein TRP vorliegt. Dass PA seine Wiederaufnahme der Ausführungen aus S01-07 (#1) mit S30 noch nicht beendet hat, geht auch aus der Fortsetzung ab S31 (#1a) hervor. Hier wird bereits gegebene Information rekontextualisiert. Auch die übergreifende Gesprächsstruktur hat also mit Einfluss darauf, dass in S30 kein eindeutiger TRP vorliegt. Mit der Problematik, dass Kriterien für das Ende einer TCU divergieren können, ist in der Forschung auf zweierlei Weise umgegangen worden: 1) Um eine exhaustive Segmentierung zu ermöglichen, werden TCUs ohne TRP angenommen. Sie liegen immer dann vor, wenn auf einer Ebene ein Abschlusspunkt fehlt; ein TRP liegt nur vor, wenn ein syntaktischer, prosodischer und semantisch-pragmatischer Abschluss zugleich vorliegt. Es können zudem auch, wie in #1a, sequenzstrukturelle Gründe das Entstehen eines TRP am TCU-Ende verhindern (vgl. Selting 2000); für TCUs ohne TRP wird z. T. eine neue Kategorie eingeführt (vgl. z. B. die turn constructional phrase (TCP) bei Szczepek Reed 2010). 2) Es wird keine exhaustive Segmentierung angestrebt. Stattdessen wird die TCU als Epiphänomen verstanden (vgl. Ford/Fox/Thompson 1996) und betont, dass der analytische Fokus darauf liegen müsse, an welchen möglichen Abschlusspunkten auf verschiedenen Ebenen neben klaren TRPs sich die Interagierenden bei der Konstitution von Turns orientieren. Die Frage nach der Segmentierung in untergeordnete Einheiten wird als „not ultimately the question we need to answer“ (Ford/Fox/Thompson 1996, 431) betrachtet. Dies entspricht auch dem Status des Turns als konstitutionstheoretisch relevante Einheit in der konversationsanalytischen Forschung, der trotz der zahlreichen Untersuchungen zu den ihm untergeordneten Einheiten besteht. Er zeigt sich auch in der Segmentierung von Transkripten nach Jefferson (1983, 2004), die nach Turns, nicht nach TCUs, erfolgt. Auer (2010) verzichtet dagegen auf die Verwendung der Einheit TCU. Er geht nicht von Einheiten aus, sondern von Zäsuren auf prosodischer, syntaktischer und pragmatischer Ebene. Gibt es auf allen Ebenen an derselben Stelle eine Zäsur, so liegt ein besonders salienter Gestaltschluss vor. Gibt es auf nur einer Ebene einen Abschlusspunkt, ist die Zäsurierung nur schwach. Sprecherwechsel finden in der Regel an Stellen statt, an denen Abschlusspunkte auf allen Ebenen vorliegen. Empirisch zeigt sich, dass pragmatische Abschlüsse immer prosodische Abschlüsse voraussetzen, die meist syntaktische Abschlüsse voraussetzen. Letztere sind am zahlreichsten, aber für sich allein auch am wenigsten vorhersagekräftig für mögliche Sprecherwechsel, während der pragmatische Abschluss entscheidend ist (vgl. fürs Englische Ford/ Thompson 1996). Der Zäsurierungsansatz ist also hilfreich für die Analyse der Handlungsstruktur in der Interaktion. Er vermeidet weiterhin ein Problem, das sich als Artefakt aus der Annahme der Einheitenkategorie TCU erst ergibt: Wenn nicht auf allen Ebenen eine Zäsur vorliegt, muss nicht entschieden werden, ob ein TRP und

28 

 Arnulf Deppermann/Nadine Proske

damit eine TCU vorliegt, sondern die Beschreibung der vorliegenden Zäsuren auf den verschiedenen Ebenen bildet für sich die Basis für weitere Analysen. Im Zusammenhang mit der Vorläufigkeit der Abgeschlossenheit von TCUs werden häufig Erweiterungen nach TRPs thematisiert. Schegloff (1996) schlägt eine dichotome Unterscheidung in Fortsetzungen einer TCU, increments, die selbst keine TCU bilden, da sie semantisch und grammatisch unselbständig sind und keine eigene Handlung konstituieren, und Fortsetzungen eines Turns durch Hinzufügen einer neuen TCU vor, geht aber auch auf Erweiterungen ein, die in keine dieser Kategorien passen (z. B. Vergewisserungssignale und Anredeformen). Im Gegensatz zur ursprünglichen Definition nach Sacks u. a. (1974) können Turns dieser Konzeption zufolge also nicht nur aus TCUs bestehen, sondern aus zwei weiteren Einheitenkategorien. Increments sind als lineare grammatische Erweiterungen eines vorläufig abgeschlossenen Syntagmas definiert. Ohne dass dies explizit Teil von Schegloffs Definition ist, folgen diese in allen diskutierten Beispielen zudem immer nach einer prosodischen Grenze, da sie sonst im Englischen, das keine rechte Satzklammer kennt, gar nicht als nachträgliche Erweiterungen erkennbar wären (vgl. Auer 2006, 2007b). Ford/Fox/Thompson (2002) vertreten eine breitere Auffassung von increments („nonmain-clause continuation after a possible point of turn completion“, Ford/Fox/Thompson 2002, 16); sie gehen im Gegensatz zu Schegloff davon aus, dass diese durchaus eigenständige Handlungen konstituieren können, und unterscheiden entsprechend zwei Typen: 1) Extensions „can be heard as syntactically and semantically coherent with what has come before“; diese stellen also keine syntaktisch unabhängige Einheit dar, sie setzen außerdem die vorausgehende Handlung fort. 2) Free constituents sind nicht als Konstituente des vorausgehenden Syntagmas interpretierbar und stellen eine neue (die vorherige bewertende oder kommentierende) Handlung dar. Nach Schegloff (1996) wären dies keine increments, sondern neue TCUs. Auer (2007b, 651) hebt hervor, dass sich eine dichotome Unterscheidung in Turn-Fortsetzungen und TCU-interne Fortsetzungen nicht durchhalten lasse, sondern eine graduelle Sicht sinnvoller sei, zumal die Korrelation mit dem unterschiedlichen Handlungsstatus keine vollständige sei – auch viele syntaktisch unabhängige Fortsetzungen stellten retrospektive Handlungsfortsetzungen dar und umgekehrt seien auch manchmal syntaktische Fortsetzungen neue Handlungen (z. B. bei kollaborativen Turns). Darüber hinaus sind die Realisierungsformen von increments einzelsprachspezifisch unterschiedlich. Auer (1991, 2006, 2007b) hat gezeigt, dass im Deutschen als abschließendes Strukturelement vor allem die rechte Satzklammer zentral ist. Viele im Nachfeld auftretende Konstituenten sind syntaktisch abhängig (regiert, nachträglich insertierend oder substituierend). Eine umfassende Systematik von Expansionen muss jedoch auch unabhängige(re) Fortsetzungen (wie koordinierte und appositive Strukturen) erfassen. Auch für einige andere Sprachen sind mittlerweile auf deren grammatische Strukturen zugeschnittene Konzeptionen von increments vorgenommen worden (vgl. u. a. Couper-Kuhlen/Ono 2007; Luke/Thompson/Ono 2012; Ono/ Couper-Kuhlen 2007). Vor dem Hintergrund dieser Untersuchungen und der Schwie-

Grundeinheiten der Sprache und des Sprechens 

 29

rigkeit, eine sinnvolle (über)einzelsprach­liche Definition zu finden, stellt sich die Frage, ob eine Annahme dieser ebenenübergreifenden Einheitenkategorie sinnvoll ist oder ob die entsprechenden Phänomene nicht auch anhand des Zusammenspiels verschiedener ebenenspezifischer Einheitengrenzen beschrieben werden können. Der Vorteil einer solchen Konzeption läge darin, dass für Äußerungsbestandteile, deren Einheitenstatus in Bezug auf Konzepte wie Turn oder TCU unklar ist, parameterbezogen zu analysieren ist, in welchen Hinsichten und aufgrund welcher Merkmale sie als Einheiten verstanden und behandelt werden (können) und wieso sie daher von Gesprächsteilnehmern unterschiedlich hinsichtlich ihrer Abgeschlossenheit gewertet werden können. Zur Einheitendiskussion innerhalb der gesprächsanalytischen und interaktionallinguistischen Forschung lässt sich zusammenfassend sagen, dass eine Konzeptualisierung, die TCUs als Epiphänomene betrachtet oder sie im Zäsurierungs­konzept aufgehen lässt, die problematische Unterscheidung zwischen der Expansion einer TCU und dem Anschluss einer neuen TCU überflüssig macht. Damit stellt sich auch die Frage, ob bzw. wofür die Kategorie TCU selbst relevant ist. Konzipiert ist sie, anders als die meisten im Folgenden zu diskutierenden Einheitenkategorien nicht aus Analytikersicht, sondern als Teilnehmerkategorie: An einem TRP (oder einer Zäsur auf allen Ebenen) zeigen die Interagierenden einander die Möglichkeit oder Erwünschtheit des Sprecherwechsels an. D. h., in solchen klaren, prototypischen Fällen lassen sich Turns bzw. TCUs als Einheiten beschreiben, an denen sich die Gesprächsteilnehmer erkennbar orientieren. In Fällen, in denen kein Sprecherwechsel stattfindet und auch keine Rückmeldesignale o. Ä. platziert werden, aber dennoch ein TRP angenommen wird, wird auch die TCU notwendigerweise oft zur Analytikerkategorie, die auf linguistisches und pragmatisches Wissen rekurriert, so dass es notwendig ist, die für die Einheit bzw. Grenze angesetzten Kriterien zu explizieren und zu reflektieren. Darüber hinaus sollte diskutiert werden, ob und inwiefern man die Turntakingrelevanz ganz von der Frage der Einheitenkonstitution entkoppeln kann: Ein TRP sollte immer eine für die Teilnehmer interaktionsorganisatorisch relevante Stelle sein, rein linguistische, insbesondere grammatische Einheiten bieten allein durch ihre analytische Identifikation keine Erklärung dafür, welche Handlung sie im gegebenen Kontext ausführen (vgl. Ford/Fox/Thompson 2013, die aus diesem Grund gar eine neue deskriptive, handlungsbasierte Metasprache fordern). Dennoch kann auch eine differenzierende Untersuchung der tatsächlichen Beschaffenheit von ursprünglich schriftsprachlich bzw. systemlinguistisch definierten Einheiten im Sprechen sinnvoll sein, auch für die Bestimmung ihrer Rolle bei der Turnkonstitution (zu aktuellen Beiträgen zu dieser Diskussion Szczepek Reed/Raymond 2013). Weitere Einheitenkonzepte, die Merkmale auf verschiedenen Ebenen einbeziehen sind u. a. die Äußerungseinheit nach Rath (1990), die Äußerung nach Rehbein (1995) und die funktionale Einheit nach Fiehler u. a. (2004). Unter funktionalen Einheiten verstehen Fiehler u. a. (2004, 204) „die kleinsten Bestandteile des Beitrags, denen eine […] (separate) Funktion [im und für den Kom-

30 

 Arnulf Deppermann/Nadine Proske

munikationsprozess] zugeschrieben werden kann.“ In Abgrenzung von der zunächst strukturell orientierten TCU wird eine Segmentierung von Turns allein auf der Handlungsebene angestrebt, wobei Syntax und Prosodie bei der Identifikation der Einheiten explizit unterstützend herangezogen werden (vgl. Fiehler u. a. 2004, 203). Die Liste an möglichen kommunikativen Aufgaben, die einer funktionalen Einheit oder einer Kombination von funktionalen Einheiten zugewiesen werden kann, ist offen, z. B. „zu etwas Stellung nehmen, eine Bewertung äußern, fluchen, […] eine Redewiedergabe ankündigen, eine Verstehensanweisung für eine andere Äußerung geben, […] etwas verneinen, etwas ablehnen […]“ (Fiehler u. a. 2004, 205). Es werden drei Arten von funktionalen Einheiten nach dem Grad ihrer Selbständigkeit unterschieden: 1) Projizierende funktionale Einheiten, z. B. Diskursmarker und redeeinleitende Phrasen (in der Terminologie von Fiehler u. a. 2004: ‚Operatoren‘) oder linksversetzte Konstituenten, können nicht allein auftreten, sondern lassen eine bestimmte Art von Folgeeinheit erwarten. Im Gegensatz zum konversationsanalytischen Ansatz, nach dem in solchen Fällen keine TCU vorliegt, kommt ihnen also hier aufgrund der isolierbaren Handlung, die mit ihnen ausgeführt wird, Einheitenstatus zu. 2) Selbstständige funktionale Einheiten haben keine projektive Kraft und können allein stehen oder frei mit folgenden Einheiten kombiniert werden. 3) Assoziierte funktionale Einheiten, z. B. Nebensätze, können syntaktisch nicht allein stehen, weil sie von einer selbstständigen Trägereinheit abhängen. Wie bei Ford/Thompson (1996) liegen immer, wenn eine abgeschlossene Handlung identifiziert wird, auch syntaktische und prosodische Abschlusspunkte vor. Solche treten aber auch einheitenintern auf. Problematisch ist an der Auffassung von Fiehler u. a. (2004), dass immer eine fein- oder grobkörnigere Segmentierung möglich ist, da es kein geschlossenes Inventar von möglichen Handlungen gibt. Insbesondere kommt Gesprächspartikeln hier mal Handlungs- und Einheitenstatus zu, ein andermal sind sie aber Teil größerer funktionaler Einheiten, ohne dass für die Unterscheidung Kriterien bereitgestellt werden. Rath (1976, 1985, 1990, 1997) dagegen behandelt alle Gesprächspartikeln auf mechanische Weise gleich. Er bezeichnet die Grundbausteine von Turns als Äußerungseinheiten und definiert sie als Einheiten zwischen Grenz- und Gliederungssig­ nalen. Zur Abgrenzung werden prosodische Mittel wie (gefüllte) Pausen und Intonationskonturen sowie lexikalische Mittel wie „Gliederungspartikeln“ (z. B. ja, nicht (wahr), und (so)) und „syntaktische Formeln“ (z. B. ich meine, verstehst du, ich würde sagen) herangezogen (vgl. Rath 1985, 1658). Die Satzgrenze ist kein Kriterium: Wenn an einer solchen keine Gliederungssignale vorliegen, umfasst die Äußerungseinheit mehr als einen Satz; umgekehrt kann ein Satz durch Gliederungssignale in mehrere Äußerungseinheiten aufgespalten werden. Syntaktische und interaktive Gliederung werden damit als getrennte Ebenen angesehen: „Sprecher und Hörer ziehen innerhalb der ablaufenden Syntax eigene, interaktive Grenzen […]“ (Rath 1990, 209). Es wird hervorgehoben, dass alle an der Interaktion Beteiligten durch das Äußern von (sprecher- oder hörerseitigen) Gliederungssignalen zur Konstitution von Einheiten beitragen, diese seien „Ergebnisse interaktiver und kognitiver Prozesse“ (Rath 1990,

Grundeinheiten der Sprache und des Sprechens 

 31

214). Die genaue Definition und Rolle der prosodischen Gliederungssignale bleibt im Gegensatz zu den unter 3.1 besprochenen Intonationsphrasenansätzen unklar, weil diese Signale in der Argumentation nur dann herangezogen werden, wenn die vorausgehende Annahme einer Äußerungseinheitengrenze gestützt werden soll. Prosodische Zäsuren innerhalb der Äußerungseinheit werden nicht diskutiert. Beispiel #4 soll zeigen, zu welchen potenziell problematischen Einheiten dieser Ansatz führt. #4 FOLK_E_00066_SE_01_T_02, Gartengespräch, 00:53:29 01 UD °h es GIBT soga:r– 02 ʔ ä:hm brEmsklötze die sin hÄrter als die FELge so; 03 (.) das hab ich schon ma gesSEHN, 04 °h 05 AL hm. 06 UD da hat sich einer komplEtt die FELge durchgeschrubbt, 07 weil er zu ar[ge BREMS][klötze] [drauf hatte. ] 08 JO [ha JA:? ] 09 [dis is] 10 [] 12 AL [ ja g]eNAU.

Sowohl das „ä:hm“ als auch das „so“ in #4, S02 wären nach Rath Gliederungssignale, die eine Äußerungseinheit („brEmsklötze die sin hÄrter als die FELge“) abgrenzen. Sie bilden beide mit dieser eine prosodische Einheit, während andere Gliederungssignale wie das „hm.“ in S05 und das „ha JA:?“ in S08 prosodisch selbständig auftreten. Die Gliederungssignale führen zur Verteilung von Sätzen auf mehrere Äußerungseinheiten (S01-02, „es GIBT soga:r“ und „brEmsklötze die …“), aber auch dazu, dass Kombinationen aus Haupt- und Nebensatz als eine Äußerungseinheit zu betrachten sind, weil keine Pausen oder Gliederungssignale dazwischentreten (S06-07), obwohl sie prosodisch voneinander abgegrenzt sind, da sie zwei Intonationsphrasen mit eigenen Fokusakzenten und Grenztönen bilden. Die Annahme der Unabhängigkeit der kommunikativen Gliederung von der syntaktischen und prosodischen ist aus verschiedenen Gründen problematisch. Erstens wird der Orientierung der Interaktionsteilnehmer an syntaktischen und prosodischen Strukturen damit nicht genügend Rechnung getragen (Selting 1995a). Zweitens ist der Status der Grenzsignale selbst nicht klar: Sie sind keine Äußerungseinheiten, da sie dazwischen („innerhalb“ der Grenzen, Rath 1990, 202; in den „Gelenkstellen“, Rath 1986, 1658) auftreten; andererseits können sie, da sie als die Einheiten erst retrospektiv konstituierend angesehen werden, auch als Teil dieser aufgefasst werden, und in Raths (1997) jüngster Publikation zum Thema werden die Grenzen in Beispielen auch erst nach ihnen notiert. Drittens stellen die als Gliederungssignale bezeichneten Wörter und Phrasen eine heterogene Gruppe dar, so dass die pauschale Behand-

32 

 Arnulf Deppermann/Nadine Proske

lung als nicht-referenzielle Elemente, die generell nicht auf der syntaktischen und semantischen Ebene operieren, nicht angemessen erscheint: Diskursmarker (also, (ich) mein) als projizierende Vor-Vorfeld-Einheiten sind ebenso wie koordinierende Konjunktionen (und, oder, denn) peripherer Teil der syntaktischen Struktur, Phrasen wie ich würde sagen und ich glaube, die oft noch als Matrixsätze interpretiert werden können, operieren in diesen Fällen auch auf der semantischen Ebene. Vergewisserungssignale wie ne und weißt du und Rückmeldesignale bzw. Responsive wie ja und hm operieren zwar durchweg auf der diskursorganisatorischen Ebene und sind (syntaktisch) selbständig, aber gerade deshalb sind sie nicht als „Einschnitte“ (Rath 1997, 16) anzusehen, zumal sie, wie Rath selbst betont, auch in Überlappung auftreten können (vgl. „ha JA:?“ in #4, S08 und „ja geNAU.“ in S12) und dann nicht linear ‚zwischen‘ den Äußerungseinheiten auftreten. Auch Schwitalla (2012) segmentiert Turns in Äußerungseinheiten, bezieht aber zugleich aktuelle Erkenntnisse zur Gliederung durch lexikalische, syntaktische und prosodische Mittel ein, so dass sein Vorgehen sich von dem von Rath unterscheidet und im Ergebnis die meisten seiner Äußerungseinheiten Intonationsphrasen entsprechen (vgl. Schwitalla 2012, 95). Während Äußerung häufig  – und so auch im vorliegenden Artikel  – nicht terminologisch gebraucht wird, verwendet Rehbein (1995) diese Bezeichnung für die Einheiten, aus denen sich ein Turn zusammensetzt. Er definiert sie als Realisierung mindestens einer sprachlichen Prozedur im Sinne der Funktionalen Pragmatik. Die Segmentierung in Äußerungen wird anhand morpho-syntaktischer und prosodischer Kriterien, aber im ersten Schritt auch explizit „intuitiv“ (Rehbein 2001, 932) vorgenommen und führt meist zu satzwertigen Einheiten, die aus Prozedurenkombinationen konstituiert sind. Sie bildet die Grundlage für die analytische Zuweisung von Sprechhandlungen (vgl. a. 3.1). Laut Fiehler u. a. (2004, 191) entspricht das Ergebnis der Segmentierung in Äußerungen weitgehend dem der Segmentierung in funktionale Einheiten, auch wenn die theoretischen Voraus­setzungen sich nicht entsprechen. So kommt z. B. auch Interjektionen, Responsiven und anderen eigenständigen Partikeln sowie freien Themen und anderen isoliert verwendeten Konstituenten Einheitenstatus zu. Ein mehrdimensionales Einheitenkonzept, das spezifisch für eine einzelne Untersuchung zum kanadischen Englisch entwickelt worden ist, ist die Talk Unit nach Halford (1996). Diese ist definiert als „minimal self-contained message unit“ – sie umfasst mindestens eine Proposition – und zugleich als „maximal unit defined by syntax and intonation“ (Halford 1996, 33). Weder prosodische noch syntaktische selbstständige Einheiten dürfen auf mehrere Talk Units aufgespalten werden. Das bedeutet, dass immer die jeweils größere Einheit auf einer Ebene den Umfang der Gesamteinheit bestimmt und die Talk Units häufig relativ groß sind (vgl. Fiehler u. a. 2004, 194), vor allem weil komplexe Sätze, die sich über mehrere prosodische Einheiten (die bei Halford nicht Intonationsphrasen entsprechen, sondern größer sein können) verteilen, als eine Einheit gelten. Die Konzeption ähnelt der der TCU, da davon ausgegangen wird, dass die Talk Units mit übergaberelevanten Stellen enden,

Grundeinheiten der Sprache und des Sprechens 

 33

die sich auch hier nur dann ergeben, wenn Grenzen auf mehreren Ebenen zusammenkommen (vgl. Halford 1996, 34). Nicht-Propositionswertiges kann zwar keine Talk Unit bilden, die Möglichkeit der Bildung einer separaten Einheit wird aber zumindest einigen Partikeln, sogar dann, wenn sie nicht als propositionswertig interpretiert werden können, zugestanden (vgl. Halford 1996, 97). Schließlich soll noch kurz ein nicht aus der Gesprochene-Sprache-Forschung stammendes Einheitenkonzept erwähnt werden, weil es im Zuge einer Differenzierung zwischen Form- und Funktionsebene dem Satz gleichberechtigt zur Seite gestellt und als auch auf die Spontansprache anwendbar eingeführt wird – die kommunikative Minimaleinheit (KM) (Zifonun 1987): Kommunikative Minimaleinheiten sind die kleinsten sprachlichen Einheiten, mit denen sprachliche Handlungen vollzogen werden können. Sie verfügen über ein illokutives Potential und einen propositionalen Gehalt. In gesprochener Sprache weisen kommunikative Minimaleinheiten eine terminale Intonationskontur auf, es sei denn, sie werden mit weiteren kommunikativen Minimaleinheiten koordinativ verknüpft. (Zifonun u. a. 1997, 91)

Die KM werden untergliedert in Vollsätze, Nicht-finit-KM und Ellipsen. Responsive und Interjektionen gelten aufgrund des angenommenen fehlenden propositionalen Gehalts und illokutiven Potenzials nicht als KM, sondern als interaktive Einheiten (Zifonun u. a. 1997, 62 ff. und 362 ff.). Da außerdem sprach­liche Handlungen sprechakttheoretisch und somit enger gefasst werden als z. B. bei Fiehler u. a. (2004), stellen auch Operatoren und herausgestellte Konstituenten keine KM dar. Ob sie als interaktive Einheiten in Frage kämen oder aufgrund der peripheren syntaktischen Eingebundenheit (über das Vor-Vorfeld) als Teile von KM gelten müssen, wird nicht thematisiert. Die Diskussion hat gezeigt, dass keines der vorliegenden Einheitenkonzepte eine eindeutige Lösung für jegliche in der gesprochenen Sprache vorzufindende Struktur bringt (s. Abschnitt 4). Aus unserer Sicht scheint klar zu sein, dass ein Ansatz zu präferieren ist, der von den beobachtbaren Aktivitäten der Interaktionsorganisation ausgeht und damit am Einheiten-Verständnis der Gesprächsbeteiligten selbst ansetzt. Dabei haben die formbezogenen Ansätze den Vorteil, dass sie a) weitaus klarere Kriterien für die Definition von Einheitengrenzen liefern, b) erlauben aufzuweisen, dass sich Interaktionsteilnehmer tatsächlich in hohem Maße an formbezogenen Eigenschaften der Turnproduktion orientieren und c) den Beitrag formaler Eigenschaften des Turn-Designs zur Interpretation des Handelns explizit erfassen lassen.

4 Problemfälle Im Folgenden wollen wir auf gängige Strukturen des Sprechens in der Interaktion eingehen, die allen der in Abschnitt 3 vorgeschlagenen Einheitenkonzeptionen Probleme bereiten. Im Einzelnen geht es um den Status von nichtautonomen Turnkom-

34 

 Arnulf Deppermann/Nadine Proske

ponenten (4.1), Äußerungen ohne vollen Turnstatus (4.2), kollaborative Turnproduktionen (4.3), nonverbale Produktionen (4.4) und die Konstitution multimodaler Einheiten (4.5).

4.1 Nicht-autonome Turnkomponenten Die klassische Definition von Turns geht davon aus, dass diese aus turn constructional units (TCUs) bestehen, die in einem transition relevance place enden (Sacks u. a. 1974; vgl. a. Abschnitt 3.2). Einige Phänomene der gesprochenen Sprache sind in Bezug auf ihren Status als Turnbestandteile besonders problematisch. Diskursmarker (Auer/Günthner 2005; Imo 2012; Schiffrin 1987) und Linksversetzungen sind aus Sicht der Turnkonstruktion keine TCUs, da sie nicht in einem TRP enden und nicht allein einen Turn ausmachen können. Prosodisch sind sie oftmals keine eigenen Intonationsphrasen. Syntaktisch sind sie dagegen autonom, denn sie sind nicht in Kongruenz- und Rektionsbeziehungen integriert, projizieren aber eine Fortsetzung durch nachfolgende sprachliche Strukturen. Somit sind sie lediglich über die topologische, aus syntaktischer Sicht fragwürdige Hilfskonstruktion eines ‚Vor-Vorfelds‘ dem Satzschema zu subsummieren. Diskursmarker machen bspw. häufig auch eigene Intonationsphrasen aus, konstituieren aber keinen TRP: #5 FOLK_E_00066_SE_01_T_01, Gartengespräch, 00:24:08 01 JO (.) und dann is natürch KLAR äh– 02 (0.76) ich MEIN, 03 PA ʔ hh° 04 JO du hast die ANlage,

Einen Diskursmarker und eine Häsitationspartikel (s. 4.4), gefolgt von einem freien Thema sehen wir in #6: #6 FOLK_E_00003_SE_01_T_01, Prüfungsgespräch, 00:02:08 01 JS also ʔ 02 ä:hm 03 diese diese bottomup und topDOWNprozesse,= 04 =in bezug auf die artikulaTION? 05 können sie DAzu vielleicht noch was sAgen?

Alle drei Strukturen sind syntaktisch nicht eingebunden. Die beiden Partikeln in S01 und S02 machen keine eigenen Intonationsphrasen aus, gehören aber auch nicht zur folgenden Intonationsphrase des freien Themas. Keine der drei Strukturen führt zu einem TRP. Increments (Schegloff 1996; Auer 2006, 2007b) und andere Formen der Expansion (Auer 1991, 1996) haben ebenfalls einen schillernden Status (vgl. a. Abschnitt 3.2). Increments sind keine eigenen TCUs, da sie keine eigene Handlung vollziehen.

Grundeinheiten der Sprache und des Sprechens 

 35

Manchmal sind sie auch prosodisch mit der Vorgängerstruktur integriert (d. h. ohne Fokusakzent und eigene Intonationskontur) und grammatisch von vorangehenden TCUs abhängig. Andererseits sind sie eigene Phrasen und werden nach einem TRP produziert. In #7, S03 wird nach einem semantisch-pragmatisch eindeutigen TRP ein grammatisch abhängiges increment angehängt, das keine neue Handlung vollzieht: #7 FOLK_E_00055_SE_01_T_07, Studentisches Alltagesgespräch, 01:18:43 01 US des war GANZ blöd; 02 ich hatte norMAL immer so_n kleinen DISporahmen auf_m konto halt; 03 °h n[ormalerweis] KRIEGT ma des ja nich we_ma noch nich SELber verdient, 04 NH [m_hm, ] 05 US aber (0.5) die ham mir des irgendwie ma SO erklÄrt,

4.2 Äußerungen ohne vollen Turnstatus Die Produktion eines vollen Turns geht mit der Beanspruchung des Rederechts (floor) und dem lokalen Management des Rederechts am Ende des Turns durch den Turnproduzenten einher (Sacks u. a. 1974: „first speaker selects next speaker“). Für zahlreiche, regelhaft produzierte Äußerungen im Rahmen einer Interaktion gelten diese Bestimmungen aber nicht. Die Rede ist hier von Rückmeldern (Yngve 1970), continuers (Fortsetzungssignalen; Schegloff 1981), Interjektionen (Nübling 2005; Reber/CouperKuhlen 2010) und anderen secondary speaker contributions (Bublitz 1988). Im folgenden Ausschnitt produzieren zuerst NO (S04, 07), dann EL (S14, 16) Rückmeldesignale: #8 FOLK_E_00039_SE_01_T_01, Pärchengespräch, 00:13:42 01 EL ds jetz schon wieder EEne woche her;= 02 =da ham_wa uns SO lange druff jefrEUt,= 03 =und 04 NO (.) ja. 05 (2.86) 06 EL war aber wIrklich_n SCHÖner tach. 07 NO (.) ja. 08 (3.7) 09 EL ham sich alle echt (.) MÜhe jegeben; 10 (4.17) 11 EL

12 (1.09) 13 NO  nee kannst schon echt FROH sein wenn du so ne freunde hast; 14 EL ja; 15 NO die sich so KÜMmern; 16 EL hm_HM,

36 

 Arnulf Deppermann/Nadine Proske

Mit Rückmeldern wird kein Rederecht über die mit ihnen produzierte, meist sehr kurze Äußerung hinaus beansprucht. Das Rederecht verbleibt beim vorangehenden bzw. parallel aktiven primären Sprecher. Noch ist kaum erforscht, welche Erwartungen für die Synchronisation dieser Äußerungen mit der Turnproduktion des primären Sprechers gelten (s. aber Barth-Weingarten 2009, 2013; Stivers 2008). Der Einheitenstatus dieser Äußerungsformate ist außerdem schwierig, da sie zumeist keine syntaktische Struktur aufweisen, sondern nur aus Partikeln bestehen. Sie vollziehen keine deutlich profilierte Handlung – sie zeigen Aufmerksamkeit und wohl auch Verstehen an, können aber nicht als vollwertige Zustimmungen gelten  –, sondern fungieren primär als gesprächsorganisatorische continuer. In S11 wird ein continuer eingesetzt, um den Turnabschluss und den Verzicht auf weiteres Rederecht anzuzeigen. Als Intonationsphrasen sind diese Phänomene allenfalls rudimentär ausgebildet: Sie sind oft einsilbig und weisen nur selten einen Fokusakzent auf, und dies auch nur, wenn man die Akzentuierung einer Silbe bei redupliziertem hm so (in Bezug auf welchen Möglichkeitsraum?) verstehen möchte.

4.3 Kollaborative Turns Kollaborative Turnproduktionen sind in pragmatischer und syntaktisch-projektionsbezogener Hinsicht Einheiten, die aber auf verschiedene Sprecher verteilt sind und sprachlich oftmals auch deutliche Züge autonomer Einheiten tragen. Ein Beispiel dafür ist: #9 FOLK_E_00003_SE_01_T_01, Prüfungsgespräch, 00:02:08 01 JS können sie DAzu vielleicht noch was sagen? 02 inwieFERN– 03 °h (.) [ähm die ] 04 DM [inwiefern die funktioNIE]ren, 05 JS ja,

JS projiziert mit „inwieFERN“ (S02), dass sie ihren Turn mit einem indirekten Fragesatz fortsetzen wird. Nach der Produktion des Interrogativpronomens bricht sie jedoch ab und atmet ein (S03), was als Wortsuche bzw. Sprechplanungspause verstanden werden kann. DM ergänzt den von JS projizierten indirekten Fragesatz (S04) und JS bestätigt die Ergänzung als ihrer Redeintention entsprechend (S05). DMs Ergänzung ist zwar eine selbständige Intonationsphrase, syntaktisch und handlungsbezogen ist sie jedoch abhängig vom Turn der vorangehenden Sprecherin. Während faktisch von JS und DM zwei Turns produziert werden, gelten sie den Beteiligten interaktional doch als ein gemeinsamer Turn, der JS als von ihr gemeint zugerechnet wird. DM übernimmt also das Rederecht nicht für sich, sondern stellvertretend für die vorangehende Sprecherin JS, um ihren Turn zu vollenden (Lerner 1991). Während DMs kollaborative Turnfortsetzung in semantischer und pragmatischer Hinsicht nahtlos

Grundeinheiten der Sprache und des Sprechens 

 37

an JS anschließt, tut sie dies in syntaktischer Hinsicht nicht: DM setzt den indirekten Fragesatz nach dem Fragepronomen erst fort, nachdem sie dieses wiederholt hat. Kollaborationen bestehen oft nicht aus bruchlosen Erfüllungen der im Vorgängerturn gestifteten syntaktischen Projektionen: Teilwiederholungen, syntaktische Strukturveränderungen und die Produktion von Diskurspartikeln, die z. B. Reformulierung, Ungewissheit, Tentativität oder Zögern anzeigen, sind übliche Merkmale von Ergänzungen (Oloff 2009). Ähnliche Probleme bezüglich des Einheitenstatus können auch diskontinuierliche Turnproduktionen des gleichen Sprechers aufwerfen (vgl. S17, 20-22, 24 in #1 in Abschnitt 2). In Bezug auf die Produktion von TCUs handelt es sich hier entweder um eigenständige TCUs oder aber um increments, in Bezug auf den Sprecherwechsel gar um eigenständige Turns, während die semantische, grammatische und pragmatische Struktur des diskontinuierlichen Turns eine integrierte Ganzheit konstituiert. Ebenfalls unselbständig hinsichtlich ihres syntaktischen und oft auch hinsichtlich ihres Turnstatus, aber im Gegensatz zu Turnergänzungen nicht durch die syntaktische Struktur des Turns des vorangegangenen Sprechers projiziert, sind Fortführungen des Vorgängerturns. In #10 ergänzt der Sprecher UD in S08 eine Aussage aus JOs Erzählung. #10 FOLK_E_00066_SE_01_T_01, Gartengespräch, 00:24:15 01 JO ich glaub der kriegt im schnitt irgendwie vielleicht so hundertzwanzig EUro, 02 wenn er seine ANlage anschleppt, 03 und da dann MISCHT, 04 (0.44) 05 UD hm_HM; 06 (0.5) 07 JO u:nd dann ha[t er] 08 UD [für ] die NACHT. 09 (0.33) 10 JO für die für den Abend oder so?

UDs Fortführung „für die NACHT.“ expliziert den zeitlichen Bezug von JOs vorangegangener Aussage darüber, wie viel ein Bekannter in seiner Tätigkeit als Dee-Jay verdient. Es handelt sich um eine semantische Spezifikation, die die Vorgängeräußerung syntaktisch abhängig, in einer eigenen Intonationsphrase expandiert, ohne eigenes Rederecht zu beanspruchen. Im Gegensatz zu einer Ergänzung handelt es sich aber um eine autonomere, fortführende Struktur: Die Fortführung vervollständigt nicht eine vom vorangehenden Sprecher erzeugte, noch unvollständige Struktur durch die Erfüllung einer mit ihr etablierten Projektion, sondern sie baut auf der syntaktisch vollständigen, keine Projektionen offenlassenden Vorgängerstruktur auf, um eine Spezifikation, evtl. im Dienste einer Verstehensprüfung anzubringen.

38 

 Arnulf Deppermann/Nadine Proske

4.4 Nonverbale kommunikative Beiträge Face-to-face-Interaktionen bestehen nicht nur aus sprachlichen Aktivitäten. Zur Interaktionskonstitution tragen ebenso die vokalen und, im Falle der wechselseitigen visuellen Präsenz der Interaktionspartner, auch die weiteren multimodalen Ressourcen wie Blick, Mimik, Gestik, Körperpositur und –bewegung und Handhabung von Objekten bei. Wenn die wissenschaftliche Frage nach den Grundeinheiten des Sprechens in der Interaktion den Bedingungen der Interaktionskonstitution angemessen Rechnung tragen will, dann darf sie sich nicht auf ein künstlich restringiertes, linguistisch definiertes Objekt beschränken, sondern muss erkunden, wie sprachliche und nicht sprachliche Strukturen bei der kommunikativen bzw. interaktiven Einheitenkonstitution zusammenspielen. Diese Erweiterung der Perspektive über das Linguistische hinaus betrifft wenigstens drei Dimensionen: – die Rolle von Vokalisierungen, – nicht-vokale Handlungen, die auf die Struktur der verbalen Interaktion bezogen sind, – die Koordination von verbalen und anderen Ressourcen in der Turnproduktion (s. 4.5). Die Abgrenzung von Vokalisierungen und verbalen Aktivitäten ist teilweise willkürlich (Reber/Couper-Kuhlen 2010). Während eine zunehmende Anzahl von Diskurspartikeln wie Rezeptions- und Häsitationssignale oder Interjektionen Eingang in Lexika findet und somit als Lexeme und Bestandteile der Sprache kanonisiert werden (z. B. hm, aha, äh), kommen andere Vokalisierungen nach wie vor nicht in Lexika vor und werden auch von den meisten Linguisten nicht als Lexeme akzeptiert (z. B. Zungeschnalzen, pf, bilabial plosives Ausatmen). Diese Phänomene sind nicht weniger konventionell und funktional spezifisch als die kanonisierten. Dass sie nicht als Bestandteil der Sprache betrachtet werden, scheint in anderen Merkmalen begründet. Z. B. weichen phonetische Strukturen vom phonetisch-phonematischen System der Einzelsprache ab, phonologische Repräsentationen sind weniger stabil und restringiert als bei Wörtern üblich und die silbische Struktur ist abweichend (z. B. kein (Voll-)Vokal). Diese Eigenschaften sind noch deutlicher ausgeprägt bei anderen vokalen Phänomenen wie Lachen, Weinen oder Seufzen, denen gar keine definitive lautliche Typ-Repräsentation zuzuordnen ist. Natürlich sind solche Phänomene nicht Teil grammatischer Strukturen. Aber sie sind oft selbst turnwertig und Bestandteile von Turns und sie gehören manchmal auch zu Intonationsphrasen. Nichtvokale kommunikative Beiträge sind auch in verbal dominierten Interaktionen oft mitkonstitutiv für die Handlungsorganisation. Sowohl first pair parts von Nachbarschaftspaaren (wie Fragen, Angebote oder Aufforderungen) als auch second pair parts (wie Antworten und Befolgungen von Aufforderungen) können nonverbal konstituiert werden (Clark 2012; Rauniomaa/Keisanen 2012). Rederechtsbeanspruchende Gesten können parallel zur Turnproduktion eines anderen Teilnehmers pro-

Grundeinheiten der Sprache und des Sprechens 

 39

duziert werden (Schmitt 2005). Ein Interaktionsbeteiligter kann anzeigen, dass er das Rederecht weiterhin beansprucht, obwohl er aktuell aufgrund von Rederechtskonkurrenz schweigt, indem er seine Gestik (z. B. erhobene Hand, Zeigegeste) und eine vorgelehnte Körperpositur einfriert (Oloff 2013). Eine exhaustive Einheitenanalyse des Sprechens, die nicht ein künstlich disziplinär gereinigtes Objekt verbaler Produktion, sondern die faktische Praxis multimodaler Interaktionskonstitution analysieren will, muss reflektieren, wie solche nicht verbal konstituierten Phänomene selbst (Handlungs-)Einheiten konstituieren bzw. an der Konstitution verbaler Einheiten teilhaben. Dabei sind jedoch die besonderen semiotischen und interaktiven Qualitäten v. a. der nonvokalen Ressourcen zu beachten. Es hat u. E. keinen Sinn, hier etwa von ‚nonverbalen Turns‘ zu sprechen, da z. B. gestische Turnbeanspruchungen oder kinesische Erfüllungen einer konditionellen Relevanz nicht nach den für Turns distinktiven Prinzipien organisiert sind. Die Orientierung an ‚one party at a time‘ und die dementsprechende Wahrnehmung von gleichzeitigen Aktivitäten als (zu vermeidenden) Überlappungen sowie die Zusammensetzung der Aktivitäten aus turn constructional units, die jeweils in einem transition relevance place enden, gilt für nonverbale Aktivitäten nicht bzw. nicht in gleicher Weise wie für verbale Turns (Schmitt 2005; Deppermann 2013a). Vielmehr scheinen uns solche Phänomene darauf zu verweisen, dass es notwendig ist, zwischen Handlungen und Turns konzeptuell klar zu unterscheiden.

4.5 Multimodale Einheiten In der multimodalen Interaktion werden kommunikative Einheiten als komplexe multimodale Gestalten konstruiert: Verschiedene multimodale Ressourcen wie Sprechen, Blick, Mimik, Gestik, Körperbewegung und die Handhabung von Objekten werden miteinander gestalthaft koordiniert (vgl. hierzu auch Fricke und Bressem in diesem Band). Diese Koordination besteht zum einen in der simultanen Ausführung von handlungskonstitutiven Aktivitäten mit unterschiedlichen modalen Ressourcen. Die verschiedenen Modalitäten haben dabei aber jeweils ihre eigene zeitliche Ordnung und sind in jeweils spezifischer Weise sequenziell und simultan mit anderen Ressourcen koordiniert. Besonders gut erforscht ist die Koordination von verbalen Referenzen mit vorlaufenden Zeigegesten (Streeck 2009; Schegloff 1984; Kendon 1972). Ein Beispiel solcher Koordination zeigt #11. Die Leiterin eines Rettungseinsatzes instruiert ihre Assistentinnen:

40 

 Arnulf Deppermann/Nadine Proske

#11 FOLK_RETÜ_01_A02; 00:44-00:48 01 EL: %*du machs viTAL*par#ame#ter; (.) EL: *zeigt auf AS1-*...#zeigt auf Messgerät#,,,,,, EL: *schaut zu AS1-------------------------#,,,,,, %Grafik 1 02 EL: %*von dir will ich_n öh öh STÜTZverband,# *(.) mit öh öhm# EL: *zeigt auf Erstehilfekoffer vor AS2----->*auf Tasche---> EL: *schaut auf Erstehilfekoffer----------#schaut auf PATs Bauch# %Grafik 2 03 EL: (--) zwei PÄCKchen* und MULL[binden, * EL: ----------------->*zeigt auf Erstehilfekoffer*

Abb. 1: Einsatzleiterin zeigt auf und schaut zu Assistentin 1

Abb. 2: Einsatzleiterin schaut und zeigt auf Erstehilfekoffer

Grundeinheiten der Sprache und des Sprechens 

 41

Wie auch sonst üblich, beginnen hier alle Zeigegesten unmittelbar vor bzw. zu Beginn der TCU bzw. der Phrase, in der die Referenz verbalisiert wird, auf die die Zeigegeste Bezug nimmt. Der Onset der ersten Zeigegeste auf die Assistentin 1 („du“) beginnt, wie häufig, schon vor dem Turn (S01). Die folgende Zeigegeste auf das Messgerät, mit dem die Vitalparameter gemessen werden sollen, wird so produziert, dass der Apex der Geste während der verbalen Referenz „viTALparameter“ erreicht wird. In S02 antizipieren die Gesten von EL noch deutlicher die verbalen Referenzen: Zeitgleich mit dem Beginn der TCU zeigt EL auf den Erstehilfekoffer, in dem sich der im weiteren Verlauf der TCU benannte Stützverband befindet, um dann nach Abschluss der TCU auf die Tasche zu zeigen, in welcher sich die in der folgenden TCU angesprochenen „PÄCKchen“ befinden (S02-03). Am Ende der Phrase „zwei PÄCKchen“ wechselt EL erneut das Zeigziel und zeigt nun wiederum auf den Erstehilfekoffer, in dem die Mullbinden sind, auf die sie in der folgenden Phrase referiert. Da es sich um die Einführung neuer Referenten handelt, liegt auf den verbalen Referenzen zusätzlich jeweils der Fokusakzent. Obwohl selbst nicht zum verbalen Turn gehörig, sind die Zeigegesten für die mit dem Turn vollzogene Handlung konstitutiv. Er funktioniert nicht ohne sie als autonome kommunikative Einheit. Die Abgrenzung des Turnbeginns ist oft schwierig. Turns beginnen vielfach mit Vorlaufelementen wie (kommunikativ relevantem, da Turnbeanspruchung signalisierendem) Einatmen und Redeannahme oder Dispräferiertheit indizierenden Vokalisationen und die Turnproduktion erfordert multimodale Arrangements, z. B. die Schaffung eines gemeinsamen Interaktionsraums und die Koordination wechselseitiger Wahrnehmung und Aufmerksamkeit der Interaktionspartner (Mondada 2007; Deppermann 2013b). Auch die Beendigung von Turns, vor allem solcher, die zugleich themen- oder sequenzbeendigend sind, impliziert oftmals die Koordination mehrerer multimodaler Ressourcen. So werden z. B. Zeigegesten und Objekte, die im Rahmen der Turnkonstruktion eine Rolle gespielt haben (z. B. als Referenten oder Verkörperungen des Diskurstopiks), kurz vor oder gleichzeitig mit der Turnbeendigung retrahiert, während die Abwendung des Rumpfes vom Gesprächspartner erst nach der Turnbeendigung vollendet wird (Mondada i. Dr.). Es kann aber durchaus sein, dass schon während der Turnproduktion mit dem Blick bereits die Transition zu einem nächsten Interaktionspartner bzw. Aufmerksamkeitsobjekt eingeleitet wird, also eine schrittweise und modalitätsspezifisch asynchrone Transition von einer fokussierten Interaktion zu einer nächsten stattfindet (Schmitt/Deppermann 2010).

5 Fazit Keines der Konzepte, die für die Beschreibung der Grundeinheiten des Sprechens vorgeschlagen wurden, kann allen Phänomenen, die im Sprechen in Interaktionen regelmäßig vorkommen, vollständig Rechnung tragen. Alle Konzepte sind mit empi-

42 

 Arnulf Deppermann/Nadine Proske

rischen Phänomenen konfrontiert, deren Einheiten-Status in Bezug auf das jeweilige Konzept unklar bzw. nicht zu erfassen ist. Dies liegt daran, dass alle Konzepte erfordern, dass Interaktionsbeiträge bestimmten Strukturierungsprinzipien folgen, die aber in der Gesprächspraxis nicht immer konsistent angewandt werden bzw. nicht für alle sprachlichen Ebenen gleichermaßen Gültigkeit haben (können). Die Diskussion hat gezeigt, dass die Suche nach Einheiten des Sprechens in der Interaktion von zwei unterschiedlichen Perspektiven motiviert ist. Zum einen interessiert die Erklärung der Handlungsorganisation, d. h., es werden gesprächs- und handlungsorganisatorisch relevante Einheiten identifiziert. Dabei sind auch multimodale Praktiken für die Einheitenkonstitution mitentscheidend. Zum anderen interessiert die Konstitution verbaler Einheiten. Die Frage ‚Aus welchen Grundeinheiten besteht ein Gespräch?‘ umfasst also aus der ersten Perspektive alle Modalitäten und fragt primär nach der Relevanz der identifizierten Einheiten für die Gesprächsteilnehmer, während die zweite Perspektive spezifisch nach der Organisation sprachlich definierter Einheiten fragt. Sie haben zwar oftmals eine gesprächsorganisatorische Funktion, doch ist dies nicht der primäre Klassifikationsaspekt. Dies geschieht notgedrungen zum Teil um den Preis, dass Phänomene, die für das situierte Handeln der Gesprächsteilnehmer relevant sind und die auch Funktion und Verständnis des Sprechens fundieren, außer Acht gelassen werden. Wenn kein Einheitenkonzept konsistent und durchgängig angewandt werden kann, dann folgt daraus, dass eine exhaustive und eindeutige Segmentierung des Sprechens in Interaktionen nicht möglich ist. Auer (2010) fordert, daraus die Konsequenz zu ziehen, das Konzept der Segmentierung für das Sprechen überhaupt aufzugeben und stattdessen Zäsuren anzunehmen, die mehr oder weniger eindeutig sind und oftmals im Nachhinein, anhand des weiteren Interaktionsverlaufs, revidiert werden. Barth-Weingarten (2013) schlägt vor, im Rahmen eines Parameteransatzes unterschiedliche Zäsurstärken komparativ zu bestimmen. Turnproduktion ist ein dynamischer, durch apriorische Planung nicht (vollständig) determinierter Prozess. Er ist stets für situative und interaktive Kontingenzen offen, die zu Adaptationen, Reparaturen, Planänderungen, Expansionen und anderen situiert-prozessualen Phänomenen der Turngestaltung führen („Online-Syntax“, Auer 2000, 2007a). So gesehen scheint die Sicht, dass das Sprechen in Interaktionen in Einheiten organisiert sei, ein Post-hoc-Artefakt zu sein. Es verdankt sich in erheblichem Maße der linguistischen Tradition der Einheitenbildung, die zumeist an intuitiven Beispielen entwickelt wurde, und es beruht wesentlich auf der Perspektive des Analytikers, der immer erst im Nachhinein, in Form einer Aufnahme oder eines Transkripts, mit sprachlicher Praxis in gefrorener Form konfrontiert ist (Ford 2004). Ist es also deshalb besser, die Suche nach Einheiten aufzugeben und die Vorstellung von Einheiten als ideologisch abzulehnen? Sicher wäre dies zu einfach. An verschiedenen Stellen dieses Beitrags haben wir darauf hingewiesen, dass sich Interaktionsteilnehmer an routinisierten Formaten, an Projektionen von Fortsetzungen und Endpunkten von sprachlichen Strukturen und Handlungen orientieren. Mit dem Wissen um diese

Grundeinheiten der Sprache und des Sprechens 

 43

koordinieren sie ihr Handeln und zeigen an, wo sie Einheiten als vollendet verstehen und behandeln. Einheiten haben also zweifellos ihren Platz in der kommunikativen Praxis für die InteraktionsteilnehmerInnen. Wenn unsere Diagnose zutrifft, dass (aus guten Gründen) keines der zur Verfügung stehenden Einheitenkonzepte für alle Phänomene des Sprechens gleichermaßen passend ist und eine vollständige und deterministische Einheitensegmentierung erlaubt, dann wird es nicht zu vermeiden sein, dass über die Logik der Segmentierung in Transkripten nach pragmatischen und theorieabhängigen Kriterien (die natürlich empirisch fundiert sein müssen) entschieden werden muss. Dennoch bleibt festzuhalten, dass Einheiten in der Interaktion noch viel flexibler und verhandelbarer sind, als dies die für die Organisation des Sprechens bisher vorgeschlagenen Konzepte annehmen lassen.

6 Literatur Auer, Peter (1991): Vom Ende deutscher Sätze. In: Zeitschrift für germanistische Linguistik 19, 139–157. Auer, Peter (1996): On the prosody and syntax of turn-continuations. In: Elizabeth Couper-Kuhlen/ Margret Selting (Hg.): Prosody in Conversation. Cambridge, 57–­100. Auer, Peter (2000): On line-Syntax – Oder: was es bedeuten könnte, die Zeitlichkeit der mündlichen Sprache ernst zu nehmen. In: Sprache und Literatur 31, 43–56. Auer, Peter (2006): Increments and more. Anmerkungen zur augenblicklichen Diskussion über die Erweiterbarkeit von Turnkonstruktionseinheiten. In: Arnulf Deppermann/Reinhard Fiehler/ Thomas Spranz-Fogasy (Hg.): Grammatik und Interaktion. Untersuchungen zum Zusammenhang von grammatischen Strukturen und Gesprächsprozessen. Radolfzell, 279–294. Auer, Peter (2007a): Syntax als Prozess. In: Heiko Hausendorf (Hg.): Gespräch als Prozess. Linguistische Aspekte der Zeitlichkeit verbaler Interaktion. Tübingen, 95–124. Auer, Peter (2007b): Why are increments such elusive objects? An afterthought. In: Pragmatics 17 (4), 647–658. Auer, Peter (2010): Zum Segmentierungsproblem in der Gesprochenen Sprache. In: InLiSt – Interaction and Linguistic Structures 49. http://www.inlist.uni-bayreuth.de/issues/49/ InList49.pdf [16.12.2014]. Auer, Peter/Margret Selting (2001): Der Beitrag der Prosodie zur Gesprächsorganisation. In: Brinker u. a., 1122–1131. Auer, Peter/Susanne Günthner (2005): Die Entstehung von Diskursmarkern im Deutschen – ein Fall von Grammatikalisierung? In: Torsten Leuschner/Tanja Mortelsmans (Hg.): Grammatikalisierung im Deutschen. Berlin/New York, 335–362. Barth-Weingarten, Dagmar (2009): When to say something – some observations on prosodicphonetic cues to the placement and types of responses in multi-unit turns. In: Dagmar Barth-Weingarten/Nicole Dehé/Anne Wichmann (Hg.): Where Prosody Meets Pragmatics. Bingley, 143–181. Barth-Weingarten, Dagmar (2011): The fuzziness of intonation units: some theoretical considerations and a practical solution. In: InLiSt – Interaction and Linguistic Structures 51. http://www.inlist. uni-bayreuth.de/issues/51/Inlist51.pdf [16.12.2014]. Barth-Weingarten, Dagmar (2013): From „intonation units“ to cesuring – an alternative approach to the prosodic-phonetic structuring of talk-in-interaction. In: Szczepek Reed/Raymond, 91–124.

44 

 Arnulf Deppermann/Nadine Proske

Barth-Weingarten, Dagmar/Elisabeth Reber/Margret Selting (Hg.) (2010): Prosody in Interaction. Amsterdam/Philadelphia. Brinker, Klaus u. a. (Hg.) (2001): Text- und Gesprächslinguistik. Ein internationales Handbuch zeitgenössischer Forschung. 2. Halbband. Berlin/New York. Brinker, Klaus/Sven Sager (2010): Linguistische Gesprächsanalyse. Eine Einführung. 5., neu bearbeitete Auflage. Berlin. Bublitz, Wolfram (1988): Supportive Fellow-Speakers and Cooperative Conversations. Discourse Topics and Topical Actions, Participant Roles and ‚Recipientaction‘ in a Particular Type of Everyday Conversation. Amsterdam/Phi­la­del­phia. Chafe, Wallace (1994): Discourse, Consciousness, and Time: The Flow and Displacement of Conscious Experience in Speaking and Writing. Chicago. Clark, Herbert H. (2012): Wordless questions, wordless answers. In: Jan de Ruiter (Hg.): Questions. Formal, Functional and Interactional Perspectives. Cambridge. Clark, Herbert H./Jean E. Fox Tree (2002): Using uh and um in spontaneous speaking. In: Cognition 84 (1), 73–111. Clayman, Steven E. (2013): Turn-constructional units and the transition-relevance place. In: Sidnell/ Stivers, 150–165. Couper-Kuhlen, Elizabeth (1986): An Introduction to English Prosody. Tübingen. Couper-Kuhlen, Elizabeth/Tsuyoshi Ono (2007): Incrementing in conversation. A comparison of practices in English, German and Japanese. In: Pragmatics 17 (4), 513–552. Cruttenden, Alan (1997): Intonation. Zweite Auflage. Cambridge. Deppermann, Arnulf (2012): Über Sätze in Gesprächsbeiträgen – wann sie beginnen und wann man sie braucht. In: Colette Cortès (Hg.): Satzeröffnung. Formen, Funktionen, Strategien. Tübingen, 1–14. Deppermann, Arnulf (2013a): Introduction: multimodal interaction from a conversation analytic perspective. In: Journal of Pragmatics 46 (1), 1–7. Deppermann, Arnulf (2013b): Turn-design at turn-beginnings: multimodal resources to deal with tasks of turn-construction in German. In: Journal of Pragmatics 46 (1), 91–121. Du Bois, John u. a. (1993): Outline of discourse transcription. In: Jane A. Edwards/Martin D. Lampert (Hg.): Talking Data. Transcription and Coding in Discourse Research. Hillsdale, 45–87. Ehlich, Konrad (1986): Interjektionen. Tübingen. Ehlich, Konrad (2010a): Funktionale Pragmatik – Terme, Themen und Methoden. In: Hoffmann, 214–231. Ehlich, Konrad (2010b): Sprechhandlungsanalyse. In: Hoffmann, 242–257. Fiehler, Reinhard u. a. (2004): Eigenschaften gesprochener Sprache. Tübingen. Fischer, Kerstin (Hg.) (2006): Approaches to Discourse Particles. Amsterdam. Ford, Cecilia E. (2004): Contingency and units in interaction. In: Discourse Studies 6 (1), 27–52. Ford, Cecilia/Sandra A. Thompson (1996): Interactional units in conversation. Syntactic, intonational, and pragmatic resources for the management of turns. In: Ochs/Schegloff/ Thompson, 134–184. Ford, Cecilia E./Barbara A. Fox/Sandra A. Thompson (1996): Practices in the construction of turns. The „TCU“ revisited. In: Pragmatics 6, 427–454. Ford, Cecilia E./Barbara A. Fox/Sandra A. Thompson (2002): Constituency and the grammar of turn increments. In: Cecilia E. Ford/Barbara A. Fox/Sandra A. Thompson (Hg.): The Language of Turn and Sequence. Oxford, 14–38. Ford, Cecilia E./Barbara A. Fox/Sandra A. Thompson (2013): Units and/or action trajectories? The language of grammatical categories and the language of social action. In: Szczepek Reed/ Raymond, 13–55.

Grundeinheiten der Sprache und des Sprechens 

 45

Forsgren, Kjell-Åke (1992): Zum Problem des Satzbegriffs im Deutschen. In: Beiträge zur Geschichte der deutschen Sprache und Literatur 114 (1), 3–27. Golato, Andrea/Emma Betz (2008): German ach and achso in repair uptake: resources to sustain or remove epistemic asymmetry. In: Zeitschrift für Sprachwissenschaft 27, 7–37. Goodwin, Charles (1979): The interactive construction of a sentence in natural conversation. In: George Psathas (Hg.): Everyday Language. Studies in Ethnomethodology. New York, 97–121. Hagemann, Sven/Eckart Rolf (2001): Die Bedeutung der Sprachakttheorie für die Gesprächsforschung. In: Brinker u. a., 885–896. Halford, Brigitte K. (1996): Talk Units. The Structure of Spoken Canadian English. Tübingen. Halliday, Michael A. K. (1967): Intonation and Grammar in British English. The Hague/Paris. Helmer, Henrike (i. V.): Analepsen im gesprochenen Deutsch. Mannheim (Unveröffentlichte Dissertation). Henne, Helmut/Helmut Rehbock (1995): Einführung in die Gesprächsanalyse. 3. Auflage. Berlin/New York. Hoffmann, Ludger (1999): Ellipse und Analepse. In: Angelika Redder/Jochen Rehbein (Hg.): Grammatik und mentale Prozesse. Tübingen, 69–90. Hoffmann, Ludger (Hg.) (2010): Sprachwissenschaft. Ein Reader. 3., aktuelle und erweiterte Auflage. Berlin/New York. Imo, Wolfgang (2012): Wortart Diskursmarker? In: Björn Rothstein (Hg.): Nicht-flektierende Wortarten. Berlin/New York, 48–88. Jefferson, Gail (1983): Issues in the transcription of naturally-occurring talk: caricature versus capturing pronunciational particulars. In: Tilburg Papers in Languge and Literature 34, 1–12. Jefferson, Gail (2004): Glossary of transcript symbols with an introduction. In: Gene H. Lerner (Hg.): Conversation Analysis: Studies From the First Generation. Amsterdam/Philadelphia, 13–23. Kendon, Adam (1972): Some relationships between body motion and speech. In: Aron Wolfe Siegman/Benjamin Pope (Hg.): Studies in Dyadic Communication. Elmsford/New York, 177–216. Kindt, Walter (1994): Satzbegriff und gesprochene Sprache. In: Lingua 94, 25–48. Koch, Peter/Wulf Oesterreicher (1985): Sprache der Nähe – Sprache der Distanz. Mündlichkeit und Schriftlichkeit im Spannungsfeld von Sprachtheorie und Sprachgeschichte. In: Olaf Deutschmann u. a. (Hg.): Romanistisches Jahrbuch. Berlin/New York, 15–43. Lerner, Gene H. (1991): On the syntax of sentences in progress. In: Language in Society 20, 441–458. Levinson, Stephen C. (1981): The essential inadequacies of speech act models of dialogue. In: Herman Parret/Marina Sbisà/Jef Verschueren (Hg.): Possibilities and Limitations of Pragmatics: Proceedings of the Conference on Pragmatics, Urbino, July 8–14, 1979. Amsterdam, 473–492. Levinson, Stephen C. (2013): Action formation and ascription. In: Sidnell/Stivers, 103–129. Luke, Kang-kwong/Sandra A. Thompson/Tsuyoshi Ono (2012): Turns and increments: a comparative perspective. In: Discourse Processes 49, 155–162. Mondada, Lorenza (2007): Interaktionsraum und Koordinierung. In: Reinhold Schmitt (Hg.): Koordination. Tübingen, 55–93. Mondada, Lorenza (i. Dr.): Multimodal completions. In: Arnulf Deppermann/Susan­ne Günthner (Hg.): Temporality in Interaction. Amsterdam/Phila­del­phia. Nübling, Damaris (2005): Die prototypische Interjektion: Ein Definitionsvorschlag. In: Zeitschrift für Semiotik 26, 11–45. Ochs, Elinor/Emanuel A. Schegloff/Sandra A. Thompson (Hg.) (1996): Interaction and Grammar. Cambridge. Oloff, Florence (2009): Contribution à l’étude systématique de l’organisation des tours de parole: Les chevauchements en français et en allemand. Mannheim (Dissertation). https://ub-madoc. bib.uni-mannheim.de/29617/[16.12.2014].

46 

 Arnulf Deppermann/Nadine Proske

Oloff, Florence (2013): Embodied withdrawal after overlap resolution. In: Journal of Pragmatics 46 (1), 139–156. Ono, Tsuyoshi/Elizabeth Couper-Kuhlen (2007): Increments in cross-linguistic perspective: introductory remarks. In: Pragmatics 17 (4), 505–512. Rath, Rainer (1976): Gesprochenes Deutsch und seine Gliederung. In: Beiträge zu den Fortbildungskursen des Goethe-Instituts für ausländische Deutschlehrer an Schulen und Hochschulen. München, 63–76. Rath, Rainer (1985): Geschriebene und gesprochene Form der heutigen Standardsprache. In: Werner Besch/Oskar Reichmann/Stefan Sonderegger (Hg.): Sprachgeschichte. Ein Handbuch zur Geschichte der deutschen Sprache und ihrer Erforschung. 2. Halbband. Berlin/New York, 1651–1663. Rath, Rainer (1990): „Satz“ und „Äußerungseinheit“. Syntaktische und interaktive Struktur in der Sprache? In: Eynar Leupold/Yvonne Petter (Hg.): Interdisziplinäre Sprachforschung und Sprachlehre. Festschrift für Albert Raasch zum 60. Geburtstag. Tübingen, 197–216. Rath, Rainer (1997): „Äußerungseinheit“ oder „möglicher Satz“? In: Deutsche Sprache 25, 1–20. Rath, Rainer (2001): Gesprächsschritt und Höreraktivitäten. In: Brinker u. a., 1213–1226. Rauniomaa, Mirka/Tiina Keisanen (2012): Two multimodal formats for responding to requests. In: Journal of Pragmatics 44, 829–842. Reber, Elisabeth/Elizabeth Couper-Kuhlen (2010): Interjektionen zwischen Lexikon und Vokalität: Lexem oder Lautobjekt? In: Arnulf Deppermann/Angelika Linke (Hg.): Sprache intermedial. Stimme und Schrift, Bild und Ton. Berlin/New York, 69–96. Rehbein, Jochen (1979): Sprechhandlungsaugmente. Zur Organisation der Hörersteuerung. In: Harald Weydt (Hg.): Die Partikeln der deutschen Sprache. Berlin/New York, 58–74. Rehbein, Jochen (1995): Segmentieren. Verbmobil Memo 64. Unveröffentlichtes Manuskript. Rehbein, Jochen (2001): Das Konzept der Diskursanalyse. In: Brinker u. a., 927–945. Rehbein, Jochen u. a. (2004): Handbuch für das computergestützte Transkribieren nach HIAT. Arbeiten zur Mehrsprachigkeit 59. Hamburg. Sacks, Harvey/Emanuel A. Schegloff/Gail Jefferson (1974): A simplest systematics for the organisation of turn taking in conversation. In: Language 50 (4), 696–735. Schegloff, Emanuel A. (1981): Discourse as an interactional achievement: some uses of ‚uh huh‘ and other things that come between sentences. In: Deborah Tannen (Hg.): Analyzing Discourse: Text and Talk. Washington, 71–93. Schegloff, Emanuel A. (1984): On some gestures’ relation to talk. In: J. Maxwell Atkinson/John Heritage (Hg.): Structures of Social Action. Studies in Conversation Analysis. Cambridge, 299–345. Schegloff, Emanuel A. (1987): Analyzing single episodes of interaction. An exercise in conversation analysis. In: Social Psychological Quarterly 50 (2), 101–114. Schegloff, Emanuel A. (1996): Turn organization: one intersection of grammar and interaction. In: Ochs/Schegloff/Thompson, 52–133. Schegloff, Emanuel A. (2007): Sequence Organization in Interaction. A Primer in Conversation Analysis. Band 1. Cambridge. Schiffrin, Deborah (1987): Discourse Markers. Cambridge. Schmidt, Claudia (1988): ‚Typisch weiblich – typisch männlich‘. Geschlechtstypisches Kommunikationsverhalten in studentischen Kleingruppen. Tübingen. Schmitt, Reinhold (2005): Zur multimodalen Struktur von turn-taking. In: Gesprächsforschung – Online-Zeitschrift zur verbalen Interaktion 6, 17–61. http://www.gespraechsforschung-ozs.de/ fileadmin/dateien/heft2005/ga-schmitt.pdf [16.12.2014].

Grundeinheiten der Sprache und des Sprechens 

 47

Schmitt, Reinhold/Arnulf Deppermann (2010): Die Transition von Interaktionsräumen als Eröffnung einer neuen Situation. In: Lorenza Mondada/Reinhold Schmitt (Hg.): Situationseröffnungen. Zur multimodalen Herstellung fokussierter Interaktion. Tübingen, 335–386. Schwitalla, Johannes (2002): Kleine Wörter. Partikeln im Gespräch. In: Jürgen Dittmann/Claudia Schmidt (Hg.): Über Wörter. Grundkurs Linguistik. Freiburg i. Br., 259–281. Schwitalla, Johannes (2012): Gesprochenes Deutsch. Eine Einführung. 4., neu bearbeitete und erweiterte Auflage. Berlin. Selting, Margret (1987): Reparaturen und lokale Verstehensprobleme. Oder: Zur Binnenstruktur von Reparatursequenzen. In: Linguistische Berichte 108, 128–149. Selting, Margret (1995a): Der ‚mögliche Satz‘ als interaktiv relevante syntaktische Kategorie. In: Linguistische Berichte 158, 298–325. Selting, Margret (1995b): Prosodie im Gespräch. Aspekte einer interaktionalen Phonologie der Konversation. Tübingen. Selting, Margret (2000): The construction of units in conversational talk. In: Language in Society 29 (4), 477–517. Selting, Margret (2001): Fragments of units as deviant cases of unit-production in conversational talk. In: Margret Selting/Elizabeth Couper-Kuhlen (Hg.): Studies in Interactional Linguistics. Amsterdam, 229–258. Selting, Margret u. a. (2009): Gesprächsanalytisches Transkriptionssystem 2 (GAT 2). In: Gesprächsforschung – Online-Zeitschrift zur verbalen Interaktion 10, 353–402. http://www.gespraechsforschung-ozs.de/heft2009/px-gat2.pdf [16.12.2014]. Sidnell, Jack/Tanya Stivers (Hg.) (2013): The Handbook of Conversation Analysis. Oxford. Sorjonen, Marja-Leena (2001): Responding in Conversation: A Study of Response Particles in Finnish. Amsterdam. Staffeldt, Sven (2014): Sprechakttheoretisch analysieren. In: Sven Staffeldt/Jörg Hagemann (Hg.): Pragmatiktheorien. Analysen im Vergleich. Tübingen, 105–148. Stivers, Tanya (2008): Stance, alignment and affiliation during story telling: when nodding is a token of preliminary affiliation. In: Research on Language in Social Interaction 41, 29–55. Streeck, Jürgen (2009): Forward-Gesturing. In: Discourse Processes 46 (2–3), 161–179. Szeczepek Reed, Beatrice (2004): Turn-final intonation in English. In: Elizabeth Couper-Kuhlen/ Cecilia E. Ford (Hg.): Sound Patterns in Interaction: Cross-Linguistic Studies From Conversation. Amsterdam, 97–117. Szczepek Reed, Beatrice (2010): Intonation phrases in natural conversation: a participant’s category? In: Barth-Weingarten/Reber/Selting, 191–212. Szczepek Reed, Beatrice/Geoffrey Raymond (Hg.) (2013): Units of Talk – Units of Action. Amsterdam/ Philadelphia. Walker, Gareth (2010): The phonetic constitution of a turn-holding practice: rush-throughs in English talk-in-interaction. In: Barth-Weingarten/Reber/Selting, 51–72. Yngve, Victor (1970): On getting a word in edgewise. In: Papers from the Sixth Regional Meeting of the Chicago Linguistic Society. Chicago. Zifonun, Gisela (1987): Kommunikative Einheiten in der Grammatik. Tübingen. Zifonun, Gisela u. a. (1997): Grammatik der deutschen Sprache. 3 Bände. Berlin/New York.

Ellen Fricke

3. Grammatik und Multimodalität Abstract: Dieser Beitrag gibt einen Abriss des in Fricke (2012) vorgestellten Ansatzes einer multimodalen Sprachbeschreibung und entfaltet in Grundzügen die dort vertretene These, dass redebegleitende Gesten im Spannungsfeld zwischen multimodaler Kodemanifestation und Kodeintegration in den Gegenstandsbereich der Grammatik von Einzelsprachen und der Sprache allgemein fallen. Für den Bereich der Syntax wird exemplarisch gezeigt, dass Gesten erstens typisierbar und semantisierbar sind, dass ihnen zweitens unabhängig von der Lautsprache Konstituentenstrukturen zugewiesen werden können, die über die Eigenschaft der Rekursivität verfügen, und dass sie drittens in lautsprachlichen Nominalgruppen als Attribut fungieren können. Geht man wie die Generative Grammatik davon aus, dass Rekursivität spezifisch für die Sprachfähigkeit im engeren Sinn (FLN) ist, dann folgt aus der Rekursivität redebegleitender Gesten, dass Sprache sich auch multimodal manifestieren kann. Eine multimodale Kodeintegration ist für einen strukturalistisch-funktionalen Ansatz wie denjenigen Eisenbergs dadurch nachgewiesen, dass Gesten durch den Artikel son, der eine qualitative Beschreibung fordert, syntaktisch in den lautsprachlichen Ma­trixkode des Deutschen integriert werden und sowohl unter eine syntaktische als auch eine semantische Attributdefinition im Sinne Eisenbergs fallen können. 1 2 3

Einleitung: Multimodalität und grammatischer Gegenstandsbereich Sprache und Medium: Multimodale ­Kodemanifestation und Kodeintegration Das Problem der syntaktischen Einheiten: Prozesse der Typisierung und Semantisierung bei redebegleitenden Gesten 4 Kodemanifestation und syntaktische Struktur: Konstituenz und Rekursion redebegleitender Gesten als Kodemanifestation der Language faculty (FLN) 5 Kodeintegration und syntaktische Funktion: Multimodale Attribuierung in Nominalphrasen des Deutschen als Einzelsprache 6 Perspektiven einer multimodalen Sprachbeschreibung: Warum wir den bisherigen gramma­ tischen Gegenstandsbereich erweitern müssen 7 Literatur

1 Einleitung: Multimodalität und grammatischer Gegenstandsbereich Das menschliche Sprechen besteht nicht nur aus Artikulationen des Mundes, die primär mit dem Ohr wahrgenommen werden, sondern auch aus sichtbaren Artikulationen anderer Körperteile, die auf das Auge wirken. Eine besondere Stellung nehmen dabei die Bewegungen der Hände ein: Die Gebärdensprachen der Gehörlosen zeigen,

Grammatik und Multimodalität 

 49

dass auch Handbewegungen allein als Artikulationen voll ausgebildeter Sprachen gelten können. Wenn es sich so verhält, dass Handbewegungen grundsätzlich das Potential zur Ausbildung einer Grammatik haben, wie steht es dann mit der Grammatikfähigkeit derjenigen Handbewegungen, die das Sprechen der Hörenden begleiten? Ist eine Einzelsprache wie das Deutsche partiell multimodal? Für den Bereich der Syntax wird in diesem Beitrag auf der Grundlage von Fricke (2008, 2012, 2013) exemplarisch gezeigt, dass Gesten erstens typisierbar und semantisierbar sind, dass ihnen zweitens unabhängig von der Lautsprache Konstituentenstrukturen zugewiesen werden können, die über die Eigenschaft der Rekursivität verfügen, und dass sie drittens in lautsprachlichen Nominalgruppen als Attribut fungieren können. Die Argumentation erfolgt jeweils begrifflich immanent: Wenn wir den Kontext der Generativen Grammatik betrachten und die These von Hauser, Chomsky und Fitch (2002) zum Ausgangspunkt nehmen, dass Rekursivität spezifisch für die Sprachfähigkeit im engeren Sinn sei, dann folgt aus der Rekursivität redebegleitender Gesten, dass Sprache sich auch multimodal manifestieren kann. Im Kontext einer strukturalistisch-funktional ausgerichteten Sprachwissenschaft wird am Beispiel der Attributfunktion auf der Grundlage von Peter Eisenbergs „Grundriss der deutschen Grammatik“ (1999, 2006, 2013) nachgewiesen, dass Gesten durch den Artikel son, der eine qualitative Beschreibung fordert, syntaktisch in den lautsprachlichen Matrixkode des Deutschen integriert werden und sowohl unter eine syntaktische als auch eine semantische Attributdefinition im Sinne Eisenbergs fallen können. Damit gehören redebegleitende Gesten zumindest in diesem Kontext zum Gegenstandsbereich einer Beschreibung der Grammatik des Deutschen. Fasst man durch den Artikel son eingeleitete Nominalgruppen als Konstruktionen auf, dann wäre auch für kon­ struktionsgrammatische Ansätze die Notwendigkeit einer multimodalen Perspektive auf Grammatik nachgewiesen. Mit seiner Reflexion der medialen Grundlagen von einzelsprachlichen Grammatiken und der Sprache allgemein stellt dieser Beitrag einen Bezug zu einer lange unterbrochenen linguistischen Forschungstradition her, die exemplarisch mit den Namen Wilhelm Wundt, Karl Bühler, Louis Hjelmslev und Kenneth Pike verknüpft ist. Diese Traditionslinie ist der grundlegenden Annahme verpflichtet, dass sprachliche Kategorien nicht von vornherein beschränkt auf die Substanz der Schrift oder des Lautes definiert werden können (vgl. Fricke 2012).

2 Sprache und Medium: Multimodale Kode­ manifestation und Kodeintegration Es ist ein Allgemeinplatz, dass jede Artikulation notwendig ein Medium voraussetzt. Da Medien jedoch gegenüber dem Mediatisierten nicht neutral sind, sondern ihm spezifische Beschränkungen auferlegen (Krämer 1998, 78 ff.; Stetter 2005, 79), gehört

50 

 Ellen Fricke

die Klärung des Medienbegriffs zu den „unverzichtbaren Grundlagen einer erkenntnistheoretisch reflektierten Linguistik“ (Stetter 2005, 266; siehe auch Schneider 2008 und in diesem Band). Wir setzen deshalb bei den folgenden grundlegenden Fragen an, die für die weitere Argumentation relevant sind: Was ist unter Multimedialität und Multimodalität in der Sprache zu verstehen? Was unterscheidet sie? Wie lassen sich diese Begriffe im Hinblick auf grammatische Analysen aus multimodaler Per­ spektive definieren? Inwieweit ist die Lautsprache als multimodal zu betrachten? Um in einem ersten Schritt die gängigen Medienbegriffe zu systematisieren, bieten die Unterscheidungen Posners (1986) einen geeigneten Ausgangspunkt. Danach „ist ein Medium jeweils ein System von Mitteln für die Produktion, Distribution und Rezeption von Zeichen, das den in ihm erzeugten Zeichenprozessen bestimmte gleichbleibende Beschränkungen auferlegt“ (Posner 1986, 293). Über die jeweiligen medienspezifischen Beschränkungen wird das Mediatisierte durch das Medium geprägt. In Abhängigkeit vom zugrunde gelegten Medientyp unterscheidet Posner einen biologischen, einen physikalischen, einen technologischen, einen soziologischen, einen kulturbezogenen und einen kodebezogenen Medienbegriff. Im Folgenden sind insbesondere der biologische und der kodebezogene Medienbegriff relevant. Der biologische Medienbegriff „charakterisiert die Zeichensysteme nach den Körperorganen, die an der Produktion, Distribution, und Rezeption von Zeichen beteiligt sind“ (Posner 1986, 293). Unter den biologischen Medienbegriff nach Posner fällt also das Kriterium der beim Rezipieren eines Zeichens vorliegenden Sinnesmodalität. Danach lassen sich visuelle Medien (Augen), auditive Medien (Ohren), olfaktorische Medien (Nase), gustatorische Medien (Geschmacksknospen im Mund) und taktile Medien (Tastsinn der Haut) unterscheiden (vgl. Posner 1986, 294). Der kodebezogene Medienbegriff hingegen „charakterisiert die Zeichensysteme nach den Regeln, mithilfe derer ihre Benutzer bei der Zeichenproduktion den Botschaften Zeichenträger und bei der Rezeption den Zeichenträgern Botschaften zuordnen“ (Posner 1986, 296). Unter einen kodebezogenen Medienbegriff fallen also auch Einzelsprachen wie das Deutsche, Englische oder Französische. Die beiden wichtigsten Forschungslinien linguistisch-semiotischer Multimodalitätsforschung haben die Relationen von Geste und Rede sowie von Sprache und Bild zum Gegenstand (für einen Forschungsüberblick zur Gestenforschung siehe Müller u. a. 2013 und 2014; zu Sprache-Bild-Relationen siehe Jewitt 2009, Stöckl 2004 und Schneider/Stöckl 2011). Beide stehen bisher nur in einem sporadischen Austausch und unterscheiden sich wesentlich im Medienbegriff, der von ihnen zugrunde gelegt wird. Die neuere Gestenforschung vertritt den Grundgedanken, dass ein und derselbe Kode (je nach Beschreibungsansatz sprachlich oder kognitiv) sich in lautsprachlichen Äußerungen und begleitenden visuellen Gesten manifestiert, die beide zwei unterschiedlichen Sinnesmodalitäten angehören. Sie wendet sich explizit gegen das Konzept der sogenannten „nonverbalen Kommunikation“ und der damit verbundenen Klassifizierung der redebegleitenden Gesten als nichtsprachlich. Sie geht mit

Grammatik und Multimodalität 

 51

Kendon und McNeill von der grundlegenden Annahme aus, dass Geste und Rede grundsätzlich Bestandteile desselben Äußerungsprozesses darstellen: […] this bodily activity is so intimately connected with the activity of speaking that we cannot say that one is dependent upon the other. Speech and movement appear together, as manifestations of the same process of utterance. (Kendon 1980, 208)

Während dem Multimodaltitätsbegriff in der Gestenforschung ein biologischer Medienbegriff im Sinne Posners zugrunde liegt, bedient sich die textlinguistische Forschung zu Sprache-Bild-Relationen eines kodebezogenen Medienbegriffs und versteht Multimodalität als das Zusammenwirken unterschiedlicher semiotischer Ressourcen (Kress/Van Leeuwen 2006 [1996]; Kress 2011, 54; Stöckl 2004, 11 f.), die auch derselben Sinnesmodalität angehören können. Beiden Richtungen der Multimodalitätsforschung (zu einer ausführlichen Darstellung siehe Fricke 2012, 37 ff.) ist gemeinsam, dass ihr Fokus bisher nahezu ausschließlich auf Phänomenen des konkreten Sprachgebrauchs liegt. Wenn wir allerdings den Begriff der sprachlichen Multimodalität nicht auf Äußerungen allgemein und darüber hinaus auf Äußerungen eines bestimmten Typs wie Sprache-Bild-Relationen oder Geste-Rede-Relationen im Sprachgebrauch beschränken wollen, dann müssen wir unsere Perspektive erweitern: auf das einzelsprachliche System, auf Sprachtypen, auf die Sprachfähigkeit und die Sprache allgemein. Der Grundgedanke für einen leistungsfähigen Multimodalitätsbegriff, der in Fricke (2008, 2012, 2013) in Bezug auf Geste-Rede-Relationen und Sprache-Bild-Relationen ausführlich expliziert wird, lässt sich folgendermaßen umreißen: Der Begriff der sprachlichen Multimodalität ist nicht primär an das Kriterium des gleichzeitigen Vorliegens verschiedener Sinnesmodalitäten in einer Äußerung gebunden, sondern sprachliche Multimodalität liegt zum einen bezogen auf eine Einzelsprache wie das Deutsche erst dann vor, wenn verschiedene Medien in dieselben sprachlichen Strukturen eintreten können – etwa die Substitution einer lautsprachlichen Konstituente durch eine gestische Konstituente in derselben syntaktischen Position – oder dieselben sprachlichen Funktionen erfüllen können, wie etwa die lautsprachliche und gestische Realisierung der syntaktischen Funktion des Attributs in einer Nominalgruppe (siehe Abschnitt 5). In solchen Fällen handelt es sich um eine einzelsprachliche multimodale Kodeintegration. In Bezug auf die Sprache allgemein (language faculty) liegt Multimodalität dann vor, wenn dieselben strukturellen Prinzipien wie beispielsweise Konstituenz und Rekursion (siehe Abschnitt 4) oder grundlegende semiotische Prinzipien der Zeichenkonstitution wie beispielsweise Prozesse der Typisierung und Semantisierung sich gleichzeitig in unterschiedlichen Medien manifestieren können. Wir sprechen dann von Prozessen der Kodemanifestation. Mit anderen Worten: Multimodalität setzt im Gegensatz zur Multimedialität nicht nur die Simultanität mindestens zweier Medien als notwendige Bedingung voraus, sondern zusätzlich als hinreichende Bedingung

52 

 Ellen Fricke

entweder deren strukturelle und/oder funktionale Integration in einen Matrixkode (Kodeintegration) oder die zumindest partielle Manifestation ein und desselben Kodes in unterschiedlichen Medien (Kodemanifestation) (Fricke 2008, 2012, 2013). Die folgende Abbildung 1 illustriert die Verschränkung von zugrundeliegendem Medienbegriff und grammatischer Beschreibungsebene in Bezug auf multimodale Geste-Rede-Relationen: MEDIENBEGRIFF ‒ kodebezogen

MEDIENBEGRIFF ‒ kodebezogen ‒ biologisch

MEDIENBEGRIFF ‒ kodebezogen ‒ biologisch MULTIMODALITÄT

Gebärdensprache (visuell)

Kodemanifestation / Kodeintegration ‒ strukturell ‒ funktional

Sprache

Verbale Ebene (auditiv)

Schriftsprache (visuell)

Gestische Ebene (visuell)

Lautsprache (primär auditiv)

SPRACHE ALLGEMEIN

EINZELSPRACHEN

(Simultanität von gestischer und verbaler Ebene)

Abb. 1: Medialität und sprachliche Multimodalität (Fricke 2012, 44)

Gehen wir von einem kodebezogenen Medienbegriff aus, dann ist die Sprache allgemein und damit auch jede Einzelsprache wie das Deutsche ein Medium, wie in Abbildung 1 ganz links dargestellt. Nach Merten (1999, 134) ist Sprache das „erste kommunikative Medium“ überhaupt, aus dessen Eigenschaften sich die grundlegenden Kriterien für alle weiteren Medien (im Sinne eines technologischen Medienbegriffs, E. F.) gewinnen lassen, nämlich „Quantelung“ in kleinste syntaktische Einheiten (hohes Auflösungsvermögen), „Nichtverbrauch“, „Relationalität“ (Verweis auf anderes als sich selbst), „Distanzwahrnehmung“, „Fungibilität der prozessierten Inhalte“, „Kopplung“ von psychischen Systemen und „Multiplikatorfunktion“, insofern Sprache von mehreren Empfängern zugleich rezipiert werden kann (Merten 1999, 134 ff.). Damit sich jedoch Sprache als erstes kodebezogenes Medium entwickeln kann, muss als Bedingung die hochauflösende Leistung des physikalischen Mediums vorhanden sein (Merten 1999, 141), wie z. B. der akustische Kanal bei den

Grammatik und Multimodalität 

 53

Lautsprachen oder der optische Kanal bei Gebärdensprachen. Physikalische Medien setzen Dinge zueinander in Beziehung und erzeugen dadurch unsere Wahrnehmung (ebd.), es sind physikalische Medien für die Wahrnehmung (Merten 1999, 144). Verschränkt man wie in Abbildung 1 den kodebezogenen Medienbegriff in einem zweiten Schritt mit dem biologischen Medienbegriff, dann lassen sich verschiedene Medien des Sprachlichen unterscheiden: Gebärdensprache, Schriftsprache und Lautsprache, die wiederum auf der Ebene der jeweiligen Einzelsprachen multimodal verfasst sein können. In Abhängigkeit vom Medienbegriff (biologisch, kodebezogen) unterscheiden wir zwischen Multimodalität im engeren und weiteren Sinn (Fricke 2012, 47 ff.). Um Multimodalität im engeren Sinn handelt es sich dann, wenn die an einer Äußerung beteiligten Medien verschiedenen Sinnesmodalitäten im Sinne eines biologischen Medienbegriffs angehören und im Sinne eines kodebezogenen Medienbegriffs strukturell und/oder funktional in ein und denselben Kode integriert sind oder alternativ ein und denselben Kode manifestieren. Multimodalität im weiteren Sinn liegt dann vor, wenn die beteiligten Medien lediglich kodebezogen verschieden sind und kein zusätzlicher Unterschied wie z. B. bei Sprache-Bild-Relationen in Bezug auf die affizierte Sinnesmodalität gegeben ist.

3 Das Problem der syntaktischen Einheiten: Prozesse der Typisierung und Semantisierung bei redebegleitenden Gesten Ein wichtiges Argument, das gewöhnlich gegen redebegleitende Gesten als potentielle Einheiten des Sprachsystems angeführt wird, ist ihre mangelnde Konventionalisierung. Ohne Konventionalisierung keine eigenständige gestische Segmentierung, ohne Segmentierung keine abgegrenzten sprachlichen Einheiten mit stabilen FormInhaltsbeziehungen, die beispielsweise als Konstituenten in syntaktische Konstituentenstrukturen eingehen können  – so die Struktur des Arguments. Nun gibt es aber auch für die Lautsprache linguistische Ansätze, die unterhalb der Morphem­ ebene systematische Semantisierungsprozesse annehmen, die zu abgrenzbaren, segmentierbaren Einheiten führen. Diese Einheiten werden „submorphematische Einheiten“ oder „Phonaestheme“ genannt (Firth 1957 [1935]; Bolinger 1975 [1968]; Zelinsky-­Wibbelt 1983). Es handelt sich um im Äußerungskontext durch Gewohnheit begründete, erlernbare, intersubjektiv nachvollziehbare Laut-Bedeutungskorrelationen (Zelinsky-Wibbelt 1983) wie zwischen Reim und Bedeutung in den englischen Einsilbern bump, chump, clump, crump, flump, glump, grump, hump usw., die „im Lexikon der semantischen Kategorie ‚heavy‘ zugeordnet sind“ (Zelinsky-Wibbelt 1983, 22). Derartige Einheiten lassen sich auch sequentiell zu komplexeren Einheiten kombinieren, wie sie beispielsweise bei morphologischen Kontaminationen vorliegen. Sie

54 

 Ellen Fricke

bilden gleichsam eigenständige kleine Systeminseln innerhalb der Wortbildung, die jedoch nicht für den gesamten Wortschatz systematisiert sind. Sie wirken sich jedoch insofern auf das Sprachsystem aus, als Phonaestheme Sprachveränderungsprozesse beeinflussen, wie Zelinsky-Wibbelt (1983) am Wortschatz des Englischen gezeigt hat. Die Integration solcher Konzepte wie das des Phonaesthems in lautsprachliche Grammatiken wird insbesondere durch die scharfe sprachtheoretische Trennung zwischen System und Performanz behindert, die sowohl für die strukturalistische Linguistik in der Tradition Saussures als auch für die Generative Linguistik in der Tradition Chomskys gilt. Nimmt man jedoch wie Stetter (2005) ein an Goodman orientiertes Konzept der Typisierung an, bei dem sprachliche Typen als Mengen von Kopien aufgefasst werden, die nicht genau gleich, sondern einander nur ähnlich sind und denen kein gemeinsames Original zugrunde liegt, dann wird diese Trennung aufgehoben. Sprachliche Einheiten sind dann nicht mehr Einheiten des Sprachsystems oder der Performanz, sondern Zwischenstufen wie Phonaestheme werden damit integrierbar. Gleiches gilt für die Semantisierung redebegleitender Gesten. In Fricke (2008, 2010, 2012) wird das bestehende, anhand der Lautsprache entwickelte Konzept des Phonaesthems mit Stetters Begriff der Typisierung, mit Peirces Konzept des diagrammatischen Ikonismus (Peirce 1931–58), bei dem Relationen zwischen Ausdrücken mit Relationen zwischen Inhalten korrelieren, und mit Wittgensteins Begriff der Familienähnlichkeit verbunden und schließlich für gestische Einheiten adaptiert, die analog „Kinaestheme“ genannt werden. Kinaestheme sind definiert als intersubjektiv semantisierte gestische Token, deren Ähnlichkeit auf der Ausdrucksseite mit einer Ähnlichkeit auf der Inhaltsseite korreliert. Die Ähnlichkeit auf der Inhaltsseite entspricht dabei der Relation der Familienähnlichkeit nach Wittgenstein (Fricke 2008, 2010, 2012). Empirische Analysen von nicht-abbildenden Zeigegestenklassen (raumpunktdeiktisch vs. richtungsdeiktisch) in Wegbeschreibungen am Potsdamer Platz in Berlin (Fricke 2007, 2008, 2010, 2012) zeigen, dass Kinaestheme sowohl einfach als auch komplex sein können. Komplexe Kinaestheme lassen sich dabei mit Kontaminationen in der lautsprachlichen Wortbildung vergleichen. Das englische Substantiv smog ist beispielsweise eine Kontamination der Substantive fog und smoke (vgl. ZelinskyWibbelt 1983). Die beiden folgenden Zeigegesten in Abbildung 2 bilden die Bestandteile eines vergleichbaren gestischen Kontaminationsprozesses.

Grammatik und Multimodalität 

 55

B

B

A

A

Abb. 2: Raumpunktdeiktische und richtungsdeiktische Zeigegesten im Deutschen (Fricke 2010, 2012)

Im Deutschen können wir zwei typisierte Formen von Zeigegesten unterscheiden, wie eine quantitative empirische Analyse in Fricke (2007) gezeigt hat: Erstens die sogenannte G-Form mit ausgestrecktem Zeigefinger und einer Orientierung der Handfläche nach unten, zweitens die sogenannte PLOH-Geste (palm-lateral-open-hand gesture) der flachen, lateralen Hand (Fricke 2007, 2010, 2012, 2014c; siehe Kendon/ Versante 2003 und Kendon 2004 für italienische Gesten sowie Haviland 2003 zu Zeigegesten in Zinacantán). Die G-Form ist semantisiert mit einer Bedeutung, die sich als „Zeigen auf einen Raumpunkt oder auf eine mit einem Raumpunkt assoziierte Entität“ umschreiben lässt, während die direktionale Bedeutung der PLOH-Geste mit „Zeigen in eine Richtung“ paraphrasierbar ist. Abbildung 3 zeigt eine Kontamination beider Gestentypen, deren Bedeutungsparaphrase „Zeigen auf einen Raumpunkt in einer bestimmten Richtung“ lautet.

B

A

Abb. 3: Kontamination von raumpunktdeiktischer und richtungsdeiktischer Zeigegeste (Fricke 2010, 2012)

56 

 Ellen Fricke

Damit verfügen Kinaestheme über eine zumindest rudimentäre morphologische und semantische Kompositionalität. Weitere Beispiele für kinaesthematische Kompositionalität lassen sich insbesondere in sog. „Gestenfamilien“ finden (siehe z. B. Calbris 1990, 2011; Fricke/Bressem/Müller 2014; Kendon 2004; Ladewig 2010; Müller 2004). Wenn es sich nun bei den lautsprachlichen Phonaesthemen um emische Einheiten im Sinne von Pike handelt und redebegleitende Gesten als Kinaestheme nach den gleichen Prinzipien beschrieben werden können, dann ist der These, dass es sich bei redebegleitenden Gesten nicht um emische Einheiten handeln kann, widersprochen. Mehr noch: Unsere Analyse zeigt, dass dieselben sprachlichen Prinzipien sich sowohl auf der verbalen als auch auf der gestischen Ebene manifestieren (vgl. Fricke 2008, 2010, 2012, 2014a). Kinaesthematische Prozesse der Typisierung und Semantisierung und ihr Potential für morphologische und semantische Kompositionalität ergänzen andere Prozesse multimodaler Bedeutungskonstitution, wie sie beispielsweise in Metaphern und Metonymien gegeben sind (Cienki 2008; Cienki/Müller 2008; Mittelberg 2006, 2008; Müller 2008, 2010) und stellen eine unabdingbare Voraussetzung für den Ansatz einer multimodalen Grammatik dar.

4 Kodemanifestation und syntaktische Struktur: Konstituenz und Rekursion redebegleitender Gesten als Kodemanifestation der Language faculty (FLN) Die grundlegende Fragestellung für die Konzeption einer multimodalen Syntax des Deutschen lautet: Kombinieren sich einfache gestische Einheiten zu komplexen gestischen Einheiten? Und wenn dies der Fall ist, wie interagieren gestische Syntagmen mit lautsprachlichen Syntagmen? Und: Inwieweit manifestieren sich auf gestischer und lautlicher Ebene dieselben syntaktischen Prinzipien? Im Folgenden werden wir für das Deutsche zeigen, dass redebegleitenden Gesten Konstituentenstrukturen zugewiesen werden können, die über die Eigenschaft der Rekursivität verfügen. In der aktuellen Debatte zur Rekursivität und sprachlichen Komplexität lassen sich im Wesentlichen folgende Positionen unterscheiden (Van der Hulst 2010; Zwart 2011; Sauerland/Trotzke 2011): So nehmen Hauser, Chomsky und Fitch (2002) an, dass Rekursion spezifisch für die menschliche Sprachfähigkeit sei. Weder Tieren noch anderen menschlichen kognitiven Fähigkeiten lasse sich diese Eigenschaft ­zuschreiben: We submit that a distinction should be made between the faculty of language in the broad sense (FLB) and in the narrow sense (FLN). FLB includes a sensory-motor system, a conceptual-intentional system, and the computational mechanisms for recursion, providing the capacity to gene-

Grammatik und Multimodalität 

 57

rate an infinite range of expressions from a finite set of elements. We hypothesize that FLN only includes recursion and is the only uniquely human element in the faculty of language. (Hauser/ Chomsky/Fitch 2002, 1569)

Dieser Auffassung widerspricht Everett (2005), indem er behauptet, dass es im Amazonischen Pirahã keine Evidenz für rekursive syntaktische Strukturen gebe. It is the only language known without embedding (putting one phrase inside another of the same type or lower level, e.g., noun phrases in noun phrases, sentences in sentences, etc.). (Everett 2005, 622)

Diese Behauptung Everetts ist nicht unumstritten (siehe z. B. Fitch 2010; Zwart 2011; Sauerland/Trotzke 2011). Sollte es jedoch tatsächlich eine Einzelsprache ohne Rekursion geben und Everetts Beobachtung zutreffen, dann kann Rekursion nicht spezifisch für die menschliche Sprachfähigkeit im engeren Sinn sein. Andere Forscher wie etwa Corballis (2007) betrachten Rekursion als eine allgemeine kognitive Fähigkeit, die nicht auf die menschliche Sprachfähigkeit beschränkt ist: Recursion is a well-known property of language, but I shall argue that the phenomenon applies to a number of other putatively human domains, including ‘theory of mind’, mental time travel, manufacture, the concept of self and possibly even religion. (Corballis 2007, 240)

Als ein Problem stellt sich in der aktuellen Diskussion dar, dass unter Rekursion in der Linguistik nicht immer dasselbe verstanden wird. Wie ist Rekursion zu definieren? Im Folgenden grenzen wir Rekursion von Iteration ab, unterscheiden zwischen Rekursion als Prozess und Struktur und charakterisieren die Relation zwischen Rekursion und Selbsteinbettung. Wenn wir zunächst Rekursion in Abgrenzung zur Iteration betrachten, dann handelt es sich jeweils um unterschiedliche Formen der Sequentialisierung von Einheiten: Mithilfe von Rekursion werden Strukturen zunehmender Einbettungstiefe erzeugt, wogegen die Iteration flache Strukturen derselben Einbettungstiefe hervorbringt (Karlsson 2010, 45). Während die durch Iteration sequentialisierten Einheiten vollkommen unabhängig voneinander sind, gilt dies nicht für rekursive Sequentialisierungen: Iteration involves repetition of an action or object, where each repetition is entirely independent of those that come before and after. Recursion involves the embedding of an action or object inside another of the same type, each embedding being dependent in some way on the one it is embedded inside. (Kinsella 2010, 180)

Betrachten wir die folgenden Beispiele für Iteration (1) und Rekursion (2) (Kinsella 2010, 181): (1) Iteration: Jack ate [NP1 the sandwiches NP1] and [NP2 the doughnut NP2] and [NP3 the apple NP3]. (2) Rekursion: [NP1 [NP2 [NP3 John’s NP3] mother’s NP2] neighbor NP1] bought the car.

58 

 Ellen Fricke

Zunächst scheint es sich in beiden Beispielen an der Oberfläche um Verkettungen von Nominalphrasen zu handeln. Betrachtet man jedoch die jeweilige Struktur genauer, dann zeigt sich, dass es sich bei Beispiel (1) um eine flache Struktur handelt, in der die Nominalphrasen unabhängig voneinander sind. Bei Beispiel (2) hingegen besteht insofern eine Abhängigkeit der Nominalphrasen untereinander, als zwischen ihnen die Relation der Modifikation vorliegt (Kinsella 2010, 181). Dies ist auch der Grund dafür, dass in (1) die Reihenfolge der Nominalphrasen prinzipiell veränderbar ist, in (2) hingegen nicht (ebd.). Dass man strikt zwischen rekursiven Strukturen und zugrunde liegenden rekursiven Algorithmen unterscheiden müsse, darauf weisen Lobina (2011, 155) und Fitch (2010, 78) hin, denn auch iterative Strukturen, wie in Beispiel (1), können durch einen rekursiven Prozess erzeugt werden: […] many studies focus on the so-called self-embedded sentences (sentences inside other sentences, such as I know that I know etc.) as a way to demonstrate the non-finiteness of language, and given that self-embedding is sometimes used as a synonym for recursive structures (see infra), too close a connection is usually drawn between the presence of these syntactic facts and the underlying algorithm of the language faculty. (Lobina 2011, 155 f.)

Diese Unterscheidung Lobinas zwischen Struktur und zugrunde liegendem Prozess erlaubt auch eine differenziertere Betrachtung der Einwände Everetts gegenüber dem Artikel von Hauser, Chomsky und Fitch (2002), denn das Nichtvorliegen von Selbsteinbettung als Struktur stellt kein Gegenargument gegen eine Annahme von Rekursion als zugrunde liegendem Algorithmus dar, der als Kernbereich der Sprachfähigkeit möglicherweise allen natürlichen Sprachen zugrunde liegt. However, even if there were a language that did not exhibit self-embedding but allowed for conjunction, you could run the same sort of argument and the non-finiteness conclusion would still be licensed. These two aspects must be kept separate; one focuses on the sort of expressions that languages manifest (or not), while the other is a point about the algorithm that generates all natural language structures. (Lobina 2011, 156)

In Bezug auf die Analyse redebegleitender Gesten wird in Fricke (2012) gezeigt, dass diese allein – ohne Bezug auf die Lautsprache – prinzipiell beliebig lange, „flache“ Verkettungen bilden können. Gesten verfügen also zum einen über die Struktureigenschaft der Iteration, die über einen rekursiven Algorithmus erzeugt werden kann. Gesten verfügen jedoch zum anderen auch über die Struktureigenschaft der „tiefen“ Selbsteinbettung, insofern gestische Konstituenten wiederum gestische Konstituenten desselben Typs enthalten können. Auf der Grundlage von empirischen Untersuchungen gestischer Komplexität werden in Fricke (2012, 176) die folgenden Phrasenstrukturregeln für redebegleitende Gesten formuliert:

Grammatik und Multimodalität 

 59

(3) GP Retr GU GU (GU1 … GUn) Retr GP GP (GP1 … GPn) Retr GU (GU1 … GUn) GP (GP1 … GPn)(GUn+1 … GUz) Retr GP (GP1 … GPn) GU (GU1 … GUn)(GPn+1 … GPz) Retr

GU



GP



(Prep) SP

SP



S (S1 … Sn)

S



(Hold) s (Hold)

Ausgangspunkt unseres Regelapparats ist die gesture unit (GU). Eine primäre gesture unit ist die höchste Einheit der Konstituentenhierarchie. Diese Tatsache wird in unseren Regeln dadurch wiedergegeben, dass die Kategorie GU das Startsymbol unseres formalen Regelapparats bildet, vergleichbar der Kategorie Satz (S) in lautsprachlichen generativen Grammatiken. Eine GU kann einfach oder komplex sein. Ist sie einfach, dann wird GU durch die miteinander verketteten Symbole GP (gesture phrase) und Retr (retraction) ersetzt. Ist sie komplex, dann können alternativ die weiteren Symbolketten, die in der geschweiften Klammer aufgeführt sind, für GU eintreten. Die geschweifte Klammer zeigt an, dass es sich bei den untereinander aufgeführten Symbolketten um Alternativen für die Ersetzung handelt. Die einzelnen Symbole und die durch sie repräsentierten Konstituenten können obligatorisch oder fakultativ sein. Sind sie fakultativ, dann wird dieser Sachverhalt durch die Einklammerung mit runden Klammern ausgedrückt. Die Eigenschaft der Selbsteinbettung teilt sich dadurch mit, dass links und rechts vom Ersetzungspfeil das gleiche Kategoriensymbol auftaucht, nämlich GU. Die fakultativen Konstituentenkategorien mit drei Punkten und tiefgestelltem Index repräsentieren eine beliebig komplexe Koordination von Konstituenten derselben Kategorie auf derselben Hierarchieebene. Mit dieser Analyse knüpfen wir an Kendons Konzept der Gestenphasen an. Kendon (1972, 2004) konnte zeigen, dass Bewegungsmuster redebegleitender Gesten erstens hierarchisch organisiert und zweitens mit Einheiten des Sprechens koordiniert sind. Nach Kendon (1972, 2004) sind gesture units (GU) durch Ruhepositionen abgegrenzt und enthalten obligatorisch eine gestische Rückzugsphase (retraction), die oben durch das Symbol Retr wiedergegeben wird. Das Vorliegen einer obligatorischen Rückzugsphase unterscheidet gesture units (GU) von gesture phrases (GP). Eine komplexe GU kann aus einer beliebigen Anzahl von GUs und/oder GPs bestehen. Videoanalysen haben gezeigt, dass die Einbettungstiefe von sekundären GUs, die nicht die oberste Konstituentenkategorie bilden, durch die Art der Rückzugsphase als Grenzsignal bestimmt wird (Fricke 2012, 155 ff.). Es handelt sich um eine primäre Rückzugsphase und damit auch um eine primäre GU, wenn die Schwerkraft auf die

60 

 Ellen Fricke

manuellen Artikulatoren zum Maximum hinstrebt und keine muskulären Antagonisten vorhanden sind. Es handelt sich um eine sekundäre Rückzugsphase und damit um eine sekundäre GU, wenn die Schwerkraft nicht maximal, sondern nur partiell ist. Eine Zusammengehörigkeit („gestural cohesion“, McNeill 2005) wird nicht nur durch denselben Grad muskulärer Entspannung, sondern insbesondere auch durch dieselbe Position im Gestenraum angezeigt (Fricke 2012, 158 ff.). Stroke-Phrasen (SP), die den gestischen Höhepunkt (stroke) mit der größten Prägnanz in Bezug auf Form und Bedeutung enthalten, können ebenfalls einfach oder komplex sein. Anders als GUs sind SPs jedoch nicht selbsteinbettend, sondern expandieren zu einem oder mehreren Strokes (S), die einander nebengeordnet sind. Strokes (S) wiederum expandieren zu einem obligatorischen stroke nucleus (s) (vgl. Kendon 2004, 112), dem ein fakultativer Hold vorangehen oder folgen kann, bei dem die Ausführung der Geste gleichsam anhält. Die terminalen Konstituenten sind die sog. „Gestenphasen“ (gesture phases) stroke nucleus (s), hold (Hold), preparation (Prep) und retraction (Retr) (vertiefend zu Gestenphasen siehe Bressem/Ladewig 2011; Kendon 1980, 2004; Kita/Van Gijn/Van der Hulst 1998). Welche sprachtheoretischen Implikationen ergeben sich aus diesen Beobachtungen? Wenn wir an die aktuelle Debatte zur Rekursion und zu sprachlicher Komplexität anknüpfen, die durch den Artikel von Hauser, Chomsky und Fitch (2002) in Gang gesetzt wurde, dann ergeben sich aus der Tatsache, dass redebegleitende Gesten rekursiv sind, die folgenden Konsequenzen: Bezogen auf die These, dass Rekursivität spezifisch für die Sprachfähigkeit im engeren Sinn (FLN) ist, folgt aus der Rekursivität redebegleitender Gesten, dass diese als integraler Bestandteil von Sprache zu betrachten sind. Oder in anderen Worten: Sprache ist ein multimodales Phänomen. Wird hingegen die Annahme sprachlicher Multimodalität abgelehnt, folgt aus der Rekursivität redebegleitender Gesten, dass Rekursivität nicht spezifisch für die Sprachfähigkeit im engeren Sinn sein kann. Bezogen auf die Beobachtungen Everetts (2005), der im Amazonischen Pirahã glaubt, eine Sprache ohne Rekursion gefunden zu haben, lässt sich Folgendes anführen: Nimmt man an, dass redebegleitende Gesten – auch aufgrund ihrer Fähigkeit zur Rekursion – sprachlich sind, dann ist die Nicht-Rekursivität des Pirahã nur nachgewiesen, wenn man auch die Nicht-Rekursivität der redebegleitenden Gesten nachgewiesen hat. Dies ist aber durch Everett nicht geschehen, da redebegleitende Gesten nicht Gegenstand seiner Untersuchungen waren.

Grammatik und Multimodalität 

 61

5 Kodeintegration und syntaktische Funktion: ­Multimodale Attribuierung in Nominalphrasen des Deutschen als Einzelsprache 5.1 Strukturelle und funktionale Integration in Grammatik und Sprachgebrauch Die Annahme, dass redebegleitende Gesten im einzelsprachlichen Gebrauch und in der konkreten Interaktion (siehe auch Deppermann/Proske und Bressem in diesem Band) eng mit dem lautlichen Sprechen verbunden sind, ist mittlerweile unbestritten. Redebegleitende Gesten und lautliche Äußerung interagieren eng im Hinblick auf prosodische Aspekte und die zeitliche Organisation der Gesamtäußerung (z. B. Loehr 2004; McClave 1991) und sind als „gesture-speech ensembles“ (Kendon 2004) semantisch und pragmatisch weitgehend koexpressiv (z. B. Kendon 2004; McNeill 1992, 2005). Der Grundgedanke, dass grundsätzlich auch syntaktische Strukturen und Funktionen durch unterschiedliche Modalitäten instanziiert werden können, findet sich bereits bei Linguisten und Semiotikern wie Wilhelm Wundt (1904 [1900]), Karl Bühler (1982 [1934]), Louis Hjelmslev (1969 [1943]) und Kenneth Pike (1967). Dennoch ist diese Traditionslinie einer Linguistik, die ihre medialen Voraussetzungen reflektiert, bisher nicht in den linguistischen Mainstream grammatischer Analysen eingegangen. Betrachtet man anderseits die Gestenforschung, dann sind Analysen von einem explizit formbasierten linguistischen Standpunkt aus unterrepräsentiert (Ausnahmen sind z. B. Bressem 2012; Fricke 2007, 2012; Harrison 2008, 2009; Ladewig 2011; Kendon 2004; Müller 1998, 2004, 2008; Mittelberg 2006, 2008; für einen allgemeinen Überblick über den gegenwärtigen Forschungsstand zur sprachwissenschaftlichen Multimodalitätsforschung siehe Müller u. a. 2013 und 2014). Dass redebegleitende Gesten als zum Gegenstandsbereich einer einzelsprachlichen Grammatik zugehörig zu betrachten sind, wurde erst in Fricke (2008, 2012) basierend auf Peter Eisenbergs „Grundriss einer deutschen Grammatik“ (1999, 2006, 2013) theoretisch fundiert. Weitere Einzeluntersuchungen finden sich in Harrison (2008, 2009) zum Bereich der Negation, in Bressem (2012, siehe auch Bressem in diesem Band) zu gestischen und vokalen Repetitionen und in Ladewig (2012) – basierend auf Fricke (2008) und Müller (1998) und diesen Ansatz in Richtung kognitiver Linguistik weiterführend – ebenfalls zu multimodalen Nominalgruppen. Wir setzen in diesem Abschnitt bei dem Beispiel einer durch den Artikel son eingeleiteten Nominalgruppe an (Fricke 2008, 2012) und zeigen exemplarisch, dass redebegleitende Gesten das Kernsubstantiv modifizieren und die syntaktische Funktion eines Attributs übernehmen können. Wir zeigen darüber hinaus, dass redebegleitende Gesten nicht nur funktional, sondern auch strukturell in eine Nominalgruppe integriert werden können und diese als Konstituente syntaktisch erweitern können.

62 

 Ellen Fricke

Die gegenwärtige Debatte zu den deutschen Deiktika so und son (Modaldeixis oder qualitative Deixis) weist darauf hin, dass das Adverb so und der Artikel son einen multimodalen Integrationspunkt für redebegleitende Gesten darstellen (z. B. Ehlich 1987; Harweg 1990; Herbermann 1988; Fricke 2007, 2008, 2012; Streeck 2002, 2009; Stukenbrock 2010, 2015). Wie lässt sich die multimodale Integration mittels son beschreiben? Die Analysen von Hole und Klumpp (2000) argumentieren sehr überzeugend dafür, dass das flektierende son basierend auf einer Grammatikalisierung von so + ein als ein Artikel aufzufassen ist, mit dem der Sprecher auf ein unbestimmtes Token eines bestimmten Typs referiert. Wenn man nun das qualitative son im Sinne Hole und Klumpps als einen Artikel auffasst, dann wird dieser vom Kernsubstantiv regiert. Als qualitatives Deiktikon erfordert son zusätzlich eine Qualitätsbeschreibung, die wiederum das Kernsubstantiv modifiziert. Diese Qualitätsbeschreibung kann innerhalb einer Nominalgruppe jedoch nicht nur lautsprachlich, sondern auch gestisch instanziiert werden. Wenn die Qualitätsbeschreibung durch eine ikonische Geste erfolgt, dann findet zusätzlich eine kategoriale Selektion der gestischen Darstellungsweise (die Hand zeichnet, modelliert, repräsentiert, agiert; siehe Müller 1998) statt. Diese eng miteinander verzahnten Integrationsschritte, die über eine einfache zeitliche Überschneidung oder eine gestische Substitution einer lautsprachlichen Einheit hinausgehen, werden im Folgenden ausführlich an Beispielen erläutert.

5.2 Multimodale Attribuierung in Nominalgruppen Zunächst soll zur Verdeutlichung in verknappter Form die Struktur der Gesamtargumentation für die Annahme gestischer Attribute vorgestellt werden, und zwar bezogen auf einen semantisch und syntaktisch definierten Attributbegriff, wie er beispielsweise für Nominalgruppen in den folgenden Definitionen Eisenbergs vorliegt: Die primäre Leistung der Attribute besteht darin, das von einem Substantiv Bezeichnete ‚näher zu bestimmen‘. (Eisenberg 1999, 231) Attribute sind unmittelbare Konstituenten von Nominalgruppen und dem Kernsubstantiv nebengeordnet. (Eisenberg 1999, 231)

Unsere eingangs aufgestellte Behauptung war, dass redebegleitende Gesten zum Gegenstandsbereich einer Grammatik des Deutschen gehören. Im Folgenden soll gezeigt werden, dass redebegleitende Gesten sowohl unter eine funktional-semantische als auch syntaktische Attributdefinition im Sinne Eisenbergs fallen können. Damit wäre zumindest eine partielle grammatische Integration von Gesten in einen lautsprachlichen Matrixkode nachgewiesen. Wir beginnen mit dem semantischen Attributbegriff und einem Beispiel für eine multimodale Modifikation des Kernsubstantivs. Die eckigen Klammern markieren Anfang und Ende einer komplexen Geste, bestehend aus vier Strokes, die jeweils fett markiert sind.

Grammatik und Multimodalität 

 63

(4) A: das iss wahrscheinlich ((Lachen)) dann die neue Staatsbibliothek (..) ähm was oben irgendwie [sone (..) gelb (.) | golden|en (.) | Tafeln hat]

A

B

A

B

Abb. 4 und 5: Modellierung eines Rechtecks (Stroke 1 und 2) in Beispiel (4) (Fricke 2012, 251)

Inwieweit wird das Kernsubstantiv Tafeln im Sinne Eisenbergs näher bestimmt? Wenn wir die lautsprachliche Ebene betrachten, dann können wir in der Nominalgruppe sone gelb-goldenen Tafeln eindeutig ein adjektivisches Attribut identifizieren, das die Extension des Kernsubstantivs Tafeln einschränkt. Die Extension ergibt sich aus der Schnittmenge der Menge der Tafeln und der Menge derjenigen Entitäten, die über die Eigenschaft verfügen, gelb-golden zu sein. Es handelt sich um ein intersektives oder auch extensionales Attribut (zur Gegenüberstellung von extensionalen und intensionalen Adjektiven siehe Zifonun u. a. 1997, 1990 ff.). Wenn wir neben der lautsprachlichen Ebene auch noch die gestische Ebene berücksichtigen, dann erhalten wir zusätzlich eine Information darüber, wie die Tafeln am Gebäude der Staatsbibliothek geformt sind, die die Fassade verkleiden. Es liegt eine Art Arbeitsteilung zwischen lautsprachlicher und gestischer Ebene vor: Das lautsprachliche Attribut bestimmt die Farbqualität der Tafeln, die redebegleitende Geste hingegen bestimmt deren Formqualität. Diese Verteilung ist kein Zufall, denn Gesten sind aufgrund ihrer medialen Eigenschaften besonders gut geeignet, Formqualitäten und räumliche Lageverhältnisse darzustellen. Dies ist für Sprecher oft das effizientere und kognitiv einfachere Mittel (Fricke 2008, 2012). Auch der Arbeitsteilung zwischen lautsprachlichem und gestischem Attribut in unserem Beispiel können wir eine Mengendarstellung zuordnen: Die Extension von Tafeln wird auf die Schnittmenge von Tafeln eingeschränkt, die über die Eigenschaft verfügen, gelb-goldenen und rechteckig zu sein. Um bestimmte Aspekte noch klarer herauszuarbeiten, soll die Möglichkeit gestischer Attribuierung (semantischer Attributbegriff) zusammenfassend an einem konstruierten Beispiel verdeutlicht werden. Nehmen wir die uns bekannte Rechteckgeste in Abbildung 4 zum Ausgangspunkt und betrachten die folgenden Äußerungen:

64 

 Ellen Fricke

(5a)  sone rechteckigen Tafeln (ohne Geste) (5b)  sone rechteckigen Tafeln (+ Rechteck-Geste) (5c)  sone Tafeln (+ Rechteck-Geste)

Welcher Unterschied besteht nun zwischen den Beispielen? Alle drei Äußerungen informieren den Adressaten über die Gestalt des von der Sprecherin intendierten Referenzobjekts. In (5a) wird die Extension des Kernsubstantivs Tafeln allein durch das lautsprachliche Adjektivattribut rechteckig eingeschränkt. In (5b) erfolgt die Einschränkung sowohl lautsprachlich durch das Adjektivattribut rechteckig als auch gestisch durch die begleitende Rechteck-Geste. In (5c) hingegen erfolgt die Einschränkung der Extension von Tafeln ausschließlich gestisch. In allen drei Fällen kommen wir zu derselben Extension, die sich aus der Schnittmenge der Menge der Tafeln (Extension des Kernsubstantivs) und der Menge derjenigen Gegenstände, die über die Eigenschaft verfügen, rechteckig zu sein (Extension des Adjektivs rechteckig bzw. der Rechteck-Geste), ergibt. Zwischen (5a) und (5c) besteht der Unterschied lediglich darin, dass die Bezugnahme auf die Gestalt in Beispiel (5a) ausschließlich lautsprachlich und in Beispiel (5c) ausschließlich gestisch geschieht. Die Leistung, dasjenige ‚näher zu bestimmen‘, was durch das Kernsubstantiv bezeichnet wird, kann also auch allein durch eine Geste erfolgen. Damit fallen bestimmte Vorkommnisse redebegleitender Gesten unter einen semantischen Attributbegriff, wie er bei Eisenberg vorliegt. Wie steht es nun mit einem syntaktischen Attributbegriff nach Eisenberg, bei dem Attribute als unmittelbare Konstituenten von Nominalgruppen aufgefasst werden, die dem Kernsubstantiv nebengeordnet sind (Eisenberg 1999, 231)? Auch hier soll die Argumentation zusammenfassend mithilfe eines Konstruktbeispiels verdeutlicht werden (zu empirischen Beispielen siehe Fricke 2012). Ein aus der Perspektive der Gestenforschung nicht trivialer Aspekt, den es zu zeigen gilt, ist, dass redebegleitende Gesten vom Kernsubstantiv abgelöste eigenständige syntaktische Einheiten darstellen können. Denn nur dann können sie als Attribute in Nominalgruppen fungieren. Da die Geste keine lautsprachliche Konstituente substituiert, sondern lediglich zeitlich mit der Nominalgruppe überlappt, wäre für das oben gegebene Beispiel auch die folgende alternative Erklärung denkbar: Die Rechteck-Geste steht metonymisch (QUALITÄT für GEGENSTAND) für das Konzept einer rechteckigen Fassadenverkleidung, die mit der Wortform Tafeln assoziiert ist (z. B. Lakoff/Johnson 1980; Mittelberg 2006; Mittelberg/Waugh 2009). Diese Wortform wiederum fungiert als verbale Bezugsgröße („lexical affiliate“ nach Schegloff 1984) der Geste. Das heißt, dass sich in diesem Fall die redebegleitende Geste „holistisch“ (McNeill 1992) auf das Kernsubstantiv oder die gesamte Nominalgruppe bezieht. Im Deutschen können wir anhand der durch den Artikel son eingeleiteten Nominalgruppen nachweisen, dass redebegleitende Gesten als vom Kernsubstantiv abgelöste, eigenständige Einheiten nicht nur unter den semantischen, sondern auch unter den syntaktischen Attributbegriff im Sinne Eisenbergs fallen können. Betrachten wir die folgenden Beispiele:

Grammatik und Multimodalität 

 65

(6a)  Ich will sonen [Qualität] Tisch kaufen. (+ Zeigegeste auf einen runden Tisch) (6b)  Ich will sonen [Qualität] Tisch kaufen. (+ ikonische kreisförmige Geste) (6c)  Ich will sonen [runden] Tisch kaufen.

Es lassen sich insgesamt drei Integrationsschritte unterscheiden. Der erste Schritt besteht in der Rektion des Artikels son durch das Kernsubstantiv der Nominalgruppe hinsichtlich des Genus und in der Kongruenzbeziehung hinsichtlich Numerus und Kasus. Wie Hole und Klumpp (2000) anhand der Parallelen zwischen dem Flexionsverhalten von son und dem des bestimmten und unbestimmten Artikels überzeugend nachweisen, ist das qualitative Deiktikon son im Deutschen ein grammatikalisierter Artikel und wird daher wie alle anderen Artikel auch vom Kernsubstantiv der Nominalgruppe regiert. Im Unterschied sowohl zum bestimmten wie unbestimmten Artikel referiert der Sprecher mit seiner Äußerung jedoch auf ein unbestimmtes Token eines bestimmten Typs.

(7) Ich will sonen [Qualität] Tisch kaufen.

Der zweite Integrationsschritt besteht in der kataphorischen bzw. katadeiktischen Integration der Qualitätsbeschreibung. Die Äußerung von sonen innerhalb der Nominalgruppe erfordert eine Qualitätsbeschreibung, die  – wenn sie im Kontext nicht gegeben ist – mit der Nominalgruppe selbst erfolgt. Sonen ist ein qualitatives Deiktikon, dessen Deixisobjekt kein Gegenstand ist, sondern eine Qualität (Fricke 2007, 74 ff.). Diese Qualitätsbeschreibung kann nun in ganz unterschiedlicher Weise realisiert werden. In Variante (6a) zeigt der Sprecher redebegleitend mit einer hinweisenden Zeigegeste auf ein Objekt (indefinites Token), das die gewünschte Qualität (definiter Typ) aufweist. In Variante (6b) erfolgt die Qualitätsbeschreibung durch eine ikonische Geste, welche die vom Sprecher intendierte Formqualität abbildet. Die Qualitätsbeschreibung kann aber auch durch die Nennung der entsprechenden Qualität geleistet werden wie in Variante (6c).

(8) Ich will sonen [Qualität] Tisch kaufen.

Der dritte Integrationsschritt erfolgt, insofern es sich bei der Qualitätsbeschreibung um eine ikonische Geste handelt, über eine kategoriale Selektion durch son in Bezug auf die vier gestischen Darstellungsweisen „die Hand modelliert“, „die Hand zeichnet“, „die Hand agiert“ und die „Hand repräsentiert“ nach Müller (1998), welche die Kategorie der ikonischen Gesten subklassifizieren. Für den letzteren Darstellungsmodus, bei dem die Hand gesamthaft ein Objekt verkörpert, gibt es für den von uns betrachteten Typ von Nominalgruppe keinen Beleg im zugrundeliegenden Korpus

66 

 Ellen Fricke

(Fricke 2012, 230). Eine plausible Erklärung dafür ist, dass dieser Darstellungsmodus bezüglich der Möglichkeit, Eigenschaften darzustellen, sehr viel beschränkter ist. Hingegen weisen insbesondere die beiden erstgenannten Darstellungsweisen, bei denen die Hände einen zweidimensionalen Umriss zeichnen oder eine dreidimensionale flüchtige Skulptur modellieren, die für eine ikonische Darstellung beliebiger Objektqualitäten notwendige Flexibilität auf. (9) Ich will sonen [gestische Darstellungsweise] Tisch kaufen.

Abbildung 6 (Fricke 2012, 228) fasst unsere Analyse noch einmal zusammen: Unten in grau abgetragen ist das Kontinuum von Referenzfestlegung und Inhaltsfestlegung in Nominalgruppen nach Seiler (1978). Der Artikel son markiert genau den Wendepunkt zwischen beiden Bereichen. MULTIMODALE INTEGRATION (Qualitätsbestimmung)

Rektion (Genus)

Hauptnomen (HN) (Kernsubstantiv)

Wendepunkt (WP)

so/solch

solchson

Kataphorik / Katadeixis

Zeigegeste (Das Demonstratum ist eine Entität als indefinites Token eines definiten Types.)

Ikonische Geste Kategoriale Selektion

Referenzfestlegung Klasse/Individuum Extension

‒ die Hand modelliert ‒ die Hand zeichnet ‒ die Hand agiert (selten) ‒ *die Hand repräsentiert Inhaltsfestlegung

Kontinuum

Eigenschaft Intension

Abb. 6: Der Artikel son als multimodaler Integrationspunkt für Gesten in Nominalgruppen des Deutschen (Fricke 2012, 228)

Grammatik und Multimodalität 

 67

Kernsubstantiv und Wendepunkt sind durch eine Rektionsbeziehung miteinander verbunden. Auf der gestischen Ebene ist dem Bereich der Referenzfestlegung die Zeigegeste zugeordnet, dem Bereich der Inhaltsfestlegung die ikonische Geste. Diese können die vom Artikel son geforderte qualitative Beschreibung instanziieren. Son verweist kataphorisch auf die Position der Qualitätsbeschreibung zwischen Wendepunkt und Kernsubstantiv. Während das Demonstratum der Zeigegeste ein außersprachliches Objekt ist, das die geforderte Qualität exemplifiziert, sind qualitative Beschreibungen mittels ikonischer Gesten in die Nominalphrase integriert. Dies wird insbesondere dadurch deutlich, dass mittels son die ikonischen Gesten in Bezug auf die vier gestischen Darstellungsweisen nach Müller kategorial selegiert werden. Damit markiert der Artikel son nicht nur den Umschlagpunkt zwischen Inhaltsfestlegung und Referenzfestlegung im Seilerschen Kontinuum, sondern überdies einen weiteren Umschlagpunkt zwischen Monomodalität und Multimodalität und stellt einen syntaktischen Integrationspunkt für Gesten in Nominalgruppen dar. Man kann sich auf der Grundlage der bisherigen Ausführungen fragen, wie es dennoch möglich ist, dass son allein mit dem Kernsubstantiv eine Nominalgruppe bilden kann, ohne dass diese gestisch oder lautsprachlich erweitert wird. (10) Ich will sonen Tisch kaufen.

Für diesen Fall gibt es zahlreiche Korpusbelege (Fricke 2012). Wenn man nicht die Annahme aufgeben will, dass son obligatorisch eine qualitative Beschreibung fordert, dann kann innerhalb einer derart konstruierten Nominalgruppe die qualitative Beschreibung nur beim Kernsubstantiv selbst liegen. Wie kann aber durch das Kernsubstantiv eine intersubjektive Qualitätsbeschreibung geleistet werden? Eine mögliche Antwort lautet: über ein konventionalisiertes und damit intersubjektiv verfügbares mentales Bild. Dies ist eine Interpretation, die Sandig (1987) vorschlägt. Dieses konventionalisierte mentale Bild, nämlich der mit einer Wortform assoziierte Prototyp, kann wiederum durch eine ikonische Geste repräsentiert werden. Eine in Fricke (2012, 230 ff.) vorgestellte Pilotstudie unterstützt diese Interpretation. Fricke (2008, 2012, 247 ff., 2014 b) nennt derartige konzeptbezogene Gesten unter Rückgriff auf den Peirceschen Zeichenbegriff „interpretantenbezogene Gesten“ im Unterschied zu „objektbezogenen Gesten“, die auf das vom Sprecher intendierte Referenzobjekt bezogen sind. Mit der Unterscheidung zwischen objekt- und interpretantenbezogenen Gesten können wir die Beobachtung erklären, dass Gesten in ihren Formeigenschaften dem vom Sprecher intendierten Referenzobjekt widersprechen können. In den von Fricke (2012, 2014b) angeführten Beispielen wird beispielsweise auf einen rechteckigen Durchgang im Stella-Musical-Theater am Marlene-Dietrich-Platz in Berlin mit kreisförmigen Gesten (Wortform Loch) oder bogenförmigen Gesten (Wortform Tor) Bezug genommen. Dies liegt nicht daran, dass eine Form nicht korrekt erinnert wird, sondern es gibt Korpusbelege dafür, dass der Wechsel von einer interpretantenbezo-

68 

 Ellen Fricke

genen Geste hin zu einer objektbezogenen vom selben Sprecher innerhalb desselben Turn vollzogen werden kann. Während bei den verschiedenen lautsprachlichen Attributtypen die Kernsubstantivnähe sowohl ausdrucksseitig als auch inhaltsseitig intersubjektiv enkodiert ist, lässt sich bei redebegleitenden Gesten die „unterscheidende Sonderung der Eigenschaft von dem Gegenstand“ im Sinne von Wundt (1904 [1900], 286 f.) in einem prädifferenzierten Zustand beobachten. Es lassen sich die folgenden drei Hauptstadien unterscheiden (Fricke 2012, 253): 1. In durch den Artikel son eingeleiteten Nominalgruppen ohne gestische oder verbale attributive Erweiterung wird die von son geforderte qualitative Beschreibung allein durch den mentalen, bildlichen Prototyp geleistet, welcher mit der Wortform des Kernsubstantivs assoziiert ist. 2. Eine ikonische Geste liefert ein intersubjektiv wahrnehmbares „Bild“ des mit dem Kernsubstantiv der Nominalgruppe assoziierten Prototyps (Interpretantenbezug), welches vom Adressaten als qualitative Beschreibung einer Eigenschaft des durch das Kernsubstantiv bezeichneten Referenten interpretiert werden kann (Objektbezug). 3. Eine ikonische Geste bezieht sich auf das vom Sprecher intendierte Referenzobjekt und wird ebenso vom Adressaten als objektbezogen interpretiert. Die Extension des durch das Kernsubstantiv Bezeichneten wird durch die Geste eingeschränkt. In den Gesten mit potentieller Attributfunktion zum Kernsubstantiv manifestiert sich damit ein weiteres Prinzip, welches auch auf der lautsprachlichen Ebene gegeben ist, nämlich die Unterscheidung zwischen intensionaler und extensionaler Determination (Zifonun u. a. 1997, 1998 f.). Attribute in Nominalgruppen unterscheiden sich darin, ob sie primär die Extension des durch das Kernsubstantiv Bezeichneten einschränken, und zwar unabhängig von dessen Bedeutung, oder ob sie bei der Modifikation auf die Bedeutung des Kernsubstantivs zurückgreifen müssen. Wenn wir auf der morphosyntaktischen Ebene potentielle gestische Attribute mit verbalen Attributen vergleichen, dann sind verbale Instanziierungen der attributiven Funktion, auch wenn es sich um Adjektive handelt, von denen behauptet wird, dass sie von allen Attributtypen mit dem Kernsubstantiv am engsten verbunden seien, als vollständige Zeichen immer schon vom Kernsubstantiv abgelöst. Dennoch ist auch bei den verbalen Attributen Substantivnähe bzw. -ferne enkodiert. Beginnen wir mit der Formseite: Auf der verbalen Ebene beruht die stärkste Ausprägung der Substantivnähe auf der Kongruenz und Rektion von Flexionsmerkmalen zwischen Kernsubstantiv und der Kategorie in Attributfunktion. Wir können grundsätzlich zwischen kongruierenden (z. B. Adjektivattribut) und nicht-kongruierenden Attributen (z. B. präpositionales Attribut) unterscheiden. Eine Differenzierung ergibt sich zum einen nach der Stellung vor oder nach dem Kernsubstantiv (Prä- und Postposition) und zum anderen nach der Nähe und Ferne zum Kernsubstantiv. Dabei sind im Deutschen die kongruierenden

Grammatik und Multimodalität 

 69

Attribute in der Regel vor dem Kernsubstantiv anzutreffen, d. h. der Bereich vor dem Kernsubstantiv ist der Bereich der stärksten morphosyntaktischen Integration. Auf der gestischen Ebene gibt es keinen mit der morphosyntaktischen Integration vergleichbaren Grad der Integrierbarkeit gestischer Formen in Nominalgruppen. Dies ist schon allein durch ihre Medialität nicht möglich, denn wie sollte beispielsweise Kongruenz zwischen lautsprachlichen und gestischen Einheiten hergestellt werden? Wir können daher für Nominalgruppen folgende Arten der syntaktischen Integrierbarkeit unterscheiden (vgl. Fricke 2012, 252): 1. Positionelle Integration: a) redeersetzend: Gesten können in einem lautsprachlichen Paradigma verbale Ausdrücke ersetzen, indem sie eine syntaktische Lücke füllen, und dadurch zeitlich linear integriert werden. Der ersetzende Integrationstyp gilt sowohl für emblematische als auch für redebegleitende Gesten. Ein Beispiel für ersetzende Integration wäre eine abqualifizierende Wegwisch-Geste in der Äußerung dieser […] Typ; b) zeitlich simultan: Dadurch, dass Gesten meist zeitlich simultan mit dem Kernsubstantiv geäußert werden, wird das Kernsubstantiv über die zeitliche Überlappung als lautsprachliche Bezugsgröße identifiziert. 2. Kataphorische Integration: Durch den Artikel son werden qualitative Beschreibungen determiniert, die auch gestisch instanziiert werden können. Der Artikel son wiederum wird vom Kernsubstantiv der Nominalgruppe regiert. Damit sind durch son integrierte Gesten vergleichbar den verbalen Attributen syntaktisch an das Kernsubstantiv der Nominalgruppe gebunden, wenn auch nur mittelbar. 3. Kategoriale Selektion: Induziert durch Ausdrücke der lautsprachlichen Ebene werden bei den redebegleitenden Gesten bestimmte Subkategorien selegiert. In unserem Beispiel werden durch das qualitative Deiktikon son im Bereich der ikonischen Gesten bestimmte gestische Darstellungsweisen wie z. B. „die Hand zeichnet“ oder „die Hand modelliert“ als Subkategorien selegiert. Eine fünfte Form der Integration, die wir in diesem Beitrag nicht behandeln, sind Fälle, in denen umgekehrt Gesten als Bezugsgrößen für lautsprachliche Äußerungseinheiten, z. B. verbale Paraphrasen, fungieren (siehe dazu Fricke 2012, 200 f.). Ebenfalls nicht angeführt ist der klassische Bereich der Deixis in definiten Nominalgruppen, bei denen das Vorliegen einer begleitenden Zeigegeste eine Bedingung dafür ist, mit einem bestimmten Deiktikon oder einem deiktisch gebrauchten Ausdruck erfolgreich referieren zu können (für einen wissenschaftsgeschichtlichen Überblick siehe Fricke 2007 und 2014c).

70 

 Ellen Fricke

6 Perspektiven einer multimodalen Sprachbe­ schreibung: Warum wir den bisherigen gramma­ tischen Gegenstandsbereich erweitern müssen “Verbal and nonverbal activity is a unified whole, and theory and methodology should be organized or created to treat it as such” (Pike 1967, 26). Folgt man diesem Postulat und der in diesem Beitrag vorgestellten Argumentation, dann sind sprachliche Äußerungen als Ganzheit zu betrachten und einer zeichenmaterieneutralen Analyse zu unterziehen, deren Kategorien nicht von der Lautsubstanz her definiert werden können. Zugleich sind in einem weiteren Schritt die medienspezifischen Möglichkeiten und Beschränkungen der beteiligten Medien im Hinblick auf die Strukturen und Funktionen der Gesamtäußerung zu erfassen. Dies gilt nicht nur wie in diesem Beitrag aufgezeigt für einen generativen oder einen strukturalistisch-funktionalen Ansatz wie den von Eisenberg, sondern grundsätzlich auch für konstruktionsgrammatische Ansätze (für einen Überblick siehe Ziem/Lasch 2013). Fasst man durch den Artikel son eingeleitete Nominalgruppen des Deutschen als Konstruktionen auf, dann können unter Anwendung des Analogieprinzips (siehe dazu den Vorschlag Schneiders in diesem Band) Gesten in Nominalgruppen als Attribut fungieren und das Kernsubstantiv modifizieren. Grundsätzlich wäre dann auch in der Konstruktionsgrammatik gleich welcher Prägung von der Möglichkeit multimodaler Konstruktionen auszugehen. Die Notwendigkeit, in der linguistischen Theoriebildung insgesamt die jeweiligen sprachlich-medialen Voraussetzungen zu reflektieren (siehe dazu ebenfalls Schneider in diesem Band; Stetter 2005; Schneider 2008), betrifft insbesondere die einem konventionalisierten Zeichen vorgängigen Prozesse der Typisierung und Semantisierung, die bisher auch in der Konstruktionsgrammatik kaum beachtet wurden. Wann kann man überhaupt von einer sprachlichen Einheit sprechen? Handelt es sich bei den in Abschnitt 3 vorgestellten submorphematischen gestischen (G-Form + PLOH) und lautsprachlichen (smog: smoke + fog) Kontamina­tionen um Konstruktionen zweier submorphematischer Einheiten? Wird diese Frage bejaht, dann kommt der Neubewertung der Ikonizität grammatischer Strukturen, wie sie bereits Jakobson (1964, 217) gefordert hat, ein besonderer Stellenwert zu (siehe auch Posner 1980). Saussure (1967, 158 f.) unterscheidet typologisch zwischen „lexikologischen Sprachen“, bei denen diagrammatisch ikonische Strukturen minimal, und „grammatischen Sprachen“, bei denen sie maximal sind. Dieser Gedanke könnte sich auch für konstruktionsgrammatische Ansätze in der Bewertung des Regelbegriffs als zielführend erweisen. Wie in Fricke (2010, 2012) und oben in Abschnitt 2 gezeigt, manifestieren sich diagrammatisch ikonische Strukturen im Deutschen nicht nur auf der lautsprachlichen, sondern auch auf der gestischen Ebene. Als ähnlich vielversprechend könnte sich für die Systematisierung von Typisierungs- und Semantisierungsprozessen die theoretische Integration des Exemplifi-

Grammatik und Multimodalität 

 71

kationsbegriffs und des Type-Token-Konzepts in Anlehnung an Goodman erweisen (Stetter 2005), deren Stellenwert für die Konstruktionsgrammatik von Schneider (in diesem Band) sehr prägnant herausgearbeitet wurde. In Ansätzen ist dies auch für redebegleitende Gesten in Fricke (2012) und Lücking (2013) geschehen, aber das diesen beiden Konzepten innewohnende Potential für eine sprachwissenschaftliche Multimodalitätsforschung wurde bei weitem noch nicht ausgeschöpft. Betrachtet man Phraseologismen, denen für den Disput um den Regelbegriff ein besonderer Stellenwert zukommt (siehe Schneider in diesem Band), dann sei aus der Perspektive einer sprachwissenschaftlichen Multimodalitätsforschung Folgendes angemerkt: In der multimodalen Metaphernforschung (siehe insbesondere Müller 2008) wurde gezeigt, dass der Quellbereich scheinbar „toter“ Metaphern gestisch aktiviert werden kann. Dies bedeutet, dass die Gesamtbedeutung und die Bedeutungen der einzelnen Konstituenten eines Phraseologismus gleichzeitig mit derselben Äußerung intersubjektiv präsent sein können. Umgekehrt eröffnen gerade redebegleitende Gesten – was immer wieder als ihre besondere Leistung herausgestellt wird (McNeill 1992) – den Zugang zu einer holistischen nicht-kompositionellen Gesamtbedeutung einer sprachlichen Äußerung. Entscheidend ist nun, dass sowohl gestische als auch lautsprachliche Äußerungsbestandteile intersubjektiv beobachtbar sind. Sie fallen beide unter dasjenige, was Stetter (2005, 212) die sprachwissenschaftliche „Dokumentation einer Performanz“ nennt. Wenn wir, wie Stetter es einfordert – und ich schließe mich dem an –, zwischen der Repräsentation der Anwendung einer Kompetenz und der Repräsentation der Kompetenz selbst strikt unterscheiden, dann entgehen wir einem Verdopplungsproblem, das sowohl für die Generative Grammatik als auch für die Konstruktionsgrammatik charakteristisch ist. Neuropsychische Systeme als die das Sprechen erzeugende Instanz sind dann nicht Gegenstand der Linguistik, sondern der Gegenstand der Neurologie und Psychologie und müssen mit den diesen Disziplinen jeweils eigenen Theorien und Methoden beschrieben werden (Stetter 2005, 216). Müssen wir deshalb vollständig auf Konzepte der kognitiven Linguistik verzichten? Nein, innerhalb einer multimodalen Sprachbetrachtung müssen wir dies nicht. Wenn es sich so verhält, dass bildlich-analoge Konzepte wie etwa mentale Prototypen sich mit Wortformen verbinden (siehe Abschnitt 5), dann sind diese, wie wir gezeigt haben, über phänomenorientierte Untersuchungen im Rahmen einer multimodalen Grammatik erschließbar. Hier ergeben sich neue Perspektiven für die Semantik allgemein und die Prototypensemantik im Besonderen. Zugleich hätte man damit auch für eine kognitive Linguistik die von Stetter angemahnte phänomenologische Fundierung. Löst man sich von dem von Stetter beschriebenen Verdopplungsproblem, dann kann man nicht nur in Bezug auf Annahmen der Generativen Grammatik immanent argumentieren, ohne sich einer Universalgrammatik verpflichtet zu sehen, wie dies in Abschnitt 4 erfolgt ist, sondern kann auch die Möglichkeit der Zuschreibung von

72 

 Ellen Fricke

rekursiven Konstituentenstrukturen dafür nutzen, um Unterschiede zu Sprache-BildRelationen und Gebärdensprachen herauszuarbeiten. Da redebegleitende Gesten sowohl gegenüber Bildern als Artefakten als auch gegenüber der Schrift ontogenetisch und phylogenetisch primär sind, ergeben sich auf der Grundlage einer multimodalen Grammatik des Sprechens und der Sprache zum einen neue Perspektiven für die Bildwissenschaft und ihren Gegenstand, das Bild. Mit dem Nachweis, dass ikonischen redebegleitenden Gesten rekursive Konstituentenstrukturen zugewiesen werden können, ist die These widerlegt, dass Gesten als „Bilder in Bewegung“ im Sinne Goodman (1981 [1968]) syntaktisch dicht sind. Ausgehend von diesem Sachverhalt kann man neu über die Möglichkeit einer Bildgrammatik nachdenken, deren Ergebnisse wiederum in eine multimodale Grammatik eingehen können. Zum anderen folgt aus der Sprachlichkeit redebegleitender Gesten, dass diese als weitere potentielle Quelle für Formen der Schriftlichkeit und Schriftentwicklung zu berücksichtigen sind. In Bezug auf die Gebärdensprachen der Gehörlosen (siehe dazu Fehrmann in diesem Band) folgt aus der Konstituenz und Rekursivität redebegleitender Gesten, dass das Kendonsche Kontinuum der Gebärden (McNeill 1992) zu revidieren ist (Fricke 2012, 116 ff.). Redebegleitende Gesten und Gebärdensprachen bilden demzufolge nicht die beiden extremen Pole einer linear angeordneten Skala, sondern redebegleitende Gesten weisen als Bestandteil multimodaler Äußerungen, obwohl sie nicht vollständig lexikalisiert sind, eine größere Nähe zu Gebärdensprachen auf als konventionalisierte emblematische Gesten mit ihren stabilen Form-Bedeutungsbeziehungen ohne syntaktische Strukturen. Denn auch für das Kendonsche Kontinuum gilt unser eingangs genanntes Postulat: Wir können nur gebärdensprachliche Gesamtäußerungen einer Einzelsprache mit multimodalen Gesamtäußerungen einer anderen Einzelsprache vergleichen und erst dann in einem weiteren Schritt den Gestenbestandteil separat betrachten. Zum Abschluss der möglicherweise zentrale Beitrag, den eine multimodale Perspektive auf Grammatik zu leisten vermag: Ein multimodaler Ansatz in Theorie und Empirie erlaubt und erfordert es, immer wieder Distanz zum Gegenstandsbereich zu gewinnen sowie gewohnte, bisher unhinterfragte Betrachtungsweisen, Kategorisierungen und Modelle zu überprüfen und sich  – jenseits der Verteidigung von Glaubenssätzen, die in der Wissenschaft keinen Platz haben sollten – einer Freiheit des Perspektivenwechsels und damit neuen Erkenntnismöglichkeiten zu öffnen.

7 Literatur Bolinger, Dwight L. (1975 [1968]): Aspects of Language. New York. Bressem, Jana (2012): Repetitions in Gesture: Structures, Functions, and Cognitive Aspects. Frankfurt (Oder) (Dissertation, Europa-Universität Viadrina).

Grammatik und Multimodalität 

 73

Bressem, Jana/Silva H. Ladewig (2011): Rethinking gesture phases: articulatory features of gestural movement? In: Semiotica 184, 53–91. Bühler, Karl (1982 [1934]): Sprachtheorie. Die Darstellungsfunktion der Sprache. Stuttgart/New York. Calbris, Geneviève (1990): The Semiotics of French Gestures. Bloomington. Calbris, Geneviève (2011): Elements of Meaning in Gesture. Amsterdam/Philadelphia. Cienki, Alan (2008): Why study metaphor and gesture? In: Alan Cienki/Cornelia Müller (Hg.): Metaphor and Gesture. Amsterdam/New York, 5–24. Cienki, Alan/Cornelia Müller (Hg.) (2008): Metaphor and Gesture. Amsterdam/New York. Corballis, Michael C. (2007): The uniqueness of human recursive thinking. In: American Scientist 95, 240–248. Ehlich, Konrad (1987): so – Überlegungen zum Verhältnis sprachlicher Formen und sprachlichen Handelns, allgemein und an einem widerspenstigen Beispiel. In: Inger Rosengren (Hg.): Sprache und Pragmatik. Lunder Symposium 1986. Stockholm, 279–313. Eisenberg, Peter (1999): Grundriss der deutschen Grammatik. Band. 2: Der Satz. Stuttgart/Weimar. Eisenberg, Peter (2006): Grundriss der deutschen Grammatik. Band. 2: Der Satz. 3., durchgesehene Auflage. Stuttgart/Weimar. Eisenberg, Peter (2013): Grundriss der deutschen Grammatik. Band. 2: Der Satz. 4., aktualisierte und überarbeitete Auflage. Stuttgart/Weimar. Everett, Daniel L. (2005): Cultural constraints on grammar and cognition in Pirahã. Another look at the design features of human language. In: Current Anthropology 46, 621–646. Firth, John Rupert (1957 [1935]): The use and distribution of certain English sounds. In: John Rupert Firth (Hg.): Papers in Linguistics 1934–1951. London, 34–46. Fitch, W. Tecumseh (2010): Three meanings of „recursion“: key distinctions for biolinguistics. In: Richard K. Larson/Viviane Déprez/Hiroko Yamakido (Hg.): The Evolution of Human Language. Cambridge, 73–90. Fricke, Ellen (2007): Origo, Geste und Raum: Lokaldeixis im Deutschen. Berlin/New York. Fricke, Ellen (2008): Grundlagen einer multimodalen Grammatik: Syntaktische Strukturen und Funktionen. Frankfurt (Oder) (Habilitation, Europa-Universität Viadrina). Fricke, Ellen (2010): Phonaestheme, Kinaestheme und multimodale Grammatik. In: Sprache und Literatur 41, 69–88. Fricke, Ellen (2012): Grammatik multimodal: Wie Wörter und Gesten zusammenwirken. Berlin/Boston. Fricke, Ellen (2013): Towards a unified grammar of gesture and speech: a multimodal approach. In: Cornelia Müller u. a. (Hg.): Body – Language – Communication. An International Handbook on Multimodality in Human Interaction. Band 1. Berlin/Boston (Handbooks of Linguistics and Communication Science, 38.1), 733–754. Fricke, Ellen (2014a): Kinesthemes: morphological complexity in co-speech gestures. In: Cornelia Müller u. a. (Hg.): Body – Language – Communication. An International Handbook on Multimodality in Human Interaction. Band 2. Berlin/Boston (Handbooks of Linguistics and Communication Science, 38.2), 1618–1630. Fricke, Ellen (2014b): Between reference and meaning: object-related and interpretant-related gestures in face-to-face interaction. In: Cornelia Müller u. a. (Hg.): Body – Language – Communication. An International Handbook on Multimodality in Human Interaction. Band 2. Berlin/Boston (Handbooks of Linguistics and Communication Science, 38.2), 1788–1802. Fricke, Ellen (2014c): Deixis, gesture, and embodiment from a linguistic point of view. In: Cornelia Müller u. a. (Hg.): Body – Language – Communication. An International Handbook on Multimodality in Human Interaction. Band 2. Berlin/Boston (Handbooks of Linguistics and Communication Science, 38.2), 1803–1823. Fricke, Ellen/Jana Bressem/Cornelia Müller (2014): Gesture families and gestural fields. In: Cornelia Müller u. a. (Hg.): Body – Language – Communication. An International Handbook

74 

 Ellen Fricke

on Multimodality in Human Interaction. Band 2. Berlin/Boston (Handbooks of Linguistics and Communication Science, 38.2), 1630–1640. Goodman, Nelson (1981 [1968]): Languages of Art. An Approach to a Theory of Symbols. London. – (Goodman 1976). Harrison, Simon (2008): The expression of negation through grammar and gesture. In: Jordan Zlatev u. a. (Hg.): Studies in Language and Cognition. Newcastle upon Tyne, 405–409. Harrison, Simon (2009): Grammar, Gesture, and Cognition: The Case of Negation in English. Bordeaux (Dissertation, Université Bordeaux). Harweg, Roland (1990): Studien zur Deixis. Bochum. Hauser, Marc D./Noam Chomsky/W. Tecumseh Fitch (2002): The faculty of language: what is it, who has it, and how did it evolve? In: Science 298 (4), 1569–1579. Haviland, John B. (2003): How to point in Zinacantán. In: Sotaro Kita (Hg.): Pointing: Where Language, Culture, and Cognition Meet. Mahwah, NJ., 139–169. Herbermann, Clemens Peter (1988): Modi referentiae. Studien zum sprachlichen Bezug zur Wirklichkeit. Heidelberg. Hjelmslev, Louis (1969 [1943]): Prolegomena to a Theory of Language. Madison. Hole, Daniel/Gerson Klumpp (2000): Definite type and indefinite token: the article son in colloquial German. In: Linguistische Berichte 182, 231–244. Jakobson, Roman (1964): On visual and auditory signs. In: Phonetica 11, 216–220. Jewitt, Carey (Hg.) (2009): The Routledge Handbook of Multimodal Analysis. London/New York. Karlsson, Fred (2010): Syntactic recursion and iteration. In: Harry van der Hulst (Hg.): Recursion and Human Language. Berlin/New York, 43–67. Kendon, Adam (1972): Some relationships between body motion and speech. An analysis of an example. In: Aron W. Siegman/Benjamin Pope (Hg.): Studies in Dyadic Communication. New York, 177–210. Kendon, Adam (1980): Gesticulation and speech: two aspects of the process of utterance. In: Mary R. Key (Hg.): The Relationship of Verbal and Nonverbal Communication. Den Haag, 207–227. Kendon, Adam (2004): Gesture: Visible Action as Utterance. Cambridge. Kendon, Adam/Laura Versante (2003): Pointing by hand in ‚Neapolitan‘. In: Sotaro Kita (Hg.): Pointing: Where Language, Culture, and Cognition Meet. Mahwah, NJ., 109–137. Kinsella, Anna (2010): Was recursion the key step in the evolution of the human language faculty? In: Harry van der Hulst (Hg.): Recursion and Human Language. Berlin/New York, 179–191. Kita, Sotaro/Ingeborg van Gijn/Harry van der Hulst (1998): Movement phases in signs and co-speech gestures, and their transcription by human encoders. In: Ipke Wachsmuth/Martin Fröhlich (Hg.): Gesture and Sign Language in Human-Computer Interaction. Berlin, 23–35. Krämer, Sybille (1998): Das Medium als Spur und Apparat. In: Sybille Krämer (Hg.): Medien, Computer, Realität: Wirklichkeitsvorstellungen und Neue Medien. Frankfurt a. M., 73–94. Kress, Gunther (2011): What is mode? In: Carey Jewitt (Hg.): The Routledge Handbook of Multimodal Analysis. London/New York, 54–67. Kress, Gunther/Theo van Leeuwen (2006 [1996]): Reading Images. The Grammar of Visual Design. London/New York. Ladewig, Silva H. (2010): Beschreiben, suchen und auffordern. Varianten einer rekurrenten Geste. In: Sprache und Literatur 41 (1), 89–111. Ladewig, Silva H. (2011): Syntactic and Semantic Integration of Gestures into Speech: Structural, Cognitive, and Conceptual Aspects. Frankfurt (Oder) (Dissertation, Europa-Universität Viadrina). Lakoff, George/Mark Johnson (1980): Metaphors We Live By. Chicago/London. Lobina, David J. (2011): „A running back“ and forth: a review of recursion and human language. In: Biolinguistics 5 (1–2), 151–169. http://www.biolinguistics.eu/index.php/biolinguistics/article/ view/198 [17.12.2014].

Grammatik und Multimodalität 

 75

Loehr, Daniel P. (2004): Gesture and Intonation. Washington, D. C. (Dissertation, Georgetown University). Lücking, Andy (2013): Ikonische Gesten. Grundzüge einer linguistischen Theorie. Berlin/Boston. McClave, Evelyn Z. (1991): Intonation and Gestures. Washington, D. C. (Dissertation, Georgetown University). McNeill, David (1992): Hand and Mind: What Gestures Reveal about Thought. Chicago. McNeill, David (2005): Gesture and Thought. Chicago. Merten, Klaus (1999): Einführung in die Kommunikationswissenschaft. Band 1: Grundlagen der Kommunikationswissenschaft. Münster. Mittelberg, Irene (2006): Metaphor and Metonymy in Language and Gesture: Discourse Evidence for Multimodal Models of Grammar. Ithaca (Dissertation, Cornell University). Mittelberg, Irene (2008): Peircean semiotics meets conceptual metaphor: iconic modes in gestural representations of grammar. In: Alan Cienki/Cornelia Müller (Hg.): Metaphor and Gesture. Amsterdam/Philadelphia, 115–154. Mittelberg, Irene/Linda R. Waugh (2009): Metonymy first, metaphor second: a cognitive-semiotic approach to multimodal figures of speech in co-speech gesture. In: Charles Forceville/Eduardo Urios-Aparisi (Hg.): Multimodal Metaphor. Berlin/New York, 329–356. Müller, Cornelia (1998): Redebegleitende Gesten: Kulturgeschichte – Theorie – Sprachvergleich. Berlin. Müller, Cornelia (2004): Forms and uses of the palm up open hand: a case of a gesture family? In: Cornelia Müller/Roland Posner (Hg.): The Semantics and Pragmatics of Everyday Gestures. Proceedings of the Berlin Conference April 1998. Berlin, 233–256. Müller, Cornelia (2008): Metaphors Dead and Alive, Sleeping and Waking: A Dynamic View. Chicago. Müller, Cornelia (2010): Wie Gesten bedeuten. Eine kognitiv-linguistische und sequenzanalytische Perspektive. In: Sprache und Literatur 41 (1), 37–68. Müller, Cornelia u. a. (Hg.) (2013): Body – Language – Communication. An International Handbook on Multimodality in Human Interaction. Band 1. Berlin/Boston (Handbooks of Linguistics and Communication Science, 38.1). Müller, Cornelia u. a. (Hg.) (2014): Body – Language – Communication. An International Handbook on Multimodality in Human Interaction. Band 2. Berlin/Boston (Handbooks of Linguistics and Communication Science, 38.2). Peirce, Charles Sanders (1931–58): Collected papers. In: Charles Hawthorne/Paul Weiss (Hg.): Band 1–6; Arthur W. Burks (Hg.): Band 7–8. Cambridge. Pike, Kenneth L. (1967): Language in Relation to a Unified Theory of the Structure of Human Behavior. Den Haag. Posner, Roland (1980): Ikonismus in der Syntax. Zur natürlichen Stellung der Attribute. In: Zeitschrift für Semiotik 2 (1–2), 67–82. Posner, Roland (1986): Zur Systematik der Beschreibung verbaler und non-verbaler Kommunikation. In: Hans-Georg Bosshardt (Hg.): Perspektiven auf Sprache: Interdisziplinäre Beiträge zum Gedenken an Hans Hörmann. Berlin/New York, 267–313. Sandig, Barbara (1987): Kontextualisierungshinweise: Verwendungen von so beim sprachlichen Handeln. In: Inger Rosengren (Hg.): Sprache und Pragmatik. Lunder Symposium 1986. Stockholm, 327–333. Sauerland, Uli/Andreas Trotzke (2011): Biolinguistic perspectives on recursion: introduction to the special issue. In: Biolinguistics 5 (1–2), 1–9. http://www.biolinguistics.eu/index.php/ biolinguistics/article/view/201/210 [17.12.2014]. Saussure, Ferdinand de (1967): Grundfragen der allgemeinen Sprachwissenschaft. Berlin.

76 

 Ellen Fricke

Schegloff, Emanuel A. (1984): On some gestures’ relation to talk. In: J. Maxwell Atkinson/John Heritage (Hg.): Structures of Social Action: Studies in Conversational Analysis. Cambridge, 266–296. Schneider, Jan Georg (2008): Spielräume der Medialität. Linguistische Gegenstandskonstitution aus medientheoretischer und pragmatischer Perspektive. Berlin/New York. Schneider, Jan Georg/Hartmut Stöckl (2011): Medientheorien und Multimodalität. Ein TV-Werbespot – Sieben methodische Beschreibungsansätze. Köln. Seiler, Hansjakob (1978): Determination: a functional dimension for interlanguage comparison. In: Hansjakob Seiler (Hg.): Language Universals. Tübingen, 301–328. Stetter, Christian (2005): System und Performanz. Symboltheoretische Grundlagen von Medientheorie und Sprachwissenschaft. Weilerswist. Stöckl, Hartmut (2004): In between modes: language and image in printed media. In: Eija Ventola/ Cassily Charles/Martin Kaltenbacher (Hg.): Perspectives on Multimodality. Amsterdam, 9–30. Streeck, Jürgen (2002): Grammars, words, and embodied meanings: on the uses and evolution of so and like. In: Journal of Communication 52 (3), 581–596. Streeck, Jürgen (2009): Gesturecraft. The Manu-Facture of Meaning. Amsterdam/Philadelphia. Stukenbrock, Anja (2010): Überlegungen zu einem multimodalen Verständnis der gesprochenen Sprache am Beispiel deiktischer Verwendungsweisen des Ausdrucks so. In: InLiSt – Interaction and Linguistic Structures 47. http://www.inlist.uni-bayreuth.de/issues/47/InLiSt47.pdf [17.12.2014]. Stukenbrock, Anja (2015): Deixis in der face-to-face-Interaktion. Berlin/Boston. Van der Hulst, Harry (Hg.) (2010): Recursion and Human Language. Berlin/New York. Wundt, Wilhelm (1904 [1900]): Völkerpsychologie. Eine Untersuchung der Entwicklungsgesetze von Sprache, Mythus und Sitte. Band 1: Die Sprache. Leipzig. Zelinsky-Wibbelt, Cornelia (1983): Die semantische Belastung von submorphematischen Einheiten im Englischen: Eine empirisch-strukturelle Untersuchung. Frankfurt a. M. Ziem, Alexander/Alexander Lasch (2013): Konstruktionsgrammatik. Konzepte und Grundlagen gebrauchsbasierter Ansätze. Berlin/Boston. Zifonun, Gisela u. a. (1997): Grammatik der deutschen Sprache. 3 Bände. Berlin/New York. Zwart, Jan-Wouter (2011): Recursion in language: a layered-derivation approach. In: Biolinguistics 5 (1–2), 43–56.

Clemens Knobloch/Josephine Krüger

4. Zum Erwerb syntaktischer Konstruktionen Abstract: Unter einer syntaktischen Konstruktion verstehen wir die grammatikalisierte Abfolge mindestens zweier potentiell rhematischer Äußerungssegmente in einer Äußerung. Solche genuin syntaktischen (Proto-)Konstruktionen können durch die syntagmatische Verbindung zweier Monorheme (Werner/Kaplan 1963) oder durch die Flexibilisierung eines en bloc extrahierten und übernommenen Syntagmas entstehen. Unter Grammatikalisierung verstehen wir im Erwerbszusammenhang nicht den graduellen diachronen Übergang zwischen freien lexikalischen und gebundenen grammatischen Elementen, sondern den praktisch operativen Übergang zwischen grammatisch nicht strukturierten Ein- oder Mehrworteinheiten des kindlichen Sprechens (unanalysierten Konstruktionen oder präsyntaktischen Pivot-Kombinationen) und polyrhematischen Konstruktionen mit mindestens zwei nachweislich funktionsverschiedenen Slots und mindestens einer variabel besetzbaren Position. Die Ausbreitung und Generalisierung solcher Schemata geschieht über item-and-analogyDynamiken (Ninio 2005). Was die Strukturanalyse als Syntax (oder Morphosyntax) versteht, das ist prozessual das Ergebnis zweier gegenläufiger Prozesse: der bottomup-Automatisierung von extrahierten Formfolgen und der top-down-Schematisierung von item-based-constructions. Demonstriert werden die Hypothesen am Beispiel des Nominalphrasenerwerbs im Deutschen. 1 Forschungs- und Diskussionsstand 2 Definitions- und Methodenfragen 3 Allgemeine Befunde 4 Die Syntax der Nominalphrase im Erstspracherwerb 5 Zusammenfassung 6 Literatur

1 Forschungs- und Diskussionsstand Niemand zweifelt daran, dass der Erwerb einer natürlichen Sprache auf angeborenen Grundlagen beruht. Und niemand zweifelt daran, dass der Erwerb einer natürlichen Sprache ohne sozial-interaktiv formatierte Lernprozesse und kognitive Eigenleistung der Lernenden unmöglich ist. Starke nativistische Annahmen (angeborene Universalgrammatik, angeborene abstrakte Kategorien und Serialisierungsprinzipien), wie sie die Spracherwerbsforschung in den vergangenen 60 Jahren dominiert haben, sind schon darum heuristisch wenig sinnvoll, weil sie die Suche nach den einschlägigen sozial-kognitiven Lern- und Erwerbsdynamiken eher entbehrlich erscheinen lassen:

78 

 Clemens Knobloch/Josephine Krüger

Was für genetisch fixiert gilt, wird eo ipso indifferent gegenüber wechselnden Lernzugriffen. Was die ‚harten‘ Rahmendaten des Erwerbs syntaktischer Konstruktionen betrifft, so stehen die Dinge seit Stern/Stern (1928) einigermaßen fest: Mit etwa 1;0 beginnen Kinder mit so genannten Einwortäußerungen von erkennbar symbolischem Charakter. Terminologisch ziehen wir den Ausdruck Monorheme (nach dem Vorschlag von Werner/Kaplan 1963) vor, weil er bezüglich des Wortstatus der involvierten Zeichengebilde weniger impliziert und weil er hervorhebt, dass die fraglichen Einheiten ‚in einem Zug‘ artikuliert und intoniert sind. Vieles spricht dafür, dass die zur gleichen Zeit hervortretende Fähigkeit der ca. Einjährigen zur Koordination von Aufmerksamkeit auf externe Objekte mit anderen Personen (joint attention; Tomasello 2003) zugleich die zentrale Ressource und Triebkraft der Semantisierung der Lautproduktion bildet. Nachdem das Kind ca. sechs Monate lang (alle Zeitangaben sind großzügig und nicht überschneidungsfrei zu nehmen) überwiegend mit Monorhemen kommuniziert hat, beginnt mit den Zweiwortäußerungen die protosyntaktische Phase. In der Regel verfügt das Kind zur Zeit des Übergangs zu duorhematischen Äußerungen über etwa 50 bis 180 einfache Elemente. Die Variationsbreite ist relativ groß. Die häufig (im Anschluss an Martin Braines Arbeiten aus den 60er Jahren) auch als pivotKonstruktionen bezeichneten Syntagmen bestehen erstmals aus zwei funktionsverschiedenen Elementen, meist einem ‚Standbein‘ und einem ‚Spielbein‘ mit unterschiedlicher Reihung (Mama auch, Linda auch, Hund auch…vs. da Mieze, da machen, da aua…), aber oft auch aus zwei variablen Positionen (Linda Brezel, Mama Teller…) mit multiplen Deutungsoptionen. In der älteren Literatur, die den Beginn von Syntax überwiegend als das Zusammenwachsen ehedem getrennter Einwortäußerungen versteht, wird darauf verwiesen, dass die zwei Elemente intonatorisch selbständig sind. Vielfach stehen die ‚Standbein‘-Elemente in den pivot-Konstruktionen für empraktische oder deiktische Operatoren. Oft ist auch das eine der beiden funktionsverschiedenen Elemente eine Formel (dasə Mieze – für da ist die/eine). Mit den meist zwischen 2;0 und 3;0 beginnenden Dreiwortäußerungen werden nicht nur die syntaktischen Verhältnisse komplexer, sondern auch die grammatische Funktionsmorphologie wird angemessener und variabler. Montiert werden syntaktisch komplexere Äußerungen aus allen bis dahin verfügbaren Formaten (Linda auch das machen…besteht z. B. aus zwei pivot-Konstruktionen). Wie dabei das syntaktische Satzschema des Deutschen (mit Vorfeld, Satzklammer, Mittelfeld etc.) schrittweise als Raster etabliert wird, untersucht Tracy (1991). Komplementäre Erwerbsstile für frühe syntaktische Konstruktionen im Deutschen etabliert Kaltenbacher (1990) in ihrer Untersuchung: Sie unterscheidet zwischen „nominalem“, auf der Kombination getrennt erworbener Symbole beruhendem Stil (meist prosodisch nur schwach integriert) auf der einen, „pronominalem“, auf der Auslösung fester und halbfester Formeln beruhendem (prosodisch gut integriertem) Stil auf der anderen Seite. Für diese auch als ‚holistisch‘ bezeichnete Strategie sind en bloc übernommene Formeln charakteristisch, die nach und nach flexibilisiert werden (Tracy 2002 gibt das Beispiel takörtas für ‚da gehört das

Zum Erwerb syntaktischer Konstruktionen  

 79

(hin)‘). Kombinatorik freier Elemente und partielle Flexibilisierung holistischer Syntagmen definieren komplementäre Zugänge zum Erwerb syntaktischer Konstruktionen. Die Opposition ist darin idealtypisch zu verstehen, dass zwar beim Individuum oft die eine oder andere Strategie erkennbar dominiert, aber doch in der Regel auch Belege für die entgegengesetzte Strategie zu finden sind. Die Beobachtungen über Unterschiede in der intonatorischen Integration früher Syntagmen, auf die sich Kaltenbacher (1990) stützt, gehen (mindestens) zurück auf Werner/Kaplan (1963, 151 ff.). Tendenziell kann die intonatorische Einheit einer Äußerung oder eines Äußerungsteils als Indikator für die strukturelle Komplexität genommen werden, die Lerner auf bestimmten Entwicklungsstufen operativ ‚in einem Zuge‘ bewältigen können. Es besteht weitgehend Einigkeit darüber, dass die kindlichen Konstruktionen mit salienten, leicht auslösbaren und prominent platzierten Segmenten des Inputs beginnen, mit dem die Kinder konfrontiert sind (Peters 1983, 1986). Aus diesen salienten Input-Elementen werden die ersten kindlichen Monorheme, die dann pragmatische Werte der Äußerungen übernehmen, aus denen sie ausgelöst wurden. Frühe syntaktische Konstruktionen werden um diese salienten Elemente gleichsam herumgebaut, die selbst kategorial zu höchst unterschiedlichen grammatischen Klassen gehören können. Prosodisch prominent am Ende von Input-Äußerungen sind im Deutschen u. a. Verbpartikel und adverbiale Relatoren ((r)auf, runter, auch), infinite Verbformen (haben, machen), Deiktika (das, da), Substantive etc. Höchst strittig ist freilich die Interpretation dieser Befunde zwischen Nativisten, Interaktionisten und Kognitivisten unter den Spracherwerbsforschern. Insbesondere in der von Slobin (1985 ff.) begründeten sprachvergleichenden Erwerbsforschung haben sich anti-universalistische Traditionen herausgebildet, die Erwerbsdynamiken (nebst ihren Begleiterscheinungen für die kognitive Entwicklung der Individuen) stärker auf die Gegebenheiten der Einzelsprache beziehen. Trotz der kategorialen Indifferenz der Redesegmente, die zuerst als (oft performative) Monorheme dienen, kreist ein Großteil der Syntaxerwerbsforschung, getrieben sicher durch valenzgrammatische und andere verbozentrische Denktraditionen, um den Erwerb von Verben und den zugehörigen Argumentstrukturen. Beide, Verben und ihre Argumentstrukturen, gelten weithin als darstellungstechnische Modelle für die sprachliche Erfassung von Szenen in propositionalen Konstruktionen. Zu den wirkmächtigen Modellgedanken der vergangenen 20 Jahre gehört in diesem Zusammenhang die verb island-Hypothese, nach welcher frühe Verblexeme zunächst praktisch nur mit einer typischen kollokativen Umgebung (also ohne Generalisierung) gebraucht werden (Tomasello 2003, 117). Ihre Wirkung beruht wohl nicht zuletzt darauf, dass sie radikal in Frage stellt, eine syntaktische Kategorie Verb könne als angeboren wirksam mit all ihren syntaktischen Konsequenzen unterstellt werden. Der Modellgedanke der item-based constructions generalisiert diesen Leitgedanken über die adverbale Sphäre hinaus. Eine solche Konstruktion enthält (mindestens) ein lexikalisch spezifiziertes Element, zusammen mit einem oder mehreren (mehr oder weniger schematisch beschränkten) variablen Slot. Im Unterschied zu reinen pivot-

80 

 Clemens Knobloch/Josephine Krüger

Konstruktionen gelten item-based constructions als genuin syntaktische Formate, weil sie Elemente sprachlich geordneter syntaktischer Relationalität enthalten. Nach dem konkurrierenden Modell von Ninio (1999) erfolgt der kindliche Einstieg in abstraktere Strukturen adverbaler Argumentbeziehungen über so genannte pathbreaking verbs. Darunter werden Verben verstanden, welche den fraglichen Typ von Relationalität in abstrakter, reiner und generischer Form enthalten. Für ‚bahnbrechend‘ in dieser Hinsicht gelten vielfach hoch grammatikalisierte, auf dem (diachronen) Weg zum Hilfsverb weit vorgerückte hochfrequente Elemente (oft auch als light verbs bezeichnet; vgl. für eine Diskussion Lange 2007, 19 ff.). Ausgehend von einem solchen formalen Modellverb, so Ninio (1999), werden syntaktische Muster auf die Verblexeme generalisiert, die das entsprechende Merkmal ebenfalls enthalten. Gegenüber konkurrierenden Ansätzen, die z. B. Transitivität eher durch prototypische lexikalische Verben (wie schlagen, ärgern, treten) vermittelt sehen, besteht Ninio (1999) auf dem modellbildenden Charakter hochfrequenter grammatischer Konzepte wie want, do, give. Aus unserer Sicht muss der eine Effekt den anderen freilich nicht ausschließen. Wenn man – mit der konstruktionsgrammatischen Axiomatik – davon ausgeht, dass stärker lexikalische und stärker grammatische Vertreter der ‚gleichen‘ distributiven Kategorie auf einem analogischen Kontinuum miteinander verbunden sind, dann macht es keinen großen Unterschied, an welcher Stelle dieses Kontinuums der Lerner in die analogisch verbundenen Untergruppen einsteigt. Man gelangt als Lerner ebenso gut von grammatischen zu stärker lexikalischen Elementen der gleichen Kategorie wie umgekehrt. Langackers (2008) Modell, wonach wir es bei Konstruktionsbedeutungen grundsätzlich mit der Überlagerung von lexikalischen Prototypen und (durch analogische Ausweitung bedingten) Schemabedeutungen zu tun haben, wäre hier einschlägig. In diesem Beitrag konzentrieren wir uns, um nicht die reichhaltige Literatur zu Verb-, Satz- und Propositionsformaten resümieren und wiederholen zu müssen, auf den Erwerb von Konstruktionen, die in das Umfeld von Nomination, Referenz und Nominalphrase gehören. Strukturell differiert die Nominalphrase von Satz und Verbalphrase dadurch, dass die (modifizierende) syntaktische Relationalität hier nicht im Nukleus, sondern in der Peripherie der deiktischen und modifizierenden Satelliten institutionalisiert ist. Wohl unter dem Einfluss konstruktionsgrammatischer Denkmodelle, die eine Sonderrolle des Verbs gegenüber anderen Kategorien im Syntaxerwerb eher relativieren, breitet sich in der Erwerbsforschung die Ansicht aus, man könne alle Konstruktionsformate (auch syntaktische) als mehr oder minder abstrakte symbolische Strukturen auffassen. Das ist eine Abkehr von der lange dominierenden Auffassung, der Spracherwerb ließe sich sauber in die komplementären Bereiche Lexikonerwerb (= idiosynkratisch und semantisch) und Grammatikerwerb (= regelhaft und asemantisch) aufteilen. Vor diesem Hintergrund gehört das (kollokative) Konstruktionspotenzial von Lexemen ebenso zum Konstruktionserwerb wie die Eignung lexikalischer Einheiten für bestimmte Konstruktionsformate. Alle Konstruktionsformate gelten

Zum Erwerb syntaktischer Konstruktionen  

 81

tendenziell als Zeichenformate, und Konstruktionsschemata operieren nicht auf ab­strakten Symbolen, sondern auf konkreter beschränkten Distributionsklassen. Nicht erforderlich ist dann die Annahme allgemeiner syntaktischer Operationen, wie sie in der generativen Tradition üblich ist. Frageschemata z. B. nehmen ebenso von item-based frames ihren Ausgang wie andere Konstruktionen auch. Dabrovska (2000) dokumentiert ein Englisch sprechendes Kind, dessen Fragen überwiegend mit dem frame what xyz doing beschrieben werden können. Mit Recht werden aufgeklärte Saussureaner (die aus den Quellen des „Cours“ wissen, dass es einen echten Widerspruch zwischen System- und Gebrauchsorientierung bei Sprachzeichen nicht gibt) hier einwenden, dass Sprachzeichen, auf welcher Systemebene auch immer betrachtet, niemals „konkret“ sein können (vgl. hierzu auch Schneider in diesem Band). Vielmehr sei schon die Selbstidentität eines bilateralen Sprachzeichens, synchron wie diachron, eine höchst prekäre Annahme, für eine syntaktische Konstruktion mit variablen slots womöglich noch um einiges prekärer als für ein Minimalzeichen. Der Einwand lässt sich dadurch praktisch relativieren, dass die Erwerbsdynamiken partielle Äquivalenzen von Zeichen ganz praktisch erzeugen  – eben durch analogische Verwendung und metaphorische Expansion: gebrauchsbasiert. So gilt die Erwartung, dass syntaktische Konstruktionsformate (ebenso wie andere Konstruktionen) zunächst ihre eigenen, relativ konkreten slots, Leerstellen, Argumentrollen definieren, dass es also im Umfeld von keine Plätze für Subjekt und Objekt, Agens und Patiens, sondern für ‚Schläger‘ und ‚Geschlagener‘ gibt, deren unterschiedliche Markierung im Symbolfeld schrittweise gelernt wird. Unter Symbolfeld verstehen wir mit Bühler (1934) die Gesamtheit der Feldzeichen und formalisierten Symbolwerte, die das darstellungstechnische Verhältnis der Sprachzeichen in der Redekette organisieren. Generell gilt der (konstruktionsgrammatische) Grundsatz, grammatische Abstraktionen ‚tieferzulegen‘ und sie stärker in lexikalisch spezifiziertem ‚Material‘ zu verankern. Begrifflich höhere Aggregationen (vor allem relationale Begriffe wie Subjekt, Objekt etc.) werden allein der fachlichen Praxis der Grammatiker zugerechnet und gelten als irrelevant für die Sprecher. Wer eine konstruktionsgrammatische Brille trägt und den Syntaxerwerb demzufolge als schrittweisen Aufbau abstrakterer, durch multiplere links verbundener Netze von einander überlappenden Konstruktionen aus ‚konkreten‘ item-based constructions sieht (Diessel 2013), der sollte daraus auch die Konsequenz ziehen, dass Lerner in ein solches System grundsätzlich an allen Punkten und von allen Seiten ‚einsteigen‘ können (wenn auch wahrscheinlich nicht von allen Punkten gleich leicht). Das Competition Model von MacWhinney/Bates (1989) wäre möglicherweise geeignet, solche Verhältnisse zu beschreiben und zu modellieren. Alles, was mit abstrakten grammatischen Begriffen bezeichnet wird (einschließlich der elementaren Wortarten/Kategorien; vgl. Keibel 2007), kann psychologisch ‚real‘ bzw. operativ erst dann werden, wenn es nachweisliche ‚Entsprechungen‘ (wie immer man diese definieren mag) in der praktischen Redekompetenz aufweist. Um ein Beispiel zu geben:

82 

 Clemens Knobloch/Josephine Krüger

Wenn die Kategorie des Adjektivs syntaktisch definiert ist durch das Ensemble von attributiven, prädikativen und koprädikativen Verwendungen, dann hat sie nur eine solche ‚Entsprechung‘, wenn zahlreiche Lexeme in all diesen drei Konstruktionstypen variabel gebraucht werden, was in den Frühphasen des Spracherwerbs, wo es kaum ‚Adjektivkandidaten‘ gibt, die sowohl prädikativ als auch attributiv verwendet werden, offenbar nicht der Fall ist. Bildlich gesprochen bilden abstrakte syntaktische Begriffe nicht das Fundament des Syntaxerwerbs, sie bezeichnen günstigenfalls vielmehr asymptotische Ziel- und Endpunkte, auf die hin der Konstruktionserwerb in seiner Dynamik ausgerichtet ist, die er aber womöglich nie erreicht (vgl. Knobloch 2003).

2 Definitions- und Methodenfragen Es ist nicht ganz trivial, mit der Frage zu beginnen, was im Erwerbszusammenhang als ‚Syntax‘ bzw. als ‚syntaktische Konstruktion‘ gelten soll. Von entfalteter Syntax spricht man in der strukturalen Sprachwissenschaft vielfach erst bei kompletter Symbolfeldintegration der fraglichen Schemata auf der Ebene der morphosyntaktischen Form und der Reihenfolge der Konstituenten. Kombinatoriken ohne symbolfeldeigene Gestalt- und Schließungsnormen könnte man als protosyntaktisch oder synsemantisch bezeichnen. In diesem Zusammenhang hat die Erwerbsforschung ein doppeltes Problem: [a] Einmal ist es für die ganz überwiegend empraktisch und synattentional (in gemeinsame Handlungen und geteilte Aufmerksamkeitsräume) eingebetteten Routinen des kindlichen Sprechens charakteristisch, dass ihre Vollständigkeits- und Schließungsnormen eben nicht die des Symbolfeldes sind. Typisch sind vielmehr Feldkopplungen, in denen bereits aktivierte und ohne weiteres verfügbare Bezüge nicht eigens im Symbolfeld kodiert werden. Gesprächslinguisten machen übrigens durchaus ähnliche Erfahrungen mit der sprachlichen Interaktion erwachsener Sprecher, manche so sehr, dass sie den syntaktischen Grundbegriff des Satzes in der Analyse gesprochener Sprache für entbehrlich halten. In der Erwerbsforschung führt diese Konstellation vielfach zur Inflationierung der Diagnose ‚Ellipse‘, die aber verdunkelt, dass gerade die produktive Verschränkung von Symbol- und Zeigfeld für die Kindersprache charakteristisch ist. Wenn das Kind eine Puppe in der Hand hat und sagt dazu meine oder neue habe, dann hat es wenig Sinn zu konstatieren, der Nukleus zu meine oder neue sei ellipsiert, zumal die Input-Daten ganz genauso organisiert sind und eine Zählung des Korpus ergibt, dass mehr als ein Drittel der attributiv-flektiert gebrauchten Adjektive solchermaßen ohne sprachlich realisierten Nukleus sind. Was qua ‚Ellipse‘ wie ein Mangel aussieht, ist eine ganz gewöhnliche Konstruktionsoption. [b] Dann gilt aber auch, dass wir direkten Einblick in die operative online-Kon­ struktion von Syntagmen bei kleinen Kindern eben nur über die Abweichun­g­en von

Zum Erwerb syntaktischer Konstruktionen  

 83

‚erwachsenen‘ Gestaltschließungsnormen haben. Was vollständig der Symbolfeldnorm entspricht, das kann entweder normgemäß konstruiert oder aber auch en bloc imitiert und (wie man sagt) ‚unanalysiert‘ übernommen sein. Aufschlussreich für die Untersuchung der tatsächlich operativen Schemata sind aber gerade die Konstruktionen, die nicht restfrei dem System der Erwachsenensprache entsprechen. Wenn man (mit Karmiloff-Smith 1992) davon ausgeht, dass die syntaktische Kompetenz in mehreren Stufen aufgebaut wird, deren erste jeweils die begrenzte operative Beherrschung eines Schemas ist, das dann reanalysiert, flexibilisiert und auf eine abstraktere Stufe der Repräsentation gehoben wird, dann sind es gerade die Abweichungen von der syntaktischen Norm, die solche Reanalyse- und Reorganisationsprozesse für den Beobachter anzeigen: Was nicht der Input-Norm entspricht, das muss kognitiv konstruiert sein. Wenn aber sowohl die Feldverschränkung als auch die Abweichung bzw. stufenweise Umorganisation von Schemata heuristisch interessant und genretypisch für die Kindersprache sind, dann sollten sie eben nicht als Mängel oder Abzüge am System der Erwachsenensprache, sondern in eigenem Recht thematisiert werden. Wir halten es für eine fruchtbare und begründbare Annahme, dass die Ressourcen des lernenden Kindes für den Aufbau einer halbwegs autonomen syntaktischen Symbolfeldkompetenz aus dem stufenweisen Umbau feldübergreifender Symbolbezüge stammen. In der ‚Grammatisierung‘ des kindlichen Sprechens wird allmählich Funktionslast vom Handlungs- und Aufmerksam­keitsfeld umgelagert und umorganisiert auf das Feld der geordneten syntagmatischen Verkettung von Symbolen. In diesem Sinne bewegt sich das Kind von ‚oraten‘ Sprechroutinen, in denen die interpersonal-pragmatische Dimension dominiert, hin zu ‚literaten‘ Sprechweisen, in denen sprachliche Formen im Hinblick auf die genaue Darstellung der Inhalte optimiert und nach Symbolfeldnormen komponiert und schematisch geschlossen werden (Maas 2010, 26 ff.). Tomasello (2003, 115) schlägt ein ähnlich auf Übergänge fokussiertes Denkmodell vor, wenn er definiert, dass pivot-Konstruktionen zwar schon über erste spracheigene Ordnungsschemata verfügen, aber noch nicht über Syntax, von der man vielmehr erst dann ausgehen solle, wenn das Kind nachweislich syntaktische Symbole, d. h. über ihre Relationen im Symbolfeld der Redekette definierte Zeichen, produktiv verwendet oder über abstrakte syntaktische Rollen verfügt. Nach Tomasellos (2003, 118 ff.) These entwickelt sich Syntax zunächst um spezifische lexikalische items herum, bevor sie auf konstruktional verwandte (d. h. durch analogische Expansion auf die Ausgangselemente bezogene) item-Klassen ausgeweitet (und somit abstrakter) wird. Sehr viel Forschung ist in diesem Zusammenhang auf den Erwerb abstrakter adverbaler Strukturmuster, vor allem von Transitivität, verausgabt worden. Wahrscheinlich liegt man nicht ganz falsch, wenn man die ersten als kombinatorisch imponierenden ‚zweizügigen‘ Äußerungen auch mit einem doppelten Zugriff auf die laufende Handlungskoordination in Verbindung bringt. Tomasello (2007, 27 f.) spricht in diesem Zusammenhang auch vom Versuch der Segmentierung einer Intention. Wenn typische performative Monorheme wie Arm! für die Intention, hochge-

84 

 Clemens Knobloch/Josephine Krüger

nommen zu werden, erweitert werden zu Mama Arm, dann haben wir es sicher noch nicht mit einem Gebilde zu tun, das auf der Symbolfeldebene integriert wäre, wohl aber mit einer spezifizierten Intention. Echte Symbolfeldsyntax ist aber wohl erst da zu konstatieren, wo die Teile der Äußerung sich nicht nur performativ integrieren, sondern wirklich propositional. Und das setzt voraus, dass empraktisches Sprechen zugunsten von ‚Referenz-und-Prädikation‘-Formaten zurückgedrängt wird. Wörter im syntaktischen Sinne sind, so gesehen, erst ein Produkt der Etablierung von (mehr oder weniger reintönigen) Symbolfeldbeziehungen in der propositionalen Ebene des Sprechens, was bei Werner/Kaplan (1963) so formuliert wird: Thus, the vocable becomes more a word the more it partakes in a specific (syntactic) structure designed for complex referential expression. Correlatively, the complex referential expression becomes more and more a sentence as its constituent vocables are modulated to reflect their distinct (grammatical-categorial) roles in the total structure. (Werner/Kaplan 1963, 154)

Auf einer ganz anderen lerntheoretischen Linie liegt der Erwerb subrhematischer (und vorwiegend grammatischer) Formregularitäten in Konstruktionen, wie Flexionsendungen, Artikelformen etc. In ihnen verdichten sich zunächst weder Intentionen noch Situationsbezüge. Flexivische Kategorien wie ‚Plural‘ und ‚Tempus‘ werden möglicherweise früh intentional gewählt, aber weitgehend mechanisch ausgeführt, während etwa die Kongruenz zwischen Artikel, attributivem Adjektiv und Substantiv immer auf unbewussten Routinen beruht. Da es sich hier vorwiegend um unbetonte Silben handelt, findet man in der Erwerbsliteratur sehr häufig die Bemerkung, dass Kinder vielfach früh damit anfangen, die Positionen dieser Silben mit undifferenziertem lautlichem Material zu besetzen (Artikelpositionen etwa mit də und ə(n)). Solche Phänomene gehören durchweg zu Kaltenbachers (1990) ‚pronominaler‘ Lernstrategie. Wie und ob diese Positionen freilich darstellungstechnisch (oder sonst wie funktional) relevant werden, ist nicht leicht auszumachen. Karmiloff-Smith (1979, 15) hat schon vor langer Zeit notiert, dass die Ebene der sprachlichen Form für das Kind einen eigenständigen kognitiven Problemraum bildet und dass man selbst dann, wenn Kinder anfangen, grammatische Morphologie konsistent zu verwenden, noch lange nicht weiß, was die Ratio dieser formalen Integration von Konstruktionen bildet. Sie kann darin bestehen, dass das Kind seine eigene Orientierung in weitgehend automatisierten Formabfolgen verbessert, und sie kann darin bestehen, dass das Kind zusätzliche distinktive ‚Marken‘ in synsemantisch unklaren oder uneindeutigen Positionen anbringt. Ein rein kommunikativ-funktionaler Erklärungsansatz wird hier immer unterschätzen, dass grammatische Formfolgen immer auch auf die Automatisierbarkeit beim Sprecher hin angelegt sein müssen (und nicht allein auf die für den Hörer nötigen Distinktionen). Insgesamt dürfte sich die Erwerbsdynamik früher syntaktischer Konstruktionen aus dem Zusammenspiel rhematischer Kombinatorik (top down) und subrhematischer Formdifferenzierung (bottom up) ergeben. Beide Wege führen in die Grammatik

Zum Erwerb syntaktischer Konstruktionen  

 85

syntaktischer Konstruktionen, der eine via Derhematisierung und kombinatorische Generalisierung und Beschränkung (aus dem affektiv-starktonigen slot für mein wird eine variable Position für lokal verfügbare und deiktisch adressierbare „reference point relations“; Langacker 2008; s. u.), und in die automatisierten subrhematischen Formfolgen werden variabilisierend Distinktoren eingebracht. Es darf als Vorzug einer konstruktionsgrammatischen Axiomatik gelten, dass sie es – obwohl nicht als Lerntheorie konzipiert – erlaubt, die Koexistenz und Abfolge unterschiedlicher Kerngrößen und Abstraktionsgrade in der operativen Beherrschung syntaktischer Phänomene zu thematisieren (vgl. Behrens 2009 und Diessel 2013 für den Nutzen der Konstruktionsgrammatik in der Spracherwerbsforschung). Entscheidend ist das grundsätzlich andere Verständnis der Erwerbsdaten in einer gebrauchsbasierten Konstruktionsgrammatik: Für letztere repräsentieren die jeweiligen Daten einen gegebenen Stand bei der stufenweise induktiven Verallgemeinerung und deduktiven Operationalisierung der Input-Erfahrungen. Dagegen stehen die Daten im Nativismus für eine parametrisch durch die einzelsprachliche Erfahrung noch nicht völlig justierte angeborene Universalgrammatik. Da Elemente und Konstruktionen für gleichermaßen zeichenhaft gelten, kann die Konstruktionsgrammatik der Tatsache Rechnung tragen, dass kognitiv auf ein und dieselbe Struktur ganz unterschiedlich zugegriffen werden kann. Sprachbenutzer verarbeiten gewissermaßen en bloc, was sie ohne Rückgriff auf analytisch-kompositionelle Prozeduren verarbeiten können, sie verarbeiten als ein komplexes Zeichen, was strukturell durchaus weiter dekomponiert werden kann und bei Bedarf auch dekomponiert wird. Das gilt für Lerner, die variabel besetzbare slots in der Konstruktion noch gar nicht als solche identifizieren, und es gilt auf andere Weise für Routiniers, die gebräuchliche Formeln sekundär als ein komplexes Zeichen auffassen. Wie von Christian Lehmann verschiedentlich argumentiert, sucht der Rezipient eines sprachlichen Ausdrucks zunächst „ganzheitlich“ nach diesem Ausdruck im Inventar. Wenn er ihn dort nicht findet (und nur dann), sucht er den Sinn aus den im Inventar vorfindlichen Segmenten zu kon­ struieren. Thematisch-situative Beziehbarkeiten dienen dabei ebenso als Ressource wie die mit den im Inventar befindlichen Elementen verbundenen (und von ihnen organisierten) Invarianzen. Wer Janoschs Geschichten vorgelesen bekommt, der weiß, auf welche Referenten sich die Ausdrücke der kleine Bär und der kleine Tiger beziehen, und braucht dazu keinesfalls analytische Dekomposition. Wenn die „Situativität“ der sprachlichen Kommunikation als übergreifendes Prinzip anerkannt ist (Behrens 2009, 433), dann ist eine grenzscharfe Gegenüberstellung von Semantik und Pragmatik für die frühe Kindersprache empirisch kaum zu begründen. Auch Syntax und Synsemantik sind durch ein Kontinuum verbunden. Sprachzeichen sind zunächst in recht weiten Grenzen ‚feldopportunistisch‘. Das bedeutet, dass vieles, was für den linguistisch geschulten Beobachter nach genuiner ‚Syntax‘ aussieht, für das sprechende Kind keineswegs reine Symbolfeldmechanismen sind. Ein ganz analoges Problem entsteht (wie oben bereits angedeutet) für die syntaktischen Kategorien bzw. Wortartbegriffe, die ohne starke UG-Vorannahmen weder

86 

 Clemens Knobloch/Josephine Krüger

einfach als nicht weiter ableitbare Primitive angesetzt noch auch einfach durch jedes ihnen in der grammatikographischen Tradition zugeordnete Lexem vertreten werden können. Die syntaktischen Kategorien werden dann vielmehr zu echten Lernaufgaben, und es muss für jeden Zeitpunkt entschieden werden, was ihnen in der Lernersprache entspricht (bzw. ob ihnen überhaupt etwas entspricht). Die Wörter und ihre Gebrauchsweisen ‚sind‘ dann nicht identisch mit ihrer syntaktischen Kategorie, sie sind vielmehr (um eine klassische Formulierung zu zitieren; Waxman/Markow 1995) „invitations to form categories“. Erst wenn eine Kategorie wirklich gebildet ist, kann sie einen schematischen Beitrag zu den Konstruktionsbedeutungen leisten, in denen sie vorkommt.

3 Allgemeine Befunde Wenden wir uns jetzt der Nominalphrase und ihrer Erwerbsarchitektonik zu. Sozialpragmatisch dient sie der Versprachlichung von Referenz in aufmerksamkeitskoordinierten Szenen (programmatisch hierzu Clark/Wilkes-Gibbs 1986). Gleich, ob sie Bezüge pronominal oder sortal versprachlicht, durch die empraktisch-synattentionale Architektur der frühen Kommunikation mit Kindern ist sie in den frühen Erwerbsphasen dominant deiktisch organisiert (was zunächst nur bedeutet, dass die Konnektivität der Sprachzeichen in die konkrete Verwendungsszene führt und nicht primär in die Ebene der syntaktischen Verkettung). Kognitiv werden durch Nominalphrasen Referenten aus den komplex dynamischen Bezügen der aktionalen Szene ausgegliedert. Referenten in diesem Sinne sind lokal verfügbare Bezugsgrößen, die sich über verschiedene Szenen gleich bleiben, sie können rein deiktisch, durch zeigende Prozeduren ausgegliedert werden oder sortal oder durch eine Kombination beider Prozeduren, die ihrerseits szenisch bündig werden kann oder nicht, letzteres dann, wenn auf ‚Abwesendes‘ referiert wird, das ein Sprecher so in die Szene einführt. Da Referenten sowohl indexikalisch adressiert als auch durch ihre relativ zeitstabilen Merkmale konzeptualisiert werden können, begegnen sich in der Ebene der referierenden Sprachmittel Indizes, Eigennamen und Konzepte. Da die kognitiven Wege und Verbindungen sowohl von den Sprachzeichen zu ihren Referenten als auch umgekehrt von den Referenten zu deren Repräsentation laufen müssen, tut man gut daran, zwei komplementäre Prozesse anzusetzen: [a] die sprachliche Identifikation und Konzeptualisierung außersprachlicher Referenten und [b] die Referenzialisierung einzelsprachlicher sortaler (und sonstiger) Konzepte. Situationsbündige Indizes (das, da etc.) sind wohl die einfachsten Versprachlichungen von Referenz und bilden eine Art Untergrenze der Nominalphrase (wenn man von implikativer Referenzialisierung etwa ‚Zeigegeste + haben‘ absieht). Am andren Ende des Kontinuums finden wir dagegen die späten und sehr komplexen Formate der ausgebauten Nominalphrase mit ‚linken‘ und ‚rechten‘ Attributen. Aus-

Zum Erwerb syntaktischer Konstruktionen  

 87

gebaute Nominalphrasen sind „literat“ (im Sinne von Maas 2010) und sozial-pragmatisch wie kognitiv darum voraussetzungsreich, weil sie (neben der Beherrschung der syntaktischen Konstruktionen) reflektierte Perspektivität beim Sprecher voraussetzen: Der muss fallweise kalkulieren, was der Hörer schon weiß und welche Informationen er noch benötigt, um das jeweils Gemeinte identifizieren und konzeptualisieren zu können (theory of mind etc.). Zwei Einschränkungen gibt es gegenüber diesem sehr ‚kognitiven‘ Verständnis von Referenz: [a] Der Ausdruck Referenz steht einmal für den Inbegriff des singulär-identifizierenden Sach- und Weltbezugs der sprachlichen Kommunikation, gleichzeitig meint Referenz aber immer auch die bloß textuelle Identität eines wiederholten bzw. wiederholbaren Bezugs. Mittels Referenz wird alles adressierbar, was in der aktuellen Aufmerksamkeitsspanne liegt. Und der laufenden Aufmerksamkeit liegen Bezüge besonders nahe, die sie gerade erst selbst symbolisch erzeugt hat. All das verwandelt den (vermeintlichen) Welt- und Wirklichkeitsbezug des Sprechens in Referenzakten kleinschrittig in Selbstbezug und Reflexivität sprachlicher Praktiken. [b] Was wir betrachten, ist bisher nur die dem Symbolfeld abgewandte und kognitive Seite der Nominalphrase, und zum Erwerb und Aufbau der einschlägigen Konstruktionsoptionen gehört zwingend der Umstand, dass Nominalphrasen als ‚Partizipanten‘ von Szenen bzw. versprachlichten Prädikaten auch eine dem Symbolfeld zugewandte Seite aufweisen. Zu dieser letzteren Seite gehören syntaktische Relatoren (Kasus, Adposition, Konstituentenfolge), durch welche ein Referent als Partizipant einer sprachlich geordneten Szene oder Konstellation eingeordnet wird. Dem Symbolfeld zugewandt sind in diesem Sinne also die syntaktischen Relatoren, die aus dem prototypisch asyntaktischen und nicht-relationalen substantivischen Ausdruck Partizipanten machen, dann aber auch die binnensyntaktischen Schemata der ­Nominalphrase, die aus einem bloßen Referenzindex ein geordnetes Ensemble von Anweisungen zur Konstruktion komplexer Referenzeinheiten machen, also pränu­ kleare slots für Determinatoren, Quantoren, attributive Adjektive, Bestimmungswörter, Possessorphrasen und postnukleare für Genitivattribute, präpositionale Attribute, Relativ- und andere Attributsätze. Auf den ersten Blick hat es durchaus den Anschein, dass die Binnenstrukturen der Nominalphrase (im Vergleich zur VP) strikt kategorial und ergo auf sehr abstraktem syntaktischem Niveau geordnet seien: Fast alle Optionen stehen für fast alle Unterklassen von substantivischen Nuklei zur Verfügung, wenn man von funktional bedingten Einschränkungen wie der begrenzten attributiven Valenz von pronominalen Kernen und Eigennamen absieht (hierzu Kaznelson 1974, 201 ff.), die für per se situationsbündige Referenten stehen und daher nur begrenzt attributiv ‚aktualisiert‘ werden können bzw. müssen. Nach ihrer Außensyntax (als Partizipanten also) sind Nominalphrasen erkennbar vielgestaltig und stärker kombinatorisch beschränkt: Ereignisnomina wie Krieg, Unwetter, Konzert verbinden sich gerne mit Prädikaten, die ihre zeitliche und räumliche Erstreckung angeben (wie beginnen, dauern, enden), mit

88 

 Clemens Knobloch/Josephine Krüger

anderen ungern. Zähl- und Messnomina zeigen Wahlverwandtschaft mit Stoffsub­ stantiven, deprädikative Nuklei ziehen Attribute an, die auf Argumente ihres prädikativen Kerns verweisen etc. Was wiederum die Erwerbsdynamik betrifft, so scheint einfache deiktische Referenz für Kinder sowohl sehr einfach und quasi gegeben mit der Fähigkeit, einen gemeinsamen Aufmerksamkeitsfokus festzuhalten, als auch relativ kompliziert, was ihre Perspektivität und die Verrechnung von Origoverschiebungen qua Versprachlichung betrifft (Überblick bei Tomasello 2003, 199–213). Die Befunde zum frühen Gebrauch von Artikelwörtern und anderen determinierenden Elementen sind unübersichtlich. Sie legen den Schluss nahe, dass mehr als nur ein Weg in die Beherrschung dieses Systems hineinführt, dass Kinder recht lange nicht zwischen vorerwähnten und anderweitig ‚verfügbaren‘ Bezügen unterscheiden etc. (vorbildlich nach wie vor Karmiloff-Smith 1979). Die Opposition zwischen bestimmtem und unbestimmtem Artikel steht anfänglich für Nomination vs. deiktische Referenz (für eine andere Position vgl. Bittner 1998). Zudem sind viele allgemein-kognitive Details zu berücksichtigen. Z. B. unterscheiden Kinder in bestimmten Domänen (Personen) zuerst zwischen Individuen, in andren Domänen (Dinge) unterscheiden sie gar nicht zwischen Individuen und lernen nur die (grundierungsbedürftigen; s. u.) sortalen Bezeichnungen. In situ beruht die Referenzialisierung von Indizes sehr stark auf der aktiven ‚Mitarbeit‘ der Rezipienten, so dass die unvollkommene Beherrschung (bzw. Verwendung) der einschlägigen Symbolfeldmechanismen weder bei Kindern noch auch bei Erwachsenen sonderlich auffällt, zumal sich die gesprochene Sprache diesbezüglich stark von der geschriebenen unterscheidet, auf der die meisten Beschreibungen des Systems bis heute beruhen. Ohne ausgeklügelte Experimente lässt sich über die allmähliche Funktionsdifferenzierung von Artikel- und DET-Funktionen wenig Bestimmtes sagen. Karmiloff-Smith (1979, 47) dürfte mit der folgenden Reihung, die das Ergebnis ihrer langjährigen Beobachtungen und Experimente bildet, immer noch weitgehend richtig liegen: deiktisch-referenziell > exophorisch-referenziell > nichtspezifisch-referenziell > anaphorisch-referenziell > generisch-referenziell. Wobei gilt, dass bei weitem nicht alle Gebrauchskontexte die Unterscheidung dieser Funktionen verlangen oder auch nur ermöglichen. Dennoch kann die Erwerbsperspektive die fachliche Aufmerksamkeit auf diejenigen elementaren Prozeduren lenken, welche zugleich der Organisation und Sicherung geteilter Referenzbezüge dienen und (als binnensyntaktische) das Symbolfeld der Nominalphrase aufbauen. Was Langacker (2008, 272 ff.) als „grounding strategies“ bezeichnet, das steht zweifellos auch in der Tradition früherer Modellgedanken (etwa bei Charles Bally), in denen die Notwendigkeit der „Aktualisierung“ abstrakter sprachlicher Systembedeutungen in der Rede unterstellt wurde. Hier fehlt der Raum, Einzelheiten zu diskutieren, darum bedienen wir uns einfach der Definition und der Terminologie Langackers (2008). Nach dieser sind Artikelwörter, Demonstra­ tiva, Quantoren selbst formale und schematische Substantive, die im adjektivischen Gebrauch ihre Kernsubstantive bzw. deren Referenten in der lokal geteilten

Zum Erwerb syntaktischer Konstruktionen  

 89

Diskurswelt ‚grundieren‘ oder verankern. Dass sie substantivisch wie adjektivisch gebraucht werden können, ist durchaus systemisch und setzt sich im (extrem häufigen) nu­kleuslosen Gebrauch der vor allem formalen attributiven Adjektive () fort. Funktional unterstellt dieser nukleuslose Gebrauch nur, dass die jeweilige Bezugssphäre sortal oder referenziell in der geteilten Aufmerksamkeit gegeben ist. Ein Dialog wie [1] PAULINE (4;0,3) CHI: darf ich die ganzen nehmen? CHI: ich hab nur kleine ROB: du hast noch größere

zeigt die ‚Äquivalenz‘ zwischen sortalem Nukleus und gegebenem Thema sowie den referenzialisierenden Charakter der Flexion attributiver Adjektive. Die Abfolge der drei syntaktischen slots für DET – ATTRIB – NUK wird offenbar so angeeignet, dass zunächst auch jede Position ohne die jeweils anderen Positionen zum Referieren verwendet werden kann. Wenn alle drei Positionen besetzt sind (der kleine Bär), handelt es sich im Zweifelsfall um einen komplexen Namen und noch nicht um eine Konstruktion mit drei variablen slots. Der slot für das Bestimmungswort eines Determinativkompositums unterscheidet sich von ATTRIB durch Fehlen der Referenzflexion und dadurch, dass er nicht ohne Nukleus gebraucht werden kann. Mehrfachbesetzung von ATTRIB und Adjektivreihung spielen im Erwerb von Nominalphrasen zunächst keine nennenswerte Rolle. Eine wesentliche Rolle in der Syntax nominaler Konstruktionen spielt das, was Langacker (2008) als „reference point relations“ bezeichnet: Um einen nicht ohne weiteres zugänglichen (oder bestimmbaren) Referenten für den Hörer identifizierbar zu machen (oder zu charakterisieren), wird dessen mentale Beziehbarkeit auf einen anderen, zugänglicheren Referenten als ‚Weg‘ zum Zielreferenten kodiert (Langacker 2008, 83 ff.). Lokalisierungskonstruktionen sind einschlägig, aber elementar ist auch der deskriptive oder restriktive Bezug auf ein Possessornomen. Pivotkonstruktionen mit zwei variablen slots vom legendären Typ mommy sock haben eine Lesart als Possessor-Possessum-Formate, die (im Deutschen wie im Englischen!) nur noch den Possessor-Eigennamen mit /-s/ markieren müssen, um in der Symbolfeldnorm anzukommen. Possessivpronomina können als indexikalisierte reference point relations verstanden werden, bei denen der Bezug auf die Sprechrollen Referenten bestimmen und identifizieren hilft. In aller Regel gehört die (zunächst stark affektive!) Possessormarke der 1. Pers. Sing. mein- sowohl zu den ersten reference point-Ausdrücken, die ohne explizit kodierten Nukleus gebraucht werden, als auch zu den ersten produktiven Konstruktionsformaten der mehrteiligen Nominalphrase: . In einer Episode des COSIMA-Teilkorpus von CHILDES (COSIMA 2;6,10) taucht bereits für 16 verschiedene Werte von X auf, während die nächst häufigeren attribu-

90 

 Clemens Knobloch/Josephine Krüger

tiven Adjektivkonstruktionen ( und ) beide nur für 3 unterschiedliche X belegt sind. Die Identifizierung eines Referenten für die Teilnehmer der Kommunikation kann nur entweder gelingen oder nicht gelingen. Sie ist eine alles-oder-nichts-Operation – und daher zu unterscheiden von den in der Nominalphrase sprachlich geordneten Verfahren der Implikation, Indikation, Nomination, Konzeptualisierung, Unterscheidung von Referenten. Tendenziell ist es die gemeinsame Beteiligung an einem Referenzakt, was die Positionen in dem qua Kongruenz verbundenen pränuklearen Feld der Nominalphrase zusammenhält. Dafür steht der Umstand, dass alle pränuklearen Elemente der Nominalphrase nicht nur gemeinsam, sondern auch einzeln, je für sich, referieren können. Dabei gilt, dass ART/DET einen lokal identifizierbaren Referenten indizieren (anfänglich oft gestisch verstärkt). Für den frühen Status des attributiven MOD-slots (sehr häufig ohne expliziten Nukleus, aber schon früh mit Flexion) scheint es nicht untypisch, dass er mit formalen Attributiva des Typs ander-, neu-, viel- besetzt wird, bevor dort prototypische lexikalische Adjektive auftauchen. Der nukleuslose Gebrauch modifizierender Attributiva setzt voraus, dass die sortale bzw. referenzielle Sphäre für die Aufmerksamkeit der Teilnehmer verfügbar ist. Äußerungen wie ganz viele oder neuen haben, von denen es in den empraktischen Konstellationen wimmelt, unterstellen eine solche Verfügbarkeit, die freilich nicht anaphorisch verstanden werden kann, weil sie keine Vorerwähnung voraussetzt, sondern lediglich lokale Adressierbarkeit. Mit Nukleus (neue Puppe habe(n), neue (Ka)ssette; COSIMA 2;6,10) wird die Referenzklasse sortal expliziert. Die Variabilisierung der drei slots DET/MOD/N erzeugt dann nach und nach das abstrakte Symbolfeldschema der kongruenzintegrierten Nominalgruppe (Karmiloff-Smith 1979, 234). Es scheint dem zweifellos beträchtlichen Abstraktionsgrad dieser Konstruktion zu entsprechen, dass sie aus Positionen zusammenwächst, die zwar aufeinander verweisen und aufeinander bezogen sind, aber doch auch einzeln ‚funktionieren‘ können. Das entspricht der strukturellen Architektur der Nominalphrase, für die gilt, dass alle ihre Elemente eine gemeinsame Argumentstelle für den Referenten aufweisen und dass alle Elemente mit Ausnahme des Nukleus selbst einen zentripetalen modifier-slot aufweisen, der am modifizierten Nukleus andockt und mit der gemeinsamen semantischen Argumentstelle für den Referenten koinzidiert (Lehmann 1985, 79 f.). In aller Regel wird bei der Beschreibung dieser Konstruktion übersehen, dass auch die in der Regel für deiktisch geltende Artikelposition zugleich ein Scharnier zwischen Handlungs- und Symbolfeld ist, weil nämlich der Artikel bei Eigennamen wie bei sortalen Ausdrücken die (vokativische) Anrede ausschließt und den fraglichen Ausdruck als 3. Person kategorisiert. Chef, Maria, Holger können Vokative sein, der Chef, die Maria, der Holger nicht. Der Artikel markiert die Phrasen als Nenngrößen, die zum Symbolfeld gehören. All das steht für den markanten Unterschied zwischen dem kongruenzinte­ grierten pränuklearen Symbolfeld und eher speziellen und ‚späten‘ Konstruktionen in der Sphäre der Nominalphrase wie etwa der des (zweifellos im Kern „literaten“;

Zum Erwerb syntaktischer Konstruktionen  

 91

Maas 2010) Relativsatzes, bei dem Diessel/Tomasello (2000) für Englisch sprechende Kinder entdeckt haben, dass so gut wie alle frühen Belege dem gleichen präsentativprädikativen Verwendungszusammenhang angehören, der wohl in keiner englischen Grammatik als „typisch“ für Relativsätze gilt: Der Relativsatz gibt neue, nicht präsupponierte Information über das Prädikatsnomen eines präsentativen Kopulasatzes: Here/there is the N, that VP (vgl. Tomasello 2003, 253–258; Diessel 2007). Dass präsentationale Kopulasätze formulaisch sehr einfach einen Referenten fokussieren, selbst nicht propositional und früh beherrscht sind, dürfte sie dafür prädestinieren, mit weiterführenden Relativsätzen (und ähnlichen Konstruktionen) erweitert und ausgebaut zu werden. Komplexe Satzkonstruktionen können (wie Diessel 2007 argumentiert) erwerbstechnisch entweder qua Musterexpansion (Ausbau) oder qua Musterintegration aufgebaut werden. Wenn man allein das pränukleare Symbolfeld der Nominalphrase ins Auge fasst (und postnukleare Genitive, Präpositionalattribute, Relativsätze als im Wesentlichen „literat“ zunächst außer Acht lässt), dann erscheint der Raum zwischen Artikelwort und Substantiv als funktional geordnet durch zwei konträre Kraftlinien: Von der ‚rechten‘, dem Nukleus benachbarten Randposition aus erstreckt sich nach ‚links‘ das Feld der Modifikation, Spezifizierung, Charakterisierung des (sortalen) Konzepts, und vom ‚linken‘, mit Artikelwörtern besetzen Rand des Feldes erstreckt sich nach ‚rechts‘ die Linie der diskursiven Identifizierung des Referenten. Es ist wichtig festzuhalten, dass kraft dieser Tatsache jedes Vorfeldelement einer nominalen Konstruktion auf beiden Linien liegt und ergo unter beiden Gesichtspunkten betrachtet werden kann. Insbesondere sind die prototypischen lexikalischen Adjektive, die im Schnittfeld dieser beiden Linien in der Mitte liegen, janusköpfig. Sie können als Referenzfestleger und/oder als Konzeptspezifizierer dienen. Die notorischen Streitigkeiten über den ‚Kopf‘ der Nominalphrase haben hier ihren rationalen Kern, insofern nämlich der referenzielle Kopf der Phrase links und der lexikalisch-sortale Kopf der Phrase rechts steht. Demnach kann man die ganze Phrase gewissermaßen ‚von links‘ als schrittweise und geordnete Spezifizierung eines Referenzindexes oder ‚von rechts‘ als ebenso schrittweise geordnete Modifikation und Referenzialisierung eines sortalen (oder sonstigen nominalen) Konzeptes betrachten. Der Konzeptmodifikation dient in der Hauptsache der (vielfach gar nicht zu den syntaktischen Konstruktionen gerechnete) nukleusadjazente slot des Bestimmungswortes in der Determinativkomposition. Das ist zugleich (neben dem beinahe spiegelsymmetrisch im DET-slot angesiedelten Possessor-Genitiv) die einzige pränukleare Position, die aus der Kongruenz herausfällt. Infolge dessen sprengt die Komposition, als Konstruktion betrachtet, die Logik des pränuklearen Feldes: Das Bestimmungswort allein taugt nicht als Referenzmittel, sein slot wird zum Nukleus geschlagen und tangiert die genuin attributiven Positionen des pränuklearen Feldes nicht. Zu der vergleichsweise frühen produktiven Aneignung der Komposition vergleiche man den folgenden Abschnitt.

92 

 Clemens Knobloch/Josephine Krüger

4 Die Syntax der Nominalphrase im Erstspracherwerb Die Vorstellung über Nominalphrasen, wie sie in einschlägigen Grammatiken vermittelt wird, ist beim Untersuchungsgegenstand der Kindersprache nur bedingt anwendbar. Zum einen, weil in den Grammatiken prä- und postnukleare Phänomene aufgelistet werden, die zwar typisch für die (gehobene) Schriftsprache sind, aber in dieser Form in der mündlichen Spontansprache kaum Verwendung finden, erst recht nicht im Falle der Spontansprache eines Kleinkindes. Zum anderen aber auch deshalb, weil komplett attribuierte NPs den möglichen Endpunkt markieren, von dem das Kleinkind noch weit entfernt ist. Anders als simple Nominalphrasen erwachsener Sprecher (unter ‚simpel‘ verstehen wir unattribuierte, d. h. nur aus einer Komponente bestehende, Nominalphrasen, z. B. Mama, Auto), verfügt das Kind anfangs weder über die Bewusstheit noch über die kognitive Fähigkeit, komplexere Nominalphrasenstrukturen zu bilden. Die Extraktion einzelner Nomen bildet jedoch gewissermaßen die Voraussetzung weiterer syntaktischer Entwicklung (Lexical Bootstrapping Hypothesis, Tomasello 2003, 91 f.). Attribution entwickelt sich im Laufe der ersten Lebensjahre; die elementare Struktur der Nominalphrase, d. h. hauptsächlich DET-ADJ-N, wie auch die Flexion nach Kasus, Numerus, Genus scheint im Alter von etwa drei Jahren weitgehend etabliert (Bittner 1998, 255; zur Flexion: Sahel 2010, 190 f.). Schlipphak (2008) analysierte die Transkripte der Kinder ANN und FAL aus CHILDES und konnte zeigen, dass beide Kinder Nominalphrasen auf dieselbe Weise und im gleichen zeitlichen Rahmen bilden. Nominalphrasen wurden dabei in drei Typen unterteilt: Eingliedrige, z. B. Auto, zweigliedrige, z. B. mein Auto, kleines Auto und drei- und mehrgliedrige NPs, z. B. mein kleines Auto. ANN äußert den Ergebnissen zufolge eingliedrige NPs erstmalig mit 1;4, zweigliedrige mit 1;5 und drei- und mehrgliedrige NPs mit 1;10 bzw. 2;5. FALs Ergebnisse sind ähnlich: Mit 1;5 äußert es eingliedrige NPs, zweigliedrige bei 1;6 und drei- und mehrgliedrige bei 2;0 und 2;9. Arbeiten zur Ermittlung von Erwerbsabfolgen für das Vorfeld der NP kommen zu unterschiedlichen Ergebnissen. So stellt Bittner (1999) anhand der Korpusdaten von 9 Mädchen zwar die Quantoren-Erwerbsabfolge ein < kein < mehr und/oder viele < zwei < drei recht eindeutig fest und begründet es durch die Zunahme der semantischen Komplexität. Beim Vergleich mit den Ergebnissen von Schlipphak (2008) kann diese Abfolge jedoch nicht bestätigt werden (vgl. Schlipphak 2008, 42 f. und Bittner 1999, 61). In einer früheren Untersuchung zum Vorfeld der NP hatte Bittner (1998, 259) außerdem die Erwerbsabfolge N < ein+N < mein+N < der/die/das+N < Art+Adj+N nachzuweisen versucht und begründet ihre Ergebnisse im Rahmen der Natürlichkeitstheorie; doch auch beim Vergleich dieser Abfolge mit den Ergebnissen von Schlipphak findet keine Übereinstimmung statt. Beweise für eindeutige Erwerbsabfolgen in NPs stehen also derzeit noch aus. Da Spracherwerb aber als sehr individuell verstanden werden muss, da der Input eine große Rolle spielt – welcher freilich auch variiert –,

 93

Zum Erwerb syntaktischer Konstruktionen  

stellt sich die Frage, ob die Suche nach allgemeingültigen Erwerbsabfolgen sich nicht gänzlich erübrigt. Die Untersuchung zu den Protokollen von CAROLINE soll keine allgemeine Erwerbsabfolge feststellen (das könnte sie gar nicht, da es sich um ein Einzelbeispiel handelt). Vielmehr sollen anhand der Daten exemplarisch verschiedene Phänomene diskutiert werden. Grundlage der Analyse bildet ein Arbeitskorpus bestehend aus ca. 14000 Nominalphrasen, die aus den Transkripten von CAROLINE aus CHILDES (00;10 bis 04;03) annotiert wurden. Danach erfolgte eine Ermittlung des relativen Vorkommens jedes einzelnen Attributs sowie eine Analyse der Kopfnomen. Folgende Ergebnisse ergeben sich bei der Zählung der Attribute von CAROLINE: 90 80

Attribute in %

70 60 50 40 30 20 10 0

10

12

14

16

18

20

22

24

26

28

30

32

34

Alter in Monaten

Vorfeld

36

38

40

42

44

46

48

50

52

54

Nachfeld

Abb. 1: Relative Anzahl der Gesamtattribute im Vor- und Nachfeld der N

Die in Abbildung 1 dargestellte relative Anzahl der Attribute zeigt eine deutliche Dominanz des Vorfelds. Vorfeldattributionen bei CAROLINE beschränkten sich auf Determinierer-Elemente (das Auto, mehr Brot), Appositionen (Onkel Tobi, Doktor Maiburg), Genitivphrasen (Mamis Geld, Papis Kaffee) und Adjektive (komische Robbe, der kleine Wau Wau). Nachfeldattribution ist ausgesprochen selten. Es kann vermutet werden, dass die Seltenheit von Nachfeldbesetzung durch das i. d. R. hohe syntaktische Gewicht von Nachfeldattributen zu erklären ist. Zudem ist es bei Präpositionalphrasen im Nachfeld eines Substantivs kaum möglich, sie eindeutig als Attribute zu identifizieren, da sie auch ohne feste syntaktische Bindung vorkommen. Auffällig an der Kurve ist, dass die Vorfeldattribution stark fluktuiert: Nachdem das Vorfeld sich schon sehr früh in geringem Umfang zeigt, fällt es vorerst wieder ab (Monate 13–16), wonach es sich vorerst auf relativ geringem Niveau hält (Monate 16–25). Ab dann kommt es zu einem starken Anstieg, welcher für die restlichen Monate auf einem sehr hohen Niveau stagniert. In dieser Zeit weisen etwa 80 % aller Nomen eine Form der Vorfeldattribution auf. In den Monaten 34–40 fällt die Kurve wieder, wobei interessant ist, dass zur selben Zeit das Nachfeld in Erscheinung tritt. Empirische Arbeiten zum Spracherwerb erwähnen ähnliche Wechselwirkungsmecha-

94 

 Clemens Knobloch/Josephine Krüger

nismen in anderen Bereichen des Spracherwerbs (complexity fluency trade off; siehe Schlipphak 2008; Tomasello 2003, 300; Elsen 1999, 96): Bei beiden Kindern des CHILDES-Korpus lässt sich ein Zusammenspiel verschiedener Phasen der Schwerpunktverlagerung beobachten […]. ANN und FAL machen abwechselnd in verschiedenen sprachlichen Aufgabenbereichen Fortschritte, verwerfen diese wieder, stagnieren in ihren Fähigkeiten und zeigen an anderer Stelle positive Entwicklungen. (Schlipphak 2008, 100)

Die wechselseitige Kurvenveränderung in den Monaten 41–51 aus Abbildung 1 bekommt eine neue Dimension, wenn man zusätzlich das Morphwachstum der Kopfnomen verfolgt. Dabei wird das Maß MLP (Mean Length of Phrases) berechnet aus den Morphen eines Wortes geteilt durch die Anzahl des Wortes (=1). Für die Grafik wurden für jeden Monat alle Morphe durch die Anzahl aller Wörter geteilt. Das MorphSegmentierungsverfahren wurde übernommen aus Best (2001, 2006): 2,4

2,2

2

MLP

1 ,8

1 ,6

1 ,4

1 ,2

1 10

12

14

16

18

20

22

24

26

28

30

32

34

36

38

40

42

44

46

48

50

52

54

Abb. 2: Komplexität der NP-Köpfe in Morphen

Bedingt durch die Zunahme von Komposita und Derivationen steigt die mittlere Morph­länge (MLP) stetig an. Der größte Anstieg kann in den Monaten 41–51 beobachtet werden, in den Monaten, in denen das Vorfeld ab- und das Nachfeld zunimmt (vgl. Abb. 1+2). Alle drei Felder der NP, Vorfeld, Kopf und Nachfeld, scheinen sich also in ihrem Aufbau wechselseitig zu beeinflussen. Dieses Beeinflussen scheint sich genauer zu erklären, wenn man die einzelnen Attribute des Vor- und Nachfeldes anschaut (Abb. 3+4):

 95

Zum Erwerb syntaktischer Konstruktionen  

70 60 50

Attribute in %

40 30 20 10 0 10

12

14

16

18

20

22

24

26

28

30

32

34

36

38

40

42

44

46

48

50

52

54

50

52

54

Alter in Monaten VF Determinierer

VF Apposition

VF Adjektiv

Abb. 3: Relative Anzahl der einzelnen Attribute im Vorfeld der NPs 4

Attribute in %

3

2

1

0 10

12

14

16

18

20

22

24

26

28

30

32

34

36

38

40

42

44

46

48

Alter in Monaten NF Präposition

NF Adjektiv

Abb. 4: Relative Anzahl der einzelnen Attribute im Nachfeld der NPs

In Abbildung 3 wurden nur die Attribute Determinierer, Adjektiv und Apposition und in Abbildung 4 nur Präpositionalphrase und Adjektivphrase berücksichtigt. Andere Attributsarten im Vorfeld (z. B. Genitivphrasen) und Nachfeld (z. B. Relativsätze, Adverbphrasen) kamen nur in Einzelfällen vor und wurden aus diesem Grund der Übersichtlichkeit halber weggelassen. Die Dominanz des Vorfelds kommt laut Abb. 3 überwiegend durch das Vorkommen von Determinativ-Elementen zustande. Heuristisch betrachtet handelt es sich in diesem frühen Stadium der Determinierer überwiegend um Imitationen und reduzierte Artikelvorstufen, wie n Ball, e Auto. Deren Abfall erfolgt deutlich sichtbar zu einem Zeitpunkt, an dem andere Vorfeldattribute (hauptsächlich Adjektive) folgen. In Abb. 4 ist erkennbar, dass die vergleichsweise wenigen Zählungen im Nachfeld überwiegend aus der Emergenz von Präpositionalphrasen resultieren. Es sieht also danach aus, als würde sich das Zustandekommen von Präpositionalphrasen negativ

96 

 Clemens Knobloch/Josephine Krüger

auf Determinier-Elemente sowie auf die Komplexität der Kopfnomen (s. Abb. 2) auswirken. Wie in Abbildung 2 ersichtlich wird, weisen Kopfnomen mit zunehmendem Alter des Kindes eine höhere Komplexität (= mehr Morphe pro Nomen) auf. Dieses Verhalten kann größtenteils auf die verbesserte strukturelle Verarbeitungskapazität zurückgeführt werden. Steigende Morphanzahl in den Kopfnomen kann überwiegend durch die Zunahme von Komposita erklärt werden: 34 32

R² = 0,899

30 28 26 24 22

Komposita %

20 18 16 14 12 10 8 6 4 2 0 10

12

14

16

18

20

22

24

26

28

30

32

34

36

38

40

42

44

46

48

50

52

54

Alter in Monaten

Abb. 5: Verhältnis Komposita zu Simplizia

In Abbildung 5 wird zweifelsfrei deutlich, dass die Bildung von Komposita signifikant mit der Zunahme des Alters korreliert (R²=0,9; die meisten Statistiker werten einen Wert ab (-) 0,6 als signifikant). Während im Alter von 19 Monaten nur 3 % aller Nomen Kompositabildung sind (und 97 % Simplizia) sind es im 27. Monat bereits 15 % (85 % Simplizia) und in der letzten Aufnahme im Monat 51 bereits 31 % (69 % Simplizia). Grob ausgedrückt handelt es sich in der letzten Aufnahme bei etwa jedem 3. Kopfnomen um ein Kompositum. Freilich bezieht sich die Korrelation auf den Alterszeitraum der Aufnahmen, d. h. auf den Zeitraum zwischen dem 10. und dem 51. Lebensmonat des Kindes. Es kann keine Aussage darüber gemacht werden, wie (und ob) sich Kompositabildung über diese Altersspanne hinaus fortsetzt. Ganz bemerkenswert ist hier nicht nur die Zunahme der Komposita, sondern die Art und Weise des Anstiegs. Kompositabildung setzt zum 18. Monat ein und steigt bis zum 26. Monat an, stagniert etwa zwischen dem 26. und dem 36. Monat und steigt dann zwischen dem 36. und 51. wieder zügig an. Vergleicht man dieses Anstiegsmuster mit dem der Determinierer (s. Abb. 3), lässt sich erkennen, dass beide Größen Kompositabildung und Determinierer eine Konträrverteilung aufweisen, also einen weiteren complexity fluency trade off: Im Zeitraum 10–18 Monate steigen Determinierer an (und fallen wieder), während Kompositabildung noch nicht stattfindet. Im Zeitraum

Zum Erwerb syntaktischer Konstruktionen  

 97

ca. 18–26 Monate stagnieren Determinierer, während Kompositabildung zunimmt. Zwischen dem 26. bis 34. Monat stagniert die Kompositabildung, dafür steigen Determinierer an. Schließlich kehrt sich das Verhältnis zum Ende der Aufnahmen hin noch einmal um; es stagniert die Determiniererhäufigkeit während die Kompositabildung wieder zunimmt. Kompositabildung ist nicht nur hinsichtlich einer Zunahme der Komplexität interessant. Es lassen sich Komposita auch unter semantischen Kriterien analysieren. Als besonders aufschlussreich gelten hierbei kindliche Spontanschöpfungen, die vom Kind in einem bestimmten kommunikativen Kontext ad hoc erfunden werden, wie z. B. im Fall CAROLINE: – Sandschaufeln, Weihnachtsbank, 26 Monate – Steinmutter, Sandkastenschaufelkreis, Kreisschaufel, Doktorhilfe, Doktorkrankenhaus, 27 Monate – Streifensonne, Musikclown, Kinderhund, Putzstall, 28 Monate – Nilpferdfisch, Fischwalross, 29 Monate – Bisslöwe, Himmeldach, Hilfsdoktor, 32 Monate – Spielelefant, Knetdinger, 33 Monate Spontanbildungen gibt es auch in der Erwachsenensprache, jedoch muss angenommen werden, dass kindlichen Spontankomposita andere Motive zugrunde liegen als Spontanäußerungen erwachsener Sprecher. So ist davon auszugehen, dass Kinder Spontanbildungen benutzen, um vorhandene Lemmalücken im Lexikon auszugleichen, während Spontanäußerungen Erwachsener vermutlich eher stilistisch motiviert sind, durch das Bedürfnis nach origineller Kennzeichnung des Referenten etc. In jedem Fall können aber kindliche Spontankomposita als Beweis dafür angesehen werden, dass das Kind das Wortbildungsmuster der Komposition verinnerlicht hat und für seine Zwecke nutzt. Spontanschöpfungen sind somit eher als Hinweis auf ein entstandenes Schema zu verstehen, weniger als rein kreativer Prozess (Tomasello 2000, 210). Aus diesem Grund ist es auch nicht verwunderlich, dass Spontankomposita zu einem späteren Zeitpunkt einsetzen als gewöhnliche Komposita, wie folgende Grafik zeigt:

98 

 Clemens Knobloch/Josephine Krüger

45

ungewöhnliche Komposita %

40 35 30 25 20 15 10 5 0

0

2

4

6

8

10

12

14

16

18

20

-5

22

24

26

28

30

32

34

36

38

40

42

44

46

48

50

52

54

Alter in Monaten

Abb. 6: Verhältnis ungewöhnliche Komposita zu gewöhnlichen Komposita

Von Bedeutung ist hier ganz besonders der Monat 40, in dem es ungefähr zu einem 50:50-Verhältnis zwischen gewöhnlichen und ungewöhnlichen Komposita kommt. Anschließend fällt die Anzahl der Spontanbildungen stark ab. Der Abfall lässt sich vermutlich damit begründen, dass das Repertoire der im mentalen Lexikon verfügbaren Standardnamen zwischenzeitlich deutlich größer geworden ist. Per Kompositionsschema improvisierte Benennungen und Bezeichnungen erübrigen sich dann weitgehend. Von Bedeutung ist im Übrigen auch, dass andere Arbeiten zu Spontanbildungen eine ähnliche Altersspanne feststellen (Elsen 1999). Auf den Status des Kompositionsschemas kommen wir im folgenden Abschnitt zurück.

5 Zusammenfassung Unvoreingenommen betrachtet handelt es sich bei den ‚kompositorischen‘ Prozessen des Sprechens um im Erwerbsverlauf mehrfach reorganisierte inkrementelle OnlineSyntax (im Sinne von Auer 2005), deren Dynamik mit reinen Offline-Strukturbeschreibungen gar nicht zu fassen ist. In der Erwerbsperspektive verschärft sich das (auch in der Mündlichkeit erwachsener Sprecher höchst reale) Problem, dass die Gestaltschließungsnormen des Symbolfeldes, die ‚Sätze‘, ‚Phrasen‘, ‚syntaktische Konstruktionen‘ überhaupt erst definieren, nicht als allein wirksam und operativ unterstellt werden können. In der gesprochenen Sprache sind Symbolfeldnormen ‚lebenslang‘ überlagert von interaktiven und kooperativen Schließungszwängen. In der Kindersprache beobachten wir umgekehrt, wie sich relativ eigenständige syntagmatische Konstruktionsmuster erst allmählich gegen die interaktive Aufmerksamkeitskoordination abheben. Es geht also darum, methodisch kontrollierbare Mittel und Wege zu finden, wie man die optische Täuschung des linguistischen Beobachters überwindet, die in allen kindlichen Äußerungen bereits den ‚Vorschein‘ der eigentlich erst zu erwerbenden (mehr oder weniger) abstrakten Konstruktionsmuster zu erkennen glaubt (Knobloch

Zum Erwerb syntaktischer Konstruktionen  

 99

2003). Der UG-Nativismus hat diese optische Täuschung radikalisiert. Der konstruktionsgrammatische Blick hingegen, fokussiert auf ausdrucksseitig ‚konkret‘ spezifiziertes Material und stark eingeschränkte (jedenfalls nicht abstrakt-kategoriale) Kombinatoriken, liefert da ein probates Gegenmittel. Aber man läuft natürlich auch Gefahr, über der Ablehnung angeborener Modularität die Schubkraft der Modularisierung im Lernprozess zu unterschätzen (Karmiloff-Smith 1992). Die Schwierigkeiten, die auch mit einer konstruktionsgrammatischen Modellierung früher syntaktischer Fähigkeiten verbunden sind, kann man an den kindlichen Augenblickskomposita erläutern, die, sobald eine Imitation des ganzen Ausdrucks ausscheidet, als Ausweis für eine Schemabildung interpretiert werden. Dieses Schema freilich ist rein positional, es enthält keine syntaktische Relatoren oder Zeichen und gleicht in vielem einfach der konkreten Standbein-Spielbein-Architektur von pivot-Konstruktionen, deren eines Element konkret gegeben ist. Zugleich stehen Augenblickskomposita jedoch auch für die vielleicht abstrakteste und allgemeinste zweigliedrige Konstruktion, die das Deutsche aufweist: die Juxtaposition von Bestimmungswort und Grundwort. Die eindrucksvolle Sammlung von gut dokumentierten Spontankomposita, die bereits Stern/Stern (1928, 394 ff.) präsentieren, lässt kaum einen Zweifel daran, dass solche Spontanbildungen mit hoher Regelmäßigkeit und Produktivität im frühen dritten Lebensjahr einsetzen. Ob man das freilich den ‚syntaktischen‘ Konstruktionen zurechnen möchte, bleibt umstritten. Weiterhin ist es beinahe unmöglich, im kindersprachlichen Material zwischen Beschränkungen zu unterscheiden, die artikulatorische Komplexität betreffen, und solchen, die syntaktische Komplexität betreffen. Im CAROLINE-Korpus gibt es (1;9,29) einen Passus, wo C. versucht, das Wort Nussschokolade nachsprechend zu artikulieren, immerhin ein Fünfsilber. Die Kette der Versuche verläuft ungefähr so: lade -> lade -> mamelade -> lade nuss -> lade nuss -> nüss lade -> nuss lade (mehrfach). Da der Gesamtzusammenhang hier eindeutig ‚Nachsprechen‘ und nicht ‚Neukonstruieren‘ beinhaltet, dürfte syntaktische Komplexität nicht beteiligt sein, aber es ist durchaus eine Ausnahme, wenn die Verhältnisse erkennbar so eindeutig sind. Das artikulatorische Format früher Monorheme dürfte jedenfalls auch ganz eigene Begrenzungen aufweisen, die mit der syntaktischen Ebene interagieren. Dass am Erwerb syntaktischer Konstruktionen sowohl genuin kombinatorische als auch dekompositorische Prozesse (wie das Auftauen und Flexibilisieren holistisch imitierter chunks) beteiligt sind, scheint in der Erwerbsforschung eine Art Minimalkonsens zu sein. Weit weniger Einigkeit besteht bezüglich der Wechselverhältnisse zwischen der zunehmenden Reichweite und Automatisierung syntaktischer Konstruktionen auf der einen, zunehmender Flexibilität und Zugänglichkeit für Variation, Reflexion und Ausbau auf der anderen Seite (vgl. hierzu das Modell der representational redescription von Karmiloff-Smith 1992). Es scheint ja evident, dass das Repertoire syntaktischer Konstruktionen im Erwerbsverlauf zugleich komplexer und reichhaltiger und „automatischer“ in dem Sinne wird, dass die Kombinatorik selbst weniger Aufmerksamkeit verbraucht. Die Automatisierung und Prozeduralisierung

100 

 Clemens Knobloch/Josephine Krüger

des Sprechens scheint Variabilität zu reduzieren, was von Gegenwirkungen ausgeglichen wird, in denen der Zugewinn an freier Aufmerksamkeit die gut gebahnten Konstruktionen wiederum variabler und flexibler macht. Außerdem zeigt speziell der schrittweise Aufbau der pränuklear kongruenzinte­ grierten Nominalphrasenstrukturen einen weiteren, mosaikartigen Modus des Erwerbs komplexer syntagmatischer Ordnungsstrukturen. Zusammengehalten wird dieses Feld durch die funktionale Klammer der gemeinsamen Referenzorganisation. Die Erwerbsaufgabe verschiebt sich hier schwerpunktmäßig auf die Probleme der Serialisierung, der Formabstimmung der Feldpositionen und der phrasalen Gestaltschließung nach den Rändern hin. Auf breiter Front findet man im kindlichen Sprechen praktisch alle möglichen ‚Ausschnitte‘ aus der kompletten DET – MOD – NUK – Reihe: DET allein, DET  – MOD, DET  – NUK, MOD allein, MOD  – NUK (andere (ka) ssette) und NUK allein. Die komplette Konstruktion erscheint in den Anfangsphasen offenbar gerne in namensähnlich festen Syntagmen wie der kleine Bär, die kleine Mickey Mouse, der kleine Finger. Selbstkorrektur und Selbstausbau ist ebenfalls lehrreich: [2] (COSIMA 3;3,3): ich muss noch (ei)n(ein) Kochlöff- (ei)n(en) neuen Kochlöffel holen

Auch evaluative passepartout-Adjektive (mein schönes Ei) sind hier nicht selten. Es gibt in den Anfangsphasen wenig oder nichts, was die kanonische Annahme der kognitiven Linguistik bestätigen würde, wonach Adjektive Objekt- und Referentenmerkmale kodieren sollen. Die Bahnung und Prozeduralisierung (entrenchment) eines Schemas kann man sich vorläufig so vorstellen, dass der kindliche Sprechapparat Ähnlichkeiten und Übereinstimmungen zwischen Instantiierungen (tokens) festhält und so generalisiert, dass auch neues ausdrucksseitiges Material in die entstandenen Bahnen ‚eingefüttert‘ werden kann. Wichtig festzuhalten ist, dass Bahnung, Etablierung und ‚Auftauen‘ solcher Schemata eine eigenständige und neue kognitive Lernaufgabe gegenüber der bloßen Imitation darstellt (Karmiloff-Smith 1992). Je mehr sich solchermaßen praktisches Konstruktionskönnen beim Sprecher akkumuliert, desto stärker bringt sich die top-down-Komponente des Norm- und Regelapparats gegenüber einfachen bottom-up-Generalisierungen zur Geltung (Behrens 2009). In der Dynamik des Sprechens steht ein kindliches Monorhem für die Verbindbarkeiten zwischen der Konstruktion, aus der es extrahiert wurde, und der empraktischen Konstellation, in der es gesprochen wird. Pragmatisch lenkt es Aufmerksamkeit auf einen gegebenen oder erreichbaren Punkt bzw. Aspekt der lokalen Handlungs- und Orientierungskoordination und unterstreicht zugleich den Anspruch auf die aktuelle Relevanz dieses hervorgehobenen Aspekts (Sperber/Wilson 1986). Die syntagmatische Elaboration einer Einwortäußerung kann an beiden Seiten dieses ‚dualen‘ Prozesses ansetzen. Die Konstruktionen der Nominalphrase sind in erster Linie ausgerichtet auf die Elaboration des Zeigens, Nennens, Beschreibens und Kon­struierens

Zum Erwerb syntaktischer Konstruktionen  

 101

von Referenzbezügen. Diverse Parameter solcher Bezüge werden konstruktiv ausdifferenziert: der diskursive Status von Referenzbezügen (DET), deren Zuordnung zu Teilnehmern (Possession), deren Konzeptualisierung, Bewertung, Beschreibung, Lokalisierung etc. Die von uns beschriebenen frühen Nominalphrasenkonstruktionen belegen aber auch, wie sehr sich die Gestaltschließungsnormen im Handlungs- und Aufmerksamkeitsfeld von denen des genuin syntaktischen Symbolfelds unterscheiden. Wenn ein Kind (COSIMA 2;6,10) mit Blick auf den abgelaufenen Kassettenrecorder neue oder dann neue (ka)ssette sagt, dann reicht das für die pragmatische Schließung. Der Handlungszusammenhang kann weiterlaufen. Rhematisiert ist der lokal relevante Aspekt des laufenden Geschehens, und der kann rein deiktisch, distinktiv-attributivorientierend, adjektivisch oder sortal adressiert werden. Die ‚komplette‘ Nominalphrase bietet einfach nur den gesamten ‚maximalisierten‘ Optionensatz für alle diese Operationen. Höchst strittig und unklar ist, welche Rolle die deskriptiv komplexe, aber relativ problemlos erwerbbare morphologische Integration des pränuklearen Feldes durch Kongruenz für die Erwerbsdynamik spielt. In der nativistischen Erwerbsforschung wird dieser Morphologie gelegentlich eine große Bedeutung zugemessen. Im Englischen, wo es nichts Entsprechendes gibt, verlangt die syntaktische Schließungsnorm ein dummy-Element (-one) für den Nukleus. Sprachhistorisch ist eine ausgeprägte Kongruenzmorphologie in diesem Feld vermutlich ein Überrest davon, dass alle Elemente auch separat referenzfähig sind bzw. waren. Die deutliche Markierung durch eine variable Schwasilbe am Wortausgang der adjektivischen Elemente ist jedenfalls auffällig und trennt die flexionslose prädikative Verwendung adjektivischer Wörter sauber von der referierenden Verwendung dieser Wörter. Seit Roger Browns (1973) klassischer Studie zum Erstspracherwerb gibt es die Beobachtung, dass, sobald diese Opposition etabliert ist, prädikative Nominalphrasen früher und reichhaltiger ausgebaut werden als Subjektsnominalphrasen. Die dafür angebotenen Erklärungen sind vielfältig und reichen von der Vermutung, dass Subjekte zu Referenzialität und ‚Gegebenheit‘ neigen, einen weniger expansionsbedürftigen slot bilden als Prädikate mit ihrer Neigung zu Introduktivität, Deskriptivität und ‚Neuheit‘, bis zu der Beobachtung, dass prädikative Nominalphrasen am Satz­ ende in der Regel per se salienter (und ‚schwerer‘) und somit zur Extraktion geeigneter sind (was sich ja nicht ausschließt). Wenn Roger Browns Beobachtung stimmt, dann wäre vielleicht die Erwartung begründet, dass Elaboration und Aufbau von Subjektsnominalphrasen eher ‚von links nach rechts‘, also von der DET- zur NUKPosition erfolgt, während prädikative Nominalphrasen umgekehrt ‚von rechts nach links‘ ausgebaut werden, von der NUK- zur (häufig unbestimmt besetzten) DET-Position. Um eine solche These zu prüfen, müsste man freilich Material untersuchen, das aus späteren Erwerbsphasen stammt, in denen die Opposition von introduktiv/prädikativ und referenziell auf der Konstruktionsebene klar etabliert ist. (Für nützliche Hinweise zu diesem Text danken wir Heike Behrens.)

102 

 Clemens Knobloch/Josephine Krüger

6 Literatur Auer, Peter (2005): Syntax als Prozess. In: InList 41. http://www.inlist.uni-bayreuth.de/issues/41/ index.htm [19.11.2014]. Behrens, Heike (2009): Konstruktionen im Spracherwerb. In: Zeitschrift für germanistische Linguistik 37 (3), 427–444. Best, Karl-Heinz (2001): Zur Einführung. In: Karl-Heinz Best (Hg.): Häufigkeitsverteilungen in Texten. Göttingen. Best, Karl-Heinz (2006): Wie viele Morphe enthalten Wörter in deutschen Pressetexten? In: Glottometrics 13, 47–58. Bittner, Dagmar (1998): Entfaltung grammatischer Relationen im NP-Erwerb: Referenz. In: Folia Linguistica XXXI, 255–283. Bittner, Dagmar (1999): Erwerb des Konzepts der Quantifikation nominaler Referenten im Deutschen. In: Jörg Meibauer/Monika Rothweiler (Hg.): Das Lexikon im Spracherwerb. Tübingen/Basel, 51–74. Brown, Roger (1973): A First Language. The Early Stages. Cambridge. Bühler, Karl (1934): Sprachtheorie. Die Darstellungsfunktion der Sprache. Jena. Clark, Herbert H./Deanna Wilkes-Gibbs (1986): Referring as a collaborative process. In: Cognition 22, 1–39. Dabrovska, Eva (2000): From formula to schema: The acquisition of English questions. In: Cognitive Linguistics 11, 83–102. Diessel, Holger (2007): Komplexe Konstruktionen im Erstspracherwerb. In: Kerstin Fischer/Anatol Stefanowitsch (Hg.): Konstruktionsgrammatik: Von der Anwendung zur Theorie. Tübingen, 39–54. Diessel, Holger (2013): Construction grammar and first language acquisition. In: Graeme Trousdale/ Thomas Hoffmann (Hg.): The Oxford Handbook of Construction Grammar. Oxford, 347–364. Diessel, Holger/Michael Tomasello (2000): The development of relative constructions in early child speech. In: Cognitive Linguistics 11, 131–152. Elsen, Hilke (1999): Ansätze zu einer funktionalistisch-kognitiven Grammatik. Konsequenzen aus Regularitäten des Erstspracherwerbs. Tübingen. Kaltenbacher, Erika (1990): Strategien beim frühkindlichen Syntaxerwerb: eine Entwicklungsstudie. Tübingen. Karmiloff-Smith, Annette (1979): A Functional Approach to Child Language. Cambridge. Karmiloff-Smith, Annette (1992): Beyond Modularity. A Developmental Perspective on Cognitive Science. Cambridge. Kaznelson, Solomon D. (1974): Sprachtypologie und Sprachdenken. München. Keibel, Jens-Holger (2007): Distributional Patterns in German Child Directed Speech and their Usefulness for Acquiring Lexical Categories: A Case Study. Freiburg (Dissertation, 2005). http://www.freidok.uni-freiburg.de/volltexte/2988 [19.11.14]. Knobloch, Clemens (2003): Das Ende als Anfang. Vom unglücklichen Verhältnis der Linguistik zur Realität der sprachlichen Kommunikation. In: Angelika Linke/Hanspeter Ortner/Paul R. Portmann-Tselikas (Hg.): Sprache und mehr. Ansichten einer Linguistik der sprachlichen Praxis. Tübingen, 99–124. Langacker, Ronald W. (2008): Cognitive Grammar. A Basic Introduction. New York. Lange, Bettina (2007): Machen, haben, gehen, kommen. Einige „Passepartout“-Verben im Primärspracherwerb des Deutschen. Frankfurt. Lehmann, Christian (1985): On grammatical relationality. In: Folia Linguistica XIX, 67–109. Maas, Utz (2010): Literat und orat: Grundbegriffe der Analyse geschriebener und gesprochener Sprache. In: Grazer Linguistische Studien 72, 21–150.

Zum Erwerb syntaktischer Konstruktionen  

 103

MacWhinney, Brian/Elizabeth Bates (1989): The Crosslinguistic Study of Sentence Processing. New York. Ninio, Anat (1999): Pathbreaking verbs in syntactic development and the question of prototypical transitivity. In: Journal of Child Language 26, 619–653. Ninio, Anat (2005): Testing the role of semantic similarity in syntactic development. In: Journal of Child Language 32, 35–61. Peters, Anne (1983): The Units of Language Acquisition. Cambridge. Sahel, Said (2010): Ein Kompetenzstufenmodell für die Nominalphrasenflexion im Erst- und Zweitspracherwerb. In: Ulrich Mehlem/Said Sahel (Hg.): Erwerb schriftsprahlicher Kompetenzen im DaZ-Kontext. Diagnose und Förderung. Freiburg, 185–209. Schlipphak, Karin (2008): Erwerbsprinzipien der deutschen Nominalphrase. Erwerbsreihenfolge und Schemata – die Interaktion sprachlicher Aufgabenbereiche. Stuttgart. Slobin, Dan I. (1985 ff.): The Crosslinguistic Study of Language Acquisition. Bände I–V. Hillsdale. Sperber, Dan/Deirdre Wilson (1986): Relevance: Communication and Cognition. Oxford. Stern, Clara/William Stern (1928): Die Kindersprache. Leipzig. Tomasello, Michael (2000): Do young children have adult syntactic competence? In: Cognition 74, 209–253. Tomasello, Michael (2003): Constructing a Language. Cambridge. Tomasello, Michael (2007): Konstruktionsgrammatik und früher Erstspracherwerb. In: Kerstin Fischer/Anatol Stefanowitsch (Hg.): Konstruktionsgrammatik. Von der Anwendung zur Theorie. Tübingen, 19–38. Tracy, Rosemarie (1991): Sprachliche Strukturentwicklung: Linguistische und kognitionspsychologische Aspekte einer Theorie des Erstspracherwerbs. Tübingen. Tracy, Rosemarie (2002): Deutsch als Erstsprache: Was wissen wir über die wichtigsten Meilensteine des Erwerbs? In: Universität Mannheim. Informationsbroschüre 1/2002 der Forschungs- und Kontaktstelle Mehrsprachigkeit. Mannheim. Waxman, Sandra R./Dana B. Markow (1995): Words as invitations to form categories: Evidence from 12- to 13-month-old infants. In: Cognitve Psychology 29, 257–302. Werner, Heinz/Bernard Kaplan (1963): Symbol Formation. New York/London.

Renata Szczepaniak

5. Syntaktische Einheitenbildung ‒ typologisch und diachron betrachtet Abstract: In diesem Beitrag wird der Wandel des deutschen Satzbaus betrachtet. Dank eines reichen deutschsprachigen Schrifttums, das bereits im 8. Jahrhundert ansetzt, ist die Entwicklung der syntaktischen Einheiten gut dokumentiert. Es wird gezeigt, dass mit dem Übergang von der (medialen) Mündlichkeit zur (medialen) Schriftlichkeit, d. h. mit der zunehmenden Literarisierung der deutschsprachigen Bevölkerung die Satzkomplexität kontinuierlich ansteigt. Der wachsende Einsatz des schriftlichen Mediums und seine thematische und funktionale Ausdifferenzierung (darunter die Diversifizierung von Textsorten) fördern den Gebrauch von hypotaktischen Strukturen. Dabei entwickeln sich formale Marker der Satzkomplexität, die in dem immer komplexeren Satzgefüge hypotaktische von parataktischen Strukturen unterscheiden lassen. Zu den Nebensatzmarkern gehören v. a. die Verb-Letzt-Stellung und die formal und funktional eindeutigen Nebensatzeinleiter. Im Gegensatz dazu wird die Stellung des finiten Verbs im übergeordneten Satz zu einem wichtigen Marker von Satztypen funktionalisiert: Das finite Verb im Hauptsatz ist an der Markierung der illokutionären Funktion beteiligt. 1 Einleitung 2 Der Übergang von der Mündlichkeit zur Schriftlichkeit 3 Syntaktische Komplexität 4 Formale Markierung der Nebensätze 5 Formale Markierung des Hauptsatzes 6 Zusammenfassung 7 Literatur

Die mittelhochdeutsche Sprache ist eine Sprache, die dem Ohr verständlich sein will, ihre Syntax ist eine Syntax, deren Gliederung nur gehört klar erscheint. […] Die moderne Sprache Deutschlands, die im 14. Jh. entsteht, ist eine Sprache der Schrift […]. (Burdach 1925, 201)

1 Einleitung In einem Schreiben vom 11. März 1411, in dem sich der Trierer Erzbischof Werner und der Kurfürst Ludwig von der Pfalz an die Stadt Frankfurt wenden, um die ungesetzlichen Neuwahlen des römischen Königs zu verhindern, ist einer der komplexesten Sätze der geschriebenen deutschen Sprache enthalten. Das „kolossale“ Satzgefüge besteht aus 44 Elementarsätzen, die insgesamt 790 Wortformen umfassen (s. Admoni

Syntaktische Einheitenbildung ‒ typologisch und diachron betrachtet 

 105

1980, 44–50). Der Satz zeichnet sich nicht nur durch einen enormen Umfang aus; er stellt vor allem ein hochgradig komplexes Satzgefüge dar, in dem die Unterordnung der Nebensätze bis hin zum 15. Grad reicht. Ein solcher Satz, der fast zwei Druckseiten einnimmt und hier deswegen nicht in voller Länge zitiert werden kann, ist in spontaner Face-to-Face-Kommunikation, der prototypischen Form mündlicher Kommunikation (Dürscheid 2012; Fehrmann/Linz 2009), weder produzierbar noch rezipierbar. Der online-Charakter der gesprochenen Sprache (Auer 2000) setzt hier ‚natürliche‘ Grenzen sowohl für die Produktion eines solchen Satzes als auch für seine Verarbeitung. Der Satz erfordert eine Planung mit (vermutlich) mehreren Korrekturdurchgängen und ist vielmehr zum ‚stillen Lesen‘ gedacht, einer Form der Sprachrezeption, die es ermöglicht, bei Bedarf zurückzuspringen, um die inhaltlichen Zusammenhänge zu rekonstruieren. Der Lesevorgang wird dabei durch formale Mittel unterstützt, die die syntaktische Einheit des ‚Großganzsatzes‘ sichtbar machen. Dies sind Merkmale, die den Nebensatz auszeichnen: in erster Linie die Verb-Letzt-Stellung sowie die Subjunktionen und Relativpronomina, darüber hinaus aber auch die konjunktivi­schen Verbformen. Dank der formalen Nebensatzmarker kann die Verflechtung und Verschachtelung von Gliedsätzen, wie sie im folgenden Ausschnitt aus dem erwähnten Ganzgroßsatz zu beobachten ist, beim Lesen nachvollzogen werden. Der besagte Ausschnitt erstreckt sich vom ersten Teil des Nebensatzes des 11. Grades bis hin zum letzten Teil des Nebensatzes des 12. Grades, in den die Nebensätze des 13. Grades eingebettet sind: […] 11a / herdoch die vorgeschrieben von Mencze und von Colle erzbischofe, zunemende unachber lte und sich vermessende / 12 / das die etlicher anderer kurfursten macht haben soltent / 13 / (das sich doch nit funden hat noch furbracht ist), / 11b / nach etlichen tagen der vorgeschrieben unserr wale marggraff Josten seligen von Merhern, / 12 / der kurzlich virfaren ist, / 11c / z Romischem konige ufzuwerfende understundent, / 12a / des sie noch alle kurfursten / 13 / ob sie eindrechteclich zusammenkommen werent, / 12b / keine machte hettent von rechtes wegin […]

Für die Kennzeichnung der Nebensätze in dieser Zeitperiode (frühes 15. Jh.) ist die Verb-Letzt-Stellung bzw. eine späte Verb-Stellung besonders wichtig. So sind der zwei Mal unterbrochene 11. Nebensatz (11a + 11b + 11c) sowie die ihm untergeordneten Sätze 12 und 13 durch die Endstellung des flektierten Verbs eindeutig als Neben­ sätze markiert: understundent (11c), soltent (12), ist (13 und 12). In Satz 12b folgt dem finiten Verb hettent hingegen noch eine Präpositionalphrase von rechtes wegin (sog. Verb-Spätstellung). Einige Sätze werden zusätzlich durch Nebensatz einleitende Elemente, u. a. Subjunktionen (s. das in Satz 12 und ob in Satz 13) markiert. Das Inventar der Subjunktionen ist jedoch zu diesem Zeitpunkt noch nicht stark funktional ausdifferenziert, so dass meist die (unterspezifizierte) Subjunktion das eingesetzt wird. Zugleich lässt sich diese Subjunk­tion aber nicht graphisch vom Relativpronomen das unterscheiden. Nur in einem Fall wird der Nebensatz durch die konjunktivische Verbform markiert: Auf diese Weise treten im Elementarsatz 13 alle drei formalen Neben-

106 

 Renata Szczepaniak

satzmarker auf: ob (Subjunktion) sie eindrechteclich zusammenkommen werent (LetztStellung des finiten Verbs im Konjunktiv). Diese elaborierte „Syntax für das Auge“ (Betten 1987, 161, in Anlehnung an Burdach 1925, 201), d. h. komplexe, mehrfach verschachtelte Satzgefüge, mit denen zusammenhängende Inhalte adäquater wiedergegeben werden können, ist ein Phänomen der Schriftsprache, die zu diesem Zeitpunkt allem voran in Verwaltungstexten einen hohen Entwicklungsgrad erreicht hat. Im Falle des zitierten, politisch motivierten Schreibens fordern die Autoren die Stadt Frankfurt auf, sich nicht an den aus ihrer Sicht ungesetzlichen Neuwahlen des römischen Königs zu beteiligen, sondern die bereits erfolgte Wahl von König Sigmund von Ungarn zu akzeptieren (s. Admoni 1980, 44). Wie sich die schriftsprachliche syntaktische Komplexität herausbildet und was sie fördert, soll in diesem Beitrag verfolgt werden. Da in der deutschen Sprachgeschichte das Schriftmedium bereits früh zum Einsatz kam  – die ersten Schriftzeugnisse in der (althoch-)deutschen Sprache stammen aus dem 8.  Jahrhundert  –, ist die Entwicklung der syntaktischen Einheiten gut dokumentiert. Dieser Beitrag wird zeigen, dass mit dem Übergang von der (medialen) Mündlichkeit zur (medialen) Schriftlichkeit, d. h. mit der zunehmenden Literarisierung der deutschsprachigen Bevölkerung und dem damit einhergehenden wachsenden Einsatz und der thematischen und funktionalen Ausdifferenzierung des schriftlichen Mediums (darunter auch der fortschreitenden Diversifizierung von Textsorten), die Zunahme an komplexen (hypotaktischen) Strukturen, die Herausbildung von Nebensatzmarkern sowie die damit verbundene Entwicklung eines Inventars von funktional spezifizierten Nebensatzeinleitern vonstattenging.

2 Der Übergang von der Mündlichkeit zur Schriftlichkeit Die Erforschung der 1500-jährigen Geschichte der deutschen Sprache basiert fast ausschließlich auf schriftlichen Belegen. Die Möglichkeit der Fixierung gesprochener Sprache mit Hilfe von Tonaufnahmegeräten besteht erst seit dem Ende des 19. Jhs.; sie betrifft dementsprechend nur einen kleinen Bruchteil der jüngsten Sprachgeschichte. Diese Datenlage bildet die Verhältnisse zwischen der mündlichen und schriftlichen Sprachverwendung im Verlauf der deutschen Sprachgeschichte nicht ab. Vielmehr kann für einen großen Teil davon vom Primat des Mündlichen ausgegangen werden, da die Mehrheit der Bevölkerung noch bis ins 16. Jh. hinein illiterat war. Im Mittelalter beschränkte sich sogar der Kontakt des Großteils der nicht alphabetisierten Gesellschaftsschicht mit der Schrift lediglich auf den (häufig nur vereinzelten) Umgang mit jenen, deren „Sprach- und Kommunikationsformen mehr oder weniger von Schriftlichem geprägt waren (z. B. Priestern)“ (Betten 2000, 1648). Nur ein Bruchteil der Lese- und Schreibunkundigen, v. a. die Herrscher und der Adel, kam in Berührung

Syntaktische Einheitenbildung ‒ typologisch und diachron betrachtet 

 107

mit schriftlich konzipierten (darunter auch volkssprachlichen) Texten, so dass ihre mündliche Sprachform davon beeinflusst werden konnte. Die dünne literate Gesellschaftsschicht (v. a. Klerus) war wiederum in sich sehr heterogen: Sie umfasste zum einen Nur-Lesefähige (viele Priester), Skriptoren, u. a. schreibkundige Mönche, die lediglich mehr oder weniger mechanisch Texte abschrieben, und zum anderen auch Schreibende, die in unterschiedlichem Maße mit lateinischen Texttraditionen vertraut und sogar zur Textproduk­tion in der althochdeutschen Volkssprache befähigt waren (Betten 2000, 1648). Im Althochdeutschen (unter Karl dem Großen) setzte die volkssprachliche Schriftlichkeit an, die nach einer Unterbrechung seit 1000 einer kontinuierlichen Entwicklung (lange noch neben und damit unter dem Einfluss der lateinischen Schriftlichkeit) unterlag (Scholz 1994). Die zunächst exklusive (v. a. klerikale) Schriftlichkeit wurde mit der Entwicklung der höfischen (weltlichen) Literatur Ende des 12. Jhs. sowie v. a. mit dem Einsatz der Schrift im Wirtschafts- und Finanzwesen seit dem 13. Jh., dann auch im Verwaltungsund Rechtswesen, allmählich überwunden (s. Knoop 1994, 861–863). Die Erfindung des Buchdrucks in der Mitte des 15. Jhs. bewirkte nicht unmittelbar ein erhöhtes Inte­ resse am Lesen- und Schreibenlernen, denn die (übrigens kostspieligen) Druckerzeugnisse waren zum großen Teil noch im exklusiven Latein geschrieben, nur etwa 5,6 % aller bis 1520 gedruckten Bücher waren auf Deutsch geschrieben (s. Knoop 1994, 863). Im ausgehenden 15. Jh., d. h. nach der Erfindung des Buchdrucks, war der Anteil der Lesekundigen immer noch sehr gering. Die Schätzungen oszillieren zwischen 1 % bis 4 % der Gesamtbevölkerung, wobei die Alphabetisierung in dieser Zeit ein typisch städtisches Phänomen war (s. Gauger 1994; Knoop 1994). So gab es in Nürnberg, das 1487 ca. 40.000 Einwohner hatte, „vier tausend lerkneblein und maidlein“ (Endres 1983, 150, zit. nach Knoop 1994, 863). Dabei war die Anzahl der Schreib- und Lesekundigen nicht mit der der Schreibenden und Lesenden gleichzusetzen. So nimmt Schön (1987, 37) an, dass es um 1500 nur etwa 1 % bis 2 % regelmäßige Leser von ‚berufsbezogener Lektüre‘, von religiösen und Sachtexten gab, um 1600 waren es etwa 2 % bis 4 %. Nur ein Bruchteil davon las literarische Texte (s. Griese/Henkel i. Dr.). Bezüglich der Herausbildung und Ausdifferenzierung von Textsorten spielte die frühneuhochdeutsche Epoche eine wichtige Rolle. Zu den im Alt- und Mittelhochdeutschen bekannten Textsorten wie Heldenepen, Segensformeln und Ge­setzestexten kam es mit dem Einsatz der neuen Medien (v. a. Zeitungen seit 1609) zur sprunghaften Diversifizierung der Textsorten (s. Fritz 2001; Nübling u. a. 2013, 195–207). Grundlegend veränderte sich die Situation aber erst im 18. Jh. (s. Knoop 1994, 867–869). In diese Zeit fällt die rasche Entwicklung des Zeitungs- und Zeitschriftenwesens mit einer wachsenden Leserschaft (ca. 3 Mio. Leser). Die Entstehung des modernen Staatswesens und die damit verbundene Bürokratisierung förderte die Notwendigkeit eines literaten Bürgers. Die Einführung der Schulpflicht im Laufe des 17./18. Jhs. führte dazu, dass Mitte des 18. Jhs. in bestimmten Regionen sogar schon mehr als 60 % der ländlichen Bevölkerung schreibfähig war. Dabei vollzog sich die Individualisierung des Lesens. Das ‚laute‘ Lesen und Vorlesen als Lesetechnik

108 

 Renata Szczepaniak

und Leseverhalten ging ins ‚stille‘ (individuelle) Lesen über (Schön 1987, 99–122). Während die Verständlichkeit eines Textes bei Hörrezep­tion umso höher ist, je einfacher, mündlichkeitsnäher die Satzorganisation ist, können Texte, die zur Leserezeption bestimmt sind, durch erhöhte Satzkomplexität eine höhere Informationsdichte bieten. Es ist also anzunehmen, dass sich die veränderten Rezeptionsbedingungen in der syntaktischen Organisation der Texte niederschlugen, indem sie die Verwendung komplexer Sätze förderten. Wie im Folgenden gezeigt wird, entwickelten sich mit dem Übergang von der (medialen) Mündlichkeit zur (medialen) Schriftlichkeit sowie der von der Semi-Oralität nichtlesekundiger Rezipienten (die einen schriftlich konzipierten Text vorgelesen oder z. B. als Schauspiel vorgeführt bekommen) zum individuellen (stillen) Lesen Phänomene der schriftsprachlichen Syntax. Die komplexen hypotaktischen Strukturen wurden nicht nur immer häufiger, sondern es entstanden und verfestigten sich allmählich formale Merkmale der Nebensätze.

3 Syntaktische Komplexität 3.1 Syntaktische Komplexitätsgrade: Parataxe, Hypotaxe und Subordination Die syntaktische Komplexität einer Äußerung hängt grundsätzlich davon ab, ob und wie Satzeinheiten miteinander verknüpft und verschränkt werden. Werden sie wie in 1) nacheinander produziert, ohne formale Kennzeichen der Zusammengehörigkeit, ergibt sich der geringste Grad der syntaktischen Komplexität: Beide Satzeinheiten sind syntaktisch voneinander unabhängig, stehen also im Verhältnis der Parataxe zueinander. Sie sind lediglich pragmatisch (in der gesprochenen Sprache auch intonatorisch) miteinander verbunden. Dass der zweite Satz die Rechtfertigung für die im ersten Satz berichtete Handlung liefert, können Hörer/Leser nur unter Bezug auf ihr Weltwissen annehmen. Wird der Abhängigkeits­charakter von Satz 2, der die Begründung für den Satz 1 transportiert, formal markiert wie in 2), besteht eine hypotaktische Satzorganisation. Ist eine Satzeinheit (Satz 2) sogar in eine andere (Satz 1) integriert, indem sie einen unverzichtbaren Teil dieser, z. B. das Objekt wie in 3), bildet, steht sie zu dieser im Verhältnis der Subordina­tion. So ist die übergeordnete Satzeinheit *Ich habe nicht gewusst aufgrund der Valenz von wissen ohne (den) Objekt(-satz) nicht vollständig, vgl. Ich habe es nicht gewusst oder Ich habe nicht gewusst, dass… Parataxe 1) Satz 1 Ich habe schon gegessen. Satz 2 Ich hatte einen Riesenhunger.

Syntaktische Einheitenbildung ‒ typologisch und diachron betrachtet 

 109

Hypotaxe 2) [Ich habe schon gegessen]Satz 1, [weil ich einen Riesenhunger hatte]Satz 2. Subordination 3) [Ich habe nicht gewusst, [dass du schon gegessen hast]Satz 2]Satz 1.

Mit Subordination ist der höchste Grad der syntaktischen Abhängigkeit einer satzwertigen Einheit von einer anderen satzwertigen Einheit gegeben. Je höher der Bindungsgrad zwischen beiden Einheiten (Komplexität 1) und je tiefer die Unterordnung reicht (Komplexität 2), umso komplexer ist die Struktur des Gesamtsatzes. Ein noch höherer Abhängigkeitsgrad als der der Subordination geht mit der Desententialisierung einher (Näheres dazu s. Lehmann 1988, 1995). wachsender Grad der syntaktischen Komplexität Parameter: syntaktische Abhängigkeit syntaktische Unterordnung

Parataxe – – unabhängige Sätze

Hypotaxe + – abhängiger Nebensatz

Subordinaton + + untergeordneter Nebensatz

Abb. 1: Syntaktische Komplexitätsgrade (nach Hopper/Traugott 2003, 178)

3.2 Syntaktischer Komplexitätsgrad und das Medium Die Bildung komplexer Sätze erfordert vom Produzenten einen hohen Planungsaufwand. Jeder von uns kennt gut die Erfahrung, bei der mündlichen Produktion von komplexen Sätzen ‚den Faden verloren‘ zu haben. Noch bewusster erleben das L2-SprecherInnen. Auch ist die Rezeption komplexer Sätze mit erhöhter Konzen­ tration und Gedächtnisarbeit verbunden. Das schriftliche Medium (auch in spontaner computergestützter Kommunikation, s. dazu u. a. Beißwenger 2010) gibt uns hingegen Raum für Korrekturen (seitens des Schreibenden) und für die Reflexion des Lesenden über das Geschriebene. Dies ist der Grund, warum das schriftliche Medium den Gebrauch von komplexen Sätzen fördert. Es ist anzunehmen, dass die Tendenz zur syntaktischen Markierung (Explizitmachung) der semantisch/pragmatischen Abhängigkeiten mittels Hypotaxe historisch mit dem wachsenden Geltungsgrad des schriftlichen Mediums einhergeht (Hundsnurscher 1998, 768). Hingegen verfügt die gesprochene Sprache über u. a. prosodische, lexikalische, aber auch non- und paraverbale Mittel, um die Zusammengehörigkeit und Abhängigkeit von Gedanken, die in formal unabhängigen Sätzen ausgedrückt werden, zu markieren. Wie Mithun (1984) zeigt, werden formal komplexe Sätze von Sprechern schriftloser Sprachen (mit oder sogar trotz einer reichen oralen Tradi­tion) sehr selten gebildet. Sie beobachtet, dass Sprecher von Mohawk (Nordamerika), Gunwinggu (Australien) und Kathlamet

110 

 Renata Szczepaniak

(Nordamerika) gewöhnlich formal unabhängige Sätze gebrauchen, deren inhaltliche Zusammengehörigkeit intonatorisch, lexikalisch, non- und paraverbal markiert wird. In ihren (oralen) Texten machen komplexe Sätze etwa 7 % aller Sätze aus. Der Anteil komplexer Sätze im gesprochenen American English liegt hingegen deutlich höher; laut Studie von Chafe (1982) bei 34 %. Dies ist zwar deutlich weniger als in Briefen (46 %), jedoch viel höher als in rein oralen Sprachen. Dass die gesprochene Sprache von der Schriftsprache in dieser Hinsicht beeinflusst wird, beobachtet auch Mithun (1984, 508): Sie stellt bei einem Kathlamet-Sprecher, der keine Erfahrung mit einer schriftsprachlichen Tradition machte, den niedrigsten Anteil an komplexen Sätzen fest. Etwas höher liegt dieser in Gungwinggu-Texten, produziert von Sprechern, die zusätzlich (zumindest rudimentär) Englisch beherrschen. Dass der Gebrauch von komplexen Sätzen mit dem Erwerb (d. h. aus ontogenetischer Perspektive) schriftsprachlicher Tradition steigt, zeigt sich bei Mohawk-Sprechern, die auf Englisch ­schreiben. In ihren in Mohawk verfassten Texten erreichen komplexe Sätze den Anteil von 30 %.

3.3 Syntaktische Komplexität in der Geschichte der deutschen Schriftsprache Übertragen auf die deutsche Sprachgeschichte, die durch einen allmählichen Übergang von der Mündlichkeit in die volkssprachliche Schriftlichkeit, unter dem Einfluss der lateinischen Schriftkultur, gekennzeichnet ist, ist anzunehmen, dass der Anteil an hypotaktisch organisierten Sätzen in der deutschen Schriftsprache allmählich angestiegen ist. So beobachtet Ebert (1978, 21), „dass das Ahd. (Althochdeutsche; R. S.) eine Vorliebe für die Parataxe zeigt. Sie begegnet nicht nur in der Dichtung, die parataktische Konstruktionen aus der altgerm. und der lat. Dichtungstradition schöpft  […], sondern auch als Übersetzung von lateinischen hypotaktischen Kon­ struktionen“. Systematische Untersuchungen zeigen, dass das geschriebene Althochdeutsch (500–1050) von der systemischen Möglichkeit, komplexe Satzgefüge zu bilden, noch verhältnismäßig wenig Gebrauch machte: So finden sich in Otfrids Evangelienharmonie (9. Jh.), einem der elaboriertesten und auch umfangreichsten Texte des Althochdeutschen, zwar insgesamt 4033 Nebensätze, doch sind dies überwiegend, in 76,3 % der Fälle, Nebensätze ersten Grades. Lediglich 21,4 % der Nebensätze weisen den 2. Unterordnungsgrad und 2,1 % den 3. Unterordnungsgrad auf. Vereinzelt treten aber auch Sätze des 4. und sogar drei Sätze des 5. Unterordnungsgrades auf (Wunder 1965, 423; Admoni 1990, 66). Im Mittelhochdeutschen (1050–1350) waren die meisten Prosatexte zum mündlichen Vortrag bestimmt, d. h. sie weisen eine „Neigung zur Parataxe“ (Admoni 1990, 117) auf. Im Prosa-Korpus des 11. und 12. Jhs. beobachtet Rockwood (1975), dass die syntaktische Komplexität in Texten der Unterweisung und Belehrung geringer war als in Gebets- und Gesetzestexten. Mit den Urkunden entwickelt sich seit dem Mittel-

Syntaktische Einheitenbildung ‒ typologisch und diachron betrachtet 

 111

hochdeutschen eine Textsorte, die sich durch die Tendenz zur umfangreichen und komplizierten Satzgestaltung von anderen besonders abhebt (Admoni 1990, 85). Bereits im frühen Frühneuhochdeutschen (1350–1500) zeichnete sich die Urkundensprache durch den „massenhaften […] Gebrauch der Satzgefüge“ (Admoni 1990, 150) aus, wohingegen der Großteil der nicht-kanzleisprachlichen Texte im 14./15. Jh. noch auf die Bedingungen der Hörrezeption eingestellt war (Betten 2000, 1651). Admoni (1967) untersucht die syntaktische Komplexität und die Länge des sog. Elementarsatzes, d. h. einer satzwertigen Satzeinheit, die entweder selbstständig oder ein Glied eines zusammengesetzten Satzes ist, in der deutschen Literatursprache vom 14. bis zum Ende des 18. Jhs. (zur Zusammenstellung des Untersuchungskorpus s. Admoni 1967, 156–157). Als treibende Kraft für die von ihm beobachtete Ausdehnung des Elementarsatzes nennt Admoni (1967, 166) das „wachsende […] Bedürfnis […] der Literatursprache, den immer komplizierteren und ‚verzweigteren‘ Denkinhalt in seinen Zusammenhängen auch strukturell zusammenhängend wiederzugeben“. Die Verwendung von hypotaktischen Strukturen, die zu komplexen Satzgefügen (ähnlich wie in dem zu Beginn zitierten Satz aus dem 15. Jh.) anwachsen können, führt er auf dasselbe Bedürfnis zurück. Seine quantitative Untersuchung umfasst zum einen den Hypotaxekoeffizienten (HK), der den Anteil hypotaktisch gebauter Sätze in der Gesamtzahl der Elementarsätze errechnet, und zum anderen den Koeffizienten der Unterordnung des ersten Grades (UKI), der die Häufigkeit der untergeordneten Sätze des ersten Grades unter allen untergeordneten Sätzen bestimmt. Der UKI zeigt damit an, wie hoch die relative Häufigkeit von mehrfach untergeordneten Sätzen ist, und somit die Tendenz zur verschachtelten „Syntax fürs Auge“. In der Literatursprache des 14. und 15. Jhs. schwankt der Hypotaxekoeffizient zwischen 0,34 und 0,8. Vergleichend dazu weisen Urkunden mit 0,75 einen tenden­ ziell höheren Anteil an Nebensätzen auf. In der Literatursprache machen Nebensätze des ersten Grades mehr als die Hälfte aller Nebensätze aus (UKI < 0,5), was auf eine vorwiegend einfache Struktur des Satzgefüges hinweist. Wie Admoni (1967, 167) feststellt, ist die Hypotaxe in den Texten, die der mündlichen Erzählung am nächsten stehen (v. a. in Schwänken), am schwächsten ausgeprägt. Auch im 16. Jh. lassen sich große Schwankungen des HK feststellen. Dabei macht sich in einzelnen Gattungen (in Traktaten, Reisebeschreibungen und in der Kunstprosa) eine Tendenz zur stärkeren Verwendung der Hypotaxe erkennbar. Ein rascher Aufschwung der Hypotaxe ist im 17. Jh. (dem Jahrhundert der Einführung der Schulpflicht) zu beobachten, gleichzeitig wächst der Anteil an Nebensätzen höheren Grades. Das Satzgefüge wird zunehmend komplex. Was bisher nur in Kanzleitexten bekannt war, wird in anderen Textsorten übernommen. Dabei stellt das 17. Jh. „die Blütezeit des überlangen und mehrgliedrigen Satzgefüges“ dar (Admoni 1985, 1540), in der sich auch unvollkommene Großsätze mehren, mitunter solche, die nur aus einem Bündel von Nebensätzen (ohne Hauptsatz) bestehen, oder solche, in denen die Nebensätze höheren Grades vor den Neben­sätzen niedrigeren Grades stehen. Das folgende 18. Jh. überwindet die „Übertreibungen“ des Unterordnungsgrades, gleichzeitig nehmen auch die unpräzise

112 

 Renata Szczepaniak

gestalteten Satzgefüge ab, so dass sie zu Beginn des 19. Jhs. vollständig abgebaut sind (Admoni 1985, 1544).

4 Formale Markierung der Nebensätze Mit dem zunehmenden Gebrauch von komplexen Satzgefügen, der in Textsorten mit hohem Grad an konzeptioneller Schriftlichkeit (v. a. Urkunden) besonders früh eingesetzt hat, gingen weitere syntaktische Entwicklungen im Bereich der Nebensätze einher. So fanden am linken Rand des Nebensatzes zahlreiche Grammatikalisierungen statt, durch die der Bestand der Nebensatz einleitenden Elemente (Subjunk­ tionen) wesentlich erweitert und funktional ausdifferenziert worden ist. Dank ihrer Spezifizierung fördern sie die Dekodierung der komplexen Sätze, weil sie die Funktion des Nebensatzes offenlegen. So ist bspw. ob ein Einleiter von abhängigen Fragesätzen, während weil Begründung signalisiert (s. Abschnitt 4.1). Am rechten Rand des Nebensatzes setzte sich hingegen die Letzt-Stellung des finiten Verbs durch, z. B. habe in weil ich mir einen Hund gewünscht habe. Im Rezeptionsprozess signalisiert diese Wortstellungsregularität, dass die nun abgeschlossene Informationseinheit verarbeitet werden kann (s. Abschnitt 4.2).

4.1 Subjunktionen Im Althochdeutschen war das Feld der Subjunktionen erst ansatzweise entwickelt. Die häufigste Subjunktion war das ahd. thaz  – eine funktional unterspezifizierte Einheit, die nicht nur Objekt-, sondern auch Subjekt- sowie kausale, finale und konsekutive Adverbialsätze einleitete (Müller/Frings 1959). Weitere Elemente waren v. a. oba, ibu (konditional), tho (temporal), uuanta (kausal) (s. u. a. Sonderegger 1987, 243–244; Greule 2000, 1211). Anders als im Neuhochdeutschen konnten die meisten Elemente, die einen untergeordneten Satz einleiteten, auch koordinierend auftreten (s. Schrodt 2004, 143–196). So weisen bei Otfrid (9. Jh.) Sätze mit uuanta (want, wante), die eine vorausgehende Aussage begründen, zu 44 % die Verb-Dritt-Stellung auf, z. B. was ‚war‘ in 4) (Wunder 1965, 155–169). In lediglich 36,5 % der uuanta-Sätze steht das Verb am Satzende (s. 5). Ausgeschlossen ist interessanterweise die Inversion, die bei nhd. Konnektoren wie deswegen möglich ist, vgl. nhd. [Es regnet.]Satz 1 [Deswegen gehe ich nicht ins Freibad.]Satz 2. Durch die Inversion gehe ich, die der Konnektor deswegen auslöst, wird sichtbar, dass der Satz 2 unabhängig ist ‒ die Zweit-Stellung, d. h. Hauptsatzstellung des Verbs bleibt erhalten (zur Entwicklung der Verbstellung im Hauptsatz s. Abschnitt 5.2). Im Gegensatz dazu markiert die Verknüpfung mit uuanta den Satz als nichtselbstständig, da die im unabhängigen Satz gewöhnliche Inversion bei adverbialer Vorfeldbesetzung ausgeschlossen ist.

Syntaktische Einheitenbildung ‒ typologisch und diachron betrachtet 

4) 5)

 113

intriat er thaz gisiuni, want iz was filu sconi (O I 4, 24) ‚Er erstaunte über das Gesicht, denn dieses war sehr schön‘ Sume firnamun iz in thaz wanta er sekilari was, thaz hiazi er io then worton waz armen wihtin spenton. (O IV 12, 47) ‚Manche fassten es so auf, da er Schatzmeister war, dass er mit diesen Worten befehle, etwas den armen Menschen zu spenden‘

Bei Otfrid kommen uuanta-Sätze (fast) ausschließlich als Nebensätze 1. Grades vor und treten dabei v. a. in der Funktion von urteilenden, kommentierenden Einschüben, die „den Zusammenhang der Erzählung“ unterbrechen (s. Wunder 1965, 164). Der Kausalsatz, wie er aus dem Neuhochdeutschen bekannt ist, ist im Althochdeutschen noch nicht herausgebildet. Es fehlt hierzu nicht nur eine eindeutige subjunktionale Einleitung, sondern häufig bildet der uuanta-Satz keine gedankliche Einheit mit dem vor­ausgehenden Hauptsatz. In der Geschichte des Deutschen wird diese nicht eindeutig unterordnende Konjunktion durch die eindeutige Subjunktion weil ersetzt (s. u.). Im Niederländischen ist sie hingegen bis heute erhalten geblieben, z. B. Blijf binnen, want het is koud buiten ‚Bleib(t) drin, denn es ist kalt draußen‘. Im Mittelhochdeutschen wurde das Inventar der Subjunktionen stark vergrößert (s. Wolf 2000, 1354). So gebrauchte Notker in seiner spätalthochdeutschen BoethiusÜbersetzung noch weit weniger Subjunktionen als die späteren mittelhochdeutschen Autoren (vgl. Handschuh 1964; Paul 252007). Wie aus Tabelle 1 ersichtlich, waren die neuen Nebensatzeinleiter noch zusammengesetzt. Diesen jungen Subjunktionen wurde häufig ein eindeutiges Unterordnungselement (u. a. daz) nachgestellt, z. B. unz (daz)/biz (daz) ‚solange bis‘, ê (daz) ‚bevor‘. Tab. 1: Anreicherung der Subjunktionen vom Ahd. zum Mhd. (aus Wolf 2000, 1354) Semantische Relation

Notker (10./11. Jh.)

Mhd.

Temporal

dô sô êr unz danne

dô sô swanne/swen ne also/alse unz (daz) biz (daz) bidaz/bedaz innen des under des ê (daz) sît nu(n) (daz) die wîle swie und

114 

 Renata Szczepaniak

Semantische Relation

Notker (10./11. Jh.)

Mhd.

Kausal

wande sîd danne durh daz

Konditional

ube so echert

Konzessiv

doh

wand(e)/wan(e) sît nû durch daz fur daz umbe daz ob als(o) et/ot und doch swie alein(e) ane ob

Trotz der erkennbaren quantitativen Anreicherung bestand im Mittelhochdeutschen nach wie vor keine klare Trennung zwischen neben- und unterordnenden Konjunktionen. Neben dem begründenden wan(d)(e) (ahd. uuanta) gehörte auch und zu den Elementen, die sowohl koordinierend als auch subordinierend verwendet wurden (s. u. a. Betten 1980; Paul 252007). Darüber hinaus, wie im Folgenden am Beispiel der Kausalsubjunktionen gezeigt wird, waren die Einleiter meist polyfunktional (z. B. temporal und kausal), so dass sie die Lesart des Nebensatzes nicht klar zu definieren vermochten. Zur Einleitung von kausalen Nebensätzen konnten neben dem syntaktisch nicht klar unterordnenden wan(d)(e) auch die Elemente sît und nû verwendet werden, die auch in temporalen Nebensätzen für die Nachzeitigkeitsrelation gebraucht wurden. Ihre Verwendung in kausalen Nebensätzen beruhte auf der konversationellen Implikatur (pragmatischer Schlussfolgerung), dass ein zeitlich vorausgehendes Ereignis den Grund für das Folgeereignis liefert (post hoc ergo propter hoc), vgl. nhd. Nachdem die Lehrerin den Raum verlassen hatte, schrien die Kinder -> ‚Nicht nur nachdem, sondern weil die Lehrerin den Raum verlassen hatte, schrien die Kinder‘ (s. Szczepaniak 2011, 175 ff.). Die in nur beschränktem Umfang verwendeten Präpositionen (durch, fur und umbe) in Verbindung mit daz leiteten neben Kausal- auch Finalsätze ein. Generell lässt sich sagen, dass der Bereich der Kausalsubjunktionen im Mittelhochdeutschen formal (da neben- und unterordnend) und funktional (meist mehrdeutig) wenig entwickelt war. Erst mit der Grammatikalisierung von weil entwickelte sich ein klar unterordnendes kausales Element. Als Grammatikalisierungsquelle diente das Substantiv wîle ‚Zeit, Weile‘, das zunächst in adverbialen Zeitbestimmungen auftrat (s. 6) und zur Präzisierung der Zeitspanne vor den mit daz oder unde eingeleiteten Temporalsätzen gebraucht wurde (s. 7–8).

Syntaktische Einheitenbildung ‒ typologisch und diachron betrachtet 

6) 7) 8)

 115

Die wîle sult ir gân in iuwer herberge (NL 1450, 3–4) ‚In dieser Zeit sollt ihr in eure Herberge gehen‘ daz ich den hort iht zeige die wîle daz si leben (NL 2368, 3) ‚dass ich den Hort nicht zeige, solange sie leben‘ daz ich iu stæte triuwe leiste âne riuwe al die wîle unde ich lebe (Er 4554-6) ‚dass ich euch beständig und ohne Reue treu bin, solange ich lebe‘

Anschließend wurde die gesamte Phrase samt daz bzw. unde (die wîle daz/die wîle unde) als sekundäre Subjunktion reanalysiert. Nach dem Abbau der primären Subjunktionen daz und unde fand eine allmähliche lautliche Reduktion zu weil statt. Im Frühneuhochdeutschen entwickelte weil weitere kontextabhängige Bedeutungs­ nuancen, so dass es ganz unterschiedliche Zeitrelationen, für die heute eigene temporale Subjunktionen wie seit, während oder solange zur Verfügung stehen, ausdrücken konnte. Seit dem 15. Jh. (Frühneuhochdeutsch) trat weil in Kontexten auf, die auf eine konversationelle Implikatur schließen lassen: So lässt sich die temporale Relation in Sätzen wie 9) als Grund-Folge, d. h. kausal, uminterpretieren. 9) Aber sie wolt in nit ein lassen die weil der ritter bei ir was (Hans Neidhart „Eunuchus des Terenz“, Ulm 1486, S. 19, Zeile 10–11, zitiert aus Bonner Frühneuhochdeutschkorpus) ‚Aber sie wollte ihn nicht hineinlassen, während der Ritter bei ihr war‘ -> ‚Aber sie wollte ihn nicht hineinlassen, weil der Ritter bei ihr war‘

Die kausale Funktion von weil ist anschließend konventionalisiert (verselbstständigt) worden, die temporale Lesart hat die Subjunktion komplett abgelegt. Das eindeutig unterordnende weil verdrängte das bis ins Mittelhochdeutsche produktive wan(d)(e) (< ahd. uuanta), was nach Eroms (1980) nur ein Teil des viel komplexeren Übergangs vom mittel- zum neuhochdeutschen System der begründenden Kon- und Subjunk­ tionen war. Weil setzte sich auch gegen weitere kausale Konjunktionen da und denn durch, die an der Verdrängung von wande beteiligt waren (s. Roemheld 1911; Arndt 1959, 1960; Wegener 2000). Als Reaktion darauf spezialisiert sich da zunehmend auf Nebensätze, die vor dem Hauptsatz platziert sind und einen bereits bekannten Grund angeben, z. B. Da ich den Film ja schon kenne, bleibe ich lieber zuhause.

4.2 Die Entwicklung der Nebensatzklammer Die Entwicklung von klar unterordnenden Elementen trug wesentlich zur Herausbildung der sog. Nebensatzklammer bei. Das Phänomen der Klammer kann am besten im Modell der topologischen Felder beschrieben werden, das die syntaktischen Beschränkungen auf die feste Position der finiten und infiniten Prädikatsteile bezieht (s. Höhle 1986; Wöllstein 2010). Die Nebensatzklammer wird im heutigen Deutsch u. a. mit einer Subjunktion (linke Satzklammer, LK) geöffnet und durch das Prädikat geschlossen (rechte Satzklammer, RK), z. B. Ich weiß, dass [LK] er einen Hund

116 

 Renata Szczepaniak

hat [RK]. Eingliedrige Prädikate wie hat stellen ein zuverlässiges Schlusssignal dar. Auch bei zweigliedrigen Prädikaten, die durch periphrastische Verbformen (darunter das Perfekt) entstehen, wird die Klammer durch das flektierte Verb geschlossen, z. B. Ich weiß, dass [LK] er einen Hund bekommen hat [RK]. Bei drei- und viergliedrigen Verbalgruppen hängt die Reihenfolge v. a. von der Form des infiniten Prädikatsteils ab. Zur Nachstellung tendiert das finite Verb in Kombination mit einem Partizip, z. B. (dreigliedrig) Der Radfahrer behauptete, dass [LK] ihn der Hund in die Hose gebissen haben soll [RK] oder (viergliedrig) Der Hundebesitzer räumte ein, dass [LK] der Radfahrer gebissen worden sein mag [RK], jedoch nicht von seinem Hund. In Verbindung mit Infinitiven, darunter Modalverben, wird das finite Verb der Prädikatsgruppe vorangestellt, z. B. Er erzählte, dass [LK] er hat fliehen müssen [RK] (Härd 1981, 17). Im Gegenwartsdeutsch ist die Voranstellung des finiten Verbs die einzig mögliche Abweichung von der Nachstellung. Damit herrscht zwischen den Prädikatsgliedern immer Kontaktstellung, wodurch alle übrigen Satzelemente im Mittelfeld eingeklammert sind. Auf diese Weise ist die gesamte Prädikatsgruppe ein klares Grenzsignal des Nebensatzes. Im Althochdeutschen war die Nebensatzklammer nur eine unter mehreren Strukturoptionen, wobei das finite Verb „um mindestens eine Stelle weiter gegen Ende des Satzes als im Hauptsatz“ stand (Ebert 1978, 38). Postfinit wurden v. a. schwere (umfangreiche) Objekte realisiert. In eingeleiteten Nebensätzen im Tatian (fr. 9. Jh.) ist „die Kontaktstellung ‚Subjunktion-Finitfeld‘ unbeliebt“ (Dittmer 1991, 188): Sie tritt in nur 8 % aller untersuchten Subjunktionalsätze auf, was u. a. daran liegt, dass das Subjektpronomen im Nebensatz mit viel größerer Regelhaftigkeit als im Hauptsatz gesetzt wurde (Sonderegger 1979, 268). Bei komplexen Prädikaten ist im Tatian (fr. 9. Jh.) zwar schon eine Tendenz zur Kontaktstellung von finiten und infiniten Prädikatsteilen zu beobachten (Dittmer 1991). Bezüglich ihrer Reihenfolge ist jedoch noch keine eindeutige Tendenz feststellbar. Bereits im ausgehenden Althochdeutschen überwog die absolute Letztstellung des Verbalkomplexes. In Notkers Psalter bilden bereits 74 % der Nebensätze eine vollständige Klammer (Borter 1982, 131). Ähnliches stellt Bolli (1975) für Notkers Boethius-Übersetzung fest. Insgesamt setzte sich die Nebensatzklammer viel früher als die Hauptsatzklammer durch. Einen vergleichbar hohen Anteil an vollständigen Klammer­struk­tu­ren, der für den Nebensatz schon bei Notker erreicht ist, weisen Hauptsätze erst an der Schwelle zum Frühneuhochdeutschen auf (s. Abschnitt 5.1). Zwar verfestigte sich die nebensatzfinale Position des Prädikats relativ früh, jedoch blieb die Reihenfolge der Prädikatsteile bis ins Frühneuhochdeutsche hinein variabel. Die allmähliche Durchsetzung der Letztstellung des Finitums dokumentiert die Studie von Härd (1981), die den Zeitraum vom 15. bis ins 20. Jh. hinein umfasst: Im 15–16. Jh. konnte das finite Verb, wie in 10 illustriert, voran-, zwischen- oder nachgestellt sein (Härd 1981, 45). Dabei ist die Voranstellung am häufigsten. Die Zwischenstellung, im 15. Jh. noch häufiger als die Nachstellung, ist im 18. Jh. völlig verdrängt worden.

Syntaktische Einheitenbildung ‒ typologisch und diachron betrachtet 

 117

10) Verbstellungsoptionen im Frühneuhochdeutschen und frühen Neuhochdeutschen a) Voranstellung: das ich nicht [bin verunreiniget worden] b) Zwischenstellung: Die doch vnschüldig […] [erkennet weren worden] c) Nachstellung: vnd darnach kümerlich wider [erbawet worden sind]

Die Nachstellung des finiten Verbs setzte sich in Abhängigkeit vom Komplexitätsgrad des Prädikats und von der Form der infiniten Prädikatsteile durch. Bei zweigliedrigen Prädikaten stand das finite Verb (dass sie gekommen ist) bereits um 1500 meist am absoluten Satzende, wobei die Nachstellung bei Verbalformen mit Partizip II (u. a. im Perfekt) häufiger war als in Verbindung mit dem Infinitiv (z. B. bei dem werden-Futur) (Härd 1981, 58). Bei dreigliedrigen Prädikaten mit Partizip II nahm die Nachstellung im 17. Jh. deutlich zu (Takada 1994), wobei die Intensivierung der schriftlichen Kommunikation seit der Erfindung des Buchdrucks eine fördernde Rolle gespielt hat. Für das 17. Jh. lässt sich sogar „ein Zusammenhang zwischen Bevorzugung des Rahmenbaus und akademischer Bildung bzw. amtlicher Schreibroutine nachweisen“ (von Polenz 1991, 200 f.; zur Vorreiterrolle der Kanzleisprache im 15. und 16. Jh. s. Ebert 1986). In der ersten Hälfte des 19. Jhs. erreichte die Nachstellung einen Anteil von 66 % bis 89 %, während sich die Voranstellung zurückzog (Härd 1981, 116 ff.). Sie ist heute kaum akzeptabel, vgl. ?Er spricht ständig von einem Hund, der ihn im Sommer soll gebissen haben. Nachgestellt wird das finite Verb heute bei viergliedrigen Prädikaten, die Partizipien enthalten, z. B. dass er gebissen worden sein soll. Das finite Verb geht bis heute nur solchen drei- bzw. mehrgliedrigen Prädikaten meist voran, die im infiniten Prädikatsfeld ein Modalverb, ein Wahrnehmungsverb sehen, hören, spüren und fühlen oder das Verb lassen enthalten, z. B. dass er hat fliehen müssen; dass er ihn hat fliehen sehen oder dass er ihn hat weglaufen lassen (s. Härd 1981, 159 ff.). Die Nachstellung ist auch hier möglich, doch ihre Akzeptanz ist je nach Art des Verbalkomplexes unterschiedlich. Die Fixierung der rechten Nebensatzklammer ist bei sehr komplexen, schriftsprachlichen Prädikatsgruppen bis heute nicht abgeschlossen.

5 Formale Markierung des Hauptsatzes 5.1 Position der infiniten Prädikatsteile (rechte Klammer) Im Hauptsatz setzte sich in der Geschichte des Deutschen ebenfalls eine Klammerstruktur durch. In Abgrenzung zum Nebensatz wird die Hauptsatzklammer durch eine frühe (Erst- oder Zweit-) Stellung des finiten Verbs eingeleitet. Die rechte Klammer bilden unterschiedliche Elemente, die komplexe Prädikate konstituieren (Weinrich 1986):

118 

 Renata Szczepaniak

11) Typen der Hauptsatzklammer a) Hilfs- bzw. Modalverb + infiniter Prädikatsteil, z. B. Sie hat gegessen; Sie muss essen (die sog. Grammatikalklammer), b) finites Verb + trennbare Verbpartikel, z. B. Sie lacht ihn an (die sog. Lexikal­klam­mer) oder c)  Kopulaverb + Prädikatsnomen, z. B. Sie wird in Zukunft Pilotin; Sie wird krank (die sog. Kopulaklammer).

Im Folgenden wird zunächst die Fixierung der rechten Hauptsatzklammer betrachtet. In Abschnitt 5.2 wird die Funktionalisierung der Position des finiten Prädikatsteils im Zuge der Entwicklung von Satztypen erörtert. Anders als im Gegenwartsdeutsch konnten im Althochdeutschen Satzglieder dem infiniten Teil des Verbalkomplexes nachgestellt werden. Bei Notker stehen schwere, d. h. umfangreiche Satzelemente wie Präpositional­phrasen meist nach dem infiniten Element, z. B. nach kenomen ‚geholt‘ im folgenden Beispiel (Borter 1982; Schrodt 2004, 217): 12) Dû habest mih kenómen uzer mînero muoter uuombo (N Ps. 137 512, 3) ‚Du hast mich aus dem Schoß meiner Mutter geholt‘

Die Ausklammerung wurde im Mittel‑ und im Frühneu­hoch­deut­schen immer seltener. In dieser Zeit entwickelten sich v. a. mit dem Perfekt und dem werden-Futur mehrgliedrige Konstruktionen, die eine Hauptsatzklammer bilden konnten. Wie die Korpusuntersuchung von Schildt (1976) zeigt, erhöhte sich vom Früh- zum Neuhochdeutschen der prozentuale Anteil der voll ausgebildeten Satzklammer (wie in 13) kontinuierlich (s. Tabelle 2). Der Anteil an Sätzen, die keinen Satzrahmen bilden, wo also alle Elemente hinter dem infiniten Prädikatsteil stehen, ging von 10 % auf 1 % zurück, s. 15). Immer seltener wurde auch die partiell ausgebildete Klammer, in der einzelne Satzelemente ausgeklammert werden, s. 14) (Schildt 1976, 246). 13) er wart sere gutlich von den frauwen und jungffrauwen angesehen (voll ausgebildeter Satzrahmen) ‚Von den adligen Frauen und Mädchen wurde er sehr freundlich angesehen‘ 14) er kunt im nit helfen bis an den morgen (partiell ausgebildeter Satzrahmen) ‚er konnte ihm bis zum Morgen nicht helfen‘ 15) er wart erkant an synen grossen deten (kein Satzrahmen) ‚An seinen großen Taten wurde er erkannt‘ Tab. 2: Die Obligatorisierung der Hauptsatzklammer im (Früh‑) Neuhoch­deutschen (Schildt 1976, 271) Zeitraum

voll ausgebildeter ­Satzrahmen

partiell ausgebildeter ­Satzrahmen

kein Satzrahmen

1470–1530 1670–1730

68,1 % 81,4 %

22,4 % 17,9 %

9,4 % 0,8 %

Syntaktische Einheitenbildung ‒ typologisch und diachron betrachtet 

 119

Die zunehmende Einklammerung führte zum Ausbau des Mittelfeldes. In den von Schild (1976, 276) untersuchten Zeiträumen (1470–1530 und 1670–1730) erhöhte sich die Distanz zwischen dem finiten und infiniten Prädikatsteil zunehmend; die Anzahl der Sätze mit 3 bis 5 Gliedern im Mittelfeld stieg an: Tab. 3: Kontinuierliche Erhöhung des Mittelfeldumfangs (Schild 1976, 276) Zeitraum

1 Glied

2 Glieder

3 Glieder

4 Glieder

5 Glieder

1470–1530 1670–1730

40,3 % 22,7 %

40,9 % 44,1 %

14,9 % 26,8 %

3,9 % 5,8 %

0,3 % 0,7 %

Im Gegenwartsdeutsch beträgt die Komplexität des Mittelfeldes im Durchschnitt etwa 1,8 Wörter in der Kopulaklammer und 3,9 in der Modalklammer (s. Thurmair 1991). Die Ausklammerungsrate liegt im Untersuchungsmaterial von Thurmair (1991, 192) bei 6 %, damit ist sie seit dem 17./18. Jh. deutlich gesunken (s. o. Tabelle 2).

5.2 Reduktion der Stellungsfreiheit des finiten Verbs (Satztypen) Die Stellung des finiten Verbs im Hauptsatz wird im Laufe der deutschen Sprachgeschichte auf zwei Positionen reduziert: die Verb-Erst- und die Verb-Zweitstellung (s. Tabelle 3). Ihre heutige Distribution kann als Ergebnis der Grammatikalisierung von Satztypen interpretiert werden (s. Szczepaniak 2013). Das Verb steht in Deklarativsätzen, die – vereinfacht gesagt – die Welt beschreiben, meist an zweiter Stelle. Die Verb-Erst-Stellung markiert hingegen Entscheidungsinterrogativ- und Imperativsätze, die den Wunsch des Sprechers ausdrücken, dass etwas der Fall sein möge. Die Endstellung ist in Hauptsätzen für besondere Aufgaben reserviert: So drücken bspw. Verb-Letzt-Interrogativsätze deliberative Fragen aus, die keine Antwort erfordern (s. ­Truckenbrodt 2012). Tab. 4: Satzmodus und die Verbstellungsdistribution (s. Wöllstein 2010, 7) Deklarativsatz

Interrogativsatz

Imperativsatz

Verb-Zweit (Verb-Erst)

Verb-Zweit Verb-Erst (Verb-Letzt)

(Verb-Zweit) Verb-Erst (Verb-Letzt)

Verb-Zweit-Satz: Ich wasche mir die Hände oder Wer wäscht sich die Hände? Verb-Erst-Satz: Wasch dir die Hände! oder Wäschst du dir die Hände? (Verb-Letzt-Satz): Ob sie sich die Hände gewaschen hat?

120 

 Renata Szczepaniak

Die Fixierung des finiten Verbs trägt damit zur Markierung der illokutionären Funktion bei, auch wenn sie kein eindeutiger Satzmodusmarker ist (s. v. a. Altmann 1993; Szczepaniak 2013). Betrachtet man die Entwicklung der Verbstellung aus der typologischen Perspektive, die sich auf die Stellungsrelation zwischen Köpfen und ihren Modifikatoren bezieht (s. u. a. Dryer 1995), so ist diese zunächst uneindeutig, da das finite Verb auf der Oberfläche in unterschiedlichen Positionen auftreten kann, s. erste Zeile in Tabelle 5. (Die formale Möglichkeit, eine grundlegende Verb-Letzt-Stellung im Deutschen anzunehmen, wird ausgeblendet, da das Augenmerk hier auf die Funktionalisierung der Oberflächenstruktur gerichtet ist.) Tab. 5: Kopffinale und kopfinitiale Wortfolge (nach Dryer 1995) Kopffinale Wortfolge

Kopfinitiale Wortfolge

Objekt – Verb (OV)

Verb – Objekt (VO)

Vollverb – flektiertes Hilfsverb (VAux)

flektiertes Hilfsverb – Vollverb (AuxV)

Nomen – Postposition (Po)

Präposition – Nomen (Pr)

Genitiv/Possessor – Nomen (GN)

Nomen – Genitiv/Possessor (NG)

Vergleichsobjekt – Adjektiv

Adjektiv – Vergleichsobjekt

Nomen – Artikel (NAr)

Artikel – Nomen (ArN)

Adjektiv – Nomen (AN)

Nomen – Adjektiv (NA)

Numeral – Nomen (NumN)

Nomen – Numeral (NNum)

Demonstrativ – Nomen (DemN)

Nomen – Demonstrativ (NDem)

Relativsatz – Nomen (RelN)

Nomen – Relativsatz (NRel)

Satz – Complementizer (SComp)

Complementizer – Satz (CompS)

Adverb – Verb (AdvV)

Verb – Adverb (VAdv)

Adverb – Adjektiv (AdvA)

Adjektiv – Adverb (AAdv)

Betrachtet man die Stellungsrelation im Neuhochdeutschen (s. grau markierte Zellen in Tabelle 5), so lässt sich keine eindeutige Typologisierung des Deutschen vornehmen. In Bezug auf die Nomi­nalphrase überwiegt die kopffinale Stellung (head-final order), wohingegen die satzinitiale Stellung des Complementizers (Subjunktion) und die Nachstellung des Relativsatzes den kopfinitialen Stellungstyp aufweisen. Doch kann die Entwicklung der Verbstellung als ein wichtiger Schritt für die Markierung der komplexen Satzstruktur angesehen werden. So beobachtet Askedal (1996), dass die Verbstellung mit der pragmatischen Funktion des Satzes korrespondiert. Die Erst- bzw. Zweit-Stellung des Verbs kommt hauptsächlich in Hauptsätzen vor, die für eine bestimmte Sprachhandlung verwendet werden, d. h. eine illokutive Funktion haben (zu abhängigen Hauptsätzen wie in Sie sagte, sie ist dort gut aufge-

Syntaktische Einheitenbildung ‒ typologisch und diachron betrachtet 

 121

hoben s. Auer 1998). Stellen wir eine Frage, verlangen wir etwas oder beschreiben wir einen Sachverhalt, verwenden wir Verb-Erst- und Verb-Zweit-Sätze. Die Nebensätze ordnen sich der illokutiven Kraft des Hauptsatzes unter, d. h. sie sind nicht nur syntaktisch, sondern auch pragmatisch unselbstständig. So kann ein und derselbe Nebensatz Teil eines Aussage-, Aufforderungs- oder Fragesatzes sein: 16) Sie hat gewusst, dass er das Buch schon gelesen hat. 17) Sag ihm, dass er das Buch schon gelesen hat! 18) Stimmt es wirklich, dass er das Buch schon gelesen hat?

Im Neuhochdeutschen sind also bestimmte Satzformen für bestimmte Funktionen vorgesehen. Je nachdem, was wir ausdrücken wollen, müssen wir uns für eine bestimmte Struktur entscheiden. Somit ist die jeweilige Satzstruktur die Ausdrucksform einer grammatischen Kategorie: Dabei opponieren einerseits der Haupt- (mit illokutiver Funktion) mit dem Nebensatz (illokutiv unselbstständig) und andererseits  – im Hauptsatzbereich  – verschiedene Satzmodi (Aussage-, Frage-, Aufforderungs- oder Ausrufesatz).

6 Zusammenfassung Für die Entwicklung der komplexen syntaktischen Struktur spielt in der Geschichte des Deutschen der Übergang von der Mündlichkeit in die (immer elaboriertere) Schriftlichkeit eine wichtige Rolle. Dabei bildet die Zeitspanne des 17./18. Jhs. eine Zäsur in mehrfachem Sinne. In dieser Zeit verändert sich schlagartig der prozentuale Anteil an literarisierten Bürgern, parallel dazu findet mit dem Einsatz der neuen Medien eine Diversifizierung von Textsorten statt. Der entscheidende Schritt in der Entwicklung der Unterordnungsmarker, d. h. der funktional spezifischen und formal eindeutigen Subjunktionen und der Klammer schließenden Stellung des finiten Verbs, fällt genau in diese Zeit. Die Hauptsatzklammer, v. a. die Fixierung der Klammer schließenden Posi­tion des infiniten Prädikatsteils, setzt sich erst im Frühneuhochdeutschen durch. Im vorliegenden Beitrag ist nicht detailliert darauf eingegangen worden, wie die finite Verbstellung (in der linken Hauptsatzklammer) sich diachron durchsetzte; die heutige Distribution konnte jedoch funktional erklärt werden: Die Verbstellung gehört zu den konstituierenden Merkmalen von Satztypen.

122 

 Renata Szczepaniak

7 Literatur 7.1 Primärliteratur Er = Hartmann von Aue: Erec. Herausgegeben von Manfred G. Scholz. Übersetzt von Susanne Held. Frankfurt a. M. 2004. NL = Das Nibelungenlied. Herausgegeben, übersetzt und mit einem Anhang versehen von Helmut Brackert. 26. Auflage. Frankfurt a. M. 2000. O = Otfrid von Weissenburg: Evangelienbuch. Herausgegeben von Oskar Erdmann. 6. Auflage besorgt von Ludwig Wolff. Tübingen 1973. Digitale Korpora: Das Bonner Frühneuhochdeutsch-Korpus: www.korpora.org/fnhd [17.12.2014].

7.2 Sekundärliteratur Admoni, Wladimir G. (1967): Der Umfang und die Gestaltungsmittel des Satzes in der deutschen Literatursprache bis zum Ende des 18. Jhs. In: Beiträge zur Geschichte der deutschen Sprache 89, 144‒199. Admoni, Wladimir G. (1980): Zur Ausbildung der Norm der deutschen Literatursprache im Bereich des neuhochdeutschen Satzgefüges (1470–1730). Ein Beitrag zur Geschichte des Gestaltungssystems der deutschen Sprache. Berlin. Admoni, Wladimir G. (1985): Syntax des Neuhochdeutschen seit dem 17. Jahrhundert. In: Werner Besch/Oskar Reichmann/Stefan Sonderegger (Hg.): Sprachgeschichte. Ein Handbuch zur Geschichte der deutschen Sprache und ihrer Erforschung. 2. Halbband. Berlin/New York, 1538‒1556. Admoni, Wladimir G. (1990): Historische Syntax des Deutschen. Tübingen. Altmann, Hans (1993): Satzmodus. In: Joachim Jacobs u. a. (Hg.): Syntax. Ein internationales Handbuch zeitgenössischer Forschung. 1. Halbband. Berlin/New York, 1006–1029. Arndt, Erwin (1959): Das Aufkommen des begründenden weil. In: Beiträge zur Geschichte der deutschen Sprache und Literatur 81, 388–415. Arndt, Erwin (1960): Begründendes da neben weil im Neuhochdeutschen. In: Beiträge zur Geschichte der deutschen Sprache und Literatur 82, 242–260. Auer, Peter (1998): Zwischen Parataxe und Hypotaxe: ,abhängige Hauptsätze‘ im Gesprochenen und Geschriebenen Deutsch. In: Zeitschrift für Germanistische Linguistik 26, 284–307. Auer, Peter (2000): On line-Syntax – Oder: was es bedeuten könnte, die Zeitlichkeit der mündlichen Sprache erst zu nehmen. In: Sprache und Literatur 85, 43‒56. Beißwenger, Michael (2010): Chattern unter die Finger geschaut: Formulieren und Revidieren bei der schriftlichen Verbalisierung in synchroner internetbasierter Kommunikation. In: Vilmos Ágel/ Mathilde Hennig (Hg.): Nähe und Distanz im Kontext variationslinguistischer Forschung. Berlin/ New York, 247–294. Betten, Anne (1980): Zu Satzbau und Satzkomplexität im mittelhochdeutschen Prosa-Lancelot. Über­legungen zur Beschreibung der Syntax mittelhochdeutscher Prosa. In: Sprachwissenschaft 5, 15‒42. Betten, Anne (1987): Grundzüge der Prosasyntax. Stilprägende Entwicklungen vom Althochdeutschen zum Neuhochdeutschen. Tübingen. Betten, Anne (2000): Zum Verhältnis von geschriebener und gesprochener Sprache im Frühneuhochdeutschen. In: Werner Besch u. a. (Hg.): Sprachgeschichte. Ein Handbuch zur

Syntaktische Einheitenbildung ‒ typologisch und diachron betrachtet 

 123

Geschichte der deutschen Sprache und ihrer Erforschung. Teilband 2. 2., vollständig neu bearbeitete und erweiterte Auflage. Berlin u. a., 1646‒1664. Bolli, Ernst (1975): Die verbale Klammer bei Notker. Untersuchungen zur Wortstellung in der Boethius-Übersetzung. Berlin/New York. Borter, Alfred (1982): Syntaktische Klammerbildung in Notkers Psalter. Berlin/New York. Burdach, Konrad (1925): Vorspiel. Gesammelte Schriften zur Geschichte des deutschen Geistes. Band 1, 2. Teil. Halle a. S. Chafe, Wallace (1982): Integration and involvement in speaking, writing, and oral literature. In: Deborah Tannen (Hg.): Spoken and Written Language. Exploring Orality and Literacy. Norwood, N. J., 35‒53. Dittmer, Arne (1991): Topologie der Spannsätze/Nebensätze (NS) der althochdeutschen Tatianübersetzung. In: Elisabeth Feldbusch/Reiner Pogarell/Cornelia Weiß (Hg.): Neue Fragen der Linguistik. Akten des 25. Linguistischen Kolloquiums, Paderborn 1990. Band 1: Bestand und Entwicklung. Tübingen, 183–191. Dryer, Matthew S. (1995): Word order typology. In: Joachim Jacobs u. a. (Hg.): Syntax. Ein inter­ nationales Handbuch zeitgenössischer Forschung. 2. Halbband. Berlin/New York, 1050–1065. Dürscheid, Christa (2012): Einführung in die Schriftlinguistik. Mit einem Kapitel zur Typographie von Jürgen Spitzmüller. 4., überarbeitete und aktualisierte Auflage. Göttingen u. a. Ebert, Robert Peter (1978): Historische Syntax des Deutschen. Stuttgart. Ebert, Robert Peter (1986): Historische Syntax des Deutschen II: 1300–1750. Bern. Eroms, Hans-Werner (1980): Funktionskonstanz und Systemstabilisierung bei den begründenden Konjunktionen im Deutschen. Mit sechs Tabellen. In: Sprachwissenschaft 5, 73–115. Fehrmann, Gisela/Erika Linz (2009): Eine Medientheorie ohne Medien? Zur Unterscheidung von konzeptioneller und medialer Mündlichkeit und Schriftlichkeit. In: Elisabeth Birk/Jan Georg Schneider (Hg.): Philosophie der Schrift. Tübingen, 123‒143. Fritz, Gerd (2001): Text types in a new medium. The first newspapers (1609). In: Journal of Historical Pragmatics 2 (1), 69–83. Gauger, Hans-Martin (1994): Geschichte des Lesens. In: Hartmut Günther/Otto Ludwig (Hg.): Schrift und Schriftlichkeit. Ein interdisziplinäres Handbuch internationaler Forschung. 1. Halbband. Berlin/New York, 65‒84. Greule, Albrecht (2000): Syntax des Althochdeutschen. In: Werner Besch u. a. (Hg.): Sprachgeschichte. Ein Handbuch zur Geschichte der deutschen Sprache und ihrer Erforschung. Teilband 2. 2., vollständig neu bearbeitete und erweiterte Auflage. Berlin u. a., 1207‒1213. Griese, Sabine/Nikolaus Henkel (i. Dr.): Lesen. In: Ursula Rautenberg/Ute Schneider (Hg.): Lesen. Ein Handbuch. Berlin. Handschuh, Doris (1964): Konjunktionen in Notkers Boethius-Übersetzung. Zürich. Härd, John Evert (1981): Studien zur Struktur mehrgliedriger deutscher Nebensatzprädikate. Diachronie und Synchronie. Göteborg. Höhle, Tilman (1986): Der Begriff „Mittelfeld“. Anmerkungen über die Theorie der topologischen Felder. In: Walter Weiss/Herbert Ernst Wiegand/Marga Reiss (Hg.): Textlinguistik contra Stilistik? Wortschatz und Wörterbuch. Grammatische oder pragmatische Organisation der Rede? Akten des VII. Internationalen Germanisten-Kongresses, Göttingen 1985. Band 3. Tübingen, 329–340. Hopper, Paul J./Elizabeth Closs Traugott (2003): Grammaticalization. 2. Auflage. Cambridge. Hundsnurscher, Franz (1998): Historische Syntax. In: Werner Besch u. a. (Hg.): Sprachgeschichte. Ein Handbuch zur Geschichte der deutschen Sprache und ihrer Erforschung. Teilband 1. 2., vollständig neu bearbeitete und erweiterte Auflage. Berlin u. a., 755‒775. Knoop, Ulrich (1994): Entwicklung von Literalität und Alphabetisierung in Deutschland. In: Hartmut Günther/Otto Ludwig (Hg.): Schrift und Schriftlichkeit. Ein interdisziplinäres Handbuch internationaler Forschung. 1. Halbband. Berlin/New York, 859‒872.

124 

 Renata Szczepaniak

Lehmann, Christian (1988): Towards a typology of clause linkage. In: John Haiman/Sandra Thomp­ son (Hg.): Clause Combining in Grammar and Discourse. Amsterdam/Philadelphia, 181‒225. Lehmann, Christian (1995): Relativsätze. In: Joachim Jacobs u. a. (Hg.): Syntax. Ein internationales Handbuch zeitgenössischer Forschung. 2. Halbband. Berlin/New York, 1199‒1216. Mithun, Marianne (1984): How to avoid subordination. In: Proceedings of the Tenth Annual Meeting of the Berkeley Linguistics Society 10, 493‒509. Müller, Gertraud/Theodor Frings (1959): Die Entstehung der dt. daß-Sätze. Berlin. Nübling, Damaris u. a. (2013): Historische Sprachwissenschaft des Deutschen. Eine Einführung in die Prinzipien des Sprachwandels. 4., durchgesehene Auflage. Tübingen. Paul, Hermann (252007): Mittelhochdeutsche Grammatik. Neu bearbeitet von Thomas Klein, Hans-Joachim Solms und Klaus-Peter Wegera. Mit einer Syntax von Ingeborg Schöbler, neubearbeitet und erweitert von Heinz-Peter Prell. Tübingen. Polenz, Peter von (1991): Deutsche Sprachgeschichte vom Spätmittelalter bis zur Gegenwart. Berlin/ New York. Rockwood, Heidi M. (1975): A Syntactic Analysis of Selected Middle High German Prose as a Basis for Stylistic Differentiations. Bern/Frankfurt a. M. Roemheld, Friedrich (1911): Die deutschen Konjunktionen wande, denn und weil. Mainz. Schildt, Joachim (1976): Zur Ausbildung des Satzrahmens. In: Gerhard Kettmann/Joachim Schildt (Hg.): Zur Ausbildung der Norm in der deutschen Literatursprache auf der syntaktischen Ebene (1470–1730). Berlin, 235–284. Scholz, Manfred Günter (1994): Die Entstehung volkssprachlicher Schriftkultur in Westeuropa. In: Hartmut Günther/Otto Ludwig (Hg.): Schrift und Schriftlichkeit. Ein interdisziplinäres Handbuch internationaler Forschung. 1. Halbband. Berlin/New York, 555‒572. Schön, Erich (1987): Der Verlust der Sinnlichkeit oder Verwandlungen des Lesens. Mentalitätswandel um 1800. Stuttgart. Schrodt, Richard (2004): Althochdeutsche Grammatik II: Syntax. Tübingen. Sonderegger, Stefan (1979): Grundzüge deutscher Sprachgeschichte. Diachronie des Sprachsystems. Band 1: Einführung – Genealogie – Konstanten. Berlin/New York. Sonderegger, Stefan (1987): Althochdeutsche Sprache und Literatur. Berlin/New York. Szczepaniak, Renata (2011): Grammatikalisierung im Deutschen. Eine Einführung. 2. Auflage. Tübingen. Szczepaniak, Renata (2013): Satztyp und Sprachwandel. In: Jörg Meibauer/Markus Steinbach/Hans Altmann (Hg.): Satztypen des Deutschen. Berlin/Boston, 738–763. Takada, Hiroyuki (1994): Zur Wortstellung des mehrgliedrigen Verbalkomplexes im Nebensatz im 17. Jahrhundert. Mit einer Beantwortung der Frage, wie und warum die Wortstellung von Grimmelshausens „Simplicissimus“ geändert wurde. In: Zeitschrift für Germanistische Linguistik 22, 190–219. Thurmair, Maria (1991): Warten auf das Verb. Die Gedächtnisrelevanz der Verbklammer im Deutschen. In: Jahrbuch Deutsch als Fremdsprache 17, 174–202. Wegener, Heide (2000): Da, denn und weil – der Kampf der Konjunktionen. Zur Grammatikalisierung im kausalen Bereich. In: Rolf Thieroff u. a. (Hg.): Deutsche Grammatik in Theorie und Praxis. Tübingen, 69–81. Weinrich, Harald (1986): Klammersprache Deutsch. In: Sprachnormen in der Diskussion. Beiträge vorgelegt von Sprachfreunden. Berlin/New York, 116–145. Wolf, Norbert Richard (2000): Syntax des Mittelhochdeutschen. In: Werner Besch u. a. (Hg.): Sprachgeschichte. Ein Handbuch zur Geschichte der deutschen Sprache und ihrer Erforschung. Teilband 2. 2., vollständig neu bearbeitete und erweiterte Auflage. Berlin u. a., 1351‒1358. Wöllstein, Angelika (2010): Topologisches Satzmodell. Heidelberg. Wunder, Dieter (1965): Der Nebensatz bei Otfrid. Untersuchungen zur Syntax des deutschen Nebensatzes. Heidelberg.

Jan Georg Schneider

6. Syntaktische Schemabildung – zeichentheoretisch betrachtet Abstract: In gebrauchsbasierten Grammatikansätzen, insbesondere solchen, die zum Paradigma der Konstruktionsgrammatik zählen, werden grammatische Schemata (Konstruktionen) als Form-Bedeutungs-Paare aufgefasst. Konstruktionsgrammatiker beziehen sich dabei implizit oder explizit auf den Saussure’schen Zeichenbegriff. Da das theoretische Potenzial dieser Verbindung bislang jedoch noch nicht ausgeschöpft ist, wird im vorliegenden Beitrag im Anschluss an Saussure eine gebrauchsbasierte Zeichentheorie skizziert, die auch komplexe Zeichenschemata erfasst und diese zum Begriff der Konstruktion ins Verhältnis setzt. Hierbei nehme ich insbesondere auf die Saussure’schen Begriffe ‚Aposem‘ und ‚Parasem‘ Bezug sowie auf das an Goodman anknüpfende Konzept der Exemplifikation, das m. E. in besonderer Weise geeignet ist zu verdeutlichen, was man in der Linguistik unter gebrauchsbasiertem Arbeiten verstehen kann. Gesamtziel des Beitrags ist es, zu einer plausiblen Idee von syntaktischer Schemabildung zu gelangen, die sich mit aktuellen Erkenntnissen anderer mit Sprache und Schemabildung befasster Disziplinen, wie etwa der Entwicklungspsychologie und der Neurobiologie, in Verbindung bringen lässt. 1 Einleitung 2 Gebrauchsbasierte Zeichentheorie nach Saussure 3 Konstruktionen als komplexe Zeichenschemata 4 Wie werden komplexe Zeichenschemata gelernt? 5 Konstruktion oder Regel? – Eine falsche Alternative 6 Zeichenprozessierung und Medialität 7 Interdisziplinärer Ausblick 8 Literatur

1 Einleitung In seinem Buch „Constructing a language“ beschreibt Michael Tomasello die Fähigkeit zur ‚Mustererkennung‘ (‚pattern-finding‘) als eine allgemeine kognitive Fähigkeit des Menschen, die auch im Spracherwerb eine zentrale Rolle spielt. Sie umfasst u. a. folgende Teilfähigkeiten (vgl. Tomasello 2003, 4, vgl. auch ebd. 16): 1. die Fähigkeit, ‚ähnliche‘ Objekte und Ereignisse zu kategorisieren; 2. die Fähigkeit, senso-motorische Schemata aus rekurrenten Wahrnehmungs- und Handlungsmustern zu bilden;

126 

 Jan Georg Schneider

3. die Fähigkeit, statistisch basierte distributionelle ‚Analysen‘ verschiedener Arten von Wahrnehmungs- und Verhaltenssequenzen durchzuführen (wobei Analyse hier nicht im Sinne einer bewussten Tätigkeit zu verstehen ist); 4. die Fähigkeit, Analogien zu bilden.

Alle diese kognitiven Fähigkeiten, die für die Entfaltung grammatischer Kompetenz notwendig sind, haben mit der Prozessierung von Zeichen (bzw. Symbolen) zu tun; es handelt sich also um semiotische Fähigkeiten. Dementsprechend betrachten gebrauchsbasierte Grammatikansätze Konstruktionen, d. h. Zeichen im Sinne von ‚Form-Bedeutungs-Paaren‘, als Basiseinheiten des Sprachsystems und stützen sich dabei explizit oder implizit auf den Zeichenbegriff Ferdinand de Saussures. Jedoch blieben die zeichentheoretische Fundierung der gebrauchsbasierten Grammatikforschung und insbesondere die Verbindung zur Saussure’schen Zeichentheorie bisher relativ vage und oberflächlich, was m. E. zwei Ursachen hat: Erstens konzentrierte sich die Saussure-Rezeption hier nur auf wenige Textstellen, dazu einseitig auf den „Cours de linguistique générale“ (im Folgenden: „Cours“), und ließ die pragmatischer orientierten Quellentexte (Saussure 1993, 1997 und 2003) außer Acht; zum anderen orientiert sich Saussure tatsächlich vor allem am Paradigma der Einzelwörter und schenkt komplexen Zeichenschemata, die ja für die Grammatiktheorie zentral sind, weniger Beachtung. In Anbetracht dieser Sachlage wird im vorliegenden Beitrag der Versuch unternommen, im Anschluss an Saussure eine gebrauchsbasierte Zeichentheorie zu skizzieren, die auch komplexe Zeichenschemata angemessen erfasst und diese zum Begriff der Konstruktion ins Verhältnis setzt. Was genau meinen wir, wenn wir in der Grammatiktheorie von Form-Bedeutungs-Paaren sprechen? Wie hängen gebrauchsbasierte Grammatik und Zeichentheorie zusammen? Im folgenden Abschnitt werden zunächst Grundannahmen einer an Saussure anknüpfenden Zeichentheorie dargestellt, wobei ich mich insbesondere auf die Begriffe ‚Parasem‘ und ‚Aposem‘ sowie auf das dialektische Verhältnis von Parole und Langue konzentriere. In Abschnitt 3 wird der Begriff der Konstruktion, so wie er heute in der Konstruktionsgrammatik (KxG) verwendet wird, einer kritischen Prüfung unterzogen. Diese beiden Argumentationsgänge werden in den Abschnitten 4 bis 6 zusammengeführt, wobei ich mich schwerpunktmäßig auf die Spracherwerbstheorie Tomasellos beziehe und zusätzlich den auf Goodman zurückgehenden Begriff der Exemplifikation ins Spiel bringe, mit dessen Hilfe sich der Aspekt der Gebrauchsbasiertheit präzisieren lässt. Dies wird anhand verschiedener sprachlicher Beispiele veranschaulicht. Zudem wird in Abschnitt 5 das Verhältnis von Konstruktion und Regel aus zeichentheoretischer Perspektive ausgelotet. Gesamtziel des Beitrags ist es, zu einer plausiblen Idee von syntaktischer Schemabzw. Einheitenbildung zu gelangen, die einerseits semiotisch fundiert ist, anderseits auf zu starke theoretische Vorannahmen (z. B. über mentale Tiefenstrukturen) verzichtet und sich zu aktuellen Erkenntnissen anderer mit Sprache und Schemabildung befasster Disziplinen, wie etwa der experimentellen Entwicklungspsychologie und

Syntaktische Schemabildung – zeichentheoretisch betrachtet 

 127

der Neurowissenschaften, in Beziehung setzen lässt. Letzteres kann allerdings nur in Form eines Ausblicks (Abschnitt 7) angedeutet werden.

2 Gebrauchsbasierte Zeichentheorie nach Saussure Zu Recht gilt das Arbitraritätsprinzip bis heute als eines der unverrückbaren Prinzipien moderner Sprachwissenschaft, auch wenn es in linguistischen Einführungen häufig als eine Art ‚Beliebigkeitsprinzip‘ trivialisiert wird. Diese Trivialisierung wurde nicht zuletzt durch die deutsche Übersetzung Herman Lommels („Beliebigkeit des Zeichens“, GRF, 79) sowie durch die berühmte bildliche Darstellung im „Cours“ begünstigt: Das Vorstellungsbild eines Baumes wird – so eine gängige Lesart – in jeder Sprache mit einem anderen signifiant, einem anderen image acoustique, verbunden: beispielsweise im Französischen mit >arbretree< und im Deutschen mit >baumbaum so (.) d von KUantang an HOCH; like from ((name)) upwards ‘like upwards from ((name))’

In this case, the local adverbial so von kuantang an hoch (‘like up from kuantang’) is only recognizable as an extension because it is prosodically separate from the prior possibly complete clause. (iii) Retrospective paradigmatic expansions, i. e. continuations which replace an element from the prior clause: (10) (Auer 1996a, 66; transcription slightly adapted; translation added) 1 K: DU: des däd I It mogeln; hey that I wouldn’t do cheat

des (‘that’) from the possibly complete prior clause is replaced by mogeln (‘cheat’). In this case, as often, the replacement is not prosodically separate but integrated into the intonation phrase packaging the TCU. (iv) Appositional expansions, which are not grammatically fitted but semantically clearly continue a prior clause: (11) (Auer 1991, 151; transcription adapted; translation added) 1 F: aber ganz andere FO::RM hat doch der; (.) but totally different langage activated > familiar that {it} this {that N} this N

>

uniquely identifiable {the N}

>

referential > {indefinite this N}

type identifiable {a N}

Abb. 1: Skala von referierenden Ausdrücken (aus GHZ 1993)

Zu lesen ist diese Skala so, dass jedem gewählten Ausdruckstyp ein bestimmter kognitiver Status entspricht, der einem H gegenüber signalisiert wird. Um die Extrempunkte zu verdeutlichen, seien die Werte „type identifiable“ und „in focus“ kurz erläutert: Die Wahl eines Nominals mit einem unbestimmten Artikel signalisiert, dass der Referent nur als Typ identifizierbar ist und nicht näher bestimmt werden muss. GHZ wählen folgendes Beispiel, das hier übertragen lautet: Ich konnte die letzte Nacht nicht schlafen. Ein Hund nebenan hielt mich wach. Die Wahl der NP ein Hund nebenan signalisiert H, dass er sich nicht weiter bemühen muss, diesen Hund näher zu identifizieren, weil es im gegebenen Kontext nicht relevant ist. Der andere Extrempunkt, „in focus“, deckt die Fälle ab, in denen der Referent nicht nur in irgendeiner Weise präsent ist (also „activated“), sondern auch das Zentrum der Aufmerksamkeit von S und H bildet – sei es, dass im Vorgängersatz über den Hund gesprochen wurde, sei es, dass dieser leibhaftig vor ihnen steht. Entsprechend hieße es dann: Ich konnte die letzte Nacht nicht schlafen. Er hielt mich wach.

314 

 Frank Liedtke

Die zitierte Skala enthält Korrelationen zwischen Ausdruckstyp und kognitivem Status. Es gibt aber auch eine syntaktische Komponente in der Hierarchie, die sich folgendermaßen auswirkt: Entitäten, denen der kognitive Status „in focus“ zukommt, bilden in der Regel das Satztopik, also den Gegenstand, von dem die Rede ist, und sie bilden in folgenden Sätzen präferiert ebenfalls das Topik (GHZ 1993, 279). Diese Eigenschaft hat Konsequenzen auf der syntaktischen Ebene, denn Topik-Eigenschaften werden in der Regel den Konstituenten am Satzanfang zugesprochen. Dies heißt wiederum, dass der Status „in focus“ (als kognitiver Status, nicht im Sinne der Informationsstruktur) Konstituenten beispielsweise in einer eingebetteten syntaktischen Position nicht zugesprochen werden kann: *Ikea hat meinem Nachbarn mit dem Bullterrier eine Einbauküche geliefert. Er hat wieder gebellt. Nur wenn die Topik-Position relevant ist, kann eine Satzfolge gelingen: Der Bullterrier meines Nachbarn hat Auslauf. Er hat wieder gebellt. Die einzelnen Werte der zitierten Skala stehen jeweils in einer genau definierten Beziehung zueinander. Die ‚unteren‘ Werte (also „type identifiable“, „referential“) etc. werden von den ‚oberen‘ Werten semantisch eingeschlossen. Das hat zur Folge, dass die Wahl eines Ausdrucks wie {a N} nicht nur den Status „type identifiable“ signalisiert, sondern auch für alle darüber liegenden Status möglich ist, denn er ist ja in ihnen eingeschlossen. Auch wenn der Referent beispielsweise „in focus“ ist, kann man in manchen Kontexten den unbestimmten Artikel mit Nomen verwenden: Ich ging mit meinen Beschwerden zu Dr. Müller. Ich dachte, ich sollte damit einen Arzt aufsuchen (GHZ 1993, 296). Die Verwendung von einen Arzt ist hier allerdings nicht referenziell, sondern generisch. Zudem haben wir außerhalb dieser spezifischen Kontexte die Präferenz, die entsprechenden Ausdruckstypen einigermaßen punktgenau zu verwenden, das heißt wir führen unseren H leicht in die Irre, wenn wir für einen ‚hohen‘ kognitiven Status einen ‚unteren‘ signalisierenden Ausdruck verwenden. Um diese Präferenz der punktgenauen Korrelation im Modell abbilden zu können, rekurrieren GHZ auf die Konversationsmaxime der Quantität, so wie sie von Grice eingeführt wurde. Grice hatte ein allgemeines Kooperationsprinzip für Gespräche und andere Formen des sprachlich-kommunikativen Austauschs formuliert. Als konkrete Ausformungen dieses allgemeinen Prinzips hatte er eine Reihe von Maximen angegeben, von denen uns die Quantitätsmaxime mit ihren zwei Untermaximen interessiert: „1. Mache deinen Beitrag so informativ wie (für die angegebenen Gesprächszwecke) nötig. 2. Mache Deinen Beitrag nicht informativer als nötig“ (Grice 1993, 249). Die ‚punktgenaue‘ Korrelation von Ausdruckstyp und kognitivem Status innerhalb der Hierarchie wird nach Auffassung von GHZ durch die Untermaximen der Quantitäsmaxime gesteuert. Wir begegnen hier also in direkter Weise einem inferenziellen Modell der Korrelation von Form und Funktion, in dem die Verwendung eines Formtyps nach Durchlaufen eines Schlussprozesses die Korrelation mit einem Funktionstyp auslöst. Der entsprechende Schlussprozess wurde von Grice Implikatur benannt; wir haben es also hier mit einer Quantitätsimplikatur zu tun.

Syntax und moderne Pragmatik 

 315

Sehen wir uns nun an, welche Aufgabe die Quantitätsmaxime in diesem Zusammenhang übernimmt (wobei sich die folgende Darstellung auf die erste Untermaxime – Q 1 – beschränkt). Wir müssen dazu kurz die pragmatischen Eigenschaften von Skalen erläutern. Von Horn (1984) wurden die sogenannten skalaren Implikaturen eingeführt, also Schlussprozesse, die die Wahl eines bestimmten Wertes auf einer Skala steuern. In einer Skala mit einem starken und einem schwachen Wert, zum Beispiel , signalisieren wir mit der Wahl des schwächeren Werts, dass der stärkere keine Anwendung findet: Mit Das Wasser ist warm signalisieren wir, dass das Wasser nicht heiß ist. Dies ist ein pragmatischer Prozess, denn der schwächere Wert warm ist in dem stärkeren Wert heiß semantisch eingeschlossen. Was heiß ist, ist mindestens auch warm. Dass wir mit warm nun punktgenau den Wert auf der entsprechenden Skala benennen können, ist Resultat der ersten Teilmaxime der Quantität. Dies wird klar, wenn man den Umkehrschluss zieht: Wenn das Wasser heiß gewesen wäre, S aber warm gesagt hätte, dann wäre S nicht so informativ wie nötig gewesen und hätte damit gegen die erste Quantitätsmaxime verstoßen. Wollen wir dies S nicht unterstellen, dann nehmen wir an, dass das Wasser nicht heiß war. Allgemein gesagt lautet das Prinzip, das der skalaren Implikatur unterliegt, von der Perspektive des Hörers aus formuliert: Wenn auf einer Skala mit einem starken und einem schwachen Wert der schwächere benannt wird, so kannst du daraus schließen, dass der stärkere nicht intendiert ist. Wenden wir dieses Prinzip auf die Hierarchie der referierenden Ausdrücke an, so erhalten wir folgende Festlegung: Wenn du einen Ausdruck an dem unteren Ende der Skala wählst (beispielsweise ein Nomen mit einem unbestimmten Artikel), dann ergibt sich auf der Basis einer Quantitätsimplikatur, dass die darüber liegenden Ausdrücke keine Anwendung finden – denn wäre der kognitive Status nicht „type identifiable“, sondern etwa „uniquely identifiable“ (signalisiert durch den bestimmten Artikel), dann wäre die Wahl des unbestimmten Artikels nicht hinreichend informativ gewesen – also ein Verstoß gegen die Quantitätsmaxime. Die Grice’schen Maximen werden also ihrer Bestimmung gemäß als interpretative Prinzipien eingesetzt, die die Zuschreibung eines Sinns lenken und erleichtern sollen, und zwar über unser semantisches Wissen hinaus. In dem vorliegenden Fall kann man mit diesem Instrument die Präferenz der Wahl spezifischer referierender Ausdrucksalternativen erklären, und zwar sowohl in Abgrenzung nach oben (zum ‚höheren‘ Ende hin) als auch nach ‚unten‘. Die Anwendung des Begriffs der skalaren Implikatur ist eine Erklärungsstrategie, die GHZ einsetzen, um unser Sprachverhalten angemessen zu beschreiben. Ein möglicher Einwand ist, dass es sich mit der implikationalen Hierarchie um eine recht große Skala handelt, die das übliche Format von skalaren Implikaturen überschreitet. Es ist die Frage, ob unsere pragmatische Kompetenz über solch große Distanzen Quantitätsimplikaturen durchzuführen erlaubt. Auch ist es nicht sicher, ob es sich um eine Skala oder, wie es den Anschein hat, um mehrere Skalen handelt, die ineinander geschoben wurden. Unabhängig von Einwänden dieser und verwandter Art,

316 

 Frank Liedtke

die zu einer Differenzierung des Modells führen müssten (etwa im Sinne von Ariel 2008), ist mit der Verbindung von informationsstrukturellen Größen (hier in kognitiver Lesart) und pragmatischen Schlussverfahren und -prinzipien der Weg gewiesen, den eine inferenzbasierte Erklärungsstrategie im Bereich der Wahl referierender Ausdruckstypen nehmen muss.

4 Bindungstheorie und pragmatisches Schließen 4.1 Bindungstheorie syntaktisch Einen ambitionierten Versuch, syntaktische und pragmatische Regularitäten aufeinander zu beziehen, hat Stephen Levinson vorgelegt. In seinem Buch Presumptive Meanings (2000) sowie in vorbereitenden Publikationen (für unseren Zusammenhang sind die Aufsätze (1987) und (1991) besonders relevant) entwickelt er eine Theorie der anaphorischen Bindung, die durchaus den Anspruch erhebt, in Konkurrenz zur Rektions- und Bindungstheorie Noam Chomskys zu treten. Diese spielt in seinem gleichnamigen Ansatz der achtziger Jahre des 20. Jahrhunderts eine tragende Rolle, ist allerdings auch im minimalistischen Programm noch wirksam (s. Chomsky 1981, 1995). Der Grundgedanke ist, dass die Bedingungen für die Bindung von Anaphern, die im Rahmen der generativen Syntax rein strukturell mit Hilfe des Begriffs des c-Kommandos formuliert wurden, auf pragmatische Prinzipien der Interpretation zurückgeführt werden können. Diese Prinzipien stellen eine Weiterentwicklung (vor allem in Sinne einer Reduktion) der von Grice im Rahmen seiner Konversationslogik entwickelten Konversationsmaximen dar (s. Grice 1993). Um die Diskussion möglichst vollständig darzustellen, sollen so knapp wie möglich die Grundzüge der Rektions- und Bindungstheorie erläutert werden, um im Anschluss daran die Theorie der generalisierten Implikaturen  – ebenso knapp wie möglich – vorzustellen. Es steht der Versuch zur Debatte, die syntaktischen Bindungskriterien durch eine pragmatische Erklärungsstrategie zu ersetzen, die im Wesentlichen auf der Interaktion dreier Prinzipien präsumptiver Bedeutung aufbaut. Es soll hier schon darauf hingewiesen werden, dass Levinsons Ansatz in mehrfacher Hinsicht auf den Arbeiten von Farmer/Harnish (1987) und Huang (1994) aufbaut, wobei Letzterer auch Anaphern im Chinesischen untersucht hat. Im Rahmen der Rektions- und Bindungstheorie geht es zentral um drei Typen von Ausdrücken: Reflexiv- und Reziprokpronomen (sich; einander), Personalpronomen (er; sie; es) und referierende Nominale (der Mann; die Frau; das Kind). Im Englischen, an dem die Theorie ursprünglich entwickelt wurde, geht es um den Kontrast zwischen himself, him und the man. Dem generativistischen Ansatz ist nun eigentümlich, dass der Anaphernbegriff gegenüber der üblichen Verwendungsweise in der Linguistik stark eingeschränkt wird: Nur Reflexiv/Reziprokpronomen zählen

Syntax und moderne Pragmatik 

 317

als Anaphern, nicht jedoch beispielsweise Personalpronomen. Im Sinne dieser eingeschränkten Lesart werden drei Bedingungen für die Bindung von Anaphern formuliert. Um sie nachvollziehen zu können, müssen wir uns kurz mit dem Begriff des c-Kommandos vertraut machen (vgl. Oehl in diesem Band). Das c-Kommando ist eine strukturelle Beziehung zwischen zwei Konstituenten eines Satzes (oder einer ‚kleineren‘ Domäne), nennen wir sie X und Y. c-Kommando liegt vor, wenn X und Y gemeinsam von einem höherliegenden verzweigenden Knoten Z regiert werden. Allerdings dürfen weder X selbst noch Y dieser höhere Knoten Z sein. Liegt c-Kommando vor, dann ist (beispielsweise) Y innerhalb der relevanten Domäne von X gebunden; liegt kein c-Kommando vor, dann ist Y bezogen auf X innerhalb der Domäne frei. Unter der relevanten Domäne können wir uns den Satz oder die NP vorstellen, innerhalb derer sich die Beziehung des c-Kommandos abspielt (zu den Bindungs-Bedingungen s. Chomsky 1981; die folgenden Beispiele sind entnommen aus Levinson 2000, 283; für weitere Ausführungen zur Rektions- und Bindungstheorie s. Fanselow/Felix 1987). Mithilfe der eingeführten Begriffe können wir nun die syntaktischen Bedingungen für Anaphern, Pronomina und NPs formulieren: – Bedingung A: Eine Anapher ist in ihrer relevanten Domäne gebunden. – Bedingung B: Ein Pronomen ist in seiner relevanten Domäne frei. – Bedingung C: Ein referierender Ausdruck (eine NP) ist frei  – unabhängig von einer Domäne. Anhand einiger Beispiele lassen sich die Bedingungen illustrieren. Ich habe den englischsprachigen Beispielen aus Levinson (2000) die deutsche Entsprechung hinzugefügt, um die jeweiligen lexikalischen Verhältnisse innerhalb der Sprachen zu verdeutlichen: – Hans bewundert sich (selbst). – John admires himself: Die Anapher sich (selbst)/ himself ist nach Bedingung A gebunden, es liegt Korreferenz vor. – Hans bewundert ihn. – John admires him: Das Pronomen ihn/him ist nach Bedingung B frei, es liegt eine disjunkte Interpretation nahe. – Hans bewundert den Professor.  – John admires the professor: den Professor/the professor ist nach Bedingung C frei, es liegt ebenfalls eine disjunkte Interpretation nahe. Um die Relevanz der jeweiligen syntaktischen Domäne zu erläutern, seien noch zwei Beispiele für das Überschreiten der Domänengrenze gegeben. Sie verdeutlichen, dass die Bedingungen für Korreferenz/disjunkte Referenz dann nicht mehr greifen. – Hans sagte, dass er kommen würde.  – John said he would come: Hier ist  – im Gegensatz zum obigen Beispiel mit Pronomen  – Korreferenz möglich, da die c-kommandierende Konstituente Hans/John außerhalb des Matrixsatzes und damit der relevanten Domäne steht. – Hans sagte, dass der Professor kommen würde.  – John said the professor would come: Korreferenz ist nicht möglich, weil gemäß Bedingung C referierende Aus-

318 

 Frank Liedtke

drücke (die NP der Professor/the professor) unabhängig von jeder syntaktischen Domäne frei, also nicht gebunden sind. Man kann die oben angegebenen Bedingungen für die Bindung von Ausdrücken als Anweisungen betrachten, wie diese zu interpretieren sind. Man würde beispielsweise Bedingung B so umformulieren können, dass man etwa zu folgender Interpretationsregel käme: Wenn dir ein Pronomen begegnet, dann interpretiere es innerhalb der relevanten Domäne nicht als korreferent mit seinem Antezendenten, d. h. mit dem vorangehenden referierenden Ausdruck (einem Nomen). Die anderen Bedingungen können entsprechend ebenfalls als interpretative Anweisungen umformuliert werden. Diese Möglichkeit hat nun einige Pragmatiker dazu veranlasst, die Beziehungen von Anaphern/Pronomen und ihren jeweiligen Antezedenten neu zu formulieren, und zwar unter Rückgriff auf pragmatische Prinzipien der Äußerungsinterpretation. Da Levinson in seinem schon erwähnten Buch von 2000 eine explizite Ausformulierung des pragmatischen Pendants zu den syntaktischen Bindungsprinzipien vorgestellt hat, sei diese hier exemplarisch dargestellt. Um dies tun zu können, soll wiederum die theoretisch-begriffliche Grundlage der präsumptiven Bedeutungstheorie vorgestellt werden.

4.2 Bindungstheorie pragmatisch Das grundlegende Ziel Levinsons ist es, einerseits die Vielzahl der Konversationsmaximen, die Grice in seinem einflussreichen Aufsatz unterschieden hat, auf drei Prinzipien herunterzubrechen. Andererseits entwirft er in seinem Ansatz eine Theorie der standardisierten konversationellen Schlussverfahren, eine Theorie also, die nicht mit jeder Äußerung ein erneutes Durchlaufen der Grice’schen Kategorien und Schlüsse unterstellt, sondern allgemeine, kontextunabhängige Prinzipien des Inferierens annimmt. Levinson bezieht sich dabei wesentlich auf den Grice’schen Begriff der generalisierten konversationellen Implikatur, abgekürzt GKI. Ganz allgemein ist zunächst zu bemerken, dass er dabei durchaus die Augenhöhe zu den generativistischen Ansätzen sucht, indem er beansprucht, eine Theorie der bevorzugten Interpretation von Äußerungstypen auszuformulieren: „The theory of GCIs is not of course a theory of conventional idioms, clichés and formulae, but it is a generative theory of idiomaticity – that is, a set of principles guiding the choice of the right expression to suggest a specific interpretation“ (Levinson 2000, 24). Wie sieht eine solche Strategie im Einzelnen aus? Generalisierte konversationelle Implikaturen (im Folgenden GKI) sind im Gegensatz zu den partikularisierten (PKI) ein standardisierter, relativ kontextunabhängiger Typ von Schlussverfahren. Bei PKI durchlaufen wir das klassische Grice’sche Schema der inferenziellen Interpretation: Wenn wir auf die Frage Wo wohnt C? als Antwort die Auskunft erhalten: Irgendwo in Südfrankreich, dann werden wir zunächst einen

Syntax und moderne Pragmatik 

 319

Verstoß gegen die erste Quantitätsmaxime feststellen. Der Antwortende war nicht informativ genug. Eine partikularisierte Implikatur entsteht dadurch, dass es H nicht bei dieser Feststellung belässt, sondern eine Interpretation wählt, die in Übereinstimmung mit dem allgemeinen Kooperationsprinzip steht. Im Sinne dieses Prinzips würde man zu einer Interpretation gelangen wie: „S weiß den Aufenthaltsort nicht genau“ o. Ä. Generalisierte Implikaturen kürzen diesen inferenziellen Weg ab. Sie entstehen dadurch, dass bestimmte Ausdrücke von S gewählt werden, wobei aufgrund der Quantitätsmaxime erschlossen werden kann, dass ein alternativer, stärkerer Ausdruck unangemessen wäre, denn das würde gegen die erste Teilmaxime der Quantität verstoßen. Dies hatten wir als skalare Implikatur eingeführt. Wir haben es nun mit einer zwar verwandten, aber doch anderen Skala zu tun: Eine Äußerung wie Sie ging in ein Haus und entdeckte darin eine Schildkröte wird aufgrund der Quantitätsmaxime in der Regel so interpretiert, dass es sich weder um ihr Haus noch um ihre Schildkröte handelt. Dies ist ein Schluss ex negativo: Wäre es ihr Haus oder ihre Schildkröte gewesen, dann wäre S mit dem gegebenen Satz unterinformativ gewesen, S hätte nicht die nötige Information gegeben, die man für diese Interpretation gebraucht hätte. Das entscheidende Merkmal für GKIs ist nun, dass dieser Schluss immer dann gezogen wird, wenn entgegenstehende Informationen nicht vorliegen. Schlüsse dieser Art heißen default-Inferenzen. Kurz gesagt ist der Unterschied zwischen PKI und GKI derjenige, dass für Erstere bestimmte Informationen vorliegen müssen, um sie zu vollziehen (Maximenverstoß u. a.), für Letztere entgegenstehende Informationen nicht vorliegen dürfen, um sie vollziehen zu können. Mit Blick auf den vorhergehenden Absatz können wir also sagen: skalare Implikaturen sind GKIs. Levinson arbeitet in seinem Ansatz in Presumptive Meanings (2000) den Begriff der generalisierten konversationellen Implikatur zu einer allgemeinen Theorie der Äußerungsbedeutung aus. Grundlegend und für das Phänomen der anaphorischen Bindung zentral ist seine Formulierung dreier Prinzipien (in Anlehnung an Grice), die seiner Ansicht nach jeder Form sprachlicher Kommunikation zugrunde liegen. Die Benennung der Prinzipien macht die Anbindung an Grice deutlich: Sie heißen Q-Prinzip (in Anlehnung an die erste Quantitätsmaxime), I-Prinzip (Informativität im Sinne der zweiten Quantitätsmaxime) und M-Prinzip (in Anlehnung an die Modalitätsmaxime, die die Kürze, Klarheit und Verständlichkeit des Diskurs-Beitrags betrifft). Sie lassen sich wie folgt wiedergeben: Q-Prinzip, sprecherseitig: Triff keine Feststellungen, die deinen Kenntnisstand des umgebenden Weltzustands unterschreiten; wähle jeweils die stärkste Version, die mit der Faktenlage vereinbar ist. Hörerseitig: Wenn es eine Interpretation der Sprecheräußerung gibt, die mit dieser vereinbar, aber viel stärker als das wörtlich Ausgedrückte ist, dann gehe davon aus, dass diese stärkere Interpretation nicht die intendierte ist. Am Beispiel der Schildkröte im Haus lässt sich dies illustrieren. Vorausgesetzt, wir haben ein geordnetes Paar von Ausdrücken, bei dem mein der stärkere, ein der schwächere Part ist, so dass wir eine Skala erhalten der Form , dann ergibt

320 

 Frank Liedtke

sich: Die Interpretation, dass es sich um das Haus und die Schildkröte der Sprecherin handelt (= das stärkere mein auf der Skala), ist nicht intendiert, denn diese Lesart würde sowohl dem sprecherseitigen als auch dem hörerseitigen Teil des Q-Prinzips widersprechen. Diese Lesart ergibt sich kontextfrei, per default oder eben: generalisiert (Levinson 2000, 76). I-Prinzip, sprecherseitig: Triff Feststellungen mit dem minimalen Informationsgehalt, der ausreicht, um deine kommunikativen Intentionen zu realisieren (wobei dieses Minimum nach ‚unten‘ durch das Q-Prinzip begrenzt ist). Hörerseitig: Da S nur das Minimum kommuniziert, reichere den Informationsgehalt der S-Äußerung in der Weise an, wie es S rationalerweise unterstellt werden kann. Die Anreicherungen können temporale, lokale oder referenzielle Beziehungen zwischen Entitäten betreffen. Das klassische Beispiel ist hier: Er zog sich die Schuhe an und stieg aus dem Bett. Der Konnektor und wird im Sinne der Lesart einer zeitlichen Reihenfolge pragmatisch angereichert, so dass wir eine und-dann-Lesart vornehmen (Levinson 2000, 114). M-Prinzip, sprecherseitig: Als Gegenstück zum I-Prinzip lässt sich hier formulieren: Triff Feststellungen über ungewöhnliche, nicht stereotype Situationen mittels markierter Ausdrücke, die mit den minimalen Feststellungen gemäß des I-Prinzips konkurrieren. Hörerseitig: Eine reichere, markierte oder ungewöhnliche Ausdrucksweise ist korreliert mit einer ungewöhnlichen Situation. Betrachten wir auch hier das Beispiel der Koordination mit und: Eine Äußerung wie Er betätigte den Schalter und der Zimmerspringbrunnen setzte sich in Gang wird dem I-Prinzip entsprechend angereichert zu und infolgedessen, das heißt, es wird eine kausale Folgebeziehung zwischen den beiden beschriebenen Ereignissen angenommen. Durch die ausführlichere Form Er betätigte den Schalter und genau in dem Moment setzte sich der Zimmerspringbrunnen in Gang wird keine Aussage über eine kausale Beziehung getroffen (Levinson 2000, 136 f.) Soweit die kurze Darstellung der Grundidee der präsumptiven Interpretation von Levinson. Präsumptiv, also bis auf Weiteres gültig ist diese Art der Äußerungsinterpretation deshalb, weil der unterstellte Äußerungssinn eben nur ein vorläufiger, bis zum Erweis des Gegenteils gültiger ist. Sobald sich Gegenevidenz zur vorgenommenen Interpretation ergibt, wird eine konkurrierende Interpretation in Betracht gezogen – ebenfalls wieder präsumptiv. Dieser Charakter der Interpretation ist Reflex einer zentralen Eigenschaft von konversationellen Implikaturen, also auch der generalisierten: ihrer Tilgbarkeit, also der Rücknehmbarkeit der konversationellen Inferenz bei gegenteiliger Information. Konversationelle Implikaturen sind entweder explizit oder kontextuell tilgbar, sie sind widerspruchsfrei zurücknehmbar mithilfe solcher Wendungen wie vielmehr, besser gesagt u. a. Wie greifen nun die eingeführten Prinzipien ein in die Formulierung einer pragmatischen Bindungstheorie als Alternativkonzept zur generativ-syntaktischen Theorie? Grundsätzlich, soviel zunächst allgemein, geht es Levinson darum, die Arbeitsteilung zwischen Syntax und Pragmatik neu zu definieren. Etwas konkreter besteht sein Vorschlag darin, den soeben skizzierten Prinzipien Konkretisierungen hinzuzufügen, die

Syntax und moderne Pragmatik 

 321

an die Stelle einer syntaktischen Erklärung der Bindungsverhältnisse treten. Hierbei gibt es zwei Wege, einen moderaten und einen radikalen Weg. Levinson wählt, nach einer Diskussion des moderaten, letztlich den radikalen Weg, in der Überzeugung, „that anaphora is primarily a pragmatic matter“ (Levinson 2000, 267). Die Anbindung einer pragmatischen Theorie der Anapher an die eingeführten Prinzipien präsumptiver Bedeutung wird über den Begriff der Informativität geleistet. Grob gesagt weisen Anaphern gegenüber ihren Antezedenten (den Bezugsausdrücken) einen geringeren Grad an Informativität auf, sie ‚verweisen‘ aufgrund dieser Unterspezifikation auf ihre Antezedenten, und dieses ‚Verweisen‘ kann in Begriffen der Prinzipien der Informativität ausformuliert werden. Sehen wir uns an, wie diese Arbeitsteilung zwischen Anapher und Bezugsausdruck in concreto funktioniert, wobei zunächst der moderate, dann der radikale Vorschlag dargestellt werden soll. Der moderate Vorschlag: Die Bedingung A der syntaktischen Bindungstheorie (Eine Anapher ist in ihrer relevanten Domäne gebunden) wird weiterhin syntaktisch expliziert, die Bedingung B (Ein Pronomen ist in seiner relevanten Domäne frei) sowie die Bedingung C (Ein referierender Ausdruck (eine NP) ist frei – unabhängig von irgendeiner Domäne) werden pragmatisch als Ergebnis einer GKI, hauptsächlich auf der Basis des I-Prinzips erklärt. Der radikale Vorschlag: Dieser geht erheblich weiter; Bedingung B wird pragmatisch als Ergebnis einer GKI primär auf der Basis des I-Prinzips erklärt, Bedingungen A und C werden von dieser abgeleitet und somit ebenfalls pragmatisch expliziert. Der ambitionierte Anspruch des radikalen Vorschlags ist nur dann einzulösen, wenn er auf einem ebenso starken Grundprinzip aufruht wie die Bedingungen der Bindungstheorie, die an eine bestimmte Version der universellen Grammatik rückgebunden sind. Dieses Grundprinzip ist durch die Annahme der disjunkten Referenz gegeben (Farmer/Harnish 1987; Levinson 2000, 328); sie wird folgendermaßen ausbuchstabiert: Nehmen wir einen prototypischen Satz, der sich auf eine Szene bezieht mit einem Handelnden und einem Objekt, auf das dieser einwirkt, und nehmen wir weiterhin an, dass sich diese Konstellation in zu spezifizierender Weise als ursprünglich herausstellt. Wir können dann weiterhin annehmen, dass dies die Beschreibung eines ‚Ur-Aktes‘ ist, wobei diese Beschreibung in ihrer unmarkierten Form das Einwirken eines belebten Agens auf ein unbelebtes Patiens beinhaltet (Argumente für diese Annahme bringt Comrie 1981 vor). Daraus folgt, dass ein Agens und ein Patiens in dieser ursprünglichen Szene als disjunkt interpretiert werden; die korreferente Lesart der Mitspieler, also das Einwirken auf sich selbst, stellt dann den markierten Fall dar. Genau das besagt die Annahme der disjunkten Referenz. Die dargestellte Annahme wirkt in dieser Form leicht spekulativ, aber es stehen eine Reihe von typologischen Beobachtungen zur Verfügung, die sie stützen. Anaphern im Chomsky’schen Sinne treten als Reflexivpronomina auf. Es scheint nun im typologischen Vergleich eine Konstante zu geben, die Reflexivpronomina im Gegensatz zu nicht-reflexiven Pronomina als die markierte Variante auszeichnet. So erscheint im Englischen das reflexive himself markiert gegenüber dem Pronomen

322 

 Frank Liedtke

him – oder, in der skalaren Schreibweise: . Im Deutschen ist dieser Kontrast schwächer (), allerdings kann die Partikel selbst zur Verstärkung des Reflexivums beitragen, womit wir dann eine analoge Skala haben (zu einer sprachvergleichenden Perspektive s. Ariel 2008). Beiden Sprachen gemeinsam ist die Möglichkeit, diese Partikel zur Verstärkung der Aussage zu verwenden, so dass sie von der typologisch verbreiteten Tendenz Gebrauch machen, Reflexivität und Emphase formal einander anzunähern. Die pragmatische Fundierung der B-Bedingung lässt sich, exemplarisch an diesem Fall verdeutlicht, so darstellen: Dass ein Pronomen in seiner relevanten Domäne frei ist, wird mit der Annahme der disjunkten Referenz begründet, die ihrerseits in der grundlegenden Voraussetzung des unmarkierten Falls der ein belebtes Agens und ein unbelebtes Patiens enthaltenden Szene wurzelt. – Hans bewundert ihn. – John admires him. (Disjunkte Lesart aufgrund der zugrundeliegenden Annahme disjunkter Referenz) – Hans bewundert sich (selbst).  – John admires himself. (Korreferente Lesart aufgrund des M-Prinzips) – Hans sagt, dass er Hunger hat. – John says he is hungry. (Korreferent aufgrund des I-Prinzips) – Hans sagte, dass der Junge ging. – John said the boy went. (Disjunkt aufgrund des M-Prinzips) Die Arbeit des I- und des M-Prinzips kann folgendermaßen beschrieben werden: Die Tatsache, dass die korreferente Lesart im zweiten Beispiel aus dem M-Prinzip folgt, erklärt sich aus der Verwendung des markierten Ausdrucks sich (selbst)/himself gegenüber der unmarkierten Variante in Gestalt des Pronomens ihn/him. Hörerseitig können wir aus der Wahl der markierten Form schließen (per GKI), dass offenkundig eine Feststellung über eine nicht-stereotype Situation vorliegt. Somit liegt eine Kongruenz der Form und der dargestellten Situation hinsichtlich ihrer Markiertheit/ Nicht-Prototypizität vor und auf theoretischer Ebene ein pragmatisches Gegenstück zur Bedingung A der Rektions- und Bindungstheorie. Schauen wir uns den dritten Fall an, dann haben wir ein außerhalb seiner relevanten Domäne gebundenes Pronomen, was konsistent mit der Bedingung B ist. Die konkurrierende Erklärung mittels des I-Prinzips macht sich den Unterschied des dritten gegenüber dem vierten Beispielsatz zunutze. Die reduzierte Form des Pronomens er/he gegenüber der vollen NP der Junge/the boy ruft das I-Prinzip auf, das einen minimalen Informationsgehalt im Falle der prototypischen Situation nahelegt. Pronomina wie er etc. sind gegenüber der nominalen Form wie der Junge etc. semantisch allgemeiner und weniger spezifiziert. Sie weisen also vergleichsweise geringere Informativität auf, was dazu führt, dass sie (hörerseitig) pragmatisch angereichert werden. Daraus ergibt sich, dass der Gebrauch semantisch unterspezifizierter Ausdrücke (wie Pronomina) Korreferenz innerhalb wie außerhalb einer lokalen Domäne implikatiert, in diesem Fall aufgrund des I-Prinzips. Der reziproke vierte Fall löst eine andere GKI

Syntax und moderne Pragmatik 

 323

aus: Die Verwendung des komplexeren Ausdrucks (im Vergleich mit dem Pronomen) führt zur GKI der disjunkten Referenz, denn aufgrund des M-Prinzips folgt aus dem Gebrauch einer (gegenüber dem semantisch allgemeinen Pronomen) markierten Form mit höherem Informationsgehalt auch die Signalisierung einer komplexeren Situation – es handelt sich offenkundig um zwei Personen. Durch die Anwendung des Q-, I- und M-Prinzips können also die in den Beispielen dargestellten Fälle der gebundenen Anapher bzw. des freien Pronomens und Nomens einschließlich der Wirkung der Domänengebundenheit aus einer Theorie der GKI hergeleitet werden. Somit wäre grundsätzlich der Nachweis erbracht, dass pragmatische Prinzipien der präsumptiven Interpretation, gemeinsam mit Annahmen über Präferenzen der Referenzzuweisung, an die Stelle der syntaktischen Bindungsprinzipien treten können. Eine vertiefte Ausarbeitung dieser Erklärungsstrategie findet sich vor allem in den neueren Arbeiten von Huang (s. Huang 2000). Es ist wichtig zu sehen, dass das Ziel der pragmatischen Erklärungsansätze nicht in einer völligen Substitution der syntaktischen durch die pragmatische Erklärungsstrategie besteht. Es wird eher von einer historisch oder auch typologisch bedingten Ergänzung beider Strategien ausgegangen. So werden Sprachen oder auch historische Entwicklungsstufen einer Sprache angenommen, die mit den pragmatischen Bindungsprinzipien erklärbar sind, andererseits Sprachen oder Entwicklungsstufen, die stärker syntaktisch geprägt sind, wobei diachron der Weg von der pragmatischen zur syntaktischen Fundierung verläuft. Eine vollständige Beschreibung der Bindungsverhältnisse muss damit von beiden Erklärungsstrategien Gebrauch machen, der syntaktischen wie der pragmatischen.

5 Literatur Altmann, Hans (1987): Zur Problematik der Konstitution von Satzmodi als Formtypen. In: Meibauer, 22–56. Altmann, Hans (1993): Satzmodus. In: Jacobs u. a., 1006–1029. Ariel, Mira (2008): Pragmatics and Grammar. Cambridge. Austin, John L. (1972): Zur Theorie der Sprechakte. Stuttgart. Bolkestein, Machtelt (1993): General ideas of functionalism in syntax. In: Jacobs u. a., 339–349. Bühler, Karl (1934): Sprachtheorie. Die Darstellungsfunktion der Sprache. Jena. Neudruck. Stuttgart 1999. Chomsky, Noam (1981): Lectures on Government and Binding. The Pisa Lectures. Dordrecht. Chomsky, Noam (1995): The Minimalist Program. Cambridge. Comrie, Bernard (1981): Language Universals and Linguistic Typology. Oxford. Daneš, František (1964/66): A three level approach to syntax. In: Traveaux du cercle linguistique de Prague 1, 225–240. Dominicy, Marc/Nathalie Franken (2002): Speech acts and relevance theory. In: Daniel Vanderveken/ Susumo Kuno (Hg.): Essays in Speech Act Theory. Amsterdam, 263–283. Fanselow, Gisbert/Sascha Felix (1987): Sprachtheorie. Band 2: Die Rektions- und Bindungstheorie. Tübingen.

324 

 Frank Liedtke

Farmer, Ann K./Robert M. Harnish (1987): Communicative reference with pronouns. In: Jef Verschueren/Marcella Bertucelli-Papi (Hg.): The Pragmatic Perspective. Amsterdam, 547–565. Firbas, Jan (1992): Functional Sentence Perspective in Written and Spoken Communication. Cambridge. Gabelentz, Georg (1891): Die Sprachwissenschaft. Ihre Aufgaben, Methoden und bisherigen Ergebnisse. Leipzig. GHZ = Gundel, Jeannette/Nancy Hedberg/Ron Zacharski (1993): Cognitive status and the form of referring expressions in discourse. In: Language 69 (2), 274–307. Grice, H. Paul (1993): Logik und Konversation. In: Georg Meggle (Hg.): Handlung, Kommunikation, Bedeutung. Frankfurt a. M., 243–265. Halliday, Michael A. K. (1967): Notes on transitivity and theme in English (Part 2). In: Journal of Linguistics 3, 177–274. Harnish, Robert M. (1994): Mood, meaning, and speech acts. In: Savas L. Tsohatzidis (Hg.): Foundations of Speech Act Theory: Philosophical and Linguistic Perspectives. London, 407–459. Horn, Laurence (1984): Toward a new taxonomy for pragmatic inference. Q- and R-based implicature. In: Deborah Shiffrin (Hg.): Meaning, Form, and Use in Context. Washington, D. C., 11–42. Huang, Yan (1994): The Syntax and Pragmatics of Anaphora. A Study with Special Reference to Chinese. Cambridge. Huang, Yan (2000): Anaphor. A Crosslinguistic Study. Oxford. Jacobs, Joachim u. a. (Hg.) (1993): Syntax. Ein internationales Handbuch zur zeitgenössischen Forschung. Berlin. Kissine, Mikhail (2013): From Utterances to Speech Acts. Cambridge. Levinson, Stephen C. (1987): Pragmatics and the grammar of anaphora. In: Journal of Linguistics 23, 379–434. Levinson, Stephen C. (1991): Pragmatic reduction of the binding conditions revisited. In: Journal of Linguistics 27, 107–161. Levinson, Stephen C. (2000): Presumptive Meanings. The Theory of Generalized Conversational Implicature. Cambridge. Liedtke, Frank (1998): Grammatik der Illokution. Tübingen. Mathesius, Vilèm (1929): Die funktionale Linguistik. In: Traveaux du cercle linguistique de Prague. Neudruck. Nendeln 1968. Meibauer, Jörg (Hg.) (1987): Satzmodus zwischen Grammatik und Pragmatik. Tübingen. Paul, Hermann (1995): Prinzipien der Sprachgeschichte. 10., unveränderte Auflage. Tübingen. Prince, Ellen (1981): Toward a taxonomy of given-new information. In: Peter Cole (Hg.): Radical Pragmatics. New York/London, 223–255. Rosengren, Inger (1988): Die Beziehung von Satztyp und Illokutionstyp aus einer modularen Sicht. In: Linguistische Studien, Reihe A/185. Berlin, 113–138. Sadock, Jerry M. (1994): Toward a grammatically realistic typology of speech acts. In: Savas L. Tsohatzidis (Hg.): Foundations of Speech Act Theory: Philosophical and Linguistic Perspectives. London, 393–406. Scholz, Ulrich (1987): Wunschsätze im Deutschen. In: Meibauer, 234–258. Searle, John R. (1968): Austin on locutionary and illocutionary acts. In: Philosophical Review 77, 405–424. Searle, John R. (1971): Sprechakte. Ein sprachphilosophischer Essay. Frankfurt a. M. Searle, John R. (1982): Eine Taxonomie illokutionärer Akte. In: ders.: Ausdruck und Bedeutung. Frankfurt a. M., 17–50. Sperber, Dan/Deidre Wilson (1986): Relevance: Communication and Cognition. Oxford.

Syntax und moderne Pragmatik 

 325

Wunderlich, Dieter (1984): Was sind Aufforderungssätze? In: Gerhard Stickel (Hg.): Pragmatik in der Grammatik. Düsseldorf, 92–117.

Sven Staffeldt

14. Einheiten des pragmatischen Standards Abstract: Der Beitrag beschäftigt sich mit der Frage, wie sprachlich-kommunikative Einheiten als zum pragmatischen Standard gehörend verstanden werden können. Dabei wird zunächst der Standardbegriff zu klären sein, was negativ über variationslinguistische Ab- und positiv über situationale Eingrenzungen geschieht. Ist die Diskussion um den Begriff eines sprachlichen Standards (als Standardsprache bzw. Standardvarietät) in der Variationslinguistik gut etabliert, wird mit der Klärung des Begriffs eines pragmatischen Standards weitgehend Neuland betreten. Es können hier zwei Lesarten auseinandergehalten werden: diejenige eines gesprochensprachlichen Standards (etwa im Unterschied zu dem eines geschriebensprachlichen) und diejenige eines Sprachhandlungsstandards (etwa im Unterschied zu dem eines phonetisch-phonologischen oder morphologisch-syntaktischen Standards). Im ersten Verständnis wird die Frage zu beantworten sein, ob sich mediale Unterschiede in der Standardsprachlichkeit zeigen, die es notwendig machen, einen gesprochensprachlichen Standard anzusetzen. Im zweiten Verständnis geht es um die beiden miteinander zusammenhängenden Fragen, welche sprachliche Handlungen und welche Realisierungsformen sprachlicher Handlungen als standardsprachlich (im Gesprochenen und Geschriebenen) angesehen werden können.

1 Standardbegriff – ex negativo und positiv 2 Standardbegriff situational 3 Schriftsprachstandard, Standardisierung und Kodifizierung 4 Pragmatischer Standard 5 Literatur

1 Standardbegriff – ex negativo und positiv Bei jeder sozial-alltäglichen verbalen Kommunikation kompetenter SprecherInnen muss man sich darauf verlassen können, dass es grundsätzlich möglich ist, Sprache so zu gebrauchen, dass man verstanden wird. Die soziale Wirklichkeit ist zum größten Teil sprachlich konstituiert: Kleine und große Verkäufe werden sprachlich abgewickelt, Bewerbungsgespräche geführt, Miet- und Arbeitsverträge unterschrieben, für die Sozialversicherung und die Steuer müssen Angaben gemacht werden, man muss einen Ausweis beantragen, man unterrichtet und wird unterrichtet, man grüßt Nachbarn und Kollegen, man erklärt jemandem, wie man irgendwohin gelangt usw. Nahezu jede soziale Situation scheint ganz wesentlich verbal verwoben zu sein. In jeder Schule, auf jedem Amt, bei jeder Versicherung, aber auch im familiären,

Einheiten des pragmatischen Standards 

 327

nachbarschaftlichen oder beruflichen Umfeld usw. kommt es darauf an, verstanden werden zu können. Die Möglichkeit des Verstehens ist eine der Voraussetzungen sprachlicher Interaktion und sprachliche Interaktion ist ein wesentliches Mittel, Verstehensprozesse anzustoßen. Man könnte dies das funktionalistische Axiom der Sprachbetrachtung nennen: Grundfunktion der Sprache ist es, durch deren Verwendung Verstehen zu ermöglichen. Sprache in ihrer Verwendung ist nicht nur ein personenabhängiges Phänomen, sondern u. a. auch ein räumliches. Entsprechend werden als verschiedene Erscheinungsformen ein und derselben Sprache (Varietäten) beispielsweise Idiolekte und Soziolekte einerseits von Regiolekten und Dialekten anderseits unterschieden (s. unten Abb. 1). Die Standardvarietät lässt sich nun in erster Näherung negativ über die Nicht-Identität mit einer der anderen Varietäten definieren (so zum Beispiel Glinz 1980). Varietäten sind als andere Erscheinungsformen aus dieser Perspektive nur deshalb Varietäten, weil sie sich vom Standard als Vergleichsvarietät unterscheiden. Es ließe sich dann sagen: Wenn eine deutschsprachige Äußerung kein Merkmal enthält, das einer anderen Varietät zugeordnet werden kann, so handelt es sich um eine voll standardsprachliche Äußerung des Deutschen. Das würde bedeuten: Jede andere Varietät ist gegenüber dem Standard in bestimmten sprachlichen Ausprägungen markiert. Wie bei Fremdwörtern Fremdheitsmerkmale eine Rolle spielen, anhand derer sprachliche Einheiten als einer Nehmersprache fremd erkannt werden können (vgl. hierzu Eisenberg 2011, 1–36), so spielen bei den Varietäten Nicht-Standard-Merkmale eine Rolle, anhand derer sprachliche Einheiten als einer bestimmten Nicht-Standard-Varietät zugehörig erkannt werden können. Varietäten sind deswegen Varietäten, weil die Sprache hier variiert. Gemeinsamer synchroner Bezugspunkt zum Abgleich, wie stark die Variation ist und in welchen Bereichen wie variiert wird, ist die sich diachron natürlich auch wandelnde Standardsprache. Variation kann als Variation nur betrachtet und überhaupt als solche bemerkt werden, wenn es zu einem bestimmten Zeitpunkt einen hinsichtlich der Frage nach Variation neutralen Bereich ohne oder mit jedenfalls unmarkierter Varianz gibt, von dem sie sich unterscheiden (oder schwächer formuliert: irgendein tertium comparationis muss gegeben sein). Wenn die Fremdwortanalogie zugrunde gelegt wird, bedeutet dies aber auch: Wie es Grade der Fremdheit (oder anders gewendet: der Integration von Fremdwörtern) gibt, so gibt es Grade der Standardsprachlichkeit. Standardsprache zu sein ist keine absolute, sondern eine graduelle Angelegenheit. Eine solche Negativdefinition von Standardsprache läuft  – solange nicht auch Positivbeschreibungen der Standardsprache angeboten werden  – aber Gefahr, die Standardsprache zu virtualisieren. Eine die Varietäten gleichermaßen umfassende wie von ihnen unterschiedene Standardsprache bleibt notwendig fleischlos: Was bleibt übrig, wenn alle Varietäten weg sind? Sie gerät damit in die Nähe der allgemeinen, einzelsprachbezogenen Sprachkompetenz: der Langue. Man könnte einen negativ bestimmten Standard deswegen auch als Kompetenzstandard bezeichnen.

328 

 Sven Staffeldt

Standarddeutsch ist dann das System der deutschen Sprache ohne Berücksichtigung ihrer variierenden Parole-Ausprägungen. Der Versuch, die Standardsprache schließlich auch positiv zu beschreiben, bringt sofort ein neues Verständnis von Standard ins Spiel: Wer das Standarddeutsche beschreibt, hat nunmehr eine Varietät unter anderen im Auge: Standard sind vor allem diejenigen sprachlichen Einheiten, die innerhalb sprach- und/oder nationalterritorialer Grenzen mindestens für die Belange überregionaler Kommunikation problemlos (und das heißt auch: ohne die Gefahr, nicht oder schwer verstanden zu werden) verwendet werden können. (Hagemann/Klein/Staffeldt 2013b, 2)

Auf diese Weise kann die Standardsprache konzeptionell in einem Varietätenraum verortet werden (vgl. Abb. 1), in dem die Erscheinungsformen des Deutschen (wie auch einer Sprache allgemein) sich – wenn auch nicht vollständig, so doch systematisch umfänglich – mit der Annahme folgender Varietäten erfassen lassen (vgl. hierzu auch bereits Klein 1974, 76–86 und grundlegend Nabrings 1981, sowie Barbour/Stevenson 1998 und Löffler 2005a, 79–160 mit weiteren Varietäten und zum Teil auch anderen Kriterien und Benennungen). Ein und dieselbe Sprache in Abhängigkeit der S und H, von den Umständen, der Zeit und dem Ort (Konzept der inneren Mehrsprachigkeit)

= Varietät Individuum: personale Variation

Kodifikation (normativ-präskriptiv, gesamtgesellschaftlich): Standardvarietät

Idiolekt

Situation: diaphasische Variation

Raum: diatopische Variation

Situolekt

Dialekt Gruppe/Schicht: Diastratische Variation Soziolekt Urbanolekt Regiolekt Substandard

Sprachkontakt: Variation durch Sprachmischung Pidgin, Kreol

Register ‒ Fremdenregister/ Xenolekt ‒ Sondersprachen (z.B. Slang) Stil ‒ Genderiekt/Sexoiekt ‒ Jugendsprache ‒ Gerontolekt

Abb. 1: Sprachliche Variation nach ihren Dimensionen im Varietätenraum (vgl. Dittmar 1997, 173–251)

Einheiten des pragmatischen Standards 

 329

Wenn man sich der Standardvarietät positiv nähert, so sind zur äußeren positiven Beschreibung dieser Varietät u. a. mindestens folgende Charakteristika einschlägig (vgl. auch die Festlegungen in Deutrich/Schank 1973, 246 f. und deren als Tabelle zusammengefasste operationale Definition von Standardvarietät in Dittmar 1997, 203): 1. Verbreitung Überregionale Geltung und Verwendbarkeit (etwa als Amts- bzw. Landessprache innerhalb eines Staatsgebiets oder gesamtgesellschaftliche Verkehrssprache, Sprache in überregionalen journalistischen Nachrichten in Fernsehen, Zeitungen oder Online-Zeitungen), 2. Distanz Konzeptionelle Orientierung an der Schriftsprache, 3. Deskriptivität und Normativität Kodifizierung (etwa in Wörterbüchern und Grammatiken des Deutschen, aber auch in Ratgebern zum Verfassen bestimmter Textsorten), 4. Präskriptivität Orientierung am Standard beim Spracherwerb und an offizieller, informeller usw. Kommunikation (etwa als zu lernendes Deutsch in Schulen oder als offiziell verlautbartes Deutsch in Bekanntmachungen oder Bundespressekonferenzen usw.). Dabei sind die meisten Merkmale, die zur Explikation des Begriffs ‚standardsprachlich‘ herangezogen werden, weder notwendig noch hinreichend. Dies hat bereits Ammon (1986) für die wichtigsten Kriterien gezeigt. Lediglich eine Explikation auf normtheoretischer Grundlage (mit einer Kombination der Merkmale kodifiziert und offizielle Gültigkeit) ist danach für die Zwecke einer Begriffsexplikation als handhabbar einzuschätzen. Wenn es aber umgekehrt darum geht, zunächst einmal Standardsituationen zu beschreiben, stehen nicht mehr (notwendige oder hinreichende) Kriterien für die Zuordnung sprachlicher Einheiten zur Standardvarietät im Vordergrund des Interesses, sondern die Beschreibung der Situationen, von denen man annimmt, dass bei der Produktion von Äußerungen in diesen Situationen Standardsprachlichkeit erwartet wird. Hier wird der Begriff eines sprachlichen Standards situational.

2 Standardbegriff situational Eine positive Bestimmung der Standardvarietät wird empirisch-operational ermöglicht durch die Identifizierung von Situationen, in denen standardsprachliche Äußerungen erwartbar sind. Oder anders gewendet: Situationen, die einen mehr oder weniger starken bis erheblichen Druck auf die sprachliche Angemessenheit von Äußerungen als standarddeutsche ausüben, das sind Standardsituationen. Bei weitem nicht jede Situation übt diesen Druck aus. Wenn man mit Freunden zusammen Sil-

330 

 Sven Staffeldt

vester feiert, mit der Familie Abendbrot isst, auf einen alten Bekannten trifft, sich am Ski-Lift gegen eine Horde Kinder durchsetzen will, Zuschauer eines Boxkampfes ist – dies sind alles Situationen, die wenig bis keinen Druck in Richtung Standardsprachlichkeit aufbauen. Aber wenn man sich in einem großen Unternehmen auf eine gehobene Stelle bewirbt und zu einem Bewerbungsgespräch eingeladen wird, eine Staatsexamensprüfung absolviert oder eine Sprechstunde wahrnimmt, in der Theaterpause mit anderen zusammen im Foyer einen Sekt trinkt, eine Bahnhofsdurchsage macht (und zwar auch und gerade dann, wenn diese automatisch generiert wird), von der ZEIT interviewt wird, in einem Amt Dinge regeln muss (ein Auto anmelden, einen neuen Personalausweis beantragen etc.) – dies sind dagegen Situationen, in denen Standardsprachlichkeit erwartet wird und Nicht-Standardsprachlichkeit mehr oder weniger markiert ist. Die (intuitiv plausible, durch Studien allerdings noch zu überprüfende) These ist, dass jede Person, die sich in einer solchen Situation befindet und verbal-kommunikativ tätig werden muss, diesem Druck ausgesetzt ist, was übrigens auch zu kommunikativen Hemmungen und letztlich dazu führen kann, sich solchen Situationen möglichst wenig auszusetzen. Wie können Situationen dieser Art, Standardsituationen, näher charakterisiert werden? Was verbindet diese Situationen, von denen man intuitiv annimmt, dass sie einen solchen Druck auf die Produktion sprachlicher Einheiten ausüben? Als gemeinsame Merkmale von Standardsituationen (vgl. auch die Auflistung im Rahmen der sog. Freiburger Redekonstellationstypik in Steger u. a. 1974, 74–76) kann angenommen werden: 1. Geringerer Bekanntheitsgrad Kontakte mit Menschen außerhalb des engeren Kreises an Verwandten, Freunden und Bekannten. Grenzbereich: entfernte Verwandte, Arbeitskollegen, wenig bekannte Personen, die man aber häufig trifft usw. 2. Höherer Grad an Öffentlichkeit Kontakte mit Menschen außerhalb der eigenen Wohnung. Grenzbereich: gute Nachbarn, der Bäcker um die Ecke usw. 3. Höherer Grad an Überregionalität Kontakt mit Menschen, die sprachlich kulturell nicht aus der eigenen Heimatregion stammen und/oder auch nicht den eigenen Dialekt sprechen usw. 4. Höherer Grad an Sozialprestige Kontakte mit Menschen, bei denen es darauf ankommt, als kompetent, souverän, gebildet, sozial anerkannt, der Mittel- oder Oberschicht zugehörig usw. angesehen zu werden. 5. Stärker formell oder offiziell Kontakte mit Menschen in institutionellen (staatlichen, behördlichen usw.) Umgebungen.

Einheiten des pragmatischen Standards 

 331

Sowohl die Kriterien selbst sind graduell als auch der Zusammenfall von Kriterien. Zudem dürften die Kriterien unterschiedlich starke Auswirkungen auf die sprachliche Gestaltung haben. Die stärkste Standardsituation wäre dabei diejenige, bei der alle Kriterien in hohem Grad vorliegen (zum Beispiel: als PR-Agent für ein großes Chemieunternehmen nach einem Störfall der überregionalen Presse Rede und Antwort stehen), die schwächste, bei der nur ein eher schwaches Kriterium in geringerem Grad erfüllt ist (zum Beispiel eine Hausflurbegegnung beim Müll-Runterbringen in einem Mehrfamilienhaus mit dem unter einem wohnenden Nachbarn). Für die Erforschung der Standardvarietät haben diese Kriterien zugleich eine operationalisierende Funktion. Klein (2013, 24–26) spricht hier vom ‚usus-orientierten Zugang‘. Die Produktion von Äußerungen in so definierten Standardsituationen kann grundsätzlich als Versuch angesehen werden, möglichst standardnah zu sprechen. Kombiniert mit dem Ex-negativo-Verständnis des Standardbegriffs ergeben sich dann in einer ersten Näherung als Eigenschaften standardsprachlicher Äußerungen: möglichst wenig dialektal unterhalb eines oberen Nonstandard-Levels formulieren (vgl. Holtus/Radtke 1986, 1989, 1990; für spezielle Studien beispielsweise Kösters-Gensini 2002; Lameli 2004; Lenz 2003; Scholten 1988), möglichst wenig umgangssprachlich, möglichst wenig jugendsprachlich, möglichst wenig fachsprachlich, möglichst wenig fäkalsprachlich, möglichst wenig beleidigend usw. Was dagegen standardsprachliche Charakteristika in positiver Hinsicht sind, kann nur ermittelt werden – und hier kommt die operationalisierende Funktion der situationalen Bestimmung zum Tragen  –, wenn man das Sprachvorkommen der Beteiligten innerhalb solcher Standardsituationen untersucht (vgl. beispielsweise für die Gestaltung eines bestimmten Typs standardsprachlicher Entschuldigungen Staffeldt 2013a, b). Legt man eine solche Bestimmung des Standardbegriffs zugrunde, können sprachliche Vorkommen von vornherein als situational unterschiedlich standardsprachlich eingestuft werden. Dabei ist nicht jedes bislang als Standardsprache etikettierte Sprachdatenmaterial auch in diesem Sinn als standardsprachlich anzusehen. So sind zum Beispiel die meisten der 35 Telefondialoge in dem Band „Gesprochenes Standarddeutsch“ (Brons-Albert 1984) gering bis gar nicht situational standardsprachlich. Es handelt sich zum größten Teil um Telefongespräche von Verwandten, KommilitonInnen, Bekannten, früheren Klassenkameradinnen untereinander und nur selten kennen sich die Interaktanten nicht oder ist die Situation eher formell (z. B. Gespräch mit einem Vorgesetzten). Auch die vier Bände „Texte gesprochener deutscher Standardsprache“ (vgl. Steger u. a. 1971–1979), die auf dem Freiburger Korpus (1960 bis 1974, vgl. zur Dokumentation FR) beruhen, sind in dieser Hinsicht sehr heterogen. Einerseits gibt der erste Band die Auskunft, „nur hochsprachlich Formuliertes“ (Steger u. a. 1971, 22) sei in das Archiv der Freiburger Forschungsstelle aufgenommen worden. Andererseits verstehen die Autoren, wie im Anschluss klar wird, Hochsprache im Gegensatz zur Mundart: „Das impliziert, daß wir grundsätzlich keine Aufnahmen von Mundartgesprächen sammeln“ (ebd.). Die Bände II und IV

332 

 Sven Staffeldt

erfassen mit Mediendiskussionen und Beratungs- und Dienstleistungsdialogen zwar Standardsprache in unserem Sinne, im dritten Band aber geht es um Alltagsgespräche (so etwa um Small Talk in der Küche, beim Kaffeetrinken, beim Morgenkaffee usw.), was keine Standardsituationen in unserem Sinn wären. Avisiert ist hier (wie in allen vier Bänden insgesamt) im Engeren gesprochene Sprache allgemein, nicht aber unbedingt nur gesprochene Standardsprache im Speziellen.

3 Schriftsprachstandard, Standardisierung und Kodifizierung Traditionell wird Standard in Abgrenzung von der näher liegenden Umgangssprache und dem weiter entfernten Dialekt kategorisiert (so etwa Löffler 2005b, 22). Dass der Standardbegriff dabei vor allem für die geschriebene Sprache einschlägig ist, hängt mit der historischen Sichtweise auf das Phänomen der Standardisierung zusammen. Diese Perspektive sieht die Entstehung der Standardsprache in der Vereinheitlichung der Schrift (Schriftsprachstandard), die ihrerseits einen Einfluss auf das Gesprochene ausübt: Von Standardsprache spreche ich erst etwa vom Beginn des 19. Jh.s an. Deren Kriterium ist Plurivalenz, d. h. die Schriftsprache gewinnt weitere Verwendungsdomänen hinzu, sie wird zunehmend auch gesprochen in zunehmend mehr Bereichen des öffentlichen und privaten Lebens. Schriftsprache wird plurivalent, sie wird Standardsprache. Dieser Prozeß beginnt in etwa mit der allgemeinen Schulpflicht und ist bis heute noch nicht abgeschlossen. (Besch 1988, 187; vgl. dazu auch Polenz 1999, 338)

Hier spielen vor allem Sprachnormierungen (verschärft im 19. und 20. Jahrhundert; vgl. hierzu insgesamt Polenz 1999, 338–390) eine Rolle, die zum Teil auch heute noch im Gang sind, so etwa im Bereich der Orthographie und der schriftnahen oder schriftbezogenen Aussprache (vgl. zur Geschichte der neueren Orthographiereform die Zeittafel in Osterwinter 2011, 8–22 und für eine historische Einordnung der ersten beiden Konferenzen von 1876 und 1901 die Einleitung in Nerius 2002, IX–XVII; zur Aussprachenormierung vgl. die Bühnen-, später Hoch- und schließlich nur noch Aussprache von Siebs 1898, 1961, 2000). Weiterhin sind Sprachkodizes ganz allgemein einschlägig, wenn es darum geht, einen Zugang zur Erforschung der Standardsprache zu finden (vgl. dazu Klein 2013, 26–29). Auch Wörterbücher und Grammatiken, die sich bis in das 20.  Jahrhundert hinein und auch heute noch vor allem an einem Schriftsprachstandard orientieren, sind dabei als (immer auch als normativ verwendbare) Kodifizierungen des Standards von großer Bedeutung (vgl. zur Kodifizierungsproblematik Klein 2014).

Einheiten des pragmatischen Standards 

 333

4 Pragmatischer Standard 4.1 Begriffliches Grundverständnis Nachdem bislang der Standardbegriff im Zentrum der Beschreibung stand, wird hier knapp erläutert, was mit pragmatisch gemeint ist. Grundsätzlich hat die linguistische Pragmatik als Gegenstand alle Aspekte der Sprachverwendung. Zwei Aspekte sind unter der Perspektive eines pragmatischen Standards besonders wichtig. Zum einen kann – und dies ist alles andere als unproblematisch – als Sprachverwendung das Gesprochene angesehen werden. Dieses Verständnis rührt letztlich daher, dass sprachsystematisches Denken über lange Zeit schriftdominiert war (und auch noch ist – dazu gleich mehr) und Standard also normalerweise als Schriftsprachstandard zu verstehen wäre, der der gesprochenen Realisierung nicht unbedingt entsprechen muss. Vor diesem Hintergrund setzt sich ein pragmatischer Standard als gesprochensprachlicher Standard ab. Zum anderen aber kann Sprache als ein System verstanden werden, das überhaupt nur existiert, weil es und indem es angewendet wird. Und diese Anwendungen sind als einzelsprachabhängige Handlungen modellierbar. Dieses zweite Verständnis beschränkt sich dabei nicht auf das Gesprochene, sondern umfasst alle Realisierungsformen. Ein pragmatischer Standard ist hier ein Sprachhandlungsstandard.

4.2 Gesprochensprachlicher Standard Kodifizierungen eines sprachlichen Standards, die sich nicht am Sprachgebrauch orientieren, diesen nicht aufgreifen, haben sicher nur eine geringe Chance, Einfluss auf die Produktion sprachlicher Äußerungen auszuüben und so die Standardsprache mitzugestalten. De facto hinken Kodifizierungen dem Sprachgebrauch hinterher, indem sie bestimmte Varianten oder Tendenzen als standardsprachlich adeln, bestimmte andere aber nicht usw. Völlige Neuerungen lassen sich nur in Ausnahmefällen oder mit erheblichem Aufwand durchsetzen. Das zeigen nicht zuletzt bereits die zum großen Teil gescheiterten, aber nicht gänzlich wirkungslosen Verdeutschungsversuche von Campe (vgl. Campe 1813): Mit seinem Versuch, alle Fremdwörter in Form von sekundären Zeichen zu verdeutschen, hat Campe zweifellos die Leistungsfähigkeit der Sprache und vermutlich auch die der Sprecher überschätzt. […] Gleichwohl haben sich von seinen ca. elftausend Verdeutschungsversuchen ungefähr – so eine vorsichtige Schätzung – zweihundert durchgesetzt und sind in den noch heute gebräuchlichen Wortschatz eingegangen. (Kilian/Niehr/Schiewe 2010, 26; vgl. dazu auch Orgeldinger 1999, 373–380)

334 

 Sven Staffeldt

Während die Standardsprache als situational bestimmbare Varietät normative Kraft entfaltet, ist an eine ohnehin nicht wünschenswerte Setzung der Standardsprache durch gebrauchsunabhängige Normierung allein schon aus realistischen Abwägungen möglicher Erfolgsaussichten nicht zu denken. Anders herum wird ein Schuh draus  – Standard ist nur zu haben als Gebrauchsstandard (im Sinne von Ammon (1995, 88), wobei dafür sein Textbegriff ausgedehnt werden muss): Es steht für uns außer Frage, dass ein ,gesprochenes Standarddeutsch‘ nur aus dem Gebrauchsstandard zu rekonstruieren ist. […] Für aussichtslos halten wir die Bestrebungen, aus solchen Rekonstruktionen des Gebrauchsstandards heraus ein gesprochenes Standarddeutsch kodifizieren und ein kodifiziertes Standarddeutsch vermitteln zu wollen. (Maitz/Elspaß 2013, 43 f.)

Diese beiden Punkte sind momentan stark umstritten. Abgesehen von Positionen, die selbst die Rekonstruktion eines gesprochenen Standards für kontraproduktiv oder gar mindestens heuristisch schädlich halten (vgl. etwa die rhetorischen Fragen in Günthner 2013, 225), dreht sich die Diskussion vor allem um die Frage, ob (1) auch für die gesprochene Sprache ein Standard als deskriptive Modellgröße angenommen werden kann oder muss (vgl. hierzu Schneider 2011; Hennig 2006; Fiehler 2006), und ob (2) ein solcher Standard schließlich vermittelbar ist. Gerade (2) ist sozial aber hochrelevant. Das gilt zum Beispiel für den schulischen Unterricht und berufliche Entwicklungen: Aus didaktischer Perspektive ist eine Kategorie ‚gesprochenes Standarddeutsch‘ unabdingbar. Die Fähigkeit, zwischen Varietäten, insbesondere zwischen Standardsprache und Dialekt sowie zwischen gesprochener und geschriebener Sprache zu unterscheiden und zwischen ihnen situationsangemessen wechseln zu können (funktionales Code-Switching und Code-Shifting), ist Ausdruck einer hochentwickelten Sprachkompetenz. Nicht zuletzt ist hier auch ein ganz praktisches Karriere-Argument anzuführen: Wer gar keine standardnahe Varietät beherrscht, hat in vielen Bereichen mit Karrierenachteilen zu rechnen. Dies ist zwar kein linguistisches Argument, aber durchaus eines, das von Linguisten und vor allem Sprachdidaktikern berücksichtigt werden sollte. (Schneider/Albert 2013, 58; vgl. zur Anwendungsrelevanz aus schulischer Sicht auch Klug/Rödel 2013)

4.3 Beispiele für Einheiten des gesprochensprachlichen Standards 4.3.1 Vorklärungen Im Sinne eines Langue-Verständnisses von Standard (also dem Standard ex negativo, wie er oben vorgestellt wurde) können zunächst einmal vorfindliche Kodifizierungen als erste Orientierung herangezogen werden, wenn es darum geht, die Einheiten des gesprochensprachlichen Standards zu identifizieren. Eine als Grammatik der gesprochenen deutschen Sprache auftretende, deskriptiv orientierte Sammlung spezifisch

Einheiten des pragmatischen Standards 

 335

gesprochensprachlicher Phänomene ist nämlich nicht auf Dialekte bezogen, nicht auf Soziolekte, nicht auf Idiolekte usw., sondern versucht das System des Deutschen, oder einfach: das Deutsche, wie es sich im Gesprochenen zeigt, zu beschreiben. Diese Perspektive kann aber nur einnehmen, wer die Dichotomie Langue vs. Parole oder Kompetenz vs. Performanz nicht so versteht, dass man auf der einen Seite ein abstraktes und eigentlich ungreifbares Sprachsystem hat, das über die Formulierung von i. w. S. Regeln oder Regelmäßigkeiten rekonstruiert werden kann, und auf der anderen die in Bezug auf diese Regeln defizitäre Sprachverwendung. Diese Abwertung der Parole oder der Performanz muss aufgegeben werden, um aus der Parole Langue-Einheiten durch verschiedene Abstraktionsverfahren (über Kasuistik hinausgehend) als Beschreibungsresultat gewinnen zu können (vgl. dazu etwa Krämer 2002 und Linke 2009). Es geht darum, dass sowohl die geschriebene Sprache als auch die gesprochene Sprache zwar als medial verschiedene Erscheinungsformen beschrieben werden können, sich in beiden Sprachverwendungen aber Standardeinheiten von Nicht-Standardeinheiten unterscheiden lassen. Dabei ist es wichtig zu erkennen, dass gesprochener und geschriebener Standard nicht voll deckungsgleich sein müssen und es auch nicht sind. Die meisten Grammatiken sind am schriftsprachlichen Standard orientiert, so zum Beispiel ganz explizit die Eisenberg-Grammatik. Sie „legt sich auf das geschriebene Standarddeutsche fest“ (Eisenberg 2013, 3). Eine schriftsprachlich orientierte Grammatik ist aber nur die eine Hälfte des Standards. Die andere Hälfte erfassen Beschreibungen der gesprochenen Sprache  – wie unterschiedlich groß die beiden Hälften auch ausfallen mögen. Je mehr strukturell-funktionale Spezifika der gesprochenen deutschen Standardsprache gefunden werden, die mit einer schriftorientierten Grammatik nicht angemessen beschrieben werden können, umso größer ist der Bedarf für eine eigene Grammatik des Gesprochenen (etwa Fiehler u. a. 2004 bzw. Dudenredaktion 2009, 1165–1244 oder Hennig 2006). Dieser Bedarf ist dann übrigens ganz unabhängig davon, welchen theoretischen Status man dem Gesprochenen in sprachsystematischer Hinsicht zuerkennt. Durch die seit der zweiten Hälfte des 20.  Jahrhunderts verstärkt unternommenen Bemühungen verschiedener, vor allem pragmatisch orientierter Richtungen der Linguistik (Gesprochene-Sprache-Forschung, Gesprächsanalyse, Interaktionale Linguistik etc.; vgl. hierzu Staffeldt/Hagemann 2014) bei der Erforschung der gesprochenen Sprache schält sich so langsam ein Bild des gesprochensprachlichen Standards heraus. Infrage kommen grundsätzlich überregional und auch in formellen Kontexten verwendbare Einheiten, die (a) spezifisch gesprochensprachlich sind, (b) im Gesprochenen nicht als ungrammatisch eingestuft werden und (c) strukturell kommunikativ funktional sind. In letzterer Hinsicht wären also Phänomene wie Versprecher und Sprachproduktionserscheinungen wie Stottern, Lispeln, Näseln usw. zwar spezifisch gesprochensprachlich, aber nicht zu einem Standard des Gesprochenen zu zählen. Im Folgenden werden einige Beispiele für Einheiten des pragmatischen Standards im Sinne eines gesprochensprachlichen Standards präsentiert, die einerseits

336 

 Sven Staffeldt

als Typ in der Literatur (und insbesondere in Grammatiken) zu finden, und andererseits situational auch tatsächlich als Verwendungsbeispiel in Standardsituationen anzutreffen sind. Bei den ausgewählten Standardkontexten handelt es sich zum einen um eine Bundespressekonferenz (Kürzel hier: BPK) und zum anderen um eine Passage aus einer Konferenz des damals designierten Bundesaußenministers Westerwelle (Kürzel hier: WES). In beiden Fällen handelt es sich um Kontexte, in denen Standardsprachlichkeit erwartet werden kann. Aus Platzgründen wird hier darauf verzichtet, die in Staffeldt/Hagemann (2014; BPK) bzw. in Staffeldt/Ott (2014; WES) zu findenden Transkripte komplett anzuführen. Die angegebene Zählung der Segmente entspricht jeweils der Zählung im Originaltranskript. Bei den Beispieltypen wird auch darauf verzichtet, weitere Forschungsliteratur zu diesen Typen anzuführen. Grundsätzlich findet man dazu leicht jeweils Literaturhinweise in den oben angegebenen Grammatiken oder in Übersichten oder Lehrwerken zum gesprochenen Deutsch (wie etwa Schwitalla 2012). Die Besonderheit der im Folgenden angeführten Beispiele besteht darin, dass sie gesprochensprachlich unauffällig sind, geschriebensprachlich aber u. U. markiert bis fehlerhaft wären.

4.3.2 Beispiele – Referenz-Aussage-Strukturen bzw. Linksherausstellungen/-versetzungen (1) WES 0050 DAS_äh 0051 was ich AUßenpolitisch geSAGT habe– 0052 (0.4) 0053 das GILT,

Hierbei handelt es sich um Strukturen, bei denen typischerweise irgendein Satzglied vorwegproduziert und schließlich im Vorfeld des Satzes pronominal wieder aufgegriffen wird. Die mit links verbundene Metaphorisierung von Gesprochenem als räumlich linear aufeinanderfolgender Einheiten ist dabei an der Schreib- und Leserichtung orientiert und meint auf die Verhältnisse beim Sprechen bezogen natürlich ein zeitliches Davor. – Freistehende, allein voll funktionale Nebensätze (2) WES 0008 Wes wenn sie bItte so freundlich WÄRen– 0009 weil das eine PRESsekonferEnz– 0010 (0.4) 0011 in DEUTSCHland ist;

Diese beiden durch Subjunktion und Verbletztstellung formal deutlich als Nebensatz gekennzeichneten Einheiten sind selbstständig und kommunikativ voll funktional.

Einheiten des pragmatischen Standards 

 337

Sie bedürfen keines Hauptsatzes. Zudem dürfte der Äußerungstyp „Wenn Sie bitte so freundlich wären, xy zu tun“ als verfestigte Form zum Vollzug direktiver Sprechakte angesehen werden. – Ellipsen (3) WES 0002 Mod UND als nächstes der KollEge hier vOrn, (–) 0003 Mor (.) 0004 äh jAmes morriSON he (here?) from the bbC–

Grundsätzlich ist die gesprochene Sprache infolge ihrer situationalen Verankerung in Raum-Zeit-Kommunikationen offen für Ellipsen aller Art. Hier haben wir es in 0002 mit einer verblosen Konstruktion zu tun, mit der der Moderator der Pressekonferenz die Rederechtsvergabe organisiert. – Anakoluthe und Konstruktionswechsel (4) WES 0018 Wes WIR; (.) 0019 bItte sie dass_äh bei allem verSTÄNDnis dafÜr (.) Aber– 0020 Mor ja (.) äh– 0021 Über

Der Flexionsfehler (fehlende Pluralmarkierung {-n} bei bitte) ist auffällig. Fehler dieser Art zählen allerdings nicht zum Standard. Was aber als gesprochensprachlich spezifisch angesehen werden kann, sind Abbrüche und Neuansätze von Formulierungen. Hier wird nach dass zunächst einmal abgebrochen. Es folgt eine aus der Per­ spektive vollständiger satzförmiger Einheiten elliptische Präpositionalphrase, die aber ihrerseits (ähnlich wie bei aller Liebe oder bei allem Respekt) allein wieder voll funktional ist. Schließlich wird eine weitere neue Konstruktion durch aber eingeleitet, aber nicht mehr weiter fortgeführt: Man weiß, worum es geht. – Korrekturen bzw. Reparaturen (5) BPK 077 verTRAUlich heißt in diesem fall– 078 AUCH in diesem fall;

Das Segment 077 wird durch die Wiederaufnahme von in diesem Fall als reparaturoder korrekturbedürftig markiert (Reparandum) und mittels Hinzufügung des akzentuierten auch (Reparans) ergänzt. Es handelt sich um eine selbstinitiierte Selbstkorrektur, ein häufiger Typ von Korrekturen. Von der Art der Korrektur, bei der etwas nachträglich hinzugefügt wird, unterscheidet sich das Beispiel (5) vom folgenden Beispiel (6).

338 

 Sven Staffeldt

(6) BPK ich dEnke wir sollten jetzt die erKLÄrung, 098 S 099 von minister zu guttenberg ABwarten, 100 über den eh über die UHRzeit dieser erklärung (Anmerkung: Das Segment 100 ist nicht vollständig wiedergegeben.)

Hier wird nichts nachgetragen, sondern ein drohender Kongruenzfehler berichtigt, der möglicherweise durch eine Überlagerung verschieden geplanter Einheiten (eventuell über den Zeitpunkt und über die Uhrzeit) zustande gekommen ist und dann ein Indiz für einen Konstruktionswechsel in der Planungsphase wäre. – Relativische Anschlüsse (7) BPK 094 das is ein verFAHren, 095 .hh was SIE als chef des bundesprEsseamtes096  .hh für (–) RICHtig und (.) äh gewInnbringend (–) erachten,

Vor allem wo hat sich als Relativum etabliert, aber auch was (statt etwa welches oder das) wie hier in 095 funktioniert auch jenseits von das, was… als unauffälliges Relativum. – Rechtsherausstellungen und Nachträge (8) BPK 016 Jl frage an: herrn MOritz, 017 ((räuspert sich)) 018  WIRD es heute eine erklärung des verteidigungsministers geben– 019 WANN und mit welchem Inhalt.

Es ist nicht ohne Weiteres klar, wie die Intonationsphrase 019 syntaktisch analysiert werden kann oder sollte. Was aber klar ist: Sie bezieht sich auf 018 und sowohl wann als auch mit welchem Inhalt sind als Konstituenten des Satzes in 018 ansehbar (wann als interrogativisches Adverbial und mit welchem Inhalt als Attribut zu Erklärung).

4.3.3 Ausblick: Rückwirkungen In der gesprochenen Sprache geläufige und als zum gesprochenen Standard gehörige Einheiten können ihrerseits einen gewissen Einfluss auf Entwicklungen der Schriftsprache haben. Man kann sagen, dass

Einheiten des pragmatischen Standards 

 339

viele syntaktische Muster in der informellen Schriftlichkeit (ältere) Entsprechungen in der gesprochenen Sprache [haben]. Dass ein Muster in der Mündlichkeit akzeptabel ist, sagt jedoch noch nichts über dessen Akzeptabilität in einem schriftlichen Text. Die aus der Mündlichkeit in die Schriftlichkeit übertragenen Muster sind dort zunächst einmal markiert. (Albert 2013, 192)

Derartige Innovationen in der Schriftlichkeit (etwa das Spektrum des Gebrauchs von Modalverben ohne Infinitiv eines Vollverbs, vgl. dazu Albert 2013) haben aber als schriftsprachliche Konstruktionen mitunter standardsprachliches Entwicklungspotenzial  – und sei es nur, dass sich beispielsweise wo in bestimmten Fällen auch schriftsprachlich als zu den Standard-Relativa gehörig etabliert (zum Beispiel: der Ort, wo ich wohne statt der Ort, in dem ich wohne). Schwerer hat es dagegen momentan (noch) die gesprochensprachlich mittlerweile völlig unauffällige weil-V2-Stellung, in die Schriftsprachlichkeit einzudringen und sich dort festzusetzen.

4.4 Sprachhandlungsstandard In diesem Abschnitt wird mit zögerlichen Schritten das beinahe noch unerschlossene Gebiet eines pragmatischen Standards als Sprachhandlungsstandard betreten. Ein erster Versuch wurde in Staffeldt (2013a, 88–90) unternommen. Zwar existieren viele pragmatische Studien, die sich in der einen oder anderen Form mindestens implizit auf die Standardsprache beziehen. Dass dabei aber konsequent der Versuch unternommen würde, einen pragmatischen Standard begrifflich in den Griff zu bekommen, ist nicht der Fall. Die Beschreibung einer Varietät – und also auch der Standardvarietät – kann und sollte grundsätzlich auf allen Ebenen der Sprachbeschreibung durchführbar sein. Immerhin handelt es sich bei einer Varietät um eine Menge sprachlicher Strukturen (Phonologie, Morphologie, Syntax, Semantik, Lexikon, Pragmatik) […], die relativ zu außersprachlichen Faktoren (z. B. Alter, Geschlecht, Gruppe, Religion, historische Periode, Stil etc.) in einem Varietätenraum geordnet sind. (Dittmar 1997, 177)

Sind die Ebenen der Phonetik/Phonologie und der (Morpho-)Syntax relativ prominent, bleibt die Pragmatik seltsamerweise unberücksichtigt. So listet Löffler als die „drei Zonen des Kontinuums“ (Löffler 2005b, 22) der für die Beschreibung der Sprachformen angenommenen Bereiche auf: Standard, Umgangssprache und Dialekt, die grammatisch, lexikologisch, phraseologisch und orthographisch sowie orthophonisch untersucht werden können. Die pragmatische Ebene aber fehlt. Pragmatisches ist als Gegenstand zur Charakterisierung von Varietäten bisher nicht genügend berücksichtigt worden. Woran liegt das? Sicher nicht daran, dass alle Sprechhandlungen gleichermaßen für alle Varietäten typisch wären. Das ist nämlich nicht der Fall: Dissen ist z. B. etwas, das vornehmlich jugendsprachliche oder/und musikfachsprachliche Relevanz besitzt, Exkommunizieren und Heilig- oder Seligspre-

340 

 Sven Staffeldt

chen sind religiöse Sprachhandlungen, Anpöbeln ist sicherlich eine etwas derbere umgangssprachliche Handlung und die Frage „Willst du mich heiraten?“ ist eine private Angelegenheit. Einzelne Sprechhandlungen können also einzelnen Bereichen zugeordnet werden, was nicht zuletzt auch als Gelingensbedingung rekonstruierbar ist: Krankschreiben darf nur ein Arzt, für eine Verhaftung bedarf es eines Haftbefehls, den nur ein Richter anordnen darf, und Heiligsprechen darf nur der Papst. Mindestens fachsprachlich sind Sprechhandlungen als Ganze also bereichsspezifisch. Wenn allerdings als großer Gegenspieler des Standards die Dialekte angesehen werden, so gestaltet sich die Situation schwieriger: Gibt es Sprechhandlungen, die nur in Dialekten (oder nur im Standard) vorkommen? Meines Wissens wurde diese Frage noch nicht (oft) gestellt, zumindest aber noch nicht ausführlich beantwortet. Es könnte sein, dass man es für selbstverständlich hält, dass Sprechhandlungen diatopisch nicht variieren. Wenn man als Pole des Kontinuums Dialekt vs. Standard annimmt (wie etwa Löffler dies tut), scheint es hinsichtlich der Existenz von Sprechhandlungen, die nur einem dieser Pole zugerechnet werden, derzeit also keinen Bedarf zu geben, die pragmatische Beschreibungsebene zu berücksichtigen. Neben der Existenz varietätsexklusiver Sprechhandlungen spielt mindestens noch die Frage nach der Realisierung von Sprechakten eine wichtige Rolle. Falls es keine rein dialektalen Sprechakte geben sollte, so könnten sich die dialektalen Realisierungsformen nicht-dialektaler Sprechakte doch unterscheiden. Auch hier gibt es meines Wissens (noch) keine einschlägigen, pragmatisch ausgerichteten Untersuchungen der folgenden Art: Auffordern im Ostfränkischen oder Auffordern in der westmünsterländischen Mundart im Vergleich zu standardsprachlichem Auffordern – möglicherweise ebenfalls deshalb, weil man sich keine großen Erkenntnisse bei einer solchen Forschungsfrage verspricht. Dabei liegen dialektale Unterschiede für prominente Sprechhandlungen jedenfalls bei formelhaftem Sprachgebrauch auf der Hand, so etwa bei unterschiedlichen Verabschiedungsformeln, Wünschen und Bemerkungen: – Servus oder Grüß Gott oder Moin gegenüber zumindest überregionalem Hallo (vgl. zur Verbreitung der Grußformeln die entsprechende Karte im „Atlas zur deutschen Alltagssprache“, s. ADA im Literaturverzeichnis), – An gudn Beschluss!, was man vor Jahreswechsel im Würzburger Raum wünscht (Hörbelege), vs. standardsprachlich Guten Rutsch!, – Bist du die Treppe runtergefallen? als jedenfalls wieder im Würzburger Raum anzutreffende Bemerkung, wenn man sieht, dass ein Bekannter, Kollege oder Freund beim Friseur war (Hörbelege), usw. Dagegen gibt es eine größere Anzahl (vor allem auch populärer) Werke, in denen für bestimmte Anlässe ein pragmatischer (allerdings meist schriftsprachlich orientierter) Standard kodifiziert ist. Das betrifft mindestens alle Ratgeber zur Herstellung von Exemplaren einer bestimmten Textsorte (so z. B. die etwas ältere, dafür aber recht umfangreiche Loseblattsammlung Manekeller 1996, die Behördentexte, Geschäftsbe-

Einheiten des pragmatischen Standards 

 341

richte, Werbetexte, Fachveröffentlichungen, persönliche Texte, Musterreden, Bewerbungen u. v. m. behandelt und zahlreiche weitere Einzelveröffentlichungen desselben Autors). Auch die großen Wörterbuchverlage bieten bspw. Einzelwerke zu verschiedenen sprachlichen Handlungen an (etwa zu Beileidsbekundungen), die als Vorschlag zum standardsprachlichen Vollzug solcher Handlungen gelten dürfen. Nicht selten sind Musterexemplare (etwa von verschiedenen Geschäftsbriefen oder Reklamationsschreiben) auch in Wörterbüchern selbst bereits zu finden. Sieht man als Gegenspieler des Standards nicht nur die Dialekte an, sondern lässt alle anderen Varietäten zu, wird man jedoch sofort mit Unterschieden rechnen. Ju­gendsprachliches Auffordern etwa dürfte sich in der Realisierung erheblich von standardsprachlichem Auffordern unterscheiden. Die Beantwortung einer solchen Frage muss aber methodisch gut abgesichert werden. Wenn es um einen Vergleich der Realisierungsformen von Sprechhandlungen geht, muss zunächst einmal sichergestellt werden, dass es sich um die gleichen Sprechhandlungen handelt, damit z. B. jugendsprachliches und standardsprachliches Auffordern überhaupt als die gleichen, aber verschieden realisierten Sprechhandlungen angesehen werden können. Das ist wohl der methodisch schwierigste Punkt, weil die Identifizierung einzelner Sprechakte immer vor dem Hintergrund einer Sprechaktklassifizierung geschehen muss, diese aber entweder sprachfern deduktiv entworfen wird oder induktiv zirkulär ist: Das Untersuchen einer Sprechhandlung setzt voraus, dass man einen Begriff dieser Sprechhandlung hat, was aber das Ziel der Untersuchung dieser Sprechhandlung ist. Hier gibt es noch viel zu tun.

5 Literatur ADA: Atlas zur deutschen Alltagssprache. URL-Einstiegsseite: URL zur Karte mit den Grußformeln: http://www.philhist.uni-augsburg.de/lehrstuehle/germanistik/sprachwissenschaft/ada/ runde_2/f01/[19.11.2014]. Albert, Georg (2013): Innovative Schriftlichkeit in digitalen Texten. Syntaktische Variation und stilistische Differenzierung in Chat und Forum. Berlin. Ammon, Ulrich (1986): Explikation der Begriffe ‚Standardvarietät‘ und ‚Standardsprache‘ auf normtheoretischer Grundlage. In: Holtus/Radtke, 1–63. Ammon, Ulrich (1995): Die deutsche Sprache in Deutschland, Österreich und der Schweiz. Das Problem der nationalen Varietäten. Berlin/New York. Barbour, Stephen/Patrick Stevenson (1998): Variation im Deutschen. Soziolinguistische Perspektiven. Berlin/New York. Besch, Werner (1988): Standardisierungsprozesse im deutschen Sprachraum. In: Sociolinguistica 2, 186–208. Brons-Albert, Ruth (1984): Gesprochenes Standarddeutsch. Telefondialoge. Tübingen. Campe, Joachim Heinrich (1813): Wörterbuch zur Erklärung und Verdeutschung der unserer Sprache aufgedrungenen fremden Ausdrücke. Ein Ergänzungsband zu Adelung’s und Campe’s Wörterbüchern. Braunschweig. http://reader.digitale-sammlungen.de/resolve/display/ bsb10523274.html [19.11.2014].

342 

 Sven Staffeldt

Deppermann, Arnulf/Reinhard Fiehler/Thomas Spranz-Fogasy (Hg.) (2006): Grammatik und Interaktion. Radolfzell. Deutrich, K. Helge/Gerd Schank (1973): Redekonstellation und Sprachverhalten I und II. In: Klaus Baumgärtner/Hugo Steger (Hg.): Funk-Kolleg Sprache. Eine Einführung in die moderne Linguistik. Band 2. Frankfurt a. M., 242–262. Dittmar, Norbert (1997): Grundlagen der Soziolinguistik. Ein Arbeitsbuch mit Aufgaben. Tübingen. Dudenredaktion (Hg.) (2009): Die Grammatik. Unentbehrlich für richtiges Deutsch. Mannheim/ Wien/Zürich. Eisenberg, Peter (2011): Das Fremdwort im Deutschen. Berlin/New York. Eisenberg, Peter (2013): Grundriss der Deutschen Grammatik. Band 2: Der Satz. 4., aktualisierte und überarbeitete Auflage. Stuttgart. Fiehler, Reinhard (2006): Was gehört in eine Grammatik gesprochener Sprache? Erfahrungen beim Schreiben eines Kapitels der neuen Duden-Grammatik. In: Deppermann/Fiehler/ Spranz-Fogasy, 21–41. Fiehler, Reinhard u. a. (2004): Eigenschaften gesprochener Sprache. Tübingen. FR: http://agd.ids-mannheim.de/FR--_extern.shtml [19.11.2014]. Glinz, Hans (1980): Deutsche Standardsprache der Gegenwart. In: Hans Peter Althaus u. a. (Hg.): Lexikon der germanistischen Linguistik. 2. Auflage. Tübingen, 609–619. Günthner, Susanne (2013): Vom schriftsprachlichen Standard zur pragmatischen Vielfalt? Aspekte einer interaktional fundierten Grammatikbeschreibung am Beispiel von dass-Konstruktionen. In: Hagemann/Klein/Staffeldt, 223–243. Hagemann, Jörg/Wolf Peter Klein/Sven Staffeldt (Hg.) (2013a): Pragmatischer Standard. Tübingen. Hagemann, Jörg/Wolf Peter Klein/Sven Staffeldt (2013b): Pragmatischer Standard – Eine Annäherung. In: Hagemann/Klein/Staffeldt, 1–13. Hennig, Mathilde (2006): Grammatik der gesprochenen Sprache in Theorie und Praxis. Kassel. Holtus, Günter/Edgar Radtke (Hg.) (1986): Sprachlicher Substandard. Tübingen. Holtus, Günter/Edgar Radtke (Hg.) (1989): Sprachlicher Substandard II. Standard und Substandard in der Sprachgeschichte und in der Grammatik. Tübingen. Holtus, Günter/Edgar Radtke (Hg.) (1990): Sprachlicher Substandard III. Standard, Substandard und Varietätenlinguistik. Tübingen. Kilian, Jörg/Thomas Niehr/Jürgen Schiewe (2010): Sprachkritik. Ansätze und Methoden der kritischen Sprachbetrachtung. Berlin/New York. Klein, Wolfgang (1974): Variation in der Sprache. Ein Verfahren zu ihrer Beschreibung. Kronberg i. T. Klein, Wolf Peter (2013): Warum brauchen wir einen klaren Begriff von Standardsprachlichkeit und wie könnte er gefasst werden? In: Hagemann/Klein/Staffeldt, 15–33. Klein, Wolf Peter (2014): Gibt es einen Kodex für die Grammatik des Neuhochdeutschen und, wenn ja, wie viele? Oder: Ein Plädoyer für Sprachkodexforschung. In: Albrecht Plewnia/Andreas Witt (Hg.): Sprachverfall? Dynamik, Wandel, Variation. IDS-Jahrbuch 2013. Berlin/Boston, 219–242. Klug, Christian/Michael Rödel (2013): Zur Anwendungsrelevanz eines gesprochenen Standards: Die Perspektive des Schulunterrichts. In: Hagemann/Klein/Staffeldt, 331–343. Köster-Gansini, Sabine (2002): Die Flexionsmorphologie im gesprochenen deutschen Substandard. Untersuchung eines Korpus. Tübingen. Krämer, Sybille (2002): Gibt es eine Sprache hinter dem Sprechen? Frankfurt a. M. Lameli, Alfred (2004): Standard und Substandard. Regionalismen im diachronen Längsschnitt. Stuttgart. Lenz, Alexandra N. (2003): Struktur und Dynamik des Substandards. Eine Studie zum Westmitteldeutschen (Wittlich/Eifel). Stuttgart. Linke, Angelika (Hg.) (2009): Oberfläche und Performanz. Untersuchungen zur Sprache als dynamischer Gestalt. Tübingen.

Einheiten des pragmatischen Standards 

 343

Löffler, Heinrich (2005a): Germanistische Soziolinguistik. 3. Auflage. Berlin. Löffler, Heinrich (2005b): Wie viel Variation verträgt die deutsche Standardsprache? Begriffsklärung: Standard und Gegenbegriffe. In: Ludwig M. Eichinger/Werner Kallmeyer (Hg.): Standardvariation. Wie viel Variation verträgt die deutsche Sprache? Berlin, 7–27. Maitz, Péter/Stephan Elspaß (2013): Zur Ideologie des ‚Gesprochenen Standarddeutsch‘. In: Hagemann/Klein/Staffeldt, 35–48. Manekeller, Frank W. (1996): Der Textberater. Ratgeber für die Textarbeit, Formulierungshilfen und Mustertexte für die Rede- und Schreibpraxis. Freiburg. [Loseblattsammlung in zwei Ordnern]. Nabrings, Kirsten (1981): Sprachliche Varietäten. Tübingen. Nerius, Dieter (Hg.) (2002): Die orthographischen Konferenzen von 1876 und 1901. Hildesheim/ Zürich/New York. Orgeldinger, Sibylle (1999): Standardisierung und Purismus bei Joachim Heinrich Campe. Berlin/ New York. Osterwinter, Ralf (2011): Die Rechtschreibreform (1996/1998) in Pressetexten. Eine kritische Analyse der Agentur-Orthographie und ihrer Umsetzung in der Frankfurter Allgemeinen Zeitung. Heidelberg. Polenz, Peter von (1999): Deutsche Sprachgeschichte vom Spätmittelalter bis zur Gegenwart. Band 3: 19. und 20. Jahrhundert. Berlin/New York. Schneider, Jan Georg (2011): Hat die gesprochene Sprache eine eigene Grammatik? Grundsätzliche Überlegungen zum Status gesprochensprachlicher Konstruktionen und zur Kategorie ‚gesprochenes Standarddeutsch‘. In: Zeitschrift für germanistische Linguistik 39, 165–187. Schneider, Jan Georg/Georg Albert (2013): Medialität und Standardsprache – oder: Warum die Rede von einem gesprochenen Gebrauchsstandard sinnvoll ist. In: Hagemann/Klein/Staffeldt, 49–60. Scholten, Beate (1988): Standard und städtischer Substandard bei Heranwachsenden im Ruhrgebiet. Tübingen. Schwitalla, Johannes (2012): Gesprochenes Deutsch. Eine Einführung. 4. Auflage. Berlin. Siebs, Theodor (1898): Deutsche Bühnenaussprache. Ergebnisse der Beratungen zur ausgleichenden Regelung der deutschen Bühnenaussprache, die vom 14. bis 16. April 1898 im Apollosaale des Königlichen Schauspielhauses zu Berlin stattgefunden haben. Berlin/Köln/ Leipzig. Siebs, Theodor (1961): Deutsche Hochsprache. Bühnenaussprache. Herausgegeben von Helmut de Boor und Paul Dies. 18. Auflage. Berlin. Siebs, Theodor (2000): Deutsche Aussprache. Hochsprache, Bühnensprache, Alltagssprache. Nachdruck der 19. Auflage. Wiesbaden. Staffeldt, Sven (2013a): Auf dem Weg zum pragmatischen Standard mit Entschuldigungen. In: Hagemann/Klein/Staffeldt, 85–111. Staffeldt, Sven (2013b): Entschuldigungsmails – oder: Wie und wo findet man einen pragmatischen Standard? In: Iva Kratochvílová/Norbert Richard Rolf (Hg.): Grundlagen einer sprachwissenschaftlichen Quellenkunde. Tübingen, 199–218. Staffeldt, Sven/Jörg Hagemann (Hg.) (2014): Pragmatiktheorien. Analysen im Vergleich. Tübingen. Staffeldt, Sven/Christine Ott (2014): Sprechen als kommunikative Ressource. Was die linguistische Pragmatik für den Kompetenzbereich ‚Sprechen‘ zu bieten hat. In: Michael Rödel (Hg.): Deutschunterricht am Gymnasium – Was kann die Sprachwissenschaft leisten? Hohengehren, 66–83. Steger, Hugo u. a. (Hg.) (1971–1979): Texte gesprochener deutscher Standardsprache. 4 Bände. München. (I) (1971) (II) (1974): „Meinung gegen Meinung“. Diskussionen über aktuelle Themen.

344 

 Sven Staffeldt

(III) (1975): Alltagsgespräche. Beratungen und Dienstleistungsgespräche. (IV) (1979): Steger, Hugo u. a. (1974): Redekonstellation, Redekonstellationstyp, Textexemplar, Textsorte im Rahmen eines Sprachverhaltensmodells. Begründung einer Forschungshypothese. In: Hugo Moser (Hg.): Gesprochene Sprache. Jahrbuch 1972 des Instituts für deutsche Sprache. Düsseldorf, 39–97.

Stephan Stein

15. Einheiten der gesprochenen und der geschriebenen Sprache Abstract: Eine zentrale Aufgabe bei jeglicher Art von Textproduktion besteht in der Textgliederung: Der Prozess der textuellen Einheitenbildung führt im Zuge der Textproduktion dazu, dass Texte in an der Textoberfläche manifeste Einheiten gegliedert werden. Dass sich die Einheitenbildung in gesprochener und in geschriebener Sprache unterscheiden kann, ist auf die jeweiligen Kommunikations- und Produktionsbedingungen zurückzuführen. Die Beschreibung dieser Einheiten war und ist geprägt durch ein Nebeneinander grammatik-theoretischer und kommunikationsbezogener Konzepte (Satz vs. Äußerungseinheit, Turnkonstruktionseinheit, möglicher Satz, prosodische Einheit usw.). Hinzu kommt, dass sich aus Rezeptions- und aus Analyseperspektive über die syntaktische Organisation hinausweisende Äußerungseigenschaften (z. B. ungewöhnliche Interpunktion, lexikalische Gliederungsmittel, prosodische Gestaltung) als Gliederungsressourcen interpretieren lassen. Der Beitrag unterstreicht daher die Notwendigkeit einer prozessbezogenen Perspektive auf die Beschreibung bzw. Rekonstruktion der Einheitenbildung und zielt darauf ab, die jeweiligen Kommunikations- und Gliederungstätigkeiten der Interaktionspartner in ihrer zeitlichen Abfolge zum Ausgangspunkt zu machen und nach der Art und nach dem Zusammenspiel der jeweiligen Signalisierungs- und Konstruktionsschemata zu fragen. 1 Was heißt Einheitenbildung? 2 Zur Fragestellung und zur Vergleichbarkeit gesprochener und geschriebener Sprache 3 Grundlegendes zur Einheitenbildung in der ­Kommunikationspraxis: Satz vs. Äußerung 4 Rekonstruktion der Einheitenbildung in ­gesprochener Sprache 5 Konstruktionsschemata und ihre Ausgestaltung 6 Literatur

1 Was heißt Einheitenbildung? Wir verstehen Texte (gesprochen, geschrieben, gebärdet) üblicherweise als komplexe Gebilde, d. h. sie umfassen in der Regel mehr als ein Wort bzw. mehr als eine grammatisch aufgebaute Konstruktion. Zwangsläufig gehört es zu den Aufgaben des Textproduzenten, Texte als komplexe Gebilde in kleinere Einheiten zu gliedern. In erster Linie geschieht das, um dem Rezipienten die Verarbeitung, d. h. die Bedeutungskonstitution und den Aufbau einer „kognitiven Textwelt“ (vgl. Pohl 1998, 165) zu erleichtern. Es gehört also praktisch zu jeder Form der Textbildung (Ausnahmen

346 

 Stephan Stein

sind z. B. gedächtnisentlastende Listen wie Einkaufzettel), dass der Textproduzent im entstehenden Text eine an der Oberfläche manifeste Gliederung in ausdrucksseitigen Einheiten vorsieht. Es ist anzunehmen, dass sich gesprochene und geschriebene Sprache (vgl. zu gebärdeter Sprache Fehrmann, Bressem und Fricke, in diesem Band) in der Art und Weise, wie und in welche kleineren Portionen Texte gegliedert werden, unterscheiden. Abhängig von der Komplexität der Textprodukte lassen sich Einheiten und Einheitenhierarchien auf unterschiedlichen Ebenen unterscheiden (z. B. Absätze und größere makrostrukturelle Einheiten in geschriebenen Texten  – Gesprächsphasen, bestimmte Aktivitätstypen wie Erzählungen, Gesprächssequenzen und Sprecherbeiträge/Turns in gesprochenen Texten). Die Redeweise von „Einheiten“ und „Einheitenbildung“ bezieht sich jedoch in erster Linie auf die mikrostrukturelle Ebene von Texten und Gesprächen und betrifft die Frage, welcher Art die Textportionen sind, mit denen Schreiber und Sprecher die zu versprachlichenden Inhalte in eine der Kommunikationssituation angemessene Form bringen. Für geschriebene Texte scheint die Sache einfach zu sein. Bezieht man nämlich gängige textlinguistische Auffassungen von Textualität – wie z. B. Brinkers Bestimmung von Texten als „Folgen von Sätzen“ (2010, 17) – ein, wird schnell ersichtlich, dass die textuelle Komplexität und Einheitenbildung mit dem grammatischen Konzept des Satzes in Verbindung gebracht wird: „Als wichtigste Struktureinheit des Textes ist der Satz anzusehen“ (ebd.). Ohne an dieser Stelle auf die mit einer solchen Auffassung zusammenhängenden Probleme einzugehen, ist erkennbar, weshalb die Brisanz der Frage nach der Einheitenbildung und nach der Art der Einheiten erst im Zuge der Etablierung von Gesprochene-Sprache-Forschung und Gesprächsanalyse erkannt worden ist. Denn erst dadurch, dass gesprochene Sprache als Untersuchungsgegenstand der Sprachwissenschaft und insbesondere auch – wenngleich zeitlich erheblich verzögert – der Grammatikographie akzeptiert wurde, ist die Frage nach den Einheiten gesprochener und geschriebener Sprache gestellt und dann innerhalb recht kurzer Zeit für die Analyse gesprochener Sprache zum „Kardinalproblem“ (Mackeldey 1987, 45) erklärt worden. Dass sich die Erforschung gesprochener Sprache und die linguistische Gesprächsanalyse dieser Thematik besonders intensiv zuwenden mussten, liegt darin begründet, dass gesprochene Texte keine Portionierung aufweisen, die mit der visuell wahrnehmbaren Oberflächengliederung geschriebener Texte vergleichbar wäre.

Einheiten der gesprochenen und der geschriebenen Sprache 

 347

2 Zur Fragestellung und zur Vergleichbarkeit gesprochener und geschriebener Sprache 2.1 Problemlage Es ist gängige Praxis – und viele Aufsatz- und Buchtitel belegen dies auch –, davon auszugehen, dass man gesprochene und geschriebene Sprache pauschal miteinander vergleichen könne. Generalisierenden Gegenüberstellungen ist gemeinsam, dass sie sich an solchen Instanzen mündlicher und schriftlicher Kommunikation orientieren, die als jeweils besonders typisch für die beiden medialen Realisierungsweisen von Sprache gelten können. Man läuft damit jedoch u. U. Gefahr, die Einsicht, dass es weder die gesprochene noch die geschriebene Sprache gibt (vgl. Fiehler 2000), in ihrer Relevanz nicht konsequent genug zu berücksichtigen. Zumindest muss man sich der Gefahr der Homogenisierung der Untersuchungsgegenstände (vgl. dazu ebd., 35 f.) und der damit verbundenen Übergeneralisierung von Befunden, die an einzelnen Textexemplaren je bestimmter Text- und Gesprächssorten gewonnen wurden und daher zunächst allein für diese Gültigkeit beanspruchen können, bewusst sein. Wenn es wenig Sinn hat, pauschal gesprochene und geschriebene Sprache vergleichen zu wollen, hat es auch wenig Sinn anzunehmen, dass man pauschal die Einheitenbildung für gesprochene und für geschriebene Sprache gegenüberstellen könnte. Die in der Titelformulierung implizit angelegte Frage nach einem Vergleich der Gliederung und der Art der Einheitenbildung ist in dieser Form, genau genommen, zu unspezifisch, wenn auch aus forschungspraktischen Gründen naheliegend und aus darstellungstechnischen Gründen wünschenswert. Denn es dürfte kaum überraschen, dass sich Instanzen konzeptioneller Mündlichkeit und konzeptioneller Schriftlichkeit (im Sinne von Koch/Oesterreicher 1985) in der Praxis der Einheitenbildung erheblich unterscheiden, sofern man Texte betrachtet, die für die beiden Realisierungsformen von Sprache als besonders typisch gelten können (wie etwa Alltagsinteraktionen und Gesetzestexte), weil sie die Folgen der jeweiligen Kommunikationsbedingungen besonders deutlich in Gestalt jeweils charakteristischer Texteigenschaften und „Formulierungsspuren“ in sich tragen. Schon eher könnte es überraschen, dass das auch auf den Vergleich von Instanzen jeweils beider konzeptioneller Domänen untereinander zutrifft (wie z. B. auf Alltagsinteraktionen und frei gehaltene Vorträge auf der einen oder auf Gesetzestexte und Tagebucheinträge auf der anderen Seite). Es ist also davon auszugehen, dass die Art der Einheitenbildung und die Gliederungsresultate auch innerhalb ein und derselben Realisierungsweise von Sprache erheblicher Variation unterliegen können.

348 

 Stephan Stein

2.2 Vergleich der Grundeinheiten gesprochener und ­geschriebener Sprache Es bietet sich zunächst an, von einem Vergleich von Grundeinheiten auszugehen, wie ihn Fiehler (2005, 1175) teilweise aus grammatischer Sicht vornimmt: Grundeinheiten geschrieben

Buchstabe

Wort

gesprochen

Laut

Wort

Satz funktionale Einheit

Gesprächsbeitrag

Text Gespräch

Sieht man davon ab, dass weitere Unterscheidungsmöglichkeiten denkbar wären, verdeutlicht die Übersicht, dass auf unterschiedlichen Ebenen von Einheiten geschriebener und gesprochener Sprache die Rede sein kann (vgl. ausführlich dazu Stein 2003). Darüber hinaus wird sichtbar, dass sich für einen Vergleich in besonderer Weise die Ebene unterhalb der kommunikativen Entitäten ‚Text‘ und ‚Gespräch‘ anbietet (vgl. auch Stein 2010, 65). Abgesehen davon, dass auch hier der „Satz“ als zentrale Struktureinheit von Texten präjudiziert wird, wird betont, dass der strukturellen Grundeinheit „Satz“ für geschriebene Texte zwei durch andere Faktoren geprägte Einheiten für gesprochene Sprache gegenübergestellt werden: der interaktiv durch das Kriterium des Sprecherwechsels (i. S. v. Rederechtswechsel) bestimmte Gesprächsbeitrag (sonst auch: Sprecherbeitrag bzw. im Anschluss an die angelsächsische Forschung Turn) sowie die „funktionale Einheit“, aus der sich Gesprächsbeiträge zusammensetzen (vgl. Fiehler 2005, 1175). Nach dieser Auffassung ist für Texte von einer grundlegenden Gliederung nach Sätzen, für Gespräche dagegen zunächst von einer grundlegenden Gliederung nach Gesprächsbeiträgen bzw. Sprecherbeiträgen als konstitutiven Einheiten auszugehen. Gesprächsbeiträge ergeben sich daraus, dass das Rederecht von den beteiligten Interaktionspartnern nach den Regeln des Sprecherwechsels ausgehandelt wird. Die hier zur Diskussion stehende Frage nach Einheiten gesprochener Sprache richtet sich auf die Konstitution von Gesprächsbeiträgen, d. h. auf die Art und Weise des Aufbaus von Gesprächsbeiträgen und ihrer internen Gliederung, für die Fiehler (2005, 1175 und 1235 f.) von „funktionaler Einheit“ spricht (vgl. zur Unterscheidung weiterer Einheiten unter- und oberhalb des Sprecherbeitrags Stein 2010, 68). Die Übersicht verdeutlicht also die Schwierigkeiten eines Vergleichs gesprochener und geschriebener Sprache hinsichtlich der Einheitenbildung. Problematisch ist an dieser abstrakten Unterscheidung grundlegender Einheiten aber vor allem, dass es gerechtfertigt erscheint, für geschriebene Sprache von Sätzen als Einheiten auszugehen, für gesprochene Sprache dagegen von funktional und interaktiv begründeten Einheiten. Ruft man sich an dieser Stelle die in der Anfangs- und Konsolidierungsphase von Gesprochene-Sprache-Forschung und Gesprächsanalyse vorherrschenden sprachwissenschaftlichen Paradigmen in Erinnerung und macht man sich den damit zusam-

Einheiten der gesprochenen und der geschriebenen Sprache 

 349

menhängenden, in Teilen bis heute anhaltenden „written language bias“ – d. h. die nachhaltige Prägung des Sprachbewusstseins sowie der Sprachbeschreibung durch Vorstellungen von geschriebener Sprache – bewusst, ist es nachvollziehbar, warum die Frage „Sprechen wir in Sätzen?“ (vgl. Rath 1990) explizit gestellt worden ist. Aus dem oben Gesagten geht aber bereits hervor, weshalb die Frage aus heutiger Sicht falsch gestellt erscheinen muss: Sie impliziert, man könnte mit einem grammatisch geprägten Konzept Texteigenschaften kommunikativ-funktionaler Art angemessen erfassen. Zu fragen wäre also vielmehr, unter welchen Kommunikationsbedingungen bzw. in welchen Fällen die bei der Produktion spontan gesprochener Sprache (und analog auch die bei der Produktion geschriebener Sprache) gebildeten Einheiten in Satzstrukturen aufgehen (und wann nicht) (vgl. Selting 1995). Dass die Frage ­„Schreiben wir in Sätzen?“ dagegen so erst gar nicht gestellt wurde, ist darauf zurückzuführen, dass geschriebene Sprache schon immer als standardnahe Sprachvarietät aufgefasst und durch den nachhaltigen Einfluss der Grammatikschreibung mit der Erwartung verbunden worden ist, dass geschriebene Texte in Sätzen aufzugehen haben.

2.3 Zwischenbilanz zum Verständnis von „Einheitenbildung“ und zu ihrer Beschreibung Vor dem Hintergrund des bisher Gesagten ist Folgendes festzuhalten: Texte zu gliedern und Einheiten zu bilden ist ein konstitutiver Teil der Textherstellungstätigkeit, d. h. Aufgabe und Leistung (und damit zugleich immer auch Teil der Verantwortung) der Textproduzenten, nicht dagegen der analysierenden Wissenschaftler. Aus linguistischer Sicht gilt es, die Verfahren zu ermitteln und die Mittel zu bestimmen, die in jeweils authentischen Interaktionssituationen von den Interaktionspartnern verwendet werden. Die Beschreibung der Einheiten zielt also darauf ab, die authentische Einheitenbildung auf empirisch breiter Basis zu rekonstruieren und theoretisch zu modellieren. Grundlage der Analyse der Gliederungstätigkeit und der Einheitenbildung muss also immer – bezogen auf Text- und Gesprächssorten – die authentische Interaktionspraxis sein. Leitend ist dafür das – die Methodik gesprächslinguistischer Arbeit prägende – Postulat, die Beschreibungs- und Analysekategorien aus authentischen Textzeugnissen abzuleiten und auf die jeweiligen Umstände der Kommunikationssituationen zu beziehen. Es liegt in der Natur der Sache, dass medial mündliche Texte dabei wesentlich größere Probleme verursachen als medial schriftliche Texte; das gilt vor allem für die oft nicht eindeutige Erkenn- und Festlegbarkeit von Grenzen einer in Produktion befindlichen Einheit, also für die Ränder potenzieller Einheiten. In Zusammenhang damit kann nicht ausgeschlossen werden, dass Textproduzent und Textrezipient im authentischen Interaktionsgeschehen von partiell unterschiedlichen Einheiten ausgehen, d. h. dass sich Produktions- und Rezeptionseinheiten nicht zwangsläufig decken müssen (vgl. dazu Stein 2002). In besonderer Weise

350 

 Stephan Stein

trifft das zu, wenn Rezipienten als Hörer in Gesprächen die Möglichkeit haben, die Textproduktion und damit auch die Einheitenbildung zu beeinflussen (vgl. dazu Stein 2003, 405–409). Welcher Art also sind die Einheiten und wie werden sie gebildet bzw. als solche erkennbar gemacht?

3 Grundlegendes zur Einheitenbildung in der ­Kommunikationspraxis: Satz vs. Äußerung 3.1 Einige Bemerkungen zum Satz-Begriff Anzunehmen, Sprachteilhaber sprächen und schrieben in Sätzen, setzt voraus, dass Sprachteilhaber ein Verständnis davon haben, was unter einem „Satz“ zu verstehen ist; denn ansonsten wüssten sie nicht, was sie tun. Gemeint ist nun nicht die wissenschaftliche Problematik einer Satzdefinition (vgl. dazu u. a. Dürscheid/ Schneider 2015; Stein 2003, 43–64), sondern ein alltagstaugliches, intuitives, sicher aber durch die schulische Sozialisation (in vielen Fällen) nicht mehr ‚unbelastetes‘ Satzkonzept. Es sei einmal dahingestellt, ob man jenseits sprachwissenschaftlicher und sprachdidaktischer Zwecke – wie z. B. dem, sich über grammatische Strukturen verständigen zu können – überhaupt ein Satzkonzept für den erfolgreichen Umgang mit Sprache und für erfolgreiche Kommunikation benötigt. Sicher sind aber die Vorstellungen von „Satz“ als wissenschaftlichem Konstrukt für die Beschreibung einer sprachlichen Grundeinheit und die Implikationen von „Satz“ als alltagstauglichem Begriff nicht identisch. Jedenfalls ist nicht ohne weiteres erkennbar, an welche Art von Satzkonzept im Alltagshandeln angeknüpft wird und ob ein notwendiger (satz-) theoretischer Bezugsrahmen zugrunde liegt, geschweige denn, ob bei Sprachteilhabern überhaupt ein Bewusstsein für die Theorieabhängigkeit gegeben ist. Es spricht, wie man sich durch Befragungen schnell vergegenwärtigen kann, vieles dafür, dass der üblicherweise implizite, nur in Ausnahmefällen explizite Rekurs auf den „Satz“ im Alltag vor allem durch Vorstellungen und Erwartungen von Wohlgeformtheit und Vollständigkeit geprägt ist. Diese Vorstellungen sprechen dafür, dass ein elementares strukturelles Satzkonzept verbreitet ist, das sich im Sinne der Valenzgrammatik am Vorhandensein eines finiten Verbs, einer verbinduzierten grammatischen Struktur und an der Sättigung der verbspezifischen Argumente ausrichtet. Nur so lässt sich z. B. erklären, dass Äußerungsteile Interaktionspartner nicht nur erkennen lassen können, dass noch etwas folgt, sondern ihnen auch eine Vorstellung davon ermöglichen, was (strukturell) folgen wird (vgl. zur Projektion Stein 2003, 247–301; Auer 2005 und 2010; Hennig 2006, 186–214).

Einheiten der gesprochenen und der geschriebenen Sprache 

 351

3.2 Empirische Beobachtungen zur begrenzten Reichweite des Satzkonzepts Die Auffassung vom „Satz“ als (der) Grundeinheit geschriebener Sprache (auf der Grundlage eines strukturellen Satzkonzepts) lässt nun erwarten, dass geschriebene Texte auch überwiegend aus Sätzen bestehen. Ohne Zweifel finden sich dafür unzählige Belege aus verschiedenen Textsorten, die alle mehr oder weniger stark durch die von Koch/Oesterreicher für Distanzkommunikation angegebenen Charakteristika beschreibbar sind (man mag den vorliegenden Artikel als Beleg dafür ansehen). In der täglichen Flut an Gebrauchstexten finden sich jedoch ebenfalls in großer Zahl Belege aus distanzpolnahen Textsorten, in denen sich der Textproduzent zumindest teilweise gegen ausgebaute Satzstrukturen entscheidet. Wie stark die Satz-Orientierung unser Sprachbewusstsein in dieser Hinsicht prägt, verdeutlicht besser als alles andere, dass in solchen Fällen unweigerlich die Rede von „Ellipsen“ aufkommt und damit (im ursprünglichen Wortsinn) auf eine ausgebaute(re) Struktur verwiesen wird. Nicht alle nicht-satzförmigen Äußerungsformen lassen sich jedoch auf diese Weise erklären (vgl. dazu Stein 2003, 88–106). Ich beschränke mich zur Illustration auf zwei im Sprachgebrauch verbreitete Erscheinungen, zum einen auf den „isolierten“ bzw. freistehenden Nebensatz: […] Und was macht die Koalition? Sie gibt auf, bevor es richtig losgeht. Das kann nur heißen, dass die Idee von Anfang an falsch war. Oder dass die Koalition einknickt, wenn es schwer wird. […] (Kommentar „So klein kann diese Koalition sein“ von Stefan Braun, Süddeutsche Zeitung Nr. 86, 12./13.04.2014, S. 4),

zum anderen auf die „Konstruktionsübernahme“: […] Verdächtige bleiben im Dunkeln – […] –, Fragen unbeantwortet. Vor allem die eine: […] (Kommentar „Lob der Kanzlerin“ von B. E. [Benedikt Erenz], Die Zeit Nr. 15, 03.04.2014, S. 20).

Konstruktionen dieser Art gelten als charakteristisches Mittel im gesprochenen Deutsch, sie kommen aber auch in geschriebener Sprache vor, wenn eine grammatische Konstruktion über einen bereits erreichten syntaktischen Abschluss und ein entsprechendes Satzendzeichen hinaus in Geltung gehalten wird und den Leser dazu „zwingt“, die bereits verarbeitete Konstruktion weiterhin in Geltung zu halten. Es ist darüber hinaus zu beobachten, dass man über ganze Textpassagen hinweg weitgehend auf ausgebaute Satzstrukturen verzichten kann. Das ist im folgenden Beispiel der Fall, das auch die genannten Phänomene beinhaltet: Kermit auf dem Titelblatt? Sehr witzig. Finden wir jedenfalls. Warum? Weil manches nun einmal nur mit Humor zu ertragen ist. Die Analysen zur Lage des Mannes zum Beispiel. […] (Editorial „Warum Selbstironie dem Mann von heute Kraft gibt“ von Matthias Kalle, Sonderbeilage „ZeitMann“ zu Die Zeit, April 2014, S. 3)

352 

 Stephan Stein

Erinnert sei auch an das Verfahren z. T. äußerst kleinschrittiger Textportionierung, wie man sie oft in Werbetexten finden kann: Für Familienunternehmen. Und Familienausflüge. Für jede Aufgabe den richtigen Citan. Wie unsere Kombi-Varianten. […] Mercedes-Benz Vans. Born to run. (Ganzseitige Werbeanzeige, Die Zeit Nr. 16, 10. April 2014, S. 27)

Hinzuweisen ist ferner auf die in Zeitungstexten bewusst eingesetzte Strategie, die Variation im syntaktischen Ausbau zu nutzen, um Aussageinhalte zu verdichten: […] Die Gewalt und die Demütigungen im Gefängnis haben ihn verändert, haben ihn reizbar gemacht, als ob ein Stück der Dunkelheit, die er durchlebt hat, in ihn hineingesickert wäre. Ein irres Mitbringsel aus der Hölle. […] (Reportage „Spuren der Gewalt“ von Christoph Cadenbach, Süddeutsche Zeitung Magazin Nr. 14, 04.04.2014, S. 12)

Angesichts solch intentionaler Formen der Einheitenbildung ohne Anschluss an kotextuelle grammatische Strukturen erscheint es mir fraglich, ob es zielführend ist, wenn man die Entscheidung über Satzhaftigkeit an äußeren Textgestaltungsmitteln wie den verwendeten Interpunktionszeichen festmacht (vgl. Dürscheid/Schneider 2015). Denn damit löst man den Satz als strukturelle Beschreibungseinheit letztlich auf. M. E. ist es plausibler, auch für die Beschreibung der Einheitenbildung an einem strukturellen Satzkonzept festzuhalten, sofern man auch andere Strukturen, die keine satzförmige Gestalt aufweisen, als kommunikativ-funktionale Einheiten einbezieht. Wie der kursorische Blick auf satzförmige und nicht-satzförmige Formen der Einheitenbildung in geschriebener Sprache verdeutlicht, verbietet es sich, das vermeintlich Hochfrequente zu übergeneralisieren und das vermeintlich Niedrig(er)frequente zu marginalisieren. Vielmehr setzt eine angemessene Beschreibung der Einheitenbildung voraus, auch solche Gestaltungsformen von Texten einzubeziehen, die den normativ geprägten Erwartungen, die aus der Homogenisierung des Untersuchungsgegenstandes ‚geschriebene Sprache‘ und aus der Prototypisierung bestimmter Text­ sorten resultieren, (zumindest partiell) nicht entsprechen. Eigentlich ist es müßig, die Begrenztheit des Satzkonzepts für gesprochene Sprache eigens zu thematisieren. Tut man es doch, kann man zunächst auf die in der Anfangszeit der Gesprochene-Sprache-Forschung verbreitete fragwürdige Praxis verweisen, syntaxferne Äußerungen in Transkripten in Orientierung an der standardsprachlichen Syntax (weg) zu redigieren, und man kann auf die umfangreiche Forschung der letzten vier Dekaden zu syntaktischen Phänomenen gesprochener Sprache verweisen (vgl. für einen Überblick Schlobinski 1997; Schwitalla 2012, 100– 149). Bilanziert man die Forschung, lässt sich sagen, dass Produkte gesprochener Sprache eine Vielzahl syntaktischer Phänomene aufweisen, die gemessen an der

Einheiten der gesprochenen und der geschriebenen Sprache 

 353

standardsprachlichen Syntax als „defizitär“ einzustufen wären, die aber durchaus „regulär“ verwendet werden (z. B. Links- und Rechts-Herausstellungen) und im Zusammenhang mit charakteristischen mündlichen Formulierungsverfahren wie Korrektur und Reparatur, Konstruktionsübernahme oder Parenthese stehen können (z. B. Anakoluthe und Abbrüche, Apokoinus, syntaktische Kontaminationen). So werden im Alltagsgespräch oft Äußerungen produziert, die zwar nicht ‚regellos‘ oder ‚gegen‘ syntaktische Regeln entstehen, die aber in ihrer Äußerungsgestalt – erklärbar meist als Folge der Kommunikationsbedingungen – nicht das strukturelle Format vollständiger und wohlgeformter Sätze aufweisen (auch hier erübrigen sich entsprechende Belege). Man kann daraus die Folgerung ableiten, dass es Textproduzenten umso weniger gelingt, der Standardsyntax gerecht werdende Äußerungen zu produzieren, je näher sich die Äußerungsformen in Richtung Nähepol bewegen – und umgekehrt. Die Formulierung suggeriert, und darauf kommt es mir an dieser Stelle an, dass Textproduzenten auch unter Bedingungen extremer Mündlichkeit auf grammatisches Strukturwissen zurückgreifen, aber nicht notwendigerweise, um Sätze zu produzieren, sondern um den Bedingungen der Äußerungssituation angemessene Äußerungsresultate hervorzubringen. Wenn es die Kommunikationsbedingungen zulassen und wenn es angemessen erscheint, ist es dabei ohne weiteres möglich, auch über längere Äußerungsstrecken hinweg in „Sätzen“ zu sprechen.

3.3 Äußerungen als kommunikativ relevante Einheiten Die Beobachtungen zur Variation der Einheitenbildung und zur Begrenztheit des Satzkonzepts in geschriebenen und in gesprochenen Texten sprechen dafür, eine systematische Trennung vorzunehmen, wie sie Meibauer (2008, 8; Hervorhebungen im Original) vorgeschlagen hat: Sätze sind Einheiten der Grammatik; sie sind durch die Regeln der Grammatik bestimmt und dadurch gewissermaßen abstrakte Objekte. In einer konkreten Kommunikationssituation werden Sätze ausgesprochen („geäußert“), und zwar durch Sprecher, die damit etwas mitteilen wollen. Geäußerte Sätze bezeichnet man als Äußerungen. Es ist sehr wichtig zu verstehen, daß hier kein Widerspruch vorliegt. Man redet von Äußerungen nur, wenn man annimmt, daß sie in einer konkreten Kommunikationssituation auch tatsächlich gemacht worden sind; […]. Es ist dabei zweitrangig, ob es sich um mündliche oder schriftliche Kommunikation handelt; auch schriftliche Mitteilungen sind Äußerungen.

Der Gegensatz „‚Satz‘ vs. ‚Äußerung‘“ bezieht sich also nicht auf die Opposition „‚geschriebene Sprache‘ vs. ‚gesprochene Sprache‘“, sondern auf die Opposition „‚abstrakt‘ vs. ‚konkret‘“. Nimmt man diese Gegenüberstellung ernst, heißt das, dass der Terminus ‚Äußerung‘ auf alle Realisierungsformen von Sprache anzuwenden und

354 

 Stephan Stein

dass als grundlegende Einheit gesprochener und geschriebener Sprache von Äußerungen auszugehen ist: Grundeinheiten geschrieben

Buchstabe

Wort

gesprochen

Laut

Wort

Äußerung

Text Gespräch

Was genau heißt aber „konkret“ bzw. was genau begründet den Status als „Äußerung“? Nach Meibauers Auffassung macht das Faktum des Geäußertwerdens einen Satz als grammatische Einheit zu einer Äußerung als kommunikativer Einheit, d. h. die fragliche Zeichenfolge muss verwendet und kontextuell verankert worden sein – die zusätzliche Attribuierung mit „kommunikativ“, die Dürscheid/Schneider (2015) für erforderlich halten, erscheint daher streng genommen tautologisch. Von „Äußerungen“ als Einheiten gesprochener und geschriebener Sprache zu sprechen besagt also, dass Zeichenfolgen in Texten und in Gesprächen von den Interaktionspartnern kommunikative Relevanz beigemessen wird. Kommunikative Relevanz ist damit wesentliches einheiteninhärentes und -konstitutives Merkmal von Äußerungen. Was unter „kommunikativer Relevanz“ zu verstehen ist, kann so gefasst werden, dass die Zeichenfolgen einen „pragmatischen Folgerungsprozess“ (Dürscheid/Schneider 2015) auslösen; mit anderen Worten: Sie werden als verständigungsrelevant angesehen, weil sie für einen Text bzw. für ein Gespräch bestimmte Funktionen übernehmen und damit letztlich dem Aufbau größerer Einheiten dienen. Was aus der (analytischen) Perspektive des Größeren/Ganzen als Resultat von Gliederungstätigkeit erscheint, ist aus der (synthetischen) Perspektive der einzelnen Äußerung also als Teil der Aufbautätigkeit, d. h. als Schritt in der Konstitution des Größeren/Ganzen zu verstehen. Der mit dieser Sehweise verbundene Gewinn ist zweifellos die Anwendbarkeit auf alle Realisierungsweisen von Sprache: Wir sprechen und schreiben in Äußerungen, indem wir kommunikativ relevante Einheiten bilden. Grammatisches wird nicht ausgeklammert, sondern abgestuft. In welcher Weise Sprecher und Schreiber für die Äußerungskonstitution auf satzförmige und andere grammatische Strukturen zurückgreifen, ist in der Kommunikationspraxis – zumindest jenseits realitätsferner Maximen wie „Sprich im ganzen Satz!“ – im Unterschied zur sprachwissenschaftlichen Analyse von nachgeordneter Bedeutung.

Einheiten der gesprochenen und der geschriebenen Sprache 

 355

4 Rekonstruktion der Einheitenbildung in ­gesprochener Sprache 4.1 Mono- vs. Multimodalität der Verständigung Es ist auffällig, dass die Identifizierung von Äußerungen als Aufbaueinheiten den Kommunikationsbeteiligten in der Regel weder in der schriftlichen noch in der mündlichen Kommunikationspraxis Schwierigkeiten macht, dass die sprachwissenschaftliche Rekonstruktion dagegen sowohl in den Beschreibungskonzepten als auch in der Terminologie erheblich auseinanderklafft. In besonderem Maße gilt das für die Analyse gesprochener Sprache. Ein wesentlicher Grund ist sicher im Gegensatz zwischen der Monomodalität schriftlicher und der Multimodalität mündlicher Verständigung zu sehen: Bei textbasierter Verständigung steht dem Leser (in der Regel eines Endprodukts, das den Prozess seiner Entstehung nicht mehr nachvollziehen lässt) eine materielle verbale Grundlage zur Verfügung, die dauerhaft visuell wahrnehmbar  – d. h. auch wiederholt rezipierbar  – ist und zumindest mit der Interpunktion, insbesondere den Satzschlusszeichen, eine grundlegende Orientierungshilfe bieten kann. Demgegenüber sind die Interaktionspartner bei mündlicher Verständigung bekanntlich auf die einmalige Rezipierbarkeit eines, zumindest im Falle gemeinsam geteilter Wahrnehmung, multimodalen, d. h. akustisch und – im Blick auf redebegleitende Signale sowie interaktionspartnerbezogene Wahrnehmungen  – auch optisch vermittelten Verständigungsangebotes angewiesen. Da mündliche Verständigung  – auch in aufgezeichneter und transkribierter Form – außerdem in Teilen einen Einblick in den Formulierungsprozess und die Konstitution von Äußerungen erlaubt, ist es naheliegend, für einen Überblick über die Ansätze zur Rekonstruktion der Einheitenbildung die Aufmerksamkeit auf gesprochene Sprache zu richten. Die Prozesshaftigkeit mündlicher Verständigung (vgl. Auer 2000) zieht für die Beschreibung der Einheitenbildung in gesprochener Sprache die Forderung nach Prozessorientierung nach sich: Für die Analyse gesprochener Sprache gilt das methodologische Postulat, die Produktion von Äußerungen bzw. die Entwicklung eines Gesprächs in ihrer zeitlichen Abfolge nachzuvollziehen. (Fiehler 2005, 1180)

Aus der Sicht der Interaktionspartner (und analog aus der Sicht des Gesprächsanalytikers) bauen sich Sprecherbeiträge sukzessive auf und können im Prozess ihrer Entstehung bzw. zeitlichen Erstreckung wahrgenommen werden. Was das für die Einheitenbildung bedeutet, beschreibt Fiehler (ebd., 1191) folgendermaßen:

356 

 Stephan Stein

Da nicht alles auf einmal geäußert werden kann, ist für Kommunikation ein Kompositionsprinzip fundamental: Das, was gesagt werden soll, muss vom Sprecher in Einheiten aufgeteilt werden, und die einzelnen Portionen müssen in eine zeitliche Abfolge gebracht, d. h. sequenzialisiert werden; entsprechend muss der Hörer die einzelnen Einheiten erkennen und synthetisieren.

Diese Aufgabe wird dadurch erleichtert, dass die Interaktionspartner im Zuge der Äußerungsproduktion ausreichend (deutliche) Gliederungsmittel verwenden. Mit Heinemann/Viehweger (1991, 108) ist davon auszugehen, daß ein Sprecher bei der Produktion eines Textes weitgehend die Verstehensbedingungen des Adressaten zu antizipieren versucht, indem er […] in den Text Gliederungs- und Rezeptionshilfen einbaut, durch die er den Adressaten über den Verlauf der beabsichtigten oder bereits realisierten Textherstellung informiert.

Was als „Gliederungs- und Rezeptionshilfen“ interpretiert werden kann und aufgrund welcher Kriterien Äußerungen voneinander abzugrenzen sind, ist jedoch alles andere als konsensuell. Es geht dabei hauptsächlich um die Frage, was Äußerungen für den Aufbau von Sprecherbeiträgen leisten, sofern diese mehr als eine kommunikativ relevante Einheit umfassen (sollen). Für erfolgreiche mündliche Verständigung müssen sich die Interaktionspartner gegenseitig signalisieren, an welchen Stellen im Aufbau befindliche Einheiten beginnen und enden. Wie also werden Mehr-Einheiten-Turns aufgebaut und gegliedert?

4.2 Divergenz der Gliederungskonzepte 4.2.1 Kurzer Blick zurück: Gliederungsressourcen im Prinzipienstreit Die Gesprochene-Sprache-Forschung war vor allem in der Anfangszeit stark durch einen Dualismus von Gliederungsprinzipien bestimmt, die sich im Anschluss an Mackeldey (1987, 45 f.) als intern-syntaktische und als extern-kommunikative Gliederung charakterisieren lassen. In diesem Umfeld sind recht heterogene Ansätze für die Beschreibung der Binnengliederung von Sprecherbeiträgen entwickelt worden, die sich vornehmlich darin unterscheiden, ob und in welchem Maße die für die Äußerungskonstitution betriebene syntaktische Strukturbildung oder bestimmte gesprächsorganisierende lexikalische Mittel als Gliederungsressourcen anzunehmen sind. Hintergrund dafür sind auch unterschiedliche Forschungstraditionen, da sich intern-syntaktische Auffassungen stärker an der amerikanischen conversation analysis im Gefolge der Arbeiten von Sacks, Schegloff und Jefferson orientieren, externkommunikative Ansätze dagegen aus der germanistischen Gesprochene-Sprache-Forschung hervorgegangen sind. Da hier nicht der Platz ist, die verschiedenen Ansätze vorzustellen, sei auf Stein (2003, 187–220) verwiesen, wo die Ansätze ausführlich besprochen werden und ihr Erklärungspotenzial durch die Anwendung auf ein aus-

Einheiten der gesprochenen und der geschriebenen Sprache 

 357

gewähltes authentisches Textbeispiel vergleichend herausgearbeitet wird (siehe auch Hennig 2006, 146–185 und Fiehler u. a. 2004, 175–200). Aus heutiger Sicht ist die Diskussion weniger durch den problematischen Dualismus zwischen syntaktischer und kommunikativer Textgliederung geprägt als durch ein Nebeneinander von Konzepten, die die Bestimmung von Äußerungen als kommunikativ relevanten Einheiten und den Aufbau von Sprecherbeiträgen auf der einen Seite eher auf der Grundlage der Einheitenanalyse festmachen (man könnte hier von „Deutungspraxis“ sprechen) und auf der anderen Seite durch das Zusammenspiel von Kriterien auf verschiedenen Ebenen, d. h. auf der Grundlage der Einheitenmarkierung („Markierungspraxis“ nach Fiehler u. a. 2004, 211) erklären.

4.2.2 Einheitenanalyse: Aufbau von Sprecherbeiträgen aus funktionalen Einheiten Wie schon aus der oben erläuterten Unterscheidung von Grundeinheiten hervorgeht, setzt Fiehler (2005, 1175 und 1232–1238, vgl. auch Fiehler u. a. 2004, 204–220) als Grundeinheit gesprochener Sprache „funktionale Einheiten“ an: Funktionale Einheiten sind die kleinsten Bestandteile des [Gesprächs-]Beitrags, denen die Gesprächsbeteiligten im Prozess der Produktion und Rezeption der Beiträge eine separate Funktion im und für den Kommunikationsprozess zuschreiben können. Die Untereinheiten des Beitrags werden damit primär funktional, nicht syntaktisch oder prosodisch bestimmt. Die Identifizierung funktionaler Einheiten macht von syntaktischen und prosodischen Mitteln unterstützenden Gebrauch, sie ist aber weder allein noch primär von ihnen abhängig. (Fiehler 2005, 1232 f.)

Fiehler hat dabei Einheiten im Auge, die insofern den Interaktionsprozess betreffen, als sie den Aufbau von Sprecherbeiträgen organisieren. Syntax und Prosodie werden zwar nicht gänzlich ausgeschlossen, spielen aber für die Bestimmung funktionaler Einheiten keine erkennbare Rolle. Im Blick auf die Leistung für die Konstitution eines Sprecherbeitrags unterscheiden Fiehler (ebd., 1234 ff.) und Fiehler u. a. (2004, 213– 219) zwischen potenziell selbständigen, assoziierten und projizierenden funktionalen Einheiten. Wie die folgende Übersicht (zusammengestellt nach Fiehler u. a. 2004) verdeutlicht, liegt dabei ein sehr weites Verständnis von „funktional“ zugrunde, da damit sehr heterogene Äußerungstypen zusammengefasst werden, die teils eher semantisch, teils eher pragmatisch bestimmt sind: potenziell selbständige funktionale Einheiten, die allein einen Beitrag bilden können

 (1) sprachliche Handlungen  (2) reaktive bewertende Stellung­ nahmen  (3) hörersteuernde Ausdrücke und ­Exothesen [d. h. Verlautbarungen ­mentaler Vorgänge]

Ruhe bitte gut gemacht Moment Wie war das noch? […]

358 

 Stephan Stein

assoziierte funktionale Einheiten, die nur mit einer Trägereinheit einen Beitrag bilden können

projizierende funktionale Einheiten, die zusammen mit einer erwartbaren und syntaktisch von ihnen abhängigen Einheit einen Beitrag bilden

 (4) Benennung von Bedingungen, Folgen, Gründen, Zwecken usw.  (5) Adressierungen  (6) Selbstidentifizierungen  (7) diskursprozessierende Imperative  (8) Rückversicherungssignale/­ Augmente  (9) Modalisierungen (10) Gliederungssignale

um das Ziel zu erreichen […]

(11) vorgreifende Verdeutlichung des Handlungstyps (12) vorgreifende Verdeutlichung des mentalen Status der folgenden Einheit (13) Ankündigung von Redewieder­ gaben (14) Operatoren (15) Referenzkomplexe und ­Thematisierungen

ich bitte dich […]

du Trottel pass doch auf mein Name ist (…) pass mal auf das stimmt doch oder das stört mich irgendwie also

ich befürchte […]

sie fragte […] kurz gesagt […] was die Tagung nächste Woche angeht […]

Mehrgliedrige Beiträge bzw. Mehr-Einheiten-Turns entstehen dann, wenn mehrere selbständige Einheiten kombiniert werden, wenn zu einer selbständigen Einheit eine andere Einheit assoziiert wird oder wenn eine projizierende Einheit eine andere Einheit erwartbar macht (vgl. Fiehler 2005, 1233 f.). Grundsätzlich abzugrenzen sind diese Formen funktionaler Einheiten von solchen, die keine konstitutiven Aufgaben für den Aufbau von Gesprächsbeiträgen übernehmen, sondern ihre Funktionalität im Formulierungsprozess entfalten, da sie als Indikatoren für unterschiedliche Phänomene im Verbalisierungsprozess (wie Verzögerungs- und Überbrückungssignale) dienen. Dreh- und Angelpunkt des Konzepts, das der Perspektive der Interagierenden verpflichtet ist, ist die Fähigkeit, Funktionen zu erkennen und zu unterscheiden und im Rezeptionsprozess Äußerungsteilen spezifische Funktionen zuzuordnen. Es spielt dabei keine Rolle, ob funktionale Einheiten satzförmig oder nicht-satzförmig realisiert sind: Die Möglichkeit, verbalem Material eine Funktion im Rahmen des Kommunikationsprozesses zuzuschreiben, ist nicht davon abhängig, dass die sprachlichen Mittel Satzform haben. (ebd., 1238)

Es ist eine offene Frage, an welcher Art grammatischer Strukturen sich Textproduzenten für die Bildung welcher Art kommunikativ relevanter Einheiten orientieren. Unabhängig davon ist aber in grundsätzlicher Weise zu fragen, ob die Interaktionspartner im Prozess der Rezeption tatsächlich eine entsprechende Analyse und Bestimmung funktionaler Einheiten vornehmen und wie sich das empirisch ermitteln und belegen

Einheiten der gesprochenen und der geschriebenen Sprache 

 359

lässt. Um es an Fiehlers (2005, 1234) Beispiel zu erläutern: Die Äußerung Stimmt, aber die Leistung hätte durchaus noch besser sein können, nicht? umfasst 1. eine funktionale Einheit für den Rückbezug auf den vorausgegangenen Beitrag (Stimmt), 2. eine selbständige funktionale Einheit für eine assertive Sprachhandlung als kommunikativer Kern (aber die Leistung hätte durchaus noch besser sein können) und 3. eine funktionale Einheit für eine hörersteuernde Aktivität (nicht). Dass Interaktionspartner im Verstehensprozess wirklich eine solche analytische Dreiteilung annehmen, erscheint jedoch kaum gängige Praxis im Prozess mündlicher Verständigung zu sein, sondern eher Wunschdenken des Gesprächsanalytikers. Es ist also unverzichtbar, hier einen Perspektivwechsel von der authentischen (online-erfolgenden) Verstehenstätigkeit der Interaktionspartner zur Methodik des „Segmentierens“ im analytischen Prozess zu vollziehen (vgl. zur Kritik am „Segmentieren“ Auer 2010). Als Maßstab kann dafür nicht die Beteiligtenperspektive zugrunde gelegt werden. Vielmehr ist das „Kriterium für die Validität der Segmentierung von Beiträgen in funktionale Einheiten“ vorrangig darin [zu suchen], dass verschiedene Personen (vor die Aufgabe gestellt, dies zu tun) einen Beitrag als analytische Leistung übereinstimmend in Einheiten aufteilen. […] Die Abgrenzung funktionaler Einheiten ist damit letztlich eine empirische Frage, die am Maßstab intersubjektiver Übereinstimmung entschieden wird. (Fiehler u. a. 2004, 211 f.)

Fiehlers funktionales Konzept klammert also die Markierungspraxis der Beteiligten, d. h. manifeste Äußerungseigenschaften syntaktischer, prosodischer und lexikalischer Art, in der Praxis nahezu ganz aus und setzt – hypothetisch – auf die Fähigkeit der Interaktanten, interpretatorisch Funktionen zu erschließen und Äußerungsteilen zuzuschreiben, die – faktisch – jedoch an der Segmentierungsplausibilität der Analytiker festgemacht werden muss. Bestimmt man den Status von Äußerungen allein nach funktionalen Kriterien, werden also spezifische Mittel und Eigenschaften mündlicher Verständigung ausgeblendet, auf deren Leistung für die Äußerungsbegrenzung Fiehler allerdings selbst hinweist. So bleibt offen, in welcher Weise die prosodische Gestaltung zur Bestimmung kommunikativ relevanter Einheiten beitragen kann: Die prosodische Gestaltung bezieht sich zunächst auf eine Gliederung des Gesagten in Intonationsphrasen. […] Die Intonationsphrasen stimmen oft, aber nicht notwendigerweise mit syntaktischen Einheiten oder funktionalen (semantischen, pragmatischen) Einheiten überein. (Fiehler 2005, 1206)

Analoges gilt für charakteristische gesprochensprachliche lexikalische Mittel und Signale, die im Dienst der Gesprächsorganisation stehen. Sie dienen der Herstellung und Beendigung eines kommunikativen Kontakts, der wechselseitigen Steuerung der Gesprächspartner während des Gesprächs sowie der Verdeutlichung der Struktur von Äußerungen und Gesprächsbeiträgen im Vollzug des Sprechens. (Fiehler 2005, 1227)

360 

 Stephan Stein

Analoges gilt aber auch für die Syntax, da sich Interaktionspartner beim prozessualen Aufbau nicht notwendigerweise an Sätzen (im Sinne eines strukturellen Satzkonzepts), sondern allgemeiner an grammatischen Strukturen orientieren.

4.2.3 Einheitenmarkierung: Aufbau von Sprecherbeiträgen aus Turnkonstruktionseinheiten Will man die verschiedenen manifesten Äußerungseigenschaften syntaktischer, prosodischer und u. U. lexikalischer Art als Gliederungsressourcen berücksichtigen, ist ein mehrdimensionales bzw. „integratives“ Gliederungskonzept (Stein 2003, 223–239) erforderlich. Dieses Konzept steht weniger in der Tradition des extern-kommunikativen Ansatzes, wie er maßgeblich von Rath (1979, 72–116, 1990, 1997) mit der Beschreibung von „Äußerungseinheiten“ vertreten worden ist, sondern mehr in der Tradition der amerikanischen Konversationsanalyse, die das in der Kommunikationspraxis weitgehend reibungslose Funktionieren von Turnorganisation und Turnverteilung zum Ausgangspunkt macht. Leitendes Prinzip ist es, die Äußerungskonstitution bzw. die Turnkonstitution vor dem Hintergrund des interaktiven Charakters mündlicher Verständigung zu betrachten und zu beschreiben, wie die Aktivitäten der Interaktionspartner im Rahmen der Turnkonstruktion und Turnorganisation, d. h. Turnabschluss und Turnhalten, über die Einheitenbildung bestimmen (vgl. dazu auch Auer 2010). Aufbauend auf Sacks/Schegloff/Jefferson (1974) werden eine Komponente zur Bildung und eine Komponente zur Begrenzung von „turn constructional units“ (TCU, Turnkonstruktionseinheiten) angenommen: 1. Die Bildung einer oder gegebenenfalls mehrerer TCU beruht auf der Anwendung von Konstruktionsschemata für den Aufbau grammatisch-syntaktischer Strukturen, deren Ausbau zwischen Sätzen und einzelnen, syntaktisch unverbundenen Äußerungsteilen, die auch nicht-satzförmige und nicht um ein finites Verb organisierte Äußerungsformen umfassen können, variieren kann. Vom Grad und von der Art des grammatischen Ausbaus hängt das Maß der projektierenden Kraft der gebildeten grammatischen Strukturen ab. 2. Die Begrenzung einer oder gegebenenfalls mehrerer TCU beruht auf dem Zusammenspiel verschiedener Gliederungsressourcen bzw. Signalisierungssysteme; sie umfassen – als konstruktionsschemaabhängiges Signalisierungssystem die projektierende Kraft der grammatisch-syntaktischen Konstruktionen, d. h. die Orientierung an möglichen Endpunkten von Konstruktionen, insbesondere des möglichen Satzes, – als permanent aktives Signalisierungssystem die Prosodie bzw. bestimmte prosodische Parameter, insbesondere die Tonhöhenbewegung, – als potenzielles Signalisierungssystem die Verwendung lexikalischer Mittel (insbesondere gesprächsspezifischer Signale bzw. Textorganisationssignale),

Einheiten der gesprochenen und der geschriebenen Sprache 

 361

die aufgrund ihrer Polyfunktionalität jedoch nicht nur gliederungsrelevante Aufgaben übernehmen. Interaktionspartner gestalten also zum einen mit den grammatisch-syntaktischen Konstruktionsschemata den Grad des syntaktischen Ausbaus, zum anderen das Zusammenspiel zwischen den verschiedenen Signalisierungssystemen flexibel und situationsadäquat aus (für eine detaillierte Darstellung der verschiedenen Konstruktionsschemata zur Bildung von TCU und der Signalisierungssysteme zur Begrenzung von TCU sei auf Stein 2003, 240–416 verwiesen). Dementsprechend muss ein empirisch adäquates Gliederungskonzept die jeweiligen Kommunikations- und Produktionsbedingungen reflektieren und alle denkbaren Abstufungen bei der Äußerungsproduktion für die Äußerungsstruktur und die Äußerungsgliederung erfassen. Aus diesem Grund ist es auch nicht möglich, die naheliegende Frage nach der Hierarchisierung der Gliederungsressourcen in allgemeingültiger Weise zu beantworten. Untersuchungen, die das Potenzial der grammatischen Strukturen, der prosodischen Gestaltung und der Verwendung von Textorganisationssignalen für den Aufbau turninterner Einheiten und die Rekonstruktion der Einheitenbildung berücksichtigen, vertreten in dieser Frage z. T. diametral entgegengesetzte Positionen. Empirisch begründet erscheint folgende Gewichtung: Syntax, Prosodie und Textorganisationssignale sind voneinander unabhängige Signalisierungssysteme für turninterne Einheiten. Die syntaktischen Konstruktionsschemata stellen dabei das grundlegende Signalisierungssystem dar. Denn der Aufbau syntaktischer Konstruktionen ermöglicht eine globalere Projektion als die prosodische Kontur, weil syntaktisch nicht nur – wie auch prosodisch – Fortsetzungserwartungen ausgelöst werden können, sondern auch weil mit vollzogener syntaktischer Gestaltschließung zugleich das (bzw. ein mögliches) Einheitenende kontextualisiert wird. Besonders nachdrücklich zeigt sich das daran, dass an Stellen, die als mögliche Endpunkte syntaktischer Konstruktionen in Frage kommen, – häufig Hörersignale gesetzt werden, – Turnübernahmeversuche erfolgen (vgl. dazu auch Jefferson 1986, 153 ff.), – syntaktische Konstruktionen von Sprecher und Hörer gemeinsam zu einem Abschluss gebracht werden (der Hörer die syntaktische Konstruktion des Partners also (mit) vervollständigt, sodass syntaktische Konstruktionen kollaborativ gebildet werden) – oder syntaktische Konstruktionen über mögliche Endpunkte hinweg verlängert werden, und zwar durch den Sprecher oder durch den Hörer und auch über Sprecherwechsel hinweg. An solchen Aktivitäten wird umso deutlicher, dass die grammatische Strukturbildung als interaktiv relevante Ressource für die Turnkonstruktion dient, und zwar für alle Interaktionspartner. Allgemeiner: Die Interaktionspartner machen sich ihr grammatisch-syntaktisches Wissen systematisch für die verschiedenen Facetten der Turn-

362 

 Stephan Stein

konstruktion und Turnorganisation zunutze. Die Auffassung, dass sich Sprecher und Hörer wesentlich am Aufbau syntaktischer Konstruktionen orientieren, steht in der Tradition einer „syntax-for-conversation“ (vgl. stellvertretend Schegloff 1979, 280 f.): Syntax is, among other things, that sequential organization that organizes the turn-constructional unit and by reference to which the progress of that unit is exhibited by speakers and analyzed-recognized by recipients. (ebd., 277)

Unterstützt wird die Syntax wie erwähnt einerseits durch die Prosodie, andererseits durch lexikalische (oft formelhafte) Textorganisationssignale. Prosodische und lexikalische Mittel können aber auch innerhalb syntaktischer Konstruktionen kleinere Äußerungssegmente als interaktiv funktionale Teile von Turnkonstruktionseinheiten kontextualisieren oder mehrere syntaktisch konstituierte Einheiten zu größeren Äußerungssegmenten verbinden. Das trägt dem Umstand Rechnung, dass prosodische Konturen nach Pausen oder Bearbeitungen bereits versprachlichter Äußerungsteile weitergeführt werden können und dass lexikalische Mittel sich nicht homogen auf die Textproduktion verteilen, sondern teilweise sehr dicht auftreten, teilweise aber auch fast ganz entfallen können.

4.2.4 Vergleichende Beispielanalyse und einheitenbezogene Interpretationsprobleme Was die beiden grundlegenden Betrachtungsweisen leisten, verdeutlicht am besten ein kurzer Vergleich der Analyseresultate bei der Anwendung auf authentische Beispieltexte. Als Grundlage dient dafür die folgende Gesprächspassage (aus dem Textband „Kindersprache“, vgl. Rath/Immesberger/Schu 1987, 298; Transkription nach GAT (vgl. Selting u. a. 1998)); ich konzentriere mich auf die in Teilen fast wortgleichen Sprecherbeiträge von T(horsten) in den Zeilen 01 f. und 06 f.: 01 T ((...)) äi wä:sche was? (-) LÄ:HMgackers; ne? die weißt du Murmeln 02 kama sich MAche. (---) aus TON. kann man 03 J s sinn dann das; LÄHMgackers? was sind denn 04 T (lacht) weißt nicht 05 J nä. nein 06 T LÄ:HMgackers, das kamma aus TON mache. (-) das sinn 07 so ku’

warte mal

Einheiten der gesprochenen und der geschriebenen Sprache 

 363

1. Die Bestimmung nach funktionalen Kriterien wirft im ersten Fall (Zeilen 01 f.) Probleme auf: Thorstens Sprecherbeitrag beginnt mit einer potenziell selbständigen funktionalen Einheit in Form eines hörersteuernden Ausdrucks (äi wä:sche was?). Eindeutig identifizierbar ist weiterhin eine assoziierte funktionale Einheit in Form eines Rückversicherungssignals (ne?). Da es nicht am Ende einer „Referenz-AussageStruktur“ (Fiehler 2005, 1210) platziert wird, sondern in die Struktur integriert ist und den Referenzausdruck markiert, ist unklar, ob dieses Textstück (LÄ:HMgackers;) wie auch der Prädikationsteil (die kama sich MAche. (---) aus TON.) jeweils als funktionale Einheit aufgefasst werden soll. Der Beitrag in den Zeilen 06 f. legt eine Dreiteilung nahe: zwei potenziell selbständige funktionale Einheiten für den Vollzug jeweils einer assertiven Sprachhandlung (LÄ:HMgackers, das kamma aus TON mache. und das sinn so ku‘), wobei die zweite Einheit zugunsten einer assoziierten funktionalen Einheit in Form eines diskursprozessierenden Imperativs (wade mo.) abgebrochen wird. 2. Für die Bestimmung nach TCU (vgl. dazu auch Stein 2010, 83–86) ist auffällig, dass in beiden LÄ:HMgackers-Äußerungen die Referenzausdrücke durch anaphorische Proformen wieder aufgenommen werden, dass prosodisch aber in unterschiedlich starker Weise zwischen Referenzausdruck und Aussage getrennt wird. In Zeile 01 unterstreicht das Rückversicherungssignal ne? die fehlende prosodische Integration, der Referenzausdruck bildet prosodisch eine eigenständige Einheit, was einen eigenen semantischen Fokus (vgl. Selting 1994, 304) konstituiert bzw. „einen höheren kommunikativen Stellenwert des Referenzausdruckes [markiert]“ (Fiehler 2005, 1211) und der Einführung eines neuen thematischen Aspekts dient. Thorsten vollzieht also zunächst lediglich einen Referenzakt – offensichtlich ist es ihm wichtig, die Aufmerksamkeit des Interaktionspartners ganz auf den Referenzträger als neuen Gesprächsgegenstand zu fokussieren. Dass an dieser Stelle eine Höreraktivität ausbleibt, hat den einfachen Grund, dass mit dem Äußerungsteil LÄ:HMgackers noch kein in irgendeiner Weise kommentierbarer, z. B. zustimmungsfähiger Mitteilungsgehalt vorliegt. Syntaktisch erscheint diese „Herausstellung“ zwar auf den ersten Blick wie eine doppelte Vorfeldbesetzung, weil ein Konstruktionsteil (LÄ:HMgackers) verbalisiert und im Aufbau der anschließenden syntaktischen Konstruktion wieder aufgegriffen wird, sie erweist sich gegenüber der späteren Konstruktion allerdings als wesentlich selbständiger, sodass sie eher dem Bereich der Vor-Vorfeldbesetzung zuzurechnen ist (vgl. dazu Auer 1997, 77 f.). Für die Äußerung in den Zeilen 06 f. ist beobachtbar, dass der Referenzausdruck prosodisch nicht als eigenständige Einheit kontextualisiert, sondern in die folgende Konstruktion integriert ist. Dies „wird durch Realisierung der Voranstellung quasi ‚unter dem Dach‘ der ununterbrochen fortgesetzten Intonationskontur signalisiert“ (Selting 1993, 294). Syntaktisch gesehen liegt hier eine doppelte Vorfeldbesetzung vor. Im Blick auf die Turnkonstitution repräsentieren die beiden fast wortgleichen Textstücke die üblicherweise als „Linksversetzung“ und als „Freies Thema“ charakterisierten Formen der Linksherausstellung (vgl. vor allem Selting 1993 und 1994;

364 

 Stephan Stein

Scheutz 1997; Stein 2003, 255–272), die sich in der Äußerungsgestaltung hauptsächlich prosodisch unterscheiden. Anders als es die Termini „Herausstellung“, „Linksversetzung“ und „Freies Thema“ aber suggerieren, sind diese Strukturen nicht auf bereits fertige Satzstrukturen zurückzuführen. Die Herausstellung erfolgt zeitlich gesehen vor ihrer Bezugskonstruktion, und zwar „ohne daß die Planung des folgenden Bezugssyntagmas schon projizierbar wäre“ (Auer 1991, 140). Die Referenzausdrücke lösen also unspezifische Fortsetzungserwartungen aus. Funktional stehen beide Konstruktionstypen im Dienst der Topikalisierung bzw. der Topik-KommentarGliederung; diese ist „als konversationelle Technik aufzufassen, einen Teil der formulierten Mitteilung als Gegenstand/Ausgangspunkt/Thema bzw. als Kommentar/ Prädikation zu präsentieren“ (Selting 1993, 304). Eine derartige Aufspaltung dient als Mittel vorausorientierender Aufmerksamkeitssteuerung und hat „für Sprecher und Hörer den Nutzen, die kognitiven Aktivitäten des Thematisierens und Prädizierens auseinanderzunehmen“ (Schwitalla 2012, 114). Referenz-Aussage-Strukturen lassen sich damit als Konstruktionsschemata begreifen, die von Interaktionspartnern systematisch als Topikalisierungstechniken für die Turnkonstruktion genutzt werden. Beide Ansätze sind mit Interpretationsproblemen behaftet, die den Status von Textportionen als kommunikativ relevante Äußerungen betreffen. Für die turninterne Einheitenbildung stellt sich die Frage, von wie vielen Einheiten auszugehen ist, wenn einerseits funktional nicht eindeutig bestimmbare Textstücke vorliegen und andererseits prosodisch, lexikalisch und syntaktisch bestimmte potenzielle Einheitengrenzen nicht oder nur partiell übereinstimmen. Die Zahl und die Grenzen der TCU in Mehr-Einheiten-Turns zu bestimmen und operationalisierbare Kriterien abzuleiten, bereitet in der Praxis also z. T. Schwierigkeiten. Um sie zu umgehen, haben Ford/Fox/ Thompson (1996, 431) als Ausweg vorgeschlagen, anstatt die einheitenorientierte Analyse weiter zu verfolgen, zunächst alle relevanten Praktiken heranzuziehen, die der Ausgestaltung gemeinsamer konversationeller Beteiligung dienen. Dazu zählen sie außer der Syntax den Handlungskontext, die Prosodie, das nonverbale Verhalten (Gestik und Blickverhalten) und die Kontrolle des Rezipientenverhaltens (vgl. ebd., 448 f.). Wichtigster Befund ihrer Beispielanalysen ist die starke Kontextabhängigkeit der Interpretation der Gliederungsressourcen: Thus projection creates a manipulable potential end point, a provisional and negotiable goal that can be confirmed or manipulated through the same practices that produced it in the first place. (ebd., 449)

Die Konsequenzen, die sich daraus ergeben, alle kontextuell relevanten (lexikalischsemantischen, pragmatischen, prosodischen, syntaktischen, sequenziellen und aktivitätstypspezifischen) Informationen für die Bestimmung von TCU heranzuziehen, hat Selting (2000) dargelegt. Wenn die TCU als kleinste interaktionell relevante linguistische, d. h. syntaktisch und prosodisch und u. U. lexikalisch bestimmte Einheit in ihrem semantischen, pragmatischen und sequenziellen Kontext aufgefasst wird

Einheiten der gesprochenen und der geschriebenen Sprache 

 365

(vgl. ebd., 487 und 511), heißt das letztlich, dass ihr Abschluss immer nur retrospektiv zuverlässig ermittelt werden und dass sie grundsätzlich nicht kontextfrei als turnübergaberelevant oder als nicht-turnübergaberelevant eingestuft werden kann: […] we need to distinguish TCUs as the basic linguistic units and TRPs [= turnübergaberelevante Stellen] as the ends of possible turns made up of one or more than one TCU. (Selting 2000, 490)

Infolgedessen ist bei der Bestimmung einer TCU zu berücksichtigen, inwiefern sie als (mögliche) Turnbeendigung zu interpretieren ist, d. h. ob es sich um eine turnbeendende oder um eine nicht-turnbeendende Einheit handelt (vgl. ebd., 490 f.). Von Bedeutung ist dies insbesondere in den genannten Fällen, wenn prosodisch Einheiten konstituiert werden, die mit syntaktischen Endpunkten und Einheiten nicht übereinstimmen. In solchen Fällen geben die syntaktische Konstruktion und die syntaktische Kohäsion den Ausschlag: […] in cases of conflict between the syntactic and the prosodic signaling of possible units – i. e. when possible prosodic completions are used at places other than possible syntactic completions – syntax may be stronger and may override more local prosodic signaling. (Selting 2000, 503)

Der syntaktischen Struktur kommt also deshalb eine wichtige Rolle zu, weil sie im Aufbau befindlichen Einheiten ein projektierendes Potenzial verleiht, das die Interaktionspartner nutzen, um sich über die Fortsetzung (und Fortsetzungsmöglichkeiten) oder den (möglichen) Abschluss (und Abschlussmöglichkeiten) von turninternen Einheiten und Turns (insbesondere übergaberelevante Stellen) Klarheit zu verschaffen und so über den gemeinsam betriebenen und zu verantwortenden Prozess der Gesprächsorganisation auf der Ebene der Sprecherbeiträge zu verständigen. Es ist deshalb abschließend nochmals auf das Verhältnis zwischen Äußerung als kommunikativ relevanter Einheit und grammatischer Struktur(bildung) zurückzukommen und die Frage aufzugreifen, in welcher Weise Äußerungen grammatisch strukturiert und variiert werden (können).

5 Konstruktionsschemata und ihre Ausgestaltung 5.1 Variation im syntaktischen Ausbau Die Kommunikationspraxis lebt davon, dass auch in Sätzen gesprochen und nicht nur in Sätzen geschrieben wird. Es ist daher naheliegend, nicht von einem ohnehin strittigen grammatischen Konzept wie dem des „Satzes“ auszugehen, sondern von einem offenen begrifflichen Konzept, das sich auf beide Realisierungsweisen beziehen lässt. Der hier verwendete Begriff „Konstruktionsschema“ (vgl. dazu Stein 2003, 228 und 240–301) betont mit dem Bestandteil „Konstruktion“ (nicht im Sinne der Kon-

366 

 Stephan Stein

struktionsgrammatik) den Aufbaucharakter sprachlicher Äußerungen und mit dem Bestandteil „Schema“ die Regelhaftigkeit ihrer Bildung. Die Auswertung authentischer Texte zeigt, dass in gesprochenen Texten weniger, als man es von geschriebenen Texten gewohnt ist, das Verfolgen bzw. Erreichen einer syntaktischen Gestaltschließung an der Textoberfläche die Bildung von Äußerungen bestimmt. Man muss sich daher auch von der Vorstellung verabschieden, dass als Konstruktionsschemata lediglich syntaktisch durchorganisierte und um ein Verb (mit seinen Ergänzungen) herum gruppierte Strukturen verwendet werden. Ermittelt man die Beschreibungskategorien konsequent unter Beachtung der Realisierungsbedingungen der Texte, wird es möglich, die häufig als ausreichend erachtete Differenzierung zwischen Sätzen bzw. satzförmigen Strukturen auf der einen Seite und satzwertigen Konstruktionen (vgl. z. B. Lindgren 1987), Satzäquivalenten (vgl. Jürgens 1997, 215) bzw. „Nicht-finit-KM [KM = kommunikative Minimaleinheit]“ (vgl. Zifonun u. a. 1997, 88) auf der anderen Seite für selbständige grammatisch-syntaktische Einheiten mit bzw. ohne finites Verb zu präzisieren (vgl. dazu die Systematisierung verbloser und verbhaltiger Typen von Konstruktionsschemata bei Stein 2003, 245 f.). Für die Klärung der Fragen, welche funktionalen Typen von Äußerungen typischer-, nicht aber notwendigerweise satzförmig bzw. nicht-satzförmig realisiert werden und wie die Strukturbildung in Abhängigkeit von den gewählten kommunikativen Praktiken variiert, besteht aber weiterer Forschungsbedarf für alle Realisierungsweisen.

5.2 Pragmatische Syntax Eine adäquate Analyse grammatischer Eigenschaften von Äußerungen als kommunikativ relevanten Einheiten muss die pragmatischen Bedingungen bei der Herstellung von Texten reflektieren und ihren Einfluss auf die Äußerungsgestaltung berücksichtigen, wie es im Konzept einer „pragmatischen Syntax“ der Fall ist (vgl. dazu vor allem Jürgens 1999 und 2001; Kindt 2001; Stein 2003, 240–244). Was eine „pragmatische Syntax“ ausmacht, beschreibt Jürgens (1999, 20, vgl. auch Jürgens 2001, 69 f.) folgendermaßen: Eine pragmatische Syntax sollte sich dadurch auszeichnen, daß sie die in Texten und Diskursen regelhaft verwendeten sprachlichen Strukturen zu ihrem Gegenstand erhebt und diese Strukturen mit Blick auf die kommunikativen Gegebenheiten der Äußerung beschreibt. Daraus ergibt sich zwangsläufig die Forderung, den Zusammenhang der verschiedenen inner- und außersprachlichen Faktoren, insbesondere die kognitiven Grundlagen der Textproduktion und ­-rezeption sowie Fragen des (sprachlichen und außersprachlichen) Kontextes, nicht nur einzubeziehen, sondern zentral zu berücksichtigen.

Besonders lohnenswert sind dabei intermediale vergleichende Analysen wie bei Jürgens (1999), der anhand einer Untersuchung von Fußball-(Live)Reportagen (in

Einheiten der gesprochenen und der geschriebenen Sprache 

 367

Hörfunk und Fernsehen) und entsprechenden Spielberichten (in Printmedien) eine Forderung umsetzt, die im Zusammenhang mit einer gewissen Renaissance der Erforschung syntaktischer Charakteristika gesprochener Sprache in den 1990er Jahren (vgl. dazu u. a. Peyer 1997; Schlobinski 1997; Schönherr 1997; Uhmann 1997; Miller/ Weinert 1998; Jürgens 1999) erhoben worden ist: Charakteristisch für diese „Wiederentdeckung“ ist, dass sich eine pragmatische Herangehensweise an grammatische Phänomene durchsetzt, d. h. dass von einer Wechselbeziehung zwischen grammatischer Struktur und pragmatischen Faktoren ausgegangen und die konkrete Ausgestaltung eines Konstruktionsschemas als von situativen Bedingungen beeinflusste Größe verstanden und beschrieben wird. Die Frage nach den Einheiten gesprochener und geschriebener Sprache lässt sich also für alle Realisierungsweisen von Sprache mit dem Konzept der Äußerung beantworten, deren konkrete und für die jeweilige Realisierungsweise von Sprache charakteristische Ausgestaltung, wie aufgezeigt, mit dem Konzept der pragmatischen Syntax beschrieben werden kann.

6 Literatur Auer, Peter (1991): Vom Ende deutscher Sätze. In: Zeitschrift für germanistische Linguistik 19, 139–157. Auer, Peter (1997): Formen und Funktionen der Vor-Vorfeldbesetzung im gesprochenen Deutsch. In: Schlobinski, 55–91. Auer, Peter (2000): On line-Syntax – Oder: was es bedeuten könnte, die Zeitlichkeit der mündlichen Sprache ernst zu nehmen. In: Sprache und Literatur 31 (85), 43–56. Auer, Peter (2005): Projection in interaction and projection in grammar. In: Text 25 (1), 7–36. Auer, Peter (2010): Zum Segmentierungsproblem in der Gesprochenen Sprache. In: InLiSt – Interaction and Linguistic Structures 49. http://www.inlist.uni-bayreuth.de/issues/49/ InList49.pdf [23.12.2014]. Brinker, Klaus (2010): Linguistische Textanalyse. Eine Einführung in Grundbegriffe und Methoden. Bearbeitet von Sandra Ausborn-Brinker. 7., durchgesehene Auflage. Berlin. Dürscheid, Christa/Jan Georg Schneider (2015): Satz – Äußerung – Schema. In: Ekkehard Felder/Andreas Gardt (Hg.): Handbuch Sprache und Wissen. Berlin/Boston (Handbücher Sprachwissen, 1), 167–194. Fiehler, Reinhard (2000): Über zwei Probleme bei der Untersuchung gesprochener Sprache. In: Sprache und Literatur 31 (85), 23–42. Fiehler, Reinhard (2005): Gesprochene Sprache. In: Duden. Die Grammatik. 7. Auflage. Mannheim u. a., 1175–1256. Fiehler, Reinhard u. a. (2004): Eigenschaften gesprochener Sprache. Tübingen. Ford, Cecilia E./Barbara A. Fox/Sandra A. Thompson (1996): Practices in the construction of turns: the „TCU“ revisited. In: Pragmatics 6, 427–454. Heinemann, Wolfgang/Dieter Viehweger (1991): Textlinguistik. Eine Einführung. Tübingen. Hennig, Mathilde (2006): Grammatik der gesprochenen Sprache in Theorie und Praxis. Kassel. Jefferson, Gail (1986): Notes on ‚latency‘ in overlap onset. In: Human Studies 9, 153–183.

368 

 Stephan Stein

Jürgens, Frank (1997): Syntaktische Variation in der Sportberichterstattung. Unter besonderer Berücksichtigung der Hörfunk- und der Fernsehreportage. In: Schlobinski, 209–225. Jürgens, Frank (1999): Auf dem Weg zu einer pragmatischen Syntax. Eine vergleichende Fallstudie zu Präferenzen in gesprochen und geschrieben realisierten Textsorten. Tübingen. Jürgens, Frank (2001): Ziele und Prinzipien einer pragmatischen Syntax. In: Liedtke/Hundsnurscher, 53–72. Kindt, Walther (2001): Syntax und Pragmatik: Eine zu entdeckende Verwandtschaft. In: Liedtke/ Hundsnurscher, 5–29. Koch, Peter/Wulf Oesterreicher (1985): Sprache der Nähe – Sprache der Distanz. Mündlichkeit und Schriftlichkeit im Spannungsfeld von Sprachtheorie und Sprachgeschichte. In: Romanistisches Jahrbuch 36, 15–43. Liedtke, Frank/Franz Hundsnurscher (Hg.) (2001): Pragmatische Syntax. Tübingen. Lindgren, Kaj B. (1987): Zur Grammatik des gesprochenen Deutsch. Sätze und satzwertige Konstruktionen. In: Zeitschrift für germanistische Linguistik 15, 282–292. Mackeldey, Roger (1987): Alltagssprachliche Dialoge. Kommunikative Funktionen und syntaktische Strukturen. Leipzig. Meibauer, Jörg (2008): Pragmatik. Eine Einführung. 2., verbesserte Auflage. Tübingen. Miller, Jim/Regina Weinert (1998): Spontaneous Spoken Language. Syntax and Discourse. Oxford. Peyer, Ann (1997): Satzverknüpfung – syntaktische und textpragmatische Aspekte. Tübingen. Pohl, Inge (1998): Textsemantisierung sprachlich unterdeterminierter Texte. In: Inge Pohl/Jürgen Pohl (Hg.): Texte über Texte. Interdisziplinäre Zugänge. Frankfurt a. M. u. a., 161–180. Rath, Rainer (1979): Kommunikationspraxis. Analysen zur Textbildung und Textgliederung im gesprochenen Deutsch. Göttingen. Rath, Rainer (1990): Sprechen wir in Sätzen? Über Einheitenbildung im Alltagsdialog. In: Kwartalnik Neofilologiczny XXXVII, 3–18. Rath, Rainer (1997): „Äußerungseinheit“ oder „möglicher Satz“? In: Deutsche Sprache 25, 1–20. Rath, Rainer/Hubert Immesberger/Josef Schu (Hg.) (1987): Kindersprache. Texte italienischer und türkischer Kinder zum ungesteuerten Zweitspracherwerb. Mit Vergleichstexten deutscher Kinder. Tübingen. Sacks, Harvey/Emanuel A. Schegloff/Gail Jefferson (1974): A simplest systematics for the organization of turn-taking for conversation. In: Language 50, 696–735. Schegloff, Emanuel A. (1979): The relevance of repair to syntax-for-conversation. In: Talmy Givón (Hg.): Syntax and Semantics. Volume 12: Discourse and Syntax. San Diego/New York/Berkeley, 261–286. Scheutz, Hannes (1997): Satzinitiale Voranstellungen im gesprochenen Deutsch als Mittel der Themensteuerung und Referenzkonstitution. In: Schlobinski, 27–54. Schlobinski, Peter (Hg.) (1997): Syntax des gesprochenen Deutsch. Opladen. Schönherr, Beatrix (1997): Syntax – Prosodie – nonverbale Kommunikation. Empirische Untersuchungen zur Interaktion sprachlicher und parasprachlicher Ausdrucksmittel im Gespräch. Tübingen. Schwitalla, Johannes (2012): Gesprochenes Deutsch. Eine Einführung. 4., neu bearbeitete und erweiterte Auflage. Berlin. Selting, Margret (1993): Voranstellungen vor den Satz. Zur grammatischen Form und interaktiven Funktion von Linksversetzung und Freiem Thema im Deutschen. In: Zeitschrift für germanistische Linguistik 21, 291–319. Selting, Margret (1994): Konstruktionen am Satzrand als interaktive Ressource in natürlichen Gesprächen. In: Brigitta Haftka (Hg.): Was determiniert Wortstellungsvariation? Studien zu einem Interaktionsfeld von Grammatik, Pragmatik und Sprachtypologie. Opladen, 299–318.

Einheiten der gesprochenen und der geschriebenen Sprache 

 369

Selting, Margret (1995): Der ‚mögliche Satz‘ als interaktiv relevante syntaktische Kategorie. In: Linguistische Berichte 158, 298–325. Selting, Margret (2000): The construction of units in conversational talk. In: Language in Society 29, 477–517. Selting, Margret u. a. (1998): Gesprächsanalytisches Transkriptionssystem (GAT). In: Linguistische Berichte 173, 91–122. Stein, Stephan (2002): Bedeutungskonstitution durch Einheitenbildung in geschriebenen und gesprochenen Texten. In: Inge Pohl (Hg.): Prozesse der Bedeutungskonstruktion. Frankfurt a. M. u. a., 329–356. Stein, Stephan (2003): Textgliederung: Einheitenbildung im geschriebenen und gesprochenen Deutsch – Theorie und Empirie. Berlin/New York. Stein, Stephan (2010): Grundeinheiten gesprochener Sprache. Bestimmungs- und Beschreibungsprobleme aus prozessorientierter Sicht. In: Norbert Dittmar/Nils Bahlo (Hg.): Beschreibungen für gesprochenes Deutsch auf dem Prüfstand. Analysen und Perspektiven. Frankfurt a. M. u. a., 63–98. Uhmann, Susanne (1997): Grammatische Regeln und konversationelle Strategien. Fallstudien aus Syntax und Prosodie. Tübingen. Zifonun, Gisela u. a. (1997): Grammatik der deutschen Sprache. 3 Bände. Berlin/New York.

Reinhard Fiehler

16. Syntaktische Phänomene in der gesprochenen Sprache Abstract: Nach einer Definition der Begriffe ‚multimodale Verständigung‘ und ‚gesprochene Sprache‘ werden im vorliegenden Beitrag Prozessualität, Interaktivität und Multimodalität als zentrale Besonderheiten multimodaler Verständigung beschrieben und in ihren möglichen Auswirkungen auf die Syntax gesprochener Sprache charakterisiert. Als aktuelle Konzepte zur syntaktischen Beschreibung gesprochener Sprache stelle ich dann die on line-Syntax, die Konstruktionsgrammatik und die multimodale Grammatik vor. Als Probleme der syntaktischen Beschreibung gesprochener Sprache diskutiere ich die Beschreibungskategorien sowie die Varianz gesprochener Sprache, die eine eindeutige kategoriale Erfassung erschwert. Als Gegenstand syntaktischer Beschreibung werden die funktionalen Einheiten und der Gesprächsbeitrag eingeführt (Abschnitt 2). Sodann stelle ich Ausschließlichkeit, quantitative Differenz und funktionale Differenz als zu unterscheidende Formen von Besonderheiten vor. Es schließen sich Darstellungen zur Syntax im Formulierungsprozess, zu spezifischen syntaktischen Strukturen und Konstruktionen und zur Syntax ‚elliptischer‘ Gesprächsbeiträge an (Abschnitt 3). Zum Abschluss werden zusammenfassend allgemeine Tendenzen der Syntax gesprochener Sprache benannt (Abschnitt 4). 1 Einleitung 2 Besonderheiten der multimodalen ­Verständigung und ihre Relevanz für die syntaktische ­Beschreibung gesprochener Sprache 3 Syntaktische Besonderheiten der gesprochenen Sprache 4 Allgemeine Tendenzen der Syntax gesprochener Sprache 5 Literatur

1 Einleitung Die Sicht auf die Besonderheiten  – auch auf die syntaktischen Besonderheiten  – multimodaler Verständigung und gesprochener Sprache ist lange Zeit durch das in der Linguistikentwicklung seit de Saussure allmächtige theoretische Konzept eines einheitlichen, homogenen Sprachsystems verstellt worden. Wenn die Sprache ein einheitliches, homogenes System ist, dann ist kein Platz für syntaktische Besonderheiten der gesprochenen Sprache und eigentlich auch schon nicht für die Unterscheidung von geschriebener und gesprochener Sprache. Das Konzept eines einheitlichen, homogenen Sprachsystems basiert auf einer unter der Hand vorgenommenen Gleichsetzung von Sprache mit geschriebener Sprache. Diese besitzt – als Folge langer Nor-

Syntaktische Phänomene in der gesprochenen Sprache 

 371

mierungsprozesse – in der Tat in einigen Hinsichten eine gewisse Einheitlichkeit und Homogenität. Die Gleichsetzung von geschriebener Sprache mit Sprache schlechthin hat ihre Grundlage in der schriftsprachlichen Prägung des gesellschaftlichen Sprachbewusstseins – und insbesondere auch in dem der Schrift verfallenen Bewusstsein von Sprachwissenschaftlern und Sprachwissenschaftlerinnen und dem daraus resultierenden „written language bias“ (Linell 1982) der Sprachwissenschaft. Gleichwohl sind Unterschiede zwischen geschriebener und gesprochener Sprache seit geraumer Zeit diskutiert worden. Wenn sie mit der Vorstellung des Sprachsystems zusammengebracht wurden, wurde dies häufig in der Perspektive diskutiert, ob geschriebener und gesprochener Sprache das gleiche Sprachsystem zugrunde liegt (was die Frage aufwirft, wo die nicht zu leugnenden Unterschiede zu verorten sind) oder ob man zwei eigenständige Systeme ansetzen muss (was angesichts der nicht zu leugnenden Gemeinsamkeiten nicht sinnvoll ist). Zwei Systeme anzusetzen bedeutet zudem den Ausstieg aus der Einheitlichkeit und Homogenität des Sprachsystems und lenkt den Blick auf eine beliebige, immer feiner zu differenzierende Vielfalt von Subsystemen (zur 1- oder 2-System-Debatte vgl. Fiehler u. a. 2004, 118–125). Speziell in Hinblick auf Syntax kommt Motsch – ein dezidierter Vertreter der 1-System-Konzeption – noch 1992 zu folgenden Aussagen: Lexikon und Syntax [sind] in ihrer Grundstruktur unabhängig von der Realisierungsform. (Motsch 1992, 247) Insbesondere syntaktische Strukturen sind offensichtlich unabhängig von den spezifischen Eigenschaften der lautlichen oder graphischen Realisierung. Es scheint keine Beispiele dafür zu geben, dass eine syntaktische Konstruktion in der geschriebenen Sprache korrekt, in der gesprochenen dagegen inkorrekt ist oder umgekehrt, d. h., in dieser Hinsicht gilt eine einheitliche hochsprachliche Norm. (Motsch 1992, 246)

Wenn es so wäre, bräuchte dieser Artikel nicht geschrieben zu werden. Die Konzeption des einheitlichen, homogenen Sprachsystems hat die Ausarbeitung des Eigencharakters von multimodaler Verständigung und gesprochener Sprache und die Erfassung ihrer Besonderheiten aufs schwerste behindert. Darüber hinaus hat sie die Entwicklung von theoretischen Modellen, die dem Varianzreichtum von natürlichen Sprachen gerecht werden, erschwert. Wie unangemessen diese Konzeption ist, wird sofort deutlich, wenn man die Frage der Einheitlichkeit und Homogenität nicht aus der Perspektive der geschriebenen Sprache in den Blick nimmt, sondern sie aus der Sicht der gesprochenen Sprache mit ihrem Varianzreichtum betrachtet. Diese Vielfalt und Varianz steht im krassen Gegensatz zu Einheitlichkeit und Homogenität. Es bleibt zu hoffen, dass die Varianz der Sprache im Zuge einer Relativierung der Schriftzentrierung auch disziplingeschichtlich nach und nach stärker sichtbar wird und Beachtung findet. Auch wenn das Konzept eines einheitlichen homogenen Sprachsystems die Homogenität der geschriebenen Sprache suggeriert, so ist dies nur bedingt zutreffend. Auch Schriftsprache ist in vieler Hinsicht nicht homogen. Sie umfasst unter-

372 

 Reinhard Fiehler

schiedlichste Textsorten, die vom Einkaufszettel über den Brief und das Protokoll bis hin zur philosophischen Abhandlung reichen und die jeweils eigenen Regeln unterliegen. Die Fiktion der Homogenität geschriebener Sprache wird außer durch das langue-Konzept auch durch eine prototypische Betrachtungsweise von Schriftsprache verstärkt, bei der bestimmte Textsorten (z. B. Zeitungstexte und Belletristik) unter der Hand als zentral und wesentlich gesetzt werden (zu der Unterscheidung zwischen einer medial-extensionalen und einer prototypisch-graduierenden Sichtweise sowohl auf geschriebene wie auch auf gesprochene Sprache vgl. Fiehler u. a. 2004, 50–52). Eine homogenisierende Sichtweise kann verhindert oder zumindest erschwert werden, wenn man nicht die Unterscheidung von geschriebener und gesprochener Sprache zentral setzt, sondern wenn man von der Vielfalt kommunikativer Praktiken als den Grundformen der Verständigung ausgeht. Auf diese Weise wird deutlich, dass alle kommunikativen Praktiken über einen Anteil für die jeweilige Praktik spezifischer Regeln verfügen. Mit dem Aufkommen einer intensiveren Beschäftigung mit gesprochener Sprache seit Mitte der 60er Jahre des letzten Jahrhunderts stand zunächst die Syntax gesprochener Sprache, genauer: syntaktische Differenzen zwischen geschriebener und gesprochener Sprache, im Zentrum der Untersuchungen. Motor dieser Entwicklungen war die Forschungsstelle Freiburg des IDS mit dem Projekt „Grundstrukturen der deutschen Sprache“, das die Dokumentation und Analyse gesprochener Sprache zum Ziel hatte (vgl. Fiehler/Wagener/Schröder 2007). Die syntaktischen Arbeiten aus der Zeit von 1965 bis 1973 und die dort behandelten Phänomene werden detailliert von Betten (1977) referiert. Hervorheben möchte ich hier nur Sandig (1973), die die historische Kontinuität einiger gesprochensprachlicher syntaktischer Muster (u. a. Herausstellungen, Nachträge, Wortstellung im Nebensatz, Parenthesen, Anakoluthe) betont und zugleich ihre normative Diskriminierung in Grammatiken beschreibt, sowie Engel (1974), der eine Reihe von syntaktischen Strukturen (u. a. Kurzsätze ohne Verb, Ausklammerungen und Stellungsvarianz im Mittelfeld) korpusbasiert und quantitativ untersucht. Mit der pragmatischen und gesprächsanalytischen Wende treten dann syntaktische Fragestellungen in den Hintergrund (vgl. Betten 1978). Sie werden erst wieder von Schlobinski (1997) aufgegriffen. In der interaktionalen Linguistik entwickeln sie sich dann  – neben der Prosodie  – zu einem zentralen Arbeitsgebiet (vgl. u. a. die Arbeiten von Auer, Günthner, Imo und Selting). Daneben entstehen erste Versuche der Grammatikschreibung für gesprochene Sprache (vgl. Hoffmann 1997 und Fiehler 2009).

Syntaktische Phänomene in der gesprochenen Sprache 

 373

2 Besonderheiten der multimodalen ­Verständigung und ihre Relevanz für die syntaktische ­Beschreibung gesprochener Sprache 2.1 Multimodale Verständigung vs. gesprochene Sprache Während es recht klar ist, was mit geschriebener Sprache gemeint ist  – nämlich schriftlich realisierte Wörter, Sätze oder Texte –, wird der Begriff gesprochene Sprache auf (mindestens) zwei verschiedene Weisen verwendet. Zum einen zur Bezeichnung des gesamten Prozesses multimodaler Verständigung. Er umfasst dann alle Formen der verbalen und körperlichen (mimischen, gestischen, proxemischen etc.) Kommunikation. Zum anderen wird gesprochene Sprache verwendet, um die verbalsprachlichen Anteile der multimodalen Kommunikation zu bezeichnen. In diesem Fall wird  – in Anpassung an die Verhältnisse in der Schriftsprache  – multimodale Verständigung auf ihre verbalen Bestandteile reduziert, eine Praxis, die lange Zeit auch in der Gesprächsanalyse gang und gäbe war, wie die Beschränkung auf Verbaltranskripte zeigt. Auch wenn in vielen Zusammenhängen der verbale Anteil der für die Verständigung zentrale ist, ist diese Reduktion jedoch im Grundsatz nur verständlich, wenn man sie als eine Übertragung der Verhältnisse in der Schriftsprache auf die gesprochene Sprache versteht. Im Rahmen dieses Artikels spreche ich von multimodaler Verständigung, um den Gesamtprozess verbaler, körperlicher und wahrnehmungs-, wissens- und inferenzgestützter Kommunikation zu bezeichnen. Als gesprochene Sprache bezeichne ich die verbalsprachlichen Anteile der multimodalen Verständigung einschließlich aller bedeutungstragenden stimmlichen und prosodischen Erscheinungen (vgl. Fiehler 2009, 1172). Die Differenzierung zwischen multimodaler Verständigung und gesprochener Sprache ist erforderlich, weil beide Konzepte jeweils unterschiedliche Auffassungen zur Folge haben, was unter ‚Syntax gesprochener Sprache‘ zu verstehen ist.

2.2 Besonderheiten multimodaler Verständigung Multimodale Verständigung zeichnet sich gegenüber der schriftsprachlichen Kommunikation durch eine Reihe von Eigenschaften aus, die in ihren Folgen für die syntaktische Beschreibung von multimodaler Verständigung und gesprochener Sprache reflektiert und beschrieben werden müssen und die im Grundsatz ein eigenständiges Syntaxkonzept erfordern. Die wesentlichen Eigenschaften multimodaler Verständigung sind (1) ihre Prozessualität, (2) ihre Interaktivität und (3) ihre Multimodalität. (1) Prozessualität: Grundlage für die grammatische Beschreibung geschriebener Sprache sind für gewöhnlich fertig vorliegende Produkte (Sätze, Texte). Gegenstand

374 

 Reinhard Fiehler

der Beschreibung von multimodaler Verständigung und gesprochener Sprache hingegen sind nicht nur solche vorliegenden Produkte (Transkripte), sondern zugleich ganz wesentlich auch der Prozess der Interaktion, in dem sie entstehen: Multimodale Verständigung ist ein kooperativer Prozess, der in der Zeit abläuft und für den diese Prozessualität und Zeitlichkeit ebenso konstitutiv ist wie die Flüchtigkeit seiner Produkte. Gesprächsbeiträge und Gespräche sind Resultat einer gemeinsamen Hervorbringung, die sich nach und nach in der Zeit entwickelt und die sich nicht dauerhaft materialisiert. Die Analyse und Beschreibung von multimodaler Verständigung und gesprochener Sprache erfordern deshalb vorrangig eine Prozessorientierung anstelle einer Produktorientierung, wie sie für die Analyse geschriebener Sprache charakteristisch ist (Draufsicht auf ein fertiges Produkt). Für die Analyse und Beschreibung gilt das methodologische Postulat, die Produktion von Äußerungen bzw. die Entwicklung eines Gesprächs in ihrer zeitlichen Abfolge nachzuvollziehen. Nur so wird deutlich, welche Funktion einzelne Elemente im Prozess multimodaler Verständigung haben, und erst auf dieser Grundlage können strukturbezogene Kategorien sinnvoll gebildet werden. Um der Prozessualität multimodaler Verständigung gerecht zu werden, muss – wie Auer (2007, 96) es fordert – eine angemessene Syntaxbeschreibung „‚inkrementell‘ sein, d. h. den syntaktischen Strukturaufbau in der ‚Echtzeit‘ erfassen; denn mündliche Sprache wird linear in der Zeit produziert und rezipiert (und unterscheidet sich damit von der Zweidimensionalität des geschriebenen Textes)“. (2) Interaktivität: Interaktivität bedeutet, dass die Beteiligten zur Realisierung gemeinsamer oder individueller Zwecke und Ziele gemeinschaftlich handeln und dabei sich zu jedem Zeitpunkt gegenseitig beeinflussen und steuern. Die wechselseitige Beeinflussung und Steuerung betrifft alle Ebenen des Handelns. Sie erfolgt bei der wahrnehmungs-, wissens- und inferenzgestützten Verständigung ebenso wie bei der körperlichen Kommunikation und der verbalen Verständigung. Die syntaktische Relevanz von Interaktivität zeigt sich u. a. in Strukturlatenzen, wenn die mental noch präsente syntaktische Struktur der Vorgängeräußerung vom folgenden Sprecher (meistens zum Zweck der Verkürzung) genutzt wird (vgl. Abschnitt 3.4), sowie bei der gemeinschaftlichen Äußerungsproduktion. (3) Multimodalität: Unter den Bedingungen wechselseitiger Wahrnehmung kann Verständigung parallel und gleichzeitig auf verschiedenen Ebenen erfolgen. Das heißt, sie ist weitaus mehr als verbalsprachliche Kommunikation. Sie umfasst darüber hinaus zunächst einmal alle Formen körperlicher Kommunikation (Mimik, Gestik, Körperhaltung, Körperkonstellation etc.). Zwischen den verbalen und den körperlichen Anteilen bestehen komplexe Wechselwirkungen, zugleich verläuft zwischen ihnen aber auch – entlang der Unterscheidung Stimmgebundenheit (akustische Wahrnehmung) vs. Leibgebundenheit (optische Wahrnehmung) – eine deutliche Trennungslinie. Zur Multimodalität der Verständigung gehören zum Dritten auch die verschie-

Syntaktische Phänomene in der gesprochenen Sprache 

 375

denen Formen der Verständigung, die sich auf visuelle Wahrnehmungen, Wissen und Schlüsse (Inferenzen) stützen. In syntaktischer Hinsicht eröffnet Multimodalität ein weites Feld, indem nicht nur syntaktische Beziehungen zwischen verbalen Elementen, sondern zwischen Elementen der verschiedenen Modalitätsebenen thematisch werden.

2.3 Syntaktische Konzepte zur Beschreibung gesprochener Sprache Bei der Analyse gesprochensprachlicher Phänomene hat sich wiederholt gezeigt, dass Grammatikkonzepte, wie sie für die Beschreibung geschriebener Sprache verwendet werden, nur bedingt auch für die Beschreibung multimodaler Verständigung und gesprochener Sprache geeignet sind. Dies hat dazu geführt, die Anforderungen zu reflektieren, die eine für die gesprochene Sprache angemessene Grammatik erfüllen sollte. Günthner (2011, 235–243) fasst diese Anforderungen wie folgt zusammen: Eine praxisorientierte Grammatiktheorie – gründet auf einem Grammatikkonzept, das der kommunikativen Praxis entstammt und folglich sprachliche Verfahren im Prozess sozialer Aktivitäten betrachtet. – muss der Tatsache Rechnung tragen, dass grammatische Strukturen keineswegs homogene, ahistorische, statische Gebilde darstellen. – ist funktional ausgerichtet und handlungsbasiert. – muss der Medialität sprachlichen Handelns gerecht werden und damit sowohl spezifisch mündliche als auch spezifisch schriftliche Eigenschaften von Sprache mitreflektieren. – hat zu berücksichtigen, dass wir uns beim Sprechen und Interpretieren an musterhaft vorgeprägten Formaten bzw. konstruktionellen Schemata orientieren. – akzeptiert die offene, dynamische Natur grammatischer Konstruktionen im interaktionalen Gebrauch. – betrachtet sprachliche Strukturen in ihrer zeitlichen Entfaltung und damit in der Echtzeit ihrer Produktion und Interpretation. – bezieht die Dialogizität mündlicher Sprache und damit die Orientierung am Gegenüber in die Theoriebildung ein. – schließt kognitive Faktoren, die die sprachliche Produktion wie auch Rezeption mitbedingen, in ihre Theoriebildung ein.

Günther plädiert damit für eine Grammatikkonzeption, für die konstitutiv ist, „dass Grammatik, grammatische Regelhaftigkeiten und grammatische Muster im Sprachgebrauch konstruiert, verfestigt und modifiziert werden, d. h., dass sich sprachliche Strukturen aus und in der Performanz entwickeln“ (Günthner 2011, 232). Hopper (1998, 156) formuliert dies zugespitzt: „Grammar in this view, is not the source of understandings and communication but a by-product of it. Grammar is, in other words, epiphenomenal.“ Haspelmath (2002, 263) greift dies auf, wenn er schreibt: „Grammatik entsteht als Nebenprodukt des Sprechens in der sozialen Interaktion“ und indem er

376 

 Reinhard Fiehler

Grammatik als geronnenen Diskurs charakterisiert. Auch wenn die Auffüllung dieser Grammatikkonzepte in vieler Hinsicht noch nicht erfolgt ist, finden sich mit Auers Konzept einer (1) on line-Syntax (2000, 2007), mit (2) konstruktionsgrammatischen Ansätzen und (3) der multimodalen Grammatik (z. B. Fricke 2012 und Fricke in diesem Band) erste Konkretisierungen einer Grammatiktheorie für multimodale Verständigung und gesprochene Sprache. (1) Die on line-Syntax modelliert die Produktion und Rezeption von Äußerungen im zeitlichen Vollzug. Ihre Grundoperationen sind Projektionen (und Projektionseinlösungen) sowie Retraktionen. Projektionen sind Erwartungen über mögliche Fortsetzungen von eröffneten syntaktischen Gestalten. Dieser Erwartungsraum wird durch nachfolgend produzierte Elemente eingeschränkt, bis mit dem Gestaltschluss eine Projektion eingelöst ist. Retraktionen greifen auf bereits gefüllte syntaktische Positionen zurück und modifizieren sie. Die on line-Syntax modelliert so die Zeitlichkeit der Produktion und Rezeption von Äußerungen. (2) Croft (2001, 46) formuliert die Grundannahme der Konstruktionsgrammatik wie folgt: „Constructions, not categories and relations, are the basic, primitive units of syntactic representation.“ Die Beschreibung der Besonderheiten gesprochener Sprache hat zur Identifizierung einer Vielzahl von spezifischen Konstruktionen geführt. Die Charakterisierung der Konstruktionen erfolgt dabei sowohl durch formale wie auch funktionale Merkmale: Konstruktionen [enthalten] typischerweise [in ihren Beschreibungen; R. F.] Einträge zu morphosyntaktischen Eigenschaften (interne Abfolge von syntaktischen Einheiten innerhalb der Konstruktion, Stellungsbeschränkungen in den Satzfeldern, strukturelle Beziehungen untereinander, Kasusmarkierungen, enklitische Strukturen etc.), zu prosodischen und phonologischen Ausprägungen (Intonationsverlauf, prosodische Einbettung oder Selbstständigkeit in Bezug auf den umgebenden Diskurs etc.), zur Semantik und Funktion (semantische Rollen, Rahmen oder Szenen, die zur Interpretation herangezogen werden müssen, textuelle oder interpersonelle Funktionen) und schließlich zum Kontext (Register, Textsorten/Gattungen, sequenzielle Platzierung im Diskurs etc.). Nicht alle dieser Ebenen sind für die Beschreibung einzelner Konstruktionen gleichermaßen relevant. (Günthner/Imo 2006, 4–5)

Zur Beschreibung von musterhaft vorgeprägten Elementen der gesprochenen Sprache scheinen solche Konstruktionen, und genereller: das Format der Konstruktionsgrammatik, in besonderer Weise geeignet (vgl. Deppermann 2006 und 2011, der Konvergenzen und Divergenzen zwischen Gesprächsanalyse, interaktionaler Linguistik und Konstruktionsgrammatik diskutiert). (3) Anliegen der multimodalen Grammatik ist, nicht nur syntaktische Beziehungen zwischen verbalen Elementen zu erfassen, sondern gerade auch entsprechende Beziehungen zwischen Elementen verschiedener Modalitätsebenen. Damit werden u. a. gemischte Äußerungen beschreibbar, die sich aus verbalen Elementen und Gesten, Körperhaltungen etc. zusammensetzen (z. B. und während des anfalls hat er dann so dagelegen + demonstrierende Körperhaltung).

Syntaktische Phänomene in der gesprochenen Sprache 

 377

Die vorliegenden Analysen zur Semantisierung und Typisierung von Gesten als potentiellen syntaktischen Konstituenten […] sowie die Beispielanalysen zur multimodalen Attribuierung in Nominalgruppen zeigen, dass eine multimodale Grammatik nicht nur im Ansatz möglich, sondern auch notwendig ist, will man der Sprache als Medium der Verständigung gerecht werden. (Fricke 2012, 258)

Trotz erfolgversprechender Ansätze u. a. von Fricke (2012), Stukenbrock (2014) und Zima (2014) ist die Einbeziehung der Multimodalität in die syntaktische Beschreibung noch weitgehend ein Desiderat. In den folgenden Ausführungen beschränke ich mich weitgehend auf syntaktische Beziehungen zwischen verbalen Elementen. Dabei lege ich einen an Morris orientierten Begriff von Syntax zugrunde, wonach die Syntax die Regularitäten der Anordnung (Reihenfolge) von und der Beziehung zwischen sprachlichen Zeichen beschreibt. Dabei gehe ich von drei grundlegenden Relationen aus, die zwischen sprachlichen Zeichen bestehen können: (1) der Relation der additiven Reihung, (2) der Relation der Abhängigkeit und (3) der Relation von Operator und Skopus. Bei der Reihung sind die Elemente nicht voneinander abhängig. Die sprachlichen Zeichen treten additiv in einer bestimmten Reihenfolge zusammen auf (Hai tötet Urlauber). Bei der Abhängigkeit tritt ein Element nicht nur gereiht auf, sondern ist zudem von einem anderen Element abhängig (z. B. sind in der Nominalphrase der weiße Hai sowohl der Artikel der wie auch das Adjektiv weiße vor dem Nomen Hai gereiht und zugleich von ihm abhängig). Bei der Relation von Operator und Skopus besitzt ein Element – der Operator – Geltung für eine bestimmte Menge von sprachlichen Elementen  – seinen Skopus (z. B. besitzt in der Äußerung versprochen ich komme morgen der Operator versprochen Geltung für die folgenden Elemente ich komme morgen, indem er sie als ein Versprechen ausweist (vgl. Fiehler 2012)).

2.4 Probleme der syntaktischen Beschreibung gesprochener Sprache Die Beschreibung von syntaktischen Phänomenen der gesprochenen Sprache sieht sich u. a. mit drei Problemen konfrontiert. Zum einen sind viele der traditionellen syntaktischen Beschreibungskategorien dem Gegenstand gesprochene Sprache nicht angemessen. Zum anderen sind viele Phänomene der gesprochenen Sprache so beschaffen, dass sie graduelle Übergänge aufweisen und sich nur schwer mit eindeutig abgrenzenden Kategorien erfassen lassen. Und letztlich ist die Frage zu beantworten, welche Einheiten der gesprochenen Sprache überhaupt für die syntaktische Beschreibung zugrunde gelegt werden sollen. (1) Die überwiegende Zahl der linguistischen Beschreibungskategorien wurde in der und für die Analyse geschriebener Texte entwickelt und dann in Grammatiken zu einem relativ festen Satz von Analyse- und Beschreibungskategorien kanonisiert.

378 

 Reinhard Fiehler

Beispiele für solche Kategorien sind ‚Satz‘, ‚Anakoluth‘, ‚Linksherausstellung‘, ‚Apokoinukonstruktion‘ etc. Diese grammatischen Beschreibungskategorien sind  – wie alle Kategorien – funktional ihrem Gegenstand angepasst, und das heißt der Analyse und Beschreibung von geschriebener Sprache. Für ein gegenstandsangemessenes Erfassen der Verhältnisse in der gesprochenen Sprache sind sie nur bedingt geeignet. Die auf die Schriftsprache ausgerichteten Analyse- und Beschreibungskategorien sind darüber hinaus das einzige voll entwickelte Kategoriensystem. Ein Kategoriensystem, das in ähnlicher Weise funktional auf die gesprochene Sprache zugeschnitten wäre, existiert im Moment nur in Grundzügen. So sind das schriftsprachlich dominierte Sprachbewusstsein und die für die Schriftsprache entwickelten Analysekategorien zwangsläufig die Grundlage für das Verständnis und die Erkenntnis von gesprochener Sprache: Gesprochene Sprache wird durch die Brille der geschriebenen wahrgenommen, sie ist das Modell für das Verständnis von Mündlichkeit. Generell bedürfen Kategorien der traditionellen Grammatik, wenn sie zur Beschreibung mündlicher Kommunikation verwendet werden sollen, einer handlungs- und funktionsorientierten Reinterpretation. Was traditionelle, formbestimmte und strukturbezogene Kategorien bezeichnen, wird dabei rekonstruiert in Hinblick auf ihre Funktion(en) im Prozess des Sprechens, d. h. auch in Hinblick auf seine Charakteristik und Qualität als Handlung. Reinterpretation bedeutet also, dass die kommunikative Funktion von sprachlichen Mitteln oder Strukturen rekonstruiert und expliziert und dass sie in einem ‚sprechenden‘ Kategoriennamen kondensiert wird (vgl. z. B. die Reinterpretation von Linksherausstellungen als Referenz-AussageStrukturen (Fiehler u. a. 2004, 168–172) und die Reinterpretation von Apokoinukonstruktionen einerseits als Anknüpfungskonstruktionen und andererseits als Rahmungskonstruktionen (Fiehler 2006, 33–35)). (2) Es ist eine geläufige Erfahrung bei der Untersuchung von Phänomenen in der gesprochenen Sprache, dass im empirischen Material weit mehr Verwendungsweisen anzutreffen sind, als in Grammatiken beschrieben sind. So konstatiert Günthner (2012) z. B. fünf verschiedene Verwendungsweisen von und zwar, wobei die Grenzen zwischen den Fällen keineswegs eindeutig zu ziehen sind: Die präsentierte Analyse zeigt ein erheblich diversifizierteres Bild hinsichtlich der Verwendungsformen und -funktionen von und zwar-Konstruktionen als das in weiten Teilen von der Forschungsliteratur skizzierte, bei dem oftmals nur schriftsprachliche (oder konstruierte, an der Schriftsprache orientierte), monologisch ausgerichtete Beispiele herangezogen werden. (Günthner 2012, 41)

Allgemeiner formuliert Imo (2007, 37): Je stärker man empirisch gewonnenes, gesprochensprachliches Material in den Mittelpunkt der Analyse stellt, desto mehr muss die Variabilität von Konstruktionen Einzug in die Formulierung einer Grammatik finden.

Syntaktische Phänomene in der gesprochenen Sprache 

 379

Im Zusammenhang mit ‚Adjektiv + dass-Satz‘-Konstruktionen stellt Günthner (2009, 179–180) fest: Zugleich existieren zahlreiche Übergänge zwischen den Konstruktionen sowie „fuzzy boundaries“ zu weiteren Konstruktionen. Das Phänomen der fließenden Übergänge zwischen Konstruktionen repräsentiert eine zentrale Beobachtung, die Studien zu Verwendungsweisen von Kon­ struktionen im tatsächlichen Sprachgebrauch immer wieder machen.

Dies führt Günthner (2009, 180) zu dem Schluss: Ein solches dynamisches Konstruktionskonzept […] betrachtet Konstruktionen nicht länger als homogene, statische Gebilde mit starr festgelegten formalen Strukturen, sondern als konventionalisierte, jedoch flexible und dynamische Muster, die im Prozess der Interaktion inkrementell ergänzt werden können und aushandelbare Grenzen sowie Überlappungen mit verwandten Konstruktionen aufweisen.

Um diese Unschärfe von Konstruktionen und Kategorien modellieren zu können hat Imo (2007, 2011) den Einbezug des Prototypenansatzes bzw. eines Granularitätskonzepts in die Grammatikschreibung vorgeschlagen. Die konkrete Ausgestaltung dieses Vorschlags steht allerdings aus. (3) Für die Schriftsprache und -grammatik ist der Satz die zentrale Einheit, und es ist klar, dass syntaktische Beschreibungen sich auf die zwischen seinen Elementen bestehenden Relationen beziehen. Für die gesprochene Sprache ist der Satz nicht in gleicher Weise die zentrale Einheit, und so bleibt zu fragen, welche Einheiten dort Gegenstand der syntaktischen Beschreibung sein sollen. Die zentrale Einheit der gesprochenen Sprache ist der Gesprächsbeitrag, der seinerseits aus funktionalen Einheiten besteht (vgl. Fiehler 2009, 1221–1227). Funktionale Einheiten sind die kleinsten Bestandteile des Beitrags, denen die Gesprächsbeteiligten im Prozess der Produktion und Rezeption der Beiträge eine separate Funktion im und für den Kommunikationsprozess zuschreiben können. So besteht z. B. der Gesprächsbeitrag: gut du leichtgläubiger jakob mit dieser auskunft kannst du doch nicht wirklich zufrieden sein oder etwa doch aus vier funktionalen Einheiten, einer reaktiven bewertenden Stellungnahme, einer Adressierung, einer Aussage (die eine Vermutung zum Ausdruck bringt) und einer Frage. Die Untereinheiten des Beitrags sind damit primär funktional, nicht syntaktisch oder prosodisch bestimmt. Ferner ist die Bestimmung funktionaler Einheiten an die Perspektive der Gesprächsbeteiligten gebunden: Sobald diese Teilen eines Beitrags solche Funktionen zuschreiben können, identifizieren sie diese Segmente als funktionale Einheiten. Gegenstand syntaktischer Beschreibung gesprochener Sprache sind damit der Aufbau dieser funktionalen Einheiten, sofern sie aus mehr als einem Element bestehen, sowie die Relationen zwischen funktionalen Einheiten im Gesprächsbeitrag. Zu unterscheiden sind drei Typen von funktionalen Einheiten: potenziell selbstständige funktionale Einheiten, assoziierte funktionale Einheiten und projizierende funktio-

380 

 Reinhard Fiehler

nale Einheiten: Potenziell selbstständige funktionale Einheiten können für sich alleine einen Beitrag bilden. Besteht ein Gesprächsbeitrag aus mehreren selbstständigen funktionalen Einheiten, so stehen sie in der Relation der additiven Reihung. Assoziierte funktionale Einheiten sind nicht allein stehend möglich. Sie erfordern eine Trägereinheit, von der sie abhängig sind; nur mit ihr zusammen bilden sie einen Beitrag. Die Relation zwischen den funktionalen Einheiten ist dann die der Abhängigkeit. Projizierende funktionale Einheiten sind ebenfalls nicht selbstständig. Sie machen eine weitere funktionale Einheit erwartbar. Nur beide zusammen stellen einen vollständigen Beitrag dar. Die syntaktische Relation zwischen ihnen ist die von Operator und Skopus. Diese drei Relationen zwischen funktionalen Einheiten widerspiegeln die drei oben genannten grundlegenden syntaktischen Beziehungen zwischen Elementen.

3 Syntaktische Besonderheiten der gesprochenen Sprache 3.1 Ermittlung und Formen von Besonderheiten Jede Bestimmung von spezifischen Eigenschaften setzt unumgänglich  – implizit oder explizit – einen Vergleich voraus. Im Kontext von gesprochener und geschriebener Sprache ist jeweils die andere Seite Vergleichsgegenstand: Verglichen wird also gesprochene mit geschriebener Sprache, wobei der Fokus Syntax bedingt, dass schriftsprachliche Sätze mit funktionalen Einheiten und Gesprächsbeiträgen verglichen werden (zur Problematik des Vergleichens vgl. Fiehler u. a. 2004, 110–116). Bei diesem Vergleich lässt es sich nicht vermeiden, dass auch Beschreibungskonzepte und Beschreibungskategorien der geschriebenen Sprache verwendet werden (z. B. Konzept und Kategorie des Satzes) und dass von diesem Standpunkt aus die Besonderheiten der gesprochenen Sprache dann als Abweichung bzw. Negation gefasst werden (z. B., dass in der gesprochenen Sprache vielfältige Formen von ‚nichtsatzförmigen‘ Äußerungen zu beobachten sind). Die dabei verwendeten schriftsprachlichen Konzepte oder Kategorien sind jedoch in vielen Fällen für die gesprochene Sprache nicht gegenstandsangemessen. Wenn man von Besonderheiten der gesprochenen Sprache spricht, so ist es heuristisch sinnvoll, drei Formen zu unterscheiden: (1) Ausschließlichkeit (AUS): Damit sind Phänomene gemeint, die  – mit Ausnahme des Falls, dass in der geschriebenen Sprache Mündlichkeit nachgebildet wird – ausschließlich in der gesprochenen Sprache zu finden sind (z. B. weil/obwohl/wobei/während mit Verbzweitstellung). (2) Quantitative Differenz (QD): Ein Phänomen kommt in beiden Realisierungsformen vor, ist jedoch in der gesprochenen Sprache häufiger (z. B. Operator-Skopus-Struk-

Syntaktische Phänomene in der gesprochenen Sprache 

 381

turen). (3) Funktionale Differenz (FD): Ein Phänomen kommt sowohl in der gesprochenen wie auch in der geschriebenen Sprache vor, besitzt aber in beiden eine unterschiedliche Funktionalität (z. B. Verberststellung). Ich möchte im Folgenden drei Bereiche von Besonderheiten behandeln: (1) syntaktische Besonderheiten im Formulierungsprozess, (2) besondere syntaktische Strukturen bzw. Konstruktionen und (3) die Syntax ‚elliptischer‘ Gesprächsbeiträge.

3.2 Syntax im Formulierungsprozess Der Gesprächsbeitrag wird vom Sprecher, nachdem er das Rederecht übernommen hat, auf der Grundlage eines Äußerungsplans (intendierter Beitrag) in einem Formulierungsprozess sukzessive realisiert. Der Formulierungsprozess besteht zum einen in der Versprachlichung kognitiver Inhalte und zum anderen in der Bearbeitung bereits geäußerten sprachlichen Materials. Dabei bedienen sich die Sprecher einer Vielzahl von Formulierungsverfahren, die in den Äußerungen Spuren hinterlassen und an diesen Indikatoren erkennbar sind (Gülich/Kotschi 1996). Im Rahmen der Versprachlichung kognitiver Inhalte spielen vor allem drei Gruppen von Formulierungsverfahren eine Rolle: (i) Darstellungsverfahren, mit denen der Sprecher das, was er mitteilen will, auf eine bestimmte Weise formuliert; (ii) Problembearbeitungsverfahren, mit denen er anzeigt, dass Formulierungsprobleme bestehen, und mit denen diese Probleme zugleich bearbeitet werden; (iii) Verfahren der Verständnissicherung, die der Absicherung des Mitgeteilten dienen. (i) Darstellungsverfahren: Die Darstellungsverfahren betreffen unterschiedlichste Phänomene wie die Wahl einer aktivischen oder passivischen Darstellung, die Wahl bestimmter syntaktischer Konstruktionen (z. B. Referenz-Aussage-Strukturen statt der klassischen Satzform), die Wortwahl und die Wortstellung, den Detaillierungsgrad der Darstellung und vieles mehr. Der Prozess des Formulierens kann unterbrochen werden, um eine zweite Formulierungslinie zu eröffnen, die die begonnene Konstruktion der ersten nicht fortsetzt, sondern etwas anderes versprachlicht. Nach Beendigung dieser Äußerungseinheit wird die unterbrochene Konstruktion fortgeführt. Hierbei handelt es sich um Einschübe bzw. Parenthesen. Einschübe haben sehr häufig eine metakommunikative Funktion. wir müssen- * →um das schon mal anzukündigen← * die mülltonnen noch rausstellen

(ii) Problembearbeitungsverfahren: Die Anforderungen des Formulierungsprozesses können auch dazu führen, dass der Sprecher zu Beginn oder im Verlauf seines Beitrags nicht in der Lage ist, die ersten Elemente seiner Äußerung zu formulieren bzw.

382 

 Reinhard Fiehler

seine Äußerung fortzusetzen. Solche Formulierungsprobleme führen zu Formulierungspausen, in denen der Sprecher schweigt oder die er mit Haltesignalen wie äh oder ähm füllen kann. Formulierungsprobleme können auch durch Dehnungen oder durch Wortwiederholungen (Repetitionen) überbrückt werden. also aber der westen hat diese- ** diese äh: diese ängste=ja sehr stark durch den kommu'nismus gehabt↓ nicht↑ ** von- * einer- * be'zahlung- ** →von eim← von eim 'stundenlohn >→oder so←< war 'nie die rede

Formulierungsprobleme können darin bestehen, dass die Äußerungsplanung noch nicht abgeschlossen ist und deshalb die Darstellungsverfahren nicht angewandt werden können oder dass an bestimmten Stellen die folgende Phrase oder das folgende Wort nicht verfügbar ist. Solche Wortsuchprozesse können durch Elemente wie na oder durch Einschübe wie sag schon oder wie heißt das doch gleich angezeigt werden. ja ich habe mir äh sagen lassen- * dass ähm: *3* na wie war das jetzt↓ ** dass man die 'miete- * äh →dass man den mietvertrag kündigen muss bevor man die miete erhö:ht←

Durch Indikatoren wie oder so, so in etwa, wenn man so will wird angezeigt, dass zwar ein Wort, aber nicht das treffende gefunden wurde. Zu den Formulierungsproblemen gehören auch Fehlartikulationen und Versprecher, bei denen der Sprecher das betreffende Wort nicht voll trifft bzw. er sich verspricht. denn wenn sie jetz von der güteverhandlung völlig unbefriert äh friedigt rausgehn

Die komplexen Anforderungen, die die Versprachlichung an den Sprecher stellt, können dazu führen, dass im Prozess des Formulierens Projektionen nicht erfüllt und begonnene syntaktische Konstruktionen nicht oder anders zu Ende geführt werden. Dies führt zum einen zu Formulierungsabbrüchen, die in der gesprochenen Sprache – sowohl sprecherbedingt wie auch hörerbedingt (z. B. nach Einwürfen oder Versuchen einer vorzeitigen Übernahme des Rederechts)  – häufig sind. Zum anderen können die Anforderungen der Versprachlichung Konstruktionsbrüche oder Konstruktionsmischungen (auch Anakoluthe genannt) zur Folge haben. also der is 'dumm einfach auch der 'blickts einfach nicht 'durch ne↑ und dass da wir im augenblick eine große wandlung sich vollzieht

Eine häufige Form des Konstruktionsbruchs besteht darin, dass im Prozess des Formulierens von einer erforderlichen Verbletzt- zu einer Verbzweitkonstruktion übergegangen wird (auch Loslösung genannt):

Syntaktische Phänomene in der gesprochenen Sprache 

 383

wenn ich demagogisch wäre würde ich sagen dass dieser entwurf wenn er so durch käme würde im interesse der arbeitgeber liegen wenn so ein fall an sie herangetragen wird und er lässt sich nicht durch ein gespräch mit dem arzt aus der welt schaffen dann schalten sie die vertragsabteilung ein

Das Ende von Formulierungs- bzw. Versprachlichungsproblemen kann dadurch angezeigt werden, dass an Elemente vor der problematischen Sequenz angeknüpft bzw. dort begonnene Konstruktionen wieder aufgenommen werden. Die Problembearbeitungsverfahren erzeugen damit eine spezifische syntaktische Struktur, für die es im Schriftlichen kein Äquivalent gibt. Formulierungsprobleme der beschriebenen Art bei der Versprachlichung kognitiver Inhalte sind in der mündlichen Verständigung, die ohne Verzögerung immer im direkten Vollzug erfolgt, unvermeidbar und normal, und sie werden durch die Existenz der entsprechenden Signalisierungsverfahren und Indikatoren hinreichend kompensiert. (iii) Verfahren der Verständnissicherung: Der Direktvollzug und die Flüchtigkeit gesprochener Sprache machen auch besondere Vorkehrungen der Verständnissicherung erforderlich. Zur Verständnissicherung gehören alle kommunikativen Verfahren, mit denen der Sprecher die Struktur von Beiträgen für den Hörer verdeutlicht. So signalisieren Start-, End- und Gliederungssignale den Beginn, das Ende und die interne Strukturierung von Beiträgen. Diese Signale können verbaler, intonatorischer oder körperlicher Art sein. Auch vorgreifende Verdeutlichungen wie z. B. Ankündigungen, Abschlussaktivitäten wie Zusammenfassungen oder klammerstiftende Wiederaufnahmen von Formulierungen verdeutlichen die Struktur von Beiträgen und Gesprächssequenzen. Beginn einer Erzählung: der gipfel war jetzt noch bevor ich abgereist bin * da war ich in Quito noch ne↑ musste meine abrechnung machen […] 5:30 min später, Ende der Erzählung: ist doch wohl der gipfel ne * und so ist die 'stimmung irgendwie↓

Generell dienen viele Formen der Metakommunikation der Verständnissicherung, z. B. wenn verbal explizit der Bezugspunkt von Beiträgen benannt wird: nochmal zu dem was du vorhin gesagt hast

oder wenn Relationen zwischen Äußerungen metakommunikativ expliziert werden: um es noch einmal deutlicher/präziser/allgemeiner/ausführlicher zu sagen vorab/nebenbei gesagt

384 

 Reinhard Fiehler

Der Verständnissicherung dienen ferner alle Formen von Explizitheit und Redundanz (wie z. B. Paraphrasen oder Reformulierungen). Neben den Verfahren der Versprachlichung stehen die Verfahren der Bearbeitung von bereits geäußertem verbalem Material. Was einmal geäußert ist, kann nicht zurückgenommen, sondern nur nachträglich bearbeitet werden. Bearbeitungen weisen eine eigenständige, im Regelfall dreigliedrige syntaktische Struktur auf: Sie bestehen aus einem Bezugsausdruck, einem Bearbeitungsindikator und einem Bearbeitungsausdruck. ich könnte ihn sachlich berichtigen aber ich bräuchte ihn nich/* ehm bräuchte keine persönlichen stellungnahmen abzugeben Bezugsausdruck Bearbeitungsindikator Bearbeitungsausdruck

Dass es sich um einen Bezugsausdruck und einen Bearbeitungsindikator handelt, kann erst ex post erschlossen werden, nachdem der Bearbeitungsausdruck geäußert worden ist. Sie werden dann entsprechend reinterpretiert. Bearbeitungen lassen sich in primär korrektive und primär weiterführende unterteilen. Bei den korrektiven Bearbeitungen wird ein Ausdruck oder eine Formulierung vom Sprecher selbst (Selbstkorrektur) oder vom Hörer (Fremdkorrektur) als falsch oder unpassend empfunden. Dies hat häufig den Abbruch der begonnenen Formulierung zur Folge, was in der Regel zu einer Pause führt. Nach der Äußerung eines Korrektur­ indikators wird dann ein Korrekturausdruck formuliert, der beim Hörer mental an die Stelle des Bezugsausdrucks treten soll. nun der mietpreis * äh * nicht nur unwesentlich sondern entscheidend geändert hätte↓ entscheidend geändert hätte↓ ** gell↑ ja * also wenn sie eben nur wegen des heizöls oder wegen dem heizöl da irgendwelche- äh * bedenken 'haben

Korrekturen lassen sich in Ausdrucks-, Formulierungs- und Inhaltskorrekturen unterscheiden. Werden z. B. Versprecher korrigiert, handelt es sich um Ausdruckskorrekturen. Zu den weiterführenden Bearbeitungen gehören Formulierungsverfahren wie Paraphrasen, Reformulierungen, Reduktionen und Expansionen. Bei den Paraphrasen sind Bezugsausdruck und Bearbeitungsausdruck weitgehend bedeutungsgleich. Im Grenzfall sind es wörtliche Wiederholungen (Repetitionen). Paraphrasen erfüllen kommunikativ sehr unterschiedliche Funktionen. Häufig dienen sie der Verständnissicherung oder Intensivierung.

Syntaktische Phänomene in der gesprochenen Sprache 

 385

das war sein vierter unfall in diesem jahr- * 'vier 'unfälle↓

Auch bei Reformulierungen besteht zwischen Bezugsausdruck und Bearbeitungsausdruck große Ähnlichkeit. Es gibt aber in lexikalischer und syntaktischer Hinsicht Abweichungen, die eine Aspektualisierung des Bezugsausdrucks bewirken. das ist aufgrund der bestimmungen des bürgerlichen gesetzbuches- * nicht statthaft nicht möglich bloß 'fragt sich das natürlich ob die frau sievers damit 'einverstanden ist ob sie das 'will nich↑

Bei Reduktionen ist der Bearbeitungsausdruck gegenüber dem Bezugsausdruck weniger umfangreich. Reduktionen leisten häufig eine Zusammenfassung oder bringen etwas auf den Begriff. im san remo gibt es das beste tiramisu weit und breit- * traumhaft↓

Bei Expansionen wird der Bezugsausdruck durch den Bearbeitungsausdruck quantitativ erweitert. Diese Erweiterung kann vielfältige Funktionen erfüllen, wie z. B. die der Spezifizierung, Verdeutlichung, Steigerung, Verallgemeinerung oder Exemplifizierung. wie groß isch denn die wohnung quadratmetermäßig etwa (Spezifizierung) er fühlte sich nicht wohl * im klartext er hatte wieder mal gesoffen (Verdeutlichung) er war ein held * mehr noch * ein vorbild für die ganze nation (Steigerung) un das hat se zu hause auch immer gemacht so rumgepuzzelt ne 'stofftiere gemacht un diese schönen 'puppen gemacht und für die 'kinder immer irgendwat genäht oder so (Exemplifizierung)

Ein weiteres Beispiel für spezifizierende Expansionen sind Kumulationen. Bei diesem Formulierungsverfahren wird zunächst ein Formulierungskern geäußert, der dann in einem zweiten Zug, der die gleiche Handlungsfunktion erfüllt, ausgeführt wird: nein * das mach ich nicht bitte * greif doch zu

Kumulationen bestehen mindestens aus zwei Einheiten, die beide auch alleine hinreichend sind zur Erfüllung der betreffenden Handlungsfunktion (Ablehnung bzw. Erlaubnis). Sie wird jedoch mit der zweiten Einheit expliziter formuliert, womit zugleich eine Intensivierung erreicht wird.

386 

 Reinhard Fiehler

3.3 Besondere syntaktische Strukturen und Konstruktionen Im Zuge des wiedererwachenden Interesses an der Grammatik gesprochener Sprache wurden vor allem im Rahmen der interaktionalen Linguistik in den letzten zwanzig Jahren durch intensive Analyse von Daten zahlreiche für die gesprochene Sprache spezifische syntaktische Strukturen und Konstruktionen entdeckt und beschrieben. Diese Sammelphase hält durchaus noch an. Da hier nicht der Platz ist, diese Strukturen im Detail vorzustellen, verweise ich auf ihre Darstellung in der Duden-Grammatik (vgl. Fiehler 2009, 1198–1213). Ich werde sie hier nur mit einer kurzen Erläuterung, einem Beispiel, der Angabe, um welche Form von Spezifik es sich handelt, und einer Literaturangabe vorstellen. Im Anschluss gehe ich auf einige weitere syntaktische Strukturen ein, die dort noch nicht erfasst sind. – Referenz-Aussage-Strukturen (AUS): un * die lehrer die 'saßen da alle auch * um so größere 'tische herum

Referenz-Aussage-Strukturen bestehen aus einem referierenden Element (die lehrer) und einer Einheit, mit der dann eine Aussage über das Referenzobjekt gemacht wird. Der Aussageteil enthält dabei ein Element (hier: die), mit dem auf den Referenzausdruck zurückverwiesen wird (vgl. Selting 1993). – Apokoinukonstruktionen (AUS): des is was furchtbares is des

Apokoinukonstruktionen (vgl. Scheutz 1992) bestehen aus drei unmittelbar aufeinander folgenden Teilen, wobei sowohl A-B wie auch B-C, nicht aber A-B-C eine nach schriftsprachlichen Standards syntaktisch wohlgeformte Kette bilden. Das den Konstruktionen gemeinsame Element heißt Koinon (was furchtbares). Betrachtet man die Apokoinukonstruktionen in ihrer zeitlichen Hervorbringung, lassen sie sich als Anknüpfungs- bzw. – wie in diesem Beispiel – als Rahmungskonstruktionen reinterpretieren. – Operator-Skopus-Strukturen (QD): kurz und gut- wir können uns das * 'abenteuer nicht leisten

Operator-Skopus-Strukturen sind zweigliedrige sprachliche Einheiten, deren einer Bestandteil, der Operator, aus einem kurzen, im prototypischen Fall nicht satzwertigen sprachlichen Ausdruck besteht (kurz und gut) und deren anderer Bestandteil, der Skopus, eine potenziell vollständige Äußerung darstellt. Der Operator gibt dabei – funktional betrachtet – dem Hörer eine Verstehensanleitung oder -anweisung, wie der Äußerungsteil in seinen Skopus aufzunehmen ist (vgl. Fiehler 2012).

Syntaktische Phänomene in der gesprochenen Sprache 

 387

– Abhängige Verbzweitkonstruktionen (QD): ich weiß du kannst das

Vor allem nach den Verben des Sagens und Denkens besteht sowohl im Mündlichen wie im Schriftlichen eine Konstruktionsalternative. Der folgende, syntaktisch abhängige Äußerungsteil kann mit Subjunktion und Verbletztstellung oder aber als Verbzweitkonstruktion ohne Subjunktion realisiert werden (du kannst das) (vgl. Auer 1998). – Ursprüngliche Subjunktionen (weil, obwohl, wobei, während) mit Verbzweitstellung (AUS): – modorenlärm den kann ich schon nicht mehr höre weil ich woar 'zwanzich joahr eisenbiejer und hob an der eisenbiejemaschin geschafft– >s=war ä bissl eng↓< * obwohl * im kaisersaal * war=s 'noch enger – und so hihi schlagermusik und=so↓ ** wobei s- so so manche schlager * die find ich zum teil gar nich so übel – weil des grundstück hundertprozentig der stadt gehören würde da würd s gar keine schwierigkeiten geben während hier müssen die grundstücke weiß net wieviel grundstückseigentümer s sind erst eben erworben werden

Eine Reihe von Subjunktionen, die schriftsprachlich nur nebensatzeinleitend und entsprechend mit Verbletztstellung verwendet werden können, wird in der gesprochenen Sprache zunehmend auch mit Verbzweitstellung verwendet (vgl. zu weil als eine der ersten Arbeiten Keller (1993), zu obwohl Günthner (1999), zu wobei Günthner (2001)). – Verberststellung (FD): gibt halt überall solche und solche

Im gesprochenen Deutsch ist die Spitzenstellung des Verbs (gibt) unter bestimmten Bedingungen auch in der einfachen Aussage möglich. Es weicht damit von der für das Schriftliche weitgehend verbindlichen Verbzweitstellung ab (vgl. Auer 1993). – Subjektlose Partizipialkonstruktionen (QD): ich also papiere zusammengeschmissen koffer geschnappt losgestürzt zum taxistand rein und abgedüst zum flughafen

Bei der Darstellung von Ereignisabfolgen werden in Erzählungen häufig subjektlose Partizipialkonstruktionen verwendet, die kettenartig gereiht werden können. Sie sind jeweils eigenständige funktionale Einheiten (vgl. Redder 2006). – Kopplungskonstruktionen (AUS): 'ich * 'nix wie weg

388 

 Reinhard Fiehler

Eine weitere reguläre syntaktische Konstruktion in Erzählungen sind funktionale Einheiten, bei denen eine Referenz und eine Tätigkeit bzw. Eigenschaft des Referenten ohne Finitum miteinander gekoppelt werden (vgl. Günthner 2006). – Aussagekerne (AUS): es ging auf 'einmal aus 'heiterem himmel los↓ 'keine luft mehr gekriegt 'super herzrasen und und 'kopfschmerzen die 'ohren gingen zu 'schwindelig und alles

Aussagekerne sind funktionale Einheiten, die aus einer Nominal- oder Adjektivphrase bestehen. Sie sind Resultat einer Kondensierungsstrategie, die in szenischen Schilderungen eingesetzt wird, um pointiert und plakativ Ereignisse oder Sachverhalte einzuführen (vgl. Günthner 2006). – Expansionen (QD): wie 'weit ist das entfernt * von port 'dixon

Äußerungen können, nachdem ein erster möglicher Abschluss- bzw. Übergabepunkt erreicht ist und wenn kein anderer Gesprächsbeteiligter an dieser Stelle das Rederecht übernimmt, vom ursprünglichen Sprecher in verschiedener Form fortgeführt werden. Dabei wird eine abgeschlossene syntaktische Struktur durch Hinzufügen von neuem verbalem Material (von port dixon) zu einer größeren Struktur ausgebaut, die ihrerseits syntaktisch abgeschlossen ist und damit einen neuen, späteren potenziellen Übergabepunkt markiert (vgl. Auer 2006). – Dativ-Possessiv-Konstruktionen (AUS): dem otto seine operation hat nichts geholfen

Die Dativ-Possessiv-Konstruktion besteht aus einer Konstituente im Dativ, die den Besitzer bezeichnet (dem otto), und einem Possessivpronomen (seine), das einem Substantiv vorangeht. Dieses Substantiv (operation) bezeichnet das Besessene (vgl. Zifonun 2003). Neben den aufgeführten syntaktischen Formaten sind in der letzten Zeit einige weitere Strukturen untersucht worden, darunter die Projektorkonstruktionen (Günthner 2008), zu denen u. a. die Pseudocleftstrukturen gehören. Pseudoclefts sind „komplexe, bi-klausale Satzmuster, die sich aus einem abhängigen W-Teilsatz (Teil A) und einem Matrixsatz mit der Kopula sein sowie einer im Mittelfeld des Matrixsatzes positionierten NP bzw. einem Komplementsatz (Teil B) zusammensetzen“ (Günthner 2008, 91): also was ich 'wichtig finde↑, is * da- dass 'ihr euch vertraut↓. Für die gesprochene Sprache stellt Günthner fest, dass nur wenige Fälle diese kanonische Form [W-Teilsatz + Kopula + NP/Komplementsatz] aufweisen. Häufiger wird dort eine Struktur verwendet, bei der im B-Teil ein eigenständiger, syntaktisch und prosodisch nicht-integrierter Hauptsatz oder ein längeres Diskurssegment steht [W-Teilsatz + Kopula + Hauptsatz bzw. längeres Segment]: was ich damit eigentlich sagen wollte ich glaube es könnte hier vieles besser laufen. In anderen Fällen ist keine Kopula realisiert

Syntaktische Phänomene in der gesprochenen Sprache 

 389

[W-Teilsatz + subordinierter Komplementsatz]: was ich nur schade finde dass heute so viele das gar nicht mehr kennen. Ohne Kopula kann statt einem subordinierten Komplementsatz auch ein Hauptsatz folgen [W-Teilsatz + Hauptsatz]: was immer entsetzlich is du kommst in ein restaurant und es riecht schon so übel (Beispiele vereinfacht nach Günthner). Pseudoclefts teilen mit den anderen Projektorkonstruktionen (die Sache/das Ding ist…-Konstruktionen und Extrapositionen mit es) die Eigenschaft, dass sie eine deutliche Zweigliedrigkeit aufweisen und dass ihr A-Teil projizierende Wirkung hat. Bei den Pseudoclefts und den Extrapositionen mit es beinhaltet der A-Teil häufig eine Bewertung. Eine weitere, in der gesprochenen Sprache häufige Struktur sind die ‚Adjektiv + dass-Satz‘-Konstruktionen: schön dass ihr zeit habt (vgl. Günthner 2009). Auch hier handelt es sich um eine deutlich zweigliedrige Struktur, bei der das Adjektiv im Regelfall bewertend ist (z. B. unglaublich, schade, gut, toll, irre, super, klar). Günthner stellt zum einen heraus, dass anstelle des isolierten Adjektivs auch Nomen oder Nominalphrasen (hammer, kein wunder, zum schreien, zum schießen) möglich sind und dass zum anderen der Adjektiv-Teil nicht nur isoliert, sondern auch verschieden umfangreich expandiert vorkommen kann. Neben dem selbstständigen Adjektiv sind Extrapositionen mit es möglich (es ist schön dass ihr zeit habt), ferner ‚ich finde es Adjektiv + dass-Satz‘-Konstruktionen (ich finde es schön dass ihr zeit habt) und exklamative ‚wie Adjektiv + dass-Satz‘-Konstruktionen (wie schön dass ihr zeit habt). Günthner betrachtet dies als ein Beispiel für ein Familiennetzwerk von Konstruktionen, zwischen denen fließende Übergänge bestehen. Strukturell vergleichbar mit der ‚Adjektiv + dass-Satz‘-Konstruktion ist die ‚Negation + dass/wenn-Satz‘-Konstruktion, die in der gesprochenen Sprache häufig vorkommt und die noch nicht genauer beschrieben ist: nicht dass mir das spaß machen würde und nicht wenn ich es vermeiden kann. Auch diese Konstruktion ist zweigliedrig, wobei die Negation nicht expandierbar ist. Die ‚nicht wenn‘-Konstruktion tritt im Regelfall responsiv auf. Es scheint mir sicher, dass in dem Maße, wie es gelingt, die Schriftfixierung zu relativieren oder zu lösen, noch eine Reihe weiterer syntaktischer Strukturen erfasst werden können, die in einer der drei genannten Formen (Ausschließlichkeit, quantitative Differenz, funktionale Differenz) für die gesprochene Sprache spezifisch sind.

3.4 Syntax ‚elliptischer‘ Gesprächsbeiträge In der gesprochenen Sprache ist eine Vielzahl von Äußerungen zu beobachten, die als vollständige kommunikative Handlungen empfunden werden, die aber in der Form nicht dem prototypischen schriftsprachlichen Satz mit Referenz und Prädikation entsprechen. Es ist vielfach versucht worden, diese Äußerungen dennoch als vollständige Sätze zu betrachten, von denen aus verschiedenen Gründen und aufgrund

390 

 Reinhard Fiehler

bestimmter Kontextbedingungen bestimmte Elemente lediglich nicht explizit versprachlicht werden. Aus dieser Sichtweise handelt es sich bei den nicht satzförmigen Äußerungen um Ellipsen. Setzt man jedoch das Satzkonzept nicht voraus, so lassen sich diese Äußerungen auf andere Weise verstehen und weiter differenzieren. Zum einen können bestimmte sprachliche Handlungen kommunikativ vollständig ausgeführt werden, ohne dass die verwendeten sprachlichen Mittel der Satzform unterliegen. Hierzu gehören u. a. viele Aufforderungen (weg das buch, zur sache), Warnungen (achtung, feuer), Ausrufe (himmel, welch glück), Flüche (verdammt noch mal), Grüße (guten Morgen alle miteinander), aber auch reaktive sprachliche Handlungen wie Antworten (ja, nein, keine ahnung) oder Bewertungen (richtig, gut, klasse). Dieser Typus nicht satzförmiger Äußerungen enthält kein finites Verb. Komplexere verblose Äußerungen können eine propositionale Struktur mit Referenz und Prädikation besitzen: die ganze fahrt eine einzige katastrophe; so viele menschen hier; eine unangenehme geschichte das. Ein anderer Teil der nicht satzförmigen Äußerungen resultiert daraus, dass – bei gemeinsamer Situation – Elemente, die wahrgenommen werden oder zu erschließen sind, nicht versprachlicht werden. So kann ein Sprecher ohne explizite Referenz auf sich selbst äußern: komm gerade aus der Stadt. Verbalisiert wird nur das, was der Hörer nicht weiß und nicht erschließen kann. Das Gleiche gilt für Äußerungen, die im Rahmen eines gemeinsamen Tätigkeitszusammenhangs (hammer; davon nur ein halbes pfund) oder in einer zweckgebundenen Einrichtung vollzogen werden: Fahrkartenschalter: [ A: köln hin und zurück zweiter klasse mit bahncard [ B:                          fünfzehn dreißig Tennisplatz: fünfzehn dreißig Cafe: einen kleinen braunen

In beiden Fällen besteht geteiltes Wissen (über Struktur und Komponenten einer Handlung, über den gemeinsamen Handlungsplan bzw. über Zweck und Organisation der Einrichtung) und nur das, was relativ zu diesem Wissen nicht als gemeinsam bekannt vorausgesetzt werden kann, muss verbalisiert werden. Die gemeinsame Situation und das geteilte Wissen ermöglichen so einen ökonomischen Einsatz der sprachlichen Mittel, der auf den Möglichkeiten der wahrnehmungs-, wissens- und inferenzgestützten Kommunikation aufsetzt. Die Ökonomie kann durch den Einsatz von deiktischen Ausdrücken und Zeigegesten noch verstärkt werden (hier mit dem obersten kabel + Zeigegeste). Äußerungen dieser Art sind außerhalb der betreffenden Situation und ohne das geteilte Wissen nicht oder nur teilweise verständlich. Wird in den betreffenden Situationen mehr und ausformulierter kommuniziert, so ist dies

Syntaktische Phänomene in der gesprochenen Sprache 

 391

nicht den sachlichen Erfordernissen geschuldet, denen die Kommunikation dient, sondern anderen Zwecken, wie z. B. sozialer Höflichkeit. Eine weitere Gruppe der nicht satzförmigen Äußerungen beruht darauf, dass die mental noch präsente syntaktische Struktur der Vorgängeräußerung vom folgenden Sprecher genutzt wird. [ A: hast du die lampen schon angebracht [ B:                     nur im esszimmer die

Hierbei werden die Konstruktion bzw. lexikalische Elemente der vorausgehenden Äußerung übernommen und latent vorausgesetzt (Strukturlatenz, Konstruktionsübernahme). Nicht satzförmige Äußerungen finden sich besonders zahlreich in bestimmten mündlichen kommunikativen Praktiken wie z. B. dem Wetterbericht (nachmittags dichte bewölkung in regen übergehend) oder Sportreportagen (ball steil auf gomez).

4 Allgemeine Tendenzen der Syntax gesprochener Sprache In Hinblick auf die in Abschnitt 3.3 behandelten Strukturen und Konstruktionen lassen sich einige allgemeinere Merkmale feststellen. So weist eine Reihe dieser Strukturen eine deutliche Zweigliedrigkeit auf. Im Fall der Referenz-Aussage-Strukturen kommt sie dadurch zustande, dass Referenz und Aussage klarer voneinander getrennt sind, als es im ‚klassischen‘ Satz der Fall ist. Die kommunikativ zu leistenden Aufgaben werden separiert und sind damit für den Hörer leichter unterscheid- und nachvollziehbar. Im Fall der Operator-Skopus-Strukturen ergibt sich die Zweigliedrigkeit durch die unterschiedliche Leistung und den unterschiedlichen Status von Operator und Skopus als Verstehensanweisung und Bezugsäußerung. Insoweit die ursprünglichen Subjunktionen mit Verbzweitstellung den Operator-Skopus-Strukturen zuzurechnen sind, weisen auch sie diese Zweigliedrigkeit auf und sind damit deutlich anders strukturiert als die entsprechenden konjunktionalen Nebensätze mit Verbletztstellung. Weitere deutlich zweigliedrige Strukturen sind die Pseudoclefts und die ‚Adjektiv + dass-Satz‘-Konstruktionen. Bei diesen ergibt sich die Zweigliedrigkeit in vielen Fällen aus der Separierung von Bewertung und bewertetem Sachverhalt. Ein zweites Merkmal ist, dass in einer Reihe dieser Strukturen Hauptsätze zu finden sind oder möglich sind. Dies betrifft die Operator-Skopus-Strukturen, die abhängigen Verbzweitkonstruktionen, die ursprünglichen Subjunktionen mit Verbzweitstellung sowie die Pseudoclefts und die die Sache ist-Konstruktionen, bei denen im Teil B in der gesprochenen Sprache auch Hauptsätze möglich sind. Die Verwendung von Hauptsätzen in diesen Strukturen bedeutet, dass die Relation zwischen den

392 

 Reinhard Fiehler

Bestandteilen nicht durch formale Elemente wie Konjunktionen oder Verbletztstellung markiert wird. In dem Beispiel ich weiß du kannst das muss die Relation zwischen den Elementen, also die Relation von Matrixsatz und abhängigem Verbzweitsatz, erschlossen werden, während diese Abhängigkeit im Fall von ich weiß dass du das kannst formal markiert ist. Eine dritte Beobachtung ist, dass bei den für die gesprochene Sprache spezifischen Strukturen das Konstruktionsprinzip von Operator und Skopus eine größere Rolle zu spielen scheint. Dies betrifft die Operator-Skopus-Strukturen und die ursprünglichen Subjunktionen mit Verbzweitstellung. Dieses Konstruktionsprinzip scheint in Hinblick auf die Produktion und Verarbeitung von Äußerungen Vorteile zu bieten. Fokussiert man lediglich den projizierenden Aspekt von Operatoren, werden sie vergleichbar mit anderen projizierenden Einheiten, wie sie sich bei den Projektorkonstruktionen und den ‚Adjektiv + dass-Satz‘-Konstruktionen finden. Das Mittel der Projektion ist funktional im Rahmen der Äußerungsproduktion und der Rederechtssicherung. Ein letzter Punkt ist die Beobachtung, dass es in der gesprochenen Sprache Konstruktionen gibt, die nicht generell verbreitet, sondern für einzelne Gesprächsformen spezifisch sind. So scheinen die subjektlosen Partizipialkonstruktionen, die Kopplungskonstruktionen und die Aussagekerne ihre Domäne fast ausschließlich in Erzählungen zu haben. Transkriptionskonventionen [ Partiturklammer, die zusammengehörende Sprecherzeilen markiert A: Sprecherkennung [A: ja |aber | simultane (Teile von) Äußerungen stehen übereinander; Beginn [B: |nein nie |mals und Ende sind in den jeweiligen Textzeilen markiert + unmittelbarer Anschluss/Anklebung bei Sprecherwechsel * kurze Pause (bis max. 0,5 Sekunden) ** etwas längere Pause (bis max. 1 Sekunde) *3,5* längere Pause mit Angabe der Dauer in Sekunden = Verschleifung (Elision) eines oder mehrerer Laute zwischen Wörtern (z. B. sa=mer für sagen wir) / Wortabbruch ↑ steigende Intonation (z. B. kommst du mit↑) ↓ fallende Intonation (z. B. jetzt stimmt es↓) - schwebende Intonation (z. B. ich sehe hier-) ' auffällige Betonung (z. B. aber 'gern) : auffällige Dehnung (z. B. ich war so: fertig) ←immer ich→ langsamer (relativ zum Kontext) →immerhin← schneller (relativ zum Kontext) >vielleicht< leiser (relativ zum Kontext) lauter (relativ zum Kontext)

Syntaktische Phänomene in der gesprochenen Sprache 

 393

5 Literatur Auer, Peter (1993): Zur Verbspitzenstellung im gesprochenen Deutsch. In: Deutsche Sprache 21, 193–222. Auer, Peter (1998): Zwischen Parataxe und Hypotaxe: ‚abhängige Hauptsätze‘ im Gesprochenen und Geschriebenen Deutsch. In: Zeitschrift für Germanistische Linguistik 26, 284–307. Auer, Peter (2000): On line-Syntax – oder: was es bedeuten könnte, die Zeitlichkeit der mündlichen Sprache ernst zu nehmen. In: Sprache und Literatur 85, 43–56. Auer, Peter (2006): Increments and more. Anmerkungen zur augenblicklichen Diskussion über die Erweiterbarkeit von Turnkonstruktionseinheiten. In: Deppermann/Fiehler/Spranz-Fogasy, 279–294. Auer, Peter (2007): Syntax als Prozess. In: Heiko Hausendorf (Hg.): Gespräch als Prozess. Tübingen, 95–124. Betten, Anne (1977): Erforschung gesprochener deutscher Standardsprache. Teil 1. In: Deutsche Sprache 5, 335–361. Betten, Anne (1978): Erforschung gesprochener deutscher Standardsprache. Teil 2. In: Deutsche Sprache 6, 21–44. Croft, William (2001): Radical Construction Grammar. Oxford. Deppermann, Arnulf (2006): Construction Grammar – Eine Grammatik für die Interaktion? In: Deppermann/Fiehler/Spranz-Fogasy, 43–66. Deppermann, Arnulf (2011): Konstruktionsgrammatik und Interaktionale Linguistik: Affinitäten, Komplementaritäten und Diskrepanzen. In: Alexander Lasch/Alexander Ziem (Hg.): Konstruktionsgrammatik III. Aktuelle Fragen und Lösungsansätze. Tübingen, 205–238. Deppermann, Arnulf/Reinhard Fiehler/Thomas Spranz-Fogasy (Hg.) (2006): Grammatik und Interaktion. Untersuchungen zum Zusammenhang von grammatischen Strukturen und Gesprächsprozessen. Radolfzell. Engel, Ulrich (1974): Syntaktische Besonderheiten der deutschen Alltagssprache. In: Gesprochene Sprache. Jahrbuch 1972. Düsseldorf, 199–228. Fiehler, Reinhard (2006): Was gehört in eine Grammatik gesprochener Sprache? Erfahrungen beim Schreiben eines Kapitels der neuen DUDEN-Grammatik. In: Deppermann/Fiehler/ Spranz-Fogasy, 21–41. Fiehler, Reinhard (2009): Gesprochene Sprache. In: Duden. Die Grammatik. 8., überarbeitete Auflage. Herausgegeben vom Wissenschaftlichen Rat der Dudenredaktion. Mannheim/Wien/ Zürich, 1165–1244. Fiehler, Reinhard (2012): Wo fängt der Satz an? Operator-Skopus-Strukturen in gesprochener und geschriebener Sprache. In: Colette Cortès (Hg.): Satzeröffnung. Formen, Funktionen, Strategien. Tübingen, 31–44. Fiehler, Reinhard/Birgit Barden/Mechthild Elstermann/Barbara Kraft (2004): Eigenschaften gesprochener Sprache. Tübingen. Fiehler, Reinhard/Peter Wagener/Peter Schröder (2007): Analyse und Dokumentation gesprochener Sprache am IDS. In: Heidrun Kämper/Ludwig M. Eichinger (Hg.): Sprach-Perspektiven. Germanistische Linguistik und das Institut für Deutsche Sprache. Tübingen, 331–365. Fricke, Ellen (2012): Grammatik multimodal. Berlin/Boston. Gülich, Elisabeth/Thomas Kotschi (1996): Textherstellungsverfahren in mündlicher Kommunikation. Ein Beitrag am Beispiel des Französischen. In: Wolfgang Motsch (Hg.): Ebenen der Textstruktur. Tübingen, 37–80. Günthner, Susanne (1999): Entwickelt sich der Konzessivkonnektor obwohl zum Diskursmarker? Grammatikalisierungstendenzen im gesprochenen Deutsch. In: Linguistische Berichte 180, 409–446.

394 

 Reinhard Fiehler

Günthner, Susanne (2001): wobei (.) es hat alles immer zwei seiten. Zur Verwendung von wobei im gesprochenen Deutsch. In: Deutsche Sprache 29, 313–341. Günthner, Susanne (2006): Grammatische Analyse der kommunikativen Praxis – ‚Dichte Konstruktionen‘ in der Interaktion. In: Deppermann/Fiehler/Spranz-Fogasy, 95–121. Günthner, Susanne (2008): Projektorkonstruktionen im Gespräch: Pseudoclefts, die Sache ist-Konstruktionen und Extrapositionen mit es. In: Gesprächsforschung – Online-Zeitschrift zur verbalen Interaktion 9, 86–114. Günthner, Susanne (2009): „Adjektiv + dass-Satz“-Konstruktionen als kommunikative Ressourcen der Positionierung. In: Susanne Günthner/Jörg Bücker (Hg.): Grammatik im Gespräch. Berlin/ New York, 149–184. Günthner, Susanne (2011): Aspekte einer Theorie der gesprochenen Sprache – Plädoyer für eine praxisorientierte Grammatikbetrachtung. In: Jan Claas Freienstein/Jörg Hagemann/Sven Staffeldt (Hg.): Äußern und Bedeuten. Festschrift für Eckard Rolf. Tübingen, 231–250. Günthner, Susanne (2012): Eine interaktionale Perspektive auf Wortarten: Das Beispiel und zwar. In: Björn Rothstein (Hg.): Nicht-flektierende Wortarten. Berlin/Boston, 14–47. Günthner, Susanne/Wolfgang Imo (2006): Konstruktionen in der Interaktion. In: Susanne Günthner/ Wolfgang Imo (Hg.): Konstruktionen in der Interaktion. Berlin, 1–22. Haspelmath, Martin (2002): Grammatikalisierung: von der Performanz zur Kompetenz ohne angeborene Grammatik. In: Sybille Krämer/Ekkehard König (Hg.): Gibt es eine Sprache hinter dem Sprechen? Frankfurt a. M., 262–286. Hoffmann, Ludger (1997): Zur Grammatik von Text und Diskurs. In: Gisela Zifonun u. a.: Grammatik der deutschen Sprache. Band 1. Berlin/New York, 98–591. Hopper, Paul (1998): Emergent grammar. In: Michael Tomasello (Hg.): The New Psychology of Language: Cognitive and Functional Approaches to Language Structure. Mahwah, 155–175. Imo, Wolfgang (2007): Der Zwang zur Kategorienbildung: Probleme der Anwendung der Construction grammar bei der Analyse gesprochener Sprache. In: Gesprächsforschung – Online-Zeitschrift zur verbalen Interaktion 8, 22–45. Imo, Wolfgang (2011): Die Grenzen von Konstruktionen: Versuch einer granularen Neubestimmung des Konstruktionsbegriffs der Construction Grammar. In: Stefan Engelberg/Anke Holler/Kristel Proost (Hg.): Sprachliches Wissen zwischen Lexikon und Grammatik. Berlin/Boston, 113–145. Keller, Rudi (1993): Das epstemische weil. Bedeutungswandel einer Konjunktion. In: Hans Jürgen Heringer/Georg Stötzel (Hg.): Sprachgeschichte und Sprachkritik. Festschrift für Peter von Polenz zum 65. Geburtstag. Berlin/New York, 219–247. Linell, Per (1982): The Written Language Bias in Linguistics. Linköping. Motsch, Wolfgang (1992): Ist die Sprechakttheorie eine Theorie der gesprochenen Sprache? In: Manfred Kohrt/Arne Wrobel (Hg.): Schreibprozesse – Schreibprodukte. Festschrift für Gisbert Keseling. Hildesheim/Zürich/New York, 243–253. Redder, Angelika (2006): Nicht-sententiale Äußerungsformen zur Realisierung konstellativen Schilderns. In: Deppermann/Fiehler/Spranz-Fogasy, 123–146. Sandig, Barbara (1973): Zur historischen Kontinuität normativ diskriminierter syntaktischer Muster in spontaner Sprechsprache. In: Deutsche Sprache 1, 37–57. Scheutz, Hannes (1992): Apokoinukonstruktionen. Gegenwartssprachliche Erscheinungsformen und Aspekte ihrer historischen Entwicklung. In: Andreas Weiß (Hg.): Dialekte im Wandel. Göppingen, 243–264. Schlobinski, Peter (Hg.) (1997): Syntax des gesprochenen Deutsch. Opladen. Selting, Margret (1993): Voranstellungen vor den Satz. Zur grammatischen Form und interaktiven Funktion von Linksversetzung und Freiem Thema im Deutschen. In: Zeitschrift für germanistische Linguistik 21, 291–319. Stukenbrock, Anja (2014): Deixis in der face-to-face-Interaktion. Berlin/Boston.

Syntaktische Phänomene in der gesprochenen Sprache 

 395

Zifonun, Gisela (2003): Dem Vater Sein Hut. Der Charme des Substandards und wie wir ihm gerecht werden. In: Deutsche Sprache 31, 97–126. Zima, Elisabeth (2014): Gibt es multimodale Konstruktionen? Eine Studie zu [V(motion) in circles] und [all the way from X PREP Y]. In: Gesprächsforschung – Online-Zeitschrift zur verbalen Interaktion 15, 1–48.

Gisela Fehrmann

17. Einheitenbildung in der Deutschen Gebärdensprache Abstract: Die mit diesem Band aus ganz verschiedenen Perspektiven beleuchtete Idee, sprachliche Konstruktionen als schematisierte Einheiten zu fassen, die sich semiologisch aus dem gebrauchsbasierten Zusammenspiel syntagmatischer und paradigmatischer Relationen ergeben, ist nicht nur für die theoretische Modellierung unterschiedlicher Erscheinungsformen kommunikativ-funktionaler Lautspracheinheiten von zentraler Bedeutung. Vielmehr verspricht diese Perspektivierung gerade im Kontext gebärdensprachlicher Untersuchungen wertvolle Impulse für bislang offene Problemstellungen zu liefern, da sich Konstruktionen im visuell-gestischen Modus von Gebärdensprachen (GS) oftmals nicht als Effekt linearer, sondern simultaner Zeichenproduktion einstellen. Manuell produzierte Gebärden profitieren in Äußerungen von einer räumlichen Verortung zur Indizierung arbiträr-syntaktischer und diagrammatisch-lokaler Informationen. Zeichentheoretisch ähneln solche Simultankonstruktionen den sogenannten Shiftern (vgl. Jakobson 1971), die symbolische Informationen und indexikalische Leerstellen, die es im situativen Kontext zu allererst zu sättigen gilt, in einer Figur verbinden (vgl. Fehrmann 2010a, 2010b). 1 Einleitung 2 Semiologische Strukturprinzipien 3 Schema, Muster und Konstruktion 4 Spracherwerb und Konstruktion 5 Modalitätsspezifische Konstruktionen in der Deutschen Gebärdensprache 6 Diskussion 7 Ausblick 8 Literatur

1 Einleitung Inzwischen liegen zahlreiche internationale Forschungsarbeiten zu diversen Gebärdensprachen vor, die den Nachweis führen, dass sie natürliche Zeichensysteme mit einer auf allen sprachlichen Ebenen differenzierten Struktur sind (vgl. Emmorey 2002; Johnston/Schembri 2007). Studien zum gesunden und nach zerebraler Schädigung gestörten Laut- und Gebärdensprachgebrauch liefern Evidenzen für die Annahme, dass Laut- und Gebärdensprachen in den gleichen bzw. eng benachbarten Arealen des Gehirns verarbeitet werden (vgl. Hickok/Bellugi/Klima 1998; Poizner/Klima/ Bellugi 1990; Huber/Klann 2005; Hickok u. a. 2009). Als identitätsstiftendes Kom-

Einheitenbildung in der Deutschen Gebärdensprache 

 397

munikationsmedium gehörloser oder gemischter (gehörloser und hörender) Sprachgemeinschaften werden Gebärdensprachen meist in ungesteuerten Lernprozessen erworben; allerdings findet der Spracherwerb der Deutschen Gebärdensprache (DGS) häufig erst mit Eintritt in den Kindergarten statt, weil die meisten gehörlos Geborenen mit hörenden Eltern in einem nicht DGS-kompetenten Umfeld aufwachsen. Da sich neben den in Forschungskontexten verwendeten diversen Notationssystemen für Gebärdensprachen bis heute keine alltagstaugliche Gebrauchsschrift entwickelt hat, darf DGS als strukturell mündliche, nicht standardisierte Sprachform mit zahlreichen dialektalen Varianten begriffen werden. Ähnlichkeiten zwischen Gebärdensprachen sind nicht durch Ähnlichkeiten zwischen Lautsprachen, sondern historisch motiviert. Nimmt man die von Lautsprachen grundsätzlich verschiedene Modalität von Gebärdensprachen in den Blick, wird deutlich, wie sehr die sprachliche Zeichenprozessierung von modalen Faktoren geprägt ist (vgl. Crasborn 2001; Meier/Cormier/ Quinto-Pozos 2002; Perniss/Pfau/Steinbach 2007): Gebärdensprachliche Äußerungen werden in einem umrissenen Artikulationsraum produziert, der sich dreidimensional um den vorderen Oberkörper und Kopf des Gebärdenden aufspannt. Jedes einzelne, hier manuell artikulierte Gebärdenzeichen lässt sich als eine spezifische Kombination mehrerer sublexikalischer Parameter analysieren, die notwendig eine spezifische Handform, ihre Orientierung in Relation zum Körper des Gebärdenden, eine bestimmte Ausführungsstelle am oder vor dem Körper sowie eine bestimmte Bewegung der Hand oder Finger (Secondary Movement) umfassen und teils von Mundgestik oder Mundbild begleitet sind (vgl. Stokoe 1960; Sandler 1989). Die diversen Formen der zweihändig artikulierten Zeichen folgen dieser sublexikalischen Architektur und sind artikulatorisch, aber nicht zwingend aus struktureller Perspektive komplex. Auf grammatischer Ebene folgt die Deutsche Gebärdensprache einer relativ freien Wort­ ordnung, die in der unmarkierten Form von der Subjekt-Objekt-Verbstellung (SOV) regiert wird; Variationen der Gesichtsmimik zeigen Satzarten und Topikalisierungen an. Wenngleich der Anteil ikonischer Zeichen in allen beobachteten Gebärdensprachen recht hoch ist, wirken diese medialen Zeichenaspekte nicht limitierend auf das Lexikon und die Zeichenverarbeitung ein (vgl. Taub 2001; Grote/Linz 2003). Medialitätsspezifische, komplexe Konstruktionen, die sich den diversen Schematisierungsverfahren des Raumes verdanken, haben in der Deutschen Gebärdensprache (wie in vielen anderen Gebärdensprachen) grammatische bzw. pragmatische Funktion. Im vorliegenden Beitrag soll primär der Frage nachgegangen werden, welche Konstruktionsformen sich in der DGS identifizieren lassen und inwiefern sie sich als Effekt medialitätsspezifischer Realisierungen eines allgemeinen Schematisierungsverfahrens fassen lassen. Auf einer allgemeineren Ebene verbindet sich hiermit aber auch die Frage nach dem Verfahren der Schematisierung sprachlichen Wissens: Wie lässt sich der Prozess der Schemabildung denken und inwieweit bindet er medialitätsspezifische Aspekte und produktive bzw. rezeptive Prozesse der Zeichenverarbeitung in die Generierung sprachlicher Konstruktionen ein? Die Erörterung dieser Problemstellung verspricht Einsichten in die Frage, inwiefern sich Verfahren der

398 

 Gisela Fehrmann

Segmentierung, Identifizierung, Exemplifikation und Kategorisierung zur Analyse lautsprachlicher und gebärdensprachlicher Äußerungseinheiten eignen. Denn sprachliche Äußerungen setzen sich ja gerade nicht nur aus einer linearen Kombination von Einzelzeichen zusammen. Sie nutzen immer auch simultane Verfahren der sprachlichen, stimmlichen, graphischen und gestischen Zeichenproduktion, die eher selten in den Fokus des allgemeinen linguistischen Interesses rücken. Nimmt man Simultankon­struktionen aus semiologischer Sicht in den Blick, legt ihre Analyse zugleich eine Erklärungslücke systemlinguistischer Modellbildung frei, die mit der Reflexion unispatial gedachter, syntagmatischer und paradigmatischer Relationen nicht geschlossen werden kann. In Erweiterung dieses Zweiachsenmodells wird deshalb die Konzeptualisierung einer ‚peridigmatischen‘ Relation vorgeschlagen, um den Erklärungshorizont für die theoretische Verortung simultan produzierter Schemata zu öffnen, die als obligatorisch oder fakultativ miteinander verbundene Zeichen gerade nicht an einer syntaktischen Position konkurrieren. Zur Entfaltung dieser Annahme werden im Folgenden ein Überblick über semiologische Strukturprinzipien gegeben und eine kurze Reflexion der Prozesslogik von Musterbildung und Schematisierung unternommen, bevor die Analyse gebärdensprachlicher Konstruktionen schließlich den Blick für eine kritische Ergebnisdiskussion öffnet.

2 Semiologische Strukturprinzipien Die an den Quellen orientierte Rekonstruktion authentischer Ideen Ferdinand de Saussures insbesondere nach Ludwig Jäger (vgl. Jäger o. J., 1976, 2010; Scheerer 1980) legt eine im Geiste hermeneutisch-idealistischer Tradition konturierte Sprachansicht frei, die insbesondere die epistemische Qualität systemisch konfigurierter Sprachzeichen betont und damit der Annahme von der zeichenunabhängigen Genese mentaler Konzept- oder Bedeutungsstrukturen entgegenwirkt. Anders als die von den Editoren Charles Bally und Albert Sechehaye mit dem Cours de linguistique générale präsentierte Sprachidee hebt die in den Quellen aufscheinende Sprachansicht Saussures auf die Modellierung einer dialektischen Beziehung von Ausdruck und Bedeutung bzw. Parole und Langue ab (vgl. Saussure 1989, 253 f., 2 IV § 1 al. 6, 1833 ff.; Jäger 1976, 232 ff. und 2010, 187 ff.): Erst im Prozess der semiologischen Zeichensynthesis eta­ blieren sich mit den im Signe synthetisch verbundenen Zeichendimensionen Signifiant und Signifié die einzelsprachlich organisierten Größen der gegliederten Lautgestalt (Aposème) und der konzeptuellen Bedeutung (Parasème) (vgl. Jäger 1986, 2010; Fehr 1997). Wenngleich Saussure die Differenz zwischen phonischer Tatsache und phonematischer Identifikation von Lautgestalten noch nicht kannte, lässt sich die Figur des Aposème theorieimmanent eher als identifizierte, einzelsprachlich jedoch noch nicht kategorisierte und in dieser Hinsicht phonische Zeichenqualität begreifen. Auf mentaler Ebene entspricht ihr das Image Acoustique als perzeptuo-motori-

Einheitenbildung in der Deutschen Gebärdensprache 

 399

sches Kon­strukt (vgl. Saussure 1989, 157, IIIC 284, 1166 ff.; Jäger o. J., 2010). Hierdurch erfahren die im sozio-individuellen Äußerungsgeschehen stetig neu ‚verhandelten‘ Zeichendimensionen bei Saussure auch auf Ebene der Signifikanten ihren mentalen Reflex und begleiten (bewusste) Vorstellungsbilder (vgl. Fehrmann 2004a). Denn die material artikulierten Zeichen der Parole werden auf kognitiver Ebene als schematisierte Erfahrungsspuren verarbeitet (Image Acoustique), die ihrerseits zwei wiederum prinzipiell verschiedene Dimensionen des perzeptuo-motorischen Zeichenverarbeitungsprozesses synthetisch miteinander verbinden (vgl. Jäger o. J.). Dabei ist das mentale Klangbild (Acoustème) Resultat eines Schematisierungsprozesses, der Wahrnehmungserfahrungen vielfältigster individueller Zeichenrezeptionen in ein schematisiertes Engramm überführt. Bezogen auf Gebärdensprachen wäre hier ein visuelles Analogon anzunehmen, das in Anlehnung an Saussure als Visème bezeichnet werden könnte (vgl. Fehrmann 2004a). Die zweite, einem Image Acoustique korrespondierende Figur, das sogenannte Mécanème, hingegen ist Ergebnis einer Schematisierung, die spezifische Artikulationserfahrungen der audio-motorischen bzw. visuo-motorischen Zeichenproduktion in ein allgemeines motorisches Bewegungsschema transformiert (vgl. Saussure 1989, 144, N 14b, 1063 und 129, N Phonologie 930 ff.). Allerdings erzeugen manuell produzierte Gebärden – wie im Übrigen auch Gesten – je nach Perspektive ganz unterschiedliche Gestalten. Fällt der Blick auf die eigene gebärdende Hand, wird die Gebärde im Vergleich zur ‚fremden‘ Hand spiegelbildlich, d. h. um 180° gedreht, wahrgenommen. Die Tatsache, dass Gebärdensprachzeichen aus der Adressanten- und Adressatenperspektive um 180° variieren, wirft die Frage auf, ob sich diese besondere, modalitätsspezifische Zeichenerfahrung auf mentaler Ebene ein weiteres Mal in einer doppelten Typisierung der immer schon synthetischen Signifikanten (Visème/Acoustème) niederschlägt und zwei unterschiedliche Rezeptionsmuster der Signifikantenstruktur (Visème1 & Visème2) provoziert. Bei positiver Beantwortung dieser Frage müsste die Schematisierung der Zeichenwahrnehmung aus der Fremdperspektive (Visème1) von der aus Eigenperspektive (Visème2) abweichen. Hinsichtlich des Anspruchs an ein integriertes Formschema wäre dann für Gebärdensprachen sogar von einer triadischen Substruktur auszugehen. Nicht zuletzt für die Modellierung des Sprachverarbeitungsprozesses ist die Konzeptualisierung der Zeichenstruktur von hoher Relevanz. Nach allgemeinem Forschungskonsens dienen auditive Feedbackschleifen in lautsprachlichen Äußerungen vor allem der Selbstkontrolle. Bezogen auf Gebärdensprachen ist zu konstatieren, dass die Frage nach dem Stellenwert der visuellen Eigenwahrnehmung im Gebärdensprachverarbeitungsprozess in der aktuellen Forschungsliteratur immer noch kontrovers diskutiert wird. Denn in gebärdensprachlichen Interaktionen ist der Sprecher primär auf die kommunikativen Handlungen des Anderen konzentriert, um beispielsweise das hoch differenzierte Signalsystem des Blickverhaltens verarbeiten zu können. Vor diesem Hintergrund könnten auch responsive Verhaltensweisen wie das Backchanneling des Anderen eine weitere, den Monitoringprozess ergänzende Feed-

400 

 Gisela Fehrmann

backschleife bilden, die im Fall von Gebärdensprachen essenzieller Natur wäre und in der lautsprachlichen Kommunikation eine zusätzliche, responsive Monitoringfunktion einnähme. Denn Lautsprachen dürfen de facto als Mixed Media (Mitchell 1995, 83 ff.; vgl. auch Fricke und Bressem in diesem Band) begriffen werden, insoweit die sprachliche Interaktion immer auch durch gestische Hinweise, Blickverhalten, Proxemik etc. reguliert wird (vgl. Fehrmann/Linz 2010). Sollte sich diese Annahme durch zukünftige Forschungen erhärten, stützt sie nicht nur auf ganz basaler Ebene die Idee von einem Zeichen als Konstruktion, sondern zudem die allgemeine Annahme von der sozialen Natur mentaler Repräsentationen. Allerdings könnte die Monitoringfunktion auch über zwei grundsätzlich zu differenzierende Verarbeitungsschleifen – die visuelle (bzw. die akustische in Lautsprachen) und die kinästhetische – bedient werden. Diese Hypothese geht auf die plausible Annahme zurück, dass dem kinästhetischen Rückkopplungssystem im Sprachverarbeitungsprozess prinzipiell ein wichtiger Stellenwert beizumessen ist und dass ihm im Fall von Gebärdensprachen eine ungleich wichtigere Funktion zukommt als bei der Verarbeitung von Lautsprachen. Signers may rely primarily on somatosensory feedback when monitoring language output, and if the perceptual loop theory is to be maintained, the comprehension system must be able to parse a somatosensory signal as well as an external perceptual signal for both sign and speech. (Emmorey/Bosworth/Kraljic 2009, 398)

Bislang sind diese Ergebnisse noch nicht in die linguistische Modellierung des Sprachverarbeitungsprozesses eingeflossen. In Ergänzung zu der Saussureschen Analyse des Image Acoustique als synthetische Verbindung von Acoustème und Mécanème möchte ich vorschlagen, dieses Monitoringinstrument begrifflich als ‚Cinéstème‘ zu fassen. Erst in Kombination mit dem motorischen Artikulationsengramm (Mécanème) und den ‚Sehbildern‘ (Visème, evtl. sogar Visème1 und Visème2) bzw. Klangbildern (Aposème) würde dieses ‚Cinéstème‘ ein Image Acoustique bzw. ‚Image Optique‘ definieren. Schon auf Ebene der Signifikanten zeigt sich so, was im Weiteren unter den Begriffen Schema, Muster und Exemplifikation zu diskutieren ist: Zeichen sind materiale Konstruktionen an der Schnittstelle von Langue und Parole und gleichermaßen auf Verfahren der Schematisierung wie der Erprobung verwiesen, wenn ein singuläres Zeichenereignis ‚dauerhafte‘ Spuren auf mentaler Ebene (Langue) hinterlassen soll. Dabei bleibt die mentale ‚Repräsentation‘ der Zeichenform (wie auch der Bedeutung) an ihre Aktualisierung im Vollzug (Parole) gebunden, sodass der Sprachgebrauch als Quelle potenzieller Veränderlichkeit in die Grundprinzipien der Zeichenverarbeitung eingeschrieben ist und er die Zeichenstruktur auf formaler (und inhaltlicher) Ebene als dynamisches Gebilde ausweist (vgl. Jäger 1980, 201 ff.). Diese von Saussure für die Zeichenform postulierte Verzahnung von Produktions- und Rezeptionsprozessen erfährt auch im Kontext neuroanatomischer Spiegelneuronenforschung unerwartete Brisanz (vgl. Fehrmann 2010a): Von einer breiten Öffentlichkeit wahrgenommen,

Einheitenbildung in der Deutschen Gebärdensprache 

 401

konnten Forscher der Universität Parma zeigen, dass motorische Neurone nicht nur feuern, wenn die Hand eines Affen in ‚intentionaler‘ Weise mit einem Objekt interagiert, sondern auch wenn er beobachtet, wie ein anderer diese Handlung ausführt. Auf einer ganz grundlegenden Ebene koppeln Spiegelneurone also einerseits Produktions- an Wahrnehmungsprozesse und vice versa und schreiben andererseits den Anderen in die (perzeptuo-)motorischen Handlungsmuster ein (vgl. Rizzolatti u. a. 1996). Auf mentaler Ebene kommt den ‚konzeptuellen‘ Zeichenbedeutungen aus strukturlogischer Sicht eine eher abstrakt bzw. negativ zu denkende dynamische Existenz zu, denn die (parasemische) Bedeutung eines Zeichens lässt sich nur im Kontext des Gesamtsystems fassen. Sie organisiert sich über zeichengeleitete Abgrenzungslogiken im Gesamtnetzwerk sprachlicher Zeichen und ist gut als Effekt diskursbasierter Gebrauchsmuster erklärbar. Die Frage, was ein bestimmtes Zeichen bedeutet, ist im Horizont semiologischer Überlegungen so schon falsch gestellt und müsste als Frage danach reformuliert werden, was die anderen Zeichen des Systems zu einem heuristisch bestimmten Zeitpunkt n gerade nicht bedeuten (vgl. Saussure 1989, 259, IIIC 392, 1864). In der Modellierung Saussures bilden Zeichen also nicht – wie u. a. noch im modernen Diskurs der Kognitiven Linguistik (vgl. Lakoff 1987, 1989; Jackendoff 1983, 1992) unterstellt – mentale Einheiten ab; sie generieren sie in gewisser Hinsicht erst. Gebrauchstheoretisch betrachtet üben sich die Bedeutungen von Zeichen über ihre materiale Prozessierung im diskursiven Gebrauch ein. Als Sammelbecken individuell geäußerter Zeichen und sozial verhandelter Deutungen avanciert die Parole zur Querschnittssumme synchronen Sprachgebrauchs, der einer individuellen Sprach­ organisation auf Langue-Ebene logisch insofern vorausliegt, als sich der individuelle Spracherwerb nur im Kontext eines bereits etablierten Sprachsystems vollziehen kann (zu dem sich hier andeutenden „Henne-Ei“-Problem vgl. Dürscheid/Schneider 2015, 173). Aber auch beim erwachsenen Sprecher sind mentale Repräsentationen dynamisch organisiert: Prinzipiell wirkt jede rezeptiv wahrgenommene oder produktiv getätigte Zeichenäußerung auf die mentale Organisation des gesamten Zeichensystems zurück; ein Zeichen ist nur zu einem heuristischen Zeitpunkt n mit sich selbst identisch (vgl. Saussure 1990, 6, N 1.1, 3283). Die fortwährende Rückkopplung der mentalen Zeichenorganisation an die diskursive Zeichenprozessierung zeichnet dafür verantwortlich, dass die im mentalen Depot verankerten Zeichen stetig aktualisiert bzw. reorganisiert und in diesem Sinne dynamisch ‚repräsentiert‘ werden. Zugleich erfahren Zeichen im performativen Vollzug eine Kontextualisierung, die auch die semantische Nähe bzw. Distanz von Zeichen als Ergebnis einer relationalen Kombinationslogik ausweist. Denn insofern sie im konkreten Äußerungsvollzug in größere lineare Zusammenhänge gebracht werden, treten Zeichen in typischeren oder eher selteneren Kombinationsgeflechten auf. So wird ein Zeichen über den Parameter der syntaktischen Kombination in eine besonders enge bzw. schwache Bezie-

402 

 Gisela Fehrmann

hung zu anderen Zeichen gesetzt, die sich auf parasemischer Ebene  – ähnlich der Valenzstruktur von Verben – auch als Wertstruktur (Valeur) fassen lässt. Der Wert bzw. die Bedeutung eines Zeichens verdankt sich so letztlich der diskursiven ‚Erprobung‘ in der Parole: „[T]out ce qui entre dans la langue a d’abord été essayé dans la parole un nombre de fois suffisant“ (Saussure 1989, 376, IR 2.23, 2522: „[A]ll das, was in die Langue tritt, ist zuvor einige Male in der Parole hinlänglich erprobt worden“, G. F.). Mit Saussure bedarf es also einer gewissen Anzahl von konkreten Anwendungen, damit es zur Musterbildung und d. h. zur Zeichengenese kommt. Dabei geht es dezidiert nicht um ‚Testung‘, sondern um Exemplifikation im Sinne Goodmans (vgl. Goodman 1998). Am Beispiel der Musterbildung durch Deklination verdeutlicht Saussure, dass die assoziativ verbundenen Elemente einer grammatischen Kategorie (eines Paradigmas) – désireux, soucieux, malheureux – in ihrem Verhältnis zueinander durch einen eher stabilen und einen eher variablen Aspekt verbunden sind (vgl. Saussure 1989, 289, G 2.26a, 2039). Während in diesem Beispiel das Suffix – als syntagmatischer Bezugspunkt – den eher stabilen Anteil der Konstruktion definiert, der um konkurrierende Stammmorpheme der vertikalen Ebene ergänzt werden muss, bestimmt im Beispiel enseignons, enseignement, enseigner das Stammmorphem als eher stabiles Element den Rahmen, durch den alternierende morphologische Varianten in paradigmatische Relation treten (vgl. ebd., 289, IIIC 383, 2035). Da jede in der sozialen Sphäre der Parole getätigte Entäußerung als ‚Bewährungsprobe‘ wiederum auf die systemische Ordnung der Formen, Konzepte und Regeln der Langue zurückwirkt, ist die (sozio-individuelle) Organisation des Sprachsystems dynamischer Natur. Vor diesem Hintergrund lässt sich die Kategorie der Exemplifikation deshalb schon mit Saussure als grundlegende Variable eines allgemeinen Sprachverfahrens freilegen (vgl. Schneider in diesem Band).

3 Schema, Muster und Konstruktion Christian Stetter hat die Frage nach dem Stellenwert der Exemplifikation im Prozess der Musterbildung als Frage nach ihrem Stellenwert für das Type-Token-Verhältnis reformuliert. Ähnlich wie dies im vorliegenden Beitrag unternommen wird, skizziert er die Logik eines dynamischen Systembegriffs, die jenseits der klassischen Unterscheidung von Kompetenz und Performanz ansetzt und sprachliches Wissen als Effekt gebrauchsbasierter Regelbildung ausweist (vgl. Stetter 2005). Denn die Regel (Type) baut sich als Effekt einer doppelten Dialektik auf: Einerseits gliedern die syntagmatisch-paradigmatischen Relationen in sehr grundlegender Weise die Strukturen sprachlicher Zeichensysteme. Andererseits sind mentale Organisationsformen sprachlicher Strukturen (Langue) dialektisch auf den Sprachgebrauch in der Parole bezogen. Durch die permanente ‚Erprobung‘ sprachlichen Wissens in der Parole sind mit jeder Aktualisierung eines ‚Musters‘ auch Veränderlichkeit und Überformung der

Einheitenbildung in der Deutschen Gebärdensprache 

 403

Anwendungsregel bzw. des ‚Schemas‘ als grundlegende Verfahren in die Architektur des Zeichensystems eingeschrieben. Und weil dieses „Überschreibverfahren“ (ebd., 273 ff.) die Organisation mentaler Strukturen zwingend bestimmt, kann die Langue nur als dynamischer Effekt des sozialen Sprachgebrauchs konzeptualisiert werden – eine Modellierung, die nicht nur die traditionelle Unterscheidung von Kompetenz und Performanz, sondern auch die Idee einer solipsistischen Wissensgenese radikal unterläuft. Gestützt wird diese Annahme durch neurowissenschaftliche Arbeiten zur korrelativ-temporalen Modellierung der neuronalen Wissensorganisation (vgl. Linz 2002; Fehrmann 2004a). Bevor im Weiteren Formen der ‚Konstruktion‘ in den Mittelpunkt der Auseinandersetzung rücken, soll der Blick auf Kants Überlegungen zum Verfahren des Schematismus gelenkt werden, um endlich den Begriff des Schemas schärfen zu können. Denn es ist Kant, der mit seiner Untersuchung heraushebt, dass der Begriff der Anschauung bedarf und umgekehrt die Anschauung unter den Begriff subsumierbar sein muss, damit sie die Grenzen des Konkreten überwindet. Gedanken ohne Inhalt sind leer, Anschauungen ohne Begriffe sind blind. Daher ist es eben so nothwendig, seine Begriffe sinnlich zu machen (d. i. ihnen den Gegenstand in der Anschauung beizufügen), als seine Anschauungen sich verständlich zu machen (d. i. sie unter Begriffe zu bringen). (Kant 1911 [1787], 75, Z 14 ff.)

Reine Vernunftbegriffe, denen „keine sinnliche Anschauung angemessen sein kann“ (Kant 1913 [1790], 351, § 59, Z 26 ff.) und die sich folglich nicht direkt, d. h. weder am Beispiel (empirische Begriffe) noch durch „Schemate“ (d. h. reine/apriorische Begriffe, ebd., 351, § 59, Z 15 ff.), darstellen lassen, sind auf „indirecte Darstellungen des Begriffs“ (ebd., 352, § 59, Z 260) verwiesen, die das Verfahren der Urteilskraft quasi als ‚Umwegstrategie‘ bereitstellt, um sie sinnlich erfahrbar zu machen. Diese ‚Umwegstrategie‘ ist  – so Kant  – „demjenigen, was sie im Schematisiren beobachtet, bloß analogisch“ (ebd., 351, § 59, Z 28 f.). Hier lässt sich die Versinnlichung der Idee nur indirekt „vermittelst einer Analogie, zu welcher man sich auch empirischer Anschauungen bedient“ (ebd., 352, § 59, Z 261) generieren. Dabei wird eine reine Vernunftidee mit einer Anschauung in Beziehung gesetzt und so über den Vergleich zweier Begriffe die Reflexion der Regeln möglich. Die Idee des absolutistischen („despotischen“) Staates, der „durch einen einzelnen absoluten Willen beherrscht wird“ (ebd., 352, § 59, Z 261), lässt sich – so Kant – mit einer Maschine wie der Handmühle vergleichen, sodass sich erst über die Reflexion des analogischen Vergleichsverfahrens die Regel selbst einstellt. Jäger (2009) arbeitet diese Logik äußerst differenziert heraus und macht die vernachlässigten Verfahren der symbolischen und ästhetischen Bezugnahme auch für Linguisten zugänglich. Dabei zeigt er mit Rekurs auf und in transkriptionstheoretischer Erweiterung der Arbeit von Jürgen Villers (1997), dass die Urteilskraft hier mit ‚metaphorischer‘ Bezugnahme operiert, denn obgleich zwischen beiden Gegenständen keine Ähnlichkeit besteht, liegt sie in der Reflexion der

404 

 Gisela Fehrmann

Regeln des Vergleichs (vgl. Jäger 2009, 16). Dazu wird die funktionelle Struktur der ‚Quelldomäne‘ (ein schematisierter Begriff) auf die der ‚Zieldomäne‘ (reine Idee) übertragen. „Denn zwischen einem despotischen Staate und einer Handmühle ist zwar keine Ähnlichkeit, wohl aber zwischen den Regeln, über beide und ihre Causalität zu reflektieren“ (Kant 1913 [1790], 352, § 59, Z 254 ff.). Hingegen lassen sich empirische Begriffe (aber auch apriori Kategorien) „demonstrativ“ versinnlichen (ebd., 352, § 59, Z 261), indem ihnen mittels der Verfahren der Einbildungskraft ihr Bild gegeben wird. Sie sind dazu auf eine Prozedur verwiesen, mit der sie zwar direkt, aber doch nur im Rückgriff auf eine „Regel zur Erzeugung einer Gestalt“ (Dürscheid/Schneider 2015, 184) anschaulich werden: Der Begriff vom Hund bedeutet eine Regel, nach welcher meine Einbildungskraft die Gestalt eines vierfüßigen Thieres allgemein verzeichnen kann, ohne auf irgendeine einzige besondere Gestalt, die mir die Erfahrung darbietet, oder auch ein jedes mögliche Bild, was ich in concreto darstellen kann, eingeschränkt zu sein. (Kant 1911 [1787], 136, Z 174 ff.)

Mit der Verzeichnung von empirischen Begriffen setzt das Verfahren des Schematismus so einen genuin dialektischen Prozess in Gang, der die Anschauung über die Regel (das Schema) kategorisiert. Umgekehrt können diese Regeln direkt – wenn auch nicht hinreichend  – am konkreten „Beispiel“ (Kant 1913 [1790], 351, § 59, Z 15 ff.)  – quasi referenziell  – demonstriert werden. Transzendentale Begriffe (Kategorien) erfahren ihren referentiellen Realitätsbezug in ähnlicher Weise, denn um die „Realität unserer Begriffe darzuthun, werden immer Anschauungen erfordert. […] Sind jene reine Verstandesbegriffe, so werden die letzteren Schemate genannt“ (ebd., 351, § 59, Z 15 ff.). Diese Verfahrenslogik kann mit Rekurs auf Nelson Goodman (1998) und Christian Stetter (2005) semiologisch ausgefaltet werden: Wie bereits herausgearbeitet wurde, bedarf es einer gewissen Menge an Exemplifikationen (Vorkommnisse), bevor sich aus der begrenzten Zeichenerfahrung ein gebrauchsbasiertes Muster ergibt, das einerseits durch seinen Status zwischen partikularer Erprobung und abstrakter Regel (Schema) ‚typisierend‘ wirkt, andererseits an die modifizierende Erprobung in der Interaktion gebunden bleibt und so die sozio-dynamische Qualität des Schemas sicherstellt. Denn erst durch die Ähnlichkeit in der Verschiedenheit sich wiederholender Erfahrungen bildet sich über die spezifischen Exemplifikationen ein – in der Sphäre des Konkreten situiertes – Muster aus, das zwischen spezifischer Erfahrung und abstrakter Regel anzusiedeln ist. Exemplifikationen werden also durch die Ähnlichkeit in der Verschiedenheit sich wiederholender Erfahrungen, d. h. über das Muster, ‚begriffen‘ und über die Verknüpfung mit dem Schema aus dem Konkreten gelöst. Vor diesem Hintergrund und im Anschluss an Dürscheid/Schneider (2015, 183–190) ist es plausibel, die Begriffe Schema, Exemplifikation und Muster nun auch in eine hierarchische Ordnung zu bringen. Frei nach Goodman ist dann das ‚Exempel‘ – ähnlich der ‚Probe‘ im Prozess der Musterbildung – als eine im Konkreten verhaftete, jeweils nur einen Ausschnitt selektierende Orientierungsfolie zu sehen, die im raum-zeitlichen

Einheitenbildung in der Deutschen Gebärdensprache 

 405

Kontext lokalisiert ist (vgl. Goodman 1998). Der Begriff ‚Muster‘ hebt hingegen eher auf die diskursgebundene Materialität von Zeichenprozessen zwischen Ähnlichkeit und Differenz, der Begriff ‚Schema‘ auf die abstrakte mentale Struktur als Effekt von Gebrauchsroutinen ab. In diesem Sinne plädiere ich dafür, Musterbildung als einen in der Parole verorteten und am Konkreten orientierten Prozess zu fassen und Schema (Langue) als das abstrakte Ergebnis eines musterbildenden Prozesses (Parole) zu begreifen. Bringt man nun die Ausführungen zur semiologisch konturierten Zeichengenese wieder in Erinnerung und verbindet diese mit der Einsicht in die prozessuale Natur von Musterbildung und Schematisierung, lässt sich für die von Schneider (in diesem Band) aufgeworfene Frage nach der Genese und den Realisationsformen von sprachlichen Konstruktionen konstatieren, dass streng genommen tatsächlich alle schematischen Zeichen(-handlungen) Konstruktionen sind (vgl. Goldberg 1995). Im Horizont semiologischer Grundannahmen wird deutlich, dass sich ein Konstruktionsmuster nicht additiv aus kompositionellen Strukturen ergibt, sondern nur als synthetische Struktur begriffen werden kann (vgl. Schneider in diesem Band). Dies gilt streng genommen auch für einfache Zeichen, wie Morpheme, die ja auch auf einem synthetisch verbundenen Form-Meaning Pairing basieren. Schon eingangs wurde dargelegt, dass auch auf Formebene eine zweifache Schematisierung greift, die der Typisierung einmal des rezeptionsseitig erfahrenen Klangbildes (Acoustème), dann der des produktionsseitig artikulierten Bewegungsbildes (Mécanème) geschuldet ist. Gleichwohl erreicht das synthetische Formschema erst mit der Kopplung an die schematisierte Bedeutung des synthetischen Zeichens eine Integrationsebene, die auf der Ebene der Parole mit dem Begriff ‚Konstruktion‘ angesprochen wird. Aus dieser Perspektive sind in der Tat alle Zeichenkonfigurationen Resultat von Schematisierungsprozessen und in diesem Sinne Konstruktionen, die sich lediglich hinsichtlich der syntagmatischen Komplexität von komplexen Konstruktionen unterscheiden (vgl. Goldberg 1995). Zugleich wird der Begriff der Konstruktion mit dieser Analyse eigentlich seiner terminologischen Schärfe und kreativen Kraft beraubt, die er ja gerade in der Abgrenzung zu generativistischen Modellierungen beansprucht. In Ermangelung einer Alternative wird der Begriff der Konstruktion im Folgenden genutzt, um auf etablierte Muster der ‚komplexen‘ Zeichenbildung zu verweisen, denen eine pragmatische, semantische oder (diskurs-)grammatische Funktion beigemessen werden kann. Unzweifelhaft darf angenommen werden, dass die mentale Repräsentation von (sprachlichem) Wissen, d. h. die Regel, an Musterbildungsprozesse gebunden ist, die sich über das Verfahren der Exemplifikation in der sozialen Interaktion ausbilden (vgl. Fehrmann 2004b; Dürscheid/Schneider 2015; Schneider in diesem Band).

406 

 Gisela Fehrmann

4 Spracherwerb und Konstruktion Besondere Überzeugungskraft gewinnt diese Annahme, wenn man den Blick auf die frühkindliche Erfahrungswelt lenkt, denn der Wissenserwerb spielt sich von Anbeginn im sozialen Kontext sprachlicher Interaktion ab. Kindliches Handeln wird korrigiert, gelobt, zuweilen bestraft, d. h. in den Kontext sprachlicher Deutungshorizonte gestellt. Dabei helfen sprachliche Kommentare dem Kind, sich selbst als Anlass sozialer Aktion zu begreifen und die von Sprache begleiteten Reaktionen seiner Mitwelt auf sein eigenes Handeln zurück zu beziehen. Kann es einmal das reaktive Verhalten eines Interaktanten an seine eigenen Handlungen rückbinden und erkennen, dass unterschiedliches Verhalten verschiedene Folgehandlungen beim Gegenüber hervorruft, wird es erfolgreiche von weniger erfolgreichen Kommunikationsstrategien unterscheiden lernen und zunehmend auf ein bestimmtes Sprechhandlungsziel passende Praktiken entwickeln (vgl. Mead 1934). Initial teilt sich mit der Reaktion Anderer vor allem die pragmatische Bedeutung kindlichen Zeichenhandelns mit. Dennoch erfahren die an einen konkreten sinnlich-situativen Erlebnisrahmen gebundenen Erfahrungen der Kinder im Horizont sprachlicher Interaktion von Anbeginn eine Transzendierung, die die individuelle Welt der sinnlichen Wahrnehmung übersteigt. Obgleich diese Annahmen auf zahlreichen Forschungsarbeiten beruhen, die die sprachliche Entwicklung hörender und in einem lautsprachlichen Umfeld aufwachsender Kinder fokussieren, werden die generellen Einsichten hier vorläufig auf die Sprachentwicklung von Kindern übertragen, deren erste Sprache eine Gebärdensprache ist (vgl. Iversen 2007; Lillo-Martin 1999), da der Forschungsstand zu dieser Problemstellung nach wie vor eher überschaubar ist. Dennoch sei erwähnt, dass verschiedene Untersuchungen immer wieder einen Modalitätseffekt formulieren: Anscheinend treten Kinder, deren L1 Gebärdensprache ist, früher in die Phase der Zeichenproduktion ein als Kinder, deren Herkunftssprache eine Lautsprache ist. Sie verfügen also über einen gewissen ‚Vorsprung‘ bei der Zeichenproduktion bzw. – wie Newport/Meier (1985) unterstellen – die Zeichenproduktion setzt in lautsprachlichen Erwerbsprozessen verspätet ein: From this perspective, it is spoken language onset which is slightly delayed (rather than signed language onset which is slightly advanced), relative to when the child is cognitively and linguistically capable of controlling the first lexical usages. (Ebd., 889)

In der Regel wird dieser Befund auf die unterschiedlich komplexen Anforderungen an die motorische Artikulation von gebärdeten und gesprochenen Zeichen zurückgeführt. Ein umgekehrter Befund wird bezüglich des kindlichen Einsatzes der – syntaktische Operationen signalisierenden – Mimik formuliert (vgl. Reilly/McIntire/Bellugi 1991). Da das Gros der Studien ansonsten ein strukturell vergleichbares Muster für die Sprachentwicklung sprechender und gebärdender Kinder zeichnet, verzichtet

Einheitenbildung in der Deutschen Gebärdensprache 

 407

die nachfolgende Skizze der wichtigsten Einsichten in den ungesteuerten kindlichen Spracherwerb deshalb auf eine modalitätsspezifische Auffächerung der Argumente. Im konkreten Sprachgebrauch verstehen Kinder die frequenten Konstruktionen syntagmatisch verbundener Zeichen anfangs als Holophrasen mit generalisierter, primär pragmatischer Bedeutung, die sie erst im weiteren Spracherwerb differenzieren (vgl. Tomasello 2003, 36). Umgekehrt produzieren sie schon früh – und oftmals mit einem bestimmten Intonationsbogen – Einzelwortäußerungen oder „some unparsed adult expressions as holophrases“ (ebd., 38), um ihre noch ganz an einer bestimmten Erfahrungsszene orientierten kommunikativen Absichten auszudrücken, die kaum von den referenziellen Aspekten ihrer Äußerung unterschieden werden können: Functionally speaking, children’s early one-unit utterances are entire semantic-pragmatic packages – holophrastic expressions – that express a single relatively coherent, yet undifferentiated, communicative intention. (Ebd., 39)

Kinder stehen also vor der Aufgabe, den eingangs ungegliederten Fluss sprachlicher Kommunikation in seine Konstituenten zu zergliedern, syntaktische Muster aufzubauen und Regeln zum kreativen Sprachgebrauch zu entwickeln. Der vorliegende Beitrag geht davon aus, dass ihnen dabei keine angeborene universalgrammatische Ausstattung zur Verfügung steht, sondern dass sich sprachliche Strukturen als diskursbasierte Gebrauchsmuster der kindlichen Ontogenese über Schematisierungsprozesse sukzessive entwickeln. Children hear and produce whole utterances, and their task is to break down an utterance into its constituent parts and so to understand what functional role is being played by each of these parts in the utterance as a whole. (Ebd., 40)

Schon bald setzen Kinder auch Mehrwortäußerungen und erste Pivot-Schemata ein, um den illokutiven Sinn bzw. Zweck ihrer Sprechhandlungen auszudrücken. Zwar weisen diese Konstruktionen noch keine syntaktische Markierung auf. Aber die kindlichen Äußerungen zeigen bereits einen systematischeren Bauplan; einzelne Worte oder Phrasen markieren oft den einer Äußerung eigenen, eigentlichen Sprechakt, während syntaktische Leerstellen  – als erste Anzeichen einer sichtbaren Abstraktion  – mit ganz verschiedenen sprachlichen Einheiten gesättigt werden. Tomasello verdeutlicht dieses Muster ähnlich wie Saussure für die Morphologie (s. o.) am konkreten Beispiel „More milk, More grapes, More juice“ (ebd., 114). Zuweilen stiften aber auch Pronomen „or other general expressions“ (ebd.) den eher stabilen Bezug: „I ____, or ____it, or even It’s ____ or Where’s ____“ (ebd.). Allerdings generalisieren Kinder die Pivot-Schemata noch nicht über die konkrete Erfahrung hinaus: „[E]ach is a constructional island“ (ebd., 115). In Item-Based Constructions werden dann auch Wortordnung oder Morphologie genutzt, um grammatische Informationen wie Partizipantenrollen in Ereignissen zu markieren. Zwar überwinden Kinder hier allmählich die Fixation auf Pivot-Muster, wenn sie mit den sogenannten „Verb-Island Con-

408 

 Gisela Fehrmann

structions“ (Tomasello 2006, 20 ff.) unterschiedliche syntaktische Muster bedienen und beispielsweise semantisch ähnliche Verben in einem identischen Satzrahmen verwenden und andere Verben nach Maßgabe komplexerer Muster nutzen. Die hier wirksam werdende Schematisierung „builds linguistic constructions around concrete pieces of language“ (Tomasello 2003, 140). Inselkonstruktionen spiegeln also noch keine abstrakten grammatischen Schemata wider und entwickeln sich relativ unabhängig voneinander (vgl. Tomasello 2006, 20 f.). Muster aus Inselkonstruktionen sind vor allem lexikalisch motiviert und an Szenarien, d. h. an „kohärente konzeptuelle Bündel“ (ebd., 22), gekoppelt, die „aus einem Ereignis oder einem Zustand mit einem oder mehreren Beteiligten“ bestehen (ebd.). Ihre schrittweise Abstraktion stiftet letztlich ein Schema, das ähnlich der von Saussure konzeptualisierten Wertstruktur (Valeur) die Verbargumente im Sinne der Valenz auf einer abstrakten Ebene bestimmt. Augenscheinlich liegen syntagmatisch verkettete Zeichen deshalb der Segmentierung und Identifizierung einzelner Zeichen und Zeichengruppen voraus, denn Kinder arbeiten sich nur langsam von der ungegliederten Äußerung mit primär pragmatischer Funktion über segmentierte Zeichenketten zu einfachen und komplexen Konstruktionen vor: „Nous avons ces types de syntagmes dans la tête, et au moment de les employer, nous faisons intervenir le groupe d’association“ (Saussure 1989, 285, IIC 69, 2: „Wir haben diese Typen von Syntagmen in unserem Kopf und sobald wir sie gebrauchen, treten uns Gruppen von Assoziationen dazwischen“, G. F.; vgl. ähnlich Tomasello 2003, 5). Allerdings bauen sich die vertikalen Assoziationsketten nicht – wie im obigen Zitat anklingend – automatisch als Ergebnis der individuellen Sprachverarbeitung auf. Vielmehr  – und das stellt Tomasello mit Rekurs auf Ron Scollon (1973) und dessen Analyse der Mehrwortphase überzeugend heraus  – verdankt sich diese Entwicklung in ganz besonderer Weise dem interaktiven Diskursgeschehen. Fokussiert ein Kind einen Ereignisaspekt lexikalisch, nimmt ein erwachsener Gesprächspartner die Äußerung mit Hilfe von „replacement sequences“ thematisch wieder auf und versprachlicht dabei zumeist einen anderen Aspekt des Geschehens: For example, the child might say „More!“ and the adult reply „You want some grapes?“ Or the adult might say „Do you want your shoes?“ and the child reply „On!“ The multi-word structure […] thus only exists across the discourse turns of the interlocutors; but the child registers them both in the conversation. (Tomasello 2003, 123)

Die Segmentierung und Identifizierung von Syntagmen und Zeichenklassen ist also ganz eindeutig auf interaktive Sprechhandlungen verwiesen. Mit fortschreitender Spracherfahrung werden Konstruktionen dann immer stärker segmentiert, variiert und zunehmend abstrakter schematisiert, bis sich etwa über Analogieverfahren eine abstrakte Matrix im Sinne eines Regelkanons aufbaut, der sowohl den begrenzenden syntaktischen Rahmen als auch den Raum für neue kreative Kombinationen stiftet. Schlussendlich artikulieren Kinder ihre kommunikativen Ziele durch abstrakte Kon-

Einheitenbildung in der Deutschen Gebärdensprache 

 409

struktionen, die den Äußerungen Erwachsener sehr nahekommen, indem beispielsweise die in einer Konstruktion vom Verb geforderten Argumente syntaktisch realisiert werden. Auf dem Weg zu dieser Sprachkompetenz neigen Kinder, die bereits über eine Reihe abstrakter Konstruktionen verfügen, aber auch noch ganz konkrete Konstruktionen nutzen, für eine ganze Zeit zur Übergeneralisierung, bevor sie sich in abstrakt schematisierten sprachlichen Konstruktionen artikulieren.

5 Modalitätsspezifische Konstruktionen in der Deutschen Gebärdensprache In der nachfolgenden Analyse gebärdensprachlicher Äußerungen geht es in Anlehnung an die von Jan Schneider (in diesem Band) vorgeschlagene Differenzierung von Konstruktionen darum, unterschiedlich komplexe Konstruktionen zu analysieren. Mit den sogenannten Klassifikatorkonstruktionen geraten hierbei Strukturmuster in den Fokus, die den in Lautsprachen beschriebenen Konstruktionen allerdings nur bedingt ähneln und  – so die Untersuchungsannahme  – am ehesten als (a) lexikalisch teilspezifizierte Konstruktionen (typisch x) beschrieben werden können. Idiome und Phraseme der DGS gelten hingegen als eindeutige Fälle (b) lexikalisch vollspezifizierter Konstruktionen, die wie in Lautsprachen als stabile syntagmatische Kompositionen gelten können. Schließlich fällt der Blick (c) auf die recht unterschiedlichen Schematisierungen des Raumes, die neben den räumlich spezifizierten Mustern zur syntaktischen Markierung von Argumenten, Evidentialität und epistemischer Modalität auch diagrammatisch motivierte Verfahren der Lokalisierung von Referenten umfassen. Inwieweit diese Schemata die Sprache-Gestik-Unterscheidung unterlaufen und die Konzeptualisierung einer dritten Relationsdimension verlangen, die auch die Logik simultan zu sättigender Zeichenschemata berücksichtigt, muss im Rahmen einer allgemeinen, die Simultaneität von Kommunikationsprozessen reflektierenden Modellbildung diskutiert werden. Schon auf Einzelzeichenebene kombinieren Gebärden segmentierbare Einheiten mit mimischen Aspekten zu simultanen Konstruktionen, um sprachliche Informationen anzuzeigen (vgl. Fehrmann 2010b). Linear organisierte Syntagmen verdanken sich einer Verkettungslogik, bei der das Referendum über Pronomina oder Zeigegesten adressiert und durch den Gebrauch einfacher Verben, die nicht im Raum bewegt und meist am Körper ausgeführt werden, anschließend prädikativ spezifiziert wird. Abhängig von der Verbvalenz kommen zur Argumentsättigung dabei zuweilen Auxiliare zum Einsatz, die das hier nicht in die Verbbewegung integrierbare direktionale Moment ausdrücken. Unzweifelhaft haben sich auch in der DGS voll lexikalisierte, linear-zeitlich organisierte Konstruktionen etabliert, die als formelhafte Redewendung (interessant Vortrag) kontextuell passend eingesetzt werden. Daneben gibt es eine Reihe feststehender Phraseme (alte Suppe mit der übertragenen Bedeutung

410 

 Gisela Fehrmann

kalter Kaffee) und idiomatische Phraseologismen (ziehen-Auge heraus mit der übertragenen Bedeutung Verrückt sein nach bzw. Stielaugen bekommen), die von kompetenten Sprechern gerade nicht in ihrer wörtlichen, sondern in ihrer metaphorischen Bedeutung begriffen werden. Eine modalitätsspezifische Besonderheit stellt in allen bislang untersuchten Gebärdensprachen die ikonische Zeichenklasse der Klassifikatoren dar. Sie sind intensional gering bestimmt und haben eine extensional so große Reichweite, dass sie im konkreten Äußerungskontext lexikalisch spezifiziert werden müssen. Ihre ikonische Kraft liegt in ihrem Potenzial, selektive gestalt- und handhabungsbezogene Objektqualitäten darzustellen. Der mediale Mehrwert, den Klassifikatoren gegenüber Lexemen genießen, resultiert also aus ihrem Potenzial, nominale Aspekte und Verbgebärden in einer Konstruktion kombinieren zu können (vgl. Kutscher o. J.). Sie werden also insbesondere im Kontext komplexer Prädikatkonstruktionen produktiv, um einerseits Aspekte der Bewegung durch Modifikation der externen Bewegungskomponente und andererseits Informationen zur Verortung bzw. zur räumlichen Relation von Objekten und Personen durch Verfahren der Platzierung zu markieren, sodass Gebärdensprachen kaum Gebrauch von räumlichen Präpositionen machen (vgl. Aronoff u. a. 2003; Emmorey 2003). In diesen Konstruktionen verschmelzen die Handform und Bewegung als möglicherweise morphematische Zeichenaspekte zu Klassifikatorkonstruktionen, die im konkreten Äußerungskontext mit gestischen Verfahren der diagrammatischen Verortung amalgamieren. Da sich die genaue Lokalisation hier an ‚realen‘ Raumverhältnissen orientiert, die ein Gebärdensprecher in den räumlichen Anordnungen seiner ‚Rede‘ widerspiegelt, werden Klassifikatorkonstruktionen hier als Hybridstruktur analysiert, die morphematische Elemente regel- und d. h. schemageleitet mit einer gestisch-räumlich zu sättigenden Leerstelle kombiniert (vgl. Fehrmann 2010b). Kinder beherrschen diese Konstruktionen erst relativ spät und es ist beinahe sichtbar, wie sie über die sukzessive Exemplifikation von spezifischen Konstruktionen und initial übergeneralisierten Mustern zur Ableitung einer Regel gelangen, die auf einer abstrakteren Ebene und in Verknüpfung mit den noch zu beschreibenden Kongruenzverben schließlich mit anderen Schemata zu komplexen Simultankonstruktionen kombiniert wird. Aus dieser Perspektive dürfen sie als komplexe Zeichenformen begriffen werden, die – ähnlich den von Roman Jakobson (1971) als Shifter beschriebenen Deiktika – erst im konkreten Äußerungskontext ihre Sättigung finden. Hier sei erwähnt, dass sowohl psychologische Wahrnehmungsstudien (vgl. Poizner/Bellugi/Lutes-Driscoll 1981) als auch psycholinguistische Forschungen zu gebärdensprachlichen Versprechern (vgl. Leuninger u. a. 2004) Hinweise auf die besondere Rolle der Parameter Handform und Bewegung liefern. Für den hier fokussierten Rahmen sind aber insbesondere Konstruktionen interessant, die sich als syntagmatische Verbindungen aus simultan-räumlichen Verkettungsverfahren ergeben und teils von einer arbiträr-räumlichen, teils von einer diagrammatischen Schemaanwendung geprägt sind (vgl. Engberg-Pedersen 1993; Meier/ Cormier/Quinto-Pozos 2002; Woll 2003; Fehrmann/Jäger 2004; Perniss 2007; Pizzuto/

Einheitenbildung in der Deutschen Gebärdensprache 

 411

Pietrandrea/Simone 2007; Fehrmann 2013). Verantwortlich hierfür ist u. a. ein Verbsystem, das neben nicht-indizierenden und in diesem Sinne einfachen Verben (Plain Verbs, Padden 1988) die besondere Klasse der indizierenden Verben (Inflecting Verbs, Liddell 2003) umschließt und die Sättigung der Verbvalenz in entsprechend unterschiedlicher Weise organisiert (vgl. Fehrmann/Jäger 2004). Die Klasse der indizierenden Verben umfasst Kongruenzverben (Agreement Verbs) wie fragen und Raumverben (Spatial Verbs) wie umziehen, die beide die räumlich-simultane Organisation von Syntagmen erlauben. Kongruenzverben werden ihren Argumenten assoziiert, indem die Verbgebärde durch die direktionale Manipulation des Anfangs- bzw. Endpunkts der Bewegung auf die deiktisch indizierten Argumente prädikativ gesättigt wird (Agreement). Hier klingt an, was konstruktionstheoretisch interessant ist: Das abstrakte Schema (die Regel) zur konkreten Nutzung eines Kongruenzverbs schreibt die räumlich vermittelte Identifikation von Agens und Patiens vor, die in der konkreten Äußerung an direktional identifizierbaren Loci orientiert und in diesem Sinne gestisch-deiktisch zu sättigen ist. Damit gehen diese Konstruktionen auf ein Schema zurück, das eine gestisch zu sättigende Leerstelle bereitstellt. Ist das Referendum während der Interaktion anwesend bzw. sichtbar, richtet der Sprecher die Verbgebärde direkt darauf aus. Zugleich wird hier eine Schematisierung des Raumes sichtbar, die sich in DGS als Ergebnis von sprachlichen Nutzungsroutinen in vielfältiger Form ausdifferenziert hat und bei räumlich präsenten Referenten als Real Space bezeichnet wird (vgl. Liddell 2003). Handelt es sich aber um eine Bezugnahme auf Depräsentes, orientiert sich die Wahl des Anfangs- bzw. Endpunkts an der mental verinnerlichten Position eines im Gebärdenraum virtuell verorteten und lexikalisch spezifizierten Klassifikators oder Indexzeichens (Token, ebd.) mit Stellvertreterfunktion für ein Referendum (vgl. Abb. 1).

Abb. 1: Illustration zum Einsatz von ­Kongruenzverben im Token Space: a-Index b-Index küssen (A küsst B)

Aus konstruktionstheoretischer Sicht greift hier die gleiche, bereits beschriebene abstrakte Regel wie bei der Referenz auf Präsentes, allerdings realisiert sie sich im konkreten Äußerungskontext in einem Anwendungsmuster, das die Ausrichtung der direktionalen Verbkomponente auf einen imaginären, räumlichen Fluchtpunkt hin verlangt. Aus dieser modifizierten Nutzungsroutine resultiert auf Diskursebene eine Schematisierung des Raumes, die mit Scott Liddell als Token Space bezeichnet werden darf (vgl. ebd.). Wenngleich die Platzierung von Indizes eigentlich einer arbi-

412 

 Gisela Fehrmann

trären Logik folgt, kann ihnen durch die vertikal oder horizontal markierte räumliche Anordnung eine pragmatische Bedeutungsdimension beigemessen werden. In der Regel drückt die vertikal indizierte Verortung von Referenten mittels Indizes Machtverhältnisse und Hierarchien aus; die horizontal räumlich variierte Nachbarschaft von Zeichen zeigt hingegen den Grad der sozialen Nähe-Ferne-Beziehung von Aktanten an, für die die Indizes stehen. Anders als in der gestischen Kommunikation ist diesen Variationen ein Schema unterlegt, das die pragmatische Dimension sprachlicher Äußerungen diskursgrammatisch reguliert und in ikonisch-räumlichen Verfahren artikuliert. Diese linguistisch komplexen Verfahren der Simultankonstruktion lassen sich typologisch-strukturell am ehesten mit der linguistischen Funktionsweise von Tonsprachen vergleichen. Oberflächlich identisch vollzieht sich in DGS der Einsatz von Raumverben, die über die im Token Space räumlich positionierten Klassifikatoren bzw. indexikalisch markierten Objekte für das Argument Source/Goal flektiert werden (vgl. Padden 1988). Allerdings ist die Platzierung von Indizes hier an topographisch-räumlichen Verhältnissen orientiert, sodass das Arrangement von Referenzpunkten die physikalischen Gegebenheiten lokaler Verhältnisse diagrammatisch widerspiegelt und ein Flug von München nach Hamburg beispielsweise durch (a) die südliche Verortung des Indexes für München, (b) die nördliche Indexplatzierung für Hamburg und eine (c) sich vertikal von (a) nach (b) erstreckende Verbbewegung fliegen ausgeführt wird. In diesem Beispiel würde die konkrete Äußerung jedoch einem Muster folgen, das die Anwendung der bereits beschriebenen abstrakten Regel zur diagrammatischen Informationsverortung insoweit modifiziert, als der Gebärdenraum durch eine 90°-Drehung von der Horizontalen in die Vertikale transformiert wird und die sprachlichen Zeichen hier abgetragen werden. Augenscheinlich folgt diese Variation der kulturell etablierten und in DGS diskursgrammatisch regulierten Praxis, Landkarten als mediale Artefakte zur kartographischen Darstellung geographischer Informationen zu nutzen. Damit ist der konkrete Spielraum, der die räumliche Verortung gebärdensprachlicher Äußerungen ermöglicht, jedoch noch lange nicht ausgeschöpft. Wird auf physikalisch-räumliche Begebenheiten – etwa bei einer Wegbeschreibung – neutral Bezug genommen, werden die über Klassifikatorstrukturen angezeigten Referenzobjekte zwar wieder isomorph zur realen Raumausstattung  – d. h. diagrammatisch  – platziert. Aber durch die simultane Anwendung eines ganz anderen Schemas ist es gleichzeitig möglich, perspektivische Informationen zu vermitteln. So wird die eher distanzierte Berichtperspektive angezeigt, wenn die räumliche Beschreibung aus der ‚Vogelperspektive‘ und mit stabilem Blickwinkel versprachlicht und der Boden des Gebärdenraums dazu auf Bauchhöhe abgesenkt wird. Umgekehrt signalisiert der auf Schulter- bzw. Augenhöhe angehobene Gebärdenraum den Eindruck der Erlebnisperspektive, sodass es scheint, als durchwandere der Gebärdende den zu beschreibenden Raum. In diesem Fall wechselt mit der Durchwanderung zugleich die Perspektive, aus der das Szenario beschrieben wird.

Einheitenbildung in der Deutschen Gebärdensprache 

 413

Wenn auf solch diagrammatisch motivierte Szenarien in Dialogen konversationell Bezug genommen wird, unterliegen diese ikonischen Darstellungsmuster einer weiteren Schematisierung, die der neuerlich räumlich geleisteten Markierung – diesmal aber durch den reagierenden Interaktanten  – dient. Positioniert ein Sprecher eine Objektgebärde beispielsweise in seinem Gebärdenraum weit rechts, nimmt ein ihm gegenüber stehender Rezipient sie aus seiner Perspektive als fremden Gebärdenraum klar links verortet wahr (dein rechts ist mein links). Der Interlokutor, der auf solch diagrammatisch inszenierte Konstruktionen Bezug nimmt, um Kommentare, Nachfragen oder Korrekturen zu äußern, wird dabei die zitierten Elemente in seinem eigenen Artikulationsraum in einer um 180° gedrehten Komposition verorten (Reversed Space, vgl. Emmorey 2002). So ist es also der Interlokutor, der diesen Kon­struktionen responsiv den ‚Echtheitsstempel‘ räumlicher Realität zuweist (vgl. Abb. 2).

Abb. 2: Illustration zum Reversed Space

Er zeigt damit seine eigene Haltung gegenüber der vermeintlich auf geographischräumlicher Authentizität beruhenden Verortung der Referenzobjekte im Gebärdenraum des Vorredners an und signalisiert, dass er die durch ‚reale‘ Raumverhältnisse motivierte Bezugnahme anerkennt. Das dieser modalitätsspezifischen Markierung zugrunde liegende Schema changiert also zwischen der Indizierung epistemischer Modalität und – insofern es sich ja auch um eine auf „Hören-Sagen“ (Jakobson 1971, 135) zitierte Referenz handelt – verbaler Evidentialität. In erstaunlich sichtbarer Weise ist hier beobachtbar, was Mead in seinen Reflexionen dem Anderen als logischem Regenten von Semantisierungsprozessen zuschreibt: Die Bedeutung eines sprachlichen Zeichens (signifikantes Symbol, vgl. Mead 1934, besonders 117, 129 ff., 207 und 295) wird in einem interaktiven Deutungsakt durch den Anderen hergestellt. Umgekehrt erfahren die arbiträr-räumlich arrangierten Szenarien ihre anaphorisch bzw. kataphorisch (zuweilen wird der Index, dann die spezifizierende Gebärde produziert) referenzielle Signatur, wenn der Interaktant das räumliche Arrangement in seiner zitierten Übernahme dieser Konstruktionen gerade nicht dreht, sondern spiegelt und die Konstruktion in unangepasster Orientierung übernimmt (Mirrored Space, vgl. Emmorey/Falgier 1999). D. h. er übersetzt die räumlichen Spezifika deiktischer Perspektivierungen nicht in einen eigenen deiktischen Referenzrahmen,

414 

 Gisela Fehrmann

sondern übernimmt die lokalen Referenzpunkte unangepasst und unterstreicht so deren arbiträre, endophorische Natur (vgl. Abb. 3).

Abb. 3: Illustration zum Mirrored Space

Bei einem eher in Narrationen angewendeten Verfahren imaginiert der Erzähler die Charaktere einer Erzählung als ihm physikalisch präsent zur Seite oder gegenüber stehend und adressiert sie, indem er seine Rede durch die räumliche Orientierung von Gebärden-, Blick-, Schulter- und Körperausrichtung an die imaginierten Akteure richtet (vgl. Liddell/Metzger 1998). Um Konfusion zu vermeiden, werden die Redeund Handlungszitate der Charaktere in einem seitlich versetzten Artikulationsraum, dem sogenannten Surrogate Space (vgl. Liddell 2003), dargeboten. Das abstrakte Raumschema zur Markierung von Erzählfiguren verlangt also einen um ca. 45° zur Seite verschobenen Artikulationsraum (Shifted Referential Framework, vgl. Morgan 1999) und zeigt durch diese räumliche Markierung an, welche Information durch welchen Charakter wiedergegeben wird. Anders formuliert, signalisiert der räumlich spezifizierte Artikulationsort die Quelle einer Rede oder Handlung und markiert über dieses diskursgrammatische Muster so zugleich den Evidentialis (vgl. Jakobson 1971). Aber auch die räumliche Anordnung von Pro- und Kontra-Argumenten aktiviert ein Schema, das als Verfahren zur Gliederung des Argumentationsraums für viele Gebärdensprachen beschrieben ist. Dabei werden die Pro-Argumente in der einen, die Kontra-Argumente in der anderen Gebärdenraumhälfte verortet; hier wird konkret verräumlicht, was im Deutschen als metaphorisches Phrasem mit der Konstruktion auf der einen Seite X/auf der anderen Seite Y ausgedrückt wird. Zeitliche Informationen werden in DGS ebenfalls in räumlich strukturierten Kon­struktionen realisiert, wenn sprachliche Äußerungen entlang einer sagittalen, horizontalen oder diagonalen Zeitachse formuliert werden, die über deiktische, sequenzielle bzw. anaphorische Zeitbezüge informieren (vgl. Engberg-Pedersen 1993; Fehrmann 2013). Die an der Origo des Sprechers orientierte deiktische Zeitachse verknüpft zeitlich zurück- oder in der Zukunft liegende Informationen über einen Zeitstrahl mit der aktuellen Äußerung und reicht von der vorderen Begrenzung des Gebärdenraums (Futur) bis an die Schulter des Sprechers heran. Möchte der Sprecher eine Handlung als in der Vergangenheit liegend kennzeichnen, weist er (als Rechtshänder) i. d. R. mit einem Zeitwort oder einer Zeitangabe auf den hinter seiner (rechten)

Einheitenbildung in der Deutschen Gebärdensprache 

 415

Schulter liegenden Bereich (vgl. Engberg-Pedersen 1993). Unmarkiert sind Äußerungen immer als Präsenzform zu verstehen. Der Gebrauch dieser Zeitachse ist nicht nur für die DGS, sondern auch für die Dänische Gebärdensprache, nicht jedoch für die American Sign Language (ASL) belegt: „In ASL, such deictic reference to a location behind the signer cannot be temporal; it can only have spatial meaning“ (Emmorey 2002, 110). Die sequentielle Zeitachse markiert vergangene, zeitlich aufeinander folgende Ereignisse, indem die sich in der Zeit erstreckenden Geschehnisse so abgetragen werden, dass – ähnlich einem Wochenkalender – Zurückliegendes links und nah an der Gegenwart Liegendes rechts gebärdet wird. Im Gegensatz hierzu erstreckt sich die anaphorische Zeitachse diagonal im Gebärdenraum; ihr zeitlicher Referenzpunkt orientiert sich anaphorisch am Diskursgeschehen als referenzieller Orientierungspunkt und markiert Situationen und Ereignisse, die sich auf den referierten Zeitpunkt in einer kausal-zeitlichen Logik zubewegen oder sich aus einer Retrospektive voneinander ableiten lassen. „[T]he anaphoric timeline appears to be used to contrast or compare time periods related to discourse“ (ebd., 111). Es geht mithin um die Abtragung von Situationen, die auseinander resultieren und sich in progressiver Entwicklung zeitlich-kausal aneinanderreihen (vgl. Winston 1991; Fehrmann 2004b). An dieser Stelle wird deutlich, dass der Begriff der Konstruktion im Fall von Gebärdensprachen nicht nur für die Analyse von Morphemen, Lexemen oder komplexen lexikalisierten Einheiten wie Idiomen fruchtbar wird. Vielmehr lassen sich in DGS zahlreiche Konstruktionen identifizieren, die von reichhaltig differenzierten Raumschemata regiert werden und die diagrammatische bzw. topographische Lokalisierung von Referenzobjekten im Gebärdenraum, die räumliche Markierung von Tempus, Sprecherperspektive, epistemischer Modalität, Evidentialis sowie die Verräumlichung von Argumentationsstrukturen organisieren (vgl. Engberg-Pedersen 1993; Winston 1995; Fehrmann 2013). Ganz offensichtlich sind diskursgrammatische Routinen in DGS deutlicher grammatikalisiert als in der Lautsprache.

6 Diskussion Erst in jüngerer Zeit nimmt die linguistische Forschung auch die spezifischen Differenzen in den Blick, die sich der von Lautsprachen grundsätzlich verschiedenen Modalität der Gebärdensprachen verdanken und aus einem multimedial geprägten Sprachsystem resultieren, das in vielerlei Hinsicht von modalen Prozessierungsfaktoren geprägt ist. Wie bereits erwähnt, möchte ich die diagrammatisch spezifizierten Konstruktionen der DGS als synthetische Verbindungen verbaler und non-verbaler Aspekte werten. Aus dieser Sicht sind die funktional vielfältig differenzierten räumlichen Schemata in Gebärdensprachen mit lexikalisch teilspezifizierten Konstruktionen vergleichbar, die eine Leerstelle  – hier allerdings zur gestisch regierten Sättigung – offen halten. Mit dieser Annahme wird die von Dürscheid/Schneider (2015,

416 

 Gisela Fehrmann

187) vorgeschlagene Trennung sprachlicher und bildlicher bzw. diagrammatischer Verfahren – die anders als sprachliche Zeichen von den Autoren nicht als ‚Konstruktionen‘ gefasst werden – für die DGS obsolet, denn in vielen Simultankonstruktionen überlagern sich morpho-syntaktische, diagrammatische und topographische Informationen. Für eine semiologisch begründete Analyse stellen die räumlich organisierten Konstruktionen der Gebärdensprachen wie die Konstruktionen in (tonalen) Lautsprachen eine Herausforderung dar, weil ja nach Saussure eine assoziativ verbundene Gruppe konkurrierender Zeichen an einer syntaktischen Position darum kämpft, in diese Position eintreten zu können. Mit dieser Modellierung lassen sich die räumlich motivierten Simultankonstruktionen (Reversed Space, Mirrored Space etc.) gebärdensprachlicher Äußerungen jedoch nicht erklären, denn hier treten paradigmatische Alternativen gerade nicht notwendig konkurrierend auf, sondern schieben sich zuweilen übereinander. Aber eigentlich gewinnt ein Zeichen gerade aus der Konkurrenz zu anderen Zeichen seinen Wert, wenn es um die Sättigung in einem Syntagma kämpft: Durch die in konkreten Äußerungen je variierenden Kombinationen mit anderen Zeichen entwickeln sich sukzessive schließlich Typikalitäten, die einem Zeichen als kombinatorischer Wert  – ähnlich der Valenz bei Verben  – zukommen. Wenngleich dieses Verfahren bei vielen Lexemen der DGS plausibel ist, übersteigen Simultankonstruktionen, die gleichzeitig von verschiedenen Schemata bestimmt sind, diese Logik. Ich schlage deshalb eine Erweiterung des zweidimensionalen Saussure-Modells vor und möchte neben der (horizontalen) syntagmatischen und der (vertikalen) paradigmatischen mit der ‚peridigmatischen‘ Relation eine dritte Dimension ins Spiel bringen, über die Zeichen zueinander in Beziehung treten. Raummetaphorisch gesprochen wäre diese Achse sagittal zu imaginieren. Damit wird es möglich, synchron bzw. simultan artikulierte Zeichenkombinationen aus der konkreten Kombination mehrerer, an derselben syntagmatischen ‚Position‘ bzw. im selben syntagmatischen Verbund realisierter Zeichen herzuleiten. Hier alternieren Zeichen also nicht an einer Position, sondern kombinieren und vernetzen sich zu Konstruktionen. Je nach Häufigkeit der tatsächlichen Exemplifikationen wirkt der Gebrauch auch hier musterbildend, sodass dann das Muster zum Schema, d. h. zur Regel avanciert. Dass Saussure die (strukturalistische) Entgegensetzung paradigmatischer und syntagmatischer Relation selber kritisch sah, hat Ludwig Jäger z. B. in seiner Untersuchung der „Points Délicats“ im Kapitel „Heikle Punkte“ (Jäger 2010, 195 ff.) gezeigt. In einer prozessualen, an den Äußerungsvollzug gebundenen Perspektive lässt sich die abstrakte Matrix der Zeichenorganisation als modalitätsspezifisch organisierter Kanon syntaktischer Regeln begreifen, die ihrerseits Resultat von diskursiven Exemplifikationen (vgl. Goodman 1998) sind, die im konkreten Äußerungsgeschehen muster- und auf abstrakter Ebene typenbildend wirken. Bezogen auf die performative Argumentsättigung abstrakter Verbvalenzen lassen sich diese Regeln auch als Basis syntaktischer Projektion im mündlichen Sprachgebrauch interpretieren, die Peter Auer – ganz ohne Bezug auf konstruktionsgrammatische Ansätze – im Rahmen seiner

Einheitenbildung in der Deutschen Gebärdensprache 

 417

Überlegungen zur Online-Syntax am Phänomen der Projektion und Retraktion diskutiert (vgl. Auer 2000). Eben diese Spuren von Gebrauchslogiken – und nicht etwa positiv bestimmte Definitionen wie die Zuschreibung von semantischen Merkmalen – haften einem Zeichen als Konstruktion in seiner Funktion als Term im Gesamtsystem an. Wie deutlich wurde, ist die Modellierung einer prozess- und interaktionsbasierten Wissensgenese gut mit den Grundannahmen konstruktionsgrammatischer Modellierungen vereinbar.

7 Ausblick Die vorliegende Untersuchung hat den Versuch unternommen, modalitätsspezifische Konstruktionen der Deutschen Gebärdensprache vor dem Hintergrund semiologischer und konstruktionstheoretischer Grundannahmen zu analysieren. Dieses Unterfangen hat auf mehreren Ebenen zu produktiven Ergebnissen geführt, zuweilen aber auch die Notwendigkeit ergänzender Modellbildung deutlich werden lassen. Unter Rückgriff auf neue Arbeiten zur (Gebärden-)Sprachverarbeitung wurde deutlich, dass die von Saussure differenziert entwickelte Konzeptualisierung der einem Aposème auf mentaler Ebene entsprechenden Figur des Image Acoustique nicht nur als dyadisches, sondern als triadisches Schema entworfen werden darf, dem neben Mécanème und Acoustème bzw. Visème ein Cinéstème korrespondiert. Die von räumlichen Schemata regierten Simultankonstruktionen der DGS stellen für die semiologische Analyse eine besondere Herausforderung dar, da sie sich im Spannungsfeld syntagmatischer und paradigmatischer Relationsbildung nicht hinreichend analysieren lassen. Ich habe deshalb eine Erweiterung des traditionell an zwei Dimensionen orientierten Modells um eine dritte ‚peridigmatische‘ Tiefendimension vorgeschlagen, die allererst die Folie zur theoretischen Verortung simultaner Konstruktionen stiftet. Denn den an einer syntagmatischen Position konkurrierenden, assoziativ verbundenen Zeichen kommt so erst die Option zu, sich an eben dieser Position mit weiteren, die strukturelle Architektur eines breiten Äußerungsgeschehens regulierenden Zeichenschemata zu verbinden. Diese Verschwisterung stellt gerade keine Konkurrenz, sondern eine Möglichkeitsbedingung dar, die sich als eine der ‚Valeurstruktur‘ vergleichbare Markierung immer dann über die syntagmatischen Zeichenverbünde legt, wenn ihre ‚Sättigung‘ diskursiv obligatorisch ist. Abhängig von den Anforderungen des kontextuellen Diskursgeschehens können sich so mehrere Schemata mit den an einer syntaktischen Position (einem Syntagma) je konkurrierenden Assoziationsketten realisieren. Die hier vorgeschlagene Arbeitshypothese muss sich in weiteren Studien allererst einer genauen Überprüfung stellen, bevor absehbar ist, ob mit diesem Instrument ein Mehrwert für die Analyse gebärdensprachlicher Konstruktionen erzielt werden kann.

418 

 Gisela Fehrmann

Aber auch die Erforschung der strukturellen Funktionsweise koartikulierter Gesten steht vor der Aufgabe, Simultankonstruktionen analysieren zu müssen (vgl. Fricke in diesem Band), die beispielsweise im Falle ikonischer Ostensionspraktiken – wie sie etwa in der Äußerung so groß war der Fisch sichtbar werden  – das Muster so_geste_groß ist x bedienen. Andere Verzahnungsmuster von verbalen und gestischen Zeichen – etwa zur obligatorischen Koartikulation von sprachlichen und nichtsprachlichen Deiktika und Demonstrativa – erläutert z. B. Levinson (o. J.). Das hinter den komplexen ‚Mischkonstruktionen‘ liegende Schema schreibt auch in diesen Fällen die simultane Äußerung verbaler und non-verbaler Zeichen obligatorisch vor (vgl. ebd., 9). Zukünftige Forschungen an der Schnittstelle von gebärdensprachlicher, manueller und stimmlich-gestischer Kommunikation werden sich aus theoretischer Sicht an den Differenzen und Ähnlichkeiten messen lassen müssen, die die unterschiedlichen Zeichensysteme an eine Modellierung sprachlicher Organisationssysteme stellen.

8 Literatur Aronoff, Mark u. a. (2003): Classifier constructions and morphology in two sign languages. In: Karen Emmorey (Hg.): Perspectives on Classifier Constructions in Sign Languages. Mahwah, NJ, 53–84. Auer, Peter (2000): On line-Syntax – oder: Was es bedeuten könnte, die Zeitlichkeit der mündlichen Sprache ernst zu nehmen. In: Sprache und Literatur 85, 43–56. Crasborn, Onno (2001): Phonetic Implementation of Phonological Categories in Sign Language of the Netherlands. Utrecht. Dürscheid, Christa/Jan Georg Schneider (2015): Satz – Äußerung – Schema. In: Ekkehard Felder/Andreas Gardt (Hg.): Handbuch Sprache und Wissen. Berlin/Boston (Handbücher Sprachwissen, 1), 167–194. Emmorey, Karen (2002): Language, Cognition, and the Brain: Insights from Sign Language Research. Mahwah, NJ. Emmorey, Karen (Hg.) (2003): Perspectives on Classifier Constructions in Sign Languages. Mahwah, NJ. Emmorey, Karen/Brenda Falgier (1999): Talking about space with space: Describing environments in ASL. In: Elizabeth A. Winston (Hg.): Storytelling and Conversation: Discourse in Deaf Communities. Washington, DC, 3–26. Emmorey, Karen/Rain Bosworth/Tanya Kraljic (2009): Visual feedback and self-monitoring of sign language. In: Journal of Memory and Language 61 (3), 398–411. Engberg-Pedersen, Elisabeth (1993): Space in Danish Sign Language. The Semantics and Morphosyntax of the Use of Space in a Visual Language. Hamburg (Internationale Arbeiten zur Gebärdensprache und Kommunikation Gehörloser, 19). Fehr, Johannes (1997): Saussure: Zwischen Linguistik und Semiologie. Ein einleitender Kommentar. In: Ferdinand de Saussure: Linguistik und Semiologie: Notizen aus dem Nachlaß. Texte, Briefe und Dokumente. Gesammelt, übersetzt und eingeleitet von Johannes Fehr. Frankfurt a. M., 17–226.

Einheitenbildung in der Deutschen Gebärdensprache 

 419

Fehrmann, Gisela (2004a): Verzeichnung des Wissens. Überlegungen zu einer neurosemiologischen Theorie der sprachgeleiteten Konzeptgenese. München. Fehrmann, Gisela (2004b): Die diskursive Logik kategorieller Wissensstrukturen. In: Ludwig Jäger/ Erika Linz (Hg.): Medialität und Mentalität. Theoretische und empirische Studien zum Verhältnis von Sprache, Subjektivität und Kognition. München, 69–98. Fehrmann, Gisela (2010a): Hand und Mund. Zwischen sprachlicher Referenz und gestischer Bezugnahme. In: Sprache und Literatur 41 (1), 18–36. Fehrmann, Gisela (2010b): Sprache im gestischen Dispositiv. Medialitätsspezifische Aspekte von Gebärdensprachen. In: Erika Fischer-Lichte/Christoph Wulf (Hg.): Gesten. Inszenierung, Aufführung und Praxis. München, 58–77. Fehrmann, Gisela (2013): Exploiting space in German Sign Language. Linguistic and topographic reference in signed discourse. In: Peter Auer u. a. (Hg.): Space in Language and Linguistics: Geographical, Interactional and Cognitive Perspectives. Berlin, 607–636. Fehrmann, Gisela/Ludwig Jäger (2004): Sprachraum – Raumsprache. Raumstrategien in Gebärdensprachen und ihre Bedeutung für die kognitive Strukturierung. In: Ludwig Jäger/Erika Linz (Hg.): Medialität und Mentalität. Theoretische und empirische Studien zum Verhältnis von Sprache, Subjektivität und Kognition. München, 177–191. Fehrmann, Gisela/Erika Linz (2010): Shifting Gesture. Deiktische Verfahren in sprachlicher und visueller Kommunikation. In: Gottfried Boehm/Sebastian Egenhofer/Christian Spies (Hg.): Zeigen. Die Rhetorik des Sichtbaren. München, 378–410. Goldberg, Adele Eva (1995): Constructions: A Construction Grammar Approach to Argument Structure. Chicago. Goodman, Nelson (1998): Sprachen der Kunst. Entwurf einer Symboltheorie. Übersetzt von Bernd Philippi. 2. Auflage. Frankfurt a. M. Grote, Klaudia/Erika Linz (2003): The influence of sign language iconicity on semantic conceptualization processes. In: Wolfgang G. Müller/Olga Fischer (Hg.): From Sign to Signing. Amsterdam (Iconicity in Language and Literature, 3), 23–40. Hickok, Gregory/Ursula Bellugi/Edward S. Klima (1998): The basis of the neural organization for language: evidence from sign language aphasia. In: Reviews in the Neurosciences 8, 205–222. Hickok, Gregory u. a. (2009): Neural dissociation in the production of lexical versus classifier signs in ASL: distinct patterns of hemispheric asymmetry. In: Neuropsychologia 47 (2), 382–387. Huber, Walter/Juliane Klann (2005): Zerebrale Repräsentation der Gebärdensprache. In: Linguistische Berichte. Sonderheft 13, 359–380. Iversen, Wiebke (2007): Gebärdenspracherwerb. In: Hans-Christoph Nuerk/Liane Kaufmann/Klaus Willmes (Hg.): Kognitive Entwicklungsneuropsychologie. Göttingen, 137–152. Jackendoff, Ray S. (1983): Semantics and Cognition. Cambridge, MA/London. Jackendoff, Ray S. (1992): Languages of the Mind. Essays on Mental Representation. Cambridge, MA/London. Jäger, Ludwig (o. J.): Les „points délicats“ Saussuriens. Skizze eines systematischen Aufrisses der Sprachtheorie F. de Saussures – nebst einem kritischen Seitenblick auf Ausschnitte der jüngeren Saussure-Forschung. Unveröffentlichtes Manuskript. Aachen. Jäger, Ludwig (1976): F. de Saussures historisch-hermeneutische Idee der Sprache. Ein Plädoyer für die Rekonstruktion des Saussureschen Denkens in seiner authentischen Gestalt. In: Linguistik und Didaktik 27, 210–244. Jäger, Ludwig (1980): Linearität und Zeichensynthesis. In: Manfred Frank/Friedrich Adolf Kittler/ Samuel Weber (Hg.): Fugen. Deutsch-Französisches Jahrbuch für Textanalytik 1980. Olten/ Freiburg i. Br., 187–212.

420 

 Gisela Fehrmann

Jäger, Ludwig (1986): Der saussuresche Begriff des Aposème als Grundlagenbegriff einer hermeneutischen Semiologie. In: Ludwig Jäger/Christian Stetter (Hg.): Zeichen und Verstehen. Akten des Aachener Saussure-Kolloquiums 1983. Aachen, 7–33. Jäger, Ludwig (2009): Das schreibende Bewusstsein. Transkriptivität und Hypotypose in Kants „Andeutungen zur Sprache“. In: Elisabeth Birk/Jan Georg Schneider (Hg.): Philosophie der Schrift. Tübingen, 99–124. Jäger, Ludwig (2010): Ferdinand de Saussure zur Einführung. Hamburg. Jakobson, Roman (1971): Shifters, verbal categories, and the Russian verb. In: Roman Jakobson (Hg.): Selected Writings: Word and Language. Band 2. Den Haag, 130–147. Johnston, Trevor/Adam Schembri (2007): Australian Sign Language (AUSLAN). An Introduction to Sign Language Linguistics. Cambridge, MA. Kant, Immanuel (1911 [1787]): Kritik der reinen Vernunft. 2. Auflage. In: Immanuel Kant: Gesammelte Schriften. Herausgegeben von der Königlich Preußischen Akademie der Wissenschaften (Akademie-Ausgabe). Band III. Berlin. Kant, Immanuel (1913 [1790]): Kritik der Urteilskraft. In: Immanuel Kant: Gesammelte Schriften. Herausgegeben von der Königlich Preußischen Akademie der Wissenschaften (AkademieAusgabe). Band V. Berlin. Kutscher, Silvia (o. J.): Verbs of Location and Motion in German Sign Language (DGS). Modality Specific Properties of Classifiers and Verb Classification. Unveröffentlichtes Manuskript. Humboldt-Universität Berlin. Lakoff, George (1987): Women, Fire, and Dangerous Things. What Categories Reveal about the Mind. Chicago/London. Lakoff, George (1989): Some empirical results about the nature of concepts. In: Mind and Language 4, 103–129. Leuninger, Helen u. a. (2004): The impact of modality on language production: evidence from slips of the tongue and hand. In: Thomas Pechmann/Christopher Habel (Hg.): Multidisciplinary Approaches to Language Production. Berlin, 219–278. Levinson, Steven C. (o. J.): Deixis and Pragmatics. http://www.hf.uio.no/ilos/personer/vit/kjelljs/acourse-on-deixis/levinson2004.pdf [17.09.2014]. Liddell, Scott K. (2003): Grammar, Gesture, and Meaning in American Sign Language. Cambridge. Liddell, Scott K./Melanie Metzger (1998): Gesture in sign language discourse. In: Journal of Pragmatics 30, 657–697. Lillo-Martin, Diane (1999): Modality effects and modularity in language acquisition: the acquisition of American Sign Language. In: William C. Ritchie/Tej K. Bhatia (Hg.): Handbook of Child Language Acquisition. San Diego u. a., 531–567. Linz, Erika (2002): Indiskrete Semantik. Kognitive Linguistik und neurowissenschaftliche Theoriebildung. München. Mead, George H. (1934): Mind, Self, and Society from a Standpoint of a Social Behaviorist. Herausgegeben von Charles W. Morris. Chicago. Meier, Richard P./Kearsy Cormier/David Quinto-Pozos (Hg.) (2002): Modality and Structure in Signed and Spoken Languages. Cambridge, MA. Mitchell, William J. T. (1995): Picture Theory. Essays on Verbal and Visual Representation. Chicago. Morgan, Gary (1999): Event packaging in British Sign Language discourse. In: Elizabeth Winston (Hg.): Storytelling and Conversation. Discourse in Deaf Communities. Washington, DC, 27–58. Newport, Elissa/Richard P. Meier (1985): The acquisition of American Sign Language. In: Dan I. Slobin (Hg.): The Crosslinguistic Study of Language Acquisition. Hillsdale, NJ, 881–938. Padden, Carol (1988): Interaction of Morphology and Syntax in American Sign Language. New York (Outstanding Dissertations in Linguistics, Series IV).

Einheitenbildung in der Deutschen Gebärdensprache 

 421

Perniss, Pamela (2007): Space and Iconicity in German Sign Language (DGS). Dissertation. Radboud University Nijmegen (MPI Series in Psycholinguistics, 45). Perniss, Pamela M./Roland Pfau/Markus Steinbach (Hg.) (2007): Visible Variation: Comparative Studies on Sign Language Structure. Berlin (Trends in Linguistics. Studies and Monographs, 188). Pizzuto, Elena/Paola Pietrandrea/Raffaele Simone (Hg.) (2007): Verbal and Signed Languages. Comparing Structures, Constructs and Methodologies. Berlin/New York (Empirical Approaches to Language Typology, 36). Poizner, Howard/Ursula Bellugi/Venita Lutes-Driscoll (1981): Perception of American Sign Language in dynamic point-light displays. In: Journal of Experimental Psychology: Human Perception and Performance 7, 430–440. Poizner, Howard/Edward S. Klima/Ursula Bellugi (1990): Was die Hände über das Gehirn verraten. Neuropsychologische Aspekte der Gebärdensprachforschung. Hamburg. Reilly, Judy S./Marina L. McIntire/Ursula Bellugi (1991): Baby face: a new perspective on universals in language acquisition. In: Patricia Siple/Susan D. Fischer (Hg.): Theoretical Issues in Sign Language Research. Vol. 2: Psychology. Chicago, 9–23. Rizzolatti, Giacomo u. a. (1996): Premotor corte and the recognition of motor actions. In: Cognitive Brain Research 3, 131–141. Sandler, Wendy (1989): Phonological Representation of the Sign: Linearity and Nonlinearity in American Sign Language. Providence, RI (Publications in Language Sciences, 32). Saussure, Ferdinand de (1989): Cours de linguistique générale. Kritische Ausgabe von Rudolf Engler. Band 1: Reproduction de l’édition originale. Wiesbaden. Saussure, Ferdinand de (1990): Cours de linguistique générale. Notes de Ferdinand de Saussure sur la linguistique générale. Kritische Ausgabe von Rudolf Engler. Band 2: Appendice. Nachdruck der Originalausgabe. Wiesbaden. Scheerer, Thomas M. (1980): Ferdinand de Saussure. Darmstadt. Scollon, Ron (1973): Conversation with a One Year Old. A Case Study of the Developmental Foundation of Syntax. Honolulu. Stetter, Christian (2005): System und Performanz. Sprachtheoretische Grundlagen von Medientheorie und Sprachwissenschaft. Weilerswist. Stokoe, William C. (1960): Sign Language Structure. Buffalo (Studies in Linguistics: Occasional Papers, 8). Taub, Sarah F. (2001): Language from the Body. Iconicity and Metaphor in American Sign Language. Cambridge, MA. Tomasello, Michael (2003): Constructing a Language. A Usage-Based Theory of Language Acquisition. Cambridge, MA. Tomasello, Michael (2006): Konstruktionsgrammatik und früher Erstspracherwerb. In: Kerstin Fischer/Anatol Stefanowitsch (Hg.): Von der Anwendung zur Theorie. Tübingen, 19–38. Villers, Jürgen (1997): Kant und das Problem der Sprache. Die historischen und systematischen Gründe für die Sprachlosigkeit der Transzendentalphilosophie. Konstanz. Winston, Elizabeth A. (1991): Spatial referencing and cohesion in an American Sign Language text. In: Sign Language Studies 73, 397–410. Winston, Elizabeth A. (1995): Spatial mapping in comparative discourse frames. In: Karen Emmorey/ Judy S. Reilly (Hg.): Language, Gesture and Space. Hillsdale, NJ, 87–114. Woll, Bencie (2003): Modality, universality, and the similarities among sign languages: a historical perspective. In: Annie Baker/Beppie van der Bogaerde/Onno Crasborn (Hg.): Crosslinguistic Perspectives in Sign Language Research. Hamburg, 17–30.

Jana Bressem

18. Repetition als Mittel der Musterbildung bei redebegleitenden Gesten Abstract: Dieser Beitrag entfaltet vor dem Hintergrund von Wiederholungen als elementarem Prinzip der Einheitenbildung in Laut- und Gebärdensprachen die These, dass Wiederholungen auch bei redebegleitenden Gesten ein Grundverfahren der Musterbildung darstellen (vgl. Bressem 2012). Ausgehend von der Rolle und Funktion von Wiederholungen als syntagmatischem Mittel in Laut- und Gebärdensprachen werden zwei Klassen von Wiederholungen (Iteration und Reduplikation) als Mittel der Erzeugung gestischer Komplexität diskutiert. Unterschiede in Form-, Bedeutungs- und Strukturaspekten gestischer Wiederholungen werden vorgestellt und anschließend auf deren semantische und grammatische Funktion in multimodalen Äußerungen bezogen. Abschließend wird für Repetition als Grundform sprachlicher Strukturbildung in Rede, Geste und Gebärde und für diagrammatische Ikonizität als Mittel der Typisierung und Grammatikalisierung in Gesten argumentiert. Ein kurzer Ausblick zur aktuellen Forschung von multimodalen Konstruktionen bildet den Abschluss. 1 Einleitung 2 Einheitenbildung mittels Repetition in Rede und Gebärde 3 Mittel der Erzeugung gestischer Komplexität 4 Muster gestischer Einheitenbildung: Iteration und Reduplikation 5 Repetition als Grundform sprachlicher Struktur­bildung in Rede, Gebärde und Geste 6 Ausblick 7 Literatur

1 Einleitung Wenn Menschen kommunizieren, sprechen sie nicht nur mit dem Mund, sondern setzen auch Körperbewegungen ein. Eine wesentliche Rolle übernehmen dabei redebegleitende Gesten, die zusammen mit der Lautsprache als Bestandteile ein und desselben Äußerungs- und Produktionsprozesses verstanden werden: […] this bodily activity is so intimately connected with the activity of speaking that we cannot say that one is dependent upon the other. Speech and movement appear together as manifestations of the same process of utterance. (Kendon 1980, 208)

Mit Rückgriff auf Bühlers funktionale Sprachtheorie (1934) zeigt sich, dass Gesten über ein grundlegendes Sprachpotential verfügen, da sie Aussagen über Gegenstände

Repetition als Mittel der Musterbildung bei redebegleitenden Gesten 

 423

in der Welt ermöglichen (Darstellung), die Kraft haben, das Verhalten anderer zu regulieren (Appell) und Aussagen über den inneren Zustand des Sprechers zu treffen (Ausdruck) (vgl. Müller 1998, 16 ff.; 2013). Im Falle der Abwesenheit von Lautsprache, wie dies bei den Gebärdensprachen Gehörloser der Fall ist, ermöglicht dieses Sprachpotential Gesten, sich zu voll ausgebildeten Sprachen zu entwickeln. Ausgehend von dieser Eigenschaft vertreten neuere Ansätze daher die These, dass Sprache und Gesten auf dieselben strukturellen und semiotischen Prinzipien zurückgreifen, Gesten somit in den Gegenstandsbereich der Grammatik fallen und die Grammatik einer Einzelsprache, wie die des Deutschen, als multimodal zu konzipieren ist (vgl. Fricke 2012 und in diesem Band). Grundlegend für die Konzeption einer multimodalen Grammatik ist dabei, ob Gesten sich zu komplexeren Einheiten verbinden, und wenn ja, wie diese Einheitenbildung zu beschreiben ist und in welchem Wechselverhältnis gestische und lautsprachliche Einheiten in solchen komplexeren Einheiten stehen. Der vorliegende Beitrag setzt an diesem Punkt an und diskutiert das Problem der Muster- und Einheitenbildung anhand repetitiver Sequenzen bei redebegleitenden Gesten. Repetitive Strukturen treten in vielen Zeichensystemen, beispielsweise in der Musik, in der Kunst und im Film, als ein basales Mittel der Zeichenkonstitution auf. Auch in nicht-menschlichen Zeichensystemen, wie dem Vogelgesang oder dem Bienentanz, aber auch in der vokalen und gestischen Kommunikation nicht-humaner Primaten spielen repetitive Muster als Mittel der Strukturbildung eine wesentliche Rolle (vgl. Liebal u. a. 2006). In Laut- und Gebärdensprachen kommen repetitive Strukturen als elementares syntagmatisches sprachliches Mittel auf allen Ebenen als Struktur- und Einheitenbildungsmuster zum Tragen. So werden sie als stilistisches und pragmatisches Mittel zum Ausdruck von Standpunkten genutzt (vgl. Kotschi 2001). Im Spracherwerbsprozess stellen die durch Duplizierung von Silben kreierten rhythmischen Strukturen ein grundlegendes Muster und Mittel in der Erfahrung, Verkörperung und dem Erwerb phonologischer und prosodischer Strukturen einer Sprache dar (vgl. Dressler u. a. 2005). Als morphologisches Mittel übernehmen Wiederholungen in der Wortbildung in Laut- und Gebärdensprachen vielfältige Funktionen (Hurch 2005). Repetitive Strukturen sind daher in vielen Zeichensystemen ein grundlegendes Mittel der Zeichenkonstitu­tion und können demzufolge als kognitive Universalien betrachtet werden. Vor diesem Hintergrund argumentiert dieser Beitrag dafür, dass Wiederholungen auch bei redebegleitenden Gesten ein Grundprinzip der Musterbildung darstellen und durch dieselben strukturellen Prinzipien wie Sprache (Iteration und Rekursion, vgl. Fricke 2012) Einheiten unterschiedlicher Komplexität und Funktionalität bilden. Im Speziellen wird die These vorgestellt, dass Gesten zwei große Klassen von Repetitionen bilden, die sich in Form-, Bedeutungs- und Strukturaspekten unterscheiden und darüber hinaus mit spezifischen semantischen und grammatischen Funktionen in multimodalen Äußerungen einhergehen (vgl. Bressem 2012, 2014). In Bezug auf die medialen Voraussetzungen wird gezeigt, dass Gesten über Strukturen verfügen,

424 

 Jana Bressem

die mit repetitiven Sequenzen in Laut- und Gebärdensprachen vergleichbar sind, zugleich aber auch medial spezifische Muster instanziieren. Diese medialitätsspezifische und modalitätsübergreifende Perspektive trägt zur Untersuchung von Wiederholung als universalem Mittel der Zeichen- und Bedeutungskonstitution in einem weiteren Gegenstandsbereich bei. Der folgende Abschnitt diskutiert die Rolle und Funktion von Wiederholungen in Laut- und Gebärdensprachen und arbeitet modalitätsspezifische Unterschiede bezüglich des Status von Repetitionen heraus. Anschließend werden Mittel der Erzeugung gestischer Komplexität vorgestellt und erste bestehende Untersuchungen gestischer Wiederholungssequenzen im Lichte einer multimodalen Grammatik einer kritischen Überprüfung unterzogen. Diese beiden Stränge werden im vierten Abschnitt zusammengeführt und zwei Typen gestischer Musterbildung vorgeschlagen, die sich in Form-, Bedeutungs- und Strukturaspekten und ihrer semantischen und grammatischen Relevanz für die multimodale Äußerung unterscheiden. Dies wird anhand verschiedener Beispiele illustriert. Im Anschluss wird Repetition als Grundform sprachlicher Strukturbildung in Rede, Geste und Gebärde diskutiert. Den Abschluss bildet ein kurzer Ausblick zur aktuellen Forschung von multimodalen Konstruktionen.

2 Einheitenbildung mittels Repetition in Rede und Gebärde Die Wiederholung sprachlichen Materials wird bereits sehr früh in Lautsprachen als das einfachste Muster zur Herstellung komplexer Einheiten verstanden (vgl. Pott 1862). Gingen diese Untersuchungen noch von einem holistischen Ansatz aus, der die Wiederholung von Phonemen, Silben, Wörtern und Sätzen zusammenfassend betrachtet, werden repetitive Strukturen heute klassischerweise in zwei große Bereiche unterteilt: Repetition und Reduplikation. Bei beiden handelt es sich um ähnliche Phänomene, die durch ein analoges Prinzip, nämlich die Wiederholung sprachlichen Materials, entstehen. Abhängig vom betroffenen sprachlichen Material und vom Grad der Grammatikalisierung übernimmt das Mittel der Wiederholung auf sprachlichen Ebenen verschiedene Funktionen. Während Repetitionen in der Regel dem Bereich der Syntax und des Diskurses zugeordnet werden, wird Reduplikation als morphologisches Mittel zur Bildung neuer Wörter verstanden (Stolz 2007). Phonologische und prosodische Dopplungen, wie beispielsweise die Wiederholung rhythmischer Strukturen, fallen in den Bereich der Repetition. Ebenso dazu zählt rekursive Affigierung, d. h. die mehrmalige Anwendung eines morphologischen Prozesses, wie sie im Deutschen der Bildung von Ur-ur-ur-großmutter zugrunde liegt. Syntaktische Wiederholungen (sehr sehr heiß, schnell schnell), die Wiederholung einer Wortgruppe (Ein Hai, ein Hai ist hinter dir!) oder einer ganzen Äußerung (Lebt wohl, lebt wohl) fallen ebenfalls in den Bereich der Repetition (vgl. Mattes 2014; Schind-

Repetition als Mittel der Musterbildung bei redebegleitenden Gesten 

 425

ler 1991). Als Mittel zur Erzeugung von Aufmerksamkeit und Emphase werden mit ihnen komplexere syntaktische Ausdrücke erzeugt (vgl. Schindler 1991, 601). Auch das mehrfache Vorkommen eines natürlichen Lautes oder anderer nicht-sprachlicher akustischer Phänomene, wie in Onomatopoetika (Kuckuck, Tamtam, Wauwau), werden als Repetitionen klassifiziert. Reduplikation hingegen wird definiert als „systematic repetition of phonological material within a word for semantic or grammatical purposes“ (Rubino 2005, 11) und ist vor allem in nicht-indoeuropäischen Sprachen ein produktives morphologisches Mittel. Reduplikation ist dabei formbasiert und funktional sehr divers. Auf der Ebene der Form muss zwischen totaler Reduplikation, der Wiederholung eines ganzen Stammes oder einer Wurzel und partieller Reduplikation, der partiellen Wiederholung eines Stammes oder einer Wurzel (z. B. Vokal oder Konsonant) unterschieden werden. Das wiederholte Element wird der Basis entweder voran- oder nachgestellt oder in diese eingefügt (siehe Tabelle 1). Tab. 1: Beispiele für Repetition und Reduplikation Totale Reduplikation

Partielle Reduplikation

Indonesisch: orang ,Mann‘ > orang-orang ‚Männer‘ Tausug: dayang ‚Dame‘ > dayangdayang ‚­Prinzessin‘

Französich: fille ‚Mädchen‘ > fi~fille ‚kleines Mädchen‘ Illokano: ag-bása ‚lesen‘ > ag-basbása ‚lesend‘ Deutsch: klimper > klimpimper

Funktional wird Reduplikation für lexikalische Zwecke u. a. zur Bildung von Nomina, indefiniten Pronomina oder zum Ausdruck von Aspekt genutzt. Grammatische Funktion übernimmt Reduplikation u. a. zum Ausdruck von Plural, Numerus und Tempus. Sprachübergreifend stellen die Pluralmarkierung, Verkleinerung und Markierung von Intensität die häufigsten Funktionen dar (vgl. Mattes 2014). Während sich in Lautsprachen eine klare Unterscheidung zwischen Repeti­tion und Reduplikation findet, trennen Untersuchungen zu Wiederholungen in Gebärdensprachen das Phänomen in dieser Eindeutigkeit nicht. So nehmen zwar Channon (2002) und Wilbur (2005) eine funktionale Aufteilung vor (lexikalisch und prosodisch vs. grammatisch), die meisten Untersuchungen subsumieren das Phänomen ‚Wiederholung‘ jedoch unter Reduplikation. Ebenso wie in der Lautsprache ist Reduplikation in Gebärdensprachen ein produktives morphologisches Mittel und formal und funktional divers. Gebärden werden sprachübergreifend vorwiegend im Bewegungsmuster (z. B. kreisförmige elliptische oder beschleunigte Bewegungen), in der Position des Gebärdenraumes (zum Körper, horizontal zur Seite) oder in der Ausführung der Hände (ein- vs. beidhändig) variiert. Vollständige Reduplikation liegt vor, wenn die Gebärde in der gleichen Ausführung (Handform, Bewegung, Position) wiederholt

426 

 Jana Bressem

wird. Partielle Reduplikation ist gegeben, wenn z. B. die Bewegung der wiederholten Segmente reduziert oder verlangsamt ist. Im gesprochenen und geschriebenen Deutsch beispielsweise wird Flexion primär durch eine nicht-repetitive Affigierung angezeigt. In Gebärdensprachen dagegen spielen Repetitionen als Flexionsmarker, z. B. bei Verben und Adjektiven für die Markierung von Aspekt und Numerus, eine große Rolle (Klima/Beluggi 1979, 265 ff.). Anders als Lautsprachen markieren Gebärdensprachen Flexion jedoch intern: Bewegungen werden auf der horizontalen, vertikalen und sagittalen Achse wiederholt oder in unterschiedlichen Räumen im Gebärdenraum positioniert. Bei Nomen markiert Reduplikation sehr häufig den Plural (vgl. Pfau/Steinbach 2006). So drückt die deutsche Gebärdensprache Plural mithilfe von Rückwärts- und Seitwärtsredu­plikation aus, indem die Bewegung der Gebärden durch eine Ausführung zum Körper hin oder horizontal zur Seite variiert wird. Aber auch für die Derivation wird das Mittel der Reduplikation gebraucht. In der Amerikanischen Gebärdensprache werden beispielsweise aus Gebärden, die zeitliche Ereignisse wie ‚Woche‘ oder ‚Monat‘ denotieren, Adverbien abgeleitet. Langsame Wiederholung mit einem großen kreisförmigen Bewegungsverlauf markiert dabei die Dauer (‚für Wochen und Wochen‘) (vgl. Meir 2012, 106). Obwohl Laut- und Gebärdensprachen unterschiedliche Modalitäten nutzen, gebrauchen sie die gleiche Form, nämlich die Wiederholung sprachlichen Materials, für dieselben Zwecke. Modalitätsspezifische Unterschiede zeigen sich vor allem in der Anzahl der wiederholten Segmente und in der Ausbildung bestimmter Formen von Reduplikationen, die in Gebärdensprachen aufgrund der Dreidimensionalität der Modalität möglich sind. Während Segmente in Lautsprachen in der Regel einmal wiederholt werden, sind zwei Wiederholungen in Gebärdensprachen die Regel, mit der Besonderheit, dass mehr als zwei Wiederholungen unbestimmt sind (vgl. Channon 2002). Gebärden markieren daher beispielsweise lexikalische Unterschiede nicht durch die Anzahl der Wiederholungen. In Lautsprachen hingegen ist die Anzahl der Wiederholungen meist kontrastiv. Darüber hinaus haben Gebärdensprachen die Möglichkeit, modalitätsspezifische Muster etwa in der Pluralmarkierung auszubilden (vgl. Pfau/Steinbach 2006). So ist Seitwärtsreduplikation in Lautsprachen nicht möglich, da diese hierzu nicht über die artikulatorischen Möglichkeiten verfügen.

3 Mittel der Erzeugung gestischer Komplexität Aktuelle Forschung zu redebegleitenden Gesten begegnet der Frage, ob Gesten über das Potential verfügen, Einheiten unterschiedlicher Komplexität zu bilden, aus zwei Richtungen. Ausgehend von einem Verständnis, das Sprache und Gesten grundlegend unterschiedliche Eigenschaften zuschreibt, vertritt David McNeill (1992, 2005) die Position, Gesten seien nicht in der Lage, komplexere Einheiten zu bilden. Da

Repetition als Mittel der Musterbildung bei redebegleitenden Gesten 

 427

redebegleitende Gesten, anders als Sprache, von Sprechern individuell im Moment der Äußerung geboren würden, somit über keine Standards und keinen Kode verfügten und ferner als holistische Gestalten lediglich bildliche Bedeutung übermittelten, seien sie grundsätzlich nicht-kombinatorisch und nicht-hierarchisch organisiert. Daraus folgt, dass „two gestures produced together don’t combine to form a larger, more complex gesture. There is no hierarchical structure of gestures made out of other gestures“ (McNeill 1992, 21). Demgegenüber stehen Arbeiten, die im Anschluss an Adam Kendon die Position vertreten, dass gestische Bewegungsmuster zum einen in der Zeit strukturiert und außerdem hierarchisch organisiert sind (vgl. Kendon 1972, 190). Weiterhin können Formmerkmale redebegleitender Gesten unterschiedlich stark konventionalisiert werden, sodass Gesten systematisch bezogen auf die Art und Weise der Merkmale variieren können, die an der Bedeutungsherstellung beteiligt sind (vgl. Kendon 2004). Diese Eigenschaften erlauben es Gesten, auf zwei Weisen Einheiten verschiedener Komplexität zu bilden: simultan und linear. Ähnlich wie Gebärdensprachen werden redebegleitende Gesten mit den Händen artikuliert, die in bestimmter Weise geformt und ausgerichtet, frei im Raum positioniert und bewegt werden können (vgl. Fehrmann in diesem Band). In der Gebärdensprachlinguistik wird diese simultane Komplexität der gebärdenden Hände mit Hilfe von phonologischen Parametern, Bündeln bedeutungsunterschei­dender Merkmale, bestehend aus Handform, Orientierung, Bewegung, Position, näher beschrieben (vgl. Stokoe 1960; Klima/Beluggi 1979). In adaptierter Form werden diese Parameter auch zur Beschreibung gestischer Formen eingesetzt (vgl. Bressem 2013 für einen Überblick über Notationssysteme) und erlauben so einerseits die Identifikation und Segmentation der gleichzeitig auftretenden gestischen Handformen, Bewegungen und Positionen. Andererseits zeigen sie, dass gestische Formen wiederkehrend und sprecherübergreifend mit stabilen Form- und Bedeutungsbeziehungen auftreten und Veränderungen einzelner Form­­­aspekte (z. B. Orientierung der Handfläche) Bedeutungsänderungen nach sich ziehen können (vgl. Kendon 2004; Müller 2004). Das Auftreten solcher Kinaestheme, „intersubjektiv semantisierte[r] gestische[r] Token, deren Ähnlichkeit auf der Ausdrucksseite mit einer Ähnlichkeit auf der Inhaltsseite korreliert“ (Fricke in diesem Band, 54, vgl. auch Fricke 2010), ist dabei Beleg dafür, dass Gesten über eine rudimentäre morphologische und semantische Kompositionalität verfügen (vgl. auch Müller 2004). Redebegleitende Gesten sind jedoch nicht nur simultan komplex, sondern auch in der Zeit strukturiert und hierarchisch organisiert. Zum einen lassen sich gestische Bewegungsabläufe in einzelne Phasen segmentieren (z. B. Ruheposition, Vorbereitung, Ausführung, Rückzug), zum anderen bilden redebegleitende Gesten Einheiten unterschiedlicher Größe und Komplexität, die von kleineren gestischen Phrasen bis hin zu größeren gesture units reichen. Darüber hinaus sind gestische Bewegungseinheiten mit Syntagmen auf der lautsprachlichen Ebene koordiniert (vgl. Kendon 1972, 1980): „sweeps of the arms or movements of the head may be sustained over larger

428 

 Jana Bressem

linguistic units, such as phrases, while eye shifts, wrist and finger movements occur over smaller segments, such as syllables“ (Kendon 1972, 183). Ausgehend von Kendons Konzeption der linearen und hierarchischen Struktur redebegleitender Gesten entwickelt Fricke in ihrer multimodalen Grammatik daher die These, dass Gesten einerseits Konstituentenstrukturen zugewiesen werden können und andererseits über die Eigenschaft der Rekursion in der Lage sind, Einheiten unterschiedlichster Komplexität und Einbettungstiefe zu bilden (vgl. Fricke 2012 und in diesem Band). Besonderen Stellenwert nehmen in Frickes Konzeption gestische Bewegungssequenzen ein, die nicht durch Selbsteinbettung, sondern mithilfe des Prinzips der Iteration und Koordination prinzipiell unendlich lange gestische Ketten bilden können (vgl. Fricke 2012, 165 ff.). Hierbei handelt es sich um zwei Typen von Sequenzen, denen aufgrund artikulatorischer Merkmale unterschiedliche Relevanz für die Bildung komplexer gestischer Einheiten zugesprochen wird (vgl. Kita u. a. 1998). Es sind dies zum einen Sequenzen, in denen aufeinander folgende bedeutungstragende Teile der Gesten (stroke) durch Vorbereitungsphasen (preparation) getrennt sind. Solche Sequenzen liegen Tätigkeitsdarstellungen (z. B. kratzen, hämmern) oder Gesten, die der rhythmischen Struktur der Äußerung folgen (Taktstockgesten, vgl. McNeill 1992), zugrunde. In diesen Fällen sind die strokes durch Aufwärtsbewegungen, die der Vorbereitung der Ausführung dienen, voneinander getrennt (siehe Abbildung 1). Demgegenüber stehen Sequenzen, in denen sich die einzelnen strokes ohne zwischengeschaltete Vorbereitungsphasen einander unmittelbar anschließen, wie dies bei der Darstellung von Gegenständen (z. B. rechteckiger Bilderrahmen) oder Bewegungsabläufen (z. B. Iterativität) der Fall ist. Die Finger zeichnen hier aufeinanderfolgend in mehreren strokes z. B. die Umrisslinie eines Bilderrahmens nach, ohne einzeln vorbereitet zu werden (siehe Abbildung 1). Beide Sequenztypen bilden jedoch nicht nur formbezogen, auf der Ebene der Gestenphasen, unterschiedliche Einheiten, die durch verschiedene Grade der Zusammengehörigkeit gekennzeichnet sind, sondern auch funktional. Als bedeutungstragender Teil einer Geste werden stroke-Phasen in der Regel als bedeutsamste gestische Bewegungsphase aufgefasst, da sie die semantische Information der Geste tragen und in der Regel mit dem lexikalischen Bezugswort in der lautsprachlichen Äußerung koordiniert sind (vgl. z. B. Kendon 1972, 1980; McNeill 1992). Treten bedeutungstragende Phasen ohne zwischengeschaltete Vorbereitungsphasen auf, verfügt diese Einheit über einen stärkeren Grad an Zusammengehörigkeit und überträgt damit zugleich eine komplexere gestische Bedeutung als strokes, die durch Vorbereitungen voneinander getrennt sind. In Frickes Konzeption entsprechen beide Typen unterschiedlichen Arten von Konstituentenstrukturen, die die unterschiedlichen Grade der Zusammengehörigkeit der Sequenzen abbilden. Während preparation-stroke-Sequenzen durch verschiedene Knoten dominiert werden und somit Konstituenten getrennter gesture phrases (GP) sind, bilden stroke-stroke-Sequenzen komplexe stroke-Phasen. Sie sind daher Kon­

Repetition als Mittel der Musterbildung bei redebegleitenden Gesten 

 429

stituenten ein und derselben Gestenphrase und somit durch denselben Knoten dominiert (siehe Abbildung 1). Gesture Unit

Gesture Unit

Preparation

Gesture

Gesture

Gesture

Phrase1

Phrase2

Phrase3

Stroke

Preparation

Phase

Stroke

Kratzbewegung 1

Stroke

Stroke

Phase

Phase

Stroke

Kratzbewegung 2

Stroke1

obere Kante des Bilderrahmens

Retraction Retraction

Stroke2

rechte Kante des Bilderrahmens

Stroke3

untere Kante des Bilderrahmens

Stroke4

linke Kante des Bilderrahmens

Abb. 1: Konstituentenstruktur von gestischen Sequenzen mit und ohne Vorbereitungsphasen (angelehnt an Fricke 2012, 179)

Für stroke-stroke-Sequenzen schlägt Fricke des Weiteren drei Grundtypen vor: erstens Repetitionen, bei denen die einzelnen strokes in ihren Formmerkmalen nicht variieren und alle strokes die gleichen Formparameter instanziieren. Zweitens Reduplikationen, bei denen die einzelnen strokes in einem einzigen Formmerkmal, der Positionierung der Hände im Gestenraum, differieren. Drittens Variationen, bei denen lediglich die Handform über die einzelnen strokes konstant bleibt, alle anderen Formmerkmale aber nicht (vgl. Fricke 2012, 167 ff.). Gestische Komplexität entsteht einerseits auf der Ebene der gestischen Formparameter, andererseits in der linearen Abfolge auf der Ebene der Bewegungsphasen. Redebegleitende Gesten werden jedoch nicht nur allein artikuliert, sondern in der Regel zeitgleich mit Lautsprache geäußert, interagieren mit lautsprachlichen Syntagmen und sind dabei prosodisch, semantisch und pragmatisch eng verbunden (vgl. Kendon 2004; McNeill 1992, 2005). Darüber hinaus sind Rede und Geste auch syntaktisch auf unterschiedlichste Weise aufeinander bezogen. Redebegleitende Gesten sind beispielsweise obligatorisch für den Gebrauch verbaler Deiktika wie so, son oder hier (vgl. Fricke 2007; Streeck 2002), stehen in enger Verbindung mit verbaler Negation (vgl. Harrison 2009) und Wortarten (z. B. Nomen, Verben, Adjektiven) (vgl. Hadar/Krauss 1999) oder werden in syntaktischen Lücken ersetzend für Nomen oder Verben gebraucht (vgl. Ladewig 2012, 2014). Weiterhin können redebegleitende

430 

 Jana Bressem

Gesten in Nominalphrasen das Kernsubstantiv näher bestimmen und als gestisches Attribut fungieren (vgl. Fricke 2012 und in diesem Band). Rede und Geste treten dabei entweder gleichzeitig auf oder sind zeitlich versetzt, wobei Gesten häufiger dem lautsprachlichen Bezugselement vorausgehen als umgekehrt. Auch semantisch können Rede und Geste in unterschiedlichen Beziehungen stehen. Redebegleitende Gesten verfügen über das Potential, Lautsprachliches zu ersetzen, zu ergänzen oder zu modifizieren, sodass durch das Zusammenspiel beider Modalitäten multimodale Äußerungen und Äußerungsbedeutungen entstehen, in denen redebegleitenden Gesten jeweils spezifische Relevanz zukommt. Will man sich im Rahmen einer multimodalen Grammatik also der Grundfrage nähern, wie repetitive Sequenzen in Gesten zur Bildung komplexer Einheiten gebraucht werden und in welchem Wechselverhältnis gestische Wiederholungen mit lautsprachlichen Syntagmen stehen, erfordert dies eine Betrachtung, die gestische Wiederholung auf der Ebene der Form, Bedeutung und Funktion allein und in Relation zur Lautsprache in Betracht zieht. Bisherige Unterscheidungen repetitiver Sequenzen fokussieren entweder gestische Formaspekte (z. B. Fricke 2012; Kita u. a. 1998) oder aber konzentrieren sich in erster Linie auf multimodale Aspekte der Bedeutungsherstellung (z. B. McNeill 1992). Im Folgenden werden wir zeigen, dass eine Betrachtung, die alle Aspekte berücksichtigt, nicht nur die These ermöglicht, dass Gesten über das Prinzip der Wiederholung gestischen Materials zwei große Klassen von Wiederholungen bilden, sondern ebenfalls Gemeinsamkeiten und Unterschiede redebegleitender Gesten mit repetitiven Sequenzen in Laut- und Gebärdensprachen aufzudecken erlaubt.

4 Muster gestischer Einheitenbildung: Iteration und Reduplikation Folgt man Stetter (2005) in der Annahme, dass sich Typenbildung nur im intersubjektiven Gebrauch konstituiert und in der sprachlichen Interaktion hervorgebracht wird, sodass der „type nur in den tokens selbst gefunden werden“ kann (Fricke 2012, 81, Herv. i. Orig.), verlangt dies für die Frage nach Prozessen der Musterbildung in multimodalen Äußerungen und redebegleitenden Gesten eine sprachgebrauchs- und datenbezogene Perspektive. Basierend auf einer korpuslinguistischen Untersuchung und der These Frickes (2012 und in diesem Band), dass auch Körperbewegungen semantisiert und zu Typen werden können, zeigt Bressem (2012), dass redebegleitende Gesten mit dem Prinzip der Iteration zwei Typen repetitiver Sequenzen bilden: 1) Iterationen, in denen die Wiederholung gestischen Materials in einer mehrmaligen Wiederholung ein und derselben gestischen Bedeutung resultiert und nicht zur Herstellung einer komplexen gestischen Bedeutung führt. 2) Reduplikationen, in denen die strokes einzelne gestische Bedeutungen ausdrücken und eine zusammenhängende

Repetition als Mittel der Musterbildung bei redebegleitenden Gesten 

 431

Reduplikationskonstruktion bilden, die zur Bildung einer komplexen gestischen Bedeutung führt. Diese semantische Klassifikation repetitiver gestischer Sequenzen ist in Form, Bedeutungs- und Strukturaspekten sowie in unterschiedlichen grammatischen Funktionen dieser Sequenzen in multimodalen Äußerungen begründet. Im Folgenden werden die Termini ‚Iteration‘ und ‚Reduplikation‘ als Bezeichnung für die identifizierten Muster gestischer Repetition verwendet. Wir unterscheiden damit zwischen dem zugrundeliegenden Iterationsprinzip und den entstehenden Mustern, die oben definitorisch eingeführt wurden. Auf der Ebene der gestischen Form umfassen Iterationen Sequenzen von mindestens zwei preparation-stroke- oder stroke-stroke-Phasen. Reduplikationen sind hingegen lediglich auf stroke-stroke-Sequenzen beschränkt. Reduplikationen setzen sich also ausschließlich aus expressiven und bedeutungstragenden Gestenphasen zusammen, während bei Iterationen die expressiven Phasen durch Vorbereitungen voneinander getrennt sind. In beiden Fällen entstehen somit auf der Ebene der Bewegungsphasen unterschiedliche Grade der Zusammengehörigkeit. Auf der paradigmatischen Ebene nach Formparametern zeigt sich, dass beide Typen nicht mehr als zwei Formparameter gleichzeitig verändern, diese Variation nur bestimmte Parameter betrifft und zudem über die beiden Typen spezifisch verteilt ist. Iterationen bleiben in ihren Formmerkmalen über die einzelnen strokes konstant und ändern sich nicht. Treten Änderungen auf, betreffen diese die Bewegungsrichtung, Bewegungsqualität oder die Position der Hände im Gestenraum. Bei Reduplikationen variieren die strokes grundsätzlich in Formmerkmalen und dabei auf zwei Weisen: Die einzelnen strokes verändern sich in der Bewegungsrichtung und der Position oder unterscheiden sich nur in der Positionierung der Hände im Gestenraum (vgl. Fricke 2012). Im Hinblick auf die Länge der Sequenzen zeigt sich ein weiterer charakteristischer Gegensatz zwischen beiden Mustern. Während die meisten repetitiven Sequenzen zwei, höchstens drei strokes umfassen, gibt es nur bei Iterationen einen Spielraum, der Sequenzen von zwei bis zu neun strokes erlaubt. Für die Ebene der Bedeutung lassen sich für beide Typen ebenfalls unterschiedliche Eigenschaften identifizieren, die nicht nur für die Frage gestischer Einheitenbildung, sondern vor allem auch für Grammatikalisierungsprozesse in redebegleitenden Gesten interessant sind. Iterationen werden primär gebraucht, um auf konkrete und abstrakte Handlungen, Objekte und Ereignisse Bezug zu nehmen. So werden Iterationen eingesetzt, um beispielsweise Handlungsvollzüge wie kratzen, hämmern oder schlagen darzustellen (vgl. Beispiel 1 in Abbildung 2). Die Wiederholung der einzelnen strokes ist in diesem Fall konstitutives Merkmal der Iterativität der Handlungen selbst. Dienen Iterationen der Darstellung von Objekten (vgl. Beispiel 2 in Abbildung 2), ist die Repetition notwendiges Mittel zur Darstellung von Umrissen oder Ausdehnungen von Gegenständen. Werden Iterationen meta-kommunikativ und diskursstrukturierend eingesetzt, heben sie für den Sprecher zentrale Äußerungsaspekte hervor (vgl. Beispiel 3 in Abbildung 2).

432 

 Jana Bressem

Beispiel 1: Arko

Beispiel 2: Metallding

Beispiel 3: Waffen

rennt er in flur, kratzt.

wo die flasche w´Ein da in som metAllding drinne is,

wenn sie d`A – ERNst meinen,

Die flache Hand, mit der Handfläche nach unten, führt dreimalig eine gebogene Bewegung zum Körper der Sprecherin aus.

Die gewölbten Hände, mit der Handfläche nach unten, führen drei gebogene laterale Bewegungen nach außen und innen aus.

Die Hand ist zu einem Ring geformt und wird vier Mal mit vergrößerten und akzentuierten Bewegungen nach oben und unten bewegt.

Abb. 2: Gestische Iterationen zur Darstellung konkreter und abstrakter Handlungen, Objekte und Ereignisse (Zeichnungen: Mathias Roloff)

Reduplikationen hingegen werden primär für die Bezugnahme auf Abstrakta gebraucht und tragen, je nach Reduplikationstyp, lexikalische oder grammatische Bedeutung. Im Fall von Reduplikationen, in denen sich die einzelnen strokes in der Bewegungsrichtung und der Positionierung im Gestenraum ändern, dienen die Repetitionen der Darstellung der Aktionsart ‚Iterativität‘ (vgl. Beispiel 4 in Abbildung 3). Wiederholung wird „als zeitliche Verlaufsstruktur […] sprachlich und gestisch als wiederholter Bewegungsverlauf konzeptualisiert“, der sich zwischen zwei Endpunkten ausbreitet (Müller 2000, 221). Variieren die einzelnen strokes lediglich in der Positionierung der Hände im Gestenraum, trägt die Repetition die Bedeutung ‚Plural‘ (vgl. Beispiel 5 in Abbildung 3). Der Gestenraum vor dem Körper des Sprechers wird nichtmimetisch zur Herstellung struktureller Relationen zwischen strokes genutzt (vgl. Müller/Tag 2010). Die einzelnen strokes markieren individuelle Bereiche im Gestenraum, die über zeitliche und räumliche Nähe und die nur geringe Formvariation den Eindruck einer Sequenz von ähnlichen, aber unterschiedlichen Bereichen im Raum und somit die Vorstellung von Mehrzahl entstehen lassen.

Repetition als Mittel der Musterbildung bei redebegleitenden Gesten 

 433

Beispiel 4: hin und her

Beispiel 5: einzelnen Schritte

dInge immer zwischen zwei ÄMtern hin und hErschickt,

kannste dir ja immer die Einzelnen schritte d´URCHlesen,

Der gestreckte Zeigefinger wird drei Mal mit einer gebogenen Bewegung vom und auf den Körper zu bewegt.

Die flache Hand, mit der Handfläche nach unten, führt drei gebogene Bewegungen nach unten aus.

Abb. 3: Gestische Reduplikationen zur Darstellung abstrakter Handlungen, Objekte und Ereignisse (Zeichnungen: Mathias Roloff)

Auch für die Herstellung multimodaler Äußerungen und Äußerungsbedeutungen nehmen beide Klassen gestischer Repetitionen unterschiedliche Rollen ein. Die Mehrzahl aller Repetitionen überlappt mit dem verbalen Bezugselement, ist jedoch in ihrem Einfluss auf deren Semantik unterschiedlich. Reduplikationen sind bezogen auf die semantischen Merkmale der lautsprachlichen Äußerung redundant. Wie auch die lautsprachliche Äußerung trägt die gestische Reduplikationskonstruktion lexikalische (Iterativität) oder grammatische Bedeutung (Plural), drückt somit verbsemantische und grammatische Bedeutungsaspekte in einer weiteren Modalität aus und muss in ihrer semantischen Funktion für die Herstellung einer multimodalen Äußerungsbedeutung als unterstützend beschrieben werden. Iterationen hingegen untermalen die Semantik der Äußerung nicht nur, sondern tragen zur semantischen Modifikation der verbalen Bezugsgröße bei. Stellen Iterationen Handlungen oder Objekte dar, ergänzen und spezifizieren sie die im Verb geäußerte Handlung hinsichtlich der Art und Weise (vgl. Beispiel 1) oder das Objekt hinsichtlich Form und Größe (vgl. Beispiel 2). Diese unterschiedliche Tiefe der semantischen Integration spiegelt sich auch in einer anderen Integrationstiefe auf der Ebene der Syntax wider. Die Mehrzahl der Repetitionen ist über zeitliche Überlappung, d. h. die gleichzeitige Ausführung mit dem verbalen Bezugselement, in die lautsprachliche Äußerung integriert. Iterationen, die Objekte in ihrer Größe und Form näher beschreiben, überlappen dabei mit Nomen oder Nominalphrasen der lautsprachlichen Äußerung. In diesem Sinne können sie, wie Fricke (2012) gezeigt hat, als gestische Attribute klassifiziert werden, da sie die

434 

 Jana Bressem

Extension des Kernsubstantivs der Nominalphrase spezifizieren und einschränken können. Iterationen hingegen, die Handlungen in ihrer Art und Weise näher beschreiben, überlappen in der Regel mit Verben oder Verbalphrasen und modifizieren damit das Verb des lautsprachlichen koexpressiven Segments. In dieser Funktion sind Iterationen mit adverbialen Adjektiven (vgl. Eisenberg 1999, 225) vergleichbar. Reduplikationen zeigen ebenfalls typische Muster der Korrelation mit lautsprachlichen Segmenten. Zur Darstellung von Iterativität korrelieren sie überwiegend mit Verbalphrasen. Zeigen sie Plural an, neigen sie dazu, nicht nur einzelne Phrasen, sondern ganze Äußerungen zu umspannen. Aufgrund ihrer semantischen Redundanz können Reduplikationen jedoch nicht in gleichem Ausmaß wie Iterationen die syntaktische Funktion eines Modifikators übernehmen. Gestischen Repetitionen kommt folglich semantisch und syntaktisch ein unterschiedlicher Stellenwert für die Herstellung multimodaler Äußerungen zu. Gründe hierfür sind auf der Ebene der gestischen Einheit selbst und der Fundierung und Loslösung der Wiederholungen in und von körperlichen und visuellen Erfahrungen zu finden. Iterationen werden überwiegend zur Nachahmung von Handlungen der Hand und Konkreta gebraucht, konzeptualisieren kinästhetische Erfahrungen und beruhen somit direkt auf körperlichen Erfahrungen. Sie stellen zusätzliche semantische Merkmale zur Verfügung, die für das Verständnis der multimodalen Äußerung notwendig sind, und sind daher eng mit dem lautsprachlichen Bezugselement und der Äußerung verbunden. Repetition dient dabei stets zur Herstellung einer zusammenhängenden gestischen Formeinheit, die über Ähnlichkeiten der Form und Gestaltprinzipien als zusammenhängend markiert und wahrgenommen wird (vgl. Bressem 2012). Unabhängig von der Anzahl der ausgeführten strokes instanziieren die einzelnen strokes ein und dieselbe gestische Bedeutung. Reduplikationen heben sich diesbezüglich grundlegend von Iterationen ab. Die Wiederholung einzelner strokes resultiert in der Herstellung einer komplexen gestischen Bedeutungseinheit, die auf den Teilbedeutungen der einzelnen strokes und der mit der Wiederholung verbundenen semantischen Veränderung beruht. Das abstrakte Muster des Kopierens ermöglicht die Herstellung einer gestischen Reduplikationskonstruktion, die „eine Bedeutung aufweist, die zwar auf der Bedeutung der Ausgangsform basiert, aber von ihr verschieden ist“ (Stolz 2008, 57). Die Kon­ struktion ist dabei ein verfestigtes Muster im Sinne Schneiders, d. h. ein komplexes Zeichenschema, das als „Ganze[s] eine eigenständige Bedeutung bzw. Diskursfunktion aufweis[t], […] die auch unabhängig von speziellen Äußerungskontexten als ‚Semiosepotenzial‘ […] beschreibbar ist“ (Schneider in diesem Band, 133). Dass ­Reduplikationen anders als Iterationen keine direkten kinästhetischen Erfahrungen verkörpern, sondern primär visuelle Wahrnehmungen nachahmen, die mit anderen und komplexeren Prozessen der Abstraktion einhergehen, ist Voraussetzung für die Entstehung dieser Reduplikationskonstruktion. Die in der Konstruktion angelegte eigenständige gestische Bedeutung hat wiederum zur Folge, dass Reduplikationen die Semantik der lautsprachlichen Äußerung nicht in gleichem Maße beeinflussen

Repetition als Mittel der Musterbildung bei redebegleitenden Gesten 

 435

wie Iterationen. Vielmehr verkörpern sie den semantischen Kern der Äußerung in einer weiteren Modalität und sind somit auf der Ebene der Semantik weniger stark in die lautsprachliche Äußerung integriert. Darüber hinaus führt die Konstruktionsbedeutung zu einer Ablösung von der Syntax der Verbalsprache und erlaubt den Ausdruck von Plural, ohne zwingend auf eine Überlappung mit bestimmten lautsprachlichen Einheiten angewiesen zu sein.

5 Repetition als Grundform sprachlicher Struktur­ bildung in Rede, Gebärde und Geste Der vorhergehende Abschnitt hat Repetition als Mittel zur gestischen Musterbildung bei redebegleitenden Gesten auf der Ebene der Form, Bedeutung und Funk­tion und die Rolle repetitiver Sequenzen in der Herstellung multimodaler Äußerungen und Äußerungsbedeutungen diskutiert. Am Ende des zweiten Abschnitts wurden Gemeinsamkeiten und Unterschiede im Gebrauch des Prinzips Wiederholung in Laut- und Gebärdensprachen herausgearbeitet. Im Folgenden werden diese beiden Stränge nun mit den für redebegleitende Gesten identifizierten Mustern in Relation gesetzt und die These vertreten, dass Wiederholung eine Grundform sprachlicher Strukturbildung ist, die als unabhängig von der artikulatorischen Modalität zu verstehen ist, somit als modalitätsübergreifend charakterisiert werden kann, jedoch gleichzeitig medialitätsspezifische Ausprägungen aufweist. Zur Stützung dieser These werden die von Gil (2005) vorgestellten Kriterien zur Unterscheidung von Repetitionen und Reduplikation in Lautsprachen herangezogen. Ausgehend von einer Kritik an lautsprachlichen Klassifikationen, die auf der Einheit ‚Wort‘ basieren, schlägt Gil Kriterien vor, die neben dem Kriterium ‚Wort‘ noch zusätzliche formbasierte, aber auch semantische und funktionale Merkmale beinhalten (vgl. Tabelle 2). Als formbasierte Kriterien führt Gil neben der Größe der Zieleinheit, der Kontiguität und der Anzahl der kopierten Einheiten die Verschränkung der Wiederholung mit der Intonationsstruktur der Äußerung auf. Werden in lautsprachlichen Repetitionen zwei oder mehr Segmente wiederholt, die angrenzend oder getrennt sein können und innerhalb einer oder mehrerer Intonationsgruppen vorkommen können, sind in Reduplikationen die kopierten Segmente einander stets benachbart, bestehen in der Regel aus zwei Segmenten und kommen nur innerhalb einer Intonationseinheit vor. Alle diese Merkmale treffen ebenso auf gestische Iterationen und Reduplikation zu. Bei Iterationen und Reduplikationen sind strokes entweder durch Vorbereitungsphasen voneinander getrennt oder schließen sich einander direkt an. Während Reduplikationen normalerweise aus Sequenzen von nicht mehr als drei strokes bestehen, können Itera­tionen aus bis zu neun strokes aufgebaut sein. Umschließt die Mehrzahl aller gestischen Repetitionen in der Regel eine Intonations-

436 

 Jana Bressem

einheit, können Iterationen mit bis zu sechs Intonationseinheiten einhergehen (vgl. Bressem 2012). Tab. 2: Kriterien zur Unterscheidung von Repetition und Reduplikation (adaptiert von Gil 2005, 37) Kriterium Formbezogen

Repetition

Reduplikation

Zieleinheit

Größer als Wort

Kontiguität der Kopien

Angrenzend oder getrennt Zwei oder mehr Innerhalb einer oder mehrerer Intonations­ einheiten Ikonisch oder nicht vorhanden Vorhanden oder ­abwesend

Gleich oder kleiner als Wort Angrenzend

Anzahl der Kopien Intonationsbereich der Zieleinheit Semantisch

Bedeutung

Funktional

Kommunikative ­Verstärkung

i. d. R. zwei Innerhalb einer ­Intonationsgruppe Arbiträr oder ikonisch Abwesend

Neben den formbasierten sind auch die semantischen und funktionalen Kriterien auf repetitive Sequenzen in redebegleitenden Gesten anwendbar. Verfügen Repetitionen in Lautsprachen in der Regel über keine eigenständige Bedeutung, geht Reduplikation mit Bedeutungen einher, die arbiträr oder ikonisch motiviert sind. So wird Reduplikation sprachübergreifend zur Markierung von Plural, Aspekt, Intensivierung oder Menge/Zahl gebraucht (vgl. Mattes 2014). Repetitionen hingegen dienen der Erzeugung bestimmter Effekte, Veränderungen auf der konnotativen Ebene oder werden für stilistische, textuelle oder pragmatische Zwecke eingesetzt (vgl. Kotschi 2001; Stolz 2007). Daran anknüpfend ist die Funktion der beiden Muster in Lautsprachen unterschiedlich. Für Repetitionen ist das Moment der kommunikativen Verstärkung, d. h. der Gebrauch von Wiederholung zur Steuerung der Aufmerksamkeit charakteristisch. Für Reduplikationen trifft dies nicht zu. Ähnliche semantische und funktionale Charakteristika finden sich auch für gestische Wiederholungen und dabei in spezifischer Ausprägung je nach Wiederholungstyp. Ist die Bedeutung gestischer Reduplikationen ikonisch motiviert und beruht auf dem Prinzip der diagrammatischen Ikonizität (siehe Abschnitt 6), sind Iterationen in metonymischen Relationen zu Handlungen und Objekten begründet (vgl. Mittelberg 2010 zu Aspekten der Metonymie in Gesten). Kommunikative Verstärkung spielt eine wesentliche Rolle in Iterationen. So markieren Iterationen einerseits den Fokus der Aufmerksamkeit (vgl. Chafe 1994). Andererseits können sie sich von sprachlichen Figur-Grund Strukturen ablösen und eigenständige Markierungen von Aufmerksamkeitsfoki realisieren (vgl. Bressem 2012 für eine Diskussion gestischer Wiederholung unter dem Blickwinkel der Aufmerksamkeitssteuerung). In gestischen

Repetition als Mittel der Musterbildung bei redebegleitenden Gesten 

 437

Reduplikationen hingegen ist kommunikative Verstärkung in diesem Sinne nicht relevant. Abgesehen von diesen Gemeinsamkeiten mit Wiederholungsmustern in Lautsprachen zeigen sich interessante Überschneidungen mit Reduplikationen in Gebärdensprachen. In Gesten und Gebärden wird Reduplikation zur Markierung von Iterativität und Plural genutzt. Des Weiteren teilen beide auch auf der paradigmatischen Ebene der Formparameter bestimmte Merkmale. In Gebärdensprachen wird Aspekt oder Aktionsart durch Modulation der Bewegung ausgedrückt. Die Markierung von Plural erfolgt durch die Wiederholung von Gebärden auf der horizontalen, vertikalen oder sagittalen Achse (vgl. Klima/Beluggi 1979; Pfau/Steinbach 2006). In gestischen Reduplikationen lassen sich ähnliche Veränderungen der Formparameter dokumentieren. Gesten gebrauchen daher eine analoge Struktur für eine vergleichbare Funktion. Da redebegleitende Gesten und Gebärden die gleiche Modalität nutzen, überraschen diese Gemeinsamkeiten nicht, werfen aber zugleich die Frage auf, ob gestische Formen des Ausdrucks und der Markierung von Iterativität und Mehrzahl Grundlage für gebärdensprachliche Grammatikalisierungsprozesse sein könnten, wie es z. B. von Wilcox (2007) bereits für Modalverben oder die Markierung von Aspekt gezeigt wurde. Zusammenfassend lässt sich bezogen auf das Phänomen der Reduplikation das Argument, es handle sich hierbei um ein modalitätsunabhängiges Mittel in Lautund Gebärdensprachen (vgl. Pfau/Steinbach 2006), aufgrund der identifizierten Gemeinsamkeiten nun auch auf redebegleitende Gesten ausweiten. Wie aber kommt es zu diesen Gemeinsamkeiten in Rede, Gebärde und Geste? Unsere These zur Beantwortung dieser Frage lautet wie folgt: In Anlehnung an Stolz (2008) gehen wir davon aus, dass das abstrakte Prinzip des Mehrfachsetzens durch Kopieren in Reduplikationen ein semiotisch basales Mittel ist, das den Grundstein für ähnliche formbasierte und semantische Strukturen in der verbalen und visuellen Modalität legt. Darüber hinaus nehmen wir an, dass Reduplikation in Rede, Gebärde und Geste auf diagrammatischer Ikonizität (vgl. Peirce 1960) – relative Motiviertheit in der Terminologie Saussures (2001) – beruht. Überschneidungen in Rede, Gebärde und Geste sind daher in einem allgemeinen Prinzip begründet, das auf dem Kopieren von Segmenten, ihrer strukturellen Anordnung und der daraus entstehenden Ikonizität basiert. Diagrammatische Ikonizität ist als strukturelles Prinzip auf einer Reihe von Ebenen des Sprachsystems aktiv und untermauert die systematische Bildung von Zeichen in komplexere Zeichen wie z. B. Wörter, Phrasen oder Sätze. Anders als in Fällen bildlicher Ikonizität, in denen eine physische Ähnlichkeitsbeziehung zwischen der Form und der Bedeutung der Zeichen besteht, beruht diagrammatische Ikonizität auf Ähnlichkeiten, die in Abfolgerelationen komplexer Zeichen bestehen. Relationen des Ausdrucks werden auf Relationen des Inhalts abgebildet. So wird die lineare Abfolge von Zeichen genutzt, um Abfolge in Raum und Zeit, Kontinuität, Dauer oder Bewegung auszudrücken (Pusch 2001). In Laut- und Gebärdensprachen wird Reduplikation in der Regel als diagrammatisch ikonisch hinsichtlich der seman-

438 

 Jana Bressem

tischen Klasse ‚mehr‘ und somit z. B. für die Markierung von Plural, Iterativität, Intensivierung aufgefasst. Dabei werden laut- oder gebärdensprachliche Reduplikationen als ikonisch bezogen auf Quantität (mehr der gleichen Form) und Komplexität (reduplizierte Wortform ist semantisch komplexer als die nichtreduplizierte) verstanden und entsprechen daher der allgemeinen Charakterisierung von Reduplikation: „Was semantisch ‚mehr‘/komplexer ist, sollte auch in der Kodierung als ‚mehr‘/merkmalhafter aufscheinen“ (Mayerthaler 1980, 20). Auch bei repetitiven Sequenzen in Gesten sind vergleichbare Strukturen zu identifizieren. Ähnlich wie in Rede und Gebärde sind gestische Reduplikationen ikonisch bezogen auf den Aspekt der Quantität und der Komplexität. Ein Mehr von der gleichen Form führt zu einer Veränderung in der Quantität, und zwar entweder hinsichtlich der Anzahl der Einheiten (Plural) oder des Vorkommens von Ereignissen (Iterativität). Darüber hinaus trifft auch das Merkmal der semantischen Komplexität auf gestische Repetitionen zu. Die Bedeutung der einzelnen strokes ist semantisch weniger komplex als die Bedeutung aller strokes zusammengenommen, sodass die Reduplikationskonstruktion eine komplexere Gesamtbedeutung trägt. Beide Aspekte, Quantität und Komplexität, scheinen auch in Konstruktionen zum Tragen zu kommen, die in der Literatur hinsichtlich des Ausdrucks von ‚Intensivierung‘ beschrieben werden (vgl. Müller/Tag 2010). In diesen Fällen wird, vergleichbar mit Fällen von Iterativität und Plural, die Posi­tion der Hände sukzessive verändert, nicht jedoch in der Bewegungsrichtung oder der horizontalen Anordnung. Vielmehr markieren die Hände unterschiedliche Bereiche vor dem Körper des Sprechers, indem sie vertikal nach oben geführt werden. Diagrammatische Ikonizität in Reduplikationen geht darüber hinaus mit Grammatikalisierungsprozessen einher. Kennzeichnend für Grammatikalisierung ist „semantic development from a concrete to an abstract meaning of unit, that is grammaticized“ (Hurch/Mattes 2005, 9). Eine solche Entwicklung lässt sich auch für die diskutierten repetitiven Sequenzen redebegleitender Gesten beobachten. Sind gestische Iterationen direkt mit körperlicher Erfahrung verbunden, zeichnen gestische Reduplikationen einen sukzessiven Prozess der Abstraktion von körperlichen oder visuellen Erfahrungen nach. Dieser Abstraktionsprozess rückt z. B. nicht das tatsächliche Bewegungsereignis, sondern die lexikalische Basis der Aktionsart in den Vordergrund. Eine noch stärkere Abstraktion erlaubt es dann auch, Konzepte wie ‚Plural‘ oder ‚Intensivierung‘ durch die unterschiedliche Positionierung der Hände in Relation zueinander auszudrücken. Diagrammatische Ikonizität fungiert demzufolge auch in redebegleitenden Gesten als Mittel der Schemabildung und ermöglicht die Bildung von Konstruk­tionen. Mit dieser Argumentation schließen wir uns Fricke (2012, 86) an, die mit Bezug auf Saussure die These vertritt, dass relative Motiviertheit nicht nur ein Grundgerüst grammatischer „Konstruktionsregeln“ in Lautsprachen ist, sondern auch als Mittel der Typisierung und als Indikator für rudimentäre Grammatikalisierungsprozesse bei redebegleitenden Gesten verstanden werden kann.

Repetition als Mittel der Musterbildung bei redebegleitenden Gesten 

 439

6 Ausblick Der Beitrag hat am Beispiel repetitiver Sequenzen gezeigt, dass Wiederholung auch bei redebegleitenden Gesten ein Grundprinzip der Musterbildung darstellt und mittels Repetition unterschiedlich komplexe Einheiten und Zeichenschemata in redebegleitenden Gesten entstehen können. Im Vergleich zu dem Phänomen in Laut- und Gebärdensprachen sind modalitätsübergreifende, aber auch medialitätsspezifische Charakteristika aufgedeckt worden, die zum einen deutlich machen, dass in Gesten Formen sprachlicher Strukturbildung, Bedeutung und Funktionen zum Vorschein kommen, die sich in wesentlichen Zügen mit denen der Lautsprache und der Gebärdensprache decken, Gesten auf der anderen Seite auch durch das Vorhandensein der lautsprachlichen Äußerung eigenständige Muster herausbilden. Bei Reduplikation wurde vor allem die Relevanz diagrammatischer Ikonizität im Prozess gestischer Schemabildung und Grammatikalisierung diskutiert. Dabei wurde von einer Reduplikationskonstruktion ausgegangen, der auf Basis der diagrammatischen Ikonizität die Grundstruktur ‚mehr Form = mehr Bedeutung‘ zugrunde liegt. Diese Reduplikationskonstruktion kann als ein Beispiel für Schemabildung in redebegleitenden Gesten gelten, bei der Gesten selbst in der Lage sind, unabhängig von Lautsprache komplexe Zeichenschemata zu bilden. Betrachtet man jedoch die für redebegleitende Gesten dokumentierte rekurrente Korrelation mit syntaktischen Einheiten (z. B. Nomen und Verben) und die jeweils unterschiedliche syntaktische Integrationstiefe, wie sie auch für gestische Iterationen und Reduplikation dokumentiert wurde, stellt sich die Frage, ob auch hier komplexe Zeichenschemata zu finden sind und möglicherweise multimodale Konstruktionen angenommen werden können. In der Forschung zur Multimodalität und Interaktionsforschung finden sich in jüngster Zeit zahlreiche Vorschläge, den Gegenstandsbereich der Konstruktionsgrammatik multimodal auszuweiten und der fehlenden Fokussierung der Medialität in klassischen Ansätzen, wie sie auch von Schneider (in diesem Band) bemängelt wird, entgegenzutreten (z. B. Andrén 2010; Imo 2008; Zima 2014). So gibt es – in der Regel ausgehend von einer rekurrenten Korrelation von Sprache mit anderen Modalitäten, wie beispielsweise Geste, Blick oder Schulterbewegungen – Untersuchungen zu Diskursund Modalpartikeln und Transitivkonstruktionen mit dem Ziel, die theoretische und methodologische Basis für die Anwendung des Konzepts einer multimodalen Konstruktion auszuloten und das Wissen darüber, was als multimodale Konstruktion verstanden und beschrieben werden kann, auszuweiten. Vor dem Hintergrund der in diesem Beitrag diskutierten Reduplikationskonstruktion, die als Muster der Schemabildung allein auf der Ebene der Gesten identifiziert wurde, zeigt sich, welches Potential Gesten selbst und unabhängig von der Lautsprache hinsichtlich der Herstellung komplexer Zeichenschemata innewohnt. Forschung zu multimodalen Konstruktionen muss daher nicht nur der Medialität von Sprache Rechnung tragen, sondern insbesondere das Potential redebegleitender Gesten als Ausdrucksmedium ernst nehmen und deutlich machen, welche Rolle Gesten für die Herstellung multimodaler

440 

 Jana Bressem

Konstruktionen spielen, ohne Gesten dabei als bloßen Ausdruck der verbalen Kon­ struktionsbedeutung in der visuellen Modalität zu verstehen.

7 Literatur Andrén, Mats (2010): Children’s Gestures from 18 to 30 Months. Lund. Bressem, Jana (2012): Repetitions in Gesture: Structures, Functions, and Cognitive Aspects. Frankfurt (Oder). Bressem, Jana (2013): Transcription systems for gestures, speech, prosody, postures, gaze. In: Cornelia Müller u. a. (Hg.): Body – Language – Communication. An International Handbook on Multimodality in Human Interaction. Berlin/Boston (Handbooks of Linguistics and Communication Science, 38.1), 1037–1058. Bressem, Jana (2014): Repetitions in gesture. In: Cornelia Müller u. a. (Hg.): Body – Language – Communication. An International Handbook on Multimodality in Human Interaction. Berlin/ Boston (Handbooks of Linguistics and Communication Science, 38.2), 1641–1649. Bühler, Karl (1934): Sprachtheorie. Die Darstellungsfunktion der Sprache. Jena. Chafe, Wallace L. (1994): Discourse, Consciousness, and Time: The Flow and Displacement of Conscious Experience in Speaking and Writing. Chicago. Channon, Rachel (2002): Beads on a string? Representations of repetition in spoken and signed languages. In: Richard P. Meier u. a. (Hg.): Modality and Structure in Signed and Spoken Languages. Cambridge, 65–87. Dressler, Wolfgang u. a. (2005): Reduplication in child language. In: Hurch, 454–474. Eisenberg, Peter (1999): Grundriß der deutschen Grammatik. Band 2: Der Satz. Stuttgart/Weimar. Fricke, Ellen (2007): Origo, Geste und Raum: Lokaldeixis im Deutschen. Berlin. Fricke, Ellen (2010): Phonaestheme, Kinaestheme und multimodale Grammatik: Wie Artikulationen zu Typen werden, die bedeuten können. In: Sprache und Literatur 41 (1), 70–88. Fricke, Ellen (2012): Grammatik multimodal: Wie Wörter und Gesten zusammenwirken. Berlin. Gil, David (2005): From repetition to reduplication in Riau Indonesian. In: Hurch, 31–63. Hadar, Uri/Robert Krauss (1999): Iconic gestures: The grammatical categories of lexical affiliates. In: Journal of Neurolinguistics 12, 1–12. Harrison, Simon (2009): Grammar, Gesture, and Cognition: The Case of Negation in English. Bourdeaux. Hurch, Bernhard (Hg.) (2005): Studies on Reduplication. Berlin u. a. (Empirical Approaches to Language Typology, 28). Hurch, Bernhard/Veronika Mattes (2005): Über die Entstehung von partieller Reduplikation. In: Gertraud Fenk-Ozclon/Christian Winkler (Hg.): Sprache und Natürlichkeit – Gedenkband für Willi Mayerthaler. Tübingen, 137–156. Imo, Wolfgang (2008): Individuelle Konstrukte oder Vorboten einer neuen Konstruktion? Stellungsvarianten der Modalpartikel halt im Vor- und Nachfeld. In: Anatol Stefanowitsch/ Kerstin Fischer (Hg.): Konstruktionsgrammatik II. Von der Konstruktion zur Grammatik. Tübingen, 135–156. Kendon, Adam (1972): Some relationships between body motion and speech. In: Aaron Seigman/ Benjamin Pope (Hg.): Studies in Dyadic Communication. Elmsford/New York, 177–216. Kendon, Adam (1980): Gesticulation and speech: Two aspects of the process of utterance. In: Mary Ritchie Key (Hg.): Nonverbal Communication and Language. The Hague, 207–227. Kendon, Adam (2004): Gesture: Visible Action as Utterance. Cambridge.

Repetition als Mittel der Musterbildung bei redebegleitenden Gesten 

 441

Kita, Sotaro u. a. (1998): Movement phases in signs and cospeech gestures and their transcription by human encoders. In: Ipke Wachsmuth/Martin Fröhlich (Hg.): Gesture and Sign Language in Human-Computer Interaction. Berlin, 23–35. Klima, Edward S./Ursula Beluggi (1979): The Signs of Language. Cambridge. Kotschi, Thomas (2001): Formulierungspraxis als Mittel der Gesprächsaufrechterhaltung. In: Klaus Brinker (Hg.): Text- und Gesprächslinguistik: Ein internationales Handbuch zeitgenössischer Forschung. Berlin, 1340–1348. Ladewig, Silva H. (2012): Syntactic and Semantic Integration of Gestures into Speech: Structural, Cognitive, and Conceptual aspects. Frankfurt (Oder). Ladewig, Silva H. (2014): Creating multimodal utterances. The linear integration of gestures into speech. In: Cornelia Müller u. a. (Hg.): Body – Language – Communication. An International Handbook on Multimodality in Human Interaction. Berlin/Boston (Handbooks of Linguistics and Communication Science, 38.2), 1662–1677. Liebal, Katja u. a. (2006): Gestural communication in orangutans (Pongo pygmaeus). In: Gesture 6 (1), 1–38. Mattes, Veronika (2014): Types of Reduplication: A Case Study of Bikol. Berlin. Mayerthaler, Willi (1980): Ikonismus in der Morphologie. In: Zeitschrift für Semiotik 2, 19–37. McNeill, David (1992): Hand and Mind. What Gestures Reveal about Thought. Chicago. McNeill, David (2005): Gesture and Thought. Chicago. Meir, Irit (2012): Morphology. In: Roland Pfau u. a. (Hg.): Sign Languages. Berlin/Boston, 77–112. Mittelberg, Irene (2010): Interne und externe Metonymie: Jakobsonsche Kontiguitätsbeziehungen in redebegleitenden Gesten. In: Sprache und Literatur 41 (105), 112–143. Müller, Cornelia (1998): Redebegleitende Gesten: Kulturgeschichte, Theorie, Sprachvergleich. Berlin. Müller, Cornelia (2000): Zeit als Raum. Eine kognitiv-semantische Mikroanalyse des sprachlichen und gestischen Ausdrucks von Aktionsarten. In: Ernest W. B. Hess-Lüttich/H. Walter Schmitz (Hg.): Botschaften verstehen. Kommunika­tionstheorie und Zeichenpraxis. Festschrift für Helmut Richter. Frankfurt a. M., 211–228. Müller, Cornelia (2004): Forms and uses of the palm up open hand. A case of a gesture family? In: Cornelia Müller/Roland Posner (Hg.): Semantics and Pragmatics of Everyday Gestures. Berlin, 233–256. Müller, Cornelia (2013): Gestures as a medium of expression: The linguistic potential of gestures. In: Cornelia Müller u. a. (Hg.): Body – Language – Communication. An International Handbook on Multimodality in Human Interaction. Berlin/Boston (Handbooks of Linguistics and Communication Science, 38.1), 202–217. Müller, Cornelia/Susanne Tag (2010): Combining Gestures: Mimetic and Non-mimetic Use of Gesture Space. Frankfurt (Oder). Peirce, Charles S. (1960): Collected Papers of Charles Sanders Peirce (1931–1958). Vol. I: Principles of Philosophy, Vol. II: Elements of Logic. Cambridge. Pfau, Roland/Markus Steinbach (2006): Pluralization in sign and in speech: A cross-modal typological study. In: Linguistic Typology 10 (2), 135–182. Pott, Friedrich (1862): Dopplung (Reduplikation, Gemination) als eines der wichtigsten Bildungsmittel der Sprache beleuchtet aus Sprachen aller Weltteile. Lemgo/Detmold. Pusch, Claus D. (2001): Ikonizität. In: Martin Haspelmath u. a. (Hg.): Language Typology and Language Universals/Sprachtypologie und sprachliche Universalien/La Typologie des Langues et les Universaux Linguistiques. An International Handbook/Ein internationales Handbuch/ Manuel International. Berlin/New York, 369–384. Rubino, Carl (2005): Reduplication: Form, function and distribution. In: Hurch, 11–29.

442 

 Jana Bressem

Saussure, Ferdinand de (2001): Grundfragen der allgemeinen Sprachwissenschaft. Herausgegeben von Charles Bally und Albert Sechehaye unter Mitwirkung von Albert Riedlinger. Übersetzt von Herman Lommel. 3. Auflage. Berlin/New York. Schindler, Wolfgang (1991): Reduplizierende Wortbildung im Deutschen. In: Zeitschrift für Phonetik, Sprachwissenschaft und Kommunikationsforschung 44, 597–613. Stetter, Christian (2005): System und Performanz. Symboltheoretische Grundlagen von Medientheorie und Sprachwissenschaft. Weilerswist. Stokoe, William (1960): Sign Language Structure. Buffalo. Stolz, Thomas (2007): Das ist doch keine Reduplikation! Über falsche Freunde bei der Suche nach richtigen Beispielen. In: Andreas Ammann/Aina Urdze (Hg.): Wiederholung, Parallelismus, Reduplikation: Strategien der multiplen Strukturanwendung. Bochum, 47–81. Stolz, Thomas (2008): Grammatikalisierung ex nihilo. Totale Reduplikation – ein potentielles Universale und sein Verhältnis zur Grammatikalisierung. In: Thomas Stolz (Hg.): Grammatikalisierung und grammatische Kategorie. Bochum, 83–109. Streeck, Jürgen (2002): Grammars, words, and embodied meanings: On the uses and evolution of so and like. In: The Journal of Communication 52 (3), 581–596. Wilbur, Ronnie B. (2005): A reanalysis of reduplication in American Sign Language. In: Hurch, 594–623. Wilcox, Sherman (2007): Routes from gesture to language. In: Elena Pizzuto u. a. (Hg.): Verbal and Signed Languages: Comparing Structures, Constructs and Methodologies. Berlin/New York, 107–131. Zima, Elisabeth (2014): Gibt es multimodale Konstruktionen? Eine Studie zu [V (motion) in circles] und [all the way from X PREP Y]. In: Gesprächsforschung – Online-Zeitschrift zur verbalen Interaktion 15, 1–48.

IV Schema

Jörg Bücker

19. Schema – Muster – Konstruktion Abstract: Ziel des Beitrags ist es, einen Überblick über die Konzepte Schema, Muster und Konstruktion zu liefern, die in kognitiv-funktionalen sowie text-, gesprächs- und diskurslinguistischen Ansätzen eine wichtige Rolle spielen. Einleitend wird gezeigt, dass Schemata, Muster und Konstruktionen auf allen sprachanalytisch unterscheidbaren Komplexitätsebenen als Modelle einer gebrauchsbasierten Einheitenbildung zum Einsatz kommen und meist den Versuch widerspiegeln, die jeweils zum Gegenstand gemachten Einheiten nach Möglichkeit ebenenübergreifend, merkmalsreich, oberflächennah und kontextbezogen zu repräsentieren, wie sie für sprachlich Handelnde in der Kommunikation in Erscheinung treten. Nach einer Überblicksdarstellung über zentrale Varianten des Schema- (Abschnitt 2), des Muster- (Abschnitt 3) und des Konstruktionsbegriffs (Abschnitt 4), die sich aus Platzgründen auf terminologisierte Begriffsvarianten beschränkt, wird in Abschnitt 5 ein unverbindlicher begriffssystematischer Vorschlag für eine Möglichkeit unterbreitet, wie die „Konzeptklassen“, die in kognitiv-funktionalen und pragmalinguistischen Ansätzen typischerweise mittels der Begriffe Schema, Muster und Konstruktion zum Gegenstand gemacht werden, taxonomisch sinnvoll zueinander in Beziehung gesetzt werden können. Der Beitrag schließt mit einem Fazit und Ausblick, in dem die zentralen Ergebnisse zusammengefasst und kurz in den Kontext einiger aktueller Entwicklungen der gebrauchsbasierten Linguistik gestellt werden (Abschnitt 6). 1 Einleitung 2 Schema 3 Muster 4 Konstruktion 5 Versuch einer Zusammenführung 6 Fazit und Ausblick 7 Literatur

1 Einleitung Zu den Kernfragen der sprachwissenschaftlichen Diskussionen der letzten Jahrzehnte zählt die Frage, auf der Grundlage welcher Konzepte die für linguistische Fragestellungen und Erkenntnisinteressen relevanten Einheiten mündlicher und schriftlicher, ggf. auch gebärdeter Kommunikation empirisch und theoretisch überzeugend rekonstruiert werden können (vgl. in jüngerer Zeit u. a. Stein 2003; Hennig 2006; Auer 2010; Deppermann 2012). Besonders kontrovers wird diese Frage für die Ebene syntakti-

446 

 Jörg Bücker

scher Einheiten diskutiert. Während syntaktische Einheiten in traditionellgrammatischen und generativen Ansätzen in der Regel vor dem Hintergrund einer der Varianten des Satzbegriffes oder im Rahmen einer elaborierten Phrasenstrukturgrammatik diskutiert werden, stehen in der gebrauchsbasierten kognitiv-funktionalen Linguistik (u. a. Langacker 1988, 2000; Bybee 2010) sowie der Text-, Gesprächs- und Diskurslinguistik (vgl. zum Beispiel die Beiträge in Schiffrin/Tannen/Hamilton 2003; Janich 2008; Auer 2013) meist andere Modelle der Einheitenbildung im Vordergrund. Ein grundlegender Kritikpunkt an satz- und phrasenstrukturbasierten Ansätzen besteht darin, dass die Konzepte Satz und Phrase häufig zu stark von Aspekten syntaktischer Einheitenbildung abstrahieren, die auf den folgenden Ebenen liegen: i. Prozessorientierte und interaktionsbasierte Einflüsse auf die Einheitenbildung in der mündlichen Kommunikation (u. a. Auer 2010; Deppermann 2012 sowie auch Ágel 2003, Linell 2005 und Hennig 2006 zum Problem des Skriptizismus) ii. Oberhalb der „Satzsyntax“ operierende Ordnungs- und Gestaltungsprinzipien von Texten, Gesprächen und Diskursen (u. a. Günthner 1995; Linke 2011) iii. Systematizität regelbasiert nur schwer erschließbare Idiosynkrasien auf den verschiedenen sprachanalytischen Komplexitätsebenen (u. a. Fillmore/Kay/ O’Connor 1988) Zu den Konsequenzen, die aus dieser Kritik gezogen werden, zählen u. a. Versuche, für die Analyse gesprochener Sprache einen „weitgehend grammatikunabhängigen Satzbegriff“ (Kindt 1994, 25) zu formulieren, den Satzbegriff im Sinne eines „möglichen Satzes“ flexibler zu fassen (Selting 1995) oder ihn deskriptiv und explanativ aus der „Abfolgelogik“ der mündlichen Turnkonstruktion heraus zu begründen (Deppermann 2012; vgl. auch Deppermann in diesem Band sowie Dürscheid/Schneider 2015). Je radikaler die Konzepte Satz und Phrase dabei in Frage gestellt werden (vgl. zum Beispiel Rupps (1965) Forderung nach neuen wissenschaftlichen Kategorien für die Untersuchung gesprochener Sprache sowie Auers (2010) Kritik am Satz als Symptom des für die Mündlichkeit irregeleiteten Versuchs einer Einheitenbildung qua Segmentierung), desto dringlicher stellt sich die Frage nach alternativen Konzepten, auf deren Grundlage sich die Einheiten kommunikativen Handelns angemessen(er) für eine sprachgebrauchsbasierte und text-, gesprächs- und diskurslinguistische Theoriebildung erschließen lassen. Zu den häufig diskutierten Alternativen zum Satz- und zum Phrasenbegriff zählen die Begriffe Schema, Muster und Konstruktion, die insbesondere in generativen Modellen kaum eine Rolle spielen (eine Ausnahme stellt der Parallelarchitektur-Ansatz von Jackendoff (2007) und Culicover/Jackendoff (2005) dar, in dem Elemente generativer und konstruktionsgrammatischer Ansätze miteinander verbunden werden). Schemata, Muster und Konstruktionen werden in vielen Ansätzen als „natürliche Kategorien“ (Bybee/Moder 1983, 256) entwickelt, d. h. sie spiegeln den Versuch wider, Einheiten so zu repräsentieren, wie sie für sprachlich Handelnde in der kommunikativen Praxis mit einer situationsüberschreitend-stabilen Dimension

Schema – Muster – Konstruktion 

 447

und einer situationsgebunden-innovativen Dimension in Erscheinung treten. Eine Konsequenz dieses Anspruchs ist, dass Schemata, Muster und Konstruktionen merkmalsreich, oberflächennah und unter Berücksichtigung kontextueller Faktoren als Kategorien mit einer prototypisch organisierten Binnenstruktur und Randbereichsunschärfen („fuzzy boundaries“, vgl. u. a. Lakoff 1973) repräsentiert werden. Darüber hinaus sind sie anders als viele Varianten des Satz- und des Phrasenbegriffs analytisch nicht auf die syntaktische Ebene beschränkt, sondern können und werden auch für die Analyse von Phänomenen herangezogen, die im Hinblick auf ihre Komplexität oberhalb und unterhalb der syntaktischen Ebene liegen. Ungeachtet dieser Parallelen besteht jedoch noch keine Einigkeit darüber, in welchem Verhältnis die Begriffe Schema, Muster und Konstruktion zueinander stehen und wie sie sich ggf. von einander abgrenzen lassen. Auf dieses Problem wird in diesem Beitrag im Anschluss an einen Überblick über einige wichtige Zugänge zu den Konzepten Schema, Muster und Konstruktion eingegangen.

2 Schema Während das Konzept des Schemas in der Philosophie vor allem mit den erkenntnistheoretischen Arbeiten Immanuel Kants verbunden ist (vgl. dazu auch Dürscheid/ Schneider 2015), zählen zu den gebrauchsbasierten Auseinandersetzungen mit dem Schema-Begriff u. a. Ronald W. Langackers Kognitive Grammatik, Charles Fillmores „Frame“-Semantik, die kognitiv-funktionale Semantik und Metapherntheorie in der Tradition George Lakoffs und Mark Johnsons sowie die an die Arbeiten Joan Bybees anschließenden Untersuchungen zu schemabasierten Formen der morphologischen und morpho-syntaktischen Klassenbildung. Insbesondere die Arbeiten in der Tradition Bybees erschließen mit sprachsystemgebundenen Schemata, die innerhalb grammatischer Funktionsklassen ausdrucksseitige Familienähnlichkeiten zwischen unterschiedlichen sprachlichen Zeichen repräsentieren und „mit mehr oder minder großer Wahrscheinlichkeit verläßliche Hinweise auf die durch sie signalisierte Funktion bereitstellen“ (Köpcke 1993, 72), einen neuen und vergleichsweise jungen schema-theoretischen Gegenstandsbereich. In Langackers Kognitiver Grammatik werden Schemata auf einer grundlegenden Ebene im Sprachstruktur- und Sprachgebrauchswissen verortet und an Relationen taxonomischer Unter- bzw. Überordnung gebunden, die ein taxonomisch höherrangiges Konzept als Schema mit einem taxonomisch niedrigerrangigen Konzept als seiner Instanziierung verbinden: Schematicity can be equated with the relation between a superordinate node and a subordinate node in a taxonomic hierarchy; the concept [TREE], for instance, is schematic with respect to the concept [OAK]: [[TREE] → [OAK]]. In such relationships I call the superordinate structure a

448 

 Jörg Bücker

schema, and the subordinate structure an elaboration or instantiation of the schema. (Langacker 1987, 68)

Diese Perspektive auf Schematizität liegt auch Langackers Zugang zu sprachsystemspezifischen Konstruktionsschemata („constructional schemas“) als „schematizations of constructions“ (Langacker 2002, 298) zugrunde (vgl. dazu auch Abschnitt 4). Langackers Schema-Begriff zeichnet sich also durch die folgenden beiden Merkmale aus: Konzepte werden aufgrund ihres taxonomischen Verhältnisses zu anderen Konzepten als Schemata charakterisiert, und unter einer Schema-Instanziierung wird nicht ein situationsgebundener Fall der verbalen Externalisierung eines kognitiv repräsentierten Konzepts, sondern ein wie das Schema im Sprachgebrauchswissen situationstranszendent repräsentiertes Konzept verstanden. Diese terminologische Belegung ist mit einem gewichtigen Nachteil verbunden: Sie rekonstruiert Schematizität in der Domäne der Kognition und entlang taxonomischer Hierarchien, ohne dass dabei die Domäne des situierten „Zeichenhandelns“ (Feilke/Linke 2009, 5) in den Blick gerät, in der Schemata gebrauchsbasiert geprägt werden. Ein stärker durch kognitionspsychologische Schematheorien geprägter Schemabegriff spielt für den „Scenes-and-Frames“-Ansatz Fillmores eine Rolle, wie er u. a. in Fillmore (1977a) entwickelt wurde (vgl. zu aktuelleren „frame“-theoretisch beeinflussten Ansätzen mit schematheoretischen Bezugspunkten u. a. Konerding 1997, 1999). Fillmores „Scenes-and-Frames“-Modell geht von einer engen Beziehung zwischen nicht-sprachlichen Elementen konzeptuell komplexer „Szenen“ auf der einen Seite und Elementen sprachlich organisierter und vermittelter „Frames“ auf der anderen Seite aus (Busse 2012, 53–60). Dabei weist vor allem das Konzept der „Szene“ deutliche Parallelen zum Schemabegriff der Kognitionspsychologie in der Tradition Bartletts (1932) auf (vgl. auch Busse (2012, 53), der Fillmores „Scenes-and-Frames“Ansatz treffend als „‚schematheoretische Phase‘ des Fillmore’schen Frame-Modells“ charakterisiert). In der Kognitionspsychologie stellen Schemata kognitiv repräsentierte komplexe Organisationsformen konzeptuellen Wissens dar, die in Abhängigkeit von der Wahrnehmungsdisposition (den Intentionen, den relevanten Wertesystemen, den Erwartungshaltungen und den verfügbaren kognitiven Kapazitäten des jeweiligen Individuums) kognitiv prozessierte Informationen filtern und perspektivisch (re-) strukturieren (u. a. Thorndyke/Yekovich 1980; Rumelhart 1980; Mandler 1984; Bloom 1988; Whitney u. a. 1995). So zeigen zum Beispiel Fass/Schumacher (1981) auf der Grundlage von Leseexperimenten, dass die Rezeption und die Reproduktion von Informationen aus einer Hausbeschreibung dadurch beeinflusst wird, ob die Probanden die Hausbeschreibung aus der Perspektive eines Hauskäufers oder eines Einbrechers gelesen haben bzw. wiedergeben sollen. Die Unterschiede lassen sich ihres Erachtens durch ein „Hauskäuferschema“ („homebuyer schema“) und ein „Einbrecherschema“ („burglar schema“) erklären, die bei der Enkodierung, Abrufung und Reproduktion der im Text gegebenen Informationen jeweils unterschiedliche Filterund (Re-)Strukturierungsfunktionen ausüben.

Schema – Muster – Konstruktion 

 449

Eine dritte Variante des Schema-Konzepts wird in der kognitiv-funktionalen Semantik und Metapherntheorie (u. a. Lakoff/Johnson 1980; Lakoff 1987) diskutiert. Anders als in Fillmores „Scenes-and-Frames“-Ansatz geht es dabei um Schemata, deren Funktion darin besteht, „auf Wahrnehmungsakte gestützte Erfahrungen so zu organisieren, dass sie erinnerbar und kognitiv operationsfähig werden“ (Busse 2012, 321). Die untersuchten Schemata sind zumindest in einigen Fällen präkonzeptueller („preconceptual“) Natur, d. h. sie zählen zu den elementarsten Bausteinen des menschlichen Erkenntnisvermögens, die konzeptuell organisierten kognitiven Vorgängen wie zum Beispiel Begründen und Erläutern epistemologisch vorgeschaltet sind. Das gilt insbesondere für Bildschemata („image schemas/schemata“), bei denen es sich um Resultate wiederkehrender elementarer senso-motorischer Erfahrungen handelt, die mittels sog. Bildschema-Transformationsprozesse („image schema transformation“) miteinander kombiniert werden können (vgl. u. a. Johnson 1987; Lakoff 1987, 1990; Clausner/Croft 1997, 1999; Hampe 2005a, b). Bildschemata spielen u. a. als rekurrente Quelldomänen von Metaphorisierungsprozessen eine wichtige Rolle. Ein häufig angeführtes Beispiel ist die Metapher „love is a journey“, im Rahmen derer das anschaulich-räumlich dimensionierte Konzept „journey“ als Quelldomäne („source domain“) auf das abstraktere, nicht anschaulich-räumlich dimensionierte Konzept „love“ als Zieldomäne („target domain“) projiziert wird. Ein vierter gebrauchsbasiert-linguistischer Zugang zum Konzept des Schemas wurde schließlich in der kognitiv-funktionalen Morphologie in der Tradition Joan Bybees entwickelt. Der kognitiv-funktionalen Morphologie zufolge bieten Schemata Erklärungsmöglichkeiten für Formen morphologischer und morpho-syntaktischer Klassenbildung, die traditionellen Spracherwerbs- und Sprachwandeltheorien Probleme bereiten (vgl. u. a. Bybee 1998; Bybee/Slobin 1982; Bybee/Moder 1983; Köpcke 1993, 1994; Abbot-Smith/Tomasello 2006). So haben traditionelle „Item-and-Process“Modelle häufig keine plausible Erklärung für den Erwerb und die Systematik traditionell als arbiträr, irregulär oder inkorrekt erachteter Formen, wie sie in natürlichen Sprachen durchgehend zu beobachten sind (vgl. etwa Köpcke/Zubin (1984) zur Systematik scheinbar arbiträrer Genuszuordnungen im Deutschen sowie Bybee/Slobin (1982) zur Rolle produktiver morpho-phonologischer Schemata für den Erwerb irregulärer Formen in der englischen Tempusmorphologie). Aus diesem Grund erklärt die kognitiv-funktionale Morphologie den Erwerb und die Systematik solcher Auffälligkeiten nicht über Regeln (vgl. als ein Beispiel die traditionelle Ableitung der Tempusflexion der starken gegenwartsdeutschen Verben über regelhafte Vokalalternanzen), sondern über Schemata. Schemata lassen sich dabei als sprachsystemgebundene gestalthafte Abstraktionen ausdrucksseitiger Familienähnlichkeiten zwischen unterschiedlichen sprachlichen Zeichen innerhalb einer bestimmten grammatischen Funktionsklasse charakterisieren, die zur Stabilität, Produktivität und Binnendifferenzierung dieser Funktionsklasse beitragen. Ähnlich wie die Schemata, die in der kognitionspsychologischen, in der „frame“-semantischen und in der kognitiv-semantischen Forschung diskutiert werden, verfügen sie über intrinsisch nicht (vollständig) spezifizierte Berei-

450 

 Jörg Bücker

che („Slots“), die variabel besetzt bzw. substanziell spezifiziert werden können. So ist zum Beispiel ein morpho-phonologisches Schema wie „…æŋ(k)]verb, past“, das Bybee/ Slobin (1982, 278–282) zufolge die Tempusbildung der starken englischen Verben in Klasse VI beeinflusst und für inkorrekte Präteritalformen wie *„strang“ anstelle von „strung“ verantwortlich ist, lediglich im Hinblick auf den Silbenkern und die Koda spezifiziert. Im Unterschied zu den kognitionspsychologischen Schemata sowie den Bildschemata der kognitiven Semantik sind die in der Tradition Bybees untersuchten Schemata allerdings in aller Regel sprachsystemgebundene Einheiten, d. h. sie sind fest an substanzielle Details einzelsprachlich spezifischer Form-Funktionsfestlegungen gebunden und haben jenseits davon keine Realität.

3 Muster Bereits Sandigs (1989) Unterscheidung zwischen Intonations-, Satz-, Wissens-, Handlungs-, Text- und Stilmustern lässt erkennen, dass der Musterbegriff in der sprachwissenschaftlichen Literatur mindestens ebenso verbreitet ist wie der Schemabegriff. In der Tat hat nach wie vor Heinemanns (2000, 516) Diktum Gültigkeit, dass das Konzept Muster „zu einer Art Modewort geworden ist, das Eingang gefunden hat auch in zahlreiche wissenschaftliche Konzepte, ohne daß allerdings Begriffsinhalt und -umfang genauer fixiert wurden“. Aus diesem Grund wird sich der folgende Überblick auf Positionen beschränken, die von terminologisierten Varianten des Musterbegriffs Gebrauch machen (kaum terminologisierte Erscheinungsformen des Musterbegriffs sind vor allem in der traditionellen Grammatik und teils auch in der Phraseologie verbreitet). Einigkeit besteht in der Forschung dahingehend, dass Muster – ebenso wie im Übrigen auch Schemata  – „auf einer analytischen Ebene im Nachhinein festgestellt werden [müssen]“ (Bubenhofer 2009, 24). Sie treten also als nicht-selbstevidente Resultate eines analytisch gerichteten rekonstruktiven Wahrnehmungsakts auf Daten in Erscheinung. Unterschiede zwischen den Zugängen zum Musterbegriff lassen sich im Hinblick darauf feststellen, auf welcher analytischen Ebene, in welchem Theorie­ rahmen und mit welchen Methoden Muster jeweils rekonstruiert werden. In der Korpuslinguistik spielt der Musterbegriff insbesondere für die „Pattern Grammar“ (Hunston/Francis 2000) eine Rolle, die unter Mustern vorwiegend „corpus-driven“ (Tognini-Bonelli 2001) zu ermittelnde „complementation patterns“ versteht. Problematisch ist dabei, dass das Verhältnis dieser Muster zu dem, was in Grammatiktheorien üblicherweise unter Argumentstrukturen, Valenzrahmen, Subkategorisierungsrahmen u. ä. verstanden wird, vollkommen unklar bleibt. Einen anders gelagerten Musterbegriff vertritt demgegenüber Stefanowitsch (2009), der an der Schnittstelle zwischen Korpuslinguistik und Konstruktionsgrammatik vorschlägt, konventionalisierte und holistisch repräsentierte sprachliche Einheiten mit kompositionalen Eigenschaften als „Satzmuster“ zu bezeichnen, um sie von „Konstrukti-

Schema – Muster – Konstruktion 

 451

onen“ mit nicht-kompositionalen Eigenschaften abzugrenzen (vgl. Stefanowitsch 2009, 569). Stefanowitschs Vorschlag birgt allerdings ein Problem in sich: Es macht wenig Sinn, Satzmuster auf der einen Seite begriffssystematisch von Konstruktionen abzugrenzen, wenn Satzmuster auf der anderen Seite ebenso wie Konstruktionen als konventionalisierte symbolgrammatisch-holistische Einheiten im Sprachstrukturund Sprachgebrauchswissen rekonstruiert werden (vgl. zur Kritik an Stefanowitschs Begriff des Satzmusters auch Dürscheid/Schneider 2015). Ein weiterer korpuslinguistisch basierter Zugang zum Konzept des Musters liegt schließlich mit Bubenhofer (2009) vor, der seinen Musterbegriff an der Schnittstelle zwischen Korpus- und Diskurslinguistik entwickelt. Da Bubenhofer Muster konsequent als sozio-kulturell geprägte Resultate diskursiven Handelns diskutiert, treten Muster in seinem Ansatz deutlich als Modelle kognitiv und sozio-kulturell realer Phänomene in Erscheinung. Einen ähnlichen Ansatz wie Bubenhofer verfolgt Wengeler (2003, 2007), der korpusbasiert diskursive „Denk- und Argumentationsmuster“ (2003, 199) untersucht, die als Elemente des kulturgeschichtlich geprägten argumentativen Handlungswissens von Diskursakteuren eine Rolle spielen. Wengelers Musterbegriff weist seinerseits in seiner kulturhistorischen Orientierung Parallelen zu Linkes (2011) mentalitätsgeschichtlichem und kulturanalytischen Zugang zu Mustern als „kulturellen Signifikanzen des alltäglichen Sprachgebrauchs“ (Linke 2011, 41) auf. Linke zufolge stellen Muster „einen wichtigen ‚Ort‘ der Verschränkung von Kultur und Sprache“ (Linke 2011, 27) dar und erfordern aus diesem Grund eine Sprachgebrauchsanalyse, die sich als Teil einer Kulturanalyse versteht (vgl. auch Tienken in diesem Band). Ebenfalls sprachgebrauchs- und kulturanalytisch, aber stärker gesprächslinguistisch orientiert sind die aus den sprachpsychologischen Arbeiten Karl Bühlers hervorgegangene Funktionale Pragmatik (u. a. Ehlich/Rehbein 1979; Ehlich 1991; Brünner/ Graefen 1994) sowie die auf die wissenssoziologischen Arbeiten Thomas Luckmanns zurückgehende Theorie kommunikativer Gattungen (u. a. Luckmann 1986; Günthner/ Knoblauch 1996; Günthner 1995, 2000; Kotthoff 1999a, b; Birkner 2002). Der Funktionalen Pragmatik zufolge sind (Handlungs-)Muster „Tiefenkategorien“, die Kommunizierenden als sozio-kulturell geprägte und mental repräsentierte „Formen von standardisierten Handlungsmöglichkeiten“ (Ehlich/Rehbein 1979, 250) zur Verfügung stehen. Der Theorie der kommunikativen Gattungen liegt ein vergleichbares Musterkonzept zugrunde, allerdings grenzt sie im Unterschied zur Funktionalen Pragmatik handlungslogisch einfacher aufgebaute Muster wie zum Beispiel Sprichwörter begrifflich von handlungslogisch komplexeren Gattungen wie zum Beispiel Beschwerdegeschichten ab (vgl. dazu ausführlicher Günthner/Knoblauch 1996; s. außerdem auch Kallmeyer/Schütze 1976, 1977 zu „Kommunikations-/Handlungsschemata“, Antos/ Schubert 1997 zu „Diskursmustern“ und Fiehler u. a. 2004 zu „kommunikativen Praktiken“). An der Schnittstelle zwischen Text- und Gesprächslinguistik befinden sich Brinkers (1988) Untersuchungen zu „thematischen Mustern“ sowie Gülich/Hausen-

452 

 Jörg Bücker

dorfs (2000) Analysen zu „Vertextungsmustern“, die „unabhängig von der medialen Konstituiertheit“ mit der Bewältigung narrationsspezifischer Aufgaben verbunden sind (Gülich/Hausendorf 2000, 375; vgl. auch Gülich 1980 sowie Hausendorf/ Quasthoff 1996). In der Textlinguistik schließlich charakterisiert Heinemann Muster als „mentale Modelle“ (Heinemann 2000, 517), deren Reflexe in den verschiedenen Erscheinungsformen textueller Musterhaftigkeit sichtbar werden (vgl. zu textuellen Mustern u. a. Sandig 1987, 1989; Fix 1990; Linke 2009).

4 Konstruktion Der Konstruktionsbegriff entspricht in seinen nicht-terminologisierten Vorkommen in vielen Punkten den nicht-terminologisierten phraseologischen und traditionellgrammatischen Erscheinungsformen des Musterbegriffs sowie dem Musterbegriff der „Pattern Grammar“. Den weitreichendsten Grad an Terminologisierung hat der Konstruktionsbegriff in den unterschiedlichen Spielarten der Konstruktionsgrammatik (Construction Grammar bzw. CxG) erfahren (vgl. als kurze einführende Überblicksdarstellungen u. a. Fillmore 1988; Goldberg 2003; Fried/Östman 2005; Fischer/Stefanowitsch 2007; Imo in diesem Band). Die u. a. aus der Phraseologie (Makkai 1972; Fillmore/Kay/O’Connor 1988), der Kasusgrammatik und der Frame-Semantik (u. a. Fillmore 1968, 1977b, 2003; Ziem 2008; Busse 2012), der Kognitiven Grammatik (u. a. Langacker 1987, 1991) und der kognitiv-funktionalen Semantik (u. a. Lakoff 1987; Lakoff/Johnson 1980) hervorgegangene Konstruktionsgrammatik geht anders als die Mehrzahl traditionellgrammatischer und phraseologischer Ansätze davon aus, dass sowohl idiosynkratisch als auch regelhaft anmutende sprachliche Einheiten als symbolgrammatisch organisierte Exponenten eines Sprachsystems rekonstruiert werden können, das sich nicht in Lexikon und Grammatik unterteilen lässt. Aus diesem Grund wird der von der traditionellen Dichotomie Lexikon/Grammatik weitgehend unbelastete Begriff der Kon­struktion in den Mittelpunkt der Theoriebildung gestellt. Unter Konstruktionen werden sprachliche Einheiten mit einer konventionalisierten, symbolgrammatischdirekten Verbindung zwischen den charakterisierenden formbezogenen Merkmalen einerseits und den charakterisierenden semantisch-pragmatischen Merkmalen andererseits verstanden. Konstruktionen können einfach und komplex, produktiv und unproduktiv, transparent und intransparent sowie spezifiziert und „schematisch“ sein (vgl. zu einer ausführlicheren Diskussion des Konstruktionsbegriffs Imo in diesem Band). Bei der Modellierung von Konstruktionen werden insbesondere „unsichtbare“, seriell prozessierte Repräsentationsebenen vermieden, die theoriegeleiteten Spekulationen Vorschub leisten. Solche Repräsentationsebenen werden in vielen Ansätzen vorausgesetzt, die die Verbindung struktureller und semantischpragmatischer Repräsentationen bei komplexen sprachlichen Einheiten nicht als

Schema – Muster – Konstruktion 

 453

Leistung eigenständiger, formal und semantisch-pragmatisch substanziell spezifizierter Type-Repräsentationen deuten, sondern aus den Produkten autonom prozessierter Module ableiten, die sukzessive an Modulschnittstellen zusammengeführt werden (vgl. dazu auch Jacobs 2008, 2009). Konstruktionen werden in vielen konstruktionsgrammatischen Ansätzen als Modelle entwickelt, die sprachliche Einheiten nach Möglichkeit so repräsentieren, wie sie – im Sinne kognitiv und sozio-kulturell realer Phänomene – für Interagierende im situierten kommunikativen Handeln in Erscheinung treten. Das gilt insbesondere für konstruktionsgrammatische Untersuchungen, die durch aktuelle Entwicklungen in der Spracherwerbsforschung (u. a. Tomasello 2003, 2007; Diessel 2004; Knobloch/ Krüger in diesem Band), der Gesprächslinguistik (zum Beispiel Auer 2006, 2007; Deppermann 2006, 2007; Imo 2007a, 2007b; Günthner 2008, 2009; Bücker 2012) und der Diskursanalyse (u. a. Ziem 2013; Lasch i. V.) beeinflusst werden und Konstruktionen als Elemente eines hochgradig plastischen, weitestgehend durch sprachliche Erfahrung geformten „Konstruktikons“ (Jurafsky 1991, 8; Fischer 2007, 143) begreifen. Als gebrauchsbasiert geprägte sprachsystemspezifische Einheiten, die als kognitiv und sozio-kulturell reale Phänomene bzw. natürliche Kategorien zum situationstranszendenten Sprachgebrauchswissen der Interagierenden gehören, haben Konstruktionen große Ähnlichkeiten mit den in der kognitiv-funktionalen Morphologie Bybees diskutierten Schemata, die sprachsystemgebundene gestalthafte Ab­straktionen ausdrucksseitiger Familienähnlichkeiten zwischen unterschiedlichen sprachlichen Zeichen innerhalb einer bestimmten grammatischen Funktionsklasse repräsentieren (vgl. Abschnitt 2). Eine Abgrenzung ist hier außerordentlich schwierig, eine Möglichkeit der Unterscheidung könnte unter Umständen die Basis der Zeichenfunktion bieten, die Schemata und Konstruktionen jeweils zukommt. Schemata wie das Präteritalschema „…æŋ(k)]verb, past“ (Bybee/Slobin 1982) sind im Idealfall Resultate ausdrucksseitig orientierter kognitiver Analogieschlüsse, die über einer größeren Menge mental gespeicherter distinkter Symbole mit einer in einem bestimmten Bedeutungs-/Funktionszusammenhang auftretenden geteilten ausdrucksseitigen Eigenschaft operieren und Abstraktionen erzeugen. Diese Abstraktionen können so lange als indexikalisch charakterisiert werden, wie sie keinen eigenen Konventionalisierungsprozess in der Sprachgemeinschaft durchlaufen (müssen), da sie keine nicht-analogiebasierten idiosynkratischen Eigenschaften entwickeln und das bestehende grammatische Verhalten der Elemente in dem sprachlichen Teilsystem, in dem sie entstanden sind, nicht infolge steigender Produktivität zu verändern beginnen. Empirisch sind solche indexikalischen Schemata zum Beispiel über Kunstwort­ experimente und über phasenweise im Spracherwerb beobachtbare Fehlleistungen rekonstruierbar. Konstruktionen wie „Gott bewahre!“ sind demgegenüber im prototypischen Fall Paradebeispiele für Einheiten des Sprachsystems, die auf jeden Fall in der Sprachgemeinschaft als Symbole konventionalisiert werden müssen, da sie über Analogieschlüsse nicht (vollständig) abgeleitet werden können. Sollte auf diese Weise zwischen sprachsystemspezifisch-indexikalischen Schemata einerseits und

454 

 Jörg Bücker

sprachsystemspezifisch-symbolischen Konstruktionen andererseits eine Trennlinie gezogen werden, dann muss dabei aber berücksichtigt werden, dass die in dieser Form etablierten Kategorien keine diskreten Kategoriengrenzen aufweisen, sondern von einem Kontinuum zwischen den Polen prototypischer Schemahaftigkeit und prototypischer Konstruktionshaftigkeit auszugehen ist.

5 Versuch einer Zusammenführung Die Darstellung hat bis zu diesem Punkt gezeigt, dass terminologisierte Varianten der Begriffe Schema, Muster und Konstruktion weitgehend auf gebrauchsbasiert argumentierende Ansätze in der kognitiv-funktionalen Linguistik, in der Korpuslinguistik und in der Text-, Gesprächs- und Diskurslinguistik beschränkt sind. In strukturalistischen und insbesondere in generativen Positionen spielen die Begriffe Schema, Muster und Konstruktion dagegen kaum eine Rolle. Schemata, Muster und Konstruktionen werden in vielen Ansätzen mehr oder minder explizit mit den folgenden Charakteristika in Verbindung gebracht: i. Sie sind nicht-selbstevidente modellhafte Resultate eines analytisch gerichteten, d. h. rekonstruktiven und theoretisch reflektierten Wahrnehmungsakts auf experimentell oder nicht-experimentell erzeugte Daten mit dem Ziel, Einheiten kommunikativen Handelns als kognitiv und sozio-kulturell reale Phänomene zu identifizieren und modellhaft zu rekonstruieren. ii. Sie stellen Modelle situationstranszendenter kognitiver Organisationsformen deklarativen Wissens präkonzeptueller und/oder konzeptueller Natur im Langzeitgedächtnis dar. iii. Sie repräsentieren diese Organisationsformen als abstrakte und typisierte Konstellationen von Elementen und Relationen, die (a) die stereotypen erfahrungsweltlichen Vorkommen eines bestimmten sprachsystemspezifischen und/oder sprachsystemunspezifischen Phänomens auszeichnen, die (b) auf Erfahrungen mit und Wissen über dieses Phänomen basieren und die (c) mehr oder minder zuverlässige Erwartungshaltungen im Hinblick auf die erfahrungsweltlichen Vorkommen dieses Phänomens erzeugen und als kognitive Routinen helfen, sie zu bewältigen. iv. Sie repräsentieren diese Organisationsformen als Konstellationen, die über intrinsisch nicht (vollständig) spezifizierte Bereiche („Slots“) verfügen, die darauf spezialisiert sind, im Gebrauchsfall durch sprachsystemspezifische und sprachsystemunspezifische Informationen substanziell angereichert zu werden. v. Sie repräsentieren diese Organisationsformen als flexible Konstellationen, die sich verändernde sprachsystemspezifische und sprachsystemunspezifische Bedingungen reflektieren, die auf die erfahrungsweltlichen Vorkommen des jeweiligen Phänomens sowie das Wissen über dieses Phänomen Einfluss haben.

Schema – Muster – Konstruktion 

 455

vi. Sie repräsentieren diese Organisationsformen so, dass sie miteinander kombiniert und ineinander verschachtelt werden können. Demgegenüber resultieren die Hauptunterschiede zwischen den einzelnen Varianten der Begriffe Schema, Muster und Konstruktion daraus, mit welchen Phänomenbereichen der Erfahrungswelt Schemata, Muster und Konstruktionen jeweils in Verbindung gebracht werden und auf welcher semiotischen Grundlage sie ihre Funktionen ausüben. In einem ersten Schritt lassen sich die Vorkommen der Konzepte Schema und Konstruktion in der hier berücksichtigten Literatur damit idealtypisch wie folgt zueinander in Beziehung setzen, ohne dass es zu starken intrinsischen Überschneidungen kommt: Schematische Einheiten im Sprachstruktur- und Sprachgebrauchswissen

Nicht sprachsystemgebunden

Konzeptuell

Konzeptbildende/

Sprachsystemgebunden

Präkonzeptuell

Rein analogische Zeichenbasis

Konventionelle Zeichenbasis

Handlungsschemata

Bildschemata

Indexikalische

-transformierende

(gattungs-,

(elementare lokale

Schemata (vgl. die

Schemata

Schemata (für

textsorten- und

Konfigurationen im

Arbeiten Bybees und

(Konstruktionen im

Metaphorisierungen,

diskursspezifisches

Sinne Lakoffs)

Köpckes)

Metonymisierungen

Wissen um typische

Konstruktions-

usw.)

Handlungsabläufe

grammatik)

Symbolische

Sinne der

u.ä.)

Der linke Zweig des Schaubilds umfasst Schemata, die für die Einheitenbildung im kommunikativen Handeln wichtig sind, selbst aber keine Repräsentationen genuin sprachsystemgebundener Einheiten darstellen. Die nicht-sprachsystemgebundenen Schemata lassen sich im Hinblick auf ihre epistemologische Komplexität weiter in konzeptuelle Schemata (epistemologisch komplex) und präkonzeptuelle Schemata (epistemologisch elementar) untergliedern. Bei den präkonzeptuellen Schemata spielen u. a. die „universal primitive image schemas“ (Dodge/Lakoff 2005, 58) der kognitiv-funktionalen Semantik eine Rolle. Zu den konzeptuellen Schemata zählen dagegen Schemata, die auf unterschiedliche Aspekte der Prozessierung von Konzepten spezialisiert sind (zum Beispiel Schemata zur Generierung von Metaphern und Metonymien), und Schemata, die handlungslogisch komplexe und ggf. kollaborativ

456 

 Jörg Bücker

zu bewältigende typische Aktivitätsabläufe repräsentieren, die komplexe Formen der Modellbildung erfordern. Dem rechten Zweig des Schaubilds sind Schemata zugeordnet, die als sprachsystemgebundene Exponenten der grammatischen Systeme von Einzelsprachen entstehen und in Erscheinung treten. Da sprachsystemgebundene Schemata immer komplexer als epistemologisch elementare Schemata sind, entfällt hier die Unterscheidung zwischen konzeptuellen und präkonzeptuellen Schemata. Stattdessen könnte im Hinblick auf die semiotische Basis der jeweiligen Zeichenfunktionen idealtypisch zwischen rein analogiebasierten indexikalischen Schemata einerseits und Konstruktionen als konventionsbasierten symbolischen Schemata andererseits unterschieden werden (vgl. Abschnitt 4). Schemata wären dabei so lange als indexikalisch charakterisierbar, wie sie keines eigenen Konventionalisierungsprozesses in der Sprachgemeinschaft bedürfen, da sie vollständig aus Analogieschlüssen und Ab­straktionsleistungen auf der Grundlage bereits erworbener Symbole hervorgehen und das bestehende grammatische Verhalten der Elemente in dem sprachlichen Teilsystem, in dem sie entstanden sind, nicht verändern. Konstruktionen wären demgegenüber im prototypischen Fall insofern symbolische Schemata, als sie in der Sprachgemeinschaft als geteilte Form-Bedeutungszusammenhänge konventionalisiert werden müssen, da sie über Analogieschlüsse (alleine) nicht erschlossen werden können. Es sei aber noch einmal betont, dass indexikalische Schemata und symbolische Konstruktionen nur im Hinblick auf ihre ideal- bzw. prototypischen Vertreter klar voneinander getrennt werden können und zahlreiche Übergangsphänomene und Überschneidungsbereiche zwischen beiden Kategorien existieren (die Zuschreibung „rein“ im Schaubild hat den Zweck, diesen Umstand hervorzuheben). Damit stellt sich die Frage, wie der Musterbegriff sinnvoll in dieser idealtypischen Begriffssystematik untergebracht werden kann. Einerseits könnte mittels des Musterbegriffs eine weitere Ausdifferenzierung der konzeptuell und handlungslogisch komplexen Handlungsschemata bewältigt werden (z. B. eine Untergliederung in Vertextungsmuster bzw. Textordnungsmuster im Sinne Gülichs und Hausendorfs, Argumentationsmuster im Sinne Wengelers, thematische Muster im Sinne Brinkers, musterhafte Minimalgattungen im Sinne Günthners usw.). Das hätte den Vorteil, dass in dieser Form terminologisch transparent an eine große Zahl an text-, gesprächs- und diskurslinguistischen Untersuchungen zu Musterhaftigkeit angeschlossen werden könnte. Ein Nachteil wäre dagegen, dass die Subklassifikation der Handlungsschemata über den Musterbegriff erfolgen würde, ohne dass dieser Wechsel mit einem erkennbaren begriffssystematischen Vorteil verbunden wäre. Eine andere Lösung, für die sich auch Dürscheid/Schneider (2015) aussprechen, bestünde darin, den Musterbegriff für theoriearme Deskriptionen systematisch auftretender Zeichenkonstellationen in Daten zu reservieren, die bei Bedarf als Ausgangspunkte für die Entwicklung theoriegesättigterer schemabasierter Modelle kognitiv und sozio-kulturell realer Phänomene herangezogen werden können (vgl. beispielsweise Bücker (2014) zu einer solchen Verwendung des Musterbegriffs im Rahmen einer kon-

Schema – Muster – Konstruktion 

 457

struktionsgrammatisch orientierten Untersuchung). Das hätte den Vorteil, dass in der Terminologie das Bewusstsein darum widergespiegelt werden würde, dass Schemata nicht einfach aus der Oberfläche von Daten abgeschöpft werden können, sondern auf „begriffsbildende Operationen einer wissenschaftlichen Wahrnehmungsdisposition“ (Bücker 2012, 67–68) angewiesen sind, die Fälle oberflächennah beobachteter Musterhaftigkeit in theoretisch gesättigtere Schemata überführen. Ein Nachteil wäre dagegen, dass dieser Musterbegriff vom typischen Musterbegriff der Text-, Gesprächsund Diskurslinguistik abweicht.

6 Fazit und Ausblick Die Untersuchung hat versucht, einen strukturierten Überblick über die unübersichtliche Forschungssituation zu den Begriffen Schema, Muster und Konstruktion zu liefern, die in vielen gebrauchsbasierten und pragmalinguistischen Ansätzen als alternative Konzepte der Einheitenbildung eine Rolle spielen. Die Darstellung und Diskussion hat gezeigt, dass die terminologisierten Varianten der Konzepte Schema, Muster und Konstruktion häufig den Versuch widerspiegeln, Einheiten nach Möglichkeit so zu repräsentieren, wie sie für sprachlich Handelnde als kognitiv und sozio-kulturell reale Phänomene mit einer reproduzierten situationstranszendenten Dimension einerseits und einer innovativen situationsgebundenen Dimension andererseits in Erscheinung treten. Möglichkeiten der begriffssystematischen Ausdifferenzierung ergeben sich vor allem im Hinblick darauf, mit welchen Phänomenbereichen der Erfahrungswelt die Konzepte jeweils in Verbindung gebracht werden und auf welcher semiotischen Grundlage sie ihre kommunikativen Funktionen ausüben. Während sich die Konzepte Schema und Konstruktion insgesamt recht gut zueinander in Beziehung setzen lassen (Konstruktionen stellen als sprachsystemspezifische symbolische Schemata eine spezifische Ausprägung von Schemata dar), wirft der Musterbegriff das Problem auf, dass er häufig mit sehr ähnlichen Phänomenbereichen der Erfahrungswelt in Verbindung gebracht wird wie der Schemabegriff. Um starke begriffssystematische Überlappungen zu vermeiden, könnte der Musterbegriff entweder zur weiteren Untergliederung der Schemaklassen herangezogen oder für oberflächennahe Deskriptionen rekurrenter Zeichenkonstellationen reserviert werden, die zum Ausgangspunkt für weiterführende schematheoretische Modellierungen gemacht werden können. Der hier vorgestellte Versuch einer begriffssystematischen Ordnung verfolgt nicht das Ziel, eine vollständige Typologie aller für sprachwissenschaftliche Fragestellungen relevanten Schema-, Muster- und Konstruktionstypen zu liefern. Ziel ist stattdessen die unverbindliche Präsentation einer Möglichkeit, wie die Konzeptklassen, die nach dem gegenwärtigen Stand der Dinge in kognitiv-funktionalen und pragmalinguistischen Ansätzen besonders häufig über die Begriffe Schema, Muster und Kon-

458 

 Jörg Bücker

struktion diskutiert werden, taxonomisch sinnvoll zueinander in Beziehung gesetzt werden könnten. Impulse für weitere Ausdifferenzierungen und ggf. Modifikationen dieses Vorschlags sind insbesondere von Untersuchungen zu erwarten, die die traditionellen sprachwissenschaftlichen Untersuchungsfelder unter neuen Gesichtspunkten erschließen oder in Form neuer Gegenstandsbereiche ergänzen. Dazu zählen zum Beispiel Untersuchungen zu gebärdensprachlich vermittelter Kommunikation (vgl. u. a. Kutscher 2010; Fehrmann in diesem Band; Pfau/Steinbach/Woll 2012; Dürscheid/Schneider 2015), Untersuchungen zu medientheoretischen und multimodalen Dimensionen sprachlichen Handelns (vgl. u. a. Schneider 2008; Stukenbrock 2009; Deppermann/Linke 2010; Deppermann 2013; Fricke 2012) und Untersuchungen zum Erwerb, zum Gebrauch und zur diachronen Entwicklung kommunikativer Einheiten, die traditionellen Modellen der Einheitenbildung Probleme bereiten oder von ihnen nicht berücksichtigt werden (vgl. u. a. Bybee/Slobin 1982; Bybee/Moder 1983; Köpcke 1987; Brinton 1996; Diewald/Bergs 2008; Fried 2009; Günthner 2008; Traugott/Trousdale 2013).

7 Literatur Abbot-Smith, Kirsten/Michael Tomasello (2006): Exemplar-learning and schematization in a usage-based account of syntactic acquisition. In: The Linguistic Review 23 (3), 275–290. Ágel, Vilmos (2003): Prinzipien der Grammatik. In: Anja Lobenstein-Reichmann/Oskar Reichmann (Hg.): Neue historische Grammatiken. Zum Stand der Grammatikschreibung historischer Sprachstufen des Deutschen und anderer Sprachen. Tübingen, 1–46. Antos, Gerd/Thomas Schubert (1997): Unterschiede in kommunikativen Mustern zwischen Ost und West. In: Zeitschrift für Germanistische Linguistik 25 (3), 308–330. Auer, Peter (2006): Construction grammar meets conversation: Einige Überlegungen am Beispiel von „so“-Konstruktionen. In: Susanne Günthner/Wolfgang Imo (Hg): Konstruktionen in der Interaktion. Berlin/New York, 291–315. Auer, Peter (2007): Syntax als Prozess. In: Heiko Hausendorf (Hg.): Gespräch als Prozess. Linguistische Aspekte der Zeitlichkeit verbaler Interaktion. Tübingen, 95–142. Auer, Peter (2010): Zum Segmentierungsproblem in der Gesprochenen Sprache. In: InLiSt 49. Auer, Peter (Hg.) (2013): Sprachwissenschaft. Grammatik – Interaktion – Kognition. Stuttgart. Bartlett, Frederic Charles (1932): Remembering. A Study in Experimental and Social Psychology. Cambridge. Birkner, Karin (2002): Ost- und Westdeutsche im Bewerbungsgespräch: Ein Fall von interkultureller Kommunikation? In: Helga Kotthoff (Hg.): Kultur(en) im Gespräch. Tübingen, 301–331. Bloom, Charles P. (1988): The roles of schemata in memory for text. In: Discourse Processes 11 (3), 305–318. Brinker, Klaus (1988): Thematische Muster und ihre Realisierung in Talkshowgesprächen. In: Zeitschrift für Germanistische Linguistik 16 (1), 16–45. Brinton, Laurel J. (1996): Pragmatic Markers in English: Grammaticalization and Discourse Functions. Berlin/New York.

Schema – Muster – Konstruktion 

 459

Brünner, Gisela/Gabriele Graefen (1994): Einleitung: Zur Konzeption der Funktionalen Pragmatik. In: Gisela Brünner/Gabriele Graefen (Hg.): Texte und Diskurse. Methoden und Forschungsergebnisse der Funktionalen Pragmatik. Opladen, 7–21. Bubenhofer, Noah (2009): Sprachgebrauchsmuster: Korpuslinguistik als Methode der Diskurs- und Kulturanalyse. Berlin/New York. Bücker, Jörg (2012): Sprachhandeln und Sprachwissen: Grammatische Konstruktionen im Spannungsfeld von Interaktion und Kognition. Berlin/New York. Bücker, Jörg (2014): Konstruktionen und Konstruktionscluster. Das Beispiel der Zirkumposition „von XP her“ im gesprochenen Deutsch. In: Alexander Lasch/Alexander Ziem (Hg.): Grammatik als Netzwerk von Konstruktionen. Sprachwissen im Fokus der Konstruktionsgrammatik. Berlin/ New York, 117–135. Busse, Dietrich (2012): Frame-Semantik: Ein Kompendium. Berlin/New York. Bybee, Joan L. (1998): The emergent lexicon. In: CLS 34: The Panels, 421–435. Bybee, Joan L. (2010): Language, Usage and Cognition. Cambridge. Bybee, Joan L./Carol Lynn Moder (1983): Morphological classes as natural categories. In: Language 59 (2), 251–270. Bybee, Joan L./Dan I. Slobin (1982): Rules and schemas in the development and use of the English past tense. In: Language 58 (2), 265–289. Clausner, Timothy C./William Croft (1997): Productivity and schematicity in metaphors. In: Cognitive Science 21 (3), 247–282. Clausner, Timothy C./William Croft (1999): Domains and image schemas. In: Cognitive Linguistics 10 (1), 1–31. Culicover, Peter W./Ray Jackendoff (2005): Simpler Syntax. Oxford. Deppermann, Arnulf (2006): Construction grammar – eine Grammatik für die Interaktion? In: Arnulf Deppermann/Reinhard Fiehler/Thomas Spranz-Fogasy (Hg.): Grammatik und Interaktion. Radolfzell, 43–65. Deppermann, Arnulf (2007): Grammatik und Semantik aus gesprächsanalytischer Sicht. Berlin/New York. Deppermann, Arnulf (2012): Über Sätze in Gesprächsbeiträgen – wann sie beginnen und wann man sie braucht. In: Colette Cortès (Hg.): Satzeröffnung. Formen, Funktionen, Strategien. Tübingen, 1–14. Deppermann, Arnulf (2013): Introduction: multimodal interaction from a conversation analytic perspective. In: Journal of Pragmatics 46 (1), 1–7. Deppermann, Arnulf/Angelika Linke (Hg.) (2010): Sprache intermedial. Stimme und Schrift, Bild und Ton. Berlin/New York. Diessel, Holger (2004): The Acquisition of Complex Sentences. Cambridge. Diewald, Gabriele/Alexander Bergs (Hg.) (2008): Constructions and Language Change. Berlin/New York. Dodge, Ellen/George P. Lakoff (2005): Image schemas: from linguistic analysis to neural grounding. In: Beate Hampe (Hg.): From Perception to Meaning: Image Schemas in Cognitive Linguistics. Berlin, 57–92. Dürscheid, Christa/Jan Georg Schneider (2015): Satz – Äußerung – Schema. In: Ekkehard Felder/Andreas Gardt (Hg.): Handbuch Sprache und Wissen. Berlin/Boston (Handbücher Sprachwissen, 1), 167–194. Ehlich, Konrad (1991): Funktional-pragmatische Kommunikationsanalyse. Ziele und Verfahren. In: Dieter Flader (Hg.): Verbale Interaktion. Studien zur Empirie und Methodologie der Pragmatik. Stuttgart, 127–165. Ehlich, Konrad/Jochen Rehbein (1979): Sprachliche Handlungsmuster. In: Hans-Georg Soeffner (Hg.): Interpretative Verfahren in den Sozial- und Textwissenschaften. Stuttgart, 243–274.

460 

 Jörg Bücker

Fass, Warren/Gary M. Schumacher (1981): Schema theory and prose retention: boundary conditions for encoding and retrieval effects. In: Discourse Processes 4 (1), 17–26. Feilke, Helmuth/Angelika Linke (2009): Oberfläche und Performanz – Zur Einleitung. In: Angelika Linke/Helmuth Feilke (Hg.): Oberfläche und Performanz. Untersuchungen zur Sprache als dynamischer Gestalt. Tübingen, 3–17. Fiehler, Reinhard u. a. (2004): Eigenschaften gesprochener Sprache. Tübingen. Fillmore, Charles J. (1968): The case for case. In: Emmon Bach/Robert T. Harms (Hg.): Universals in Linguistic Theory. New York, 1–88. Fillmore, Charles J. (1977a): Scenes-and-frames-semantics. In: Antonio Zampolli (Hg.): Linguistic Structures Processing. Amsterdam, 55–81. Fillmore, Charles J. (1977b): The case for case reopened. In: Peter Cole/Jerrold M. Sadock (Hg.): Syntax and Semantics. Volume 8: Grammatical Relations. New York, 59–82. Fillmore, Charles J. (1988): The mechanisms of „Construction Grammar“. In: Shelley Axmaker/Annie Jaisser/Helen Singmaster (Hg.): Proceedings of the Fourteenth Annual Meeting of the Berkeley Linguistics Society. Berkeley, 35–55. Fillmore, Charles J. (2003): Valency and semantic roles: the concept of deep structure case. In: Vilmos Ágel u. a. (Hg.): Dependenz und Valenz. Ein internationales Handbuch der zeitgenössischen Forschung. 1. Teilband. Berlin/New York, 457–475. Fillmore, Charles J./Paul Kay/Mary Catherine O’Connor (1988): Regularity and idiomaticity in grammatical constructions: the case of „Let Alone“. In: Language 64 (3), 501–538. Fischer, Kerstin (2007): Konstruktionsgrammatik und Interaktion. In: Anatol Stefanowitsch/Kerstin Fischer (Hg.): Konstruktionsgrammatik. Von der Anwendung zur Theorie. Tübingen, 133–150. Fischer, Kerstin/Anatol Stefanowitsch (2007): Konstruktionsgrammatik. Ein Überblick. In: Anatol Stefanowitsch/Kerstin Fischer (Hg.): Konstruktionsgrammatik. Von der Anwendung zur Theorie. Tübingen, 3–17. Fix, Ulla (1990): Der Wandel der Muster – der Wandel im Umgang mit den Mustern: Kommunikationskultur im institutionellen Sprachgebrauch der DDR am Beispiel von Losungen. In: Deutsche Sprache 18 (4), 332–347. Fricke, Ellen (2012): Grammatik multimodal. Wie Wörter und Gesten zusammenwirken. Berlin/New York. Fried, Mirjam (2009): Construction grammar as a tool for diachronic analysis. In: Constructions and Frames 1 (2), 261–290. Fried, Mirjam/Jan-Ola Östman (2005): Construction grammar. A thumbnail sketch. In: Mirjam Fried/ Jan-Ola Östman (Hg.): Construction Grammar in a Cross-Language Perspective. Amsterdam/ Philadelphia, 11–86. Goldberg, Adele E. (2003): Constructions: a new theoretical approach to language. In: Trends in Cognitive Sciences 7 (5), 219–224. Gülich, Elisabeth (1980): Konventionelle Muster und kommunikative Funktionen von Alltagserzählungen. In: Konrad Ehlich (Hg): Erzählen im Alltag. Frankfurt a. M., 335–384. Gülich, Elisabeth/Heiko Hausendorf (2000): Vertextungsmuster Narration. In: Klaus Brinker u. a. (Hg.): Text- und Gesprächslinguistik. Ein internationales Handbuch zeitgenössischer Forschung. 1. Halbband. Berlin/New York, 369–385. Günthner, Susanne (1995): Gattungen in der sozialen Praxis. Die Analyse kommunikativer Gattungen als Textsorten mündlicher Kommunikation. In: Deutsche Sprache 25 (1), 193–218. Günthner, Susanne (2000): Vorwurfsaktivitäten in der Alltagsinteraktion. Grammatische, prosodische, rhetorisch-stilistische und interaktive Verfahren bei der Konstitution kommunikativer Muster und Gattungen. Tübingen.

Schema – Muster – Konstruktion 

 461

Günthner, Susanne (2008): Projektorkonstruktionen im Gespräch: Pseudoclefts, „die Sache ist“-Konstruktionen und Extrapositionen mit „es“. In: Gesprächsforschung – Online-Zeitschrift zur verbalen Interaktion 9, 86–114. Günthner, Susanne (2009): „Adjektiv + ‚dass‘-Satz“-Konstruktionen als kommunikative Ressourcen der Positionierung. In: Susanne Günthner/Jörg Bücker (Hg.): Grammatik im Gespräch: Konstruktionen der Selbst- und Fremdpositionierung. Berlin/New York, 149–184. Günthner, Susanne/Hubert A. Knoblauch (1996): Die Analyse kommunikativer Gattungen in Alltagsinteraktionen. In: Susanne Michaelis/Doris Tophinke (Hg.): Texte. Konstitution, Verarbeitung, Typik. München, 35–57. Hampe, Beate (2005a): When down is not bad and up not good enough: A usage-based assessment of the plus-minus parameter in image-schema theory. In: Cognitive Linguistics 16 (1), 81–112. Hampe, Beate (Hg.) (2005b): From Perception to Meaning: Image Schemas in Cognitive Linguistics. Berlin. Hausendorf, Heiko/Uta M. Quasthoff (1996): Sprachentwicklung und Interaktion. Eine linguistische Studie zum Erwerb von Diskursfähigkeiten bei Kindern. Wiesbaden. Heinemann, Wolfgang (2000): Textsorte – Textmuster – Texttyp. In: Klaus Brinker u. a. (Hg.): Text- und Gesprächslinguistik. Ein internationales Handbuch zeitgenössischer Forschung. 1. Halbband. Berlin/New York, 507–523. Hennig, Mathilde (2006): Grammatik der gesprochenen Sprache in Theorie und Praxis. Kassel. Hunston, Susan/Gill Francis (2000): Pattern Grammar: A Corpus-Driven Approach to the Lexical Grammar of English. Amsterdam/Philadelphia. Imo, Wolfgang (2007a): Construction Grammar und Gesprochene-Sprache-Forschung. Tübingen. Imo, Wolfgang (2007b): Der Zwang zur Kategorienbildung: Probleme der Anwendung der Construction Grammar bei der Analyse gesprochener Sprache. In: Gesprächsforschung – Online-Zeitschrift zur verbalen Interaktion 8, 22–45. Jackendoff, Ray (2007): A parallel architecture perspective on language processing. In: Brain Research 1146, 2–22. Jacobs, Joachim (2008): Wozu Konstruktionen? In: Linguistische Berichte 213, 3–44. Jacobs, Joachim (2009): Valenzbindung oder Konstruktionsbindung? Eine Grundfrage der Grammatiktheorie. In: Zeitschrift für Germanistische Linguistik 37 (3), 490–513. Janich, Nina (Hg.) (2008): Textlinguistik. 15 Einführungen. Tübingen. Johnson, Mark (1987): The Body in the Mind: The Bodily Basis of Meaning, Imagination, and Reason. Chicago. Jurafsky, Daniel (1991): An On-Line Computational Model of Human Sentence Interpretation: A Theory of the Representation and Use of Linguistic Knowledge. Berkeley (Dissertation, University of California). Kallmeyer, Werner/Fritz Schütze (1976): Konversationsanalyse. In: Studium Linguistik 1, 1–28. Kallmeyer, Werner/Fritz Schütze (1977): Zur Konstitution von Kommunikationsschemata der Sachverhaltsdarstellung. Exemplifiziert am Beispiel von Erzählungen und Beschreibungen. In: Dirk Wegner (Hg.): Gesprächsanalysen. Referate der IPK-Tagung 1976. Hamburg, 159–274. Kindt, Walther (1994): Satzbegriff und gesprochene Sprache. In: Lingua 94, 25–48. Konerding, Klaus-Peter (1997): Grundlagen einer linguistischen Schematheorie und ihr Einsatz in der Semantik. In: Inge Pohl (Hg.): Methodologische Aspekte der Semantikforschung. Frankfurt a. M., 57–84. Konerding, Klaus-Peter (1999): Merkmale, Bedeutungspostulate, Prototypen, Schemata – Aspekte der Kompatibilität prominenter Modelle in der Semantik. In: Inge Pohl (Hg.): Interdisziplinarität und Methodenpluralismus in der Semantikforschung. Frankfurt a. M., 19–41. Köpcke, Klaus-Michael (1987): Der Erwerb morphologischer Ausdrucksmittel durch L2-Lerner am Beispiel der Personalflexion. In: Zeitschrift für Sprachwissenschaft 6, 186–205.

462 

 Jörg Bücker

Köpcke, Klaus-Michael (1993): Schemata bei der Pluralbildung im Deutschen. Versuch einer kognitiven Morphologie. Tübingen. Köpcke, Klaus-Michael (1994): Zur Rolle von Schemata bei der Pluralbildung monosyllabischer Maskulina. In: Klaus-Michael Köpcke (Hg.): Funktionale Untersuchungen zur deutschen Nominal- und Verbmorphologie. Tübingen, 81–95. Köpcke, Klaus-Michael/David Zubin (1984): Sechs Prinzipien für die Genuszuweisung im Deutschen: Ein Beitrag zur natürlichen Klassifikation. In: Linguistische Berichte 93, 26–50. Kotthoff, Helga (1999a): Die Kommunikation von Moral in georgischen Lamentos. In: Jörg Bergmann/ Thomas Luckmann (Hg.): Von der Moral zu den Moralen. Opladen, 50–80. Kotthoff, Helga (1999b): Affekt-Darbietung in interkulturellen Lamentationen in Georgien. In: Stefan Rieger/Schamma Schahadat/Manfred Weinberg (Hg.): Interkulturalität. Zwischen Inszenierung und Archiv. Tübingen, 231–250. Kutscher, Sylvia (2010): Ikonizität und Indexikalität im gebärdensprachlichen Lexikon – Zur Typologie sprachlicher Zeichen. In: Zeitschrift für Sprachwissenschaft 29 (1), 79–110. Lakoff, George P. (1973): Hedges: a study in meaning criteria and the logic of fuzzy concepts. In: Journal of Philosophical Logic 2 (4), 458–508. Lakoff, George P. (1987): Women, Fire, and Dangerous Things. Chicago. Lakoff, George P. (1990): The invariance hypothesis: is abstract reason based on image-schemas? In: Cognitive Linguistics 1 (1), 39–74. Lakoff, George P./Mark Johnson (1980): Metaphors We Live By. Chicago. Langacker, Ronald W. (1987): Foundations of Cognitive Grammar. Volume I. Stanford. Langacker, Ronald W. (1988): A usage-based model. In: Brygida Rudzka-Ostyn (Hg.): Topics in Cognitive Linguistics. Amsterdam, 127–161. Langacker, Ronald W. (1991): Foundations of Cognitive Grammar. Band 2. Stanford. Langacker, Ronald W. (2000): A dynamic usage-based model. In: Suzanne Kemmer/Michael Barlow (Hg.): Usage-Based Models of Language. Stanford, 1–63. Langacker, Ronald W. (2002): Concept, Image, and Symbol. The Cognitive Basis of Grammar. 2. Auflage. Berlin/New York. Lasch, Alexander (i. V.): Konstruktionen im Dienst von Argumentationen. In: Jörg Bücker/Susanne Günthner/Wolfgang Imo (Hg.): Konstruktionsgrammatik V – Konstruktionen im Spannungsfeld von sequenziellen Mustern, kommunikativen Gattungen und Textsorten. Tübingen. Linell, Per (2005): The Written Language Bias in Linguistics: Its Nature, Origins and Transformations. London/New York. Linke, Angelika (2009): Stilwandel als Indikator und Katalysator kulturellen Wandels. Zum Musterwandel in Geburtsanzeigen der letzten 200 Jahre. In: Der Deutschunterricht 61 (1), 44–56. Linke, Angelika (2011): Signifikante Muster – Perspektiven einer kulturanalytischen Linguistik. In: Elisabeth Wåghäll Nivre u. a. (Hg.): Begegnungen. Das VIII. Nordisch-Baltische Germanistentreffen in Sigtuna vom 11. bis 13.6.2009. Stockholm, 23–44. Luckmann, Thomas (1986): Grundformen der gesellschaftlichen Vermittlung des Wissens: Kommunikative Gattungen. In: M. Rainer Lepsius/Friedhelm Neidhardt/Johannes Weiß (Hg.): Kultur und Gesellschaft. Sonderheft 27 der Kölner Zeitschrift für Soziologie und Sozialpsychologie. Opladen, 191–211. Makkai, Adam (1972): Idiom Structure in English. The Hague. Mandler, Jean Matter (1984): Stories, Scripts, and Scenes: Aspects of Schema Theory. Hillsdale. Pfau, Roland/Markus Steinbach/Bencie Woll (Hg.) (2012): Sign Language. An International Handbook. Berlin.

Schema – Muster – Konstruktion 

 463

Rumelhart, David E. (1980): Schemata: The building blocks of cognition. In: Rand J. Spiro/Bertram C. Bruce/William F. Brewer (Hg.): Theoretical Issues in Reading and Comprehension. Hillsdale, 33–58. Rupp, Heinz (1965): Gesprochenes und geschriebenes Deutsch. In: Wirkendes Wort 15, 19–29. Sandig, Barbara (1987): Textwissen. Beschreibungsmöglichkeiten und Realisierungen von Textmustern am Beispiel der Richtigstellung. In: Johannes Engelkamp/Kuno Lorenz/Barbara Sandig (Hg.): Wissensrepräsentation und Wissensaustausch. Interdisziplinäres Kolloquium der Niederländischen Tage in Saarbrücken, April 1986. St. Ingbert, 115–155. Sandig, Barbara (1989): Stilistische Mustermischungen in der Gebrauchssprache. In: Zeitschrift für Germanistik 10, 133–150. Schiffrin, Deborah/Deborah Tannen/Heidi E. Hamilton (Hg.) (2003): The Handbook of Discourse Analysis. Oxford. Schneider, Jan Georg (2008): Spielräume der Medialität. Linguistische Gegenstandskonstitution aus medientheoretischer und pragmatischer Perspektive. Berlin/New York. Selting, Margret (1995): Der „mögliche Satz“ als interaktiv relevante syntaktische Kategorie. In: Linguistische Berichte 158, 298–325. Stefanowitsch, Anatol (2009): Bedeutung und Gebrauch in der Konstruktionsgrammatik. Wie kompositionell sind modale Infinitive im Deutschen? In: Zeitschrift für Germanistische Linguistik 37 (3), 565–592. Stein, Stephan (2003): Textgliederung. Einheitenbildung im geschriebenen und gesprochenen Deutsch: Theorie und Empirie. Berlin/New York. Stukenbrock, Anja (2009): Referenz durch Zeigen. Zur Theorie der Deixis. In: Deutsche Sprache 37, 289–316. Thorndyke, Perry W./Frank R. Yekovich (1980): A critique of schema-based theories of human story memory. In: Poetics 9, 23–49. Tognini-Bonelli, Elena (2001): Corpus Linguistics at Work. Amsterdam/Philadelphia. Tomasello, Michael (2003): Constructing a Language: A Usage-Based Theory of Language Acquisition. Harvard. Tomasello, Michael (2007): Konstruktionsgrammatik und früher Erstspracherwerb. In: Kerstin Fischer/Anatol Stefanowitsch (Hg.): Konstruktionsgrammatik. Tübingen, 19–37. Traugott, Elizabeth Closs/Graeme Trousdale (2013): Constructionalization and Constructional Changes. Oxford. Wengeler, Martin (2003): Topos und Diskurs. Begründung einer argumentationsanalytischen Methode und ihre Anwendung auf den Migrationsdiskurs (1960–1985). Tübingen. Wengeler, Martin (2007): Topos und Diskurs: Möglichkeiten und Grenzen der topologischen Analyse gesellschaftlicher Debatten. In: Ingo H. Warnke (Hg.): Diskurslinguistik nach Foucault: Theorie und Gegenstände. Berlin/New York, 165–186. Whitney, Paul u. a. (1995): On babies, bath water, and schemata: a reconsideration of top-down processes in comprehension. In: Discourse Processes 20, 135–166. Ziem, Alexander (2008): Frames und sprachliches Wissen. Kognitive Aspekte der semantischen Kompetenz. Berlin/New York. Ziem, Alexander (2013): Syntaktische Konstruktionen als diskursive Muster: Krisen in der medienvermittelten Öffentlichkeit. In: Jens Maeße (Hg.): Ökonomie, Diskurs, Regierung: interdisziplinäre Perspektiven. Wiesbaden, 141–166.

Susanne Tienken

20. Muster – kulturanalytisch betrachtet

Abstract: Der Beitrag zeigt auf, dass Sprachgebrauchsmuster in der linguistischen Kulturanalyse als kulturelle Sinnformgebungen verstanden werden können, die eine Verortung des Menschen in der Welt und in der Gemeinschaft ermöglichen  – und zwar insofern, als Musterbildungen im Zusammenfall von Typisierung und Routine immer das kollektive Produkt von Kommunikationsgemeinschaften darstellen. Theoretisch grundlegend ist dabei die konstruktivistische Annahme einer sozial hergestellten Wirklichkeit, wie sie von Berger und Luckmann (242012) vorgelegt worden ist. Muster lassen sich im Rahmen dieses Ansatzes als Teil intersubjektiver Verständigungsprozesse deuten und haben Anteil an der Festigung und Fortführung von Wahrnehmungsweisen. Dies wird ergänzt durch Prämissen, wie sie in der dialogistischen Sprachtheorie formuliert werden (vgl. Linell 2009). Danach geschieht jegliche Äußerung in der Kommunikation immer schon im vorausgreifenden Wechselspiel von Ego und Alter. Diese Grundlagen werden schließlich mit einem semiotischen Kulturverständnis vereint, um rekurrente sprachliche Formen als symbolhaft, als signifikante Muster (vgl. Linke 2011) deuten zu können. Die sinnhafte Erschließung dieser Musterbildungen ermöglicht Einblick in Aspekte menschlichen Daseins, in Veränderungen der Wahrnehmung, Erfahrung und Aneignung von Welt. 1 Einleitung 2 Sprache und Kultur 3 Muster in Theorie und Methode 4 Musterstudien 5 Fazit: signifikante Muster als kulturelle Sinnformgebungen 6 Literatur

1 Einleitung Sprache ist in der linguistischen Kulturanalyse als ein Ort zu verstehen, an dem Kultur nicht als vorgängiger Kontext gegeben ist, sondern an dem sie in ihren Repräsentationen in Erscheinung tritt und zum Funktionieren gebracht wird (vgl. Tienken 2008, 211; Linke 2014, 177). Typisierungen und Routinisierungen sind bei dieser Funktionalisierung von zentraler Bedeutung. Obwohl es kulturbezogenes Arbeiten in der Sprachwissenschaft schon lange gibt (vgl. Gardt 2003, 271), ist die kulturanalytische Linguistik ein verhältnismäßig junger Wissenschaftsbereich, der vor allem Forschende aus Sprachgeschichte und Sprachgebrauchsforschung vereint. Diese sind sich dessen aber nicht zwangsläufig bewusst,

Muster – kulturanalytisch betrachtet 

 465

was insbesondere auf die inhärente Interdisziplinarität von Kulturanalyse und Kulturwissenschaft zurückzuführen ist. Die breite Streuung der Arbeiten im Bereich der neueren Sprachgeschichtsforschung (z. B. Stukenbrock 2005; Schröter 2012; auch Havinga/Langer 2014), der Diskursanalyse (z. B. Warnke 2004) und der Soziolinguistik (z. B. Keim 2007; Auer 2000) veranschaulicht jedoch trotz oder gerade wegen der Diversität eine fortschreitende Kulturalisierung der Linguistik jenseits eines nichtkulturbezogenen Mainstreams. Besonders seit Ende der 90er Jahre des 20. Jahrhunderts lassen sich Tendenzen zur Konturierung einer kulturbezogenen Linguistik erkennen (vgl. Linke 1996, 2003a, 2003b). Die steigende Anzahl an Tagungen und Sammelbänden mit thematischer ­Orientierung im Bereich von Sprache und Kultur sowie die Gründung entsprechender Forschungsnetzwerke belegen dies. Die kulturorientierte Linguistik wächst, aber sie ist nicht hegemonial gesinnt. Mittlerweile gibt es sowohl Raum für die Betrachtung sprachlicher Phänomene vor dem Hintergrund von Philosophie, Religion, Politik etc., wie von Gardt (2003) dargelegt, als auch für die Analyse von Sprache als das Formativ dieser gesellschaftlichen Domänen (vgl. Linke 2011), was nicht zuletzt auch Gegenstand der kritischen Diskursanalyse ist (vgl. Threadgold 2003). Trotz der Verschiedenheit der Ansätze ist den Arbeiten die Annahme der Interdependenz von Sprache und Kultur (vgl. Günthner/Linke 2006), von Sprachgeschichte und Gesellschaftsgeschichte (vgl. von Polenz 2002) gemeinsam. Dieses Verständnis der Verwobenheit von Sprache und Kultur ist im sprachlichen Idealismus bei Humboldt bereits ebenso zu finden wie in Hermann Pauls Postulat von Sprachwissenschaft als Kulturwissenschaft. Somit ist die Vorstellung einer Wechselbeziehung von Sprache und Kultur nicht neu und erst recht nicht einzigartig für die jetzige linguistische Kulturanalyse – diesen Zusammenhang ins Zentrum zu stellen und zudem verstehen zu wollen, hingegen schon.

2 Sprache und Kultur Die heutige empirische und theoretische Neuerarbeitung des Zusammenhangs von Sprache und Kultur ist weniger auf die Rückbesinnung auf eigene Traditionen zurückzuführen als auf den Austausch mit anderen Disziplinen. Die ständig andauernde Diskussion über die Inhalte und Disziplinarität von Kulturwissenschaft(en) ist dafür symptomatisch. Aus diesem Grund wäre es auch verfehlt, die kulturanalytische Linguistik als Fach allzu fest zu konturieren. Es handelt sich vielmehr um die linguistische Ausprägung sowohl von Cultural Studies als auch von Kulturwissenschaft, die ihren Spürsinn dafür einsetzt, „Materialität, Medialität und Tätigkeitsformen des Kulturellen“ zu durchleuchten, „um genauer zu erkennen, wie und in welchen Prozessen und kulturspezifischen Ausprägungen Geistiges und Kulturelles in einer jeweiligen

466 

 Susanne Tienken

Gesellschaft überhaupt produziert werden“ (Bachmann-Medick 2010, 9). Es geht also eher darum, neue Sichtweisen zu etablieren als sich fachlich abzugrenzen. Wissenschaftsgeschichtlich lässt sich die (Neu)Entstehung einer kulturanalytischen Linguistik größtenteils durch die Verflechtung zweier bedeutsamer Turns des 20. Jahrhunderts erklären, nämlich die des Linguistic Turn mit dem recht weit zu fassenden Cultural Turn (Bachmann-Medick 2010, 7 ff.). Diese Neuorientierungen in den Geisteswissenschaften haben, grob ausgedrückt, den Weg für ein Sprachverständnis geebnet, bei dem Sinnzuschreibungen veränderlich sind, und zu einem Kulturverständnis geführt, das auch das Alltägliche umfängt. Der Begriff der Kultur erscheint dabei trotz unzähliger Definitionen „notorisch vage“ (Wengeler 2006, 6). Eine klar umrissene Definition ist und bleibt auch nicht zu erwarten. Der Cultural Turn weist Kultur vielmehr die Position eines „grundlegenden Phänomens sozialer Ordnung“ zu, „das sämtliche Gesellschaftsbereiche durchdringt“ (Reuter/Hörning 2004, 7). Sprache und Kommunikation werden als ein Bereich betrachtet, der neben anderen steht und deshalb mehr oder weniger gesondert betrachtet wird. Erst vom Linguistic Turn, an dessen Wirkung die Linguistik allerdings trotz der Benennung nicht beteiligt war, lässt sich sagen, dass er den Fokus auf Sprache als wirklichkeitstragend und wirklichkeitsgenerierend (vgl. Günthner/Linke 2006, 3) und auf die sprachliche Durchdringung von Welt gerichtet hat, sowie die Einsicht mit sich brachte, dass uns Welt immer bereits durch den medialen Filter von Sprache erscheint. Ohne Sprachlichkeit wäre die Vergangenheit nicht zu fassen und die Zukunft nicht zu denken. Ohne Sprache wäre unser Dasein in gewisser Hinsicht schlicht sinn- und somit kulturlos. Dies wiederum insofern, als Kultur als Sinnstruktur zu verstehen ist. Ernst Cassirer, der zu den Vordenkern dieses Turns gezählt werden kann, sieht die Fähigkeit zur Symbolisierung als Schlüssel zur menschlichen Existenz. Sprache ordnet er neben Mythos, Kunst und Religion als einen Bestandteil des symbolischen Universums ein, welches Menschen zur Gestaltung ihrer Welt handhaben. Seiner eigenen „Erfindung“, dem „Symbolnetz“, könne der Mensch nicht entkommen. Er [der Mensch, S. T.] kann nicht anders, als sich auf die Bedingungen seines Daseins einzustellen. Er lebt nicht mehr in einem bloß physikalischen, sondern in einem symbolischen Universum. Sprache, Mythos, Kunst und Religion sind Bestandteile dieses Universums. Sie sind die vielgestaltigen Fäden, aus denen das Symbolnetz, das Gespinst menschlicher Erfahrung gewebt ist. (Cassirer 22007, 50)

Die Metapher des symbolischen Netzes, des Gespinstes, scheint auch in der Definition von Clifford Geertz wieder auf, in der er mit Hinweis auf Max Weber Kultur als „selbstgesponnenes Bedeutungsgewebe“ definiert, in das der Mensch selber verstrickt sei (Geertz 1983, 9). Dieser kultursemiotische Ansatz sollte sich als richtungsweisend für den Cultural Turn erweisen, für eine Definition von Kultur als Text (vgl. BachmannMedick 1996) und für die poetics of culture (vgl. Greenblatt 1990) in der Literaturwis-

Muster – kulturanalytisch betrachtet 

 467

senschaft. Kultur gilt in diesen Zusammenhängen als etwas, was lesbar ist und somit gedeutet werden kann. Für die Linguistik ist nun besonders relevant, dass Kultur in dieser Rahmung als eine „Praxis der Signifikation“ (Bachmann-Medick 1996, 16) verstanden werden kann. Sprachliche Zeichen referieren jedoch nicht einfach auf Dinge in der Welt, sondern verleihen ihnen eine Bedeutung, die sich nicht aus den Dingen selbst, sondern in Übereinkunft mit anderen und im Prozess beständiger Resignifikation ergibt. Die Sinngebung der Welt wird dementsprechend ontogenetisch erworben und phylogenetisch modifiziert (vgl. Feilke 1996). Sinn entsteht also nicht vorrangig situativ, sondern ist der Vorgeformtheit des Sprachgebrauchs, seiner generellen Musterhaftigkeit zu verdanken (vgl. Linke 2011, 27). Vor allem Feilke (1996, 1998) hat gezeigt, wie die Idiomatizität von Sprache an Sozialität gebunden ist. Er resümiert: Da die Kontexte unseres Sprach-Handelns […] in verschiedener Hinsicht fraglos kulturell geprägt sind, müssen auch Kultur, Kommunikation und Sprache aufs Engste zusammenhängen, und zwar nicht irgendwie, sondern durch das Sprechen und die in ihm hervorgebrachten Ordnungen selbst. (Feilke 1998, 173)

Bei der Herstellung dieser Zusammenhänge, von Bedeutungsgeweben und der Ausdeutung der Welt sind wir folglich nicht auf uns allein gestellt, sondern im ständigen Austausch mit anderen, was z. B. in der Ethnomethodologie untersucht wird. Zeichentheoretisch relevant ist dabei Garfinkels (1967) Indexikalitätskonzept, in dem das Potential sprachlicher Zeichen fokussiert wird, den Kontext sozialer Wertungen, von Interaktionsrollen oder Lebensweisen aufzurufen. Ähnlich wie der Ethnomethodologie geht es der kulturanalytischen Linguistik um die Beschreibung der Herstellung sozialen Sinns sowie darum, diesen Sinngebungsprozess auch theoretisch zu erklären. Ein Schritt in diese Richtung ist die Verbindung des semiotischen Kulturverständnisses mit dem einer kommunikativen Gestaltung von Kultur. Schließlich erhalten Zeichen nur einen Sinn, wenn sie in Gebrauch genommen werden. Linke (2008) verortet deshalb die wechselseitige Prägung von Kultur und Sprache in der Kommunikation und führt kulturellen Wandel auf dreierlei Zusammenhänge zurück: Erstens wohne kommunikativer Praxis eine Dynamik und ein „latentes Überraschungspotential“ inne, die sich aus dem Handlungscharakter von Kommunikation sowie aus einer gewissen Unvorhersehbarkeit des Effektes auf die teilnehmenden Interagierenden ergebe (vgl. Linke 2008, 28). Die Reaktion des anderen habe Folgen für die Wahl sprachlicher Formen und Handlungen in ähnlich gestalteten Situationen. Zweitens bildeten die „Repetitivität und Serialität kommunikativer Akte und Ereignisse“ die Voraussetzung der Reproduktion von Kultur und drittens seien die Muster des kommunikativen Austausches wiederum ein „Effekt der grundlegenden Reflexivität von Kommunikation wie Kultur“ (Linke 2008, 29). Vergesellschaftung ist also eine zen­ trale Funktion und ein emergenter Effekt von Kommunikation zugleich.

468 

 Susanne Tienken

Berger und Luckmann (242012) beschreiben diese Wechselwirkung (ohne die Verwendung linguistischer Terminologie) in bildhafter Weise: Das notwendigste Vehikel der Wirklichkeitserhaltung ist die Unterhaltung. Das Alltagsleben des Menschen ist wie das Rattern einer Konversationsmaschine, die ihm unentwegt seine subjektive Wirklichkeit garantiert, modifiziert und rekonstruiert. (Berger/Luckmann 242012, 163)

Dass diese Vergesellschaftung von Wirklichkeit funktionieren kann und Sprache dabei als Medium eingesetzt wird, ist wiederum auf die grundlegende Gemeinschaftlichkeit von Sprache, ihre Dialogizität und die Sozialität sprachlichen Miteinanders zurückzuführen, wie es im epistemologischen Paradigma des Dialogismus diskutiert wird (vgl. Linke 2008). Bei diesem heuristischen Rahmen, in welchen z. B. Michail Bachtin, Max Weber, Martin Buber oder auch George Herbert Mead und Erving Goffman gehören, geht es um die Erklärung menschlichen Handelns, von Kognition und Kommunikation (Linell 2009, 7). Die Grundidee des „dialogischen Prinzips“ besteht darin, dass sich menschliche Existenz über die wechselseitige Beziehung und Auseinandersetzung mit anderen (auch sprachlich) konstituiert. Es gibt also keine Äußerungen eines Einzelnen, die nicht immer auch schon an den angenommenen Erwartungen anderer ausgerichtet sind, und auch keine Auffassung über das Selbst, die nicht schon von antizipierten Urteilen anderer geprägt wäre. Die häufig zitierte „Brückenmetapher“ Vološinovs verdeutlicht diese beidseitige Prägung von Sprache. Demnach ist das Wort (zu verstehen als Äußerung) zu betrachten als […] a bridge thrown between myself and another. If one end of the bridge depends on me, then the other depends on my addressee. A word is territory shared by both addresser and addressee, by the speaker and his interlocutor. (Vološinov 1986 [1929], 86)

Die Brücke – um im Bild zu bleiben – kann also nur halten, wenn sie gemeinschaftlich getragen wird. Sinnpotentiale werden nicht einfach nur dargeboten, sondern im Hinblick auf das erwartete Verständnis des anderen ausgewählt. Sprache ist in ihrer Idiomatizität als durch und durch „soziale Gestalt“ (Feilke 1996) zu verstehen, Präsuppositionen sind dabei das Scharnier zwischen sprachlicher Form und dem „Hintergrund einer Welt, die schweigend für gewiß gehalten wird“ (Berger/Luckmann 24 2012, 163). Kultur und Sprache stehen schließlich in einem wechselseitigen Verhältnis, da Menschen als soziale Wesen ständig miteinander umgehen.

Muster – kulturanalytisch betrachtet 

 469

3 Muster in Theorie und Methode 3.1 Signifikante Muster Die folgenden Ausführungen bauen im Wesentlichen auf Angelika Linkes Ausführungen zu signifikanten Mustern auf. Die Grundthese, die als Vertiefung ihres kommunikationstheoretischen Ansatzes gesehen werden kann, besteht darin, „dass Musterbildungen einen wichtigen ‚Ort‘ der Verschränkung von Kultur und Sprache […] darstellen“ (Linke 2011, 27). Akzentuiert wird hier die Annahme der Bedeutsamkeit der Wahl und Bevorzugung bestimmter sprachlicher Muster gegenüber anderen. Die Aktualisierung von Mustern steht mit den jeweiligen Situationen und den Intentionen der Sprechenden in Verbindung, ohne jedoch zwingend dafür verantwortlich gemacht werden zu können (vgl. Linke 2011, 28). Vielmehr liefern u. a. soziolinguistische Beobachtungen Hinweise darauf, dass bestimmte Gruppen in bestimmten lokalsituativ-sozialen Kontexten systematisch zur Verwendung gewisser Muster neigen, was die Wahlmöglichkeiten kontinuierlich auf ein im Voraus gegebenes Spektrum einengt. Zu nennen wäre unter anderem die Arbeit von Keim (2007) zu den deutschtürkischen ‚Powergirls‘, deren spezifischer kommunikativer Stil als Ausdruck eines veränderlichen Selbstentwurfes gewertet werden kann. Die Wahl bestimmter Formulierungsmuster ist allerdings weder intentional noch konkret individuell: Wir haben es offensichtlich mit Anregungseffekten zu tun, das heißt mit einem Prozess von Gefallen, Wiederholung, Aneignung und Normalisierung. Konkreter formuliert also mit einem Phänomen, dass eine Formulierung, eine Wendung, eine Kollokation, die von einem Sprecher produziert wird, auf ein verbreitetes Gefallen bei anderen Sprechern und Sprecherinnen stößt, dass sie von anderen Sprechern als passend, als treffend, als richtig empfunden wird, dass diese Wendung schließlich in der entsprechenden Kommunikationsgemeinschaft allgemein angeeignet und letztlich zu einem als normal empfundenen, fertigen sprachlichen ‚Baustein‘ wird. (Linke 2011, 29)

Performanztheoretisch ist bereits früher erarbeitet worden, dass sprachliche Muster im Vollzug immer auch verändert oder unterminiert werden (vgl. Krämer 2002, 344–346). Mit der Betonung der Wiederaufnahme sprachlicher Muster aufgrund von Gefallen durch Sprecherinnen und Sprecher geht Linke aber darüber hinaus und charakterisiert den Menschen innerhalb von Gemeinschaften als kulturellen Akteur bei der Gestaltung von Welt. Darin offenbart sich ein grundlegend kulturanalytisches Statement. Aus dialogistischer Perspektive ließe sich hinzufügen, dass die jeweiligen Muster auch immer in Hinblick auf das erwartete Gefallen der anderen aktualisiert werden – oder eben auf ein Funktionieren. Was misslingt, wird selten wieder verwendet. Aus diesen Darlegungen lässt sich auch folgern, dass diachroner Wandel sprachlicher Muster auf einer Variabilität der synchronen Ebene beruht, die lokal-situativen Einflüssen und Anpassungen ausgesetzt ist.

470 

 Susanne Tienken

Das Aktualisieren bzw. das Wiederholen von Formen und Mustern baut auf Gemeinschaftlichkeit. Aus diesem Grund geht es Linke (2011) anders als z. B. Bubenhofer (2009) nicht um statistische Signifikanz, sondern um die Erschließung der Frage, inwiefern Muster als bezeichnend für eine bestimmte Gemeinschaft zu einer bestimmten Zeit anzusehen sind, inwiefern sie „Selbstdeutung und Weltdeutung einer Gesellschaft“ (Linke 2003b, 45) indizieren. Die kulturelle Signifikanz von Sprachgebrauchsmustern als symbolische Formen ergibt sich also nicht unmittelbar, sondern muss hermeneutisch erarbeitet werden, was „Ahndungsvermögen und Verknüpfungsgabe“ im Humboldt’schen Sinne erfordert (Humboldt 1994 [1821], 34).

3.2 Muster in der Methodik kulturanalytischer Linguistik Humboldts Anforderungen richten sich zwar an Historiker, sie sind aber auch für das Selbstverständnis der kulturanalytischen Linguistik relevant, da sie hermeneutische Verfahren für den Umgang mit musterhafter Sprache im Gebrauch nahelegen. Im Gegensatz zu Arbeiten der kritischen Diskursanalyse oder der Soziolinguistik ist der Untersuchungsgegenstand in kulturanalytisch-linguistischen Studien zu Beginn der Analyse zumeist äußerst vage (vgl. Tienken 2008), was im Wesentlichen auf das Erkenntnisinteresse kulturanalytischer Linguistik zurückzuführen ist: Es geht zwar allenfalls auch darum, bereits bekannte kulturelle Phänomene oder Entwicklungen im Spiegel von Sprachgebrauch und Sprachgebrauchsveränderungen bestätigt zu finden. Eigentliches Ziel einer kulturanalytischen Linguistik ist es jedoch, über die Analyse von Sprachgebrauch auf kulturelle Phänomene oder Veränderungen aufmerksam zu werden, die nicht bereits auf der Hand liegen. (Linke 2011, 40)

Kulturanalytische Linguistik ist somit nicht als Hilfswissenschaft zur Bestätigung der Resultate anderer Disziplinen anzusehen, sondern als eine eigenständige Wissenschaft mit offenem Horizont. Dabei kann sie zum einen die Erkenntnisse und Fragestellungen anderer Forschungszweige nutzen, um auf empirischer Grundlage die Entwicklung einer Sprachgebrauchstheorie weiter voranzutreiben. Zum anderen kann sie auch im Rückgriff auf heuristische Rahmungen des Linguistic und des Cultural Turn linguistisch fundierte Deutungsangebote von Sinnstrukturen heutiger und vergangener Welt bieten. An der sprachlichen Oberfläche feststellbare Muster können nun dafür genutzt werden, das angemahnte „Ahndungsvermögen“ auf den Plan zu rufen und Fragen nach dem Sinn von Sprachgebrauch, nach sozialsemiotischer Wirkung und kulturellem Mehrwert von Mustern evozieren (vgl. Hermanns 2003, 150). Muster sind gewissermaßen die „luminous details“ der Alltagswelt (vgl. Gallagher/Greenblatt 2000, 15), sprachliche Verdichtungsformen von Relevantsetzungen. Die Muster als solche zu erkennen, ist allerdings nicht immer einfach, da sie eben gerade Teil der Lebenswelt, des unbefragten Bodens der „natürlichen Weltanschauung“ sind (vgl. Schütz/

Muster – kulturanalytisch betrachtet 

 471

Luckmann 2003 [1979], 29 ff.) und somit oftmals nicht unmittelbar ersichtlich sind. Bisher sind es vor allem zwei Verfahrensaspekte, die den Vollzug eines notwendigen Perspektivenwechsels vom „Teilnehmer zum Beobachter“ ermöglichen (vgl. Assmann 1991, 13), wobei Überschneidungen durchaus vorkommen und Vorteile bieten können: 1. Kontrastivität: Muster werden in der Regel erkennbar, wenn sie mit einem Gegenbild konfrontiert werden, wenn eine Ausführungsvariante anderen gegenüber gestellt wird (Linke 2003b, 42). Ein Kontrast kann durch diachronische Betrachtung hergestellt werden oder auch durch die Analyse von Material aus unterschiedlichen Sprachgemeinschaften, wobei dies sowohl für unterschiedliche Einzelsprachen als auch für binnensprachliche Varietäten gelten kann. Möglich ist auch eine Kontrastierung mit Texten anderer Gattungen, um die Sinnangebote inhärenter Muster erschließen zu können (vgl. Tienken 2008, 66 f.). 2. Serialität: Neben dem eher qualitativ orientierten Verfahren der Kontrastierung bietet sich das Sichten seriell verfügbarer Quellen an. In der massiven Häufung gleichartiger Quellen lassen sich Muster qua ihrer Rekurrenz identifizieren (vgl. Schröter 2012). In Korpusanalysen lassen sich Muster als „Klumpen im Text“ ausmachen (Bubenhofer 2009, 111), wobei aber statistische Signifikanz nicht notwendigerweise mit kultureller Signifikanz korreliert. Mit der Identifizierung von Mustern ist allerdings noch keine Analyse vollbracht. Diese kann sich erst durch „Verknüpfungsgabe“ ergeben, die in der kulturanalytischen Linguistik vor allem in der Triangulierung von Theorie, Methode und Material besteht (vgl. Linke 1996; Tienken 2008, 65 f.). Muster können auf diese Weise im Wechselspiel von Bottom-up- und Top-down-Strategien im Verlauf einer „hermeneutischen Spirale“ (Fix 2007, 333) oder im Rahmen einer „quantitativen Hermeneutik“ (Schröter 2012, 363) gedeutet werden. Auf diese Weise ist eine Annäherung an das „Verweisungsganze“ möglich, „aus dem das einzelne kulturelle Phänomen seinen Sinn“ bezieht (Bude 1991, 7).

4 Musterstudien Im Folgenden werden Musterbildungen auf den sprachlichen Analyseebenen der kommunikativen Gattung, des kommunikativen Musters sowie der Morphologie exemplarisch behandelt, um methodische Aspekte und das Erkenntnisinteresse kulturanalytischer Linguistik zu veranschaulichen. Dabei greife ich bei den kommunikativen Gattungen auf eigene Untersuchungen, bei den anderen beiden Bereichen auf Beispiele aus der bestehenden Forschungsliteratur zurück.

472 

 Susanne Tienken

4.1 Kommunikative Gattungen: Erzählungen als Vereinheitlichung von Welt Muster auf der Textebene sind, zumindest interdisziplinär betrachtet, diejenige sprachliche Formgebung, zu der es in der Forschung die meisten theoretischen Ausführungen gibt. Textsorte, Gattung oder Genre sind allesamt Varianten eines Konzepts, das sowohl in der Linguistik und der Literaturwissenschaft als auch in der Kunst-, Musik- oder Medienwissenschaft sowie der Soziologie und Ethnologie/ Anthropologie den Zugriff auf ein zu untersuchendes Phänomen sichert. In allen diesen Disziplinen geht es bei der Sichtung des Objekts zunächst um einen zentralen Wesenszug, nämlich um die Rekurrenz von typisierten Mustern und um deren routinehaften Gebrauch. Obwohl sich kulturanalytische Linguistik aller Konzepte empirisch annimmt, haben diese dennoch unterschiedliche theoretische Bewandtnis für die kulturanalytische Erschließung der textuellen Ebene. In der angloamerikanischen und in der skandinavischen Sprachwissenschaft ist der Begriff des Genres in mehreren Disziplinen relevant und deckt sich teilweise mit dem, was in der germanistischen Linguistik als Textsorte bezeichnet wird. Zu finden ist Genre hier vor allem im Bereich der angewandten Linguistik sowie im Bereich der Halliday-inspirierten, systemisch funktionalen Linguistik. Während es in diesen Bereichen sowie in der germanistischen Textlinguistik allerdings vornehmlich um den Vergleich oder die Erfassung, Beschreibung und letztlich Typologisierung von Textsorten geht (vgl. z. B. Heinemann 2000), hat das Konzept der kommunikativen Gattung verstärkt funktional-explikativen Anspruch, nämlich Einblick zu geben in den kommunikativen Haushalt von Gesellschaften (vgl. Luckmann 1986, 1988, 2002). Die konstruktivistische Grundannahme ist dabei, dass Lebenswelt in der alltäglichen Kommunikationspraxis ständig rekonstruiert wird und dass sich sprachliche Muster/ Gattungen dabei zur Lösung wiederkehrender „kommunikativer Probleme“ herausbilden (Luckmann 1986). Bildhaft gesprochen lassen sich dann bei einer Inventur des „Haushaltes“ die als wichtig erachteten Dinge auffinden (Luckmann 1988, 284). Die sprachwissenschaftliche Relevanz des ursprünglich wissenssoziologischen Konzepts besteht zudem darin, dass kommunikative Gattungen in ihrer wiedererkennbaren Musterhaftigkeit Ressourcen darstellen, mit denen ein spezifischer kommunikativer Kontext erkannt, aber auch hergestellt werden kann (vgl. Günthner 2006, 175). Lassen sich also kommunikative Gattungen ausmachen, erhalten wir Hinweise auf gesellschaftliche Relevantsetzungen und deren kommunikative Organisation (vgl. Luckmann 1986, 206; Günthner/Knoblauch 1994; Günthner 2006). Somit vermitteln kommunikative Gattungen auch die Grenzen des Sagbaren in einer Kommunikationsgemeinschaft. Kommunikativen Gattungen wohnt also nicht nur eine Zeichenhaftigkeit inne, sondern sie enthalten immer auch eine Handlungsdimension, die im dialogistischen Sinne sowohl kulturell geprägt als auch prägend ist. Ihre Signifikanz beziehen kommunikative Gattungen aus ihrem Sedimentcharakter bzw. der Eigenschaft, Geäußertes ständig zu reproduzieren und zu rekontextualisieren.

Muster – kulturanalytisch betrachtet 

 473

Sie funktionieren somit als ein historisch vorgeformtes, als normatives Apriori für die Interagierenden und als ein Zugriff auf Welt: Speech genres are much more changeable, flexible, and plastic than language forms are, but they have a normative significance for the speaking individuum, and they are not created by him but are given to him. (Bakhtin 1986, 80 f.)

Die normative Signifikanz ergibt sich im Verständnis von kommunikativen Gattungen jedoch nicht aus der sprachlichen Gestaltung allein, sondern gerade aus der sinnträchtigen Verbindung der sogenannten Binnenstruktur, also der lexikalisch-syntaktischen, aber auch prosodischen und gestischen Ausformung sowie der Außenstruktur, den personellen und institutionalen Gegebenheiten einer Interaktionssituation. Hinzu kommt als Zwischenstruktur eine situative Realisierungsebene, in welche spezifische interaktive Verläufe und Elemente eingeordnet werden (vgl. Günthner/ Knoblauch 1994). Bei der Analyse von kommunikativen Gattungen ist für die kulturanalytische Linguistik also bedeutsam, dass diese nicht textuell-isoliert, sondern in ihrer Einbindung in Interaktionen untersucht werden, was einer plausiblen Deutung ihres Sinns im Rahmen kulturanalytischer Linguistik zuträglich ist. Das Gelingen oder Misslingen der Wahl sprachlicher Formen lässt sich (günstigstenfalls) in der Interaktion beobachten. Als Beispiel soll die kommunikative Gattung der persönlichen Erzählung im Internet herangezogen werden. Selbstoffenbarende Erzählungen, die ehemals psychotherapeutischen Sitzungen, Treffen von Selbsthilfegruppen oder dem vertraulichen Gespräch unter Freunden vorbehalten waren, werden nunmehr massenhaft im Internet veröffentlicht. Sie sind in eine mediale Praktik eingebunden, die in den neuen Medien als Sharing oder als Teilen bezeichnet wird (vgl. Tienken 2013). Websites und Foren fordern dabei explizit zum Teilen von Erfahrungen, d. h. dem Hinzufügen einer Erzählung in thematisch vorgegebenen Bereichen auf. Folglich wird in Blogs oder Foren erzählt, was einen selbst bewegt und anderen schon passiert ist bzw. passieren könnte: Geburtserlebnisse, Krankheitsgeschichten, Erzählungen über Sexualdebuts etc. Bedeutsam ist auch, dass der Zeitpunkt des Erlebens und der Zeitpunkt des Erzählens weitgehend angenähert werden. Sobald das Erzählte weiter zurückliegt, erfolgt zumeist eine Entschuldigung zu Beginn der Erzählung. Als Zuspitzung dieses Postulats zeitlicher Unmittelbarkeit in Sharingsituationen kann die quasi-synchrone Mediatisierung der Ich-hier-jetzt-Origo eines „Sprechers“ in Form eines Selfies geltend gemacht werden, eines mit Hilfe eines Smartphones erstellten Selbstportraits, welches zumeist unmittelbar in sozialen Medien wie z. B. Facebook oder Instagram veröffentlicht wird. Bei Selfies geht es darum, die Anwesenheit, den Ort und die eventuelle Begleitung der sich selbst fotografierenden Person ohne Zeitverlust zu vermitteln. Bei der Analyse medizinisch orientierter Foren im Bereich von Schwangerschaft und Geburt sind zwei Arten von Erzählungen zu unterscheiden. Besonders signifi-

474 

 Susanne Tienken

kant sind einerseits Erfahrungsberichte zur Geburt mit ausgesprochen einheitlicher Binnenstruktur. Erzählerischer Aufbau, Wortwahl, Kommunikationsstil ähneln sich hier auffallend stark. Der üblicherweise erzähltheoretisch postulierte Neuigkeitswert von Erzählungen steht im Kontext von Sharing weit hinter dem Ähnlichkeitswert von Erzählungen zurück. Tellability geht also mit Shareability einher. Die detailreichen Darstellungen der Geburtsberichte liefern den anderen werdenden Müttern und frisch Entbundenen keine Neuigkeiten, sondern bewirken die narrative Anteilnahme der anderen, was in den Kommentaren der Forenteilnehmenden auch mit Ausdrücken des Lobes und mit Begeisterung indizierenden Emoticons ratifiziert wird. Daneben finden sich Erzählungen kleineren Formats, wie z. B. Problemschilderungen, bei deren Lösung die Antworten der anderen Forenteilnehmer eine gewisse Orientierung bieten. Aus den kleinen Erzählungen und den darauf folgenden Kommentaren geht deutlich hervor, dass externen medizinischen Experten generell mit Misstrauen begegnet wird. Daher wird bei den Problemschilderungen explizit nach den subjektiven Erfahrungen anderer Forenmitglieder gefragt. Aus der Vielzahl der geposteten Antworten im Thread kann sich das ratsuchende Subjekt eine für sich selbst passende Alternative zur eigenen Handlungsorientierung aussuchen  – oder auch nicht. Für Sharingsituationen ist dabei konstitutiv, dass weder Problemschilderungen noch die eingegangenen Antworten kritisiert oder in Frage gestellt werden. Stattdessen wird mit Hilfe von Dankesworten und diversen Emoticons eine emotionale Verbindlichkeit gegenüber sämtlichen an der Interaktion Teilnehmenden signalisiert und somit weitgehender Konsens inszeniert. Sharing stellt zweifelsohne einen Faktor für wesentliche Neuerungen im kommunikativen Haushalt der Gesellschaft dar. Die massive Veröffentlichung persönlicher Erzählungen ist dabei zwar bereits ein bedeutsames Zeichen eines kulturellen Wandels, ergibt aber noch nicht das ganze Bild. Die Neuerung besteht im Effekt der Wechselwirkung von medialer Affordanz und sozialem Motiv von Sprachbenutzern (vgl. Miller/Shepherd 2004). Das Medium ist dabei mit Dürscheid (2005, 9) der Außenstruktur kommunikativer Gattungen zuzuordnen. Aus der Wechselwirkung von Binnen- und Außenstruktur der kommunikativen Gattung ergeben sich auf der Zwischenebene aber auch gemeinschaftlich hergestellte Kommunikationsansprüche. Dabei ist grundlegend, dass in Sharingsituationen lediglich vermutet Gleichgesinnte aufgesucht werden, was zwar auch bei Selbsthilfegruppen der Fall ist, aber durch die Existenz von Webforen oder thematisch ausgerichteten Websites beispielsweise enorm erleichtert wird. Die soziale Ressource, die persönliche Erzählungen im Kontext von Sharing in sich bergen, ist also die der Selbstverständigung selbstgewählter Kommunikationsgemeinschaften. Bei dem Austausch von Erzählungen geht es vor allem um die Bestätigung des eigenen, narrativ vorgeprägten Erlebens als richtig, was letztlich zu einer Homogenisierung von Erfahrung, zu einer Wirklichkeitserhaltung im Sinne von Berger/Luckmann (242012) führt (vgl. Tienken 2013). Dies lässt sich im Anschluss an Anthony Giddens Reflexivitätstheorie deuten, nach welcher sich Individuen der Post-

Muster – kulturanalytisch betrachtet 

 475

moderne verstärkt an den Erfahrungen von Peers orientieren und das Expertentum an Bedeutung verliert (vgl. Giddens 1991). Die Analyse von ‚geteilten‘ Erzählungen als kommunikative Gattungen kann darüber hinaus verdeutlichen, inwiefern mediale Affordanzen kulturelle Sinngebungsprozesse und Selbstverortungen nachhaltig verändern (vgl. Tienken 2015, 39 ff.). Die breite thematische Auffächerung im Web macht es sinnvoll, Musterhaftigkeiten im Kontext von Sharing in der Differenzierung von Kommunikationsgemeinschaften auf der jeweiligen Text- und Interaktionsebene zu analysieren. Damit kann dem generellen Fokus der kulturanalytischen Linguistik auf Kommunikationsgemeinschaften unterschiedlicher Größenordnung auch entsprochen werden.

4.2 Kommunikative Muster: Grüße als Formen von Nähe und Distanz Neben den großformatigen kommunikativen Gattungen mit verfestigten Verlaufsformen sind es die kommunikativen Muster  – die „weniger komplex formalisierten und weniger verpflichtend festgelegten kommunikativen Formen“ (Günthner/Knoblauch 1994, 703) –, die in den Blick kulturanalytischer Linguistik genommen werden können. Trotz geringerer Verfestigung ist nämlich relevant, dass Muster „sozial standardisiert“ sind und „zur Realisierung spezifischer, im sozialen Prozeß häufig wiederkehrender Aufgaben oder Zwecke dienen“ (Fiehler 1990, 94). Die größere Variationsmöglichkeit bringt also genau das Moment der Wahl ins Spiel, das als Faktor der Erhaltung und Veränderung von Welt anzusehen ist. Ein anschauliches Beispiel für kommunikative Muster sind Grüße, d. h. Begrüßungen und Verabschiedungen wie z. B. Guten Tag, Hi, Hallo, Grüß Gott, Servus, Auf Wiederhören, Tschau etc., die mehr oder weniger formelhaft ausgeführt werden, zu denen häufig ähnliche Varianten verfügbar sind und deren Wahl kommunikativ bedeutsam ist. Dabei ist weniger ihre semantische Bedeutung relevant (diese ist oftmals verblasst), sondern ihre Funktionalität und Performativität. Letzteres ist schon aus der Tatsache ersichtlich, dass Grußformeln zwar in auffälliger Frequenz als Buchtitel für Fremdsprachlehrwerke dienen und im fremdsprachlichen Unterricht zumeist Stoff schon der ersten Unterrichtseinheiten sind, der Etymologie allerdings keine Beachtung geschenkt wird. Sie sind Formen von Höflichkeit, was besonders bei ihrem Unterbleiben deutlich wird. In der Kontrastierung der diachronischen Betrachtung wird zudem deutlich, dass Grüße zur kommunikativen Konstruktion soziokultureller Ordnungen beitragen und dass sie gerade in ihrer Alltäglichkeit ein signifikantes Muster darstellen können (Linke 2014). Zur Erläuterung lässt sich die Entwicklung der Verwendung von Hallo und Tschüss heranziehen (vgl. Schürmann 1994). Während Hallo früher allenthalben als unpersönlicher Zuruf wie in Hallo, ist da jemand? oder Hallo, Sie da! verwendet wurde und somit als Ausdruck von Distanz zu verstehen war, ist Hallo in Verbindung mit dem Vornamen seit Mitte des 20. Jahrhun-

476 

 Susanne Tienken

derts auch als Gruß zwischen Bekannten gebräuchlich. Bemerkenswert ist nun aber, dass Hallo sich nicht nur in diesem Kontext verbreitet hat, sondern auch in Beziehungen des Siezens bzw. der Distanz Eingang gefunden hat. Selbst in Anredeformen schriftlicher Kommunikation, vor allem in E-Mails, ist nunmehr z. B. Hallo Frau/Herr X zu finden. Die Verbreitung aus informellen Kontexten in solche, die früher eher distanzierende Formeln erwarten ließen, folgt dem gleichen Verwendungsmuster wie Tschüss. Sowohl Hallo als auch Tschüss entstammen der Sphäre von Informalität und sozialer Nähe, indizieren aber heute eine latente „Informalisierung und Ent-Distanzierung“: Auf diese Weise wird in den kommunikativen Ritualen von Begrüßung und Verabschiedung eine neue kommunikative Sphäre mittlerer Distanz bzw. eines mittleren Formalisierungsgrades geschaffen, ohne dass die für das Deutsche charakteristische Du-Sie-Differenzierung grundsätzlich in Frage gestellt wird. (Linke 2014, 180 f.)

In der Verbreitung veränderter Grußmuster zeichnet sich also auch ein Wandel der Einschätzung des Gegenübers ab. Unser heutiges Dasein ist wesentlich durch eine Höflichkeit der Nähe geprägt, was nicht zuletzt anhand von Wettergrüßen wie mit vielen Grüßen aus dem sonnigen Mainz oder herzlich aus dem verregneten Zürich ersichtlich werden kann. Neben solche qualitativ orientierten Kontrastierungen lässt sich die quantitative Hermeneutik Juliane Schröters (2012) stellen, die die Verwendung der Abschiedsformel auf Wiedersehen anhand von 206 literarischen Abschiedsszenen aus Werken des 19. und 20. Jahrhunderts untersucht. Dabei stellt sie fest, dass auf Wiedersehen in der ersten Hälfte des 19. Jahrhunderts in auffälliger Häufigkeit von Vertretern des Adels gebraucht wird bzw. von Sprechern, die Interaktionspartner gleichen oder niedrigeren Standes verabschieden. Als Hauptgrund dafür lässt sich annehmen, dass die Äußerung durch eine rangniedrigere Person der Gefahr ausgesetzt ist, vom Interaktionspartner ausgehend von ihrer wörtlichen Bedeutung als Anmaßung empfunden zu werden, nämlich als versuchte Bestimmung, als Bestätigung oder Erinnerung eines Wiedertreffens, über das der untergeordnete Interaktant nach der sozialen Logik der Zeit nicht zu verfügen hat. (Schröter 2012, 366)

Erst im späten 19. Jahrhundert lässt sich nach Schröter eine Lockerung der sozialen Verwendungsrestriktionen feststellen; auf Wiedersehen wird nun auch im Dialog paarig als Gruß-Gegengruß eingesetzt, um dann im weiteren Verlauf eine „immer zentralere“ Stellung im Spektrum der Abschiedsformeln zu erhalten (Schröter 2012, 268). Das allein durch sprachpuristische und deutschnationale Bestrebungen und die damit verbundene Verfemung des französischen adieu zu erklären, dessen Platz auf Wiedersehen einnehmen konnte, reicht nach Schröter nicht aus, seine zunehmende Verwendung zu erklären. Ihre Daten zeigen, dass eine Zunahme des Musters bereits im 19. Jahrhundert zu verzeichnen ist, die Kritik an adieu aber erst zur Zeit des Ersten

Muster – kulturanalytisch betrachtet 

 477

Weltkrieges kulminiert. Nach Schröter scheint zum einen die Orientierung am prestigeträchtigen Sprachgebrauch der höheren Schichten eine Rolle gespielt zu haben, zum anderen aber auch im Zuge einer weitreichenden „sozialen Beschleunigung“ im Sinne Hartmut Rosas ein tatsächliches Wiedersehen wahrscheinlicher geworden zu sein (Schröter 2012, 375). Die Abnahme der Verwendung von auf Wiedersehen ab der zweiten Hälfte des 20.  Jahrhunderts bringt Schröter mit der Verbreitung des als informell empfundenen tschüs oder bis bald in Verbindung. Die Bedeutung des Gefallens an bestimmten Formen und die daraus resultierende Wahl einer Variante durch Sprecherinnen und Sprecher dürften auch hier zentral zu setzen sein. Schröter schlägt vor, den Prozess der ‚Informalisierung der Umgangsformen‘ als „soziokulturell bedingte Präferenz einer Höflichkeitsart“ zu deuten, „die darin besteht, dass man dem Kommunikationspartner emotionale Verbundenheit und persönliche Zuneigung signalisiert“ (Schröter 2012, 373). Dass auf Wiedersehen diese Leistung nicht (mehr) zu erbringen vermochte, liegt vermutlich nicht an der Abschiedsformel selbst, sondern daran, dass sie zunehmend in der Geschäftskommunikation Anwendung fand, was sie als Form zum Indizieren (in Garfinkels Sinne) einer Nähebeziehung schlichtweg untauglich machte.

4.3 Muster auf lexikalisch-morphologischer Ebene: Wortbildung als Erfahren, Fassen und Aneignen von Welt Wortbildungsmuster sind für die linguistische Kulturanalyse auf verschiedene Weise relevant und können sowohl in synchronischer als auch in diachronischer Betrachtung Aufschlüsse über kulturelle Sinngebungen liefern. Als konventionalisierte Verdichtungsformen zeigen insbesondere Komposita an, was in einer Kommunikationsgemeinschaft zueinander in Bezug gesetzt wird und somit auch, welche Sinnbezüge in einer Gesellschaft bereits vorhanden sind oder auch neu hergestellt werden. Letzteres lässt sich beispielsweise an der Vielzahl der Komposita in den Nominierungslisten sowohl für das Wort des Jahres der Gesellschaft für deutsche Sprache als auch für das Unwort des Jahres illustrieren. Einschlägige Belege für solche Wörter oder Unwörter sind z. B. Armutseinwanderung, Protz-Bischof oder Sozialtourismus, die allesamt Neubildungen zur Erfassung und Bewertung (neuer) Dinge in der Welt sind (vgl. Herberg u. a. 2004). Da Grund- und Bestimmungswort aufeinander bezogen sind, bieten Komposita dieser Art die Möglichkeit der Analyse wertender Perspektivierungen. Bezeichnenderweise war gerade die Wortbildung, insbesondere die Movierung und Komposition, eine Kernfrage in den Anfängen der feministischen Linguistik, welche sich u. a. der Offenlegung und Kritik bestehender diskriminierender sprachlicher Strukturen widmet. Nach Auffassung der feministischen Linguistik bildet Sprache die Ungleichheit zwischen den Geschlechtern in einer Gesellschaft nicht nur ab, sondern verfestigt diese auch. So werden unmovierte Pluralformen wie Liebe Zuhörer oder die Politiker von heute als rekurrentes Muster der Missachtung und

478 

 Susanne Tienken

des Unsichtbarmachens von Frauen gedeutet, da ein Mitgemeintsein von Frauen in Formen des generischen Maskulinums eine (selten erbrachte) besondere kognitive Leistung erfordert. Vor allem im Bereich von Personenbezeichnungen, also bei der kategorialen Erfassung von Mitgliedern einer Gesellschaft, sind Asymmetrien zuungunsten von Frauen als Spiegelungen einer diskriminierenden Gesellschaft gedeutet worden (vgl. Trömel-Plötz 1978; Pusch 1979). In neueren Ansätzen der feministischen Linguistik wird, ausgehend von einem konstruktivistischen Wirklichkeitsverständnis, weniger die Diskriminierung eines Geschlechts als die Zwei-Genderung der Welt kritisiert, die sich im Verständnis dieser Forschungsrichtung wiederum unter anderem auch durch entsprechende Wortbildungsmuster konstituiert (vgl. Hornscheidt 2008). Neben dieser synchronischen Perspektive lässt sich auch eine diachronische Perspektive auf Wortbildungsmuster anlegen. So ist zum Beispiel die Substantivkomposition eine typische Musterbildung im Deutschen, die erst mit dem Beginn der frühen Neuzeit an Produktivität gewann (vgl. Solms 1999, 234; Linke 2011, 33). Solms sieht die Entwicklung der Substantivkomposition zudem im Lichte zweier großer kulturgeschichtlicher Veränderungen. Zum einen weist er darauf hin, dass „die Komposition als eine besonders auf die medial schriftsprachliche Vermittlung bezogene Symbolisierungsweise“ in Erscheinung tritt (Solms 1999, 237). Zum anderen deutet er die Zunahme des Anteils von Substantivkomposita am Gesamt des Substantivwortschatzes als Zeichen einer Standardisierung des Denkens (vgl. Solms 1999, 239). Solms Untersuchung ist insofern richtungsweisend, als er sich dezidiert auf den Symbolcharakter von Sprache beruft. Die Substantivkomposition sei Zeichen von Differenzierungsprozessen in der Wahrnehmung und deute auf eine veränderte Aneignung von Welt: Die im 16./17 Jh. typische Komposition aber weist im jeweils eineindeutig abgegrenzten Symbol auf eine in der Wahrnehmung ebenfalls ‚eineindeutig‘ zu nennende Differenzierung der Welt, deren Einzelteile in gleicher Weise systemisch aufeinander bezogen sind, wie im Determinativkompositum nur die Spezifizierung des einordnenden Begriffes stattfindet; die konkrete Wortbildung spiegelt den Prozeß grundlegender Begriffsbildung, die ihrerseits eine spezifische Form der Wahrnehmung und Aneignung von Welt darstellt. (Solms 1999, 241)

Dies lässt sich am Vergleich von Osten bzw. Morgenland veranschaulichen. Während nämlich Osten (als Simplex) grundlegend ‚richtungsoffen‘ ist, so vereindeutigt Morgenland (als Kompositum) die Perspektive des Sprechers  – und bringt aufgrund intersubjektiver Verständigungsprozesse auch die kollektive Aneignung dieser Perspektivierungen mit sich (vgl. Solms 1999, 237 ff.). Eine solch kulturelle Sinngebung geschieht nach Solms nicht nur im Medium von Sprache, sondern es ist zudem nach „Spiegelungen auch in anderen Symbolisierungsbereichen“ zu suchen (Solms 1999, 242). Ein weiterer Beleg für die Differenzierung und Perspektivierung von Welt sei in der ungefähr gleichzeitigen Herausbildung der Zentralperspektive in der Malerei zu sehen, wobei keine Zwangsläufigkeit der Parallelität von Sprache und Veränderungen in anderen Symbolisierungsbereichen zu erwarten ist. Vielmehr ist auf die Ent-

Muster – kulturanalytisch betrachtet 

 479

wicklung in Kommunikationsgemeinschaften zu schauen, weshalb die Bedeutsamkeit von Austauschprozessen und von Intersubjektivierungsverfahren zu betonen ist: […] tatsächlich wird aber hier die den unterscheidbaren Entitäten inhärente Gemeinsamkeit ab­strahiert und kategorisiert, so dass die einzelnen Entitäten als der Kategorie zugehörig gedeutet und entsprechend symbolisiert werden können. Im Einzelsymbol und insbesondere in seiner im Gebrauch erwiesenen Akzeptanz ist die Sozialisierung erfolgt, so dass es zum typischen und charakteristischen Merkmal des Kollektivs geworden ist (Solms 1999, 240; Hervorhebung S. T.).

Genau dieses Funktionieren der Substantivkomposition, der Prozess dieser „im Gebrauch erwiesenen Akzeptanz“ in der Frühen Neuzeit lässt sich eindrucksvoll am Beispiel der weitreichenden (und in der Folge prestigeträchtigen) Verwendung des Musters der Komposition durch Martin Luther bzw. seinen Nachfolgern belegen. Lobenstein-Reichmann (2004, 88) spricht von einem regelrechten „Kompositionsboom“ nach der Reformation und kann zeigen, inwiefern sich Luther das Muster der Komposition zu eigen und vor allem zunutze machte. Der theologisch-politische Erfolg beispielsweise von Wortbildungen mit gnade, gott oder götze als Bestimmungswort sei darauf zurückzuführen, dass sie „einerseits für jedermann semantisch transparent waren“ und dass sie „andererseits ganze Wortschatzpulke analog gebildeter Formen darstellten, von denen die eine die andere stützt“ (Lobenstein-Reichmann 2004, 87). Darin liegt […] eine Verschiebung in der Norm und ein Besetzen von Begriffen gleichermaßen. Und genau darin lag sein [Luthers, S. T.] Erfolg. Luther hatte nämlich allein schon dadurch, dass er die sprachliche Vorlage für alle Diskussion bildete, von Anfang an auch den semantischen Kampf gewonnen. (Lobenstein-Reichmann 2004, 94)

Auf diese Weise ergeben sich diskursive Muster, die, und das ist Lobenstein-Reichmanns zentrale Aussage, Luther und die übrigen Reformatoren dazu verwendeten, den theologischen Diskurs ihrer Zeit zu dominieren. Der pragmatisch-kommunikative Aspekt der Typisierung wird also genutzt, um die Deutungshoheit in Fragen des „Menschen zwischen Gott und Teufel“ zu erlangen (Lobenstein-Reichmann 2004, 94).

5 Fazit: signifikante Muster als kulturelle Sinnformgebungen Ziel dieses Beitrags war es, Muster aus der Perspektive der kulturanalytischen Linguistik darzustellen. Dabei wurde eine methodische Programmatik teils explizit eingeführt, teils implizit vorgeführt. Während die genannten methodischen Aspekte der Kontrastierung und der Serialität vor allem als Mittel zur Auffindung von Mustern dienen, kann die Perspektivierung eines Musters X als Y (z. B. Grüße als Formen von

480 

 Susanne Tienken

Nähe und Distanz) freilegen, worin der mehr oder weniger bewusst erlebte soziale Sinn sprachlicher Formen für die Mitglieder einer Kommunikationsgemeinschaft besteht. In der Verschränkung theoretischer Prämissen und empirischer Belege (synchron und diachron, qualitativ und quantitativ) wurde gezeigt, dass Muster jenseits sozialen Handelns menschlicher Akteure, deren Neigungen und Auffassungen nicht existieren. Dies gilt für das Teilen persönlicher Erzählungen im Internet ebenso wie für Abschiedsgrüße des 19. Jahrhunderts. Musterbildungen sind als interaktive Ressourcen zu betrachten, die in Gebrauch genommen werden und von anderen akzeptiert und verstanden werden müssen, um bedeutungsvoll zu werden und auch zu bleiben. Muster sind Formen und Mittel zugleich, mit deren Hilfe Menschen in beständiger Fortschreibung und Deutung dem gemeinsamen Geschäft der Kommunikation nachgehen und in diesem Prozess Welt erfahren oder sich aneignen. Warum trotz ähnlicher kulturgeschichtlicher Ereignisse in einer Kommunikationsgemeinschaft Muster Anwendung finden oder sich herausbilden, in einer anderen aber nicht, mag deshalb zunächst irritieren, den Wert kulturanalytisch-linguistischer Deutungen stellt dies aber nicht in Frage. Im Gegenteil: Wir erhalten einen weiteren Hinweis auf die dialogischen Prinzipien von Sprachgebrauchsgeschichte, deren Ausbau ebenso wünschenswert wäre wie eine Erweiterung der Empirie. Im Rückgriff auf die dialogistische Sprachtheorie, konstruktivistische Ansätze sowie die Kultursemiotik lassen sich die zweifelsohne vorhandenen Desiderata der kulturanalytischen Linguistik erschließen. Ein solches Desiderat ist vor allem die Entwicklung einer stärker kulturorientierten Sprachgebrauchstheorie, wobei unterschiedliche Konzepte von Performanz eine wesentliche Rolle spielen dürften. Als Beitrag zu einer solchen Weiterentwicklung von Sprachgebrauchstheorie, schlage ich vor, signifikante Muster als kulturelle Sinnformgebungen zu benennen und einzuordnen. Dieses Kompositum birgt verschiedene Lesarten, die ineinander greifen. Zum einen wird die Symbolhaftigkeit von sprachlichen Mustern betont: Muster sind Formen, die für etwas stehen – sinnhafte Formen. Zum anderen vermag der Begriff die Verflechtung individueller Motive und kollektiver Ratifizierung zum Ausdruck zu bringen. Es sind gemeinschaftlich gestaltete Formgebungen, die erst durch kommunikative Passungsprozesse ihren sozialen Sinn erhalten, behalten oder auch variieren. Auf heuristischer Ebene gilt es deshalb, die Bereiche benachbarter Disziplinen aufzufinden, die sich im transdisziplinären Austausch fruchtbar bearbeiten lassen. Auf empirischer Ebene sind dafür im Prinzip sämtliche sprachliche Analysekategorien denkbar, nicht nur diejenigen, die hier in den Blick genommen wurden. Tendenziell lässt sich sagen, dass sich textuelle, lexikalische oder morphologische Muster leichter identifizieren, erfassen und deuten lassen als beispielsweise prosodische oder syntaktische Musterbildungen. Aus diesem Grund wäre es sinnvoll zu untersuchen, inwiefern Ergebnisse und Methodik der Kognitionswissenschaften für kulturanalytische Linguistik relevant sein können. Innerhalb der Linguistik sind es vor allem die Konstruktionsgrammatik, die Interaktionslinguistik und die Gesprächsana-

Muster – kulturanalytisch betrachtet 

 481

lyse, die nach den Möglichkeiten von Erfassung und Deutung dieser weniger auffälligen musterhaften Erscheinungen zu befragen wären.

6 Literatur Assmann, Aleida (1991): Kultur als Lebenswelt und Dokument. In: Aleida Assmann/Dietrich Harth (Hg.): Kultur als Lebenswelt und Dokument. Frankfurt a. M., 11–25. Auer, Peter (2000): Die Linguistik auf dem Weg zur Kulturwissenschaft? In: Freiburger Universitätsblätter 147 (39), 55–68. Bachmann-Medick, Doris (1996): Einleitung. In: Doris Bachmann-Medick (Hg.): Kultur als Text. Die anthropologische Wende in der Literaturwissenschaft. Frankfurt a. M., 7–64. Bachmann-Medick, Doris (2010): Cultural Turns. Neurorientierungen in den Kulturwissenschaften. Reinbek bei Hamburg. Bakhtin, Mikhail M. (1986): The problem of speech genres. In: Mikhail M. Bakhtin: Speech Genres and other Late Essays. Austin, TX, 60–102. Berger, Peter L./Thomas Luckmann (2012): Die gesellschaftliche Konstruktion der Wirklichkeit. 24. Auflage. Frankfurt a. M. Bubenhofer, Noah (2009): Sprachgebrauchsmuster. Korpuslinguistik als Methode der Diskurs- und Kulturanalyse. Berlin. Bude, Heinz (1991): Die Rekonstruktion sozialer Sinnsysteme. In: Uwe Flick u. a. (Hg.): Handbuch qualitative Sozialforschung. München, 101–112. Cassirer, Ernst (2007): Versuch über den Menschen. Einführung in eine Philosophie der Kultur. Deutsche Fassung: 2., verbesserte Auflage. Hamburg. Dürscheid, Christa (2005): Medien, Kommunikationsformen, kommunikative Gattungen. In: Linguistik online 22 (1), 3–16. Feilke, Helmuth (1996): Sprache als soziale Gestalt. Ausdruck, Prägung und Ordnung der sprachlichen Typik. Frankfurt a. M. Feilke, Helmuth (1998): Kulturelle Ordnung, Sprachwahrnehmung und idiomatische Prägung. In: Ralph Köhnen (Hg.): Wege zur Kultur. Perspektiven für einen integrativen Deutschunterricht. Frankfurt a. M./Berlin/Bern, 171–183. Fiehler, Reinhard (1990): Kommunikation und Emotion. Berlin/Boston. Fix, Ulla (2007): Zugänge zu Textwelten. Linguistisch-literaturwissenschaftliche Möglichkeiten, in die Geschlossenheit eines Erzähltextes einzudringen. In: Fritz Hermanns/Werner Holly (Hg.): Linguistische Hermeneutik. Theorie und Praxis des Verstehens und Interpretierens. Tübingen, 323–356. Gallagher, Catherine/Stephen Greenblatt (2000): Practicing New Historicism. Chicago. Gardt, Andreas (2003): Sprachwissenschaft als Kulturwissenschaft. In: Ulrike Haß-Zumkehr/ Christoph König (Hg.): Literaturwissenschaft und Linguistik von 1960 bis heute. Göttingen, 271–288. Garfinkel, Harold (1967): Studies in Ethnomethodology. Englewood Cliffs, NJ. Geertz, Clifford (1983): Dichte Beschreibung. Bemerkungen zu einer deutenden Theorie der Kultur. In: Clifford Geertz: Dichte Beschreibung. Beiträge zum Verstehen kultureller Systeme. Frankfurt a. M., 7–43. Giddens, Anthony (1991): Modernity and Self-Identity. Self and Society in the Late Modern Age. Stanford.

482 

 Susanne Tienken

Greenblatt, Stephen (1990): Towards a poetics of culture. In: Stephen Greenblatt: Learning to Curse: Essays in Early Modern Culture. New York, 146–160. Günthner, Susanne (2006): Von Konstruktionen zu kommunikativen Gattungen: Die Relevanz sedimentierter Muster für die Ausführung kommunikativer Aufgaben. In: Deutsche Sprache 34, 173–190. Günthner, Susanne/Hubert Knoblauch (1994): Forms are the food of faith. Gattungen als Muster kommunikativen Handelns. In: Kölner Zeitschrift für Soziologie und Sozialpsychologie 46 (4), 69–723. Günthner, Susanne/Angelika Linke (2006): Einleitung: Linguistik und Kulturanalyse. Ansichten eines symbiotischen Verhältnisses. In: Zeitschrift für germanistische Linguistik 34, 1–27. Havinga, Anna/Nils Langer (2014): Sprache im Alltag der Frühen Neuzeit. Soziolinguistische Zugänge. In: Dessislava Stoeva-Holm/Susanne Tienken (Hg.): Von Köchinnen und Gelehrten, von Adeligen und Soldaten. Interdisziplinäre Zugänge zum Erschließen der Vormoderne. Uppsala, 155–174. Heinemann, Wolfgang (2000): Textsorten. Zur Diskussion um Basisklassen des Kommunizierens. Rückschau und Ausblick. In: Kirsten Adamzik (Hg.): Reflexionen und Analysen. Tübingen, 9–29. Herberg, Dieter/Michael Kinne/Doris Steffens (2004): Neuer Wortschatz. Berlin/New York. Hermanns, Fritz (2003): Linguistische Hermeneutik. Überlegungen zur überfälligen Einrichtung eines in der Linguistik bislang fehlenden Teilfaches. In: Angelika Linke/Hanspeter Ortner/Paul R. Portmann-Tselikas (Hg.): Sprache und mehr. Ansichten einer Linguistik der sprachlichen Praxis. Tübingen, 125–163. Hornscheidt, Antje (2008): Die sprachliche Benennung von Personen aus konstruktivistischer Sicht. Genderspezifizierung und ihre diskursive Verhandlung im heutigen Schwedisch. Berlin/Boston. Humboldt, Wilhelm von (1994 [1821]): „Ueber die Aufgabe des Geschichtsschreibers. Vortrag vom 12. April 1821 vor der Kgl.-Preuss. Akademie der Wissenschaften zu Berlin“. In: Jürgen Trabant (Hg.): Wilhelm von Humboldt: Über die Sprache. Reden vor der Akademie. Tübingen, 33–51. Keim, Inken (2007): Die türkischen Powergirls. Lebenswelt und kommunikativer Stil einer Migrantinnengruppe in Mannheim. Tübingen. Krämer, Sibylle (2002): Sprache – Stimme – Schrift. Sieben Gedanken über Performativität als Medialität. In: Uwe Wirth (Hg.): Performanz. Zwischen Sprachphilosophie und Kulturwissenschaften. Frankfurt a. M., 323–346. Linell, Per (2009): Rethinking Language, Mind and World Dialogically: Interactional and Contextual Theories of Human Sense-Making. Charlotte, NC. Linke, Angelika (1996): Sprachkultur und Bürgertum. Zur Mentalitätsgeschichte des 19. Jahrhunderts. Stuttgart/Weimar. Linke, Angelika (2003a): Begriffsgeschichte – Diskursgeschichte – Sprachgebrauchsgeschichte. In: Carsten Dutt (Hg.): Herausforderungen der Begriffsgeschichte. Heidelberg, 39–49. Linke, Angelika (2003b): Sprachgeschichte – Gesellschaftsgeschichte – Kulturanalyse. In: Helmut Henne u. a. (Hg.): Germanistische Linguistik – Konturen eines Faches. Tübingen, 25–65. Linke, Angelika (2008): Kommunikation, Kultur und Vergesellschaftung. Überlegungen zu einer Kulturgeschichte der Kommunikation. In: Heidrun Kämper/Ludwig Eichinger (Hg.): Sprache – Kognition – Kultur. Sprache zwischen mentaler Struktur und kultureller Prägung. Berlin/New York, 24–50. Linke, Angelika (2011): Signifikante Muster – Perspektiven einer kulturanalytischen Linguistik. In: Elisabeth Wåghäll Nivre u. a. (Hg.): Begegnungen. Das VIII. Nordisch-Baltische Germanistentreffen in Sigtuna vom 11. bis zum 13.6.2009. Stockholm, 23–44. Linke, Angelika (2014): Unauffällig, aber unausweichlich. Alltagssprache als Ort von Kultur. In: Thomas Forrer/Angelika Linke (Hg.): Wo ist Kultur? Perspektiven der Kulturanalyse. Zürich, 169–192.

Muster – kulturanalytisch betrachtet 

 483

Lobenstein-Reichmann, Anja (2004): Wortbildung bei Martin Luther: Systematische, semantische und kommunikative Aspekte. In: Klaus J. Mattheier/Haruo Nitta (Hg.): Sprachwandel und Gesellschaftswandel – Wurzeln des heutigen Deutsch. München, 69–97. Luckmann, Thomas (1986): Grundformen der gesellschaftlichen Vermittlung des Wissens: Kommunikative Gattungen. In: Friedrich Neidhardt/M. Rainer Lepsius/Johannes Weiss (Hg.): Kultur und Gesellschaft. Kölner Zeitschrift für Soziologie und Sozialpsychologie, Sonderheft 27, 191–211. Luckmann, Thomas (1988): Kommunikative Gattungen im kommunikativen Haushalt einer Gesellschaft. In: Gisela Smolka-Kordt/Peter M. Spangenberg/Dagmar Tillmann-Bartylla (Hg.): Der Ursprung der Literatur. Medien, Rollen, Kommunikationssituationen zwischen 1450 und 1650. München, 279–288. Luckmann, Thomas (2002): Der kommunikative Aufbau der sozialen Welt und die Sozialwissenschaften. In: Thomas Luckmann: Wissen und Gesellschaft. Konstanz, 157–181. Miller, Carolyn R./Dawn Shepherd (2004): Blogging as social action: a genre analysis of the weblog. In: Into the Blogosphere: Rhetoric, Community, and Culture of Weblogs. Herausgegeben von Laura Gurak, Smiljana Antonijevic, Laurie Johnson, Clancy Ratliff und Jessica Reyman. University of Minnesota. http://blog.lib.umn.edu/blogosphere/blogging_as_social_action.html [19.12.2014]. Polenz, Peter von (2002): Sprachgeschichte und Gesellschaftsgeschichte von Adelung bis heute. In: Dieter Cherubim/Karlheinz Jakob/Angelika Linke (Hg.): Neue deutsche Sprachgeschichte. Mentalitäts-, kultur- und sozialgeschichtliche Zusammenhänge. Berlin/New York, 1–23. Pusch, Luise (1979): Der Mensch ist ein Gewohnheitstier, doch weiter kommt man ohne ihr. Eine Antwort auf Kalverkämpers Kritik an Trömel-Plötz‘ Artikel über ‚Linguistik und Frauensprache‘. In: Linguistische Berichte 63, 84–102. Reuter, Julia/Karl H. Hörning (2004): Doing Culture. Kultur als Praxis. In: Julia Reuter/Karl H. Hörning (Hg.): Doing Culture. Neue Positionen zum Verhältnis von Kultur und sozialer Praxis. Bielefeld, 7–13. Schröter, Juliane (2012): „Wenn Menschen auseinandergehn, so sagen sie: auf Wiedersehn“. Zur soziopragmatischen Geschichte eines Abschiedsgrußes im 19. und 20. Jahrhundert. In: Jahrbuch für germanistische Sprachgeschichte 3, 361–379. Schürmann, Thomas (1994): ‚Adieu‘ und ‚tschüs‘ im Deutschen. In: Muttersprache. Vierteljahresschrift für deutsche Sprache 104 (3), 260–270. Schütz, Alfred/Thomas Luckmann (2003 [1979]): Strukturen der Lebenswelt. Konstanz. Solms, Hans-Joachim (1999): Der Gebrauch uneigentlicher Substantivkomposita im Mittel- und Frühneuhochdeutschen als Indikator kultureller Veränderung. In: Andreas Gardt/Ulrike Haß-Zumkehr/Thomas Roelcke (Hg.): Sprachgeschichte als Kulturgeschichte. Berlin, 225–246. Stukenbrock, Anja (2005): Sprachnationalismus. Sprachreflexion als Medium kollektiver Identitätsstiftung in Deutschland (1617–1945). Berlin/New York. Threadgold, Terry (2003): Cultural studies, critical theory and critical discourse analysis: histories, remembering and futures. In: Linguistik Online 14 (2), 5–37. Tienken, Susanne (2008): Alltagsgattungen und der Ort von Kultur. Sprachwissenschaftliche und kulturanalytische Studien anhand von Milchverpackungen in Deutschland und Schweden. Stockholm. Tienken, Susanne (2013): Sharing. Zum Teilen von Erzählungen in Onlineforen. In: Laura Álvarez López/Charlotta Seiler Brylla/Philip Shaw (Hg.): Computer-Mediated Discourse across Languages. Stockholm, 17–43. Tienken, Susanne (2015): Neue Medien, neue Formen. Hybridisierung als Aspekt sozialen Wandels. In: Stefan Hauser/Martin Luginbühl (Hg.): Hybridisierung und Ausdifferenzierung – Kontrastive Perspektiven linguistischer Medienanalyse. Bern, 31–56.

484 

 Susanne Tienken

Trömel-Plötz, Senta (1978): Linguistik und Frauensprache. In: Linguistische Berichte 57, 49–68. Vološinov, Valentin N. (1986 [1929]): Marxism and the Philosophy of Language. Cambridge, MA./ London. Warnke, Ingo (2004): Diskurslinguistik als Kulturwissenschaft. In: Walter Erhart (Hg.): Grenzen der Germanistik. Rephilologisierung oder Erweiterung? Stuttgart/Weimar, 308–324. Wengeler, Martin (2006): Linguistik als Kulturwissenschaft. Eine Einführung in diesen Band. In: Martin Wengeler (Hg.): Linguistik als Kulturwissenschaft. Hildesheim/New York, 1–23.

Noah Bubenhofer

21. Muster aus korpuslinguistischer Sicht Abstract: Die Stärke korpuslinguistischer Methoden liegt darin, in großen Textmengen das serielle Auftreten eines bestimmten sprachlichen Phänomens zu entdecken. Es existiert deshalb vor dem Hintergrund des Firth’schen Kontextualismus eine lange Tradition, typische Kookkurrenzen von sprachlichen Einheiten statistisch zu berechnen, beispielsweise durch Kollokationsanalysen. Doch auch komplexere Phänomene, die über Wortpaare hinaus gehen und typische Kookkurrenzen von sprachlichen Einheiten unterschiedlicher Ebenen (Wortform, Grundform, morphosyntaktische Klasse etc.) umfassen und die für bestimmte Textdaten typisch sind, können datengeleitet eruiert werden. Im Beitrag wird zunächst anhand von Beispielen die Palette der korpuslinguistischen Zugriffe auf Musterhaftigkeit in Texten dargestellt. Ausgehend von grundsätzlichen Gedanken zur korpuslinguistischen Perspektive auf Musterhaftigkeit werden die beiden wichtigen Paradigmen der Korpuslinguistik, korpusbasierte und datengeleitete Verfahren, herausgearbeitet. Auf der Grundlage dieser Überlegungen werden dann die wichtigsten Ansätze der Korpuslinguistik vorgestellt, die mit quantitativen Methoden Musterhaftigkeit in Textdaten testen oder entdecken. 1 Einleitung 2 Die korpuslinguistische Perspektive 3 Methodische Zugriffe auf sprachliche Muster 4 Fazit 5 Literatur

1 Einleitung Nachdem in den vorangegangenen Kapiteln hauptsächlich aus einer theoretischen Perspektive Phänomene zwischen Satz/Äußerung und Schema modelliert worden sind, geht es im Folgenden darum, einen quantitativ-empirischen Blick einzunehmen. Aus korpuslinguistischer Perspektive treten Phänomene, die man als „Muster“ bezeichnen könnte, in vielen unterschiedlichen Kontexten zutage. Zunächst sollen deshalb Beispiele vorgestellt werden, die unterschiedliche Typen von Musterhaftigkeit zeigen, bevor im Anschluss daran auf die theoretischen und methodischen Aspekte eingegangen wird. Ein erstes Beispiel von Mustern in der Korpuslinguistik sind Kollokationen, wie in Tabelle 1 auszugsweise dargestellt (vgl. Belica 2007). Es handelt sich um die ersten elf Kollokatoren zum Lemma „Maßnahme“ (in allen Flexionsformen), also um Wortformen, die im Deutschen Referenzkorpus DeReKo (Kupietz u. a. 2010) überzufällig

486 

 Noah Bubenhofer

häufig zusammen mit „Maßnahme“ vorkommen. Im Unterschied zu vielen Kollokationstabellen unterscheidet sich diese dadurch, dass weitere Informationen verfügbar sind. So ist zu jedem Kollokator ein „syntagmatisches Muster“ genannt, das die typische Verwendung der Kollokation wiedergibt. Die Häufigkeit des syntagmatischen Musters ist mit einer Prozentzahl angegeben. Lesebeispiel: In 84 % aller Fälle, in denen das Lemma „Maßnahme“ zusammen mit dem Lemma „ergreifen“ vorkommt, geschieht dies in der Form des syntagmatischen Musters „Maßnahmen [zu] ergreifen um“ (wobei „zu“ nur manchmal vorkommt). In der originalen Ausgabe der Kollokationen werden darüber hinaus eine Reihe weiterer Informationen angegeben, so z. B. der statistische Wert, der die Signifikanz der Kollokation wiedergibt, die absoluten Frequenzen, mit denen die Kollokation im Korpus auftritt, der Bereich vor bzw. nach dem Suchwort „Maßnahme“, in dem der Kollokator auftritt, sowie die Belege für die Kollokation im Korpus. Weiter werden sog. „sekundäre“ Kollokatoren berechnet: Für jede Kollokation wird angegeben, welche weiteren Kollokatoren zur jeweiligen Kollokation ebenfalls überzufällig häufig in den Daten vorkommen. Tab. 1: Ausschnitt (und um Spalten gekürzte Version) aus der Kookkurrenzdatenbank CCDB (Belica 2007) zum Lemma „Maßnahme“ Kollokatoren

syntagmatisches Muster

ergreifen ergriffen vertrauensbildende konkrete solche flankierenden bauliche weitere vorbeugende geeignete notwendigen

84 % 80 % 56 % 78 % 45 % 71 % 57 % 65 % 62 % 79 % 83 %

Maßnahmen [zu] ergreifen um Maßnahmen […] ergriffen werden vertrauensbildende […] Maßnahmen konkrete […] Maßnahmen solche […] Maßnahmen die|den flankierenden […] Massnahmen durch bauliche […] Maßnahmen weitere […] Maßnahmen vorbeugende […] Maßnahmen durch geeignete […] Maßnahmen die|alle notwendigen […] Maßnahmen

Die Kollokationsanalyse trägt also dazu bei, die musterhafte Verwendungsweise des Lemmas „Maßnahme“ in einem bestimmten Korpus aufzudecken. Im zweiten Beispiel werden musterhafte Strukturen in einem Korpus visualisiert. Die Datenbasis sind Bergsteigerberichte aus den Periodika des Schweizer Alpenclubs von 1864 bis 2010 (Text+Berg-Korpus: Bubenhofer u. a. 2013). Ähnlich wie beim Beispiel oben wurden Kollokationen berechnet, allerdings wurde dies nicht selektiv für bestimmte Lemmata durchgeführt, sondern für alle, die für das Korpus (im Vergleich zu einem Referenzkorpus) statistisch signifikant sind. Anschließend wurden alle Kollokationen in einem Netz visualisiert. Abbildung 1 zeigt einen Überblick über das Netz. Durch die Visualisierung als Graph werden Verdichtungsbereiche sichtbar, also Bereiche, in denen einzelne Lemmata (Knoten) besonders viele Verknüpfungen

Muster aus korpuslinguistischer Sicht 

 487

(Kanten) untereinander aufweisen. In Abbildung 2 ist ein Detail aus dem Kollokationsgraph abgebildet. Es zeigt einen Verdichtungsbereich um die Themen Trinken/ Essen, Unwetter, Müdigkeit und Tiere. Das Netz gibt in seiner Gesamtheit die typische Bergsteigererzählung wieder, indem die typischen Kollokationen und deren Vernetzung untereinander aufgezeigt werden.

Abb. 1: Kollokationsnetz eines Korpus alpinistischer Literatur (Text+Berg-Korpus)

Während Kollokationen auf der Grundlage von Wort- oder Grundformen berechnet werden und (im Normalfall) nur aus Basis und Kollokator bestehen, sind sog. n-Gramme längere Einheiten: Sie bestehen aus n Einheiten (Bigramme, Trigramme etc.), z. B. Wortformen, die unmittelbar aufeinander folgen oder aber in einem bestimmten „Fenster“ der Länge x vorkommen. In einem Korpus lassen sich alle vorkommenden n-Gramme berechnen und nach Frequenz ordnen. Eine Spielart davon sind sog. „komplexe n-Gramme“, die aus einer Kombination von Wortformen und

488 

 Noah Bubenhofer

morphosyntaktischen Informationen (Part-of-Speech) oder beliebigen anderen Elementen bestehen können.

Abb. 2: Ausschnitt aus dem Kollokationsgraphen des Text+Berg-Korpus

Berechnet man die komplexen n-Gramme im oben genannten Text+Berg-Korpus alpinistischer Berichte separat für bestimmte Zeitperioden, können die n-Gramme gefunden werden, die statistisch signifikant für eine Periode im Vergleich zum Rest sind. So sind z. B. die folgenden komplexen n-Gramme typisch für die Zeit von 1880 bis 1899 (vgl. für eine ausführliche Darstellung Bubenhofer/Scharloth 2011; Bubenhofer/ Schröter 2012):

Muster aus korpuslinguistischer Sicht 

Tab. 2: Beispiele für typische komplexe n-Gramme für die Zeit von 1880 bis 1899 im Text+Berg-Korpus (ADJA = Adjektiv, NN = Nomen, ADV = Adverb, APPR = Präposition, CARD = Kardinalzahl, ART = Artikel) n-Gramm

Auswahl an Beispielen

ADJA Stunde ADJA (NN)

halben Stunde angenehmer Steigung halbe Stunde steilen Anstieges halbe Stunde langem Zeitaufwand halben Stunde weiteren Weges halbe Stunde langer schon um 9 Uhr 30 circa um 1 Uhr 30 selbst um 12 Uhr 10 bereits um vier Uhr Endlich gegen 9 Uhr an der linken Seite des an der rechten Seite des an der anderen Seite des an der breiten Wand des in der Nähe des Gipfels in der Nähe der Grenze in der Nähe des Muttensees alten Weg über den Feegletscher anderen Weg auf das Gabelhorn ausgetretenen Weg durch den Moränenschutt

ADV APPR CARD NN CARD ADV APPR CARD Uhr

an der ADJA NN des

APPR ART Nähe ART NN

ADJA Weg APPR ART NN

Tab. 3: Beispiele für typische komplexe n-Gramme für die Zeit von 1930 bis 1949 im Text+Berg-Korpus (VVFIN = finites Vollverb, PPER = irreflexives Personalpronomen, KOUS = unterordnende Konjunktion) n-Gramm

Auswahl an Beispielen

dann VVFIN ART NN dann VVFIN ART ADJA dann VVFIN PPER auf

dann kündete die Gipfelglocke dann geschieht das Wunder dann folgt ein heikler dann standen wir auf (dem kühnen Gipfel) Wie ich in den Riss einstieg als wir in der Gabel anlangten Bevor wir in das Couloir hinübersteigen während wir der Hütte zustrebten während wir die Steigeisen ablegten Als wir die Passhöhe erreichten Draussen erwachte ein neuer Tag. Dann kam ein trüber Tag. Nun naht das schwierigste Stück. So lasst uns eilen jetzt heisst es handeln

KOUS PPER APPR ART NN VVFIN KOUS PPER ART NN VVFIN

ADV VVFIN ART ADJA NN .

ADV VVFIN PPER VVINF

 489

490 

 Noah Bubenhofer

Das Muster „ADJA (=Adjektiv) Stunde ADJA“, ggf. gefolgt von einem Nomen (NN), ist demnach typisch für die älteren Bergsteigerberichte (vgl. für das Tagset Schiller/ Teufel/Thielen 1995). Das komplexe n-Gramm wird in den Texten beispielsweise realisiert als „halben Stunde angenehmer Steigung“, „halben Stunde langem Zeitaufwand“ etc. Für die Zeit von 1930 bis 1949 sind dagegen andere komplexe n-Gramme typisch; eine Auswahl davon ist in Tabelle 3 dargestellt. Diese n-Gramme bewegen sich auf einer abstrakteren Ebene als n-Gramme oder Kollokationen auf der Ebene der Wortformen. Anhand der Beispiele wird sichtbar, dass diese alle dem gleichen syntaktischen Muster folgen, das als Folge von Wortformen und/oder morphosyntaktischen Angaben definiert ist. Die Beispiele zeigen drei unterschiedliche Erscheinungsformen von rekurrenten sprachlichen Einheiten  – musterhaftem Sprachgebrauch  –, die allesamt über datengeleitete Verfahren der Korpusanalyse gewonnen wurden. Die terminologische Fassung dieser Phänomene ist uneinheitlich. Neben „Kollokationen“ (Evert 2005) und „(komplexen) n-Grammen“ (Manning/Schütze 2002, 192 ff.; Bubenhofer/Scharloth 2013) werden in der Literatur die genannten Phänomene teilweise auch „Usuelle Wortverbindungen“ (Steyer 2013), „Kookkurrenzen“ (Lemnitzer 1997, 124), „MultiWord Unit“ bzw. „Multi-Word Expression“ (Halliday u. a. 2004, 121; Oakes 1998, 184; Sinclair 2004, 31), „Collostructions“ (Stefanowitsch/Gries 2003) oder „Concgrams“ (Cheng/Greaves/Warren 2006) genannt, um nur die wichtigsten Vertreter aus korpuslinguistischer Perspektive zu nennen.

2 Die korpuslinguistische Perspektive Die korpuslinguistische Arbeit mit großen Textdatenmengen lässt Analysemethoden entstehen, die nicht den Einzelbeleg, sondern das musterhafte Auftreten bestimmter Phänomene in den Daten im Blick haben. Die Liste der Trefferstellen einer Suche in einem Korpus ist deswegen zunächst uninteressant. Bereits die einfachsten Darstellungsmodi von Korpustreffern verfolgen deshalb das Ziel, das Entdecken von Mustern in der Belegmenge zu ermöglichen. Die sog. „Key Word in Context“-Ansicht (KWiC) zentriert den Beleg auf das Suchwort und reduziert die Umgebung auf ein Minimum, um den Blick auf den unmittelbaren Kontext vor und nach dem Suchwort zu lenken. Die Sortierung der Belege ist die nächste Möglichkeit, einen Überblick über die Musterhaftigkeit des Kontextes zu gewinnen: Abbildung 3 zeigt einen Ausschnitt aus einer KWiC-Darstellung der Suche nach „Maßnahmen“ im Deutschen Referenzkorpus DeReKo über die Schnittstelle COSMAS II (Kupietz u. a. 2010). Die Ergebnisse sind nach dem ersten und zweiten Vorgänger-Wort geordnet. Die KWiC-Darstellung vermittelt so bereits einen ersten Überblick über häufige syntaktische Einbettungen des Suchwortes. Ähnlich ist die Darstellung von Treffermengen in anderen Korpora gestaltet, so z. B. auch in den DWDS-Korpora (vgl. Geyken 2007).

Muster aus korpuslinguistischer Sicht 

 491

Abb. 3: Beispiel einer KWiC-Darstellung im DeReKo über COSMAS II

Besonders produktiv für die Zusammenfassung von Belegmengen hat sich das auf Firth zurückgehende Konzept der Kollokation erwiesen (Firth 1957). Firth definiert mehrere „Modi von Bedeutung“, darunter den Modus „meaning by ‚collocation‘“: One of the meanings of ass is its habitual collocation with an immediatley preceding you silly, and with other phrases of address of personal reference. (Firth 1957, 194)

Mit „habitual“ tritt das empirische Moment in die Diskussion ein: Das Bindungsverhalten von Wörtern ist nicht zufällig; empirisch zeigen sich offensichtlich bestimmte Bindungsmuster, also Bindungen, die gebräuchlicher sind als andere, obwohl sie syntaktisch und semantisch ebenfalls möglich wären (vgl. „Zähne putzen“ statt „Zähne waschen“ – aber „laver les dents“ statt „nettoyer les dents“). Firth selber formalisiert sein Konzept der Kollokationen nicht weiter, dies wurde erst später geleistet (vgl. Evert 2009, 1213). Aus korpuslinguistischer Perspektive ist es naheliegend, Phänomene, die über Gebrauchshäufigkeiten gefasst werden können, empirisch-quantitativ zu operationalisieren. Im Fall der Kollokationen wurde eine breite Palette von Formalisierungen für verschiedene Einsatzzwecke entwickelt und diskutiert (dazu mehr weiter unten). Die in Tabelle 1 als Ausschnitt gezeigten Kollokatoren zu „Maßnahme“ zeigen, wie die riesige Treffermenge durch die statistische Zusammenfassung über die signifikantesten Kollokatoren und syntaktischen Muster den Blick auf die typischen Verwendungsweisen lenkt. Jetzt ist es möglich, eine musterhafte Struktur zu entdecken und linguistisch zu interpretieren.

492 

 Noah Bubenhofer

Musterentdeckende Verfahren sind bei empirisch-quantitativen Analysen also zentral, da bei großen Datenmengen die Belegmengen nicht mehr überblickt werden können. Es ist allerdings nicht nur die Not der praktischen Analysearbeit, die eine Fülle von korpuslinguistischen Methoden entstehen ließ, um Muster in großen Textmengen zu entdecken. Dies wird bei einem Blick auf Diskussionen zum Selbstverständnis der Korpuslinguistik deutlich: Ist die Korpuslinguistik eine Hilfswissenschaft, eine Methode oder eher ein Denkstil, der den linguistischen Zugang zu Sprache grundsätzlich verändert? Perkuhn und Belica machen deutlich, dass digitale Korpora nicht nur „Belegsammlungen oder Zettelkästen in elektronischer Form“ sind, sondern eine eigene „korpuslinguistische Perspektive“ ermöglichen (Perkuhn/ Belica 2006, 2). Sinclair formulierte diese neue Perspektive wie folgt: The study of language is moving into a new era in which the exploitation of modern computers will be at the centre of progress. The machines can be harnessed in order to test our hypotheses, they can show us things that we may not already know and even things which shake our faith quite a bit in established models, and which may cause us to revise our ideas very substantially. In all of this my plea is to trust the text. (Sinclair 2004, 23)

Korpora dienen also nicht nur der Überprüfung von Hypothesen entlang von bestehenden linguistischen Kategorien. Korpuslinguistik ermöglicht es, ausgehend von den Daten und diese ernst nehmend, neue Hypothesen zu generieren und damit auch neue linguistische Kategorien zu bilden. Dieses Paradigma wird als „corpus-driven“ oder „datengeleitet“ bezeichnet (Teubert 2005, 4; Tognini-Bonelli 2001; Belica/Steyer 2008; Steyer 2004; Bubenhofer 2009; Scharloth/Eugster/Bubenhofer 2013); es hebt sich ab von korpusbasierten („corpus based“) Paradigmen und erhebt den Anspruch, dass eine solche korpuslinguistische Perspektive einen neuen Blick auf linguistische Daten ermöglicht. Für eine datengeleitete Korpuslinguistik sind musterentdeckende Verfahren noch wichtiger als für klassische Ansätze. Sie ermöglichen überhaupt erst die Analyse der entsprechend großen Datenmengen und sind die Grundsteine, um durch eine linguistische Interpretation der Muster zu neuen Kategorien zu gelangen. Dabei wird die Methodenpalette gegenwärtig weiter angereichert, indem Verfahren des Data Minings (maschinelles Erkennen von Korrelationen in Daten) und der visuellen Analyse für linguistische Fragestellungen fruchtbar gemacht werden (Risch u. a. 2008; Rohrdantz u. a. 2010; Bubenhofer 2014). Muster jeglicher Art sind in der Korpuslinguistik also zentrale Analysekategorien, die vor allem in datengeleiteter Perspektive als Emergenzphänome wahrgenommen werden: Die Strukturen in der Sprache kommen nicht erst dadurch zustande, dass die Gesetzmäßigkeiten durch unseren Geist er-funden werden. Das Systemhafte steckt vielmehr in der Sprache selbst, es tritt emergent aus ihr hervor, so dass es von unserem Geist quasi nur noch ge-funden werden muss. (Perkuhn/Keibel/Kupietz 2012, 13)

Muster aus korpuslinguistischer Sicht 

 493

Diese Sichtweise im Hintergrund werden im Folgenden verschiedene methodische Zugriffe auf Musterhaftigkeit aus korpuslinguistischer Perspektive dargestellt.

3 Methodische Zugriffe auf sprachliche Muster Grundsätzlich ist „Muster“ ein schillernder Begriff und wird, überlappend oder in Abgrenzung zu Konzepten wie „Schema“ und „Konstruktion“, in den linguistischen Teildisziplinen unterschiedlich verstanden. Eine ausführliche Begriffsbestimmung leistet Bücker (in diesem Band). Die bisherigen Ausführungen haben deutlich gemacht, dass aus korpuslinguistischer Perspektive musterhafte Sprache ein Phänomen des Sprachgebrauchs ist. Ob ein Sprachgebrauchsmuster eine mentale Realität widerspiegelt, also z. B. kognitiv als lexikalische Einheit vorgeprägt und abrufbar ist, oder sich aus kultureller Praxis oder sozialem Sprachhandeln ergibt (vgl. Tienken in diesem Band), bleibt dabei vorerst offen und soll an dieser Stelle auch nicht diskutiert werden. Es ist aber hilfreich, mit Steyer (2013, 41) zwei Aspekte von Muster auseinanderzuhalten: 1) Muster als „durch den Sprachgebrauch erreichte Vorgeprägtheit von Wortkombinationen als auch die Struktur von Wortverbindungen im Sinne einer Konstruktion“ (Häcki Buhofer 2011, 506). 2) Musterhafter Sprachgebrauch als post-hoc festgestellte rekurrente Verwendung beliebiger sprachlicher Einheiten (vgl. Bubenhofer 2009, 24). Natürlich sind beide Aspekte die Kehrseiten derselben Medaille: Durch den Sprachgebrauch geprägte Wortkombinationen (z. B. „Guten Tag“) werden – weil sie Ergebnis von rekurrentem Sprachgebrauch sind – musterhaft in bestimmten Situationen (z. B. Begrüßungen) verwendet. Daraus können sich Handlungsmuster verfestigen, die man als „kommunikative Gattungen“ (Günthner/Knoblauch 1994) fassen kann. Beide Aspekte spielen in der Korpuslinguistik eine Rolle: Bei der Berechnung von Kollokationen geht es z. B. darum, die Assoziationsstärke zwischen „Guten“ und „Tag“ zu berechnen, um Hinweise auf die Vorgeprägtheit dieser Wendung zu gewinnen (1. Aspekt). Weiter dienen Distributionsanalysen über die Verteilung bestimmter Phänomene (z. B. von „Guten Tag“) über verschiedene Korpora oder die Berechnung der Korrelation eines Phänomens mit weiteren Phänomenen (z. B. „Guten Tag“ in Abhängigkeit von Textsorten, zeitlichen Epochen etc.) dazu, abzuschätzen, wie musterhaft ein Phänomen verteilt ist (2. Aspekt). Das Schwergewicht liegt im Folgenden jedoch auf dem ersten Aspekt, wobei, da die Aspekte eng miteinander verknüpft sind, die Abgrenzung nicht immer trennscharf sein kann.

494 

 Noah Bubenhofer

3.1 Kollokationen Kollokationen sind Kombinationen von zwei Wörtern, die in natürlicher Sprache eine Tendenz aufweisen, nahe beieinander aufzutreten (Evert 2009, 1214). Dabei bleibt zu klären, was mit „Wort“, „Tendenz“ und „nahe beieinander auftreten“ gemeint ist. Zudem ist es wichtig darauf hinzuweisen, dass es unterschiedliche Auffassungen von Kollokationen gibt. Evert (2009, 1213) unterscheidet zwischen einem „empirischen Konzept“ (wofür er die Bezeichnung „Kollokationen“ verwendet) und einem „theoretischen Konzept“ (von Evert „Mehrworteinheit“ genannt), die mit den Namen Sinclair (im Nachgang zu Firth) und Hausmann (1985) verbunden sind. Hausmann nimmt die phraseologische Perspektive ein und definiert „Kollokation“ enger als die Vertreter des Firth’schen und Sinclair’schen Kollokationenbegriffs. Auch Bartsch (2004, 76) definiert Kollokationen enger als „lexically and/or pragmatically constrained recurrent co-occurrences of at least two lexical items which are in a direct syntactic relation with each other“. Die Differenzen zwischen den Kollokationendefinitionen sind es aber nicht Wert, deswegen einen „Kollokationskrieg“ (Hausmann 2004) zu führen. Aus der Perspektive einer datengeleiteten Korpuslinguistik sind Kollokationen ein Konzept, dessen genaue Operationalisierung je nach Forschungsinteresse über verschiedene Parameter gesteuert werden kann. Die wichtigen Parameter sind oben bereits kurz erwähnt und werden nun ausführlicher dargestellt: 1) Bestandteile der Kollokation: Klassischerweise werden als Bestandteile der Kollokation Wortformen oder Grundformen angenommen. Wie später gezeigt werden soll, sind aber auch andere sprachliche Elemente denkbar, wie z. B. (morpho-) syntaktische Kategorien oder semantische Klassen. 2) Kookkurrenz: Wann bei zwei sprachlichen Einheiten Kovorkommen (Kookkurrenz) vorliegt, ist ebenfalls unterschiedlich definierbar. Evert (2009, 1221 ff.) unterscheidet drei Typen von Kookkurrenz: a) Kookkurrenz auf der sprachlichen Oberfläche: Der einfachste Ansatz, Kookkurrenz zu messen, ist die Definition einer maximalen Spannweite vor und nach dem Suchwort, gemessen in Anzahl Wörtern. Die Definition der Spannweite bewegt sich oft zwischen drei und fünf Wörtern, muss aber je nach Erkenntnisinteresse festgelegt werden. Weiter kann definiert werden, ob die Spannweite die Satzgrenze überschreiten darf oder nicht. Zudem muss die Spannweite nicht symmetrisch sein, um beispielsweise nur den Kontext vor dem Suchwort mit einzubeziehen.

Muster aus korpuslinguistischer Sicht 

 495

Abb. 4: Ausschnitt aus einem Wortprofil zu „Maßnahme“ im DWDS-Korpus – Attribute zum Suchwort

b) Kookkurrenz in der gleichen Texteinheit: Nach diesem Prinzip wird Kookkurrenz als Kovorkommen in der gleichen Texteinheit (z. B. Satz, Äußerung, Text etc.) definiert. Damit wird dem Problem begegnet, dass bei der Definition einer Spannweite auf der Textoberfläche eine willkürliche Entscheidung über die Grenze des Kontextes getroffen wird. So schiebt z. B. unter Umständen ein eingeschobener Nebensatz die Distanz zwischen dem Suchwort und dem Kollokator über die Spannweitengrenze, während der Kollokator in einem Satz ohne den eingeschobenen Nebensatz noch innerhalb der Spannweite wäre. c) Syntaktische Kookkurrenz: Bei diesem Ansatz müssen zwei Wörter in einer bestimmten syntaktischen Relation zueinander stehen, um als potenzielle Kollokation gefunden zu werden. So könnten z. B. nur Adjektive der gleichen Nominalphrase als Kollokator zu einem nominalen Suchwort akzeptiert werden. Dies setzt ein entsprechend computerlinguistisch aufbereitetes Korpus voraus, bei dem etwa morphosyntaktische Klassen („Part-of-Speech“) annotiert sind. Die sog. „Wortprofile“ im DWDS-Korpus-Abfragesystem (vgl. Abbildung 4) sind ein Beispiel für solch syntaktisch definierte Kollokationen (Geyken/Didakowski/Siebert 2008). 3) Assoziation: Ausgehend von einem Suchwort können nun innerhalb der Spannweite die Häufigkeiten aller vorkommenden Wort-Types bestimmt werden. Um die Bindungsstärken zwischen Suchwort und den Kollokatoren zu berechnen, werden statistische Assoziationsmaße verwendet, die die beobachtete Häufigkeit der Kollokation mit der erwarteten Häufigkeit vergleichen. Die erwartete Häufig-

496 

 Noah Bubenhofer

keit ist abhängig von den Frequenzen von Suchwort und Kollokator im Korpus generell und der Korpusgröße. Dies kann man sich an folgendem Beispiel plastisch vorstellen: – Wenn zwei sehr häufig auftretende Wörter auch hin und wieder zusammen vorkommen, ist das statistisch gesehen nicht überraschend. – Wenn zwei Wörter hingegen je eher selten, jedoch in fast allen Fällen zusammen vorkommen, ist dies statistisch überraschend. Mit der Berechnung der erwarteten Häufigkeit geht man also von der sog. Nullhypothese aus. Diese behauptet eine gleichmäßige Verteilung der Wörter im Korpus: Alle Wörter haben die gleiche Wahrscheinlichkeit, zusammen aufzutreten, die natürlich von ihrer allgemeinen Häufigkeit im Korpus abhängt. Je stärker die beobachtete von der erwarteten Häufigkeit abweicht, desto statistisch signifikanter ist die Bindungsstärke der Kollokation (vgl. Evert 2009, 1224 f.). Es gibt eine Reihe von unterschiedlichen Assoziationsmaßen, die die Abweichung von beobachteten und erwarteten Häufigkeiten bewerten (z. B. t-Test, Log-Likelihood-Test oder Mutual Information). Es führt an dieser Stelle zu weit, detaillierter auf die unterschiedlichen Assoziationsmaße einzugehen. Eine ausführliche Diskussion verschiedener Maße führt Evert (2005). Diese Prämisse der Nullhypothese, die von einer gleichmäßigen Verteilung der Wörter im Korpus ausgeht, ist in natürlicher Sprache eigentlich nicht haltbar. Aufgrund grammatischer und semantischer Restriktionen kann nicht davon ausgegangen werden, dass Wörter in einem Korpus zufällig verteilt sind – die meisten Assoziationsmaße, die für die Berechnung von Kollokationen verwendet werden, gehen aber davon aus. Die Diskussionen darüber, welche Maße streng statistisch gesehen überhaupt für die Berechnung von Kollokationen verwendet werden dürfen, halten deswegen noch an (vgl. Evert 2009, 1244; Kilgarriff 2005; Gries 2005). Über die genannten Parameter kann relativ genau beeinflusst werden, welche Art von Kollokationen aus den Daten extrahiert werden sollen. Gerade die Wahl des Assoziationsmaßes hat einen großen Einfluss auf die Berechnung der Bindungsstärke, wobei es sinnvoll ist, unterschiedliche Maße miteinander zu vergleichen. Evert (2009, 1236 ff.) gibt zudem in Abhängigkeit von unterschiedlichen Forschungsinteressen Entscheidungshilfen.

3.2 Mehrworteinheiten Der Einblick in eine Kollokationstabelle aus der Kookkurrenzdatenbank CCDB (Belica 2007) in Tabelle 1 hat bereits gezeigt, dass es gewinnbringend ist, die Beschränkung von Kollokationen auf zwei Elemente (z. B. „Maßnahmen ergreifen“) aufzuheben. Bei dem dort verwendeten Algorithmus werden zusätzlich zum (primären) Kollokator („ergreifen“) auch sekundäre Kollokatoren berechnet, also Wörter, die in der Umge-

Muster aus korpuslinguistischer Sicht 

 497

bung der Kollokation („Maßnahmen ergreifen“) weiter auftreten (z. B. „um“ – „Maßnahmen ergreifen um“). Es gibt unterschiedliche Ansätze, Kollokationen weiter zu fassen. Im Beispiel der CCDB werden für jede berechnete Kollokation weitere Kollokatoren zur Kollokation berechnet. Ein anderer Ansatz operiert mit sog. n-Grammen, also Mehrworteinheiten, die aus n aufeinander folgenden Wörtern bestehen (Manning/Schütze 2002, 192 ff.). Dafür werden in einem Korpus alle kombinatorisch möglichen n-Gramme berechnet. Für n = 3, Trigramme, werden alle Kombinationsmöglichkeiten Wort 1 – Wort 2 – Wort 3 Wort 2 – Wort 3 – Wort 4 Wort 3 – Wort 4 – Wort 5 etc. aufgelistet und anschließend gezählt. Auch hier können über Parameter die Typen der zu erfassenden n-Gramme definiert werden: 1) Bestandteile des n-Gramms: Wortform oder Grundform. 2) Diskontinuität: Es kann definiert werden, ob die Wörter kontinuierlich aufeinander folgen müssen oder nicht. Falls nicht, wird ein „Fenster“ („Spannweite“) definiert, innerhalb dessen sich das n-Gramm bewegen kann. 3) Beachtung von Satz- und Textgrenzen: Ja oder Nein. Eine nach Auftretensfrequenz geordnete Liste von n-Grammen enthält auf den ersten Plätzen eine Reihe von trivialen Fällen, die aus Wörtern bestehen, die auch für sich genommen sehr häufig sind. Deshalb können ähnlich wie bei den Kollokationen Assoziationsmaße verwendet werden, um die Bindungsstärke der n-Gramme zu berechnen. Da mehr als zwei Elemente vorhanden sind, müssen die statistischen Maße allerdings angepasst werden. Anpassungen für n-Gramme finden sich bei Zinsmeister/ Heid (2003) und da Silva/Lopes (1999). Zudem gibt es unterschiedliche Implementierungen als Software-Tools, so z. B. das „Ngram Statistics Package“ (Banerjee/Pedersen 2003), bei dem ebenfalls für n-Gramme angepasste Assoziationsmaße verfügbar sind. Anstelle von Assoziationsmaßen zur Berechnung der Bindungsstärke des n-Gramms gibt es eine weitere Methode, um hochfrequente, aber triviale n-Gramme aus den Daten zu entfernen. Die Idee besteht darin, mit einem Referenzkorpus zu arbeiten und die „Keyness“ (Scott/Tribble 2006; Bondi/Scott 2010) jedes n-Gramms im Untersuchungskorpus im Vergleich zum Referenzkorpus zu berechnen. Mit Keyness ist ein Assoziationsmaß gemeint (ähnlich wie bei den oben diskutierten Assoziationsmaßen für die Berechnung von Kollokationen), mit dem ausgedrückt wird, ob ein bestimmtes Wort signifikant häufiger im Untersuchungskorpus vorkommt als im Referenzkorpus. Dieses Maß ist sehr verbreitet, um Schlüsselwörter („Keywords“) in einem Korpus zu finden, und ist in viele Korpustools implementiert. Natürlich kann dieses Verfahren auch eingesetzt werden, um die Keyness von n-Grammen zu berechnen, wie Bubenhofer (2009) gezeigt hat. Dort wurden beispielsweise n-Gramme in einem Zeitungskorpus berechnet und die Zeiträume 1995 bis 1997 und 2003 bis

498 

 Noah Bubenhofer

2005 einander gegenübergestellt: N-Gramme wie „die bosnischen Serben“, „und der Opposition“ oder „gegen die Korruption“ sind (im Ressort „Ausland“) typisch für die ältere, „gegen den Irak“, „Abzug aus dem“, „[Kampf/Krieg] gegen den Terrorismus“ dagegen für die neuere Periode (Bubenhofer 2009, 210). Bei Verfahren dieser Art ist die Wahl des Referenzkorpus offensichtlich entscheidend, um zu steuern, welche ­Vergleichsparameter von Interesse sind. Im genannten Fall liegt das Interesse darin, diachrone Veränderungen in der Verwendung von n-Grammen zu beobachten. Genauso denkbar wäre jedoch z. B. der Vergleich zwischen Textsorten, Themen, Sprecher/innen etc.

3.3 Komplexe Formen Die Berechnung von n-Grammen auf der Basis von Wortformen führt mitunter zu unbefriedigenden Ergebnissen. So gehen die n-Gramme „gegen den Terrorismus“, „Kampf gegen den“, „Kampf gegen Terrorismus“ und „Krieg gegen den“ auf ein gemeinsames, abstrakteres Muster „[Kampf/Krieg] gegen [den] [Terror/Terrorismus]“ zurück. Komplexere Formen der Berechnung von n-Grammen versuchen, dieses Problem anzugehen. Eine Möglichkeit besteht darin, syntaktische Restriktionen zu definieren, ähnlich wie im Fall der syntaktischen Kookkurrenz bei der Berechnung von Kollokationen. Solche Ansätze werden etwa vor dem Hintergrund konstruktionsgrammatischer Interessen angewendet (vgl. Stefanowitsch/Gries 2003). Ein stärker datengeleiteter Ansatz ist die Berechnung sog. „komplexer n-Gramme“ (Scharloth/Bubenhofer 2011; Hein/Bubenhofer im Druck), wie bereits oben in Tabelle 2 und Tabelle 3 vorgestellt. Noch kaum ausgelotet sind zudem Möglichkeiten, ausgehend von n-Grammen deren typischen Anordnungen nacheinander in Texten zu berechnen. Einen ersten Ansatz demonstrieren Bubenhofer/Müller/Scharloth (2013) mit der datengeleiteten Berechnung von Mustern in Narrativen auf der Basis von hierarchischen n-Gramm-Kollokationsgraphen, um typische Erzählmuster aufzudecken. Erwähnenswert sind in diesem Zusammenhang aber auch solche Ansätze, die zwar von einer datengeleiteten Korpusanalyse ausgehen, danach jedoch stärker auf qualitativ-interpretative Analysen setzen. Ein Beispiel hierfür sind die Arbeiten zu usuellen Wortverbindungen und Wortverbindungsmustern von Steyer (2013). Sie geht von Kollokationsanalysen aus, die dann aber systematisch qualitativ (mit regelmäßigem quantitativem Rückgriff) untersucht werden, um abstrakte Wortverbindungsmuster (z. B. „aus welchen [SUBSTANTIV-GRUPPE] auch immer“) zu erarbeiten (Steyer 2013, 332). Zuletzt soll noch auf die Berechnung von Kollokationsgraphen wie in Abbildung 1 eingegangen werden. Hier werden für ein Gesamtkorpus alle signifikanten Kollokationen berechnet – ggf. mit einer Beschränkung auf Basen, die im Vergleich zu einem Referenzkorpus typisch für das Untersuchungskorpus sind  – und als Netz visualisiert. Damit zeigen sich Verdichtungsbereiche von Wörtern, die (durch ihr Kollokati-

Muster aus korpuslinguistischer Sicht 

 499

onsverhalten) besonders viele Verbindungen untereinander aufweisen. So kann die binäre Beschränkung von Kollokationen aufgehoben werden, indem ihre Position im Kollokationsnetz gezeigt wird. Anstelle von Wort- oder Grundformen kann es darüber hinaus zielführend sein, mit semantischen Taxonomien zu arbeiten. Ein Beispiel ist die Annotation von Texten mit einer Taxonomie wie dem „Wortschatz nach Sachgruppen“ (Dornseiff 2004) und die Berechnung von Kollokationen auf der Basis der Sachgruppen (Scharloth/Eugster/Bubenhofer 2013). Damit zeigen sich musterhafte Strukturen in den Daten auf einer semantischen Ebene.

4 Fazit Aus korpuslinguistischer Perspektive sind zwei Forschungsparadigmen sichtbar, die sich für musterhafte Strukturen in Textdaten interessieren. Das eher korpusbasierte Paradigma geht von bestehenden linguistischen Analysekategorien aus und zielt darauf ab, diese korpuslinguistisch zu formalisieren, um empirische Evidenz dafür zu finden. Mit Musterhaftigkeit sind damit Phänomene gemeint, die sich an ebendiesen linguistischen Kategorien orientieren. Produktiv für Musterhaftigkeit sind Theorien wie beispielsweise die Phraseologie (vgl. Burger 2003), die seit mehreren Jahrzehnten auf musterhafte Strukturen im Sprachgebrauch aufmerksam macht. Ebenso wichtig sind verschiedene Grammatiktheorien, was sich z. B. im Fall der Konstruktionsgrammatik in neuester Zeit zeigt (vgl. Lasch/Ziem 2011). Auf der anderen Seite werden mit dem datengeleiteten Paradigma andere Ziele verfolgt. Auch hier wird mit der Prämisse gearbeitet, dass sich im Sprachgebrauch Musterhaftigkeit feststellen lässt. Musterhaftigkeit wird hier aber als Emergenzphänomen wahrgenommen. Musterhaftigkeit zeigt sich, wenn sehr große Datenmengen datengeleitet analysiert werden. Die gefundenen musterhaften Strukturen sind zunächst statistische Auffälligkeiten, die sich nicht immer leicht in bestehende linguistische Kategorien integrieren lassen. Dadurch ergibt sich aber die Chance, bestehende Kategoriensysteme zu überdenken und aufgrund der empirischen Evidenzen neue Kategorien zu bilden. Zudem lenken datengeleitete Verfahren den Blick auf unauffällige Konstruktionen, die bisher in der linguistischen Analyse marginalisiert worden sind. Beispielhaft sei die Arbeit von Steyer (2013) erwähnt, die den Konstruktionen mit dem Lemma „Grund“ 150 Buchseiten datengeleiteter Analyse widmet. Parallel dazu ist zu beobachten, wie sich die disziplinären Grenzen verschieben – etwa bei der Phraseologie, die ihren Gegenstandsbereich von primär idiomatischen und nicht-kompositionellen Wendungen in letzter Zeit massiv ausweitet und nun auch nicht-idiomatische, kompositionelle und mehrgliedrige Einheiten und ihren weiteren syntaktischen Kontext in den Blick nimmt (vgl. Steyer 2013, 36). Das datengeleitete Paradigma könnte in Zukunft noch bedeutender werden. Denn in einer digitalen Welt ist eine datengeleitete Korpuslinguistik gleichsam Chance und

500 

 Noah Bubenhofer

Notwendigkeit, um emergente Strukturen auf der Performanz-Ebene von Sprache freizulegen.

5 Literatur Banerjee, Satanjeev/Ted Pedersen (2003): The design, implementation, and use of the ngram statistic package. In: Proceedings of the Fourth International Conference on Intelligent Text Processing and Computational Linguistics. Mexico City. Bartsch, Sabine (2004): Structural and Functional Properties of Collocations in English: A Corpus Study of Lexical and Pragmatic Constraints on Lexical Co-occurrence. Tübingen. Belica, Cyril (2007): Kookkurrenzdatenbank CCDB – V3. Eine korpuslinguistische Denk- und Experimentierplattform für die Erforschung und theoretische Begründung von systemischstrukturellen Eigenschaften von Kohäsionsrelationen zwischen den Konstituenten des Sprachgebrauchs. http://corpora.ids-mannheim.de/ccdb/[03.03.2014]. Belica, Cyril/Kathrin Steyer (2008): Korpusanalytische Zugänge zu sprachlichem Usus. In: Marie Vachková (Hg.): Beiträge zur bilingualen Lexikographie. Prag, 7–24. Bondi, Marina/Mike Scott (2010): Keyness in Texts. Amsterdam/Philadelphia. Bubenhofer, Noah (2009): Sprachgebrauchsmuster. Korpuslinguistik als Methode der Diskurs- und Kulturanalyse. Berlin/New York. Bubenhofer, Noah (2014): Geokollokationen – Diskurse zu Orten: Visuelle Korpusanalyse. In: Sondernummer Mitteilungen des Deutschen Germanistenverbandes: Korpora in der Linguistik – Perspektiven und Positionen zu Daten und Datenerhebung 1, 45–59. Bubenhofer, Noah/Joachim Scharloth (2011): Korpuspragmatische Analysen alpinistischer Literatur. In: Daniel Elmiger/Alain Kamber (Hg.): La linguistique de corpus – de l’analyse quantitative à l’interpretation qualitative/Korpuslinguistik – von der quantitativen Analyse zur qualitativen Interpretation. Neuchâtel, 241–259. Bubenhofer, Noah/Joachim Scharloth (2013): Korpuslinguistische Diskursanalyse: Der Nutzen empirisch-quantitativer Verfahren. In: Ingo Warnke/Ulrike Meinhof/Martin Reisigl (Hg.): Diskurslinguistik im Spannungsfeld von Deskription und Kritik. Berlin, 147–168. Bubenhofer, Noah/Juliane Schröter (2012): Die Alpen. Sprachgebrauchsgeschichte – Korpuslinguistik – Kulturanalyse. In: Péter Maitz (Hg.): Historische Sprachwissenschaft. Erkenntnisinteressen, Grundlagenprobleme, Desiderate. Berlin/Boston, 263–287. Bubenhofer, Noah/Martin Volk/David Klaper u. a. (Hg.) (2013): Text+Berg-Korpus (Release 147_v03). http://www.textberg.ch [04.03.2014]. Bubenhofer, Noah/Nicole Müller/Joachim Scharloth (2013): Narrative Muster und Diskursanalyse: Ein datengeleiteter Ansatz. In: Zeitschrift für Semiotik, Methoden der Diskursanalyse 35 (3–4), 419–444. Burger, Harald (2003): Phraseologie. Eine Einführung am Beispiel des Deutschen. Berlin. Cheng, Winnie/Chris Greaves/Martin Warren (2006): From n-gram to skipgram to concgram. In: International Journal of Corpus Linguistics 11 (4), 411–433. Dornseiff, Franz (2004): Der deutsche Wortschatz nach Sachgruppen. Berlin/New York. Evert, Stefan (2005): The Statistics of Word Cooccurrences: Word Pairs and Collocations. Stuttgart. http://elib.uni-stuttgart.de/opus/volltexte/2005/2371 [04.03.2014]. Evert, Stefan (2009): 58. corpora and collocations. In: Anke Lüdeling/Merja Kytö (Hg.): Corpus Linguistics. Berlin/New York, 1212–1248. Firth, John Rupert (1957): Modes of meaning. In: Papers in Linguistics 1934–1951, 190–215.

Muster aus korpuslinguistischer Sicht 

 501

Geyken, Alexander (2007): The DWDS corpus: a reference corpus for the german language of the 20th century. In: Christiane Fellbaum (Hg.): Collocations and Idioms: Linguistic, Lexicographic, and Computational Aspects. London, 23–42. Geyken, Alexander/Jörg Didakowski/Alexander Siebert (2008): Generation of word profiles on the basis of a large and balanced german corpus. In: Proceedings of the XIII EURALEX International Congress, 371–385. Gries, Stefan Thomas (2005): Null-hypothesis significance testing of word frequencies: a follow-up on Kilgarriff. In: Corpus Linguistics and Linguistic Theory 1 (2), 277–294. Günthner, Susanne/Hubert Knoblauch (1994): „Forms are the food of faith.“ Gattungen als Muster kommunikativen Handelns. In: Kölner Zeitschrift für Soziologie und Sozialpsychologie 46, 693–723. Häcki Buhofer, Annelies (2011): Lexikografie der Kollokationen zwischen Anforderungen der Theorie und der Praxis. In: Stefan Engelberg/Anke Holler/Kristel Proost (Hg.): Sprachliches Wissen zwischen Lexikon und Grammatik. Berlin, 505–531. Halliday, Michael/Alexander Kirkwood/Wolfgang Teubert/Colin Yallop u. a. (2004): Lexicology and Corpus Linguistics. An Introduction. London/New York. Hausmann, Franz Josef (1985): Kollokationen im deutschen Wörterbuch. Ein Beitrag zur Theorie des lexikographischen Beispiels. In: Henning Bergenholtz/Joachim Mugdan (Hg.): Lexikographie und Grammatik. Akten des Essener Kolloquiums zur Grammatik im Wörterbuch 1984. Tübingen, 118–129. Hausmann, Franz Josef (2004): Was sind eigentlich Kollokationen? In: Kathrin Steyer (Hg.): Wortverbindungen – mehr oder weniger fest. Berlin/New York, 309–334. Hein, Katrin/Noah Bubenhofer (im Druck): Korpuslinguistik konstruktionsgrammatisch. Diskursspezifische n-Gramme zwischen statistischer Signifikanz und semantischpragmatischem Mehrwert. In: Alexander Lasch/Alexander Ziem (Hg.): Konstruktionsgrammatik IV: Konstruktionen als soziale Konventionen und kognitive Routinen. Tübingen. Kilgarriff, Adam (2005): Language is never, ever, ever, random. In: Corpus Linguistics and Linguistic Theory 1 (2), 263–276. Kupietz, Marc/Cyril Belica/Holger Keibel u. a. (2010): The german reference corpus dereko: a primordial sample for linguistic research. In: Proceedings of the 7th Conference on International Language Resources and Evaluation. Valletta, 1848–1854. Lasch, Alexander/Alexander Ziem (Hg.) (2011): Konstruktionsgrammatik III: Aktuelle Fragen und Lösungsansätze. Tübingen. Lemnitzer, Lothar (1997): Extraktion komplexer Lexeme aus Textkorpora. Tübingen. Manning, Christopher D./Hinrich Schütze (2002): Foundations of Statistical Natural Language Processing. 5. Auflage. Cambridge, MA. Oakes, Michael (1998): Statistics for Corpus Linguistics. Edinburgh. Perkuhn, Rainer/Cyril Belica (2006): Korpuslinguistik – Das unbekannte Wesen. Oder Mythen über Korpora und Korpuslinguistik. In: Sprachreport 22 (1), 2–8. Perkuhn, Rainer/Holger Keibel/Marc Kupietz (2012): Korpuslinguistik. Stuttgart. Risch, John/Anne Kao/Stephen Poteet u. a. (2008): Text visualization for visual text analytics. In: Simeon Simoff/Michael Böhlen/Arturas Mazeika (Hg.): Visual Data Mining. Berlin/Heidelberg, 154–171. Rohrdantz, Christian/Steffen Koch/Charles Jochim u. a. (2010): Visuelle Textanalyse. In: InformatikSpektrum 33 (6), 601–611. Scharloth, Joachim/Noah Bubenhofer (2011): Datengeleitete Korpuspragmatik: Korpusvergleich als Methode der Stilanalyse. In: Ekkehard Felder/Marcus Müller/Friedemann Vogel (Hg.): Korpuspragmatik. Thematische Korpora als Basis diskurslinguistischer Analysen von Texten und Gesprächen. Berlin/New York, 195–230.

502 

 Noah Bubenhofer

Scharloth, Joachim/David Eugster/Noah Bubenhofer (2013): Das Wuchern der Rhizome. Linguistische Diskursanalyse und Data-driven Turn. In: Dietrich Busse/Wolfgang Teubert (Hg.): Linguistische Diskursanalyse. Neue Perspektiven. Wiesbaden, 345–380. Schiller, Anne/Simone Teufel/Christine Thielen (1995): Guidelines für das Tagging deutscher Textkorpora mit STTS. Stuttgart. Scott, Mike/Chris Tribble (2006): Textual Patterns: Key Words and Corpus Analysis in Language Education. Philadelphia. Silva, Joaquim Ferreira da/Gabriel Pereira Lopes (1999): A local maxima method and a fair dispersion normalization for extracting multi-word units from corpora. In: Sixth Meeting on Mathematics of Language. Orlando, FL, 369–381. Sinclair, John (2004): Trust the Text: Language, Corpus and Discourse. London. Stefanowitsch, Anatol/Stefan Thomas Gries (2003): Collostructions: investigating the interaction of words and constructions. In: International Journal of Corpus Linguistics 8 (2), 209–243. Steyer, Kathrin (2004): Kookkurrenz. Korpusmethodik, linguistisches Modell, lexikografische Perspektiven. In: Kathrin Steyer (Hg.): Wortverbindungen – mehr oder weniger fest. Berlin/New York, 87–116. Steyer, Kathrin (2013): Usuelle Wortverbindungen: Zentrale Muster des Sprachgebrauchs aus korpusanalytischer Sicht. Tübingen. Teubert, Wolfgang (2005): My version of corpus linguistics. In: International Journal of Corpus Linguistics 10 (1), 1–13. Tognini-Bonelli, Elena (2001): Corpus Linguistics at Work. Amsterdam. Zinsmeister, Heike/Ulrich Heid (2003): Significant triples: adjective+noun+verb combinations. In: Proceedings of the 7th Conference on Computational Lexicography and Text Research. Budapest, 92–102.

Alexander Lasch

22. Konstruktionen in der geschriebenen Sprache Abstract: Der Band „Satz, Äußerung, Schema“ in der Handbuchreihe „Sprache und Wissen“ offeriert „Überlegungen zu einer modalitätsübergreifenden Einheitenbildung“, die den gemeinsamen Gegenstand unterschiedlicher Forschungsgebiete der germanistischen Linguistik in den Mittelpunkt stellen: den so genannten ‚satzwertigen Ausdruck‘. Im vorliegenden Beitrag werden die Ansätze einer gebrauchsbasierten Kon­ struktionsgrammatik im Mittelpunkt stehen (vgl. u. a. Croft 2001, 2013; Bybee 2013; Boas 2013; Deppermann 2006; Goldberg 1995, 2003, 2006, 2013; Gries 2013; Stefanowitsch/Gries 2003; Gries/Stefanowitsch 2004; Langacker 2005, 2009; Lasch/Ziem 2014; Ziem/Lasch 2013). Besonderes Augenmerk gilt dem Verhältnis zwischen den Konzepten ‚Satz‘, ‚Konstruktion‘, ‚Aussagekomplex‘ und ‚Schema‘ in der geschriebenen Sprache. Dem Konzept ‚Aussagekomplex‘ wird hier vor dem Begriff der Äußerung aus zwei Gründen der Vorzug gegeben. Zum einen wird der Begriff der Äußerung eher selten auf schriftsprachliche Untersuchungsgegenstände angewendet (zur gesprochenen Sprache vgl. die Beiträge von Bücker und Imo in diesem Band). Hier spricht man etwa in text- und diskurslinguistischen Untersuchungen von Aussagen und Aussagenkomplexen (vgl. bspw. Busse 1987, 1997, 2007, 2008; Busse/Teubert 2013; Felder/ Müller/Vogel 2012; Spitzmüller/Warnke 2011). Zum anderen sind es gerade diese Aussagenkomplexe, die als transphrastische Einheiten in einer Komplexitätshierarchie über der Periphrase anzusiedeln sind und sich damit als Gegenstand anbieten, wenn man die Reichweite des Konstruktionsbegriffs ausloten möchte. 1 2

Die Konstruktion als Format sprachlichen Wissens Gebrauchsbasierte konstruktionsgrammatische Ansätze in der Praxis: Vom Korpus zum Konstruktikon 3 Ein Fallbeispiel: Die diskursspezifische Konstruktion [[NP]+[[DETGEN]+[Lebens]]] 4 Fazit 5 Literatur

1 Die Konstruktion als Format sprachlichen Wissens 1.1 Hinführung Der Artikel verfolgt drei Anliegen: (1) Der Überblick über die Prämissen gebrauchsbasierter Ansätze der Konstruktionsgrammatik beschreibt Sprache kurz als kogni-

504 

 Alexander Lasch

tives und soziales Phänomen und beleuchtet die Konstruktion als Format sprachlichen Wissens. Die so verstandene Konstruktion wird als Strukturformat in ihrem Verhältnis zu den Größen ‚Satz‘, ‚Aussagenkomplex‘ und ‚Schema‘ beschrieben. Diese Positionierung kann hier keinesfalls abschließend erfolgen. Sie soll vielmehr die Darstellung der aktuellen Forschungsdiskussion und zentrale Spannungspunkte innerhalb der Konstruktionsgrammatik in Bezug setzen zu den hier zur Disposition gestellten Konzepten. Fluchtpunkt der Darstellung ist die Auseinandersetzung mit der Frage, ob das Konzept Konstruktion über die „Satzgrenze“ hinaus auszudehnen sei oder nicht – in den relativ jungen gebrauchsbasierten Konzepten der Konstruktionsgrammatik erweist sich der vom Handbuch „Satz, Äußerung, Schema“ anvisierte Phänomenbereich als relevant für die Theoriebildung. (2) In einem zweiten Abschnitt wird kurz ein Modell für die Erarbeitung von Konstruktionsbedeutungen vorgestellt und diskutiert, bevor dieses in (3) einer Beispielanalyse (aus der Erforschung der Syntax und der Diskursanalyse) zur Anwendung kommt. Ziel dieser Analyse ist, die Spann- und Reichweite der angestellten Überlegungen aufzuzeigen: Die Integration sprachlicher Einheiten unterschiedlicher Komplexitätsgrade eines spezifischen Kommunikationsbereichs stellt die Belastbarkeit des konstruktionsgrammatischen Ansatzes für den Diskussionszusammenhang unterschiedlicher Konzepte wie ‚Satz‘, ‚Aussage/Aussagekomplex‘ und ‚Schema‘ aus und zeigt auch gleichzeitig die forschungspraktischen Grenzen einer gebrauchsbasierten Konstruktionsgrammatik auf. Alle Überlegungen dieses Beitrags zielen dezidiert auf die geschriebene Sprache als Gegenstand ab, sie sind nicht ohne weiteres auf Untersuchungen zur gesprochenen Sprache anzuwenden (vgl. dazu Bücker und Imo in diesem Band). Die Geschichte der Entwicklung der Konstruktionsgrammatik(en) kann hier nicht im Detail nachgezeichnet werden. Einen prägnanten Überblick bieten die Einführungen in die Bände Fischer/Stefanowitsch 2007 sowie Lasch/Ziem 2011, die jüngst vorgelegte Einführung Hilpert 2013 und Hoffmann/Trousdale 2013a. Der aktuelle Forschungsstand und die Adaption der gebrauchsbasierten konstruktionsgrammatischen Ansätze auf die Erforschung der deutschen Sprache werden ausführlich vorgestellt und diskutiert in Ziem/Lasch 2013. In diesem Artikel und dem spezifischen Interesse des Handbuchs folgend wird ein Beispiel näher besprochen, das syntaktisches auf der einen und diskurslinguistisches Interesse auf der anderen Seite verbindet. Die dort aufgeworfenen Fragen und Problemstellungen folgen der Diskussion um das ‚Konstruktikon‘, welches von Lasch/Ziem (2014) mit einem Schwerpunkt auf morphosyntaktische Phänomene in Vergangenheit und Gegenwart in den Blick genommen wurde. Zum anderen wird verdeutlicht, dass zwar pragmatische sowie diskursfunktionale Aspekte der Konstruktionsbedeutung stärker zu berücksichtigen (vgl. Östman 2005; Östman/Trousdale 2013) seien, was aber nicht gleichbedeutend damit ist, den Konstruktionsbegriff auf transphrastische Einheiten auszudehnen.

Konstruktionen in der geschriebenen Sprache 

 505

1.2 Prämissen der gebrauchsbasierten Konstruktionsgrammatik(en) Eine Konstruktion (z. B. nach Goldberg 1995, 4 und 2006, 5; zusammenfassend Ziem/ Lasch 2013, 9–17 und präzisierend 77) bzw. eine „grammatische Konstruktion“ (Goldberg 2013, 17–19) ist eine sprachliche Einheit, die als Form-Bedeutungs-Paar Ergebnis von Sprachgebrauchs- und damit Prozessen der Konventionalisierung ist. Konstruktionen sind nicht vollständig hinsichtlich ihrer Bedeutung vorhersagbar und/oder usuell und seriell nachweisbar. Gemeinhin werden damit sprachliche Einheiten bis zur Komplexität der Periphrase gefasst. Zentrales Anliegen der Konstruktionsgrammatik ist, diese Konstruktionen als Format sprachlichen Wissens aufzufassen und so Spracherwerb, Sprachgebrauch und Sprachwandel in den verschiedenen medialen Erscheinungsformen von Sprache und auf verschiedenen Ebenen des Sprachsystems adäquat zu beschreiben (vgl. beispielsweise Croft/Cruse 2004; Croft 2001, 2013; Goldberg 2003, 2006; Hilpert 2013; Stefanowitsch 2011, 181–188 oder Ziem/Lasch 2013). Das schließt auch dezidiert Überlegungen dazu ein, wie Konstruktionen miteinander in Verbindung stehen, welche Vererbungsprozesse und Linkings zwischen Konstruktionen unterschiedlichen Abstraktionsgrads bestehen und wie man mittels dieses Netzwerks, dem so genannten ‚Konstruktikon‘ (vgl. ausgehend von Goldbergs construct-i-con (2003, 219) etwa Ziem/Lasch 2013; Boas 2014; Bücker 2014; Lasch 2014a; Rostila 2014 sowie Ziem 2014a und b), komplexes sprachliches Wissen in seiner Strukturierung zu beschreiben in der Lage ist. Konzepte wie diese sind schon länger virulent: Die kognitive Linguistik, z. B. die Cognitive Construction Grammar nach Lakoff und Langacker (vgl. Lakoff 1977, 1987; Langacker 1987, 2005, 2009; Evans/Green 2006; hinführend Ziem/Lasch 2013, 39–41; Broccias 2013 und Boas 2013; eher abzuraten ist von der recht einseitigen Darstellung bei Wildgen 2008), arbeitet seit mehreren Jahrzehnten an sprachlichen Phänomenen, die auf kognitive und soziale Gestalten hindeuten. Feilke sprach innerhalb der germanistischen Linguistik bereits 1996 unter Bezug auf Lakoff (1977) von der „Sprache als soziale[r] Gestalt“ und dachte vor dem Hintergrund unterschiedlicher Konventionalisierungsgrade idiomatisierter Einheiten über die Überwindung der Trennung von Lexikon und Grammatik nach (vgl. besonders deutlich Feilke 1996, 211 ff. und 239). Konstruktionen sind solche Gestalten und damit Formen von Sprachwissen. Konstruktionen geben als sprachliche Muster anhand ihrer Realisierungen einen Hinweis darauf, wie zu welcher Zeit in welcher Art von wem, zu wem und über welches Thema gesprochen wurde. Sie öffnen einen Blick auf bewusste (surface frames) und unbewusste (aber meist nicht explizierte) und gelernte Verwendungskontexte, Gebrauchsregeln und Aussageabsichten (deep seated frames) (vgl. Lakoff/Wehling 2009, 73–87, weiter Lakoff/Johnson 1980 und Lakoff 1987, Busse 2012 sowie Ziem 2008 und 2014b). Die Affinität konstruktionsgrammatischer Studien und framesemantischer Ansätze lässt sich über das gemeinsame Interesse an Bedeutungen usueller sprachlicher Einheiten unterschiedlicher Komplexitätsgrade erklären (Boas 2014). Bisher wird

506 

 Alexander Lasch

der Konstruktionsbegriff (meist) angewendet auf sprachliche Einheiten bis zur Periphrase; ob der Konstruktionsbegriff ausgedehnt werden soll auf transphrastische Einheiten, ist strittig (vgl. dazu bspw. die jüngste Positionierung zu „grammatischen Konstruktionen“ von Hoffmann/Trousdale 2013b, 1; Goldberg 2013, 17–19; Kay 2013 u. a.). Unabhängig davon kann die Diskurslinguistik jedoch schon heute einen Gewinn aus grammatischen Analysen ziehen, die zum einen gebrauchsbasiert sind und zum anderen dezidiert die Bedeutung sprachlicher Einheiten im Visier haben. Gebrauchshäufigkeiten können Hinweise auf den diskursspezifischen Gebrauch von Kon­ struktionen anhand ihrer Realisierungsvarianten geben. Besondere Prägungen von Konstruktionsbedeutungen wiederum in diesen teils spezifischen Kontexten zeigen semantische Spezifizierungen von Konstruktionen an, die sich für einen Kontext als typisch erweisen können und sich nach und nach verfestigen. Eben diese Hinweise wiederum sind für eine Framesemantik und die Konstruktionsgrammatik essentiell, denn nur so lassen sich Bedeutungen, kleinste Bedeutungsunterschiede und Wandelprozesse sprachlicher Einheiten anhand ihrer Realisierungen erfassen.

1.3 Konstruktion und Satz In den meisten konstruktionsgrammatischen Arbeiten gilt der Satz als Komplexitätsgrenze der untersuchten sprachlichen Phänomene: This extended notion of the Saussurean sign has become known as a ‚construction‘ (which includes morphemes, words, idioms, and abstract phrasal patterns) and the various linguistic approaches exploring this idea were labeled ‚Construction Grammar‘. (Hoffmann/Trousdale 2013b, 1; vgl. weiter Kay 2013; Hoffmann/Trousdale 2013a, 255–343)

Der Satz scheint auf den ersten Blick forschungspraktisch nicht die entscheidende Rolle zu spielen, wenn von ‚phrasalen Konstruktionen‘ (Goldberg 2013, 17–19) gesprochen wird. Das hat auch seine Gründe darin, dass sich in verschiedenen Arbeiten der letzten Jahre zeigte (v. a. von Croft 2001, 2013; in Anlehnung daran auch Ziem/Lasch 2013), dass man auf die Beschreibung funktionaler Kategorien wie ‚Subjekt‘, ‚Objekt‘ oder ‚Prädikat‘ besser verzichtet, da diese 1) nicht als Kategorie sprachübergreifend in vergleichenden Arbeiten herangezogen werden können und sie 2) als funktionale Kategorien einer sprachlichen Einheit Bedeutung aus der Perspektive einer satzwertigen Aussage zuweisen. Daher setzt man in den gebrauchsbasierten Ansätzen auf die Beschreibung der formalen Aspekte sprachlicher Einheiten. Ihre Bedeutung wird, soweit möglich, über ihren Tiefenkasus in größeren sprachlichen Einheiten (vgl. Fillmore 1968, 1988; Dowty 1991; darauf aufbauend u. a. Goldberg 1995, 2003; Polenz 2008), Merkmale ihrer Wortart oder andere (weitestgehend) morphosyntaktische (und weniger prosodische, graphematische bzw. orthographische) Merkmale

Konstruktionen in der geschriebenen Sprache 

 507

hergeleitet. Hier wurde die Kollokations- und Kollostruktionsanalyse (vgl. Stefanowitsch/Gries 2003 sowie Gries/Stefanowitsch 2004; Stefanowitsch 2013; Gries 2013) fruchtbar. Da die Einheiten nicht mehr als Funktionen eines Syntagmas beschrieben werden, steht auch die Zuordnung zu einer Größe wie ‚Satz‘ nicht zwingend im Vordergrund. Der Satz wird scheinbar nur dann deutlich sichtbar, wenn darüber verhandelt wird, ob transphrastische sprachliche Einheiten noch als Konstruktion zu werten seien oder nicht – hier zeichnet sich forschungspraktisch und theoretisch in Bezug auf die geschriebene Sprache eine Engführung auf „grammatische Konstruktionen“ ab. Auf den zweiten Blick in die konstruktionsgrammatischen Studien wird allerdings schnell deutlich, dass die Periphrase als basale Analyseeinheit und -ebene favorisiert wird. An diese Basiseinheit werden die Analysen zu Konstruktionen niederen Ab­straktionsgrades angeschlossen. Da die Konstruktionsgrammatik(en) die Konstruktion als Format sprachlichen Wissens unabhängig von ihrer medialen Erscheinungsform postuliert, ergeben sich ganz andere forschungspraktische Probleme im Hinblick auf die strukturelle Einheit ‚Satz‘ und auf eben diese unterschiedlichen medialen Repräsentationsformen von Sprache. Das zeigt sich besonders deutlich daran, dass sich die Interaktionale Linguistik zunehmend auf konstruktionsgrammatische Ansätze stützt. Diese kämpfte über lange Jahre damit, wie man das Schema des Satzes auf sprachliche Einheiten der Gesprochenen Sprache (GS) anpasste und anwendete  – ausgehend von kon­ struktionsgrammatischen Ansätzen stellen sich diese Probleme in einem vollkommen anderen Licht dar (z. B. Deppermann 2006; Günthner 2006, 2009, 2010, 2011; Imo 2010; Bücker 2014).

1.4 Konstruktion und Aussagenkomplex Interessanter ist daher auch die Frage, wie mit transphrastischen schriftsprachlichen Einheiten in der Konstruktionsgrammatik zu verfahren sei bzw. welche Analysen vorliegen, die thematisch begründet an der Grenze der Periphrase operieren. Eines dieser zentralen Muster, welches sich oberhalb der Satzebene beschreiben lässt, ist das des ‚Aussagenkomplexes‘. Dieses Konzept ist auf den ersten Blick kein Thema für eine Grammatik, wird schriftlinguistisch vorsichtig im Rahmen der Textlinguistik und nur in wenigen Arbeiten im Bereich der Diskurslinguistik systematisch beschrieben. Aus textlinguistischer Perspektive wird danach gefragt, wie ein Aussagenkomplex als argumentative Einheit bspw. die Etablierung eines Themas oder einer Textfunktion bzw. eine spezifische thematische Entfaltung unterstützt; in der Diskurslinguistik schließt man aus solchen Aussagenkomplexen u. a. auf Diskurspositionen – immer, wenn etwas auf eine bestimmte Art gesagt wird, wird es auf andere Weise zugleich nicht gesagt, was wiederum auch die Framesemantik interessiert (vgl. zu beiden Aspekten Busse 2012). Überlegungen dieser Art führen anhand verwendeter sprachlicher Muster zu kommunikativen Strategien von Diskursakteuren. Man hat in beiden

508 

 Alexander Lasch

Zugriffen vor allem die Bedeutung einer sprachlichen Einheit im Blick, seltener primär ihre Form. Die Konstruktionsgrammatiken könnten in diesem Zusammenhang eine Formanalyse offerieren, die die Gestalt sprachlicher Formationen als Einheiten von Form und Bedeutung versteht. Das Dilemma ist: Fasste man die Konstruktion ausgehend etwa von der Goldberg’schen Setzung „[t]he totality of our knowledge of language is captured by a network of constructions“ (Goldberg 2003, 219) als einziges Format sprachlichen Wissens auf, dann gelte auch ein Aussagenkomplex als Konstruktion. Aussagenkomplexe als argumentative Einheiten sind, da oberhalb der Periphrase angesiedelt, zwar sehr abstrakt. Auch sind sie nur noch minimal spezifiziert. Häufig erkennt man sie an bestimmten Konnektoren und Diskursmarkern, kategorisiert werden können sie etwa anhand der Art und Weise, wie verschiedene Aussagen zu komplexen Einheiten (z. B. Datum, Schlussregel und Argument) verbunden werden. Diese Verhältnisse könnte man als recht abstrakte Form der Bedeutung von Argumentationsmustern und schließlich Textmustern und damit als Konstruktionen auffassen. Auch wenn einige Ansätze der Konstruktionsgrammatik dafür plädieren, dass Einheiten wie Aussagenkomplexe und Texte in letzter Konsequenz als Konstruktionen beschrieben werden können, so muss forschungspraktisch die Frage gestattet sein, welchen Gewinn man aus dieser Setzung zu ziehen hofft (vgl. Lasch 2014b). Für den Moment ist eingeführten und etablierten Konzepten und Begriffen der Vorzug zu geben und der Konstruktionsgrammatik die Anschlussfähigkeit auszustellen; die aktuelle Diskussion läuft tatsächlich darauf zu, den Konstruktionsbegriff nicht auf diese abstrakteren Muster und Schemata auszudehnen und wird vor allem von den Forschern vertreten, die sich der Untersuchung der geschriebenen Sprache widmen.

1.5 Konstruktion und Schema Wie Dürscheid und Schneider (2015) mit ihrem Einleitungsaufsatz zum ersten Band dieser Reihe u. a. zeigen, ist bei einem Blick auf die Forschungslandschaft der germanistischen Linguistik alles andere als klar, wie mit größeren sprachlichen Einheiten, die über Einzelwortebene (Morphemebene) hinausreichen, systematisch zu verfahren sei. Sie plädieren für die Etablierung des Schema-Begriffs, der nicht nur schriftlinguistisch relevante Gegenstandskategorien unter- und oberhalb der Periphrase umfasst, sondern auch hinsichtlich der Modalitäten der gesprochenen und geschriebenen Sprache hinreichend belastbar zu sein scheint: Hier wird gezeigt, dass das Schema nicht nur als komplexe kognitive Einheit aufgefasst werden kann, sondern auch als basale linguistische Analyseeinheit. Zu diesem Zweck erläutern wir zunächst den Schemabegriff vor dem Hintergrund der philosophischen Tradition, dann grenzen wir ihn als Terminus von Konstruktion und Muster ab. (Dürscheid/Schneider 2015, 167)

Konstruktionen in der geschriebenen Sprache 

 509

Im vorliegenden Beitrag wird neben den Begriffen ‚Satz‘ und ‚Aussage‘/‚Aussagenkomplex‘ das Verhältnis des ‚Schema‘-Begriffs zum Begriff der ‚Konstruktion‘ diskutiert. Mit dem Blick auf die konstruktionsgrammatischen Studien ist zu konstatieren, dass sich die Forschung auf sprachliche Einheiten der Periphrase-Ebene konzentriert. Phänomene einer so genannten ‚Textgrammatik‘ oberhalb der Periphrase werden in Bezug auf die Untersuchung der geschriebenen Sprache entweder kategorisch ausgeschlossen oder zumindest nur sehr vorsichtig diskutiert (Östman 2005; Östman/Trousdale 2013). Das ist auch vor dem Hintergrund zu verstehen, dass belastbare Begriffe für entsprechende Entitäten und Konzepte in der Forschung etabliert sind. Anders als ‚Muster‘ oder ‚Schema‘ hat der Begriff und das Konzept der (‚grammatischen‘) Konstruktion eine geringere Reichweite in Bezug auf die Untersuchung geschriebener Sprache. Im Bereich der gesprochenen Sprache sieht das freilich anders aus: Es werden nicht nur kollaborative Konstruktionen beschrieben, sondern es wird auch dafür geworben, die Konstruktionsgrammatik und damit ihre basalen Einheiten, die Konstruktionen, auf der Ebene des Diskurses zu verankern (vgl. dazu die Beiträge von Bücker und Imo in diesem Band). Dies läuft in letzter Konsequenz auf eine vollkommen pragmatikalisierte Grammatik hinaus, die pragmatische und diskursfunktionale Bedingungen der Verwendung in die Konstruktionsbedeutung einschreibt. Dürscheid und Schneider (2015) präzisieren den Vorschlag von Ziem/Lasch (2013) zum Begriff des Schemas in der Konstruktionsgrammatik. Dort wird unter einem Schema ein ‚kognitives Muster‘ verstanden, „das aus strukturell ähnlichen sprachlichen Äußerungen hervorgegangen ist“ (Ziem/Lasch 2013, 201). Kennzeichen des Schemas als sprachliches Muster sei weiter, dass es auf konstruktionaler Ebene lexikalisch nicht voll spezifiziert sei, da  – so wird impliziert  – das Schema immer eine spezifische Abstraktionsform einer Konstruktion sei. Dürscheid und Schneider merken zu diesem Gebrauch kritisch an, dass auch für lexikalisch voll spezifizierte Konstruktionen der Schema-Begriff anzuwenden sei, da die voll spezifizierte Kon­ struktion „z. B. hinsichtlich der Aussprache“ variieren könne (Dürscheid/Schneider 2015, 186). Im Grunde spiegeln sich in den beiden Verständnissen die Auffassungen wider, die bereits mehrfach in Bezug auf die Grenze der Konstruktion durchklangen. Betrachtet man die unterschiedliche Aussprache sprachlicher Einheiten nicht nur als formale Variation, sondern bezieht pragmatische und diskursfunktionale Aspekte bei der Angabe von Konstruktionsbedeutungen mit ein, dann könnte auch die Aussprache u. a. ein Kriterium sein, um Realisierungen von dann hinsichtlich der Aussprache nicht spezifizierten Konstruktionen als Realisierungen spezifischer Schemata aufzufassen. Dann würde gelten, was Grundlage der Bestimmung in Ziem/Lasch (2013) war: Das Schema lässt sich aus unterschiedlichen Realisierungen hier unterschiedlich ausgesprochener lexikalisch voll spezifizierten Konstruktionsrealisierungen ableiten und ist hinsichtlich einer Variable (hier: Aussprache) nicht fixiert. Andererseits stellt diese Einbeziehung pragmatischer und diskursfunktionaler Aspekte die Konstruktionsgrammatik im Moment noch vor erhebliche Probleme. Phänomene wie die ‚Variation der Aussprache‘ gehören (wie die ‚Variation der Schreibung‘) zunächst zur Form

510 

 Alexander Lasch

einer sprachlichen Einheit, die als Schema oder Konstruktion aufzufassen ist. Variiert eine Einheit hinsichtlich dieses formalen Merkmals, ist danach zu fragen, ob die Variation relevant wird in Bezug auf die Konstruktionsbedeutung. Die Tragweite kann man am Beispiel der Adverbien des Deutschen gut illustrieren, die als Konstruktionen wiederum andere Konstruktionen höherer Abstraktionsstufe und deren Bedeutung in spezifischer Weise aktualisieren: (1) Das gelingt Dir besonders gut!

Ob Sprecher oder Schreiber Lob oder Tadel intendieren, hängt von der (antizipierten) Betonung und Interpretation der Adverbien besonders und gut im jeweiligen gegebenen Kontext ab. Man kann z. B. (1) gut und besonders als Lexeme und damit (voll lexikalisierte) Konstruktionen bestimmen, auf höherer Ebene (2) als Instanzen einer Konstruktion der Modalisierung [[besonders/gut]+[VP]] bzw. [[[besonders]gut]+[VP]], die die Bedeutung einer Konstruktion auf der Ebene der Periphrase modifiziert, verstehen und (3) als Instanzen der Konstruktion der Markierung der ironischen Distanzierung und damit Umkehrung der Bedeutung beschreiben. Das Merkmal dieser Konstruktion ist die besondere (antizipierte) Betonungsstruktur. Neben der Betonung ist es weiteres Merkmal, dass die ironische Distanzierung mehrteilig sein kann und prinzipiell positiv wie negativ konnotierte Elemente einer Dichotomie akzeptiert werden, auch wenn schlecht im konstruierten Beispiel (2) die markierte Variante darstellen dürfte: (2) Das gelingt Dir besonders schlecht!

In der hier im Versuchsaufbau postulierten (3) Konstruktion der Markierung der ironischen Distanzierung ist die Variante mit schlecht markiert. Mit anderen Worten: schlecht wird seltener als gut als Instanz der postulierten Konstruktion angesehen (vgl. DWDS-Kernkorpus: sieben Belege für near(geling*, @schlecht, 10) vs. 61 Belege für near(geling*, @gut, 10), http://www.dwds.de/[23.12.2014]). Aus Realisierungen dieser Konstruktion wie im Beispiel können wir auf die Konstruktion als kognitives Muster schließen. Zu ihren Charakteristika gehört u. a. auch eine spezifische Betonungsstruktur. Andere Bedeutungsaspekte, die man aus der Aussprache von schlecht oder gut in der gesprochenen Sprache ziehen könnte, wie Herkunft des Sprechers, Alter, Sozialisationsmerkmale etc., sind für die Konstruktionsgrammatik, wie sie hier vertreten wird, forschungspraktisch (noch) nicht relevant. An diesem Beispiel kann man zwei Dinge zeigen: Formale Aspekte einer sprachlichen Einheit sind nur dann für die Konstruktionsgrammatik relevant, wenn sich mit ihrem Gebrauch auch eine Bedeutung der sprachlichen Einheit erschließen lässt und umgekehrt. Gegenüber einer pragmatischen und diskursfunktionalen Erweiterung der Konstruktionsbedeutung herrscht im Moment in der Konstruktionsgrammatik jedoch keineswegs Einigkeit. Zum anderen decken die Konzepte ‚Konstruktion‘ und

Konstruktionen in der geschriebenen Sprache 

 511

‚Schema‘ unterschiedliche Entitäten ab – die Schnittmenge bilden sprachliche Einheiten, die hinsichtlich eines bedeutungskonstitutiven Aspekts nicht voll spezifiziert sind.

2 Gebrauchsbasierte konstruktions­grammatische Ansätze in der Praxis: Vom Korpus zum Konstruktikon 2.1 Analyse von Sprache im Gebrauch Introspektiv-interpretative Analyseverfahren, also die Selbstbeobachtung und Bewertung sprachlicher Phänomene in Bezug auf Grammatikalität durch einen Wissenschaftler, haben die Sprachwissenschaft und vor allem die Grammatikforschung lange dominiert. Auch wenn die Intuition (Sinclair 1991, 39) ein unverzichtbares Mittel zur Beurteilung empirischer Evidenz ist, so ist sie gegenüber empirisch erhobenen Daten und deren Analyse fehlerbehaftet. Die Auseinandersetzung zwischen Croft und Sandra (vgl. Croft 1998; Sandra 1998) sowie die experimentellen Untersuchungen (etwa Tomasello/Brooks 1998) und quantitativen Korpusanalysen (etwa Gries 1999) sind Indizien für eine Neuorientierung hin zu einer Fundierung der Konstruktionsgrammatik(en) als gebrauchsbasierte Ansätze (vgl. Goldberg 2013, 26–28; Bybee 2013; Boas 2013). Sie greifen in unterschiedlicher Art und Weise auf sprachliche Daten zu, die in Gebrauchssituationen erhoben worden sind (Gries 2013; Stefanowitsch 2013), und sind bemüht, sprachliche Strukturen aus dem Gebrauch heraus zu erklären (Bybee 2013). So unterschiedlich wie diese Situationen und das Interesse an Sprache im Gebrauch je nach Forschungsrichtung sind, so unterschiedlich gestaltet sich auch der Aufbau von Korpora, die für die Analyse herangezogen werden. Große maschinenlesbare Korpora (quantitative korpuslinguistische Zugänge) stehen neben thematisch orientierten Korpora der geschriebenen Sprache und Gesprächsaufzeichnungen (qualitative korpuslinguistische Zugänge) sowie Sprachdaten, die in Laborumgebungen erhoben worden sind (experimentelle Zugänge). Quantitative korpuslinguistische Studien setzen sich mit der Analyse von sprachlichen Einheiten auf der Basis von bedingten Häufigkeiten in einem großen Textkorpus auseinander und beschreiben u. a. Kollokationen, d. h. das musterhafte gemeinsame Auftreten unterschiedlicher sprachlicher Einheiten. Bereits die Definition einer Konstruktion nach Goldberg (1995, 4) bot hinreichend Ansatzpunkte, um Konstruktionen in größeren Textkorpora zu identifizieren und zu beschreiben. Mit der Erweiterung des Konstruktionsbegriffs (Goldberg 2006, 5) und damit der Annahme, dass auch kompositionelle Einheiten als Konstruktionen gelten sollen, wenn sie im Sprachgebrauch als frequente Einheiten nachgewiesen werden können, kann man

512 

 Alexander Lasch

davon sprechen, dass die quantitativ korpuslinguistischen Verfahren die Bereiche zur Erforschung von Morphologie, Syntax und Phraseologie zunehmend prägen. Ein Interessenschwerpunkt liegt u. a. auf Einheiten, die sich nicht nur als formal aufeinander bezogen beschreiben lassen, wie z. B. die adverbiale Modalisierung einer Verbalphrase [[ADV]+[VP]], sondern die darüber hinaus auch inhaltsseitig aufeinander bezogen sind wie [[gut]+[gelingen]] und als Kollokate eine Beziehung aufweisen, die sich nicht mit den zwei getrennten Modulen Lexikon und Grammatik adäquat beschreiben lässt. Einen Überblick über die korpuslinguistischen Verfahren wie Frequenz- und Kookkurrenzanalysen, Analysen bedingter Wahrscheinlichkeiten und Studien zur Assoziationsstärke (Kollostruktionsanalyse, Stefanowitsch 2013) sowie Multifaktorenanalysen gibt Gries (2013). Qualitative korpuslinguistische Untersuchungen basieren zwar wie quantitative Untersuchungen auch auf Daten des Sprachgebrauchs, haben allerdings einen anderen Interessenschwerpunkt. Sie sind bestrebt, semantische, pragmatische und formale Eigenschaften von Konstruktionen im Detail zu analysieren. Damit können sie zum einen auf die Ergebnisse von quantitativen Studien im Bereich von Morphologie, Syntax und Idiomatik im Bereich der geschriebenen Sprache aufbauen, um z. B. diskurslinguistische Fragen zu motivieren oder sich anderen Forschungsgegenständen zuzuwenden, wie etwa der Sequenzanalyse gesprochener Sprache. Da bisher eine automatische Transkription und Annotation gesprochener Sprache technisch nicht möglich ist, erlaubt die Menge an für eine Untersuchung zur Verfügung stehender Daten zum einen häufig keine quantitative Untersuchung (und statistische Auswertung) von Korpora. Daneben sind zum anderen aufgrund konstitutiver Eigenschaften der gesprochenen Sprache wie Interaktivität, Pragmatizität und Zeitlichkeit (Deppermann 2011, 210–213) quantitative Verfahren nicht als gegenstandsadäquat einzuschätzen. Experimentelle Methoden kommen vorwiegend in der konstruktionsgrammatischen Spracherwerbsforschung zum Einsatz. Der Spracherwerb ist abhängig von der (sozio-)kognitiven Entwicklung von Kindern, die sich als Prozess nur zum Teil in korpusbasierten Studien nachzeichnen lässt (grundsätzlich dazu Diessel 2013). In Laborumgebungen werden daher experimentell Lernprozesse angeleitet, der Adhoc-Erwerb von Objektbezeichnungen beobachtet (am bekanntesten dürfte wohl die Suche nach dem toma sein (Tomasello/Barton 1994)), Ersetzungs- und Vollständigkeitstests etwa zum Nachweis von Kollokationswissen oder Wissen über syntaktische Muster sowie Priming-Experimente und Lesestudien durchgeführt.

2.2 Modell zur Beschreibung der internen Struktur einer Konstruktion Neben der Frage, wie man Sprachdaten erhebt und für konstruktionsgrammatische Studien zugänglich macht, interessiert auch, wie die Strukturen von Konstruktionen

Konstruktionen in der geschriebenen Sprache 

 513

repräsentiert werden. Auf stärker formalisierte Ansätze (vgl. aktuell etwa Sag 2012; Sag/Boas/Kay 2012; Fillmore 2013; Michaelis 2013; vgl. dazu den Überblick in Ziem/ Lasch 2013) wird hier bei der Repräsentation der internen Struktur von Konstruktionen auf der Ebene der Periphrase nicht zurückgegriffen. Um die Form- und Bedeutungsseite einer Konstruktion aufzuschließen, wird mit einem Modell gearbeitet, das im Wesentlichen auf die Modelle zur Darstellung der internen Struktur von Kon­ struktionen bei Goldberg (1995 u. ö.) und Croft aufbaut (2001 und wieder 2013, 225; zusammenfassend Boas 2013, 234–239). Darüber hinaus werden die Prämissen der von Polenz’schen Satzsemantik (in der aktuellen Auflage von 2008) implementiert (in Bezug auf das Modell vgl. Ziem/Lasch 2013, 110–142 und Lasch 2014a). Die Konzepte des Aussagerahmens, des Prädikationsrahmens, der Prädikatsklassen und semantischen Rollen entwickelt von Polenz im Anschluss an die Fillmore’sche Kasusgrammatik (Fillmore 1968), die auch die Goldberg’sche Konstruktionsgrammatik wesentlich beeinflusst. Mit ihrer Hilfe lässt sich die Bedeutung von Konstruktionen  – die konzeptuell und terminologisch innerhalb der Konstruktionsgrammatik(en) immer noch nicht zufriedenstellend gefasst ist – analysieren. Damit ist dann nicht nur eine Beschreibung der Struktur von Konstruktionen möglich, sondern auch ihre Vernetzung im so genannten Konstruktikon, das semantische und formale Beziehungen berücksichtigt, darstellbar. (3) Er gibt ihr den Bauplan. (4) Er baut ihr das Haus.

Das Modell zur Darstellung der Konstruktionsbedeutung wird hier knapp am Beispiel der Ditransitivkonstruktion, in die die Verben geben (3) und bauen (4) eingebettet werden, vorgestellt. Sie wurden auch gewählt, um zu zeigen, wie Argumentrollen der Konstruktion und die thematischen Rollen des Verbs (Partizipantenrollen; Valenz) korrespondieren können (vgl. Goldberg 1995, 50–52; Evans/Green 2006, 671–680). Damit ein Verb in eine Konstruktion eingebettet werden kann, müssen wenigstens eine Argumentrolle und eine Partizipantenrolle fusionieren. Der Satz Er gibt ihr den Bauplan (3) ist als Realisierung einer Ditransitiv-Konstruktion (mit der Bedeutung Cause-Receive nach Goldberg) aufzufassen, in die das Verb geben eingebettet ist. Das Verb geben fordert eine NPNom (er) als Agens (AG), eine NPAkk (den Bauplan) als affiziertes Objekt (AOB) und eine NPDat (ihr) als Benefaktiv (BEN). Geben korrespondiert hinsichtlich aller Rollen mit den Argumentrollen der Konstruktion, die folglich fusionieren können. Die interne Struktur der Konstruktion kann dargestellt werden wie in Abbildung 1:

514 

SEM

 Alexander Lasch

HANDLUNG ‚GEBEN‘







NPNOM

NPDAT

NPAKK

= direkt geben

SYN

VP

Abb. 1: Die Einbettung des Verbs geben in die Ditransitiv-Konstruktion im Aussagerahmen ­HANDLUNG ‚GEBEN‘

Die Prädikatsklasse HANDLUNG und der (postulierte) Aussagerahmen HANDLUNG ‚GEBEN‘ dienen der Angabe der Konstruktionsbedeutung. Die Verbbedeutung von geben und die Konstruktionsbedeutung interagieren direkt miteinander; daneben können modales, resultatives und das Verhältnis des intendierten Resultats voneinander unterschieden werden. Wie bei semantischen Rollen und Aussagerahmentypen handelt es sich bei den Relationstypen um eine offene Klasse (vgl. etwa die unterschiedlichen Entwürfe von Goldberg 1995, 59–66; Ziem/Lasch 2013, 116 sowie 129 f.). Letztlich dienen sie alle dazu, die Bedeutungsdimension einer Konstruktion differenzierter zu fassen und in einem Konstruktionsnetzwerk verorten zu können. Bis dieses jedoch etabliert und empirisch bestätigt ist, bleiben die postulierten Aussagerahmen (und die darauf basierenden Angaben von Relationstypen) hypothetisch. Wird bauen in den postulierten Aussagerahmen gesetzt und damit in die Ditransitiv-Konstruktion eingebettet, wie im Satz Er baut ihr das Haus (4), kann der modale Relationstyp zwischen Konstruktionsbedeutung und Verbbedeutung schon einen Hinweis darauf geben, wie die Argumentrollen der Konstruktion mit den thematischen Rollen des Verbs fusionieren bzw. welche Rollen durch die Konstruktion erzwungen werden (vgl. Goldberg 1995, 65). SEM

HANDLUNG ‚GEBEN‘







NPNOM

NPDAT

NPAKK

≈ modal bauen

SYN

VP

Abb. 2: Die Einbettung des Verbs bauen in die Ditransitiv-Konstruktion im Aussagerahmen ­HANDLUNG ‚GEBEN‘

Konstruktionen in der geschriebenen Sprache 

 515

Im Valenzplan von bauen ist ein Benefaktiv (BEN) nicht obligatorisch. Diese Rolle wird durch die profilierte Argumentrolle (BEN) der Konstruktion lizenziert, während alle anderen Rollen fusionieren. Dieses Modell zur Beschreibung der Struktur von Konstruktionsbedeutungen und der formalen Merkmale der in sie eingebetteten Filler erlaubt es, Vererbungsbeziehungen und Linking zwischen Konstruktionen unterschiedlicher Komplexitätsgrade über semantische wie formale Kriterien aufzuzeigen. Bauen (4) bspw. wird als Konstruktion auf Morphemebene ebenso in andere Konstruktionen eingebettet, wie gut (1), schlecht (2), besonders (1, 2) und Haus (4), wobei semantische und formale Aspekte in der Bestimmung der Beziehungsrelationen je unterschiedlich zum Tragen kommen können.

2.3 Das Konstruktikon Konstruktionen unterschiedlichen Abstraktionsgrads sind im so genannten „Kon­ struktikon“ (vgl. Goldberg 2003, 219; Ziem/Lasch 2013; Boas 2013, 242–246; Boas 2014; Bücker 2014; Lasch 2014a; Rostila 2014 sowie Ziem 2014a und b; Broccias 2013, 193– 195) geordnet, einem Netzwerk, das gemäß der Prämissen der (gebrauchsbasierten) Konstruktionsgrammatik(en) die scharfe Trennung zwischen Lexikon und Grammatik zugunsten eines Kontinuums aufhebt und das  – dies wurde bereits problematisiert  – ‚alles sprachliche Wissen‘ fasse: „The totality of our knowledge of language is captured by a network of constructions: a ‚construct-i-con‘“ (Goldberg 2003, 219). Die Annahme eines solchen Netzwerks setzt neben anderem voraus, dass man die Möglichkeit der Mehrdeutigkeit von Konstruktionen wie der Ditransitiv-Konstruktion (Goldberg 1995, 38) oder weniger komplexer Konstruktionen als systematisch gegeben postuliert und nicht von vornherein ausschließt. Eine wichtige Frage ist, wie die Konstruktionen miteinander in Verbindung stehen. Goldberg hat diesbezüglich von verschiedenen Vererbungs- und Linking-Verhältnissen gesprochen (Goldberg 1995, 2003 und 2013, 21–26), die in der für die Konstruktionsgrammatik einschlägigen Forschung zu Kollostruktionen, kollokativ verbundenen Clustern und n-Grammen sprachlicher Einheiten mit Konstruktionsstatus, durch Stefanowitsch und Gries (beginnend 2003) gewissermaßen initiiert wurden. Das Konzept des Konstruktikons schließlich wurde vor allem in den letzten Jahren weiter präzisiert, u. a. von Boas (2010) und Broccias (2012). Konsens ist heute, dass es prinzipiell möglich sei, komplexes sprachliches Wissen nach formalen (vgl. Broccias 2013; Boas 2013 im Anschluss an Croft/Cruse 2004; Ziem/Lasch 2013) und/oder nach bedeutungsseitigen Kriterien (vgl. etwa Boas 2014; Lasch 2014a; Ziem 2014b) zu organisieren – alle diese Formen sind in der aktuellen Forschung kopräsent (vgl. etwa Goldberg 2013, 21–26), ergänzen sich und werden darüber hinaus durch die Ansätze der Framesemantik beeinflusst (Boas 2014 und Ziem 2014b).

516 

 Alexander Lasch

[KONSTRUKTIKON] [agentive Konstruktionen]

[nonagentive Konstruktionen]

[HANDLUNG ‚GEBEN‘V(AGNPn, BENNPd, AOBNPa)]

[…]

[HANDLUNG ‚GEBEN‘V(=direkt)(AGNPn, BENNPd, AOBNPa)] […] [HANDLUNG ‚GEBEN‘V(≈modal)(AGNPn, BENNPd, AOBNPa)]

SEM

HANDLUNG ‚GEBEN‘







NPNOM

NPDAT

NPAKK

SEM

HANDLUNG ‚GEBEN‘

= direkt geben

SYN

VP







NPNOM

NPDAT

NPAKK

≈ modal bauen

SYN

VP

Abb. 3: Die Einbettung der Verben geben und bauen in die Ditransitiv-Konstruktion im Aussagerahmen HANDLUNG ‚GEBEN‘

Die Abb. 3 zeigt einen Ausschnitt aus dem Konstruktikon, wenn man der Angabe der internen Strukturen einer Konstruktion, wie in 2.2 beschrieben, folgte. Die Ordnung ist, gemäß den Ausgangsprämissen, orientiert an der Bedeutung sprachlicher Einheiten von einem niedrigeren Abstraktionsgrad (Satz) zu komplexeren und ab­strak­ teren Konstruktionen (Schema). Es wird postuliert, dass die Konstruktionen, in denen Verb- und Konstruktionsbedeutung in modaler Relation zueinander stehen, ihre Eigenschaften von den Konstruktionen erben, in denen eine direkte Relation zwischen Verb- und Konstruktionsbedeutung etabliert wird. Die Konstruktionsbedeutung wird dort durch die spezifische Bedeutung des in sie eingebetteten Verbs bauen spezifisch aktualisiert. Formseitig sind beide Varianten identisch, bedeutungsseitig ergeben sich durch die Einbettung unterschiedlicher Verben Aktualisierungen, die einem Knoten, wie hier dem Aussagerahmen HANDLUNG ‚GEBEN‘, zugeordnet werden können. Der Ausschnitt aus dem Konstruktikon unterschlägt aus abbildungstechnischen Gründen, dass auch Konstruktionen wie geben und bauen zu anderen Konstruktionen in Verbindung stehen, deren Instanzen sie sein können: (5) Er gibt sein letztes Hemd. (6) Er baut das Haus.

Konstruktionen in der geschriebenen Sprache 

 517

Geben und bauen sind hier nicht mehr in Ditransitiv-Konstruktionen eingebettet wie in (3) und (4), wohl aber in agentive Konstruktionen, die auch wie in (5) idiomatische Qualität haben können. Dieses knappe Beispiel dürfte andeuten, dass die Aufrichtung eines Konstruktikons die gebrauchsbasierten Ansätze forschungspraktisch vor große Herausforderungen stellt. Nichtsdestotrotz bietet dieser Ansatz eine Möglichkeit, Konstruktionen unterschiedlicher lexikalischer Fixiertheit und unterschiedlicher Abstraktheit formal und bedeutungsseitig miteinander so ins Verhältnis zu setzen, dass man die Atomarität sprachlicher Einheiten als unausgesprochene Hypothese nicht fortschreibt.

3 Ein Fallbeispiel: Die diskursspezifische ­Konstruktion [[NP]+[[DETGEN]+[Lebens]]] Anliegen dieses Abschnitts ist, die Reichweite des Konstruktionsbegriffs auszuloten. Dazu soll eine Beispielanalyse in der gebotenen Kürze vorgestellt werden. Über die Frage, wie weit der Konstruktionsbegriff reiche, lässt sich trefflich streiten. Forschungspraktisch kann man sich darauf einigen, vorerst nur sprachliche Einheiten bis zur Komplexität der Periphrase und so den Gegenstand ähnlich zu fassen wie andere Grammatikmodelle. Die eher syntaktisch orientierten Ansätze mit Orientierung auf schriftsprachliche Daten sähen die Grenze gern bei satzwertigen Ausdrücken. Ganz anders stellt sich die Orientierung für gesprächsanalytisch orientierte Ansätze dar, die den Konstruktionsbegriff auch für sprachliche Einheiten anwenden, die über die Satzgrenze hinausgehen (Deppermann 2006; Günthner 2006, 2009; Imo 2010) – für sie war aber auch der traditionelle Begriff ‚Satz‘ eher hinder- als förderlich, weil die Eigenheiten gesprochener Sprache mit der Adaptation von Kategorien, die anhand schriftsprachlicher Daten erarbeitet wurden, bestenfalls als ‚markiert‘ bezeichnet werden konnten (vgl. hierzu auch Deppermann/Proske und Fiehler in diesem Band). Die Konstruktion aber erlaubt auch Muster grammatisch zu beschreiben, die mehrteilig und gesprächskonstitutiv sind – nicht umsonst sind es vor allem ‚partnerorientierte Konstruktionen‘, die sich im Bereich der Erforschung gesprochener Sprache großer Beliebtheit erfreuen (vgl. dazu Bücker und Imo in diesem Band). Eine dritte Richtung geht schließlich noch weiter. Sie fordert mit guten Argumenten und nachdrücklich, dass eine Analyse von Konstruktionen und Konstruktionsnetzwerken ohne Berücksichtigung pragmatischer Aspekte nicht möglich sei und diese daher in Modelle der Konstruktionsgrammatik eingebettet werden müssten (vgl. den „construction discourse“; Östman 2005; Östman/Trousdale 2013). Einer solchen Pragmatisierung der Grammatik kann man durchaus skeptisch gegenüberstehen, dennoch kann es reizvoll sein, in einer Beispielanalyse darüber nachzudenken, wie die Verbindungen von periphrastischen Konstruktionsrealisierungen in größeren sprachlichen Einheiten zu bestimmen seien. Wie bereits ange-

518 

 Alexander Lasch

deutet, werden hier (aus forschungspraktischen und theoretischen Gründen) bereits etablierte Konzepte wie ‚Argumentation‘, ‚Aussagezusammenhang‘, ‚Schema‘ oder ‚Text‘ nicht mit dem Begriff der ‚Konstruktion‘ belegt. In den folgenden Überlegungen werden Ergebnisse einer konstruktionsgrammatischen Analyse von Realisierungen einer Konstruktion unterhalb der Ebene der Periphrase mit einer exemplarischen Analyse des Diskurses der Palliativmedizin bzw. Sterbehilfe aus der Perspektive der Sicht der christlichen Kirchen in Verbindung gesetzt. Die hier vorgestellten Ergebnisse basieren auf einer Präsentation für das Kolloquium „Palliativmedizin und Sterbhilfe“ (2010) des Forschungsnetzwerks „Sprache und Wissen“ an der Universität Heidelberg und fassen knapp Ergebnisse zusammen, die in Lasch (2015) ausführlich präsentiert werden. Datengrundlage der Untersuchung war das (2010 noch recht überschaubare) Korpus HeiDeKo (vgl. Felder/Müller/Vogel 2010 und 2012, 15), das schriftsprachliche Texte unterschiedlicher kommunikativer Reichweite (massenmediale Printformate und Publikationen für spezifische Adressatenkreise) umfasst. Für die exemplarische Untersuchung wurde der Ausschnitt des Korpus gewählt, der es ermöglichte, die Diskursposition der Christlichen Kirchen Deutschlands zu diesem Thema aus Grundsatztexten herauszuarbeiten. Es zeigte sich in der quantitativen Analyse, dass Realisierungen des spezifischen sprachlichen Musters mit Konstruktionsstatus [[NP]+[[DETGEN]+[Lebens]]] die Texte dieses Diskursauschnitts maßgeblich im Vergleich zu anderen Diskursauschnitten prägen. Statt Komposita (Lebensende, Lebensphase) konnten typische (das heißt durch eine Kollokationsanalyse ermittelte) Cluster, in denen die Konstruktion realisiert wird, ermittelt werden, die hier jetzt nicht quantifiziert, sondern qualitativ besprochen werden: aktive Beendigung des Lebens, Gott des Lebens, Freund des Lebens, Unwert eines menschlichen Lebens, Teil des Lebens, Ende des/jedes Lebens, Wert des armseligsten Lebens, Beendigung des menschlichen Lebens, Schutz des Lebens, Anwalt des Lebens, Sinn des Lebens, Achtung des Lebens, Unverfügbarkeit des Lebens, Verlängerung des Lebens, Vernichtung lebensunwerten Lebens, Vernichtung menschlichen Lebens, Phase des Lebens, Kunst des Lebens, Verkürzung des Lebens usw. (vgl. Lasch 2015). Man kann das Genitivattribut als Konstruktion analysieren, ohne dabei auf die kontextelle Einbettung (im Text oder Diskurs) achten zu müssen. Andererseits ist die hohe Auftretenshäufigkeit der lexikalisch teilspezifizierten Konstruktion [[NP]+[[DETGEN]+[Lebens]]] im Diskursausschnitt bemerkenswert. Hypothesen wie die, dass die Realisierungen dieser spezifischen Konstruktion typisch für einen Diskursausschnitt seien, die Auftretenshäufigkeit die Konstruktionsbedeutung entscheidend mit beeinflusse und dass sich Diskurspositionen von Diskursakteuren auch auf der Ebene kleinerer syntaktischer Einheiten rekonstruieren lassen, lassen sich ableiten. Die an der geschriebenen Sprache ausgerichteten gebrauchsbasierten Ansätze der Konstruktionsgrammatik stellen Thesen wie diese in der Regel nicht auf, da sie zum einen pragmatische Aspekte in der Konstruktionsbedeutung, wie hier am Beispiel des Genitivattributs, eher nicht berücksichtigen. Zum anderen ist die Frage, ob man aus der Erschließung der Konstruktionsbedeutung von [[NP]+[[DETGEN]+[NPGEN]]]

Konstruktionen in der geschriebenen Sprache 

 519

in der teilspezifizierten Form [[NP]+[[DETGEN]+[Lebens]]] einen Gewinn für die grammatische Beschreibung ziehen kann. Unabhängig davon, dass man unterschiedliche „semantische Typen“ des Genitivattributs annehmen mag (vgl. exempl. Duden 2009, IV, 824 ff.; Eisenberg 2006, I, 229 und II, 248 ff.), so ist die Konstruktion vor dem Hintergrund der allgemeinen Entwicklung des Sprachgebrauchs hin zur Verwendung von Präpositionalphrasen (*Ende von dem Leben) bzw. von Komposita (Lebensende) zunehmend als markiert anzusehen (diese Hypothese müsste allerdings erst empirisch bestätigt werden). Eine semantische Gemeinsamkeit weisen alle Konstruktionsrealisierungen auf, die nach dem Muster [[NP]+[[DETGEN]+[NPGEN]]] gebildet sind: Sie determinieren eine positiv bzw. negativ konnotierte Lesart der attribuierten Bezugsnominale (z. B. Anwalt vs. Beendigung), wobei ihre eigene Bedeutung (des Lebens) weitestgehend unangetastet bleibt. Die Verwendung eines Kompositums (z. B. Lebensbeendigung, Lebensverkürzung, Lebensvernichtung) rückt durch die Charakteristika der Wortbildung möglicherweise diesen Zusammenhang nicht so deutlich in den Vordergrund, denn allgemein gilt für Determinativkomposita, dass diese durch das Zweitglied (Determinatum) „semantisch dominiert“ (-verkürzung) und durch das Erstglied (Determinans) näher bestimmt werden (Lebens-). Die Erstglieder sind dabei den Zweitgliedern untergeordnet (vgl. Duden 2009, IV, 664 f.). Diese spezifische semantische Perspektivierungsleistung der Konstruktion des Genitivattributs mag einer der Gründe dafür sein, weshalb es in diesem Diskursausschnitt favorisiert wird. Durch die Attribuierung wird eine übergeordnete Konstruktion, ein Bezugsnominal, in einem satzwertigen Ausdruck (der wiederum als Kon­ struktion zu bestimmen ist) hinsichtlich seiner Bedeutung aktualisiert: (7) Gott ist ein Freund des Lebens.

Konstruktionen wie diese kann man als Konstruktionen der Eigenschaftszuweisung (Askription, vgl. Abb. 4, Lasch 2014a) beschreiben, in denen ein Spezifiziertes Objekt (SOB) durch eine Eigenschaft näher bestimmt wird, im Falle des so genannten ‚Gleichsetzungsnominativs‘ durch ein zweites Spezifiziertes Objekt (SOB‘). In die Konstruktion eingebettet ist das Verb sein, dessen Verbbedeutung in direkter Relation zur Konstruktionsbedeutung steht; alle durch die Konstruktion vorgegebenen Rollen und die Rollen des Verbs fusionieren. In die NP ein Freund des Lebens ist die Konstruktion des Genitivattributs eingebettet, die, wie zu sehen war, in der teilspezifizierten Realisierung [[NP]+[[DETGEN]+[Lebens]]] in dem hier beschriebenen Diskursausschnitt hochfrequent ist: So bringt die hinsichtlich der Bedeutungskonstitution besondere Kon­struktion, die zudem als markiert zu gelten hat, ein zentrales Thema diskursiv ins Spiel, ohne dass dieses explizit angekündigt werden müsste. Eine teilspezifizierte Konstruktion niedriger Abstraktionsstufe wird zum erkennbaren sprachlichen Muster, sie ist als soziale Konvention gestalthaft (Feilke 1996) und deutet als surface

520 

 Alexander Lasch

frame auf einen spezifischen deep seated frame hin (Lakoff/Wehling 2009), der aktiviert werden soll. [KONSTRUKTIKON]

[nonagentive Konstruktionen]

[Kommutation]

[ASKRIPTIONv(SOBNPn,[X])]

[ASKRIPTIONv(=direkt)(SOBNPn, [X])]

[ASKRIPTIONsein(=direkt)(SOBNPn,QUAL)] SEM

ASKRIPTION

< SOB

[agentive Konstruktionen]

QUAL >

[ASKRIPTIONv(=modal)(SOBNPn, [X])]

[ASKRIPTIONsein(=direkt)(SOBNPn,SOB'NPn)] SEM

ASKRIPTION

= sein

[Akzeptation]

< SOB

SOB' >

< SOB

SOB' >

= < SOB

sein

QUAL >

Konstruktion der Eigenschaftszuweisung (Askription) mit ‚Gleichsetzungsnominativ‘ am Beispiel: Gott ist ein Freund des Lebens.

SYN

VP

NP NOM

[[DETNOM]+[NNOM]]

AP

SYN

VP

[[DETNOM]+[ADJDNOM]+[NNOM]]

[…]

NPNOM

NPNOM

SOB = Spezifiziertes Objekt QUAL = Qualitativ

[[NPNOM] + [NPGEN]]

[[[DETNOM]+[NNOM]] + [[DETGEN]+[NGEN]]]

[…]

Abb. 4: [[NP]+[[DETGEN]+[Lebens]]] in der Konstruktion der Eigenschaftszuweisung (Askription) im Konstruktikon

Diskurslinguistisch gesprochen markiert es wohl den Dreh- und Angelpunkt einer diskurssemantischen Grundfigur; es indiziert als Form-Bedeutungspaar letztlich die relevante Diskursposition: Das Leben wie das Sterben ist dem Menschen als Gnade Gottes unverfügbar; das irdische Leben und Sterben ist nur Teil des (ewigen) Lebens. So wie es sich darstellt, markieren die Diskursakteure der christlichen Kirchen den Diskurs „Palliativmedizin/Sterbehilfe“ als nicht zentral und setzen mit dem Begriff Leben (z. B. in der Verwendung des Genitivattributs des Lebens) eine Diskursposition dominant, die auf eine andere Diskursebene verweist  – ihre Position ist eindeutig und mit dem Blick auf die diskursiven Grundfiguren nicht verhandelbar, sie adressie-

Konstruktionen in der geschriebenen Sprache 

 521

ren den Diskurs Menschliches als christliches Leben. Diesem übergeordneten Diskurs ordnet sich das hier behandelte Thema unter  – auch das ist eine Diskursposition. Diese Position ist für die hier beschriebene Gruppe und einen spezifischen Adressatenkreis sozial konventionalisiert. Sprachliche Muster etablieren sich im Sprachgebrauch, da sie versprechen, das jeweils angestrebte kommunikative Ziel einfacher zu erreichen als mit anderen Mitteln; in Diskursen markieren sie  – so die hier vertretene These  – unterschiedliche Diskurspositionen. Die Analyse zu Realisierungen der lexikalisch teilspezifischen Konstruktion [[NP]+[[DETGEN]+[Lebens]]] hat gezeigt, dass zum einen ihre Einbettung in Konstruktionen höheren Abstraktionsgrades (z. B. Konstruktionen der Eigenschaftszuweisung, vgl. Abbildung 4) eine besondere mehrfache semantische Spezifizierung erzwingt, und zum anderen wegen der hohen Frequenz der Konstruktion ein übergeordneter Diskurs – nämlich der des menschlichen als christlichen Lebens – adressiert wird. Dies gelingt, ohne dass diese Diskursposition explizit thematisiert würde, durch das hochfrequente Auftreten der lexikalisch teilspezifizierten Konstruktion [[NP]+[[DETGEN]+[Lebens]]], die damit einen Aussagekomplex in den untersuchten Texten etabliert und eine sprachliche als diskursive und soziale Praxis bestätigt. Es ist also nicht nur so, dass die Analyse der Diskurspositionen (und deren Manifestation als sprachliche Einheiten unterschiedlicher Komplexität) wichtige Hinweise dafür liefert, weshalb eine sprachliche Einheit verwendet wurde oder gerade nicht. Umgekehrt verhält es sich ähnlich – anhand der Beschreibung stabiler sprachlicher bzw. innovativer sprachlicher Muster kann erklärt werden, welche Einheiten an der Etablierung diskursbestätigender bzw. diskursverändernder Positionen beteiligt sind. Konstruktionsgrammatische Überlegungen können die Analyse von Aussagen auf Satzebene und Aussagenkomplexen oberhalb der Satzebene in Diskursen ergänzen, da sie Sprache im Gebrauch und die Zusammenhänge von Form und Bedeutung in den Mittelpunkt des Interesses stellen. Dass dieses Interesse durchaus gewinnbringend in z. B. diskurslinguistische Studien einzubringen ist, zeigte das Beispiel. Umgekehrt beeinflusst der Sprachgebrauch, der auch diskursive Praktiken einschließt, die Konstruktionsbedeutungen, auch unterhalb der Ebene von Periphrasen. Deshalb ist zumindest zu diskutieren, ob und inwieweit pragmatische Aspekte und Korpusbefunde, die auf den Gebrauch von Konstruktionen in bestimmten Kommunikationsdomänen hinweisen, in konstruktionsgrammatische Studien Eingang finden sollten. Der im Diskurs beobachtete Gebrauch der lexikalisch teilspezifizierten Konstruktion [[NP]+[[DETGEN]+[Lebens]]] ist nicht allein auf der Ebene des Satzes zu beschreiben, sondern muss unabhängig davon, ob pragmatische Aspekte in die Konstruktionsbedeutung eingehen oder nicht, in Aussagenkomplexen und Diskursauschnitten analysiert werden. Mit der Abnahme der Abstraktheit einer Konstruktion und ihrer Konstruktionsrealisierungen fallen pragmatische Aspekte bei der Bestimmung der Konstruktionsbedeutung stärker ins Gewicht. Kurz gesagt: Je idiomatischer eine sprachliche Einheit ist, desto stärker muss die Konstruktionsgrammatik ausgreifen auf die Erklärung

522 

 Alexander Lasch

der Gebrauchskontexte der Einheiten, um die Relevanz und Bedeutung dieser Kon­ struktionen im Konstruktikon adäquat beschreiben zu können. Wie gezeigt zielt dabei die Differenzierung zwischen Größen wie ‚Satz‘, ‚Aussagenkomplex‘ und ‚Schema‘ und die Verortung des Konzeptes ‚Konstruktion‘ im Verhältnis dazu zum einen auf eine theoretische Positionierung der Konstruktionsgrammatik, zum anderen auf forschungspraktische Fragen, die – und das ist Indiz für die Vitalität der gebrauchsbasierten konstruktionsgrammatischen Ansätze – noch lebhaft diskutiert werden.

4 Fazit Das Konzept der Konstruktion liegt systematisch nicht passgenau zu Konzepten wie ‚Satz‘, ‚Aussage‘/‚Aussagenkomplex‘ und ‚Schema‘, da die Einheit von Form und Bedeutung für die Konstruktion immer gegeben sein muss, und mit der Satzgrenze zugleich der Gegenstandsbereich im Hinblick auf die geschriebene Sprache eingehegt ist. Das Konzept des ‚Satzes‘ wie das der ‚Aussage‘ oder des ‚Aussagenkomplexes‘ ist nur deshalb in der Debatte virulent, da über die Reichweite des Konstruktionsbegriffs nachgedacht wird und der Begriff der ‚Konstruktion‘ im Verhältnis etwa zu ‚Text‘, ‚Gespräch‘, ‚Diskurs‘ ausgeleuchtet wird – die aktuelle Forschungsdiskussion im Bereich der geschriebenen Sprache lässt im Moment aber klar eine Tendenz zu ‚grammatischen Konstruktionen‘ erkennen. Analytisch und strukturell ist daher der Aussagenkomplex nicht unmittelbar und der Satz als Einheit nur von geringer forschungspraktischer Relevanz. Anders sieht dies in Bezug auf den Schema-Begriff aus. Die Konzepte ‚Konstruktion‘ und ‚Schema‘ decken unterschiedliche Entitäten ab – die Schnittmenge bilden sprachliche Einheiten, die hinsichtlich eines bedeutungskonstitutiven Aspekts nicht voll spezifiziert sind. Denn wie gezeigt ist der Begriff der Konstruktion daran gebunden, dass die Bedeutung einer sprachlichen (Teil-)Einheit bestimmt werden kann, was beim Schema nicht zwingend erforderlich ist. Daher ist auch unterhalb der morphologischen Ebene der Konstruktionsbegriff nicht anzuwenden – eine spezifische Verknüpfung von Phonen wie to te ta mag zwar, je nach Kontext, schematisch sein, ist aber nicht oder nur unter sehr spezifischen Bedingungen etwa in der gesprochenen Sprache als Konstruktion zu fassen (z. B. etwa als Zauberspruch). Der im Band skizzierte Gegenstand, nämlich das Verhältnis zwischen ‚Satz‘, ‚Äußerung‘ bzw. ‚Aussage‘/‚Aussagenkomplex‘ und ‚Schema‘ ist für die Konstruktionsgrammatik heute (noch) keine Herausforderung. Das liegt zum einen daran, dass verschiedene Ansätze heute wieder stärker auf ‚grammatische Konstruktionen‘ der geschriebenen Sprache hin orientiert sind, die als Einheiten unterhalb der Ebene der Periphrase liegen. Andere Ansätze, die den Konstruktionsbegriff weiter fassen, stehen auch forschungspraktisch vor der Frage, wie das Konzept der Konstruktion als

Konstruktionen in der geschriebenen Sprache 

 523

‚einziges Format‘ sprachlichen Wissens zu etablieren und zugleich operationalisierbar zu machen sei.

5 Literatur Boas, Hans C. (2010): The syntax-lexicon continuum in construction grammar: a case study of English communication verbs. In: Belgian Journal of Linguistics 24, 57–86. Boas, Hans C. (2013): Cognitive construction grammar. In: Hoffmann/Trousdale, 233–254. Boas, Hans C. (2014): Zur Architektur einer konstruktionsbasierten Grammatik des Deutschen. In: Lasch/Ziem, 37–63. Broccias, Cristiano (2012): The syntax-lexicon continuum. In: Terttu Nevalainen/Elizabeth Closs Traugott (Hg.): The Oxford Handbook of the History of English. Oxford, 735–747. Broccias, Cristiano (2013): Cognitive grammar. In: Hoffmann/Trousdale, 191–210. Bücker, Jörg (2014): Konstruktionen und Konstruktionscluster: das Beispiel der Zirkumposition von XP her im gesprochenen Deutsch. In: Lasch/Ziem, 117–135. Busse, Dietrich (Hg.) (1987): Historische Semantik. Analyse eines Programms. Stuttgart. Busse, Dietrich (1997): Das Eigene und das Fremde. Annotationen zu Funktion und Wirkung einer diskurssemantischen Grundfigur. In: Matthias Jung/Martin Wengeler/Karin Böke (Hg.): Die Sprache des Migrationsdiskurses. Das Reden über Ausländer in Medien, Politik und Alltag. Opladen, 17–35. Busse, Dietrich (2007): Diskurslinguistik als Kontextualisierung – Sprachwissenschaftliche Überlegungen zur Analyse gesellschaftlichen Wissens. In: Ingo H. Warnke (Hg.): Diskurslinguistik nach Foucault. Theorie und Gegenstände. Berlin/New York, 81–105. Busse, Dietrich (2008): Diskurslinguistik als Epistemologie. Das verstehensrelevante Wissen als Gegenstand linguistischer Forschung. In: Ingo H. Warnke/Jürgen Spitzmüller (Hg.): Methoden der Diskurslinguistik. Sprachwissenschaftliche Zugänge zur transtextuellen Ebene. Berlin/New York, 57–87. Busse, Dietrich (Hg.) (2012): Frame-Semantik. Ein Kompendium. Berlin/Boston. Busse, Dietrich/Wolfgang Teubert (2013): Ist Diskurs ein sprachwissenschaftliches Objekt? Zur Methodenfrage der historischen Semantik. In: Dietrich Busse/Wolfgang Teubert (Hg.): Linguistische Diskursanalyse: Neue Perspektiven. Wiesbaden, 13–30. Bybee, Joan L. (2013): Usage-based theory and exemplar representations. In: Hoffmann/Trousdale, 49–69. Croft, William (1998): Linguistic evidence and mental representations. In: Cognitive Linguistics 9, 151–173. Croft, William (Hg.) (2001): Radical Construction Grammar. Syntactic Theory in Typological Perspective. Oxford. Croft, William (2013): Radical construction grammar. In: Hoffmann/Trousdale, 211–232. Croft, William/David A. Cruse (2004): Cognitive Linguistics. Cambridge. Deppermann, Arnulf (2006): Construction grammar – Eine Grammatik für die Interaktion? In: Arnulf Deppermann/Reinhard Fiehler/Thomas Spranz-Fogasy (Hg.): Grammatik und Interaktion. Radolfzell, 43–65. Deppermann, Arnulf (2011): Konstruktionsgrammatik und Interaktionale Linguistik: Affinitäten, Komplementaritäten und Diskrepanzen. In: Lasch/Ziem, 205–238. Diessel, Holger (2013): Construction grammar and first language acquisition. In: Hoffmann/ Trousdale, 347–364.

524 

 Alexander Lasch

Dowty, David R. (1991): Thematic proto-roles and argument selection. In: Language 67, 547–619. Duden (2009): Grammatik der deutschen Gegenwartssprache. Band 4. 8., überarbeitete Auflage. Mannheim u. a. Dürscheid, Christa/Jan Georg Schneider (2015): Satz – Äußerung – Schema. In: Ekkehard Felder/Andreas Gardt (Hg.): Handbuch Sprache und Wissen. Berlin/Boston (Handbücher Sprachwissen, 1), 167–194. Eisenberg, Peter (2006): Grundriss der deutschen Grammatik. Band 1 und 2. 3., durchgesehene Auflage. Stuttgart/Weimar. Evans, Vyvyan/Melanie Green (2006): Cognitive Linguistics. An Introduction. Edinburgh. Feilke, Helmuth (1996): Sprache als soziale Gestalt. Ausdruck, Prägung und die Ordnung der sprachlichen Typik. Frankfurt a. M. Felder, Ekkehard/Marcus Müller/Friedemann Vogel (2010): Das Heidelberger Korpus – Gesellschaftliche Konflikte im Spiegel der Sprache. In: Zeitschrift für Germanistische Linguistik 38, 314–319. Felder, Ekkehard/Marcus Müller/Friedemann Vogel (2012): Korpuspragmatik – Paradigma zwischen Handlung, Gesellschaft und Kognition. In: Ekkehard Felder/Marcus Müller/Friedemann Vogel (Hg.): Korpuspragmatik. Thematische Korpora als Basis diskurslinguistischer Analysen. Berlin/ New York, 2–28. Fillmore, Charles J. (1968): The case for case. In: Emmon Bach/Robert T. Harms (Hg.): Universals in Linguistic Theory. New York, 1–88. Fillmore, Charles J. (1988): The mechanisms of construction grammar. In: Berkeley Linguistic Society 14, 35–55. Fillmore, Charles J. (2013): Berkeley construction grammar. In: Hoffmann/Trousdale, 111–132. Fischer, Kerstin/Anatol Stefanowitsch (2007): Konstruktionsgrammatik: Ein Überblick. In: Kerstin Fischer/Anatol Stefanowitsch (Hg.): Konstruktionsgrammatik: Von der Anwendung zur Theorie. Nachdruck der Ausgabe von 2006. Tübingen, 3–17. Goldberg, Adele E. (1995): Constructions: A Construction Grammar Approach to Argument Structure. Chicago. Goldberg, Adele E. (2003): Constructions: a new theoretical approach to language. In: Trends in Cognitive Sciences 7 (5), 219–224. Goldberg, Adele E. (2006): Constructions at Work. The Nature of Generalization in Language. Oxford. Goldberg, Adele E. (2013): Constructionist approaches. In: Hoffmann/Trousdale, 15–31. Gries, Stefan Th. (1999): Particle movement: a cognitive and functional approach. In: Cognitive Linguistics 10, 105–145. Gries, Stefan Th. (2013): Data in construction grammar. In: Hoffmann/Trousdale, 93–110. Gries, Stefan Th./Anatol Stefanowitsch (2004): Extending collostructional analysis. A corpus-based perspective on ‚alternations‘. In: International Journal of Corpus Linguistics 9 (1), 97–129. Günthner, Susanne (2006): Von Konstruktionen zu kommunikativen Gattungen: Die Relevanz sedimentierter Muster für die Ausführung kommunikativer Aufgaben. In: Deutsche Sprache 34 (1–2), 173–190. Günthner, Susanne (2009): Adjektiv + dass-Satzkonstruktionen als kommunikative Ressourcen der Positionierung. In: Susanne Günthner/Jörg Bücker (Hg.): Grammatik im Gespräch. Konstruktionen der Selbst- und Fremdpositionierung. Berlin/New York, 149–184. Günthner, Susanne (2010): Konstruktionen in der kommunikativen Praxis – zur Notwendigkeit einer interaktionalen Anreicherung konstruktionsgrammatischer Ansätze. In: Zeitschrift für Germanistische Linguistik 37 (3), 402–426. Günthner, Susanne (2011): Between emergence and sedimentation. Projecting constructions in German interactions. In: Peter Auer/Stefan Pfänder (Hg.): Constructions: Emerging and Emergent. Berlin/Boston, 156–185.

Konstruktionen in der geschriebenen Sprache 

 525

Hilpert, Martin (2013): Constructional Change in English. Developments in Allomorphy, Word Formation, and Syntax. Cambridge. Hoffmann, Thomas/Graeme Trousdale (Hg.) (2013a): The Oxford Handbook of Construction Grammar. Oxford. Hoffmann, Thomas/Graeme Trousdale (2013b): Construction grammar. Introduction. In: Hoffmann/ Trousdale, 1–12. Imo, Wolfgang (2010): Mein Problem ist/mein Thema ist – how syntactic patterns and genre interact. In: Anja Wanner/Heidrun Dorgeloh (Hg.): Syntactic Variation and Genre. Berlin/New York, 141–166. Kay, Paul (2013): The limits of (construction) grammar. In: Hoffmann/Trousdale, 32–48. Lakoff, George (1977): Linguistic gestalts. In: Chicago Linguistic Society (Hg.): Papers from the 13th Regional Meeting, 236–287. Lakoff, George (Hg.) (1987): Women, Fire, and Dangerous Things. Chicago. Lakoff, George/Mark Johnson (Hg.) (1980): Metaphors We Live By. Chicago. Lakoff, George/Eva E. Wehling (Hg.) (2009): Auf leisen Sohlen ins Gehirn. Politische Sprache und ihre heimliche Macht. 2., aktualisierte Auflage. Heidelberg. Langacker, Ronald W. (1987): Foundations of Cognitive Grammar. Band 1: Theoretical Prerequisites. Stanford. Langacker, Ronald W. (2005): Construction grammars: cognitive radical, and less so. In: Francisco J. Ruiz de Mendoza Ibanez/Sandra Pena Cervel (Hg.): Cognitive Linguistics: Internal Dynamics and Interdisciplinary Interaction. Berlin/New York, 101–159. Langacker, Ronald W. (2009): Cognitive (construction) grammar. In: Cognitive Linguistics 20 (1), 167–176. Lasch, Alexander (2014a): Das Fenster wirkt geschlossen – Überlegungen zu nonagentiven Konstruktionen des Deutschen aus konstruktionsgrammatischer Perspektive. In: Lasch/Ziem, 65–95. Lasch, Alexander (2014b): Zur Vereinbarkeit von diskurslinguistisch motivierter Sprachgeschichtsschreibung und maschineller Sprachanalyse am Beispiel des „Islamismus“Diskurses. In: Vilmos Ágel/Andreas Gardt (Hg.): Paradigmen der Sprachgeschichtsschreibung (Jahrbuch für Germanistische Sprachgeschichte, 5). Berlin/New York, 231–249. Lasch, Alexander (2015): „Gott ist ein Freund des Lebens“. Die Konstruktion [[NP]+[[DETGEN]+[Lebens]]] als gestalthafte Routine im palliativmedizinischen Diskurs. In: Alexander Ziem/ders. (Hg.): Konstruktionsgrammatik IV. Konstruktionen als soziale Konventionen und kognitive Routinen. Tübingen, 133–154. Lasch, Alexander/Alexander Ziem (Hg.) (2011): Konstruktionsgrammatik III. Aktuelle Fragen und Lösungsansätze. Tübingen. Lasch, Alexander/Alexander Ziem (Hg.) (2014): Grammatik als Netzwerk von Konstruktionen: Sprachwissen im Fokus der Konstruktionsgrammatik. Berlin/Boston. Michaelis, Laura A. (2013): Sign-based construction grammar. In: Hoffmann/Trousdale, 133–152. Östman, Jan-Ola (2005): Construction discourse: a prolegomenon. In: Jan-Ola Östman/Mirjam Fried (Hg.): Construction Grammars: Cognitive Grounding and Theoretical Extensions. Amsterdam/ Philadelphia, 121–144. Östman, Jan-Ola/Graeme Trousdale (2013): Dialects, discourse and construction grammar. In: Hoffmann/Trousdale, 476–490. Polenz, Peter von (2008): Deutsche Satzsemantik. Grundbegriffe des Zwischen-den-Zeilen-Lesens. 3., unveränderte Auflage. Berlin/New York. Rostila, Jouni (2014): Inventarisierung als Grammatikalisierung: Produktive Präpositionalobjekte und andere grammatikalisierte Linking-Muster. In: Lasch/Ziem, 97–116.

526 

 Alexander Lasch

Sag, Ivan (2012): Sign-based construction grammar: an informal synopsis. In: Hans C. Boas/Ivan Sag (Hg.): Sign-Based Construction Grammar. Stanford, 69–202. Sag, Ivan/Hans C. Boas/Paul Kay (2012): Introducing sign-based construction grammar. In: Hans C. Boas/Ivan Sag (Hg.): Sign-Based Construction Grammar. Stanford, 1–30. Sandra, Dominiek (1998): What linguists can and can’t tell you about the human mind: a reply to Croft. In: Cognitive Linguistics 9, 361–378. Sinclair, John M. (1991): Corpus, Concordance, Collocation. Oxford. Spitzmüller, Jürgen/Ingo H. Warnke (2011): Diskurslinguistik. Eine Einführung in Theorien und Methoden der transtextuellen Sprachanalyse. Berlin/New York. Stefanowitsch, Anatol (2011): Keine Grammatik ohne Konstruktionen: ein logisch-ökonomisches Argument für die Konstruktionsgrammatik. In: Stefan Engelberg/Anke Holler/Kristel Proost (Hg.): Sprachliches Wissen zwischen Lexikon und Grammatik. Berlin/New York, 181–210. Stefanowitsch, Anatol (2013): Collostructional analysis. In: Hoffmann/Trousdale, 290–306. Stefanowitsch, Anatol/Stefan Th. Gries (2003): Collostructions: investigating the interaction between words and constructions. In: International Journal of Corpus Linguistics 8 (2), 209–243. Tomasello, Michael/Michelle E. Barton (1994): Learning words in non-ostensive contexts. In: Cognitive Development 10, 201–224. Tomasello, Michael/Patricia J. Brooks (1998): Young children’s earliest transitive and intransitive constructions. In: Cognitive Linguistics 9 (4), 379–395. Wildgen, Wolfgang (2008): Kognitive Grammatik. Klassische Paradigmen und neue Perspektiven. Berlin/New York. Ziem, Alexander (2008): Frames und sprachliches Wissen: kognitive Aspekte der semantischen Kompetenz. Berlin/New York. Ziem, Alexander (2014a): Konstruktionsgrammatische Konzepte eines Konstruktikons. In: Lasch/ Ziem, 15–34. Ziem, Alexander (2014b): Von der Kasusgrammatik zum FrameNet: Frames, Konstruktionen und die Idee eines Konstruktikons. In: Lasch/Ziem, 263–290. Ziem, Alexander/Alexander Lasch (2013): Konstruktionsgrammatik. Konzepte und Grundlagen gebrauchsbasierter Ansätze. Berlin/Boston.

Georg Albert

23. Konstruktionen in unterschiedlichen medialen Kontexten Abstract: Thema des Beitrags ist die Genese und anschließende Diffusion innovativer Konstruktionen, besonders im Zusammenhang mit den medialen Gegebenheiten und spezifischen Kontexten des Gebrauchs dieser Konstruktionen. Als Beispiel dient die Konstruktion [können + NP] wie in Wer kann Papst? oder Solche Angebote kann nur der Osterhase. Ein solcher Gebrauch von können hat sich inzwischen auch im journalistischen Sprachgebrauch etabliert. Die Verwendung ohne Infinitiv wird in schriftsprachlichen Kontexten anders als in der gesprochenen Sprache wahrgenommen, ermöglicht semantische Modifikationen und kann als Innovation beschrieben werden. Die überschaubare Karriere dieser Konstruktion erlaubt Schlussfolgerungen zur Rolle des Mediums (als einem Verfahren der Zeichenprozessierung, vgl. Schneider 2008, 100) für die Entwicklung einer Konstruktion. So kann die zunehmende Frequenz mit kontextsensitiven Modifizierungen einhergehen. Die Konstruktion [können + NP] ist daher ein Beispiel für die Untrennbarkeit von syntaktischem und lexikalischem Wissen einerseits und Kenntnis der Normen unterschiedlicher, medienspezifischer Gebrauchsweisen andererseits. Die über das Beispiel hinausgehende Fragestellung lautet: Inwiefern kann oder muss die Beschreibung einer Konstruktion ihr Auftreten in unterschiedlichen mündlichen und schriftlichen (z. B. Chat, Feuilleton) Medien berücksichtigen? 1 Grundlagen: Medialität 2 Effekte medialer Übertragung 3 Das Beispiel [können + NP] 4 Konstruktion und Medium 5 Literatur

1 Grundlagen: Medialität Grammatische Konstruktionen sind durch Sprachgebrauch verfestigte Schemata, von denen man annehmen kann, dass sie Akteuren in irgendeiner Weise potentiell zur Verfügung stehen, weil sie in unterschiedlichen Situationen auf ähnliche Weise reproduziert werden. Der Prozess der Schematisierung sowie die (modifizierende) Reproduktion des Schemas finden dabei stets in spezifischen medialen Kontexten statt. Die zentrale These des folgenden Beitrags lautet, dass diese medialen Kontexte selbst bei der Entstehung und bei der Entwicklung von Konstruktionen eine Rolle spielen können, Konstruktionen mithin nicht unabhängig vom medialen Kontext

528 

 Georg Albert

ihres Vorkommens beschrieben werden sollten. Mit Bezug auf den Sprachspielbegriff von Ludwig Wittgenstein lässt sich folgende Prämisse formulieren: Wenn man ein Sprachspiel betrachtet, darf man sich daher nicht auf die sprachliche Handlung im engeren Sinn, also die sprachliche Äußerung, beschränken, sondern muss das ganze Ensemble an Faktoren berücksichtigen, inklusive etwaiger anderer semiotischer Handlungen und des Mediums und der Modi, in denen kommunikativ gehandelt wird, aber auch inklusive der kontextuellen Situation, der Bezüge, die zu dieser hergestellt werden, und der Bezugselemente selbst wie auch der beteiligten Kommunikanten, die diese Bezüge herstellen und zugleich bestimmte Intentionen verfolgen. (Weidacher 2011, 53)

Zunächst ist an dieser Stelle zu klären, wie die Termini Medium und entsprechend mediale Kontexte im Folgenden verwendet werden: Angesichts der Vielzahl der diskutierten Medienkonzepte gibt Dürscheid (2005, 4) eine Übersicht in Anlehnung an Roland Posner, der neben einer Reihe anderer das „kodebezogene Medienkonzept“ anführt. Im Sinne dieses Konzepts ist nach Posner eine Einzelsprache ein Medium, wobei laut Dürscheid weiter zu fragen sei, „ob das Zeichensystem mündlich oder schriftlich realisiert wird“ (Dürscheid 2005, 4). Folgt man dieser Auffassung, dann sind die geschriebene und gesprochene Sprache Varianten eines Mediums. Diese Konzeption ist letztlich also eine semiotische, insofern sie nach der Art der vorkommenden Zeichen fragt. Dürscheid favorisiert für die Linguistik hingegen den technologischen Medienbegriff, demzufolge Medien als materiale, vom Menschen hergestellte Apparate zur Herstellung/Modifikation, Speicherung, Übertragung oder Verteilung von sprachlichen (und nicht-sprachlichen) Zeichen (Habscheid 2000, 137; so auch zitiert in Dürscheid 2005, 5)

zu definieren sind. Eine Konsequenz dieser Auffassung von Medien als technische Hilfsmittel ist, dass gesprochene Sprache im Face-to-Face-Gespräch nicht als Medium angesehen wird, da „[a]ufgrund der Kopräsenz der Teilnehmer […] kein Kommunikationsmittel erforderlich“ (Dürscheid 2005, 5) sei. Dagegen könnte man einwenden, dass Artikulationsorgane nicht allein schon deshalb aus der Kategorie ,Kommunikationsmittel‘ herausfallen müssten, weil sie keine Artefakte sind. Schwerwiegend ist aber vor allem die Konsequenz, dass auf der Basis des technischen Medienbegriffs per definitionem nicht nach den medialen Eigenschaften von Face-to-Face-Kommunikation gefragt werden kann. Vor dem Hintergrund des gegenwärtigen Diskussionsstands der Gesprochene-Sprache-Forschung kann aber behauptet werden, dass es mediale Eigenschaften sind, die für bestimmte Merkmale prototypischer gesprochener Sprache konstitutiv sind (vgl. Auer 2000; Dürscheid 2012, 116 f.; Fricke 2012, 36). Für die folgenden Überlegungen wird ein semiotischer Medienbegriff zugrundegelegt, für den die materiellen Eigenschaften und die Verfügbarkeit der in einem Medium prozessierten Zeichen zentral sind. Je nach Erkenntnisinteresse sind hier verschiedene Abstraktionsgrade möglich. Auf einem hohen Abstraktionsniveau können

Konstruktionen in unterschiedlichen medialen Kontexten 

 529

visuelle und akustische Zeichen voneinander (und von weiteren Zeichen) unterschieden werden. Visuelle Zeichen können unterhalb dieser Beschreibungsebene weiter in Schriftzeichen, Bildzeichen, Gebärden etc. unterteilt werden; akustische Zeichentypen sind demnach Sprachlaute, Musik etc. Für das Folgende ist weiter von Bedeutung, dass die Unterscheidung „geschrieben vs. gesprochen“ nicht als einfache Dichotomie funktioniert, wie es vor allem das Modell von Koch und Oesterreicher vorsieht (und zwar für „medial schriftlich“ bzw. „medial mündlich“, vgl. Koch/Oesterreicher 1990). Die Beschreibung medialer Kontexte von Sprachgebrauch bzw. der fraglichen Konstruktionen muss konkretere mediale Eigenschaften berücksichtigen. Hierzu zählen: – Zeitlichkeit: Sprachliche Kommunikation kann unter den Bedingungen der Gleichzeitigkeit von Produktion und Rezeption stattfinden (synchrone Kommunikation). Dies ist der Fall bei prototypischer Face-to-Face-Kommunikation, prinzipiell ist es aber auch vorstellbar, dass Akteure schriftliche Botschaften auf einem gemeinsam sichtbaren Blatt Papier austauschen – während eines wissenschaftlichen Vortrags ist diese Situation nicht ganz unüblich. Asynchrone Kommunikation findet statt, wenn die Rezeption einer sprachlichen Handlung zeitversetzt erfolgt. Schriftsprachliche Kommunikation ist prototypisch asynchron organisiert. Streng genommen trifft dies auch auf die Chatkommunikation zu, selbst wenn hier die Zeitversetzung minimal ist. Es kommt im Chat nicht zu Unterbrechungen und Überlappungen, erst am Ende des Schreibvorgangs wird die Nachricht verschickt (vgl. Beißwenger 2010). Der schnelle Austausch von Nachrichten führt jedoch im Chat zu Strukturen, die es rechtfertigen, von quasi-synchroner Kommunikation zu sprechen (vgl. Dürscheid 2005, 8). Die dichotome Unterscheidung von synchroner und asynchroner Kommunikation wird somit relativiert und es bedarf weiterer Forschung, um zu zeigen, ob aufgrund unterschiedlicher Formulierungsstrategien beispielsweise in E-Mails (Rezeption am selben Tag ist möglich) und Briefen (Rezeption ist frühestens am Folgetag möglich) genauere Unterscheidungen sinnvoll wären. – Raum: Die Interaktionspartner einer Kommunikation können räumlich getrennt sein oder nicht. Das Beispiel des Telefonierens zeigt, dass eine räumliche Trennung nicht zwangsläufig auch Asynchronizität der Kommunikation bedeutet. Spezifische Konstruktionen mit phatischer Funktion (z. B. ein Hallo mit Frageintonation) sind charakteristisch für synchrone Kommunikation bei räumlicher Trennung. Ein gemeinsamer Raum bedeutet für die Akteure wechselseitige Sichtbarkeit, so dass in entsprechenden Kontexten Mimik und Gestik untrennbar mit der lautlich artikulierten Sprache verbunden sind (vgl. Fricke 2012, 38 ff. und passim). – Anzahl der beteiligten Akteure und Rollenverteilung: Medien unterscheiden sich darin, ob sie prinzipiell über eine Eins-zu-Eins-Kommunikation hinaus auch Eins-zu-Viele- oder Viele-zu-Viele-Kommunikation ermöglichen (vgl. Dürscheid 2005, 7). Während in einem Chatroom Viele-zu-Viele-Kommunikation möglich ist, erlaubt eine E-Mail nur Eins-zu-Viele-Kommunikation – während bei beiden

530 

 Georg Albert

immer auch Eins-zu-Eins-Kommunikation stattfinden kann. Was unter den jeweils gegebenen medialen Bedingungen dann tatsächlich ,gespielt‘ wird, wie also die Produzenten- und Rezipientenrollen verteilt werden, ist keine Frage der Medialität, sondern des Sprachspiels (vgl. Schneider 2011, 168; vgl. zum Aspekt der Rollenverteilung auch Ágel/Hennig 2006, 18). Das Medium „konturiert sie [semiotische Performanzen], ohne sie jedoch zu determinieren“ (Schneider 2011, 170). – Vorkommen technischer Apparaturen: Ein spezifischer medialer Kontext ist gegeben, wenn eine Face-to-Face-Kommunikation ohne jede Beteiligung körperexterner Apparaturen stattfindet. Gesprochene Sprache kann aber auch durch Mikrofone oder Megafone modifiziert werden, was zumindest auf die Artikulation einen Einfluss haben kann. Für geschriebene Sprache ist es von fundamentaler Bedeutung, ob mit der Hand, einer Schreibmaschine oder per Tastatur in einer Textverarbeitungssoftware geschrieben wird. Je nach materiell-medialer Situation stehen unterschiedliche Zeichen und semiotische Potentiale zur Verfügung. – Kombination mit nicht-sprachlichen Zeichen: In Bezug auf gesprochene Sprache ist keineswegs letztgültig geklärt, wo die Grenzen zwischen verbalem, paraverbalem und nonverbalem Zeichenrepertoire verlaufen, ob also beispielweise manche Gesten Sprachzeichen sind oder nicht (vgl. Fricke 2012). Geschriebene Sprache tritt häufig gemeinsam mit Bildern auf, ermöglicht semiotisch relevante Variation von Schrifttypen (vgl. Stöckl 2004; Spitzmüller 2013) und hat neue Zeichen wie etwa die Emoticons etabliert. Alle diese Eigenschaften von kommunikativen Ereignissen sind mediale Eigenschaften und konstitutiv für den jeweiligen Sprachgebrauch. Die dichotome Unterscheidung von geschriebener und gesprochener Sprache ist demnach oft nicht differenziert genug. Dies mag einer Unterschätzung der Medialität geschuldet sein (vgl. auch Deppermann/Helmer (2013), 131, die ,Mündlichkeit‘ und ,Schriftlichkeit‘ für „eine zu grobe Unterscheidung“ halten). Es wird im Folgenden aber nicht nur die Auffassung vertreten, dass die gesprochene Sprache ein Medium ist, sondern weitergehend, dass es unterschiedliche mündliche Medien (Face-to-Face-Gespräch, Vortrag, Telefonat, etc.) und unterschiedliche schriftliche Medien (handgeschriebene Postkarte (vgl. Diekmannshenke 2011), E-Mail, Zeitungstext, etc.) gibt, die allesamt potentiell spezifische sprachliche Konstruktionen hervorbringen und weiterentwickeln können.

2 Effekte medialer Übertragung Konstruktionsgrammatische Arbeiten haben in den letzten Jahren betont, dass es sich bei sprachlichen Zeichen – auch bei lexikalisch unfixierten Konstruktionen wie etwa der Passivkonstruktion  – stets um Form-Bedeutungs-Paare handelt (vgl. in diesem

Konstruktionen in unterschiedlichen medialen Kontexten 

 531

Band Bücker, Imo, Lasch, Schneider). Formen haben per se eine Materialität, die in ihrer medial spezifischen Art und Weise für die Semantik einer Konstruktion konstitutiv ist, indem sie Möglichkeiten des Gebrauchs eröffnet. Festzuhalten ist, dass es keine semantischen Gehalte vor oder jenseits ihrer medialen Prozessierung gibt. Am konsequentesten formuliert diese Auffassung Ludwig Jäger: Semantik wird also prinzipiell als ein Effekt transkriptiver, d. h. intra- und intermedialer Bezugnahmen von sprachlichen und nichtsprachlichen Medien auf sich selbst oder auf andere Medien verstanden. (Jäger 2012, 309)

Damit ist klar, dass eine (grammatische) Konstruktion in einem bestimmten medialen Kontext nicht (mehr) dieselbe Konstruktion sein muss wie in einem anderen Kontext. Die Übertragung einer Konstruktion in einen neuen medialen Kontext birgt somit prinzipiell das Potential semantischer und funktionaler Modifizierungen. Die ursprüngliche Semantik einer Konstruktion ist das Resultat ihres bisherigen Gebrauchs in einander vergleichbaren Situationen und Kontexten, für welche die Konstruktion etabliert wurde. Die Verwendung in einem nicht mehr vergleichbaren Kontext ist ein innovativer Akt, der zwar auf Analogie beruht, jedoch bis zur Ratifizierung durch die Rezipienten einen prekären Status hat (vgl. Albert 2013, 38). Die Entwicklung einer solchen Konstruktion ist offen für Differenzierungen. Ein Beispiel für den unterschiedlichen Gebrauch eines Ausdrucks in mündlichen und schriftlichen Medien gibt Bücker (2013, 207): Auf die im Vergleich zur Mündlichkeit deutlicher ausgeprägte rhetorisch-stilistische Dimension, die jein in schriftlichen Texten hat, deuten u. a. die syntaktische Integration von jein in verfestigte Formeln und der Sonderfall graphematischer Ikonisierungsverfahren hin. Das zeigt, dass auch die schriftlichen Gebrauchsformen von jein als vollwertige Exponenten einer ,medienimmanente[n] Genese des sprachlichen Sinns‘ (Jäger 2011, 24 f.) rekonstruiert werden können, die sich nicht auf eine einfache Umsetzung mündlicher Gebrauchsformen und Strukturen mit den Mitteln der Schrift reduzieren lassen.

Das bereits erwähnte Beispiel von Hallo mit Frageintonation kann verdeutlichen, dass semantische und stilistische Unterschiede nicht nur zwischen gesprochener und geschriebener Sprache bestehen. Auch in räumlich nicht getrennter Face-to-FaceKommunikation kommt Hallo mit Frageintonation vor, bedeutet aber etwas völlig anderes als in einem Telefonat. In einem Face-to-Face-Gespräch wird Hallo? responsiv gebraucht und drückt Ungläubigkeit und Widerspruch aus (etwa: Hallo? Geht’s noch?). Obwohl es sich in beiden Fällen um gesprochene Sprache handelt, hat Hallo? unter den konkreten medialen Bedingungen verschiedene Funktionen. Mit Jäger (2002) können kommunikative Akte grundsätzlich als Transkriptionen aufgefasst werden. Demnach ist Semantik in einem weiten Sinne als Effekt der Konstitution von Skripten mittels intra- und intermedialer Verfahren aufzufassen. Bei einer Übertragung gesprochener Sprache in die Schriftlichkeit (sei es als phonetisches

532 

 Georg Albert

Transkript im herkömmlichen Sinne, sei es als Übernahme typisch mündlicher Ausdrucksweisen in schriftliche Kommunikation) handelt es sich um ein intermediales Verfahren, das mindestens ein zweites mediales Kommunikationssystem zur Kommentierung, Erläuterung, Explikation und Übersetzung (der Semantik) eines ersten Systems heranzieht. (Jäger 2002, 29; Herv. i. Orig.)

Der hier entscheidende Punkt ist die Feststellung, dass das Ergebnis der Transkription  – das Skript  – keinesfalls als Abbild des transkribierten Prätextes verstanden werden darf. Selbst wenn eine getreue Übersetzung angestrebt wird, schließt jede Transkription als ein Akt des Lesbarmachens „in einem bestimmten Sinne auch die Konstitution der erschlossenen Bedeutung“ (Jäger 2002, 29; Herv. i. Orig.) mit ein. Man kann also keine Bedeutungsidentität von Prätext und Skript voraussetzen, vielmehr ist nach der „Angemessenheit der Transkription“ (ebd., 33) zu fragen. Es ist daher festzuhalten, dass eine Konstruktion durch ihre Übertragung von einem medialen Kontext in einen anderen grundsätzlich semantische Modifikationen erfahren kann.

3 Das Beispiel [können + NP] 3.1 können in der geschriebenen Standardsprache Das Verb können gehört neben mindestens fünf weiteren Verben dem Paradigma der Modalverben an bzw. hat sich vom althochdeutschen Vollverb kunnan über einen mehrstufigen Grammatikalisierungsprozess zum neuhochdeutschen Modalverb entwickelt (vgl. Fritz 1997, 16; Diewald 1999, 34). Als voll grammatikalisiertes Modalverb regiert können den reinen Infinitiv und ermöglicht systematisch zwei unterschiedliche Lesarten (vgl. Zifonun u. a. 1997, 1253; Diewald 1999, 216). Die „Grundmodalität“ (Abraham 2008, 184) wird oft als deontische Lesart bezeichnet (Christian kann gut kochen), bei der „sozusagen ,objektiv‘ vorhandene Voraussetzungen oder Bedingungen für das Zutreffen der im Vollverb enthaltenen Aussage zum Ausdruck gebracht [werden]“ (Hentschel/Weydt 2013, 67; zur weiteren semantischen Differenzierung und Kritik am Terminus deontisch vgl. Zifonun u. a. 1997, 1882 ff.; Diewald 1999, 74; Abraham 2008, 184 f.). Die epistemische Verwendung (Die Verspätung kann am schlechten Wetter liegen) drückt eine Faktizitätsbewertung der Möglichkeit aus und ist nach Diewald (1999, 218) dominant, wenn das regierte Vollverb sein ist oder wenn das Vollverb im Perfekt steht. Strukturelle Muster wie die Kombination von können mit sein (für die epistemische Lesart) oder mit einem Handlungsverb (für die deontische Lesart) können als Kon­struktionen im Sinne der Konstruktionsgrammatik gelten (vgl. Diewald 2006, 91). Die deontische Verwendung kann abstrakt als Ausdruck einer Disposition oder Fähig-

Konstruktionen in unterschiedlichen medialen Kontexten 

 533

keit beschrieben werden. Zifonun u. a. (1997, 1888 f.) unterscheiden hier genauer eine trasubjektiv-circumstantielle und eine extrasubjektiv-circumstantielle Verwenin­ dung: Vor allem bei können kommt eine spezielle Spielart der circumstantiellen Verwendung zum Tragen: die intrasubjektiv-circumstantielle. Bei ihr werden als die speziellen Fakten, die den Sachverhaltsentwurf möglich erscheinen lassen, Fähigkeiten, Begabungen, also sozusagen Fakten von Körper und Geist, eines handlungsfähigen oder zumindest belebten Wesens (Denotat des Subjektausdrucks) herausgestellt. (Zifonun u. a. 1997, 1889)

Der extrasubjektiv-circumstantielle Gebrauch schreibt „unbelebten Gegenständen oder Substanzen inhärente Eigenschaften im Sinne von Dispositionen“ (Zifonun u. a. 1997, 1889) zu, wie in Eisen kann man schmieden. (vgl. Zifonun u. a. 1997, 1889)

Manche der deontischen Verwendungen von können sind normativ interpretierbar (vgl. Zifonun u. a. 1997, 1889). Ein Internetbeleg hierfür ist: Kann man wegen Krankheit gekündigt werden? (http://rechtsfragenblog.de/kann-man-wegenkrankheit-gekuendigt-werden, 05.09.2013)

Die Verwendung von können ohne ein Vollverb im Infinitiv („Absolutver­wendung“, vgl. Deppermann/Helmer 2013) findet sich in Standardgrammatiken nur mit bestimmten Restriktionen (z. B. Susanne kann (gut) Englisch, vgl. Weinrich 2003, 299; Zifonun u. a. 1997, 1255 f.). Voraussetzung für diesen Gebrauch ist ein (nominaler) Ausdruck, der „eine Bewegungsrichtung oder eine intellektuelle Fähigkeit eindeutig bezeichne[t]“ (Weinrich 2003, 299), ein „assoziiertes Vollverb“ sei „in der Regel […] kontextfrei spezifizierbar“ (Zifonun u. a. 1997, 1256).

3.2 Absolutverwendung von Modalverben in der Mündlichkeit Die Modalverben des heutigen Deutsch haben sich sämtlich aus Vollverben entwickelt, ohne dass dadurch die ältere Verwendungsweise als Vollverben zwangsläufig obsolet geworden wäre. Es lässt sich für alle heutigen Modalverben zeigen, dass aus dem ursprünglichen Vollverbgebrauch zunächst die deontische und erst später die epistemische Lesart entstanden ist (vgl. Diewald 1999). Im heutigen Deutsch kann man von einem „Zustand der Divergenz“ sprechen, d. h. vom „gleichzeitige[n] Vorhandensein unterschiedlich stark grammatikalisierter und unterschiedlich ,alter‘ Gebrauchsweisen“ (Diewald 1999, 33). Dabei gibt es für die unterschiedlichen Gebrauchsweisen jeweils prototypische, syntaktisch und semantisch spezifizierbare Kontexte (vgl. Diewald 1999, 39).

534 

 Georg Albert

Studien zum kindlichen Erstspracherwerb deuten darauf hin, dass Kinder beim Erwerb der Modalverben die Phasen der phylogenetischen Entwicklung nacheinander durchlaufen (vgl. Naumenko 2008, 116–119). Dabei verzichten sie allerdings nach dem Erwerb des modal-auxiliaren Gebrauchs keineswegs sofort auf die Verwendung als Vollverben. Die nicht als standardsprachlich kodifizierten Verwendungsweisen der modalen Verben werden entsprechend als typisch für die Kindersprache angesehen (vgl. Jensen 1987, 197; sein Beispiel lautet Darf ich noch einen Kuchen?) und als Ellipsen erklärt: Die phylo- und ontogenetisch spätere auxiliare Verwendung lauert „für den ,ellipsophilen‘ Grammatiker freilich schon immer im Hintergrund“ (Feilke u. a. 2001, 5; ausführlich dazu Albert 2013, 122 ff.). Jenseits der standardsprachlichen Kodizes gibt es allerdings durchaus Belege für den Vollverbgebrauch der modalen Verben bei erwachsenen Sprechern. Bauer (1961, 18) gibt das folgende Beispiel mit einer standardsprachlichen Paraphrase: und da ist es [das Wasser] so flach gewesen, daß man hat hineingekonnt (Standard: und da war es so flach, daß man hineingehen konnte).

Die Standardgrammatiken und vor allem die Beschreibungen des infinitivlosen Gebrauchs der modalen Verben als elliptisch gehen grundsätzlich von formeller, geschriebener Sprache aus und können als Beispiel für den „written language bias“ (vgl. Linell 2005) gelten. In der gesprochenen Sprache allerdings ist die „Absolutverwendung“ von können gut belegt und nicht auf Dialekte beschränkt. Deppermann/ Helmer (2013, 132 ff.) unterscheiden sieben verschiedene Typen dieser Gebrauchsweise, wobei einige davon (Auslassung eines verbum movendi, Komplementsatz bei mögen und wollen, idiomatische Konstruktionen) durchaus den Vorgaben der Standardgrammatiken entsprechen. Die typischen Gebrauchsweisen in der Mündlichkeit sind durch Online-Produktion und Interaktion erklärbar (vgl. Deppermann/Helmer 2013, 137). Deppermann/ Helmer (2013) diskutieren als Faktoren der vorgefundenen Variation neben der Medialität noch die Faktoren Gattung und Interaktion. An der Relevanz „von bestimmten Kontextbedingungen der Interaktion“ zeige sich, dass „[d]ie Erklärung ,Medialität‘ […] zu grob“ (Deppermann/Helmer 2013, 137) sei. Dieser Einschätzung kann insoweit zugestimmt werden, als ,Medialität‘ auf die einfache Unterscheidung zwischen phonischer und graphischer Realisierung (vgl. Koch/Osterreicher 1990, 5) reduziert wird. Es bliebe dann allerdings noch der Zusammenhang zwischen verschiedenen medialen Kontexten und den Spielräumen für Interaktion zu klären.

3.3 Diffusion der Konstruktion in der Schriftlichkeit Für das erste Jahrzehnt des 21. Jahrhunderts lässt sich der infinitivlose Gebrauch von können in informellen, schriftlichen Texten in Internet-Chats belegen, ab Ende des

Konstruktionen in unterschiedlichen medialen Kontexten 

 535

Jahrzehnts taucht diese Verwendung auch in Feuilletontexten auf (vgl. Albert 2013, 94). Inzwischen hat sich dieser Gebrauch von können mit einer direkt regierten Nominalphrase in bestimmten Kontexten etabliert. Dabei ist die Konstruktion [können + NP] ein Beispiel für den engen Zusammenhang von syntaktischem, lexikalischem und Textmuster-Wissen. Eine solche Konstruktion ist nämlich nicht in allen (medialen) Kontexten gleichermaßen wahrscheinlich und wird je nach Kontext unterschiedlich wahrgenommen und interpretiert. Die dialogisch strukturierten Texte der quasi-synchronen Chatkommunikation stellen zweifellos einen naheliegenden Ausgangspunkt für die schriftsprachliche Karriere von [können + NP] dar. Im Rahmen der dort gemeinsam etablierten (virtuellen) Situation sind geteilte Aufmerksamkeitsfoki möglich – und somit auch stärker kontextabhängige Äußerungen als in der prototypischen Schriftlichkeit. So finden sich folgende Belege für die Kombination von können mit einer direkt regierten Nominalphrase (vgl. Albert 2013, 94): (1) kannste mal eben klartext (30-40-50-Chat-Set, 2007) (2) im mom kann ich nur noch tiefkühlkost (30-40-50-Chat-Set, 2009)

Die Verwendung ist analog zum Gebrauch in der Mündlichkeit, es handelt sich um eine innovative Übertragung. Die Akteure genießen offensichtlich das normferne Schreiben und die Sprachspielerei, da Nonstandard-Konstruktionen im Chat kommunikativ besonders erfolgreich sind. Die Belege unterscheiden sich von dem Gebrauch, der als standardsprachlich gilt, dadurch, dass die Nominalphrasen (klartext, tiefkühlkost) keine Fähigkeit oder Disposition eines Agens ausdrücken und ein Vollverb nicht ohne Interpretation des äußerungsübergreifenden Kontexts ergänzt werden kann. Die Adressaten dieser Äußerungen müssen aus dem Kontext inferieren, welche Handlungen mit den jeweiligen Substantiven assoziiert sind, und können dann den komplexen Ausdruck als eine Bewertung der Fähigkeiten oder Dispositionen des Subjekts in Bezug auf eben diese assoziierten Handlungen verstehen. Wenn dies möglich ist, muss freilich auch gar kein Vollverb mehr ergänzt werden. Für diese Annahmen sprechen analoge Belege mit anderen modalen Verben wie (3) aber ohne haut, die darfst du nicht (30-40-50-Chat-Set, 2007),

wo es um das diätkonforme Verspeisen eines Grillhähnchens geht. Die Kombination von können mit einem nominalen Ausdruck, der nicht den standardsprachlichen Restriktionen entspricht, ist auch in einem Online-Diskussionsforum belegt: (4) [Er] kann keine Nähe (ElitePartner-Forum, 2010; vgl. Albert 2013, 96)

Die Forendiskussionen sind insgesamt weniger stark dialogisch strukturiert als der Chat und weichen weniger stark von den Normen der Standardschriftsprache ab. Die

536 

 Georg Albert

Absolutverwendung von können ist im Chat nicht nur häufiger, sie ist auch möglich mit Adjektiven: (5) [Sie] kann nur einheitlich (30-40-50-Chat-Set, 2007) (6) kannst du mal für [Name] langsam und so ???? (30-40-50-Chat-Set, 2007)

Die Kombination mit einem Adjektiv hat sich offensichtlich außerhalb der informellen Schriftlichkeit des Chats nicht durchgesetzt. Das Muster [können + NP] hingegen hat sich weiter verbreitet und kann als eine Konstruktion angesehen werden. Dieser Konstruktionsstatus soll im Folgenden begründet werden: Unter Konstruktionen sind Paare aus Form und Bedeutungs- bzw. Diskursfunktion zu verstehen, wobei die Bedeutung bzw. Funktion nicht kompositionell aus den Konstituenten der Konstruktion herleitbar ist (vgl. Goldberg 2006, 5; Ziem/Lasch 2013, 15; Schneider in diesem Band). Konstruktionen haben selbst Bedeutung und beeinflussen oder verändern die Bedeutung ihrer Konstituenten (vgl. Ziem/Lasch 2013, 21). Heuristisch kann man von den folgenden Bedingungen ausgehen: Nur wenn gezeigt werden kann, dass eine sprachliche Struktur einen eigenständigen nicht-kompositionalen Beitrag zur Interpretation eines Konstrukts leistet und dass dieser für alle durch sie lizenzierten Konstrukte gilt, ist sie wirklich eine Konstruktion. (Deppermann/Elstermann 2008, 104)

Beim prototypischen Gebrauch operiert das Modalverb auf einem infinitiv-regierten Verbalkomplex und transportiert den Valenzrahmen des Infinitivs weiter (vgl. Zifonun u. a. 1997, 1253). Im Fall von deontisch gebrauchtem können bezieht sich dies auf die Fähigkeit oder Disposition des Satzsubjekts, die im Verbalkomplex ausgedrückte Handlung auszuführen. Bei [können + NP] wird die Nominalphrase direkt von können und nicht von einem infiniten Vollverb regiert, eine Handlung wird nicht ausgedrückt. Man könnte von einer Verb-Insel-Konstruktion (vgl. Tomasello 2006, 24; Goldberg 2006, 56) sprechen, die dem Rezipienten die Anweisung gibt, die regierte Nominalphrase als Kennzeichnung einer im Kontext passenden Handlung aufzufassen und eine Fähigkeit oder Disposition des Subjekts diese Handlung betreffend zu fokussieren. In interaktions­orientierten Texten (vgl. Storrer 2013, 337) wie dem Chat funktioniert das dann unproblematisch, wenn ohnehin gerade entsprechende Handlungen besprochen werden. Das entspricht auch den Bedingungen für die Absolutverwendung der modalen Verben in der Mündlichkeit, wo Interaktionsorientierung die Regel ist. Diese setzt laut Deppermann/Helmer (2013, 132) den pragmatischen Kontext eines bestimmten Handlungszusammenhangs (Aktivitätstyp, oft ähnlich einer Gattung, aber meist weniger verbal geprägt) voraus und dort meist zusätzlich die sensorische Verfügbarkeit relevanter Objekte und ggfs. auch mit der Äußerung koordinierte leibliche Handlungen.

Konstruktionen in unterschiedlichen medialen Kontexten 

 537

Dass sich [können + NP] zur Konstruktion verfestigt hat, zeigt sich an Belegen aus nicht-interaktionsorientierten Texten, in denen ein Verstehen nur möglich ist, wenn die Nominalphrase gemäß der Konstruktionsbedeutung uminterpretiert wird: (7) Großbürgerin kann Prinzessin (Süddeutsche Zeitung, 09.03.2011) (8) BMW kann nicht nur Autos (ADAC Motorwelt, 05/2011)

Das Substantiv Prinzessin kann auf eine bestimmte Person referieren oder eine Rolle bezeichnen, nicht aber eine Handlung, Fähigkeit oder Disposition. Die Konstruktion [können + NP] erzwingt hier eine entsprechende Uminterpretation. Dieses Phänomen wird in der Konstruktionsgrammatik als „Coercion“ diskutiert, was wohl von Laura A. Michaelis (vgl. Michaelis 2004) zuerst ausführlich beschrieben wurde. Ihre Arbeit zeigt, dass nicht immer Lexeme aufgrund ihrer Bedeutung grammatische Wahlen nach sich ziehen, sondern umgekehrt auch die Konstruktionsbedeutung eine passende Lesart für einzelne Lexeme erzwingen kann (vgl. Diewald 2006, 86). Für diese Annahme spricht das Relevanzprinzip: Rezipienten machen Äußerungen für sich relevant, indem sie nach einer entsprechenden Interpretation suchen. Beispielsweise muss die Äußerung Er trägt Hund mit artikelloser Nominalphrase dergestalt interpretiert werden, dass Hund ein Kleidungsstück aus Hundefell bezeichnet (vgl. D’Avis/ Finkbeiner 2013, 221). Für die Beschreibung der Reinterpretation, die [können + NP] auslöst, bietet sich eine frame-semantische Analyse an. In der Kombination mit absolutem können eröffnet die NP nicht den Frame einer Entität, sondern einen Handlungsframe. Bei Englisch (sprechen) oder Schach (spielen) lässt sich diese Lesart ohne Weiteres herstellen, weshalb hier auch standardsprachlich eine Absolutver­wendung von können möglich ist (vgl. Weinrich 2003, 299). Prinzessin hingegen lässt sich in der ­Typologie von ­Konerding (1993, 175) der Kategorie „Person/Mensch/jmd./Wesen“ und nicht „Handlung/Handeln/Verfahren/Mitteilung“ zuordnen. Zum kontextfrei salienten Personen- bzw. Rollen-Frame von Prinzessin gehören sog. Slotfiller wie ,Reichtum‘, ,Würde‘, ,repräsentative Kleidung‘ etc. (vgl. zur Terminologie Ziem 2008; Busse 2012). Die Konstruktion [können + NP] erzwingt die Aktivierung eines Handlungsframes, der im Fall von Prinzessin etwa die Slotfiller ,repräsentieren‘ oder ,öffentlich sprechen‘ beinhalten könnte. Während in den kodifizierten Verwendungen von können ohne Infinitiv die Handlungs- oder Dispositionslesart des Substantivausdrucks also die Voraussetzung für die Akzeptabilität des gesamten Ausdrucks ist, ist in der neu etablierten Konstruktion [können + NP] die Handlungs- oder Dispositionslesart beim Substantiv die Folge der Verwendung in der Konstruktion. Diese Möglichkeit, dass ein Lexem je nach grammatischem Kontext unterschiedliche Frames aktiviert, wird auch in der Frame-Semantik gesehen (vgl. Busse 2012, 68). Für die Gesamtbedeutung eines Konstrukts – die ohnehin das Ergebnis einer situationsgebundenen Rezeptionsleistung ist – kann also weder nur die Konstruktion noch die jeweiligen Lexeme alleine verantwortlich sein

538 

 Georg Albert

(vgl. auch Welke (2009, 103) für das Zusammenspiel von Verbvalenz und Konstruktionsbedeutung). Nachdem sich [können + NP] als Konstruktion in informeller Schriftlichkeit eta­ bliert hat, breitet sich die Konstruktion weiter in formelleren Texten aus. Für das Jahr 2012 gibt es eine Reihe an Belegen aus überregionalen Feuilletons, in denen häufig ein ironisch distanzierter Gebrauch stilistisch auffälliger Formulierungen die Eloquenz der Autoren unter Beweis stellen soll – (7) ist bereits ein früher Beleg für diese Art der Verwendung. Die folgenden Belege zeigen, dass die erzwungene Fähigkeitsoder Dispositionslesart beim Substantiv ein festes Merkmal der Konstruktion ist: (9) Nicht jeder kann Elvis (Die Welt, 16.08.2012) (10) Boris Johnson […] kann auch Roman (Frankfurter Allgemeine Zeitung, 31.08.2012) (11) Kann Peer Steinbrück Kanzlerin? (Focus Online, 01.10.2012) (12) Wirtschaft kann nur die CDU (Die Welt, 09.10.2012) (13) Ich kann Krise, so die Botschaft (Die Welt, 05.12.2012) (14) Das Internet kann nicht nur „Shitstorm“, es kann auch Solidarität! (Bild-Zeitung, 27.03.2013)

Die Entwicklung folgt einem häufigen Muster: Auf die Verwendung in standardferneren Kontexten (z. B. Jugendsprache, Slang, Chat) folgt eine Ästhetisierung oder Ironisierung (vgl. Beleg (7), aber beispielsweise auch die Ästhetisierung ,ethnolektaler‘ Sprechweisen in TV-Comedys) und schließlich eine Routinisierung, die möglicherweise in einer Standardisierung endet (vgl. Albert 2013, 98). Neuland (2006, 230 f.) spricht hier von Stilbildung und Stilverbreitung. Die für die Schriftlichkeit innovative Konstruktion [können + NP] erlaubt es, für den Kontext relevante Handlungs- bzw. Dispositionsaspekte hervorzuheben (vgl. Albert 2013, 98). Hierfür müssen die Rezipienten den für die Nominalphrase am ehesten passenden semantischen Frame so lange modifizieren, bis er für die Konstruktion passt  – was dem „grundsätzlich dynamischen Charakter“ der Frames (Busse 2012, 624) durchaus entspricht: „Frame-Anpassung und Frame-Wandel sind im Grundprinzip der Frame-Aktivierung bereits immer schon angelegt“ (ebd.). Die Beispiele (9) bis (14) zeigen dabei besonders deutlich, wie eine syntaktische Konstruktion die konventionelle Bedeutung eines Lexems (El­vis, Roman, Krise) unterdrückt und eine Reinterpretation erzwingt. Besonders auffällig ist bei der etablierten Konstruktion [können + NP] die Artikellosigkeit des Substantivs. Der Gebrauch von Substantiven ohne ein Artikelwort kann wie in Auto fahren zur Folge haben, dass die referentielle Funktion des betreffenden Ausdrucks in den Hintergrund rückt und etwas anderes verstanden wird, hier die prototypische Tätigkeit des Autofahrens (vgl. D’Avis/Finkbeiner 2013, 222). Diese Verwendungsweise kann dazu führen, dass das Substantiv an syntaktischer Selbstständigkeit einbüßt, was im prototypischen Fall mindestens drei Konsequenzen hat: Das Substantiv ist nicht erweiterbar, es ist nicht anaphorisierbar und es muss mit nicht anstelle von kein negiert werden (vgl. D’Avis/Finkbeiner 2013, 222).

Konstruktionen in unterschiedlichen medialen Kontexten 

 539

In 30 zufällig entdeckten Belegen für das Muster [können + NP] aus publizistischen (schriftlichen) Texten der Jahre 2012 und 2013 enthält die NP tatsächlich nur in drei Fällen einen Artikel oder ein Artikelwort: (15) Christian Wulff kann sie nicht, die Rolle […] des Staatsmanns (Frankfurter Allgemeine Zeitung, 03.01.2012) (16) Solche Angebote kann nur der Osterhase (Werbeprospekt Metro, März 2013) (17) Natürlich kann sie auch jedes andere Thema (Zeit Online, 15.10.2013)

Das Negationsverhalten der NP innerhalb von [können + NP] entspricht ebenfalls den von D’Avis/Finkbeiner (2013) genannten Konsequenzen der semantischen Modifizierung, wie der folgende Beleg zeigt: (18) […] dass Markus Lanz Talk kann, aber keine Show (Die Welt, 10.06.2013)

Die Tendenz ist trotz der wenigen Belege eindeutig (vgl. etwa die Negierbarkeit von (10), (11) und (14)) und spricht für eine Verfestigung der Konstruktion. Entscheidend ist die durch die Konstruktion [können + NP] erzwungene Lesart­änderung beim Sub­stantiv. Eine vergleichbare Beobachtung machen D’Avis/Finkbeiner (2013, 224) anhand von Verwendungsweisen des Typs Podolski hat Vertrag: Insgesamt ist somit allen betrachteten lokalen Kontexten (bzw. Konstruktionen) gemeinsam, dass das Nomen dort eine Bedeutungsveränderung erfährt, die man – gegenüber einer alternativen Form mit (indefinitem) Artikel – als Abstraktion, Dereferentialisierung oder Stereotypisierung beschreiben kann.

Im Fall von [können + NP] könnte man von einer Frame-Anpassung (vgl. Busse 2012, 624) bei der NP sprechen. Eine Handlungslesart ist die Voraussetzung dafür, dass die Fähigkeit eines Agens thematisiert werden kann, die entsprechende Handlung auszuführen. Die Konstruktion ist aber nun keineswegs in allen medialen Kontexten gleichmäßig verbreitet und hat ebenso wie Podolski hat Vertrag einen unklaren Status hinsichtlich ihrer Akzeptabilität. Eine Werbekampagne der Elektromarktkette Saturn mit dem analog gebildeten Claim So muss Technik! wurde in der sprachkritischen Öffentlichkeit teilweise äußerst negativ bewertet (z. B. in Internet-Diskussionsforen und in der ARD-Sendung „ttt – Titel, Thesen, Temperamente“). Die Markiertheit der Absolutverwendung in der Schriftlichkeit belegt, dass die Übertragung aus der Mündlichkeit in schriftliche Medien mit semantischen und stilistischen Modifizierungen einhergeht. Zum Status von Podolski hat Vertrag schreiben D’Avis/Finkbeiner (2013, 224): Die intuitiv naheliegende Lösung ist, dass es sich – soweit man diese Konstruktion akzeptiert […] – um einen lexikalisierten Ausdruck handelt (vielleicht mit engen Verwendungsbeschränkungen), dessen Verwendung sich noch nicht bei allen Sprechern durchgesetzt hat.

540 

 Georg Albert

Hier wäre nun genauer zu fragen, in welchen Kontexten eine Konstruktion akzeptabel ist und woran das liegt. Geht man davon aus, dass Konstruktionen immer Teile von Sprachspielen sind, die sich durch eine Vielzahl medialer und soziopragmatischer Eigenschaften voneinander unterscheiden (vgl. Abschn. 1), ist es nur wahrscheinlich, dass Konstruktionen nicht in allen Sprachspielen gleichermaßen Verwendung finden (können) (vgl. Schneider 2008, 43). Betrachtet man z. B. die Verwendung von [können + NP] im Jahr 2013, stellt man fest, dass sich die Konstruktion offenbar für sehr spezifische Kontexte eignet und dort eine bestimmte Funktion hat. So ist es auffällig, dass [können + NP] pragmatisch besonders gut geeignet ist im Zusammenhang von öffentlichen Rollen und (politischen) Funktionen: (19) Wer kann Papst? (Handelsblatt, 11.03.2013) (20) Dass er [Brüderle] Wahlkampf kann, war nicht die Überraschung (Westfälische Nachrichten, 10.03.2013)

Die Verbreitung (Diffusion) der Konstruktion im politischen Journalismus wird offenbar durch ein pragmatisches Bedürfnis (vgl. Cherubim 1980, 139) begünstigt. Die Verwendungsweise in (19) und (20) ist weder durch einen ironisch-distanzierten Grundton (wie in (7) oder (11)) noch durch Informalität (wie die frühen Chat-Belege) charakterisierbar. In (20) wirkt die Konstruktion wenig auffällig, ein stilistischer Effekt kommt nur in (19) durch die Kürze der Form und den exponierten Status als Überschrift zustande. Die stilistische Funktion dürfte auch das Motiv bei den jüngeren Belegen sein. Besonders häufig begegnet die Konstruktion nämlich zuletzt im Bereich der Online-Publizistik: (21) Schweiger oder Möhring: Wer kann besser Tatort? (www.gmx.net, 29.04.2013) (22) Kann Lena Supertalent? (www.gmx.net, 25.07.2013) (23) Wer kann Bach? (www.zeit.de, 13.09.2013; gemeint ist hier die Fähigkeit, die Nachfolge von Thomas Bach als Präsident des Deutschen Olympischen Sportbunds anzutreten.) (24) Können die Deutschen Mode? (www.gmx.net, 13.11.2013)

Es handelt sich jeweils um Überschriften oder um Texte, die alleine mit einem Bild stehen und angeklickt werden müssen, um zum eigentlichen Artikel zu gelangen. Im Online-Journalismus bezeichnet man solche kurzen Texte oder Bilder als Teaser, die in erster Linie die Funktion haben, auf einen umfangreicheren Beitrag hinzuweisen und zum Anklicken zu animieren. Hierbei ist besonders interessant, dass die Konstruktion [können + NP] in der Überschrift des eigentlichen Artikels und auch im weiteren Text dann gar nicht mehr vorkommt. Das Vorkommen der Konstruktion korreliert hier also mit einem äußerst spezifischen medialen Kontext, in dem ihre formale Knappheit bei gleichzeitiger semantischer Fülle von hohem pragmatischen Nutzen ist. Hieran zeigt sich das Potential dieser Konstruktion zur Fokussierung von Aufmerksamkeit sowie auch die nach wie vor gegebene Markiertheit in der Schriftlichkeit  – wodurch sich dieser Gebrauch deutlich vom mündlichen Gebrauch der Konstruktion unterscheidet.

Konstruktionen in unterschiedlichen medialen Kontexten 

 541

3.4 Einschleifung und Variabilität Die überschaubare Karriere von [können + NP] erlaubt Schlussfolgerungen zur Rolle des Mediums und der kommunikativen Kontexte für die Entwicklung einer Konstruktion. Die schriftsprachliche Verwendung beginnt mit einer Übernahme von der gesprochenen in die geschriebene Sprache. Solche Rekontextualisierungen greifen auf Material zurück, das aus anderen Kontexten mit anderen Funktionen bekannt ist, und verleihen diesem einen neuen Wert in Kontexten, wo es zuvor keinen Wert hatte. Paradigmatisch für diese Art der Innovation stehen die als Readymades bekannten Werke von Marcel Duchamp, bei denen er Alltags- und Gebrauchsgegenstände wie einen Flaschentrockner oder ein Pissoir als Kunstwerke ausstellt (vgl. Groys 2004, 73 f.; Henn-Memmesheimer 2010, 161; Albert 2013, 132). Typische Ressourcen für solche innovativen Akte im Sprachgebrauch sind Nonstandard-Formen oder ,Fehler‘. Wird ein innovativer Akt von den Rezipienten akzeptiert und ein pragmatischer Nutzen wahrgenommen, beginnt die Diffusion der solchermaßen etablierten Innovation. Diffusion heißt zunächst einmal nur zunehmende Frequenz analog gebildeter Konstrukte, was die Verfestigung zur Konstruktion zur Folge hat. Diesen Vorgang kann man als Konstruktionalisierung bezeichnen, a process that leads to (1) the emergence of a new grammatical pattern (construction) out of previously independent material or (2) a reorganization of an existing construction, leading to an increasingly more opaque meaning of the pattern. (Fried 2013, 424)

Zuvor in der Schriftlichkeit nicht mögliche Kombinationen von können mit einer NP ohne weiteres Vollverb werden durch diesen Vorgang nach und nach akzeptabler und dringen zunehmend in formellere Kontexte vor. Konstruktionsgrammatische Ansätze sprechen in diesem Zusammenhang von der Einschleifung einer Konstruktion (auch „entrenchment“, vgl. Ziem/Lasch 2013, 103 u. 194). Hierunter wird teilweise nur eine hohe Frequenz (von Tokens) verstanden, in manchen Arbeiten wird darüber hinaus die Verankerung im Gedächtnis und die damit zusammenhängende Stabilisierung einer Konstruktion betont (vgl. Traugott 2008, 8). Das hieße, dass entsprechende Konstrukte für die Rezipienten immer opaker würden und die Konstruktion als solche weniger variabel. Doch offensichtlich führen zunehmende Frequenz und Einschleifung einer Konstruktion nicht automatisch zu einer Fixierung, wie auch das hier diskutierte Beispiel zeigt. Doch fast nirgends wird darauf eingegangen, wie damit umzugehen ist, wenn die gleiche formal bestimmbare Konstruktion in ihrer Funktion kontextabhängig variiert. Die kontextsensitive Adaption von Konstruktionen erklärt nicht nur funktionale Differenzen, sie ist auch verantwortlich für die oftmals erstaunlich große formale Vielfalt von Realisierungsformen einer Konstruktion. (Deppermann/Elstermann 2008, 107–108)

542 

 Georg Albert

Sprachliche Zeichen werden in immer wieder neuen Situationen verwendet, die niemals völlig identisch sind. Identität der Zeichen wäre unter diesem Gesichtspunkt sogar kommunikativ dysfunktional. So kann man über die semantischen Frames, die an bestimmte Formen gebunden sind, sagen, dass sie nicht nur „anpassungsfähig“, sondern „anpassungsbedürftig“ (Busse 2012, 625; Herv. i. Orig.) sind. Die von zunehmender Frequenz begleitete Entwicklung einer Konstruktion kann also durchaus mit kontextsensitiven Modifizierungen einhergehen. Erklären lassen sich die Modifizierungen mit den medialen und stilistischen Spezifika des Gebrauchs, wenn man Konstruktion in Übereinstimmung mit Imo (2011a, 253) – der sich seinerseits auf eine Arbeit Ronald Langackers bezieht – nicht als „stabile, abgrenzbare und klar definierbare Einheiten“ begreift. Konstruktionen sind demnach als flexible Schemata aufzufassen, die sich den aktuellen Bedürfnissen des Gebrauchs anpassen und dabei immer wieder graduelle Veränderungen erfahren. Die Wechselwirkungen zwischen abrufbarem Wissen aus vorgängigen Situationen und je aktueller, pragmatischer Anpassung bleiben auch nach der Etablierung einer Konstruktion stets konstitutiv für ihre Bedeutung bzw. Funktion. Entsprechend folgern Deppermann/Elstermann (2008, 130) aus ihrem Vergleich von verschiedenen Konstruktionen mit dem Verb verstehen: Wir sehen vielmehr, dass Konstruktionen ein flexibles Reservoir für die situiert sensitive Kon­ struktion von Turns darstellen, die die jeweiligen Kontingenzen berücksichtigen, und dabei konstruktionale Schemata nur als adaptierbare Orientierungsrahmen benutzen.

Die Variabilität einer Konstruktion hängt eng mit deren Auftreten in unterschiedlichen medialen Kontexten zusammen. Wie das Beispiel [können + NP] gezeigt hat, diffundiert eine neue Konstruktion nicht gleichmäßig in alle möglichen (hier: schriftsprachlichen) Kontexte, sondern wird in spezifischen Texten mit spezifischen Funktionen verwendet – auf die Einschleifung folgt eine funktionale Differenzierung: The task of mapping out the intricate web of motivations and partial shifts from which an observable change may gradually arise requires an approach in which the changing form can be studied in relation to its usage environment. This requirement is served well by the notion of construction, as it allows analysis from both the holistic and the ,inside-out‘ perspective. (Fried 2013, 436)

Das Wissen der Akteure über eine Konstruktion muss entsprechend über eine Erinnerung an einzelne Tokens aus vorgängigen Situationen hinausreichen. Zum Wissen über eine Konstruktion gehört darüber hinaus ein Textmusterwissen und die Erinnerung daran, in welchen Kontexten und mit welchen kommunikativen und stilistischen Funktionen eine Konstruktion realisiert worden ist (vgl. Bybee 2013, 52). Dieses Wissen ist die Basis für den abweichenden Gebrauch und für die Verbindung bestimmter Funktionen mit spezifischen medialen Kontexten (vgl. die Teaser im Online-Journalismus, Belege (21) bis (24)). Dabei werden vorgängige Gebrauchsmöglichkeiten

Konstruktionen in unterschiedlichen medialen Kontexten 

 543

keineswegs durch einen neueren Gebrauch obsolet. Denn ebenso wie Konstruktionen oftmals aus bereits vorhandenen Konstruktionen (weiter)entwickelt werden (vgl. Bybee 2013, 63), so entstehen auch semantische Frames in der Regel nicht als völlig neue Frames, sondern als Ergebnis von „Umbau“ und „Anpassung vorhandener Frames“ (Busse 2012, 626). Von einer Frame-Anpassung kann man im Fall der direkt regierten NPs in [können + NP] zweifellos sprechen, wobei diese Anpassung durch die Konstruktion erzwungen wird. Bei der Verarbeitung spielen sowohl die Konstruktionsbedeutung als auch die Bedeutungspotentiale der einzelnen Lexeme eine Rolle. Mit Blick auf verbzentrierte Konstruktionen schreibt dazu Welke (2009, 96): Sprecher konstruieren Sätze in Hinsicht auf bestimmte Verben und wählen Verben in Hinsicht auf bestimmte Konstruktionen. Hörer bauen mit jedem Wort des Satzes Erwartungen über die wahrscheinliche Konstruktion auf und schließen aus der Konstruktion auf mögliche Verben.

Die Erwartungen, die Rezipienten aufbauen, werden von dem medialen Kontext beeinflusst, in dem die Konstruktion erscheint. Dass dieses Kontextwissen zur Verfügung steht, ist die Bedingung für die Variabilität im Gebrauch von Konstruktionen (vgl. auch Deppermann/Elstermann 2008). Die Konsequenz aus diesen Beobachtungen ist, dass man sich das Verstehen von sprachlichen Konstrukten keinesfalls als einfaches Abrufen gespeicherter Bedeutungen vorstellen kann. Vielmehr findet ein komplexer Abgleichungsprozess der kognitiv vorhandenen Schemata (syntaktisches, lexikalisches, textmuster- und medienbezogenes Wissen) mit der aktuellen Rezeptionssituation statt. Wo Gehörtes oder Gelesenes nicht unmittelbar zu den vorhandenen Schemata passt, werden diese ohne Weiteres modifiziert – und die Modifizierungen können ihrerseits in der Folge das Schema graduell verändern. Eine solche Variabilität lässt sich mit einem Prototypen-Ansatz erklären, sofern man nicht von festen Klassen ausgeht: Eine Lösungsmöglichkeit bietet Prototypik in einem erweiterten, prozessualen Sinne. Hier ist der Prototyp nicht im statischen Sinne bestes Exemplar einer Klasse, sondern er ist in der wörtlichen Bedeutung von Prototyp Ausgangspunkt von Abwandlungen, die mit dem Prototyp nicht unter das gemeinsame Dach einer Invariante passen. (Welke 2009, 119)

Aus dieser Perspektive ist Wandel auch auf der Ebene von Konstruktionen nicht die Ausnahme, sondern der Normalfall.

4 Konstruktion und Medium Die bisherigen Überlegungen zeigen, dass bei der Beschreibung und Einordnung einer sprachlichen Konstruktion ihr Auftreten in unterschiedlichen medialen Kontexten berücksichtigt werden muss, da die Konstruktion je nach Kontext verschie-

544 

 Georg Albert

dene (kommunikative, stilistische) Funktionen haben kann. Die Notwendigkeit zur Berücksichtigung kontextueller Faktoren für die Variabilität von Konstruktionen ist von Östman/Trousdale (2013, 487) bereits formuliert worden. In ihrer Auflistung relevanter Variationsfaktoren wird Medialität allerdings nicht erwähnt; allenfalls der von ihnen verwendete Ausdruck „discourse pattern“, womit Textmuster und Kommunikationsformen gemeint sind, ließe sich in Richtung des hier vertretenen Medienbegriffs entwickeln. Abschließend werden – ausgehend vom Beispiel [können + NP] – drei verschiedene Möglichkeiten des Zusammenhangs von Konstruktion und Medium diskutiert. Dabei spielt auch die von Coseriu eingeführte Unterscheidung von Norm und System eine Rolle (vgl. Hennig 2002, 319 ff.).

4.1 Medienindifferente Konstruktionen Der einfachste Fall liegt dann vor, wenn der mediale Kontext auf das Auftreten und die konkrete Verwendung einer Konstruktion keinerlei Einfluss hat und die Konstruktion in allen Medien auf die gleiche Weise verwendet werden kann. Zweifellos „gibt es ein gemeinsames System, das die Regularitäten umfasst, die für beide Register [d. h. geschriebene und gesprochene Sprache] gelten“ (Hennig 2002, 318). Als Hypothese ließe sich formulieren, dass abstrakte, d. h. vor allem lexikalisch nicht-spezifizierte Konstruktionen mit höherer Wahrscheinlichkeit medienindifferent verwendet werden können als teil- oder vollspezifizierte Konstruktionen. So kann die Passivdiathese zwar unmarkiert in allen mündlichen und schriftlichen Medien vorkommen, das sogenannte bekommen-Passiv allerdings ist in formeller Schriftlichkeit stilistisch markiert (vgl. Duden 2009, 551). Andererseits ist die lexikalisch nicht-spezifizierte Apokoinu-Konstruktion ein Beispiel für eine ausschließlich in gesprochener Sprache regelmäßig vorkommende Konstruktion (vgl. 4.3). Letztlich ist es eine empirische und jeweils nur für begrenzte Untersuchungszeiträume zu beantwortende Frage, welche Konstruktionen einer Sprache zur Menge der medienindifferenten Konstruktionen gehören. Im Bereich der modalen Verben ist „[e]ine gängige, nicht medienspezifische Absolutverwendung von Modalverben […] diejenige als Matrixsatzverb. Dies geht nur mit mögen und wollen“ (Deppermann/Helmer 2013, 133). Die Konstruktion [können + NP] ist derzeit eindeutig als mediensensitiv einzuordnen (vgl. 4.2), allerdings ist nicht auszuschließen, dass sie sich über die unterschiedlichen medialen Kontexte hinweg ausbreitet und somit langfristig zu einer medienin­differenten Konstruktion wird. Eine solche „Standardisierung“ geht allerdings einher mit einem Verlust soziokultureller Konnotationen und stilistischer Gebrauchspräferenzen (vgl. Neuland 2006, 231), sodass es sich nach einem solchen Prozess streng genommen nicht mehr um dieselbe Konstruktion handeln würde wie zuvor.

Konstruktionen in unterschiedlichen medialen Kontexten 

 545

4.2 Mediensensitive Konstruktionen Die Entwicklung der Konstruktion [können + NP] zeigt, dass die innovative Übertragung eines syntaktischen Formats von einem medialen Kontext in einen anderen die Wahrnehmung der Konstruktion und deren Semantik verändert. Ausgehend von der Prämisse, dass sprachliche Strukturen grundsätzlich aus dem Gebrauch von Sprache in spezifischen Kontexten entstehen, sind solche Entwicklungen und Übertragungen durchaus als üblich anzunehmen: Constructions may also change in the way they are associated with a certain linguistic genre or variety. For instance, a construction that originates in informal speech may over time find its way into elevated written registers […]. Conversely, constructions may also undergo a process in which their range of genres narrows over time. (Hilpert 2013, 465)

Da sie entscheidend dafür sind, was man mit einer sprachlichen Form ,machen kann‘, sind die Kontexte des Vorkommens einer Konstruktion in deren Beschreibung einzubeziehen: In a discourse approach to constructions, context features like these are not outside of constructions, but part of the constructions. Together with the internal features, they specify resources for language users in an ordinary constructional fashion. When looked at in this manner, ,contextual features‘ that affect variability are not seen as being outside grammar, but as being part of grammar. (Östman/Trousdale 2013, 488)

Sprachliche Wahlen und Kontexte sind stets in wechselseitiger Abhängigkeit zu denken, da ein bestimmter Sprachgebrauch den jeweiligen Kontext konstituieren oder verändern kann (vgl. Androutsopoulos 2007, 80; Imo 2011b, 131). Für grammatische Konstruktionen heißt das, dass eine Eins-zu-eins-Zuordnung von Form und Funktion empirisch unhaltbar ist. Das gilt bei den untersuchten Konstruktionen selbst für die Fälle, in denen tatsächlich eine konstruktionsspezifische Interpretation ausgemacht werden kann, die aber eben nur unter bestimmten, nicht in der Konstruktion selbst liegenden Kontextbedingungen zweifelsfrei aktualisiert wird. (Deppermann/Elstermann 2008, 130)

Hennig (2002) argumentiert dafür, grundsätzlich Formen nicht unabhängig von ihren Funktionen zu beschreiben. Sie verweist auf bestimmte Ellipsen und Anakoluthformen, die für primäre Unterschiede zwischen geschriebener und gesprochener Sprache stehen, d. h. für Unterschiede auf der Ebene des Sprachsystems und nicht für bloße Normunterschiede. Dabei gilt analog zu den Absolutverwendungen von Modalverben: „Natürlich kann es auch hier [d. h. in der geschriebenen Sprache] Ellipsen und Anakoluthe geben. Diese haben hier aber andere Funktionen“ (Hennig 2002, 320; Herv. i. Orig.; kritisch dazu Eisenberg 2007, 285).

546 

 Georg Albert

Das Problem, das sich hieraus für die Grammatikschreibung ergibt, betrifft den Grad an Abstraktion, der jeweils zur Bestimmung einer Konstruktion als Element des Systems der geschriebenen bzw. der gesprochenen Sprache sinnvoll ist. Bedeutung und (pragmatische) Funktion sind konstitutiv für eine Konstruktion im Sinne eines Form-Bedeutungs- bzw. Form-Funktions-Paares (vgl. Goldberg 2006, 5), demnach dürfte eine Konstruktion nur bei identischer Funktion als dasselbe Element desselben Systems angesehen werden. Da sprachliche Ausdrücke jedoch sehr heterogene Funktionen haben können, besteht die Gefahr, eine Unzahl formgleicher oder form­ähnlicher Konstruktionen zu postulieren. Ohne ein Mindestmaß an Flexibilität von Konstruktionen wäre zudem kreativer und auf wechselnde Situationen reagierender Sprachgebrauch ebenso wie Sprachwandel undenkbar. Hennig (2002, 320) betont, dass ihre Unterscheidung der Ellipsen und Anakoluthe als je verschiedene Elemente der geschriebenen und der gesprochenen Sprache einen Prototypenansatz voraussetzt, also von prototypischer geschriebener und prototypischer gesprochener Sprache ausgeht. Würde man alle medial mündlichen bzw. schriftlichen Kommunikationsformen einbeziehen, dann gebe [sic] es in der Tat keine primären Unterschiede, d. h. keine Systemunterschiede. (Hennig 2002, 320)

Die hier vorgestellte Beschreibung medialer Kontexte soll zeigen, dass es Fälle gibt, bei denen eine genauere Unterscheidung als die der Dichotomie von prototypischer geschriebener und prototypischer gesprochener Sprache sinnvoll sein kann – ohne bei solchen Feinunterscheidungen die Medialität zu marginalisieren und nur noch die Ebene der Konzeption im Sinne von Koch/Oesterreicher (1990) zu betrachten. Mediensensitive Konstruktionen zu beschreiben ist dann vergleichbar mit dem Gebrauch des Zooms einer Kamera. Die Funktionen von [können + NP] als Element eines Teasers im Online-Journalismus (hohe Informationsdichte, Aufmerksamkeitslenkung, erzwungener Framewechsel für die NP) sind die Funktionen eines sehr spezifischen Gebrauchs. Mit anderen Worten: Man muss hier nahe heranzoomen, was zugleich einen geringen Grad an Abstraktion bedeutet. Für sprachsystematische Beschreibungen wird man stärker abstrahieren müssen, so dass es in solchen Fällen sinnvoll ist, einen Prototypenansatz im Sinne Hennigs (2002) zu verfolgen. Die Frage, welche gebrauchsspezifischen Funktionen sprachlicher Konstruktionen (noch) in deren Beschreibung einfließen sollten, lässt sich nicht prinzipiell beantworten, sondern muss im Einzelfall betrachtet werden. In Grammatikwerken schlägt sich dies beispielsweise in Ausdrücken wie Telegrammstil nieder.

Konstruktionen in unterschiedlichen medialen Kontexten 

 547

4.3 Medienspezifische Konstruktionen Die grundlegenden Unterschiede zwischen mündlicher und schriftlicher Zeichenprozessierung (zeitliche Abfolge von Zeichen vs. räumliche Anordnung, akustische vs. visuelle Wahrnehmbarkeit; vgl. auch Schneider 2011, 169) haben zur Folge, dass manche sprachliche Konstruktionen nur in dem einen oder dem anderen Medium vorkommen. In dialogisch-mündlicher Kommunikation gibt es hierfür Beispiele wie Gliederungs- und Turntaking-Signale, bestimmte Diskursmarker (vgl. Hennig 2002, 320 u. 323) oder Apokoinu-Konstruktionen (vgl. Schneider 2011, 175). Umgekehrt ist das System der Interpunktion spezifisch für die Schriftlichkeit, wobei Interpunktionszeichen aber keine Konstruktionen sind. Hennig (2002, 320) spricht in diesen Fällen von primären Unterschieden, die vorliegen, wenn eine Funktion in geschriebener und gesprochener Sprache auf unterschiedliche Weise ausgedrückt wird oder wenn es sich um eine Funktion handelt, die im anderen Medium auf Grund der anderen Kommunikationsbedingungen gar nicht existiert  – diese Unterschiede liegen auf der Ebene des Systems und sind primär.

Im Bereich der elektronisch-schriftlichen Kommunikation haben sich Zeichen entwickelt, die nur in wenigen anderen schriftlichen Medien (z. B. Postkarten) vorkommen, z. B. die Emoticons, Formen der Adressierung mithilfe des @-Zeichens oder die Hashtags der Twitter-Nachrichten. Auch die Konstruktion [können + NP] kann mit ihren spezifischen semantischen, pragmatischen und stilistischen Funktionen als eine typisch schriftsprachliche Konstruktion gelten. Manche Formen wie Apokoinus können in geschriebener Sprache vorkommen, haben dort aber keinen Konstruktionsstatus: „Konstruktionen, die im Geschriebenen in syntaktischer Sicht als ,falsch‘ gelten, können im Gesprochenen durchaus ,richtig‘ sein“ (Dürscheid 2012, 105). Um hier Fälle wie fingierte Mündlichkeit oder die Anführung von Beispielen auszuschließen, muss man wiederum von jeweils prototypischen Fällen ausgehen. Welche Konstruktionen tatsächlich ausschließlich in einem bestimmten Medium vorkommen, bleibt eine empirische Frage. Abschließend zeigt sich, dass die Unterscheidung von Norm und System zwar eng mit der hier vorgenommenen Einteilung in medienindifferente, mediensensitive und medienspezifische Konstruktionen zusammenhängt, aber doch quer zu ihr liegt. Abhängig vom Abstraktionsgrad der Beschreibung kann man auf Konstruktionen stoßen, die in dieser Funktion nur in einem spezifischen medialen Kontext auftreten (vgl. Telefonieren, Online-Journalismus, Überschriften etc.). Dennoch würde wahrscheinlich niemand auf die Idee kommen, dass das Telefonieren ein eigenes grammatisches System hat. So lange sich die Spezifik einer Konstruktion nicht unmittelbar aus den grundlegenden Eigenschaften prototypischer geschriebener bzw. prototypischer gesprochener Sprache ergibt, sondern aus spezielleren medialen Eigenschaften, sollte man von Normen spezifischer medialer Kontexte bzw. von Textmusterkon-

548 

 Georg Albert

ventionen oder -traditionen ausgehen. Während es also sinnvoll erscheint, auf der Ebene des Systems von nur zwei Systemen (geschrieben und gesprochen) mit einer großen Schnittmenge auszugehen (vgl. Schneider 2011, 183), sind auf der Ebene der Normen wesentlich differenziertere Beschreibungen nötig, als durch die Dichotomie ,mündlich/schriftlich‘ erfasst werden.

5 Literatur Abraham, Werner (2008): Wie ist die historisch spezifische Ausgliederung der Modalitäten bei den deutschen Modalverben denkbar? In: Linguistische Berichte 214, 183–210. Ágel, Vilmos/Mathilde Hennig (2006): Theorie des Nähe- und Distanzsprechens. In: dies. (Hg.): Grammatik aus Nähe und Distanz. Theorie und Praxis am Beispiel von Nähetexten 1650–2000. Tübingen, 3–31. Albert, Georg (2013): Innovative Schriftlichkeit in digitalen Texten. Syntaktische Variation und stilistische Differenzierung. Berlin. Androutsopoulos, Jannis K. (2007): Neue Medien – neue Schriftlichkeit? In: Werner Holly/Paul Ingwer (Hg.): Medialität und Sprache. Mitteilungen des Deutschen Germanistenverbandes 54 (1), 72–97. Auer, Peter (2000): On line-Syntax – oder: Was es bedeuten könnte, die Zeitlichkeit der mündlichen Sprache ernst zu nehmen. In: Sprache und Literatur 85, 43–56. D’Avis, Franz/Rita Finkbeiner (2013): „Podolski hat Vertrag bis 2007, egal, ob wir in der Ersten oder Zweiten Liga spielen.“ Zur Frage der Akzeptabilität einer neuen Konstruktion mit artikellosem Nomen. In: Zeitschrift für Germanistische Linguistik 41 (2), 212–239. Bauer, Erika (1961): Neckarsteinach und Darsberg Kreis Bergstraße. (Lautbibliothek der deutschen Mundarten 23/24). Göttingen. Beißwenger, Michael (2010): Chattern unter die Finger geschaut: Formulieren und Revidieren bei der schriftlichen Verbalisierung in synchroner internetbasierter Kommunikation. In: Vilmos Ágel/ Mathilde Hennig (Hg.): Nähe und Distanz im Kontext variationslinguistischer Forschung. Berlin/ New York, 247–294. Bücker, Jörg (2013): Jein: Formen und Funktionen einer Dialogpartikel in Mündlichkeit und Schriftlichkeit. In: Zeitschrift für Germanistische Linguistik 41 (2), 189–211. Busse, Dietrich (2012): Frame-Semantik. Ein Kompendium. Berlin/Boston. Bybee, Joan L. (2013): Usage-based theory and exemplar representations of constructions. In: Thomas Hoffmann/Graeme Trousdale (Hg.): The Oxford Handbook of Construction Grammar. Oxford, 49–69. Cherubim, Dieter (1980): Abweichung und Sprachwandel. In: ders. (Hg.): Fehlerlinguistik. Beiträge zum Problem der sprachlichen Abweichung. Tübingen, 124–152. Deppermann, Arnulf/Mechthild Elstermann (2008): Lexikalische Bedeutung oder Konstruktionsbedeutungen? Eine Untersuchung am Beispiel von Konstruktionen mit verstehen. In: Anatol Stefanowitsch/Kerstin Fischer (Hg.): Konstruktionsgrammatik II. Von der Konstruktion zur Grammatik. Tübingen, 103–133. Deppermann, Arnulf/Henrike Helmer (2013): Standard des gesprochenen Deutsch: Begriff, methodische Zugänge und Phänomene aus interaktionslinguistischer Sicht. In: Jörg Hagemann u. a. (Hg.): Pragmatischer Standard. Tübingen, 111–142.

Konstruktionen in unterschiedlichen medialen Kontexten 

 549

Diekmannshenke, Hajo (2011): Zwischen Ansicht und Adresse: Tradition und Variation in der Postkartenkommunikation. In: Martin Luginbühl/Daniel Perrin (Hg.): Muster und Variation. Medienlinguistische Perspektiven auf Textproduktion und Text. Bern u. a., 19–50. Diewald, Gabriele (1999): Die Modalverben im Deutschen. Grammatikalisierung und Polyfunktionalität. Tübingen. Diewald, Gabriele (2006): Konstruktionen in der diachronen Sprachwissenschaft. In: Kerstin Fischer/Anatol Stefanowitsch (Hg.): Konstruktionsgrammatik. Von der Anwendung zur Theorie. Tübingen, 79–103. Duden (2009): Die Grammatik. 8. Auflage. Der große Duden. Band 4. Mannheim u. a. Dürscheid, Christa (2005): Medien, Kommunikationsformen, kommunikative Gattungen. In: Linguistik online 22 (1), 3–16. Dürscheid, Christa (2012): Reich der Regeln, Reich der Freiheit. System, Norm und Normenreflexion in der Schule. In: Susanne Günthner u. a. (Hg.): Kommunikation und Öffentlichkeit. Sprachwissenschaftliche Potenziale zwischen Empirie und Norm. Berlin/Boston, 105–120. Eisenberg, Peter (2007): Sollen Grammatiken die gesprochene Sprache beschreiben? Sprachmodalität und Sprachstandard. In: Vilmos Ágel/Mathilde Hennig (Hg.): Zugänge zur Grammatik der gesprochenen Sprache. Tübingen, 275–295. Feilke, Helmuth u. a. (2001): Grammatikalisierung, Spracherwerb und Schriftlichkeit – Zur Einführung ins Thema. In: dies. (Hg.): Grammatikalisierung, Spracherwerb und Schriftlichkeit. Tübingen, 1–28. Fricke, Ellen (2012): Grammatik multimodal. Wie Wörter und Gesten zusammenwirken. Berlin/ Boston. Fried, Mirjam (2013): Principles of constructional change. In: Thomas Hoffmann/Graeme Trousdale (Hg.): The Oxford Handbook of Construction Grammar. Oxford, 419–437. Fritz, Gerd (1997): Historische Semantik der Modalverben. Problemskizze – exemplarische Analysen – Forschungsüberblick. In: Gerd Fritz/Thomas Gloning (Hg.): Untersuchungen zur semantischen Entwicklungsgeschichte der Modalverben im Deutschen. Tübingen, 1–157. Goldberg, Adele E. (2006): Constructions at Work. The Nature of Generalization in Language. Oxford. Groys, Boris (2004): Über das Neue. Versuch einer Kulturökonomie. 3. Auflage. Frankfurt a. M. Habscheid, Stephan (2000): ,Medium‘ in der Pragmatik. Eine kritische Bestandsaufnahme. In: Deutsche Sprache 28 (2), 126–143. Henn-Memmesheimer, Beate (2010): Sprachliche Innovationen als Ready-made. Zur Soziologie und Semantik sprachlicher Varianten. In: Peter Gilles/Joachim Scharloth/Evelyn Ziegler (Hg.): Variatio delectat. Empirische Evidenzen und theoretische Passungen sprachlicher Variation. Frankfurt a. M., 161–195. Hennig, Mathilde (2002): Wie kommt die gesprochene Sprache in die Grammatik? In: Deutsche Sprache 30 (4), 307–327. Hentschel, Elke/Harald Weydt (2013): Handbuch der deutschen Grammatik. 4., vollständig überarbeitete Auflage. Berlin/Boston. Hilpert, Martin (2013): Corpus-based approaches to constructional change. In: Thomas Hoffmann/ Graeme Trousdale (Hg.): The Oxford Handbook of Construction Grammar. Oxford, 458–475. Imo, Wolfgang (2011a): Ad-hoc-Produktion oder Konstruktion? Verfestigungstendenzen bei Inkrement-Strukturen im gesprochenen Deutsch. In: Alexander Lasch/Alexander Ziem (Hg.): Konstruktionsgrammatik III. Aktuelle Fragen und Lösungsansätze. Tübingen, 239–254. Imo, Wolfgang (2011b): „Hi! danke fürs äddn.“ Die Herausbildung einer neuen Floskel im Rahmen der social network website MySpace. In: Martin Luginbühl/Daniel Perrin (Hg.): Muster und Variation. Medienlinguistische Perspektiven auf Textproduktion und Text. Bern u. a., 125–155. Jäger, Ludwig (2002): Transkriptivität. Zur medialen Logik der kulturellen Semantik. In: Ludwig Jäger/Georg Stanitzek (Hg.): Transkribieren. Medien/Lektüre. München, 19–41.

550 

 Georg Albert

Jäger, Ludwig (2011): Transkription – Überlegungen zu einem interdisziplinären Forschungskonzept. In: Rolf Kailuweit/Stefan Pfänder/Dirk Vetter (Hg.): Migration und Transkription – Frankreich, Europa, Lateinamerika. Berlin, 15–35. Jensen, Helle Østkjær (1987): Eine kontrastive Analyse der dänischen Modalverben BEHØVE und MÅTTE und ihrer deutschen Äquivalente BRAUCHEN, DÜRFEN, MÖGEN und MÜSSEN. Odense. Koch, Peter/Wulf Oesterreicher (1990): Gesprochene Sprache in der Romania: Französisch, Italienisch, Spanisch. Tübingen. Konerding, Klaus-Peter (1993): Frames und lexikalisches Bedeutungswissen. Tübingen. Linell, Per (2005): The Written Language Bias in Linguistics. Its Nature, Origins and Transformations. New York. Michaelis, Laura A. (2004): Type shifting in construction grammar: An integrated approach to aspectual coercion. In: Cognitive Linguistics 15 (1), 1–67. Naumenko, Elena (2008): Grammatikalisierung im kindlichen Erstspracherwerb. Mannheim (Dissertation). http://madoc.bib.uni-mannheim.de/madoc/volltexte/2010/2965/[28.01.2014]. Neuland, Eva (2006): Jugendsprachen – Was man über sie und was man an ihnen lernen kann. In: dies. (Hg.): Variation im heutigen Deutsch: Perspektiven für den Sprachunterricht. Frankfurt a. M., 223–241. Östman, Jan-Ola/Graeme Trousdale (2013): Dialects, discourse, and construction grammar. In: Thomas Hoffmann/Graeme Trousdale (Hg.): The Oxford Handbook of Construction Grammar. Oxford, 476–490. Schneider, Jan Georg (2008): Spielräume der Medialität. Linguistische Gegenstandskonstitution aus medientheoretischer und pragmatischer Perspektive. Berlin/New York. Schneider, Jan Georg (2011): Hat die gesprochene Sprache eine eigene Grammatik? Grundsätzliche Überlegungen zum Status gesprochensprachlicher Konstruktionen und zur Kategorie ‚gesprochenes Standarddeutsch‘. In: Zeitschrift für germanistische Linguistik 39, 165–187. Spitzmüller, Jürgen (2013): Graphische Variation als soziale Praxis. Eine soziolinguistische Theorie skripturaler ,Sichtbarkeit‘. Berlin/Boston. Stöckl, Hartmut (2004): Die Sprache im Bild – Das Bild in der Sprache. Zur Verknüpfung von Sprache und Bild im massenmedialen Text. Konzepte – Theorien – Analysemethoden. Berlin/New York. Storrer, Angelika (2013): Sprachstil und Sprachvariation in sozialen Netzwerken. In: Barbara Frank-Job u. a. (Hg.): Die Dynamik sozialer und sprachlicher Netzwerke. Konzepte, Methoden und empirische Untersuchungen an Beispielen des WWW. Wiesbaden, 331–366. Tomasello, Michael (2006): Konstruktionsgrammatik und früher Erstspracherwerb. Übersetzt von Stefanie Wulff und Arne Zeschel. In: Kerstin Fischer/Anatol Stefanowitsch (Hg.): Konstruktionsgrammatik. Von der Anwendung zur Theorie. Tübingen, 19–37. Traugott, Elizabeth Closs (2008): Grammatikalisierung, emergente Konstruktionen und der Begriff der „Neuheit“. Übersetzt von Arne Zeschel. In: Anatol Stefanowitsch/Kerstin Fischer (Hg.): Konstruktionsgrammatik II. Von der Konstruktion zur Grammatik. Tübingen, 5–32. Weidacher, Georg (2011): Entschuldigungsmails: Konventionalisierung und Variation in der Umsetzung eines Textmusters. In: Martin Luginbühl/Daniel Perrin (Hg.): Muster und Variation. Medienlingustische Perspektiven auf Textproduktion und Text. Bern u. a., 51–80. Weinrich, Harald (2003): Textgrammatik der deutschen Sprache. 2., revidierte Auflage. Hildesheim u. a. Welke, Klaus (2009): Valenztheorie und Konstruktionsgrammatik. In: Zeitschrift für Germanistische Linguistik 37, 81–124. Ziem, Alexander (2008): Frames und sprachliches Wissen. Kognitive Aspekte der semantischen Kompetenz. Berlin/New York. Ziem, Alexander/Alexander Lasch (2013): Konstruktionsgrammatik. Konzepte und Grundlagen gebrauchsbasierter Ansätze. Berlin/Boston. Zifonun, Gisela u. a. (1997): Grammatik der deutschen Sprache. 3 Bände. Berlin/New York.

Wolfgang Imo

24. Was ist (k)eine Konstruktion? Abstract: In dem vorliegenden Beitrag geht es um die Diskussion unterschiedlicher Definitionen von Konstruktionen sowie um die Frage der Abgrenzung der Konstruktionsgrammatik zu alternativen Ansätzen wie der Valenzgrammatik oder zu interaktionslinguistischen Konzepten. Im ersten Abschnitt werden die Ursprünge des Konstruktionskonzepts erläutert und zwei besonders weit verbreitete Definitionen vorgestellt. Im zweiten Abschnitt werden exemplarisch sechs konstruktionsgrammatische Analysen zu unterschiedlichen Phänomenen des Deutschen vorgestellt, um daran die Frage zu beantworten, was eine Konstruktion ist. Im dritten Abschnitt schließlich geht es darum, kritisch zu hinterfragen, wo die Grenzen konstruktionsgrammatischer Ansätze liegen, und darzulegen, in welchen Bereichen noch Forschungsbedarf besteht, um eine Entscheidung zu treffen, ob in einem konkreten Einzelfall von einer Konstruktion zu sprechen ist oder nicht. 1 Was ist eine Konstruktion? – Die Anfänge 2 Was sind Konstruktionen des Deutschen? – Eine exemplarische Zusammenstellung 3 Was ist keine Konstruktion? – Kritik an einer alles umfassenden Konstruktionsgrammatik 4 Was ist (k)eine Konstruktion? – Ein Ausblick 5 Literatur

1 Was ist eine Konstruktion? – Die Anfänge Die Anfänge der Konstruktionsgrammatik (Fillmore/Kay/O’Connor 1988; Fillmore 1988; Lakoff 1987) lassen sich auf das Bestreben zurückführen, nicht nur den traditionellen ‚Kernbereich‘ der Grammatik beschreiben zu können, sondern auch solche Strukturen, die im Bereich zwischen produktiven syntaktischen Mustern und idiomatischen Ausdrücken liegen. Nach Fillmore/Kay/O’Connor (1988, 502) besteht die traditionelle und vor allem auch die generative Sicht auf Sprache darin, dass es zum einen eine Menge an Grundeinheiten gibt  – die Wörter  –, die dann mit Hilfe von abstrakten Regeln zu größeren Einheiten  – Phrasen, Sätze  – zusammengefügt werden können. Hinzu kommen noch semantische Interpretationsprinzipien, die für den inhaltlichen kompositionellen Aufbau der Äußerungen sorgen. Pragmatisches Wissen wird nicht als Teil des Grammatikwissens im engeren Sinne angesehen. Das Entscheidende bei den Anfängen der Konstruktionsgrammatik ist, dass diese Sichtweise auf Sprache nicht absolut abgelehnt wird. Ganz im Gegenteil wird sie durchaus als nützlich angesehen. Problematisiert wird jedoch, dass damit nicht alle grammatischen Phänomene einer Sprache erfasst werden können: „As useful and powerful as

552 

 Wolfgang Imo

the atomistic schema is for the description of linguistic competence, it doesn’t allow the grammarian to account for absolutely everything in its terms“ (Fillmore/Kay/ O’Connor 1988, 502). Der vorgeschlagene neue Ansatz, Konstruktionen als „proper units of grammar“ (Fillmore/Kay/O’Connor 1988, 501) einzuführen, zielt daher auch lediglich auf eine Erweiterung des Inventars von Grammatiktheorien um eine neue Komponente ab. Erst in der Folge – besonders intensiv zum Beispiel bei Croft (2001, 17) – wird dafür plädiert, ganz und ausschließlich auf Konstruktionen umzustellen und so auch ab­strakte syntaktische Muster wie Passiv auf der einen Seite und einzelne Wörter auf der anderen Seite explizit als Konstruktionen zu rekonstruieren. Der Vorteil dieser Sichtweise besteht darin, einen einheitlichen Beschreibungsrahmen für alle sprachlichen Phänomene vom Morphem über Wörter, Phrasen, Sätze bis hin zu Texten oder Gesprächen zu erhalten. Unklar ist allerdings noch, ob diese extreme Ausweitung des Konstruktionsbegriffs tatsächlich sinnvoll ist. Bei Fillmore/Kay/O’Connor (1988) steht diese extreme Ausweitung und der Ausbau der Konstruktionsgrammatik zu einer umfassenden und einzigen Grammatiktheorie jedoch nicht im Mittelpunkt. Stattdessen fokussieren die AutorInnen auf ein Muster, das sie als typisches Phänomen werten, das von traditionellen Syntaxanalysen ignoriert oder als nebensächliches Randphänomen abgetan wird, in Wirklichkeit jedoch stellvertretend für einen unterschätzten, großen und produktiven Anteil am grammatischen Inventar einer Sprache steht. Dieses Muster betrifft Äußerungen mit let alone (geschweige denn). Anhand der detaillierten Analyse dieser Konstruktion zeigen sie, dass das, was gerne einem „‚Appendix to the Grammar‘“ zugeschrieben wird, der als „repository of what is idiomatic in language“ dient, in Wirklichkeit zum Kernbereich der Grammatik gehört: One of our purposes is to suggest that this repository is very large. A second is to show that it must include descriptions of important and systematic bodies of phenomena which interact in important ways with the rest of the grammar, phenomena whose understanding will lead us to significant insights into the workings of language in general. A third is to make the case for a model of linguistic competence in which phenomena of the sort we have in mind are not out of place. (Fillmore/Kay/O’Connor 1988, 504)

Nach einer kurzen Diskussion der typischen Merkmale idiomatischer Ausdrücke stellen die Autoren ihr Ziel dar, die let alone-Konstruktion als ein „formal idiom“ zu beschreiben, das in einer Reihe steht mit Äußerungen wie „There goes Charlie again, ranting and raving about his cooking.“, „He’s not half the doctor you are.“, „Him be a doctor?“, „No writing on the walls!“, „It satisfied my every wish.“ u. v. m. (Fillmore/Kay/O’Connor 1988, 510–511). All diese Ausdrücke sind einerseits idiomatisch, da die Äußerungsbedeutung nicht komponentiell erschlossen werden kann und zum Teil auch syntaktisch unvorhersagbare und ungewöhnliche Kombinationen auftauchen, wie dies zum Beispiel bei dem Ausruf „Him be a doctor?“ der Fall ist. (Da die Unterscheidung von kompositionellen und nicht-kompositionellen Ausdrücken in der Geschichte der Konstruktionsgrammatik bis heute einen wichtigen Stellenwert

Was ist (k)eine Konstruktion? 

 553

hat, werde ich in dem Beitrag auch (allerdings kritisch) darauf eingehen. Es stellt sich allerdings gerade aus der Perspektive von gebrauchsbasierten Ansätzen die Frage, ob es überhaupt kompositionelle sprachliche Ausdrücke gibt und nicht doch immer zumindest pragmatische Aspekte, die nicht vorhergesagt werden können, eine Rolle spielen.). Andererseits kann man diese Muster nicht einfach als lexikalisch spezifizierte idiomatische Ausdrücke bezeichnen, da nur Teile davon lexikalisch spezifiziert sind, der Großteil aber aus frei besetzbaren Leerstellen besteht. Insofern handelt es sich um grammatische Muster. Anhand der let alone-Konstruktion, die Äußerungen wie die folgenden umfasst, (1) (2)

A: B: A: B:

Did the kids get their breakfast on time this morning? I barely got up in time to eat lunch, let alone cook breakfast. I know that Louise is a picky eater, but I bought the kids some squid for dinner. I doubt that you could get fred to eat shrimp, let alone louise squid.

führen Fillmore/Kay/O’Connor (1988, 512–534) eine umfassende konstruktionsgrammatische Analyse durch und zeigen, dass semantische sowie pragmatische Aspekte untrennbar mit formalen Aspekten verbunden werden müssen, damit let alone-Äußerungen grammatisch analysierbar werden. Zunächst werden die syntaktischen Eigenschaften behandelt. Dabei stellt sich heraus, dass let alone allgemein den koordinierenden Konjunktionen zugeordnet werden kann, aber sich dennoch in einigen Punkten von typischen Konjunktionen wie and oder or unterscheidet, beispielsweise in Bezug auf die fehlende Topikalisierungsfähigkeit der mit let alone verbundenen Konjunkte (der zweite Konjunktteil kann nicht an den Satzanfang verschoben werden). In Bezug auf die gesamte syntaktische Struktur ordnen Fillmore/Kay/O’Connor (1988, 516) die Konstruktion den „paired focus constructions“ zu, mit denen zwei Elemente in das Zentrum der Aufmerksamkeit gestellt werden können und die ein Netzwerk bilden, zu dem auch die let alone-Konstruktion gehört (z. B. He doesn’t get up for lunch, much less breakfast; She didn’t eat a bite, never mind a whole meal; She didn’t eat a meal, just a snack und She beat Smith at chess, not to mention Jones). Darüber hinaus ist die let aloneKonstruktion zusammen mit der not … but-Konstruktion die einzige, die multiple und komplexe Paarungen des Typs „You couldn’t get a poor man, let alone a rich man, to wash, let alone wax, a car, let alone a truck, for $2, let alone $1, in bad times, let alone in prosperous times“ (Fillmore/Kay/O’Connor 1988, 520) zulässt. Solche Sätze zeigen allerdings, dass die Autoren trotz ihres Anspruchs, mit attestierten Sätzen zu arbeiten (Fillmore/Kay/O’Connor 1988, 519), häufig auf mehr oder weniger dubiose und skurrile Beispiele zurückgreifen, um ihre Argumentation zu stützen. Nachdem Fillmore/Kay/O’Connor dargelegt haben, dass die syntaktischen Eigenschaften der let alone-Konstruktion deutliche Idiosynkrasien aufweisen, gehen sie auf die semantischen Eigenschaften der Konstruktion ein (Fillmore/Kay/O’Connor 1988, 522–532). Sie zeigen, dass akzeptable Äußerungen mit let alone von hochkom-

554 

 Wolfgang Imo

plexen skalaren Modellen Gebrauch machen, in die die mit let alone verknüpften Äußerungsteile eingeordnet werden. Diese Skalen können konventionell sein, wie im Beispielssatz (1) oben: Um die Äußerung interpretieren zu können, muss man auf der Skala das Mittagessen zeitlich nach dem Frühstück verorten. Wenn also jemand nicht rechtzeitig aufgestanden ist, um zu Mittag essen zu können, dann folgt daraus automatisch, dass die Person auch zu der Zeit, an der das Frühstück stattfand, nicht wach war. Andere Skalen sind stärker von kulturellem Wissen abhängig, wie in Beispielsatz (2), für dessen Interpretation man wissen muss, dass für die meisten Menschen Tintenfisch exotischer – und damit auch potentiell abstoßender – als Shrimps ist. Zudem muss man zum Verständnis dieses Satzes auch noch eine weitere Skala konstruieren, die auf überhaupt keinem konventionellen Wissen beruht, nämlich der Tatsache, dass offensichtlich Fred der weniger problematische Esser als Louise ist. Nur so wird verständlich, dass, wenn es schon zweifelhaft ist, den ‚besseren‘ Esser Fred zum Verzehr des ‚unproblematischeren‘ Gerichts Shrimps zu bewegen, es dann mit Sicherheit unmöglich ist, die ‚schlechtere‘ Esserin Louise auch noch zu dem ‚problematischeren‘ Gericht Tintenfisch zu überreden. Die Notwendigkeit der Verknüpfung von formalen Konstruktionseigenschaften mit solchen komplexen semantischen Rahmen oder Szenen aufgezeigt zu haben, ist ein wichtiges Verdienst der Konstruktionsgrammatik, wobei die Klärung noch aussteht, für welche Konstruktionen solche Rahmen oder Szenen in welchem Umfang beschreibungsnotwendig werden. Der dritte Aspekt der let alone-Konstruktion betrifft die Pragmatik, genauer die Spezifizierung der „manner in which the utterance of a let alone sentence fits its conversational context“ (Fillmore/Kay/O’Connor 1988, 532). Der Bezug zur Pragmatik wird hier vor allem durch die Grice’schen Maximen der Relevanz und Quantität erklärt. Nach Fillmore/Kay/O’Connor (1988, 532) lösen SprecherInnen mit der let alone-Konstruktion folgendes Dilemma: Im Kontext steht eine Proposition, die sie zurückweisen wollen. Dies kann mit dem zweiten Teil der let alone-Konstruktion geschehen. Gleichzeitig haben sie das Gefühl, dass es nicht kooperativ wäre, nur diesen zweiten Teil zu äußern, da der erste Teil sogar noch informativer ist. Die zwei Teile der let alone-Konstruktion haben somit die Funktion, die konfligierenden Anforderungen von Relevanz und Quantität zu erfüllen: „The weaker clause answers to the demands of Relevance […]. The stronger clause satisfies the demands of Quantity by saying the most informative thing the speaker of the let alone sentence knows to be true.“ Im Fall von Beispiel (2) oben wäre dem Relevanzprinzip dadurch Genüge getan, dass B antwortet, dass weder Fred noch Louise Tintenfisch essen. Informativer – und für zukünftige Essenseinkäufe von Vorteil – ist jedoch die Aussage, dass die Grenze der akzeptierten Lebensmittel spätestens bei Shrimps zu ziehen ist, also in Zukunft nur ‚unproblematischere‘ Lebensmittel als Shrimps zu kaufen sind. Auf einer argumentativen Ebene hat die zweiteilige Struktur noch die Funktion, dass der ‚schwächere‘ zweite Teil dadurch argumentativ als sicheres Wissen präsentiert wird, dass darüber hinaus ein ‚stärkerer‘ erster Teil präsentiert wird. Wenn, so das Kalkül, der erste Teil vom Gesprächspartner akzeptiert wird, dann muss dieser automatisch

Was ist (k)eine Konstruktion? 

 555

auch den zweiten, ‚schwächeren‘ Teil, der ja im Sinne der Relevanz der entscheidende ist, akzeptieren. Die Analyse von Fillmore/Kay/O’Connor hat also die Notwendigkeit aufgezeigt, für manche syntaktische Muster eine umfassende, zeichenbasierte Beschreibung anzustreben, in der formale mit semantischen und funktionalen/pragmatischen Merkmalen untrennbar verbunden sind. Prinzipiell lässt sich eine solche Beschreibung um alle Merkmale erweitern, die sich für eine gegebene Konstruktionsbeschreibung als notwendig herausstellen, also auch prosodische (bzw. orthographische), sequenzielle oder gattungs- und textsortenbezogene Merkmale können in die Beschreibung einfließen. Für Fillmore/Kay/O’Connor besteht ein zentrales Kriterium für Konstruktionen darin, dass sie nicht-kompositional sein müssen. Auf dieser Basis hat Goldberg (1995, 4) eine Konstruktionsdefinition erarbeitet, die von Stefanowitsch (2009, 567) als die „klassische Definition“ bezeichnet wird: C ist eine Konstruktion dann und nur dann, wenn C ein Form-Bedeutungspaar dergestalt ist, dass irgendein Aspekt von Fi oder irgendein Aspekt von Si sich nicht auf der Grundlage der Komponenten von C oder bereits etablierter Konstruktionen vorhersagen lässt. (Im Original: C is a construction iffdef C is a form-meaning pair such that some aspect of Fi or some aspect of Si is not strictly predictable from C’s component parts or from other previously established constructions.). (Goldberg 1995, 4, Übersetzung von Stefanowitsch 2009, 567)

Die Definition suggeriert durch ihre formalistische Schreibweise, dass Konstruktionen in der Tat damit trennscharf definiert werden können. Allerdings birgt diese Definition einige Probleme hinsichtlich der Überprüfbarkeit der Kriterien, die dazu eingesetzt werden sollen, festzustellen, ob eine Konstruktion vorliegt oder nicht. Diese Probleme betreffen die Formulierung „irgendein Aspekt“, der nicht vorhergesagt werden kann, und im englischen Original die Tatsache, dass es um eine strenge und eindeutige Vorhersagbarkeit gehen muss („strictly predictable“). Nimmt man diese Anforderungen ernst, so könnte man letztendlich tatsächlich alles als Kon­ struktion erklären, denn „irgendein Aspekt“, der dazu führt, dass die Konstruktion als Ganze nicht mehr aus kompositioneller Sicht „strictly predictable“ ist, lässt sich immer finden. Diesen Weg schlägt Goldberg (2006) dann auch tatsächlich ein. Sie erweitert die Definition so, dass die Nicht-Kompositionalität um das gleichberechtigte Kriterium der Rekurrenz erweitert wird. Stefanowitsch (2009), der die Entwicklung des von Goldberg postulierten Konstruktionsbegriffs kritisch beleuchtet, sieht die Ursache für diese Ausweitung in der Gebrauchsorientierung der Konstruktionsgrammatik: „Im Laufe der Zeit wird das Kriterium der Kompositionalität unter dem Druck gebrauchsbasierter Ansätze aufgeweicht und auch reine Gebrauchshäufigkeit als Zusatzkriterium aufgenommen“ (Stefanowitsch 2009, 568). Diese Aufweichung des ursprünglichen Kriteriums ist dabei durchaus auch der Tatsache geschuldet, dass die dort aufgeführte Anforderung an Konstruktionen, „strictly predictable“ zu sein, nur schwer zu erfüllen ist, wenn man tatsächlich gebrauchsbasierte Analysen

556 

 Wolfgang Imo

durchführt, d. h. also Konstruktionen im schriftlichen und mündlichen Sprachgebrauch betrachtet: Irgendwelche nicht vorhersagbare Verteilungen oder besondere Funktionen hinsichtlich Register, Textsorte, kommunikativer Gattung, sequenzieller Platzierung, prosodischer Realisierung, Diskursfunktion etc. können praktisch immer in den Daten aufgezeigt werden, und wenn man unerwartet hohes Auftreten in bestimmten Kontexten ebenfalls als nicht vorhersagbare Eigenschaft wertet, dann landet man zwangsläufig auch bei Rekurrenz als Definitionskriterium. Die alte, an der Kompositionalität orientierte Konstruktionsdefinition wird daher von Goldberg (2006) um das Rekurrenzkriterium ausgebaut: Als Konstruktion wird jedes sprachliche Muster akzeptiert, wenn irgendein Aspekt seiner Form oder Funktion sich auf der Grundlage seiner Komponenten oder anderer, bereits bekannter Konstruktionen nicht genau vorhersagen lässt. Außerdem werden auch Muster, die voll vorhersagbar sind, als Konstruktionen gespeichert, wenn sie ausreichend häufig sind. (Im Original: Any linguistic pattern is recognized as a construction as long as some aspect of its form or function is not strictly predictable from its component parts or from other constructions recognized to exist. In addition, patterns are stored as constructions even if they are fully predictable as long as they occur with sufficient frequency.). (Goldberg 2006, 5, übersetzt von Stefanowitsch 2009, 568)

Durch diese Definition wandelt sich der Konstruktionsbegriff von einem Instrument, mit dem man den – wenn auch durchaus umfangreichen – ‚Randbereich‘ der Grammatik (wie von Fillmore/Kay/O’Connor 1988 beschrieben) erfassen kann, der ‚neben‘ traditionellen syntaktischen Regeln steht, zu einem Instrument, mit dem ein Großteil, wenn nicht die gesamte Sprachstruktur erfasst werden kann: Kompositionell erklärbare Strukturen sind typischerweise häufig, und daher Konstruktionen, während nicht-kompositionell erklärbare Strukturen oft seltener sind, aber auf Grund ihrer Nicht-Kompositionalität ebenfalls als Konstruktionen beschrieben werden müssen. Zudem wird durch den Ausdruck „jedes sprachliche Muster“ auch die Möglichkeit eröffnet, vom Morphem über Wörter, Phrasen und Sätze bis hin zu Texten und Gesprächen alles als Konstruktionen zu beschreiben. Der Regelbegriff würde bei einem so erweiterten Konstruktionsbegriff keine Rolle mehr spielen. Im Folgenden sollen, um den Ansatz und die Vorteile der Konstruktionsgrammatik zu illustrieren, einige für das Deutsche beschriebene Konstruktionen vorgestellt werden.

2 Was sind Konstruktionen des Deutschen? – Eine exemplarische Zusammenstellung In diesem Abschnitt sollen Beispiele diskutiert werden, bei denen plausibel gezeigt wurde, dass die ‚aufwändigere‘, weil nicht auf Regeln basierte Vorgehensweise der Konstruktionsgrammatik plausiblere Erklärungen liefert. Es handelt sich dabei um

Was ist (k)eine Konstruktion? 

 557

Kandidaten für Konstruktionen, die von sehr kleinen Einheiten auf der Wortebene (die Modalpartikel ruhig; Diewald 2008) über lexikalisch voll spezifizierte phrasale Einheiten wie die Sache/das Ding ist (Günthner 2008a, b) und nur teilweise lexikalisch feste Muster wie VP-Konstruktionen mit vor (Zeschel 2011) hin zu immer abstrakteren Konstruktionen wie der deontischen Infinitivkonstruktion (Deppermann 2006b) und der nicht-finiten Prädikationskonstruktion (Bücker 2012) reichen. Dadurch, dass ausschließlich Konstruktionen des Deutschen vorgestellt werden sollen, schränkt sich die Auswahl leider ein, da für das Englische bislang deutlich mehr Arbeiten vorliegen. (i) Die Modalpartikel ruhig: Möglich ist die Anwendung konstruktionsgrammatischer Konzepte auf einzelne Wörter, da der Konstruktionsbegriff sich auf Saussures Zeichenbegriff stützt, der ja genau für Wörter entwickelt wurde. Diewald (2008) illustriert einen solchen konstruktionsgrammatischen Zugriff auf die Beschreibung von Wörtern-als-Konstruktionen anhand der diachronen Rekonstruktion der Entstehung der Modalpartikel ruhig aus dem Adjektiv ruhig (es gibt allerdings auch Überlegungen, anders als z. B. bei Croft (2001) von Konstruktionen nur dann zu sprechen, wenn sie oberhalb der Wortgrenze operieren). Von der heutigen Position aus betrachtet, lässt sich die Modalpartikel ruhig dahingehend bestimmen, dass sie „beschränkt auf direktive Sprechakte, die rezipientenorientiert bzw. reaktiv sind, d. h. also nicht allein vom Sprecher, sondern auch vom Hörer initiiert sind“, verwendet wird. Dabei reagiert ruhig jeweils „in der einen oder anderen Weise auf eine Absicht oder ein Bedürfnis des Hörers“ (Diewald 2008, 42). Wie für alle Modalpartikeln gilt auch für ruhig, dass es quasi eine ‚eingebaute‘ dialogische Bedeutungskomponente enthält, die eine virtuelle Sequenz aufbaut und auf einen suggerierten, implizit durch die Äußerung gegebenen Prätext verweist, wie Diewald (2008, 43) darlegt: Ruhig bedeutet, dass der Sprecher keine Einwände hat im Gegensatz zur Vermutung des Hörers, dass er welche habe. Es markiert einen Kontrast zwischen der erwarteten Haltung des Sprechers und der tatsächlichen Haltung des Sprechers bezüglich des Inhalts der Proposition. Durch die Verwendung von ruhig sagt der Sprecher also: ‚im Gegensatz zu deiner/irgendjemandes Erwartung (irrelevante Gegengründe), habe ich keine Einwände‘. Diese Bedeutung kann als zugrunde liegendes dialogisches Sequenzschema verdeutlicht werden, dessen erster Zug nicht sprachlich realisiert, sondern impliziert ist.

Die Frage ist nun, wie es geschehen konnte, dass sich aus dem Adjektiv ruhig mit Bedeutungen wie ‚frei von Arbeit‘, ‚gelassen‘ oder ‚still‘, das zudem keine besonderen Restriktionen bezüglich der Sätze, in denen es verwendet werden kann, aufweist, die sowohl inhaltlich/funktional als auch distributionell so unterschiedliche Modalpartikel ruhig entwickeln konnte. An dieser Stelle bietet die Konstruktionsgrammatik einen Ansatzpunkt. Diewald zeigt, wie sich die Verwendung von ruhig als Modal­ partikel zunächst in einem sehr engen, fast schon idiomatischen Kontext entwickelt. Frühe Belege aus dem 18. und 19. Jahrhundert zeigen die Modalpartikel ausschließlich „in der Satzmodus-Konstruktion mit dem morphologischen Imperativ“. Belege sind Sätze wie „Bleiben Sie ruhig liegen und duseln sich gemütlich aus!“ oder „habe deine

558 

 Wolfgang Imo

Plauderstunde mit ihr ruhig weiter“. In diesen Fällen ist es nach Diewald (2008, 45) so, dass die Modalpartikel-Lesart genau durch den Imperativ überhaupt erst ermöglicht wird. Dadurch, dass mit diesen Imperativen kein explizites Subjekt realisiert wird und das implizite Subjekt jeweils der Hörer ist, wird aus der ursprünglich textuellen Relation, die das Adjektiv ruhig kodiert, eine dialogische bzw. sequenzielle Relation auf pragmatischer Ebene, die typisch für die Modalpartikel ruhig ist. Die neue Bedeutung – bzw. der Wortartenwechsel – von ruhig kann also nur dadurch erklärt werden, dass bestimmte Konstruktionen, in diesem Fall die Imperativkon­struktion, einen „kritischen Kontext“ (Diewald 2008, 50) bereitstellen, der den Aufbau der Konstruktion Modalpartikel ruhig begünstigt: Die chronologisch erste grammatikalisierungsrelevante Konstruktion, der morphologische Imperativ mit der illokutiven Funktion der Empfehlung bzw. des Ratschlags, ist eine extragrammatische Konstruktion, deren Bedeutung holistisch ist und sich nicht vollständig aus bisher bekannten Form-Bedeutungs-Relationen ableiten lässt. Diese Konstruktion bildet den kritischen Kontext, in dem die neue, tendenziell grammatische Bedeutung des Lexems ruhig als eine mögliche Lesart provoziert wird. (Diewald 2008, 50)

Der Vorteil der konstruktionsgrammatischen Herangehensweise besteht darin, dass der Verbindung und der gegenseitigen Beeinflussung und auch Bedingtheit von Konstruktionen Rechnung getragen werden kann. Aus dieser Ausgangslage, die der kritische Kontext des Imperativs bereitstellt, setzt sich dann in der Folge die Herausbildung der stabilen Konstruktion Modalpartikel ruhig, wie wir sie heute kennen, fort: Zunächst finden sich Modalpartikel-Lesarten in direktiven Äußerungen, die den Konjunktiv I beinhalten. Zu Beginn des 20.  Jahrhunderts kommt der Deklarativsatz mit Modalverb hinzu, zudem kann die Modalpartikel inzwischen nicht mehr nur mit der ersten Person, sondern auch der zweiten und dritten verwendet werden. Aus der ursprünglich idiomatischen Verwendungsweise in einer Imperativkonstruktion hat sich die frei verwendbare Konstruktion Modalpartikel ruhig entwickelt, die dann schließlich ab der zweiten Hälfte des 20.  Jahrhunderts so weit als autonome Konstruktion etabliert ist, dass die ursprünglichen Restriktionen so stark abgebaut wurden, dass ruhig nun in Imperativen, höflichen Konjunktiven, Deklarativsätzen mit Modalverben und Hortativen verwendet werden kann. Diese Ausweitung der Verwendungskontexte geht einher mit einer Verlagerung der Konstruktionsbedeutung von der Umgebungskonstruktion – anfangs der Imperativ – in die lexikalische Konstruktion selbst: [D]ie ehemals holistische Konstruktionsbedeutung (des kritischen Kontexts) [wird] stärker mit demjenigen Element assoziiert, das in allen formalen Variationen konstant bleibt: Dies ist die Partikel ruhig, die am Ende dieses Ausweitungsprozesses die grammatische Bedeutung als inhärente Lexembedeutung mit sich trägt. Dies geschieht über die Entstehung isolierender Kontexte (d. h. über formale idiomatische Konstruktionen), die alte Bedeutungen beim betroffenen Element ausschließen und damit die neue Bedeutung allein stellen. (Diewald 2008, 50)

Was ist (k)eine Konstruktion? 

 559

Es zeigt sich bei der Analyse von ruhig, dass ein konstruktionsgrammatischer Zugriff insofern große Vorteile aufweist, als mit ihm Grammatikalisierungspfade sehr gut erklärt werden können. Eine einzige Konstruktion, der Imperativ, kann als Auslöser für die Entstehung der neuen Konstruktion Modalpartikel ruhig ausgemacht werden. Das Zusammenspiel aus lexikalischen, idiomatischen und abstrakten Konstruktionen erklärt, wie es schließlich dazu kam, dass sich ruhig in die Gruppe der Modalpartikeln des Deutschen eingliederte (vgl. zur Analyse von Partikeln unter konstruktionsgrammatischer Perspektive auch die Arbeiten von Fischer (2006a, b, 2007)). (ii) Äußerungsprojizierende Phrasen wie die Sache ist/das Ding ist: Phrasen wie die Sache/das Ding/das Problem/die Frage/das Ziel/das Argument etc. ist liegen in ihrer Komplexität über Konstruktionen wie die Modalpartikel ruhig, die nur aus einem Wort besteht. Es handelt sich dabei um eine Serie von lexikalisch festen Phrasen  – im Sinne von Croft (2001, 17) um spezifische Konstruktionen  –, die aus dem Grund als Konstruktionen analysiert werden müssen, dass „sie nicht aus ihren Einzelbestandteilen modular generiert“ werden, sondern jede dieser Phrasen „eine holistische Gestalt mit spezifischen Form- und Funktionszusammenhängen bildet“ (Günthner 2008a, 160). Besonderheiten bei diesen Phrasen sind erstens, dass nur Nomen verwendet werden können, die einen gewissen Abstraktionsgrad aufweisen – und innerhalb dieser Nomen auch noch Präferenzen für bestimmte sehr allgemeine Nomen wie Ding oder Sache bestehen –, dass die Kopula im Präsens und fast immer im Indikativ realisiert wird, und schließlich, dass der gesamte Ausdruck nicht als Matrixsatz verwendet wird, sondern als interaktionssteuernde Einheit: Zugleich werde ich argumentieren, dass bei der vorliegenden Konstruktion die Kategorien ‚Matrixsatz‘ und ‚Komplementsatz‘ insofern problematisch sind, als weder der ‚N-be‘-Teil als ‚Matrixsatz‘, in dem die zentrale, für die Folgeinteraktion relevante Information geäußert wird, zu betrachten ist, noch ihm das Folgesyntagma (formal und) inhaltlich untergeordnet ist. (Günthner 2008a, 160)

Auf Grund der Tatsache, dass die Phrasen nicht als Matrixsätze analysiert werden können, stellt sich die Frage, wie eine alternative Beschreibung aussehen könnte: Hier bietet sich die Konstruktionsgrammatik an, da sie es ermöglicht, Gebrauchsbedingungen und sequenzielle Informationen mit in die Beschreibung eines syntaktischen Phänomens zu integrieren. Im Falle der die Sache/das Ding ist-Phrasen heißt das, dass vor allem auf den projizierenden Charakter dieser Phrasen abgehoben werden muss, d. h. die Struktur muss als „verfestigte Projektionsphrase“ (Günthner 2008a, 161), die ihre Funktion aus dem Management dialogischer und zeitlich progredienter Äußerungsproduktion bezieht, analysiert werden (für den Konstruktionsstatus ist dabei nur der Aufbau der Projektion relevant, nicht aber deren Einlösung). Günthner (2008a, 161–167) stellt eine Reihe unterschiedlicher Arten der Kombination aus die Sache/das Ding ist-Phrasen und Folgesyntagmen heraus. Eine erste Variante besteht darin, dass der Phrase ein durch dass eingeleiteter subordinierter Satz folgt. Betrachtet man die informationsstrukturelle Gewichtung, so zeigt sich allerdings,

560 

 Wolfgang Imo

dass selbst bei diesen Varianten eine Interpretation als Matrixsatz mit subordiniertem Satz nicht plausibel ist, denn schon hier wird – unter anderem auch unterstützt durch die prosodische Realisierung von der die Sache/das Ding ist-Phrase und dem folgenden subordinierten Satz in jeweils eigenen Intonationsphrasen  – die Phrase eher als „Projektor-Konstruktion“ bzw. als „Fokuskonstruktion“ eingesetzt, die die Aufmerksamkeit der ZuhörerInnen auf den folgenden Äußerungsteil lenkt, „der als salient konstruiert wird“: Die Hauptprädikation, d. h. die interaktiv relevant gesetzte Information, liegt also keineswegs im Matrixsatz, sondern im subordinierten Komplementsatz. […] Der formal subordinierte Komplementsatz kann somit nicht länger als konzeptuelles Element der Proposition des Matrixsatzes betrachtet werden. Hinzu kommt, dass die Konstruktion nicht umstellbar ist; d. h. im Gegensatz zu sonstigen [Matrixsatz + Komplementsatz]-Verbindungen, bei denen der Komplementsatz dem Matrixsatz vorausgehen kann […], ist die ‚die Sache/das Ding ist‘-Konstruktion stellungsfixiert. (Günthner 2008a, 162)

Noch deutlicher wird die Distanz der Phrase zu Matrixsätzen dann, wenn die Folgeäußerung die Form eines Hauptsatzes einnimmt, so dass bestenfalls die Interpretation eines Matrixsatzes mit einem folgenden abhängigen Hauptsatz in Frage kommt  – auch hier hat die Phrase eher eine „interaktive Rahmungsfunktion inne“ und funktioniert wie ein „pragmatisches Rahmungselement“, was sie in die Nähe zu „Thematisierungsformeln“ oder „Diskursmarkern“ rückt (Günthner 2008a, 165). Diese Interpretation ist sogar die einzig mögliche in solchen Fällen, bei denen überhaupt kein eindeutig lokalisierbares Folgesyntagma mehr vorhanden ist, sondern zum Beispiel eine Erzählung als „komplexes Segment“ (Günthner 2008a, 167) folgt, bei der auf einer inhaltlichen Ebene die angekündigte „Sache“ bzw. das „Ding“ erst einige Zeit später als Pointe folgt. Bei solchen Konstellationen wird deutlich, dass die „die Sache/das Ding ist“-Konstruktion und die Folgeäußerung(en) auf unterschiedlichen Ebenen angesiedelt sind: Erstere hat diskursfunktionale Zwecke, sie lenkt die Äußerung der Gesprächspartner auf eine relevante folgende Information. Letztere hat bzw. haben propositionalen Gehalt und bilden die fokussierte und inhaltlich relevante Information: Diese Ansiedelung der beiden Segmente auf unterschiedlichen Ebenen (der diskurspragmatischen und der propositionalen) führt u. a. dazu, dass die Anbindung zwischen ihnen sowohl syntaktisch (durch die asyndetische Struktur) als auch prosodisch (aufgrund eigenständiger Intonationskonturen) wenig eng ausfällt. (Günthner 2008a, 167)

Was bedeutet dieser Befund nun unter einer konstruktionsgrammatischen Perspektive? Im Sinne einer „zunehmenden Pragmatikalisierung sprachlicher Phänomene“ (Günthner 2008a, 169) kann hier die These aufgestellt werden, dass sich aus der ursprünglichen propositional und syntaktisch zweiteiligen Matrixsatzkonstruktion eine Abspaltung ereignet hat, die dazu führt, dass der ehemalige Matrixsatz zu einer

Was ist (k)eine Konstruktion? 

 561

spezifischen Konstruktion wurde, die der Gruppe der „Projektor-Konstruktionen“ zugerechnet werden kann, denen unter anderem Sperrsätze (Hopper 2004; Günthner 2006), Extrapositionen (Günthner 2008b, 2009a), einige zu Phrasen geronnene Matrixsätze auf der Basis von verba sentiendi et dicendi (Imo 2007a), Freie Themen (Selting 1993), Diskursmarker (speziell zum Zusammenhang von Diskursmarkern und Projektorkonstruktionen siehe Imo 2012) und zahlreiche andere Konstruktionen mehr gerechnet werden können. Zugleich wird allerdings deutlich, dass auch eine konstruktionsgrammatische Beschreibung eine gewisse Offenheit zulassen muss, um dem flexiblen – um nicht zu sagen fragmenthaften (vgl. Günthner 2008a, 170) – Charakter dieser Phrasen um die Sache/das Ding ist Rechnung zu tragen. Es bleibt häufig unklar, ob und inwieweit eine Grenze zu ziehen ist zwischen festen syntaktischen Einheiten (Konstruktionen) und solchen, die in besonderem Maße der zeitlichen und interaktionalen Struktur von gesprochener Sprache geschuldet sind und so den Charakter von ad hoc-Bildungen und fragmentarischen Einheiten haben. Das Changieren zwischen eindeutig diskursfunktionaler, pragmatischer Funktion und matrixsatzähnlicher Struktur wirft die Frage auf, ob Mechanismen der Gesprächsstruktur tatsächlich im Sinne konstruktionsgrammatischer Analysen erfasst werden können oder sollen. Auf die Problematik der Integration der Offenheit syntaktischer Strukturen, wie sie Untersuchungen im Bereich der Gesprächsanalyse und der Interaktionalen Linguistik zeigen, in ein konstruktionsgrammatisches Modell wird in Abschnitt 3 noch genauer eingegangen. (iii) VP-Konstruktion mit vor: Noch abstrakter als die in (ii) dargestellten, voll lexikalisch spezifizierten Phrasen stellt sich eine Konstruktion dar, die Zeschel (2011) beschreibt und die unter anderer syntaktischer Perspektive auch valenzgrammatisch analysiert werden könnte. Es handelt sich dabei um ein Muster, bei dem eine Verbalphrase mit der Präposition vor gebildet wird, wie z. B. brennen vor Ehrgeiz, kochen vor Wut, strotzen vor Fehlern, triefen vor Kitsch, wimmeln vor Stars, schwirren vor Insekten etc. Zeschel (2011, 45) stellt die These auf, dass es sich bei diesen einerseits durchaus idiomatisch gebundenen aber andererseits in gewissem Maß auch frei zu bildenden Konstruktionen um Extensionen von tatsächlich vollständig frei zu bildenden Mustern wie Insel vor Norwegen, Angst vor Veränderungen oder zittern vor Kälte handelt. Zeschels Untersuchung ist vor allem deswegen von besonderer Relevanz für die Klärung der diesem Beitrag zu Grunde liegenden Frage „Was ist (k)eine Konstruktion?“, als bei den unterschiedlichen Äußerungen mit vor „Übergänge von grammatischer Regelhaftigkeit in Idiomatizität“ (Zeschel 2011, 45) zu beobachten sind und daher auch geklärt werden muss, für welche Fälle der Konstruktionsbegriff notwendig ist und wo auch mit einem Regelbegriff gearbeitet werden könnte. Der Pfad von typischer Regelhaftigkeit zu Idiomatizität (bzw., wenn man vollständig in konstruktionsgrammatischer Terminologie verbleiben will, zwischen vollständig schematischen und teilschematischen Konstruktionen) lässt sich wie folgt skizzieren: Wird die Präposition vor lokativ verwendet, so liegt ein maximaler Grad von Schematizi-

562 

 Wolfgang Imo

tät vor. Es können beliebige Einheiten miteinander verbunden werden – wie eben in dem Beispiel Insel vor Norwegen –, sofern sich eine plausible lokative Relation ergibt, bei der der erste Teil in lokalem Verhältnis zum zweiten Teil stehen kann. Die Skala führt dann zu ambigen Fällen wie Feigheit vor dem Feind, wo der lokative Aspekt zu Gunsten einer kausalen Beziehung zurücktritt. Dies ist dann eindeutig der Fall, wenn es sich um Einheiten wie Angst vor Veränderung oder zittern vor Kälte handelt (Zeschel 2011, 46). Noch immer handelt es sich hier um sehr stark schematische Muster, allerdings liefern die Muster, die ein Verb enthalten (zittern vor Kälte), die Keimzelle für die Herausbildung von dem Muster, das im Mittelpunkt der Untersuchung von Zeschel (2011, 48) steht, der von ihm so genannten „Intensivierungskonstruktion“ mit vor. Bei diesen Fällen ist zwar der kausale Anteil weiter erhalten, es erfolgt aber eine semantische Verbleichung der Verbalprädikation und zudem „können nur Verben bestimmter semantischer Typen verwendet werden“ (Zeschel 2011, 48). Es handelt sich dabei um Verben, die in ihrer Bedeutung mit Konzepten wie „Druck“, „Wallung“, „Bewegung“, „Entladung“ und generell „Überschuss“ assoziiert sind (Zeschel 2011, 48–49). Selbst hier, bei der „intensivierenden Variante von NPX V + vor + NPY-Konstruktionen“, ist ein Teil durch abstrakte Regeln erklärbar. Ein anderer Teil dagegen – zum Beispiel Ausdrücke wie platzen vor Neid – kann jedoch nur mit konstruktionsgrammatischen Annahmen plausibel erklärt werden: [A]usschlaggebend für die Akzeptabilität des Ausdrucks ist hier nicht ein primär außersprachlicher, tatsächlich in der Welt beobachtbarer Zusammenhang, sondern eine bestimmte sprachliche Übereinkunft bezüglich des Ausdrucks von abstrakten Eigenschaftszuschreibungen sowie ihrer hier vorliegenden Abwandlung zur Signalisierung von Emphase. (Zeschel 2011, 50)

Anhand einer Korpusanalyse zeigt Zeschel (2011, 50–54), dass auf der einen Seite bestimmte Kombinationen aus Verben und NPs besonders häufig vorkommen, sodass hier von einer Serie von spezifischen Konstruktionen auszugehen ist. Zugleich finden sich aber auch kleinere Mengen kreativ gebildeter Äußerungen, die darauf hinweisen, dass „die angetroffenen Vorkommen nicht schlicht auswendig gelernt und exakt repliziert werden, sondern Sprecher Generalisierungen über Vorkommen bilden und die identifizierten Muster produktiv erweitern“ (Zeschel 2011, 54). Genau wie für Konstruktionen zu erwarten ist, zeigt sich, dass idiomatische Muster als Keimzellen für abstraktere Muster dienen können, wie auch von Diewald in der Diskussion des „kritischen Kontexts“ (Diewald 2008, 50) für die Entwicklung der Modalpartikel ruhig gezeigt wurde. Auf diese Weise ist es möglich, dass aus einer spezifischen Konstruktion im Sinne Crofts (2001, 17), also einem idiomatischen Ausdruck, eine schematische Konstruktion entstehen kann. Um die NPX V + vor + NPY-Konstruktionen zufriedenstellend beschreiben zu können, ist also der Konstruktionsbegriff in jedem Fall notwendig, um die stark idiomatischen Fälle erfassen zu können. Ob es auch eines Regelbegriffs bedarf, um die abstrakten Konstruktionen zu erfassen, ist allerdings die offene Frage: In der Konstruktionsgrammatik würde der Regelbegriff lediglich durch

Was ist (k)eine Konstruktion? 

 563

den schematischer Konstruktionen ersetzt werden, die jedoch im Kern das Gleiche leisten wie Regeln – zumindest solange nicht eindeutig belegt ist, dass die Konstruktion nicht-kompositionell ist. Die Frage „Nur Konstruktionen oder Konstruktionen + Regeln?“ wird später noch ausführlich diskutiert. (iv) Deontische Infinitivkonstruktionen: Ein Beispiel für eine deutlich ab‑ straktere Konstruktion als die eben genannten findet sich bei Deppermann (2006b). Anders als Wörter wie die Modalpartikel ruhig im ersten Fall, bei denen ein Zeichenstatus – und somit Konstruktionsstatus – für viele nicht umstritten ist (kritisch dazu allerdings Verhagen 2009, der dafür plädiert, nur bei komplexen Einheiten und nicht bei Wörtern von Konstruktionen zu sprechen), und auch anders als bei lexikalisch voll spezifizierten Phrasen wie „die Sache ist/das Ding ist“ oder zumindest bei teilspezifizierten Mustern wie NPX V + vor + NPY im dritten Fall handelt es sich bei den von Deppermann (2006b) so genannten deontischen Infinitivkonstruktionen um vollständig abstrakte Konstruktionen. Genauer gesagt, können diese als eine Klasse von freien Infinitivkonstruktionen beschrieben werden, die sich sowohl in schriftlicher Kommunikation finden (z. B: „Kühl und trocken lagern!“, „Heringe säubern und mit Zitronensaft beträufeln!“ oder „Platz nehmen und ab ins Vergnügen“; Deppermann 2006b, 240) als auch in mündlicher Kommunikation. Mündlich werden sie allerdings mit einem weiteren Funktionsspektrum verwendet, zum Beispiel als Vorschlag („lEUte grüßen“), Erlaubnis („Erst hausaufgaben dAnn fernsehen“), Empfehlung („aber danach das !LE!ben AUSrichten ist verkehrt“), Aufforderung oder Gebot („GUten MO:Rgen; (.) !AUF!stehen“) und schließlich als Klage („immer AUfräumen“) (Deppermann 2006b, 244–248). Die Tatsache, dass diese Infinitive zu solchen Zwecken eingesetzt werden, ist aus der rein formalen Realisierung heraus nicht abzuleiten, was dafür spricht, sie als Konstruktionen zu beschreiben. Hinzu kommt noch die Tatsache, dass sie auch hinsichtlich ihrer syntaktischen Merkmale Besonderheiten aufweisen. Deppermann (2006b, 257–258) fasst die Merkmale der „deontischen Infinitivkonstruktionen“ wie folgt zusammen: 1. Syntaktische Merkmale: Modus, Numerus und Person sind nicht kodiert, die deontischen Infinitive finden sich immer im Aktiv Präsens und die Infinitivpartikel zu wird nicht mitrealisiert. Es besteht eine Selektionsrestriktion auf intentionale Verben sowie, auf der Ebene der äußeren Syntax, eine Präferenz für die Koordination mit weiteren deontischen Infinitivkonstruktionen oder Nominalen. 2. Semantische Merkmale: Die Argumentstruktur ist häufig reduziert, v. a. das Patiens taucht nicht auf. Es liegt eine deontische Modalität vor. Bei nicht-intentionalen Verben wie z. B. Empfindungsverben tritt ein „coercion-Effekt“ (vgl. z. B. Goldberg 1997) auf, d. h. diese Verben werden durch die Verwendung in der deontischen Infinitivkonstruktion als intentionale Verben reanalysiert. 3. Pragmatische Merkmale: Es wird eine umgrenzbare Reihe an Handlungen mit deontischen Infinitivkonstruktionen durchgeführt (Vorschlag, Empfehlung, Aufforderung/Gebot, Absichtsbekundung, Vereinbarung/Selbstverpflichtung und Klage). In Bezug auf den Informationsstatus sind Agens und nicht-realisierte Argumente

564 

 Wolfgang Imo

entweder durch den Kontext erschließbar oder nicht relevant, stattdessen wird die denotierte Aktivität profiliert. In Bezug auf die Höflichkeit gelten die deontischen Infinitivkonstruktionen als höflicher als parallele Imperativ- oder Modalkonstruktionen: Die Aufforderung Aufstehen! wirkt höflicher als Steh auf!. 4. Interaktionale Merkmale: Es handelt sich bei den deontischen Infinitivkonstruktionen meist entweder um turnwertige oder turnfinale Einheiten. Sie treten typischerweise in deliberativ-argumentativen oder direktiv-instruierenden kommunikativen Gattungen bzw. Interaktionssituationen auf. Meist liegt eine vage Mehrfachadressierung vor (mit Ausnahme der formulaischen Aufforderungen). 5. Rhetorische Merkmale: Durch ihre Kürze weisen die deontischen Infinitivkonstruktionen ein hohes „Slogan-/Formulaizitätspotenzial“ auf, was sie z. B. für ihre agitatorische Nutzung geeignet macht (Frieden schaffen ohne Waffen!) und sie wirken „pointierend-verdichtend“ (Deppermann 2006b, 258). All diese Merkmale weisen darauf hin, dass es sich bei diesen Mustern tatsächlich um Konstruktionen handelt: Zum einen ist es notwendig, eine holistische Beschreibung zu liefern, die semantische und pragmatische Informationen beinhaltet, um die Infinitivkonstruktionen überhaupt angemessen beschreiben zu können – es handelt sich also um Zeichen, d. h. Konstruktionen. Zum anderen zeigen sich coercion-Effekte, wie sie typisch für abstrakte Konstruktionen sind, d. h. durch die Verwendung dieser Infinitivkonstruktion werden auch Verben, bei denen semantisch und pragmatisch keine Aufforderung plausibel erscheint, als Aufforderungen interpretiert. Als ein Beispiel für einen solchen Effekt könnte man den Text eines Sketches von Otto Waalkes (1976) anführen, in dem die Reaktion der menschlichen Körperteile auf eine Beleidigung inszeniert wird und das Großhirn unter anderem folgenden Befehl gibt: „Großhirn an Blutdruck, steigen!“. Deppermann (2006b, 25) betont, dass die deontischen Infinitivkonstruktionen „ein Beispiel für die Erfülltheit von Goldbergs Postulat einer konstruktionsspezifischen Bedeutung“ sind, „die für nicht-kompositionale Interpretationen und coercion verantwortlich ist“, wie in dem Text von Waalkes gut zu be‑ obachten ist. (v) Nicht-finite Prädikationskonstruktion: Noch abstrakter als die deontischen Infinitivkonstruktionen ist die von Bücker (2012) ausführlich analysierte „Nicht-finite Prädikationskonstruktion“. Das liegt daran, dass es bei dieser Konstruktion zwar Vertreter gibt, die besonders salient sind und in der Literatur als typisch präsentiert werden, eine genaue Untersuchung aber zeigt, dass das Formenspektrum weitaus breiter ist als häufig angenommen. Begriffe wie „Mad Magazine Sentence“, „Incredulity Response Construction“, „Incredulity Infinitive“ oder „Abrupter Infinitiv“, um nur einige der vorgeschlagenen Bezeichnungen zu nennen, die Bücker (2012, 6–7) in seinem Literaturüberblick zusammengetragen hat, verweisen zwar auf Prototypen, greifen aber insgesamt zu kurz. Solche Prototypen betreffen Äußerungen wie „Ich … eine Kontaktanzeige?“, „Promotion? Ich?“ oder „Ich und schlafen…“ (Bücker 2012, 2). Der Vorschlag, dieses Muster als „Mad Magazine Sentence“ zu bezeichnen, rührt daher, dass sie nach Auffassung einiger LinguistInnen in der amerikanischen Satire-

Was ist (k)eine Konstruktion? 

 565

zeitschrift Mad Magazine – in einem Verweis auf Akmajan (1984) zitiert Lambrecht (1990, 215) Äußerungen wie „What, me worry?“, „My boss give me a raise?! (Ha.)“ oder „Him wear a tuxedo?! (Sure.)“ – besonders häufig vorkommen. Die Bezeichnungsvorschläge „Incredulity Response Construction“ oder „Incredulity Infinitive“ hängen mit einer häufigen Funktion zusammen, zu der dieses Muster eingesetzt wird: Auf den ersten Blick scheinen die deutschen Beispiele sich tatsächlich dadurch auszuzeichnen, dass ein Pronomen mit einem relativ frei wählbaren zweiten Äußerungsteil verbunden wird  – durch das Pronomen wäre also eine teilweise Spezifizierung der Konstruktion gegeben – und die Funktion darin besteht, eine mangelnde Passung der Einheit, auf die das Pronomen verweist, mit dem Konzept im zweiten Teil auszudrücken. Wie Bücker (2012, 124) als Resultat einer Korpusanalyse festhält, ist aber das Formen- und Funktionsspektrum deutlich weiter zu fassen. Als Zusammenfassung der formalen Eigenschaften führt er an, dass lediglich die Eigenschaften der „Zweiteiligkeit“ und der „Nicht-Finitheit“ obligatorisch sind, um die Nicht-finite Prädikationskonstruktion zu beschreiben. Es handelt sich dabei um zwei sehr abstrakte Eigenschaften, die ein weites Feld an Instantiierungen wie z. B. „Hecke zerstören?? Ein Igel??“ (Bücker 2012, 109) oder „Kohl selbstgefällig?“ (Bücker 2012, 104) abstecken. Optional treten zu den Basiseigenschaften der Zweiteiligkeit und Nicht-Finitheit dann weitere hinzu, wie die Möglichkeit, die beiden Teile – von Bücker R-Konjunkt und P-Konjunkt genannt, wobei R für Referenzakt und P für Prädikationsakt steht – mit einem und zu verbinden, mittels Prosodie oder Orthographie die Grenzen der Konjunkte zu markieren (vgl. die deutliche orthographische Grenzmarkierung bei „Hecke zerstören?? Ein Igel??“ gegenüber der fehlenden Grenzmarkierung bei „Kohl selbstgefällig?“) oder die Konjunktabfolge zu verändern, so dass erst das P-Konjunkt und dann das R-Konjunkt realisiert wird. Weiterhin ist „im R-Konjunkt die Tendenz zu pronominalen oder substantivischen Einfachbesetzungen und belebten Referenten zu beobachten“ sowie im „P-Konjunkt Besetzungen mit Verbal-, Nominal- und Adjektivphrasen unter ‚Einsparung‘ lexikalisch-semantisch ‚leichter‘ Komponenten“ (Bücker 2012, 124). Angesichts der Tatsache, dass es eine Kerngruppe prototypischer Realisierungen der Nicht-finiten Prädikationskonstruktion sowie gleichzeitig aber auch unterschiedliche Randgruppen gibt, bietet sich eine kon­ struktionsgrammatische Analyse wegen ihres Konzepts der Organisation von Kon­ struktionen in Netzwerken in besonderem Maße für die Beschreibung an, wie Bücker (2012, 172–207) illustriert. Des Weiteren hat die holistische Orientierung der Konstruktionsgrammatik den Vorteil, dass die für die Konstruktionsbeschreibung wichtigen Faktoren der orthographischen bzw. prosodischen Realisierung der Grenzen der Konjunkte problemlos in die Beschreibung integriert werden können. Ein drittes Argument dafür, konstruktionsgrammatisch vorzugehen, ist die Nicht-Kompositionalität der Struktur, d. h. die Tatsache, dass die Konstruktion mit einer Reihe von Funktionen einhergeht, die nicht über die Einzelteile und ihre Kombination erklärt werden können. So lässt sich die „gesprächsstrukturierende ‚Scharnierfunktion‘“ (Bücker 2012, 162) der Konstruktion zwar noch aus der Zweiteiligkeit herleiten, die Tatsache,

566 

 Wolfgang Imo

dass die Konstruktion dazu genutzt wird, „dass der Produzent des NFPK-Konstrukts die unterstellte Gültigkeit oder Berechtigung der gesprächsdeiktisch zum Thema gemachten Aussage konversationell als eine kommentierungsbedürftige ‚Problemstelle‘ [markiert], die ein positionierungsrelevantes ‚stance-taking‘ erfordert“, aber nicht mehr. Dementsprechend wird die Konstruktion typischerweise in „Argumentations-, Streit- oder ‚Teasing‘-Kontexten“ verwendet, wo sie als Positionierungsmittel dient (Bücker 2012, 164). Neben den Vorteilen einer umfassenden gebrauchsbasierten Beschreibung, die auch Faktoren wie die Prosodie und Orthographie sowie interaktionsfunktionale Aspekte berücksichtigt, ermöglicht es die Konstruktionsgrammatik darüber hinaus, Vorschläge zu einer kognitiven Modellierung zu machen, wie Bücker (2012, 172–207) anhand einer Netzwerkanalyse illustriert. Diese Vorgehensweise zeigt eine Möglichkeit auf, wie empirische Analysen widerspruchsfrei mit theoretischen Annahmen über kognitive Strukturen verbunden werden können.

3 Was ist keine Konstruktion? – Kritik an einer alles umfassenden Konstruktionsgrammatik Dass die Annahme von Konstruktionen unumgänglich ist, wenn das Ziel darin bestehen soll, eine Grammatiktheorie zu entwerfen, die mit allen (oder möglichst vielen) syntaktischen Mustern umgehen kann, die in einer Sprache vorkommen, wurde anhand der im vorigen Abschnitt diskutierten Beispiele gezeigt. Eine Befürwortung des Konzepts der Konstruktion heißt aber nicht automatisch, dass auch die Konstruktionsgrammatik als Ganze, d. h. die Annahme, dass das sprachliche Wissen durchgehend und ausschließlich auf Konstruktionen aufgebaut und mit konstruktionsgrammatischen Methoden zu beschreiben sei, akzeptiert werden muss. Die Idee, die Konstruktionsgrammatik als einzige und umfassende Sprach- und Grammatiktheorie zu verwenden, kann auch erst auf der zweiten, späteren Konstruktionsdefinition von Goldberg (2006) aufbauen (die auch von Croft (2001) in seiner „Radical Construction Grammar“ vertreten wird), während nach der früheren Definition von 1995 die Konstruktionsgrammatik eher die Funktion hat, als Teiltheorie zu fungieren, die mit der ‚Randgrammatik‘ umgehen muss (wie ursprünglich bei Fillmore/Kay/O’Connor (1988) angelegt). In einer ausführlichen kritischen Diskussion kontrastiert Stefanowitsch (2009) diese beiden Positionen. Er stellt fest, dass die These, dass potentiell alles eine Konstruktion sein kann – auch so abstrakte Strukturen wie beispielsweise die von Goldberg (1995) beschriebenen Ditransitivkonstruktionen  – zwar nicht von der Hand zu weisen sei, dass in diesen Fällen allerdings die Beweislast bei der Kon­ struktionsgrammatik liege:

Was ist (k)eine Konstruktion? 

 567

Obwohl Konstruktionsgrammatiker häufig dazu tendieren, komplexe Strukturen im Zweifelsfall als Konstruktionen zu klassifizieren, besteht aus theoretischer Perspektive keine Rechtfertigung dafür. [Es ist] aus grammatiktheoretischer Perspektive wünschenswert, grammatische Strukturen nur dann als Konstruktionen zu analysieren, wenn sie nicht kompositionell sind. (Stefanowitsch 2009, 573)

Der Grund dafür, nur nicht-kompositionelle Strukturen als Konstruktionen zu analysieren, bestehe darin, dass andernfalls ohne Not eine ökonomische und funktionstüchtige Beschreibung auf Regelbasis für eine unökonomische Beschreibung auf Konstruktionsbasis aufgegeben werde. Zudem unterscheiden sich nicht-kompositionelle Einheiten (Konstruktionen) qualitativ deutlich von kompositionellen, aber hoch rekurrenten Einheiten. Daher hält Stefanowitsch (2009, 569) es „sowohl aus grammatiktheoretischer als auch aus psycholinguistischer Sicht nicht für wünschenswert, a priori den selben Begriff für komplexe grammatische Strukturen mit nicht-kompositionellen Eigenschaften […] und konventionalisierte (und damit holistisch repräsentierte) aber kompositionelle grammatische Strukturen […] zu verwenden.“ Für den zweiten Fall schlägt er den traditionellen Begriff des „Satzmusters“ vor. Der Vorteil sei, dass damit Zusammenhänge zwischen Rekurrenz und Konstruktionsherausbildung schärfer erfasst werden können: Die hohe Frequenz einer komplexen Struktur führt dazu, dass diese als Einheit repräsentiert wird (in der hier vorgeschlagenen Terminologie: ein Satzmuster wird). Ist das Satzmuster erst mental repräsentiert, kann es Eigenschaften annehmen, die sich nicht aus ihren Teilen und den Regeln ergeben, nach denen diese ursprünglich zusammengesetzt wurden. Damit wird das Satzmuster zur Konstruktion. Ein Satzmuster muss aber keine solchen Eigenschaften annehmen, es kann voll kompositionell bleiben. Umgekehrt muss eine Konstruktion in jedem Fall als Einheit repräsentiert sein, sonst könnte sie keine nicht-kompositionellen Eigenschaften haben. (Stefanowitsch 2009, 569)

Dies ist allerdings, so Stefanowitsch (2009, 570), nicht als ein Plädoyer für eine Beschränkung der Konstruktionsgrammatik auf einen kleinen Phänomenbereich zu sehen, sondern lediglich als ein Hinweis darauf, dass keine vorschnellen Verallgemeinerungen des Konstruktionsbegriffs getroffen werden sollten. Bislang steht lediglich fest, dass eine Grammatiktheorie, die eine umfassende Beschreibung einer Sprache anstrebt, Konstruktionen einen theoretischen Stellenwert geben muss, „da sie sie anders nicht erfassen kann“. Umgekehrt dagegen ist es nicht erwiesen, dass Satzmuster tatsächlich notwendig sind. Ihnen kann daher ein Stellenwert eingeräumt werden, dies muss aber nicht der Fall sein. Die einzige Methode, wissenschaftlich sauber zu entscheiden, ob es reicht, nur mit der Konstruktionsgrammatik zu arbeiten oder darüber hinaus auch „Satzmuster“ (oder „Regeln“ o. ä.) anzunehmen, besteht darin, für alle Strukturen einer Sprache zu zeigen, dass tatsächlich nicht-kompositionelle Eigenschaften im engeren konstruktionsgrammatischen Sinn vorliegen. Stefanowitsch selbst (2009, 570–591) tut dies für den Bereich modaler Infinitive und zeigt tatsächlich, dass auch für diese Strukturen Nicht-Kompositionalität vorliegt. Bevor

568 

 Wolfgang Imo

das aber nicht für alle Konstruktionskandidaten gezeigt ist, sollte seiner Meinung nach aber zweigleisig gefahren werden und es sollten neben Konstruktionen auch Satzmuster (oder abstrakte Regeln) angenommen werden. Eine besondere Auswirkung hat die Forderung von Stefanowitsch vor allem für den Bereich schematischer Konstruktionen, d. h. also abstrakter Muster ohne lexikalisch spezifizierte Elemente. Besonders entschieden wurde von Goldberg (1995, 1997, 1998, 2005) die These vertreten, dass so abstrakte Muster wie Argumentstrukturkonstruktionen – Goldberg (1998, 206) führt beispielsweise als Konstruktionskandidaten „double object“, „caused-motion“, „resultative“, „intransitive motion“, „transitive“ und „possessive“ constructions an  – tatsächlich Konstruktionsstatus haben. Sie versucht, ihre These über die Beobachtung zu belegen, dass diese Konstruktionen eine eigene Bedeutung haben. Im Englischen sei somit das Muster „Subj V Obj Obl“ mit der Bedeutung „X causes Y to move Z“ verbunden und auf diese Weise können dann coercion-Effekte auftreten, d. h. die abstrakte Konstruktion ‚zwingt‘ Verben, die semantisch und auf Grund ihrer Argumentstruktur eigentlich nicht in die Konstruktion eingesetzt werden können, ihre Konstruktionsbedeutung ‚auf‘ (Goldberg 1998, 206). Diese These wird von ihr mit dem vieldiskutierten Satz „Pat sneezed the foam off the cappuccino“ (Goldberg 1998, 206) illustriert, wo das intransitive Verb „sneeze“ eine bewegungsverursachende Lesart durch die Konstruktion erhält und daher ähnlich interpretiert werden kann wie ein Verb, das inhärent eine solche Bedeutung hat (z. B. Pat brushed/blew/wiped etc. the foam off the cappuccino). Diese These klingt zwar plausibel, und solche coercion-Effekte  – deren Abgrenzung und Begründung als eigenes Phänomen jenseits von Analogiebildung oft nicht ganz klar ist  – sind nicht von der Hand zu weisen: Ein attestiertes Beispiel aus einer Fernsehsendung mit einem Hundetrainer ergab z. B. den Beleg „Es kann ja nicht angehen, dass er ihnen das Essen vom Teller hechelt“, geäußert in Bezug auf den sehr großen Hund der Familie, der mit seiner Schnauze immer auf den Tellern der Familienmitglieder lag (vgl. Boas 2011, 55). Trotz der scheinbaren Plausibilität einer solchen Analyse vertritt Boas (2010, 2011) die Position, dass die Annahme einer abstrakten „caused motion“Kon­struktion nicht funktionieren kann, da eine solche Konstruktion „zur Übergenerierung führen kann“ und weder attestierte noch sinnvollerweise als grammatisch möglich ausgewiesene Sätze wie „Fritz inhaliert das Buch vom Regal“ erzeugt (Boas 2011, 39). Während Goldberg durch die Annahme der abstrakten Konstruktion zwar erklären kann, wieso manche Verben eine Ausweitung ihres Valenzrahmens erfahren können, kann sie nicht erklären, wieso dies bei anderen nicht funktioniert. Als Lösung schlägt Boas  – ganz ähnlich wie Stefanowitsch  – vor, dass zunächst die Verben hinsichtlich ihrer semantischen Frames genauer analysiert werden müssen und dass mit einem framesemantischen Zugang zu Verben sowie mit Prozessen der Analogie die Fälle besser erklärt werden können und so die Annahme von abstrakten, schematischen Konstruktionen unnötig wird:

Was ist (k)eine Konstruktion? 

 569

The analysis outlined in this article contrasts with Goldberg’s (1995, 2006) constructional account which postulates independently existing meaningful constructions capable of supplying additional arguments to a verb’s argument structure. Whereas Goldberg argues in favor of such powerful entities, this article has shown that her analysis is problematic when it comes to limiting the scope of such constructions. By putting less emphasis on independently existing constructions for encoding purposes and focusing our attention on a more concrete level of analysis, such as conventionalized lexicalized instances of argument structures, the alternative presented above seeks to avoid the problem of overgeneration. (Boas 2011, 1295–1296)

Das würde in der Tat bedeuten, dass die von Goldberg angeführten Argumentstrukturkonstruktionen keine Konstruktionen sind, sondern lediglich als rein formale Muster, Satzbaupläne oder Verknüpfungsregeln gesehen werden müssen, für deren Erfassung andere theoretische Ansätze notwendig sind. Jacobs (2008, 2009) und Welke (2009a, b) setzen an der Debatte über Konstruktionen vs. Regeln/Muster an und machen einen konkreten Vorschlag für eine Kombination oder Komplementierung der Konstruktionsgrammatik mit einer etablierten, regelbasierten Grammatiktheorie, der Valenztheorie. Jacobs unterscheidet dabei zwischen von ihm so genannten „V-Kookkurrenzen“, d. h. „Kookkurrenzgesetzmäßigkeiten, die typische Kandidaten für eine Valenzbindungsanalyse sind“, und „K-Kookkurrenzen“, die Gesetzmäßigkeiten betreffen, „die typische Fälle von Konstruktionsbindung sind“ (Jacobs 2009, 496). Er stellt dabei die These auf, dass erstere weitaus häufiger vorkommen und den Regelfall des Sprachgebrauchs darstellen, letztere dagegen – und damit ist er in Einklang mit frühen Arbeiten zur Konstruktionsgrammatik – seltener, denn es handelt sich vor allem um solche Einheiten, die mit „Sprichwörtern, Redewendungen oder semantisch nicht-transparenten Phrasen verbunden sind“ (Jacobs 2009, 496). Selbst bei diesen sollte, so Jacobs (2008, 38), allerdings versucht werden, so weit wie möglich mit Valenzkonzepten zu arbeiten, die den Vorteil der Abstraktheit und somit auch Generalisierbarkeit haben, um zu verhindern, dass eine nicht mehr kontrollierbare Inflation von Konstruktionen zu Stande käme. Zu verhindern sei lediglich, dass die Valenzanalyse zu immer komplexeren Ad-hoc-Annahmen führen muss, um von den Vorhersagen und Erwartungen abweichende Valenzeigenschaften eines Verbs zu erklären: Der Grammatiker steht hier also zwischen der projektionistischen Szylla einer Ad-hoc-Analyse der involvierten Wörter (insbesondere ihrer Valenz) und der konstruktionistischen Charybdis einer Inflation komplexer Konstruktionen. Die Lösung dieses Dilemmas muss wohl in einer Synthese projektionistischer und konstruktionistischer Techniken bestehen, wobei die ersteren der syntaktischen Variabilität von Phraseologismen, die letzteren ihrer semantischen und teilweise auch formalen Festigkeit Rechnung zu tragen hätten. (Jacobs 2008, 38)

Während Jacobs gegenüber der Konstruktionsgrammatik sehr vorsichtig ist  – die Furcht vor der „konstruktionistischen Charybdis“ einer unkontrollierbaren Vermehrung von Konstruktionen ist bei ihm stark – ist Welke (2009a, b) deutlich offener, was den Status der Konstruktionsgrammatik angeht. Er sieht nicht vor, sie lediglich für

570 

 Wolfgang Imo

die Beschreibung formelhafter Einheiten zuzulassen, sondern plädiert für eine konsequente Kombination beider Ansätze. Seiner Ansicht nach ist die Frage nach dem Vorrang einer Valenzbeschreibung oder einer Konstruktionsbeschreibung unsinnig: Insofern ist auch das eine Frage nach Henne und Ei. Die im Lexikoneintrag enthaltene ValenzInformation ist die Information über die Konstruktionen, in denen ein Verb vorkommen kann. Und in Konstruktionen, in denen ein Verb vorkommen kann, steckt die Information über die Verben, die in die Konstruktion passen. Sprecher konstruieren Sätze in Hinsicht auf bestimmte Verben und wählen Verben in Hinsicht auf bestimmte Konstruktionen. Hörer bauen mit jedem Wort des Satzes Erwartungen über die wahrscheinliche Konstruktion auf und schließen aus der Konstruktion auf mögliche Verben. (Welke 2009a, 96)

Kombiniert man beide Ansätze, so kann dies nur einen Gewinn für die Analyse bringen, denn beide Theorien, die Valenztheorie und die Konstruktionsgrammatik zusammen, haben „ein Erklärungspotential, das keine für sich genommen hat“ (Welke 2009b, 515). Anhand einer Analyse von Valenzerweiterungen, wörtlicher gegenüber übertragener Bedeutung, der Diskussion von Polysemie und Homonymie und weiterer Phänomenen zeigt er, wie eine solche Kombination funktionieren kann. Trotz dieser Versuche ist allerdings eine echte Integration von Konstruktions- und Valenzgrammatik – ganz zu schweigen von der Integration der Konstruktionsgrammatik in andere Syntaxtheorien  – noch nicht weit fortgeschritten. Zukünftige Forschung wird zu zeigen haben, ob letztlich tatsächlich eine Kombination aus Ansätzen zum Erfolg führen wird oder ob es möglich ist, die Konstruktionsgrammatik als alleinige und umfassende Syntaxtheorie zu verwenden. Die erste Antwort auf die Frage, was (k)eine Konstruktion ist, hat also mit dem ungeklärten Zusammenhang und der problematischen Abgrenzung von Nicht-Kompositionalität und Rekurrenz zu tun. Beantworten lässt sie sich so, dass immer dann, wenn Nicht-Kompositionalität vorliegt, auch eine Konstruktion vorliegt. Offen ist, ob auch Rekurrenz als Kriterium für eine Konstruktion anerkannt wird  – in letzterem Fall könnte dann die Antwort tatsächlich lauten, dass alles syntaktische Inventar als Konstruktion beschrieben werden kann. Angesichts der Tatsache, dass Kompositionalität und Nicht-Kompositionalität ihrerseits äußerst problematisch zu bestimmen sind  – gerade aus pragmatisch begründeten Ansätzen heraus wird angenommen, dass es gar keine vollständig kompositionellen sprachlichen Ausdrücke geben kann, da immer zumindest pragmatische Informationen auf nicht-vorhersagbare Art hinzutreten –, wäre eine Alternative, dass man dann von Konstruktionen spricht, wenn man eine spezifische Konstruktionsbedeutung (einschließlich pragmatischer Funktionen) zuschreiben kann. Neben dem Spannungsfeld zwischen Konstruktion und Regel/Muster kann als ein zweites ungeklärtes Spannungsfeld das zwischen Konstruktion und prozessualer Strukturentfaltung von Sprache in interaktionalen Kontexten genannt werden. Gerade im Bereich der Gesprochene-Sprache-Forschung, Gesprächsanalyse und Interaktionalen Linguistik (Auer 2006a; Deppermann 2006a, b, 2011; Imo 2007a, b,

Was ist (k)eine Konstruktion? 

 571

2008, 2009, 2010, 2011a, b, c, 2012, 2014, 2015; Selting 2008; Fischer 2006a, b, 2007; Fried/Östman 2005; Günthner 2006, 2008a, b, 2009a, b, 2010; Zima/Brône 2011) wurde in den letzten Jahren viel mit der Konstruktionsgrammatik gearbeitet, die dank ihrer gebrauchsbasierten Orientierung und der Tatsache, dass sequenzielle, funktionale und prosodische Eigenschaften in die Konstruktionsbeschreibung integriert werden können, eine attraktive Syntaxtheorie bereitstellt. Selting (2008, 224) stellt fest, dass die Forschungsergebnisse der Interaktionalen Linguistik „well compatible with recent developments in empirical approaches to construction grammar“ seien, und Deppermann (2006a, 2011) geht sogar noch weiter, wenn er eine Verbindung von Interaktionaler Linguistik bzw. Gesprächsforschung und Konstruktionsgrammatik ausdrücklich begrüßt und darauf verweist, dass beide Ansätze voneinander profitieren können: Die Konstruktionsgrammatik profitiert von der strikt empirischen, allen Details Rechnung tragenden Methode der Gesprächsanalyse während umgekehrt die Gesprächsanalyse einerseits von dem durch die Konstruktionsgrammatik ausgeübten Druck profitiert, die empirisch gewonnenen Erkenntnisse zu systematisieren und zu verallgemeinern und andererseits die Konstruktionsgrammatik auch die „kognitive Lücke“ der Gesprächsanalyse schließen kann. Gesprächsanalyse und Interaktionale Linguistik können auf Grund ihrer methodischen und theoretischen Vorannahmen keine Aussagen über kognitive Aspekte der Sprache machen. Umgekehrt ist die Kon­ struktionsgrammatik gerade in diesem Aspekt besonders stark  – v. a. dann, wenn man die Arbeiten Langackers (1987, 2009) mit berücksichtigt. Trotz der potentiell engen Bezüge von Konstruktionsgrammatik und Gesprächsanalyse/Interaktionaler Linguistik ist auch hier die Frage „Was ist (k)eine Konstruktion?“ an vielen Stellen ungeklärt. Ein besonders zentraler Aspekt betrifft dabei die Tatsache, dass gerade bei empirischen Analysen von interaktionaler (v. a. gesprochener interaktionaler) Sprache häufig unklar ist, ob ein Phänomen nun eher unter der Perspektive einer musterhaften Verfestigung – und somit als Konstruktion – oder unter der Perspektive seiner prozessualen, den Zwängen der temporal organisierten Gesprächsorganisation geschuldeten Entstehung zu betrachten ist. Im letzteren Fall kämen eher nicht konstruktionsgrammatisch zu konzeptualisierende Begriffe wie „turn constructional units“ (Levinson 2000, 322–330), „Inkremente“ (Auer 2006b), „Reparaturen“ (Egbert 2009) o. ä. in Frage. Ein Bereich, in dem solche Probleme auftreten, ist beispielsweise der von Nachfeldbesetzungen durch Ausdrücke, bei denen entweder traditionell angenommen wird, dass sie nicht nachfeldfähig sind (z. B. Modalpartikeln) oder dass die Nachfeldbesetzung zumindest sehr markiert ist (z. B. Adverbien). So finden sich beispielsweise in Gesprächsdaten immer wieder Fälle, in denen die Modalpartikel halt im Nachfeld realisiert wird (Imo 2008). Die Frage ist dabei, ob solche Nachfeldbesetzungen nun in die Konstruktionsbeschreibung der Modalpartikel halt aufgenommen werden sollen oder ob man hier das konstruktionsgrammatische Feld verlassen sollte, um mit anderen, spezifisch für interaktionale und temporale Strukturentwicklung entwickelten Theorien zu arbeiten, wie beispielsweise der on line-Syntax von Auer (2000).

572 

 Wolfgang Imo

Hier werden die Definitionsgrundlagen von Konstruktionen wieder relevant: Nimmt man Rekurrenzaspekte mit als Definitionskriterium auf, so können beispielsweise bestimmte lokale und temporale Adverbien im Nachfeld mit Sicherheit Konstruktionsstatus beanspruchen (Imo 2011a). Schwieriger ist allerdings zu klären, ob unter einer engeren Konstruktionsdefinition  – beschränkt auf Kompositionalität  – ebenfalls Konstruktionsbeschreibungen sinnvoll sind oder ob nicht das Nachfeld an sich mit seinen Funktionen (z. B. Markierung von Nachträgen; Platz für äußerungskommentierende Einheiten) einfach jede dort platzierte Einheit im Sinne einer ‚coercion‘ anpasst, so dass keine besonderen Konstruktionen angenommen werden müssen. Auch bei der Analyse von Appositionen bestehen Probleme, hier vor allem in Bezug auf die Frage, wo die Grenze zwischen Appositionen und appositionsähnlichen Einheiten zu ziehen ist. Eine Äußerung wie „…sagte hans RATH, (.) präsident der HANDwerkskammer“ ist problemlos als Apposition zu werten. Die Funktion von diesen NP+NP-Konstruktionen besteht darin, eine zusätzliche identifikatorische Angabe bereitzustellen, um  – vor allem  – Personenreferenz sicherzustellen. Schon schwieriger wird es dann aber allerdings bei folgender Äußerung, wo die rechte Satzklammer zwischen die beiden Nominalphrasen tritt: „GEStern wurde doch mariAnne getauft. dein (-) URenkelchen“. Die Funktion ist die gleiche, die Struktur, zwei koreferente Nominalphrasen zu verbinden, ebenfalls, nur direkte Adjazenz ist nicht mehr gegeben. Soll nun der Konstruktionsbegriff einer Apposition entsprechend angepasst werden oder soll man irgendwo die Grenze ziehen und das erste Beispiel zu einer Apposition erklären, das zweite dagegen zu einer inkrementellen Nachtragsstruktur (d. h. also zu etwas, das von der Konstruktionsgrammatik nicht mehr erfasst werden kann oder muss)? Weitet man die Konstruktionsbeschreibung der Apposition aus, so führt dies allerdings letztendlich dazu, dass alle inkrementell gelieferten, funktional der Klärung von Bezugsnomen dienenden Ausdrücke zu Appositionen werden – eine wenig sinnvolle Lösung (vgl. Imo 2014, 2015). Worauf die noch zu klärende Frage schließlich hinausläuft, ist, wie mit der Arbeitsteilung zwischen Muster (d. h. Kon­ struktion) und offenem, emergenten, zeitlich progredienten Sprachgebrauch (wie in der on line-Syntax) umgegangen werden kann, ab wann also sinnvollerweise nicht mehr von Konstruktionen die Rede sein kann, sondern von Prozessen oder sequentiellen Strukturen die Rede sein muss.

4 Was ist (k)eine Konstruktion? – Ein Ausblick Die Arbeiten im Bereich der Konstruktionsgrammatik haben bislang gezeigt, dass es keine umfassende Sprachbeschreibung ohne die Annahme von Konstruktionen geben kann und dass zudem zumindest ein nicht unerheblicher Anteil einer Sprache aus Konstruktionen besteht. Diese Konstruktionen können rein spezifisch sein, d. h. lexikalisch voll spezifiziert, sie können lediglich teilweise lexikalisch spezifiziert sein

Was ist (k)eine Konstruktion? 

 573

oder sie können schließlich auch rein schematisch sein, d. h. ohne dass irgendwelche Stellen im Syntagma durch vorgegebene lexikalische Einheiten besetzt werden müssen. Unklar ist allerdings, wie groß der Anteil der Konstruktionen an einer Sprache genau ist, denn die Antwort auf diese Frage hängt mit dem gewählten Konstruktionsbegriff zusammen. Wählt man wie Stefanowitsch (2009) einen engen Konstruktionsbegriff, bei dem Nicht-Kompositionalität gegeben sein muss, so bedeutet dies, dass vorerst ein Teil der Sprache als rein formale Muster, Satzbaupläne oder Regeln konzeptualisiert werden muss – zumindest so lange, bis tatsächlich für alle diese Muster nachgewiesen ist, dass sie nicht-kompositionell sind. Dies gilt auch dann, wenn man statt des problematischen Begriffs der Kompositionalität als Definitionskriterium lieber das Vorhandensein spezifischer Konstruktionsbedeutungen und -funktionen wählt. Auch in diesem Fall kann es rein formale Muster geben, nämlich immer dann, wenn gezeigt werden kann, dass bei einem solchen Muster keine wie auch immer gearteten pragmatischen Informationen festzustellen sind, die für eine besondere Konstruktionsbedeutung sprechen. Wählt man dagegen den weiteren Konstruktionsbegriff, wie er von Goldberg (2006) vorgeschlagen wurde, ist die Aufgabe, Konstruktionen zu bestimmen, deutlich leichter: Wenn Rekurrenz ein Definitionskriterium ist, dann sind ja gerade hochgradig rekurrente, aber abstrakte Muster wie Fragesatztypen o. ä. genau wegen ihrer Rekurrenz als Konstruktionen zu werten, ohne dass sie unbedingt nicht-kompositionelle Merkmale aufweisen. Die Frage ist dann allerdings, welche Erklärungskraft der Konstruktionsbegriff in diesem Fall noch hat und ob nicht doch das Kriterium einer speziellen Konstruktionsbedeutung (inklusive pragmatischer Einträge) notwendig ist, um einen für wissenschaftliche Analysen nützlichen, d. h. weder zu weiten noch zu engen, Konstruktionsbegriff zu erhalten. Es läuft letztendlich unter anderem auch auf die Frage heraus, ob man nicht besser einen Theorien- und Methodenmix für die syntaktische Beschreibung einer Sprache verwenden sollte, in dem neben Konstruktionen sowohl abstrakte Regeln (oder Satzmuster, Satzbaupläne, Valenzmuster etc.) ihren Platz haben als auch gesprächsorganisatorische Routinen, Strukturzwänge, die aus der Zeitlichkeit der Sprachproduktion entstehen, kollaborative Phänomene, wie sie typisch für Sprachein-Interaktion sind etc. Die Frage, was (k)eine Konstruktion ist, muss daher also in der zukünftigen Forschung aus der Perspektive unterschiedlicher Ansätze, die sich mit der Analyse von syntaktischen Strukturen befassen, beantwortet werden.

5 Literatur Akmajan, Adrian (1984): Sentence types and the form-function fit. In: Natural Language and Linguistic Theory 2, 1–23. Auer, Peter (2000): On line-Syntax – oder: was es bedeuten könnte, die Zeitlichkeit der mündlichen Sprache ernst zu nehmen. In: Sprache und Literatur 85, 43–56.

574 

 Wolfgang Imo

Auer, Peter (2006a): Construction grammar meets conversation: Einige Überlegungen am Beispiel von ‚so‘-Konstruktionen. In: Susanne Günthner/Wolfgang Imo (Hg.): Konstruktionen in der Interaktion. Berlin, 291–314. Auer, Peter (2006b): Increments and more. Anmerkungen zur augenblicklichen Diskussion über die Erweiterbarkeit von Turnkonstruktionseinheiten. In: Arnulf Deppermann/Reinhard Fiehler/ Thomas Spranz-Fogasy (Hg.): Grammatik und Interaktion. Radolfzell, 279–294. Boas, Hans C. (2011): Zum Abstraktionsgrad von Resultativkonstruktionen. In: Stefan Engelberg/ Anke Holler/Kristel Proost (Hg.): Sprachliches Wissen zwischen Lexikon und Grammatik. Berlin, 37–70. Bücker, Jörg (2012): Sprachhandeln und Sprachwissen: Grammatische Konstruktionen im Spannungsfeld von Interaktion und Kognition. Berlin. Croft, William (2001): Radical Construction Grammar. Oxford. Deppermann, Arnulf (2006a): Construction grammar – Eine Grammatik für die Interaktion? In: Arnulf Deppermann/Reinhard Fiehler/Thomas Spranz-Fogasy (Hg.): Grammatik und Interaktion. Radolfzell, 43–65. Deppermann, Arnulf (2006b): Deontische Infinitivkonstruktionen: Syntax, Semantik, Pragmatik und interaktionale Verwendung. In: Susanne Günthner/Wolfgang Imo (Hg.): Konstruktionen in der Interaktion. Berlin, 239–262. Deppermann, Arnulf (2011): Konstruktionsgrammatik und Interaktionale Linguistik: Affinitäten, Komplementaritäten und Diskrepanzen. In: Alexander Lasch/Alexander Ziem (Hg.): Konstruktionsgrammatik III: Aktuelle Fragen und Lösungsansätze. Tübingen, 205–238. Diewald, Gabriele (2008): Die Funktion ‚idiomatischer‘ Konstruktionen bei Grammatikalisierungsprozessen – illustriert am Beispiel der Modalpartikel ruhig. In: Anatol Stefanowitsch/Kerstin Fischer (Hg.): Konstruktionsgrammatik II: Von der Konstruktion zur Grammatik. Tübingen, 33–58. Egbert, Maria (2009): Der Reparatur-Mechanismus in deutschen Gesprächen. Radolfzell. Fillmore, Charles J. (1988): The mechanisms of construction grammar. In: Berkeley Linguistic Society 14, 35–55. Fillmore, Charles J./Paul Kay/Mary Catherine O’Connor (1988): Regularity and idiomaticity in grammatical constructions: the case of let alone. In: Language 64 (3), 501–538. Fischer, Kerstin (2006a): Konstruktionsgrammatik und situationales Wissen. In: Susanne Günthner/ Wolfgang Imo (Hg.): Konstruktionen in der Interaktion. Berlin, 343–364. Fischer, Kerstin (2006b): Frames, constructions and invariant meanings: the functional polysemy of discourse particles. In: Kerstin Fischer (Hg.): Approaches to Discourse Particles. Amsterdam, 427–447. Fischer, Kerstin (2007): Grounding and common ground: modal particles and their translation equivalents. In: Anita Fetzer/Kerstin Fischer (Hg.): Lexical Markers of Common Grounds. Amsterdam, 47–66. Fried, Mirjam/Jan-Ola Östman (2005): Construction grammar and spoken language: the case of pragmatic particles. In: Journal of Pragmatics 37, 1752–1778. Goldberg, Adele E. (1995): Constructions: A Construction Grammar Approach to Argument Structure. Chicago. Goldberg, Adele E. (1997): The relationships between verbs and constructions. In: Marjolijn Verspoor/Kee Dong Lee/Eve Sweetser (Hg.): Lexical and Syntactical Constructions and the Construction of Meaning. Amsterdam, 383–389. Goldberg, Adele E. (1998): Patterns of experience in patterns of language. In: Michael Tomasello (Hg.): The New Psychology of Language. Mahwah, 203–218.

Was ist (k)eine Konstruktion? 

 575

Goldberg, Adele E. (2005): Argument realization: the role of constructions, lexical semantics and discourse factors. In: Jan-Ola Östman/Mirjam Fried (Hg.): Construction Grammars: Cognitive Grounding and Theoretical Extensions. Amsterdam, 17–44. Goldberg, Adele E. (2006): Constructions at Work: The Nature of Generalization in Language. Oxford. Günthner, Susanne (2006): ‚Was ihn trieb, war vor allem Wanderlust‘ (Hesse: Narziss und Goldmund). Pseudocleft-Konstruktionen im Deutschen. In: Susanne Günthner/Wolfgang Imo (Hg.): Konstruktionen in der Interaktion. Berlin, 59–90. Günthner, Susanne (2008a): Die ‚die Sache ist/das Ding ist‘-Konstruktion im gesprochenen Deutsch – eine interaktionale Perspektive auf Konstruktionen im Gebrauch. In: Anatol Stefanowitsch/Kerstin Fischer (Hg.): Konstruktionsgrammatik II: Von der Konstruktion zur Grammatik. Tübingen, 157–178. Günthner, Susanne (2008b): Projektorkonstruktionen im Gespräch: Pseudoclefts, die Sache ist-Konstruktionen und Extrapositionen mit es. In: Gesprächsforschung – Online-Zeitschrift zur verbalen Interaktion 9, 86–114. Günthner, Susanne (2009a): Extrapositionen mit es im gesprochenen Deutsch. In: Zeitschrift für germanistische Linguistik 37, 15–47. Günthner, Susanne (2009b): Adjektiv + dass-Satz-Konstruktionen als kommunikative Ressourcen der Positionierung. In: Susanne Günthner/Jörg Bücker (Hg.): Grammatik im Gespräch. Berlin, 149–184. Günthner, Susanne (2010): Konstruktionen in der kommunikativen Praxis: Zur Notwendigkeit einer interaktionalen Anreicherung konstruktionsgrammatischer Ansätze. In: Zeitschrift für germanistische Linguistik 37, 402–426. Hopper, Paul J. (2004): The openness of grammatical constructions. In: Chicago Linguistic Society 40, 239–256. Imo, Wolfgang (2007a): Construction Grammar und Gesprochene-Sprache-Forschung: Konstruktionen mit zehn matrixsatzfähigen Verben im gesprochenen Deutsch. Tübingen. Imo, Wolfgang (2007b): Der Zwang zur Kategorienbildung: Probleme der Anwendung der Construction Grammar bei der Analyse gesprochener Sprache. In: Gesprächsforschung – Online Zeitschrift zur verbalen Interaktion 8, 22–45. Imo, Wolfgang (2008): Individuelle Konstrukte oder Vorboten einer neuen Konstruktion? Stellungsvarianten der Modalpartikel halt im Vor- und Nachfeld. In: Kerstin Fischer/Anatol Stefanowitsch (Hg.): Konstruktionsgrammatik II. Tübingen, 135–156. Imo, Wolfgang (2009): Konstruktion oder Funktion? Erkenntnisprozessmarker („change-of-state tokens“) im Deutschen. In: Susanne Günthner/Jörg Bücker (Hg.): Grammatik im Gespräch. Berlin, 57–86. Imo, Wolfgang (2010): ‚Mein Problem ist/mein Thema ist‘ – how syntactic patterns and genres interact. In: Anja Wanner/Heidrun Dorgeloh (Hg.): Syntactic Variation and Genre. Berlin, 141–166. Imo, Wolfgang (2011a): Ad hoc-Produktion oder Konstruktion? – Verfestigungstendenzen bei Inkrement-Strukturen im gesprochenen Deutsch. In: Alexander Lasch/Alexander Ziem (Hg.): Konstruktionsgrammatik III: Vom Forschungsparadigma zu Fallstudien. Tübingen, 141–256. Imo, Wolfgang (2011b): Die Grenzen von Konstruktionen: Versuch einer granularen Neubestimmung des Konstruktionsbegriffs der Construction Grammar. In: Stefan Engelberg/Anke Holler/Kristel Proost (Hg.): Sprachliches Wissen zwischen Lexikon und Grammatik. Berlin (Jahrbuch 2010 des IDS), 113–148. Imo, Wolfgang (2011c): Clines of subordination: constructions with the German ‚complement-taking predicate‘ glauben. In: Ritva Laury/Ryoto Suzuki (Hg.): Subordination. Amsterdam, 165–190. Imo, Wolfgang (2012): Wortart Diskursmarker? In: Björn Rothstein (Hg.): Nicht-flektierende Wortarten. Berlin, 48–88.

576 

 Wolfgang Imo

Imo, Wolfgang (2014): Appositions in monologue, increments in dialogue? On appositions and apposition-like patterns and their status as constructions. In: Ronny Boogaart/Timothy Colleman/Gijsbert Rutten (Hg.): Extending the Scope of Construction Grammar. Berlin, 323–353. Imo, Wolfgang (2015): Zwischen Construction Grammar und Interaktionaler Linguistik: Appositionen und appositionsähnliche Konstruktionen in der gesprochenen Sprache. In: Alexander Ziem (Hg.): Konstruktionsgrammatik IV. Tübingen, 91–114. Jacobs, Joachim (2008): Wozu Konstruktionen? In: Linguistische Berichte 213, 3–44. Jacobs, Joachim (2009): Valenzbindung oder Konstruktionsbindung? Eine Grundfrage der Grammatiktheorie. In: Zeitschrift für germanistische Linguistik 37, 490–513. Lakoff, George (1987): Women, Fire and Dangerous Things. What Categories Reveal About the Mind. Chicago. Lambrecht, Knud (1990): „What, me worry?“ – ‚Mad magazine sentences‘ revisited. In: Proceedings of the 16th Annual Meeting of the Berkeley Linguistics Society, 215–228. Langacker, Ronald W. (1987): Foundations of Cognitive Grammar. Stanford. Langacker, Ronald W. (2009): Cognitive (construction) grammar. In: Cognitive Linguistics 20, 167–176. Selting, Margret (1993): Voranstellungen vor den Satz. In: Zeitschrift für germanistische Linguistik 21, 291–319. Selting, Margret (2008): Linguistic resources for the management of interaction. In: Gerd Antos/Eija Ventola/Tilo Weber (Hg.): Handbook of Applied Linguistics. Band 2. Berlin, 217–253. Stefanowitsch, Anatol (2009): Bedeutung und Gebrauch in der Konstruktionsgrammatik. In: Zeitschrift für germanistische Linguistik 37, 565–592. Verhagen, Arie (2009): The conception of constructions as complex signs. Emergence of structure and reduction to usage. In: Constructions and Frames 1, 119–152. Waalkes, Otto (1976): Das Vierte Programm (Schallplatte). Rüssl Räckords (Universal). Welke, Klaus (2009a): Valenztheorie und Konstruktionsgrammatik. In: Zeitschrift für germanistische Linguistik 37, 81–124. Welke, Klaus (2009b): Konstruktionsvererbung, Valenzvererbung und die Reichweite von Konstruktionen. In: Zeitschrift für germanistische Linguistik 37, 514–543. Zeschel, Arne (2011): Den Wald vor lauter Bäumen sehen – und andersherum: zum Verhältnis von ‚Mustern‘ und ‚Regeln‘. In: Alexander Lasch/Alexander Ziem (Hg.): Konstruktionsgrammatik III: Aktuelle Fragen und Lösungsansätze. Tübingen, 43–57. Zima, Elisabeth/Geert Brône (2011): Ad-hoc Konstruktionen in der Interaktion: eine korpusbasierte Studie dialogischer Resonanzerzeugung. In: Alexander Lasch/Alexander Ziem (Hg.): Konstruktionsgrammatik III: Aktuelle Fragen und Lösungsansätze. Tübingen, 155–174.

Sachregister A Adjektiv 63 f., 68, 82, 84, 87–91, 93, 100 f., 159, 164, 211, 240, 247 f., 252, 259, 377, 379, 388 f., 391 f., 426, 429, 434, 489 f., 495, 536, 557 f., 565 Adverb 62, 95, 120, 211, 247 f., 263, 489 Adverbial 12, 79, 112, 114, 161, 186, 190, 195, 198, 218, 338, 434, 512 Aktant 159, 170 f., 257 f., 412 Anakoluth 18, 337, 353, 372, 378, 382, 545 f. Analogie 5, 70, 80 f., 83, 126, 138, 140, 146 f., 302, 308, 327, 403, 408, 453, 455 f., 531, 568 Anapher 88, 90, 294, 300, 312, 316–319, 321, 323, 363, 414 f., 538 Apokoinu 18, 132, 139, 144, 353, 378, 386, 544 Aposem 125 f., 128 f., 131, 133 f., 140, 145, 148, 398, 400, 417 Apposition 93, 95, 198, 572 Argument 81, 88, 90, 155, 158 f., 165–168, 177, 185, 210 f., 217, 219–221, 255–266, 268–271, 273, 350, 407–409, 411 f., 513–515, 563 Argumentstruktur 79, 169, 219, 256–258, 268, 275 f., 450, 563, 568 f. Artikulation 48 f., 144, 382, 397, 399 f., 406, 414, 418, 528, 530 Attribut 12, 48 f., 51, 61–64, 68–70, 82, 84, 86–95, 101, 161, 219, 248, 250 f., 253, 311, 338, 495, 518–520 Aussage XIII, 37, 121, 160, 162 f., 171 f., 221, 249, 252, 286, 303, 310 f., 322, 352, 363, 379, 388, 391 f., 422 f., 503–506, 508 f., 518, 521 f., 532, 566 Äußerung 301, 309, 319, 345, 350, 352–354, 356–362, 364–366, 374, 376, 380 f., 386 f., 390, 398 f., 401, 407–410, 415–417, 422–424, 430 f., 433–435, 439 Autonomismus 280 f., 289, 292 B Beschreibungskategorie 284, 366, 370, 377 f. Bezugnahme → s. Referenz Bindung 93, 109, 148, 206, 299 f., 318 f., 323 Bindungstheorie 206, 299, 316–318, 320–322

C clause 28, 155, 159, 162, 174, 180–201, 232, 309 f., 554 Cours X f., 3, 8, 81, 126–129, 131, 145, 176, 398 D datengeleitet 485, 490, 492, 494, 498 f. Deixis 54 f., 62, 65 f., 69, 79 f., 85 f., 88, 90, 101, 312, 390, 410 f., 413 f., 429, 566 deontisch 532 f., 536, 557, 563 f. Dependenz 159, 246, 248, 251, 256, 259, 274 Derivation 94, 205 f., 209, 216, 219, 222, 227, 275 f., 426 diachron 6, 77, 80 f., 104, 121, 271, 323, 327, 458, 469, 471, 475, 477 f., 480, 498, 557 diagrammatisch 54, 70, 396, 409 f., 412 f., 415 f., 422, 436–439 Dialogizität 375, 468 Diffusion 527, 534, 540 f. Diskurs 446, 451, 455 Diskurslinguistik 445 f., 451, 454, 456 f., 503 f., 506 f., 512, 521 Diskursmarker 17 f., 22, 30, 32, 34, 508, 547, 560 f. Distribution 81, 119, 121, 126, 138, 142, 146 f., 206, 225, 263, 290–292, 493, 557 E Einheitenbildung IX, XII f., 18, 21, 42, 104, 126, 280, 345–350, 352 f., 355, 360 f., 396, 422–424, 431, 445 f., 455, 457 f., 503 Ellipse 17 f., 20, 22, 33, 82, 166–169, 199, 244, 279–281, 283–290, 292–294, 337, 351, 390, 534, 545 f. embodiment 180, 189, 191 emergent 95, 147, 180, 182, 184 f., 191, 193 f., 199–201, 492, 499 f., 541, 572 Erstspracherwerb 4, 77, 79 f., 82, 85, 92–94, 101, 125 f., 133–139, 142, 146 f., 209, 223, 534 Exemplifikation 67, 70, 125 f., 133–135, 137–139, 143–146, 385, 398, 400, 402, 404, 410, 416

578 

 Sachregister

F Form-Bedeutung 72, 125 f., 130–132, 148, 303, 456, 505, 520, 530, 546, 555, 558 Formulierungsverfahren 353, 381, 384 f. Frame 81, 135, 174, 257, 447–449, 452, 505–507, 515, 520, 537–539, 542 f., 546, 568 G Gattung 17, 21, 111, 168, 376, 451, 455 f., 471–473, 475, 493, 534, 555 f. Gebärde 145 f., 345, 396, 399, 409–411, 413 f., 422, 424–426, 435, 437 f., 445, 529 Gebärdensprache 48, 52 f., 72, 396–400, 406, 409 f., 412, 414–418, 422–424, 426 f., 430, 435, 437–439, 458 gebrauchsbasiert XI, XIII, 81, 85, 125–130, 133, 135, 139, 141–143, 146, 148 f., 271, 274, 396, 402, 404, 445–449, 453 f., 503–506, 511, 515, 517 f., 522, 553, 555, 566, 571 Generative Grammatik IX, XII, 3 f., 7, 9, 18, 48 f., 54, 59, 70 f., 81, 128, 130, 133, 137, 141, 157 f., 161, 176, 205 f., 208–210, 214, 216, 220, 228, 256, 259, 268 f., 275 f., 287, 300, 316, 318, 320, 405, 446, 454, 551 Genre 83, 472 f., 545 geschriebene Sprache 88, 128, 144, 163, 332, 335, 345–347, 349, 352 f., 371, 380 f., 503 f., 507–509, 511 f., 518, 522, 530, 541 Gesprächsanalyse 21, 29, 143, 335, 346, 348, 355, 359, 372 f., 376, 517, 561, 570 f. gesprochene Sprache 17, 33 f., 88, 98, 105, 108–110, 144, 169, 177, 332, 334 f., 337, 339, 346, 348, 352 f., 355, 370–373, 375–380, 382, 386–389, 391 f., 503 f., 507, 509 f., 512, 522, 527 f., 530 f., 534, 544, 546 Gesprochene-Sprache-Forschung 22, 33, 143, 285, 335, 346, 348, 352, 356, 528, 570 Geste 38 f., 41, 48–56, 58–72, 86, 144 f., 376, 390, 399, 409, 418, 422–424, 426–431, 435–438, 440, 530 Gestenraum 60, 429, 431 f. Grammatikalisierung 62, 77, 112, 114, 119, 265, 287, 415, 422, 424, 431, 437–439, 532 f., 558 f. Grammatikographie 86, 346 Grammatikunterricht 231, 234, 236, 238–243, 245, 247, 251 f. graphematisch 6, 8 f., 506, 531

H Handlung 21–23, 26, 28, 30, 34, 36, 39, 82 f., 133, 135, 160, 166, 168, 240, 242, 251, 285, 301 f., 308, 333, 375, 378, 385, 389, 405, 414, 432 f., 451, 455, 467, 493, 514, 516, 537 Hauptsatz 104, 111–113, 115–121, 140, 161, 183, 207, 217 f., 224, 274, 301, 337, 388 f., 391, 560 Hypotaxe 104, 106, 108–111, 244, 306 I ikonisch 62, 65–70, 72, 140, 397, 410, 412 f., 418, 422, 436–439 Illokution 21 f., 33, 104, 120 f., 160 f., 164–168, 171, 177, 226, 232, 285, 299, 302, 306, 407, 558 Implikatur 114 f., 299 f., 314–316, 318–320, 322 increment 28, 34 f., 37, 185, 195 f., 200 Index 86 f., 89, 91, 140 f., 396, 411–413, 453, 455 f., 467 Induktion 4 f., 85, 242, 252 f., 341 Infinitiv 116 f., 137, 158, 166, 225, 267, 275 f., 302, 339, 527, 532–534, 536 f., 557, 563–565, 567 Informationsstruktur XIII, 25, 168, 299 f., 308, 310 f., 314, 316, 559 Intension 63, 66, 68, 157, 163, 208, 269 Interaktion XII f., 14, 17–22, 27, 29–31, 33, 35 f., 38 f., 41–43, 82, 129 f., 133, 136 f., 139, 141 f., 144, 146, 166, 169 f., 181 f., 184 f., 189, 191, 194, 303, 316, 327, 345, 347–349, 354–359, 361, 363–365, 374–376, 379, 399 f., 405 f., 411, 417, 430, 446, 473–476, 480, 573 Interaktionale Linguistik 143, 335, 372, 386, 507, 561, 570 f. Interaktionsforschung 439 Intonationsphrase 23–26, 31 f., 34, 36–38, 338 Iteration 57 f., 422 f., 428, 430–436, 438 f. K Klassifikation 232 f., 250, 252, 280, 284, 286, 288, 294, 301, 431, 435, 456 Kognitionspsychologie 448–450 kognitiver Status 310 f., 313 f. Kollokation 130, 133, 139, 485–487, 490 f., 493–499, 507, 511 f., 518

Sachregister 

kommunikative Minimaleinheit 33, 160, 164, 168, 232, 281, 285, 366 Kompetenz IX–XI, 6 f., 12–14, 71, 83 Komposition 56, 71, 85, 91, 97 f., 131, 160, 174 f., 220–222, 227, 356, 405, 409, 413, 427, 450 f., 477–479, 511, 536, 551–553, 555 f., 563–565, 567, 570, 572 f. Konjunkt 290, 391, 565 Konjunktion 32, 113–115, 292, 305 f., 392, 489, 553 Konstituentenstruktur 9, 48, 53, 56, 72, 144, 256 f., 266, 274, 428 f. Konstituenz 9, 11 f., 28, 30, 32 f., 51, 53, 56, 58–62, 64, 71 f., 82, 87, 135 f., 138, 141, 171, 174, 207, 211 f., 215 f., 218, 227, 256, 260, 264, 310, 314, 317, 338, 377, 388, 407, 536 Konstruktikon 453, 504 f., 511, 513, 515–517, 520, 522 Konstruktion 11, 18, 49, 70, 78–82, 84 f., 87, 89–91, 98–101, 110, 118, 128, 130–134, 136–145, 147, 157, 164, 167, 172–178, 182, 184 f., 187, 189, 193–195, 197–201, 233, 257 f., 264, 271–273, 284, 286, 290, 293 f., 337, 345, 351, 360–362, 364, 366, 371, 375 f., 379, 381–383, 386, 391 f., 397 f., 400, 402 f., 405–411, 413–417, 424, 431, 434, 438 f., 452–457, 475, 493, 499, 504–511, 513–522, 527, 529–532, 534–547, 551–566, 568, 570–573 Konstruktionsgrammatik 70 f., 85, 126, 130, 132 f., 142 f., 145 f., 173 f., 233, 255 f., 267, 274, 276, 376, 439, 450, 452, 455, 480, 499, 503–511, 513, 515, 517 f., 521 f., 532, 537, 551 f., 554–556, 559, 562, 565–567, 569–572 Konstruktionsschema 81, 272, 361, 365–367, 448 konstruktivistisch 283, 464, 472, 478, 480 kontextkontrolliert 168, 280, 283, 286–288 Konvention 38, 53, 67, 70, 72, 115, 166, 210, 318, 379, 427, 450, 452 f., 455 f., 477, 505, 521, 538, 554, 567 Koordination 14, 38 f., 41, 59, 78, 98, 100, 162, 184, 289–294, 320, 428, 563 Kopula 91, 118 f., 164, 167, 309, 388 f., 559 Korpus 490, 492, 498 f., 511 f. Korpuslinguistik 450, 454, 485, 492–494, 499 Korreferenz 317, 322

 579

Kulturanalyse 451, 464–467, 469–473, 475, 477, 479 f. Kultursemiotik 466, 480 L langue 208, 231, 233, 235, 240, 243, 252 f., 310, 327, 334 f., 372, 398, 400–403, 405 let alone 552–554 Linking 199, 268, 505, 515 M Matrixsatz 301 f., 317, 388, 392, 544, 559–561 Mécanème 127, 399 f., 405, 417 Medialität 50–52, 69, 128, 142–145, 375, 397, 424, 435, 439, 465, 527, 530, 534, 544, 546 Medium 8, 14 f., 49 f., 52, 106, 109, 168 f., 377, 397, 439, 468, 474, 478, 528, 530, 541, 543 f., 547 Mehrworteinheit 77, 494, 496 f. Metapher 56, 71, 81, 134, 140 f., 257 f., 336, 403, 410, 414, 416, 447, 449, 455, 466 Minimalismus 8, 206, 210, 220, 222, 259, 316 Mitteilungseinheit 155 f., 162 f., 165 f., 168, 171, 177, 232, 235 Modalverb 116–118, 138, 224, 249, 339, 437, 532–534, 536, 544 f., 558 Modularisierung 99, 210 monomodal 67, 355 Monorhem 78 f., 99 f. move α 11, 216, 222, 224 multimodal 34, 38 f., 41 f., 48–53, 56, 60–62, 66 f., 70–72, 144, 181, 191, 355, 370 f., 373–377, 423 f., 430 f., 433–435, 439, 458 Mündlichkeit 98, 104, 106, 108, 110, 130, 143 f., 339, 347, 353, 378, 380, 446, 530 f., 533–536, 539, 547 Muster 4 f., 22, 59, 80, 83, 91, 97 f., 125, 130, 134, 139–141, 146–149, 163, 176, 215, 237, 240, 243, 245, 260, 271, 276, 300, 305, 310, 339, 341, 372, 379, 399–401, 404 f., 407–414, 416, 418, 423–426, 431, 434, 436, 439, 446 f., 450 f., 454–457, 467, 469–472, 475–480, 485 f., 490 f., 493, 498, 505, 507–510, 512, 517–519, 521, 532, 535 f., 538 f., 542–544, 551–553, 555–557, 561–570, 572 f. Musterbildung 398, 402, 404 f., 422–424, 430, 435, 439, 464, 469, 471, 478, 480

580 

 Sachregister

Musterhaftigkeit XIII, 233, 375 f., 452, 456 f., 467, 470, 472, 475, 481, 485 f., 490 f., 493, 499, 571 N Nebensatz 31, 104–106, 108–117, 121, 156, 161, 177, 183, 207, 226 f., 244, 248, 267, 336, 351, 372, 387, 391, 495 n-Gramm 487–490, 497 f., 515 Nomen 92 f., 96, 120, 138, 170, 247, 314 f., 318, 377, 389, 426, 429, 433, 439, 489 f., 539, 559 Nominalphrase XII, 26, 58, 80, 86 f., 89–93, 100 f., 158, 167, 220, 249, 259, 300, 311, 377, 389, 430, 433 f., 495, 535, 537, 572 Norm 12, 82 f., 89, 98, 100, 159, 163, 233, 241, 328, 334, 352, 371 f., 473, 479, 533, 535, 544 f., 547 f. O Objekt 8, 38 f., 65, 81, 108, 112, 120, 140, 166 f., 207, 217, 244, 246, 248, 259, 262, 269, 397, 401, 506, 513, 519 Online-Syntax 22, 42, 82, 98, 105, 143, 310, 370, 376, 417, 534 P Parameter 29, 41 f., 101, 109, 205 f., 209 f., 219 f., 223, 360, 397, 401, 410, 427, 429, 431, 437, 494, 496–498 Parasem 125 f., 128 f., 131, 133 f., 144 f., 398, 401 f. Parataxe 104, 108–110, 244 parole IX–XI, 126, 128–131, 140–142, 145 f., 157, 176–178, 208, 231, 233, 235, 239, 243, 245, 252 f., 310, 328, 335, 398–402, 405 Partikel 18–20, 22, 24, 26, 30, 32–34, 36–38, 79, 118, 164, 216, 224 f., 227, 304–306, 322, 557–559, 562 f., 571 Performanz IX–XII, 6 f., 14, 18, 54, 71, 128, 145, 208, 335, 375, 402 f., 469, 480, 500, 530 Phrasenstruktur 9, 11, 58, 92, 210–214, 216, 218–220, 222 f., 227, 249, 269, 446 Pivotkonstruktion 77 f., 83, 89, 99, 136 f., 139, 192, 407 Prädikat 26, 82, 87, 91, 101, 115–119, 121, 155, 158 f., 166 f., 170, 174, 176–178, 219, 221, 236 f., 244, 246, 248–252, 256 f., 264, 266, 308, 410, 506, 514, 564

Prädikation 84, 159, 165, 168, 170 f., 174, 210, 217–219, 221 f., 263, 265, 286 f., 363 f., 389 f., 513, 557, 560, 562, 565 Pragmatik XIII, 10, 22, 32, 85, 226, 299 f., 320, 333, 339, 451, 554 Projektion 36 f., 42, 141, 161, 169, 182 f., 185–187, 193, 201, 213, 219, 222, 255–259, 261 f., 266 f., 272, 274–276, 285, 350, 361, 376, 382, 392, 416 f., 559, 569 Pronomen 20, 36 f., 105, 116, 137, 159, 214, 247, 283, 316 f., 321 f., 407, 565 Proposition 21 f., 32 f., 79 f., 84, 91, 158–160, 162, 165, 167 f., 170 f., 174, 176 f., 195, 217 f., 232, 285, 292, 301 f., 305, 307, 390, 554, 557, 560 Prosodie 21–28, 30–32, 34 f., 61, 78 f., 109, 155, 163–165, 172, 189–191, 195 f., 199 f., 357, 359–365, 372 f., 376, 379, 388, 423–425, 429, 473, 480, 506, 555 f., 560, 565 f., 571 Prototyp 29, 67 f., 71, 80, 87, 90 f., 105, 132, 143 f., 165, 175, 177, 262 f., 265, 269, 276, 304, 307, 321 f., 352, 372, 379, 386, 389, 447, 453 f., 456, 528 f., 533, 535 f., 538, 543, 546 f., 564 f. R Reduktionismus 280 f., 289, 292 Reduplikation 424–426, 431–439 Referenz 20, 26, 32, 39, 41, 64, 66–68, 80, 84, 86–91, 100 f., 134, 144, 170, 314, 320–323, 358, 364, 388–391, 403 f., 407, 411–415, 531, 565, 572 Referenz-Aussage-Struktur 20, 132, 139, 144, 336, 363 f., 378, 381, 386, 391 Regel 5, 9, 12 f., 18, 35, 50, 58 f., 69–71, 80, 89 f., 99 f., 116, 130 f., 135, 137–139, 141–143, 147, 149, 155, 157 f., 165, 174 f., 177 f., 182, 207–210, 220, 223, 227, 233, 246, 266, 268, 273, 275, 281, 289, 304, 318, 335, 348, 353, 366, 372, 402–404, 407 f., 410–412, 416, 438, 446, 449, 452, 505, 508, 551, 556, 561–563, 567–569, 573 Regelwissen XI, 137, 141 f., 243 Rektion 18, 34, 65–68, 164, 217, 220, 223 f., 259–264, 267, 276, 316 Rekurrenz 125, 146, 439, 449, 457, 471 f., 477, 490, 493, 555 f., 567, 570, 572 f. Rekursion 49, 51, 56–58, 60, 72, 157, 161, 220–222, 227, 423 f., 428

Sachregister 

Relativpronomen 213 Rhema 78, 84 f., 101, 287, 309 S Satzart 234 f., 237, 243 f., 246 f., 251, 274, 284 Satzbauplan 260, 267, 271, 284 Satzdefinition 155, 157–159, 233 f., 283, 285, 350 Satzgefüge 104–106, 111 f., 156, 235, 244 Satzglied 118, 208, 231, 234–238, 243–253, 260 f., 263, 266, 284, 308, 336 Satzmodus 119–121, 160, 164 f., 171 f., 217, 225 f., 249, 252, 284, 302–306, 557 Schema 34, 78–83, 86–88, 90, 97–100, 128, 130–134, 138–141, 143, 145 f., 148, 162 f., 166, 173, 175–178, 180, 182, 189, 200 f., 211, 222, 235, 239, 243, 253, 271 f., 290, 318, 345, 360 f., 365 f., 398–400, 402–405, 407–409, 411–418, 434, 439, 446–457, 485, 493, 504, 508–511, 516, 522, 527, 542 f., 552, 557, 561–563, 568, 573 Schemabildung XI, 77, 99, 125 f., 134, 139, 143–149, 164, 397, 400, 404 f., 407–409, 411, 438 f., 527 Schematisierung → s. Schemabildung Schriftlichkeit XII, 72, 106–108, 110, 112, 143, 168, 339, 347, 530 f., 534–536, 538–541, 544, 547 Schriftsprachstandard 332 f. Schulgrammatik 233 f., 236–238, 242 f., 245–253, 294 Segmentierung 19, 21–23, 25, 27, 30, 32, 42 f., 53, 83, 94, 135, 138, 165, 211, 359, 398, 408 f., 427, 446 Semantik 10, 71, 85, 141, 174, 213, 220 f., 257, 262, 300, 376, 433 f., 447, 449 f., 455, 531 f., 537, 545 Semiologie → s. Semiotik Semiotik XII, 39, 50 f., 61, 126–131, 133 f., 140, 143, 145 f., 148 f., 155, 169 f., 177, 398, 401, 404 f., 416 f., 423, 434, 437, 455–457, 464, 467, 470, 528, 530 sentence 155, 159, 162, 164, 183 f., 187 f., 299, 309 f., 554 Signalisierungssystem 361 signifiant 12, 127, 129–131, 141, 148, 398 signifié 12, 127, 129–132, 140 f., 148, 398 Sprachakt 333, 339, 363 Spracherwerb 3, 223

 581

Sprechakt 22 f., 33, 120, 137, 159, 166, 171, 245, 247, 299–308, 337, 339–341, 406–408, 557 Standard 318, 327–331, 333–335, 337–341, 349, 353, 397, 451, 475, 534 f., 538, 541, 544 Standardvarietät 329, 331, 339 Strukturalismus X, 48 f., 70, 164, 256, 258 Subjekt 12, 18, 20, 81, 112, 159, 164, 167, 170 f., 174, 176–178, 207, 212, 217, 224, 237, 244, 246, 248–251, 259, 262, 266, 275, 308, 397, 474, 506, 558 Subjunktion 105 f., 112–116, 120 f., 208, 211 f., 214, 226 f., 336, 387, 391 f. Subordination 108 f., 226 f. Symbol 9, 59, 83, 87, 126, 134, 175, 177, 210, 403, 413, 451–457, 464, 466, 470, 478, 480 Symbolfeld 78, 80–85, 87 f., 90 f., 98, 101 synchron 5 f., 81, 148, 271, 276, 327, 469, 477 f., 480 syntagmatisch 83, 98, 100, 136, 138 f., 142, 147, 164, 402, 405, 407–410, 416 f., 423, 486 System X–XII, 3–6, 9 f., 12–15, 26, 29, 38, 50–54, 71, 81, 83, 88 f., 115, 126–131, 133 f., 136, 141–144, 148 f., 170 f., 176–178, 181, 207, 209 f., 231, 233, 235 f., 238, 240, 243, 245–247, 261, 310, 328, 333, 335, 360, 370 f., 378, 396–403, 407, 411, 415, 417 f., 423, 427, 437, 446–450, 452–457, 472, 478, 492, 499, 505, 528, 532, 544–548 T Taxonomie 301 f., 445, 447 f., 458, 499 Textgliederung 163, 357 Textkompetenz 231, 234, 239–243, 245, 251 Textlinguistik 51, 235, 346, 452, 472, 507 token 54, 62, 65 f., 71, 100, 133 f., 168, 173, 177 f., 187, 402, 411, 427, 430, 541 Turn 18 f., 21 f., 24–30, 32, 34–39, 41 f., 68, 169, 182–184, 186, 188 f., 191–195, 199–201, 346, 348, 356, 358, 360 f., 364 f., 408, 446, 542, 547, 564 Turnkonstruktionseinheit 20, 24–30, 34 f., 37, 39, 41, 180–185, 187–192, 194 f., 198–201, 345, 360–365, 571 type 71, 133 f., 148, 168, 173 f., 233, 402, 430, 453 Typenbildung → s. Typisierung

582 

 Sachregister

Typisierung XI, 48, 51, 53 f., 56, 70, 171, 377, 399, 405, 422, 430, 438, 464, 479 U Universalgrammatik 71, 77, 85, 223, 228 V Valenzgrammatik XIII, 79, 246, 249, 262, 350, 561, 570 Valenztheorie XII, 142, 255–257, 260, 265, 276, 286, 569 f. Variation 78, 99, 173, 192, 208, 220, 223, 225, 327 f., 347, 352 f., 365, 397, 412, 429, 431 f., 475, 509 f., 530, 534, 544, 558 Varietät 327 f., 334, 339–341, 349, 471 Verbalphrase 80, 170, 210 f., 219, 221, 249, 292, 512, 561 Verbstellung 112, 117, 119–121, 134, 172, 249, 252, 272, 380, 387, 391 f., 397 Vererbung 175, 255, 274 f., 505, 515 Virtualität 3, 7, 14 f., 259, 327, 411, 535, 557 Visème 399 f., 417

Vollsatz 155, 160–162, 165 f., 168, 177, 232 W Wortart 81, 85, 170, 236, 243–245, 247, 251 f., 259 Wortstellung 112, 171 f., 180, 183 f., 192, 268, 272, 274, 300, 310 f., 372, 381 Wortverbindung 490, 493, 498 X X-bar-Schema 210 Z Zeichen 50, 67 f., 70, 78, 81, 83, 85 f., 99, 126–134, 138, 140 f., 144 f., 148, 157, 163, 170, 172–175, 177 f., 233, 239 f., 271, 279, 333, 354, 377, 397–402, 404–408, 410, 412 f., 416–418, 423 f., 437, 439, 447, 449, 453, 455–457, 467, 474, 478, 528 f., 542, 547, 557, 563 f. Zeichentheorie → s. Semiotik