200 21 38MB
German Pages 192 [197] Year 1980
John Pheby Intonation und Grammatik im Deutschen
SAMMLUNG AKADEMIE-VERLAG 19
SPRACHE
John Pheby
INTONATION UND GRAMMATIK IM DEUTSCHEN 2., durchgesehene Auflage
Akademie-Verlag • Berlin 1980
Erschienen im Akademie-Verlag, D D R - 1 0 8 0 Berlin, Leipziger Str. 3—4 © Akademie-Verlag 1975 Lizenznummer: 202 • 100/170/80 Umschlag: Karl Salzbrunn Gesamtherstellung: VEB Druckerei „ T h o m a s M ü n t z e r " , 5820 Bad Langensalza Bestellnummer: 751 9 7 2 3 (7519) • LSV 0815 Printed in G D R D D R 15,— M
VORWORT
Mit der vorliegenden Arbeit wird versucht, die Beziehung zwischen Intonation und Grammatik im Deutschen zu zeigen. Als Ergänzung dazu ist der Aufsatz "Zur Analyse der deutschen Intonation" anzusehen, der in den "Beiträgen zur Geschichte der deutschen Sprache und Literatur" 94 (1972) erschienen ist. Darin werden die vorwiegend auditiv untersuchten intonatorischen Merkmale nach phonologischen Gesichtspunkten interpretiert, wohingegen es das Anliegen der vorliegenden Arbeit ist, die dort getroffenen phonologischen Abstraktionen in die grammatische Beschreibung einzubeziehen. Beide Arbeiten beruhen auf den Ergebnissen einer 1969 in Cambridge eingereichten Dissertation: "The role of intonation in colloquial German". Diese Ergebnisse werden hier im wesentlichen wiedergegeben, wobei zugleich versucht wird, die theoretischen Grundlagen, die dort vorausgesetzt wurden, in vereinfachter Form darzustellen. Die Untersuchung stützt sich weitgehend auf Gedankengänge und Publikationen von Prof. M. A. K. Halliday zur Sprachtheorie (s. besonders Halliday 1961) und zur Intonation (Halliday 1963a und b, 1967 und 1970a). Die sprachtheoretischen Arbeiten Hallidays stellen ihrerseits u. a. besondere Richtungen der Weiterentwicklung einer Sprachtheorie dar, die ursprünglich von Firth konzipiert und in zwei Sammelbänden besonders gut zugänglich gemacht wurde: Firth (1957b) und Palmer (1968). Eine Übersicht über die Entwicklung in einigen Aspekten seit den Arbeiten von Firth gibt die Festschrift Bazell, Catford, Halliday und Robins (Hrsg.): In memory of J . R . Firth (1966). Während des Entstehens und nach Abschluß der vorliegenden Arbeit haben Entwicklungen der Theorie in wichtigen Aspekten stattgefunden, die zwar berücksichtigt wurden, aber nicht in gebührendem Maße einbezogen werden konnten. Auch konnte hier die allgemeine Theorie nicht ausführlich erklärt werden, sondern es wird bei den meisten wichtigen Aspekten auf ausführlichere Arbeiten v e r wiesen. Andererseits besteht die Hoffnung, daß die Untersuchung einen B e i 5
trag zur Interpretation der empirischen Daten im Deutschen leistet, auf einem Gebiet also, auf das die genannte Theorie meines Wissens noch nicht angewendet wurde.
6
INHALT
1.
EINLEITUNG
9
1.1. 1.2.
Zielsetzung
9
Theoretische Voraussetzungen
10
1.3.
Einige Grundlagen
17
2.
INTONATION
31
2.1.
Zur linguistischen Funktion der Intonation
31
2. 2. 2.3.
Intonation in der linguistischen Beschreibung
39
Phonologische Kategorien
46
3.
GRAMMATIK
67
3.1. 3. 2.
Allgemeines
67
Die Rangskala - hierarchische Ordnung der Einheiten
69
3. 3.
Der Satz
72
3.4.
Realisierung und Differenzierung
79
3.5.
Der Teilsatz: Struktur und Systeme
86
3. 6.
Der Satz: Struktur und Systeme
107
4.
INTONATION IN DER GRAMMATIK
116
4.1.
Intonation in der komponentiellen und in der systematischen Beschreibung
116
4. 2.
Drei Arten der intonatorischen Realisierung
123
4. 3.
Einige Systeme im Deutschen
146
4.4.
Graphische Übersicht
172
Anmerkungen Zu Zu Zu Zu
Teil Teil Teil Teil
Bibliographie
1 2 3 4
176 177 178 180 183 7
1.
EINLEITUNG
1.1.
Zielsetzung
Mit der vorliegenden Arbeit soll beschrieben werden, welche Rolle die Intonation in der Grammatik der deutschen Alltagssprache spielt, wobei eine Abgrenzung einer besonderen, aber allgemeingültigen Sprachvariante als Gegenstand vorausgesetzt ist und unten ( 1 . 4 . ) vorgenommen wird. Die grammatischen Einheiten, die für die Zwecke dieser Arbeit als Funktionsbereiche der durch intonatorische Merkmale realisierten Kontraste gelten, sind der Satz, der Teilsatz und die Gruppe^. In Übereinstimmung mit den hauptsächlich in Teil 4 erörterten theoretischen Gründen für die Aufstellung von vorläufig getrennten grammatischen und phonologischen Analysen als Voraussetzung für ihre Integration (so paradox dies zunächst erscheinen mag) befassen wir uns nicht nur mit der F o r mulierung eines phonologischen, sondern auch eines geeigneten grammatischen Rahmens für eine Diskussion der Rolle der Intonation. So ergibt sich insgesamt eine Einteilung in drei Unterthemen: das phonologische Modell (Teil 2), das grammatische Modell (Teil 3) und der Versuch, beide zu integrieren (Teil 4). Unsere Darstellung unternimmt es keineswegs, a l l e
mög-
lichen intonatorisch realisierten Kontraste im Deutschen zu erklären, aber sie wird ihren Zweck erfüllt haben, wenn sie - bis zu einem willkürlich festgelegten Grad der Differenzierung - zeigen kann, welche A r t e n trasten durch das Mittel der Intonation realisiert werden,
wie
von Kondiese Kon-
traste realisiert werden, und wie sie in Zusammenhang mit anderen Kontrasten gebracht werden können, die mit grammatischen Kategorien zur B e schreibung desselben Gegenstandes formuliert werden müssen. Diese Ziele sind durch zwei Annahmen motiviert, die angesichts der Ergebnisse der neueren und gegenwärtigen Forschimg auf dem Gebiet der Intonation keineswegs selbstverständlich sind: erstens, daß eine Beschreibung der Intonation als Teil einer grammatischen Gesamtdarstellung überhaupt formuliert werden kann und sollte, und zweitens, daß gerade die hier angewendete Methode 9
geeignet ist, diese Aufgabe zu erfüllen. Ferner wird angenommen, daß die Richtigkeit beider Annahmen von Halliday in seinen Arbeiten zur englischen Intonation nachgewiesen worden ist (s. Halliday, 1963a, 1963b, 1967, 1970a). Die Nachteile, die andere Modelle nach unserer Meinung mit sich bringen, werden relativ zu unseren eigenen Zwecken gesehen, wobei ihr Beitrag zum Gesamtbild nicht geleugnet wird. Unsere Untersuchung geschieht im Rahmen eines grammatischen Modells, von dem angenommen wird, daß es auf Grund seiner Stellung in einer Gesamtauffassung der Sprache geeignet ist, nicht nur die Verhältnisse der internen Organisation der Sprachmittel zu beschreiben, sondern bereits die Möglichkeit enthält, die Rolle dieser Verhältnisse in der außersprachlichen gesellschaftlichen Umgebung, d.h. die kommunikative Rolle der - nach unserem speziellen Anliegen hauptsächlich intonatorischen - sprachlichen Verhältnisse abzuleiten.
1. 2. Theoretische Voraussetzungen 1. 2.1. Die oben genannte Annahme, nämlich, daß gewisse Auffassungen über den Charakter der Sprache in dem Aufbau des Beschreibungsapparats selbst eingebaut sind, ist natürlich nichts Neues - sie bestimmt den Gegenstand, die Form und den Aufbau jeder Theorie. Die allgemeine Auffassung der Sprache, z.B. als "Zeichensystem", als "der Kommunikation zugrunde liegendes System", als "gesellschaftliche Aktivität" oder als kreatives "Regelsystem" usw., bestimmt immer unsere Anforderung an die Sprachtheorie. Das hat in der modernen Linguistik bei einigen Schulen zur Betonung besonderer Interessen geführt, die - nur zum Teil mit Recht - als Einseitigkeit interpretiert wurde: Was bei einigen Theorien als Impuls zu wesentlichen Einsichten und zur raschen Entwicklung dieser Theorien angesehen wird, gilt bei Vertretern anderer theoretischer Standpunkte als Nebensache, als eine unter vielen Komponenten, sogar als "Anwendungsbereich" oder eben als eine Seite des Komplexes "Sprache". Wir meinen, daß apriorische Annahmen über die Sprache immer wesentliche, bestimmende Faktoren für den Aufbau einer Theorie 10
bilden und implizit oder explizit in der Theorie enthalten sind. Damit will nicht gesagt werden, daß Theorien in dieser Hinsicht eindeutig abgegrenzt werden können. Gerade die gegenseitige Beeinflussung sowohl zwischen Theorien der Sprachwissenschaft untereinander als auch zwischen der Sprachwissenschaft und anderen Disziplinen hat im Gegenteil zur Bereicherung einzelner Theorien und zu einem Gesamtbild geführt, das angesichts der kurzen Geschichte der modernen Linguistik recht fruchtbare Ergebnisse aufweist, weil ein solcher gegenseitiger Einfluß es gestattet hat, die Vielseitigkeit der Sprache nicht nur zu erkennen, sondern auch zu formulieren. So ist das Erkennen der Vielseitigkeit der Sprache einerseits ein Ergebnis der theoretisch bedingten Betonung einzelner Aspekte und andererseits eine Quelle für fruchtbare Ergebnisse in den einzelnen Nachbardisziplinen, die diese einzelnen Aspekte zu ihrem Gegenstand zählen. 1. 2.2. Wir gehen von der allgemeinen Annahme aus, die viele Theorien inhaltlich oder deklarativ - gemeinsam haben, daß die Sprache - selbst gesellschaftliche Aktivität - im System aller gesellschaftlichen Aktivitäten und E r scheinungen eine wesentliche Rolle spielt. Das besagt, daß die Sprache nicht nur hinsichtlich ihrer internen (systemhaften) Zusammenhänge, sondern auch hinsichtlich ihrer gesellschaftlichen Relevanz, d.h. hinsichtlich der Bedingungen ihrer kommunikativen Effektivität zu erklären ist. Der Begriff "Gesellschaft", der für unsere speziellen Zwecke nur in seinem allgemeinsten Sinn verwendet werden kann, bezieht sich im Zusammenhang mit der Sprache auf Verhältnisse, die äußerst vielfältig und verflochten sind. '.'Gesellschaftlich" umfaßt jede Sprechsituation und damit jedes Sprachereignis, insofern, als dieses nur in einer gesellschaftlichen (zwischenmenschlichen) Situation sinnvoll sein kann, und fällt andererseits mit der jeweiligen Sprachgemeinschaft zusammen, wobei natürlich gewisse Einschränkungen notwendig sind. Die Grenzen der "jeweiligen Sprachgemeinschaft" sind recht undeutlich und bedürfen noch einer speziell soziolinguistischen Klärung. Jedenfalls liefert das System selbst keine eindeutigen Kriterien, denn die Merkmale der verschiedenen Ebenen können unterschiedlich verteilt sein, was am Beispiel des Deutschen zu sehen ist: Phonetische, grammatische und lexische 11
Grenzen fallen nicht zusammen. Eine soziale Bestimmung der Sprachgemeinschaft hätte sich jedoch ihrerseits auf Merkmale des Systems zu berufen, aber auch - mit einer gewissen Vorsicht - auf die explizite Haltung der Sprecher zu dem, was sie als ihre Sprache und ihre Sprachgruppe auffassen, denn schon die Bezeichnung einer Sprache oder einer Sprachvariante, die über denldiolekt hinausgeht, ist eine Kennzeichnung der Gruppe, die sie spricht, und damit eine implizite Aussage über diese Gruppe. Auf die komplexen Verhältnisse, die dabei eine Rolle spielen, können wir hier nicht eingehen. 1 . 2 . 3 . Wenn wir annehmen, daß die Sprache eine gesellschaftliche Aktivität ist, die nur im Zusammenhang mit anderen gesellschaftlichen Aktivitäten, also im gesellschaftlichen Kontext, abläuft, und in einem Verhältnis der gegenseitigen Abhängigkeit und der gegenseitigen Bedingtheit zu diesem steht, und wenn wir daraus die weitere Annahme ableiten, daß die Beschreibung der Sprache zugleich zum Teil eine Beschreibung einer gesellschaftlichen Aktivität ist, dann haben diese Annahmen natürlich Implikationen für die theoretische Stellung dessen, was wir zunächst unverbindlich als "Sprachsystem" bezeichnen, und für dessen Beschreibung im Gesamtrahmen. Es wird nämlich u. a. damit impliziert, daß das System nur einen Teil dieses Gesamtrahmens darstellen und nicht als das einzige Anliegen und der einzige Gegenstand der Beschreibung gelten kann. Das Sprachsystem ist zwar als Ausgangspunkt für die Linguistik zu betrachten, weil gerade die Kategorien und die Methoden der Linguistik für die Erfassung der Systemeigenschaften der Sprache am adäquatesten sind. Andererseits kann das System nicht isoliert \ind selbständig betrachtet werden, weil die Linguistik letzten Endes auch die Aufgabe hat, die Rolle des Sprachsystems im gesamten gesellschaftlichen Zusammenhang zu zeigen. Eine Mindestforderung an die Beschreibung wäre demnach, den Weg zur Herstellung der Beziehung zum übrigen gesellschaftlichen Zusammenhang offen zu lassen. Eine strengere Anforderung wäre es, diesen Weg explizit zu ermöglichen. Es ist deshalb nicht notwendig, wie häufig behauptet wird, und sogar schwer, die Behauptung zu begründen, daß das System einerseits und seine Verwendung andererseits auseinandergehalten werden können, wenn wir die12
se Verwendung als die Verwendung zu kommunikativen Zwecken verstehen. Diese beiden Seiten der Kommunikation sind bei der Beschreibung zu berücksichtigen, wenn die gesellschaftliche (kommunikative) Relevanz der im System erfaßten Verhältnisse gezeigt werden soll. Eine etwas andere Betrachtungsweise unterscheidet zwischen competence und Performance. Nach dieser Auffassung wird die competence der Performance gegenübergestellt, wobei die competence "die Kenntnis des Sprecher-Hörers von s e i ner Sprache" und die Performance ("Sprachverwendung") "den aktuellen Gebrauch der Sprache in konkreten Situationen" bedeutet (Chomsky 1970, S. 13-14). Mit "Gebrauch der Sprache" wird jedoch nicht etwa die Verwendung zu kommunikativen Zwecken gemeint, sondern es geht hier um die Möglichkeiten und Bedingungen für die Realisierungen der in der competence gegebenen Regelmäßigkeiten. Auf jeden Fall ist die Performance nicht auf die "konkrete Situation" bezogen, sondern immer noch auf den idealen Sprecher-Hörer und ist eher im wörtlichen Sinne als "Leistung" des Sprecher-Hörers zu verstehen, insofern die Performance von solchen objektiven und subjektiven Einflüssen wie den "Begrenzungen hinsichtlich des Gedächtnisses, der Zeit und des Zugriffs" bedingt ist (Chomsky 1970, S. 19). Da die Idealisierungen competence und Performance unabhängig vom gesellschaftlichen Kommunikationsvorgang und anderen gesellschaftlichen Faktoren charakterisiert werden, bleibt die Frage: Wenn das System in sich geschlossen ist und ohne B e zug auf Verhältnisse außerhalb des Systems beschrieben wird, wie (in bezug worauf) wird däs System erklärt? Mit anderen Worten: Wenn die gesellschaftliche Relevanz der "Sprache" (competence) und der Sprachverwendung (Performance) durch Idealisierung aus der Betrachtung ausgeschlossen wird, wie ist sie dann wiederherzustellen? Die Beschreibung des Systems allein kann die Effektivität des Systems nicht erklären, denn diese Effektivität liegt in der Verwendung des Systems in der Kommunikation, und diese findet nur im gesellschaftlichen Zusammenhang statt. Chomsky behauptet (1970, S. 24), daß das Bestehen auf eine textbezogene Analyse "die Entwicklung einer Theorie der aktuellen Sprachverwendung" ausschließe, wobei wiederum auf die irreführende Gleichsetzung der Performance mit "Sprachverwendung" hinzu13
weisen ist. Er macht andererseits keinen alternativen Vorschlag zur Herstellung der Beziehung zwischen der Sprache und der gesellschaftlichen Situation, in der die Sprache ihre Funktion ausübt. 1.2.4. Die Feststellung, daß die Sprache eine wesentliche gesellschaftliche Aktivität ist, die zugleich eine Komponente aller gesellschaftlichen Aktivitäten darstellt, könnte in einem gewissen Sinn als trivial gelten, zumal kaum ein Sprachwissenschaftler diesen gesellschaftlichen Charakter der Sprache leugnen würde. Andererseits bleibt die allgemeine Bejahung dieses wesentlichen Aspekts zu einem großen Teil implizit, weil sie bis vor kurzem kaum auf die praktische Anwendving und noch weniger auf die Formulierung von Sprachtheorien einwirkte. F. de Saussure, der den konventionellen und damit gesellschaftlichen Charakter des Zeichens und des Zeichensystems betonte, entwickelte eine Theorie, die von zahlreichen Theoretikern u. a. deswegen kritisiert wurde, weil sie die Sprache von ihrer gesellschaftlichen Bedingtheit losgelöst habe. Bezogen auf Saussure und dessen theoretische Überlegungen allein wäre eine solche Kritik nur zum Teil berechtigt. Apresjan hält sie ebenfalls in den meisten Fällen für "unbegründet", denn Saussure "weist auf die Beziehungen zwischen Sprache und Gesellschaft... hin" (Apresjan 1971, S. 41-42). Ohne die Bedeutung der Saussureschen Theorie für die Entwicklung der Linguistik zu negieren, wäre zu bemerken, daß er keine Konsequenzen für die empirische Forschung aus den "Beziehungen zwischen Sprache und Gesellschaft" zog, und daß die wichtigsten von ihm beeinflußten Schulen des amerikanischen und des europäischen Strukturalismus mehr von den anderen von Saussure formulierten theoretischen Überlegungen profitierten, vor allem von seiner Konzeption des System Charakters der Sprache und von der Gegenüberstellung der synchronischen und diachronischen Aspekte. Es wurde vor allem die theoretische Arbeit zum Sprachsystem weiterentwickelt, und die Diskussionen innerhalb der verschiedenen strukturalistischen Schulen und zwischen ihnen liefen bei aller Verschiedenheit der Auffassungen letzten Endes auf eine Vervollkommnung und Fundierung des Beschreibungssystems hinaus.
14
Verglichen mit dem Systemaspekt der Sprache sind andere wichtige Aspekte des Verhältnisses zwischen Sprache und Gesellschaft noch recht unklar geblieben. Während eine Fülle von soziolinguistischen Arbeiten entstanden ist, die wesentliche Einsichten in einen speziellen Aspekt des Verhältnisses lieferten, nämlich der sozialen Bedingtheit sprachlicher Erscheinungen, kann nicht gesagt werden, daß die Arbeiten zum Sprachsystem in demselben Maße in Richtung auf eine Integrierung orientiert sind. Andererseits entstand erst durch die einseitige und manchmal sogar ausschließliche Beschäftigung mit den internen Eigenschaften des Sprachsystems und durch die Bemühungen um eine Vervollkommnung der Beschreibungsmethoden die Wissenschaftsdisziplin, die heute als Linguistik bezeichnet wird. Immer noch gilt das Sprachsystem als der zentrale Aspekt des durch die Linguistik zu erfassenden Bereichs, denn auch bei einer optimalen Integrierung in das Gesamtsystem der Gesellschaftswissenschaften liefert die Linguistik mit ihrem weit entwickelten Begriffssystem bzw. mit den verschiedenen Varianten von Begriffssystemen die Methoden, die am besten geeignet sind, den Aspekt der Sprache zu erforschen, den die Nachbardisziplinen gemeinsam haben. Die gewonnene "Autonomie" der Linguistik - wenn sie nicht verabsolutiert wird - ermöglicht damit erst eine sinnvolle Integrierung mit anderen Disziplinen. Um auf den gesellschaftlichen Charakter der Sprache zurückzukommen: Es «
kann die Frage gestellt werden, inwieweit es möglich ist, das Sprachsystem so aufzufassen, daß seinem gesellschaftlichen Charakter Rechnung getragen wird. Mit anderen Worten: Welche Möglichkeiten bestehen, die interne Organisation der Sprache mit geeigneten Kategorien zu erfassen und zugleich die gesellschaftliche Relevanz der sprachinternen Eigenschaften und Verhältnisse zu zeigen? In 1. 3. werden einige theoretische Vorstellungen skizziert, denen dieses allgemeine Ziel zugrunde liegt. Diese Vorstellungen beruhen auf bereits vorgeschlagenen, aber zum Teil unvollständig ausgearbeiteten Theorien, bei denen wiederum der Einfluß vorwiegend europäischer sprachtheoretischer Richtungen sichtbar ist. Zu den unmittelbaren Quellen verweisen wir auf das Vorwort und auf die dort enthaltenen Literaturangaben.
15
1. 2. 5. Ohne daß wir die Sprache hier auch nur annähernd vollständig definieren wollen oder können, legen wir zunächst fest, daß sie als gesellschaftliche Aktivität kein selbständig existierender Gegenstand ist, sondern in erster Linie ein in ein System gesellschaftlicher Aktivitäten integriertes Ereignis, genauer: eine Menge nach bestimmten Regelmäßigkeiten geordneter, strukturierter, organisierter Ereignisse. Es gehört zu den Aufgaben der Linguistik, die Regelmäßigkeiten zu erklären, die eine kommunikative Funktion, genauer: einen Komplex kommunikativer Funktionen der Sprache ermöglichen. "Erklären" bedeutet jedoch zweierlei: Zum ersten muß der Aspekt der Regelmäßigkeit erfaßt werden, den wir als die interne Organisation der Sprache (das Sprachsystem) bezeichnen können, d.h. die grammatischen, lexischen und phonologischen Verhältnisse und ihre Beziehungen zueinander. Zum zweiten, wenn das System der Regelmäßigkeiten nicht isoliert von seiner gesellschaftlichen Relevanz betrachtet werden soll, muß bei der Beschreibung die Funktion oder die Rolle dieser Regelmäßigkeiten in der Kommunikation berücksichtigt werden. Deshalb ist es notwendig, jedes sprachliche Ereignis und jede dazu gehörende Äußerung als Komponente einer konkreten Sprechsituation zu sehen und jede Komponente und Teilkomponente (etwa "Satz", "Wort" usw. ) als direkten oder indirekten Träger einer kommunikativen Funktion. Das Verhältnis zwischen der internen Organisation der Sprache und deren kommunikativer und damit gesellschaftlicher Funktion stellt eine Grenze, aber zugleich auch einen wichtigen Bereich für die Integrierung der Sprachbeschreibung mit anderen Disziplinen dar: Während die interne Organisation der Sprache eindeutig zum Gegenstand der Linguistik gehört, sind die Sprechsituation und die für die Sprache relevanten Aktivitäten unter anderem ein Teil des Gegenstandsbereichs der Soziologie. Die Kommunikationspartner bringen in die Sprechsituation das ein, was in früheren soziologisch und ethnographisch orientierten Theorien als ihre Kultur und damit die Kultur ihrer Sprachgemeinschaft bezeichnet wurde. Wir wollen die verschiedenen damit zusammenhängenden, vom Standpunkt der sprachwissenschaftlichen Forschung wenig untersuchten historischen, entwicklungsbedingten und ideologischen gesellschaftlichen Verhältnisse als das gesellschaftliche Bewußt 16
sein zusammenfassen. Dies ist ein wesentlicher Faktor sowohl der Kommunikationspartner wie auch der Sprache, deren jene sich bedienen, denn es ist wesentlich, daß dieses gesellschaftliche Bewußtsein selbst sprachlich fixiert ist und sprachlich vermittelt wird. Auf die spezielle Art dieser Verhältnisse können wir hier nicht näher eingehen. Wir begnügen uns statt des sen damit, solche Implikationen zu erörtern, die uns für die Untersuchung sprachlicher Regelmäßigkeiten, besonders, wenn sie intonatorische Erscheinungen betreffen, am relevantesten erscheinen.
1. 3. Einige Grundlagen 1. 3.1. Um die verschiedenen Aspekte der sprachlichen Aktivität speziell in ihrer Beziehung zur außersprachlichen Umwelt zu erfassen, werden mehrere aufeinander beziehbare theoretische Ebenen angenommen. Wir sind der Meinung, daß linguistische Aussagen nur dann die kommunikative Rolle der Sprache in der Gesellschaft zeigen, wenn sie auf konkrete Situationen und auf konkrete Äußerungen bezogen werden .können. Wir bezeichnen die Ebene, auf der bedeutungstragende Verhältnisse abstrahiert und in ihrem internen, ge genseitigen Zusammenhang beschrieben werden, als die Ebene der Form. Für diese Verhältnisse ist es notwendig, daß sie auf die konkrete außersprachliche Situation (die noch genauer zu spezifizieren ist) einerseits und die konkrete Äußerung (bzw. die konkrete Äußerungsabfolge) andererseits bezogen werden, damit die kommunikative Rolle der aus der Äußerung abstrahierten Komponenten gezeigt werden kann. Die konkreten Sprachvorgänge bezeichnen wir als "Substanz", so daß sich aus drei verschiedenen Bereichen drei theoretische Ebenen ergeben, die aufeinander zu beziehen sind: Situation, Form und Substanz (Abb. 1). Abb. 1 Situation Form
«A Substanz 17
Das hier dargestellte Verhältnis erfüllt nicht das geläufigere Konzept der Zuordnung von Laut- und Bedeutungsstruktur. Der Grund ist, daß die Beziehungen zwischen Situation und Form und zwischen Substanz und Form in Wirklichkeit indirekter - also mittelbarer - existieren, als hier dargestellt. 1. 3. 2. Die Ebene der Substanz umfaßt das physische - lautliche bzw. schriftliche - Medium der Kommunikation. Wir befassen uns natürlich lediglich mit dem lautlichen Medium. Es besteht keine direkte Beziehung zwischen der lautlichen Substanz und der Form als theoretischen Ebenen, da die Untersuchung der Sprachlaute durch die Phonetik nicht nur linguistische Aussagen liefert. Einen kurzen Überblick über die Anwendungsbereiche der phonetischen Forschung gibt Otto von Essen (1966), wobei wir von Essens Meinung nicht teilen, daß die Phonetik "als eine Naturwissenschaft gekennzeichnet" ist (1966, S. 1). Eher gilt, daß sie eine Reihe von Naturwissenschaften - vor allem die Physik, die Physiologie und die Psychologie - durch einen gemeinsamen, wenn auch komplex aufgeteilten Gegenstandsbereich integrativ verbindet. Wie von Essen zugleich hervorhebt, befaßt sich die Phonetik nicht ausschließlich mit dem Sprechen hinsichtlich seiner Relevanz für die Sprache im linguistischen Sinn, da z.B. die artikulatorische Aktivität eine Reihe von Vorgängen umfaßt, die nicht unmittelbar mit der sprachlichen Kommunikation zusammenhängen. Es besteht also kein Verhältnis der Identität zwischen den Gegenständen der Phonetik und der Linguistik, sondern ein Verhältnis der teilweisen Überlagerung. Die Relevanz der Untersuchung der Sprechvorgänge für die Linguistik ergibt sich erst aus ihrer Beziehung zur nächsten Ebene, zur Form, und zwar als phonologisches Verhältnis (s. unten 1.3.6.). 1. 3. 3. Die Ebene der Form wird als theoretische Ebene eingeführt, um die sprachinternen Zusammenhänge bedeutungstragender Regelmäßigkeiten, die ihrerseits vom lautlichen Medium getragen werden, zu erklären. "Bedeutungstragend" impliziert eine Beziehung zur Situation, eine Beziehung, auf die wir unten (1. 3. 4. -1. 3. 5.) zurückkommen. Die "Bedeutung" fassen
18
wir zunächst als eine Beziehung zwischen der Form und der außersprachlichen Situation auf. Die Verhältnisse innerhalb der Formebene können entweder grammatische oder lexische Verhältnisse sein, und die Beziehungen zur Situation werden entweder durch grammatische oder lexische Verhältnisse getragen. Wir befassen uns in der vorliegenden Arbeit ausschließlich mit denjenigen forma2
len Verhältnissen, die als grammatisch gelten . Eine detailliertere Darstellung des grammatischen Teils der Formebene, die unser Gesamtvorhaben voraussetzt, enthält Teil 3. Der zentrale Begriff der Formebene ist das System. Unter System wird zunächst eine auf ein bestimmtes Element in der grammatischen Hierarchie bezogene Selektion aus einer endlichen (meist kleinen) Menge möglicher Merkmale verstanden, wobei wir diese Charakterisierung im Laufe der grammatischen Beschreibung noch präzisieren müssen. Zu solchen geschlossenen Systemen gehören beispielsweise das System des Tempus, des Kasus, des Numerus usw. Das System des K a s u s , das auf die Nominalgruppe bezogen ist, enthält vier Selektionsmöglichkeiten oder sogenannte "Terme", nämlich Nominativ, Akkusativ, Genitiv, Dativ. Das System des
Numerus
ist äuf die Nominalgruppe und durch Rektionsverhältnisse auch auf die V e r balgruppe bezogen und enthält die Terme Singular und Plural. Diese Systeme gehören im Deutschen zu den einfachsten und am häufigsten beschriebenen Systemen. Wir werden sehen, daß die Grammatik des Deutschen - unter Verwendung der anderen noch zu spezifizierenden Kategorien - als ein Komplex solcher Systeme ausgedrückt werden kann, und daß mittels dieser die Beziehungen zur außersprachlichen Situation und damit die kommunikative Rolle der betroffenen Merkmale günstig dargestellt werden können. 1. 3. 4. Die Ebene der Situation umfaßt alle für die Sprache relevanten Merkmale der außersprachlichen Umwelt, die Gesamtheit der relevanten gesellschaftlichen und außergesellschaftlichen Umstände, unter denen die sprachliche Kommunikation abläuft. Sie umfaßt damit nicht nur jede einzelne Sprechsituation mit ihren relevanten Merkmalen, sondern auch alles das außerhalb der einzelnen Sprechsituation, was für das einzelne Kommunika19
tionsereignis relevant ist und sich in signifikanter Weise auf die Formebene niederschlägt. Faktoren, die nicht konkret in der einzelnen Sprechsituation vorhanden sind, beeinflussen - und bestimmen sogar - auf verschiedene Weise die verwendeten Sprachmittel und deren Funktion. Die Kommunikation erfolgt mittels eines (zum Teil auf der Formebene zu erklärenden) Systems von Zusammenhängen und Regelmäßigkeiten und eines Zuordnungssystems, das diese Regelmäßigkeiten auf die Situation bezieht. Beide Systeme liegen jedem Kommunikationsereignis zugrunde. Theoretisch erscheint es als notwendig, nach Ellis (1966a) zwischen der unmittelbaren Situation ("immediate situation"), in der das konkrete Kommunikationsereignis abläuft, und der "weiteren Situation" ("wider situation") zu unterscheiden, wobei diese Terminologie die Tatsache reflektiert, daß der Unterschied nicht polar, sondern graduell ist: Mit der "weiteren Situation" wird nicht die gesamte außersprachliche Situation, sondern eine in unterschiedlicher Hinsicht, in unterschiedlichem Grad angenommene Entfernung von der unmittelbaren Situation gemeint. Aus der Charakterisierung beider Situationen durch Ellis geht hervor, daß sie sich notwendig in komple3 xer Weise überlagern: "By immediate situation is meant everything relevant other than included under other heads (such as participants) in the place and at the time of the speech event. By wider situation is meant everything r e l e vant in the universe at any time. " (Ellis 1966a, S. 82. ) Es besteht eine gewisse Schwierigkeit darin, die oben angedeuteten gesellschaftlichen Erwägungen unter ihren verschiedenen Aspekten einzuordnen, wenn wir zum Unterschied von Ellis die "other heads" (die anderen Faktoren), insbesondere die Beteiligten ("participants") unter dem Begriff der "unmittelbaren Situation" einschließen, was wohl auf Grund ihrer Beziehung zur weiteren Situation - z.B. als Träger des Sprachsystems der gesamten Sprachgemeinschaft, das ihrer kommunikativen Aktivität zugrunde liegt - notwendig ist. Auch bei einer eindeutigen Charakterisierung der unmittelbaren Situation wäre es eine komplizierte Aufgabe,
sozial, regional und diachron unter-
schiedlich spezifierte Zwischenstufen zwischen der unmittelbaren und der am weitesten gefaßten weiteren Situation anzugeben. Die Notwendigkeit, die Be20
teiligten selbst als Merkmal der unmittelbaren Situation zu betrachten und die daraus resultierende Überlagerung der unmittelbaren durch die weitere Situation ergibt sich zum Teil daraus, daß der Beteiligte als Mensch auch nicht von seiner gesellschaftlichen und außergesellschaftlichen Umwelt getrennt betrachtet werden kann - er bringt, wie Firth mehrmals betonte, mit seiner Person zugleich seine über die Gesellschaft durch die Sprache v e r mittelte und in dieser fixierte "Kultur" in jede unmittelbare Situation ein (s. z . B . Firth 1935, 1950, 1951a). 1. 3. 5. Der Begriff der Situation als Ebene ist notwendigerweise vage, weil mit ihrer Charakterisierung als Gesamtheit der Umstände, unter denen die sprachliche Kommunikation abläuft, noch keine Beziehung zwischen Sprache und Situation hergestellt ist. Um die Verbindung zwischen der Ebene der Form und der Ebene der Situation herzustellen, wird eine "Zwischenebene" des "Kontextes" postuliert. Die Ebene der Situation hatten wir als außersprachlich angenommen. Nun ist es aber plausibel anzunehmen, daß, da die Kommunikation universell ist, alle Kommunikationsereignisse (in allen Sprachen) auf die Situation Bezug nehmen, wenngleich in einzelsprachlich v e r schieden expliziter Weise. Die Spezifizierung der einzelsprachlich realisierten Bezugnahme auf die Situation ist eine Aufgabe der Zwischenebene des Kontextes. Diese Zwischenebene reflektiert folglich die einzelsprachli4 chen Regularitäten in der Zuordnung von Form und Situation. Den Begriff der " k o n t e x t u e l l e n
Bedeutung"
wollen wir relational auffassen.
Die kontextuelle Bedeutung einer Einheit auf der Formebene ist demnach die Beziehung zwischen den Merkmalen dieser Einheit auf der Formebene und den korrelierenden Einheiten auf der Situationsebene. Im Rahmen der hier skizzierten Theorie wird der kontextuellen Bedeutung die "formale B e deutung" gegenübergestellt, die sich ausschließlich auf klassifikatorische 5 Verhältnisse auf der Formebene bezieht . Jede Ebene wird in ihren eigenen Termen behandelt: Für die Formebene gelten formale Kriterien und für die Kontextebene kontextuelle Kriterien. Um wiederum das einfache Beispiel des Numerus zu nehmen, enthält dieses System die Terme Singular und Plural. Auf der Formebene stellt Singular lediglich in bezug auf Plural ein 21
Verhältnis dar, das ein System des Numerus ergibt - und umgekehrt: Singular bedeutet "nicht Plural" und Plural bedeutet "nicht Singular". Die kontextuelle Bedeutung von Singular (bzw. Plural) kann vereinfacht als "bezogen auf ein Objekt (bzw. mehr als ein Objekt) in der Situation" aufgefaßt werden. Die kontextuelle Bedeutung ist deswegen spezifisch auf die Einzelsprache bezogen, weil sie von der formalen Bedeutung abhängt. In einer Sprache, in der das Numerussystem drei Terme besitzt, hat jeder Term eine andere formale und zugleich kontextuelle Bedeutung als in einer Sprache mit nur zwei T e r men. Die Terme Singular und Plural haben auf beiden Ebenen eine andere Bedeutung, wenn auch der Term "Dual" im System enthalten ist. Singular z.B. bedeutet dann formal "weder Dual noch Plural", kontextuell bedeutet es immer noch "bezogen auf ein Objekt". Der Term "Dual", der formal "weder Singular noch Plural" bedeutet, hat aber die kontextuelle Bedeutung "bezogen auf zwei Objekte in der Situation" und trägt damit einen Teil der kontextuellen Bedeutung von Plural in einer Sprache mit nur Singular und Plural. Der Term "Plural" hat dann nicht die kontextuelle Bedeutung "bezogen auf mehr als ein Objekt", sondern "auf mehr als zwei Objekte". Ein gutes, wenn auch ebenfalls einfaches Beispiel für die Funktion grammatischer Systeme in der weiteren und der unmittelbaren Situation stellen die Systeme der Personalpronomina, insbesondere die Subsysteme (die untergeordneten, differenzieteren Systeme) der zweiten Person dar. Im Standardenglisch besteht hier kein System, weil keine Selektion möglich ist - der Beteiligte, der als Angesprochener in der unmittelbaren Situation fungiert, wird mit you angesprochen. Zwischen einem und mehreren Angesprochenen wird auf der Formebene nicht unterschieden. Das System der zweiten Person im Französischen unterscheidet zwischen einzelnen und mehreren Angesprochenen, tu und vous. Je nach dem persönlichen Verhältnis zum Sprecher - eine Frage des Verhältnisses zwischen Sprecher und Hörer außerhalb der unmittelbaren Situation, in dem die gesellschaftliche Konvention als Merkmal der weiteren und der unmittelbaren Situation eine Rolle spielt - wird bei einem einzelnen Angesprochenen zwischen tu (familiär) und durch Selektion der Pluralform vous (formell) unterschieden, während bei mehreren Angesprochenen nur vous möglich ist. Dieses System im Französischen unterschei22
det also für den Sprecher zwischen tu-Personen und vous-Personen bei einzelnen, alier nicht bei mehreren Angesprochenen. Im Deutschen wird die Unterscheidung bei einzelnen und bei mehreren Angesprochenen beibehalten. Bei einzelnen wird zwischen du- und Sie-Personen unterschieden. Mehrere du-Personen werden mit ihr angesprochen, während Sie - und du-Personen kollektiv mit Sie oder ihr angesprochen werden, je nachdem, welches per sönliche Verhältnis in der jeweiligen unmittelbaren Situation für den Sprecher überwiegt. Auf viel komplexere Systeme und Zusammenhänge zwischen Systemen, insbesondere solche, die durch die Intonation realisiert werden, gehen wir im Laufe der Arbeit näher ein. 1. 3. 6. Die Tatsache, daß intonatorische Merkmale als Merkmale der lautlichen Substanz kontextuelle Bedeutung tragen, impliziert ein Verhältnis zwischen der Substanzebene und der Formebene, da die Form diejenige Ebene ist, auf der die Organisation der bedeutungstragenden Elemente als Selektionssysteme erklärt wird, und die demzufolge - über die Zwischenebene des Kontextes - in Beziehung zur sprachexternen Ebene der Situation steht. Die Phonologie ist eine abstrakte Zwischenebene, auf der jene V e r hältnisse aus der lautlichen Substanz abstrahiert werden, die linguistisch relevant sind. Auf dieser Zwischenebene werden die lautlichen Merkmale nur in ihrer Beziehung zur Formebene betrachtet. Die Phonologie als Zwischenebene ist aber insofern autonom, als die zu erklärenden Verhältnisse mittels eines Systems von speziell für die Beschreibung der lautlichen Merkmale geeigneten Kategorien erfaßt werden können. Das bedeutet - wie wir oben bei der Formebene feststellten -, daß die Kriterien für phonologische Aussagen der Ebene entnommen werden, auf die die Aussagen bezogen sind, und keiner anderen - z. B. der formalen - Ebene. Die Trennung der phonologischen Zwischenebene von der formalen Ebene geschieht weder aus arbiträren noch rein formalistischen Gründen: Sie bringt Vorteile für eine ökonomische Beschreibung der phonologischen Verhältnisse und deren Beziehung zur Formebene mit sich, auf die in Teil 2 und 4 in bezug auf die besonderen Merkmale der Intonation näher eingegangen wird. Es e r 23
laubt uns zunächst, von einer "phonologischen Bedeutung" der lautlichen Merkmale zu sprechen. Die phonologische Bedeutung des fallenden Tonhöhenverlaufs ist (ohne unsere endgültige Analyse vorwegzunehmen) "weder steigend noch weiterweisend", wenn man drei distinktive Verläufe annimmt. Die Unabhängigkeit solcher Aussagen von der Formebene ergibt sich daraus, daß "fallend" nicht immer mit derselben formalen Kategorie (z.B. "Aussagesatz") korreliert. Für die Aufstellung des fallenden Tonhöhenverlaufs als Term in einem System, in dem er zu den Termen "steigend" und "weiterweisend" in Kontrast (in Opposition) steht, genügt es, daß ein - oder auch mehrere - formale Kontraste vorhanden sind (s. dazu insbesondere 2. 3. und 4. 2.). 1. 3. 7. Gemäß den bisherigen Ausführungen besteht eine der Hauptaufgaben der linguistischen Beschreibung darin, Kommunikationsereignisse aus der Ebene der Substanz und aus der Ebene der Situation zu abstrahieren und über die Ebene der Form miteinander in Beziehung zu bringen. Unsere spezielle Aufgabe aber besteht darin, Merkmale der lautlichen Substanz zu abstrahieren und so darzustellen, daß ihr Verhältnis zur formalen Ebene gezeigt werden kann. Die formale Ebene ist diejenige Ebene, auf der kontextuelle Kontraste formalen Kontrasten zugeordnet werden. Unsere Aussagen sind auf Grund unserer Skizze wie in Abb. 2 einzuordnen. Abb. 2. Situation
t
Kontext
> Form
Phonologie
24
Diese Aufgabe kann allerdings im Rahmen der vorliegenden Untersuchung bei weitem nicht in allen Punkten erfüllt werden. Das hat seine Ursache vor allem darin, daß die Untersuchung situativer Merkmale und die Entwicklung der Kontexttheorie im Verhältnis zur Grammatiktheorie noch in den Anfängen steckt. Deshalb konzentriert sich die Untersuchung hauptsächlich auf die B e ziehung zwischen Substanz und Form. Dabei ist das folgende allgemeine Kriterium entscheidend: Wenn intonatorische Merkmale der lautlichen Substanz eine kommunikative Rolle in der Situation spielen, dann sind sie in ihrer B e ziehung zur Form und damit auch auf der Zwischenebene der Phonologie zu erklären. Gewisse Überlegungen dazu werden in Teil 2 entwickelt. 1. 3. 8. Unser kurzer Überblick hat einige Gebiete zusammengefaßt, deren Erforschung einen unterschiedlichen Entwicklungsstand erreicht hat, die aber in einer umfassenden Theorie der Sprache eine zentrale Stellung einnehmen müßten. Insbesondere ist das durch Firth in die Linguistik eingeführte Konzept der "context of Situation", dessen Herausarbeitung und explizite Formulierung Ellis weiterführte, zu berücksichtigen, wenn die Sprache im Verhältnis zum Sprachgebrauch erklärt werden soll. Denn ein solches Konzept ist notwendig zum Verständnis dessen, wie die Sprache ihre kommunikative Rolle spielt, d.h. wie sie in der gesellschaftlichen Umgebung funktioniert. Wir konnten kaum mehr tun, als die verschiedenen Aspekte in ihrem gegenseitigen Zusammenhang zu nennen und damit den allgemeinen Rahmen darzustellen, in den unsere Aussagen zur Funktion der Intonation einzuordnen sind. Dabei konnten wir in unserem beschränkten Rahmen nicht auf die komplizierten Verhältnisse und die Problematik eingehen, die mit den Ebenen und ihren gegenseitigen Beziehungen zusammenhängen. Die Aspekte, die für unsere Darstellung wesentlich sind, werden im weiteren Verlaufe näher herausgearbeitet. Zunächst genügt es für unseren Zweck, wenn die in diesem Abschnitt erörterten Begriffe, auf die wir uns später beziehen werden, dann als geklärt vorausgesetzt werden können.
25
1.4.
Untersuchungsfeld
1. 4 . 1 . Der spezifische Stoff, mit dem sich die vorliegende Arbeit befaßt, ist eine bestimmte relativ allgemeingültige Variante der Umgangssprache. Der Begriff "Umgangssprache" stellt eine Übertragung des englischen "colloquial German" dar, wobei mit "colloquial" noch keine soziale oder regionale Variante spezifiziert ist. Zu den größten Schwierigkeiten gehören gerade die intonatorischen Merkmale, die hinsichtlich der sozialen und r e gionalen Varianz wenig untersucht wurden. Die meisten Arbeiten auf dem Gebiet der Intonation befassen sich entweder mit der Hochsprache oder mit den Mundarten. Mit dem Hochdeutschen befaßten sich in den letzten Jahren explizit oder implizit u. a. von Essen (bes. 1964), Isacenko und Schädlich (1963, 1966), Trim (1964) und Bierwisch (1966) und mit explizit regionalen Varianten u. a. Martens (1952), der die Stadtmündarten von Hamburg und München detailliert untersuchte, Schädlich und Eras (1970), die genereller die regional bedingte Varianz eines bestimmten Satztyps in etwa 440 Orten der DDR untersuchten, und Gericke (1963), die gewisse Merkmale der Intonation der Leipziger Umgangssprache mit dem Hochdeutschen verglich. Die Phonometrie widmete dem geographischen Aspekt besondere Aufmerksamkeit (vgl. z . B . Zwirner, Maack und Bethge (1956)). In allen erwähnten Fällen sind die untersuchten Varianten eindeutig bestimmt: Sie sind entweder Hochsprache, Mundart oder städtische Umgangssprache. 1. 4, 2. Unser spezifisches Objekt bildet eine Variante der Umgangssprache. Wie jeder Begriff würde auch dieser natürlich erst durch seine Stellung innerhalb eines umfassenden Systems von Begriffen zur Einordnung einer Sprachvariante, d.h. durch seine Beziehung zu den anderen Begriffen des Systems, sei. s eigentliche Bedeutung erhalten. Die Erforschung der deutschen Sprachvarianten ergab trotz solcher Standardwerke wie z . B . der von Henzen (1954) und Moser (1960) noch kein eindeutiges, allgemein akzeptiertes Bezugssystem, in welches eine beliebige Stichprobe deutschen Sprachmaterials eingeordnet werden könnte. Jeder über die einzelnen Orte, Städte und Gebiete arbeitende Forscher ist häufig gezwungen, eigene ad-hoc-Katego26
rien einzuführen, während solche Arbeiten, die sich entweder allgemein mit Problemen der Kategorisierung der Varianten oder mit der Beschreibung der allgemeinen Sprachsituation befassen, meistens eher programmatischen Charakter tragen. Es gehört auch nicht zu den Aufgaben, die wir uns gestellt haben, eine Lösung zu diesem Problem vorzuschlagen, und die hier zu untersuchende Variante wird nicht eindeutig und rigoros definiert, sondern mit Hilfe von regionalen, sozialen und situativen Merkmalen ad hoc abgegrenzt. Während aber keines der Ergebnisse automatisch auf andere Varianten übertragen werden kann, wird unser Gegenstand hinsichtlich der grammatischen und intonatorischen Merkmale mehr mit der Hochsprache als mit irgendeiner auch städtischen - Mundart oder Umgangssprache gemeinsam haben. Die auffälligsten Unterschiede gegenüber der Hochsprache werden an den relevanten Stellen erörtert. Die meisten gegenwärtigen Arbeiten auf diesem Gebiet, d. h. auf dem bis jetzt unübersichtlichen Gebiet der Varianten, die hinsichtlich der regionalen und sozialen Stellung weder zur Hochsprache noch zu den VollMundarten gehören, befassen sich entweder mit sozialen Varianten innerhalb eines Dialektgebiets und beschränken sich weitgehend auf das Lautsystem, oder sie behandeln sozial und regional bedingte stilistische Abweichungen von der Norm in lexikalischer, syntaktischer und idiomatischer Hinsicht (z. B. Riesel 1964). Unser Problem ergibt sich daraus, daß nur wenige A r beiten die Umgangssprache mit Begriffen beschreiben, die so allgemein sind, daß sie entweder auf die Gesamtsprachgemeinschaft oder einheitlich auf die Teilsprachgemeinschaften bezogen werden können. 1. 4, 3. Worauf sich einige andere wichtige Arbeiten auf diesem Gebiet orientieren, ist sehr kurz, aber übersichtlich von Keller (1966) zusammengefaßt worden, und seine Definition der Umgangssprache wird in einer etwas präzisierten Form auch unseren Ausgangspunkt bilden. "Wängler's so-called 'Umgangssprache'" schreibt Keller (1966, S. 90) "is the everyday spoken register of northern Standard German. This is in fact what the term Umgangssprache has often denoted and still denotes. It is then simply the everyday conversational counterpart of the written Standard. " Weiter (S. 91): "It is now most often found in North Germany. For in North Germany spoken non27
dialectal forms seem to derive from the 'Schriftsprache', while in the centre and in the south spoken non-dialectal forms have arisen through the adaptation of the dialects to the Schriftsprache". Die von Wängler angeführte und von Keller zitierte situative Bedingung ist für unsere Darstellung wesentlich: "Wir haben hier unter "Umgangssprache" die u n g e z w u n g e n e
Unterhal-
tung verstanden" ((Wängler 1963, S. 8) Hervorhebung von mir - J . P . ) . Kellers Definition schließt hinsichtlich regionaler Merkmale natürlich nicht nur mundartliche, sondern auch nicht-norddeutsche regionale und städtische umgangssprachliche Varianten (z. B. Allgemeinsächsische bzw. Münchner oder Leipziger Umgangssprache) aus, die aber bei anderen Autoren (z.B. bei Kufner (1961)) ebenfalls als "Umgangssprache" gelten und für das jeweilige Gebiet oder die jeweilige Stadt auf sozialer und situativer Basis neu definiert werden. Es scheint ganz allgemein eine gewisse Diskrepanz zwischen regional und sozial orientierten Auffassungen des Begriffs "Umgangssprache" zu bestehen. Und tatsächlich können die beiden Seiten nicht voneinander getrennt werden. Umgangssprache wird meistens innerhalb des Regionalen unter Berücksichtigung sozialer Erwägungen spezifiziert oder umgekehrt (vgl. dagegen Riesel (1964)). Wir halten uns an Kellers Definition der Umgangssprache, und zwar deshalb, weil sie als Umgangsform für das gesamte Sprachgebiet gilt, d.h. weil sie gleichsam "regional unmarkiert" ist: Leipziger Umgangssprache z. B. ist - innerhalb des Gesamtsprachgebiets, und rein sozial und situativ - auch deutsche Umgangssprache, aber nicht umgekehrt. Um den Gegenstand nun etwas näher zu präzisieren, wollen wir unter deutscher Umgangssprache die Umgangssprache allgemein norddeutscher Prägung verstehen. Diese Variante liegt also etwas "unter" dem Hochdeutschen, auch wenn unter "Hochdeutsch" eine Variante verstanden wird, die von der Siebsschen Norm abweicht (Siebs 1961) und die der von Pilch behandelten Variante näher liegt (Pilch 1966). Wenn nämlich der Begriff Umgangssprache regionale Varianten einbeziehen und doch für die gesamte Sprachgemeinschaft gelten soll, wobei es sich dann um eine regional bedingte soziale Variante bzw. um eine Menge von sozialen Varianten handeln würde, dann könnte diese Menge von Varianten natürlich nur mittels sozialer und situativer Merkmale definiert werden, die den 28
Gebrauch dieser Varianten in dem jeweiligen Gebiet erforderlich machen. Dies charakterisiert ganz grob die von Riesel verwendete Methode (Riesel. 1964), die aber dazu führt, daß die sozialen und Strukturunterschiede in dem Verhältnis zwischen der Hochsprache und der jeweiligen regionalen und sogar nationalen Variante nicht zur Geltung kommen, z . B . die Tatsache, daß Umgangssprache und die schriftliche Norm in der Schweiz enger verwandt sind als in Sachsen und noch enger als in Norddeutschland. Keller nennt insgesamt drei Faktoren, die die "fluidity" der Umgangssprache als sozio-regionale Variante bestimmen: (a) the locality, (b) the social position and occupation of the Speaker, (c) the interlocutory Situation (1966, S. 92). Wir werden unten die von Keller vorgeschlagenen lokalen, sozialen und situativen Bedingungen innerhalb der norddeutschen Region als Kriterien zur Bestimmung unseres Gegenstandes übernehmen. 1. 4. 4. Die in den folgenden Teilen vorgeschlagene Beschreibung stellt eine Abstraktion und Verallgemeinerung gewisser Beobachtungen dar, die über drei Jahre hinweg in Berlin angestellt wurden. Zur Ergänzung dieser direkten Beobachtungen wurden Tonbandaufnahmen von Gesprächen gemacht, die in Gruppen von jeweils zwei oder drei Sprechern stattfanden. Die T e i l nehmer kannten sich bereits unabhängig von den Versuchsgesprächen, die in einer Umgebung stattfanden, welche bis auf das Vorhandensein der Aufnahmegeräte und die Anwesenheit des Aufnahmeleiters so "natürlich" wie möglich war. Das persönliche Verhältnis zwischen den Gesprächspartnern war entweder "zwanglos" (Kollegen, Kommilitonen), "familiär" (Freunde) oder "intim" (Ehepartner), und die Umstände waren derart, daß entweder eine dieser Kategorien oder zwei oder alle in beliebiger Kombination bei jedem Gespräch vertreten waren. Weitere Bedingungen bestanden hinsichtlich des Alters und der sozialen Stellung. Die Informanten waren Schüler, Studenten oder Universitätsabsolventen zwischen 18 und 28 Jahren. Das Bildungsniveau der Informanten reduzierte die Gefahr einer der gewählten Variante fremden lokalen Beeinflussung der zu untersuchenden Merkmale, während ihre Jugend, ihr persönliches Verhältnis zueinander und die Aufnahmebedingungen die e r wünschte Ungezwungenheit gewährleisteten. Die relevanten Merkmale der 29
Gesprächssituation entsprachen somit den Bedingungen, unter denen die direkten Beobachtungen stattfanden. Innerhalb der Gruppen war die sprachliche Homogenität durch die Übereinstimmung der Teilnehmer in ihrer Aussprache hinsichtlich der zu untersuchenden Merkmale gewährleistet. Sie waren sich ferner in den meisten Fällen darüber einig, daß sie "Hochdeutsch" sprachen, was aber als populäre Auffassung der untersuchten Variante gut entspricht. Wo eine solche Einigkeit nicht vorhanden war, wurden die betreffenden Sprecher besonders streng auf intonatorische Abweichungen kontrolliert. Bei B e r liner Sprechern wurde keine Abweichung beobachtet, während Sprecher aus dem sächsischen Raum auf Grund ihrer Abweichungen von der Analyse ausgeschlossen wurden. Das Ergebnis war, daß die untersuchte Sprache sehr gut mit der Variante übereinstimmt, die wir oben als "Umgangssprache allgemein norddeutscher Prägung" bezeichnet haben.
30
2.
INTONATION
2.1.
Zur linguistischen Funktion der Intonation
2.1.1. Im folgenden sollen einige Auffassungen von der Funktion der Intonation vom Standpunkt des besonderen Anliegens dieser Darstellung besprochen werden. Es wird eine beschränkte Auswahl von Autoren als Exponenten der in der einschlägigen Literatur auftretenden Richtungen genannt, wobei es sich hier nicht um Untersuchungsmethoden, sondern um das Verhalten zum Gegenstand handeln wird. Die Methoden der Einbeziehung intonatorischer Verhältnisse in die Gesamtbeschreibung werden unten (4) besprochen. Eine allgemeine Ansicht, die schon der klassische Strukturalismus in zahlreichen theoretischen und praktischen Einzelarbeiten mit Erfolg widerlegte, besagt, daß sich die Rolle der Intonation in der Kommunikation keiner systematischen Analyse unterwerfen läßt. Nach dieser Auffassung stellt die Grammatik (Syntax) das einzige systematische Mittel dar, die den einzelnen Sprechvorgängen zugrunde liegenden Regelmäßigkeiten zu beschreiben - mit anderen Worten: Sie sieht die grammatische Ebene als die einzige Ebene an, auf der generelle Feststellungen getroffen werden können
hingegen sei der
Gebrauch der Intonation als bedeutungstragende Komponente (falls sie überhaupt als bedeutungstragend angesehen wird) lediglich ein Merkmal der einzelnen unmittelbaren Sprechsituation, die gewisse weitere nichtlinguistische Merkmale ausdrücke, nämlich den seelischen Zustand des Sprechenden, sein Verhalten gegenüber dem Gesagten, der Situation, dem Inhalt usw. So schreibt z.B. H. Adolf, die sich mit Merkmalen besonderer Gattungen der l i t e r a r i schen Erzählung befaßt: "
as a rule, modern English, like French and
German, has separated these two elements of speech, [ d. h. Intonation und Syntax] fixing word order according to the rules derived from the pattern of association and report, and leaving the important element of intonation . . . to the initiative of the native speaker. " (Adolf 1944, S. 79.) Es wird jedoch zugleich bemerkt, daß "the verb standing at the beginning of the sentence denotes a change of pitch in the voice" (S. 72). So wird die Intonation der "Initiative" 31
des Sprechers überlassen, weil sie keine systematische Stellving in der Grammatik hat, obwohl sie ein "wichtiges Element" ist, das mit solchen grammatischen Erscheinungen wie der Spitzenstellung des Verbs korreliert. Ein inhaltlicher Widerspruch in den angeführten Aussagen besteht darin, daß einerseits eine Imprädiktabilität der Intonation angenommen wird, ander e r s e i t s grammatische Funktionen intonatorischer Verhältnisse angenommen werden. Schließlich überwiegt jedoch die Imprädiktabilität, denn da die Autorin selbst offensichtlich nicht über ein Beschreibungsmodell verfügt, das systematische Aussagen über die Interpretation erlauben würde, nimmt sie nicht an, daß ein adäquates Modell diese Aufgabe erfüllen müßte, sondern daß nur ad-hoc-Aussagen möglich sind. 2.1. 2. Einer zweiten Auffassung zufolge, die gerade bei vielen Sprachwissenschaftlern sichtbar wird, ist die Intonation zwar ein Bedeutungsträger und systematisch beschreibbar, ihre Rolle gilt jedoch als zum Grenzbereich der Linguistik gehörend, und die Intonation wird einer "sekundären" Stellung gegenüber der Grammatik einerseits und den anderen, "segmentalen" phonologischen Erscheinungen andererseits zugeordnet. Diese Auffassung vertritt u. a. Martinet, für den die Intonation gerade deshalb eine Nebenrolle spielt, weil die Kategorien seines Modells keine andere Möglichkeit zulassen: " . . . intonation cannot be denied some sort of linguistic value. But its operation does not fall within the double articulation, since the sign represented by the rise in pitch at the end does not fit into the succession of monemes, nor does it present a significans which is analysable into series of phonemes. The variations of the curve of intonation do in fact exercise complex functions difficult to unravel" (Martinet 1964, S. 76). 1968 schreibt Martinet: "Allgemein gesagt, sobald die Intonationserscheinungen für den Ausdruck der Nach- • rieht herangezogen werden, wird der eigentliche linguistische Bereich der diskreten Einheiten verlassen. . . . Es kommt hier darauf an, daß man sich nicht von den Fällen beeindrucken läßt, in denen gewisse Intonationserscheinungen eine Funktion besitzen, welche der Funktion eines phonematisch s i cher zu identifizierenden Morphems ähnlich ist. Die Tatsache, daß im Französischen ein Schlußtonanstieg oft denselben Wert besitzt wie das Morphem 32
est - ce - que / e s k / , besagt nicht, daß dieser Tonanstieg eine diskrete Einheit darstellt" (Martinet 1968 (1965) S. 200). 2.1. 3. Bloomfield und seinen Nachfolgern ist es gelungen, intonatorische Merkmale systematisch in das jeweilige phonologische Modell einzubeziehen. Bei ihnen wird die Intonation mit derselben für den Strukturalismus charakteristischen Rigorisität beschrieben wie alle sprachlich relevanten Erscheinungen. Jedoch besitzt die Intonation gegenüber diesen immer noch einen "sekundären" Status. Bloomfield selbst unterscheidet zwischen "primären" (segmentalen) und "sekundären" (suprasegmentalen) Phonemen (Bloomfield 1962). Auf den "phonemischen" und den "sekundären" Status der Intonation innerhalb strukturalistischer Modelle ist unten (4.1.) zurückzukommen. Wir beschränken uns hier auf die Bemerkung, daß die "phonemische" und zugleich "sekundäre" Rolle der Intonation in der Beschreibung bei Bloomfield und seinen Nachfolgern explizit als technischer Terminus formuliert wird. 2.1. 4. Da die Intonation während der langen Geschichte sprachwissenschaftlicher Forschungen vor dem großen Aufschwung in der Entwicklung der modernen Linguistik im 20. Jahrhundert kaum berücksichtigt wurde und ihre Beschreibung lange weit hinter der der syntaktischen und morphologischen Regelmäßigkeiten zurückblieb, ist es verständlich, daß ihr in späteren Untersuchungen auch dann eine sekundäre Rolle zukommt, wenn sie in die Beschreibung voll einbezogen ist. In den neueren Untersuchungen der europäischen Sprachwissenschaft scheinen häufig die Intonation und die Grammatik einen ähnlichen und gleichwertigen Status zu besitzen, aber nur bis zu einem b e stimmten Grad der Differenzierung. In diesem Zusammenhang kann Wodarz ausführlich zitiert werden, da seine Ansicht eine ganze Strömung in der Intonationsforschung vertritt: "Bekanntlich übt die Satzintonation einmal wesentlich syntaktische Funktionen aus, zum anderen werden mit ihrer Hille auch gefühlsmäßige Stellungnahmen des Sprechers zu dem Gesagten angezeigt" (1962, S. 800). Weiter: "Von der primären Leistung der Satzintonation, von der Kennzeichnung syntaktischer Kategorien, ist die sekundäre Leistung, nämlich die Anwendung im expressiven Bereich zu trennen: die Kadenz, die 33
gebraucht wird, wenn der Sprecher dem Gesagten emotionell relativ indifferent gegenübersteht, besitzt wiederum ein unveränderliches intonatorisches Merkmal, das sie von denjenigen Kadenzen unterscheidet, die bei einem Vorhandensein von gefühlsmäßigen Stellungnahmen angewendet wer den. Letztere weisen ihrerseits ein gemeinsames invariables Merkmal auf, das sie von e r s t e r e r unterscheidet" (1962, S. 802). (Vgl. auch Wodarz 1960.) Diese repräsentative Formulierung'' geht zwar nicht so weit, daß sie der expressiven Sphäre zugeordnete intonatorische Merkmale aus der Beschreibung ausschließt, sie besteht aber auf der Unterscheidung zwischen zwei Bereichen, nämlich dem "syntaktischen" und dem "expressiven", und impliziert damit, daß in der Gesamtbeschreibung keine konsequente Anwendung derselben Beschreibungsmethoden auf alle intonatorischen Erscheinungen möglich ist. Dies wird von Hammarström (1966) als ein allgemeines Prinzip der sprachwissenschaftlichen Untersuchung schlechthin formuliert. Wenn auch das Erkennen dieser verschiedenen Sphären - vor allem seitens der Prager Schule - neue und interessante Fragestellungen in den Bereich der Sprachtheorie brachte, so wurde dach das Problem der sprachwissenschaftlichen Erfassung der relevanten Erscheinungen damit nicht gelöst (s. andererseits unten 2. 2. 2.). Eine ähnliche Unterteilung schlägt Hammarström vor, die er als eine Unterscheidung zwischen verschiedenen "Ebenen" formuliert, von denen für unsere Diskussion lediglich die Ebenen " a " und "ß" von Interesse sind, wobei "a" die Ebene bezeichnet, auf der sprachliche Erscheinungen hinsichtlich ihrer linguistisch relevanten Merkmale beschrieben werden, während "ß" die Ebene bezeichnet, auf der beschrieben werden kann, "wie" gesprochen wird, also die expressive Ebene (Hammarström 1966). Eine systematische Arbeit über das Deutsche, die im Sinne dieses Prinzips durchgeführt wurde, ist die Untersuchung der hochdeutschen Intonation von Isacenko und Schädlich. Die Autoren verweisen mit Recht nicht auf theoretische, sondern auf methodologische Vorteile eines solchen Prinzips und e r klären ihre Methode so: "Will man der Intonation als einem System informationstragender Elemente beikommen, so kann man nicht von modalen Konnotationen, von stimmungsbedingten Nuancen oder von möglichen Paraphrasen ausgehen" (Isacenko und Schädlich 1966, S. 42). Diese Formulierung ist u. E. 34
richtig, denn sie erlaubt es i m
P r i n z i p , von den gröberen, ganz offen-
sichtlichen linguistischen Unterschieden zu den feiner differenzierten Unter schieden oder "Nuancen" überzugehen, und zwar innerhalb desselben B e schreibungsapparates. Die Annahme einer eindeutigen Grenze zwischen einem zentralen und periphären Bereich desselben Gegenstands würde theoretische und praktische Einschränkungen mit sich bringen, die den oben genannten Übergang schwierig, wenn nicht unmöglich machen würden. Auf diese Frage kommen wir unten in 2. 2. zurück. 2.1. 5. Man könnte sagen, daß die deutsche Intonation im allgemeinen vom phonetischen Standpunkt mit mehr Erfolg beschrieben worden ist als vom linguistischen, da dort wenigstens eine relative Übereinstimmung über die verwendeten Kategorien und über den Gegenstand herrschte und eine Fülle von eindeutigen Ergebnissen erzielt wurde, während die linguistische Interpretation bis vor kurzem von den Vorteilen der strukturalistischen Tradition nicht profitierte. Häufig sind die vorgeschlagenen Erklärungen der phonetischen Merkmale, die eindeutig linguistisch und damit phonologisch relevant sind, gerade deshalb nicht stichhaltig, weil sie nichtlinguistischen Bereichen entnommen sind. Es scheint, daß man die Notwendigkeit einer Beschreibungsebene anerkennt, die außerhalb der phonetischen Beschreibungsebene liegt, auf die das Beschriebene bezogen werden kann, und daß diese Notwendigkeit nicht erfüllt wird - oder nicht als erfüllt betrachtet wird - durch irgendeinen bestehenden phonologisehen Beschreibungsmechanismus. So b e rufen sich einige Phonetiker auf solche Kategorien wie "Sinneinheit", "sense group" usw.,. s. z.B. O'Connor und Arnold (1961) (für das Englische) und Delattre, Poenack and Olsen (1965) (für das Deutsche). Die letztgenannten Autoren stellen sogar u.a. fest: "Most frequently the end of one thought and the beginning of the next unite without interruption" (Delattre, Poenack and Olsen 1965, S. 137). In der Terminologie der vorliegenden Darstellung würde dies bedeuten, daß normalerweise zwischen Tongruppen keine Pausen auftreten (s. dazu 2. 3. und 4. 2.). Wenn auch möglicherweise eine allgemeine intuitive Übereinstimmung über die Bedeutung der Begriffe "Gedanke", "Sinneinheit" usw. besteht, so erscheint es doch kaum notwendig zu bemerken, daß 35
sie linguistisch undefinierbar sind. Es bleibt auf jeden Fall notwendig, parallele Aussagen auf der linguistischen Ebene zu treffen, um die Intonation, soweit sie linguistisch relevant ist, auch in linguistischen Termen 3
behandeln zu können.
Die Aussagen und Definitionskriterien erhalten dann
ihre Gültigkeit dadurch, daß sie derselben Abstraktionsebene entnommen sind, auf der sie auch verwendet werden. Diese einfache Wahrheit ist in der Grammatiktheorie schon längst erkannt worden. 2.1. 6. Otto von Essen, der 1964 eine inzwischen allgemein angenommene, auf einer Selektion zwischen drei Tonmustern beruhende Analyse der deutschen Intonation vorschlägt, sucht neben den postulierten grammatischen Korrelaten auch gewisse psychologische Korrelate: "Um Melodie zu gestalten, bedarf es einer seelischen Motivierung und einer ordnenden gliedernden Kraft. E r s t dann wird sie Ausdruck eines seelischen Geschehens und ganzheitliche Gestalt" (von Essen 1966, S. 167). Von Essen erklärt auch die melodischen Typen unter Berufung auf seelische Motivierung. Gemeinsam mit Martinet (1964) sieht er z.B. eine solche Motivierung für den fallenden Verlauf der Tonhöhe, wenn das Ende einer Äußerung erreicht wird. Da von Essen einige grammatische Korrelate der drei phonologischen Hauptklassen der Intonationsmuster (fallend, steigend und weiterweisend), die sich in der funktionalen Terminologie widerspiegeln (terminal, interrogativ resp. progredient) eindeutig feststellt, ist die Notwendigkeit kaum einzusehen, sich über diese Beschreibung hinaus auf Kriterien des psychologischen Aspekts zu berufen. Inzwischen hat Lieberman über interessante Experimente berichtet, in denen versucht wird, den Zusammenhang zwischen der Artikulation erkannter linguistisch relevanter Merkmale und psychologisch/physiologischen Prozessen herzustellen (Lieberman 1967). Verschiedene Aspekte der oben genannten Arbeiten werden - vor allem hinsichtlich der phonologischen Implikationen - anderwärts besprochen (Pheby 1969 und 1972). 2.1. 7. Die Auffassungen, die in diesem Überblick kurz besprochen wurden, sollten verschiedene, aber unmittelbar relevante Standpunkte einschließen: stilistische, phonetische und linguistische. Unsere Bemerkungen bezo36
gen sich u. a. auf Auffassungen von Wissenschaftlern, die eine systematische Funktion der Intonation nicht annehmen, solche, die diese akzeptieren, aber auf einen zentralen "linguistischen" Bereich beschränken, den sie vom "expressiven" Bereich streng unterscheiden, und solche, die bei Annahme einer systematischen Funktion die Intonation einer "sekundären" Stellung in der Gesamtbeschreibung zuordnen. Auf Grund der bisherigen positiven Ergebnisse, die vor allem der V e r dienst des klassischen Strukturalismus sind, setzt die vorliegende Untersuchung mit einer gewissen Sicherheit voraus, daß die Intonation tatsächlich eine wichtige linguistische Rolle spielt und daß diese Rolle in ein Gesamtsystem linguistischer Aussagen einbezogen werden kann und muß. 2.1. 8. Zur Frage der emotionalen (vs. linguistischen) Funktion der Intonation wäre noch zu bemerken, daß - relativ zur Gesamtmenge der Untersuchungen der Intonation - die emotionale Funktion kaum untersucht worden ist. Die Sprachwissenschaftler, die eine Grenze zwischen beiden Funktionen postulieren, berufen sich selten auf Ergebnisse, die die emotionale Funktion bestätigen, oder auf Forschungen, die diese untersuchen. Daß die Intonation eine emotionale oder "expressive" Funktion hat, wird aber in der Diskussion vorausgesetzt, jedoch nicht mit der Begründung, daß es eine praktisch sehr günstige Annahme ist, die der Intuition gut entspricht, sondern daß es "bekanntlich" der Fall ist (s. oben 2.1. 4. zu Wodarz). Hier wird die Annahme an sich nicht in Frage gestellt, sondern die häufig daraus abgeleitete Implikation für die linguistische Beschreibving. Ein Sprachwissenschaftler, der die expressive Funktion als bekannte Tatsache voraussetzt und die emotionale Funktion der linguistischen gegenüberstellt, hätte folgendes zu zeigen: 1. daß die Intonation eine emotionale oder "expressive" Funktion hat, 2. worin diese Funktion besteht und wie sie realisiert wird, 3. daß jede der beiden Funktionen in ihrem Operationsbereich die andere ausschließt. Eine Mindestforderung bestünde darin, zu zeigen: 4. daß eine solche grundsätzliche Gegenüberstellung zwar unbestätigt bleibt, jedoch zu einer fruchtbaren sprachwissenschaftlichen Untersuchung der Intonation führen kann. 37
Dadurch, daß 4 1 intuitiv richtig ist und durch die wenigen Arbeiten zu 2 bestätigt wird , ist weder 3 noch 4 gerechtfertigt. Zu 3 könnte man noch ;agen, daß keine Wissenschaftsdisziplin existiert, die innerhalb ihres B e iriffssystems eine Abgrenzung zwischen beiden Funktionsbereichen eindeu.ig bestimmen könnte: Eine Unterscheidung zwischen Psychologie und Sprachwissenschaft (soweit sie gültig wäre) ist eine andere als die zwischen emotionalem Ausdruck und linguistischer Bedeutung. Da die Sprachwissenschaft und die Psychologie - insofern diese sich mit der Sprache befaßt - zwar verschiedene Gegenstände, aber zum Teil den gleichen Stoff haben, ist es wahrscheinlich, daß sowohl "emotionale" wie auch "linguistische" Aussagen über dieselben Erscheinungsformen derselben intonatorischen Merkmale getroffen werden können, daß also psychologische Annahmen nicht geeignet sind, der linguistischen Untersuchung und dem Geltungsbereich linguistischer Aussagen apriorische Grenzen zu setzen, die ein Hindernis für 4 bedeuten würden. Die einzige umfassende Arbeit über die deutsche Intonation, die diesen Erwägungen Rechnung trägt, ist die von Bierwisch (1966) (in der die Möglichkeit von "emotionalen Transformationen" innerhalb des generativen Modells zugelassen, wenn auch nicht untersucht wurd). Die gleichen E r wägungen werden auch in Hallidays Arbeiten zur englischen Intonation berücksichtigt (Halliday 1963a, 1963b, 1967, 1970a). Allerdings ist nicht unbedingt anzunehmen, daß die beiden Autoren der vorliegenden Argumentation zustimmen würden. 2 . 1 . 9. In bezug auf den Aspekt 3 schreibt Trim: "It is difficult to see why the phonetician, at any rate, should accept such a limitation on his studies. Here, after all are regulär systemativ meaningful features of human speach, which his methods are adequate to handle" (Trim 1964, S. 378-9). Diese Aussage trifft zwar zu, doch wäre sie u. E. nicht nur auf den "Phonetiker", sondern zugleich - und zwar noch stärker - auf den "Linguisten" zu beziehen. In diesem Sinne wird im folgenden versucht, einen Beschreibungsapparat für das Deutsche zu entwickeln, der es e r möglichen wird, intonatorische Kontraste in die grammatische Beschreibung einzubeziehen, ohne dabei die emotionalen Korrelate leugnen oder 38
ausschließen zu wollen. Wie dies vorzunehmen ist, wird im Laufe der Darstellung ausführlicher erklärt. In der Diskussion zur psychologischen Abgrenzung des linguistischen Funktionsbereichs der Intonation wurde bisher so argumentiert, als ob diese Abgrenzung wissenschaftlich-psychologisch motiviert wäre. Da dies aber in Wirklichkeit meistens nicht der Fall ist, fällt es schwer, eine andere E r klärung dafür zu finden als die - allerdings schwer zu beweisende -, daß ihr, zumindest historisch bedingt und unbewußt, einfach eine idealistisch gefärbte Auffassung zugrunde liegt: Was die Sprachwissenschaft nicht in der Lage ist zu erklären, gehört - für den Sprachwissenschaftler - in den Bereich des Seelischen, des wissenschaftlich Unerklärlichen. Dieser intuitiven Auffassung wurde inzwischen in theoretischen Formulierungen konkrete Form gegeben, vor allem durch die Prager Schule. Solange weder die Sprachwissenschaft noch die experimentelle Psychologie in der Lage war, diese Fragen zu untersuchen, nämlich mit der unentbehrlichen Hilfe der experimentellen Phonetik, und solange sie nicht unmittelbar auf der Tagesordnung standen, konnte sich eine solche Auffassung gut durchsetzen. Inzwischen haben.beide Disziplinen, die sich gegenseitig keineswegs ausschließen, sondern ergänzen und stimulieren, Methoden entwickelt, die es erlauben, diesen Aspekt der Sprache zu untersuchen. Sie haben wesentliche P r o bleme gelöst und stehen noch vor einer Reihe von wichtigen Aufgaben. Man könnte dabei u. E. mit Sicherheit voraussagen: Je weiter die Sprachwissenschaft in den Bereich der Intonation vordringt, um so mehr schwindet die 5 Geltung pseudopsychologischer Erklärungen.
2. 2. Intonation in der linguistischen Beschreibung 2.2.1. Die Behauptung, daß die Intonation eine "linguistische Funktion" b e sitze, ist noch impräzis - wenn nicht bei einer strengen Interpretation des Begriffs "Funktion" sogar ungültig - und bedarf einer differenzierten Erklärung. Zwar kann die Annahme einer solchen Funktion erst im Laufe der vorliegenden Darstellung begründet werden, doch lassen sich hier schon 39
einige Grundbegriffe als Voraussetzung für die spätere Diskussion ohne P r ä judizierung der vorgeschlagenen Analyse klären. Bei strenger und eindeutiger Interpretation des Begriffs "Funktion" in einer sprachwissenschaftlichen Darstellung ist weder eine Gegenüberstellung noch die Annahme einer Vereinbarkeit der im vorangehenden Abschnitt zum Zweck der Diskussion übernommenen und verwendeten Begriffe "linguistische" und "emotionale" (oder "expressive") Funktion der Intonation v e r tretbar. Die Interpretation hängt davon ab, was man unter "linguistisch" und unter "Funktion" versteht, d.h. ob "Funktion" eine Funktion der Sprache oder eine Funktion (einer Komponente) der linguistischen Beschreibung ist. Es handelt sich dann nicht einfach um zwei verschiedene Funktionen, sondern um zwei verschiedene Arten der Funktion, oder genauer gesagt: zwei verschiedene Bereiche, in denen von möglichen Funktionen gesprochen werden kann, die bei Diskussionen der Intonation meist nicht genügend unterschieden werden. Aus der an sich trivialen Unterscheidung zwischen der Funktion sprachlicher Mittel in konkreten Sprechsituationen (bzw. einer abstrakten Funktion, die in einzelnen Sprechsituationen realisiert wird) einerseits und deren Abstraktion und Beschreibung im Beschreibungsapparat (d. h. ihre Einbeziehung in die Sprachtheorie und damit ihrer Funktion im Zusammenhang des theoretischen Gesamtsystems) andererseits ergibt sich, daß es sich nicht einfach um ein rein terminologisches Problem handelt. Aus der Argumentation im vorangehenden Abschnitt ging hervor, daß die Unterscheidung zwischen einer "linguistischen" und "emotionalen" Funktion der Intonation nicht nur i r r e l e vant, sondern falsch ist, weil dadurch sprachlich vermittelte und leicht zu erkennende Kontraste an einem arbiträr festgelegten Punkt a priori aus der linguistischen Beschreibung ausgeschlossen werden. Dieses Vorgehen ist auf die Beschaffenheit des jeweiligen Modells selbst zurückzuführen: "Nichtlinguistisch" kann nur bedeuten: "Nicht zugänglich mit den Mitteln des vorliegenden bzw. vorhandenen Beschreibungsmodells" (vgl. oben 2.1. 2. zu Martinet 1964). Eine immanente Begründung wird kaum vorgenommen.
40
2. 2. 2. In der Diskussion in 2.1. wurde angedeutet, daß die Prager Schule die Auffassung einer besonderen Funktion der Sprache, die mit der Intonation verbunden ist, nämlich den Ausdruck "emotionaler Stellungnahmen", in die linguistische Theorie einbezog. Damit wurde die - auch in der Linguistik häufig vertretene These widerlegt, daß die Intonation mit linguistischen Mitteln kaum zu erfassen sei. In verschiedenen Formen wurden die drei grundsätzlich von Bühler (1934) formulierten Funktionen "Ausdruck", "Appell" und "Darstellung" zum Gegenstand der Untersuchung erklärt. Dabei entsteht jedoch eine besondere Schwierigkeit, wenn man die Frage stellt: Wie sind die verschiedenen Funktionen einerseits und die sprachlichen Mittel (als Sprachsystem organisiert und als Träger der Funktionen) andererseits aufeinander zu beziehen, wenn man das System und die Funktionen beide aus sprachlichen Ereignissen abstrahiert? Isacenko (1964) schreibt: " . . . in the realm of expressive and connative speech, we are confronted all the time with phenomena which seem to disturb the symmetry of the system and to obscure the regularity of structural linguistic relations. This is why the most convincing regularities of linguistic structure are demonstrated on partly artificial, often even on prepared materials, purged of anything not belonging to the'intellectual', 'neutral', style of speech. Facts not considered as 'normal' are axcluded as exceptions or vaguely explained away as being g 'expressive', 'affectional' or 'emotional'" (S. 89). Isacenko stellt zwar fest, daß eventuell eine Funktion unter Verdrängung der anderen vorherrscht, sieht aber eine Schwierigkeit darin, daß verschiedene Funktionen gleichzeitig ausgeübt werden (1964, S. 89). Diese Simultaneität der Funktionen im Zusammenhang mit einem relativ konstanten System ist ein wesentliches Merkmal der Sprache. Halliday (1970b) nimmt diese F r a ge in Angriff, indem er feststellt, daß beide Aspekte (Funktion und System (in seiner Terminologie: "linguistic functions" und "linguistic structure")) berücksichtigt werden müssen, wenn der Charakter der Sprache erfaßt w e r den soll, denn 1. "we cannot explain language by simply listing its uses, and such a list could in any case be prolonged indefinitely" - die Möglichkeit gewisser Verallgemeinerungen würde zu rein soziologischen Aussagen führen, die keine Einsicht in das Sprachsystem liefern würden - und 2. "an account 41
of linguistic structure that pays no attention to the demands that we make on language is lacking in perspicacity, since it offers no principles for explaining why the structure of language is organised in one way rather than another" (Halliday 1970b, S. 141). Wie in 1. 3. betont wurde, konzentriert sich unsere Untersuchung auf die Beziehung zwischen der Formebene und der Substanzebene. Andererseits wird (hauptsächlich in Teil 4) versucht, die distinktiven Verhältnisse im Sprachsystem zu "kontextualisieren", d. h. ihre Funktionen in Sprechsituationen zu zeigen. Dabei werden die Funktionen etwas mehr ad hoc beschrieben als die grammatischen Verhältnisse, weil es uns vor allem darum geht, zu zeigen, daß eine auf die Formebene bezogene beschreibbare Funktion vorhanden ist. Ebenfalls wird (Teil 4) gezeigt,
wi e die Intonation
(nämlich auf dem Weg über die Grammatik) zum Träger dieser Funktionen wird. Weil unsere Beschreibung sich hauptsächlich auf die Formebene und die phonologische Zwischenebene bezieht, ist es bei der Feststellung einer grammatischen oder kontextuellen Funktion für unseren Zweck nicht wesentlich,
welche
Funktion im Bühlerschen Sinn ausgeübt wird. Wir werden
deshalb nicht versuchen, die Funktion im Sinne des Sprachgebrauchs systematisch darzustellen. Da die Sprache primär eine im wesentlichen gesellschaftliche Aktivität ist und die genannten Funktionen erst im Kontext der Sprechsituation sinnvoll sind, können wir ferner feststellen: Jedem sprachlichen Mittel kommt erst dann eine Funktion zu, wenn diese gesellschaftlich wirksam wird. Die Kommunikation läuft nur zwischen Beteiligten an der Sprechsituation ab, und zwar auf Grund der im weiteren Kontext der Sprachgemeinschaft vereinbarten Systemeigenschaften. Eine Beschreibung der zugrunde liegenden, im System enthaltenen Regelmäßigkeiten in der Verwendung sprachlicher Mittel für die unendlichen Möglichkeiten der Kommunikationsakte trägt zur Erklärung der "gesellschaftlichen Wirksamkeit der Sprache" bei und macht diese Formulierung zugleich tautologisch: Eine andere Wirksamkeit als eine gesellschaftliche besitzt die Sprache nicht. Alle Funktionen der Sprache sind demnach gesellschaftliche Funktionen. Sogar der Ausdruck der Emotionen ist eine gesellschaftliche Funktion der Sprache, die als Träger dieses Ausdrucks nach gesellschaftlich vereinbar42
ten und konventionalisierten Regelmäßigkeiten fungiert. Abgesehen von einigen wenigen experimentellen Arbeiten, die solche Regelmäßigkeiten bestätigen, kann angenommen werden, daß das Erkennen der ausgedrückten Emotionen durch den Hörer solche Regelmäßigkeiten voraussetzt. Dies gilt natürlich ebenso auch für andere Funktionen: Da sie für die Kommunikation r e l e vant sind, sind Regelmäßigkeiten auf der Formebene anzunehmen, die diese Funktion in der Organisation auf dieser Ebene erklären können. Damit besitzen die Regelmäßigkeiten auf der Formebene selbst eine unmittelbare kommunikative und gesellschaftliche Relevanz. 2. 2. 3. Bezogen wiederum auf die Intonation, haben diese Überlegungen folgende Implikationen. Es gehört zu den Aufgaben einer Beschreibung der intonatorischen sprachlichen Mittel (wie aller sprachlicher Mittel), sie so darzustellen, daß die Beziehung hergestellt werden kann zwischen der B e schreibung und den gesellschaftlich relevanten Merkmalen der außersprachlichen, aber sprachbezogenen Situation. Deshalb - auch weil die Intonation als Komponente der Phonologie nur über die Grammatik operieren kann, eine Tatsache, die unmittelbar unten begründet wird - sprechen Halliday, Macintosh und Strevens (1965) von der "Zwischenebene" der Phonologie als einer "Brücke" zwischen dem materiellen (phonischen) Medium der Sprache (der Substanz) einerseits und den gesellschaftlich relevanten "Patterns" (Form (Grammatik und Lexik)) der Sprache andererseits. Wenn Regelmäßigkeiten der Intonation eine kommunikative Rolle spielen (eine "Funktion" haben), dann sind diese Regelmäßigkeiten phonologisch zu erfassen, da die Phonologie die Ebene darstellt, auf der Abstraktionen über die sprachlich relevanten Regelmäßigkeiten der Substanzebene getroffen werden können. Sie ist aber deshalb eher als "Zwischenebene" zu bezeichnen, weil sie keine selbständige Funktion besitzt. Eine Phonemopposition hat keine unmittelbare sprachexterne Bedeutung, sondern sie realisiert Bedeutungskontraste, die in der Grammatik oder in der Lexik getroffen werden. Da außerdem die Zahl der möglichen Phonemoppositionen sehr klein ist (eine Sprache hat durchschnittlich etwa 30 bis 35 Phoneme zur Verfügung), ist es klar, daß ein einzelnes Phonem bzw. eine einzelne Phonemopposition verschiedene 43
Rollen spielen muß, d.h. verschiedene grammatische und lexische Kontraste realisieren muß. Die Unterscheidung zwischen Vergangenheit und Konjunktiv im Deutschen wird unter anderem durch Umlaut realisiert, wobei wir von jeder phonologisch und phonetisch bedingten Begleiterscheinung sowie von der Tatsache absehen, daß es sich zugleich um ein entsprechendes Morphem handelt: (1)
gab - gäbe
Eine der verschiedenen Möglichkeiten der Pluralbildung besteht in derselben phoriologischen Alternation (wiederum vom Morphem abgesehen): (2)
Stab - Stäbe
In anderen Fällen werden die gleichen Verhältnisse auf gleiche Weise ohne segmentales Morphem realisiert. (3)
hatte - hätte
(4)
Laden - Läden
Es handelt sich um genau die gleiche Phonemopposition, wobei dadurch zwei verschiedene grammatische Kontraste realisiert werden. Das Inventar der phonologischen Alternationsmöglichkeiten bleibt auf phonologischer Grundlage. Man würde beispielsweise in der Grammatik kaum von einer phonologischen "Numerusopposition" ausgehen. Die intonatorischen Merkmale spielen unterschiedliche Rollen in verschiedenen Sprachen. Es ist zur Konvention geworden, Sprachen als "Tonsprachen" oder "Intonationssprachen" zu klassifizieren, je nachdem^ ob die Intonation eine lexische respektive eine grammatische Rolle spielt, d.h. ob sie vorwiegend lexische oder grammatische Kontraste realisiert, wobei sich nicht alle Sprachen eindeutig nach diesen Gesichtspunkten einteilen lassen. Im Deutschen spielt die Intonation keine lexische Rolle. Daraus folgt, da sprachliche Funktionen entweder durch lexische oder grammatische Kontraste getragen werden, daß die Intonation im Deutschen eine grammatische Rolle spielt. Die grammatische Rolle der Intonation im Deutschen wird meistens am Beispiel der grammatischen Opposition: Frage und Aussage illustriert: (5) (a)
44
peter kommt
(fallende Intonation: Aussage)
(5) (b)
peter kommt
(steigende Intonation: Frage)
Die grammatische Kategorie "Satztyp Frage" wird hier allein durch eine steigende Intonation in Opposition zu einer fallenden Intonation realisiert. Diese Opposition ist im Deutschen so häufig und so wichtig, daß manchmal sogar von einer "Aussageintonation" einerseits und einer "Frageintonation" andererseits gesprochen wird. Dabei besteht die Gefahr, daß man für die steigende Intonation immer dieselbe Rolle annimmt, nämlich die Frage von der Aussage zu unterscheiden. Betrachten wir aber die Verhältnisse bei der Ergänzungsfrage. Es sind die beiden folgenden Varianten möglich: (6) (a)
wer kommt
(fallende Intonation: Frage)
(6) (b)
wer kommt
(steigende Intonation: Frage)
Dabei ist die Ergänzungsfrage mit fallender Intonation die neutrale (merkmallose) Variante. Natürlich wäre die Beschreibung "Ergänzungsfrage mit Aussageintonation" möglich. Würde aber diese Beschreibungsart für alle intonatorischen Erscheinungen konsequent durchgeführt werden, so würde es natürlich zu Verwirrungen führen, weil eben ein und dieselbe Intonation verschiedene Rollen spielen kann (vgl. Beispiele (5) (a) und (6) (a)) . Auf die Verschiedenheit dieser Rollen gehen wir in Teil 4 weiter ein. Unsere bisherigen Belege genügen, um einen weiteren Aspekt der Intonation festzustellen und ihr im folgenden Rechnung zu tragen: Sie muß zunächst selbständig, d.h. unabhängig von der Grammatik, beschrieben werden, damit möglichst alle intonatorischen Kontraste erfaßt werden, ohne daß sie a priori mit grammatischen Kategorien belastet wird, die sich aus zunächst als selbstverständlich angenommenen grammatischen Funktionen ergeben. Eine Alternative im Extremfall wäre, die steigende und die fallende Intonation als freie Varianten zu betrachten, weil sie beide in der Frage vorkommen. Dies würde offensichtlich eine absurde Lösung darstellen. Auf einige Beispiele der Wechselwirkung zwischen grammatischen Strukturen und selbständig beschriebenen Tonhöhenbewegungen gehen wir unten (2. 3. und besonders in Teil 4) ein.
45
2. 3. Phonologische Kategorien 2. 3.1. Im folgenden nehmen wir eine Beschreibung der intonatorischen Merkmale des im Teil 1 beschriebenen Materials vor, die zu einer phonologischen Aussage führen soll. Wir beschränken uns dabei auf die Verhältnisse, die traditionell mit den Termini "Tonhöhe" und "Akzent" bezeichnet werden. Diese Beschreibung soll unseren besonderen Zweck erfüllen, der darin besteht, die Phonologie und die Grammatik so darzustellen, daß gezeigt werden kann, wie diese zusammen operieren, um gewisse Kontraste zu realisieren. Die Analyse erfolgte in ziemlich enger Anlehnung an die Ergebnisse anderer Autoren. Diese Anlehnung ist in einigen Fällen (insbesondere bei den Ergebnissen von O. von Essen und M.A. K. Halliday) besonders sichtbar. Eine Besprechung der wichtigsten Beschreibungen der deutschen Intonation vom Standpunkt unserer Beschreibungsmethode enthält die oben erwähnte Arbeit "Zur Analyse der deutschen Intonation" (Pheby 1972). Die vorliegende Beschreibung kann als Zusammenfassung dieser Arbeit angesehen werden,
vo-
bei jedoch einige zusätzliche Bemerkungen als angebracht erscheinen. Aus der fließenden Rede im Deutschen ist es möglich, immer wiederkehrende Tonhöhenbewegungen zu abstrahieren, die als kontrastiv ("distinktiv") gelten. Meistens werden drei solche Tonhöhenbewegungen angenommen: fallend, steigend und weiterweisend. Wenn diese Tonhöhenbewegungen in der Sprache als kontrastiv gelten sollen, dann können sie nicht an beliebigen Stellen auftreten, sondern sind an bestimmte Stellen gebunden, an denen der Sprecher sie kontrastiv verwenden kann, d. h. wo ihre Verwendung sinnvoll (bedeutungstragend) ist. Diese an sich triviale Tatsache ist um so klarer, wenn wir annehmen, daß die Intonation in engem Zusammenhang mit anderen sprachlichen Mitteln operiert. Davon hängt es u. a. ab, an welcher Stelle und auf welcher Ebene i n
der
B e s c h r e i b u n g solche Kontraste fest-
gelegt werden. Das Vorhandensein einer Selektionsmöglichkeit macht es nämlich notwendig, die Einheiten festzulegen, die auf Grund der Selektion in Kontrast zueinander stehen. Später wird es klar, was oben (2. 2. 3.) angedeutet und kurz illustriert wurde, daß die Selektion einer distinktiven Tonhöhenbewegung - die wir hier und im folgenden als "Tonmuster" bezeichnen 46
wollen - nicht eindeutig (nicht nur) im "Satz" stattfindet und nicht unmittelbar vom Satztyp abhängig ist. Gerade die Variabilität zwischen der Tonmusterselektion einerseits und der syntaktischen Gliederung und den Klassen der syntaktischen Einheiten andererseits ist sogar wesentlich für eine differenzierte Darstellung der deutschen Grammatik, wie wir unten (Teil 4) s e hen werden. Wir verweisen auf diese Ausführungen und begnügen uns hier mit der Feststellung, daß in einem Satz eine oder mehrere Selektionen möglich sind, während umgekehrt in einem zusammengesetzten Satz manchmal nur ein Tonmuster selektiert wird. Die einzige Einheit, von der mit Sicherheit behauptet werden kann, daß sie eindeutig mit der Selektion eines von mehreren Tonmustern verbunden ist und auf Grund der Selektion eines Tonmusters eine Klasse gegenüber anderen Klassen derselben Einheit bildet, ist eine phonologische, nämlich die "Tongruppe". Die Tongruppe können wir zunächst, ohne die spätere, vollständige Definition zu verletzen, als die phonologische Einheit charakterisieren, in der die Selektion aus einer endlichen Menge (einem geschlossenen • System) sich gegenseitig ausschließender Tonmuster einmal stattfindet. Mit anderen Worten: Sie stellt den Operationsbereich des Systems der TonmusterSelektion dar. Das System der Tonmuster umfaßt die drei bekannten Muster: fallend, steigend und weiterweisend, aber auch andere Möglichkeiten, die unten im Zusammenhang mit diesen drei zu beschreiben sind. Zunächst gehen wir näher auf die Zusammensetzung der Einheit Tongruppe ein. 2. 3. 2. Für die Beschreibung des Tonhöhenverlaufs innerhalb der Tongruppe, die unten vorzunehmen ist, ist es nach unserer Auffassung und unserer Methode notwendig, die Tonhöhenverhältnisse in der Reihenfolge der AkzentSilben zu berücksichtigen. Um die Akzentsilbe in unmittelbaren Zusammenhang mit der Tongruppe zu bringen, ist es deshalb notwendig, die zwischen den einzelnen Akzentsilben bestehenden rhythmischen Verhältnisse in die Beschreibung einzubeziehen. Wenn man die Einteilung der Sprachen in silbenzählende und taktzählende Sprachen annimmt, so gehört das Deutsche zu den taktzählenden Sprachen. Im Gegensatz zu den silbenzählenden Sprachen, wie z. B. dem Französischen, 47
wo die Silben phonologisch gleich lang sind (d. h. wo die Silbenlänge nicht distinktiv ist), weist das Deutsche einen Zeitabstand zwischen den Akzentsilben auf, der unabhängig von der Zahl der betreffenden dazwischen auftretenden Silben von mehr oder weniger gleicher zeitlicher Dauer ist. Das "mehr oder weniger" wird bewußt einkalkuliert, denn das unmittelbar unten erwähnte Experiment bestätigte wieder die in der phonetischen Forschung bekannte Erscheinung, daß eine auch nur annähernde Genauigkeit in der physiologischen Verwirklichung phonologisch abstrahierter Vorgänge nie e r reicht wird. In dem anderwärts ausführlicher beschriebenen Experiment (s. bes. Pheby und Eras 1969) ergaben sich folgende Verhältnisse: Es wurde die Einheit 'Takt' angenommen, die mit einer Akzentsilbe - einer "starken" Silbe - anfängt und alle folgenden akzentlosen Silben - "schwachen" einschließt. Folgendes Schema zeigt die durchschnittliche Dauer (D) in ms von ein- bis viersilbigen Takten, d.h. das zeitliche Verhältnis zwischen Takten unterschiedlicher Zusammensetzung, bei insgesamt drei Sprechern. V zeigt das Verhältnis zwischen den Durchschnitten der zeitlichen Taktlängen. lsilbig
2silbig
3silbig
4silbig
D
306,1
353,5
468,3
560,5
V
1,0
1,15
1,53
1,83
Das Gesamtexperiment ergab eine beträchtliche Streuung der einzelnen Taktlängen, d. h. eine unterschiedlich große Abweichung von den Durchschnittswerten. Die relative Gleichheit zwischen den Takten gegenüber den unterschiedlichen Silbenzahlen wird im Zusammenhang mit der oben erwähnten Ungenauigkeit in der physiologischen Realisierung als ausreichend für die Annahme betrachtet, daß die starke Silbe als Anhaltspunkt für einen rhyth mischen Takt dient. Genau ein solcher Takt, der zunächst von den Wortgrenzen unabhängig ist, liegt H. Pauls Gliederung des folgenden Satzes zugrunde: (7)
/niemals /hätte ich ge-/glaubt/ so von dir be-/trogen zu/werden (s. Paul 1959, I, S. 151)
wobei das Zeichen / hier und im folgenden die Taktgrenze anzeigt und un7 mittelbar vor der starken Silbe steht.
48
Es kann der Fall eintreten, und zwar am Anfang einer Tongruppe (z. B. am Anfang einer Äußerung), daß die starke Silbe fehlt. Es handelt sich dabei meistens um eine "rhythmische Pause", die stellvertretend für die s t a r ke Silbe steht (s. Pheby und Eras 1969 betr. eine vorgeschlagene Erklärung dieser Erscheinung). Die "rhythmische Pause" entspricht Abercrombies Begriff "silent s t r e s s " (etwa: "schweigender Akzent") (Abercrombie 1964b). Eine arhythmische Pause dagegen ist eine Pause, die den Rhythmus u n t e r bricht (etwa eine Verzögerung, eine "Verlegenheitspause" usw.). Wir v e r zichten hier auf eine nähere Beschreibung dieser Erscheinungen und legen fest, daß der Takt entweder mit einer starken Silbe oder einer rhythmischen Pause anfängt. Jeder Takt enthält eines von beiden. Die schwachen Silben haben einen anderen Status im Takt: Wenn keine schwachen Silben vorhanden sind, ändert sich nichts an dem rhythmischen Charakter der Rede, es handelt sich dann einfach um einen einsilbigen Takt. Auf Grund dieser Verhältnisse kann folgende phonologische Struktur für den Takt vorgeschlagen werden. Die starke Silbe bzw. die rhythmische P a u se einerseits und die schwachen Silben andererseits erfüllen unterschiedliche Funktionen im Takt und weisen unterschiedliche Merkmale auf. Wir unterscheiden demnach zwei Stellen in der Struktur des Taktes. Die Stelle I (der Iktus), die durch die Klasse der starken Silben oder eine rhythmische Pause realisiert wird, ist obligatorisch. Die Stelle N (Nichtiktus) wird durch die Klasse der schwachen Silben realisiert und ist fakultativ, also: (N). Wir haben damit u . a . eine Hierarchie aufgestellt, bei der jede Einheit das gesamte Material ihres Bereichs einschließt, d . h . , die Taktgrenze fällt mit einer Silbengrenze, die Silbengrenze mit einer Phonem-"grenze" zusammen, so daß kein Material außerhalb der Hierarchie steht: Takt
/ n i : m a l s / h £
ta
Silbe
/ n i :+m a l s / h E + t a + P i ^
Phonem / n.i :+m. a. 1. s / h.E+t.a +
¿19
/ / /
wobei / wiederum die Taktgrenze, + die Silbengrenze und . die Phonemgrenze bezeichnet, wobei f e r n e r ? auf Grund der Silbenstruktur als segmentale Einheit aufgefaßt wird.
49
2. 3. 3. Es wäre nun die Tongruppe in Zusammenhang mit dieser H i e r a r chie zu bringen. Wir nehmen an, daß zur Vervollständigung der Hierarchie gilt: Die Einheit Tongruppe besteht aus einer Reihenfolge von Takten. Im Gegensatz zu den anderen Einheiten läßt sich die Tongruppengrenze auf phonetischer Grundlage nicht eindeutig festlegen. Sie kann durch eine Pause, einen ausgedehnten ("überlangen") Takt (s. Pheby and Eras 1969) oder den Anfang eines neuen Vorlaufmusters (s. unten 2. 3. 7.) signalisiert werden. Wenn diese Verhältnisse nicht bestehen, läßt sich die Tongruppengrenze bei fließendem Sprechen nicht aus dem Signal ableiten. Beispiel (Reihenfolge von 2 Tongruppen mit weiterweisendem und fallendem Tonmuster): (8) (a)
//wenn die /anderen/ kommen dann /geh ich —I? H
w o b e i / / die Tongruppengrenze bezeichnet, die "Schwerpunktsilbe" unterstrichen ist undl-«—?—H die Stelle bezeichnet, an der die Tongruppengrenze gezogen werden muß und auf Grund der phonetischen Information an einer beliebigen Silbengrenze gezogen werden kann. Eine solche Tongruppengrenze ist aber deshalb notwendig, weil zwei Tonmuster selektiert worden sind. Es ist in Ermangelung empirischer Evidenz notwendig, eine theoretische Entscheidung zu treffen, und zwar unter Berufung auf andere vorhandene (empirisch feststellbare) Grenzen. Man könnte sich hier willkürlich an den in Frage kommenden Taktgrenzen festhalten, nämlich den Grenzen vor / kommen und / geh. Ebenso willkürlich aber grammatisch befriedigender wäre ein aus der grammatischen Ebene entnommenes Kriterium, nämlich die Grenze der grammatischen Einheit, in der der durch die Tonmusterselektion realisierte Kontrast operiert. Wenn eine "linguistische Pause" (die weder grammatisch noch phonologisch eindeutig bestimmt worden ist) auftreten würde, dann würde diese ohne Zweifel mit der grammatischen Grenze zusammenfallen: (8) (b)
//wenn die /anderen/kommen # . . . //dann geh i c h / /
In diesem Fall handelt es sich um eine Satzgrenze ( # ) . Aber das ist nicht immer der Fall. Die "Phrasierung" (die Gliederung grammatischer Segmente in Tongruppen oder "Phrasen") ist eine wichtige Funktion innerhalb des Satzes (s. Bierwisch 1966; auch unten, 4.2. 2.). Wir übernehmen diese Konven50
tion mit der wiederholten Bemerkung, daß sie nicht empirisch zu begründen ist, aber daß damit andererseits nichts an linguistischer Information eingebüßt wird. Um das etwas grob auszudrücken: Wenn die phonetische Evidenz so gering ist, daß man nach ihr "suchen" muß, dann wird sie auch von geringer linguistischer Bedeutung sein. Bis auf diese Konvention gilt: Die Einheit "Tongruppe" besteht aus einer Reihenfolge von Takten oder aus einem Takt. Damit ist die Tongruppe in die phonologische Hierarchie einbezogen: Tongruppe
//
Takt
//
Silbe
//
Phonem
// / +
/
// +
//
/ / . + . / . + . / /
Wir nehmen somit an, daß es möglich ist, eine Hierarchie von phonologischen Einheiten aufzustellen, die - bis auf die oben erwähnte Konvention unabhängig von der Hierarchie grammatischer Einheiten ist. Die Notwendigkeit dieser Unabhängigkeit für die vorliegende Arbeit wurde mehrmals angedeutet. Wir gehen hier nicht näher darauf ein, sondern verweisen wiederholt auf Teil 4. 2. 3. 4. In der Reihenfolge der starken Silben hebt sich innerhalb der Tongruppe eine starke Silbe besonders hervor. O. von Essen nennt diese Silbe die "Schwerpunktsilbe" und bezieht sie auf das "sinnwichtigste Wort" des gegebenen Satzes (z. B. von Essen 1964). Wir wollen diese besonders prominente Silbe weder akustisch charakterisieren, was bei dem heutigen Stand der Forschung ohnehin kaum möglich ist, noch, wie von Essen, direkt aus der Semantik ableiten. Sie kann so spezifiziert werden: In einer Tongruppe kommt nur ein Tonmuster vor, das für die gesamte Tongruppe charakteristisch ist. Dieses Tonmuster fällt entweder mit der "Schwerpunktsilbe" die wir hier und im folgenden als die "Tonsilbe" bezeichnen wollen - zusammen, falls diese die letzte Silbe in der Tongruppe ist, oder mit der Tonsilbe und allen folgenden Silben bis zum Ende der Tongruppe. Diesen Abschnitt, der also nicht immer mit der Tonsilbe zusammenfällt und keinesfalls mit \ ihr identisch ist, bezeichnen wir als die "Tonstelle".
51
Beispiel: (Analyse nach von Essen:) Schwerpunkt (9)
//
t
//
(10)
Tonsilbe
Schwerpunkt
Nachlauf
//
vie/lleicht//
t
Tonsilbe -v Tonstelle
Tonstelle
Dieser tontragende Abschnitt, die Tonstelle, entspricht also der Schwer punktsilbe bzw. der Schwerpunktsilbe zusammen mit dem "Nachlauf" nach der Beschreibung und der Terminologie von Essens. Der Gesamtabschnitt wird als "Tonstelle" zusammengefaßt, weil er den gesamten phonologischen Kontrast trägt: nach der Tonsilbe ist kein weiterer phonologischer Kontrast möglich (s. dazu unten, 2. 3. 5. unter "Tonmuster 4"). Die Beispiele veranschaulichen die gleiche phonologische Selektion. Die Tonstelle kann beliebig viele starke und schwache Silben - und damit beliebig viele Takte - enthalten (s. Beispiele in 2. 3. 5.). 2. 3. 5. Die einmalige Selektion des Tonmusters, das für die Tongruppe dann charakteristisch ist, findet innerhalb der Tonstelle statt. Für diese (in Teil 1 spezifierte) Sprachvariante besteht nach unserer Analyse die Möglichkeit einer Selektion von nicht drei, sondern von fünf Tonmustern. Dieses Selektionssystem wird nach einem doppelten Kriterium aufgestellt. Es wird erstens die g e s a m t e
Tonhöhenbewegung
innerhalb der Tonstelle
berücksichtigt. Eine fallend-steigende Intonation innerhalb der Tonstelle steht z. B. in Kontrast zu einer fallenden und zu einer steigenden. Sie stellt keine Zusammensetzung zweier Tonmuster dar: einmal fallend und einmal steigend. Zweitens wird das Selektionssystem nach dem Prinzip aufgestellt, daß die Elemente ("Terme") des Systems sich in irgendwelchen grammatischen Zusammenhängen ausschließen. Es wird nicht in erster Linie berücksichtigt, in w e l c h e n
Zusammenhängen sie sich ausschließen. Damit wird
gesichert, daß die festgestellten Kontraste zwischen den phonologischen Klas-
52
sen tatsächlich phonologischer Art sind. Ihre Funktionen in der Sprache hängen dann von ihren verschiedenen grammatischen Funktionen ab. Die fünf vorgeschlagenen Tonmuster umfassen u. a. die drei traditionellen kontrastiven Tonhöhenverlaufe: fallend, steigend und weiterweisend bzw. "terminal", "interrogativ" und "progredient". Unsere Beispiele stellen aktuelle Äußerungen dar, die aber nicht in ihrem ursprünglichen kontextuellen Zusammenhang stehen. Eine detailliertere Beschreibung enthält Pheby 1972. Vorläufig werden hier nur die Tonstellen transkribiert. Die bei jeder Tongruppe angegebene Zahl stellt das jeweilige Tonmuster dar, während x die rhythmische Pause anzeigt. Tonmuster 1:
fallend
(\)
Beispiele: (11) / / I jetzt//
(12) / / I heute//
(13) / / I x w i e / s V /
(14) / / I x der/arme/hund / / I x der/arme/hund// /
• — • —
(15) / / I x das/haben sie . . . als/ope/rette/aufge/führt// / m
• —
(16) / / I j a / / l x es/wurde ge/sungen da/bei// /
(17) / / I x also/halb ge/sprochen und/halb ge/sungen7/ /
(18) / / I x im/abi ne/fünf// Tonmuster 2:
steigend ( / )
Beispiele:
Jj
(19) / / 2 x im/abi ne/fünf//
JJ
(20) / / 2 weißt du/wäs7/ (21) / / 2 hast du/nachrichten ge/hört// 53
J
(22) / / 2 meinst du/jemand von/uns// (23) / / 2 x und/wer macht den/ab/wasch// —
_ —
•
t
J
•.
(24) / / 2 x und/was heißt dy/namisches/mikro/phon// Tonmuster 3:
gleichbleibend (
)
Beispiele: /
(25) / / 3 wenn die nicht /schwimmen/kann// (dann kriegt sie im abi ne fünf) (26) / / 3 wenn die /schwimmen geht// (dann geh ich mit) /
(27) / / 3 x im /hallen/bad// (auch nicht) /
(28) / / 3 wenn die /anderen/kommen// (dann geh ich) Für die "weiterweisende" Intonation - Tonmuster 3 - wird, wie die Bezeichnung andeutet, eine Funktion der "Unabgeschlossenheit" angenommen. Natürliche Äußerungen mit Tonmuster 3, die ohne Unterbrechung des Gesprächs unabgeschlossen blieben, wobei der jeweilige abschließende Hauptsatz allerdings "mitverstanden" war, stellen folgende Beispiele dar: /
(29) / / 3 x na/wenn das s o / i s t / / /
(30) / / 3 x na/wenn die so/blöd sind// /
—
•
•
•
__
•
(31) / / 3 x na/wenn kein er/wächsener da/bei i s t / / Zusätzlich zu diesen oft beschriebenen drei Mustern stellen wir auch folgende zwei fest: Tonmuster 4:
fallend-steigend
Beispiele: /
-
.
•>
(32) / / 4 darfst du/das// 54
(V )
>
'
•
'
"
(33) / / 4 wer hat das ge/sagtJ] \
4
(34) / / 4 . wer kommt/morgen// / «
i
»
^
(35) / / 4 x das/machen die nicht/immer// (36) / / 4 was/haben w i r / / Damit Vinterscheiden wir durch die Zuordnung zu Tonmuster 2 bzw. Tonmuster 4 zwischen "steigend" resp. "fallend-steigend" nach dem oben e r wähnten Kriterium der Tonhöhenbewegung in der gesamten Tonstelle. Die Unterscheidung erweist sich weiter dadurch als berechtigt, daß Tonmuster 4 nicht immer eine "interrogative" Funktion besitzt, wie manche Forscher angenommen haben. (O. von Essen z.B. faßt beide Tonmuster als "interrogativ" zusammen (von Essen 1964, S. 44-45).) Ebenso unterscheiden wir zwischen "fallend" (Tonmuster 1) und "steigendfallend" (Tonmuster 5), obwohl die Funktionen differenzierter sind als bei dem Kontrast z.B. zwischen "steigend" (Tonmuster 2) und "fallend-steigend" (Tonmuster 4). Tonmuster 5:
steigend-fallend
(/\ )
Hier steigt zwar die Tonhöhe innerhalb oder unmittelbar nach der Tonsilbe, aber dann kehrt sie wieder zur tieferen Lage zurück. Beispiele: ^ * t (37) / / 5 kann er auch//
« (38) / / 5 muß ich j a / /
(39) / / 5 x das/weiß ich/schon//
liegenden Analyse:
v
Vorlauf
v
' Tonstelle
Wir werden sehen, daß man nicht einfach eine distinktive Tonhöhenbewegung über den gesamten Vorlauf ohne Berücksichtigung des Verhältnisses zwischen starken und schwachen Silben annehmen kann. Schon die Anwesenheit mindestens eines Taktes ist eine Voraussetzung für eine distinktive Tonhöhenbewegung im Vorlauf - wenn keine starke Silbe vorhanden ist, dann stehen eventuelle schwache Silben im Vorlauf in proklitischem Verhältnis zur Tonstelle. Die Tonhöhe ist in solchen Fällen phonetisch gleichbleibend und phonologisch nicht distinktiv. Beispiele: (53) / / I x aber na/türlich//
(54) / / I x es/stimmt aber/nicht//
Wenn starke Silben im Vorlauf vorhanden sind, können die verschiedenen Tonhöhenbewegungen im Vorlauf realisiert werden. Diese Eigenschaften des Vorlaufs erlauben es uns, folgende Differenzierungen der Tonmuster 1 und 2 vorzunehmen, die wir im Zusammenhang mit den entsprechenden Tonmustern als differenziertere Systeme, und zwar zusammengefaßt als Subsystem B, beschreiben können. 63
Tonmuster lb
breit fallend
differenzierte Tonmuster alb Vorlauf gleichbleibend Tonmuster blb Vorlauf gestuft Tonmuster clb Vorlauf steigend
—' —'
'
Beispiele: /
(55) (a) / / a l b jeden/tag im/halle n/bäd//
•
.
/
• —
(55) (b) / / b l b jeden/tag im/hallen/bad// /
(56)
/ / c l b das/find ich/doch un/möglich//
Tonmuster alb kann als eine "neutrale" oder "unmarkierte" Variante des Tonmusters l b betrachtet werden, das wir bereits als "emphatisch" bezeichnet haben. Wenn ein Vorlauf phonetisch vorhanden ist, dann wird er die gleichbleibende Form annehmen, falls keine besonderen Gründe für die Selektion eines anderen Vorlaufs bestehen. Das Beispiel (55) (a) ist nicht mehr und nicht weniger emphatisch als etwa: / (55) (ai) / / l b x im/hallenbad// Gegenüber Tonmuster alb sind die Tonmuster blb und clb beide markiert und haben unterschiedliche Funktionen. Wenn wir die Emphase weiter differenziert betrachten, können wir zwischen "einfacher Emphase" ( Tonmuster alb, Beispiel (55) (a}) und "expressiver Emphase" (Tonmuster blb, Beispiel (55) (b)) unterscheiden. Wir können folgende Kontraste voraussetzen: für
A: wo und wann übt ihr denn? B : na jeden tag im hallenbad (Beispiel (55) (a)) A: sag mir noch mal wo und wann. B: na jeden tag im hallenbad. (Beispiel (55) (b)) kannst du nicht hören? Tonmuster la
differenziertes Tonmuster ala Vorlauf fallend: 64
eng fallend: ~~
Beispiel: (55) (c) / / a l a jeden/tag im/hallen/bad// Wir bezeichnen dieses Vorlaufmuster, analog zu alb, als ala, weil es phonetisch bedingt ist. Wenn bei l a ein Vorlauf vorhanden ist, so muß er diesen Tonhöhenverlauf aufweisen. Weitere Möglichkeiten konnten nicht festgestellt werden. Tonmuster 2
eng oder breit steigend:
!, /
differenzierte Tonmuster a2: Vorlauf gleichbleibend: b2: Vorlauf fallend:
—
— —
Beispiele: (56) (a) / / a 2 a x und/wer/macht den/ab/wasch//
.
~
-
-
+ *
(56) (b) / / b 2 a x und/wer/macht den/ab/wasch// Der Tonhöhenverlauf bei Tonmuster b2 ist phonetisch bedingt, und dieses Tonmuster ist in der Opposition gegenüber Tonmuster a2 unmarkiert. Während (56) (b) mit Tonmuster b2a eine sachliche Forderung nach Information darstellt, hat derselbe Satz (56) (a) mit Tonmuster a2a eine "skeptische" Implikation. Wir unterscheiden bei einem relativ differenzierten System der "Implikation" bei der Ergänzungsfrage zwischen "Frage mit neutraler Implikation" und "Frage mit skeptischer Implikation". Diese stellen dann g Subklassen der Subklasse "Ergänzungsfrage" dar. Bei den Tonmustern 3, 4 und 5 wurden keine differenzierteren Tonmuster auf Grund des Tonhöhenverlaufs im Vorlauf festgestellt. 2. 3. 9. Zusammenfassung der wichtigsten Punkte Ausgangspunkt für die Beschreibung der Intonation ist die Einheit Tongruppe. Die Tongruppe besteht aus Takten. Sie hat die Strukturelemente (V) T - einen fakultativen Vorlauf und eine obligatorische Tonstelle. An der Tonstelle findet die Selektion zwischen 5 möglichen Tonmustern statt, die das System I darstellen. Weitere Differenzierungen in der Ton65
musterselektion an der Tonstelle werden im Subsystem A zusammengefaßt. Weitere Differenzierungen im Vorlauf, die im Zusammenhang mit dem Tonmuster stehen, stellen das Subsystem B dar. Das Tonmuster fängt mit der ersten Silbe in der Tonstelle an, die zugleich die erste (oder einzige) (starke) Silbe in der Tonstelle ist und als Tonsilbe bezeichnet wird. Der Takt ist die phonologische Einheit, die in der Zusammensetzung der Tongruppe fungiert und aus Silben zusammengesetzt ist. Er hat die Struktur elemente I (N) - einen obligatorischen Iktus, der durch eine starke Silbe oder durch eine rhythmische Pause realisiert wird, und einem fakultativen Nichtiktus, der durch 1 bis n (meist 4) schwache Silben realisiert wird. Die Systeme zeigt Abb. 4. Abb. 4. Subsystem B (fallend:
Subsystem A )
a (eng:
\
a (gleichbleibend: b (gestuft:
)
System I
\ b (breit:
\
a (eng:
/
c (steigeno:^-^ ) a (gleichbleibend: — b (fallend:
) )
b (breit: a (tief:
/ _
b (hoch: a (eng:
v
b (breit:
V
V /\
(In den mit trast festgestellt. )
66
bezeichneten Stellen wurde kein systematischer Kon-
3.
GRAMMATIK
3.1.
Allgemeines
3.1.1. In dem hier vorgelegten Teil, wird lediglich ein relativ kleiner Ausschnitt aus der deutschen Grammatik beschrieben. Die Auswahl der zu b e schreibenden Verhältnisse sowie der Grad der Differenzierung unserer B e schreibung werden von dem allgemeinen Anliegen der Gesamtunter suchung bestimmt: Es werden jene Aspekte behandelt, die u. E. für eine Darstellung der Funktion der Intonation wesentlich sind, während andere Aspekte, die in keinem direkten oder indirekten Zusammenhang mit den intonatorischen V e r hältnissen stehen, nur wenig berücksichtigt werden. Dabei beschränkt sich die im folgenden vorgeschlagene Analyse in mancher Hinsicht auf bereits häufig dargestellte Erscheinungen; einige der einfachsten und bekanntesten Verhältnisse werden hier lediglich um der Veranschaulichung und der Zusammenhänge willen noch einmal erläutert*. Andererseits wird versucht, möglichst wenige der überlieferten und gegenwärtig viel differenzierter angewendeten Kategorien als selbstverständlich anzunehmen, diese vielmehr für das Deutsche neu zu definieren, weil in der vorliegenden Arbeit zum Teil neu definierte Kategorien und zum Teil alte Kategorien mit neuen Interpretationen verwendet werden. Unsere Definitionen hängen von einer Interpretation der hier angewendeten Grammatiktheorie - insbesondere in der ausführlichen Formulierung von Halliday - ab (s. Halliday 1961). Die Theorie selbst stellt ein Begriffssystem dar, in dem vier zentrale Kategorien - EINHEIT, STRUKTUR, KLASSE und SYSTEM - durch drei "Skalen" - RANG, DIFFERENZIERUNG und REALISIERUNG - miteinander in Beziehung gebracht werden. Es wird von diesen sieben zentralen Begriffen angenommen, daß sie universell sind, während die für die Beschreibung des Deutschen aus der Theorie abgeleiteten Kategorien als sprachspezifisch gelten.
67
3.1. 2. Wie in 1. 2. angedeutet wurde, kann eine Grammatik als ein Komplex von Systemen beschrieben werden. Darin eingeschlossen ist die Beschreibung der Fähigkeit des Sprechers, in regulärer Weise an bestimmten Stellen in der Äußerung (z. B. innerhalb des Satzes, des Teilsatzes, der Wortgruppe usw.) bestimmte Entscheidungen zu treffen. Jede solche Entscheidung ist insofern frei, als dem normalen Sprecher natürlich alle Selektionsmöglichkeiten der von ihm beherrschten Sprache zur Verfügung stehen. Andererseits ist eine solche Selektion in zweifacher Hinsicht gebunden. Erstens ist sie mit einer bestimmten Stelle im grammatischen Komplex v e r bunden, die als Domäne für das Operieren des Systems gilt. Im Deutschen operieren z. B. Numerussystem und Kasussystem innerhalb der Domäne Nominalgruppe. Das Numerussystem enthält die Terme (Selektionsmöglichkeiten) 'Singular' und 'Plural'. Jede Nominalgruppe muß einen und nur einen dieser Terme selektieren. Mit jeder grammatischen Einheit - genauer: mit jeder Klasse solcher Einheiten - ist eine Reihe solcher Selektionsmöglichkeiten verbunden. So werden in der Nominalgruppe der Kasus und der Numerus und in der Verbalgruppe der Numerus und das Tempus selektiert. Die Klassenbezogenheit der Systeme macht diese zwangsläufig von der Stellung dieser Einheit in der Struktur der übergeordneten Einheit abhängig. Auf das Verhältnis Einheit - Struktur - Klasse - System wird im Laufe dieses Teils näher eingegangen. Es wird uns zunächst darum gehen, die betreffenden Einheiten
im Deutschen zu identifizieren und miteinander in Zusammen-
hang zu bringen, nämlich die, die für das Operieren von intonatorisch getragenen Kontrasten relevant sind. Die zweite Einschränkung hinsichtlich der Auswahl der kontrastiven Selektion aus Systemen ergibt sich daraus, daß solche Selektionen bedeutungstragenden Charakter haben: Jeder Kontrast auf der Formebene widerspiegelt einen Kontrast auf der Kontextebene und ist damit für die Kommunikation relevant. Da nun nach den Ausführungen in Teil 1 und 2 unser Hauptanliegen darin besteht, gewisse Systemeigenschaften zu untersuchen, um die Relevanz phonologisch abstrahierter intonatorischer Merkmale für die Kommunikation zu erklären, ergibt sich die Aufgabe, die phonologischen Selektionsmöglichkeiten, ihre Stellung und ihren vielschichtigen Zusammenhang in der 68
Grammatik zu zeigen. Die Vielschichtigkeit des Zusammenhangs zwischen Systemen in der Grammatik ist zum Teil auf die unterschiedlichen Positionen der Einheiten, in denen die Systeme operieren, innerhalb der Gesamt hierarchie zurückzuführen. Deshalb wird im folgenden Abschnitt zuerst v e r sucht, die hierarchischen Verhältnisse zwischen den Einheiten zu spezifizieren.
3. 2. Die Rangskala - hierarchische Ordnung der Einheiten 3. 2.1. Die Einheiten, die für eine Beschreibung der Intonation im Deutschen von unmittelbarer Relevanz sind, legen wir zunächst als S a t z , Teilsatz und G r u p p e fest. Diese Einheiten können aber erst im Zusammenhang mit der Gesamthierarchie vollständig definiert werden, die durch eine Berücksichtigung der Einheiten 'Wort' und 'Morphem' zu vervollständigen wär e . Die aufgestellten Einheiten haben Korrelate in der traditionellen Gram2
matik , wobei die meisten traditionellen Darlegungen jedoch gewisse Mehrdeutigkeiten in der Definition zulassen. In der traditionellen Grammatik w e r den die Einheiten nicht immer spezifisch nach ihrem hierarchischen Status geordnet, der Klassenzugehörigkeit wird als Kriterium im allgemeinen mehr Bedeutung beigemessen. Dies betrifft insbesondere das Verhältnis zwischen dem Satz und dem Teilsatz sowie zwischen dem Wort und der Gruppe. Die primäre Einteilung der grammatischen Hierarchie in "Satz" und "Wort" ist in der traditionellen Grammatik genauso selbstverständlich wie z. B. die Einteilung Syntax/Morphologie und wird selten in Frage gestellt. Das Wort wird dort in einer besonderen, mehrdeutigen Weise beschrieben: Zuerst als "lexikalische Einheit" oder "Bedeutungseinheit" identifiziert, wird das Wort dann immer als ein und dieselbe grammatische Einheit interpretiert, unabhängig davon, an welcher Stelle in der grammatischen Hierarchie es auftritt. Vgl. z.B. die Einheit gut, die in (57) als selbständige Wortgruppe - wie die Einheit der käse - fungiert, wohingegen in (58) die lexikalische Einheit gute Teil (57)
einer Wortgruppe ist. | der; käse | ist | gut |
(58)
| der f gute • käse |
(wobei ; die Wortgrenze und | die Gruppengrenze darstellt). Viele unnötige und unfruchtbare Diskussionen zum Begriff der "Wortart" sind auf diese oder ähnliche Konfusionen zurückzuführen. Auf das Verhältnis zwischen hierarchischer Struktur und den Klassen der Einheiten innerhalb der Struktur wird unten näher eingegangen. Wir beschränken uns vorläufig auf die Bemerkung, daß nach der traditionellen Auffassung keine klare wechselseitige Zuordnung zwischen der hierarchischen Struktur und den identifizierten Klassen von Einheiten besteht. 3. 2. 2. Wie oben angedeutet wurde, befassen wir uns vorweigend mit den Einheiten "Satz", "Teilsatz" und "Gruppe". Das Wort und das Morphem werden im Rahmen der vorliegenden Arbeit nicht spezifisch untersucht, da sie nicht unmittelbar relevant für die Funktion der Intonation sind. Deshalb stellt die Gesamthierarchie eine Hypothese dar. Während bisherige Analysen des Deutschen die angenommene Hierarchie jedoch nicht explizit bestätigen, finden wir keinen stichhaltigen Anhalt dafür, daß diese anhang vorhandener Analysen explizit widerlegt werden kann. Die Rangskala - d.h. der zur Erklärung der grammatischen Hierarchie aufgestellte Teilapparat - gilt als hierarchisch vollständig: Die in ihr enthaltenen Einheiten - vom Morphem bis zum Satz - definieren sich gegenseitig und umfassen das gesamte zu analysierende Material, so daß die Gesamthierarchie der Strukturbeziehungen zwischen den Einheiten erklärt werden kann. Der Satz wird als die Einheit charakterisiert, die aus einem oder mehreren Teilsätzen zusammengesetzt ist; der Teilsatz ist wiederum aus einer oder aus mehreren Gruppen zusammengesetzt; die Gruppen aus einem oder aus mehreren Wörtern; das Wort aus einem oder aus mehreren Morphemen. Keine grammatische Einheit oder Teileinheit darf aus dieser Hierarchie ausgeschlossen werden, und jede Einheit muß einem bestimmten Rang zugeordnet werden. In der Reihenfolge von unten nach oben wird das Morphem als die Einheit charakterisiert, die als Element der Wortstruktur fungiert: Das Wort als Element der Gruppenstruktur; die Gruppe als Element der Teilsatzstruktur und der Teilsatz als Element der Satzstruktur. Die Gesamthierarchie wird in Abb. 5 illustriert.
70
Abb. 5. Satz
er
ist
noch
sauer
weil
ich
das
verbummelt
er
ist
noch
sauer
weil
ich
das
ver bummel t hab e
habe
Teilsatz Gruppe Wort Morphem
(Das Zeichen " | " grenzt die jeweilige Einheit und " " deren Strukturelemente ab) Die Teile einer diskontinuierlichen Einheit werden der Einfachheit halber auf derselben Rangebene dargestellt. Ihre Zugehörigkeit zu einer Einheit wird in Abb. 6 und 7 durch Pfeile (—•-•—) auf der Rangebene dieser Einheit angezeigt. Abb. 6. (Satz)/Teilsatz
ich : habe i es : verbummelt
Gruppe Wort Abb. 7. (Satz)/Teilsatz Gruppe
da
wird
er
nichts
von
wissen
wollen
— " " "
Wort Die Bedingung, daß jede Einheit aus "einer oder mehreren" Einheiten des nächst tieferen Rangs besteht, enthält die triviale Implikation, daß die Einheit "Satz" genau denselben Abschnitt umfaßt wie die im Satz enthaltenen kleineren Einheiten: Letzten Endes kann sich der Satz aus einem Teilsatz, der Teilsatz aus einer Gruppe, die Gruppe aus einem Wort und das Wort aus einem Morphem zusammensetzen, wie in Abb. 8.
71
Abb. 8. doch
gestern
hier
Morphem— doch
gestern
hier
Satz Teilsatz_. Gruppe Wort
Die Gesamtdefinition der jeweiligen Einheit ist nach den oben angeführten Teilcharakterisierungen zweifach und berücksichtigt die hierarchische Beziehung jeder Einheit zur nächst höheren und zur nächst tieferen Einheit. Der Teilsatz wird z . B . als die Einheit definiert, die als Element der Satzstruktur fungiert und sich aus Gruppen zusammensetzt; die Einheit "Gruppe" fungiert als Element der Satzteilstrüktur und setzt sich aus Wörtern zusammen.
3. 3. Der Satz 3. 3.1. Die zweifache Definition der Einheiten nur in bezug aufeinander innerhalb der Rangskala und ohne Berufung auf andere Kriterien läßt beide Endpunkte der Rangskala offen: Der Satz und das Morphem können nicht vollständig definiert werden, weil oberhalb des Satzes und unterhalb des Morphems keine Einheit identifiziert werden kann, welche die Definition dieser Einheiten vervollständigen könnte. Im Falle des Morphems ist dies unwichtig, da das Morphem als grammatische Einheit in bezug auf seine Funktion im Wort vollständig spezifiziert werden kann. Der Versuch einer vollständigen Definition des Satzes wäre demgegenüber schwieriger, weil keine höhere grammatische Einheit identifiziert worden ist, in der der Satz eine Funktion hätte. Unabhängig hiervon ist es klar, daß wir keinen allgemeinen theorieunabhängigen Satzbegriff übernehmen können. Meistens herrscht zwar allgemeine intuitive Übereinstimmung darüber, ob ein gegebenes konstruiertes Beispiel tatsächlich einen richtigen Satz darstellt oder nicht - davon hängt der Erkenntniswert solcher Beispiele ab. Aber eine D e f i n i t i o n 72
des Sat-
zes ist immer theoriegebunden, weil es keinen gültigen immanenten Begriff "Satz" gibt, der außerhalb aller Grammatiktheorien steht und für alle Grammatiken gilt. Indem wir den Satz also als primitiven Begriff auffassen, sind wir uns darüber im klaren, daß weder unsere Teildefinition allein noch die allgemeine intuitive Auffassung bei der praktischen Analyse eine eindeutige Einteilung für Abschnitte eines Textes liefert. So ist zum Beispiel die Segmentierung des folgenden (relativ einfachen) Textes keineswegs unproblematisch: (59)
1 // 1 übrigens es hat sich ist mir heute erst klar geworden// 2 // 2 es war ganz gut// // 2 daß frucht selbst etwas später kam// // 1 nämlich nach beginn meines Vortrags//
3 // 1 wenn er schon da gesessen hätte/ //
als ich runterkam//
4 // 1 durch einen reinen zufall // 1 bin ich gerade noch so pünktlich gekommen// 5 // 1 ich hätte es glatt verpaßt//
j*
6 // 3 ich hab nicht richtig auf die uhr geschaut//
]*
7 // 3 der chef hatte mich im Sekretariat noch//
} J
8 // 3 das hatte ich dir erzählt//
}
7 // 3 auf drei kleinigkeiten hingewiesen//
Ii
// 3 die er gerne geändert haben wollte// 9 // 1 und dann war es plötzlich viertel// 10 // 1 und wir hatten noch nicht aufgebaut//
J 1 J
11 // 1 ich wollte auch manches noch probieren//
L
12 // 1 die projektion//
J
Das Beispiel stellt einen Monolog dar, der in Teilsätze (Hauptsätze und Nebensätze) eingeteilt ist, wobei jeder Teilsatz eine Zeile einnimmt. Jeder Teilsatz fällt mit mindestens einer Tongruppe zusammen. Wir nehmen an, daß höchstens zwölf Sätze notwendig sind, um den zitierten Abschnitt zu beschreiben, wenn wir z.B. das Kriterium der "freien Form" anwenden würden. Dies wäre jedoch nur eine Möglichkeit. Die grammatische Ambiguität der Einheiten hängt erstens davon ab, ob mehrere "Hauptsätze" in einem 73
Satz auftreten können, und zweitens davon, auf welcher Basis bestimmte Nebensätze und Hauptsätze einem gegebenen "zusammengesetzten" Satz zugeordnet werden. Während die Regeln des Deutschen z.B. Sätze zulassen, die aus mehreren Hauptsätzen bestehen, welche jeweils mit einer Tongruppe zusammenfallen, sehen sie keine eindeutige Zuordnung der Abschnitte 4, 5 und 6 vor, wo eine beträchtliche Identität des Informationswerts von 4 und 5 vorhanden ist und eine kausale Beziehung zwischen 5 und 6 besteht, wobei ander e r s e i t s jeder dieser Abschnitte als selbständiger Satz vorkommen könnte. Die Abschnitte 9 und 10 stehen offensichtlich in einer engeren Beziehung zueinander als 8 und 9. Trotz des Vorhandenseins von und in einigen Fällen, das nicht unbedingt nur eine Beziehung zwischen T e i l s ä t z e n da auch S ä t z e
impliziert,
mit und verknüpft werden können, wäre es schwierig oder
sehr kompliziert, eine solche Beziehung nur in bezug auf den Satz, d. h. 3 ohne eine theoretisch fundierte Textanalyse nachzuweisen . Hinsichtlich der Mitteilung, des Inhalts oder des Sachverhalts stellt der oben zitierte Monolog einen relativ einheitlichen und abgeschlossenen Abschnitt dar. Es könnte sogar behauptet werden, daß die Einheitlichkeit des Sachverhalts dafür spricht, daß man den Abschnitt in zwei Teile - 8 und den Rest - segmentiert, was nicht mehr und nicht weniger willkürlich wäre als eine Einteilung in 12 "Sätze". Die Einteilung, die hier vorgeschlagen wird, stellen die geschweiften Klammern auf der rechten Seite dar, wobei diese Einteilung ebenfalls auf keinen eindeutig grammatischen Kriterien beruht, da solche Kriterien fehlen. W. Schmidt schrieb erst 1967 über die Definition des Satzes, daß sie "ein Problem" darstellt, "dessen Lösung bis zum heutigen Tage größte Schwierigkeiten macht" (Schmidt, W. 1967, S. 240). Angesichts der oben gemachten Bemerkungen wird hier die Ansicht v e r t r e ten, daß die Schwierigkeit nicht in der Definition, sondern in der Interpretation der Definition bei der Behandlung aktueller Äußerungen liegt. Es gehört nicht zu den Zielen der vorliegenden Arbeit, eine befriedigende Lösung zu diesem Problem vorzuschlagen, und der Begriff Satz wird so gehandhabt, daß er verschiedene Möglichkeiten zuläßt, wie im Beispiel (59). Der Satz bleibt also ein primitiver Begriff und wird als solcher auf andere Begriffe
74
bezogen, wobei dies jedoch schon gewisse Einschränkungen der Zuordnungsmöglichkeiten natürlicher Äußerungen zum Satz oder zum Teilsatz mit sich bringen wird. Wenn wir uns wiederum auf die zweifache Definition der Einheiten beziehen, so stellen wir fest, daß unter Berufung auf die Einheit "Teilsatz" mindestens eine partielle Definition der Einheit "Satz" möglich ist, weil der Teilsatz als Element der Satzstruktur fungiert. Innerhalb des theoretischen Rahmens, der die oben angeführten Definitionen bestimmt, kann die Beziehung zwischen den Teilsätzen selbst als Anhaltspunkt für die Abgrenzung des Abschnitts gelten, der als Satz angenommen wird: Gewisse T e i l s ä t z e
setzen andere Teilsätze voraus, so daß beide
zusammen einen "zusammengesetzten Satz" bilden. Aus Beispiel (59) nehmen wir die Abschnitte, in denen im Sinne einer solchen Voraussetzung mindestens eine einseitige Abhängigkeit besteht: (60)
es war ganz gut daß frucht etwas später kam
(61)
wenn er schon da gesessen hätte als ich runter kam
(62)
der chef hatte mich auf drei kleinigkeiten hingewiesen die er gerne geändert haben wollte
wenn die Satzteile 9 und 10 im Beispiel (59) als ein Satz interpretiert w e r den, dann wäre ebenfalls in der Liste anzuführen: (63)
und dann war es plötzlich viertel und wir hatten noch nicht aufgebaut.
Für die grammatischen Beziehungen zwischen solchen Teilsätzen gibt es eine unbegrenzte Zahl von Beschreibungen. Nach den meisten davon ergeben sich zwei Arten der Beziehung, die vom Status des Teilsatzes als individueller Einheiten abhängen. In jedem Fall setzt ein Teilsatz den anderen voraus: Eine Art von Teilsatz kann allein stehen, die andere nicht. Im Falle von (63) hängt diese Aussage natürlich davon ab, ob das Ganze als ein Satz interpretiert wird (abgesehen von der Frage, ob auf Grund des und im ersten Teilsatz das Beispiel (63) im vorangehenden Satz im Abschnitt (59) einge75
schlössen werden sollte). Wenn wir (63) als einen Satz interpretieren, was übrigens bestimmt für solche Fälle gilt wie: (64)
ich glaube du verstehst mich nicht richtig
wo nur ein Satz angenommen werden kann, so ergeben die Beispiele (62) und (63) zwei verschiedene Möglichkeiten einer Beziehung zwischen T e i l sätzen, die wir undifferenziert als das System der Voraussetzung b e z e i c h nen können. Das System hat - zunächst auf einer relativ undifferenzierten Stufe - zwei T e r m e : "Verknüpfung", eine Beziehung zwischen g l e i c h w e r t i gen Teilsätzen, d. h. Teilsätzen, die allein stehen könnten, und " V e r b i n dung", eine Beziehung zwischen nichtgleichwertigen Teilsätzen, von denen einer selbständig vorkommen könnte und der andere nicht. Wenn wir die 4 Elemente der Satzstruktur vorläufig als « und ß bezeichnen , die durch die Klassen " f r e i e r " resp. "gebundener" T e i l s a t z r e a l i s i e r t werden, dann hätten die oben angeführten Beispiele folgende Strukturen:
(60): aß (62): aß (63):a&.a, wobei das Strukturelement
durch einen "verknüpften
T e i l s a t z " r e a l i s i e r t wird, (64): K t t B e i s p i e l (61), ein unvollendeter Satz, hätte, wenn der Satz durch einen f r e i e n T e i l s a t z vollendet worden wäre, die Struktur: ß ?
K
wobei ce durch ß und ß durch y vorausgesetzt wird. Die Struktur ccß sieht nämlich eine endlose Anreihung v o r : ocßycfe... während gleichwertige T e i l s ä t z e , d.h. T e i l s ä t z e der gleichen T i e f e endlos verkettet werden können, etwa:
acta
( s. B e i s p i e l (64)), aha La
...
oder
ccß&.ß&.ß...
z.B.: (65) & a und das interessante war eben ß heraus sozusagen zu sehen y
ob man Verständnis haben kann für sein verhalten
&. J und ob man Verständnis haben kann für ihr verhalten 76
wobei eine Verkettung in der Tiefe y vorkommt, also:
. Die Voraus-
setzungsbeziehung zwischen Teilsätzen in der Satzstruktur kann weiter durch folgendes Beispiel illustriert werden: (66) & a / / 3 aber ich habe das gefühl//
// 1 // 1 // * * //