Sprechbewegung und Sprachstruktur: Morphographisch-strukturelle Ableitungs-Hierarchie eines Modell-Universums der Sprechbewegung und Sprachstruktur 9783111349626, 9783110995558


166 100 23MB

German Pages 302 [304] Year 1975

Report DMCA / Copyright

DOWNLOAD PDF FILE

Table of contents :
INHALTSVERZEICHNIS
I
II
III
IV
V
VI
VII
VIII
IX
X
XI
XII
XIII
XIV
XV
XVI
XVII
XVIII
LITERATUR
ANHANG
AUTOREN-REGISTER
SACH-REGISTER
Recommend Papers

Sprechbewegung und Sprachstruktur: Morphographisch-strukturelle Ableitungs-Hierarchie eines Modell-Universums der Sprechbewegung und Sprachstruktur
 9783111349626, 9783110995558

  • 0 0 0
  • Like this paper and download? You can publish your own PDF file online for free in a few minutes! Sign Up
File loading please wait...
Citation preview

JANUA LINGUARUM STUDIA MEMORIAE NICOLAI VAN WIJK DEDICATA edenda curai C. H. V A N S C H O O N E V E L D Indiana

Series

University

Maior,

94

SPRECHBEWEGUNG UND SPRACHSTRUKTUR Morphographisch-strukturelle AbleitungsHierarchie eines Modell-Universums der Sprechbewegung und Sprachstruktur

von

REINHOLD SOLLE

1975

MOUTON THE HAGUE • PARIS

© Copyright 1975 in The Netherlands Mouton & Co. N.V., Publishers, The Hague No part of this book may be translated or reproduced in any form, by print, photoprint, microfilm, or any other means, without written permission from the publishers.

LIBRARY OF CONGRESS CATALOG CARD NUMBER: 74-84247

Printed in Belgium by NIC1, Ghent

INHALTSVERZEICHNIS

I 1. 2. 3. 4.

Einleitung Konzeption des Modell-Universums Systematische Feldeingrenzung Inhaltliche Gliederung der Ableitungs-Hierarchie

1 2 6 10

II 1. Kontinuitäts-Theorie 2. Evolution und Sprachursprung 3. Hirn- und Sprech-Rhythmik

15 19 25

III 1. 2. 3. 4. 5.

Atem-und Silbenpuls Atmung, Lautbildung und Artikulation Silbe, Atemfuß, Atemgruppe und Phrase Ballistischer Puls- und Rückstoß Synoptische Darstellung der Sprechbewegung

27 29 33 35 38

IV 1. Brust- und Konsonantbewegung 2. Ballistische Silbentypen

40 41

V 1. Kehlkopf-und Mundverschluß in phylogenetischer Sicht 2. Vokal- und Konsonantbildung in ontogenetischer Sicht

45 50

VI 1. Vokalbildung im Ansatzrohr 2. Systematische Eingrenzung der Vokal- und Konsonant-Artikulation . . 3. Ansatzrohr und Formantbildung

55 61 69

VI

INHALTSVERZEICHNIS

VII 1. Puls- und Rückstoß der Lippen- und Zungenbewegung 2. Ausführung und Bereitstellung der Lippen- und Zungenbewegung . . .

75 78

VIII 1. 2.

Motorische und sprachliche Entwicklung Lall-Silbe und Reduplikation

85 88

IX 1. Phonem-System und distinktive Oppositionen 2. Distinktive Oppositionen und Ansatzrohr 3. Phonemische Klassifikations-Matrix und Kodierung

91 97 99

X 1. 2. 3. 4.

Sprechimpuls und Gesamt-Bedeutung Der Plancharakter serieller Ordnung Sukzessiv- und Simultan-Ordnung Ketten-und Klassenbildung

102 106 111 113

XI 1. 2. 3. 4.

Indikation und Prädikation Situativer und symbolischer Zwei-Zeichen-Satz Das prädikative Syntagma als Satz-Universalie Indikative Aktualisierung durch Aktanten und Circonstanten

119 124 131 139

XII 1. Sapirs Sprachtypen 2. Inter-und intraspezifische Modifikation 3. Interaktion zwischen "langue" und "parole"

147 157 162

XIII 1. 2. 3. 4. 5. 6.

Die Satzbildung in den NAI-Sprachen Indikativ/Prädikativ-Funktion und Formklassen-Unterscheidung . . . . Polaritäts-Kontinuum und Proximitäts-Hierarchie Aktanten-Fundierung und Positions-Ordnung Anaphora-Verweis und nominal/pronominaler Rückbezug Prädikative Aktanten-Ausrichtung

169 174 177 180 182 185

XIV 1. Zwei-Referent-Prädikator und Tripositionalität 2. Greenbergs Basisordnung-Typologie 3. Dominanz und Harmonie bei universellen Stellungsregeln

188 192 198

INHALTSVERZEICHNIS

VII

XV 1. 2. 3. 4. 5. 6. 7.

Universalien-Komplex: Frage-Ordnung Universalien-Komplex : Verb-Ordnung Universalien-Komplex: Funktions-Ordnung Universalien-Komplex: Modifizierer-Ordnung Universalien-Komplex: Inflektions-und Kasus-Ordnung Universalien-Komplex: Pronominal-Ordnung Uni versalien-Komplex : Modalitäten-Ordnung

205 207 209 214 221 224 227

XVI 1. Ableitungs-Hierarchie und Universalien-Komplexe 2. Außen- und Binnen-Kriterien der Basisordnung 3. Prinzipien der Universalien-Bestimmung

232 236 239

XVII 1. Kategoriale Isomorphie in Phonologie, Grammatik, Semantik 2. Hypothetisch-deduktiver Drei-Stufen-Plan

. . . .

247 252

XVIII 1.

"Morphologischer" Ausblick

256

Literatur

263

Anhang A

275

Anhang B

278

Autoren-Register

284

Sach-Register

287

Für die großzügige und vielseitige Förderung vorliegender Arbeit bin ich Herrn Prof. Dr. C.-F. Graumann, für Anregungen und Hinweise auf dem Gebiet der Psychophonetik und Kommunikationswissenschaft Herrn Prof. Dr. S. Ertel und Herrn Prof. Dr. G. Ungeheuer, f ü r kritische Anmerkungen zu sprachwissenschaftlichen Problemen Herrn Prof. Dr. K. Heger zu besonderem Dank verpflichtet. Heidelberg,

September

1974

I

1. EINLEITUNG

"Wir wollen in unserem Wissen vom Gebrauch der Sprache eine Ordnung herstellen: eine Ordnung zu einem bestimmten Zweck; eine von vielen möglichen Ordnungen" (Wittgenstein 1960, §132). — Dieses Zitat, das Hörmann an den Anfang seiner Psychologie der Sprache (1967) stellt, könnte auch der Leitsatz vorliegender Untersuchung sein. Darum seien zunächst die Fragen aufgeworfen: 1. Was für eine Ordnung soll denn hergestellt werden? 2. Welchem bestimmten Zweck soll diese Ordnung dienen und 3. Wieso ist sie nur eine von vielen möglichen Ordnungen ? Bei näherer Prüfung bereitet indes schon die Beantwortung der ersten Frage einiges Kopfzerbrechen. Wenn nämlich — wie im Titel angedeutet wird — eine "Ordnung" zwischen der Sprechbewegung (des menschlichen Sprechapparates) und der Sprachstruktur (der formalen Syntax) hergestellt werden soll, handelt es sich weder um eine rein psycholinguistische noch linguistisch-strukturelle Betrachtung (op. cit. 18), sondern um ein "deskriptives Kontinuum", das sich ausschnittweise über beide Gebiete erstreckt. Worin nun der "Zweck" einer solchen Ordnung besteht, kann ebenfalls nur mit einigem Zögern beantwortet werden, da Ordnung in gewissem Sinne "Selbstzweck" ist und insofern keiner externen Begründung bedarf. So könnte man auch in vorliegendem Fall argumentieren, daß die methodische Überführung von Sprechbewegung in Sprachstruktur eine Aufgabe eigener Art darstelle, die selbstgenügsam sei. Damit nicht zufrieden, könnte man außerdem als inhaltlich orientierten "Zweck" der Untersuchung die Absicht anführen, das deskriptive Kontinuum der Sprechbewegung und Sprachstruktur in die Bestimmung von Sprach-Universalien einmünden zu lassen. Dieweil aber bei der Komplexität des Forschungsgegenstandes viele Ansätze und viele Verfahren möglich sind, kann auch der hier etablierte Ordnungszusammenhang nur einer von vielen möglichen sein. Dies um so mehr, als er sich auf einen Inhaltsbereich erstreckt, der weder mit dem der kognitiven Ordnung, der Psycholinguistik, der strukturellen Linguistik oder der (inhaltlich orientierten) Sprachwissenschaft übereinstimmt.

2

EINLEITUNG

Schon die Art der Stoffauswahl aus diesem sehr weiten Inhaltsbereich wird deswegen die darin herzustellende Ordnung indirekt präjudizieren. Einerseits wird dasjenige selegiert, was mit einer vor-systematischen Ordnungsvorstellung vereinbar erscheint, andererseits wirkt aber auch die — mehr oder weniger repräsentative — Datensammlung auf die Form der Systematisierung zurück. Um begründen zu können, warum die hier vertretene Ordnung optimal ist bzw. vor den sonst möglichen Ordnungen bevorzugt wird, muß man demnach auf deren inhaltsbedingte Voraussetzungen eingehen. Nur so gelingt es, den hier eingeschlagenen Ableitungsweg in seiner methodischen Notwendigkeit zu erkennen: die Kriterien der herzustellenden Ordnung sind darum — bei gegebener Disposition — durch die Art der "Herstellung" ( = Ableitung) selbst zu erbringen, um als optimale ausweisbar zu sein. 2. KONZEPTION DES MODELL-UNIVERSUMS

Die Aufgabe, ein deskriptives Kontinuum zwischen Sprechbewegung und Sprachstruktur herzustellen, stellt sich darum in doppelter Form, d.h. in inhaltlicher und methodischer Hinsicht. Um eine optimale Bearbeitung des Forschungsgegenstandes zu gewährleisten, sollen die methodischen Kriterien dabei so weitgehend aus den inhaltlichen Gesichtspunkten entwickelt werden, wie dies bei gegebener Problemlage überhaupt möglich ist. Ausgangspunkt der inhaltlichen Betrachtung sei die schlichte Überlegung, daß der menschliche Sprechapparat eine "conditio sine qua non" (unerläßliche Bedingung) nicht nur der Sprechbewegung, sondern auch der Sprachstruktur darstellt, da es keine "natürliche" Sprache gibt, die ohne dieses organismische Instrument entstanden wäre. Damit wird einerseits betont, daß selbst die kompliziertesten Formen der Sprachstruktur auf die fundierenden Bedingungen der Sprechbewegung zurückgehen, andererseits aber auch hervorgehoben, daß "Sprache" sehr viel mehr als bloße Betätigung des Sprechapparates impliziert bzw. nicht einfach auf ihre organismischen Grundlagen reduziert werden kann. [Um Mißverständnissen hinsichtlich der thematischen Abgrenzung vorzubeugen, sei hier betont, daß es sich bei dieser "unerläßlichen Bedingung" nur um die generelle Regel bei der Entstehung natürlicher Sprachen, nicht aber die Ausnahme handeln soll. Wenn Ertel (1969, 75-82) etwa nachweisen kann, daß Gehörlose und Hörende wegen zugrundeliegender "Allgemeinqualitäten" weitgehende Übereinstimmung in der (visuellen) Zuordnung von sinnfreien Lautgebilden und Zeichnungen aufweisen, die an die Vermittlung durch verschiedene Sinneskanäle (Kinästhesie, Gehör) denken läßt, so wird damit obiger Regel kein Abbruch getan, da sie an den normalerweise konstitutiven, d.h. auditiven Gegebenheiten des Phänomens "Sprache" orientiert ist. Damit ist zugleich gesagt, daß nicht-akustische Gebärdensprache natürlicher Herkunft und nicht natürlich entstandene Kunstsprachen verbaler, logischer oder mathematischer Provenienz aus dem hier definierten Problemkreis zwangsläufig

KONZEPTION DES MODELL-UNIVERSUMS

3

ausscheiden — womit aber ihr möglicher Charakter als "Sprache" (im weiteren Sinn) nicht in Abrede gestellt werden soll.] Daraus erwächst eine methodische Schwierigkeit besonderer Art. Denn es wird nun erforderlich, die fundierenden Bedingungen der Sprechbewegung nur insoweit als Rahmenordnung der Sprachstruktur gelten zu lassen, als dadurch die inhärenten Regularitäten höherer Sprach-Ebenen nicht präjudiziert werden. Wenn man davon ausgeht, daß die eigentliche Sprechbewegung der motorischen Ebene über die auditiv-phonemische, serielle, signifikative und syntaktische Ebene zur semantischen Bedeutungshöhe "hinauf-transformiert" wird, stellt zwar jede untere Ebene die notwendige Bedingung jeder übergeordneten Ebene dar, beschreibt sie aber nicht in zureichender Weise. Vielmehr steht der "unerläßlichen Bedingung" der ersteren eine selektive Forderung gegenüber, derzufolge nur diejenigen Charakteristika übernommen werden, die "transformierbar", d.h. in die inhärenten Regularitäten der übergeordneten Ebene übersetzbar sind. Insofern aber diese Charakteristika bei der Transformation von Ebene zu Ebene nur noch als unabdingbare Voraussetzung höherer Stufen anzusehen sind, können sie — in dem dreifachen Hegeischen Sinne — als "aufgehobene" betrachtet werden, denn sie sind 1. auf eine höhere Stufe "hinauf-gehoben"; 2. auf dieser Stufe trotz der Transformation noch "aufbewahrt", aber 3. dort auch als eigenständiges Phänomen "verschwunden": "So ist das Aufgehobene ein zugleich Aufbewahrtes, das nur seine Unmittelbarkeit verloren hat, aber darum nicht vernichtet ist" (Hegel 1812, 94). Beginnt man nun mit der Beschreibung der Sprechbewegung als der untersten Ebene dieser Ableitungs-Hierarchie, so sind demnach nicht deren Charakteristika schlechthin, sondern nur solche Momente zu berücksichtigen, die in die inhärenten Regularitäten der nächsthöheren (akustischen) Ebene übersetzbar sind. Dabei ist zu berücksichtigen, daß nach dem Prinzip der "Äquifinalität", d.h. der prinzipiell mehrsinnigen Transformations-Richtung keine einfache 1:1-Beziehung zwischen den korrespondierenden Momenten verschiedener Ebenen möglich ist (vgl. Heider 1944; 1958; Lenneberg 1967, 1933). Danach müssen die fundierenden Bedingungen der jeweils unteren Ebene innerhalb des deskriptiven Kontinuums so dargestellt werden, daß die Art ihrer Ausfilterung im "aufhebenden" Selektions-Prozeß der jeweils oberen Ebene sichtbar wird. Da es keine einwertige Zuordnung beider Ebenen gibt, fällt die Selektivität bei jeder folgenden Stufe mehr ins Gewicht; einige Daten einer vorausgehenden Stufe sind irrelevant für jede der folgenden Stufen, und jedes Item der letzten Stufe kann eine Funktion mehrerer Vaiiablen der vorausgehenden Stufe sein. So erlaubt etwa die Messung des Ansatzrohres (vocal tract) eine genaue Voraussage des Klangspektrums, ein und derselbe akustische Effekt kann aber auf völlig verschiedene Weise Zustandekommen. Ähnlich kann auch dasselbe Attribut einer auditiven Empfindung das Resultat verschiedener physikalischer Reize sein (Jakobson & Halle 1956, 34).

Hierbei ist von besonderer Bedeutung, daß die Selektivität bei jeder folgenden Stufe mehr ins Gewicht fällt, d.h. in dem Maße über die Selektions-Kriterien der

4

KONZEPTION DES MODELL-UNIVERSUMS

gesamten Hierarchie mitentscheidet, wie sie sich der obersten Ableitungs-Stufe, d.h. dem eigentlichen Bestimmungs-Ziel nähert. Da nur auf der obersten Stufe darüber entschieden werden kann, was letztlich und end-gültig "aufgehoben" werden muß, bleibt nämlich die Transformation von Stufe zu Stufe immer auf den Zusammenhang der gesamten Ableitungs-Hierarchie angewiesen. Wenngleich sie gemäß der Eigenstruktur dieser Stufen eine gewisse Selbständigkeit bewahrt, wird doch ihre Gesamt-Richtung von der obersten Stufe, d.h. vom Bestimmungs-Ziel her diktiert. Damit wäre aber der methodische Weg von der Sprechbewegung zur Sprachstruktur (bzw. Universalien-Ableitung) nicht nur als kontinuierliche, sondern auch als eingrenzende Beschreibungsweise festgelegt. Denn das von Stufe zu Stufe zunehmende Gewicht der Selektivität muß sich in der Deskription als zunehmend schärfere Herausarbeitung des eigentlichen Bestimmungs-Zieles auswirken, dem die gesamte Ableitungs-Hierarchie unterzuordnen ist. Wenn aber die fundierenden Bedingungen der untersten Ebene in allen weiteren Ebenen nur insoweit erhalten bleiben, als sie in das eigentliche Bestimmungs-Ziel überführbar sind, ist die Basis dieses hypothetischen "Universums" final (bzw. "äqui-final") auf dessen Spitze bezogen, während sich die Spitze wiederum in kausaler Abhängigkeit von der Basis befindet, die eine notwendige, wenn auch nicht zureichende Bedingung der ersteren darstellt. Graphisch kann dieses wechselseitige Abhängigkeits-Verhältnis durch eine Pyramide dargestellt werden, deren Grundfläche die Basis des Universums und deren Spitze dessen Bestimmungs-Ziel darstellt (vgl. Abb. 1). Da es sich um ein hypothetisches Universum handelt, dessen "Ordnung" zwar nur eine von vielen möglichen ist, die aber im hier ausgeführten Sinne als verbindliches Sprachmodell hingestellt werden soll, sei diese Ableitungs-Hierarchie als ein (mögliches) "Modell-Universum" der Sprechbewegung und Sprachstruktur eingeführt. Sp

Basis (Prß) entspricht.

KONZEPTION DES MODELL-UNIVERSUMS

5

Durch obige Pyramide wird aber nicht nur das Abhängigskeits-Verhältnis von Basis und Spitze dargestellt, sondern auch angedeutet, daß die finale Ausrichtung auf dem kürzesten Wege zwischen Basis und Spitze angestrebt wird, wobei letztere in zentraler Position über ersterer zu lokalisieren ist. Jede Verschiebung der Spitze aus dieser zentralen Position (bei gleichbleibender Höhe) würde nämlich gleichbedeutend mit zunehmender Distanz zwischen Spitze und zentralem Projektionspunkt der Basis (bzw. verkleinertem Ausfallwinkel) sein (vgl. Abb. 1). Da dieser Suchweg (zwischen zentralem Projektionspunkt und Spitze) aber zunächst noch unbekannt ist bzw. sowohl den finalen wie den kausalen Bedingungen der Ableitung genügen muß, kann er — im Bilde gesprochen — nur durch approximierendes "Auspendeln" gefunden werden, wobei jedem Ausschlag des zentralen Projektionspunktes eine kompensatorische Gegenbewegung der Spitze (und umgekehrt) entspricht. Die zentralen Punkte ziehen sich so lange gegenseitig an, bis sie auf das Optimum des kürzesten Weges (bzw. geringsten Widerstandes gegen die Anziehungskraft) eingependelt sind. Analog dazu könnte die Ableitungs-Hierarchie auch durch ein sog. "Euler-VennDiagramm" abgebildet werden, dessen einzelne Schichten den verschiedenen Transformations-Stufen entsprechen würden. Die Ähnlichkeit mit obigem PyramidenModell ist besonders evident, wenn man es in der Seiten-Ansicht darstellt (vgl. Abb. 2 a). Zeigt man es aber in der Aufsicht, so werden die sich überlagernden Schichten als einschließend-eingeschlossene Figur-Grund-Bereiche präsentiert, wobei die Umrißlinie der jeweils oberen von derjenigen der jeweils unteren Schicht voll umfaßt wird (vgl. Abb. 2 b). Unabhängig von der (horizontalen) Eigenstruktur der Ableitungs-Ebenen, die in den (unregelmäßig geformten) Umrißlinien der Schichten zum Ausdruck kommt, wäre hier das zunehmende Gewicht der Selektivität in der gemeinsamen Ausrichtung der Figur-Grund-Bereiche auf die oberste "Figur" ( = Pyramidenspitze) zu sehen, so daß letztere bei kürzestem Weg zwischen zentralem Projektionspunkt und Spitze innerhalb der Umrißlinien aller darunterliegenden Schichten liegen müßte (vgl. Abb. 2 b). Da jedoch bei jeder Modell-Vorstellung die Gefahr eines Schematismus naheliegt, sei darauf hingewiesen, daß in dem Pyramiden-Modell (bzw. dem Euler-Venn-Diagramm) nur der Aspekt zunehmender Selektivität in der Aufwärtsrichtung (von der Basis zur Spitze) dargestellt werden kann. Insofern die Sprechbewegung aber nicht nur sequentielle und serielle, sondern auch konzeptive, signifikative, logische und regelhafte Komponenten enthält, die in die Sprachstruktur überführt werden sollen, ist nicht nur an die kontinuierliche Eingrenzung des Bestimmungs-Ziels, sondern auch an die Einführung obiger Komponenten (auf bestimmten Ebenen der Hierarchie) zu denken. Dabei wird es zweckmäßig sein, sie — analog zum Pyramiden-Modell — aus ihren allgemeineren (außersprachlichen) Voraussetzungen herzuleiten und soweit zu spezifizieren, daß sie in die Rahmenordnung der vorgesehenen Ableitungs-Stufe einführbar sind. Diese zusätzlichen Komponenten kommen also in dem

K O N Z E P T I O N DES

ABB. 2.

MODELL-UNIVERSUMS

Euler-Venn-Diagramm: a Seitenansicht b Aufsicht.

Pyramiden-Modell nur implizit zum Ausdruck, könnten aber nach ihrer (außersprachlichen) Bestimmung mit "Trichtern" verglichen werden, die (als umgekehrte "Pyramiden") den spezifizierten Inhalt zufließen lassen.

3. SYSTEMATISCHE FELDEINGRENZUNG

Damit haben wir das am Forschungs-Gegenstand gewonnene Prinzip zunehmender Selektivität soweit schematisiert, daß seine Verwandtschaft mit feldtheoretischen Bestimmungs-Methoden allgemeinerer Art erkannt werden kann (vgl. Solle 1969). Und zwar ist hier nicht nur der feldtheoretische "Einstieg von oben" gemeint, wie er von Gestalttheoretikern und Phänomenologen vertreten wurde (Köhler 1944, 143; Mac Leod 1947, 196-197; Luchins 1951, 70) bzw. vom Funktionalismus als "Reduktion von oben" (Brunswik 1955, 237) bekannt ist (vgl. Solle 1966, 51, 169), sondern an eine "morphologische" Methode gedacht, die auf "vollständige Feldüberdeckung", d.h. systematische Erfassung aller problem-relevanten Daten angelegt ist und durch Kontinuität, Stützpunkttaktik, Widerspruchslosigkeit etc. gekennzeichnet werden kann (Zwicky 1959; 1966). Hierfür wird die Konstruktion und Auswertung eines sog. "morphologischen Kastens" empfohlen, der die Definition

SYSTEMATISCHE

1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15.

A. A. A. A. A. A. A. A. A. A. A. A. A. A. A.

FELDEINGRENZUNG

FaFa, FaMo, MoFa, MoMo FaFa, FaMo B. MoFa, MoMo FaFa, MoFa B. FaMo, MoMo FaFa, MoMo B. FaMo, MoFa FaFa B. FaMo, MoFa, MoMo FaMo B. FaFa, MoFa, MoMo MoFa B. FaFa, FaMo, MoMo MoMo B. FaFa, FaMo, MoFa FaFa, FaMo B. MoFa C. MoMo FaFa, MoFa B. FaMo C. MoMo FaFa, MoMo B. FaMo C. MaFo FaMo, MoFa B. FaFa C. MoMo FaMo, MoMo FaFa C. MoFa MoFa, MoMo B. FaFa C. FaMo FaFa B. FaMo C. MoFa D. MoMo

9

common occurs common not found not found not found not found occurs occurs occurs not found occurs not found not found common

TAB. 1. Systematisches Übersichtsschema von Verwandtschaftsbezeichnungen (kinship terminology) mit häufig, selten oder gar nicht vorkommenden Formen möglicher Kombinationen zur Ermittlung universeller Kategorien. (Nach Greenberg 1966.)

zu erstellende Modell-Universum eher dem morphologischen Kasten der "kinship terminology", auf den unteren Ebenen dagegen mehr dem allgemeinen Prinzip markiert/unmarkierter Kategorie-Unterscheidung bezüglich seines EndlichkeitsCharakters gleichen würde. Der zunehmend schärferen Herausarbeitung des Bestimmungs-Ziels (vgl. S. 14) würde somit eine "Feldeingrenzung" entsprechen, die zunehmend "systematischer", d.h. lösungsstrenger sein würde. Für den hier zu beschreibenden Forschungs-Gegenstand ist aber die Forderung nach zunehmender Lösungsstrenge gleichbedeutend mit zunehmender Abstraktion und Formalisierung der syntaktischen Struktur von der "unerläßlichen Bedingung" ihrer organismischen Grundlage. Der systematischen Eingrenzung serieller Ordnungsformen wird also eine Beschreibung körperlicher Fundierungsvorgänge vorauszugehen haben, die bereits hinsichtlich ihrer sequentiellen Uberführbarkeit selegiert sind. Es wird sich somit um eine Ableitungs-Hierarchie handeln müssen, deren deskriptives Kontinuum von der "morphographischen" Darstellung des menschlichen Sprechapparates bis zur "strukturellen" Analyse syntaktischer Regelhaftigkeit reicht. (Im Unterschied zu der "morphologischen" Methode sei hier von "morphographischer" Abbildung gesprochen, um einerseits einer Verwechslung beider Termini vorzubeugen, andererseits aber die Betonung auf den "graphischen" AbbildungsAspekt zu verlagern, der dem "logischen" Formalisierungs-Aspekt gegenüberzustellen ist.) Danach würden erst die "strukturellen" Ableitungs-Kriterien dem Endlichkeits-Charakter strenger Lösbarkeit entsprechen, sie müßten aber bis zu den sequentiellen Verläufen "morphographischer" Körpervorgänge als ihren fundierenden Bedingungen zurückverfolgt werden. Vor einem allzu schematischen Denken muß indes auch hier gewarnt werden. Denn es läßt sich vorwegnehmen, daß es auf allen Ebenen der Ableitungs-Hierarchie endliche Elemente-Verbindungen geben wird, die den Vorzug vor vieldeutigen

10

SYSTEMATISCHE FELDEINGRENZUNG

Zusammenhängen verdienen, sofern sie nur mit der Eingrenzungs-Richtung auf das Bestimmungs-Ziel vereinbar sind. Ein wesentliches Kriterium der AbleitungsHierarchie wird deswegen darin zu sehen sein, daß die Überführung fundierender Bedingungen selber so weit wie möglich dem Prinzip endlicher Feldeingrenzung entspricht. Allerdings wird man mit zunehmender Entfernung vom Organismisch-Anschaulichen auch mit einer Zunahme unbekannter bzw. vieldeutiger Zusammenhänge zu rechnen haben, was zunächst der Forderung nach zunehmender Lösungsstrenge zuwiderlaufen würde. Darum wird gerade die dritte Variante morphologischer Lösbarkeit, nämlich die methodische Kombination vieldimensionaler und endlichbestimmter Zusammenhänge mehr und mehr in den Vordergrund treten müssen: wie sich später zeigen wird, dominiert sie vornehmlich bei der eigentlichen Universalien-Bestimmung. Um eine solche Kombination aber überhaupt vornehmen bzw. sagen zu können, was endlich lösbar und vieldeutig unlösbar ist, bedarf es wiederum einer systematischen Übersicht, die schon in Richtung auf diese wahrscheinlichkeitstheoretische Lösbarkeit angelegt ist. Die material orientierte Selektivität der Daten-Überführung wird darum als deskriptives Kontinuum mit einer formal orientierten Feldeingrenzung zu verbinden sein, die den Vorzug ungewöhnlich weiter Feldüberdeckung mit demjenigen möglichst lückenloser Erfassung problem-relevanter Daten zu vereinbaren sucht, wobei die Basis der Ableitungs-Hierarchie mehr der umfassenden Weite der Feldüberdeckung, die Spitze dagegen mehr der strengen Lösbarkeit des morphologischen Kastens entspricht (Zwicky 1966; vgl. weitere Schriften des Autors zur morphologischen Forschung: 1950; 1957; 1958; 1962). An dieser Stelle könnte bereits gefragt werden, in welcher besonderen Form die "Sprachstruktur" als Zielvorstellung des Modell-Universums zu antizipieren ist. Da es jedoch zum Prinzip einer sprachlichen Fundierungs-Hierarchie gehört, eine mögliche Zielvorstellung nur insoweit vorwegzunehmen, als sie mit den Bedingungen der sie konstituierenden Ebenen zu vereinbaren ist, sei hier nur summarisch angemerkt, daß der anvisierte Universalien-Charakter dieser Sprachstruktur nur über die Oberflächenstruktur von Einzelsprachen erreichbar sein wird, wenn die Fundierung durch eine aktuell sich ereignende Sprechbewegung methodisch brauchbar sein soll. An geeignetem Ort wird aber aufzuzeigen sein, wie sich diese Pluralität von Einzelsprachen zur allgemeinen Begriffsstruktur der Aussage verhält und wie sich außereinzelsprachliche Universalien daraus in einer Weise ableiten lassen, daß sie zu ihrer gegenseitigen Abstützung beitragen, weil sie zu größeren Universalien-Komplexen verschränkt sind. 4. INHALTLICHE GLIEDERUNG DER ABLEITUNGS-HIERARCHIE

Bevor nun mit der eigentlichen Untersuchung dieses sehr komplexen ForschungsGegenstandes begonnen wird, sei zur besseren Orientierung über den internen

INHALTLICHE GLIEDERUNG DER ABLEITUNGS-HIERARCHIE

11

Zusammenhang der Ableitungs-Hierarchie ein kurzer Abriß der inhaltlichen Gliederung gegeben (vgl. Inhaltsverzeichnis). Im Abschnitt II wird zunächst auf Fundierungs-Aspekte eingegangen, die für den Aufbau des Modell-Universums nur indirekt relevant sind, zur Klärung der eigenen Position aber systematisch ausgegrenzt werden müssen. — So wird etwa an der sog. "Kontinuitäts-Theorie" aufgewiesen, daß dort in einem ganz anderen Sinn von (kategorialer) Kontinuität als in vorliegender Abhandlung gesprochen wird. Da die Ableitungs-Hierarchie nicht von einem Mosaik phylogenetischer Sprachkomponenten, sondern von den Bedingungen des menschlichen Sprechapparates ausgeht, werden die "proximalen" Evolutions-Kriterien im folgenden Kapitel besonders herausgestellt. Weiter wird darauf hingewiesen, daß der Zusammenhang zwischen Hirn- und Sprechrhythmik nur insofern für die Untersuchung von Belang sein kann, als dadurch die rhythmisch-sequentiellen Bedingungen der Sprechbewegung besser interpretierbar werden. Im Abschnitt III wird dann mit der eigentlichen Beschreibung der organismischmotorischen Grundlagen des Sprechvorgangs begonnen. Hier wird nachgewiesen, daß die "wahre Grundeinheit" des Sprechens nicht in zerebralen Vorgängen, sondern im sog. "Silbenpuls" zu sehen ist, der das phonetische Korrelat des motorischen Atem- und Brustpulses darstellt. Da die Sprechbewegung als integrierte Funktion von Atmung, Lautbildung und Artikulation verstanden wird, können die rhythmischen Verläufe der einzelnen Sprechorgane in graphischer Darstellung so koordiniert werden, daß eine "Funktions-Hierarchie" der Sprechbewegung sichtbar wird, die nicht nur dem Prinzip systematischer Feldeingrenzung entspricht, sondern auch nach dem Gewicht zunehmender Selektivität auf die "Silbe" ausgerichtet ist. Ausgehend von dem fundierenden Atem- und Silbenpuls wird im Abschnitt IV versucht, die möglichen Silbentypen gemäß dem freigebenden, kulminierenden und arretierenden Silben-Faktor zu bestimmen. Dabei läßt sich der — dem energetischen Gleichgewicht der Silbe entsprechende — Kontrast von optimalem Konsonant und optimalem Vokal als Ausgrenzungs-Kriterium für die Silben-Universalie CV (bzw. CVO) verwenden. Im Abschnitt V wird unter Bezugnahme auf Abschnitt III dargelegt, daß nicht nur ein Funktionszusammenhang zwischen Atmung (Brust) und Artikulation, sondern auch zwischen Lautbildung (Ansatzrohr) und Artikulation besteht, der noch einmal die Betrachtung der phylogenetischen Voraussetzungen der Vokal- und Konsonantbildung erforderlich macht, die durch eine ontogenetische Parallele ergänzt wird. Im Abschnitt VI wird näher auf die morphographischen Bedingungen des Ansatzrohres eingegangen, das den eigentlichen "Klangkörper" der Phonation darstellt. Hier ergibt sich eine systematische Eingrenzungsmöglichkeit, die zunächst von der Arbeitsweise des Schallgenerators ausgeht bzw. die Artikulation als dessen limitierende Bedingung beschreibt, um daraus die Artikulation vokalischer und konsonantischer Sprachlaute ableiten zu können. Dabei können die Vokale als Varianten von Mund-

12

INHALTLICHE GLIEDERUNG DER ABLEITUNGS-HIERARCHIE

öffnungs-Größe und kubischem Inhalt, die Konsonanten nach Artikulations-Ort und -Art charakterisiert werden. Außerdem wird eine morphographisch/phonetische Zuordnung von Ansatzrohrgestalt und Formantbildung versucht. Im Abschnitt VII wird die (artikulatorische) Lippen- und Zungenbewegung in einen systematischen Zusammenhang zur Silbenbildung gebracht, wobei die molekular/molaren Wurf- und Hemmimpulse der Konsonantbewegung am körpereigenen Widerstand näher untersucht werden. Dies führt zur Kennzeichnung einer jeweils dominanten und nicht-dominanten Ausführungsrichtung der ballistischen Bewegung, die — analog zu Millers TOTE-Modell — einer (effektiven) Ausführungsphase und (ineffektiven) Bereitstellungsphase gegenübergestellt wird. Im Abschnitt VIII werden anschließend einige ontogenetische Zusammenhänge der "Erbkoordination" diskutiert, die sowohl die motorische Entwicklung der Gliederkoordination wie der Sprechorgane betreffen. Neben dem Versuch einer Synchronisation von allgemeiner Motorik und Sprech-Motorik, der methodisch unzulänglich bleibt, werden entwicklungsbedingte "Meilensteine" des Spracherwerbs angeführt, die in jedem Fall (d.h. von Normalen, Akzelerierten und Retardierten) durchlaufen werden müssen (Lenneberg). — Erst nach dieser Betrachtung motorischer Eigenbewegung und kognitiver "Quasi-Lokomotion" wird die Lall-Silbe als ontogenetische Grundeinheit herausgestellt, die gemäß dem sprachlichen Fundierungs-Zusammenhang motorisch, perzeptiv und kognitiv determiniert sein kann. Als ihr objektiviertes Produkt wird die Reduplikation erkannt, welche die Bedeutung einer "Wiederholung schlechthin" oder "Mehrheit schlechthin" annehmen kann (Cassirer). Bei der Diskussion des Phonem-Systems im Abschnitt IX wird dann die Grenzlinie von den motorisch-phonetischen zu den phonemisch-symbolischen Ereignissen überschritten, indem — wiederum ausgehend von der konsonantisch-vokalischen SilbenEinheit — die distinktiven Oppositionen entwickelt und auf ihre Universalität hin untersucht werden. Hierbei wird besondere Sorgfalt auf die "äquifinale" Überführbarkeit dieser Laut-Oppositionen aus den morphographischen Eigenschaften des Ansatzrohres verwandt. Im Abschnitt X wird der Sprechimpuls als kognitive "Quasi-Lokomotion" interpretiert, der auf die "Gesamt-Bedeutung" eines in sich vollständigen Sprechabschnittes ( = Satzes) bezogen bleibt. Als relativ einfaches und doch offenes SimulationsModell bietet sich wieder das TOTE-Modell an, da es einerseits die Test- und Operationsphasen der einzelnen Funktions-Ebenen, andererseits aber auch die hierarchisch organisierte Funktions-Pyramide als ganze abzubilden vermag. Im Zusammenhang damit wird der Plancharakter serieller Ordnung besprochen, woraus sich die — für Sprechbewegung und Sprachstruktur wesentliche — Unterscheidung von "organismischer Vollzugsordnung" und "formaler Ausschreibordnung" ergibt. Weiterhin wird dargelegt, inwiefern die Sukzessiv- und Simultanordnung der ersteren eine "unerläßliche Bedingung" für die (symbolische) Ketten- und Klassenbildung der letzteren darstellt, d.h. auch in der abstrahierten Sequenz noch (implizit) enthalten ist.

SYSTEMATISCHE FELDEINGRENZUNG

7

des Problems, das Studium der Bestimmungsstücke, die Aufstellung eines vieldimensionalen morphologischen Schemas, die Analyse der Lösungsmöglichkeit und endlich die Wahl der optimalen Lösung als Durchführungsschritte enthält (op. cit. 116-117). Da die wissenschaftlichen Kriterien dieser morphologischen Methode so allgemein gehalten sind, daß sie unschwer auf die verschiedensten Disziplinen anwendbar sind (op. cit. 48) bzw. mit modernen Denkmethoden sinnvoll kombiniert werden können (op. cit. 256), eignen sie sich besonders dort, wo — wie im vorliegenden Fall — eine Überbrückung mehrerer (benachbarter) Fachgebiete zu leisten ist. Dies um so mehr, als gerade in der modernen Psycholinguistik Forschungsmethoden aufkommen, die einerseits eine möglichst weite "Feldüberdeckung", andererseits aber auch eine möglichst systematische, d.h. lückenlose Erfassung der problem-relevanten Daten anstreben. Es ist wohl kein Zufall, daß diese Forschungsrichtung gerade bei jenen Autoren dominiert, die sich mit den "universellen" Aspekten der Sprache beschäftigen. So versucht neuerdings Greenberg in einer erweiterten Abhandlung über Language Universals (1966; vgl. dazu 1963) die übergreifenden Zusammenhänge der kategorialen Unterscheidung von "markiert/unmarkiert" auf phonologischer, grammatischer und lexikalischer Ebene nachzuweisen, wobei er einen erheblichen Teil seiner Überlegungen darauf verwendet, die zunächst an grammatischen Modalitäten gewonnenen Regeln auf korrespondierende Charakteristika der Phonologie zu übertragen und sich genaue Rechenschaft darüber zu geben, warum die kategoriale Kontinuität dieses "Isomorphismus" nicht in jedem Fall durchführbar ist. Specifically, we can ask wether the additional characteristics of the unmarked/marked in the grammatical and semantic spheres to which no correspondent has yet been mentioned from phonology do have such a partner and, if they do not, to seek for an explanation of the impossibility of a mapping in these cases (Greenberg 1966, 61).

Ohne auf weitere Einzelheiten dieses (später noch zu streifenden) Problems einzugehen, sei hier nur festgehalten, daß obigem Autor an einer ungewöhnlich weiten "Feldüberdeckung", zugleich aber an einer möglichst lückenlosen Erfassung problem-relevanter Daten gelegen ist. Insofern es ihm dabei um die Herausarbeitung kategorialer Kontinuität und materialer Korrespondenz geht, bedient er sich ähnlicher Denkprinzipien, wie sie auch von Vertretern der "morphologischen Methode" gefordert werden (als da sind: Gleichheit/Verschiedenheit, Koinzidenz/NichtKoinzidenz, Widerspruchslosigkeit etc. — vgl. Zwicky 1966, 46, 47, 56). Der Vergleich kann aber noch weiter getrieben werden, da die lückenlose Erfassung problem-relevanter Daten nicht nur die genaue Umschreibung des ProblemBereichs, sondern auch die systematische Ausgrenzung der nicht mehr lösungsrelevanten Daten innerhalb dieses Bereichs erforderlich macht. Wenn sich etwa ein Autor wie Greenberg darüber Rechenschaft gibt, warum obiger "Isomorphismus" nicht vollständig ist und zu diesem Behuf die einzelnen Analogie-Momente der

8

SYSTEMATISCHE FELDEINGRENZUNG

Übertragbarkeit in beiden Übertragungs-Richtungen systematisch durch variiert, um durch Ausfällung nicht mehr lösungs-relevanter Daten das übergreifende Prinzip allmählich "auszusparen", so bedient er sich dabei eben jener Explorations-Technik, wie sie von der morphologischen Methode entwickelt wurde. Da aber die systematische Ausgrenzung der nicht mehr lösungs-relevanten Daten des Problem-Bereichs von der Weite der Feldüberdeckung abhängt, ergibt sich je nach Art der Bestimmungs-Aufgabe eine mehr oder weniger strenge Form der "Lösbarkeit". So wird 1. ein "morphologischer Kasten" um so mehr unbekannte bzw. vieldeutige Zusammenhänge enthalten müssen, je vergleichsweise komplexer die Fragestellung ist. Es lassen sich aber auch 2. Probleme denken, "zu deren Lösung nur bestimmte bekannte Elemente in kleiner Anzahl einzusetzen sind", die dann mittels der morphologischen Methode streng lösbar sind. Eine weitere Variante kann 3. in der Kombination endlich-bestimmter und vieldeutiger Zusammenhänge gesehen werden, wie sie etwa in der Wahrscheinlichkeitsrechnung mathematischer Statistik gegeben ist (vgl. op. cit. 51-53). Je nach dem Unschärfegrad der eingeführten Bestimmungsstücke muß demnach die "Lösung" des vorgegebenen Problems verschieden genau ausfallen. Diese Abhängigkeit der Lösungsstrenge von der Endlichkeit der eingeführten Elemente (bzw. der Weite der Feldüberdeckung) wird auch bei Greenberg sichtbar, wenn er das Prinzip der markiert/unmarkierten Kategorie-Unterscheidung einerseits als allgemeines Charakteristikum der phonologischen, grammatischen und lexikalischen Ebene nachzuweisen sucht, es andererseits aber auch — auf semantischer Ebene—in dem endlich angelegten System möglicher Verwandtschafts-Bezeichnungen (kinship terminology) in streng lösbarer Form anwendet. So kann er zeigen, daß bei letzteren von insgesamt 15 logisch möglichen Klassifikationen einige häufig, einige selten und einige überhaupt nicht vorkommen und gelangt durch systematische Ausgrenzung zu dem Schluß, daß von Kroebers 8 Kategorien der Verwandtschaftsbeziehung nur 3 Kategorien zum systematischen Ausbau der "kinship terminology" unerläßlich sind, d.h. universelle Bedeutung besitzen (Kroeber 1909; Greenberg 1966, 84-87; vgl. Tab. 1). Vergleicht man dieses Vorgehen mit der Arbeitsanweisung für systematische Feldüberdeckung (von endlichen Elementen), so läßt sich die Ähnlichkeit beider Verfahren kaum verkennen (vgl. Zwickys Bestimmung der regulären Polyeder: 1966, 58-88). Da nun in vorliegender Studie ähnlich wie bei Greenberg eine ungewöhnlich weite Feldüberdeckung mit einer möglichst lückenlosen Erfassung problem-relevanter Daten zu vereinbaren ist, bietet sich der Vorteil eines Pyramiden-Modells noch einmal in anderer Form an. Während nämlich zunächst nur an das von Stufe zu Stufe zunehmende Gewicht der Selektivität gedacht war (vgl. S. 3), wird jetzt der Charakter der Endlichkeit bzw. der strengen Lösbarkeit berücksichtigt. Dieweil das Bestimmungs-Ziel von Stufe zu Stufe mehr präzisiert wird, kann damit gerechnet werden, daß auch die Lösungsstrenge im selben Maße zunehmen wird. Dies würde bedeuten, daß auf der höchsten Ebene der Ableitungs-Hierarchie das

INHALTLICHE GLIEDERUNG DER ABLEITUNGS-HIERARCHIE

13

Im Abschnitt XI wird nun in diese serielle Rahmenbedingung der formalen Kettenund Klassenbildung das logische Relat von Indikation/Prädikation eingeführt, dessen allgemeingültige Bedeutung am situativ/symbolischen Zwei-Zeichen-Satz nachgewiesen wird (Mowrer). In systematischer Eingrenzung wird es auf verbaler Ebene (gemäß dem denotativen Minimum von Hinweis- und Aussage-Zeichen) zum "prädikativen Syntagma" spezifiziert (Martinet) und wegen seiner Ansiedlung im logisch-seriellen Schnittpunkt als "Leer-Schema" der eigentlichen Satz-Universalie ausgewiesen. Um diese noch ganz schematisch bestimmte Satz-Universalie wieder in die Vielzahl möglicher Sprachformen zu entlassen, wird im Abschnitt XII der Versuch unternommen, eine Überleitung vom prädikativen Syntagma zu Sapirs Begriffs-Schema zu finden, das insofern "feldüberdeckend" ist, als es vom Polarisierungs-Kontinuum zwischen Grund- und Beziehungs-Begriff ausgeht und in ein universelles TypenSchema reiner und gemischter Beziehungssprachen überführbar ist. Da jedoch die fundierenden Bedingungen der organismischen Sukzessivordnung als "inter- und intraspezifische Modifikation" in das Typen-Schema aufgenommen werden, läßt sich zugleich die wechselseitige Abhängigkeit von linguistischer Begriffsbildung und morphophonemischer Modifikation aufzeigen bzw. die in Schriftsprachen vorhandene Kluft zwischen Grammatik und Phonetik — am Beispiel der "Nordamerikanischen Indianersprachen" (NAI-Sprachen) — überbrücken. Als Prüfstein für die unbeschränkte, d.h. nicht auf "Standard-Average-EuropeanSprachen" (SAE-Sprachen: Whorf) begrenzte Anwendbarkeit der Satz-Universalie wird sodann im Abschnitt XIII die satz-organisierende Rolle des "prädikativen Monems" in den NAI-Sprachen untersucht. In Abhebung dazu wird gezeigt, daß die Subjekt-Prädikat-Konstruktion (bzw. die Subjekt-Objekt-Relation) der SAESprachen als universelle Basis ungeeignet ist, sofern man darunter nur die syntaktischen (und nicht auch die logischen) Implikationen versteht. Diese Argumentation gewinnt noch an Gewicht, wenn man die zentrale Stellung des prädikativen Monems gegenüber den indikativen bzw. "deiktischen" (pronominalen) Elementen der satzinternen und -externen Bedeutungsverschiebung (Mowrer) in den NAI-Sprachen berücksichtigt. Im Abschnitt XIV wird endlich die der Basisordnung-Typologie Greenbergs zugrundeliegende Subjekt-Verb-Objekt-Ordnung (SVO-Ordnung) als — an SAESprachen orientierte — Spezifikation des prädikativen Syntagmas beschrieben, der allerdings (bei Einbeziehung logischer Komponenten) eine allgemeingültige Bedeutung zukommen kann, sofern dies durch den korrelativ-impiikativen Zusammenhang von typologie-relevanten Universalien-Komplexen nachgewiesen wird. Zu diesen systematisch einzugrenzenden Universalien-Komplexen, die nach der Greenbergschen Methode relativ lösungsstreng bestimmt werden, gehören die im Abschnitt XV abgeleiteten Klammerbeziehungen der Frage-, Verb-, Funktions-, Modifizierer-, Inflektions-, Kasus-, Pronominal- und Modalitäten-Ordnung. D a sie das eigentliche Bestimmungs-Ziel der Ableitungs-Hierarchie darstellen,

14

INHALTLICHE GLIEDERUNG DER ABLEITUNGS-HIERARCHIE

wird im Abschnitt XVI einige Überlegung darauf verwandt, noch einmal einen — rückschauend gewonnenen — Begründungs-Zusammenhang zwischen den Universalien-Komplexen und ihren derivatorischen Voraussetzungen zu geben, so daß den "Binnen-Kriterien" der Greenbergschen Methode die "Außen-Kriterien" der Ableitungs-Hierarchie gegenübergestellt werden können. Außerdem wird anhand einiger Prinzipien der Universalien-Bestimmung (Hockett) auf die Bedeutung eines verbindlichen Sprach-Modells (bzw. Modell-Universums) hingewiesen. Im Abschnitt XVII wird von einem bloß induktiven Vorgehen der UniversalienBestimmung zu einem hypothetisch-deduktiven Ansatz übergeleitet, wie er von Greenberg am Beispiel der Kategorie "markiert/unmarkiert" bereits anvisiert wurde. Hierbei ergibt sich Gelegenheit, auf die methodische Affinität zwischen dem Isomorphie-Prinzip und der systematischen Feldeingrenzung (bzw. -ausgrenzung) hinzuweisen, so daß obiger Ansatz als konsequente Fortentwicklung der morphologischen Methode im sprachlichen Fundierungs-Zusammenhang erscheint. Dabei muß die Hypothesenbildung einen so hohen Grad von Spezifizität aufweisen, daß sie nicht im Sinne einer (allgemeingültigen) linguistisch-mathematischen ModellVorstellung generalisierbar, sondern durch systematische Feldeingrenzung jeweils neu herstellbar ist. Als folgerichtig sich ergebende Strategie wird der Drei-StufenPlan Greenbergs diskutiert und als analoges Verfahren zum hypothetisch-deduktiven Ansatz der sog. beurteilenden Statistik (Signifikanztest!) beschrieben. Abschließend wird im Abschnitt XVIII noch einmal erörtert, wie die hier getroffene Auswahl an methodischen Ansätzen zustandekam bzw. wie zufallsunabhängig sie ausfiel, wenn man davon ausgeht, daß die verschiedenen Systeme der strukturellen Grammatik prinzipiell gleichwertig sind. Dabei zeigt sich, daß über den FundierungsZusammenhang von Sprechbewegung und Sprachstruktur gerade jene Systeme selegiert wurden, die im engeren oder weiteren Sinne an der phonologischen Grundmethode (Genfer und Prager Schule) orientiert sind bzw. als der anthropologischen, behavioristischen und funktionalen Richtung zugehörig in eine direktere Beziehung zur Psycholinguistik zu bringen sind, wenn sie gemäß dem heutigen Forschungsstand der Linguistik kategorisiert werden (Hartmann).

II

1. KONTINUITÄTS-THEORIE

Da die Ableitung der Sprachstruktur aus der Sprechbewegung von einer Diskussion ihrer organismischen Grundlagen auszugehen hat, sei zunächst der Ausgangspunkt der inhaltlichen Betrachtung, daß nämlich der menschliche Sprechapparat die "unerläßliche Bedingung" von Sprechbewegung und Sprachstruktur darstellt (vgl. S. 12), noch einmal von Ansätzen abgehoben, die wegen ihrer "organismischen" Verankerung Anlaß zu Mißverständnissen geben könnten. Vorderhand sei betont, daß die vorliegende Untersuchung nichts mit dem überholten "Organismus-Konzept" der Sprache (Grimms "unverbrüchliche Gesetze") zu tun hat, das sich auf die "organische" Entwicklung der gewachsenen Sprachen bezieht und ihre "natürliche" Entstehung von der "fremden" Beeinflussung durch Nachbarsprachen zu trennen sucht (Glinz 1967, 48). Genau genommen liegen dort sogar umgekehrte Verhältnisse vor, weil die hier gemeinten organismischen Grundlagen wegen ihres fundierenden Charakters "universell", d.h. vor jeder speziellen Sprachbildung anzusetzen sind und somit eher zu einem interkulturellen Sprachvergleich als zur Ausklammerung "fremder" Einflüsse disponieren. Schwieriger sind bereits jene organismischen Voraussetzungen auszugrenzen, die nicht mehr direkt mit den fundierenden Bedingungen des Sprechapparats zu tun haben, sondern in einem weiteren, d.h. stammesgeschichtlichen Sinne mit der menschlichen Sprachfähigkeit in Zusammenhang gebracht werden können. So versteht man in der phylogenetisch konzipierten "Kontinuitäts-Theorie" unter Sprache einen Komplex mehr oder minder unabhängiger Züge, die in ein hypothetisches Kontinuum mit vielen "missing links" gebracht werden, wiewohl jeder aufgenommene Zug seine eigene evolutive Geschichte hat. Bezeichnend für diese Konzeption ist also einerseits, daß sie sich wegen ihres eklektischen Charakters über die phylogenetische Rekonstruktion der Arten-Entwicklung, damit aber auch über die "proximalen" Kriterien der Verwandtschaftsnähe zum homo sapiens hinwegsetzt, andererseits aber doch eine phylogenetische Kontinuität "zwischen" verschiedenen Arten unterstellt, die nun ausgerechnet auf ein so komplexes Verhalten wie Sprache ausgerichtet sein soll (vgl. Abb. 3).

16

KONTINUITÄTS-THEORIE

©

G

ABB. 3. Die Evolution eines so komplexen Verhaltens wie Sprache wird in der sog. KontinuitätsTheorie als Zuwachs einzelner Züge (Kästen) erklärt, wobei die leeren Kästen die "missing links" und die Nummern die Kommunikationssysteme verschiedener Spezies darstellen. (Nach Lenneberg 1967.)

So zieht Koehler (1951; 1952; 1954 a, b) mindestens 19 biologische "Prärequisiten" dieser Art in Betracht, die aufgrund glücklicher Umstände beim Menschen alle, bei verschiedenen Tierspezies aber nur teilweise vertreten sein sollen. Da es sich hier nicht um eine kybernetische, sondern eine biologische Sprach-Konzeption handelt, die ausdrücklich am homo sapiens orientiert ist, wundert es um so mehr, daß die menschliche Sprachfähigkeit — als Gesamt-Phänomen bereits unterstellt — aus phylogenetischen Teilaspekten hergeleitet wird, die in keinerlei entwicklungsgeschichtlich fundierenden, d.h. "proximalen" Zusammenhang zu dieser Fähigkeit gebracht werden können. Mit inhaltlich andersartiger Ausrichtung, aber verwandter Theorienbildung durchforscht auch Hockett (1960; vgl. Altmann 1966; Marler 1961) die "Sprache" animalischer Kommunikations-Systeme nach "wesentlichen" phylogenetischen Attributen, die aber rein logisch-pragmatischen Aspekten unterworfen werden, da sich der aufzunehmende Sprachzug (design feature) nicht so sehr auf die — mehrsinnig mögliche — Ausführung kommunikativen Verhaltens, als auf dessen gleichartigen Effekt bezieht. So kann etwa die Realisierung einer design-technischenAusführungsbestimmung — wie Tonwellen-Verbreitung, rapider Tonschwund, totaler Feedback, Spezialisation, Diskretheit usw. — im Kommunikations-System von Mensch oder Biene auf völlig verschiedene Weise vor sich gehen (vgl. Lenneberg 1967, 233). — Da sich aber die phylogenetischen Kriterien in dem Maße erübrigen, wie sie — unabhängig von der eigentlichen Stammesentwicklung — für pragmatische Aspekte abstrahiert werden, gilt auch für diesen Ansatz, daß man bei ihm die phylogenetisch fundierenden Bedingungen preisgibt, ohne ein — tatsächlich unabhängig konzipiertes—kybernetisches Kommunikations-System gefunden zu haben. Dieweil nun die Beiträge animalischer Kommunikations-Systeme eher als diskontinuierliche Momente des Evolutionsverlaufes anzusehen (vgl. dazu Lennebergs ausführliche Diskussion: 1967, 234-239) und als phylogenetische Relation zwischen verschiedenen Spezies nicht durch ein einziges Binärschema wiederzugeben sind (vgl. Abb. 4), kann das Verhältnis der sprachlichen Einzelzüge zum Evolutionsverlauf nur durch eine Darstellung wiedergegeben werden, die den binären Kriterien gerecht zu werden vermag, ohne von ihnen abzuhängen.

KONTINUITÄTS-THEORIE

17

Pleistocene Pliocene

Miocene

Oligocene

Eocene ABB. 4.

Baum-Diagramm der Hominiden-Evolution. (Nach Lenneberg 1967.)

Dies ist in der Tat beim oben eingeführten "Euler-Venn-Diagramm" (Abb. 2) der Fall, wenn man berücksichtigt, daß es einerseits in ein Binär-Schema transponierbar (vgl. Abb. 4 u. 5 a), andererseits aber auch zu einer nicht-linearen, d.h. überlappenden Darstellung geeignet ist (vgl. Abb. 5 b). Wollte man also — was hier nicht beabsichtigt ist — das Euler-Venn-Diagramm von Abb. 2 (als Modell der Ableitungs-Hierarchie) nach "unten" um die phylogenetischen Grundlagen des menschlichen Sprechapparates erweitern, so könnte dies nicht mehr in der Form eines Diagramms mit einfacher Figur-Grund-Abstufung geschehen, da die einzelnen Schichten des Modells wegen der komplexen Relation individueller phylogenetischer Züge nicht mehr in ein einfaches Kontinuum fundierend-fundierter Bedingungen (wie in Abb. 2) zu bringen wären, sondern in überlappender Darstellung (wie in Abb. 5 b) präsentiert werden müßten, um die (kategoriale) "Kontinuität" zu veranschaulichen. Daraus ergibt sich bereits, daß hier nicht von dem zunehmenden Gewicht der Selektivität im Sinne fundierend-fundierter Bedingungen die Rede sein kann,weil hierzu die direkte Verbindung (bzw. Überführbarkeit) der korrespondierenden Momente zweier Ebenen erforderlich wäre. Es würde sich also weder um ein Diagramm mit einfacher Figur-Grund-Abstufung noch um eine direkte Überführbarkeit korrespondierender Momente im Sinne des Pyramiden-Modells handeln, sondern um ein relativ "loses" Schema kategorialer Kontinuität, das der mosaikartigen Anordnung von phylogenetischen Einzelzügen allerdings weit überlegen wäre (sog. "Kontinuitäts-Theorie"), weil es von den "proximalen" Bedingungen ausgehen würde.

18

KONTINUITÄTS-THEORIE

W ABB. 5 (a) Übertragung eines Baum-Diagramms (vgl. Abb. 4) in ein Euler-Venn-Diagramm, (b) Hypothetische Darstellung der Kommunikationssysteme von Vertebraten, die mittels eines Baum-Diagramms wegen der vorkommenden Überlappungen nicht möglich wäre. (Nach Lenneberg 1967.)

Mit dieser Kontrastierung beider Varianten des Euler-Venn-Diagramms (vgl. Abb. 2 u. 5b) wird aber zugleich eine Begründung erbracht, warum die unterste Ebene der Ableitungs-Hierarchie nicht bei den phylogenetischen Sprachzügen, sondern erst beim menschlichen Sprechapparat beginnt. Will man einen (einigermaßen) direkten Zusammenhang zwischen ihm und seinen stammesgeschichtlichen Voraussetzungen herstellen, so bleiben nur die "proximalen" Bedingungen übrig, die wegen ihrer inhärenten Vergleichsmomente eine gewisse Verwandtschaft mit den Eigenschaften des (menschlichen) Sprechapparates erkennen lassen. Auch sie werden jedoch aus der Ableitungs-Hierarchie ausgeklammert, da sie in keinen direkten Fundierungs-Zusammenhang zu Sprechbewegung und Sprachstruktur zu bringen sind. Sofern sie jedoch zu einem tieferen Verständnis der sprachlichen Grundlagen beitragen, sollen sie noch kurz gestreift werden (vgl. Abschnitt V).

19

EVOLUTION UND SPRACHURSPRUNG 2. EVOLUTION U N D S P R A C H U R S P R U N G

Wie Lenneberg hervorhebt, ist eine Rekonstruktion des Sprachursprungs unmöglich, weil 1. die biologische Evolution in strukturellen und funktionalen Transformationen "versteckt" ist, die hinsichtlich physischer Anpassung, sensorischer Spezifikation und kognitiver Spezialisierung zu vollziehen sind; 2. die morphographische Beschaffenheit des Gehirns weder eine genaue Zuordnung des Verhaltens noch eine artspezifische Festlegung erlaubt, aber auch 3. bei Affe und Mensch hinsichtlich Umfang und Form keinen sicheren Aufschluß über Sprachkapazität liefern kann; 4. die kulturelle Komplexität der Sozialstruktur, selbst wenn sie voll zugänglich wäre, keine eindeutigen Rückschlüsse erlaubt (1967, 265). — Dennoch ist immer wieder versucht worden, den mindestens 30 000 bis 50 000 Jahre zurückliegenden Sprachursprung (op. cit., 261) durch Rekurs auf einzelne der oben genannten Punkte zu ermitteln. Darum soll in diesem Zusammenhang kurz auf sie eingegangen werden. Zunächst ist ganz allgemein zur biologischen Evolution zu bemerken, daß die sog. Tiefen-Transformationen molekular-genetischer Art maßgeblicher als die phänotypischen Oberflächen-Transformationen sind, weil letztere nur als Außenaspekt der ersteren aufzufassen sind. So ist die bekannte Methode D'Arcy Thompsons (1942) als rein beschreibendes Verfahren nur in der Lage, topologische Beziehungen zwischen Körperformen gemäß den Veränderungen der Wachstums-Gradienten innerhalb der Ontogenese wiederzugeben (vgl. Woodger 1945), vermag aber genetisch verankerte Transformationen nur indirekt sichtbar zu machen. Während sich also die phänotypischen Züge mit Hilfe mechanisch-mathematischer Mittel beschreiben lassen, entziehen sich die genotypischen Vorgänge solchem Zugriff nicht nur, sondern werden auch in dem Maße unzugänglicher, je weiter sie zeitlich zurückliegen, da archäologisch allenfalls mit Knochenrelikten, aber nicht mehr mit genetischen Proben gerechnet werden kann (vgl. Lenneberg 1967, 247: Abb. 6).

-c

Apparent transformation Ta

t

\

Developmental history

Developmental history

H2

Hi

Molecular structure

S,

>

Deep transformation

Molecular structure v.,

Tm ABB. 6. Tierspezies können einander hinsichtlich der genotypischen Transformationen in der Molekularstruktur des Genmaterials verwandt sein; phänotypisch, d.h. bei den ausgewachsenen Organismen kann diese Ähnlichkeit jedoch verdeckt sein. (Nach Lenneberg 1967.)

20

EVOLUTION U N D

SPRACHURSPRUNG

Allerdings lassen auch die phänotypischen Körperformen nicht ohne weiteres Rückschlüsse auf das Verhalten von Individuen zu, die niemals direkt beobachtet werden konnten. Gibt doch der Bauplan eines Organismus im allgemeinen nur zu erkennen, wie eng die Grenzen der biologischen Matrix gezogen sind, erlaubt aber nicht, aus dem Vorhandensein morphographischer Varianten mit Sicherheit auf ein zugehöriges Verhalten zu schließen. Da sich strukturelle und behavioristische Züge in ihrer hierarchischen Zuordnung nicht entsprechen, ist es vorteilhafter, umgekehrt vom Verhalten auf die Morphographie zu schließen, zumal letztere dadurch eine zusätzliche Bedeutung erhalten kann (op. cit., 27). Es ist also denkbar, daß ein und dieselbe morphographische Gehirnstruktur bei verschiedenen Spezies voneinander abweichende Verhaltensaspekte impliziert wie auch umgekehrt ein Verhaltenszug mehreren morphographischen Kriterien zugeordnet werden kann, weil die zerebrale Repräsentation des Verhaltens im Verlaufe der evolutiven Entwicklung mannigfache Veränderungen durchgemacht haben mag (op. cit., 265). Nicht minder problematisch ist die einfache Zuordnung von Gehirngewicht und Sprachfähigkeit. So ergeben die individuellen Maße beim Vergleich zwischen dem sprachbegabten "nanozephalischen" Zwerg und dem averbalen Schimpansen keinen Hinweis auf Sprachkapazität, dieweil das Verhältnis von Gehirn und Körper bei ersterem dem eines dreijährigen Schimpansen entspricht. Wiewohl also der kleinschädelige Zwerg stark retardiert ist (Mentalalter: 5 bis 6 Jahre) und nur das Gehirngewicht eines Babys (0.400 kg) bei einer Körperlänge von 23 bis 36 Zoll besitzt, kann er sehr wohl die Sprachfähigkeit eines normalen Fünfjährigen erreichen (Seckel 1960). Da Zwerg und Schimpanse dasselbe Hirngewicht besitzen (op. cit., 70: Tab. 2), ist offenbar die Organisation des Gehirns wichtiger als seine Masse bzw. die intrazerebrale Gewebsproportion von größerer Bedeutung als das absolute Verhältnis von TAB. 2. Vergleich von Gehirn- und Körpergewicht hinsichtlich der Sprachfähigkeit bei Mensch, Schimpanse und Rhesus. (Nach Lenneberg 1967.)

Age

2i/ 2

Speech Faculty

Body Weight (Kg)

Brain Weight (Kg)

Ratio

12.3 34 47

Man (m) Man (m) Man (m)

131/2 18

Beginning Yes Yes

131/2 45 64

1.100 1.350 1.350

Man (dwarf) Chimp, (m) Chimp, (f) Rhesus

12 3 adult adult

Yes No No No

131/2 131/2 47 31/2

0.400 1 0.400 2 0.450 3 0.090 4

Figures in last four lines are estimates based on: Meckel (1960) Schultz (1941) 3 Schultz (1941) "Kroeber (1948). s

34 34 104 40

EVOLUTION U N D

21

SPRACHURSPRUNG

Gehirn- und Körpergewicht. Dies geht besonders aus der — auf relativer Gewichtsverschiebung beruhenden — Proportionsänderung der genetischen Entwicklung hervor. Aufschlußreich ist hier ein Vergleich des Reifungsverlaufes von Mensch (14 Lebensjahre) und Schimpanse (8 Lebensjahre) (op. cit. 173: Abb. 7; vgl. Altman & Dittmer 1962). Danach ist der relative Zuwachs bei beiden nahezu identisch, das Gehirn macht aber beim Menschen eine längere Reifung als beim Schimpansen durch, denn das Gehirngewicht beträgt bei der Geburt bei ersterem nur 24 %, bei letzterem aber 60 % des ausgereiften Gehirns. Besonders im ersten Viertel des Reifungsverlaufes holt der Mensch diesen Vorsprung größtenteils auf, um sich im zweiten Viertel der Reifungskurve des Schimpansen völlig anzugleichen. Demnach besteht der Unterschied zwischen beiden weniger in absoluten Meßdifferenzen als in zeitlich bedingten Durchgangsstadien. Die menschliche Gehirnreifung könnte darum als eine "fötalisierte" Version der allgemeinen Primaten-Entwicklung angesehen werden (Kummer 1953). Ähnlich wie die vorzeitige Gehirnreifung beim Schimpansen für den Spracherwerb ungünstig zu sein scheint, wird beim Menschen durch den irreversiblen Prozeß zerebraler Latéralisation eine Plastizitäts-Grenze erreicht, die einer "Einfrierung" des bis dahin erlangten Status gleichkommt. Sie ist besonders gut bei geistig Retardierten mit physiologisch bedingter Verzögerung der Sprachentwicklung zu beobachten (Lenneberg 1967, 174, 178). Aber auch bei Normalen ist nach diesem Zeitpunkt, (der ungefähr in das 12. Lebensjahr fällt,) mit reduzierter Flexibilität und Reorganisation

• Man o Chimp

3i 2

7 4

10J 6 Age in years

14 8

18 11

ABB. 7. Graphischer Vergleich der Wachstumsquote von Gehirn- und Körpergewicht bei Mensch und Schimpanse. Während der Zuwachs an Körpergewicht bei beiden praktisch gleich ist, unterscheidet sich der Zuwachs an Gehirngewicht vor allem im ersten Viertel des Reifungsverlaufes. (Nach Lenneberg 1967.)

22

EVOLUTION UND SPRACHURSPRUNG 120

i

l

i

I

I

I

I

I

i—I—I—i—i—r Normal Retarded Language established

Putting words together Walking readiness Sitting readiness

0

0

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

Chronological age

ABB. 8. Graphischer Vergleich der Reifungskurven für den Spracherwerb bei normalen und retardierten Kindern. (Nach Lenneberg 1967.)

zu rechnen, wie sie etwa in der verminderten Lernfähigkeit für Fremdsprachen zum Ausdruck kommt (op. cit., 169: Abb. 8). Die zunehmende Spezialisierung der Hirngebiete im Verlauf ontogenetischer Entwicklung zeigt sich auch darin, daß postnatale kortikale Ablationen in frühen Jahren keinen (oder nur geringfügigen) Schaden verursachen, später jedoch zu irreversiblen Funktionseinbußen führen (Brooks & Peck 1940; Doty 1953; Benjamin & Thompson 1959; Landau et al. 1960; Harlow et al. 1964). Allerdings ist eine enge Lokalisations-Theorie, nach der man eine Speicherung von Wörtern und syntaktischen Regeln in bestimmten Zellaggregaten vermutet, mit den klinischen Fakten unvereinbar, zumal es kein "absolutes", sondern nur ein statistisch darstellbares Sprachgebiet gibt, wie man bei interner Hirnkrankheit und -Schädigung mittels operativer Eingriffe und elektrischer Reizungen feststellen konnte (Lenneberg 1967, 60-61, 56). Aber auch der Versuch, den Sprachbeginn aus dem Kulturstand prähistorischer Zeit abzulesen, muß als unzureichend bezeichnet werden. Am häufigsten hat man noch den Werkzeuggebrauch als indizierendes Moment für die Hirn- und Sprachentwicklung angesehen (Miller 1964, 30-31; Washburn 1959). Wenn das Großhirn des Menschen zumindest teilweise eine Folge des Bipedalismus ist (Washburn & Howell 1960), wird die Auge-Hand-Koordination durch den manipulativen Werkzeugumgang (vgl. Werkzeug-Skala: Napir 1962) begünstigt, wobei zu berücksichtigen ist, daß letzterer bereits vorhanden gewesen sein muß, als die menschliche Hand noch relativ unentwickelt war (Leakey 1961 a,b). Der Übergang von beid- zu einhändiger

EVOLUTION UND SPRACHURSPRUNG

23

Steinbearbeitung, markiert durch das Auftreten asymmetrischer Schneidwerkzeuge, könnte danach als kritische Phase für den phylogenetischen Sprachbeginn angesehen werden, zumal auch in der ontogenetisehen Entwicklung eine Polarisation der Gehirnhälften erfolgt, in deren Verlauf die kognitiven Funktionen (einschließlich der Sprachgebiete) in die linke Hemisphäre verlegt werden (strukturelle Asymmetrie: Rensch 1968; Ajuriaguerra 1957; Hecaen & Ajuriaguerra 1963; Teuber 1962). Als Hinweis auf den möglichen Zusammenhang von Werkzeuggebrauch und Sprache wäre weiter anzuführen, daß für beide Tätigkeiten ein hierarchisch organisiertes Planungsvermögen im Sinne sequentieller Strategie vorausgesetzt werden muß (Pribram 1958; Miller 1964; Lorenz 1965, 237; vgl. dazu "Aufschubhandlung": Osgood 1953, 656-657; Mowrer 1960, 226-229). Deswegen läßt sich die Diskrepanz im kulturellen Aufstieg bei Affe und Mensch, die bei annähernd gleicher manipulativer Geschicklichkeit (vgl. Kortlandt 1968, 71) nicht unbedingt voraussagbar gewesen wäre, vor allem auf die ausbleibende Wechselwirkung zwischen Werkzeuggebrauch und Sprache (Konzeptbildung, Benennung) bei den Primaten zurückführen, die trotz sorgfältigster Schulung eine vorwiegend averbale Intelligenz behalten (Hayes 1951; Kellogg & Kellogg 1933). Dies um so mehr, als sich der Übergang vom "homo erectus" zum "homo sapiens" wahrscheinlich fünf mal an verschiedenen geographischen Orten der Erdoberfläche ereignet hat, so daß der mit der Sprache verbundene kulturelle Aufstieg nicht nur einer zufälligen Anhäufung von Erfahrung, sondern der planmäßigen Variation von Ausgangsbedingungen zuzuschreiben ist (Miller 1964, 31-32). Dank dieser historischen Entwicklung könnte man auch mit Sprachzügen rechnen, die allen natürlichen Sprachen gemeinsam sind (Universalien), weil die im Mythos des Turmbaus zu Babel festgehaltene "Zerstreuung" über die Erde bzw. die Aufspaltung in verschiedene Rassen erst nach der Entstehung dieser recht gleichartigen "Ursprache" erfolgen konnte (Coon 1962). So schwierig aber eine Zuordnung der morphographischen Hirnstruktur zum Sprachverhalten sein mag, so eindeutig lassen sich deskriptive Kriterien des eigentlichen Sprechapparates anführen, die mit der Sprachfähigkeit des Menschen in Verbindung gebracht werden können. So beeinflußt der aufrechte Gang alle Resonanzkammern des Kopfes und bewirkt — neben dem Anwachsen des GehirnVolumens — eine Schwerpunktverlagerung, die sowohl eine Veränderung der oralen Höhlen-Proportion wie auch der relativen Zungenstellung (bezüglich Aufhängung und Befestigung) mit sich bringt, obgleich Knochen, Muskeln und Gewebestrukturen analog wie bei den Primaten angeordnet bleiben (Lenneberg 1967, 39). Außerdem bahnt sich in der menschlichen Entwicklung eine als Vereinfachung erscheinende Spezialisierung an, die zu stromlinienförmigen Resonanzkammern, Stimmband-Reduktion, Atmungs-Ökonomie und Optimalisierung der Luftflußbedingung in Mund- und Nasenhöhle führt: mit nur einem Stimmbandpaar wird die Lautbildung auf die Ausatmung beschränkt, deren Resonanzraum (nach erfolgter Epiglottis-Senkung) dadurch vergrößert wird, daß die Luft frei durch Mund- und Nasenhöhle strömen kann, wobei die trichterförmige Beschaffenheit der Kehlkopf-

24

EVOLUTION UND SPRACHURSPRUNG

düse für optimale Luftflußbedingung sorgt, durch die zugleich eine Reduzierung des Lungen-Luftdrucks und eine Luftflußbeschleunigung (mit minimalem Energieverlust und maximaler Stimmbandeffiziens) erreicht wird (Fink & Kirschner 1959). In diesen Zusammenhang gehört auch die — erst später zu besprechende — Entwicklungstendenz zunehmender Stimmritzen-Abdichtung (Nemai 1920) und Tieferstellung des Kehlkopfes (Schilling 1937), die zu einer voll funktionierenden Atemund Lautkontrolle unerläßlich scheinen (vgl. V.l.). Relativ aufschlußreich ist weiterhin ein anatomischer Vergleich von Lippen- und Mundform bei Affe und Mensch. Während die Muskeln um die Mundecken bei "homo sapiens", Schimpanse und Gorilla recht ähnlich sind (Lightoller 1925; Huber 1931), findet sich der "Lachmuskel" (risorius Santorini) sowie der "Ringmuskel" (orbicularis oris) rund um den Mundrand nur beim Menschen (Duckworth 1910) und bildet die anatomische Vorbedingung zu luftdichtem Verschluß und plötzlich "explosivem" Öffnen (Explosive: p, b, m, f, v, w, wh etc.). — Bemerkenswert ist auch ein Vergleich der Gebiß-Zahnbogen: im Unterschied zu den Gebißformen der Primaten finden sich beim "homo sapiens" keine vergrößerten Eckzähne, die das durchgehende Ebenmaß des U-förmigen Zahnbogens unterbrechen würden, was — nebenbei bemerkt — eine wesentliche Voraussetzung zur Erzeugung von "Zischlauten" ist (Frikative: f, v, s, sh, th etc) (Schultz 1958). Obige Übersicht belegt also nur die eingangs erwähnte Schwierigkeit bzw. Unmöglichkeit einer Rekonstruktion des Sprachursprungs, die in direktem Zusammenhang mit der Problematik einer "kontinuierlichen" phylogenetischen Herleitung steht (vgl. S. 16). Sie bestätigt auch, daß eine systematische Methodik, die sich auf einen präsenten, d.h. wissenschaftlich überprüfbaren Forschungs-Gegenstand bezieht, ungleich objektiver als eine historisch-rekonstruierende vorzugehen vermag. Damit wird aber eine Argumentation wiederholt, die in anderer Form schon oben vorgebracht wurde, als der Unterschied zwischen den (hier und jetzt) fundierenden Bedingungen des menschlichen Sprechapparats und dessen (zeitlich weit zurückliegenden) phylogenetischen Voraussetzungen hervorgehoben wurde. An dieser Stelle kann nun präzisiert werden, daß selbst bei Berücksichtigung phylogenetischer Proximität eine Zuordnung morphographischer Körperfunktionen zur Sprechfunktion bei den (ausführenden) Sprechwerkzeugen besser als bei den (steuernden) Gehirnprozessen gelingt, so daß ersteren im Rahmen des Modell-Universums wegen ihrer größeren Eindeutigkeit — im Sinne "endlicher Lösbarkeit" — der Vorzug zu geben ist. Dies um so mehr, als die frühere Unterscheidung zwischen fundierenden und fundierten Bedingungen der Sprechbewegung hier noch einmal spezifiziert werden kann: so komplexer Art die "feuernden" Impulse des ZNS auch sein mögen, sie sind zu ihrer motorischen Realisierung insgesamt auf die "unerläßliche Bedingung" der körperlichen Exekutions-Organe angewiesen, die keine differenziertere Ausführungsbestimmung zulassen, als in ihren strukturellen Besonderheiten angelegt ist.

EVOLUTION UND SPRACHURSPRUNG

25

[Selbstverständlich besagt die hier vorgenommene Gewichtung nichts über den sonst möglichen Zugang zu Sprachphänomenen bzw. zu den ihnen unterliegenden Gehirnfunktionen: Bei der bevorzugten Berücksichtigung der Ausführungs-Organe werden nicht notwendig jene Fragen optimal beantwortet, die eventuell bei einer physiologischen Klärung der Hirnprozesse selbst beantwortbar wären. Die hier in spezifizierter Form vorgebrachte Argumentation der "unerläßlichen Bedingung" kann darum nur im Rahmen des — auf natürliche Sprachen bezogenen (vgl. S. 12) — Modell-Universums zwingend erscheinen, stellt aber zugleich den Kunstgriff dar, die in den morphographisch registrierbaren Organen nicht vermittelten Gehirnfunktionen als (hier) nicht relevant auszugrenzen.] Da diese "kanalisierenden" Vollzugs-Organe aber nicht nur über die Art der — morphographisch bedingten — Laut-Ausformung, sondern auch deren sequentielle Anordnung bzw. serielle Überführbarkeit entscheiden, erfüllt ihre Beschreibung zwei Grundforderungen der Ableitungs-Hierarchie, nämlich 1. die direkte Verbindung korrespondierender Momente zwischen Sprechbewegung und Sprachstruktur und 2. die für die angestrebte Lösungsstrenge erforderliche Eindeutigkeit in der systematischen Zuordnung (vgl. S. 17,8).

3. HIRN- U N D SPRECH-RHYTHMIK

Innerhalb dieser Rahmenordnung, die von den "kanalisierenden" Vollzugs-Organen gesetzt wird, gibt es indes eine Dimension zerebraler Aktivität, die sich speziell auf den sequentiellen Verlauf der Sprechbewegung bezieht und daraufhin untersucht werden kann, wieweit sie als Hirn-Rhythmik disponierenden Charakter für die eigentliche Sprech-Rhythmik besitzt. Dabei ist von der Tatsache auszugehen, daß rhythmische Aktivität als solche fundamental für das Vertebraten-Gehirn ist, so daß die menschliche Sprechbewegung lediglich als Spezialfall einer universell beobachtbaren Rhythmizität (v. Holst 1937; Bremer 1944) bzw. als Funktion eines in großem Variantenreichtum auftretenden — Zentralnervengewebes aufgefaßt werden könnte (Adrian 1937; Wall 1959). Eine genauere Zuordnung bestimmter Hirnrhythmen zur Sprechbewegung gelang jedoch bisher nur unzulänglich. So gehört der bei Mußezustand auftretende und auf die Occipital-Region rückführbare Alpha-Rhythmus (9-10 cps) sicher nicht zu jenen Rhythmen, die mit der Sprechtätigkeit in engere Beziehung gebracht werden könnten. Erst mit Hilfe statistischer Analysen von EEG-Voltmessungen gelang es neuerdings, einen bisher durch "elektrisches Geräusch" maskierten Grundrhythmus von 7 cps bloßzulegen, der — weil durch die temporo-parietale Region hervorgerufen — den eigentlichen Sprachgebieten wesentlich verwandter sein dürfte (Brazier 1960). Bemerkenswert ist in diesem Zusammenhang, daß Kleinkinder nicht zu sprechen beginnen, bevor ihre Gehirnmasse eine gewisse elektro-physiologische Reife besitzt, die sich in der entsprechenden Frequenz-Erhöhung des dominanten Rhythmus

26

HIRN- UND SPRECH-RHYTHMIK

anzeigt: "Nur wenn dieser Rhythmus etwa 7 cps oder schneller ist (bei einem Alter von ca zwei Jahren), sind sie für die Sprachentwicklung vorbereitet" (Lenneberg 1967, 117). Es ist somit möglich, daß dieser Grundrhythmus als sequentieller "Raster" für die im allgemeinen viel langsameren Sprechrhythmen (in Silbenlänge, Intonationsmuster usw.) natürlicher Sprachen dient. Träfe diese Vorstellung zu, so müßten sich letztere — gemäß dem unterliegenden rhythmischen Vehikel der zeitlichen Grundeinheit (160 ± 2 0 rnsec) — in multimodaler Häufigkeits-Anordnung verteilen, wobei die Distanz zwischen den Modalwerten entweder ein Gleiches oder Mehrfaches dieser Grundeinheit betragen würde (op. cit. 119). Veranschaulichen läßt sich diese ausfilterbare Rhythmizität schon durch einen einfachen Klopfrhythmus, der im Unterschied zum zufälligen Klopfen stets ein reproduzierbares Grundmuster enthält, das trotz variierter Zeitdauer "im Takt" bleibt: wo Extraschläge vorkommen, haben sie sich in entsprechenden Bruchteilen der übergeordneten Zeiteinheit einzufügen. Und zwar ist diese temporäre Proportionalität für die Satz-Melodie so dominant, daß sie vergleichsweise wichtiger als Tonhöhe, Lautheit, Färbung usw. erscheint (op. cit. 108). Sie kann jedoch in dieser Abhandlung vernachlässigt werden, weil sie 1. noch einer genaueren experimentellen Objektivierung bedarf und 2. zu jenen Voraussetzungen der Sprechbewegung gehört, die nicht in die formalisierte ( = abstrahierte) Sprachstruktur überführt werden, da in letzterer nur noch die serielle Anordnung der rhythmischen Elemente, aber nicht mehr die Zeitdauer ihrer Aufeinanderfolge bzw. deren zerebrale Proportionalität erscheint. Was über die Rhythmizität der Sprechbewegung noch zu sägen ist, kann deswegen in die Beschreibung der eigentlichen Sprechorgane aufgenommen werden, deren "kanalisierende" Wirkung den rhythmisch-sequentiellen Aspekt impliziert. Auch hier gilt das oben Festgestellte, daß kein rhythmisches Muster innerhalb der Sprechbewegung auftreten kann, das mit der strukturellen Eigenart dieser Organe unvereinbar ist: insofern rhythmische Sprechbewegung überhaupt vorhanden ist, kann sie als fundierend für alle Manifestationen verbaler Art gelten, wiewohl sie selbst nur ausgefilterte Periodizität der Hirn-Rhythmik ist. Die aus der Sprechbewegung in die Sprachstruktur überführte Sukzessivordnung dieser Periodizität, in welche die Zeitdauer der seriellen Elemente nicht mehr eingeht, wird also in direkter Weise nur durch die Sprech-, aber nicht durch die Hirn-Rhythmik fundiert.

III

1. ATEM- UND SILBENPULS

Die experimentellen Befunde Stetsons, die schon in den Jahren 1905 bis 1951 erhoben wurden und in jüngerer Zeit besonders von Smith & Smith (1962) sowie Jakobson & Halle (1956) gewürdigt worden sind, haben für vorliegende Untersuchung eine so zentrale Bedeutung, daß ihnen ein breiterer Raum zuerteilt werden muß. Bevor aber auf ihre inhaltlichen Aspekte eingegangen wird, sei eine kurze Begründung über ihr generelles Verhältnis zu dem hier konzipierten Ansatz systematischer Feldeingrenzung gegeben. Ganz allgemein läßt sich zunächst feststellen, daß sich die "Deskription" Stetsons nicht nur empfiehlt, weil sie "experimentell" ist, d.h. den klassischen Ansprüchen an das Experiment (Willkürlichkeit, Wiederholbarkeit, Variierbarkeit: vgl. Hofstätter 1957, 101) genügt, sondern auch als Basis der Ableitungs-Hierarchie besonders geeignet ist, weil sie einerseits den Anschluß an die ganzkörperliche Sprechbewegung, andererseits aber — durch adäquate Kennzeichnung der motorisch-phonetischen Korrelate — die Überleitung zur phonemischen Silbenerfassung gewährleistet (vgl. Jakobson & Halle 1956, 21). Diesem Phonetiker war also schon vor zwei Jahrzehnten an einer Sprach-Definition gelegen, die vornehmlich an den fundierenden Bedingungen der Sprachproduktion, d.h. an den motorisch-phonetischen Grundlagen der Sprechbewegung orientiert war, weil vergleichende "Phonemik" vergleichende "Phonetik" voraussetzt (Stetson 1951, 6). Durch eine Galiläische Wendung stellte er gleichsam die bis dahin vorherrschende Ansicht auf den Kopf, wonach eine "wissenschaftliche" Bestimmung der Sprache gleichbedeutend mit einem "geisteswissenschaftlichen" Ansatz sein müsse. "By defining speech in terms of its movement systems, Stetson's work discredits traditional interpretations that regard speech as primarily a mental or psychic phenomenon" (Smith & Smith 1962, 34). Man könnte auch sagen, daß er als erster so konsequent war, die Sprache von der "unerläßlichen Bedingung" ihrer motorischphonetischen Grundlagen her anzugehen und damit — im Sinne des hier konzipierten Ansatzes — wieder auf die Füße zu stellen.

28

ATEM- UND SILBENPULS

Aber auch innerhalb des Stetsonschen Arbeitsbereiches läßt sich eine experimentelle Akzentuierung erkennen, die eindeutig auf die rhythmische Erfassung der "direkt fundierenden" Vollzugs-Organe ausgerichtet ist (vgl. S. 24,25). So wird die "wahre Grundeinheit" des Sprechens nicht etwa in zerebralen Vorgängen gesucht, sondern — in Übereinstimmung mit zahlreichen Sprachforschern — in dem "Silbenpuls" (syllable pulse) gesehen, der nichts weiter als das phonetische Korrelat des motorischen "Atempulses" (breath pulse) bzw. "Brustpulses" (ehest pulse) ist. Stetson stellte also den — auch morphographisch registrierbaren — Atempuls, der in kleinen, unmerklichen Brustkontraktionen von 8-10 pro sec. erfolgt (Stetson 1951, 31) und in direkte Beziehung zur artikulatorischen Silben-Produktion von 6.7-8.2 pro sec. zu bringen ist (Hudgins & Stetson 1937; vgl. Miller 1951, 793"), als rhythmische Grundeinheit heraus, da er mit dem korrespondierenden "Silbenpuls" auch die ablösbare "Silbe" konstituiert. Analog einem nur indirekt zugänglichen Hirnrhythmus ist demnach dieser Atempuls als das eigentlich tragende Vehikel der Sprechbewegung anzusehen, das insofern als biologische Konstante anzusehen ist, als es sich nur innerhalb ontogenetisch fixierter Altersgrenzen (vom 8. bis 30. Lebensjahr) geringfügig variieren, d.h. beschleunigen läßt (Harris 1953; House 1961; Lehiste & Peterson 1961; Peterson & Lehiste 1960; vgl. Lenneberg 1967, 115). Für diesen Atem- bzw. Silbenpuls der Sprechrhythmik gilt nun in besonderer Weise, was oben nur in allgemeinerer Form von Stetsons experimenteller Deskription gesagt werden konnte: daß er nämlich einerseits den Anschluß an die ganzkörperliche Sprechbewegung, andererseits aber auch die Überleitung zur phonemischen Silbenerfassung gewährleistet (vgl. S. 27). Überdies kann er als die fundierende Einheit der Sprechbewegung angesehen werden, da die "Silbe" — weil durch den Brustpuls konstituiert — ihre Begrenzung nicht durch ein energetisches TonstärkenMinimum, sondern durch Bedingungen findet, die "eine Bewegung als eine ausmachen": "Its delimitation is not due to a 'point of minimum sonority' but to the conditions which define a movement as one movement. In the individuality of the syllable the sound is secondary; syllables are possible without sound. Speech is rather a set of movements made audible than a set of sounds produced by movements" (Stetson 1951, 33). Wenn aber Sprache eher aus einer hörbar gemachten Bewegungs-Koordination als einer durch Bewegungs-Koordination herbeigeführten Lautbildung besteht, wie an sprechfähigen, aber gehörlosen Personen leicht nachgewiesen werden kann, muß auch der — dem Brustpuls entsprechende — Silbenpuls als eine phonetische Lauteinheit angesehen werden, die erst nach Ablösung von ihrer motorischen Grundlage in "Konsonant" und "Vokal" zerlegbar ist. Die "freigebende" und "arretierende" Funktion des Konsonanten bzw. die "ausformende" Funktion des Vokals im Silbenpuls-Verband sind also vom Standpunkt motorischer Phonetik konstituierender als ihre davon abgelöste sonorische Qualität. "The movements of the 'sounds' often overlap and often fuse; they are not always separate. But by common consent a syllable is always a separate event in the speech series" (op. cit., 27).

ATMUNG, LAUTBILDUNG UND ARTIKULATION

29

2. ATMUNG, LAUTBILDUNG UND ARTIKULATION

Um einen methodischen Zugang zum experimentellen Ansatz Stetsons zu gewinnen, sei zunächst seine funktionale Aufgliederung des physiologischen Sprechapparates übernommen, wonach 1. der Atem-Mechanismus für die erforderliche Luftzufuhr sorgt; 2. der Kehlkopf die Stimmlaute produziert und 3. der Artikulations-Mechanismus die geformte sprachliche Äußerung hervorbringt (op. cit., 11). Es ist nun von Bedeutung, daß Stetson diese Einteilung des Sprechapparates nicht in der üblichen Weise analog der Funktion einer Orgel mit Windwerk (Brustkorb) und Pfeifenwerk (Ansatzrohr) versteht, wobei Stimmritze (Glottis) bzw. konsonantische Konstriktion als "Ventil" fungiert, um den Luftfluß durch die Stimmbänder freizugeben oder zu drosseln. Bei diesem Modell wird nämlich stillschweigend unterstellt, das Ventil stehe unter einem Luftdruck von Seiten des Windwerks bzw. habe die Aufgabe, die nachströmende Luft durch entsprechende Öffnung und Schließung zu regulieren. Stetson betont dagegen mit Nachdruck, daß der Atem-Mechanismus des menschlichen Sprechapparates eher einem "Hand-Blasebalg" (zum Anfachen des Feuers) entspricht, dessen Luft-Volumen zwar vergrößert werden kann, dessen Düse aber ständig offenbleiben kann, weil kein Luftdruck (bzw. Luftfluß) vorhanden ist. Mit einem solchen Blasebalg ist es jedoch möglich, kleine Luftstöße zu emittieren, die durch schnelle, das Luftvolumen ständig reduzierende, Handbewegungen erzeugt werden, ohne daß hierzu eine ventilartige Vorrichtung erforderlich wäre (op. cit., 1). Wichtig bei diesem Vergleich mit dem Hand-Blasebalg ist vor allem der Umstand, daß nun dem "Pfeifenwerk" (Ansatzrohr) nur noch eine akzessorische, aber keine komplementierende Rolle mehr gegenüber dem "Windwerk" (Brustkorb) zukommt. Dies funktionale Verhältnis von Atmung einerseits und Lautbildung/Artikulation andererseits wird besonders anschaulich bei Patienten mit Kehlkopfschnitt (Laryngotomia), die gezwungen sind, mit künstlichem Kehlkopf zu sprechen. Unmittelbar nach der operativen Entfernung des Kehlkopfs vermögen sie nicht den leisesten Laut durch Betätigung der Artikulationsorgane hervorzurufen, lernen dies aber mittels eines künstlichen Kehlkopfs binnen weniger Stunden. Dabei versieht die in den Vorderbereich der Mundhöhle reichende Röhre dieses Hilfsorgans dieselbe Funktion wie der intakte Kehlkopf, der Luftfluß und Ton für die artikulatorische Überformung des Resonanzraumes liefert. Als Luftquelle dient ihm dabei ein schlichter Hand-Blasebalg, der aber ein Mindestvolumen von 3 bis 4 Litern besitzen muß. Der Patient hält also seinen Stimmatem buchstäblich in der Hand, wenn er die Luft aus dem handbedienten Blasebalg in die Mundhöhle emittiert und durch Druckanpassung der Artikulationsorgane so zu regulieren sucht, daß nicht nur ein terminierbarer Luftfluß, sondern auch eine adäquate Lautbildung gewährleistet ist (op. cit., 17). Der oben dargestellte Brustpuls ist also nichts anderes als das funktionale Äquivalent eines rhythmisch emittierten Luftstoßes, wie er von einem expandierten Blase-

30

ATMUNG, LAUTBILDUNG UND ARTIKULATION

balg (mit offener Düse) unter allmählicher Reduzierung des Luftvolumens erzeugt wird. Er ist insofern autonom, als er keiner funktionalen Komplementierung durch das überformende Ansatzrohr von Lautbildung und Artikulation bedarf, (wie an Patienten mit Luftröhrenschnitt zu ersehen ist, die mit einer, direkt über dem Sternum in die Trachea eingeführten Röhre zu atmen vermögen — op. cit., 16). Insofern er aber durch das Ansatzrohr des menschlichen Sprechapparates überformt wird, ist er nicht nur das fundierende, sondern auch das einheitstiftende Moment des phonetischen Silbenpulses. Somit ist auch die "Silbe" als akustisch ablösbares Epiphänomen durch die gesamtkörperliche Bedingung der Atmung determiniert, dieweil erst durch das Expandieren des Brustkorbs (bzw. der Lungenflügel) und das Festhalten der Brust-Zwerchfell-Position die Voraussetzung zum stoßweisen Ausatmen gegeben ist (op. cit., 2). In graphischer Registrierung erscheint diese Ausatmungsphase denn auch als absteigende Kurve mit kleinen Stufen, die mit den "stops" (Pausen, Konsonanten) der Sprechbewegung übereinstimmen (Lenneberg 1967,115). Die ziemlich verbreitete, aber falsche Annahme, daß der Fluß von Konsonanten und Vokalen auf einem kontinuierlichen Ausatmungsdruck beruhe, muß also dahingehend berichtigt werden, daß die Brustmuskeln einen besonderen Druckpuls bei jeder einzelnen Silbe ausüben, der zwischen den Silben-Einheiten jedesmal abfällt: "Die Brust hält eine allgemeine Stellung ein, die das Luftvolumen bewahrt, aber die minutiösen Kontraktionen der kurzen Muskeln zwischen den Rippen (intercostals) drücken kleine Luftstöße heraus, welche die einzelnen Silben darstellen" (op. cit., 3). Dieweil nun die Sprechbewegung als integrierte Funktion der Atmung (Brust, Unterleib), der Lautbildung (Kehlkopf) und der Artikulation (Mund-RachenHöhle) zu verstehen ist, liegt es nahe, die rhythmischen Verläufe der einzelnen Sprechorgane in graphischer Darstellung phasenmäßig so zu koordinieren, daß die fundierten Bedingungen von Lautbildung/Artikulation den fundierenden Bedingungen der Atmung eingeordnet werden. Eben dies tat aber Stetson, wenn er in einem Übersichts-Diagramm sowohl die rhythmischen Verläufe der Abdomen -und Brustatmung, wie auch der Vokal-Vibration und artikulativen Überformung (Mundluft, Lippen- und Zungenbewegung) einander gegenüberstellte (vgl. Abb. 9). Hervorzuheben ist bei dieser Registrierung, daß sie sich auf morphographisch meßbare Daten der Körperbewegung bezieht, die der rhythmischen Alternation von Ausdehnung (Expansion) und Zusammenziehung (Kontraktion) entsprechen. Dies gilt sowohl für die Rumpfbewegung des Ein- und Ausatmens wie für die artikulatorische Öffnung und Schließung der Mund-Rachen-Höhle. Da jedoch diese morphographisch registrierbare Änderung der beteiligten Organe durch eine Muskelkoordination zustandekommt, die als rhythmische Alternation von Zusammenziehung (Kontraktion) und Ausdehnung (Expansion = Erschlaffung) gekennzeichnet werden kann, lassen sich die für den "molaren" Bewegungsrhythmus zuständigen "molekularen" Innervationen ersteren wiederum phasenmäßig einordnen. (Die von Tolman stammende Unterscheidung von molar/molekular für den Unter-

31

ATMUNG, LAUTBILDUNG UND ARTIKULATION

müssiwt^;^ c. dc'Uni« SouiTif

UIOTOR

ty™*

PHonnics

^ A

Oiaph. Aldo men

VISIBLE

R«oum|

SPEECH

ß'M

BaiMHUHIimiHHIIIii

intHMiftnium nam«.

im tHliniHUHUl

niinuawam j?

ItllllHIIlUIHt» i - t



Mimili v

r

k

Abb. 9. Vergleich der Silbenpuls-Darstellung nach Rousselot, motorischer Phonetik und Visible Speech. (Nach Stetson 1951.)

schied übergeordneter Verhaltensweisen und einzelner Reaktionselemente wird hier im Sinne großräumig-organischer und kleinräumig-elementarer Funktionseinheiten verwendet — Littman & Rosen 1950; vgl. Solle 1969, 135-136.) Die molekularen Daten der Muskelinnervation werden also den molaren Daten der Organbewegung ebenso wie die fundierten Bedingungen von Lautbildung/ Artikulation den fundierenden Bedingungen der Atmung eingeordnet. So registriert Stetson beispielsweise die molare Bewegung von Brust und Unterleib durch direkte Körperwand-Messung (vgl. Abb. 10), erfaßt aber gleichzeitig die unterliegenden Muskelkontraktionen durch oszillographische Aufzeichnung der Aktions-Potentiale (vgl. Abb. 11). Gleichzeitig werden aber auch die molekularen Kontraktionen der Brustmuskeln denjenigen der Abdomen- und Zwerchfellmuskeln zugeordnet (vgl. Abb. 9). Summarisch sei also festgehalten, daß sich aus dieser doppelten Einordnung molekular/ molarer und fundiert/fundierender Daten eine "Funktions-Hierarchie" der Sprechbewegung ergibt, die nicht nur dem Prinzip systematischer Feldeingrenzung entspricht, sondern auch gemäß dem zunehmenden Gewicht der Selektivität

32

ATMUNG, LAUTBILDUNG U N D

ARTIKULATION

dominalmuskeln (BM). (Nach Stetson 1951.)

ABB. 11. Placierung der Elektroden für die Registrierung der Aktionsströme bei den Sprechmuskeln. 1 - 1 Rectus abdominis; 2 - 2 laterale Unterleibsmuskeln. 3 - 3 Zwerchfell; 4 - 4 interne Intercostal-Muskeln; 5 - 5 externe Intercostal-Muskeln; 6 - 6 interne Kehlkopfmuskeln. (Nach Stetson 1951.)

a u f d a s ablösbare, d.h. in die f o r m a l e S a t z s t r u k t u r ü b e r f ü h r b a r e E p i p h ä n o m e n d e r "Silbe" ausgerichtet w e r d e n k a n n .

SILBE, ATEMFUSS, ATEMGRUPPE UND PHRASE

33

3. SILBE, ATEMFUß, ATEMGRUPPE UND PHRASE

Bevor jedoch eine synoptische Darstellung dieser Funktions-Hierarchie der Sprechbewegung gegeben werden kann, muß noch eine weitere System-Komponente im experimentellen Ansatz Stetsons eingeführt werden. Hierbei handelt es sich um die motorische Ausführung des oben erwähnten Prinzips molarer Expansion/Kontraktion. Betrachtet man sie genauer, so läßt sie sich als Alternation "ballistischer", d.h. frei schwingender und "gespannter", d.h. kontrollierter Organführung kennzeichnen. Bemerkenswert ist in diesem Zusammenhang, daß erst die durch Stetson & Bouman (1933) perfektionierte Methode zur Messung elektrischer Muskelströme, die simultan mit der (molaren) Organführung registriert wurde, zu dieser revidierten Einteilung eines ballistischen und gespannten Bewegungstyps — mit je zwei Untertypen — führte: danach werden ballistische Bewegungen (bei einseitiger Antagonisten-Kontraktion) geschoßartig "geworfen" oder (bei Überlagerung eines angespannten Antagonisten-Paares durch eine schnelle Muskelkontraktion) entsprechend "versteift". Langsame gespannte Bewegungen können wiederum lokal fixiert, d.h. "gehalten" oder beweglich fixiert, d.h. "kontrolliert" sein (Stetson 1905; Stetson & McDill 1923; Stetson 1951). Dieses Einteilungsprinzip ballistisch/gespannter Organführung ist nun insofern von "feldüberdeckender" Weite, als es sich nicht nur auf den menschlichen Gang (Hubbard & Stetson 1938), sondern auch auf die Armbewegung (Stetson & Bouman 1933; Sperry 1939), die Augenbewegung (Huey 1900; Dodge 1903) und — wie noch näher zu beschreiben ist — auf die expandierend-kontrahierende Sprechbewegung anwendbar ist (Stetson 1951; vgl. Smith & Smith 1962, 29-34). Trotz der morphographischen Verschiedenheit dieser einzelnen Organe lassen sich also typenmäßige Gemeinsamkeiten feststellen, die auf die besondere Funktion der beteiligten Muskelgruppen zurückzuführen sind. Dabei entspricht der "fixierende" Bewegungstyp den entgegengesetzt arbeitenden Muskelgruppen, die das Organ lokal fixieren, d.h. in einer bestimmten Position festhalten; der "kontrollierende" Typ ist dann gegeben, wenn sich die antagonistischen Muskelgruppen gemeinsam an der Erzeugung einer Bewegung beteiligen, während der beide Opponenten kontrahiert sind, die Richtung aber veränderbar ist, so daß eine relativ langsame Bewegung resultiert; der "ballistische" Typ hingegen, der sich als einzelner, schneller Impuls ohne Richtungsänderung abhebt, liegt vor bei plötzlicher Kontraktion der positiven Muskelgruppe mit entsprechend schneller Relaxation, wobei während mindestens der halben Bewegung keiner der Opponenten kontrahiert wird und die nicht-kontrollierte "Wurfbewegung" durch Kontraktion der negativen Muskelgruppe arretiert wird (op. cit., 28). Diese einzelnen Bewegungstypen können nun in eine systematische Beziehung zu Atmung und Artikulation gebracht werden, wobei ganz allgemein gilt, daß die kürzeren, d.h. schnelleren Rhythmen der Überformung immer nur (einordbarer) Teil der längeren, d.h. langsameren Rhythmen sein können, die ihnen unterliegen.

34

SILBE, ATEMFUSS, ATEMGRUPPE UND PHRASE

So stellt die ballistische Brustbewegung das überformende Element der kontrollierten Abdomen-Zwerchfell-Atmung dar, während die artikulatorische Ausformung des Atempulses von der gleichfalls ballistischen, aber relativ schnelleren Mund- und Zungenbewegung besorgt wird. Aus der phasenmäßigen Zuordnung dieser verschiedenen Bewegungs-Ebenen ergibt sich demnach eine "Funktions-Pyramide", deren Basis der größten rhythmischen Einheit, deren Spitze aber der konsonantisch/ vokalisch differenzierten "Silbe" gleichzusetzen ist. Innerhalb dieser Funktions-Pyramide, die dem Prinzip systematischer Feldeingrenzung entspricht, lassen sich wiederum jene sequentiellen Einheiten definieren, die einerseits der Fundierungs-Hierarchie von Atmung, Lautbildung und Artikulation, andererseits aber auch dem Gegensatz gespannter und ballistischer Organführung zuzuordnen sind. Dabei ist hervorzuheben, daß der menschliche Körper diese verschiedenen Bewegungs-Ebenen der Funktions-Pyramide schon in seinem Bau erkennen läßt. So beruhen die Bewegungen der "Phrase", die sich auf den gesamten Ausatmungsabschnitt beziehen, (dem die schnelle Einatmung folgt), auf dem regulierenden Ausatmungsdruck der Abdomen-Zwerchfell-Muskeln sowie der externen Brustmuskeln; die Bewegungen der "Atemgruppe" und des"Atemfußes" gehen ebenfalls auf die kontrollierenden Unterleibsmuskeln zurück und sind zeitlich lang genug, um verschiedene Kulminationspunkte für Betonung und Akzentuierung zu erlauben. Die "Silbe" hingegen besteht aus einer einzigen ballistischen Bewegung der (antagonistisch arbeitenden) internen und externen Brustmuskeln (intercostals), bei der es zeitlich unmöglich ist, auch nur zwei verschiedene Akzente unterzubringen (op. cit., 4). Diese an der Tiefatmung (Atemgruppe, Atemfuß) und der Brustatmung (Silbe) beteiligten Muskelgruppen werden in Abb. 12 dargestellt. Da sind zunächst die antagonistisch arbeitenden Abdominal- und Zwerchfell- sowie externen Brustmuskeln, die sowohl für das (lokal fixierende) Festhalten des Brustkorbes wie auch für die langsame Anpassungsbewegung von Phrase, Atemgruppe und Atemfuß zuständig sind. Dabei werden die Druckimpulse der Abdominalmuskeln durch die bewegliche Masse der Eingeweide auf das Zwerchfell übertragen, das seinerseits von den größeren Brustkorbmuskeln fixiert wird. Der auf diese Weise in Expansionsstellung gehaltene bzw. in langsamer Bewegung kontrollierte Brustkorb wird dann durch die gleichfalls antagonistisch arbeitenden Intercostal-Muskeln zu jenen momentanen Druckimpulsen veranlaßt, die auf den unterliegenden Phasen-Einheiten wie "Gekräusel auf einer Welle" hinlaufen. Hierbei kontrahieren die internen IntercostalMuskeln den Brustkasten, indem sie die Rippenbögen nach unten ziehen und den Brustpuls arretieren. Den schnellen Druckimpulsen der Intercostal-Muskeln entspricht demnach eine relativ gleichförmige Bewegung der Abdominal-Muskeln gegen das Zwerchfell bei der Ausatmung, der die durch Rippenhebung (der externen Intercostal-Muskeln) und Zwerchfelldehnung bewirkte Einatmung folgt (op. cit., 16-20). — Die Körperstellen, an denen die Elektroden zur Registrierung der beteiligten Muskelgruppen angelegt wurden, sind aus Abb. 11 ersichtlich.

SILBE, ATEMFUSS, ATEMGRUPPE U N D PHRASE

35

1. Brustpuls-Muskulator EI = externe Intercostal-Muskeln (Rippenhebung bei Einatmung) II = interne Intercostal-Muskeln (Rippensenkung bei Ausatmung) 2. Atmungsgruppen-Muskulatur R = Abdominal-Muskeln, geführt von Rectus (Druck auf Zwerchfell durch flüssige Masse der Eingeweide) D = Zwerchfell (Gegendruck zu Abdominal-Muskeln: Einatmungsmuskel) Beide Muskelgruppen arbeiten antagonistisch. (Nach Stetson 1951.)

Mithin kann die "Silbe", die ihrerseits einen freigebenden, vokalformenden und arretierenden Faktor enthält, im Sinne einer "umfaßten" phasischen Einheit (vgl. Euler-Venn-Diagramm: Abb. 2) als überformender Bestandteil des "Atemfußes" angesehen werden, der eine oder mehrere Silben enthält und selbst einer "Atemgruppe" zugehört, die einen oder mehrere Atemfüße einbegreift, selbst aber wieder Teil einer "Phrase" mit einer oder mehreren Atemgruppen ist. Geht man also von dem Minimum hierarchischer Umfassung aus, so besteht die einfachste Äußerung aus einer Phrase mit nur einer Atemgruppe, die ihrerseits wieder nur einen Atemfuß mit einer Silbe enthält (op. cit., 3). 4. BALLISTISCHER PULS- U N D RÜCKSTOß

Setzt man voraus, daß die langsamen Rhythmen der Unterleibsbewegung von den schnellen Rhythmen der Brustbewegung, letztere aber von den noch rascheren

36

BALLISTISCHER PULS- UND RÜCKSTOSS

Artikulationen der Mundbewegung überformt werden, so läßt sich eine weitere Unterscheidung innerhalb der ballistischen Bewegungsform durch diesbezügliche Beachtung der beteiligten Muskelgruppen machen. Bezeichnet man nämlich die Wurf- bzw. Startbewegung der positiven Muskelgruppe als "Pulsstoß" (beat stroke), die Hemm- bzw. Arretierbewegung der negativen Muskelgruppe aber als (zugehörigen) "Rückstoß" (back stroke), so besteht die ballistische Bewegungsform im einfachsten Fall aus Pulsstoß, Beförderung und Rückstoß. Allerdings ist der Ausdruck "Rückstoß" (back stroke) leicht irreführend, da er keinen eigentlichen Rückimpuls, sondern nur eine Arretierkontraktion der negativen Muskelgruppe darstellt. Bei schnellem rhythmischen Wechsel kann er jedoch die zusätzliche Bedeutung eines rückwärts gerichteten Stoßes erhalten, weil er hier das beteiligte Organ nicht nur arretiert bzw. in der anschließenden Relaxationsphase für einen neuen "Pulsstoß" bereitstellt, sondern es schon während dieser — sonst erforderlichen — Ruhepause "zurückwirft". In diesem Fall arbeitet also auch die negative Muskelgruppe so "ballistisch", daß sich der Rückstoß dem Pulsstoß weitgehend anpaßt und zeitlich gar nicht oder nur geringfügig hinter ihm zurückbleibt (Pulsstoß: 0.05 sec; Rückstoß: 1.45 - 0.05 sec). An sich ist nun diese Einteilung in Pulsstoß, Beförderung und Rückstoß überall dort anwendbar, wo überhaupt von ballistischer — gegenüber gespannter — Bewegung gesprochen wird, läßt sich also an der Bein- und Armbewegung ebenso demonstrieren wie an der Augen- und Sprechbewegung (vgl. S. 33). Bei letzterer gilt sie ebenso für die fundierende Brustbewegung wie die überformende Artikulationsbewegung von Kiefer, Lippen und Zunge. Was oben von dem Einteilungsprinzip ballistisch-gespannter Organführung im allgemeinen gesagt wurde, daß es nämlich von "feldüberdeckender" Weite ist, kann hier dahingehend spezifiziert werden, daß ballistische Bewegungsform gleichbedeutend mit der Alternation von Pulsstoß (beat stroke) und Rückstoß (back stroke) ist. Die experimentelle Deskription Stetsons ist jedoch insofern leicht zweideutig, als sie sich einerseits auf die molekulare Muskelkontraktion von Puls- und Rückstoß, andererseits aber auch auf die (durch sie bewirkte) molare Organbeförderung beziehen kann. Dies wird besonders an dem Terminus "back stroke" deutlich, der bei schnellem rhythmischen Wechsel mit dem zunächst nur molekular gemeinten "Rückstoß" der negativen Muskelgruppe auch die molare "Rückbeförderung" des beteiligten Organs implizieren kann. Diese terminologische Ambiguität von molekular/molar wird noch dadurch unterstützt, daß Stetson die Bedeutung des ballistischen Rückstoßes vorwiegend an Beispielen demonstriert, die eine solche "Umkehrbewegung" des Organs tatsächlich beinhalten. So entspricht bei der ballistischen Bewegungsführung des Dirigentenstabes (op. cit., 29) wie auch des Schmiedehammers (op. cit., 29) dem molekularen Puls- und Rückstoß der Muskelgruppen eine großräumige Organführung, bei welcher das Organ "zurückgeworfen" (bzw. bei der Dreieck-Figur des Dirigierens "herumgeworfen") wird. Ähnliches gilt für die Auf- und Abbewegung der artikulatorischen

BALLISTISCHER PULS- U N D RÜCKSTOSS

37

Sprechorgane (Kiefer, Lippen, Zunge: op. cit., 23, 44, 47), wo die Wurfbewegung ebenfalls eine ganze, d.h. die gesamte Beförderungsstrecke des Organs einbeziehende ist. Anders dagegen bei der (während einer Ausatmungsphase) "kräuselartig" verlaufenden Brustpulsbewegung, die sonst als Prototyp der ballistischen Organführung gilt: hier kann zwar auch von molekularem Puls- und Rückstoß der negativen Muskelgruppe gesprochen werden, aber er bezieht sich vorwiegend auf die einzelnen Abschnitte der Ausatmungsphase, weniger jedoch auf die gesamte Beförderungsstrecke bzw. den Wechsel von der Ausatmung zur Einatmung, so daß er auch nicht als implikative Umkehrbewegung (im obigen Sinne) in Frage kommt. Es empfiehlt sich darum, für die Funktion der (molekularen) Muskelgruppe andere Termini als für den (molaren) Beförderungsweg des beteiligten Organs zu verwenden. Zusätzlich zum "Pulsstoß" (beat stroke) und "Rückstoß" (back stroke) der Muskelgruppen sei deswegen vom effektiv "ausführenden Pulsschlag" und vom ineffektiv "bereitstellenden Rückschlag" eines sich in Umkehrbewegung befindlichen Organs gesprochen. Und zwar sei diese Umkehrbewegung unter die von Woodworth (1958, 36ff) eingeführte Kategorisierung "zweiphasig motorischer Einheiten" (two-phase motor units) subsumiert, die von Miller et al. (1960, 32ff) zu dem kybernetischen Rückkoppelungssystem der TOTE-(Test-Operate-Test-Exit)-Einheit weiterentwickelt wurde. Analog zum "beat stroke" und "back stroke" der (molekularen) Muskelgruppen präsentiert sie einen molaren Bewegungstyp, dem hinsichtlich seines biologischkybernetischen Anwendungsbereichs gleichfalls "feldüberdeckende" Weite zukommt: The first phase is preparatory or mobilising; the second, effective or consummatory. To jump, you first flex the hips and knees, then extend them forcefully; the crouch prepares for the jump. To grasp an object, the first phase is to open your hand, the second is to close it around the object. You must open your mouth before you can bite, you must draw back your arm befoie you can strike, etc. The two phases are quite different movements, yet they are obviously executed as a single unit of action. If stimulation is correct for releasing the action, first the preparatory TOTE unit is executed, and when it has been completed the stimulation is adequate for the consummatory TOTE unit and the action is executed. Many of these two-phase plans are repetitive: the completion of the second phase in turn provides stimuli indicating that the execution of the first phase is again possible, so an alternation between the two phases is set up, as in walking, running, chewing, drinking, sweeping, knitting, etc. (op. cit., 32-33). Bei Stetsons Darstellung ist also zu beachten, daß "beat stroke" und "back stroke" zwar durchgängig als Puls- und Rückstoß der (molekularen) Muskelgruppen identifizierbar sind, je nach dem deskriptiven Zusammenhang aber auch den "Pulsschlag" oder "Rückschlag" des in molarer Umkehrbewegung befindlichen Organs betreffen können. So impliziert der positive "Pulsstoß" den effektiv ausführenden "Pulsschlag", nach erfolgter Arretierung aber auch den ineffektiv bereitstellenden "Rückschlag". Dagegen kann der negative "Rückstoß" nur einen "Rückschlag" implizieren, wenn er zum nicht-arretierten Typ (schneller Umkehrbewegung) gehört, da

38

BALLISTISCHER PULS- UND RÜCKSTOSS

nach erfolgter Arretierung (mit zugehöriger Relaxationsphase) ein neuer "Pulsstoß" erforderlich wäre. Dieser deskriptive Zusammenhang der molekular/molaren Bedeutung von "beat stroke" und "back stroke" wird besonders deutlich, wenn man eine Zuordnung der einzelnen Ausführungs-Ebenen ballistischer Organführung versucht, wie sie bei einem Phasenvergleich von Brust-, Kiefer- und Lippen-Zunge-Bewegung gegeben ist. Sie kann im einzelnen recht kompliziert sein, bleibt aber in jedem Fall an der gut registrierbaren Kieferbewegung orientiert, die Beginn und Ende der artikulatorischen Silbenbildung anzeigt. Darüberhinaus gilt das oben beschriebene hierarchische Prinzip, wonach der ballistische Brustpuls seinerseits von relativ rascheren Puls- und Rückstößen der Artikulationsmuskulatur überformt wird: The releasing consonant stroke closes the vocal canal so that the action of the chest muscles compresses the air; then the rapid back stroke [ = Rückschlag implizierender Rückstoß: R.i.R.] of the lip or tongue, with the opening of the jaw, releases the air. The beat stroke, and often the back stroke, occur during the beat stroke of the chest. At rapid rates the back stroke of the consonant [ = R.i.R.], the opening of the jaw, and the back stroke of the chest, tend to coincide, as well as the beat strokes. The opening and closing of the jaw marks the series of syllables (op. cit., 44).

5. SYNOPTISCHE DARSTELLUNG DER SPRECHBEWEGUNG

Damit wären die terminologischen Voraussetzungen geschaffen, um eine synoptische Darstellung der Sprechbewegung geben zu können, die hinsichtlich der fundierenden Anordnung von Atmung, Lautbildung, Artikulation (vgl. Kap. III.2.) und der bewegungstypischen Einteilung in Phrase, Atemgruppe, Atemfuß, Silbe (vgl. Kap. III.3.) wie auch bezüglich der Überformung ballistischer Brustbewegung durch ballistische Artikulation (vgl. Kap. III.4.) dem Prinzip systematischer Feldeingrenzung entspricht. Eine synoptische Darstellung dieser Funktions-Hierarchie wird im Phasen-Diagramm von Abb. 9 gegeben. Danach leitet die Abdomen-Kontraktion die Bewegung der Atemgruppe ein, die durch entsprechende Zwerchfell-Kontraktion beendet wird; eine Kontraktion der externen Intercostal-Muskeln arretiert den Brustpuls, der durch Kontraktion der internen Intercostal-Muskeln eingeleitet wurde. Die Mikrophon-Linie der Stimme, die die Vibrationsphase der Vokale markiert, fällt in diese (durch Int. I. und Ext. I. begrenzte) Ausatmungsspanne. Analog wird der (durch verschiedene Methoden ermittelte) Brustdruck registriert, der das Verhältnis der Brustpulse zu den freigebenden und arretierenden Konsonanten der Silbe wiedergibt; der Luftdruck innerhalb des Mundes ist insofern bedeutsam, als er bei Konsonanten eine entsprechende Druckerhöhung indiziert, für die sich typische Verlaufsformen ergeben. Lippen- und Zungenbewegung zeigen konsonantische Kontaktnahme der Silbenbildung an. In die Begrenzungsphasen der Intercostal-Muskeln fallen außerdem

SYNOPTISCHE DARSTELLUNG DER SPRECHBEWEGUNG

39

die Ausatmungstöße des außerhalb vom M u n d r a u m gemessenen Luftdrucks wie auch Freigabe und Arretierung von Silbenanfang und -ende. — Die akustischen Muster sind im "Visible Speech" wiedergegeben (op. cit., 54). Die einzelnen Phasen der Sprechbewegung bei dem Wort " a b b a " beschreibt Stetson in grober Umrißlinie von Bewegungen, Kontakten u n d Luftdruck-Verhältnissen wie folgt: In der ersten Silbe 'ab' gibt es keinen freigebenden Konsonanten; der Brustpuls, Kurve C, wird durch die Brust freigegeben. Der abfallende Stoß, 1-3, stellt die schnelle Bewegung des Pulses dar; in 1 fällt die schnelle Kontraktion der Brustmuskeln, die die Brust zusammendrücken. Während Phase 2 setzt der Impuls der Brust die Kompression fort, so daß ein Luftstrom frei durch den Vokal-Kanal fließt. In Phase 3 schließt die Vokal-Bewegung diesen Kanal und blockiert damit den Luftfluß; der rapide Anstieg des Luftdrucks arretiert die Brustbewegung. In diesem Fall ersetzt die Konsonantenbewegung die Kontraktion der negativen Muskelgruppe des Brustkastens. Die aktuelle Verbindung zwischen Brustkasten und akzessorischer Konsonantenbewegung wird durch die Säule der komprimierten Luft im Vokal-Kanal bewirkt. Zwischen den Silben 'ab' und 'ba' (zwischen 3 und 1) stellen sich die Brustmuskeln auf eine neue Kompression ein. Die Lippen bleiben in Kontakt, aber die Lippenmuskeln relaxieren als Vorbereitung für den freigebenden Stoß von 'b' in 'ba' (1 der nächsten Silbe). In dieser zweiten Silbe 'ba' kehrt die schnelle Kontraktion der Brustmuskeln in 1 wieder, der Druck steigt plötzlich wegen des Konsonanten-Verschlusses an, wird aber plötzlich durch den Rückstoß (R.i.R.) der unteren von der oberen Lippe freigegeben, so daß die Luft wie vorher in Phase 2 frei durch den Kanal fließen kann. In Phase 3 ziehen sich die Einatmungsmuskeln des Brustkastens zusammen, um den Impuls des letzteren zu stoppen, indem sie die offene Silbe 'ba' bilden. Die Silbenbewegung ist brust-arretiert, und der Luftdruck bleibt bei Null (3), weil kein konsonantischer Verschluß vorhanden ist (op. cit., 55). Die akustischen Muster werden im 'Visible Speech' als 'Spektrogramme' wiedergegeben, wobei die wechselnden Lautkomponenten auf verschiedenen Häufigkeits-Ebenen in entsprechende Bänder (bars) übersetzt werden, von denen jede sich auf eins der verschiedenen Häufigkeits-Bänder konzentriert. Die Häufigkeits-Bänder wurden ausgewählt, um die hervorstechenden und am meisten modulierten Spektrum-Zonen herauszustellen, die den Einfluß der wechselnden Höhlenöifnung der Stimmbildungsorgane repräsentieren. Die Methode stellt deutlich zwei wichtige Züge der Silbe heraus: 1. Die recht gut definierten 'Resonanz-Bänder' markieren das Modulationsmuster des Vokals, der gewöhnlich den Silbenkern bildet. Bis zu einer Zeiteinheit von 3 pro sec. sind Vokale englischer Silben leicht erkennbar. 2. Mit Marichelle werden die Konsonanten weitgehend durch den Einfluß konsonantischer Konstriktionen auf den Vokal abgelesen. Folglich muß die Silbe als ganze gesehen werden, nicht aber als serielle Anordnung von Konsonant, Vokal, Konsonant (op. cit., 55-56).

IV

1. BRUST- UND KONSONANTBEWEGUNG

Gemäß der Fundierungs-Hierarchie von Atmung, Lautbildung und Artikulation (vgl. Kap. III.2) kann nun noch eine andere Form funktionaler Dependenz aufgezeigt werden, die bereits bei der synoptischen Darstellung der Sprechbewegung angedeutet wurde. Hierbei handelt es sich um das Problem, wie trotz verschiedener ballistischer Ebenen ein einheitlicher Silbenpuls zustandekommt, wenn der fundierende Brustpuls und die konsonantische Hilfsbewegung in ihrer freigebenden bzw. arretierenden Funktion kompensatorisch aufeinander verwiesen sind. Scheint es doch auf den ersten Blick mit einiger Schwierigkeit verbunden zu sein, die Muskelgruppen von Kiefer, Zunge und Lippen in eine direkte Beziehung zu den Muskelgruppen des Brustkorbs zu bringen, da erstere völlig unabhängig arbeiten, d.h. nicht direkt am Brustkorb befestigt sind. Die antagonistische Arbeitsweise der ballistischen Brust- und Artikulationsmuskeln läßt sich aber in ähnlicher Weise wie diejenige der Abdominal- und Zwerchfellmuskeln erklären. Während nämlich hier die Druckimpulse der Abdominalmuskeln durch die "flüssige Masse" der Eingeweide auf das Zwerchfell übertragen werden (vgl. S.34), fungiert als Übertragungsmedium zwischen Brust- und Artikulationsmuskeln die in Brust und Ansatzrohr gestaute Luftsäule: "An examination of the entire speech mechanism shows that the column of compressed air in the ehest and vocal canal becomes the intermediary between the expiratory muscles of the ehest acting as positive group and the muscles of the consonant apparatus acting as the negative group" (op. cit., 51). Der Unterschied zwischen der antagonistischen Arbeitsweise von Muskelgruppen, die nur einer oder aber mehreren Bewegungs-Ebenen angehören, die also durch Befestigung an demselben Organ direkt oder durch ein Übertragungsmedium nur indirekt verbunden sind, läßt sich durch die Gegenüberstellung eines brust-arretierten und konsonant-arretierten Rückstoßes demonstrieren: Wenn der Silbenpuls brust-arretiert ist, wirken die Muskeln des Brustkorbs direkt auf die bewegliche Masse der Brustwände, um den Impuls aufzufangen und die Silbenbewegung zu

BRUST- UND KONSONANTBEWEGUNG

41

arretieren. Ist aber der Silbenpuls konsonant-arretiert, so wirken die Muskeln von Lippen, Zunge, Gaumensegel nicht direkt auf die Masse der Brustwände. Stattdessen schließen sie den Stimmkanal und verursachen eine Kompression der Luftsäule, die auf die bewegliche Masse der Brustwände reagiert (op. cit., 51). Hervorzuheben ist in diesem Zusammenhang, daß es nicht die "vokalische", sondern die "konsonantische" Hilfsbewegung ist, die das funktionale Äquivalent zum Brustpuls auf artikulatorischer Ebene darstellt. Daraus ergibt sich eine funktionale Aufwertung des Konsonantischen im Silbenpuls, die ohne Fundierungs-Hierarchie nicht sichtbar geworden wäre. Während nämlich sonst der Terminus "Kon-sonant" (bzw. "Mitlaut" im Deutschen) auf dessen akzessorische Bedeutung gegenüber dem "selbst-lautenden" Vokal hinzuweisen scheint, spielt er im ballistischen Silbenpuls eine ungleich wichtigere Rolle als letzterer: "Der Konsonant hat eine Funktion in der Bewegung der Silbe: er verengt den Stimmkanal, um den Brustpuls zu limitieren; der Vokal jedoch ist eine ausformende Bewegung, um den Brustpuls frei strömen zu lassen" (op. cit., 37). Die relative Konstanz vokalischer Laute ist denn auch weniger auf deren tonale Gleichartigkeit (steady-state tone), als auf die Gleichförmigkeit konsonantischer "Einfassung" zurückzuführen. Diese funktionale Abhängigkeit des nur ausgeformten Vokals von der freigebenden und/oder arretierenden Konsonantbewegung kommt besonders deutlich im "Visible Speech" zum Ausdruck. So werden im Vokal "a" der Silbe "ab" die Resonanz-Bänder zum Konsonant ("b") hin, d.h. nach unten abgebogen, während sie im Vokal "a" der angeschlossenen Silbe "-ba" vom Konsonant weg, d.h. nach oben abgebogen werden, woraus ersichtlich wird, daß die konsonantische Kontraktion während der gesamten Ausformungsperiode des Vokals "mitbeteiligt" ist (op. cit., 57: Abb. 9, S.67).

2. BALLISTISCHE SILBENTYPEN

Aus der experimentellen Deskription der Sprechbewegung dürfte bereits deutlich geworden sein, daß die "Silbe" als motorisch-phonetische Grundeinheit mittels der ballistischen Muskelgruppen von Brust und Artikulation, die stellvertretend füreinander stehen, limitiert werden kann. Da der Silbenpuls als Bewegungseinheit definiert ist, die beim Sprechen durch die Stimmbänder hörbar gemacht wird, genügen aber für dessen Begrenzung prinzipiell die Brustmuskeln. Man könnte auch sagen, daß der Silbenpuls, der selbst eine ballistische Überformung der Ausatmungsbewegung darstellt, bereits durch Freigabe und Arretierung der Rippenmuskeln konstituiert ist, durch die akzessorische Artikulationsbewegung aber seinerseits überformt werden kann (vgl. Kap. III.4). Aus diesem kompensatorischen Verhältnis der Brust- und Artikulationsmuskeln ergibt sich, daß jede Silbe invariabel aus einem freigebenden, ausformenden und arretierenden Moment bestehen muß (Jakobson & Halle 1956, 21). Dabei kommen

42

BALLISTISCHE SILBENTYPEN

für den freigebenden Faktor Rippenmuskeln und Konsonantbewegung, für den ausformenden Faktor das Muskelsystem der Mund-Rachen-Höhle und für den arretierenden Faktor wiederum Brustmuskeln und Konsonantbewegung in Frage. Ihnen entsprechen bei unerläßlichem Vokalanteil (V) vier Silbentypen, die in der systematischen Reihenfolge fundierend-fundierter Bedingungen definiert sind, nämlich OVO = durch durch CVO = durch durch OVC = durch durch CVC = durch durch

Brustmuskeln freigegeben und Brustmuskeln arretiert ("oh", "1"); Konsonant freigegeben und Brustmuskeln arretiert ("beau"); Brustmuskeln freigegeben und Konsonant arretiert ("ope"); Konsonant freigegeben und konsonant arretiert ("pope")

(Stetson 1951, 2-3, 50ff). Dabei kann an die Stelle des Vokals in der Silbenmitte auch ein kontinuierlicher Konsonant (Kontinuent) treten, vorausgesetzt daß ein Brustpuls vorhanden ist (op. cit., 34). Teilt man die Silben verschiedener Weltsprachen nach diesen drei Silben-Faktoren der Freigabe, Ausformung und Arretierung ein, so ergibt sich ein endliches Kategorien-Schema, da keine Sprache über mehr als 5-20 Vokale und 10-50 Konsonanten verfügt (op. cit., 58). Danach kann für jede Silbe ermittelt werden, zu welcher Klasse der Freigabe (Brust, Konsonant) und Arretierung (Brust, Konsonant) und zu welcher Vokalklasse (Vokal, Kontinuent) sie gehört. Mithin wird sie durch insgesamt drei (weiter spezifizierbare) Klassenangaben im Sinne obiger Silbentypen ausreichend definiert. Ähnlich jedoch wie das oben besprochene Übersichtsschema der Verwandtschaftsbeziehungen (kinship terminology) nur der feldüberdeckende Raster zur Ermittlung universeller Kategorien ist (vgl. S.18), kann auch das organismisch fundierte Einteilungsprinzip der drei Silben-Faktoren nur die methodische Voraussetzung zur systematischen Ausgrenzung universeller Silbentypen sein, sie aber nicht selbst schon beinhalten. Darum ist es erforderlich, obige vier Silbentypen noch einmal auf ihre universelle Bedeutung hin zu untersuchen. Beginnt man mit dem "fundierenden" Silbentyp OVO, der mit dem unerläßlichen Vokalanteil (vgl. Jakobson & Halle 1956, 21) und beidseitiger Brustmuskel-Begrenzung gleichsam das funktionale Minimum der Silbe darstellt, so muß ihm schon deswegen universelle Bedeutung zukommen, weil er für alle weiteren Silbentypen vorausgesetzt werden muß. Da man jedoch gemeinhin nur mit einer Silbendefinition auf akustisch-phonemischer Ebene zu tun hat, die von dem energetischen Kontrast zwischen optimalem Konsonant und optimalem Vokal ausgeht (op. cit., 37), wird

BALLISTISCHE SILBENTYPEN

43

dieser "fundierende" Silbentyp meist gar nicht als solcher erkannt und deswegen auch nicht berücksichtigt. Wenn Lehrer und Vortragende sogenannte 'isolierte Laute' von sich geben, sprechen sie in Wirklichkeit Silben aus; die Vokale und gelegentlich Liquide und Nasale konstituieren eigene Silben wie in 'oh, a, 1, rr..., 11...'; lang ausgedehnte Frikative wie 'sss...' etc., werden zum Vokalersatz, die übrigen Konsonanten werden entweder mit kurzem Vokal, der den Konsonant freigibt — wie in 'buh, puh' — oder in arretierender Position — wie in 'eff, ess' — ausgesprochen. Hinter die Silbe als kleinste Einheit der Äußerung kann demnach nicht zurückgegangen werden (Stetson 1951, 27).

Erst nach diesem fundierenden Silbentyp kann dann entschieden werden, wieweit den übrigen Silbentypen universelle Bedeutung zukommt. Da sie in jedem Fall eine vokalische und konsonantische Komponente enthalten, läßt sich hier das Prinzip des energetischen Kontrastes übernehmen. Dieweil der optimale Konsonant (EnergieMinimum) zugleich das Silben-Gefälle (slope phoneme), der optimale Vokal (EnergieMaximum) aber den Silben-Gipfel (crest phoneme) darstellt, entspricht dieser Kontrast nicht nur dem energetischen Gleichgewicht der Silbe (Jakobson & Halle 1956, 37, 21), sondern läßt sich auch als Ausgrenzungskriterium für die Typen-Alternative CVO vs. OVC verwenden: "Since many languages lack syllables without a prevocalic consonant and/or with a postvocalic consonant, CV (Consonant + Vowel) is the only universal model of the syllable" (op. cit., 37). Zu dieser einzigen, aber OVO implizierenden Silben-Universalie der vier Silbentypen ist jedoch zu bemerken, daß die übliche Notierung CV dem Silbenpuls insofern nicht gerecht wird, als dabei die freigebende und arretierende Funktion der Brustmuskeln unberücksichtigt bleibt, so daß man besser CVO schreiben sollte, wie es der Registrierung durch Kymograph, Oszillograph und "Visible Speech" entspricht (Stetson 1951, 40). Zu beachten ist auch, daß in der Notierung Stetsons konsonantische Konstriktion und vokalische Ausformung in einem einzigen Symbol (C, V) dargestellt werden, um der rhythmischen Alternation molekularer Puls- und Rückstöße Ausdruck zu verleihen, die auf artikulatorischer Ebene eine molare Umkehrbewegung von Kinn, Lippen und Zunge implizieren. Die Silbeneinteilung gelingt also nur, wenn die wirklich limitierenden Konsonanten erkannt werden, die den Brustpuls entweder freigeben oder arretieren, hat aber nichts mit dem Umstand zu tun, daß in einigen Sprachen nirgends auch nur zwei Konsonanten oder Vokale beieinanderstehen dürfen, während andere Sprachen durch Häufungen von Konsonanten oder Vokalen geradezu charakterisierbar sind (vgl. Sapir 1961, 56), da es auf motorisch-phonetischer Ebene nur auf die wellenförmigen Druckunterschiede der Brust- und Artikulationsbewegung ankommt (vgl. Abb. 9), denen auf phonemischer Ebene der (umgekehrte) Kurvenverlauf von energetischem Silben-Gefälle (C) und Silben-Gipfel (V) entspricht (Jakobson & Halle 1956, 21). — Besagen kann die formale Notierung auch nichts darüber, welche Konsonanten sich innerhalb eines bestimmten Phonemsysstems am besten eignen, die Silbe am Beginn oder Ende zu limitieren, da sie wegen

44

BALLISTISCHE SILBENTYPEN

ihres universellen Charakters gerade von solchen Besonderheiten abstrahieren muß (vgl. Miller 1951, 797). Exemplarisch sei noch angefügt, daß die weitaus vorherrschende Silbenform in Englisch (und Deutsch) die Sequenz CVC ist, was sowohl beim einfachsten Wortschatz von 300 Wörtern bei Taubstummen (Groff 1934) wie auch bei den am häufigsten gebrauchten 500, 1000 und 2000 Wörtern dieser Sprache nachgewiesen werden kann (Thorndike 1931). Ungefähr 70% aller Silben werden sowohl konsonantisch freigegeben wie arretiert, 80% werden hingegen konsonantisch arretiert (OVC, CVC). Mithin überwiegt die Silbe, die durch einen Konsonant abgeschlossen wird, in der englischen Sprache bei weitem (Stetson 1951, 58). Bei spezifizierter Notierung gehören von allen erfaßten Silben zu der Sequenz CVC 33.5%, CV 21.8%, VC 20.3%, V 9.7%, CVCC 7.8%, CCVC 2.8%, VCC 2.8%, CCV 0.8%, CCVCC 0.5% (French et al. 1930).

V

1. KEHLKOPF- UND MUNDVERSCHLUß IN PHYLOGENETISCHER SICHT

Wenn oben die Rede davon war, daß ein Patient mit Kehlkopfschnitt (Laryngotomie) durch adäquate Druckanpassung der Artikulationsorgane mittels eines künstlichen Kehlkopfs wieder zu sprechen vermag (vgl. S.29), daß also die Lautbildung des Kehlkopfs relativ passiv gegenüber der Artikulationsbewegung der Mund-RachenHöhle ist, so sollte dies nur die fundierende Bedeutung der Atmung bzw. die kompensatorisch-antagonistische Arbeitsweise der Brust- und Artikulationsmuskeln innerhalb der Fundierungs-Hierarchie von Atmung, Lautbildung und Artikulation veranschaulichen (vgl. Kap. III.4. u. IV.l.). An dieser Stelle muß jedoch spezifiziert werden, daß nicht nur ein Funktionszusammenhang zwischen Brust- und Artikulationsmuskeln, sondern auch zwischen Kehlkopf- und Artikulationsmuskeln besteht, da sich letztere antagonistisch oder kooperativ an der Öffnung, Ausformung und Schließung des Stimmkanals beteiligen können. Die Sprechbewegung läßt sich demnach auch als "Auseinandersetzung" zwischen den eigentlichen Sprechwerkzeugen des Ansatzrohrs, nämlich Mund und Kehlkopf ansehen, die gemeinsam vom fundierenden Atemdruck abhängig bleiben (Rossi 1958, 43). Betätigen sich doch bei jedem Silbenpuls die Kaumuskeln und Kehlkopfsenker im rhythmischen Wechsel von konsonantischer Verengung und vokalischer Erweiterung, wobei jeder Konsonant mit der (molaren) Schließung des Mundes und jeder Vokal mit der (molaren) Öffnung des Mundes ein (molekulares) Anspannen der Kaumuskeln voraussetzt (op. cit., 35, 43). Sprechen kann in diesem Sinne — im Unterschied zum tierischen oder kindlichen Schreien — als regelmäßiger Wechsel zwischen Konsonant- und Vokalbewegung, d.h. als Atemabschließen mit dem Mund (C) und dem Kehlkopf (V) verstanden werden (op. cit., 34). Dabei kommt dem Kehlkopf insofern eine vermittelnde Rolle zu, als er das eigentliche Organ der "Ab-stimmung" zwischen Binnen- und Außendruck darstellt, dieweil die Stimmlippen eine dem Trommelfell vergleichbare Membran bilden, die das Druckgefälle nicht nur manometerartig registrieren, sondern durch entsprechende Luftregulation rückwirkend auch die Atmung kontrollieren (op. cit., 17). Atem-

46

KEHLKOPF- UND MUNDVERSCHLUSS IN PHYLOGENTISCHER SICHT

druck und Atemabschluß sind also aufeinander "abgestimmt", weil die Rumpfmuskeln keinen stärkeren Atemdruck entfalten dürfen, als die Stimmlippen in Ton verwandeln können wie auch umgekehrt die Stimmlippen auf einen ausreichenden Atemdruck angewiesen sind (Rossi 1962, 27). Im Unterschied zur animalischen Lautgebung, bei der wegen undichter Stimmritze verhältnismäßig viel "wilde Luft" entweicht, ist also der menschliche Kehlkopf imstande, den Atemdruck so ökonomisch zu regulieren, daß er restlos in Tonschwingungen umgesetzt werden kann. Bei geringem Atemdruck werden die Stimmlippen vom Ring-Schildknorpel-Muskel (M. cricothyreoideus) durch Entfernung ihrer Ansatzstellen am Ring- und Schildknorpel nur wenig gespannt, es schwingen dann nur die inneren, zarten Ränder der Stimmlippen. Bei stärkerem Atemdruck spannen sich außer dem Ring-Schildknorpel-Muskel auch die in die Stimmlippen selbst eingelagerten Stimmuskeln (M. vocalis), sie betätigen sich dann als Antagonisten des Ring-Schildknorpel-Muskels und bringen die Stimmlippen in ihrer ganzen Breite und Masse in Schwingung. Im ersten Fall entsteht ein leiser, sanfter Ton, man nennt ihn 'Kopfton' oder 'Kopfregister', weil dabei nur die Luft oberhalb der Stimmritze, also im 'Kopf deutlich hörbar mitschwingt, im zweiten Fall kommt ein kräftiger, muskulöser bis metallischer Klang zustande, den man 'Brustton', 'Bruststimme' oder 'Brustregister' nennt, weil dabei die Luft unterhalb der Stimmritze und im Brustraum mitschwingt. — In beiden Fällen wie auch in der Verbindung von Kopf- und Bruststimme zur Mischstimme (voix mixte) kann der Atemdruck, wie gesagt, restlos, d.h. ohne Überdruck und 'wilde Luft' in Ton umgesetzt werden (op. cit., 29).

Die Abschlußfahigkeit des Kehlkopfes wird allerdings nicht nur durch die Dichte der Stimmritze, sondern auch durch die Stärke der beteiligten Muskeln bestimmt, zunächst also der Kehlkopfsenker, die den Kehlkopf gegenüber dem aufwärts gerichteten Atemdruck tief zu halten haben (Rossi 1958, 18). Sie sind jedoch dem vollen Atemdruck der Rumpfmuskeln nur dadurch gewachsen, daß sie durch die Mundboden-Muskeln (obere Zungenbein-Muskeln) unterstützt werden, die den mit dem Zungenbein verbundenen Kehlkopf vom Unterkiefer her anheben und halten, wobei letzterer seinerseits durch die am Schädel ansetzenden Kaumuskeln angehoben und gehalten wird. Daher sind es eigentlich die Kaumuskeln, die ein aktives Standhalten der Kehlkopfsenker gegenüber einem gesteigerten Atemdruck vermitteln (op. cit., 18; vgl. Abb. 13). Es ist nun von einiger Bedeutung, daß sich beide Ausführungsbestimmungen zur Gewährleistung einer ausreichenden Luftdrosselung, nämlich die Dichte der Stimmritze und die Tiefstellung des Kehlkopfs insofern als phylogenetische EntwicklungsKriterien verwenden lassen, als sie einen direkten Bezug zur menschlichen Evolution zeigen, d.h. unmittelbar in die proximalen Eigenschaften des Sprechapparates überführbar sind (vgl. S.18). Gibt es doch schon im Tierreich zwei gleichberechtigte, einander ergänzende Entwicklungstendenzen, die auf zunehmend bessere Luftdrosselung angelegt sind: "Erstens die von Nemai entdeckte, zunehmende Abdichtung der Stimmritze, und zweitens die besonders von Schilling studierte zunehmende

KEHLKOPF- UND MUNDVERSCHLUSS IN PHYLOGENETISCHER

SICHT

47

I

I

I

ABB. 13. Die vom Schädel über den Unterkiefer zum Rumpfskelett ziehenden, den Kehlkopf heltenden Muskeln. I. Kaumuskeln 1. M. temporalis; 2. M. masseter 3. M. pterygoideus II. Obere Zungenbein-Muskeln 4. M. geniohyoideus und M. mylohyoideus; 5. M. biventer mand III. Kehlkopfsender 6. M. sternohyoideus; 7. M. sternothyreoideus; 8. M. omohyoideus (Nach Rossi 1962.)

Tieferstellung des Kehlkopfes" (Rossi 1962, 36; Némai 1920; Schilling 1937; 1940; Zenker & Zenker 1960). Zur allmählichen Schließung der Knorpellücke in der phylogenetischen Entwicklung bemerkt Rossi : Bei den Kloaken- und Beuteltieren, den beiden untersten Klassen der Säugetiere, besteht die Stimmritze fast zur Gänze aus verknorpelten Rändern, die nur dem Schutz der Luftröhre vor dem Eindringen von Fremdkörpern dienen. Die Stimmritze ist daher noch sehr undicht, die Stimmlippen sind als ganz kurze Schleimhautfalten nur angedeutet. Beim Erdferkel oder Ameisenschwein (Orycteropus capensis), einem schon etwas höher organisierten Tubulidentaten, ist die knorpelige Lücke noch immer doppelt so lang wie die Bänderglottis. Erst bei den Nagern, den Raubtieren und Huftieren wird die Lücke immer kleiner und die eigentliche Stimmritze immer länger. So fällt beim Pferd auf die Knorpellücke nur ein Viertel, beim Hirsch nur mehr ein Fünftel der ganzen Stimmritze und beim Schwein noch etwas weniger. Aber erst bei den Schmalnasenaffen ist die Lücke fast verschwunden und insbesondere beim Schimpansen kaum mehr zu erkennen (Rossi 1962, 28). Bei keinem der Säugetiere findet sich jedoch "jenes Zusammengehen der knorpeligen und ligamentösen Teile zu gleichmäßig gezogenen Stimmlippen" wie beim Menschen,

48

KEHLKOPF- UND MUNDVERSCHLUSS IN PHYLOGENETISCHER SICHT

weil das Tier die volle Kraft der Schließmuskeln aufwenden muß, um die Glottislücke möglichst eng zu halten" (Nemai 1913). Ähnlich führt Rossi über die allmähliche Senkung des Kehlkopfes aus: Ursprünglich, bei den nieder organisierten Säugern steht der Kehlkopf so hoch an die Choanen angedrängt, daß Atem und Stimme nur durch die Nase entweichen und die Nahrung nur seitlich am Kehlkopf vorbei in die Speiseröhre gelangen kann. Ein Pferd z.B. bekommt daher durch das Maul keine Luft, es muß ersticken, wenn man ihm die Nase zuhält. Die Huftiere und ebenso die Nager schreien daher nur durch die Nase. ... Erst bei den Fleischfressern und auch schon bei den Schweinen entsteht eine Verbindung zwischen Kehlkopfausgang und Mundraum.... Bei den katzenartigen Raubtieren steht der Kehlkopf dauernd noch etwas tiefer und bei den Affen schon so tief, daß er insbesondere bei den Schmalnasenaffen — mit Ausnahme des Orang Utan — nicht mehr über der Zunge zu sehen ist. Nasenrachen- und Mundraum stehen da bereits dauernd miteinander in Verbindung (Rossi 1958, 19). Zusammenfassend fügt er hinzu: Es bestehen also schon im Tierreich zwei gleichsinnige Entwicklungstendenzen: Ein fortschreitendes Abdichten der Stimmritze und ein Absenken des Kehlkopfes gegenüber dem Atemdruck.... Beides ist beim Menschen am weitesten vorgeschritten (op. cit., 19).

Darüberhinaus besteht ein Zusammenhang zwischen Aufrichtung und Stimmentwicklung, weil die gleichen Muskeln zur Erzeugung des stimmlichen Ausdrucks und zur Stützung der Unterleibsorgane bei aufrechter Haltung verwendet werden (vgl. S.23). Nach Versuchen Brittons besitzt kein einziges Säugetier den für den aufrechten Gang erforderlichen Blutdruck: Hasen werden bereits nach 5 Minuten wegen Blutleere im Gehirn ohnmächtig, Hunde und Affen haben nach einer halben Stunde 20 bis 40 % ihres arteriellen Blutdrucks verloren, wenn man sie in gestreckter Haltung festhält. Das fehlende Gegengewicht des Kehlkopfdrucks gegenüber den Atemstößen der Rumpfmuskeln ist also nur der prägnanteste Ausdruck einer allgemeinen Schwäche, sich in der Vertikale behaupten zu können (op. cit., 21). Dieser Mangel wird noch offensichtlicher, wenn man bedenkt, daß das spezifisch menschliche Abschließungsorgan nicht der Kehlkopf, sondern der Mund ist, wie besonders aus einem anatomischen Vergleich von Lippen- und Mundform bei Gorilla, Schimpanse und Mensch hervorgeht (vgl. S.24). Während der Kehlkopfverschluß alsbald "gesprengt" werden muß, um durch einen entsprechenden "Schrei" die Notwendigkeit zur Öffnung des Luftweges anzuzeigen, kann der Mund beliebig lange, beliebig fest und — was für die Konsonantbildung besonders wichtig ist — durch beliebig einsetzbare Verschlußmittel (Lippen, Zähne, Zunge, Gaumen, Gaumensegel) abgeriegelt werden, sofern nur der Atemweg durch die Nase intakt ist. Erst der Mund ist also der eigentliche Widerpart der Rumpfmuskeln, da er — im Unterschied zum Kehlkopf — sehr wohl einem vollen Druck der Bauchdecke standhalten kann (op. cit., 32-33; vgl. Kap. IV.l.). Rossi nimmt denn auch drei Stadien der phylogenetischen Stimmentwicklung an, die im Endeffekt den funktionalen Primat der Mundhöhle gegenüber den weniger

KEHLKOPF- UND MUNDVERSCHLUSS IN PHYLOGENETISCHER SICHT

49

willkürlichen Organteilen des Sprechapparates begründen, und unterscheidet dementsprechend erstens das Abschliessen... mit dem Kehlkopf, wobei Atem- und Speiseweg noch völlig getrennt voneinander sind, zweitens die Beteiligung des Mundes an der Stimme, zunächst aber nur mit einem Öffnen und einem Verbinden des Atem- und des Speisewegs im Nasenrachenraum, und drittens erst das Schließen des Mundes zur Beherrschung des Schreiens mit einem noch festeren Abschließen..., als es mit dem Kehlkopf allein noch möglich ist (op. cit. 33). Die animalische Ton- und Lautgebung kann darum bestenfalls "prävokalisch" sein und findet ihren Ausdruck in einem charakteristischen Ungleichgewicht von Schrei(Brüllen, Bellen, Blöken, Quietschen, Fippen, Piepsen) und Klagelauten (Heulen, Stöhnen, Winseln), bei der es zu keiner Einbeziehung des körpereigenen Widerstandes — im Sinne beliebig einsetzbarer Verschlußmittel — kommt. Selbst die dem "homo sapiens" am nächsten stehenden Primaten (Schimpansen) bringen es nur zu konsonantenähnlichen Lauten, "die sich wie p, f, k, g, ch und ts anhören; sie entstehen aber nicht durch ein Abschließen der Ausatmung, sondern der Einatmung. Es sind Saug-, Schluck- und Schmatzlaute", deren Unterscheidung von bloßen Nahrungslauten nicht immer ganz einfach ist. Ähnliches gilt auch für die vorkommenden Kombinationen aus Kehlkopflauten. "Dem Tier fehlt also das Kennzeichen der menschlichen Sprache: Der echte, durch Abschluß der Ausatmung entstehende Konsonant als Beherrschung der laryngalen Tongebung mit dem Mund" (op. cit., 33; vgl. dazu die Funktion des Konsonanten im Silbenpuls: S.41). Das schwingende Gleichgewicht von Atemdruck und Atemabschluß wird im Tierreich auch beim sog. "Singen" nicht erreicht. Wo dies — wie bei einigen Singvögeln — doch der Fall zu sein scheint, geschieht es nicht durch Vermittlung des Kehlkopfes, sondern der Syrinx, die in der Luftröhre an der Einmündung der beiden Bronchien, d.h. wesentlich tiefer als der Kehlkopf liegt. Die durch letzteren bedingten Schwierigkeiten der Tongebung kommen darum gar nicht erst auf, zumal bei den Vögeln mit dem Fehlen des Zwerchfells auch die Voraussetzung zur antagonistischen Rumpfatmung und der damit verbundenen Stützung der Unterleibsorgane entfällt (op. cit., 24). Im Unterschied dazu erfordert zwar die menschliche Singstimme keinen konsonantischen Abschluß, ist aber in hohem Maße auf die Kontrolle des Kehlkopfstandes angewiesen. Man könnte auch sagen, daß der Kehlkopf dem Mund "untergeordnet" werden muß, weil bei seinem Entgleiten nach oben die Beherrschung der Stimme verlorengeht. Da hohe und tiefe Töne durch ein entsprechendes Auf- und Abgehen des Kehlkopfes indiziert werden, ist dies vor allem bei hohen Tönen der Fall, wenn dem Atemdruck nicht durch adäquate Kehlkopfsenkung begegnet wird, die ein "Umkippen" der Stimme verhütet. Will der Sänger die Enge ... beim Singen hoher Töne überwinden, so muß er den Kehlkopf, wie gesagt, tief stellen, ... und das gelingt ihm anfangs nur in einem deutlich fühlbaren Ringen zwischen Mund und Kehlkopf, Kaumuskeln und Kehlkopfsenkern, bis ein Stand-

50

KEHLKOPF- U N D MUNDVERSCHLUSS IN PHYLOGENETISCHER SICHT

halten des Kehlkopfs gegenüber dem Atemdruck erreicht ist. Erst dann wird eine Stimmbeherrschung und eine deutliche Artikulation in hoben Tonlagen möglich (op. cit., 40: Abb. 14).

ABB. 14. Extreme Tiefstellung des Kehlkopfs beim Singen als Ausdruck einer beherrschten Atemführung. (Nach Rossi 1962.)

2. V O K A L - U N D K O N S O N A N T B I L D U N G I N O N T O G E N E T I S C H E R

SICHT

Analog zu dieser phylogenetischen Betrachtung zeigt sich auch in ontogenetischer Sicht, daß die Hauptschwierigkeit der frühkindlichen Lautbildung in der Beherrschung des Atemdruckes liegt. Da der Kehlkopf bis zum fünften Lebensmonat noch so hoch steht, daß der Kehldeckel in der Höhe des Gaumensegelzäpfchens (Uvula) erscheint, deswegen aber von den Mundboden-Muskeln — als Antagonisten der Kehlkopfsenker — nicht genügend gehoben werden kann, fehlt ihm die Stabilität des Muskelspannsystems, das für den Erwachsenen so charakteristisch ist. Denn die Kehlkopfsenker vermögen dem Atemdruck wegen des fehlenden Gegenzugs der Mundboden-Muskeln noch nicht aktiv standzuhalten, "sondern werden passiv gedehnt, der Kehlkopf steigt auf, es werden dann auch die Stimmlippen überlastet, und es entsteht, was wir als 'Schreien' hören: Ein Versagen des Kehlkopfes gegenüber dem Atemdruck" (Rossi 1958, 18-19; 38-39; vgl. Abb. 15). Kleinkinder können also schon aus physiologischen Gründen weder sprechen noch singen, sondern nur "schreien" (bzw. "gurren"), da der Kehlkopf sich erst nach einem halben Lebensjahr zu senken beginnt, die für den Erwachsenen charakteristische Tiefstellung

VOKAL- U N D KONSONANTBILDUNG IN ONTOGENETISCHER SICHT

51

aber nicht vor dem siebten Lebensjahr erreicht (Braus 1956; Luchsinger & Arnold 1949; vgl. Abb. 16a, b). Ontogenetisch muß also das Schreien als Urform der menschlichen Vokalisation angesehen werden. Es teilt — aus den oben angegebenen Gründen — mit dem animalischen Schreien die Natur des "Prävokalischen". Wie eine Spektrogrammanalyse zeigt, weist es neben dem Öffnen und Schließen des Mundes noch keinerlei "kontrollierte" Artikulation auf: was an Modulation erreicht wird, geht auf laryngale Veränderungen bzw. subglottale Druckunterschiede zurück (Lenneberg 1967,276). — Im Unterschied dazu sind die — in der sechsten bis achten Lebenswoche erstmals

ABB. 16 a. Die Kehlkopfstellung beim Neugeborenen (oberer Rand des Kehldeckels in Höhe des 1. und 2. Halswirbels). Kd = Kehldeckel, oberer Rand; Zb = Zungenbein; Schk = Schildknorpel; Rk = Ringknorpel. (Nach Rossi 1962.)

52

VOKAL- U N D KONSONANTBILDUNG IN ONTOGENETISCHER SICHT

ABB. 16 b. Die Kehlkopfstellung beim Erwachsenen in Ruhelage (oberer Rand des Kehldeckels in Höhe des 3. Halswirbels). (Nach Rossi 1962.)

einsetzenden — "Gurrlaute" (cooing), bereits vokal-gleich, wenn auch noch nicht vokalisch im Sinne einer bestimmten Weltsprache. Den späteren Sprechlauten können sie weder motorisch noch akustisch gleichgesetzt werden, da die Artikulationsorgane noch in unkoordinierter, d.h. unkontrollierter Weise betätigt werden. Erst im Alter von sechs Lebensmonaten ist die Ton-und Lautgebung so weit gediehen, daß sich vokalische und konsonantische Komponenten einwandfrei unterscheiden lassen (op. cit., 277-278). Wie der hohe Kehlkopfstand erkennen läßt, kann also beim Kleinkind weder von einer Beherrschung der laryngalen Lautbildung noch einer entsprechenden "Unterordnung" des Kehlkopfs unter den Mund die Rede sein (vgl. S.49). Deswegen läßt sich bei ihm — analog zur phylogenetischen Entwicklung — neben seinem Verbleib im "Prävokalischen" (Schreien, Gurren) auch die mangelhafte Einbeziehung des körpereigenen Widerstandes — im Sinne beliebig einsetzbarer Verschlußmittel — feststellen (vgl. S.48). Die ersten artikulatorischen Äußerungen haben deswegen noch nicht den Charakter der aktiven Silbenpuls-Begrenzung (Konsonantbewegung), sondern der mehr passiven, an das Lautmedium angepaßten Ausformung (Vokal). Diesbezügliche Beobachtungen reichen bis zu Taine (1876) zurück und wurden ohne größere Unterbrechungen bis in die Neuzeit gemacht (McCarthy 1963, 506; vgl. Kap. IV. 1.). Dabei muß man sich die allmähliche Überformung der laryngalen Lautgebung durch die artikulatorische Vokal- und Konsonantbewegung in einen ziemlich kon-

VOKAL- UND KONSONANTBILDUNG IN ONTOGENETISCHER SICHT

53

stanten, d.h. kulturunabhängigen Bezugsrahmen ontogenetischer Entwicklung eingebettet denken. Während der ersten Lebensmonate, wo das Kind noch gesäugt wird und die meiste Zeit in Rücken- und Bauchlage verbringt, überwiegen die Vokale. Die von Zungen- und Lippenbewegung einerseits und Zahnbildung andererseits abhängige Konsonantbildung entwickelt sich erst im zweiten und dritten Lebensjahr. Zu lallen beginnt das Kind erst, wenn es sitzen kann, da diese Lageveränderung entscheidenden Einfluß auf die Mundhöhlenform (Gaumenpartie) hat. Regelrechtes Sprechen kann überhaupt erst einsetzen, wenn die körperlichen Voraussetzungen dazu — wie Atmung, aufrechte Haltung, Zahnbildung, Nahrungsverarbeitung — erfüllt sind. Hierbei scheint die Entwicklung der Sprechmuskulatur in groben Zügen einer neurologischen Reifung zu entsprechen, die von den niederen zu den höheren Nervenzentren fortschreitet (op. cit., 513, 514; vgl. S.23). Besonders eindrucksvoll sind in diesem Zusammenhang die phonetischen Studien, die von Irwin und Mitarbeitern unternommen wurden. Sie legten den Sprechproben anstelle der starren Zeiteinheit die rhythmische Atemeinheit zugrunde (Irwin & Curry 1941) und erreichten durch gründliche Schulung in phonetischer Niederschrift eine hohe Reliabilität der Datenerhebung (Irwin 1941 a, b; Irwin & Chen 1941; Irwin 1945). Zur Protokollierung für die innerhalb von 30 Atemeinheiten geäußerten Laute benutzten sie das Internationale Phonetische Alphabet. Als Maße wurden verwandt: die Frequenzen der Vokal- und Konsonant-Phoneme, die Vokal- und Konsonant-Typen, die Proportionen der Vokal- und Konsonant-Frequenzen, die Proportionen von Typen und Frequenzen sowie zwei Indizes für den Unterschied zwischen Anzahl und Prozentsatz der Phoneme in der Kindes- und Erwachsenensprache (vgl. McCarthy 1963, 509). Die wesentlichen Resultate dieser Untersuchungsreihe können wie folgt zusammengefaßt werden : 1. In den ersten dreißig Monaten der Kindheit ist die Häufigkeit der Vokale größer als die der Konsonanten. 2. Bis zum 2. Lebensjahr ist ein ständiges Anwachsen der Vokal-Frequenz feststellbar, das nach dem 2. Lebensjahr beim Beginn regelrechten Sprechens noch steiler ansteigt als vorher. 3. In der frühen Kindheit kommen Vokale etwa 5 mal so häufig wie Konsonanten vor, wobei ca. 50% der Konsonanten aus vokal-verwandten h-Lauten bestehen (Irwin & Curry 1941). 4. Erst im Alter von 2 \ Jahren sind die Konsonanten ebenso häufig wie die Vokale. 5. In den ersten beiden Lebensmonaten benutzen Kinder im Durchschnitt 4.5 verschiedene Vokal- und nur 2.7 verschiedene Konsonant-Typen. 6. Während des ersten Lebensjahres übertrifft die Zahl der Vokal-Typen die der Konsonant-Typen. Beim Auftauchen der ersten Wörter überschneiden sich jedoch die Kurven für Vokalund Konsonant-Typen, so daß die Anzahl der letzteren die der ersteren in allen folgenden Altersphasen übertrifft. 7. Im Alter von Jahren benutzt das Kind praktisch alle Vokal-Typen, aber nur 2/3 ( = 16) der Konsonant-Typen des Erwachsenen (Irwin & Chen 1946; Chen & Irwin 1946). 8. Teilt man die Konsonanten nach ihrem Artikulationsort ein, so überwiegen zunächst die in der hinteren Mundhöhle gebildeten Konsonanten ( = 87%). Zusammen mit den Hintergaumenlauten machen

54

VOKAL- UND KONSONANTBILDUNG IN ONTOGENETISCHER SICHT

sie 97 % der wenigen in der frühen Kindheit gebrauchten Konsonanten aus. In dem Maße jedoch, wie die Konsonantbildung von den vorderen Teilen der Mundhöhle übernommen wird (Labiale, Dentale), fallen sie bis zum 30. Lebensmonat auf 8 % zurück. 9. Teilt man auch die Vokale nach ihrem Entstehungsort ein, so ergibt sich das umgekehrte Bild, daß Frontal-Vokale von 72% zu 47% abnehmen und Hinter-Vokale bis zum Alter von 2\ Jahren von 2.3% bis 37% zunehmen (vgl. McCarthy 1963, 509). Wenn auch diese phonetische Registrierung noch nicht zwischen prävokalischer und vokalischer Lautbildung unterscheidet (S.52; vgl. Punkt 5 obiger Zusammenfassung), kann den Untersuchungsbefunden doch entnommen werden, daß es sich bei der frühkindlichen Sprechbewegung zunächst um eine laryngale Vokalisation handelt, die nur allmählich von den Artikulationsorganen überformt wird. Dementsprechend werden die beliebig einsetzbaren Verschlußmittel der Konsonantbewegung erst nach und nach entdeckt und zwar in einem charakteristischen Fortschreiten von der Rachen- zur Mundhöhle, d.h. von mehr laryngaler zu mehr oraler Abschlußtendenz, die sich auch innerhalb der Mundhöhle von den hinteren zu den vorderen Partien verlagert.

VI

1. VOKALBILDUNG IM ANSATZROHR Nachdem die Fundierungs-Hierarchie von Atmung, Lautbildung und Artikulation in ihren funktionalen Zusammenhängen dargestellt wurde, kann nun etwas näher auf die morphographischen Bedingungen des Ansatzrohres eingegangen werden, das als eigentlicher "Klangkörper" der Vokalisation anzusehen ist. Während nämlich der Brustkorb in der rhythmischen Alternation eines Blasebalges mit offener Düse (Stimmritze, Mundöffnung) für die Luftzufuhr sorgt, moduliert das Ansatzrohr die im Kehlkopf gebildeten Laute in der rhythmischen Umkehrbewegung vokalischer Erweiterung und konsonantischer Verengung. Im einzelnen ist diese akustische Modulationsfähigkeit jedoch durch die morphographische Ausformung dieses Organs bedingt, die als Veränderung der Mundöffnung (Backen- und Lippenmuskeln), Beweglichkeit des Mundbodens (Unterkiefer) und Wechsel der Zungenform charakterisiert werden kann (Musehold 1913, 40). Greift man den Vergleich mit dem Wind- und Pfeifenwerk der Orgel noch einmal auf (vgl. S.29), so entspricht das menschliche Resonanzrohr eher dem "Pfeifenwerk" als der Brustkorb dem "Windwerk". Schon Musehold hat darauf hingewiesen, daß es dieselben funktionalen Bestandteile wie die sog. "Zungenpfeife" besitzt (vgl. Abb. 17): Der Kehlkopf ist der Luftröhre gewissermaßen als Kopf aufgesetzt und bildet gleichzeitig die Eingangspforte zu den unteren Luftwegen: der Luftröhre und den Lungen. Die über ihm befindlichen oberen Luftwege: der Rachen, die Mund- und Nasenhöhle, dienen als Ansatzrohr. Wenn man diese Teile des Stimmorgans und ihre Anordnung mit den Flöten- und Zungenpfeifen vergleicht, so fällt schon äußerlich eine merkwürdige Übereinstimmung in der mechanischen Anordnung der einzelnen Teile mit der Zungenpfeife auf. Die letztere besteht aus einem mehr oder weniger langen Rohr — kürzer bei den aufschlagenden, länger bei den durchschlagenden Zungen — dem 'Stiefel S \ an dessen Kopfende sich der tonerzeugende Zungenmechanismus und darüber der Schallkörper K als Ansatzrohr befindet. Dieselbe Anordnung zeigt auffallend ähnlich auch der menschliche Stimmapparat: unten nächst dem Luftbalg, den Lungen, ein langes Rohr, die Luftröhre L, die an ihrem Kopfende den tonerzeugenden Mechanismus — den Kehlkopf mit den Stimmlippen St — trägt. Die über dem letzteren gelegenen Mund-, Nasen- und Rachenhöhle entsprechen dem

56

VOKALBILDUNG IM ANSATZROHR

veranschaulichen. (Nach Musehold 1913.)

Ansatzrohr K. Im Prinzip also haben die Zungenpfeife und das menschliche Stimmorgan dieselben Bestandteile mit gleicher mechanischer Bedeutung. Die letzteren zeigen aber durch die Vollkommenheit des menschlichen Stimmapparates bedingte sehr bemerkenswerte Unterschiede (op. cit., 37-38). Und zwar erklärt sich die größere Vollkommenheit des menschlichen Ansatzrohrs, das aus einer oberen (Nasenhöhle, Nasenrachenraum) und unteren Abteilung (Schlund- und Mundrachen, Mundhöhle) besteht, die durch eine Klappenvorrichtung (Gaumensegelzäpfchen g) voneinander abschließbar sind, vor allem aus dessen plastischer Beweglichkeit gegenüber der mechanischen Orgelpfeife. Bildet doch die Mundhöhle den wichtigsten Teil des Ansatzrohres und besitzt die hervorragende Eigenschaft, Form und Rauminhalt willkürlich und hochgradig verändern zu können. Nur ihre obere Begrenzung zur Nasenhöhle, d.h. der von den Zahnfortsätzen der Oberkiefer nach oben gewölbte Gaumen ist knöchern und unbeweglich, während der Mundboden und die seitlichen Wände sehr modulierbar sind. Dabei ermöglicht die dem Mundboden aufliegende Zunge wegen ihrer grossen Plastizität zusammen mit der Beweglichkeit von Mundboden, Mundöffnung (Backen-, Lippenmuskeln) und Unterkiefer eine vielfach abstufbare Veränderung der Mundhöhle nach Form und Volumen (op. cit., 40).

VOKALBILDUNG IM ANSATZROHR

57

Diese bereits von Willis (1830) erkannte Analogie zwischen Orgelpfeife und Ansatzrohr, wonach die akustischen Eigenschaften des letzteren vornehmlich durch dessen Länge, Durchmesser und Zungenfrequenz bedingt sind, kann also nicht mehr als eine relativ grobe Approximation sein. Dies gilt auch für die Helmholtzsche Vokaltheorie, in der das Ansatzrohr als akustisches Filter der vom Zungenaggregat (Stimmlippen) emittierten Luftimpulse beschrieben wird, die als sinoidale Teilschwingungen gemäß den Eigenresonanzen (Formantgebiete) des Ansatzrohres verstärkt oder gedämpft werden (Helmholtz 1870). Zu bedenken ist nämlich, daß die Gleichsetzung von Zungenaggregat (durchschwingende oder aufschlagende Zunge) und Glottis bzw. (kreiszylindrischem) Rohr und Ansatzrohr insofern hinkt, als bei dem mechanischen Modell eine viel stärkere Kopplung als beim Zusammenwirken von Phonation und Artikulation vorliegt. Ungeheuer führt deswegen — trotz neuerlicher Erwähnung dieser Parallelität (vgl. Bloch & Trager 1942, 12) — drei Gründe an, die für eine vom Phonationsorgan getrennte Untersuchung des Ansatzrohrs sprechen: 1. Selbst wenn die Kopplung der menschlichen Sprechwerkzeuge ebenso stark wäre wie bei der Zungenpfeife die Kopplung zwischen Zungenaggregat und Rohr, müßten die Filtereigenschaften des Ansatzrohres getrennt vom Phonationsorgan untersucht werden. 2. Die Luftimpulse entstehen an der Glottis in anderer Weise als bei der schwingenden Zunge, die gegenüber dem Zungenaggregat der Pfeife kleinen Dimensionen der Stimmlippen machen eine Rückwirkung des Ansatzrohres unwahrscheinlich. 3. Das Phonationsorgan ist cerebral gesteuert, und zwar unabhängig von der physikalischen Funktion des Ansatzrohres (Ungeheuer 1962, 37; vgl. Ranke & Lullies 1953, 206-207; v.d. Berg 1954; Flanagan 1958). Die Schwierigkeit einer geometrisch-mathematischen Approximation des menschlichen Ansatzrohres durch zylindrische (Willis) oder kugelförmige (Helmholtz) Hohlräume, die der plastischen Bewegungsweise dieses Organs kaum gerecht werden (vgl. S.56), läßt sich allerdings dadurch bei einfachen Tonhöhen-Experimenten umgehen, daß man die Mund-Rachen-Höhle selbst als "Pfeifenwerk" verwendet, wie dies bei der — durch die Nasenlöcher angeblasenen — sog. "Wunderflöte" der Fall ist, wo dem vergrößerten oder verkleinerten Rauminhalt ein tieferer oder höherer Ton entspricht, während bei gleichem Rauminhalt wiederum die erweiterte Mundöffnung gleichbedeutend mit einer Erhöhung und die verengte mit einer Senkung des Tones ist. Demnach kann die gesamte Variationsbreite menschlicher Tonhöhen-Modulierung auf die (rhythmisch alternierende) Veränderung von Mundhöhlen-Volumen und Mundöffnungsgröße zurückgeführt werden (Musehold 1913, 41). Während nämlich der kubische Inhalt des Mundhöhlen-Volumens (bei konstanter Mundöffnung) mit der relativen Höhe der Eigentöne übereinstimmt, kann den einzelnen (deutschen) Vokalen i, ü, e, u, o, ö, a, ä in aufsteigender Reihe ein je vergrößerter Rauminhalt zugeordnet werden (Merkel). Andererseits erfordern diese

58

VOKALBILDUNG IM ANSATZROHR

Vokale von i über e zu a eine diesbezügliche Verlängerung des vertikalen Mundöffnungs-Durchmessers, während die bei o beginnende Vorschiebung der Lippen den Querschnitt-Durchmesser verkürzt, der sich bei u weiter verkleinert. Daneben spielt die Länge des Ansatzrohres eine Rolle, das bei i am kürzesten ist und über e, a, o zu u allmählich verlängert wird. Maßgeblich sind auch die durch die Zungenstellung bedingten inneren Abmessungen der Mundhöhle beteiligt: Während die geringste Veränderung beim Vokal a festzustellen ist, wird die Zungenwurzel bei u nach hinten/oben gegen das etwas gehobene Gaumensegel heraufgezogen; bei i wird hingegen der Zungenrücken dem harten Gaumen so genähert, daß eine — nur durch einen schmalen Spalt verbundene — vordere und hintere Abteilung des Mundkanals entsteht. Die Stellungen für o und e entsprechen dabei dem Mittel zwischen a und u bzw. zwischen u und i (op. cit., 42). Die nach der Mundöffnungs-Größe geordneten Vokale, welche sich — mit der kleinsten Öffnung beginnend — in die aufsteigende Reihe u(l), o(2), i(3), e(4), a(5) bringen lassen, in der Reihe der kubischen Inhalte aber den Rangwert i(3), e(4), u(l), o(2), a(5) erhalten, können gemäß diesen beiden Varianten molarer Expansion und Kontraktion wie folgt beschrieben werden : Bei i zeigt sich das kleinste Volumen mit relativ großer Öffnung, so daß dieser Vokal den höchsten Eigenton besitzt. Dann folgt e mit etwas größerem Rauminhalt, aber auch größerer Öffnung, a steht mit größtem Volumen und größter Öffnung in der Mitte. Bei o ist der Rauminhalt gegen a nur wenig verändert, aber die Mundöffnung durch die Verschiebung der Lippen erheblich verkleinert. Der Eigenton der Mundhöhle muß also bei o tiefer sein als bei a und wird bei der u-Stellung noch tiefer, weil die Mundöffnung sehr verkleinert ist im Verhältnis zu einer nur geringen Änderung des Volumens. Demnach würden Vokale nach den Eigentönen der Mundhöhle, vom tiefsten angefangen, die Reihenfolge u, o, a, e, i haben (op. cit. 43).

Allerdings ist mit obiger Tonhöhen-Einstufung noch keine phonetische VokalKlassifikation gegeben, wie sie etwa in dem Beschreibungs-Instrument der API (Association Phonétique Internationale) vorliegt. Letztere wurde nicht abstrakt gewonnen, sondern von konkreten Daten (Röntgenbildern) abgeleitet, so daß die zweiparametrige Kennzeichnung (front-back, close-open) der artikulatorischen Verhältnisse der graphischen Darstellung unmittelbar entnommen werden kann. Die innerhalb dieses Vokalgerüsts unterscheidbaren (8) Kardinalvokale und (7) sekundären Kardinalvokale wurden von Delattre et al. (1948) in ein einziges Schema gebracht, in dem nur akustische Beschreibungsmerkmale (Formantfrequenzen) verwendet werden (Meyer-Eppler 1949; Potter et al. 1947; vgl. Ungeheuer 1962, 28-29). In Verbindung mit dieser röntgenographischen Darstellungsform hat sich die von Bell (1867) und Sweet (1877) eingeführte Unterscheidung horizontal/vertikaler Zungenbewegung durchgesetzt, deren horizontale Markierungspunkte als "back" (guttural), "mixed" und "front" (palatal) und deren vertikale Punkte als "high", "mid" und "low" zu kennzeichnen sind, woraus sich insgesamt 9 Kardinalstellen, nämlich

V O K A L B I L D U N G IM A N S A T Z R O H R

high-back mid-back low-back

high-mixed mid-mixed low-mixed

59

high-front mid-front low-front

ergeben. Diese artikulatorischen Positionsmarken von Bell und Sweet dienen auch als Ausgangsbasis für Br0ndals Grundschema der Vokal-Einteilung, wo durch mehrfache Kombination von B (back), F (front), H (high), L (low) insgesamt 16 Vokaltypen und 24 Vokalnuancen gewonnen werden, deren systematische Kohärenz in verschiedener Hinsicht überprüft wird (Brendal 1936; vgl. Ungeheuer 1962, 25-27). Eine systematische Anordnung der englischen Vokale, die an der morphographischen Position des Zungenbogens orientiert ist, wird im Vokal-Diagramm von Abb. 18a, b wiedergegeben. Hier dient der höchste Punkt des Zungenbogens als

ABB. 18a. Obersichts-Diagramm fur die Zungenhohe bei der Vokalbildung. (Nach Wise 1958: Wise, C.M. "Introduction to phonetics" 1958. Reprinted by permission of Prentice Hall, Inc. Englewood Cliffs, New Yersey).

Wise 1958.)

60

V O K A L B I L D U N G IM A N S A T Z R O H R

"Referenzpunkt", um andere Vokale als jeweils höher, tiefer, weiter vorn oder hinten lokalisieren zu können. Bemerkenswert ist dabei, daß ein durch Spektrograph (Visible Speech) hergestelltes Diagramm der Frequenzen des 1. und 2. Formanten weitgehende Ähnlichkeit mit dem Röntgen-Schema (von Abb. 18b) bzw. dessen trapezförmiger Darstellung aufweist (Abb. 18c: Wise 1958, 83-85; Ward 1929; Jones 1937; 1950; Heifner 1950). Allerdings werden nur die an den Eckpunkten des Diagramms befindlichen "Hauptvokale" invariabel durch dieselbe Zungenposition erzeugt. Sie entsprechen den jeweils extremen Lagen von high/low und front/ back in der Anordnung: i = high/front; u = high/back; a = low/front; a = low/

1

I

- r

—r

1

-

\a

FRONT

-

• T"""

!

Hl GH

\

\ «

V



A

o

K

/ y —
• 5 •c .S -C

•a

«

á S S o G VI o c ¡a o Ö M o M

-3 3 . M sO*

eo

•a Ö

cl c a Q. s

S

»

» «

S

52 M

1

3

" II

g

2

S O« 0c *C K« w c 4> .S c M a> tí H » 5 C L 1 ¡ I l - c e s « O S ' S S í . » s •g * -a Ö

1 o

'

¡

3

ä>

H

-a a .3 a .s tí « ^ £ • S 3 ? - 7 3 2 O - T - J S & J 3 S cg Ö J .e u3 0 c o S

-H "

1/5

n
Teil-Reaktion Teil-Reaktionvon vonRRs = Angst Hemmungsrichtung

Käse - R

2.

Käse

ReN e

x

x

Ton

s

^ r

Ton = CS von Schock rs = Teil-Reaktion auf Schock

s

Käse - R ~ - r

Blinklicht

Re

Xx ( ) s

B1 -

4.

Schock

r ^ r

Blinklicht

r

.

B1

= CS von Käse

re

= Teil-Reaktion von R e = Eßreaktion

ex

TonB1

~

e

"

s

ABB. 37. Konditionierungs-Schema für "Satz-Kombinationen": 1. Gegenstand-GegenstandSatz; 2. Gegenstand-Zeichen-Satz; 3. Zeichen-Gegenstand-Satz; 4. Zeichen-Zeichen-Satz. (Nach Mowrer 1960.)

kann es eine entsprechende Appetenz auslösen; falls jedoch ein Summton für einen bestimmten Strafreiz (Elektroschock) steht, kommt es wahrscheinlich gar nicht zu einer explorativen Response, da — nach dem Schema von Abb. 36 — eine antizipatorische Hemmung aus "Furcht" vor Bestrafung eintritt: Das für den Strafreiz stehende Aussage-Zeichen (Summton) wird auf das für das Lockmittel stehende Hinweis-Zeichen (Blinklicht) soweit übertragen, daß die Hemmreaktion nun auch die bereits vorhandene Reaktionsgewohnheit auf das (vorher positive) Hinweis-Zeichen unterbindet. Man sieht es der unterbliebenen Reaktion äußerlich gar nicht an, daß es sich um eine (positiv-negative) Gegen-Konditionierung mit dem Endeffekt Null handelt, weil sie von einer überhaupt nicht vorgenommenen (positiven oder negativen) Konditionierung nicht zu unterscheiden ist. Da nun der Zeichen-Zeichen-Satz die vollkommenste Form obiger "Satz-Kombinationen" darstellt, d.h. die weniger entwickelten Formen analytisch in sich enthält (vgl. Abb. 37), bildet er als reiner Zeichenbezug den idealen Übergang vom

128

SITUATIVER UND SYMBOLISCHER ZWEI-ZEICHEN-SATZ

völligen oder teilweisen Gegenstandsbezug zum eigentlichen Symbolbezug. Gerade weil er mitten zwischen dem Gegenstands- und Symbolbezug steht, eignet er sich als übergreifende Kategorie, deren situative oder symbolische Komponente erst in einem weiteren Schritt auszugrenzen ist. Wenngleich wir also den — von Mowrer eingeführten — Unterschied von Zeichen und Symbol aufgreifen, reservieren wir doch zugleich dem Zeichen die allgemeinere, weil umfassendere Bedeutung, so daß zum einen das gegenständliche und zum andern das symbolische Zeichen aus ihm entlassen werden kann. Der Satz überhaupt, d.h. der aus Indikation und Prädikation bestehende "Zwei-Zeichen-Satz" bezieht sich also nach erfolgter Ausgrenzung auf alle drei Ebenen: die (völlige oder teilweise) Gegenstands-, Zeichen- und Symbolebene (vgl. Abb. 38). Satz Indikation

I

+

Prädikation

Zwei-Zeiohen-Satz^^^ GegenstandsEbene ABB. 38.

ZeichenEbene

SymbolEbene

Kategoriale Bestimmung und Ausgrenzung des Zwei-Zeichen-Satzes.

Von hier aus wird ohne weiteres verständlich, daß der sog. Ein-Wort-Satz in der verschiedensten Weise interpretiert werden kann, je nachdem, wie er "gemeint" ist. Geht man dabei — wie oben dargestellt — in systematischer Weise vor, so kommt es ganz darauf an, ob das fragliche Wort nur ein Zufallszeichen oder ein prädikatisiertes Zufallszeichen, d.h. eine auch inhaltlich treffende Bezeichnung ist ("Dreieck"). Sollte letzteres der Fall sein, so ist es wiederum möglich, diesen — in einem Wort enthaltenen — "Zwei-Zeichen-Satz" als symbolisch losgelöst oder situativ verankert vorzustellen. Betrachtet man ihn als abstrahiert, so ist er logisch — wenn auch nicht grammatisch — in sich vollständig; wird er dagegen in seinem Gegenstandsbezug gesehen, so hat er zunächst nur Hinweis-Charakter, mit dem man jedoch ein (nichtverbales oder verbales) Prädikat verbinden kann. In diesem Fall bedeutet "Dreieck" soviel wie "Hier ist ein Dreieck", weil man voraussetzen kann, daß die Gleichsetzungen a ist dreieckig a ist ein Dreieck usw. vorausgegangen sind und nur an die Stelle des Zufallszeichens a das hier und jetzt erfolgende "Hinweisen" getreten ist. Da aber gerade die frühkindlichen Lautäußerungen in hohem Maße auf die Stützung durch die Gesamt-Situation angewiesen sind (vgl. Hörmann 1967, 289ff), muß der

SITUATIVER UND SYMBOLISCHER ZWEI-ZEICHEN-SATZ

129

Ein-Wort-Satz meist auch als Ein-Zeichen-Satz, d.h. als Aussage betrachtet werden, bei der die verbale Indikation fehlt. Es handelt sich also nicht um einen autonomen Satz im oben beschriebenen Sinn, weil das Einzelwort ("Wasser!" = "Da ist Wasser!") nur als Prädikation gemeint ist, die verbale Indikation aber wegen des vorhandenen Gegenstands überflüssig erscheint. Wiewohl im inhaltlich kennzeichnenden Substantiv "Wasser" eine indikative und eine prädikative Funktion beachtet werden könnte, macht doch das Kind nur von letzterer Gebrauch. Da es aber zunächst gar nicht um den syntaktisch-semantischen, sondern den pragmatischen Bezug geht (vgl. S.105), ist das Einzelwort wiederum nur insofern als Prädikation gemeint, als es einen subjektiven Wunsch auszudrücken imstande ist ("Wasser!" = "Da ist Wasser, das ich trinken möchte!"). Aus diesem Grund bestehen die meisten Ein-WortSätze von Kleinkindern aus sog. "mands" (Abkürzung von engl.: demands, commands, exclamations — vgl. Skinner 1957), die immer voraussetzen, daß Gegenstand oder Person anwesend sind (Mowrer 1960, 136). Die denotative Aussage steht und fällt also mit dem verbalen Hinweis-Zeichen, das an die Stelle des Gegenstandes tritt. Da es nur beim Menschen völlig ablösbar, d.h. symbolisch verwendbar ist, stellt es zugleich das eigentliche Kriterium menschlicher Sprache dar, das sie grundlegend von allen tierischen Kommunikationssystemen unterscheidet, die bestenfalls ein gegenstandsgebundenes Hinweis-Zeichen besitzen. — (In der Bienensprache wird das "Subjekt" durch ein wenig Substanz [Nektar, Zuckerwasser] präsentiert, es handelt sich also um eine Gegenstand-Zeichen-Variation; die Ameisensprache ist noch weniger entwickelt: vgl. op. cit., 133). [Um die Besonderheit obiger Bestimmung noch einmal bewußt zu machen, sei darauf hingewiesen, daß diese entscheidende Diskriminations-Schwelle zwischen animalischer und humaner "Sprachgebung" bei einem anders konzipierten Ansatz nicht o.w. denselben Erklärungswert wie in vorliegender Ableitung erhalten muß. So geht etwa das — von der neueren Kommunikationswissenschaft wieder aufgenommene — "Organon-Modell" K. Bühlers geradezu von der "Stoffgebundenheit" bzw. "Gegenstandsgebundenheit" des Hinweis-Zeichens aus, wie es beispielsweise beim Bienenstanz oder der Territoriums-Markierung gegeben ist: "das zur Markierung verwendete Zeichen kann abgelöst von dem markierten Gegenstand seine Identifikationsfunktion nicht erfüllen" (Ungeheuer 1967, 2079; vgl. Bühler 1927; 1934). Dabei wird die Notwendigkeit einer festen Verknüpfung zwischen Kontaktmittel und physischer Situation insofern betont, als die mit dem Markierungs-Zeichen verbundene Aussage nur innerhalb des "symphysischen" bzw. "sympraktischen" Umfeldes vom Adressaten interpretierbar ist. Bei dieser Aufarbeitungs-Richtung, die nicht bei der linguistisch ablösbaren, sondern der situativ verankerten Seite des Total-Vorgangs beginnt und die verbale Mitteilungs-Ebene durch die "synsemantische" Komponente einzubeziehen sucht, verlagert sich also das Gewicht ganz auf die Seite der Kontext-Variation, was zwangsläufig zu einer korrespondierenden Akzentverschiebung des Hinsicht-Charakters führt: "Diese volle Verwirklichung sprachlicher Kommunikation, die impliziert, daß das Mitgeteilte allein aus dem

130

SITUATIVER UND SYMBOLISCHER ZWEI-ZEICHEN-SATZ

Ganzen der Rede ohne Situationshilfen verstanden werden kann, ist jedoch, überblickt man die Vielfalt zwischenmenschlicher Kommunikationsformen, sehr selten ..." (Ungeheuer 1967, 2077). Die situative Rarität dessen, was Sprache eigentlich sei, wird noch durch den Bühlerschen Begriff des "Phantasmas" unterstrichen, der die gewisse Irrealität dieser Hilfsfunktion zum Ausdruck zu bringen sucht: "Wenn eben der Handlungsraum nicht zugleich Perzeptionsraum ist, dann muß er kommunikativ im Bewußtsein und in der Vorstellung der Kommunikationspartner entworfen werden. Das bedeutet z.B., daß der kommunikativ dominierende Partner die Vorstellungen des anderen mit sprachlichen Mitteln so beeinflußt, d.h. steuert, daß die Szene der gemeinsamen Aktion ihm als 'Phantasma', um einen Terminus Bühlers zu gebrauchen, gegenwärtig wird" (op. cit. 2083). Dabei ist unverkennbar, daß in dieser (kommunikationswissenschaftlichen) Konzeption eine weitgehend analoge Zeichen-Zuordnung wie bei Mowrer getroffen wird, ohne daß allerdings die Zeichen-Beziehung im Sinne eines denotativen Minimums expliziert zu werden braucht: "In diesem Geschäft der Fixierung üben die sprachlichen Zeichen durch wechselseitige Spezifikation in einem verallgemeinerten Sinne die Funktion der Markierung, der Indikation aus, wie dies im engeren Sinne durch Namen geschieht. Die Verweisungen, die am Phantasma vollzogen werden, korrespondieren der Anaphora im syntaktischen Aufbau der vermittelnden Rede" (op. cit., 2083). Da sich nun in obiger Ableitung ergeben hat, daß die GegenstandZeichen-Variation als eine von vier möglichen "Satz-Kombinationen" (vgl. Abb. 37) unter das Schema des Zwei-Zeichen-Satzes subsummiert werden kann, läßt sich an dieser Stelle zugleich eine Begründung dafür erbringen, warum die Aufarbeitung des Total-Vorgangs in vorliegender Studie eher vom "synsemantischen" als vom "symphysisch-sympraktischen" Aspekt her vorgenommen werden muß. Denn es zeigt sich hier, daß letzterer auf dem Umweg über Indikation ( = Identifikation, Markierung) und Prädikation ( = Verweisungs-Aussage) als situationsspezifischer Sonderfall des Zwei-Zeichen-Satzes zu verstehen ist, dem somit ein wesentlich größeres Gewicht zukommt, als dies bei disjunktiver Interpretation der situativ/linguistischen Ausgangsbedingung hätte vermutet werden können. Außerdem wird sichtbar, daß der systematische Stellenwert eines solchen Begriffs einem probabilistisch orientierten Häufigkeitskriterium nicht konform zu sein braucht (vgl. obige "situative Rarität"). Der Erklärungswert einer linguistischen Universalie wie "remoteness" (vgl. S.122) dürfte denn auch mehr in der Definition ihrer oberen Grenze als ihrem Sample-Charakter liegen, wonach räum- und/oder zeitunabhängige Mitteilungen zwar prinzipiell für humansprachliche Kommunikationsprozesse möglich sind, bei einem vorgegebenen Sample-Charakter aber keineswegs durchgängig realisiert sein müssen. Dem animalischen Kommunikationssystem wird man hingegen diesen "remoteness"-Anteil, der für die humane Sprachgebung konstitutiv ist, wegen des situativ gebundenen Hinweis-Zeichens selbst dann absprechen müssen, wenn eine "symphysisch" bzw. "sympraktisch" gleichartige Situation vorzuliegen scheint, da die eigentliche Ungleichartigkeit beider Systeme erst durch das

SITUATIVER UND SYMBOLISCHER ZWEI-ZEICHEN-SATZ

131

metasprachliche Ordnungskriterium des Zwei-Zeichen-Satzes entdeckt werden kann.] Deswegen verfügt nur der Mensch über eine echte, d.h. autonome Prädikation, beim zustandsgebundenen Tier läßt sich dagegen nur von einer "Quasi-Prädikation" (Cassirer 1944) sprechen. Ist es doch gerade die — zunächst "überflüssig" ( = redundant) erscheinende Verdoppelung des Referenz-Objektes, die Humansprache initiiert, da nur auf diese Weise die intrapersonale Bedeutungsverschiebung vom Aussage- zum Hinweis-Zeichen bzw. die interpersonale Bedeutungsvermittlung zwischen Kommunikations-Partnern ermöglicht wird. 3. DAS PRÄDIKATIVE SYNTAGMA ALS SATZ-UNIVERSALIE

Zunächst ist hervorzuheben, daß das logische Relat von Indikation/Prädikation, das im Zwei-Zeichen-Satz zum Ausdruck kommt, noch nichts über den Charakter der verbalen Ausführungsbestimmung dieses allgemeinen Programms besagt. Wenn wir also vom Zwei-Zeichen-Satz als der Minimal-Bedingung einer Denotation des Nicht-Jetzt und Nicht-Hier sprechen (vgl. Mowrer 1960, 136; Hull 1930, 524) bzw. feststellen, daß es etwas geben muß, über das gesprochen wird (Indikation) und etwas, das davon ausgesagt wird (Prädikation), so ist diese Feststellung keineswegs identisch mit der Behauptung, keine Sprache könne auf die Unterscheidung von Subjekt (bzw. Substantiv) und Prädikat (bzw. Verb) verzichten (vgl. Mowrer 1960, 140; Ogden & Richards 1923, 260; Fries 1952, 14). Da man beim interlinguistischen Vergleich nicht von einer l:l-ReIation von Subjekt/Substantiv und Prädikat/Verb ausgehen kann (Whorf 1952, 6; McCarthy 1963, 530), ist diese Behauptung nur aufrechtzuerhalten, wenn man dabei spezifiziert, daß Subjekt/Substantiv nur eine mögliche Ausführungsbestimmung von Indikation und Prädikat/Verb eine solche von Prädikation ist, aber durch weitere (verbale oder nicht-verbale) Ausführungsbestimmungen ersetzt werden kann. In eben diesem Sinne wird denn auch von Sapir gewarnt, bei dem Versuch einer universellen Sprachtypologie von der Anordnung der "Redeteile" auszugehen, weil sie nicht so sehr "unser intuitives Wissen um die Organisation der Wirklichkeit widerspiegeln als vielmehr unsere Fähigkeit, dieser Wirklichkeit durch eine Vielfalt von Formen Ausdruck zu geben" (1961, 112). Da jede Sprache ihr eigenes System besitzt, in dem festgelegt wird, wie die linguistischen Einheiten zuzuordnen sind, besitzt eine bestimmte Form der Verkettung von Sukzessivelementen außerhalb dieses Systems gar keine "Realität": "Ein Redeteil außerhalb der durch die jeweilige Syntax gesteckten Grenzen ist ein Trugbild, eine Fata Morgana" (op. cit., 113). Bei dieser allgemeinen Regel, daß die Enkodierung bestimmter Gegebenheiten keineswegs auf bestimmte Redeteile beschränkt zu sein braucht, gibt es nur einen Vorbehalt: Es muß etwas geben, worüber gesprochen werden kann und es muß etwas über diesen Gesprächsgegenstand ausgesagt werden, nachdem er einmal festgelegt ist. Dieser Unter-

132

DAS PRÄDIKATIVE SYNTAGMA ALS SATZ-UNIVERSALIE

schied ist von so grundlegender Bedeutung, daß die große Mehrzahl aller Sprachen ihn dadurch unterstreicht, daß sie irgendwelche formalen Schranken zwischen diesen beiden Teilen der Aussage errichtet... Tatsächlich existiert keine einzige Sprache, in der es nicht irgendeine Art der Unterscheidung zwischen Substantiv und Verb gäbe, obschon in einzelnen Fällen der Unterschied sehr vage ist. Bei den anderen Redeteilen liegt die Sache anders. Nicht einer von ihnen ist für die Existenz der Sprache unumgänglich nötig (op. cit., 113) Wenn man bedenkt, daß die Termini "Substantiv" und "Verb" lateinischer Herkunft sind und sich streng genommen nur auf latinisierte Sprachen beziehen können, (die sich weitgehend mit den oben erwähnten SAE-Sprachen Whorfs decken: vgl. S.115), so wundert es eigentlich, daß Sapir — im Gegensatz zu Whorf — diesen Redeteilen ausnahmsweise eine universelle Existenz zusprechen will. Der Grund ist zweifellos darin zu sehen, daß er in Wirklichkeit gar nicht die verbale Ausführungsbestimmung von Gesprächsgegenstand und Aussage, sondern deren logische Voraussetzung meint, die wir als Indikation/Prädikation bestimmt haben. N u r so ist es zu erklären, daß er "Indikation" ohne weiteres mit "Substantiv" und "Prädikation" mit "Verb" gleichsetzt, als sei das logische Relat nur durch diese Sprachkategorien realisierbar. Tatsächlich kann aber der Charakter des "Vagen" so weit gehen, daß die sog. Nomina und Verben nicht nur aus zwei diametral entgegengesetzten Klassen bestehen, sondern als zwei Unterabteilungen einer einzigen Klasse von Einheiten angeordnet sein können, die alle prädikative oder nicht-prädikative Funktion zu übernehmen vermögen. Es ist darum nur konsequent, die auf systeminterne Redeteile angewandte Regel Sapirs auch auf Substantiv und Verb auszudehnen, zumal es sich nach der logischen Voraussetzung von Indikation/Prädikation leicht erklären läßt, warum es Sprachen gibt, in denen alle Lexeme als Prädikat verwendet werden können, so daß eine Klassifizierung nur noch anhand bestimmter Modalitäten (Nomen: Zahl, Besitz; Verb: Zeit, Aspekt usw.) möglich ist. Gibt doch der Gebrauch von Ausdrücken wie " N o m e n " und "Verb" auch in diesem Fall wenig her, da sich die überlieferte Nomenklatur nur sehr oberflächlich mit den zu etikettierenden LexemKlassen deckt (Martinet 1963, 129-130). Wir stehen also vor der Aufgabe, die logische Voraussetzung von Indikation/ Prädikation so allgemeingültig in eine Formel der Verbalisierung zu überführen, daß Subjekt und Prädikat (bzw. Substantiv und Verb) nur als Variation dieser Formel bei SAE-Sprachen auftreten, aber nicht stellvertretend für alle anderen Weltsprachen stehen können. Wenn man nun davon ausgeht, daß diese universelle Ausführungsbestimmung auf einen Zwei-Zeichen-Satz im oben definierten Sinne zurückgehen muß, so läßt sich sagen, daß der sich ergebende Satz der Verbal-Ebene im einfachsten Fall der Kettenbildung nur durch zwei linguistische Einheiten repräsentiert sein kann (vgl. S.113). D a von Form und Inhalt solcher Einheiten zunächst abzusehen ist, existieren sie vorerst nur als "Zeichen", nämlich als verbale Minimal-Zeichen, die in keine weiteren Zeichen mehr unterteilbar sind, weil sie die kleinste Ausdruckseinheit darstellen,

DAS PRÄDIKATIVE SYNTAGMA ALS SATZ-UNIVERSALIE formale Ausschreibordnung

133

Zwei-Zeichen-Satz

Ketten- und Klassenbildung

Symbol-Ebene

VerbalZeichen

Monem

Lexem

Grairanem

ABB. 39 a. Kategoriale Bestimmung des Monems gemäß seiner doppelten Ableitung aus der seriellen Ordnung und dem Zwei-Zeichen-Satz.

die einen bestimmten semantischen "Inhalt" aufnehmen kann. Eine solche signifikative Minimal-Einheit sei hier mit Martinet durch den Terminus "Monem" bezeichnet (Martinet 1963, 23). Diese Einheit entspricht also in vorliegender Ableitung einerseits den Kriterien der formalen Ausschreibordnung, da sie kettenmäßig verwendet und klassenmäßig zugeordnet werden kann, andererseits aber auch den logischen Bedingungen des Zwei-Zeichen-Satzes, der sich auf der (verbalen) Symbol-Ebene durch zwei signifikative Minimal-Einheiten realisieren muß (vgl. Abb. 39 a). Die potentielle Satz-Universalie würde demnach im einfachsten Falle aus nur zwei Monemen zu bestehen brauchen, die in ihrer Eigenschaft eines minimalen Syntagma den logischen Gehalt des Zwei-Zeichen-Satzes in sich aufnehmen könnten. [Der Terminus "Monem" soll hier nicht nur ein wissenschaftliches Äquivalent für den traditionellen Terminus "Wort" sein, sondern dem doppelten Umstand gerecht werden, daß 1. ein "Wort" nicht die signifikative Minimal-Einheit zu sein braucht, d.h. aus mehreren "Monemen" zusammengesetzt sein kann und 2. ein "Monem" als kleinste Bedeutungs-Einheit mit Sprachinhalt (Signifikat) und Lautträger (Signifikant) nicht nur auf "Lexeme" (z.B. "hab-" in "(ich) habe"), sondern auch auf "Morpheme" ("-e" in "(ich) habe"), die nicht im Lexikon, sondern nur in der Grammatik einer Einzelsprache erscheinen, bezogen werden kann (vgl. Martinet 1963, 24). Da aber der Ausdruck "Morphem" keine terminologisch eindeutige Bezeichnung ist und zudem als "Monem" verstanden werden muß, empfiehlt es sich, ihn im Unterschied zum lexikalischen Monem = "Lexem" als grammatikalisches Monem = "Grammem" einzuführen (op. cit., 107), um die in relativ unbegrenzten und begrenzten Inventaren auftretenden Satz-Pole kennzeichnen zu können, die oben in

134

DAS PRÄDIKATIVE SYNTAGMA ALS SATZ-UNIVERSALIE

der Gegenüberstellung von "Grundbegriff" (RaE) und "Beziehungsbegriff" (ReE) als unabdingbar für den universellen Basis-Satz dargestellt werden (op. cit., 108; Heger 1969, 187; vgl. S.154: Abb. 39a). Beide Probleme, nämlich die Zusammensetzung von Monemen und die Abgrenzung von Monem-Klassen sind innerhalb einer rein syntagmatischen Betrachtungsweise (Kettenbildung) nicht mehr zu lösen, sondern zwingen zu einer paradigmatischen Aufarbeitung (Klassenbildung). Die Monem-Definition bei Martinet wird demnach nur durch eine syntagmatische Bestimmung erreicht, die auf der Parole-Ebene besagt, daß ein Monem-Vorkommen nicht weiter unterteilbar ist. Übersetzt man sie mit Heger in die Langue-Ebene, so ist damit gemeint, daß ein Monem nicht als Summe aus Katena und Einheiten des nächstniederen Ranges beschreibbar ist (Heger 1969, 183). Hierbei hat der von Frei eingeführte Katena-Begriff (Frei 1962, 128-140) insofern eine wichtige Funktion, als er die zugleich notwendige und hinreichende Bedingung für eine hierarchische Rangabstufung von zusammengesetzten Monem-Einheiten darstellt. So wird etwa das Pluszeichen ( + ) in der syntagmatischen Verkettung (poir + ier) bei paradigmatischer Anordnung zu einem Multiplikationszeichen ( x ) in (poir x ier) bzw. führt bei Ausklammerung des Katena-Zeichens (poir + ier) + x zur Isolierung des Faktors x , der insofern selbst zum Bedeutungsträger (Signifikant) wird, als er zur Bedeutung (Signifikat) des Syntagmas als "syntaktische Relation" beiträgt (Heger 1969, 148-149). Ein zu einer bestimmten MonemKlasse (Lexem/Grammem) gehöriges Monem muß demnach zusätzlich durch seinen objektsprachlichen oder (ausschließlich) metasprachlichen Bedeutungs-Inhalt gekennzeichnet werden, um dem paradigmatisch verstandenen Bindungs-Charakter von unabhängigen (rang-niederen) und abhängigen (rang-höheren) Monem-Einheiten gerecht werden zu können. Bevor man an eine paradigmatische Rangabstufung von Monem-Kombinationen gehen kann, die auf das Monem als kleinste Zeichen-Einheit vom Rang 1 zurückführbar sind, ist jedoch zu berücksichtigen, daß die von Martinet zugrundegelegte Entsprechung von Signifikat/Signifikant beim Monem nur bei einzelsprachlicher Betrachtung zur Definition von Monem-Klassen ausreicht, bei außereinzelsprachlicher, d.h. universeller Betrachtung jedoch statt auf das "Sem" ( = kleinste bedeutungsdistinktive Einheit, die auf einzelsprachlich gebundene Sememe bezogen ist —vgl. Heger 1969, 167) nun auf das "Noem" als außereinzelsprachlichen Begriff bezogen werden muß, dessen Verhältnis zum Signifikat nur über das Semem (mit Hilfe logischer Termini wie "Konjunktion", "Adjunktion", "Disjunktion" — Heger 1964, 502-504; 1969, 167; 1971, 30-31) zu ermitteln ist (vgl. das Hegersche Trapez-Modell, wo Sem/Noem an derselben Systemstelle, d.h. der rechten oberen Trapez-Ecke in disjunktiver Verbindung erscheinen können — Heger 1969, 168; Abb. 39 b). Bei einer Definition von Monem-Klassen wie Lexem/Morphem (Martinet) kann man also zunächst davon ausgehen, daß lexikalische Moneme zu relativ unbegrenzten, grammatikalische Moneme hingegen zu relativ begrenzten Inventaren gehören, d.h. nur mit einer beschränkten Zahl von anderen Monemen austauschbar sind

DAS PRÄDIKATIVE SYNTAGMA ALS SATZ-UNIVERSALIE

Signifikat

Semem

135

Sem/Noem

ABB. 39 b. Trapez-Modell zur Abbildung der bedeutungs-quantitativen (links) und -qualitativen (oben) bzw. der intensionalen (oben) und extensionalen (rechts) Zeichen-Dimension bei einzelsprach lichem (Sem) und außereinzelsprachlichem ( N o e m ) Bezugspunkt. (Nach Heger 1969, 1971.)

(Martinet 1963, 107-108). Da diese Klassifizierung aber noch nicht zu einer RangZuweisung von Monem-Kombinationen führt, muß zusätzlich berücksichtigt werden, ob ein Lexem/Grammem (Heger) 1. objektsprachlichen oder (ausschließlich) metasprachlichen Bedeutungs-Inhalt besitzt; 2. in freier oder gebundener Form auftritt bzw. 3. in freier oder gebundener Form jeweils wieder objekt- oder metasprachlich gekennzeichnet ist (Heger 1969, 187-190; vgl. Abb. 39 c).

gebunden

frei

mit nicht ausschließlich reflexiv-metasprachlichem Semem

freies Lexem

gebundenes I exem

"heute"

"cant-"

freies Grammem

gebundenes Grammem

"moi"

"-ba-,-n-,-t"

Lexem

Grammem

mit ausschließlich reflexiv-metasprachlichem Semem

gebundenes metasprachl. Lexem "pomme (S2)"

gebundenes metasprachl. Grammem "-a-"

ABB. 39C. Paradigmatisches Zuordnungs-Schema der freien und gebundenen Form von Lexem/ Grammem. (Nach Heger 1969.)

Erst nach einer solchen objekt/metasprachlichen Bestimmung ist es möglich, paradigmatische Einheiten zu definieren, deren Rang-Zugehörigkeit von Rang n bis n + x genau festgelegt ist: So kann etwa eine "autoseme Minimal-Einheit" erst auf Rang R2 auftreten, weil sie zusätzlich zum Lexem ein metasprachliches Monem enthalten muß, das auf Rang R1 noch nicht vorhanden, auf Rang R3 aber bereits zur Bindung

136

DAS PRÄDIKATIVE SYNTAGMA ALS SATZ-UNIVERSALIE

eines Grammems führt, das zusammen mit der autosemen Minimal-Einheit die "Flexionsform" bzw. "Vokabel" konstituiert, was auf der Parole-Ebene ungefähr dem traditionellen Terminus "Wort" entsprechen würde (Heger 1969, 190-193). — Martinet hatte demnach guten Grund, bei der Bestimmung der kleinsten ZeichenEinheit nicht vom gewöhnlichen "Wort" auszugehen, das die Lexem/Morphem-bzw. Lexem/Grammem-Unterscheidung bereits in sich enthält, sondern das "Monem" als grundlegende, d.h. beide Satz-Pole übergreifende Zeichen-Klasse zu wählen, die einen lexikalisch/grammatikalischen Inhalt aufnehmen kann (vgl. Abb. 39a).] Methodisch weist nun Martinet die für eine Mitteilung erforderliche MinimaiBedingung von zwei nicht weiter unterteilbaren Minimal-Einheiten (Monemen) dadurch nach, daß er zunächst von einer einzigen Einheit ausgeht, um dann feststellen zu können, daß sie nicht ausreicht, um eine sprachlich autonome Äußerung abzugeben (Beispiel: "fête" erfordert zusätzliche Kennzeichnung eines Vorhandenseins [il y a fête] oder Nicht-Vorhandenseins [il n'y a pas fête]): Da das Aussage-Monem ("fête") unverständlich bleibt, solange es für sich allein steht, ist eine Ausrichtung auf etwas Gemeintes erforderlich, das sich von allem Nicht-Gemeinten deutlich unterscheidet. "Man muß das Monem, wie man sagt, aktualisieren. Dazu ist ein Kontext nötig, d.h. mindestens zwei Moneme, von denen eins speziell Träger der Nachricht ist, das andere sich als aktualisierend betrachten läßt" (Martinet 1963, 113). Geht man aber davon aus, daß das "Aussage-Monem" nichts anderes als die begriffliche Projektion des Aussage-Zeichens (Prädikation) auf die signifikative Minimal-Einheit (Monem) der verbalen Ebene darstellt und (mindestens) eines aktualisierenden Monems bedarf, um eine vollständige, d.h. vom situativen Kontext unabhängige Nachricht ausmachen zu können, so läßt sich letzteres analog dazu als Projektion des Hinweis-Zeichens (Indikation) auf ein weiteres Monem der verbalen Ebene auffassen, das die Funktion des "Eindeutigmachens" versieht. Im Sinne der Ableitungs-Hierarchie kann man also sagen, daß diese beiden für eine verbale Minimal-Nachricht unerläßlichen Moneme als direkte Projektion des logischen Relates von Indikation/Prädikation auf die verbale Kettenbildung anzusehen sind, die nach obiger Darlegung ebenfalls aus (mindestens) zwei linguistischen Einheiten bestehen muß, wenn sie der Minimal-Bedingung einer Verkettungs-Möglichkeit entsprechen soll (vgl. S.114, 132). Wie aber oben bereits angedeutet wurde (vgl. S.122), braucht das logische Relat von Indikation/Prädikation nicht unbedingt auf zwei segmental repräsentierte Sukzessivelemente projiziert zu sein, sondern kann auch durch ein einziges, gleichsam geschichtetes Träger-Element zum Ausdruck gebracht werden. Es wäre also falsch, in jedem Fall einen verbalen Bauplan "Indikations-Monem + Prädikations-Monem" annehmen zu wollen, da das logische Relat ebenso gut in einem Monem, zwei Monemen wie auch beliebig vielen Monemen realisiert werden kann, je nachdem wie weit der Projektionswinkel von Indikation/Prädikation reicht (vgl. Abb. 40a). Daß tatsächlich eine Art Schichtung von prädikativer und indikativer Funktion vorliegen kann, ergibt sich aus der Beobachtung, daß es sog. "subjektlose" Spra-

DAS PRÄDIKATIVE SYNTAGMA ALS S ATZ-UNI VERS ALI d

ABB. 40a.

Ind.

Präd.

Ind.

Präd.

Ind.

Präd.

137

Projektionswinkel für Indikation/Prädikation bei einem Monem, zwei und n Monemen.

chen gibt, "in denen eine völlig normale, weder auffordernde noch elliptische Äußerung aus einem einzigen Monem besteht" (Martinet 1963, 115), das aber dieselbe Intonationskurve wie umfangreichere Äußerungen desselben Typs (Behauptung, Frage usw.) aufweisen kann: "Deshalb kann man versucht sein, hier von einem aktualisierenden Monem zu sprechen, dessen Signifikant in der Intonation besteht" (op. cit., 116). Sobald jedoch eine Aussage intendiert wird, die denotativ darstellbar, d.h. vom Intonationsmuster unabhängig sein soll, muß die indikative Korrektur selber durch ein segmental erscheinendes Monem repräsentiert sein. Martinet empfiehlt deswegen, von Aktualisierung (im engeren Sinne) nur dann zu sprechen, "wenn das aktualisierende Monem eine Einheit der ersten Gliederungsebene, d.h. ein segmentales Monem ist" (op. cit., 116). Entscheidend für den gegenseitigen Verweisungs-Zusammenhang von Prädikations- und Indikations-Monem ist indes, daß hier eine Äußerung vorliegt, die für sich eine Mitteilung (Nachricht) ausmachen kann, d.h. von sich aus nicht der Kennzeichnung von Beziehungen zu eventuell Hinzugefügtem bedarf, während umgekehrt die Ergänzungen gerade daran erkannt werden, "daß sie Erfahrungselementen entsprechen, bei denen es für nötig gehalten wird, die Beziehung zum Ganzen der

138

DAS PRÄDIKATIVE SYNTAGMA ALS SATZ-UNIVERSALIE

mitzuteilenden Erfahrung zu kennzeichnen; eine Beziehung, der auf der sprachlichen Ebene die Funktion entspricht" (op. cit., 112-113). Hier ist nun genau der Überschneidungspunkt zwischen bloßer Ketten- und Klassenbildung einerseits und verbaler Ausführungsbestimmung des logischen Relates von Indikation/Prädikation andererseits gegeben: Es handelt sich nicht nur um eine Verbindung von zwei oder mehr Monemen schlechthin (Syntagma) noch um eine Verbindung von zwei oder mehr Monemen, die ihrer Funktion nach unabhängig von ihrem Platz in der Äußerung ist (autonomes Syntagma), sondern um eine Verbindung von zwei oder mehr Monemen, die für sich allein eine Mitteilung ausmacht (prädikatives Syntagma) (op. cit., 101, 112). Im "prädikativen Syntagma" haben wir also die eigentliche Ausführungsbestimmung von Indikation/Prädikation vor uns, die innerhalb der Ketten- und Klassenbildung der formalen Ausschreibordnung einer jeden Weltsprache realisiert werden muß. Dieses Ketten-Segment kann — wie oben gezeigt wurde (vgl. Abb. 40a) — aus einem Monem, zwei Monemen oder beliebig vielen Monemen bestehen. Geht man davon aus, daß sich das logische Relat im denotativen Minimum von zwei (segmentalen) Monemen hinreichend ausdrücken kann, so können zwar beliebig viele Moneme hinzugefügt werden, sind aber nur als indikative Erweiterung der Kern-Aussage zu verstehen: "Besteht die Äußerung aus einem alleinstehenden prädikativen Monem, so ist jede Hinzufügung weiterer Moneme, die an dem prädikativen Charakter des ursprünglichen Monems nichts ändern, eine Erweiterung des anfänglichen Prädikats." Sieht man demnach das prädikative Monem als funktional übergeordnet an, weil es die indikative Erweiterung nach- bzw. unterordnet ("regiert"), so läßt sich die Erweiterung durch "Beiordnung", d.h. die Aufreihung mehrerer (erweiterter) Prädikations-Moneme als Sonderfall der Erweiterung durch "Unterordnung" auffassen, die auf ein einziges Prädikations-Monem bezogen ist (op. cit., 116-118; vgl. Solle 1969). Bereits hier ist also sicher, daß nur der prädikative Kern als "satzorganisierendes" Moment in Frage kommt, falls es sich um eine denotative Minimal-Aussage handeln soll, die als autonome Mitteilung für sich allein stehen kann. Da die Form der indikativen Erweiterung zunächst offen läßt, ob es sich dabei noch um nicht-differenzierte "Aktualisierung" schlechthin oder bereits vorhandene Dichotomisierung in Person/Umstands-Bestimmungen (bzw. deren Mischformen) handelt, läßt sich zu ihrer Veranschaulichung der Stemma-Graph Tesnieres verwenden, wenn an der Stelle des "Verbs" das satzorganisierende Prädikations-Monem erscheint, das 1. durch beliebig viele Arme indikativ erweitert werden (horizontale Dimension), aber 2. auch in fortschreitender Korrektur beliebig weit spezifiziert werden kann (vertikale Dimension) (Tesniere 1959, Kap. 2-6; vgl. Abb. 40b). Dabei bleibt jedoch noch völlig offen, ob sich die indikativen Arme auf bloße "Aktualisierung" oder auf Person/Umstands-Bestimmungen im engeren Sinne beziehen, läßt also die von Tesniere für Schulgrammatik-Formen vorgesehene Aufteilung für (einzelsprachlich festgelegte) Handlungs-Teilnehmer (actants) und Um-

139

DAS PRÄDIKATIVE SYNTAGMA ALS SATZ-UNIVERSALIE chante

fort ABB. 40b. Stemma-Graph mit vertikaler und horizontaler Dimension. (Nach Tesnière 1959: Tesnière, L. "Eléments de syntaxe structurale" 1959. Reprinted by permission of Editions Klincksieck, Paris).

standsbestimmungen (circonstants) als möglichen Spezialfall zu, wo die Aktanten im Stemma-Graphen (links) vor den Circonstanten (rechts) angeordnet werden können: "Graphiquement, nous conviendrons de matérialiser la chose dans le stemma, en plaçant autant que possible les actants sur la gauche et les circonstants sur la droite" (op. cit., Kap. 48, §14). Eine genauere Abgrenzung zwischen Handlungsteilnehmern und Umstandsbestimmungen läßt sich indes bei universeller, d.h. außereinzelsprachlicher Betrachtung kaum vornehmen, da die Frage, "ob eine bestimmte Aktantenbezeichnung in der Umgebung eines bestimmten Lexems obligatorisch ist oder nicht, davon abhängt, wieviele Bestandteile eines Aktantenmodells von diesem Lexem impliziert sind" und somit nur von der betreffenden Einzelsprache her beantwortet werden kann, der das Lexem angehört (Heger 1966, 169-170; 1971, 93: Fußnote). 4.

INDIKATIVE A K T U A L I S I E R U N G D U R C H A K T A N T E N U N D CIRCONSTANTEN

Angesichts dieser Schwierigkeit, zu einer universellen Bestimmung der aktualisierenden Satzteile zu gelangen, fragt es sich, welcher Wert der Subjekt/Prädikat- bzw. Subjekt/Objekt-Unterscheidung im traditionellen Verständnis überhaupt noch beizumessen ist. Offensichtlich scheint selbst ein Sprachforscher wie Martinet, der die Universalität von Subjekt/Prädikat sonst ausdrücklich bestreitet (Martinet 1963, 115: "So häufig der Bauplan Subjekt-Prädikat auch ist, es wäre falsch, ihn für universell zu halten."), durch die Art seiner aus SAE-Sprachen entnommenen Beispiele bisweilen in das alte Denkschema zurückzufallen, wenn er von der obligatorischen Anwesenheit des "Subjektes" spricht: Formal also ist das Subjekt immer entweder durch ein funktionales Monem oder durch seine Stellung gekennzeichnet. Woran man es aber als Subjekt erkennen und von den Ergänzungen unterscheiden kann, ist seine obligatorische Anwesenheit in einem gewissen Typ von Äußerungen: In 'les chiens mangent la soupe' oder 'ils mangent la soupe' kann man 'les chiens' oder 'ils' ebensowenig fortlassen wie den prädikativen Kern 'mangent'; 'la soupe' dagegen kann wegfallen, ohne die Äußerung zu verstümmeln oder das Zusammenspiel des übrigen zu verändern" (op. cit., 114-115).

140

INDIKATIVE AKTUALISIERUNG DURCH AKTANTEN UND CIRCONSTANTEN

Ein gewisser Widerspruch entsteht nun dadurch, daß Martinet das "Subjekt" einerseits im Sinne einer selbständigen Mitteilung als obligatorisches Glied der zweigliedrigen Minimal-Aussage (op. cit., 114), andererseits aber als bloße Ergänzung, d.h. als indikative Erweiterung des eingliedrigen Prädikations-Kerns versteht, das gegenüber sonstigen Erweiterungs-Elementen keine Sonderstellung behaupten kann: "Subjekt wird dasjenige der beiden obligatorischen Elemente — Subjekt und Prädikat — sein, das eher auch als Ergänzung auftreten kann: 'les chiens' und 'ils', in den eben angeführten Sätzen Subjekt, können auch als Ergänzungen gebraucht werden, so in 'les Chinois mangent les chiens' und 'les Chinois les mangent', wo das zweite 'les' eine Variante von 'ils' ist" (op. cit., 115). Ähnlich wie Sapir die Subjekt/Prädikat-Unterscheidung bei universeller Betrachtung trotz der Unsicherheit ("Fata Morgana") sonstiger "Redeteile" aufrechtzuerhalten suchte (vgl. S.131-132), zeigt sich demnach auch bei Martinet eine gewisse Ambivalenz gegenüber der "unerläßlichen" oder nur "akzessorischen" Rolle des Subjektes, damit aber auch der Universalität oder Nicht-Universalität von Subjekt/Prädikat, die mit dem traditionellen Subjekt-Begriff zu stehen oder zu fallen scheint. Bei einer Analyse dieser ambivalenten Zuordnung kommt man sicher am weitesten, wenn man sie innerlich mit dem Autor nachzuvollziehen und bis zu ihren systematischen Ausgangs-Bedingungen zurückzuverfolgen sucht. Da Martinet einerseits an der autonomen Minimal-Aussage (prädikatives Syntagma) im Sinne einer unabhängigen Nachricht, andererseits aber an der sprachwissenschaftlichen Bestimmung der zweigliedrigen Äußerung gelegen ist, geht man wohl in der Annahme nicht fehl, daß ihn die informationstheoretische Bestimmung der unabhängigen Mitteilung dazu verleitet, die an sich notwendige "Aktualisierung", d.h. Indizierung des Prädikations-Monems bereits im Sinne eines "unerläßlichen" Handlungs-Teilnehmers einzugrenzen, der im traditionellen Grammatik-Verständnis als "Subjekt" bezeichnet wurde. Unterstellt man die Richtigkeit dieser Analyse, so dürfte es Martinet also weniger um das an anderer Stelle verworfene "Subjekt" bzw. Subjekt/Prädikat-Schema (op. cit., 115-116) als um den Tatbestand gehen, daß ein aktualisierendes (indikatives) Monem innerhalb einer informationstheoretischen Bestimmung (autonome Mitteilung) in einem anderen Sinne "obligatorisch" als bei nur sprachwissenschaftlicher Bestimmung ist, die zunächst nur vom "obligatorischen" Prädikations-Kern ausgeht und indikative Elemente (im engeren und weiteren Sinne) generell als "Ergänzung" bzw. "Erweiterung" des satzorganisierenden Knotens verstanden wissen will. Abgesehen von dieser Konfundierung informationstheoretischer und linguistischer Gesichtspunkte im denotativen Zwei-Zeichen-Satz tritt obige Ambivalenz aber auch dort in Erscheinung, wo es um die eigentliche Funktion der HandlungsTeilnehmer gegenüber dem Prädikations-Kern geht. Hier wird — da es sich um einen primär sprachwissenschaftlichen Aspekt handelt — zunächst dem Prädikat die übergeordnete, d.h. "regierende" Rolle zugestanden, solange die indikativen Er-

INDIKATIVE AKTUALISIERUNG DURCH AKTANTEN UND CIRCONSTANTEN

141

gänzungs-EIemente anonym bleiben: "Das Prädikat besteht aus einem prädikativen Monem, das von Modalitäten begleitet sein kann. U m dieses prädikative Monem herum baut sich der Satz auf, ihm gegenüber kennzeichnen die übrigen aufbauenden Elemente ihre Funktion" (op. cit., 116). Sobald jedoch an eine F o r m der Handlungs-Teilnahme wie Aktiv/Passiv gedacht wird, wie sie für die bekannteren SAE-Sprachen (Französisch, Deutsch usw.) charakteristisch ist, spricht man plötzlich umgekehrt von der "Ausrichtung" des Prädikats durch den (aktiven oder passiven) Handlungs-Teilnehmer: Immerhin kann man in manchen Sprachen, so z.B. im Französischen und im Deutschen, das Prädikat auf die Teilnehmer der Handlung hin ausrichten: Nehmen wir die Handlung des Öffnens, als ihren Gegenstand das Gartentor, als Handelnden den Gärtner: Gebraucht man die als 'Aktiv' bezeichnete Form des Prädikats, so heißt es 'der Gärtner öffnet das Gartentor'; nimmt man das sogenannte Passiv, so heißt es 'das Gartentor wird vom Gärtner geöffnet'. Im ersten Fall ist das Prädikat auf den Gärtner hin ausgerichtet ('öffnet'), im zweiten auf das Tor hin ('wird geöffnet') (op. cit., 116). U m deutlich zu machen, daß es sich bei dieser F o r m von "Subjekt"-Ausrichtung nur um eine fakultative, aber nicht obligatorische (universelle) Beziehung handelt, wird jedoch sogleich hinzugefügt, daß die F o r m dieser "Ausrichtung" auch anders aussehen kann, d.h. außer an Handlungs-Teilnehmern auch an Umstands-Bestimmungen orientiert sein kann bzw. weder an Teilnehmer noch Umstände gebunden sein m u ß : "Im Madegassischen zum Beispiel kann man das Prädikat außerdem auch ausrichten nach etwas, dem im Deutschen eine Umstandsbestimmung entspräche. Andere Sprachen dagegen, wie z.B. das Baskische, kennen diese Möglichkeit, das Prädikat auszurichten, nicht: Sind die Handlung, ihre Teilnehmer und die verschiedenen Umstände gegeben, so liegt damit die Struktur der Äußerung fest" (op. cit., 116).

Gerade obiges Beispiel von einem "Subjekt", das trotz vollzogener Aktiv/PassivTransformation anscheinend immer der ausrichtende Bezugspunkt der Satz-Aussage bleibt, ist indes geeignet, den Unterschied zwischen einer mehr logischen oder linguistischen Betrachtungsweise deutlich zu machen. Denn es handelt sich bei diesem (logischen) "Subjekt" eben nicht um etwas inhaltlich Identifizierbares, sondern um eine logisch übergreifende Kategorie für Handlungs-Teilnehmer, die neben dem aktiven "Subjekt" (Gärtner) so etwas wie ein passives "Gegen-Subjekt" (Gartentor) einschließt, das jedoch syntaktisch ganz anders organisiert wird (vgl. Tesniére 1959, Kap. 51, §18). Man könnte auch sagen, daß das frühere "Objekt" des Aktiv-Satzes (Gartentor) im Passiv-Satz zwar in derselben "passivischen" Abhängigkeit vom "aktivischen" Handlungs-Teilnehmer (Gärtner) bleibt, jetzt aber selbst die Rolle des ausrichtenden Bezugspunktes übernimmt, die vorher nur dem "aktivischen" Teilnehmer zukam. Da somit das frühere "Nicht-Subjekt" (Objekt) des Aktiv-Satzes selber zum "Subjekt" des Passiv-Satzes werden kann, führt sich der Terminus "Subjekt" innerhalb der Aktiv/Passiv-Transformation eigentlich selbst ad absurdum, da er wegen der

142

INDIKATIVE AKTUALISIERUNG DURCH AKTANTEN UND CIRCONSTANTEN

teilweisen Unvereinbarkeit von ausrichtendem Bezugspunkt und betroffenem Handlungs-Teilnehmer offenbar mehrdeutig werden muß. Es empfiehlt sich darum, Bezugspunkt und Teilnehmer durch je eine gesonderte Terminus-Kategorie zu erfassen, die eine diskursive Darstellung dieser beiden teils kommensurablen, teils inkommensurablen Dimensionen erlaubt. Ausgangspunkt für eine derartige Bestimmung muß dabei der Gedanke sein, daß das Vorhandensein eines Teilnehmers die Voraussetzung dafür ist, daß er zum "ausrichtenden" Bezugspunkt werden kann. In der Ausdrucksweise Tesniéres würde dies heißen, daß ein organisierendes "Verb" (hier: Prädikations-Monem) mindestens "mono-valent" d.h. bindungsbereit für einen Aktanten sein muß, wenn es die Voraussetzung für einen Bezugspunkt im obigen Sinne abgeben soll (Tesniére 1959, Kap. 49, §9). Negativ ließe sich die Monovalenz auch dadurch kennzeichnen, daß hier noch gar kein Konflikt zwischen der Zuordnung von Teilnehmer und Bezugspunkt entstehen kann, da der sonst zwischen verschiedenen Teilnehmern hin- und herwandernde Bezugspunkt im Fall eines einzigen Teilnehmers notwendig bei diesem verbleiben muß. (Dies mag auch dazu verleitet haben, als Prototyp für das "zweigliedrige" Subjekt/Prädikat-Schema zu dienen — vgl. Martinet 1963, 114). Aber schon im Falle der Bivalenz kann die oben aufgezeigte Unvereinbarkeit von Teilnehmer/ Bezugspunkt gegeben sein, die bei vorausgesetzten Teilnehmern unweigerlich dazu zwingt, den Bezugspunkt einem — und nur einem — der (dazu vorher unterschiedenen) Teilnehmer zuzuordnen. Geht man nun von der Voraussetzung aus, daß die Ordnungszahlen der sich ergänzenden Aktanten die jeweilige Valenz des "Verbs" (Prädikations-Monems) nicht übersteigen können (Tesniére 1959, Kap. 51, §4), so ergibt sich daraus von selbst, daß ein 2. (ergänzender) Aktant nur auftreten kann, wo es einen 1. (ergänzten) Aktanten, daß ein 3. (ergänzender) Aktant nur auftreten kann, wo es einen 2. (ergänzten) Aktanten gibt usw. Es handelt sich demnach um eine "Fundierungs-Hierarchie" von Aktanten, wo der jeweils ergänzende Aktant nur auftreten kann, wenn es auch einen ergänzten Aktanten gibt, so daß der 1. Aktant auftreten kann in Sätzen mit 1, 2, 3 Aktanten, der 2. Aktant jedoch nur noch in Sätzen mit 2,3 Aktanten und der 3. Aktant nur noch in Sätzen mit 3 Aktanten (op. cit., Kap. 51, §5). Aus dieser Fundierungs-Hierarchie geht hervor, daß es für die Unterscheidung von Aktanten elementar ist, zu wissen, welches der "ergänzte" und der "ergänzende" Aktant ist. Rückt man hierbei von einer Prioritäten-Liste im Sinne des traditionellen "Subjekt kommt vor Objekt" ab, so wird die Zuordnung in vielen Fällen durchaus beliebig sein, da die Aussage gerade davon abhängt, daß sich zwei Aktanten gegenseitig (und nicht einseitig!) ergänzen. Es wäre also müßig, darüber zu streiten, ob "Gärtner" vor "Gartentor" (Aktiv-Satz) oder "Gartentor" vor "Gärtner" (Passiv-Satz) kommt, wenn der Mitteilende gerade das Kausalitäts-Verhältnis zwischen beiden darstellen will, für das zwei Aktanten unerläßlich sind. Dennoch könnte man in vorliegendem Fall auch den "ausrichtenden" Bezugspunkt dadurch einbeziehen, daß man den-

INDIKATIVE AKTUALISIERUNG DURCH AKTANTEN UND CIRCONSTANTEN

143

jenigen Aktanten den 1. nennt, der in jedem der beiden Sätze tatsächlich im Fokus der Betrachtung steht, nämlich "Gärtner" im Aktiv- und "Gartentor" im PassivSatz, von denen nun mit einem gewissen Recht gesagt werden kann, daß sie durch den jeweils anderen Aktanten "ergänzt" werden. Es zeigt sich also, daß die rein numerische Aufführung von Aktanten noch nicht o.w. zu einer brauchbaren Unterscheidung im Sinne ergänzter/ergänzender Teilnehmer führt, sofern man nicht das zusätzliche Prinzip eines Bezugspunktes besitzt, das zwar in der Einzelsprache syntaktisch vorgesehen sein, vom Sprecher aber verschieden benutzt werden kann. — So tragen in obigem Beispiel Aktiv-Satz ("Der Gärtner öffnet das Gartentor'''' — "Der Gärtner öffnet nicht das Scheunentor, sondern das Gartentor") und Passiv-Satz ("Das Gartentor wird vom Gärtner geöffnet" = "Nicht das Scheunentor, sondern das Gartentor wird vom Gärtner geöffnet") insofern zu ihrer gegenseitigen Vereindeutigung bei, als bereits durch ihre Konfrontierung andere Bedeutungs-Varianten (wie : "Nicht der Lehrling, sondern der Gärtner öffnet das Gartentor" vs. "Das Gartentor wird nicht vom Lehrling, sondern vom Gärtner geöffnet") automatisch ausgegrenzt werden. Liegt nun dem Sprecher daran, diesen vereindeutigten Sachverhalt auch dann zum Ausdruck zu bringen, wenn ihm außer dem Verb nur jeweils ein (syntaktisch vorgeschriebener) Teilnehmer ( = traditionelles "Subjekt") zur Verfügung steht, so kann er in obigem Bedeutungs-Kontext nur zwischen reduziertem Aktiv-Satz ("Der Gärtner öffnet" — das Gartentor) und Passiv-Satz ("Das Gartentor wird geöffnet" — vom Gärtner) wählen und wird somit, da nicht der Gärtner, sondern das Gartentor als informative Neuigkeit anzusehen ist, zwangsläufig den Passiv-Satz bevorzugen müssen, um das semantische Äquivalent zum 2-Aktanten-Satz noch ausdrücken zu können. Man kann demnach in diesem Fall die Entscheidung des Sprechers für den Passiv-Satz dahingehend nachvollziehen, daß er den informativen und syntaktischen Konflikt bei bestimmter Teilnehmer-Begrenzung (1 Aktant) durch die Auswahl des richtigen Bezugspunktes (Aktiv- "Subjekt" vs. Passiv-"Subjekt") zu schlichten sucht. Wenn man berücksichtigt, daß eine Fundierungs-Hierarchie von Aktanten nicht nur eine Spezifizierung der indikativen "Aktualisierung", sondern wegen ihres homogenen Ergänzungs-Charakters auch eine kategoriale Kontinuität gegenüber den — zahlenmäßig gar nicht kumulierbaren, d.h. nicht fundierbaren — Umstands-Bestimmungen (vgl. Tesnière 1959, Kap. 56, §4: "Le nombre des circonstants n'est pas défini comme celui des actants. Il peut y en avoir aucun, tout comme il peut y en avoir un nombre illimité") darstellt, so hat die universelle Kennzeichnung eines 1., 2., 3. Aktanten usw. bzw. ihre graphische Anordnung im Stemma von links nach rechts (op. cit., Kap. 50, §15), an die erst dann die (nicht nach einem quantitativen Ordnungsprinzip aufreihbaren) Circonstanten angeschlossen werden (op. cit., Kap. 56, §11), durchaus ihre Berechtigung, sofern man sich dabei bewußt macht, daß es sich um eine durchgängige Kategorisierungs-Möglichkeit handelt, für die erst einzelsprachliche (syntaktische) und informative (bezugsmäßige) Kriterien der

144

INDIKATIVE AKTUALISIERUNG DURCH AKTANTEN UND CIRCONSTANTEN

Ergänzung bzw. der Über- und Unterordnung (op. cit., Kap. 51, §12) gefunden werden müssen. Die Durchgängigkeit der Kategorisierung von Aktanten, die dem universellen Stemma-Graphen neben dem organisierenden Prädikat seine Stabilität zu geben scheint, darf also nicht dazu verleiten, so etwas wie eine syntaktisch "saubere" Trennung von Aktanten/Circonstanten im konkreten Satzverband gegebener Einzelsprachen anzunehmen, wiewohl dies durch traditionelle Grammatik-Formen nahegelegt wird. Da nämlich Aktanten und Circonstanten wegen ihrer gemeinsamen Aktualisierungs-Funktion analoge Momente enthalten können, muß nach schärferen Kriterien ihrer linguistischen (nicht logischen!) Unterscheidbarkeit gesucht werden (op. cit., Kap. 57, §1). Hilfreich kann hierbei die Überlegung sein, da"ß die aufsteigende Valenz des "Verbs" (Prädikations-Monems) im Sinne von Avalenz, Monovalenz, Bivalenz, Trivalenz, Tetravalenz usw. sich genetisch auch in der Reihenfolge der FundierungsOrdnung herausgebildet haben dürfte, so daß sich das tetravalente "Verb" aus dem trivalenten, das trivalente aus dem divalenten und das divalente aus dem monovalenten gebildet haben würde. Wollte man zusätzlich einräumen, daß dem monovalenten das avalente Verb vorausgegangen ist, das definitionsmäßig gar keinen Aktanten, sondern nur einen Circonstanten "regieren" ( = syntaktisch anordnen) kann, so würde jeder auftretende Handlungs-Teilnehmer gleichsam nur noch im Gewand eines Circonstanten erscheinen können: Hier wären wir demnach wieder beim Aktualisierungs-Monem angelangt, das in nuce weder reiner Circonstant noch Aktant sein kann, weil ersterer letzteren noch in sich enthält und erst im Verlauf der sukzessiven Heraussetzung von fundierbaren Aktanten auch die nichtfundierbaren Circonstanten aus sich entläßt (op. cit., Kap. 106, §20). Wie wenig trennscharf die Unterscheidung der noch von Tesniere (op. cit., Kap. 57, §4) als unerläßlich (obligatorisch) angesehenen Aktanten gegenüber den nur akzessorischen (fakultativen) Circonstanten tatsächlich ist, ergibt sich allein aus der Beobachtung, daß man in der Regel um so eher mit der Einkleidung eines Aktanten in Circonstanten-Form rechnen kann, je polyvalenter der Prädikations-Kern, d.h. je genetisch später die syntaktisch obligatorische Valenzbildung anzusetzen ist: Insbesondere der 3. und 2. Aktant nähern sich also in dem Maße den Circonstanten an, wie in gegebenen Einzelsprachen für sie gewisse Überbrückungs-Elemente (z.B. Präpositionen) vorgesehen sind. Ein vieldeutiges Element dieser Art wäre etwa das französische "ä", das sowohl eine Umstandsbestimmung ("Alfred se trouve ä Paris") wie eine Aktantenform ("Alfred donne le livre ä Charles") bilden kann (op. cit., Kap. 57, §5). Auch obiger Passiv-Satz ("Das Gartentor wird vom Gärtner geöffnet" = "Das Gartentor wird geöffnet — durch den Gärtner") kennzeichnet den 2. Aktanten bereits in Präpositionsform, da die Tätigkeit des Passiv-Agens ("Gärtner") durch ein Verhältnis des Grundes angegeben wird (Jude 1966, 187), während der (genetisch frühere?) Aktiv-Satz keiner derartigen Konstruktion bedarf. Für die praktische Unterscheidung von Prädikations-Kern und Handlungs-Teil-

INDIKATIVE AKTUALISIERUNG DURCH AKTANTEN UND CIRCONSTANTEN

145

nehmern bzw. zwischen verschiedenen Teilnehmern ergibt sich jedoch insofern ein brauchbares Eingrenzungs-Prinzip, als das monovalente "Verb" mit nur einem Aktanten bei außereinzelsprachlicher Bewertung gleichsam das Minimum an Verwechslungs-Möglichkeiten zwischen verschiedenen Aktanten-Funktionen enthält: Würde man hier von einem Einheitswert ausgehen, so erhielte es den maximal möglichen Betrag (1 = 100%). Beim bivalenten Verb mit zwei Aktanten würde sich die Chance der richtigen Zuordnung (Ergänzung) bereits um die Hälfte verringern (0,5 = 50 %), beim trivalenten Verb mit drei Aktanten, d.h. insgesamt 3 x 2 = 6 ZuordnungsMöglichkeiten würde sich nur noch eine Treffer-Wahrscheinlichkeit von 17% ( = 83 % Fehler-Wahrscheinlichkeit) ergeben usw. (vgl. Tesniere 1959, Kap. 106, §2).

Wenn diese Prozent-Angaben auch nicht mehr als allgemeine Richtwerte sein können, die über die Schwierigkeit einzelsprachlicher Kategorisierung noch nichts besagen, so deuten sie doch an, welcher wahrscheinliche Sicherheitsgrad der traditionellen Subjekt/Prädikat- bzw. Subjekt/Objekt-Unterscheidung noch beizumessen ist. Denn es ergibt sich nach obiger Einschätzung von selbst, daß der "Subjekt"Terminus um so eher zu unverwechselbarer Kategorisierung führen kann, je mehr sich das "Verb" der Monovalenz nähert. Insofern ist es wohl auch kein Zufall, daß als Prototyp der zweigliedrigen Äußerung immer noch das traditionelle Subjekt/Prädikat-Schema bemüht wird. Schon bei der Bestimmung des "Objektes" treten jedoch zusätzliche Probleme auf, die mit dem linguistischen (nicht logischen!) Ergänzungs-Charakter von "Subjekt"/"Objekt" zu tun haben und nur in dem Maße von bloß zufalliger Zuordnung abweichen können, wie ein zuverlässiger KriterienKatalog mit gegenseitiger Ausschließlichkeit beider Kategorien (cross-checking) innerhalb einer gegebenen Einzelsprache gelingt. Kaum noch überschaubar werden bei dieser herkömmlichen Kategorisierung indes die Verhältnisse beim 3. (oder gar 4.) Aktanten liegen, weil hier weder ein Isolierungs-Prinzip (1. Aktant) noch ein einfaches Ergänzungs-Prinzip (1., 2. Aktant), sondern höchstens noch ein gewisses Ausgrenzungs-Prinzip (3. Aktant = ergänzter 2. Aktant) in Frage kommt. Damit kann die frühere Argumentation wieder aufgenommen werden (vgl. S. 131 ff.), denn es läßt sich nun die Subjekt/Prädikat- bzw. Subjekt/Objekt-Unterscheidung auf dem Umweg über das Aktanten-Modell als traditionelle Spezifizierung der Satz-Universalie (prädikatives Syntagma) interpretieren. Beiden Unterscheidungen ist demnach kein eigentlich prototypischer (universeller), sondern nur exemplarischer (taxonomischer) Wert beizumessen. Da auch die generative Ausschreib-Formel "noun phrase"/"verb phrase" (vgl. Abb. 31) nur ein Sonderfall obiger Satz-Universalie ist, kann sie wohl zu deren Veranschaulichung dienen, muß aber als Modelltyp auf die europäischen Sprachen beschränkt bleiben. Generalisierbar daran ist nur die allgemeine Eigenschafts-Affizierung von Indikation/Prädikation bzw. die Verbindung von Hinweis- und Aussage-Zeichen, wie sie auf die Verbal-Ebene der segmentalen Kettenbildung als "prädikatives Syntagma" projiziert wird (vgl. Abb. 41).

146

INDIKATIVE AKTUALISIERUNG DURCH AKTANTEN UND CIRCONSTANTEN Indikation/ Prädikation

Ketten- und Klassenbildung

Zwei-Zeichen-Satz

Syntagma

prädikatives Syntagma prädikatives Monem

+

Erweiterung

indikatives Monem

+

Erweiterung

Nicht-SAE

Subjekt

Prädikat

ABB. 41. Kategoriale Bestimmung des prädikativen Syntagmas in Hinsicht auf SAE- und NichtSAE-Sprachen.

XII

1.

SAPIRS SPRACHTYPEN

Damit wäre die Ableitung an einem Punkt angelangt, wo die noch ganz schematisch bestimmte Satz-Universalie in die Vielzahl möglicher Sprachformen und -gruppen entlassen werden muß. Ein erster Ansatzpunkt zu einer systematischen Durchdringung dieses Problems mag dabei in der Tatsache gesehen werden, daß es praktisch sehr schwierig sein kann, die genaueren Grenzen eines Monems (oder eines "Wortes") zu bestimmen, zumal es in Wirklichkeit "eine Unzahl möglicher Abstufungen zwischen der völligen Untrennbarkeit und der Verschmelzung einerseits und der gänzlichen Unabhängigkeit andererseits" bei den Satzelementen gibt (Martinet 1963, 105). Aus diesem Grunde wurde bisher nur ganz allgemein von Ketten- und Klassenbildung gesprochen, die besondere Art der Verkettung aber nicht präjudiziert. Spezifiziert man nun die logische Dimension von Indikation/Prädikation in der seriellen Dimension der Ketten- und Klassenbildung als prädikatives Syntagma (vgl. Abb. 41), so ist zunächst von dem einfachsten Fall auszugehen, daß Indikationsund Prädikations-Monem grundlegende, d.h. anschauliche Begriffe wie Gegenstände, Tätigkeiten, Eigenschaften usw. darstellen (vgl. Sapir 1961, 87,97). Wichtig ist dabei, daß hier eigentlich von der indikativen oder prädikativen Natur des Monems abzusehen ist, dieweil es nur um den Charakter des Anschaulichen geht, auf den das logische Relat von Indikation/Prädikation in verschiedener Weise projiziert werden kann (vgl. Abb. 40). Darum kann ein Satz aus nur einem Monem bestehen, wenngleich er erst bei zwei Monemen dem (denotativen) Kriterium der Verkettung genügt, mag aber gemäß dem Umfang der Erweiterung auch beliebig viele Moneme umfassen. Da ein solches Monem zugleich als Lexem, d.h. als relativ autonome Einheit aufgefaßt werden kann, von der weitere Einheiten ableitbar sind, soll es hier nach Sapir als "Wurzel-Element" bzw. "Radix-Element" (RaE) bezeichnet werden. Die vom RaE abgeleiteten Einheiten, dadurch von letzterem zu unterscheiden, "daß sie für Vorstellungen stehen, die für den Satz als Ganzes unwesentlich sind, die jedoch einen Zuwachs zu der Bedeutung des Wurzelelementes darstellen", seien "Ableitungs-Element" bzw. "Derivations-Element" genannt (Sapir 1961, 97).

148

SAPIRS SPRACHTYPEN

In dem Satz "the farm-er kills the duck-ling" bilden also "farm-" und "duck-" die sog. anschaulichen Radix-Elemente, "-er" und "-ing" die weniger anschaulichen, aber zu den Radix-Elementen gehörigen Derivations-Elemente. Sie tragen zwar zu einer "neuen Anschaulichkeit" bei, verändern aber als solche das Gefüge des "Satzbaus" nicht: Vom Gesichtspunkt des Satzes aus gesehen, sind die Ableitungs-Elemente -er und -ling lediglich Details der Struktur zweier vom Satz jeweils als Einheiten akzeptierter Ausdrücke (farmer, duckling). Die Gleichgültigkeit des Satzes als solchen, gegenüber der Art der Struktur seiner Wörter, zeigt sich in der Tatsache, daß ein Austausch der Wurzelelemente — z.B. man, 'Man' und chick, 'Hühnchen' für farmer und duckling — zwar den gedanklichen Inhalt des Satzes ändert, nicht aber seine Struktur (op. cit., 83-84).

[In obigem Beispiel von "man" und "farm-er" bzw. "chick" und "duck-ling" handelt es sich allerdings um lexematische Einheiten, die in einem weiteren Sinne auch für den "Satz" relevant sind. Wird doch in allen vier Fällen der Singular durch ein sog. "Null-Allomorph" indiziert, das nur zusammen mit dem "Nicht-Null-Allomorph" des Plural einen kontrastiven Funktionswert besitzt (vgl. S.223,229). Gerade die Tatsache, daß hier einerseits Rae sowie andererseits RaE + DeE gleichermaßen als Null-Allomorph des Singular erscheinen können, spricht aber für die engere Zugehörigkeit des DeE zum RaE als zum sonstigen Syntax-Verband, da es eine autonome lexematische Einheit stiftet. Die oben behauptete "Gleichgültigkeit" des Satzes gegenüber dem DeE kann sich also nur darauf beziehen, daß es im Verband mit dem RaE syntaktisch analog wie das RaE selbst behandelt werden kann.] Mit einem direkt zum RaE gehörigen DeE läßt sich nun auch ein abgeleitetes Element denken, das nur noch formal mit dem RaE verbunden ist, funktional aber eine gewisse Unabhängigkeit von letzterem erlangt hat, so daß es Beziehungen bezeichnen kann, die in ihrer Wirkung über das RaE grundsätzlich hinausgehen. Ein solches Element würde also mit dem RaE den Charakter des Anschaulichen, mit dem Satzzusammenhang aber den Charakter des unanschaulich Funktionalen teilen. Wiewohl es nicht mehr zur Wurzel gehört, wird es doch daran gefügt, ist aber mit letzterer weniger eng als das DeE verbunden. Da es die Relation zwischen anschaulichen Begriffen expliziert, sei es "Relations-Element" (ReE), wegen seiner Anlehnung an das RaE "Relations-Element, zum Radix-Element gehörig" (ReERa) genannt. — Wo jedoch dieses ReE völlig vom RaE befreit ist und für die syntaktische Beziehungsstiftung zur Verfügung steht, wäre im Unterschied zum gebundenen ReE vom "Relations-Element, zur Syntax gehörig" (ReEs y ) zu sprechen (op. cit., 98). So stellt etwa die Pluralbildung "Männ-er" von "Mann" im Deutschen einerseits eine syntaktische Beziehung her, modifiziert aber andererseits auch das RaE (durch Ablautung und Anfügen von "-er" an die Wurzel) so deutlich, daß sie weder zu den reinen Derivations-Elementen — die mit dem Satzganzen nichts zu tun haben — noch zu den von der Wurzel völlig befreiten Beziehungsbegriffen gerechnet werden kann (op. cit., 93).

SAPIRS SPRACHTYPEN

149

Hingegen hat das Suffix -s in dem Satz "the farmer kill-s the duckling" als RaEsy eine völlig abstrakte Funktion, indem es als bloßes Zufallszeichen gleichzeitig die Art der Aussage (Reihenfolge Subjekt-Verb), die Beziehung der Person (farmer als Subjekt, duckling als Objekt), die Zahl (farmer im Singular) und die Zeit (Präsens) zum Ausdruck bringt (op. cit., 88). [Die Abgrenzung des syntaktisch modifizierten ReERa bzw. des bereits zum "Satz" gehörigen Res y vom reinen DeR kann nach obiger Interpretation (vgl. S.148) nur so verstanden werden, daß hier in jedem Fall ein grammatisches Element manifest werden muß, weil es eine syntaktische Relation unmißverständlich festlegt. Anschaulich wird diese Funktion durch eine entsprechende "Auslaßprobe": "Ändert man irgendeine dieser Charakteristiken, dann erscheint der Satz sogleich als ein anderer — und zwar beziehungsmäßig, nicht inhaltlich" (Sapir 1961, 84). Da die RelationsElemente von Einzelsprache zu Einzelsprache verschieden fixiert sind bzw. den möglichen Relationen zwischen den Radix-Elementen in unterschiedlich expliziter Form gerecht werden, ist die entstehende Änderung durch obige "Auslaßprobe" im Sinne einer Verringerung des Explizitiertheits-Grades immer nur vom einzelsprachlichen Standpunkt aus nachzuvollziehen: "Ein kluger, feinfühliger Chinese, durch seine eigene Sprache an äusserste Sachlichkeit beim Gebrauch sprachlicher Formen gewöhnt, könnte angesichts des lateinischen Satzes wohl ausrufen: 'Welche Umstandskrämerei!'" (op. cit. 94).] Schon die Ableitung dieser vier Begriffsgruppen läßt deutlich erkennen, daß letztere keineswegs mit den innerhalb einer Sprache oder Sprachgruppe vorkommenden grammatikalischen Begriffen konform gehen. Vielmehr kann der gleiche (oder ähnliche) grammatische Begriff in verschiedenen Sprachen verschiedenen Begriffsgruppen zugehören, was Sapir etwa für den Pluralbegriff ausführt, aber auch für alle anderen Begriffsarten geltend macht (op. cit., 99-102). Das Sapirsche Begriffsschema erhebt also keinerlei Ansprüche auf inhaltliche Kongruenz zwischen den Begriffsgruppen und den grammatischen Kategorien, sondern läßt diese Bestimmung gerade offen, um als genereller Raster für diese Kategorien dienen zu können. Es handelt sich darum eher um ein — an den natürlichen Sprachen orientiertes — Suchschema, mit dem das Problem der Kategorienkontinuität zwischen den Weltsprachen überhaupt erst angegangen werden kann. Das Programm einer solchen universellen Aufgabe wird denn auch von Sapir mit den Worten umrissen: Es wäre wohl von Interesse aufzuzeigen, welches die am öftesten zur Bildung von Verben und Substantiven verwendeten Elemente der Gruppe II sind; unter welche verschiedenen Gesichtspunkten Substantive klassifiziert werden (nach dem Geschlecht, persönlich, Lebewesen und Nicht-Lebewesen, nach der Form, Sachnamen und Eigennamen); wie der Zahlbegriff ausgedrückt wird (Singular und Plural; Singular, Dual und Plural; Singular, Dual, Trial und Plural; Einzel-, Distributiv, Kollektivformen); welche Arten von Zeitstufen beim Verb und beim Substantiv vorkommen (die "Vergangenheit" kann unter anderem sein: unbestimmt; gerade geschehen; weitzurückliegend; mythisch; vollendet; vorvergangen); in welch minutiöser Weise gewisse Sprachen die Idee des Aspekts entwickelt haben (als

150

SAPIRS SPRACHTYPEN

momentanen Aspekt, Daueraspekt, Anfangs- und Endaspekt, Wiederholungs- oder Ergebnisaspekt oder als Kombinationen von all diesen); welche Aussageweisen (Modi) vorkommen (Indikativ, Konjunktiv, Potentialis, Optativ, Negation und viele mehr); welche Unterschiede der Person es gibt (wird "wir" z.B. als der Plural von "ich" aufgefaßt oder steht es zu "ich" in demselben Verhältnis wie "du" und "er"? beide Auffassungen sind vertreten; weiterhin: schließt "wir" denjenigen ein, den ich anspreche, oder ist das nicht der Fall? — "einschließliche" und "ausschließliche" Formen); welches Orientierungsprinzip d.h. welches System der sogenannten "hinweisenden" (demonstrativen) Wortarten zur Anwendung kommt ("dieser" und "jener" und die große Menge möglicher Zwischenbegriife; wie oft die sprachliche Form die Heikunkt und die Art der Kenntnis dessen, was der Sprecher sagt, zum Ausdruck bringt (beruht seine Kenntnis auf eigener Erfahrung, auf Hörensagen, auf Indizien?); in welcher Weise die syntaktischen Beziehungen beim Substantiv ausgedrückt werden (ist es Subjekt oder Objekt; bezeichnet es den Handelnden, das Werkzeug oder die betroffene Person? Hierher gehören auch die verschiedenen Arten des Genitivs und der indirekten Objektsbeziehung) und wie beim Verb (Aktiv und Passiv; Handlung und Zustand; transitiv und intransitiv; unpersönlich; rückbezüglich (reflexiv); reziprok; sowie eine Menge anderer näherer Bestimmungen des Beginns und des Abschlusses der Tätigkeit) (op. cit., 103-105).

Zusammenfassend hebt Sapir hervor, daß die grammatikalischen Bedingungen einzelner Weltsprachen typologisch von geringerer Bedeutung als die grundsätzlichen Unterschiede seien, die sich aufgrund der kontinuierlich konzipierten Begriffsgruppen ergäben. Indirekt spricht er sich also für eine Methode der systematischen Feldeingrenzung aus, gemäß welcher die grammatischen Begriffe verschiedener Weltsprachen erst dann vergleichbar sind, wenn sie von einem "feldüberdeckenden" Raster erfaßt wurden (op. cit., 105). [An dieser Stelle mag es angebracht erscheinen, einige Anmerkungen über die allgemeine Brauchbarkeit des Sapirschen Typologie-Ansatzes für die vorliegende Ableitung zu machen. Zunächst ist hervorzuheben, daß sich die gewisse "Zeitlosigkeit" dieses Ansatzes insofern aus seiner Zielsetzung erklärt, als Sapir nicht so sehr das technische Rüstzeug für den Sprachwissenschaftler bieten als seine Auffassung vom Phänomen "Sprache" darlegen will, deren Weitblick (über vier Jahrzehnte hinweg) sich vor allem aus der Tatsache erklärt, daß er sich schon damals dem NichtSAE-Sprachgebiet der Nord-Amerikanischen Indianer-Sprachen (NAI-Sprachen) als "dreifacher Spezialist", nämlich als Linguist, Ethnologe und Psychologe zuwandte (vgl. "Einführung" von W. G. Moulton, Princeton, N. J. in: Sapir 1961, 7-9). Es ist denn auch kein Zufall, daß der bekanntgewordene Terminus der "StandardAverage-European-Sprachen" (SAE-Sprachen) gerade von Whorf stammt, der 1931 bei Sapir in Yale indianische Linguistik studierte und seine sprachphilosophischen Thesen unter dem Eindruck der traditionsfremden NAI-Sprachen (Hopi, Shawnee, Nootka usw.) formulierte (Whorf 1963; Pinnow 1964, XIV; vgl. S.115). Für die heutige Brauchbarkeit des Sapirschen Typologie-Ansatzes spricht u.a., daß ein moderner NAI-Sprachen-Spezialist wie Pinnow auf die von Sapir in der Encyclopedia Britannica (14th Ed., Vol. 5, London 1929) zugrundegelegte Gruppierung der Nordamerikanischen Sprach-Familien zurückgeht, die in einem umfas-

SAPIRS SPRACHTYPEN

151

senden Werk wie Les Langues du Monde (Meillet & Cohen 1952) nur in Einzelheiten abgeändert wurde (vgl. die Literatur-Diskussion: Pinnow 1964, 2-4, 24-25). — Weiterhin kann eine wesentliche Uberlebens-Chance dieses Ansatzes darin gesehen werden, daß die traditionellen Beschreibungsbegriffe nicht einfach aufgegeben, sondern in modifizierter Form weiterverwendet wurden und somit eine gewisse Kontinuität zwischen dem "Alten" und dem "Neuen" herzustellen vermochten (vgl. W. G. Moulton: Sapir 1961, 9). Wie günstig die Ausgewogenheit des Sapirschen Deskriptions-Systems noch in der gegenwärtigen Forschergeneration beurteilt wird, geht u.a. aus einer Bemerkung G. A. Millers hervor, in der er die "allgemeine Akzeptabilität" dieser Typologie gerade dem Umstand zuschreibt, daß hier auf eine Kategorisierung im üblichen Sinne verzichtet wird (1954, 700). Die Flexibilität dieses Systems ist denn auch darin zu sehen, daß es in seiner Grundkonzeption als "Polaritäts-Kontinuum" mit feldeingrenzendem Charakter einer universellen Minimal-Bedingung entspricht, in seiner Verbindung mit der inter- bzw. intra-spezifischen Modifikation von Sprechsilben (Abb. 45) aber doch zu allgemeinen Sprachtypen kombinierbar (Abb. 43) und zur praktischen Klassifizierung von Einzelsprachen aller Kontinente brauchbar (Tab. 6) ist. Wegen dieser interaktiven Verschränkung von morphophonemischen und syntaktischen Kriterien ist es auch geeignet, den systematischen Übergang von der "organismischen Vollzugsordnung" zur "formalen Ausschreibordnung" innerhalb der Ableitungs-Hierarchie des Modell-Universums zu bilden (Abb. 46). Ein weiterer Grund für die Einbeziehung der Sapirschen Begriffs-Konzeption kann in ihrer flexiblen Anwendbarkeit auf syntaktische Grundeinheiten gesehen werden, die durch sie schematisch fixierbar sind, ohne daß ihre besondere Form in einer gegebenen Einzelsprache deswegen explizitiert werden müßte. D a auch die SatzUniversalie (prädikatives Syntagma) schematisch offen sein muß, wenn sie als Rahmen-Charakterisierung verschiedener Weltsprachen dienen soll, bietet sich insofern eine Verschränkung beider Ansätze an, als sie sich bei dimensionaler Verschiedenheit auf dieselben syntaktischen Grundeinheiten (Indikations- und PrädikationsMonem) beziehen lassen. Trotz dieser möglichen Integrierung beider Konzeptionen kann jedoch die kombinatorische Ausfaltung des Polaritäts-Kontinuums in die Vielzahl möglicher Sprachformen und -gruppen auch als eine derivatorische "Seitenlinie" im Modell-Universum angesehen werden, die zwar die mögliche Anwendungs-Breite der Satz-Universalie demonstriert, zur weiteren Universalien-Bestimmung aber nur insoweit "fundierend" ist, als sie die organisatorische Zentralität des Prädikations-Monems gegenüber den indikativen ("deiktischen") Elementen bzw. die Greenbergsche "ProximitätsHierarchie" unterbauen hilft, die als endozentrische Konstruktion gewisse Positionalitäts-Funktionen innerhalb der Basisordnung versieht (vgl. S.177-178, 223). Als mehrfach anwendbare Formel dürfte das Sapirsche Polaritäts-Kontinuum somit ein Integritätsmoment darstellen, dessen sprachpsychologische Relevanz für die Universalien-Bestimmung erst im morphologischen Zusammenhang des

152

SAPIRS SPRACHTYPEN

Modell-Universums voll zu ermessen ist, weil hier die sonst nur nebeneinanderstehenden Teilaspekte in einer feldmäßig aufbereiteten Gesamt-Konzeption das ganze Beziehungsnetz dimensionaler Verflechtung erkennen lassen.] Nach dieser Bestimmung der Begriffsgruppen nimmt also die Anschaulichkeit vom unabhängigen Radix-Element über das Derivations- zum Relations-Element immer mehr ab. Dabei hat der qualitative Unterschied zwischen dem mehr anschaulichen oder mehr funktionalen Element einer Aussage zugleich eine quantitative Implikation, dieweil eine Aussage um so mehr funktionale Elemente enthalten muß, je komplexer sie ist, d.h. je mehr Relationen zwischen den anschaulichen Begriffen möglich sind. Während die aus einem Monem bestehende Aussage noch gar keine externe Relation andeuten kann, bei zwei Monemen aber (wegen der indizierenden Wortstellung — vgl. op. cit., 90) noch nicht andeuten muß, gerät die aus beliebig vielen Monemen bestehende Aussage zu einem syntaktischen Chaos, falls die Fülle der möglichen Beziehungen nicht durch die explizierenden Relations-Elemente auf ein überschaubares Maß reduziert ist. Verbindet man das prädikative Syntagma, bzw. die aus prädikativem, indikativem Monem und deren Erweiterung bestehende Satz-Universalie mit diesem Begriffsbildungs-Schema Sapirs, so läßt sich eine Art "Genealogie" sprachgenetischer Ausgliederung konzipieren, die einen kontinuierlichen Übergang zu der Fülle möglicher Sprachformen erlaubt. Da sowohl das prädikative wie auch das indikative Monem zu den anschaulichen Grundbegriffen Sapirs rechnen (op. cit., 97), muß nämlich die Derivation in jedem Fall vom RaE ausgehen, so daß es zunächst gleichgültig ist, ob die Ableitung vom prädikativen oder indikativen Monem ausgeht. Beide können vielmehr in analoger Weise beschrieben werden, da sie den anschaulichen Pol darstellen, der sich gegenüber dem unanschaulichen, funktionalen Pol befindet, so daß ein Kontinuum von RaE über das DeE und das ReERa zum ReEs y angenommen werden kann. Wie fließend auch immer die Übergänge vom RaE zum ReE sein mögen, es läßt sich doch festhalten, daß es sich um eine Polarisierung handelt, die immer beim RaE beginnen muß, da das ReE erst benötigt wird, wenn die Beziehung zwischen anschaulichen Begriffen explizit gemacht werden soll. Die allmähliche Ablösung des ReEs y aus dem RaE wird dabei durch das noch völlig gebundene DeE bzw. das noch nicht völlig freie ReERa deutlich markiert (vgl. Abb. 42). Setzt man RaE und ReE als universelle Pole der linguistischen Begriffsbildung an, so ist weiterhin evident, daß jeder Pol umso mehr durch den gegenüberliegenden Pol modifiziert sein muß, je weiter man sich von dem Extremwert des reinen RaE bzw. des reinen ReE entfernt: und zwar wird das reine RaE ( R a E m o d - ) durch das ReERa bzw. durch das DeE zum modifizierten RaEmod+), während umgekehrt das reine ReE (ReEm0d_) in der gemischten Form des ReERa zum modifizierten ReE (ReEmoa+) wird. Auf diese Weise ist es möglich, nicht nur von den beiden Polen der Begriffs-

153

SAPIRS SPRACHTYPEN

prädikatives Syntagma prädikatives Monem

+ indikatives + Erweiterung Monem

RaE

RaE

RaE—DeE

RaE—DeE

RaE—DeE ReE aa RaE—DeE RaE—DeE ReEsy RaE—DeE RaE Radix-Element DeE Derivations-Element ReEiia Relations-Element, mit RaE verbunden ReEsy Relations-Element, nicht mit RaE verbunden, d.h. syntaktisch frei verfügbar ABB. 42. Spezifizierung des prädikativen Syntagmas durch die Sapirschen Begriffsgruppen. bildung, sondern auch von der gegenseitigen Modifizierung oder Nicht-Modifizierung der Pole zu sprechen (vgl. Abb. 43).

Reine Beziehungs-Sprache (1) einfach Rat:

Gemischte Beziehungs-Sprache

I, IV +

(3) einfach gemischt Hos

RaE

(2) kombiniert

I, II, IV

+ +

I, III ReE„

'Ra