195 59 21MB
German Pages 264 [265] Year 1976
LINDNER • DER SPRECHBEWEGUNGSABLAUF EINE PHONETISCHE STUDIE DES DEUTSCHEN
SAMMLUNG AKADEMIE-VERLAG
33
SPRACHE
GERHART LINDNER
DER SPRECHBEWEGUNGSABLAUF Eine phonetische Studie des Deutschen
Mit 20 Abbildungen im Text
AK A DEMI E -V E R L A G
1975
B E R L I N
Erschienen im Akademie-Verlag, 108 Berlin, Leipziger Straße 3—4 © Akademie-Verlag, Berlin, 1975 Lizenznummer: 202 . 100/123/75 Gesamtherstellung: IV/2/14 VEB Druckerei »Gottfried Wilhelm Leibniz«, 445 Gräfenhainichen • 4397 Bestellnummer: 7521129 (7533) . LSV 0805 Printed in GDR EVP 24,50
Vorwort
Bei Fachdiskussionen habe ich immer prinzipiell Zustimmung gefunden, wenn ich Gedanken entwickelte, die zum Inhalt hatten, d a ß die bloße Beschreibung der Positionen, die die Sprechorgane bei der Bildung der Sprachlaute einnehmen, nicht ausreicht, um daraus Regeln für die Korrektur des Sprechvorgangs abzuleiten. Wenn dagegen konkrete Methoden diskutiert wurden, gingen die Meinungen, wie eine solche Weiterentwicklung der phonetischen Betrachtungsweise zu verwirklichen sei, stark auseinander. Wo Diskussionen nicht weiterhelfen, müssen das Experiment und seine Auswertung weiterführen. Sicher ist der in dieser Schrift vorgelegte Lösungsansatz nicht der einzige Weg, die statische Betrachtungsweise in der Phonetik aufzuheben, aber es ist ein Lösungsansatz mit durchgehender Systematik auf einer experimentellen Grundlage. Die Schrift ist aus Forschungsarbeiten hervorgegangen, die das Ziel haben, das starre Schema aufzulösen, in dem die beschreibende Phonetik verharren muß, wenn sie nur von den Lauten und den ihnen eigenen typischen Positionen der Sprechorgane ausgeht. Sie ist zwar Ergebnis mehrjähriger Forschungsarbeiten, stellt aber noch nicht deren Endzustand dar. Mit der hier gegebenen systematischen Darstellung haben aber die Forschungen eine Stufe erreicht, die eine Zusammenfassung der Einsichten und Erkenntnisse rechtfertigt. Damit dürfte eine Grundlage sowohl für die praktische Anwendung als auch für weitere Diskussionen gegeben sein. Seit der Fertigstellung des Manuskriptes sind die Forschungsarbeiten nach verschiedenen Richtungen hin weitergegangen und vervollkommnet worden: in bezug auf die Darstellung der aus den RöntgenZeitlupen-Filmaufnahmen ermittelten Bewegungen, in bezug auf die Ermittlung von organbezogenen und komplexen Sprechbewegungsabläufen mit Hilfe von Datenverarbeitungsanlagen und in bezug auf
VI
Vorwort
den Zusammenhang zwischen den Sprechbewegungen und den davon abhängigen Klangveränderungen des Schallspektrums. Daß diese Weiterführungen der ursprünglichen Forschungslinie bisher erfolgreich verlaufen sind, bestärkt meine Ansicht, daß der hier vorgelegte Forschungsansatz sowohl in seiner Grundposition als auch in seiner Zielrichtung richtig ist, wahrscheinlich aber nicht in allen Einzelheiten. Mein Dank gilt allen, die sich in Form von Kritik oder Vorschlägen an der Verbesserung dieses Manuskriptes beteiligt haben. Besonders möchte ich den Mitarbeitern meines Bereiches und den Diplomanden danken sowie Herrn G. Hausmann, Frau M. Hochmuth, Herrn Dipl.-Ing. Mehnert, Frau Dr. U. Müller und Frl. E.-M. Reuß. Mein Dank gilt auch den Gutachtern Prof. Dr. G. F. Meierund Prof. Dr. E. Stock, die wertvolle Hinweise für die Überarbeitung und die Weiterentwicklung der Hauptgedanken gegeben haben. Wie schon so oft hat mich auch bei der stilistischen Überarbeitung dieses Manuskripts meine Frau tatkräftig unterstützt. Nicht zuletzt gilt auch mein Dank dem AkademieVerlag. Berlin, Januar 1975
Gerhart Lindner
Inhalt
1. 1.1. 1.2. 1.3. 1.4. 1.5. 1.6.
Lautsprachliche Kommunikation Bedeutung der Sprache für die Gesellschaft Stellung der Lautsprache in der gesellschaftlichen Kommunikation Lautsprachliche Zeichen und ihre Strukturen Aspekte der Übermittlung lautsprachlicher Zeichen . . . . Genese lautsprachlicher Zeichen Zielstellung für die Untersuchung
2. 2.1.
1 1 4 7 15 18 26
Artikulationsorgane und ihr Funktionsinventar Organe für die Steuerung und Koordinierung der Sprechbewegungen 2.2. Organe für die Kontrolle der Sprechbewegungen 2.3. Organe für die Ausführung der Sprechbewegungen 2.3.1. Organe für die Atmung und ihr Funktionsinventar 2.3.2. Organ für die Stimmgebung 2.3.3. Organe für die Artikulation
30 34 36 45 46 49 52
3. 3.1. 3.2. 3.3.
Methoden für die Analyse des Sprechbewegungsablaufs . . . Strukturelle Analyse Akustische Analyse Physiologische Analyse
60 65 71 74
4. 4.1. 4.2. 4.3. 4.4.
Statistik der Lautfolge-Strukturen Ziel der statistischen Untersuchungen Methode der Lautfolge-Statistik Ergebnisse der Statistik Ein Testsatz für die Anwendung der häufigsten LautfolgeStrukturen
77 77 80 83
5. 5.1. 5.2. 5.3.
Experimentelle Analyse Analyse der Sprechbewegungen mit Hilfe des Röntgenfilms . Analyse der äußerlich sichtbaren Bewegungen Analyse des akustischen Signals
100 107 113 115
97
VIII
Inhalt
6. 6.1.
Ansatz für ein Modell des Sprechbewegungsablaufs . . . . Die einzelnen Laute des Systems — Voraussetzungen für das Grundgerüst 6.2. Die Organeinstellungen bei den Lauten 6.2.1. Einstellungen bei den Vokalen 6.2.2. Einstellungen bei den Konsonanten 6.3. Systematik der Bewegungsarten 6.4. Bewegungen bei Lauten in Verbindungen 6.5. Problem der Erfassung der Bewegungsschwierigkeit . . . . 6.6. Vergleich der Bewegungsschwierigkeit mit den häufigsten Stammelfehlern
129 131 131 139 149 155 175
7. 7.1. 7.2. 7.3. 7.4. 7.5. 7.6. 7.7.
188 196 201 208 216 224 230 236
Praktische Anwendungen des Sprechbewegungsmodells . . . Darstellung der normalen Sprechweise in der Hochlautung . Umgangssprachliche Reduzierungen Entwicklung der Sprechbewegungen beim Kleinkind . . . . Anbildung der Sprechbewegungen bei Gehörlosen Korrektur von Sprechbewegungen in der Logopädie . . . . Konfrontation der Bewegungen im Fremdsprachenunterricht Abschließende Gedanken
Literatur Sachregister
120
181
241 249
1. Lautsprachliche Kommunikation
1.1. B e d e u t u n g d e r Sprache f ü r die Gesellschaft Jeder Mensch als Glied der Gesellschaft ist von Sprache umgeben. E r benutzt die Sprache, u m am gesellschaftlichen Leben teilzunehmen, sei es am Arbeitsprozeß, am Leben der Familie oder an einem kulturellen Ereignis. Lernprozesse, Beeinflussungen anderer Menschen, gesellschaftliches Zusammenwirken, wie es zur Bewältigung großer u n d f o r t schrittlicher Aufgaben der Menschheit benötigt wird, sind ohne Sprache undenkbar. Der einzelne n i m m t am gesellschaftlichen Gesamtprozeß teil, indem er sprechend und hörend, lesend u n d schreibend aktiv wird. Ohne sprachliche Aktivität ist die Teilnahme am gesellschaftlichen Leben nicht möglich. Wenn die sprachliche Tätigkeit behindert ist, dann ist auch die Eingliederung in die Gesellschaft erschwert. D a ß der Mensch die Fähigkeit der Sprachverwendung besitzt, ist so selbstverständlich, daß sich die meisten Menschen über diese grundlegende Fähigkeit keine Gedanken machen. Gerade deshalb h a b e n sich Philosophen u n d Sprachwissenschaftler mit der komplizierten Frage beschäftigt, was eigentlich die Sprache ist u n d wie es k o m m t , daß sie im Leben der menschlichen Gesellschaft sowohl f ü r den einzelnen, als auch f ü r die Gesellschaft als Ganzes eine so große Rolle spielt. KARL MARX schrieb in der Deutschen Ideologie (S. 30, 432): „Die Sprache ist so alt wie das Bewußtsein — die Sprache ist das praktische, auch f ü r andere Menschen existierende wirkliche Bewußtsein, u n d die Sprache entsteht, wie das Bewußtsein, erst aus dem Bedürfnis, d e r N o t d u r f t des Verkehrs mit anderen Menschen . . . Die u n m i t t e l b a r e Wirklichkeit des Gedankens ist die Sprache." I n diesem b e k a n n t e n Zitat kommt die enge Beziehung zwischen Sprache u n d Bewußtsein zum Ausdruck. Damit ist die H a u p t f u n k t i o n der Sprache f ü r den Menschen in seiner Eigenschaft als bewußt denkendes u n d handelndes gesellschaftliches Wesen gekennzeichnet.
2
1. Lautsprachliche Kommunikation
Aber damit ist die Reichhaltigkeit des Begriffes Sprache noch nicht •erschöpft. Andere Seiten dieses bedeutsamen u n d vielgebrauchten gesellschaftlichen Kommunikationsmittels werden deutlich, wenn andere Anwendungsformen der Sprache im Auge behalten werden. HuBiiistein h a t den Gedanken von Marx konkretisiert und von der Aktion her gefaßt, wenn er sagt: (1958, S. 505) „Durch die Sprache wird das Bewußtsein des einen Menschen dem anderen zugänglich . . . D a s Sprechen ist die Existenzform des Bewußtseins (der Gedanken, Gefühle, Erlebnisse) für den anderen, die als Mittel des Verkehrs mit ihm dient, es ist die F o r m der verallgemeinerten Widerspiegelung der Wirklichkeit oder die Existenzform des Denkens." Hierin k o m m t zum Ausdruck, daß die Sprache a n die Handlung der Menschen in der Gesells c h a f t gebunden ist. Man h a t den Begriff der Sprache auch auf das Zeichensystem beschränkt, u n d damit losgelöst von der Aktion, durch die sie immer u n d immer wieder von der menschlichen Gesellschaft als Ganzes gebraucht wird. D a n n bewegt m a n sich aber auf einer Ebene d e r Abstraktion, bei der die Gefahr besteht, daß m a n sich von der Wirklichkeit löst. W e n n Kopnin (S. 145) schreibt: „Die Sprache ist die Existenzform des Wissens in Gestalt eines Zeichensystems. Daher t r i t t auch das Wissen selbst immer in Gestalt irgendeiner Sprache auf", d a n n ist das, f ü r sich betrachtet, richtig. I n einer solchen Auffassung liegt, wenn sie nicht •ergänzt wird, die Gefahr, die Sprache rein als Zeichensystem zu bet r a c h t e n u n d von der Aktion handelnder Menschen zu lösen. Die Sprache als Zeichensystem existiert n u r so lange, wie sie von Menschen innerhalb der Gesellschaft zur Kommunikation verwendet wird. Man k a n n sich einen einzelnen Menschen vorstellen, der ohne Sprache existiert, aber nicht die menschliche Gesellschaft. E s wäre ein Fehler, die Sprache als Gebilde oder System von Zeichen unabhängig von ihrer gesellschaftlichen F u n k t i o n u n d Aufgabe darstellen oder untersuchen zu wollen, wie es in der bürgerlichen Sprachwissenschaft geschieht, vor allem, wenn m a n sich dabei auf formale Merkmale des Zeichensystems beschränkt. „Die marxistische Sprachwissenschaft sieht das entscheidende Wesensmerkmal der Sprache in ihrer kommunikativen Funktion, d. h. in ihrer Rolle, dem Menschen als Mittel der Verständigung und des gegenseitigen Verkehrs zu dienen. D a m i t richtet sich das Augenmerk auf die bedeutungsvolle Grundtatsache, daß die Sprache ihrer E n t s t e h u n g u n d ihrer F u n k t i o n nach gesellschaftlich bestimmt ist. Sie ist nicht als
1.1. Sprache und Gesellschaft
3
Mittel des Ausdrucks und der Darstellung der eigenen Individualität des Einzelwesens und als individuelle geistige Schöpfung entstanden, •sondern aus den Bedürfnissen eines gemeinsam handelnden Gesellschaftskörpers." ( W . SCHMIDT, 1967, S. 20) Ohne daß die Sprache in •der gesellschaftlichen Kommunikation täglich neu verwirklicht wird, ist sie auch als abstraktes Gebilde nicht denkbar und faßbar. Als Mittel der gesellschaftlichen Kommunikation ist die Sprache sehr vielgestaltig verwendbar. Mit ihrer Hilfe lassen sich die sehr reichhaltigen menschlichen Bewußtseinsinhalte zum Ausdruck bringen. Die •engsten Beziehungen bestehen zwischen Sprache und Denken, der wichtigsten Bewußtseinstätigkeit bei der Gewinnung neuer Erkenntnisse. Trotz der sehr engen Beziehungen zwischen Sprache und Denken dürfen sie jedoch nicht als identisch betrachtet werden. „Da die Sprache die Vorbedingung für die Entstehung des Denkens ist, ist sie zugleich notwendige materielle Hülle des Gedankens, seine unmittelbare Wirklichkeit für die anderen und für uns selbst." (RUBINSTEIN, 1962, S. 150) Indem wir die Sprache gebrauchen, müssen wir die Wirklichkeit, die wir beschreiben wollen, aus der Gleichzeitigkeit der Vorstellungen, gleichsam einem Nebeneinander, in ein Nacheinander umformen. Dabei besteht die zusätzliche Aufgabe, alle Glieder einer solchen Gedankenkette miteinander in vernünftige, für den andern verständliche Beziehungen zu bringen. Die Schwierigkeiten, das Neben•einander der Bestandteile komplizierter Gedanken bei der sprachlichen Darstellung in ein Nacheinander zu bringen, steigen mit dem Umfang und der Kompliziertheit der Gedanken. Entsprechend den Grundbedingungen der menschlichen Sprache, bei der Kommunikation ein Zeichen nach dem andern auszusprechen bzw. aufzunehmen, baut auch •die Lehre vom Denken, die traditionelle Lehrweise der Logik, auf der Form des Nacheinander auf. Das Denken ist jedoch nicht die einzige Bewußtseinstätigkeit. Mit Hilfe der Sprache ist der Mensch fähig, alle Bewußtseinsinhalte auszudrücken und auf andere Menschen einzuwirken. Die Sprache ist gleichzeitig Mittel des Ausdrucks und Mittel der Einwirkung auf andere Menschen. Beide Seiten sind miteinander zu einer unlösbaren Einheit verbunden. In der praktischen Kommunikation des täglichen Lebens treten andere als rationale Momente stärker in den Vordergrund, die aber für das gesellschaftliche Zusammenleben wichtig sind. „Die .Sprache dient. . . auch dazu, Intentionen (Strebungen) und Emotionen ettiar der Zunge zu beschreiben. Dagegen sind die Einstellungen der Zunge bei einzelnen L a u t e n häufig u n d gut dargestellt, oder es sind die K o n t a k t e einzelner Zungenteile ( z . B . der Zungenspitze) ermittelt worden. Aber eine Gesamtdarstellung der Bewegungen der Zunge oder aller Sprechorgane gleichzeitig ist bisher noch nicht möglich gewesen. Selbst wenn es gelingen sollte, die einzelnen Bewegungsabläufe erfaßbar zu machen, so spielt f ü r eine reale Abbildung u n d Darstellung des Bewegungsablaufs auch das Tempo in der Bewegung der einzelnen Organe eine sehr große Rolle. Darüber gibt es f ü r einzelne Organe zwar Informationen, f ü r den Bewegungsablauf als Ganzes aber fehlen sie zum größten Teil. Daher m u ß es eine Aufgabe der zukünftigen Forschung sein, durch genaue Analysen des Ablaufs der Bewegungen der Sprechorgane möglichst viele der noch fehlenden Angaben experimentell zu ermitteln u n d theoretisch auszuwerten.
5*
3. Methoden für die Analyse des Sprechbewegungsablaufs
Wenn auch die Sprechbewegungen eine notwendige Grundlage der lautsprachlichen Kommunikation sind, wenn es auch leicht möglich ist, die daran beteiligten Organe anzugeben, so ist es doch schwer, einfache Methoden zu nennen, die eine vollkommene Analyse des Sprechbewegungsablaufs ermöglichen. Bisher gibt es eine solche Methode nicht, und wahrscheinlich wird es in absehbarer Zeit auch keine geben, die ein vollkommenes Abbild der Sprechbewegungen liefert. Bisher ist zweierlei möglich gewesen: 1. den Bewegungsablauf eines oder mehrerer Organe, die an der Erzeugung der lautsprachlichen Zeichen beteiligt sind, genau zu verfolgen und 2. die Einstellungen aller beteiligten Organe an der Bildung eines Lautes zu ermitteln. Zur Registrierung der Atembewegungen ist die Pneumographie mit Erfolg eingesetzt worden (GTTTZMANN), auch die Myographie (GERIOKE). Sogar die Röntgenkinematographie ist zur Ermittlung von Teilbewegungen, z. B. des Zwerchfells, eingesetzt worden ( S H I N K I N , S . 283ff.). Zur genauen Ermittlung der Vertikalbewegungen des Kehlkopfes ist auch die Pneumographie verwendet worden, zur Klärung des Verlaufs der Stimmlippenschwingungen (unter unphysiologischen Bedingungen der Einstellung der Artikulationsorgane) der Hochgeschwindigkeitsfilm, zur Beobachtung der Schwingungsabläufe, vorausgesetzt, daß sie regelmäßig verlaufen, die Ströboskopie oder die Strobo-Kinematographie. ( L O T H S I N G E R - A R N O L D ) Bei der Ermittlung der Bewegungen der Artikulationsorgane sind bisher die verschiedensten Methoden zur Anwendung gekommi n, um einzelne Organe in ihrem Bewegungsablauf oder Teilen ihres Bewegungsablaufs zu erfassen. Nur einige sollen genannt werden: die Labiographie, Geniographie, die Ermittlung des Zungenkontaktes mit den Zähnen auf pneumatischem oder elektrischem Wege, kinematographische Aufnahmen der Bewegungen der Lippen mit und ohne Markierungen,
3. Analyse des Sprechbewegungsablaufs
61
röntgenkinematographische Aufnahmen, vor allem von der Zunge, Filmaufnahmen von Bewegungen der Sprechorgane bei großen Defekten in Wangen und Kiefer. Alle diese vielfältigen Methoden zeigen, wie m a n sich bemüht hat, den Bewegungsablauf der Sprechorgane zu ermitteln, weil unsere K e n n t nisse darüber eben begrenzt sind, weil die Empfindungen, die wir beim Sprechen haben, unvollkommen, begrenzt und flüchtig sind. Aber alle diese Methoden, so scharfsinnig und genial sie im einzelnen erdacht und eingesetzt worden sind, vermitteln nur ein Abbild des Bewegungsablaufs eines Organs oder einer geringen Zahl von Organen, die in dem Gesamt der beim Sprechbewegungsablauf aktiv beteiligten Organe in der Minderzahl bleibt. Aus der Bewegung eines oder mehrerer gleichzeitig beobachteter Organe ergibt sich noch nicht der Bewegungsfcorapfec in seiner Gesamtheit, weil eben bei einer solchen Einzelanalyse nur die Veränderungen eines oder einiger weniger Organe im Verlauf der Zeit ermittelt werden können. Das lautsprachliche Zeichen entsteht aber in einem Zusammenwirken aller am Produktionsakt der lautsprachlichen Zeichen beteiligten Organe. Infolgedessen f ü h r t eine Bewegungsanalyse einzelner Organe, so wertvoll diese Erkenntnisse sind, in bezug auf die Darstellung des komplexen Bewegungsablaufs zu einer unvollständigen Lösung. Da dieser Widerspruch bereits sehr zeitig erkannt worden ist, haben auch die Bemühungen, durch Verwirklichung des 2. Prinzips, eine lange Tradition. Unter Verzicht auf den zeitlichen Ablauf ist es möglich, die Einstellung aller am Produktionsprozeß lautsprachlicher Zeichen beteiligten Organe exakt zu erfassen und das zu diesem Zeitpunkt erzeugte akustische Produkt zu ermitteln, sowie die Relationen zwischen Einstellung und Klangprodukt herzustellen. Diese Methode wurde sogar häufiger angewandt, und sie hat in letzter Konsequenz zur Formulierung einer mathematischen Theorie der Akustik der Sprachlaute durch F A N T geführt. Die Experimentaltechnik hat bei der detaillierten Ermittlung der Organeinstellungen bei der Produktion bestimmter akustischer Effekte über die bereits genannten Verfahren hinaus Erweiterungen erfahren, wobei in erster Linie die Palatographie und die Röntgengeschichtaufnahme zu nennen sind. Bei den Röntgenschichtaufnahmen ist es möglich, die Form der Zungenoberfläche auch in der Sicht von vorn festzuhalten. Dieser Aspekt sei hier angeführt, weil sich damit zusätzliche Einsichten gewinnen lassen.
62
3. Analyse des Sprechbewegungsablaufs
Doch haben alle diese Methoden nur zu vervollkommneten Einsichten in die momentane oder gehaltene Stellung der Organe beim Sprechvorgang geführt. Somit kann man zusammenfassen: Die bisher entwickelten Methoden ermöglichen es, entweder den vollständigen Bewegungsablauf einzelner Organe beim Sprechen zu erfassen oder die Einstellung aller Organe in einem bestimmten Moment oder einer bestimmten Einstellungsphase des Sprechbewegungsablaufs. Es ist heute noch nicht möglich, den Bewegungsablauf einer Vielzahl von Sprechorganen gleichzeitig in ihrem zeitlichen Verlauf direkt zu ermitteln. Die Aufgabe, den Sprechbewegungsablauf als Komplex zu ermitteln, um ihn beschreiben, lehren und wissenschaftlich bearbeiten zu können, ist mit direkt registrierenden Methoden zum gegenwärtigen Zeitpunkt nicht lösbar. Auch die Möglichkeit, viele Methoden der Verlaufsregistrierung einzelner Organe gleichzeitig zu ermitteln und durch eine Vielzahl von Geräten den Bewegungsablauf als komplexes Geschehen zu ermitteln, wie es von Z W A A R D E M A R K E R und M E N Z E R A T H in Angriff genommen worden ist, scheidet aus, da mit jeder direkten Registriermethode ein Eingriff in die Bewegungsfähigkeit der Versuchsperson erfolgt. J e mehr man sie in ihrer Bewegungsfähigkeit und -freiheit einschränkt, desto mehr wird der natürliche Bewegungsablauf beeinflußt und verfälscht. Damit dürfte deutlich werden, daß auch der Weg, die direkt registrierenden Methoden zu vervollständigen, zu erweitern und zu kombinieren, auf Hindernisse stößt, die in der Beeinflussung der Versuchsperson und damit in einer Verfälschung der natürlichen Sprechweise liegen. Diese Überlegungen zeigen, daß die direkten Methoden allein keine Lösung der gestellten Aufgabe ermöglichen. Deshalb müssen die effektivsten Verfahren der direkten Methoden durch indirekte Methoden ergänzt werden. Aus dem Vorgang der lautsprachlichen Kommunikation ist zu schließen, daß die lautsprachlichen Zeichen, die im Bewegungsvollzug der Sprechorgane erzeugt werden, im akustischen Signal abgebildet werden. Wir können davon ausgehen, daß der Kommunikationsvorgang als gesellschaftlich wichtige Bedingung funktioniert, daß er eine eindeutige Übermittlung der Zeichen gewährleistet und daß er so sicher ist, daß die Lautsprache ihre beherrschende Stellung in der Kommunikation der menschlichen Gesellschaft erringen konnte. Deshalb spiegelt sich die Differenziertheit des Bewegungsvorgangs der Sprechorgane auch in der inneren Differenziertheit des akustischen Signals wider. Deshalb sind Aufnahme und Verarbeitung lautsprachlicher
3. Analyse des Sprechbewegungsablaufs
63
Zeichen so beschaffen, daß eine eindeutige Perzeption Zustandekommen kann und auch die Kontrolle des erzeugten Zeichens möglich wird. Deshalb bildet die Untersuchung der akustischen Seite der vom Sprecher erzeugten lautsprachlichen Zeichen eine notwendige und wesentliche Ergänzung der Methoden zur direkten Erfassung des Bewegungsablaufs der Sprechorgane. Allerdings ist die Beziehung zwischen den Ergebnissen der Methoden zur Ermittlung von Bewegungen oder Einstellungen der Sprechorgane und der indirekten Methode, die sich auf das im Vollzug der Sprechbewegungen erzeugte lautsprachliche Zeichen stützt, keine einfache und reversibel eindeutige Beziehung. Sie ist nicht so einfach, daß bestimmten Organbewegungen ganz bestimmte akustische Effekte, die isoliert angegeben werden könnten, entsprächen. Jede Bewegung, jede Veränderung in der Einstellung der Organe, f ü h r t zwar zu einer Veränderung im Gesamtklang. Und es ist prinzipiell möglich, von einer Veränderung der Einstellung auf die entstehende Veränderung im Gesamtklang zu schließen; jedoch ist es auch möglich, d a ß eine Veränderung der Organeinstellung, die zu einem akustischen Effekt führen würde, von einer gleichzeitigen Bewegung eines anderen Organs, das einen anderen akustischen Effekt zur Folge haben würde, kompensiert wird, so daß der Gesamtklang keinen perzeptiv erkennbaren, eventuell auch keinen registrierbaren akustischen Effekt ergibt. Es ist bekannt, daß bei bestimmten Lauten die fehlende Exaktheit der Zungenartikulation durch eine intensivere Lippenartikulation ausgeglichen werden kann, und umgekehrt. Das bedeutet zweierlei: erstens, daß die Relation zwischen Sprechbewegungen einerseits und Veränderungen im akustischen Signal andererseits nicht Organ für Organ, sondern bezogen auf den ganzen Komplex des akustischen Signals hergestellt werden muß, zweitens, daß die Relation, die vom Sprechbewegungsvorgang auf das entstehende akustische Produkt schließt, eindeutig ist, der Schluß vom akustischen Gesamtprodukt auf den BewegungsVorgang jedoch nicht in allen Einzelheiten. Dieser schwerwiegende Schluß schränkt in letzter Konsequenz die Funktion des akustischen Kontrollkreises als die höchste überwachende Instanz des Bewegungsablaufs ein. Doch ist zu bedenken, daß es für den Kommunikationsvorgang als Mittel der gesellschaftlichen Kommunnikation letztlich auf den Effekt, d. h. das akustische Signal, ankommt, und nicht darauf, wie es erzeugt wird. Zudem wirkt der akustische Kontrollkreis sehr eng mit dem kinästhetischen zusammen, der seiner-
64
3. Analyse des Sprechbewegungsablaufs
seits den Bewegungsablauf direkt kontrolliert, aber auf Grund der vorangegangenen vollzogenen Sprechbewegung. Auch besagt der Schluß nicht, daß überhaupt keine Rückschlüsse möglich wären, sondern nur nicht in bestimmten Einzelheiten. Ein praktischer Beweis f ü r die St ichhaltigkeit dieses Schlusses ist darin zu sehen, daß es im Deutschen zwei mögliche Bildungsformen für den S-Laut gibt, die dorsale und die apikale S-Bildung, und der Sprecher oft selbst nicht weiß, welche Form er verwendet, ja, ob er überhaupt nur eine Form verwendet, oder abhängig von koartikulatorischen Bedingungen, diese und jene. Deshalb ist es nicht möglich, die Registrierung und Analyse des akustischen Signals als alleinigen Ausgangspunkt zu wählen, weil damit kein vollständiges Bild des Sprechbewegungsablaufs rekonstruiert werden kann. Wohl aber ist es möglich, den im Sprechbewegungsvorgang erzeugten Effekt zu analysieren, daraus Schlußfolgerungen zu ziehen und diese dann anschließend wieder experimentell direkt zu überprüfen. Weil weder direkte Methoden noch indirekte allein ein vollständiges Abbild des Sprechbewegungsablaufs ergeben, muß eine komplexe Untersuchungsmethode angewendet werden, die sich sowohl auf direkte als auch indirekte Verfahren stützt. Die fehlenden und direkt nicht zu ermittelnden Zwischenglieder müssen erschlossen und anschliessend auf ihre Richtigkeit überprüft werden. (SOVIJÄBVI 1 9 6 2 ) I n das notwendige Komplexverfahren als Mittel der Untersuchung können nun weitere Gesichtspunkte einbezogen werden, die von anderen Gebieten sprachwissenschaftlicher Forschung abgeleitet sind. Die Analyse der Sprechbewegungen und die Darstellung des Sprechbewegungsablaufs ist in letzter Konsequenz kein selbständiges Ziel, verfolgt keinen in der Sache selbst liegenden Zweck, sondern ist auf praktische Anwendung gerichtet. Wissenschaftliche Arbeit, nur um ihrer selbst willen betrieben, wäre leere Erkenntnis. Deshalb muß die Analyse der Sprechbewegungen auf ein Ziel zusteuern, das die Vielfalt der möglichen und tatsächlich ausgeführten Bewegungen systematisiert und damit überschaubar und anwendbar macht. Das könnte wegen der großen Fülle der ausgeführten Bewegungen zu einer unüberschaubaren Vielfalt führen. Wenn man jedoch auf praktische Anwendbarkeit bedacht ist, kann man von der These ausgehen, daß niemals — weder beim fehlerhaften noch beim unvollkommenen Sprechen in bezug auf eine Norm, wie beim Fremdsprachenunterricht — alle Bewegungen falsch sind oder neu erlernt werden müssen, sondern daß nur wenige davon betroffen sind. Bei der Konzentration auf diese
3.1. Strukturelle Analyse
65
wenigen Bewegungen wird der neu zu erlernende Bewegungskomplex überschaubar und lehrbar. Daher muß es das Ziel einer exakten Bewegungsanalyse sein, in ein System von Sprechbewegungen einzumünden, das leicht zu übersehen und — eventuell mit Hilfe elektronischer Datenverarbeitungsanlagen — auch praktisch zu beherrschen und auf den jeweiligen Fall anwendbar ist. Bei der Systematisierung sprachlicher Einheiten können in verschiedenen Ebenen Verfahrensweisen der Sprachwissenschaft studiert werden, die viel Material zusammengetragen und aufbereitet haben. Die erste dieser Leistungen ist die Entwicklung der Schrift gewesen Die vielen Laute individueller, koartikulatorischer und mundartlicher Klangfärbung wurden zu Klassen von Zeichen zusammengefaßt, die durch jeweils ein Symbol repräsentiert werden, den Buchstaben. Dabei wurde von Merkmalen abstrahiert, die für den praktischen Kommunikationsprozeß sonst wesentlich sind, beispielsweise von Eigentümlichkeiten des Produzenten, seinen Kenntnissen, seiner sozialen Stellung usw. Ob wir dabei die Buchstaben, die Laute oder die Phoneme in Betracht ziehen — allen diesen Zeichensystemen ist gemeinsam, daß sie zur L a u t sprache in einer bestimmten Relation stehen, die dadurch gekennzeichnet ist, daß die Zeichen ein System bilden, daß sie im Verlauf eines bestimmten Abstraktionsprozesses aus der Realität gewonnen worden sind, daß sie in Umkehrung dieses Abstraktionsprozesses wieder auf die Praxis bezogen werden können und daß das entstandene Zeichensystem seine systemeigenen Relationen aufweist, die nun ohne stete Beziehung zum praktischen Ursprung auf der Abstraktionsebene untersucht werden können.
3.1. Strukturelle Analyse Die Feststellung, daß Systeme sprachlicher Einheiten entwickelt worden sind, reicht für unser Anliegen noch nicht aus. Es besteht die Aufgabe, zu prüfen, inwieweit aus den bereits entwickelten Zeichensystemen auswertbare Erkenntnisse in bezug auf den Sprechbewegungsablauf abgeleitet werden können; denn in allen diesen Systemen steckt eine intensive Arbeit, die von der menschlichen Gesellschaft geleistet worden ist. Diese Prüfung muß sich auf die Systeme der Laute, der Buchstaben, der Phoneme erstrecken. Das Einordnungs- und Bezugssystem f ü r diese
66
3. Analyse des Sprechbewegungsablaufs
Systeme ist jeweils ein anderes. Die Buchstaben standen früher sicher •einmal zu den Lauten in einer einfachen Relation und waren tatsächlich das, als was sie heute in Laienkreisen noch manchmal angesehen werden: Bezeichnungen für Laute. I n der Weiterentwicklung der Sprache hat sich aber das Lautsystem, die Aussprache, schneller weiterBuchstabe
laut
Darstellung
e
[e-J
in der Schrift
Abb. 5. Unterschiedliche Verwendung von Schrift- und Lautzeichen.
3.1. Strukturelle Analyse
67
entwickelt, so daß heute der Zustand erreicht ist, daß die Übereinstimmung von Lauten und Buchstaben nur noch im Groben gewährleistet ist, nicht aber in Einzelheiten. (Abb. 5) Die Angleichung der Schrift an die Weiterentwicklung der Aussprache, wie sie von Zeit zu Zeit in einer kleinen Rechtschreibreform vollzogen wird, befriedigt immer nur den notwendigen Nachholebedarf, stellt aber keine eindeutigen Beziehungen zwischen den Elementen des Lautsystems und den Elementen des Systems der Schrift her, dessen Elemente und dessen Relationen zwischen den Elementen als relativ konstant anzusehen sind. Die Phoneme einer Sprache als die kleinsten Elemente, die bei Veränderung in einer Sinneinheit zu einer Bedeutungsänderung führen können, sind sprachwissenschaftlich gut erforscht. Das betrifft vor allem die Besonderheiten jedes einzelnen Elements, weil sich jedes Element erst durch seine spezifischen Beziehungen zu den anderen Elementen des Systems von diesen abhebt und damit seinen Standort im System erhält. Der Gedanke der Relationen zwischen System und Element kommt daher bei den Phonemen am deutlichsten zum Ausdruck. Das Element, Bestandteil des Systems, wird durch seinen Platz im System bestimmt. F ü r die Analyse der Sprechbewegungen liefert jedoch eine genaue Durchforschung der systeminternen Phonemrelationen in bezug auf den Bewegungsablauf nichts oder sehr wenig; denn obwohl in den phonomatischen Unterschieden auch Unterschiede in der Einstellung der Sprechorgane enthalten sein müssen (sonst würden sich keine akustisch unterscheidbaren Merkmale ergeben), liegt bei der Auswahl und der Kennzeichnung der Phoneme darauf nicht der Schwerpunkt. Und wenn das Phonem als Bündel von Merkmalen angesehen wird, die es verkörpert, so doch nur als Verkörperung derjenigen Merkmale, durch die es sich von anderen Phonemen unterscheidet. Nur die Merkmale, die zur Unterscheidung von anderen führen, gehen in den Begriff des Phonems ein; wenn darin Sprechbewegungen enthalten sind, so auf alle Fälle nicht alle, sondern nur diejenigen, die f ü r die Unterscheidung der Phoneme wichtig sind. Es lassen sich von der Definition der einzelnen Phoneme aber immerhin gewisse Rückschlüsse auf unterscheidende Merkmale •der Einstellung der Sprechorgane ziehen, nämlich solche, die unbedingt vollzogen sein müssen, damit sich die Phoneme genetisch, akustisch und perzeptiv voneinander unterscheiden. Da aber die Phoneme zumeist a u s isolierten und einander gegenübergestellten Wörtern einer Sprache gewonnen werden und vor allem, da bekannt ist, daß sie ihre Merkmale im Kontext nicht immer rein beibehalten, läßt sich der Schluß nicht
68
3. Analyse des Sprechbewegungsablaufs;
konsequent durchführen. Dazu k o m m t noch, daß sich die Unterschiede, die sich im P h o n e m ausdrücken, auf Bewegungen anwenden lassen, dievollzogen sein müssen, d a m i t ein Sinnunterschied bewirkt wird, aber nicht auf solche Bewegungen, die bei der P r o d u k t i o n lautsprachlicher Zeichen vollzogen werden. Solche Bewegungen wären n u r aus Angaben über die Folgen von P h o n e m e n in der zusammenhängenden l a u t s p r a c h lichen Bedeutungseinheit zu ermitteln. E i n e solche Darstellung d e r Phonemfolge liegt aber nicht in der Zielrichtung der Phonologie. D a h e r sind a u c h von dort, obwohl es prinzipiell nicht ausgeschlossen wäre, f ü r unsere Fragestellung keine Einsichten zu gewinnen. W e n n m a n die Laute als Elemente eines sprachlichen Systems z u g r u n d e legt, so geht dieses System von vorgefundenen R e a l i t ä t e n aus. E s müssen alle die L a u t e in das System einbezogen werden, die im V e r b a n d einer bestimmten, k o n k r e t e n Sprache verwendet werden, unabhängig davon, ob sie sich mit einem begrenzten u n d genau beschreibbaren I n v e n t a r von Regeln wieder in das System einordnen lassen u n d unabhängig; davon, ob in anderen Sprachen die gleichen oder andere L a u t e gebraucht werden. Beim L a u t s y s t e m einer Sprache ist die Menge der L a u t e , die verwendet werden, der Ausgangspunkt, das System die Folge, resultierend aus der Ordnung, die die wissenschaftliche Analyse in die Menge der F a k t e n bringt. W e n n aber jede L a u t ä u ß e r u n g auch als L a u t bezeichnet werden, würde, d a n n m ü ß t e es eine unübersehbare Menge von L a u t e n geben.. D a dies nicht der Fall ist, m u ß a u c h der L a u t als eine Abstraktion angesehen werden, bei der 1. von den Individualqualitäten des Sprechers u n d 2. von Varianten abstrahiert wird, die sich u m einen Mittelwert z e n trieren. Beim Begriff des L a u t e s werden alle seine wesentlichen Bild u n g s m e r k m a l e einbezogen, sowohl in genetischer als auch in gennematischer wie auch in perzeptiver Hinsicht. Aus diesem G r u n d e sind die L a u t e diejenigen E l e m e n t e eines sprachlichen Systems, das a m ehesten f ü r eine theoretische Analyse der im Sprechvorgang enthaltenen Bewegungen geeignet ist. W e n n in d e n L a u t e n die wesentlichen Merkmale ihrer Bildung e n t h a l t e n sind, dann, lassen sich aus einer Analyse von L a u t s t r u k t u r e n gewisse Einsichten, auch über die notwendigen Bewegungsabläufe einer Sprache gewinnen, vorausgesetzt, d a ß diese S t r u k t u r e n b e k a n n t sind. W e n n a u c h im Begriff des L a u t e s die Besonderheiten seiner Bildungsweise, d. h. der genetische Aspekt, mit e n t h a l t e n sind, so k o m m t doch vordergründig' der perzeptive Aspekt zum Ausdruck, d. h. die Art wie er sich f ü r den.
3.1. Strukturelle Analyse
69
Angesprochenen mehr oder weniger eindeutig von anderen vom Sprecher gebrauchten unterscheidet; denn vom Hörer aus wird das lautsprachliche Zeichen in klanglich unterscheidbare Eindrücke unterteilt, die dann den Namen L a u t e bekommen haben. Wenn Arten von Strukturen von Lautfolgen und deren Häufigkeit ermittelt werden sollen, so muß als Grundlage für eine Untersuchung die Anzahl der Elemente im System geklärt sein. Das ist aber beim Lautsystem, sowohl einer bestimmten Sprache wie auch eines universalen Systems, nicht leicht möglich. Da sich in den heutigen Nationalsprachen sowohl dialektale als auch fremdsprachliche Wörter befinden, die nicht nur die Bedeutung, sondern teilweise auch die Aussprache ihrer ursprünglichen Herkunft beibehalten haben, ist das System der Laute, •die in einer Nationalsprache, beispielsweise des Deutschen, gebraucht werden, eine Frage der Konvention und der Definition. Die obere Begrenzung der Anzahl der Elemente des Lautsystems einer Sprache hängt davon ab, wieviel der aus dem Dialekt oder anderen Sprachen stammenden (und offensichtlich nur ganz selten vorkommenden) Laute in das System aufgenommen oder aus ihm ausgeschlossen werden. Erst, wenn der Umfang eines Lautsystems einer konkreten Sprache durch Ermittlung und Definition des Umfangs festgelegt ist, ist es sinnvoll, die Frage nach der inneren Struktur des Systems zu stellen. Deshalb sind auch Untersuchungen über die innere Struktur des Lautsystems einer bestimmten Sprache bisher wenig und selten durchgeführt worden. Wenn nämlich eine Änderung (Erweiterung oder Einengung) im System umfang erfolgt, dann sind die Änderungen nicht ohne weiteres auf die inneren Strukturen zu übertragen, die sich mit der Veränderung der Anzahl der Elemente des Systems zwangsläufig ergeben. Das mag mit der Grund sein, warum die Ermittlung von Strukturgesetzen des Lautsystems bisher umfangsmäßig weit hinter den Arbeiten zur Ermittlung von Strukturgesetzen im Phonemsystem von Sprachen zurückstehen. Grundsätzlich läßt sich aus den Lauten zwar noch nichts über den Bewegungsablauf der Sprechorgane aussagen, es lassen sich eher einige Angaben über die Häufigkeit der Beanspruchung bestimmter Organe gewinnen. Zur inneren Struktur eines aus der Praxis abstrahierten Systems, wie des Lautsystems, gehören aber auch Angaben über die Stellung von Elementen in ihrer Reihenfolge und Regeln f ü r die möglichen Reihenfolgen dieser Elemente. F ü r die Fortsetzung angefangener Reihen von Elementen gibt es ganz bestimmte Wahrscheinlichkeiten.
70
3. Analyse des Sprechbewegungsablaufs
(MEYER-EPPLER, 1 9 5 9 ) D i e E l e m e n t e sind i n d e r F o r m v o n MARKOFF-
Ketten miteinander verbunden, bei denen die Übergangswahrscheinlichkeit von einem Element als Endpunkt einer bereits vorangegangenen Kette zum nächsten bestimmt werden kann. Wenn der erste Teil von Wörtern oder stehenden Redensarten bekannt ist, so ergibt sich in manchen Fällen der fehlende Rest zwangsläufig. Die Übergangswahrscheinlichkeit zum folgenden Glied wird zur Sicherheit. Es ist dann nur möglich, daß eine angefangene Wortkette in einer einzigen Weise fortgesetzt werden kann. Von WEIGL ist auf dieser Grundlage eine Behandlungsmethode von Aphatikern ausgebildet worden, die den sogenannten Deblockierungseffekt verwendet. Auch auf der Basis der Schrift (begrenztes, abgeschlossenes System von Zeichen) sind die Übergangswahrscheinlichkeiten von einem Element zum andern berechnet worden. (KÜPEMÜLLER 1 9 5 4 ) Bei den Lauten sind bisher genaue Untersuchungen an der fehlenden Begrenztheit des Systems, vielleicht auch an der nicht völlig eindeutigen Frage der lautlichen Transkription, gescheitert. Bisher stehen Untersuchungen dieser Art in mathematisch voll durchgeführter Form für die deutsche Sprache noch aus. Und doch wären aus ihren Angaben wenigstens Teile des Bewegungsablaufs unmittelbar zu entnehmen oder genauer gesagt, zu erschließen. Jeder Laut verlangt zu seiner Produktion, daß die Sprechorgane ganz bestimmte Einstellungen einnehmen. Also müssen, wenn die Folgen von Lauten bekannt sind, die Bewegungen, die die Sprechorgane bei der Realisierung der Laut/oZgre vollziehen, erschlossen werden können. Das wäre bei Lautfolgen höheren Ordnungsgrades sicher ebenso möglich wie bei den kleinsten Elementen, aus denen auf die Bewegungsabläufe geschlossen werden kann, den zweigliedrigen Lautfolgen. Sie sind in der Literatur auch unter anderen Bezeichnungen vertreten: dyadische Segmente, MARKOirketten 1. Ordnung, Laut Verbindungen. Alle bezeichnen die natürliche lineare Aufeinanderfolge von zwei Elementen eines Systems. Aus ihnen lassen sich bis zu einem, gewissen Grade die Bewegungen der Sprechorgane erschließen, die sich beim Übergang der Sprechorgane aus der Einstellung des einen Lautes in die zur Bildung des zweiten Lautes notwendige Einstellung unbedingt vollziehen müssen. I n diesen Lautverbindungen ist also ein Abbild der Sprechbewegungen enthalten, die unbedingt und mit notwendiger Konsequenz vollzogen werden müssen. Damit müßte sich eigentlich, wenn die Lautfolge eines be-
3.2. Akustische Analyse
71
stimmten Wortes festliegt — und sie ist ja mit Sicherheit leicht zu ermitteln — auch der Bewegungsablauf unmittelbar erschließen lassen. Wir wissen, d a ß es nicht so ist, d a nämlich, wie bereits gesagt, wohl die unbedingt notwendigen Sprechbewegungen aus der Lautfolge zu erschließen sind, nicht aber die Bewegungen ermittelt werden können, die als koartikulatorisch gesteuerte Bewegungen zwar nicht f ü r die L a u t v e r bindung, doch f ü r die Aussprache des gesamten Zeichens notwendig sind. Die vollständige rückschließende Bewegungsermittlung scheitert auch daran, daß bei der Beschreibung der L a u t e n u r diejenigen Organe festgehalten werden, die a n der Erzeugung des akustischen E f f e k t s ivesentlieh beteiligt sind, nicht aber die anderen, und daß a n der Bildung vieler Lautverbindungen bei Lauten, die aufeinander folgen, nicht die gleichen Organe zu denen zählen, die wesentlich sind. Dazu k o m m t noch ein weiterer G r u n d : D a f ü r die Bildung m a n c h e r L a u t e (z. B. [s]) mehrere gleichberechtigte Varianten existieren, läßt sich aus der Lautfolge allein nichts über den Bewegungsablauf aussagen. Die strukturelle Analyse k a n n also, wenn sie von der Basis des L a u t systems ausgeht u n d Strukturen höheren Ordnungsgrades berücksichtigt, ein wertvolles Hilfsmittel u n d eine gute Grundlage zur Vorbereitung der notwendigen experimentellen Untersuchungen sein. Ohne diese allerdings ist eine zielgerichtete Analyse der Sprechbewegungen mit relativ geringem Aufwand nicht zu erreichen.
3.2. A k u s t i s c h e Analyse Die Analyse der Sprechbewegungen k a n n nur als komplexe Analyse durchgeführt werden, wobei Methoden der physiologischen, akustischen und strukturellen Analyse (auf der Basis der Lautfolge) miteinander zusammenwirken u n d aufeinander bezogen sein müssen. Dabei spielt die akustische Analyse, die gerade in den letzten J a h r z e h n ten besonders stark entwickelt worden ist, eine wesentliche Rolle. Sie ermöglicht eine Analyse, die am gesprochenen Signal angreift; sie vermittelt daher ein unbeeinflußtes Resultat des tatsächlich produzierten lautsprachlichen Zeichens. Die Analyse ist bei den akustischen Zeichen nicht an den Akt der Genese selbst gebunden, sondern setzt erst nach diesem Akt ein, ist also von der Person des Produzenten vollkommen unabhängig. Das ist ein großer Vorteil, der vor allem volle Natürlichkeit gewährleistet u n d eine Beeinflussung der Versuchs- oder Gewähr-
72
3. Analyse des Sprechbewegungsablaufs
person ausschließt. Voraussetzung ist, daß die lautsprachlichen Zeichen frei von Störungen und Verzerrungen zunächst auf einem Tonträger aufgezeichnet werden und von dort zur Analyse gelangen, eine Forderung, die heute von vielen phonetischen Laboratorien erfüllt werden kann. Sie ist demnach berechtigt und erfüllbar. Die Aufnahmen lassen sich in gelöster Atmosphäre und in natürlicher oder auch beabsichtigt gesteuerter Sprechweise vor dem Mikrophon sprechen und auf Band aufnehmen, so daß die Voraussetzungen für «ine spätere gezielte Analyse gegeben sind. Von den Methoden, die für die Analyse des akustischen Signals gegenwärtig zur Verfügung stehen, eignen sich für die Ermittlung oder auch nur die Kontrolle des Bewegungsablaufs der Sprechorgane nicht alle, •die ausgearbeitet worden sind; sie sind teilweise mit anderer Zielstellung entwickelt worden. Bei den meisten Geräten, die heute in der akustischen Analyse lautsprachlicher Zeichen eingesetzt werden, steht •die exakte Ermittlung bestimmter physikalischer Parameter im Vordergrund, die für die Darstellung des lautsprachlichen Zeichens wichtig •sind: Grundfrequenz, Dynamik, Zeitparameter, Klangdarstellung. So wichtig auch die Ermittlung einzelner Parameter für das lautsprachliche Zeichen und seine physikalisch exakte Darstellung sein mögen — für die Unterstützung der Analyse des Sprechbewegungsablaufs muß eine Auswahl vollzogen werden, die darauf gerichtet ist, daß der Schluß von der akustischen Analyse auf den Vollzug der Sprechbewegungen möglich ist. Deshalb scheiden aus der Betrachtung alle Methoden zur Analyse einzelner und vor allem stationärer Abschnitte des lautsprachlichen Zeichens aus, oder solche Methoden, die im Grunde auf einen quasi-stationären akustischen Vorgang zurückgeführt werden müssen. Da sich die Sprechbewegungen kontinuierlich vollziehen, führen sie folglich auch zu kontinuierlichen Klangveränderungen. Deshalb können Methoden, die vom quasi-stationären Signal ausgehen, keine Erkenntnisse der Bewegungsvorgänge ergeben. Die Methode der akustischen Analyse muß sich deshalb auch auf die Methoden stützen, die die Veränderung bestimmter Parameter im Verlauf der Zeit zum Ausdruck bringt. Unter diesen steht das quasi dreidimensionale Darstellungsverfahren des Sonogramms an erster Stelle. { P O T T E R , K O P P , G R E E N ) Dadurch wird ein Analyseergebnis abgebildet, das die Veränderungen des Klanges des lautsprachlichen Signals im Verlauf der Zeit wiedergibt. Damit eine Auswertung im Hinblick auf
3.2. Akustische Analyse
73
den Sprechbewegungsablauf erfolgen kann, ist eine genaue Abgrenzung der Segmente des akustischen Signals erforderlich, die in erster Näherung mit den Lauten übereinstimmen. Jedoch ist der Laut als kleinste perzeptive, das Segment als kleinste akustische Einheit anzusehen. Die Feststellung der Segmente ist eine schon nicht leichte Aufgabe, ihre Abgrenzung gegeneinander ist oft nicht widerspruchsfrei möglich, wenn nicht die Perzeption zu Hilfe genommen wird. Dabei kommen dann auch die Mängel des Sonogramms zur Wirkung; denn die gute quasi dreidimensionale Abbildung des Klanges des lautsprachlichen Zeichens kommt unter Verzicht auf die Darstellung von Dynamikunterschieden — die als besondere Analyseleistung im Sonagramm zusätzlich geschrieben werden — kaum zustande. Diese machen in mancher Beziehung wesentliche perzeptive Unterscheidungsmerkmale aus. Der akustische Analysator ist ja bekanntlich ein nicht sofort und beliebig schnell analysierendes Organ, dessen zeitliches Auflösungsvermögen unbegrenzt wäre. Das tritt vor allem dann in Erscheinung, wenn mit zeitlich bedingten Verdeckungseffekten gerechnet werden muß, die dann auftreten, wenn leise Schalleindrücke unmittelbar auf laute folgen. Gerade diese für den akustischen Analysator zu den „Dunkelstrecken" zählenden Abschnitte des lautsprachlichen Zeichens werden infolge der Dynamikkompression des Sonagraphen in gleicher Weise abgebildet wie die perzeptiv erfahrbaren Klangveränderungen. Das ist einerseits günstig und verschafft auch dort einen Einblick in die Klangveränderung des akustischen Signals, wo sie mit dem akustischen Analysator nicht mehr wahrgenommen werden können; es werden also auch Schallereignisse dargestellt, die perzeptiv nicht relevant werden. Insofern stimmt die sonographische Analyse nicht genau mit dem Höreindruck uberein. Sie zeigt einerseits zu wenig, andererseits zu viel. Generell kann die Relation zwischen metrischen und auditiven Daten noch nicht genau bestimmt werden. Nur ein Bruchteil der im Spektrum enthaltenen Informationen ist für die auditive Indentifikation der Lautfolge relevant, wobei man heute noch nicht mit Sicherheit sagen kann, welcher Teil der Informationen dies ist. Die anderen Parameter des analysierten akustischen Signals sind gegenüber den Klangveränderungen nicht so wichtig. Auch aus dem mehrfach — mit Hilfe von Filtern — oszillographisch registrierten akustischen Signal lassen sich Schlüsse auf den Bewegungsablauf ziehen, doch ist das Verfahren wesentlich aufwendiger als die Auswertung des Sonagramms. 6 Lindner
74
3. Analyse des Sprechbewegungsablaufs
Die Auswertung von Tonhöhen- und Dynamikverlauf ist f ü r die Deutung der Artikulationsbewegungen von untergeordneter Bedeutung, wenn auch zur Steuerung der Atmung und der Kehlkopfartikulation wertvolle Hinweise daraus zu entnehmen sind.
3.3. Physiologische Analyse Eingangs dieses Kapitels wurden in einer Übersicht die Methoden aufgezählt, die f ü r die Analyse des Bewegungsablaufs verwendet werden können und verwendet worden sind. Bei der weiterführenden Betrachtung soll die Frage behandelt werden, welche Methoden, da die physiologische Analyse das Kernstück der aufeinander bezogenen Analyseverfahren darstellt, die zweckmäßigsten sind, die mit dem geringsten Aufwand an Mitteln, mit dem geringsten Eingriff in den Vollzug des Sprechbewegungsablaufs und mit den besten Relationsmöglichkeiten zu den anderen Untersuchungsverfahren die eindeutigsten Ergebnisse liefern. Da jedes direkte Verfahren einen Eingriff in den Bewegungsablauf der Sprechorgane bedeutet, erscheinen diejenigen Verfahren am zweckmäßigsten, die mit einem, Vorgehen eine Mehrzahl von Organen in ihrem Bewegungsablauf gleichzeitig erfassen. Dann braucht nicht eine Mehrzahl von Verfahren bei der experimentellen Ermittlung des Bewegungsablaufs miteinander kombiniert zu werden. Von diesem Gesichtspunkt aus erscheinen Film&uinahmen als besonders geeignet. Auf jeden Fall lassen sich damit die Bewegungen mehrerer Organe gleichzeitig registrieren. Bei den Aufnahmen der Sprechorgane von außen kann durch die Verwendung eines Spiegels die im Film immer auf zwei Dimensionen reduzierte dreidimensionale Bewegung vollständig bei der Auswertung erfaßt werden, wenn das Gesicht der Versuchsperson gleichzeitig frontal und im Profil aufgenommen wird. Leider ist diese doppelte Erfassung der Bewegungen mit dem Röntgenfilm nicht möglich. E r erfordert die Durchstrahlung der Sprechorgane in einer Richtung. Der Röntgenfilm zeigt im Vergleich mit dem normalen Film mehr Organe, vor allem, wenn der Bildausschnitt groß genug gewählt werden kann, und nicht nur die Bewegungen von Unterkiefer, Lippen, Zungenspitze und Zungenrücken sowie des Gaumensegels, sondern gleichzeitig auch die Bewegungen des Zungenbeins, der Mundbodenmuskulatur, des Kehldeckels und des Kehlkopfes verfolgt werden können.
3.3. Physiologische Analyse
75
Die Filmaufnahmen haben, obwohl sie nicht direkt am Kopf des Sprechers und an seinen Sprechorganen angreifen, wie die direkt registrierenden Methoden wie z. B. die Labiographie, doch Auswirkungen auf die Sprechweise des Sprechers, da die Aufnahmen in einer bestimmten, vereinbarten Situation und vor allem in einer vorherbestimmten Kopfhaltung gemacht werden müssen. Der Kopf darf sich während der Filmaufnahmen nicht vor der Kamera bewegen, da sonst wesentliche Organe, deren Bewegungen gerade erfaßt werden sollen, aus dem Gesichtsfeld der Aufnahmeapparatur heraustreten würden. Diese Beschränkung der Bewegungsfreiheit der Versuchsperson hat natürlich Einfluß auf den Sprechstil, aber die Veränderungen wirken sich doch mehr auf Melodie und Dynamik aus, weniger auf die artikulatorischen Bewegungsabläufe. Die Filmaufnahmen müssen bei der Registrierung der Sprechbewegungen mit erhöhter Aufnahmefrequenz durchgeführt werden. Vorausgesetzt, daß das Bewegungstempo normal ist — und diese Bedingung läßt sich trotz der psychischen Beeinflussung während der Aufnahmesituation durchaus erreichen — werden in der Sekunde bis zu 20 Laute gesprochen, was etwa dem normalen Redetempo von 6 bis 7 Silben pro Sekunde entspricht, das bei der Unterhaltung stets erreicht, manchmal sogar überschritten wird. Wenn aber pro Sekunde 20 Laute produziert werden, dann reichen die mit normaler Bildfrequenz aufgenommenen 24 Filmaufnahmen nicht aus, um Bewegungen der Sprechorgane damit aufzuzeichnen ; denn dann kommt im Durchschnitt eine Aufnahme auf einen Laut, und bei der späteren Filmauswertung ist nicht sicher, ob mit der Aufnahme die Vollphase eines Lautes, oder eine Übergangsphase vom vorhergehenden oder zum folgenden Laut festgehalten worden ist. Es kommt noch hinzu, daß die Öffnungszeit des Kameraverschlusses bei 24 Aufnahmen pro Sekunde relativ lang (bezogen auf die Geschwindigkeit der Bewegungen der Sprechorgane) ist, so daß die Bewegungsunschärfe gerade der schnellbewegten Organe groß ist. Das ist bei der späteren Vorführung des Filmes durchaus kein Nachteil, da der Zuschauer in der Bewegungsunschärfe die schnelle Bewegung nacherlebt und besser nachempfinden kann. F ü r ein exaktes Studium des Bewegungsablaufes, der auf die Details der Einzelbilder zurückgreifen muß, ist dies aber ein erheblicher Nachteil, wenn nicht sogar ein Hindernis für eine korrekte Auswertung .Daher sollte für Aufnahmen der Sprechbewegungen die Bildaufnahmefrequenz unbedingt erhöht werden, unter Umständen sogar über das Doppelte der normalen Bildaufnahme6»
76
3. Analyse des Sprechbewegungsablaufs
frequenz hinaus. Mit den Filmaufnahmen ist nicht n u r der Bewegungsablauf der Sprechorgane, sondern auch deren Tempo (anhand der f ü r einen L a u t notwendigen Anzahl der Bilder) relativ leicht zu ermitteln. Gerade beim Röntgenfilm m u ß aber mit wesentlichen Einschränkungen gerechnet werden, da die Strahlenbelastung f ü r jede Versuchsperson beschränkt ist. Wenn die Bildaufnahmefrequenz erhöht wird, steigt die Strahlenbelastung noch an. Daher m u ß die Auswahl des Textes, der in bezug auf seinen Bewegungsgehalt untersucht wird, sehr g u t vorbereitet werden. N u r d a n n ist gewährleistet, daß von geringem Experimentalmaterial auf die Bewegungen im gesamten Sprechbewegungsablauf zurückgeschlossen werden k a n n . Auch hier zeigt sich, daß die Untersuchung des Sprechbewegungsablaufs nicht mit einer Methode allein durchgeführt werden kann, sondern daß das Vorgehen im Komplex notwendig ist u n d daß die anderen Methoden mit der experimentellen physiologischen Analyse im Zentrum der Untersuchungen Schritt f ü r Schritt in die Auswertung einbezogen werden müssen.
4. Statistik der Lautfolge-Strukturen
4.1. Ziel der statistischen Untersuchungen Wenn es das Ziel ist, diejenigen Sprechbewegungen mit den höchsten Gebrauchshäufigkeiten zu ermitteln, kann eine Statistik der zweigliedrigen Lautfolge-Strukturen wesentliche Informationen hefern. Wie schon kurz dargestellt, sind in den zweigliedrigen Lautfolgen immanent die unbedingt notwendigen Bewegungen enthalten; denn die Sprechorgane müssen sich, damit die Lautfolge artikuliert werden kann, sowohl am Anfang wie auch am Ende der Lautverbindung in einer f ü r den Anfangsund Endlaut typischen Einstellung befinden, und zwischen ihnen muß sich eine~Ei\nate\\wa%%veränderungvollziehen, ein Bewegungsablauf, der die unbedingt notwendigen Bewegungen enthält. Insofern gibt eine zweigliedrige Lautfolge einen Einblick in die notwendigen Organbewegungen beim Sprechen. Während eine Statistik der direkt beim Sprechen vollzogenen Bewegungen nur dann möglich wäre, wenn alle Bewegungen durch Untersuchungen ermittelt u n d bekannt wären, k n ü p f t eine Statistik der zweigliedrigen (oder auch mehrgliedrigen) Lautfolge-Strukturen an bekannte Formen der Analyse sprachlichen Materials an und läßt sich daher auch mit einfachen und nicht-experimentellen Methoden durchführen. Deshalb ist es mit einer solchen Statistik auch möglich, die Voraussetzungen für Untersuchungen des Sprechbewegungsablaufs zu schaffen. Die statistische Untersuchung kann als Vorstufe f ü r experimentelle Untersuchungen des Sprechbewegungsablaufs genützt werden. F ü r statistische Untersuchungen von Lautfolge-Strukturen gilt die Regel, die M E N Z E R A T H für sprachstatistische Untersuchungen ganz allgemein formuliert h a t : „Die Art der Materialgewinnung, wie die Aufteilung der ,Masse' und die Bearbeitung des so vorbereiteten Materials, das alles — nicht also allein die Darstellung — trägt bereits entschieden den Charakter wissenschaftlichen Denkens. Jede statistische Arbeit muß von vornherein auf das Ziel der Untersuchung hin angelegt
78
4. Statistik der Lautfolge-Strukturen
sein und von Beginn bis zum Ende ein von dem Ziel gesteuertes Ganzes bilden." (1954, S. 3) Das Ziel der statistischen Untersuchungen von Lautfolge-Strukturen kann daher nicht ein rein statistisches Ziel sein, sondern muß außerhalb der Statistik bestimmt werden, wenn sie dazu dienen soll, Untersuchungen des Sprechbewegungsablaufs vorzubereiten. Daher ist auch die Aufdeckung von gesetzmäßigen Zusammenhängen einzelner Parameter des sprachlichen Materials, wie sie von manchen Autoren ermittelt worden sind (ZIPF, MANDELBROT, HERDAN) nicht Ziel einer solchen Untersuchung. Sie zielt vielmehr auf praktische Anwendungsmöglichkeiten, ab, indem Aussagen über die Gebrauchshäufigkeit einzelner Lautfolgen angestrebt werden. Daraus aber folgt, daß eine Statistik von Lautfolge-Strukturen nicht an lexikalisch vollständigem oder auch nur lexikalisch orientiertem Material vorgenommen werden kann, sondern sich auf Material stützen muß, das das tatsächliche Sprechbewegungsgeschehen widerspiegelt. Und dieses wird im zusammenhängenden Sprechen praktiziert. Die Untersuchung von Lautfolge-Strukturen muß also vom zusammenhängenden Text ausgehen. Dadurch wird eine neue Schwierigkeit aufgeworfen, die Frage der Textauswahl. Während ein Lexikon unter ganz bestimmten Randbedingungen als vollständig oder wenigstens im Wesentlichen vollständig betrachtet werden kann, ist die Textgrundlage für zusammenhängende Sprache ein praktisch unendlich großes Inventar, aus dem eine Auswahl erfolgen muß. Die Grundlage für eine solche Statistik muß daher eine repräsentative Textauswahl sein. Da aus den Ergebnissen der Statistik später Schlüsse hinsichtlich des Sprechbewegungsablaufs gezogen werden können, muß dies schon bei der Ausarbeitung der Grundlagen für die Materialaufbereitung mit berücksichtigt werden. Aus der Sicht des Sprechbewegungsablaufs bildet weder das Wort noch die grammatisch vollständige Struktur, der Satz, eine Einheit. Vom Sprechbewegungsablauf her gesehen muß das als zusammengehörig aufgefaßt werden, was auf einen Atemzug ohne Pause gesprochen wird. Dazu wird die Bezeichnung Sprechtakt verwendet. Im zusammenhängenden Sprechen werden gewöhnlich alle Bewegungsabläufe innerhalb eines Sprechtaktes in einem zusammenhängenden Bewegungsablauf realisiert. Es werden also auch die Lautfolgen zu einer Abbildung des Bewegungsablaufs, die bei einer Transliteration des gesprochenen Textes durch den Wortabstand getrennt sind.
4.1. Ziel
79
Das würde aber zu Schwierigkeiten in der Statistik führen; denn solche Lautverbindungen treten möglicherweise nur im Zusammenhang des Sprechtaktes auf, sonst aber nicht. Es sind eindeutig LautfolgeStrukturen anderer Art, die einen Sprechbewegungsablauf nur in speziellen Situationen abbilden, die nicht zwangsläufig als Bewegungsablauf realisiert werden müssen. Schon aus diesem Grunde ist es notwendig, die in die Statistik eingehenden zweigliedrigen Lautfolgen als qualitativ unterschiedliche Grundelemente zu kennzeichnen. Die Lautfolgen zwischen Wörtern im Sprechtakt brauchen nämlich nicht unbedingt als einheitlicher Bewegungsvorgang realisiert zu werden; es ist denkbar, daß ein Sprecher in einer bestimmten Situation gerade an dieser Stelle eine Atem- oder Staupause macht, und dann wird der einheitliche, zusammenhängende Bewegungsablauf unterbrochen. Diese Art von Lautverbindungen ist kein notwendiges Abbild des Sprechbewegungsablaufs im zusammenhängenden Sprechen. Ähnliche Besonderheiten liegen im Wortinnern vor, wenn (gerade bei zusammengesetzten Wörtern) zwei Laute, die an der Silbenfuge stehen, zu einer Lautfolge zusammengefaßt werden. Auch diese Lautfolge hat nicht den gleichen Verbindlichkeitsgrad hinsichtlich des in ihr enthaltenen notwendigen Bewegungsablaufs wie beispielsweise bei einer Lautfolge, bei der alle Komponenten der gleichen Silbe angehören. Eine solche Lautfolge muß unbedingt als geschlossene artikulatorische Einheit realisiert werden. Daraus ergibt sich, daß auf Grund der Bedeutung für den Sprechbewegungsablauf drei Arten von Lautfolgen unterschieden werden müssen: a) Lautfolgen innerhalb der Silbe (Silbenbindungen), b) Lautfolgen innerhalb eines Wortes, jedoch über die Silbengrenze hinweg (Wortbindungen) und c) Lautfolgen innerhalb eines Sprechtaktes, wobei die beiden Glieder der Lautfolge verschiedenen Wörtern zugehören (Satzbindungen). Das wirft bestimmte neue Probleme auf, vor allem bei den Wortbindungen ; denn wenn auch die SilbenzaÄi eines Wortes im allgemeinen nicht umstritten ist, so ist es doch die Silbengrrenze. I n der Sprachwissenschaft ist dazu eine Fülle von Beiträgen veröffentlicht, ohne daß das Problem heute als gelöst gelten könnte (KLOSTEE-JENSEN). Von dem anstehenden Problem aus, nämlich einige Besonderheiten des Sprechbewegungsablaufs aus der Statistik ermitteln zu können, erhält auch die Silbenfrage eine vereinfachte Akzentuierung, wie sie auch schon
80
4. Statistik der Lautfolge-Strukturen
bei der Frage Sprechtakt oder Satz möglich war. Die Silbengrenze wird dort angesetzt, wo beim Sprechen eine Pause oder Verzögerung des artikulatorischen Ablaufs möglich ist. Die Silbengrenze wird für die Lautfolge-Statistik nach rein artikulatorischen Bedingungen festgelegt.
4.2. Methode der Lautfolge-Statistik Damit die Statistik von Lautfolgen überhaupt begonnen werden kann, muß das Inventar festgelegt sein, mit dem die Statistik aufgestellt wird. Es muß sich dabei um ein begrenztes und eindeutig definiertes Inventar handeln, mit dem alle vorkommenden Fälle dargestellt werden können. Von diesem Gesichtspunkt aus ist möglichste Vollständigkeit und Vielgestaltigkeit des Inventars erwünscht. Andererseits ist bei der späteren Aufarbeitung der Statistik zu erwarten, daß die Anzahl der zweigliedrigen Lautfolgen, die überhaupt theoretisch möglich sind, etwa das Quadrat des Umfangs des Ausgangsinventars ausmachen. Der Arbeitsaufwand wächst mit der Vergrößerung des Grundinventars ganz erheblich an. Von da her ist ein möglichst begrenztes Inventar wünschenswert. Aus diesem Grund wurde die statistische Untersuchung auf das für die deutsche Hochlautung typische Mindestinventar beschränkt und besteht aus 42 Lauten (Lindner, 1961): Vokale: [a] (Falle), [e] (fressen), [a] (Falle), [i] (sitzt), [o] (Post), [u] (Butter), [ce] (Löffel), [ Y ] (Stück), [a:] (fahren), [e:] (wem?), [i:] (sie), [o:] (Ofen), [u:] (gut), [e:] (Säge), [ 0 : ] (böse), [y:] (Bücher), [ao] (Maus), [ae] (ein), [00] (läuft), [e] (hängt). Konsonanten: [b] (Baum), [d] (die), [g] (gut), [p] (Paul), [t] (Ton), [k] (Kahn), [v] (Willi), [z] (Reise), [3] (Journal), [j] (ja), [f] (Fall), [s] (Maus), [J] (schaut), [g] (riecht), [x] (auch), [h] (hängt), [m] (Maus), [n] (nein), [rj] (Fang), [1] (lieb), [R] (Rast), [R] (davor). Mit diesen 42 Lauten lassen sich die wichtigsten tatsächlichen Realisationen zusammenhängender deutscher Sprache darstellen. Sie entsprechen bis auf eine Ausnahme auch dem Grundinventar der deutschen Hochlautung. Diese Abweichung betrifft das R. Es ist bekannt, daß das R längst nicht in allen Fällen als Schwinglaut voll realisiert wird und daß es verschiedene Lautvarianten gibt, die an Stelle des voll realisierten R gesprochen werden (ULBRICH). Deshalb wurden alle voll realisier-
4.2. Methode
81
ten R-Formen (gleichgültig, ob als Zungenspitzen- oder Zäpfchen-R realisiert oder realisierbar) unter dem Zeichen R in die Statistik aufgenommen, alle als Auflösungsvariante (gleichgültig, ob als Reibelaut, vokalische Substitution oder mögliche Elision) realisierten oder realisierbaren R-Allophone unter dem Zeichen R in die Statistik aufgenommen. Vor allem für die spätere praktische Anwendung im Artikulationsunterricht und für den Fremdsprachenunterricht ist die Position des R-Lautes wesentlich. Die Untersuchungen wurden an unterschiedlichen Textvorlagen durchgeführt : a) einfachste Sprache im Lesebuch für Gehörlose des 2. Schuljahres (etwa 5000 Lautfolgen) b) Transkription einer Nachrichtensendung des Berliner R u n d f u n k s (etwa 5000 Lautfolgen) c) zwei Prosatexte mit möglichst wenig direkter Rede aus schöngeistiger Literatur von zwei verschiedenen Autoren (rund 10000 Lautfolgen). Die schriftlich vorgegebenen Texte wurden nach der Norm der deutschen Hochlautung in Lautfolgen transkribiert, die Nachrichtensendung nach der Reallautung. Bei einem Vergleich der drei unterschiedlichen Texte ergab sich, d a ß die grundlegenden Gesetzmäßigkeiten der Lautfolge-Strukturen bei allen drei Texten die gleichen waren. Deshalb wurden die Ergebnisse zusammengefaßt, damit die Ausgangsbasis verbreitert und damit die Aussagesicherheit erhöht wird. Es werden im folgenden Ergebnisse dargelegt und interpretiert, die sich auf den Gesamttext von rund 20000 Lautfolgen beziehen. I n der ersten Arbeitsphase wurden die Texte — bezogen auf das oben dargestellte Lautinventar — transkribiert. Dabei wurden in die fortlaufenden Texte auch die verschiedenen Silben-, Wort- und Sprechtaktgrenzen zur Bestimmung der Arten der Lautfolgen eingezeichnet. Bei dem gesprochenen Nachrichtentext ist die Festlegung der Atempausen bereits durch den Sprecher vorgegeben. Man brauchte sie nur aufzuzeichnen. Bei den schriftlichen Textvorlagen wurden die Atempausen dort angenommen, wo sie beim emotional neutralen Sprechen normalerweise liegen. Die Grenzen zwischen den Wörtern sind durch die inhaltliche Struktur des Ausspruchs eindeutig bestimmt. Schwierigkeiten machte vor allem die Markierung der Silbengrenzen, selbst wenn m a n
82
4. Statistik der Lautfolge-Strukturen
davon ausgeht, die Silbengrenzen nur nach rein artikulatorischen Gesichtspunkten festzulegen. Dabei ergaben sich zwangsläufig Abweichungen von den Regeln der Silbentrennung, wie sie von der Rechtschreibung vorgenommen wird: 1. Bei der Lautfolge [st] (z. B. Fenster) wird zwischen s und t getrennt. (Die Buchstabenfolge st am Anfang von deutschen (nicht Fremd-) Wörtern müßte [Jt] gesprochen werden.) 2. Bei zusammengesetzten Wörtern die den Regeln der Rechtschreibung nach in ihre Bestandteile zerlegt werden müssen, folgt die Silbentrennung den Sprechregeln (z. B . da/rauf). 3. Wenn Silben oder Wörter mit dem gleichen Laut beginnen, mit dem das vorangegangene Wort oder die vorangegangene Silbe endet, dann wird dieser Laut nur einmal gesprochen. Die Grenzlinie geht dann mitten durch den Laut. In diesen Fällen ist eine Silben- oder Wortgrenze nicht angegeben (z. B. Falle, am Meer). Unter der Voraussetzung, daß jeder Laut mit jedem anderen eine Lautfolge bilden kann, sind theoretisch (42 • 41 = ) 1722 zweigliedrige Lautfolgen möglich, die jeweils in drei Formen auftreten können. Damit ist der Umfang abgesteckt, den die Statistik theoretisch erreichen kann. Daran gemessen erscheint der Umfang der Gesamt-Statistik von rund 20000 Lautfolgen als dürftig. Da jedoch nicht alle Möglichkeiten von Lautverbindungen in der deutschen Sprache ausgeschöpft werden und das Ziel, wie schon gesagt, nicht Aussagen über statistische Gesetzmäßigkeiten, sondern über Besonderheiten des Sprechbewegungsablaufs sind, werden die häufigsten Lautfolgen mit Sicherheit vollständig erfaßt. Das haben auch Untersuchungen von F R A N K ergeben, der feststellte, daß etwa bei 20000 Elementen der Umfang der Statistik erreicht ist, wo keine neuen Lautverbindungen zum bereits erarbeiteten Material hinzukommen. Das würde bedeuten, daß 20000 Lautfolgen ausreichen, ein vollständiges Bild nicht nur über die häufigsten, sondern darüber hinaus auch die weniger häufigen Lautfolgen zu vermitteln. Nach erfolgter Auswertung der Statistik hat sich herausgestellt, daß das Inventar einige Mängel enthält, die bei zukünftigen statistischen Untersuchungen korrigiert werden müßten: Das Ende und der Anfang der Sprechtakte sind nicht besonders in die Statistik aufgenommen, und der Vokaleinsatz ist nicht als besonderes Zeichen vermerkt. In der zweiten Arbeitsphase wurden aus der Lautfolge der phonetischen Transkription die zweigliedrigen Lautfolgen bestimmt. Dabei wurde jeder Laut, außer dem ersten und letzten eines Sprechtaktes, zweimal
4.3. Ergebnisse
83
registriert, einmal als der letzte einer Lautfolge, ein zweites Mal als das Anfangsglied einer solchen. (Z. B. wurde das Wort Tafel in die folgend e n zweigliedrigen Lautfolgen aufgeschlüsselt: [ta:] (SiB), [a:f] (WoB), [fo] (SiB), [al] (SiB).) (In Klammern jeweils die A r i d e r Lautfolgen: SiB = Silbenbindung, WoB = Wortbindung) Die Ergebnisse der Bestimmung der Lautfolgen wurden in vorbereitete Listen eingetragen und •dann zusammengefaßt.
4.3. Ergebnisse der Statistik Untersuchungen über Lautfolge-Strukturen sind bisher noch sehr •selten durchgeführt worden. Das mag an der umständlichen Form der •dann folgenden Auswertung liegen. Der Vorschlag, solche statistischen Untersuchungen durchzuführen, ist jedoch schon sehr alt; bereits 1936 wurde von E. und K . Z W I E N E R das Problem aufgeworfen, jedoch nicht praktisch ausgeführt. F ü r das Deutsche liegen nur die Untersuchungen von H . M E I E R und L I N D N E R ( 1 9 6 1 ) vor, wobei nur die letztere den .Zuschnitt auf die Sprechbewegungen hat und die drei verschiedenen Arten von Lautfolgen innerhalb der Silben, Wörter und Sprechtakte unterscheidet. Die Lautfolgen selbst müssen zwangsläufig von unterschiedlicher Häufigkeit sein. Rein rechnerisch gibt es Laute, die in der Statistik häufig vorkommen und solche, die seltener auftreten. Daraus läßt sich f ü r jede einzelne Lautfolge ein Erwartungswert ermitteln, der sich als das Produkt ihrer relativen Häufigkeiten ergibt. Dieser rein rechnerischen Ermittlung der Häufigkeit von Lautverbindungen liegt die Annahme zugrunde, daß in der Sprache alle Lautfolgen möglich und daß •die Laute nach den Gesetzen der Zufälligkeit miteinander kombiniert seien. Die praktischen Erfahrungen zeigen aber, daß die Häufigkeit von Lautfolgen ganz anderer Art ist. Manche Laute gehen mit manchen anderen überhaupt keine Verbindung ein, dagegen sind bestimmte L a u t e als Nachfolger eines oder mehrerer Laute besonders stark prädestiniert. . Z W I R N E R hat das Verhältnis von tatsächlicher Häufigkeit zu erwarteter Häufigkeit als „Affinität" bezeichnet. Damit die erwarteten Wahrscheinlichkeiten von Lautkombinationen berechnet werden können, müssen die Häufigkeiten f ü r das Vorkomm e n der einzelnen L a u t e im gesamten Text bekannt sein. Deshalb sei
4. Statistik der Lautfolge-Strukturen
84
eine Übersicht über die prozentualen Häufigkeiten der Laute im untersuchten Text vorangestellt: Vokale kurze (offene) Vokale a e 9 i
3,8 3,6 8,5 4,1
o
1,2
ü ä ce Y
2,1 0,0 0,1 0,3
37,2
Konsonanten
23,7
stimmhafte Verschlußlaute 9,0 b 2,0 d 5,2 g 1,8 stimmlose Verschlußlaute p 1,1 t 9,2 k 1,9
lange (geschlossene) Vokale a: 2,1 e: 2,1 i: 2,5 o: 1,0 u: 0,9 e: 0,3 o: 0,2 y= 0,5
9,6
Diphthonge ao ae
3,9
00
1,0 2,5 0.4
62,8
12,2
stimmhafte Engelaute v 1,7 z 1,7 3 0,0 j 0,5 stimmlose Engelaute f 3,0 s 5.4 1,7 J 1.5 ? X 0,7 1,3 h
13,6
Nassallaute
12,7
q Liquide 1 R B
3,9
2.4 9.5 0,8 11,4 3,7 2,6 5,1
Wenn man von der Verteilung von Vokalen (37,2%) und Konsonanten (62,8%) im Text ausgeht, würde sich eine Häufigkeit der Kombinationen zwischen den Hauptgruppen von Lauten nach den Gesetzen der Zufallsstatistik in folgender Weise ergeben:
4.3. Ergebnisse Vokale Vokale Konsonanten Konsonanten
85 - Vokale — Konsonanten — Vokale — Konsonanten
13,8% 23,4% 23,4% 39,4%
Demgegenüber ergibt aber die tatsächliche Verteilung der Verbindungen im untersuchten Text ein ganz anderes Bild: Vokale Vokale Konsonanten Konsonanten
- Vokale — Konsonanten — Vokale — Konsonanten
1,5% 36,7% 36,4% 25,4 %
Diese beiden Übersichten müssen im Zusammenhang gesehen werden. Sie machen zahlenmäßig deutlich, was eigentlich auch schon vorher b e k a n n t war, aber hier durch die Zählung bewiesen wird, d a ß die Affinität zwischen L a u t e n der gleichen H a u p t g r u p p e n gering ist, vor allem die Affinität der Vokale untereinander, u n d d a ß der H a u p t t e i l der Lautverbindungen von den Verbindungen von Vokalen mit Konsonanten gestellt wird. D a s bestätigt die von MENZERATH u n d D E LAOEKDA gemachte Bemerkung, daß das Sprechen eine unaufhörliche Folge von Öffnungs- und Schließbewegungen ist (1934, S. 58). Als Folge von Vokalen u n d Konsonanten sind bereits die Lallmonologe des Säuglings anzusehen. Die Affinität der H a u p t g r u p p e n von L a u t e n zueinander vermittelt noch kein vollständiges Bild von den Affinitätswerten, weil in diesen Zahlen auch die Lautfolgen mit enthalten sind, die a n den Wortgrenzen im Satzzusammenhang u n d bei den Silbengrenzen im Wortinnern entstehen, u n d hierbei sind praktisch die zufälligen Kombinationsgesetze in weit stärkerem Maße wirksam als bei den Lautfolgen innerhalb der Silben. Von den ausgezählten Silben waren 6 9 % Silbenbindungen, 14% Wort- u n d 1 7 % Satzbindungen. Bezieht m a n die Aufteilung der Lautfolgen zwischen den H a u p t g r u p p e n nur auf die Silbenbindungen, so ergibt sich ein verändertes Bild: Vokale Vokale Konsonanten Konsonanten
- Vokale — Konsonanten — Vokale — Konsonanten
0,0% 37,8% 47,2% 15,0%
D a r a u s ist zunächst ersichtlich, daß, wie wahrscheinlich erwartet, die Lautfolgen von zwei Vokalen a n den Wort- u n d Satzfugen entstehen. Sie müssen zwar im Bewegungsablauf des zusammenhängenden Sprechens
86
4. Statistik der Lautfolge-Strukturen
gemeistert, aber nicht zwangsläufig als ein einheitlicher Bewegungsablauf realisiert werden; denn an diesen Stellen ist eine Unterbrechung des hörbaren Artikulationsablaufs oder eine Verlangsamung möglich. Es ist wahrscheinlich, daß dies sogar tatsächlich geschieht, wenn man bedenkt, daß im Deutschen vokalanlautende Wörter in der Regel mit Vokaleinsatz zu sprechen sind. Ein Teil des Bewegungsablaufs vollzieht sich also bei reinen Vokalfolgen ohne Stimme, d. h. unhörbar. Auffällig an der Statistik der Lautfolgen innerhalb der Silben ist, daß die Anzahl der Vokal-Konsonant-Folgen geringer ist als die der Konsonant-Vokal-Folgen. Das steht mit der besonderen Form der Struktur der Silben in der deutschen Sprache in Zusammenhang; denn es gibt mehr Silben, die mit einem Vokal enden als solche, die mit einem Vokal beginnen, wenn man nur an die häufig vorkommenden Vorsilben beund ge- denkt, sowie an die ganze Gruppe der offenen Silben. Bevor über einzelne Lautfolgen etwas dargelegt werden soll, sollen zunächst L&utgruppen besprochen werden. In der Übersicht der Lauthäufigkeiten waren bereits die Vokale in 3, die Konsonanten in 6 Gruppen aufgeteilt worden ( L I N D N E R , 1961). Bei einer systematischen Darstellung könnten demnach insgesamt 81 Arten von Kombinationen verbal interpretiert werden. Das ist hier nicht notwendig. In diesem Zusammenhang geht es darum, einige bemerkenswerte Ergebnisse herauszugreifen und für die Einsicht in den Bewegungsablauf nutzbar zu machen. Bei den reinen Vokalfolgen ist bemerkenswert, daß 65% aller in die Statistik eingegangenen Vokalfolgen als Satzbindungen registriert worden sind, also im (Satzzusammenhang entstanden sind, wenn ein Wort auf einen Vokal endet und das nächste mit einem Vokal beginnt. In diesem Fall sind sie beide mit Sicherheit durch den Stimmeinsatz getrennt. Die Verbindungen von Vokalen mit Konsonanten und umgekehrt sind die wichtigsten überhaupt. Das kommt auch in den Zahlen der Statistik zum Ausdruck. Sie machen fast drei Viertel aller im zusammenhängenden Text gesprochenen Lautfolgen aus, zeichnen sich durch hohe Affinität zueinander aus und haben einen hohen Prozentsatz von Silbenbindungen. Bei ihnen kommen 80% der überhaupt festgestellten Lautfolgen innerhalb von Silben vor. Bei den Vokalen nehmen die kurzen Vokale eine Sonderstellung ein. Sie haben bereits als Einzellaute die größere Häufigkeit. Die Affinität der Vokale zu den Konsonanten ist im Ganzen etwa gleich und liegt zwischen 1 und 2.
4.3. Ergebnisse
87
Verschlußlaute stehen weit häufiger vor Vokalen als nach ihnen. D a s gilt vor allem für die stimmhaften Verschlußlaute, die als Anfangsglied einer Lautverbindung eine Affinität von 2,6, als Endglied aber nur eine Affinität von 0,8 aufweisen, also weniger oft vorkommen, als aus der Zufallsverteilung erwartet werden kann. Die stimmhaften Verschlußlaute kommen vor Vokalen nur innerhalb von Silben vor, nach Vokalen dagegen fast nie innerhalb einer Silbe. Auch das läßt sich mit der Erfahrung gut in Übereinstimmung bringen: stimmhafte Verschlußlaute sind fast ausschließlich Laute im Wort- oder Silbenanlaut. Aber auch die stimmlosen Verschlußlaute weisen vor Vokalen einen höheren Affinitätswert auf mit 1,3 als unmittelbar nach Vokalen, wo sie mit 1,0 gerade dem Erwartungswert entsprechen. Auch die Engelaute stehen häufiger vor Vokalen als nach ihnen. Aber die beiden Gruppen von Engelauten verhalten sich dabei völlig gegensätzlich: Die stimmhaften Engelaute sind typische Anlautkonsonanten; sie kommen vor Vokalen nur innerhalb der Silbe vor und zeigen zii folgenden Vokalen eine sehr große Affinität von 2,8. Besonders groß ist ihre Affinität zu den langen Vokalen mit 4,1. Das ist der höchste Affinitätswert, der bei Folgen von Lautgruppen überhaupt gefunden wurde. Die stimmlosen Engelaute zeigen ein umgekehrtes Verhalten, obwohl sie nicht so ausgesprochen typisch die Endlautposition charakterisieren, wie die Anlautposition von den stimmhaften Engelauten vertreten wird. Sie haben zu voraufgehenden kurzen Vokalen die größere Affinit ä t mit 1,7. Die stimmlosen Engelaute folgen den kurzen Vokalen in der Silbe in hohem Grade, die stimmhaften nur in wenigen Ausnahmefällen. Die Nasalen und Liquiden sind vorwiegend Endkonsonanten. Besonders groß ist die Affinität zu voraufgehenden kurzen Vokalen mit 2,8. 95%. dieser Lautfolgen kommen innerhalb der Silbe vor. Man denkt hierbei in erster Linie an die Endsilbe -en. Noch größer ist die Affinität zu voraufgehenden Diphthongen mit 3,2, hervorgerufen durch den unbestimmten Artikel „ein" und seine Beugungsformen. Auch die Affinität der Liquiden ist in Verbindung mit Vokalen recht hoch. Sie zeigen sowohl in prävokalischer als auch in postvokalischer Stellung hohe Affinitätswerte. Eine Ausnahme bilden die Diphthonge. Nach Diphthongen sind Liquide selten, was durch den kleinen Affinitätswert von 0,2 ausgedrückt wird. Die Lautfolgen von Vokalen und Konsonanten stellen einschließlich ihrer Umkehrung das Normale dar, komplizierte Folgen von Öffnungs-
88
4. Statistik der Lautfolge-Strukturen
u n d Schließbewegungen des Artikulationstraktes. Die Lautfolgen von Konsonanten stellen die Ausnahme dar, aber gerade sie macht die Sprache prägnant und präzis. Durch bestimmte Konsonantenfolgen werden die Beugungen der Wörter vollzogen, die ihre grammatische Beziehung zueinander ausdrücken. Bei den Lautfolgen von Konsonanten untereinander zeigen sich bemerkenswerte Ausfälle: (Sie beziehen sich auf die Lautfolgen im Deutschen, haben also nicht allgemein-sprachliche Bedeutung.) Auf einen stimmhaften Engelaut folgt nie ein anderer Konsonant. Auf einen stimmhaften Verschlußlaut folgen andere Konsonanten (außer einem Liquiden wie in [bR, bl, dR, gR, gl)] nur ganz selten. Die angeführten Ausnahmen stehen zu 94% ihres Vorkommens innerhalb der Silben. Die stimmlosen Verschlußlaute treten sehr häufig in Lautfolgen mit stimmlosen Engelauten auf. Zwischen ihnen besteht eine große Affinit ä t von 1,6 und ein großer Prozentsatz an Silbenbindungen. Die stimmlosen Engelaute stehen häufig in Lautfolgen mit nachfolgenden Verschlußlauten, vorwiegend mit stimmlosen Verschlußlauten, wobei eine Affinität von 2,1 erreicht wird. Bei den Lautfolgen mit •stimmlosen Verschlußlauten handelt es sich vorwiegend um solche innerhalb der Silbe, was durch einen Anteil von 70% Silbenbindungen dokumentiert wird. Bei den Lautfolgen mit stimmhaften Verschlußlauten handelt es sich dagegen vorwiegend um Lautfolgen von Wort zu Wort, was durch den hohen Prozentsatz an Satzbindungen von 82% ausgedrückt wird. Die Nasalen gewinnen in Lautfolgen mit anderen Konsonanten typischere Züge als Auslautkonsonanten. Verbindungen mit anderen Konsonanten kommen innerhalb der Silben nur zu 28% vor; sie stehen nie in Lautfolgen mit anderen Nasalen oder Liquiden, nur in Ausnahmen mit stimmhaften Verschlußlauten oder stimmhaften Engelauten. Auch die Liquiden zeigen in ihrer Lautfolgestruktur deutliche LTnterschiede; sie haben hohe Affinität zu nachfolgenden stimmhaften und stimmlosen Verschlußlauten. Dagegen ist die Affinität zu anderen Liquiden oder Nasalen gering. Aus den Lautfolgen von Gruppen lassen sich auf bestimmte sprachliche Eigentümlichkeiten der deutschen Sprache Schlüsse ziehen; die Bewegungsvorgänge lassen sich aus ihnen nur soweit ermitteln, als ein bestimmter Bewegungsahlauf für eine Gruppe von Lauten gemeinsam, vorhanden ist. Das trifft auf die Gruppen aller stimmlosen im Gegensatz zu den stimmhaften Konsonanten und Vokalen zu, auf die Bewe-
4.3. Ergebnisse
89
gung des Gaumensegels, die in der Gruppe der Nasalen im Gegensatz zu allen oralen L a u t e n zum Ausdruck k o m m t . Aber schon bei den Verschlußlauten hört die Möglichkeit einer Gruppenbetrachtung auf, da der zur Bildung der Verschlußstellen notwendige Bewegungsablauf je nach der Artikulationsstelle des Verschlusses verschieden ist. Die Verschlußlaute haben zwar ein gemeinsames Bildungsmerkmal, aber keinen in Einzelheiten übereinstimmenden Bewegungsablauf. W e n n nach den Regeln einer Zufallskombination von 42 L a u t e n jeder L a u t mit jedem andern eine Lautfolge bilden könnte, so würde das, rein theoretisch, die stattliche Anzahl von 1722 möglichen Lautfolgen ergeben. Sie sind im Deutschen nicht alle möglich, wahrscheinlich in anderen Sprachen auch nicht. Aber es ist wahrscheinlich, d a ß das Auswahlprinzip, welche Lautfolgen in einer Sprache vorkommen, welche nicht, f ü r jede Sprache etwas anders ist. Schon die B e t r a c h t u n g der Lautfolgen innerhalb der Lautgruppen h a t gezeigt, d a ß manche Gruppenverbindungen insgesamt ausfallen, d a ß die Lautfolgen von Vokalen mit Vokalen im Deutschen selten sind u n d n u r a n bestimmten Stellen im Sprechtakt auftreten können. Eine eingehendere Einsicht in die einzelnen Lautfolgen ist sehr interessant ; denn in den einzelnen Folgen von Laut zu Laut sind die notwendig auszuführenden Organbewegungen enthalten. W e n n m a n die Lautfolgen ihrer Häufigkeit nach ordnet, so treten die gleichen Gesetzmäßigkeiten auf, die sich auch sonst bei der Abzahlung sprachlicher Einheiten ergeben. Diese Gesetzmäßigkeiten sind a n Wörtern, a n L a u t e n u n d in englischer Sprache auch a n Silbenstrukt u r e n untersucht worden. Sie zeigen immer wieder die gleiche Gesetzmäßigkeit, daß eine kleine Gruppe von Elementen existiert, die sehr häufig vorkommt, u n d daß ihr eine reichhaltige Formengruppe gegenübersteht, deren Elemente aber mit relativ geringer Häufigkeit auftreten. Aus der Differenz zwischen theoretisch möglichen u n d praktisch nicht vorkommenden läßt sich n u n schon bereits auf solche Bewegungen schließen, die dem Bewegungsprinzip allgemein oder zumindest dem der deutschen Sprache widersprechen. Diese gesetzmäßigen Ausfälle sind bei den Gruppenverbindungen schon formuliert worden: I m Deutschen folgt auf einen stimmhaften Engelaut nie ein weiterer Konsonant. Auf einen s t i m m h a f t e n Verschlußlaut folgt n u r in Ausnahmefällen ein Konsonant, außer einem Liquiden. 7
Lindner
90
4. Statistik der Lautfolge-Strukturen
Auf einen Vokal folgt innerhalb der gleichen Silbe in deutschen Wörtern kein weiterer Vokal. Wieviel der möglichen 1722 Lautfolgen im zusammenhängenden Text tatsächlich vorkommen, läßt sich nach der durchgeführten statistischen Untersuchung für den untersuchten Text wohl sagen. Es sind 913 t a t sächlich vorgekommen. Aus den Untersuchungen von F B A N K kann als wahrscheinlich angesehen werden, daß diese Zahl in anderen Texten nicht wesentlich anders ist. Das heißt aber nicht, daß sie als vollkommen exakt gelten kann. Das bedeutet, daß von den theoretisch möglichen Lautfolgen in der deutschen Sprache nur etwa die Hälfte realisiert wird. Bei den Silbenbindungen ist der Anteil noch geringer. Nur 34% der möglichen Lautfolgen sind als Silbenbindungen realisiert worden. Die anderen 19% entstehen nur an Silben- und Wortgrenzen innerhalb des Sprechtaktes. Bei der Ausnutzung der Realisationsmöglichkeiten nehmen die Lautfolgen von Vokalen und Konsonanten auch wieder die erste Stelle ein; von den theoretischen Möglichkeiten werden 67% realisiert. Bei manchen Lauten sind bestimmte Arten von Lautverbindungen unmöglich. Auch diese Erkenntnisse sind bereits bekannt. Die Statistik ergibt insofern keine neuen Erkenntnisse. Sie sollen aber der Vollständigkeit halber noch einmal angeführt werden, soweit sie sich aus der Statistik tatsächlich ableiten lassen: Auf [z, j, h] folgt nie ein weiterer Konsonant vor [x, h, q, -K] steht nie ein anderer Konsonant (bei [h] innerhalb der gleichen Silbe) vor [q] steht nie ein Langvokal oder Diphthong. Wenn es auch bedeutsam ist zu wissen, welche Lautfolgen im Deutschen nicht vorkommen, so ist doch die Frage viel wichtiger, welche Lautfolgen und damit Bewegungsabläufe im Deutschen häufig vorkommen. Denn gerade für die künstliche Sprachanbildung ist eine solche Antwort wesentlich. Man kann davon ausgehen, daß für die Einübung einer bestimmten Sprechbewegung Zeit aufgewendet werden muß. Wenn es sich dabei um einen Bewegungsablauf handelt, der in der Sprache häufig vorkommt, so ist die aufgewendete Zeit für Lehrer und Schüler viel rationeller angewendet, als wenn es sich um einen Bewegungsablauf handelt, der nur in ganz wenigen Wörtern einmal vorkommt. Auch ist die Gefahr, daß der Bewegungsablauf wieder verlernt wird, dabei viel größer, weil keine Bekräftigung des eingeübten Steuerungsmechanismus erfolgt. In der Übersicht über die häufigsten Lautfolgen sind auch
4.3. Ergebnisse
91
%
r" p i j
•— — _. _i
r
.i l-/ r 1/
¥
/
.
1
Y
M1 A
—
pO, -
j-
/ i: 1
]
\ y
/T
\
i ' Abb.
2
4
a
16
25
50
100
200
400
900
1600
6. Zusammenhang zwischen der Anzahl der zweigliedrigen Lautfolgen und ihrer relativen Gebrauchshäufigkeit in aufsummierender Darstellung. F ü r alle Arten von Lautfolgen (ausgezogene Kurve) und für Lautfolgen nur innerhalb von Silben (gestrichelte K u r v e ) .
die häufigsten Bewegungen, die beim Sprechen zusammenhängenden Textes bewältigt werden müssen, enthalten. Wenn man die Folgen einzelner Laute nach der Häufigkeit ihres Vorkommens ordnet und stets die häufigsten summiert (kumulative Darstellung), so ergibt sich auch für die Lautfolgen eine ähnliche Gesetzmäßigkeit, die schon für andere zählbare sprachliche Einheiten erwähnt worden ist (Abb. 6). Aus der Abbildung läßt sich ersehen, daß sowohl die Lautverbindungen insgesamt als auch die innerhalb der Silben der gleichen Gesetzmäßigkeit folgen, nur daß die für die Silbenbindungen ermittelte Kurve über der der Gesamtanzahl und parallel zu ihr verläuft. Aus dieser zunächst summarischen Darstellung ist zu ersehen, daß die häufigsten 16 Lautfolgen 2 5 % , die häufigsten 80 Lautfolgen 5 0 % , die häufigsten 250 Lautfolgen 8 0 % aller vorkommenden Lautfolgen im zusammenhängenden Text ausmachen. 7*
92
4. Statistik der Lautfolge-Strukturen
Abb. 6 zeigt deutlich, daß n u r wenige Lautfolgen die Mehrzahl aller praktisch vorkommenden ausmachen, daß sich also wenige, aber wichtige Bewegungsabläufe immer u n d immer wieder beim zusammenhängenden Sprechen wiederholen. W e n n das Anbildungsprogramm beim künstlichen oder das Rehabilitationsprogramm beim gestörten Sprechen auf diese wichtigen Bewegungen leonzentriert wird, so ist damit neben einem hohen praktischen Wirkungseffekt auch gewährleistet, d a ß sie durch den Gebrauch ständig wiederholt u n d damit nicht vergessen werden. Aus dieser Übersicht ist auch das umgekehrte zu ersehen, d a ß die restlichen 2 0 % aller vorkommenden Formen von Lautfolgen sich auf etwa 660 verschiedene Arten von Lautfolgen beziehen. Der Rest stellt also einen sehr großen Formenreichtum von geringer Gebrauchshäufigkeit dar. Noch stärker ist diese Konzentration der Gebrauchshäufigkeit auf wenige F o r m e n bei den Lautfolgen zu beobachten, die innerhalb von Silben auftreten. Die häufigsten 12 Silbenbindungen machen 25%, 500/0, 8 0 % aller Lautfolgen innerhalb der Silben aus, die in zusammenhängendem Text gesprochen werden. Die restlichen 20 Prozent verteilen sich auf etwa 430 verschiedene F o r m e n von Silbenbindungen. E s lohnt sich also, die 80 häufigsten Lautfolgen näher zu betrachten, denn in ihnen ist ein Bewegungsanteil konzentriert, der im Durchschnitt in jeder zweiten Lautfolge verwendet wird. U n t e r den häufigsten 80 (siehe auch Tabelle am Schluß des Kapitels) sind Lautfolgen der H a u p t g r u p p e n Vokal-Vokal nicht vertreten. Die Verbindungen zwischen den anderen H a u p t g r u p p e n kommen in der folgenden Verteilung vor: Konsonanten — Vokale 32 Vokale — Konsonanten 27 Konsonanten — Konsonanten 21 U n t e r den Vokalen, die a n diesen häufigsten Lautfolgen beteiligt sind, gehören 47 zur Gruppe der kurzen, offenen Vokale u n d 7 zur Gruppe der langen, geschlossenen. Fünf sind Diphthonge. E s ist interessant, daß die kurzen Vokale dabei so stark überwiegen, stehen doch die langen Vokale in der Vorstellung der Menschen viel mehr im Vordergrund, j a manche wissen gar nicht, d a ß es überhaupt die kurzen gibt. Die
93
4.3. Ergebnisse
kurzen Vokale müssen also bei Sprechübungen sehr stark in den Vordergrund gerückt werden, wenn diese praxisnah sein sollen. Unter den 80 häufigsten Lautfolgen ist der Anteil an Silbenbindungen sehr hoch. E r erreicht bei den Folgen von Vokalen und Konsonanten 90, bei reinen Konsonantenfolgen dagegen nur 54 Prozent. Das bedeutet aber, daß die häufigsten Konsonantenfolgen zu einem erheblichen Prozentsatz an Wort- und Silbenfugen auftreten. Innerhalb der Silbenbindungen ergibt sich im Prinzip das gleiche Bild, nur daß die Konzentration noch größer ist. Die 46 häufigsten Silbenbindungen, die 5 0 % der real gesprochenen Silbenbindungen repräsentieren, wiesen die folgende Verteilung auf: Konsonanten — Vokale 23, mit kurzen Vokalen davon 19 Vokale — Konsonanten 18, „ „ „ „ 15 Konsonanten — Konsonanten 5 Hierbei ist auffällig, daß bei den Silbenbindungen die kurzen Vokale noch stärker in den Vordergrund rücken. Bei einem Vergleich der häufigsten Lautfolgen insgesamt und nur innerhalb der Silben muß man feststellen, daß zwischen beiden Statistiken eine weitgehende Korrelation besteht. Sämtliche der häufigsten Silbenbindungen sind in der zahlenmäßig größeren Gruppe der häufigsten allgemeinen Lautfolgen enthalten. Die 80 häufigsten Lautfolgen V -
1.
2. 3. 4. 5. 6. 7. 8. 9. 10.
Ii.
12.
K
K -- V
an
aR
nt ta
aen
tB 15
K -
st
ts de
na
nd
K
Si*
Wo*
Sa*
ges.
610 253 319 319 225 151 299 272 212 209 206 10
6 50
17 43
633 346 319 319 309 305 302 272 212 209 207 207
—
—
65
—
19 1
153 3
—
—
—
—
—
1
92
*Si = Silbenbindungen, Wo = Wortbindungen, Sa =
— —
105
Satzbindungen
94
4. Statistik der Lautfolge-Strukturen
Fortsetzung der Tabelle V 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37. 38 39. 40. 41. 42. 43. 44. 45. 46. 47. 48. 49. 50. 51.
K
K -
V
K -
di:
un as
IS
an e :i? in en
at
ES al
uq
ga
da be da
Rt de: tae
Jt
SI da: Re ni ha sa
ft
ft sd
lt
ti li
le
aet
nf ita
vi: zi
tf
K
Si 197 195 187 176 175 174 164 159 146 147 137 63 126 128 121 17 79 32 91 81 88 85 77 60 49 84 44 83 5 46 9 56 74
Wo
Sa
—
—
2 4 —
—
70
— —
—
—
—
—
—
—
2 —
— —
4 45 9
—
33 —
—
—
—
—
99 2 62
—
18 — —
—
9 —
— —
—
—
8
—
25 2
—
34 —
—
34 —
5 35 18 —
1 25
—
73 73 37
—
6 —
73 1 53 22 2 51
—
—
—
—
35 15 —
—
56 —
ges. 197 195 189 180 175 174 164 159 148 147 141 141 135 128 121 116 99 94 91 90 88 85 85 85 85 84 84 83 83 82 80 78 77 76 73 73 72 71 70
95
4.3. Ergebnisse Fortsetzung der Tabelle V 52. 53. 54. 55. 56. 57. 58. 59. 60. 61. 62. 63. 64. 65. 66. 67. 68. 69. 70. 71. 72. 73. 74. 75. 76. 77. 78. 79. 80.
K
K -
V
K -
K
Si 59 68 11 66 66
Ol
fo R\ fe fe nb
Wo 10 —
24 —
Rn i: R ml tR te ta la nv
It Ri el el kt at aos me es e: n ti
56 —
HI 11 —
—
20 —
—
2 —
3 4 10 1 1 8
56 56 49 55 53 37 23 10 50 52 48 44 20
iR
32 —
—
ma
—
—
10
65 55 33 63 59 57 44 40 54
aof
ges.
—
—
Z9
Sa
2 2 17 18 1 49 1 1 —
1
—
3 6 29 15 3 —
—
12 3 29 — —
3 6 13
—
1 18
69 68 67 66 66 66 65 65 64 63 61 61 61 61 59 59 58 58 57 56 56 55 55 54 53 52 51 51 51
Die 46 häufigsten Silbenbindungen Y-K 1. 2. 3.
K-Y
an sR te
K-K
Anzahl 610 319 319
Nr. bei häuf. Lautfolgen 1 3 4
96
4. Statistik der Lautfolge-Strukturen
Fortsetzung der Tabelle V — K 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37. 38. 39. 40. 41.
K — V
K —K
Anzahl
Nr. bei häuf. Lautfolgen
ts
299 272 253 225 212 209 206 197 195 187 176 175 174 164 159 151 147 146 137 128 126 121 91 88 85 84 83 81 79 77 74 73 73 70 68 66 66 65
7 8 2 5 9 10 11 13 14 15 16 17 18 19 20 6 22 21 23 26 25 27 31 33 34 38 40 32 29 35 45 47 48 51 53 55 56 58
ER nt st dE i?
na di: ga
ün as IS
da ba da aen e: B an in de: En Jt ES
da: Ra ha sa ül
at aq li la vi : ZI fo fE fa
za
97
4.4. Testsatz Fortsetzung der Tabelle Y-K 42. 43. 44. 45. 46.
K-V
i: R nl Ol ml
K-K
Anzahl
Nr. bei häuf. Lautfolgen
Et
63 63 60 59 59
24 61 36 52 62
4.4. E i n T e s t s a t z f ü r die A n w e n d u n g d e r h ä u f i g s t e n L a u t f o l g e - S t r u k t u r e n So einleuchtend es H S -a si S ©a S hs C3 s 3 ® S h d 55 o .j o u
® W .2
1 1
X!
104
5. Experimentelle Analyse
•zeitlichen Gliederung gut zu erkennen, obwohl sie in einigen Frequenzgebieten durch das Störgeräusch verdeckt waren. Eine Analyse mit anderen Geräten, beispielsweise mit einem Oszillographen, erübrigte sich aus diesem Grunde. Daher wurde ein Weg gesucht, der es ermöglicht, trotz der unvollkommenen Ausgangssituation die Ergebnisse der genetischen und der gennematischen Analyse aufeinander zu beziehen. Die Röntgenaufnahmen können als diejenigen angesehen werden, auf die sich die Untersuchungen hauptsächlich stützen. Für die Herstellung dieser Relation waren aber ungestörte akustische Abbilder des Sprechaktes vonnöten. Die fehlende natürliche Relation wurde künstlich geschaffen. Dazu wurden von der gleichen Versuchsperson, die im Versuch vor der Röntgenkamera gesprochen hatte, Play-Back-Aufnahmen hergestellt. Der Originalmitschnitt mit dem Sprechakt der Versuchsperson und dem Sprechkommando des Versuchsleiters wurde kopiert, herausgeschnitten und zu einer Schleife geformt, die der Versuchsperson im Studio über Kopfhörer zugeleitet wurde. Nach einer gewissen Eingewöhnungs- und Einübungszeit wurde die Versuchsperson aufgefordert, synchron zu ihrem eigenen lautsprachlichen Zeichen mitzusprechen. Dabei wurde weniger an der Artikulation als an suprasegmentalen Strukturen verbessert. Der Versuchsleiter des Play-Back-Sprechens mußte die Angleichung auditiv so weit wie möglich vornehmen. Dabei waren vor allem die Melodieführung, eventuell aber auch geringe Stockungen im Redefluß die Stellen, an denen die Versuchspersonen Schwierigkeiten hatten. Die Sprechversuche wurden erst dann auf Band aufgenommen, wenn vom Versuchsleiter, der beide Aufnahmen abhören konnte, auditiv völlige Übereinstimmung festgestellt worden war. E s wurden mehrere Aufnahmen gemacht, von denen dann die beste für die Analyse ausgewählt wurde. Der Vergleich zwischen Originalmitschnitt und Play-Back-Aufnahme ergab bei der sonagraphischen Analyse, daß die Differenzen an keiner Stelle größer als 0,1 sec waren. (Abb. 7, 8) Das war ausreichend, um die durch das Geräusch verdeckten Zwischenräume des Artikulationsgeschehens rekonstruieren zu können; zur Grundlage der Zuordnung konnten die Play-Back-Aufnahmen nicht gemacht werden, da ein möglicher Fehler von 0,1 sec immerhin bei einer Bildaufnahmefrequenz von 50 Bildern/sec eine Folge von 5 Bildern ausmacht. Die Versuchspersonen waren nach zwei Gesichtspunkten ausgewählt. .Sie sollten, damit die Filmaufnahmen auch vorgeführt werden konnten,
5. Experimentelle Analyse
105
ein einwandfreies Gebiß aufweisen. Sie sind heutigentags unter Zwanzigjährigen, die meist als Versuchspersonen dienten, nicht leicht zu finden. Die zweite Bedingung bezog sich notwendigerweise auf die Beherrschung der Standardaussprache. Bei den meisten Sprechern sind doch Abweichungen von der Standardaussprache in Richtung auf Umgangssprache oder gar Dialekt vorhanden. Beide Bedingungen sind nur bei wenigen Versuchspersonen erfüllt. Die Beherrschung der Standardaussprache ist notwendig, weil die Sprechbewegungen verschiedener Versuchspersonen miteinander verglichen werden sollen. Das ist nur dann möglich, wenn der Sprechbewegungsablauf auf der gleichen Grundlage, eben der Standardaussprache, vollzogen wird. Sonst wäre erst ein eingehender Vergleich der Mundarten oder Dialekte notwendig, und es wäre nicht zu ermitteln, welche interindividuellen Unterschiede im Sprechbewegungsablauf auf individuelle Eigenarten der Sprecher oder auf Unterschiede in der umgangssprachlichen Realisierung zurückzuführen sind. Das war aber bei einer auf das Notwendigste zu beschränkenden Versuchssituation nicht möglich. Wenn die Forderung, Standardaussprache zu sprechen, nicht in allen Sprechsituationen voll eingehalten worden ist, so liegt das an der Schwierigkeit der Versuchssituation, in der die Versuchsperson einen zwar geübten und beherrschten Text, aber mit fixiertem Kopf und unter Anwendung von Kontrastmitteln sprechen mußte. So sind Abweichungen in Richtung auf die Umgangssprache durchaus erklärlich. I n der Versuchssituation war als Textgrundlage die Folge der Laute festgelegt; es sollten ja nicht besondere Stimmungen ausgedrückt werden. Die Formung der suprasegmentalen Strukturen war dem Ermessen des Sprechers überlassen, der die Realisierung in der ihm gemäßen Weise vollzog. Bei der Analyse der Sprechbewegungen ist ohnehin die Aufmerksamkeit nicht auf die suprasegmentalen Strukturen, sondern vor allem darauf gerichtet, wie sich die Bewegungen der Organe in ihrem Zusammenspiel vollziehen. I n dieser Beziehung ist zwar ein direkter interindividueller Vergleich möglich; er war aber nicht primär beabsichtigt. Die Sprechbewegungen werden von jedem Sprecher vollzogen, indem er den Auftrag realisiert, einen bestimmten Text zu sprechen. Die dabei ausgeführten Sprechbewegungen sind nicht unmittelbar Gegenstand der Kontrolle, sondern das durch sie erzeugte akustische Zeichen. Deshalb ist es notwendig, zunächst die individuelle Schwankungsbreite in der Realisierung der Sprechbewegungen zu bestimmen. Sonst kann es zu Fehlinterpretatio8
Lindner
106
5. Experimentelle Analyse
nen kommen, indem als interindividuelle Unterschiede angesehen wird, was eigentlich noch in den Bereich der individuellen Schwankungsbreite fällt. Auch aus diesen Gründen ist es notwendig, den Text der Untersuchungen zu beschränken und für alle Versuchspersonen gleich zu halten. Deshalb sollte bei derartigen Untersuchungen jede Versuchsperson den gleichen Text mehrfach sprechen. Bei der Analyse der Bewegungen, die im Mittelpunkt steht, muß man davon ausgehen, daß die Bezugsebene für den Vergleich nicht unmittelbar durch das lautsprachliche Zeichen gegeben ist, sondern durch den Auftrag, den vorgegebenen Text zu sprechen. Dieser Auftrag war f ü r alle Versuchspersonen und für alle daraus resultierenden Sprechleistungen der gleiche. Wie er allerdings realisiert worden ist, das war unterschiedlich. Deshalb ist eine unmittelbare Vergleichbarkeit von Einzelheiten der Bewegungsanalysen nicht möglich. Alle Bewegungsanalysen müssen auf den zu sprechenden Text und von da aus auf die Bewegungen, die sich bei der Realisierung von Laut zu Laut vollziehen, bezogen werden. Deshalb ist die genaue Bestimmung jeder einzelnen Bewegungsphase und ihrer Unterordnung unter die eigentliche Absicht, die allein dem Sprechauftrag entspricht, so wichtig. Damit es möglich ist, die ausgeführten Bewegungen dem Text zuzuordnen, wurde auch der ursprünglich konzipierte Text umgestellt. E r lautete zunächst anders. Da aber die Festlegung von Fixpunkten außerordentlich wichtig ist und sie die Voraussetzung f ü r eine genaue Zuordnung bilden, wurde er umgestaltet. I n der verwendeten Fassung sind diese eindeutigen Fixpunkte, durch die eine Festlegung der Einzelheiten erfolgen kann, die Lösung des Lippen-Zahnkontaktes beim [v] in „wie" und die Bildung des Lippenverschlusses beim [b] von „habe". Damit liegen sowohl genetisch wie akustisch deutlich erkennbare Fixpunkte zu Anfang und zu Ende des Testsatzes fest, die eine erste grobe Orientierung und Einteilung des Gesamtbewegungsablaufs und des Sonagramms ermöglichen. Damit kann auch die zeitliche Koordinierung der Darstellungsformen des Testsatzes vorgenommen und auf die Bildaufnahmefrequenz der Kamera bezogen werden. Von diesen Fixpunkten ausgehend werden dann die Zuordnungen der einzelnen Filmbilder zu den Lauten oder den Übergangsphasen durch Vor- und Rückwärtsvergleich ermittelt; denn es ist auf den ersten Blick bei einer bestimmten Organeinstellung nicht zu erkennen, ob eine bestimmte Einzelaufnahme den Höhepunkt einer Lautausprägung oder ein Übergangsstadium darstellt.
5.1. Sprechbewegungen
107
5.1. Analyse der Sprechbewegungen mit Hilfe des Röntgenfilms Kernstück unserer praktischen Untersuchungen waren Filmaufnahmen der Sprechbewegungen mit Hilfe des Röntgenfilms. Dabei tritt wie bei anderen Methoden der Registrierung auch eine Beeinflussung der Versuchsperson ein; völlig unbeeinflußte Sprechbewegungsabläufe lassen sich damit nicht verfolgen. Bei allen Filmaufnahmen muß der Sprecher unbedingt in einer ganz bestimmten Situation vor der Kamera sprechen. Aber es ist eine Situation, in der keine apparativen Kräfte direkt an den Sprechorganen angreifen und damit den Sprechbewegungsablauf direkt beeinflussen. Die Filmaufnahmen müssen im Zeitlupentempo erfolgen. Beim normalen Sprechtempo werden etwa 20 Laute in einer Sekunde produziert, beim Vortrag etwas weniger. Um die Bewegungen zu erfassen und auswerten zu können, die sich beim Sprechen vollziehen, reicht daher die normale Bildaufnahmefrequenz von 24 Bildern pro Sekunde nicht aus. Man muß bei Überlegungen zur Aufnahmefrequenz davon ausgehen, daß bei Filmaufnahmen der Bewegungsablauf in kleine statische Teilstücke zerlegt wird, aus deren Veränderungen von Bild zu Bild dann der Bewegungsablauf rekonstruiert werden muß. Die einzelnen Bilder enthalten keine Bewegungen, nur aus der Veränderung, die sich zwischen zwei Bildern vollzogen hat, läßt sich die Bewegung erschließen. Außerdem ist zu bedenken, daß zur Fortbewegung des Films in der Kamera der Lichtweg unterbrochen wird. Organbewegungen in der Phase des zeitweiligen Kameraverschlusses werden im Bild nicht festgehalten. Die Bewegungen, die sich während der Öffnungsphase des Kameraverschlusses vollziehen, machen sich als Bewegungsunschärfe bemerkbar. Bei normalen Filmaufnahmen sind sie erwünscht, weil sie in der Richtung der Bewegung verwischte Konturen hervorrufen und so bei der Wiedergabe des Filmes den Eindruck der Bewegung deutlicher hervortreten lassen. Sie unterstützen den Eindruck beim Zuschauer, Bewegungen tatsächlich zu erleben. Der Analyse des Sprechbewegungsablaufs, die sich auf die Einzelbildauswertung stützen muß, um die Bewegungsabläufe zu rekonstruieren, sind solche unscharfen Konturen aber im hohen Grade unerwünscht. Aus diesen drei Gründen: die Bewegung in mehr Einzelteile zu zerlegen, um ihren zeitlichen Verlauf genauer zu erfassen, die Zeit der 8*
108
5. Experimentelle Analyse
Dunkelphasen zu verkürzen und die Bewegungsunschärfe zu reduzieren, wurde das Tempo der Aufnahme auf 48 Bilder pro Sekunde festgelegt. Eine weitergehende Erhöhung der Bildaufnahmefrequenz wäre nicht zweckmäßig gewesen. Denn jede Erhöhung der Bildfrequenz ist mit einer erhöhten Strahlenbelastung für die Versuchsperson und mit einem erhöhten Aufwand bei der Auswertung der Filmaufnahmen verbunden. Bei einer Bildfrequenz von 48 Aufnahmen pro Sekunde ist die Röntgendosis für die Versuchsperson bereits sehr hoch; denn jede Aufnahme muß so belichtet werden, daß das Filmmaterial für jedes einzelne Bild voll gedeckt wird. Wenn man davon ausgeht, daß die Öffnungs- und Verschlußphasen der Aufnahmekamera etwa gleich lang sind, dann müssen bei einer Aufnahmezeit von 5 Sekunden Röntgenstrahlen in einer Dosis ausgesandt werden, die etwa 500 Schirmbildaufnahmen entsprechen. Denn die Röntgenstrahlung wirkt auch in dem Augenblick, wo sie nicht zur Bilderzeugung verwendet wird, also auch in den Verschlußphasen der Kamera. Deshalb wurde in den gesamten Entstehungsprozeß der Filmaufnahmen ein elektronischer Bildverstärker eingeschaltet. Damit wird die Strahlenbelastung der Versuchsperson ganz erheblich vermindert, so daß sie uns f ü r 20 sec reine Aufnahmezeit zur Verfügung stand. Eine Verbesserung der gesamten Aufnahmetechnik wurde mit einem Röntgen-Blitzgerät erreicht, das sehr kurze Röntgenblitze erzeugt, in der Zwischenzeit die Versuchsperson nicht mit Strahlung belastet und mit der Aufnahmekamera gekoppelt ist. Mit dieser Technik wurden die Kontrollaufnahmen unserer Untersuchungen durchgeführt. Sie sind vor allem deshalb besonders gut auszuwerten, weil die Röntgenimpulse sehr kurz sind, infolgedessen bei den Aufnahmen keine Konturenverwischungen infolge schneller Organbewegungen entstehen. Da die Konturen klar sind, ist für die Einzelbildauswertung eine bessere Grundlage vorhanden. Auch dabei wurde die Aufnahmefrequenz von etwa 50 Bildern/Sekunde beibehalten. Die ersten Aufnahmen wurden ohne Kontrastmittel durchgeführt. Da die Organe, die im Mittelpunkt der Beobachtung stehen sollen, aber hauptsächlich aus Muskeln bestehen, ergaben sich bei den Probeaufnahmen keine auswertbaren Bilder. Deshalb wurde den Versuchen zur Anwendung geeigneter Kontrastmittel besondere Aufmerksamkeit gewidmet. Die Organe, die im Mittelpunkt der Bewegungsanalyse stehen sollten, waren vor allem die Zunge und das Gaumensegel. Unterkiefer und Lip-
5.1. Spfechbewegungen
109
pen, deren Bewegung beim Sprechen auch wichtig sind, bereiten hinsichtlich der Kontrastierung keine besonderen Schwierigkeiten. Der Unterkiefer gibt allein durch seine Konsistenz genügend Schatten, die Lippen können, wenn nötig, durch geeignete übliche Kontrastmittel hervorgehoben werden. Die Röntgenstrahlung läßt sich in jedem Fall so dosieren, daß die Lippen gegenüber der L u f t deutlichen Kontrast geben. Zur Kontrastbildung der Zunge und des Gaumens wurde, nachdem sich die Benetzung der gesamten Mundhöhle mit Kontrastmittel nicht bewährt hatte, als die günstigste Variante das Markieren der Mittellinie des Gaumens und des Zungenrückens sowie der Zungenspitze mit Orabase ermittelt, dem zur Kontrasterzeugung Silber-Zinnspäne beigemischt waren. Orabase ist ein Präparat der Zahnmedizin, das zur Schließung kleiner Schleimhautdefekte, die bei der Zahnbehandlung entstehen, dient. Das Mittel härtet unmittelbar bei der Berührung mit Speichel und haftet fest auf der Schleimhaut. I n unserem Fall wurde damit die Mittellinie einerseits der Zunge von vorn bis zum hinteren Teil des Zungenrückens, andererseits des Palatums und eines Teiles des Velums mit Hilfe biegsamer Sonden bestrichen. Die markierten Linien bleiben etwa 10 Minuten klar erkennbar, dann wird die obere Schicht abgetragen und bildet im Mund unkontrollierbare Haftstellen. Zur Sichtbarmachung des Gaumensegels wurde Visotrast durch die Nase der Versuchsperson eingesprüht. Damit werden die Oberfläche des Gaumensegels und die hintere Pharynxwand gut sichtbar gemacht. Allerdings wird das Kontrastmittel schon nach kurzer Zeit wieder unwirksam, schon nach 1 Minute ist die Wirkung wesentlich vermindert. Daher wird das Kontrastmittel auch erst unmittelbar vor der Aufnahme, wenn schon alles vorbereitet ist, eingesprüht und dann unmittelbar darauf gesprochen. Wenn man das Gaumensegel beobachten will, treten Schwierigkeiten ganz besonderer Art auf. F ü r Röntgenaufnahmen muß generell ein hochempfindlicher und kontraststarker Film verwendet werden, damit die geringen Intensitätsunterschiede sichtbar werden. Zwischen der Partie des Gaumensegels und der Partie der Lippen besteht aber eine große Differenz in der Oesamtbeleuchtung. Wenn deshalb die Lippen deutlich abgebildet werden, ist vom Gaumensegel nichts zu sehen; die gesamte Partie ist trotz der Kontrastierung völlig dunkel u n d ohne Konturen. Wenn die Röntgenintensität erhöht wird, werden die Bewe-
110
5. Experimentelle Analyse
gungen des Gaumensegels gut sichtbar, dagegen wird die Lippenpartie überstrahlt, und es werden dort keine Konturen mehr sichtbar. Diese Problematik, die auch von der Eigenart der Versuchsperson abhängig ist, kann als eines der zentralen Probleme von Röntgenfilmaufnahmen der Sprechbewegungen bezeichnet werden. Deshalb wurde auch bei der Kennzeichnung der Lippen Kontrastmittel angewendet. Es wurde auf eine Gesichtshälfte so aufgetragen, daß die Mittellinie der Lippen stark markiert war und daß die Flächen der Wangen damit leicht angeschminkt, nach hinten verlaufend, den Gesamtkontrast milderten. Damit war ein doppelter Erfolg verbunden: Die Lippen waren deutlicher hervorgehoben, aber es wurde auch der starke Kontrast zwischen Lippen und Gaumensegel gemindert. Dadurch waren die Lippen nicht so stark überstrahlt, und die Pharynxpartie konnte so weit durchstrahlt werden, daß die Bewegungen des Gaumensegels erkennbar waren. Da ein Röntgenbildverstärker für die Sprechbewegungsaufnahmen verwendet wurde, war der Bildausschnitt begrenzt. Bei den Kontrollaufnahmen mit dem Röntgen-Blitzgerät war die Fläche des Bildausschnitts größer. Deshalb mußte bei den Aufnahmen des Hauptversuches auf die aufschlußreichen Bewegungen des Zungenbeines sowie des Kehldeckels und anderer Knorpel des Kehlkopfes verzichtet werden, indem der Ausschnitt voll auf das Hauptgeschehen beim Sprechen, die Organe des Mund- und Rachenraumes beschränkt wurde. Die mit dem Röntgen-Blitzgerät gemachten Kontrollaufnahmen lehren, daß für eine umfassende Analyse des Sprechbewegungsablaufs auch die Bewegungen der unteren Begrenzung der Mundbodenp&rtie und die Vertikalbewegungen des Kehlkopfes sowie des Kehldeckels, mit einbezogen werden müßten; wie die Aufnahmen der Sprechbewegungen von außen ergeben haben, bilden sich einige der markantesten Zungenbewegungen auch im Mundboden ab. Sie können erschlossen werden; doch wäre eine Möglichkeit einer unmittelbaren Einbeziehung der Zusammenhänge sicher vorteilhafter. Die Vertikalbewegungen des Kehlkopfes sind Veränderungen der Länge des Ansatzrohres und haben somit auch Einfluß auf die Resonanz des Hohlraumes. Die Bewegungen, die bei der Vorführung des Röntgenfilms nacherlebt werden können, müssen für eine genaue Bewegungsanalyse aus den Phasen der Einzelbilder rekonstruiert werden. Dazu ist es aber notwendig, daß für den Vergleich von Einzelbildern Fixpunkte vorhanden sind, die genau die gleiche Stelle auf den Bildern markieren. Solche Bezugs-
5.1. Sprechbewegungen
111
punkte eindeutig festzulegen, die die Verfolgung von Bewegungen über mehrere Bilder hinweg gestatten, ist nicht leicht. Sie gehen vor allem dann verloren, wenn die Versuchsperson während der Filmaufnahme Kopfbewegungen gemacht hat. Dann verschiebt sich die Abbildungsebene des Filmes. Solche Bewegungen sind vor allem dann unangenehm und störend, wenn es Bewegungen sind, die sich nicht in der Ebene der gedachten Filmaufnahme abspielen. Es ist möglich, ein Nicken der Versuchsperson, wenn es genau in der späteren Abbildungsebene liegt; bei der Auswertung zu kompensieren, dagegen nicht seitliche Kopfbewegungen und Drehbewegungen des Kopfes. Man kann solche Bewegungen am laufenden Film recht gut erkennen. Bei Drehbewegungen des Kopfes verschieben sich die beiden oberen Zahnreihen horizontal, beim Neigen des Kopfes vertikal zueinander. Es ist daher notwendig, die Filmaufnahmen bei der Wiedergabe auf diese möglichen Verschiebungen zu prüfen. Um solche Bewegungen zu vermeiden, wurde bei unseren Versuchen der Kopf der Versuchsperson hinten gestützt. Sie wurde angewiesen, ihn hinten anzulehnen; eine vollständige Fixation des Kopfes wurde aus Gründen der psychischen Beeinflussung vermieden. Unter der Voraussetzung, daß keine Kopfbewegungen stattgefunden haben, können als Fixpunkte für die Auswertung die Zähne dienen, die sehr klar zu erkennen sind. Auch der gesamte Oberkiefer kann als Bezugsbasis dienen. Ohne besondere Markierungen sind auf der Zunge keine Fixpunkte vorhanden, ebensowenig beim Gaumensegel. Die Aufnahmen des Filmes wurden im Originalformat 18 mm X 24 mm hergestellt. Mit einem Vergrößerungsgerät wurden sie unmittelbar auf den Zeichentisch projiziert und dort auf vorbereitetes Zeichenpapier übertragen. Das Papier wurde durch eine spezielle Lochung immer in der gleichen Lage gehalten. Da die Nachzeichnung der Konturen im völlig verdunkelten Raum vor sich gehen mußte, um die schwachen Kontraste noch erkennen und auswerten zu können, außerdem aber die wesentlichen Bewegungsabläufe schon als Konturenveränderung erkennbar werden sollten, wurde die Konturenzeichnung mit Farbstiften vorgenommen, die ständig gewechselt wurden. Dabei wurde mit dem gleichen Farbstift die Nummer des nachgezeichneten Bildes aufgezeichnet. Es erwies sich nicht als nötig, jedes Bild nachzuzeichnen, sondern es genügte bei langsamen Abläufen, jedes zweite oder dritte nachzuzeichnen, vor allem dann Bilder auszulassen, wenn sie keine wesentliche Veränderung zum vorhergehenden brachten. Wenn sich wesentliche
112
5. Experimentelle Analyse
Veränderungen vollzogen, wurde jedes Bild festgehalten. Eine Bildwechseleinrichtung mit einer Raste sorgte dafür, daß die Bilder genau übereinander projiziert wurden. Da die alte Kontur des vorigen Bildes nun gleichzeitig mit sichtbar war, konnte auf Grund des unmittelbaren Vergleichs entschieden werden, ob das Bild festgehalten werden mußte oder nicht. Die Anzahl der gesamten Bilder pro Testsatz wurde bestimmt und in einer zweiten Phase der Auswertung mit dem Sonagramm des Originalmitschnittes verglichen, damit aus den Umzeichnungen diejenigen ausgewählt werden konnten, die typische Einstellungen während der Vollphase eines Lautes oder typische Übergangsbewegungen darstellen. Zu einer solchen Auswertung ist es nötig, die beiden Protokolle der Produktionssituation, den Film und die Tonbandaufnahme vollständig zu synchronisieren. Diese Synchronisation erfolgt in erster Linie durch die beiden sicheren Fixpunkte zu Anfang und zu Ende des Testsatzes, die Lösung der Lippen beim [v] von wie und die Lösung des Verschlusses von [b] bei habe. Beide Punkte sind sowohl auf dem Film als auch trotz des Störgeräusches auf dem Sonagramm zu erkennen. Aus der Anzahl der Bilder insgesamt und der Gesamtdauer des Testsatzes läßt sich die Dauer jedes einzelnen Bildes relativ leicht bestimmen. Als Kontrollen f ü r die Genauigkeit der Interpolation dienen die im Verlauf des Testsatzes weiterhin produzierten Verschlußlösungen. Von da aus können sich geringfügige Korrekturen nötig machen, da ja die anfänglichen Fixpunkte insgesamt um den Zeitaufwand eines Bildes, also etwa 1 /50 sec unsicher sind. I n den meisten Fällen war eine solche nachträgliche Korrektur nicht nötig. Dann ist in einem dritten Auswertungsschritt das Aufsuchen der typischen Einstellungen, sowohl, was die Voll- als auch wesentliche Übergangsphasen von Lauten betrifft, möglich. Die Bildnummern dieser Aufnahmen liegen dann schon fest und sind nach dem Sonagramm bestimmt worden. Die Aufnahmen dieser Bilder werden mit den schon vorliegenden Umzeichnungen verglichen, überprüft und nochmals auf ein besonderes Blatt herausgezeichnet. Nach diesen besonders hergestellten Umzeichnungen wurden dann die Trickaufnahmen eines Lehrfilmes hergestellt. (Optische Analysen der Koartikulation durch RBVKinematographie — T H F 719) Sie stellen entweder typische Vollphasen eines Lautes oder typische Übergangsphasen dar, die f ü r Lehrzwecke besonders hervorgehoben werden müssen. Der hergestellte Unterrichtsfilm basiert auf der Gegenüberstellung
5.2. Äußerlich sichtbare Bewegungen
113
von Real-(Röntgen-) und Trickaufnahmen, die durch Überblenden der wesentlichen Einstellungsphasen ineinander übergeführt werden. Damit ist es auch einem Zuschauer, der im Lesen von Röntgenbildern nicht geübt ist, möglich, das Wesentliche des Bewegungsablaufs und vor allem das Zusammenspiel der Bewegungen beim Sprechen zu erleben und Erkenntnisse zu gewinnen. Durch den Film wird zwar Wesentliches deutlich, anderes wird unterdrückt. Dazu zählen die beim Trick nivellierten Tempi der Bewegungen, da aus aufnahmetechnischen Gründen alle Übergangsphasen von. einer Trickphase zur anderen gleich lang gemacht wurden. Damit werden Charakteristika des Bewegungsablaufs, die im Bewegungstempoliegen, nicht erkennbar, wenn nicht deren Tempo bei den Originalaufnahmen entnommen wird. Deshalb auch die Gegenüberstellung. Bei der Auswertung der Einzelbilder für die Analyse des Sprechbewegungsablaufs wurden die Bilder, die zwischen charakteristischen Phasen lagen oder die zu einem Laut gehören, einfach gezählt; damit ist die Bilderzahl ein Zeitmaß für das Bewegungstempo.
5.2. Analyse der äußerlich sichtbaren Bewegungen Die äußerlich sichtbaren Bewegungen der Sprechorgane sind wichtig, weil sie uns wesentlich vertrauter sind als die mit dem Röntgenfilm gewonnenen, weil das Kind sie mit benutzt, um besser sprechen zu lernen, weil wir sie benutzen, um dann einen zweiten Kanal einzubeziehen, wenn der akustische beeinträchtigt ist, weil der Gehörlose aus ihnen die zur Verständigung notwendigen Informationen entnimmt und weil sich aus ihnen einige bedeutsame Erkenntnisse für die Koartikulation ableiten lassen. Allerdings nicht alle Erkenntnisse, und leider auch nicht die wesentlichsten. Aus den dargelegten praktischen Gründen kommt der Untersuchung der äußerlich sichtbaren Sprechbewegungen eine Bedeutung zu, die noch dadurch erhöht wird, daß es mit weniger Aufwand möglich ist, die notwendigen Untersuchungen unter natürlichen Bedingungen durchzuführen. Wenn wir, gleich von welcher Seite auch, auf das Gesicht schauen, sosehen wir die sich beim Sprechen vollziehenden Gestaltveränderungen der einzelnen Gesichtsteile zueinander als zweidimensionales Geschehen. Und dieses Geschehen bleibt letztlich auch ein zweidimensionales,
114
5. Experimentelle Analyse
wenn es auf dem Film festgehalten wird. I n Wirklichkeit ist es aber ein dreidimensionales, körperliches Geschehen. Der plastischen Erfassung der Veränderungen stehen aber erhebliche Schwierigkeiten entgegen. Deshalb wurde bei den Filmaufnahmen die dritte räumliche Dimension •durch einen Kunstgriff hinzugewonnen, indem der fixierte Kopf des Sprechers gleichzeitig in zwei Richtungen aufgenommen wurde. Dies wurde durch einen Spiegel erreicht, mit dessen Hilfe der Kopf des Sprechers gleichzeitig von vorn und im Profil aufgenommen werden konnte. Allerdings spielt dabei das Problem der Beleuchtung eine große Rolle. Denn für gute Filmaufnahmen müssen sowohl Original als auch Spiegelbild gleichstark und gleichmäßig ausgeleuchtet sein. Durch den Spiegel wird vollkommene Synchronität zwischen den beiden Abbildungsebenen erreicht. Wichtig ist es auch bei dieser Art von Aufnahmen, Bezugspunkte für die Auswertung zu finden. Sie sind am Gesicht nicht leicht und nicht immer mit Sicherheit zu bestimmen. Daher ist von Mitarbeitern der Heilpädagogischen Hochschule Budapest ein Verfahren entwickelt worden, indem 4 Punkte im Gesicht deutlich markiert werden. ( S U B O SITS, S. llOf.) Ihre Veränderungen lassen sich leicht feststellen und graphisch auswerten. Es entstehen auf diese Weise Kurven, auf denen gleichzeitig die Bewegungen der Lippen, Mundwinkel und des Unterkiefers zu erkennen sind. Da sie aber nur in der Ansicht von vorn allesamt sichtbar sind, ist damit die Veränderung der Lage der Sprechorgane nicht als dreidimensionales Geschehen zu ermitteln. Deshalb verwendeten wir für unsere Versuche auf das Gesicht aufprojizierte Gitterraster. Durch den Spiegel werden die Kreuzungspunkte der Gitterraster zu den gleichen Punkten, deren Koordinaten räumlich bestimmt werden können. Der Nachteil dieser Methode liegt darin, daß zwar die räumlichen Koordinaten bestimmt werden können, daß sich aber gleichsam die Sprechorgane unter dieser Deckmaske hinwegbewegen. Die räumlich bestimmbaren Koordinaten entsprechen aber nicht immer dem gleichen P u n k t des Gesichts. Das macht die Auswert u n g umständlich und schwierig. Von den Methoden hat sich das erste Verfahren, die Verwendung des Spiegels, der den Sprecher gleichzeitig frontal und im Profil sichtbar macht, besser bewährt. Vor allem zeigt die Profildarstellung in ihrem Ablauf Bewegungen des Mundbodens, die bisher noch wenig Aufmerksamkeit gefunden haben. Sie lassen sich ohne die gleichzeitige Kenntnis der frontalen Aufnahmen schwer deuten. I n den Bewegungen des Mund-
-5.3. Akustisches Signal
115
bodens, die sonst im wahrsten Sinne des Wortes meist im Schatten liegen, spiegeln sich deutlich die starken Hebungsbewegungen des Zungenrückens wider, die als Gesamtbewegungen der Zunge ausgeführt werden, vor allem beim L a u t [g] in gefunden. Bei den F i l m a u f n a h m e n können auch sehr gut die Bewegungen von Kiefer u n d Lippen beobacht e t u n d messend verfolgt werden. Wenn m a n von den Erkenntnissen •des Röntgenfilmes ausgeht, so bieten die Bewegungsaufzeichnungen •der äußerlich sichtbaren Sprechbewegungen keine zusätzlichen E r k e n n t nisse, n u r die Bewegungen der Lippen in der Sicht von vorn ergänzen •die Bewegungsabläufe u m die dritte Dimension. Sie können aber als weniger aufwendige selbständige Methode f ü r die Orientierungsforschung dienen.
5.3. A n a l y s e des a k u s t i s c h e n Signals W ä h r e n d der F i l m a u f n a h m e n der Sprechbewegungen wurde das vom •Sprecher erzeugte lautsprachliche Zeichen gleichzeitig mit auf T o n b a n d .aufgezeichnet. Die T o n b a n d a u f n a h m e n anläßlich der äußerlich sichtbaren Sprechbewegungen waren unmittelbar verwendbar, d a die Aufn a h m e n mit einer Filmkamera aufgenommen wurden, die keinen Störschall erzeugte, u n d sie somit störungsfrei auf das T o n b a n d gelangten. Die in gleicher Situation bei den R ö n t g e n a u f n a h m e n gemachten T o n b a n d a u f n a h m e n waren f ü r eine Analyse nicht unmittelbar zu verwenden, da das lautsprachliche Zeichen durch das Geräusch der R ö n t g e n a p p a r a t u r wie auch durch das Laufgeräusch der K a m e r a überlagert war. E s wäre sicher möglich gewesen, das Geräusch der K a mera durch ihre akustische Abschirmung fernzuhalten, doch wäre der Störschall der R ö n t g e n a p p a r a t u r in keinem Falle zu vermeiden gewesen. Deshalb wurde auch auf den erheblichen Aufwand, der mit einer Abschirmung der K a m e r a verbunden war, verzichtet. D a f ü r bestand aber die Aufgabe, f ü r eine vollständige akustische Analyse ein einwandfreies akustisches Analogon des Originalsignals herzustellen. I n dieser Frage steckt eine erhebliche Problematik. Sie geht auf das Problem zurück, inwieweit überhaupt ein Produktionsvorgang lautsprachlicher Zeichen in allen Einzelheiten reproduzierbar ist oder nicht. Daß eine Reproduzierbarkeit in gewissen Grenzen möglich ist, ist durch die tägliche Praxis der Kommunikation bewiesen. Doch dazu , : genügt die Reproduktion von ähnlichen Bewegungsabläufen, damit
116
5. Experimentelle Analyse
ähnliche und wiedererkennbare lautsprachliche Zeichen entstehen, diezum sprachlichen Verstehen vollkommen ausreichen. Eine vollkommeneIdentität ist nicht notwendig. Die Ähnlichkeit braucht nicht einmal sehr groß zu sein, wenn es um Einzelheiten geht; denn der Verstehensprozeßist auch durch individuell bedingte Verschiedenheiten nicht gestört. Die Play-Back-Technik ist heute sehr weit entwickelt. Sie wird in der Produktion von Unterhaltungsmusik und auch bei Unterhaltungssendungen des Fernsehens häufig angewendet und führt zu recht guten Ergebnissen, so daß der unbeeinflußte Zuschauer überhaupt nicht an die Frage denkt, ob original oder mit Play-Back-Technik übertragen wird. Wenn auch grundsätzlich Gemeinsamkeiten mit der Play-Back-Technik bei Unterhaltungssendungen vorhanden sind, so ergeben sich bei unserer Aufnahme doch einige wesentliche Abweichungen. Einmal fehlt das steuernde Element, die Musik als Untermalung, die für die Vorgabe des-zeitlichen Ablaufes bei der Produktionsleistung sorgt. Zweitens ist der Text nicht in dem Maße eingelernt und -geübt wie bei einer Unterhaltungssendung. Sowohl die Originalaufnahme vor der Röntgenkamera als auch dieWiederholung des gleichen Textes im Studio erfolgten in Räumen, di& den Versuchspersonen bisher unbekannt waren. Der Text, den dieVersuchspersonen zu sprechen hatten, war ihnen bekannt. Er war auch schon mehrmals vor der Aufnahme gesprochen worden, so daß einegewisse Stufe der Automatisierung erreicht war. Die Denkabläufe beim Sprechen waren ebenso in den Hintergrund gerückt wie in der eigentlichen Play-Back-Situation. Doch war im ersten Fall, in der Aufnahmesituation, eine freie Gestaltung möglich, während in der Studiosituation das einmal Produzierte möglichst ähnlich nachgestaltet werden sollte. Wenn man überlegt, was überhaupt frei gestaltet werden kann, so handelt es sich nur um Faktoren des Tempos und anderer suprasegmentaler Strukturen. Die Lautfolge und damit die zwangsläufig auszuführenden notwendigen Bewegungen liegen ebenso durch die vorgegebene Lautfolge fest wie die vorbereitenden Bewegungen oder nachführenden Bewegungen, die zum Zustandekommen eines flüssigen Gesamtbewegungsablaufes notwendig sind. Die hauptsächliche Schwierigkeit lag also bei der Nachgestaltung bei der richtigen Einhaltung des Tempos sowie der suprasegmentalen Strukturen, vor allem Verlauf von Dynamik und Grundtonfrequenz. Auf die Einhaltung dieser Faktoren wurde beim Nachsprechen ganz besonders geachtet. In schwierigen Fällen konnte
•5.3. Akustisches Signal
117
•den Versuchspersonen insofern eine Hilfe gegeben werden, indem der zeitliche Verlauf durch Taktieren mit der H a n d verdeutlicht wurde. Auch auf Abweichungen von der Originalintonation wurde die Versuchsperson aufmerksam gemacht. Damit k o n n t e die weitgehende Angleichung der Reproduktion a n das Original erreicht werden. Die Unterschiede, die noch vorhanden sind, sind Unterschiede im zeitlichen Verlauf, so daß einzelne Teile des Zeichens etwas schneller, andere etwas langsamer gesprochen worden sind. Diese Unterschiede betreffen aber nicht den Kern des Untersuchungsgegenstandes in seinem Wesen, sondern nur dessen Erscheinung. D e n n m a n k a n n annehmen, daß die Bewegungsabläufe trotz des etwas unterschiedlichen Tempos im Prinzip in der gleichen Weise ablaufen. Das setzt allerdings voraus, d a ß die einzelnen Phasen des Filmes nach dem tatsächlichen inhaltlichen Ablauf analysiert, zugeordnet u n d die Lautrealisationen d a n n verglichen werden. Zumeist werden die zeitlichen Verschiebungen nicht einmal durch unterschiedliches Bewegungstempo der Bewegungsabläufe hervorgerufen, sondern durch unterschiedlich lange Haltephasen der Sprechorgane bei der Verschlußbildung. D a m i t d ü r f t e eine Zuordnung auch zwischen Filmablauf u n d nachsynchronisiertem akustischen E f f e k t als sichere Grundlage gegeben sein. Dies ist außerdem u m so eher möglich, als ja a u c h die einzelnen Filmbilder keine punktuellen Ausschnitte aus dem Sprechablauf darstellen, sondern einen zeitlichen Abschnitt in der Größenordnung einer 1/100 sec darstellen, der noch durch eine beiderseitige Unsicherheitszone erweitert wird, da sich in der P h a s e des Bildtransportes auch Bewegungen abgespielt haben d ü r f t e n . Somit ist der zeitliche U m f a n g der Repräsentanz eines Bildes größer als 1/50 sec anzusetzen. Als Abbilder des akustischen E f f e k t s wurden von der R e p r o d u k t i o n Sonagramme angefertigt. Das Sonagramm k a n n heute als die vollkommenste F o r m der akustischen Analyse angesehen werden. Auf die Darstellung weiterer P a r a m e t e r wurde verzichtet, da als Abbild der Bewegungsabläufe die Klangveränderungen angesehen werden müssen. Trotzdem können die Abbilder des Sonagramms kein vollständiges Abbild des Bewegungsablaufs widerspiegeln. Erstens sind d a f ü r technische Gründe maßgebend; denn das Sonagramm entsteht unter Ausnutzung einer erheblichen Dynamikkompression, wodurch Intensitätsminima, die durch weitgehende oder angedeutete Engenbildung entstehen, nivelliert werden. Sie lassen sich durch eine gleichzeitig mit aufgenommene D y n a m i k k u r v e erkennen.
118
5. Experimentelle A n a l y s e
Nicht zu erkennen sind aber auf alle Fälle diejenigen Organbewegungen,, die sich in den akustischen „Dunkelphasen" vollziehen, dann nämlich, wenn kein hörbarer Effekt entsteht. Das sind Bewegungen von Organen hinter einer Verschlußstelle, unter Umständen auch Bewegungen vor ihr, auf alle Fälle aber Bewegungen, die bei Glottisschluß beim Vokaleinsatz vollzogen werden. Dabei werden wesentliche Bewegungen vollzogen, die im Sonagramm keinerlei Spuren hinterlassen und die nur aus dem veränderten akustischen Eindruck erschlossen werden können. Erinnert sei in diesem Zusammenhang nur an die Bewegungen, die notwendig sind, um ein isoliertes [a:] auszusprechen. Viele glauben, daß in dieser Situation die Sprechorgane sich nicht bewegen, sondern die eingenommene Stellung beibehalten wird. Das ist im Prinzip richtig, wenn man die Dauer des Artikulationsgeschehens auf den hörbaren Eindruck begrenzt. Das Artikulationsgeschehen ist aber umfangreicher. Die Bewegung beginnt schon mit der Vorbereitung zur typischen a-Einstellung und endet erst, nachdem die Bewegung wieder in die Ruhelage zurückgeführt worden ist. Von all diesen Bewegungsvorgängen wird aber im akustischen Signal nichts abgebildet. Ein anderes Beispiel: Wenn das Wort Theater gesprochen wird, so geschieht das mit deutlicher Trennung der beiden Vokale durch den Stimmeinsatz. Der Hohlraum der Mundhöhle wird kurzzeitig nicht zur Resonanz angeregt. I n dieser Zeit vollzieht sich aber eine wesentliche und schnelle Bewegung, die bewirkt, daß der Resonator der Mundhöhle mit einem deutlichen e-Klang aufhört und mit einem ebenso deutlichen a-Klang wieder zu schwingen beginnt. I n der resonanzlosen, durch den Kehlkopf nicht angeregten Phase hat sich die wesentliche Bewegung vollzogen, die in einer vollständig anderen Resonanzeigenschaft der Mundhöhle zum Ausdruck kommt. I n diesem zweiten Beispiel kann man die Veränderungen auch direkt akustisch wahrnehmbar machen, wenn der Glottisverschluß unterlassen wird, wie es in der Umgangssprache oft genug geschieht. Dann ist eine diphthongähnliche schnelle Verschleifung zwischen den beiden Vokalen deutlich hörbar und auch auf dem Sonagramm zu verfolgen. Das zeigt also, daß in einem Sonagramm nicht alle Bewegungsvorgänge abgebildet werden. Es ist nicht möglich, einen vollständigen Schluß vom akustischen Abbild auf den ihm zugrundeliegenden Bewegungsablauf zu ziehen. Dazu kommt noch ein weiterer Grund. Bei der komplizierten Struktur der Hohlräume ist es möglich, daß ein und derselbe akustische Effekt durch Verengungen des Ansatzrohres
5.3. Akustisches Signal
119
an verschiedenen Stellen hervorgerufen werden kann, zumindest was den perzeptiv dadurch erreichten Eindruck betrifft, der f ü r die lautsprachliche Kommunikation als Grundlage dient. Es ist bekannt, d a ß akustisch gleichwertige S-Laute durch unterschiedliche Bildungsweisen, die als apikale oder dorsale S-Bildung bekannt sind, erzeugt werden können. Es ist auch bekannt, daß mangelhafte Zungenartikulation durch intensivere Lippenartikulation ausgeglichen werden kann. Auch beim Artikulationsunterricht Tauber kann man beobachten, daß eine gute Lippenartikulation Mängel in der Zungenartikulation verdecken kann. Alle diese Befunde deuten darauf hin, daß zum Zustandekommen eines bestimmten Klanges mit sprachlicher Bedeutung keine bis in alle Einzelheiten eindeutige Einstellung der Sprechorgane zwangsläufig vorgegeben ist. Dazu kommen noch die großen interindividuellen Unterschiede, die in der Produktion lautsprachlicher Zeichen möglich sind. Für die Herstellung des Zusammenhangs zwischen Bewegungsablauf und Sonagramm ist eigentlich nur der Weg gangbar, der vom Bewegungsablauf ausgeht und die entsprechenden Klangveränderungen zuordnet. Andererseits ist die genaue Identifikation von Zwischenabschnitten des Bewegungsablaufs nur auf der Grundlage des originalen Auf nahmemitschnitts und des daraus angefertigten Sonagramms möglich. Das alles zeigt die enge dialektische Wechselbeziehung zwischen den einzelnen Aspekten des lautsprachlichen Zeichens. Da das Sonagramm nicht alle Einzelheiten zeigt, die eine genaue auditive Analyse erkennen läßt, muß die automatische Analyse des akustischen Signals durch eine eingehende auditive ergänzt werden. Andererseits zeigt das Sonagramm Einzelheiten, die beim Abhören nicht perzipiert werden können. Deshalb ist es notwendig, daß die apparative und die auditive akustische Analyse miteinander verglichen und aufeinander bezogen werden. Für die auditive Analyse wurde ein Segmentator verwendet, der ein abschnittweises Abhören von einzelnen Bestandteilen des akustischen Signals ermöglicht. Das ist in schwierigen Fällen notwendig, um von Einzelheiten einen gut erkennbaren perzeptiven Eindruck zu erhalten, der ohne Segmentierung von den nachfolgenden Eindrücken des laufenden Bandes gestört werden würde. Ein Beispiel, wo diese besondere Abhörtechnik angewandt wurde, war die Nasalität des Murmelvokals in der Endsilbe -en. Aber auch mit Hilfe dieses Gerätes konnte die auf den Filmaufnahmen erkennbare Gaumensegelsenkung nicht als nasaler Beiklang identifiziert werden.
6.2.1. Einstellungen
hei den Vokalen
Die typischen Einstellungen bei den Vokalen sind in vielen Lehrbüchern beschrieben worden. Die Darstellung folgt hier in wesentlichen P u n k t e n dem Wörterbuch der deutschen Aussprache, weil diese Darstellung nicht auf Untersuchungen eines Einzelnen sondern auf den umfangreichen Untersuchungen eines großen Kollektivs von Mitarbeitern beruht. Zur Ergänzung werden herangezogen der Atlas deutscher Sprachlaute (H. H . W Ä N G L E R ) , die Allgemeine und angewandte Phonetik ( O . V O N E S S E N ) , •die Sprecherziehung - ein Leitfaden für Pädagogen ( C H . Z A C H A R I A S ) sowie das auf die Korrektur von Sprechfehlern orientierte Buch Die Bekämpfung von Sprechfehlern ( H . W E I N E R T ) . Nicht nur bei Unstimmigkeiten zwischen den hier genannten Autoren, sondern auch zur Ergänzung werden weitere Werke, die sich mit den deutschen Sprachlauten beschäftigen, herangezogen. Das oberste Entscheidungskriterium sind jedoch bei den folgenden Ausführungen die Ergebnisse unseres eigenen Röntgenfilms. Denn sie zeigen Momentanphasen des Sprechbewegungsablaufs als Ausschnitte von tatsächlich vollzogenen Bewegungsabläufen. Nach den angeführten Unterlagen werden alle Vokale als stimmhafte Laute angegeben. F ü r den Fall, daß nicht geflüstert, sondern mit Stimme gesprochen wird, ist das richtig. Also kann für alle Vokale generell die Einstellung der Glottis als in Stimmstellung befindlich angegeben werden. Übereinstimmend ist in der Literatur angegeben, daß bei der Vokalartikulation das Gaumensegel gehoben ist, wobei die Ansichten auseinandergehen, ob ein vollständiger Abschluß des Nasenraumes eintritt,
132
6. Modellansatz.
oder ob ein geringer Grad an Nasalität als zulässig, manchmal sogar als klangverbessernd angesehen wird. Innerhalb eines einzelnen Werkes wird in den schematisierten Abbildungen eine bestimmte Einstellung des Gaumensegels f ü r alle Vokale beibehalten (außer WÄNGLER). D a ß dies nicht der Fall ist, bestätigten unsere Filmaufnahmen. Doch erscheint es heute noch nicht möglich, die Gaumensegelhebung, wie sie sich bei [i:] u n d [u:] in unterschiedlicher Weise dokumentiert, mit in das System einzuarbeiten, weil nicht alle Vokale röntgenologisch u n d in verschiedenem K o n t e x t untersucht worden sind. Wir werden daher f ü r das Gaumensegel in der Systematik f ü r alle Vokale gleichermaßen die Einstellung gehoben u n d als wesentlich beteiligt ansetzen, mit Ausnahme des Murmelvokals. Bei Auswertung der Filma u f n a h m e n hat sich gezeigt, daß der Murmelvokal immer dann, wenn er von Nasalen gefolgt wird, schon mit gesenktem Gaumensegel gesprochen wird. Deshalb müssen wir annehmen, daß die Gaumensegelhebung f ü r die Bildung des Murmelvokals keine notwendige Bedingung darstellt, obwohl das Gaumensegel bei ihm in der Mehrzahl der Varianten gehoben ist. Schematisierung dieser Erkenntnisse s. Abb. 9. a •• e •• £ •• i -