227 19 48MB
German Pages 220 Year 1974
Linguistische Arbeiten
15
Herausgegeben von Herbert E. Brekle, Hans Jürgen Heringer, Christian Rohrer, Heinz Vater und Otmar Werner
William John Barry
Perzeption und Produktion im sub-phonemischen Bereich Eine kontrastive Untersuchung an intersprachlichen Minimalpaaren des Deutschen und Englischen
Max Niemeyer Verlag Tübingen 1974
ISBN 3-484-10198-9
Max Niemeyer Verlag Tübingen 1974 Alle Rechte vorbehalten. Ohne ausdrückliche Genehmigung des Verlages ist es auch nicht gestattet, dieses Buch oder Teile daraus auf photomechanischem Wege zu vervielfältigen. Printed in Germany
VORWORT
Diese Arbeit wurde 1973 von der Philosphisehen Fakultät der Universität zu Köln als Dissertation angenommen. Herrn Prof. Dr. Georg Heike, der mich von den anfänglichen Höhenflügen bis zur Fertigstellung der Arbeit geduldig und ermutigend beriet, danke ich herzlich. Den Mitarbeitern am Kölner Institut für Phonetik und meinen Kollegen in Köln und Kiel, die zu jeder Zeit verständnisvoll und hilfsbereit waren, gilt ebenfalls mein Dank. Insbesondere ist die unermüdliche Bereitschaft der Herren K.-H. Cassel und E. Weiher hervorzuheben. Schließlich möchte ich meiner Frau Renate danken, ohne die diese Arbeit weder einen Anfang noch ein Ende gefunden hätte. Ihr ist die Arbeit gewidmet.
INHALT
1.0.0.0.
Einführung
2.0.0.O. 2.1.0.O.
Theoretischer Teil Phonemische Korrektheit und phonetische Ähnlichkeit Sub-phonemische Korrektheit und phonetische Variabilität Allgemeine phonetische Aspekte der Variabilität Variabilität und Produktionsprozeß Ungenauigkeit der Artikulatoren Situativer Kontext Linguistischer Kontext Variabilität und Wahrnehmung Vokalwahrnehmung Konsonantenwahrnehmung Schlußfolgerungen
2.2.0.O. 2.2.1.O. 2.2.2.0. 2.2.2.1. 2.2.2.2. 2.2.2.3. 2.2.3.0. 2.2.3.1. 2.2.3.2. 2.2.3.3. 3.0.0.O. 3.1.0.O. 3.2.0.O. 0.2.1.O. 3.2.1.1. 3.2.1.2. 3.2.1.3. 0.2.2.O. 3.2.2.1. 3.2.2.2. 3.2.2.3.
Experimentelle Untersuchung von sub-phonemisehen Fremdheitssignalen Experimentelle Möglichkeiten Untersuchungsaufbau Material- und Datenerhebung Sprecher Sprachmaterial Durchführung der Hörtests Analyseverfahren Auswertung und Prüfung der Hörtestdaten Akustische Analyse der dargebotenen Stimuli Errechnung der Korrelationen
l 6 12 12 12 16 16 18 19 26 28 36 41
44 44 48 48 48 49 5O 53 53 57 64
VIII
4. .0.O.
Ergebnisse der Analyse
69
4.1. . . 4.1.1.0. 4.1.2. .
Hörtestauswertung Indexwerte Urteilssicherheit
69 69 81
4.1.3.0.
Signifikanztest
87
4.2.0.O.
Auswertung der akustischen Daten
89
0.2.1.O.
Formantdaten
89
4.2.1.1.
Herkunftsgebundene Unterschiede
89
4.2.1.2. 4.2.2.0.
vergleich der Formantdaten mit den Hörtestergebnissen Dauerdaten
1OO 103
4.2.2.1. 4.2.2.2.
Testwortdaten Kontrollwortdaten
103 111
4.2.3.0.
Tonhöhenbewegung
115
4.2.4.0.
4.3.O.O. 0.3.1.O. 4.3.1.1.
Akustische Daten und Artikulationsbasis Artikulationsbasen des Deutschen und des Englischen Korrelationsergebnisse Einfache Korrelationen 'Tip-tip'
122 133 134 137
4.3.1.2. 4.3.1.3.
'Paß-pus 1 «Busch-bush*
139 139
4.3.1.4.
Tonhöhenbewegung als Beurteilungskriterium Zusammenfassung der Ergebnisse der einfachen Korrelationen Multiple Korrelationen Zur Bedeutung multipler Korrelationen Prüfung der Einzelkorrelationsergebnisse mit Hilfe der multiplen Korrelationen
4.2.4.1.
4.3.1.5. 0.3.2.O. 4.3.2.1. 4.3.2.2.
116
139 14O 141 141
145
IX
5.0.0.0.
Schlußfolgerungen
169
5.1.0.0.
Erörterung der Ergebnisse
169
5.1.1.0.
Können englische Hörer Fremdheit feststellen?
170
Können deutsche Englischlernende zwischen ähnlichen englischen und deutschen Lauten unterscheiden?
170
5.I.2.O.
5.1.3.0.
Urteilen deutsche Hörer aus verschiedenen Gegenden unterschiedlich? 171
5.1.4.0.
Lassen sich unterschiedliche Realisationsnormen für die englischen und deutschen Sprecher feststellen? 171 Ist eine auditive Diskriminierung der festgestellten Unterschiede möglich? 173
5.1.5.0.
5.1.6.O.
5.1.7.O.
5.2.O.O.
Besteht eine Beziehung zwischen den Urteilen der Hörer und den festgestellten Realisationsnormen?
174
Entsprechen die Englischrealisationen der deutschen Sprecher den Urteilstendenzen der Hörer gleicher Herkunft?
182
Implikationen für den Ausspracheunterricht
185
Bibliographie Abkürzungen Literatur
189 190
Anhang
2O1
1.0.O.O.
EINFUHRUNG
Die vorliegende Arbeit untersucht einige Aspekte des Phänomens 'fremder Akzent unter Berücksichtigung der lautsprachlichen Perzeption und Produktion. Es wird angenommen, daß die Fähigkeit, bei einem Sprecher einen 'Akzent 1 festzustellen und oft sogar zu bestimmen, aus welchem Land (oder bei einheimischen Sprechern aus welcher Landschaft) der Sprecher stammt, zum großen Teil von systematischen 2 Eigenschaften des Sprachschalls abhängt. Diese Annahme impliziert auf der einen Seite eine Produktionsnorm bei Sprechern eines bestimmten 'Akzents 1 und auf der anderen Seite die Fähigkeit eines Hörers, die Ausprägung einer solchen Norm als Abweichung von der eigenen Norm zu erkennen. Dieser Sachverhalt kann auf Sprecher und Hörer bezogen werden, die verschiedene Sprachen sprechen, aber auch auf Sprecher und Hörer einer Sprachgemeinschaft, die aus verschiedenen Dialektgebieten stammen. Die Feststellung einer lautlichen Abweichung von der erwarteten Form setzt die Dekodierung der intendierten Phonemkette durch den Hörer voraus. 'Akzent 1 ist daher definitionsmäßig nicht auf der Phonemebene anzusetzen: Er wird hier als 'sub-phonemisches' Phänomen bezeichnet. Eine solche Betrachtungsweise des Akzents als sub-phonemisch kann in zweierlei Hinsicht gerechtfertigt werden. Zunächst kann ein Akzent nur im konkreten Sprechakt festgestellt werden, ist also qualitativ von der höheren abstrakten Ebene der l
l
Dieser Terminus wird verwendet, um alle lautlichen Phänomene zu umfassen, die dem Hörer Information über den andersartigen Hintergrund des Sprechers geben. Obwohl in dieser Arbeit die geographische Herkunft betrachtet wird, soll der Terminus nicht grundsätzlich darauf beschränkt sein? er schließt auch soziolektale Phänomene ein. 2 Dies schließt nicht aus, daß andere Informationskanäle zum Urteil beitragen. Neben dem visuellen Kanal, der zusätzliche Information über den Sprecher vermittelt, müssen hier sprachliche Phänomene lexikalischer und syntaktischer Art erwähnt werden, die zwar in Sprachschallmustern realisiert werden, die jedoch einer von der Lautebene zu unterscheidenden Sprachebene angehören, selbst dort, wo sie Informationen über die Herkunft des Sprechers enthalten.
- 2 -
Phoneme als funktionaler Einheiten zu unterscheiden. Wenn aber bestimmte Substanzerscheinungen als abweichend kategorisiert sind, können sie als systematisch erkannt und formalisiert werden. In dieser Hinsicht sind die Abweichungen sub-phonemisch, weil sie an dem Phonemsystem (oder Merkmalsystem) orientiert sind. Diese Arbeit untersucht ausgewählte Aspekte der lautsprachlichen Produktion von Sprechern aus drei verschiedenen geographischen Gegenden auf systematische Unterschiede hin. Die untersuchten Phonemketten wurden Gruppen von Hörern aus denselben drei Gegenden zur Beurteilung dargeboten. Die Hörer hatten zu urteilen, ob die Stimuli als ihrer eigenen oder einer anderen Sprachgemeinschaft zugehörig eingestuft werden müssen. Es wurde schon zum Ausdruck gebracht, daß kein grundsätzlicher Unterschied zwischen einer fremden (im Sinne von ausländisch) und einer dialektalen Färbung besteht, solange der Hörer in der Lage ist, die intendierte Phonemkette zu dekodieren. Im Fremdsprachenunterricht ist jedoch diese Unterscheidung wichtig, wenn die bestmögliche Aussprache als Ziel gesetzt wird. Dies macht es notwendig, diejenigen substantiellen Eigenschaften ausfindig zu machen, die der Hörer, der die Zielsprache als Muttersprache hat, als 'fremd 1 betrachtet. Zweitens ist es notwendig zu wissen, welche Realisationsnormen im muttersprachlichen Dialekt (oder gar Idiolekt) des Lernenden gegeben sind. Drittens muß aufgedeckt werden, ob der Lernende zwischen Realisationen der Ziel- und Muttersprache unterscheiden kann, bzw. was er für eine Realisation der Zielsprache hält. In dieser Untersuchung wurden deshalb Sprecher und Hörer aus England und Deutschland genommen. Als Phonemketten dienten die intersprachlichen Minimalpaare 'Tip-tip 1 , 'Paß-pus* und 'Busch-bush 1 , die phonetisch so ähnlich sind, daß sie nach den traditionellen Methoden der phonetisch-
- 3-
phonologischen Kontrastanalyse gemeinhin nicht unterschieden werden. Sie sollten die Möglichkeit bieten, die Grenzen der Unterscheidung sowohl auf der Produktions- als auch auf der Perzeptionsseite zu prüfen. Bei den deutschen Sprechern wurde die Unterscheidung in der Produktion von den muttersprachlichen und den der Zielsprache angehörenden (englischen) Wörtern verlangt. Von den deutschen Hörern wurde gefordert, daß sie perzeptorisch dieselbe Unterscheidung trafen. Die Gruppen von deutschen Sprechern und Hörern wurden aus zwei verschiedenen Landschaften (Hamburg, Köln)
re-
k r u t i e r t , was eine Feststellung möglicher Unterschiede (in der Produktion wie in der Perzeption) zwischen diesen beiden Gruppen einerseits und der Gemeinsamkeit dieser Gruppen gegenüber den englischen Sprechern und Hörern andererseits ermöglichen sollte. Die englischen Sprecher und Hörer hatten dabei lediglich die Rolle einer kontrollierenden Instanz, die in der Produktion eine Norm andeutet und in der Perzeption das Abweichende feststellt. So lauteten die Kategorien der Hörerurteile für die Engländer 'englisch 1 und 'fremd' und für die Deutschen 'deutsch* und 'englisch*. Neben dem Ziel, anhand der gesprochenen Stimuli systematische Unterschiede in der Produktion der drei Sprechergruppen und anhand der Hörerurteile systematische Unterschiede in den Beurteilungskriterien der Hörergruppen aus den drei Gegenden festzustellen, liegt der Gedanke nahe, In phonologischen Gegenüberstellungen werden der englische Vokal /A/ und der deutsche Vokal /a/ nicht als funktional vergleichbar in dem jeweiligen Vokalsystem gesehen, aber die phonetische Ähnlichkeit der beiden Laute wird betont - auch für das Amerikanische, wo die Zentralisierung üblich und nicht nur regional bedingt ist. Vgl. G. Scherer und A. Wollmann, Englische Phonetik und Phonologic, Berlin 1972, S. 138; R. Arnold und K. Hansen, Phonetik der englischen Sprache, München 1968, S. 64; W . G . Moulton, The Sounds of English and German, Chicago und London 1962, S. 99.
- 4 -
Beziehungen zwischen Produktion und Perzeption zu suchen. Obwohl eine solche Beziehung in den verschiedensten Zusammenhängen postuliert worden ist, ist 2 sie in kontrastiven Studien selten untersucht worden. Eine direkte Untersuchung der Beziehung kann auch hier nicht erfolgen, weil nicht dieselben Personen als Sprecher und Hörer fungierten; ihr Vorhandensein kann nur aus den systematischen Hörer- und Sprechertendenzen geschlossen werden. Es muß bemerkt werden, daß hier nur segmentale Aspekte des 'Akzents 1 untersucht werden. Dieser Bereich Siehe A . M . Liberman, F.S. Cooper, K.S. Harris, P.F. MacNeilage, " A motor theory of speech perception", Proceedings of the Speech Communication Seminar, Vol. 2, Sitzung D 3, Stockholm 1963. Das Verhältnis der Prozesse zueinander wird als wichtige Frage im Erstsprächerwerb angesehen; siehe P. Menyuk, The Acquisition and Development of Language, Englewood C l i f f s 1971, S. 47 f. Auf der neurophysiologisehen Ebene wird eine enge Verbindung der Motor- und Auditionszentren angenommen, siehe B. Sonesson, "The functional anatomy of the speech organs", Manual of Phonetics, Amsterdam 1968, S. 72-73. Im Fremdsprachenunterricht ist die Vorstellung lange etabliert, daß die Fehler im Hören und Sprechen in der Zielsprache von den Hör- und Sprechgewohnheiten der Muttersprache herrühren - allerdings wird die gegenseitige Abhängigkeit nicht immer betont. Siehe z.B. R. Lado, Language Teaching, A Scientific Approach, New York, San Francisco, Toronto, London 1964, S. 72, aber vgl. G. Schmidt, "Die akustische Täuschung", Neuere Sprachen (1927), S. 104, in dem er die Erkennung eines fremden Akzents unter Verwendung artikulatorischer Begriffe darstellt. Vgl. auch M. Kloster-Jensen, "Physiologie et enseignement", IRAL 8 (197O), S. 221-226, A.H. Marckwardt, "Phonemic structure and aural perception", American Speech 21 (1946), S. 1O6. Einen Überblick zu dieser Frage bietet H. Lane, "Production et perception de la parole", Phonetica 23 (1971), S. 94-125. 2 Siehe aber E.J. BrieTe, A Psycholinguist!c Study of Phonological Interference, The Hague 1968, der die Fähigkeit zur Diskriminierung und Produktion unbekannter Laute untersucht.
- 5-
der lautlichen Ebene wurde aufgrund der Möglichkeit gewählt, die linguistisch funktionale Information von anderer Information abzugrenzen. Es ist uns bewußt, daß die Aufdeckung von AkzentSignalen in isoliert
dar-
gebotenen Wörtern nichts über die Signalwirkung derselben Erscheinungen im Satz aussagt. Zur Gliederung der Arbeit muß erläuternd folgendes gesagt werden: Dem empirischen Teil, in dem der experimentelle Aufbau, die analytische Methode und die Ergebnisse beschrieben werden, geht ein theoretischer Teil voraus. Dieser Teil dient der Erörterung der phonetischen Problematik, die mit der Vorstellung einer Produktionsnorm und der Perzeption von Abweichungen zusammenhängt.
2.O.O.O.
THEORETISCHER TEIL
2.1.0.0.
Phonemische Korrektheit und phonetische Ähnlichkeit
Beschränkt man sich auf den segmentalen Aspekt der lautlichen Ebene der Sprache, so besteht der lautsprachliche Kommunikationsakt aus der Enkodierung einer Kette von Phonemen in ein komplexes Muster von Luftdruckschwankungen seitens des Sprechers und aus der Dekodierung der Schallwellen in eine der ursprünglichen Kette identische Phonemkette seitens des Hörers. Die Kommunikation gilt als gestört, wenn dieser Prozeß nicht stattfindet. Angesichts dieser Tatsache ist es üblich gewesen, als erstes Ziel der lautlichen Produktionsseite im Fremdsprachenunterricht die "phonemische Korrektheit" aufzustellen.
Zwar ignoriert die Forderung nach phone-
mischer Korrektheit den qualitativen Sprung zwischen einer abstrakt definierten,
funktionsorientierten
Segmentbeschrei-
bung und einer Substanzbeschreibung; nehmen wir jedoch ein substanzorientiertes Verständnis der Phonologie an,
2
Siehe z . B . R. Lado, Language Teaching, S. 73, vgl. aber ders., Linguistics Across Cultures, Applied Linguistics for Language Teachers, Ann Arbor 1957, S. 15 und 23. 2 Siehe B. Malmberg,"Levels of abstraction in phonetic and phonemic analysis", B. Malmberg, Phonetique Generale et Romane, The Hague 1971, S. 231-248. Vgl. auch ders., "The linguistic basis of phonetics", Manual of Phonetics, S. 1-15. Eine solche Orientierung entspricht mehr der Auffassung, die in Handbüchern des Fremdsprachenunterrichts implizit enthalten ist, als eine rein formale A u f f a s s u n g der Phonologie. Obwohl zwischen phonologischen (phonemischen) und phonetischen Aspekten des Ausspracheunterrichts eine Unterscheidung gemacht wird, ist das Phonem stets als konkrete Einheit zu verstehen, die gelernt und realisiert werden muß. Eine andere Auffassung vertrat schon früher R.L. Politzer,"Phonetics, phonemics and pronunciation: Theory", Applied Linguistics and Language Teaching, Monograph Series 6, Georgetown (1954), S. 19-27.
- 7 -
so ist phonemische Korrektheit wie folgt zu verstehen: Physiologisch gesehen bedeutet sie die Erfüllung bestimmter artikulatorischer Bedingungen, die durch die Parameter Artikulationsart und -stelle, Stimmhaftigkeit oder -losigkeit, Lippenrundung oder -spreizung gegeben sind. Akustisch gesehen können die zu erreichenden Bedingungen mit Hilfe der von Jakobson entwickelten Theorie der distinktiven Merkmale beschrieben werden. Die Erfüllung der Forderung nach phonemischer Korrektheit sollte deshalb kaum als anzustrebendes Ziel des Ausspracheunterrichts hingestellt werden, zumal die Wiederherstellung der intendierten
Phonemkette im Deko-
dierungsprozeß auch dort erfolgt, wo diese Bedingung nicht gegeben ist. Diese Forderung scheint die Folge einer Projektion der für wissenschaftliche Beschreibungszwecke R. Jakobson, G. Fant, M. Halle, Preliminaries to Speech Analysis. The Distinctive Features and their Correlates, Cambridge, Mass., 1951. Allerdings hat die Beschreibung nach distinktiven Merkmalen mangels eindeutiger substantieller Korrelate für den Sprachunterricht wenig Bedeutung. Drei Punkte seien hier erwähnt, die die Substanzorientiertheit der distinktiven Merkmale sehr zweifelhaft machen. Erstens machen Jakobson, Fant und Halle selber darauf aufmerksam ( o p . c i t . , S . 31), daß eine ein-eindeutige Relation zwischen akustisch definierten Merkmalen und artikulatorisehen Phänomenen nicht existiert - so etwa, wenn das Merkmal ' f l a t 1 auf der artikulatorisehen Seite sowohl mit Lippenrundung als auch mit Pharyngalisierung in Verbindung gebracht wird, was aufgrund perzeptorischer Ähnlichkeit zur Forderung nach funktionaler Identität dieser artikulatorisehen Parameter führt, die aber phonetisch gesehen keinesfalls identisch sind. Zweitens sind die Merkmale innerhalb eines Systems relationeil definiert, was einen zwischensprachlichen Vergleich unmöglich macht. Drittens sind auch die relationell definierten Eigenschaften der Laute einer Sprache im individuellen Sprechakt nicht unbedingt vorhanden. Siehe z.B. C. Bush, Phonetic Variation and Acoustic Distinctive Features, The Hague 1964. Eine Zusammenfassung der Kritik an der Theorie der distinktiven Merkmale findet sich bei E. Thürmann, P sycho-akust i sehe Untersuchungen am Worttyp /h-V-K/ zur Plo s i v färbung deutscher Vokale, Göppingen 1971, S. 21-33.
- 8-
unerläßlichen Aufteilung des Komplexes 'Sprache' auf den unteilbaren Sprechakt zu sein. Wie vermutlich alle Menschen im Verkehr mit Ausländern (wenn auch nicht bewußt) erlebt haben, ist durch die Redundanzeigenschaften natürlicher Sprachen (50% bei Phonemen, 5O% bei Wörtern)
unter
normalen Bedingungen auch ohne phonemische Korrektheit in bezug auf die Vermittlung des semantischen Inhalts eine nahezu hundertprozentig leistungsfähige Kommunikation möglich. Die Gefahr, daß ein Deutscher durch den Vertausch von /s/ und / / oder ein Franzose durch das Weglassen von /h/ mißverstanden wird, wird weniger aufgrund wirklicher Verständnisschwierigkeiten als durch die theoretische Gegenüberstellung von Minimalpaaren wie thick/sick oder £1
heiß/Eis konstatiert. Die Gültigkeit distinktiver Merkmale als
formale
Basis eines Sprachsystems soll hier nicht bestritten werden. Es wird lediglich bestritten, daß diejenigen Merkmale, die isolierte Laute voneinander unterscheiden, auch substantiell vorhanden sind und im konkreten Sprechakt eine distinktive Rolle haben. Wenn das der Fall wäre, wäre dadurch dem Enkodierer eine unerträgliche artikulatorische Last aufgebürdet und dem Dekodierer eine psychologisch 2 unerfüllbare Aufgabe gegeben. Morton und Broadbent deuten bei der Erörterung der Vorteile eines passiven Perzeptionsmodells auf denselben Sachverhalt hin. H. Jakobson, "Information and the human ear", JASA 23 (1951), S. 471. Vgl. G. Ungeheuer, "Einführung in die Informationstheorie unter Berücksichtigung phonetischer Probleme", Phonetica 4 (1959), S. 1O3. 2 G.A. Miller, "The magical number seven, plus or minus two: Some limits on our capacity for processing information", Psych. Rev. 63 (1956), S. 81-96. Neu abgedr. G.A. Miller, The Psychology of Communication. Seven Essays» Harmondsworth (Penguin) 1968, S. 21-5O. J. Morton und D . E . Broadbent, "Passive versus active recognition models, or, is your homunculus really necessary?", Models for the Perception of Speech and Visual Form, Cambridge, Mass., 1967, S. 1O9.
- 9-
Um allerdings im Dekodierungsprozeß die Wiederherstellung der Phonemkette zu ermöglichen, ist
eine
gewisse phonetische Ähnlichkeit erforderlich. Mit anderen Worten, „/ L·
/ kann im Kontext des konkreten
Sprechakts durchaus richtig dekodiert auch wenn e s a l s [ s m ] / [ f m ]
(verstanden) werden,
oder [ t i n ] realisiert wird,
kaum jedoch wenn es als [ p i n ] , [ k i n ]
oder
Jin]realisiert
wird. Eine phonologische Theorie kann selbstverständlich diese Tatsache erklären, indem sie die Errechnung der Entfernung der verschiedenen Phoneme voneinander entweder auf artikulatorischer Basis oder nach distinktiven Merkmalen möglich macht. Ebenso kann durch die Erstellung einer Merkmalhierarchie, die von Sprache zu Sprache verschieden ist,
eine Erklärung dafür geboten werden, warum z.B.
einmal [ s ] und einmal [ t ] als Fehlrealisationen des / / in verschiedenen Sprachen vorkommen. Solche Erklärungen mögen wohl als Unterstützung einer phonologisehen Theorie dienen? dem Aussprachunterricht dienen sie nur, sofern die zur Bestimmung der phonologischen Beschreibung verwendeten Termini auch substantielle Gültigkeit haben. Dies ist jedoch mit der Verwendung artikulatorischer Termini nicht automatisch gegeben. Es kann im Ausspracheunterricht nur darum gehen, ein akzeptables Maß an phonetischer zu erreichen.
Ähnlichkeit
Es muß also eine Entscheidung in Hinsicht
Die Internalisierung des phonologisehen Systems der Zielsprache im funktionalen Sinn, die von den Verfechtern eines "emischen" Sprachunterrichts gefordert wird (siehe z.B. W . M . Rivers, "Contrastive linguistics in textbook and classroom", J.E. Alatis ( H r s g . ) , 19th Annual Round Table, Monograph Series in Language and Linguistics Nr. 21, 1968, S. 151-158),ist eine Sache, die in der Praxis unabhängig von dem Grad der phonetischen Ähnlichkeit erfolgt. Jeder, der sich einer Fremdsprache im Kommunikationsakt erfolgreich bedient, macht von dem formalen Dinstinktionssystem Gebrauch, unabhängig von dem Eindruck der Fremdheit, den er dabei erweckt. Wenn Rivers zur Rechtfertigung des emischen Ansatzes im Ausspracheunterricht meint: "In an emic approach.
- 10 -
auf die Bestimmung des 'akzeptablen Ma es 1 getroffen werden. Dies kann leicht an einer InformationsaufStellung der oben angegebenen Realisationen von _ / θ ι η / £j
gezeigt
werden: Realisation
Interpretation eines (geschulten) engl. H rers
a)
[fin]
b)
1
/ θ ι η / [ + Cockney]
[ί η]
/ θ ι η / [ + irisch]
c) d)
[tin] [sin]
/θιη/ /Θιη/
( z . B . ) [ + afrikanisch] ( z . B . ) [ + deutsch]
Ein ungeschulter muttersprachlicher
H rer mag eine
solche Pr zision des Urteils nicht erreichen k nnen; er wird dazu neigen, allen Realisationen die Interpretation / θ ι η / [ + abweichend] zu geben, d.h. die Aussprache w rde ihm 'nicht normal 1 vorkommen. In allen vier Beispielen ist die Abweichung von der erwarteten Aussprache auch phonologisch zu beschreiben. So bietet eine kontrastive Phonologie ein gutes Kriterium zur Bestimmung der ersten Stufe eines 'akzeptablen Ma es der phonetischen 1
k e i t . Man sieht also, da
hnlich-
phonemische Korrektheit aus
Gr nden der Bestimmbarkeit von Lernschritten ein Ziel des Ausspracheunterrichts sein kann, nicht aber aus Gr nden der Verst ndlichkeit. Phonemische Korrektheit darf jedoch nicht so gesehen werden, als w rde sie notwendigerweise die Interpretation [+ abweichend] verhindern; es ist eine allt gliche Erfahrung von Sprachlehrern, da
ein Sch ler alle phonemischen Dis-
tinktionen realisiert, aber trotzdem einen starken Eindruck der 'Fremdheit 1 hervorruft. Wenn im Ausspracheunterricht gegen die
'Fremdheit 1
vorgegangen werden soll, so gen gt demzufolge als Ziel the student will acquire the phonological system as a functioning whole, learning to discriminate and produce sounds which signal distinctions of meaning within the new language", betont sie als Ziel das, was sich selbst erf llt, und setzt das als selbstverst ndlich voraus, was die eigentliche Arbeit des Lernenden ausmacht, die Produktion von akzeptablen Lautketten.
- 11 -
nicht die phonemische Korrektheit, wie sie oben definiert wurde. Jedes weitergehende 1
sub-phonemische Korrektheit
1
Ziel wird als
bezeichnet; der höchste
Grad der sub-phonemisehen Korrektheit ist
die Be-
herrschung der Aussprache in dem Maße, daß man nicht als Ausländer erkannt wird. Damit dieses Ziel erreicht werden kann, müssen nicht nur supra-segmental die Produktion von situationsangepaßter Betonung und Intonation, stellungsbedingten Änderungen auf der Wortebene wie Konsonantenverschleifung, Assimilation und Vokalreduktion, sondern auch die Einhaltung bestimmter segmentaler Normwerte gewährleistet sein. Auf welche Einheit der Normwert sich bezieht, bleibt o f f e n . Aus Gründen der Enkodierungsökonomie neigen wir zu einem phonemgebundenen Normwert, der nach Kontext und Sprechgeschwindigkeit und Betonungs2 grad in der Realisation modifiziert wird. Die Praktikabilität eines phonem-orientierten Normwertes gibt aber an sich keinen Grund zur Annahme, daß die allophonische Enkodierung, wie z . B . Wickelgren der Wirklichkeit
sie postuliert, nicht
entspricht. Allerdings ist
der Gedanke
Damit tritt eine Modifikation des in 1.0.O.O. verwendeten Terminus ein. Dort war eine 'Akzentbeschreibung' per definitionem sub-phonemiseh. Hier wird durch die Annahme der Substanzorientiertheit einer phonologischen Beschreibung die Möglichkeit der Bestimmung einer phonemischen Abweichung gegeben im Gegensatz zu einer sub-phonemi sehen. 2
Siehe in diesem Zusammenhang die Erörterungen von MacNeilage zu der Theorie eines 'zielorientierten 1 Enkodierungsmechanismus: P.F. MacNeilage, "The motor control of serial ordering of speech". Psych. Rev., 77 (197O, 182196; vgl. auch B. Lindblom, "Spectrographic study of vowel reduction", JASA 35 ( 1 9 6 3 ) , S. 1773-1781, und "Dynamic aspects of vowel a r t i c u l a t i o n " , Proc. 5th I n t . Congr. Phon. Sec. Münster, Basel 1965, S. 381-388. W . A . Wickelgren, "Context sensitive coding, associative memory, and serial ordering in (speech) behaviour", Psychological Review 76 (1969), S. 1-15.
- 12 -
an über 4O.OOO Zielwerte für das Englische schwer vorstellbar. 1 2 . 2 . 0 . 0 . Sub-phonemische Korrektheit und phonetische Variabilität Wenn wir einen Normwert für jedes Phonem postulieren, um eine theoretische Basis für die Feststellung einer als 'Akzent' wahrgenommenen Abweichung zu geben, geschieht dies nicht ohne Kenntnisnahme der ewigen Frustration bei der Suche nach der phonetischen 'blauen Blume 1 der Invarianz Hier wird jedoch keine Invarianz zwischen der Substanz und dem Phonem als funktionaler Einheit in einer bestimmten Sprache gesucht, sondern es wird eine Invarianz bei jedem Menschen auf der höchsten Ebene des Enkodierungsprozesses postuliert. Diese Flucht in die kortikalen Funktionen, die uns noch weitgehend verschlossen sind, mag sich als genauso fruchtlos erweisen wie diejenigen Hoffnungen, die man besonders in den Haskins Laboratorien seinerzeit in die 2 Elektromyographie gesetzt hat. Sie gibt aber doch zusammen mit der Reduktion auf die individuelle Ebene der Forderung nach Invarianz die Möglichkeit, daß man dem Phänomen der Erkennung von invarianten linguistischen Einheiten bei aller Varianz der Produktion einen kleinen Schritt näher kommt. 2.2.1.0.
Allgemeine phonetische Aspekte der Variabilität
Sobald verschiedene Realisationen eines einzelnen Phonems genauer betrachtet werden, stellen sich große Untersiehe MacNeilage, op.cit. Siehe z . B . A . M . Liberman, F.S. Cooper, K.S. Harris, P.F. MacNeilage und M.G. Studdert-Kennedy, "Some observations on a model for speech perception", W. Wathen-Dunn ( H r s g . ) , Models for the Perception of Speech and Visual Form, Cambridge, Mass., 1967, S. 83-84. 2
- 13 -
schiede heraus. Wichtiger als die bloße Feststellung von Unterschieden ist jedoch die Tatsache, daß gewisse Unterschiede oder Kombinationen von Unterschieden eine Identifikation zulassen, d.h.
sie haben eine systematische Funktion.
Innerhalb von gewissen Grenzen, die von Person zu Person sehr unterschiedlich sein können, ist neben der Erfassung des semantischen Inhalts die Wahrnehmung geographischer, sozialer, emotionaler und persönlicher Merkmale möglich, d.h. die bestimmenden Variablen werden vom Hörer (und bei Sprechkünstlern auch vom Sprecher) intuitiv e r f a ß t . Die wissenschaftliche Erfassung dieses Problems ist jedoch noch nicht weit gediehen. Ein möglicher Grund dafür die Aufteilung des Objektbereichs
'Sprache
1
ist
zum Zwecke der
Erhellung bestimmter Teilaspekte. Eine solche Aufteilung, falls sie über den Zweck hinaus zum Selbstzweck wird, kann der Verquickung jedes einzelnen Menschen und der Gesellschaft mit der Sprache als Ganzem in keiner Weise Rechnung tragen. Ein weiterer Grund ist jedoch der bei jeder Systembeschreibung sich ergebende Zwang, der formalen Homogenität, die durch die gegenseitige Verständlichkeit von Sprechern aus verschiedenen Gegenden impliziert ist, zunächst durch ein homogenes System gerecht zu werden. Die tatsächlichen Realisationsnormen verschiedener Sprechergruppen haben sekundäre Bedeutung, es sei denn, das System der kleineren Gruppe soll in seinen Funktionen dargestellt werden. Es besteht also eine Wechselbeziehung zwischen der Allgemeinheit einer phonologischen Aussage und der Genauigkeit der Siehe W. Meyer-Eppler, "Zum Problem der sphäriellen Analyse in der lautsprachlichen Kommunikation", ZPhon 12 (1959), S. 228-236. Vgl. G. Hammarström, "Reflexions sur la linguistique structurale et la phonetique experimentale", Phonetica 9 (1963), S. 11-16.
- 14 -
Erfassung der Substanzeigenschaften. Allerdings haben bei der Erfassung von regionalen Unterschieden die im Sprechakt vorkommenden Schalleigenschaften eine wichtige Rolle gespielt. In den meisten Fällen haben jedoch auditive Urteile einzelner Linguisten die Basis für die Klassifizierung eines Dialekts geliefert, sei es bei der Feststellung des Verlaufs einer Isoglosse oder bei der A u f s t e l l u n g des Phoneminventars. Das allgemeine Ziel der Dialektuntersuchungen, abgesehen von den traditionellen Isoglossenkarten, war nicht die quantifizierbare Beschreibung regionaler Unterschiede, sondern die Beschreibung 2 dialektaler Phonologien oder Diasysteme. Auch die phonometrisch orientierten Untersuchungen zielten mehr auf substantielle Bestätigung von den in der Phonologie postulierten funktionalen Distinktionen als auf die Erfassung von unterschiedlichen Realisationsnormen. Eine Ausnahme in dieser Hinsicht stellt die Vokaldaueruntersuchung Siehe S. 6, Fußnote 2 dieser Arbeit. Vgl. auch M . A . K . Halliday, "Degree of delicacy" (Feinheitsgrad), Intonation and Grammar in British English, The Hague 1967, S. 9, und seine Diskussion der Termini "Rank", "Exponence" und "Delicacy" in "Categories of the theory of grammar". Word 17 (1961), S. 268-273. Siehe z . B . die Schriften von W.G. Moulton, P. Wiesinger, M. Philipp etc. Für einen Überblick der Beiträge zur Dialektologie des deutschsprachigen Raumes siehe Bi bli o gr aph i e zur Phonetik und Phonologie des Deutschen. Bearbeitet von F. Schindler und Eike Thürmann. Hrsg. v. Institut der Phonetik der Universität zu Köln. Tübingen 1971, Kapitel .3, S. 35-51. Siehe aber G. Heike und F. Schindler, "Versuche zur Dialektgeographie akustisch-phonetischer Meßwerte am Beispiel schlesischer Mundartaufnahmen", ZDL 37 (1970), S. 26-43, G. Heike und R.D. Hall, "Vowel patterns of three English speakers: A comparative acoustic and auditive description", Linguistics 65 (1969), S. 13-38, G. Heike, "Zur Methodik phonetischphonologischer Vergleichung. Ein Beitrag zur luso-brasilianischen Aussprache", Phonetica 17 (1967), S. 231-240.
- 15 von Zwirner dar, die eine graduelle Änderung des kurz-lang Dauerverhältnisses innerhalb des ihm zugänglichen deutschsprachigen Raumes feststellte. In jüngerer Zeit sind Versuche unternommen worden, die funktionale Beschreibung von dialektalen Unterschieden im generativen Rahmen fortzuführen. Hier waren nicht nur Unterschiede im Regelsystem verschiedener Dialekte von Interesse, sondern auch das Verhältnis des Dialekts zu einem allen Dialekten zugrundeliegenden System, das aufgrund der allgemeinen interdialektalen 2 Verständlichkeit postuliert werden kann. Der Gedanke des Diasystems bei den taxonomisehen Phonologien nimmt unter diesem Aspekt neue Form an. In diesen Arbeiten ist jedoch das Hauptanliegen nicht die Erfassung der Unterschiede selbst, sondern die Erklärung von beobachteten Abweichungen von einem Grundsystem. Die erwähnten Beschreibungen versuchen also zu erklären, warum ein tolerables Maß an semantischer Information in Sprechakten zwischen Menschen verschiedener dialektaler oder soziolektaler Gruppen trotz der beobachteten Unterschiede vermittelt wird. Die vorliegende Arbeit versucht hingegen zu erklären, welche Unterschiede zusätzliche, über den semantischen Inhalt hinausgehende Information vermitteln. Unser Hauptinteresse gilt dabei der 'Fremdheit 1 , aber die Prinzipien, die der Untersuchung zugrundeliegen, können ebensogut der Bestimmung von regionalen Merkmalen innerhalb eines Sprachraumes, soziolektalen oder idiolektalen Merkmalen dienen. E. Zwirner, "Phonometrische Isophonen der Quantität der deutschen Mundarten", Phonetica,Suppl. ad. Vol. 4 (1959), S. 93-125. 2 Siehe Gillian Brown, Phonological Rules and Dialect Variations, Cambridge 1972, und W.H. Veith, Intersystemare Phonologie, exemplarisch an diastratisch-diatopisehen Differenzierungen im Deutschen, Berlin 1972.
- 16 -
Wie in 1.0.O.O. umrissen wurde, soll untersucht werden, a) welche Unterschiede bei der Produktion bestimmter Segmentketten sich als systematische Variationen erweisen, und zwar in Abhängigkeit von nationaler Zugehörigkeit im allgemeinen (am Beispiel Deutsch) und von regionaler Zugehörigkeit im besonderen
(am Beispiel Köln und Hamburg);
b) welche dieser systematischen Variationen, falls sie unverändert in eine Fremdsprache übernommen werden (am Beispiel Englisch), den Eindruck der 'Fremdheit 1 bei Sprechern der Zielsprache erwecken; c) welche Merkmale von der jeweiligen regionalen Gruppe als 'Signal 1 der Zielsprache aufgefaßt werden, und inwiefern der Versuch, die Zielsprache auszusprechen, durch diese Auffassung beeinflußt wird. Eine solche Untersuchung setzt jedoch voraus, daß die bestimmenden Faktoren der Variabilität identifiziert werden, damit experimentell nachgeprüft werden kann, welche Elemente des Gesprochenen in welchem Maße mit den Faktoren der nationalen und regionalen Zugehörigkeit variieren. Eine grobe Aufteilung der möglichen Faktoren, die zur Variation in der lautlichen Substanz führen, läßt 1. die Ungenauigkeit im Vollzug der beabsichtigten Artikulation, 2. den situativen Kontext und 3. den linguistischen Kon2 text unterscheiden. 2 . 2 . 2 . 0 . Variabilität im Produktionsprozeß 2.2.2.1. Ungenauigkeit der artikulatorisehen Bewegungen Als Ursache der Variabilität bleibt die Ungenauigkeit der artikulatorisehen Bewegung eine dankbare Kategorie, Diese würden vermutlich wiederum als Fremdheitsmerkmale fungieren, wenn Engländer sie unverändert ins Deutsche übertragen würden. 2 A. livonen, Experimente zur Erklärung der spektralen Variationen deutscher Phonemrealisationen, Oulu 1970 (Commentationes Humanorum Litterarum 4 5 ) , S. 15-17 und S. 99.
- 17 -
weil sie weitgehend unbestimmbar ist. Auf der physiologischen Ebene werden Faktoren wie Trägheit der Artikulatoren, intermuskuläre Reibung oder auch Kontakt zwischen 2 Schleimhautflächen genannt. Elektromyographische Untersuchungen an häufig wiederholten Silbenfolgen zeigen jedoch deutlich, daß unsystematische Veränderungen der Artikulation auch neurophysiologisehen Ursprungs sein können. Mansell bietet hierfür die Interpretation, daß solche Variationen nicht gänzlich zufällig sind (er schließt z.B. Ermüdung aus), sondern in denjenigen Muskeln vorkommen, die für Bewegungen verantwortlich sind, die in einer Sprache nur sekundäre Bedeutung haben, z.B. 4 Lippenrundung im Englischen. Damit sind Fluktuationen in der Innervation von Motorzellen, die mit den unterschiedlichen Schwellwerten dieser Zellen zusammenhängen, nicht mehr in erster Linie ein Zeichen der Variabilität, sondern ein Zeichen einer potentiell feineren Abstufung in der Steuerung der Artikulatoren: "It is likely that excitability fluctuation of the sort described exists in the normal animal and serves as useful purpose in providing for finer gradation of response." 5 •""Siehe z.B. MacNeilage, Psych. Rev. 77 (197O) , S. 182-196. 2 B. Lindblom, "Vowel duration and a model of lip-mandible coordination", STL-QPSR 4 (1967), S. 17. P. Mansell, "The nature of EMG variations". University of Essex Language Centre, Occasional Papers 9, Symposium (September 1970), Aerodynamic and myodynamic studies of speech production, Colchester 197O, 3. 65-87. Mansell, o p . c i t . , S. 80-81. C.C. Hunt, "Temporal fluctuations in excitability of spinal motoneurons and its influence on monosynaptic reflex responses", j.Gen.Physiol. 38 (1955), S. 810.(Zitiert nach Mansell, 1970, S. 82) .
- 18 -
Derselbe Sachverhalt, wie Mansell selber einräumt, wird jedoch auch als Zeichen der inhärenten Fluktuation der Muskelinnervation angesehen. Diese Art der Variabilität kann in keiner Untersuchung ausgeschaltet werden und manifestiert sich in der Streuung akustischer Werte bei Gleichhaltung aller anderen bekannten Ursachen der Variabilität. 2.2.2.2.
Situativer Kontext
2 Drei Hauptfaktoren der Situation für den Sprecher können unterschieden werden, von denen jeder in eine Anzahl von Unterfaktoren unterteilt werden kann:
1. die geographische Herkunft 2. die soziale Schicht 3. die Konstituenten der unmittelbaren Gesprächssituation. Zu Punkt l gehören weitere Differenzierungen wie der Grad der Aufgeschlossenheit eines Sprechers gegenüber von außen wirkenden Einflüssen (Tourismus, regionale Heterogenität des Familien- bzw. Bekanntenkreises, Seßhaftigkeit des Sprechers bzw. seiner Familie u s w . ) . Unter Punkt 2 müssen diejenigen Variablen berücksichtigt werden, die eine soziologische Analyse der sozialen Schicht zutage fördert. Hier seien nur Faktoren wie Beruf, Ausbildungsstand des Sprechers und seiner Eltern als Hauptelemente erwähnt. Punkt 3 ist der komplizierteste Faktor, weil l und 2 als variable Konstituenten von vornherein dazugehören. D.P.C. Lloyd und A.K. Mclntyre, "Monosynaptic reflex responses of individual motoneurons", j^ Gen. Physio1. 38 (1955), S. 785. 2 Situation wird hier nicht nur im Sinne der augenblicklichen Situation, in der der Sprecher sich kurz vor und während des Sprechens befindet, verstanden. Hinzugerechnet werden alle vergangenen situativen Konstellationen, von denen angenommen werden kann, daß sie einen quasi-permanenten Einfluß auf den Sprecher in zukünftigen Sprechakten ausüben werden? siehe hierzu die Punkte l und 2.
- 19 -
Zusätzlich müssen die Anzahl und Rollen der Rezipienten (wozu die Punkte l und 2 wieder als Faktoren zählen), das Thema/ worüber gesprochen wird und die Art des Sprechens (Vortrag, Diskussion, Lesen - formell/informell usw.) berücksichtigt werden. Da nur Punkt l für diese Untersuchung von Interesse ist, wurde versucht, die Variablen der Punkte 2 und 3 soweit wie möglich für alle Sprecher (und Hörer) konstant zu halten. 2.2.2.3.
Linguistischer Kontext
Am häufigsten ist der linguistische Kontext als Variabilitätsfaktor bei der Produktion sprachlicher Äußerungen untersucht worden. Die Gründe dafür liegen auf der Hand: Zum einen sind die dadurch verursachten Variationen leicht zu beobachten, zum anderen ist die experimentelle Kontrolle der Variablen am leichtesten durchzuführen. Der Übersichtlichkeit halber kann zwischen suprasegmentalen, segmentalen und distributioneilen Faktoren im Kontext unterschieden werden. 2 Suprasegmentale Phänomene wie Intonation, Wortund Satzakzent finden ihren Ausdruck durch den relationellen Wert bestimmter Parameter wie Tonhöhe, Lautstärke, Länge und Qualität (bzw. Grundfrequenz, Intensität, Dauer und spektrale Form im akustischen Bereich) über mehrere Segmente. Die kleinste Einheit, über der sie operieren, ist die Silbe; zur Feststellung relationeller Werte Vgl. K. Kohler, "Probleme bei der Analyse gesprochener Sprache", Phonetische Untersuchungen zur gesprochenen Sprache im Deutschen, Inst. Phon., Kiel 1972. 2 Eine allgemeine Behandlung supra-segmentaler Fragestellungen ist u.a. in folgenden Werken zu finden: D.B. Fry, "Prosodic Phenomena", Manual of Phonetics, S. 365-410; G. Heike, Suprasegmentale Analyse, Marburg 1969; und I. Lehiste, Suprasegmentals, Cambridge, Mass., 197O.
- 20 -
sind allerdings außer bei Tongruppen, die nur aus Einsilblern bestehen, mindestens zwei Silben erforderlich. Dauer und spektrale Form können sinnvoll im Segmentbereich gemessen werden, gewinnen jedoch erst durch die Gegenüberstellung mit Messungen anderer Segmente Bedeutung. Unterschiede zwischen den Silben in betonter gegenüber denjenigen in unbetonter Stellung sind in der größeren Dauer der Segmente, der größeren Intensität, eventuell in höheren Grundfrequenzwerten (manchmal jedoch auch in der 'negativen Prominenz 1 einer tieferen Grundfrequenz) und in der größeren Entfernung der vokalformantwerte von Neutralvokalwerten festzustellen. Im Hinblick auf den Einfluß des segmentalen Kontexts ist zu sagen, daß jedes Segment Spuren von dem vorhergehenden und folgenden Segment in sich trägt. Diese Aussage hat ihre Gültigkeit unabhängig davon, in welchem Bereich sprachliche Manifestationen betrachtet werden. So sind im neurophysiologischen Bereich durch eine Reihe von Untersuchungen kontextuelle Einflüsse festgestellt 2 worden. Was auf neurophysiologischer Ebene feststellbar ist, muß aber notwendig auch aus physiologischen und Siehe K. Hadding-Koch, "Acoustic-phonetic studies in the intonation of Southern Swedish", Trav. Inst. Phon. Lund III, 1961, Angabe nach D.B. Fry, "Prosodic phenomena", Manual of Phonetics, S. 404. Vgl. auch G. Heike, "Lautdauer als Merkmal der wahrgenommenen Quantität, Qualität und Betonung im Deutschen", Proc. 6th Int. Gongr. Phon. Sei. München 1970, S. 433-437. 2 Siehe P.F. MacNeilage und J.L. DeClerk, "On the motor control of coarticulation in CVC monosyllables", JASA 45 (1969), S. 1217-1233; S.E.G. Ohman, "Peripheral motor commands in labial articulation", STL-QPSR 4 (1967), S. 30-63; M.A.A. Tatham und K. Morton, "Further electromyography data towards a model of speech production", Occasional Papers 1, University of Essex Language Centre, 1968, S. 25-59.
- 21 -
akustischen Messungen ersichtlich sein. Eine in alle Einzelheiten gehende Beschreibung der Art kontextueller Einflüsse ist. nicht das Anliegen dieser Arbeit. Ein kurzer Überblick möge genügen. Die relativ ruhige Haltung der Artikulatoren bei der Produktion isoliert gesprochener Vokale oder Frikative kann verständlicherweise bei der Aneinanderreihung von Lauten, aus der
normale Äußerungen (linguistisch
gesehen) bestehen, nicht beibehalten werden. Auch bei extrem langsam artikulierten Wörtern, bei denen eine verhältnismäßig unbewegliche Stellung der Artikulatoren während einer gewissen Zeit zu beobachten ist, die auf Sonagrammen als unveränderte spektrale Form erkennbar ist, kann die Bewegung von dem einen gehaltenen Laut zu dem nächsten nicht vermieden werden. Wenn der Übergang z.B. von einem gehaltenen Vokal zu einem Frikativ extrem langsam durchgeführt wird, kann der Sprecher die qualitative Veränderung des letzten Teils des Vokals sogar bewußt erleben. Hier fängt die normalerweise nicht perzipierte Koartikulation des Konsonanten mit R. Daniloff und K. Moll, "Coarticulation of lip rounding", JSHR 11 (1968), S. 7O7-721. B. Lindblom, "Articulatory activity in vowels", STL-QPSR 2 (1964). S . E . G . Öhman, "Coarticulation of stops with vowels", STL-QPSR 2 (1963), S. 1-8. Ders., "Numerical model of Coarticulation", JASA 41 (1967), S. 310-320. Ders., "Coarticulation in VCV utterances: Spectrographic measurements", JASA 39 (1966), S. 151-168. K . N . Stevens und A.S. House, "Perturbations of vowel articulation by consonantal context", JSHR 6 (1963), S. 111-128. K.N. Stevens, A.S. House und A . P . Paul, "Acoustical description of syllabic nuclei : An interpretation in terms of a dynamic model of articulation", JASA 40 (1966), S. 123-132.
- 22 -
dem Vokal an.
Bei normaler Sprechgeschwindigkeit
nimmt dieser Übergang von Konsonant zu Vokal und erneuter Konsonantenartikulation einen derart großen Teil des Vokals ein, daß der Wert des isoliert gesprochenen Vokals selten realisiert wird. Je schneller gesprochen wird, desto weiter entfernt sich der Vokalwert von dem des isoliert gesprochenen Vokals (Vokal2 reduktion). Die Abweichung ist aber nicht nur ein Produkt der Sprechgeschwindigkeit, sondern ist auch in systematischer Weise von der Artikulationsstelle des vorhergehenden und folgenden Konsonanten sowie von der Vokalqualität vorhergehender und folgender Silben abhängig. Darüber hinaus scheint die erreichte Vokalqualität nicht nur ein Produkt dieser Faktoren zu sein, sondern auch unmittelbar von der Koartikulation wird hier in einem Sinne verwendet, der die beiden differenzierten Begriffe "Steuerung" und "Koartikulation" bei Menzerath und de Lacerda einschließt. Siehe P. Menzerath und A. de Lacerda, Koartikulation, Steuerung und Lautabgrenzung, Bonn 1933. Mit anderen Worten, es wird nicht unterschieden zwischen vorbereitenden Bewegungen, die akustisch den Werdegang eines Lautes erkennen lassen ( z . B . durch die Transitionen) und Vorbereitungen, die schon beim Ansatz des vorhergehenden Lautes getroffen worden sind ( z . B . Lippenrundung als Begleiterscheinung der Plosivartikulation vor einem gerundeten Vokal). Hier wird allerdings zwischen Koartikulation von Konsonanten mit Vokalen und von Vokalen mit Konsonanten unterschieden. Das erstere ist so zu verstehen, daß während der Dauer eines Lautes, der als Vokal verstanden wird, artikulatorische Bewegungen stattfinden, die mit dem benachbarten Konsonanten zusammenhängen. Das zweite ist der umgekehrte Fall, nämlich daß die Konsonantenartikulation durch den Charakter des benachbarten Vokals beeinflußt wird. 2 Siehe B. Lindblom, "Vowel reduction", 1963, und "Dynamic vowel articulation", 1965. Siehe z . B . die auf Seite 21, Anmerkung l, angegebene L i t e r a t u r .
- 23 -
kommunikativen Intention des Sprechers in der jeweiligen Situation abhängig zu sein. Jedoch nicht nur Vokale in konsonantischer Umgebung, sondern umgekehrt auch Konsonanten in vokalischer Umgebung zeigen die Wirkung von Koartikulationserscheinungen bei natürlichem Sprechen. Diese Art der Koartikulation ist sogar bei normaler Sprechgeschwindigkeit bei Selbstbeobachtung feststellbar. Am leichtesten kann man etwa die Verschiebung der Artikulationsstelle bei der Artikulation von /k/ mit palatalen und velaren Vokalen, die sich verändernde Velarisierung des /l / im englischen Wort 'bullion 1 oder die unterschiedliche Lippenrundung bei /b/ in 'boot* im Gegensatz zu 'bit 1 aufzeigen. Die Vorbereitung der Lippenrundung vor einem gerundeten Vokal ist bereits vier Konsonantensegmente vor 2 Vokalbeginn beobachtet worden. Abgesehen von Qualitätsänderungen bei Vokalen in Abhängigkeit von vorhergehenden und folgenden Konsonanten sind systematische Dauerunterschiede gemessen worden, die auf den Konsonantenkontext zurückführen. F. Schindler, "Performance factors and vowel formant variation", Vortrag der Sektion F_, 3rd Int. Gong. App. Ling., Kopenhagen 1972. 2
R. Daniloff und K. Moll, "Coarticulation".
P. Delattre, "Some factors of vowel duration and their cross-linguistic validity", JASA 34 (1962), S. 1141-1142. E. Fischer-Jeirgensen, "Sound duration and place of articulation", ZPhon 1 7 . ( 1 9 6 4 ) , S. 175-2O7. A.S. House, "On vowel duration in English", JAS A 33 (1961), S. 1174-1178,· ders. und G. Fairbanks, "The influence of consonant environment upon the secondary acoustical characteristics of vowels", JASA 25 (1953), S. 1O5-113; G.E. Peterson und I. Lehiste, "Duration of syllable nuclei in English", JASA 32 (I960), S. 693-7O3; S.A. Zimmermann und S. M. Sapon, "Note on vowel duration seen cross-linguistically", JASA 30 (1958), S. 152-153.
- 24 -
Die Ergebnisse sind keineswegs eindeutig zu nennen, aber trotzdem sind Hypothesen über den möglichen Grund für die Variationen aufgestellt worden; diese berücksichtigen sowohl die Artikulationsstelle als auch die 2 Artikulationsart. Sowohl Maack als auch FischerJcfrgensen sehen in der längeren Vokaldauer eine Folge der Entfernung der Zunge von der Artikulationsstelle des folgenden Konsonanten. Fischer-j^rgensen jedoch analysiert den physiologischen Vorgang etwas differenzierter, 4 indem sie Lippenrundung mit berücksichtigt. Maack steht allein mit seiner Vermutung, daß ein vorn artikulierter Konsonant vor einem palatalen Vokal und ein hinten artikulierter Konsonant vor einem velaren Vokal zu einem längeren Vokal führt. Über die Abhängigkeit der Vokaldauer von der Artikulationsart benachbarter Konsonanten gehen die Meinungen auseinander. Für den Einfluß der Stimmhaftigkeit vorangehender Konsonanten scheint es bisher keine Erklärung zu geben. Was die Folge Vokal-Konsonant b e t r i f f t , vertreten Halle und Stevens die Ansicht, daß eine physiologische Abhängigkeit zwischen der Modifikation der Stimmlippen, die für stimmhafte Konsonanten notwendig ist, und der größeren Dauer des vorangehenden Vokals besteht, daß der Einfluß also universell ist. In dem Fall wäre eine größere Übereinstimmung mit den Ergebnissen x-
von Petersen und Lehiste und Eiert zu erwarten. House (1961) hält die Größenordnung der Unterschiede, die er Siehe House und Fairbanks im Vergleich zu Zimmermann und Sapon, aber vergleiche dazu die Diskussion bei Delattre. 2 A. Maack, "Die Beeinflussung der Sonantdauer durch die Nachbarkonsonanten", ZPhon 7 (1953), S. 1O4-128. 3 E. Fischer-J^rgensen,"Sound duration", 1964. 4 op.cit., S. 2O3. G.E. Peterson und I. Lehiste, I960. C.-Chr. Eiert, Phonologic Studies o_f Quantity iri Swedish, Stockholm, Göteborg, Uppsala 1964.
- 25 -
im Englischen untersucht hat, für sprachspezifisch. Unterschiede in der Dauer vergleichbarer Vokale vor Frikativen und Plosiven ergeben eine deutlichere Basis für die Annahme einer physiologischen Beziehung. House (1961) erklärt die längere Dauer von Frikativen als Folge der aufwendigeren Einstellung der Artikulatoren. Über den E i n f l u ß von folgenden Nasalen läßt sich keine Hypothese aufstellen (siehe Eiert und Halle und Stevens im Vergleich zu Petersen und Lehiste). Unterschiede in der Realisation von Phonemen in initialer und finaler Stellung infolge der Wortverkettung brauchen nicht weiter erörtert zu werden. Z . B . werden Phoneme, die sich in finaler Stellung in Wörtern befinden, in Abhängigkeit von dem darauffolgenden oder fehlenden Segment variieren; Initialsegmente variieren ebenfalls in Abhängigkeit von dem Segment zu ihrer Offenen Seite 1
hin. Nach den obigen Erörterungen ist es nicht ausgeschlossen, daß kontextuelle Variationen der Phonemrealisationen z.T. sprachabhängig sind und daher zu Interferenzerscheinungen führen, die den Eindruck des fremden Akzents erwecken. Ein offensichtliches Beispiel dieser Art ist die relativ größere Dauer aller Vokale im Englischen vor stimmhaften Konsonanten. Dieses Phänomen ist jedoch längst als eine mögliche Ursache des fremden Akzents bekannt; weitere Ursachen ähnlicher, aber weniger offensichtlicher Art konnten wegen allzugroßer Ausweitung der Zielsetzung dieser Untersuchung nicht berücksichtigt werden. Es gilt daher, die kontextuellen Bedingungen durch Verwendung von intersprachlichen Minimalpaaren für alle Sprecher gleichzuhalten. Auch Intonation und Betonung mußten soweit wie möglich gleichgehalten werden.
- 26 -
2.2.3.0.
Variabilität und Wahrnehmung
Wenn die im Sprechakt erzeugten Schallmuster die Information tragen sollen, die wir in der Einführung angenommen haben, muß der Wahrnehmungsmechanismus so funktionieren,
daß die zufälligen Variationen der Arti-
kulatoren und die durch den Artikulationsvorgang bedingten Variationen der Phonemrealisationen 'überhört 1 werden, während etwa situationsbedingte Variationen registriert werden. Obwohl der Perzeptionsprozeß keineswegs erschöpfend erforscht ist, gibt es schon gewisse Hinweise dafür, daß eine solche Differenzierung tatsächlich vorgenommen wird. Erstens ist
der Hörer in der Lage, gewisse Ungleichheiten
in der Produktion während des Perzeptionsvorgangs auszugleichen. Die deutlichsten Hinweise hierfür finden sich auf dem Gebiet der Wortbetonung, aber die Tatsache deutet auch auf andere Möglichkeiten hin. Zweitens haben 2 russische Phonetiker aufgrund experimenteller Ergebnisse geschlossen, daß nicht sequentiell über jedes einzelne Phonem eine Entscheidung getroffen wird, sondern daß Information im Kurzzeitgedächtnis gespeichert wird; in mehrdeutigen Fällen führt ein Vergleich mit der Information über andere Segmente zu einer Entscheidung. Dieser Sachverhalt stimmt mit den Gegebenheiten des Sprechaktes überein,
in dem viele der in der linguistischen Analyse vor-
handenen Segmente verschliffen
und undeutlich realisiert
I. Lehiste und G . E . Petersen, "Vowel amplitude and phonemic stress in American English", JASA 31 (1959), S. 428. Es wurde errechnet, daß bei Berücksichtigung der unterschiedlichen Intensität von Vokalen unterschiedlicher Qualität die Betonung auf der Silbe gehört wird, die im Verhältnis die größere Intensität hat. 2 V.A. Kozhevnikov und L.A. Chistovich, Speech; Articulation and Perception, Moscow,Leningrad 1965; Joint Publications Research Service, Washington DC. No. JPRS 3O.543, S. 237.
- 27 -
werden. Die Interpretation von Kozhevnikov und Chistovich deckt sich auch mit dem formalen Perzeptionsmodell, das Fry entwickelte,
um die Stellung
der akustischen Information im Gesamtkomplex der Sprachperzeption zu erklären. Drittens widersprechen diese Annahmen nicht dem Prinzip des 'Receding 1 , das in 2.1.O.O. erwähnt wurde. Mit anderen Worten,
die
akustische Information, die in einzelnen Segmenten enthalten ist,
wird über eine gewisse Zeitdauer ge-
speichert und ermöglicht die Identifikation komplexerer Einheiten als Ganzes. Die Wahrnehmung einer Abweichung kann danach a) von der Größe der Abweichung (dem Grad der Störung des Schallmusters) und b) von der Häufigkeit des Auftretens ähnlicher Abweichungen 2 abhängig sein. Viertens ist vom Perzeptionsprozeß bekannt, daß auch bei der Darbietung isolierter Silben, bei der die Aufmerksamkeit des Hörers nicht durch semanD.B. Fry, "The correction of errors in the reception of speech", Phonetica 11 (1964), S. 164-174. 2 a) und b) schließen die Interpretation zufälliger Variationen, aber nicht kontextueller Variationen als Abweichungen aus. Da manche durch kontextuellen E i n f l u ß entstehende Variationen in den Realisationen eines Phonems weder zu klein sind noch zu unregelmäßig vorkommen, um nicht registriert zu werden, kann nach unserer Auffassung nur eine ähnliche Ausgleichseinrichtung wie der Ausgleich der Vokalintensität bei der Betonungswahrnehmung die Tatsache erklären, daß trotz meßbarer Unterschiede derselbe Laut ( u n d i f f e r e n z i e r t ) wahrgenommen wird. Mit anderen Worten, oft wiederholte und physiologisch bedingte Variationen werden nicht als solche wahrgenommen, ähnlich wie die physikalisch bedingten Intensitätsvariationen nicht als solche wahrgenommen werden. Die Annahme, daß sich für die Perzeption von Sprache ein Prozeß entwickelt hat, der sich von nichtsprachlicher Wahrnehmung unterscheidet, kann nicht darüber hinwegtäuschen, daß wir nichts als einige Beobachtungen und Vermutungen haben, die auf die Art des Unterschiedes hindeuten.
- 28 -
tische Information von der Schallstruktur abgelenkt wird, einige Lauttypen 'kategoriell' wahrgenommen werden. So wird die anfangs aufgestellte These, daß nicht alle Variationen wahrgenommen werden, von einer anderen Seite einsichtig. Aus der Theorie der kategoriellen Wahrnehmung bestimmter Laute und aus der oben in Punkt a) angesprochenen Vermutung, der Grad der Störung des Schallmusters ermögliche das Urteil 'Abweichung 1 , läßt sich die Annahme schließen, daß die Qualität der Vokale in betonten Silben 2 weitgehend das Urteil bestimmt. Eine nähere Betrachtung der bisherigen Forschung der Sprachperzeption soll diese Annahme prüfen. 2.2.3.1.
Vokalwahrnehmung
Die geringere Kategorialität der Vokalwahrnehmung irt« wird vielfach aufgrund einer von Fry et al. durchgeführten 4 Untersuchung angenommen, bleibt jedoch nicht unbestritten. Weitere Untersuchungen haben gezeigt, daß Sprecher/Hörer für jedes Vokalphonem einen bevorzugten Wert haben.
Aller-
dings wurden die meisten Untersuchungen über Vokalperzeption durchgeführt. Nur wenige Untersuchungen haben VokalA.M. Liberman, "Some results of research on speech perception", JASA 29 (1957), S. 117-123. 2 Diese Annahme deckt sich mit der häufig vertretenen Meinung, daß Vokale für nicht-semantische Information wichtig sind, siehe z.B. D. B. Fry, A.S. Abramson, P.D. Eimas und A.M. Liberman, "The identification and discrimination of synthetic vowels", Lang. & §p_. 5 ( 1 9 6 2 ) , S. 171-189. Fry, et al., op cit. 4 K . N . Stevens, "On the relations between speech movement and speech perception", ZPhon 21 (1968), S. 1O2-1O6. A. Cohen, I.H. Slis, J . ' t Hart, "Perceptual tolerance of isolated Dutch vowels", Phonetica 9 (1963), S. 65. G. Fairbanks und P. Grubbs, "A psychophysical investigation of vowel formants", JSHR 4 (1961), S. 203-219 Synthetische Stimuli wurden in folgenden Untersuchungen verwendet: W.A. Ainsworth und J.B. Millar, "Methodology of
- 29 -
stimuli im Kontext benutzt, und nur Stevens hat die Frage der möglichen K a t e g o r i a l i t ä t der erkennung durch einen Vergleich der Identifizierungsund Diskriminationsf ähigkei ten von Beobachtern bei isolierten und eingebetteten Vokalen erörtert. Seine Ergebnisse zeigen bei den eingebetteten Vokalen eine deutliche Steigerung der Diskriminationsf ähigkeit an den Phonem2 grenzen, die als erlernte D i s t i n k t i v i t ä t und damit als Zeichen kategorieller Wahrnehmung interpretiert worden experiments on the perception of synthesized vowels", Lang. &^ Speech 14 (1971), S. 201-212; Cohen et al., op.cit. 1963; Fry et a l . , op. cit. 1962; 0. Fujimura, "On the second spectral peak of front vowels: A perceptual study of the role of the 2nd and 3rd formants", Lang. & Sp. 10 (1967), S. 181-193; P. Janota, "Zur Wahrnehmung synthetischer tschechischer Vokale", ZPhon 17 (1964), 235-242; J . D . M . H . Laver, "Variability in vowel perception", Lang. &. Sp_. 8 (1965), S. 95-121; G. Lindner, "Beurteilung synthetisch erzeugter vokalartiger Klänge durch deutschsprachige Hörer", ZPhon 19 (1966), S. 45-65, und ders., "Veränderung der Beurteilung synthetischer Vokale unter dem E i n f l u ß des Sukzessivkontrastes" ZPhon 19 (1966), S. 287-3O7. Lindner benutzte das von Janota hergestellte Material. R.J. Scholes, "Phoneme categorization of synthetic vocalic stimuli by speakers of Japanese, Spanish, Persian and American English", Lang. &. Sp_. 1O (1967), S. 46-68, und ders., "Categorial responses to synthetic vocalic stimuli by speakers of various languages", Lang. ^ Sp_. 10 (1967), S. 252-282. K.N. Stevens, .A.M. Liberman, M. Studdert-Kennedy und S . E . G . Öhman, "Cross-language study of vowel perception", Lang. & Sp. 12 (1969), S. 1-23; C. W i l l i s , "Synthetic vowel categorization and dialectology", Lang. &. Sp_. 14 (1971), S. 213-228. Natürlich erzeugte Vokale wurden bei G . E . Peterson, "Parameters of vowel quality", JSHR 4 (1961), S. 1O-29, und Fairbanks und Grubbs, op.cit., 1961, verwendet. G . E . Peterson und H . L . Barney, "Control methods used in a study of vowels", JASA 24 (1952), S. 175-184. B. Lindblom und M. Studdert-Kennedy, "On the role of formant transitions in vowel recognition", JASA 42 (1967), S. 830-843; K . N . Stevens, o p . c i t . , 1968. 2 "Acquired d i s t i n c t i v e n e s s " , siehe Liberman, "Some results of research on speech perception", S. 122, und Liberman et a l . , "An effect of learning on speech perception: The discrimination of duration of silence with and without phonemic significance", 1961.
- 30 -
ist. Er folgerte daraus, daß isoliert gebotene Vokalstimuli nicht als Sprachlaute aufgefaßt werden. Die Wichtigkeit dieser Behauptung für die vorliegende Arbeit läßt eine genauere Prüfung ratsam erscheinen, denn bei geringeren Diskriminationsmöglichkeiten innerhalb von Phonemgrenzen ist
die Wahrnehmung von 'Fremdheit 1
als Folge einer Abweichung von einem erwarteten Wert problematisch. Fremdheit wäre dann nur wahrnehmbar, wenn z.B. der Stimulus einen Wert des benachbarten Phonembereichs aufweist. Es gibt jedoch einige Hinweise dafür, daß die ursprünglich extreme Behauptung Stevens 1 nicht 2 uneingeschränkt Gültigkeit hat. Zum einen waren auch innerhalb des Phonembereichs die Unterschiede, die drei Unterschiedsstufen auseinander lagen, mit hoher Verläßlichkeit wahrnehmbar. Bei der zusätzlichen Information, die in einer CVC-Kombination im Vergleich zu einem isolierten Vokal vermittelt wird, ist eine zuverlässige Wahrnehmung erst bei diesen etwas größeren Unterschieden zu erwarten. Zum anderen ist in anderen Untersuchungen zur Vokalidentifikation die Aufgabe gegeben worden, das passende Wort für einen dargebotenen Stimulus aufzuschreiben bzw. den 3 Stimulus als nicht phonemartig zu notieren. Diese Reaktion verlangt auf jeden Fall von dem Hörer, daß er die Laute als Teil einer Phonemkette, also als Sprachlaute interpretiert und sie nicht in ihrer abstrakten Qualität Dies ist selbstverständlich möglich, wenn die phonemische Interpretation durch syntaktischen und semantisehen Kontext gesichert ist. 2 Er hat den Sachverhalt später selbst weniger absolut ausgedrückt. Siehe K . N . Stevens, "Perception of phonetic segments: Evidence from phonology, acoustics and psychoacoustics", D . L . Horton und J.J. Jenkins ( H r s g . ) , The Perception of Language, Columbus, Ohio, 1971, S. 216-235. Stevens spricht hier von der größeren Kategorialität der eingebetteten Vokale (S. 225 - 231). Z . B . Scholes, "Phoneme Categorization", 1967.
- 31 -
beurteilt. 2 Weitere Untersuchungen zur Vokalidentifikation zeigen deutlich, daß der sprachliche Hintergrund des Sprechers sich in der Aufteilung der gebotenen Stimuli in Phonembereiche ist,
widerspiegelt und daß es z . T . möglich
die unterschiedliche Aufteilung mit bekannten
dialektalen Unterschieden in Verbindung zu bringen. Dies ist bei Plosividentifikationen
nicht der Fall.
Die zitierten Untersuchungen beschäftigen sich fast alle mit dem Problem der Phonemidentifikation. Wenn jedoch die Identität eine Phonems (bzw. einer Phonemkette) vom Kontext fast eindeutig bestimmt ist, die unterschiedlichen
werden
sprachlichen Hintergründe der
Hörer keine perzeptuelle Interferenz ergeben von der Art, 4 wie Scholes sie beschreibt, nämlich die Einstufung des Lautes in verschiedene Phonemkategorien. Das Ergebnis des perzeptorisehen Vorgangs ist
vielmehr die Beurteilung der
vom Sprecher beabsichtigten Phonemkette mit einer mehr oder minder unspezifizierten zusätzlichen Information der 'Fremdheit'. Da wir annehmen müssen, daß der kontextuelle Beitrag zur Phonemidentifikation wesentlich ist,
ist
diese Interpretation des Phänomens 'lautliche Interferenz 1 im perzeptorischen Bereich wahrscheinlich realistischer als die phonemische Interpretation. Ein informeller Versuch des Verfassers mit einer in sprachlicher Hinsicht gänzlich naiven Person zeigte jedoch, daß nicht jeder die Fähigkeit besitzt, den Schritt vom isolierten Stimulus zum Wort zu machen. Der Versuch führte zur totalen Frustration der Versuchsperson, aber nicht zu dem Eingeständnis, daß der Laut in einem Wort vorkommen könnte. 2 Lindner, "Beurteilung vokalartiger Klänge", 1966; Stevens et al., "Cross-language study", 1969? Willis, "Vowel categorization", 1971. 4
Lindner, a.a.O.; Willis, a.a.O.
R.J. Scholes, "Phonemic interference as a perceptual phenomenon", Lang. & S£. 11 (1968), S. 86-1O3. G.A. Miller, "Decision units in the perception of
- 32 Wenn damit der Schwerpunkt vom Problem der Identifikation von Vokalphonemen zur Wahrnehmung der 'Fremdheit 1 (d.h. Wahrnehmung von Unterschieden zwischen der realisierten und der erwarteten Vokalqualität) verschoben wird, so bleibt dennoch das Problem der Grenzen menschlicher -Perzeptionsfähigkeit bestehen. Die modernen meßtechnischen Verfahren gestatten es,
auch geringfügige akustische Wertunterschiede zu
ermitteln, die jedoch unter der Diskriminationsschwelle liegen und deshalb als Signale der 'Fremdheit 1 keine Gültigkeit haben können. Wo jedoch die Unterscheidungsgrenze bei vokalischen Lauten liegt, ist nicht sicher. 2 Flanagan hat mit Hilfe variierter synthetischer Vokalstimuli die Grenze für Frequenzänderungen eines einzelnen Formanten bei 3 bis
5% des Frequenzwertes angesetzt.
Danach wäre eine Änderung des Wertes für den ersten Formanten von z . B . 4OO Hz auf 412-420 Hz oder für den zweiten Formanten von z.B. 20OO Hz auf 2036-2O60 Hz gerade wahrnehmbar. Die Fluktuation zwischen 3% und 5% scheint von der Nähe eines benachbarten Formanten abzuhängen. Unter Berücksichtigung der Ungenauigkeit bei der Bestimmung und Messung von Formanten (-g- unabhängig von der speech", I . R . E . Transactions on Information Theory, IT-S (1962), S. 81-83; vgl. J. Flanagan, Speech Analysis, Synthesis and Perception, Berlin, Heidelberg, New York 1965, S. 234-236. Allerdings wird die Meßgenauigkeit durch die Schwierigkeit, die Formanten genau zu bestimmen (siehe u n t e n ) , wieder aufgehoben, und kleinere Unterschiede können nicht als zuverlässige Darstellung der tatsächlichen Unterschiede betrachtet werden. 2 J.L. Flanagan, "A difference limen for vowel formant frequency", JASA 27 (1955), S. 613-617. Neu abgedr. Readings in Acoustic Phonetics, ed. I. Lehiste, Cambridge, Mass., 1967, 288-292.
- 33 -
Art der Darstellung) liegen die Grenzen des Wahrnehmbaren und des Bestimmbaren nicht weit auseinander. Die Wirkung der gleichzeitigen Veränderung von zwei Formanten ist noch nicht geprüft worden, und der Schwellwert zur Unterscheidung zweier Vokale im konsonantischen Kontext ist
ebenfalls noch zu untersuchen. Bezüglich der Formantamplitude hat Flanagan in demselben Aufsatz berichtet, daß der Schwellwert für die Gesamtintensität eines synthetischen Vokals bei 1,5 dB (den er auch für den ersten Formanten ansetzt, weil dieser üblicherweise der stärkste Formant ist) und für den zweiten Formanten bei 3 dB liege. Vokaluntersuchungen haben gezeigt, daß die gehörte Qualität eines Vokals nicht eindeutig durch die zweidimensionale Angabe des ersten und zweiten Formanten repräsen2 tiert werden kann, sondern daß die Formantwerte a) im Zusammenhang mit der Grundfrequenz (F ) und b) in ihrer relativen Amplitude zueinander betrachtet werden müssen. Dadurch ergibt sich die Möglichkeit eines komplexen Kompensationsprozesses auf der psychoakustisehen Ebene, die quantitativ sehr schwer zu erfassen ist. Die Amplitudenunterschiede zwischen Formanten unterliegen gewissen Gesetzmäßigkeiten, die das Ausmaß der Amplitudenschwankungen verringert. Die Anzahl der Formanten, die für die gehörte Qualität als wichtig betrachtet werden, hängt von der Artikulationsposition ab. Die extreme Dämpfung, die gerundete velare B. Lindblom, "Accuracy and limitations of sonagraph measurements". Proc. 4th Int. Congr. Phon. Sei., Helsinki, The Hague, 1962, S. 188-2O2. FO
4—
muß jedoch als Mindestwert bei Sonagrammen natürlicher Sprache aufgefaßt werden, weil er sich auf deutlich erkennbare Formanten bei Männerstimmen bezieht. 2 Siehe z.B. R.L. Miller, "Auditory tests with synthetic vowels", JASA 25 (1953), S. 114-121; Peterson, "Parameters", 1961. G. Fant, "Analysis and synthesis of speech processes", Manual of Phonetics, S. 2O5-2O6.
- 34 -
Vokale im oberen Spektralbereich erfahren, schließt eine große Beteiligung anderer als der ersten beiden Formanten aus. Bei palatalen Vokalen unterscheidet sich jedoch der dritte Formant in seiner Intensität oft in nur geringem Maße von dem zweiten Formanten. Der Beitrag, der von dem dritten Formanten geleistet wird, 2 bleibt umstritten. Miller konstatierte eine gesteigerte Übereinstimmung unter seinen Hörern bei der Darbietung von synthetischen Vokalstimuli mit drei Formanten gegenüber denen mit zwei Formanten, aber seine Hypothese, daß der zweite und dritte Formant zusammen den zweiten spektralen Höhepunkt darstellen, ließ sich in der sorgfältig kontrollierten Untersuchung von Fujimura nicht bestätigen. Die Studie zeigte jedoch deutlich, daß eine zweidimensionale Darstellung wenigstens bei palatalen Vokalen 4 keine eindeutige Vokalidentifikation erlaubt. Ein weiterer Vokalparameter, der bei Nichtrealisierung des erwarteten Wertes zur Beurteilung von Fremdheit führen könnte, ist der Dauerwert. Bastian und Abramson haben gezeigt, daß im Hinblick auf die Dauer der Vokale Stimuli als entweder lang oder kurz kategorisiert werden können, aber daß unter einem Diskriminationszwang keine Erhöhung der Unterscheidungsfähigkeit an der Phonemgrenze festzustellen war. Vgl. hierzu I. Lehiste und G.E. Peterson, "The Identification of filtered vowels", Phonetica 4 (1959), S. 161-177. 2 Miller, "Auditory tests", 1953. 4
Fujimura, "The second spectral peak", 1967. Vgl. dazu Lehiste und Peterson, op.cit.
J. Bastian und A. S. Abramson, "Identification and discrimination of phonemic vowel duration", JASA 34 (1962), S. 743-744 ( A ) .
- 35 -
In diesem Diskriminationsbereich sind wieder keine experimentellen Ergebnisse vorhanden, die Aufschluß über den geringsten wahrnehmbaren Dauerunterschied von eingebetteten Vokalen geben könnten. Die Schwellwerte für Dauerunterschiede mit anderen Stimuli variieren sehr stark je nach den Bedingungen, die bei der Durchführung der Experimente herrschten. Die Schlußfolgerungen Michons, daß für wiederholt angebotene Stimuli und oft gehörte Stimuli ähnliche Schwellwerte zu er2 warten seien, haben für diese Untersuchung insofern große Bedeutung, als Sprachlaute unweigerlich zu den Lauten gehören, mit denen Menschen, um mit Michon zu sprechen, 'ausgedehnte Erfahrung 1 (prolonged experience) haben. Es ist zunächst von Interesse, daß der erste der von Michon gefundenen zwei Grade der Empfindlichkeit (einmal der Bereich 1OO-2OO msec, und einmal 400-9OO m s e c . ) , innerhalb derer der Schwellwert relativ konstant blieb, sich zum Teil mit den für die linguistisch
definierten
Kurz- und Langvokale zu erwartenden Werten deckt. Zwar sind die sehr niedrigen Schwellwerte von O,8 % und 2 % der Stimulusdauer bei eingebetteten Vokalen unwahrscheinlich, aber die Ergebnisse lassen die Vermutung aufkommen, daß interregionale oder sogar interindividuelle Dauerunterschiede (jeweils relativ zur Sprechgeschwindigkeit) zum Eindruck der Fremdheit beitragen können. C . D . Creelman, "Human discrimination of auditory duration", JASA 34 (1962), S. 582-593; F. Henry, "Discrimination of the duration of sounds", J. Exp. Psych. 38 (1948), S. 734-743; L . H . Stott, "Time-order errors in the discrimination of short tonal durations", J_. Exp. Psych.18 (1935), S. 741-766; J.A. Michon, "Studies in subjective duration", Acta Psychologica 22 (1964), S.441450. 2 Michon, op.cit., S. 443. Michon, op.cit., S. 446.
- 36 -
Eine experimentelle Unterstützung für diese Vermutung bietet das Ergebnis einer Untersuchung der Vokaldauer als unterscheidendes Merkmal im Deutschen. Ähnlich wie Bastian und Abramson bot Heike geschnittene Langvokale in Einsilblern zur Identifikation an. Die Stimuli waren in allen Fällen das Wort mit dem Langvokal aus den Minimalpaaren (As - Aas, alle Aale, um - Ohm). Die Hörer hatten die zusätzliche Aufgabe zu beurteilen, ob das Wort der Norm entsprach. Es gab ein Maximum in den ablehnenden urteilen an der Phonemgrenze. 2 . 2 . 3 . 2 . Konsonantenwahrnehmung Die Konsonantenwahrnehmung unterscheidet sich grundsätzlich von der der Vokale hinsichtlich der Anzahl der auditiven Parameter,' die zur Identifikation benutzt werden. Während sich die Vokalperzeption auf die Dauer des Signals und die Verteilung der Formanten s t ü t z t , kommen bei den Konsonanten weitere Parameter hinzu. Ohne hier auf die Problematik der Konsonantendefinition einzugehen, können folgende akustische Elemente als unabhängige auditive Parameter postuliert werden: 1. Geräuschelement, das sich durch unterschiedliche Verteilung über den spektralen Bereich qualitativ differenzieren läßt; 2. stimmhaftes Element mit oder ohne höhere Formanten; wenn die Dämpfung der Obertöne gering genug ist, daß sich Formanten feststellen lassen, ist das Element weiter differenzierbar; 3. Signalpause; 4. Dauer. Die Identität eines Konsonanten kann von allen
2
Heike,
"Lautdauer", 1970.
Siehe z.B. E. Dieth, Vademekum der Phonetik, Bern 195O, S. 16& f f ; vgl. E. Sievers, Grundzüge der Phonetik, Leipzig 1901, S. 38 ff; D. Abercrombie, Elements of General Phonetics, Edinburgh 1967, S. 38 ff.
- 37 -
oder einigen dieser Elemente abhängen. So ist ein Nasal (ohne zunächst die Artikulationsstelle in Betracht zu ziehen) weitgehend durch die ch.-irakteristische Formantstruktur akustisch d e f i n i e r t , also durch Element 2 der obigen Liste, während ein stimmloser Plosiv aus einer Signalpause und einem Geräuschelement besteht. Die Rolle der Dauer zeigt sich in dem Verhältnis der Signalpause zu dem Geräuschelement. Bei Si-gnalmanipulation zeigt sich, daß eine Verkürzung eines Geräuschelements mit einer entsprechend langen Signalpause davor perzeptorisch einen Frikativ, eine A f f r i k a t e oder einen Plosiv bewirken kann. Durch die oben beschriebenen akustischen Eigenschaften
wird die Artikulationsart der Konsonanten
bestimmt, während die Wahrnehmung der Artikulationsstelle nur zum Teil, und zwar im Falle des Geräuschelements, von diesen Eigenschaften abhängig ist. Ein großer Teil der Information über die Stelle wird durch den Übergang von Konsonant zu Vokal bzw. von G. Heike, Sprachliche Kommunikat ion und linguistische Analyse, Heidelberg 1969, S. 52 f f . Vgl. auch J. Bastian, P.D. Eimas und A.M. Liberman, "Identification and discrimination of a phonemic contrast by silent interval", JASA 33 (1961), S. 842 ( A ) , wo die perzeptorische Funktion der Signalpause deutlich zum Ausdruck kommt. 2 Siehe z . B . J.M. Heinz und K . N . Stevens, "On the properties of voiceless fricative consonants", JASA 33 (1961), S. 589-596. G. Hughes und M. Halle, "Spectral properties of fricative consonants", JASA 28 (1956), S. 303-31O. G.A. Miller und P.F. Nicely, "An analysis of perceptual confusions among some English consonants", JASA 27 (1955), S. 228-352. D.J. Sharf, "Distinctiveness of "defective" fricative sounds", Lang. & Sp_. 11 (1968), S. 38-45. W.S.-Y. Wang, "Transition and release as perceptual cues for final plosives", JSHR 2 (1959),neu abgedr. I. Lehiste, Readings , 1967. Vgl. auch Kozhevnikov und Chistovich, "Speech", 1965, S. 204 ff.
- 38 -
Vokal zu Konsonant vermittelt. Hierzu ist
vor allem
in den Haskins Laboratories eine Vielzahl von Experimenten durchgeführt worden, die zur Theorie der 2 kategoriellen Wahrnehmung in Zusammenhang mit der "motor theory of speech perception" führte. Die Kategorialität in der Wahrnehmung bestimmter Sprachlaute im Gegensatz zu akustisch ähnlich strukturierten nicht-sprachlichen Kontroll-Lauten ließ vermuten, daß es unterschiedliche
Perzeptionsmodi für
sprachliche und nicht-sprachliche
Laute gibt. Die
geringere Kategorialität von Vokalen und Frikativen führte zu einer D i f f e r e n z i e r u n g der sprachlichen Laute als 'enkodierte 1 und 'nicht-enkodierte' Sprach4 laute. Darunter wird eine Unterscheidung solcher Laute, die isoliert durch eine bestimmte akustische Struktur wiedergegeben werden können, von denjenigen verstanden, die nur im Kontext eindeutig erkennbar sind, also keine dem Segment zuzuordnende Struktur haben. Zu der ersten Kategorie gehören Vokale, zu der zweiten die Plosivlaute und Halbvokale. Zwischen den beiden Kategorien liegen jedoch weitere Konsonanten, die eine definierbare, dem Segment zuzuordnende Struktur besitzen, aber dadurch noch nicht eindeutig bestimmt sind. Hierzu gehören Frikative, Nasale und in
Siehe Literatur unter den Namen Cooper, Delattre, Harris, Liberman etc.; eine nahezu vollständige Liste ist bei E. Thürmann, Psycho-akustische Untersuchungen, zu finden. 2 A.M. Liberman, "Speech perception", 1957, enthält einen kurzen Überblick. 4
Liberman et al., "Motor theory", 1962.
A.M. Liberman, F.S. Cooper, D . P . Sharikweiler und M. Studdert-Kennedy, "Perception of the speech code", Psych. Rev. 74 ( 1 9 6 7 ) , S. 431-461. Vgl. A . M . Liberman, "Some characteristics of perception in the speech mode", Perception and its Pi sorde rs 48 (1970),S. 238-254.
- 39 gewisser Weise die Liquiden.
Diese Gruppe scheint
jedoch - zumindest bei normaler Sprechgeschwindigkeit 2 in die Kategorie der 'enkodierten' Sprachlaute zu 3 gehören. Die Entdeckung der dichotischen Wahrnehmung" gab der Vermutung von getrennten Modi für die Wahrnehmung sprachlicher und nicht-sprachlicher Laute eine 4 physiologische Basis. Weitere Untersuchungen zeigten, daß auch die Identifikation von Vokalen im Vergleich zu der von Konsonanten einen Unterschied in der Leistung der beiden Ohren aufwies- eine Tatsache, die die bisherige Unterscheidung zwischen Konsonanten- und VokalWahrnehmung weiter unterstützte. Durch die Feststellung kategorieller Wahrnehmung und die Vermutung getrennter Wahrnehmungsmodi wird noch Siehe z . B . Heinz und Stevens, "Voiceless fricative consonants", 1961; Hughes und Halle, "Fricative consonants" 1956. L. Lisker, "Minimal cues for separating /v/, r, l , j/ in intervocalic position", Word 13 (1957), S. 257-267. A. Malecot, "Acoustic cues for nasal consonants", Language 32 (1956), S. 274-284. K. Nakata, "Synthesis and perception of nasal consonants", JASA 31 (1959), S. 661-666. J.D. O'Connor, L.J. Gerstman, A . M . Liberman, P . C . Delattre und F.S. Cooper, "Acoustic cues for the perception of initial / w , j , r , I / in English", Word 13 (1957), S. 25-43. 2 Siehe z . B . Liberman, "Perception in the speech mode", 1970, S. 4 4 2 . D. Kimura, "Cerebral dominance and perception of verbal stimuli", Canadian Journal of Psychology 15 (1961), S. 166. Ders., "Left-right differences in the perception of melodies", Quart J.Exp. Psych. 16 (1964), S. 355 ff. Ders., "Functional asymmetry of the brain in dichotic listening", Cortex 3 (1967), S. 163 ff. 4 D . P . Shankweiler und M. Studdert-Kennedy, "Identification of consonant and vowels presented to left and right ears", Quart. J_. Exp. Psych. 19 (1967), S. 59 ff.
- 40 -
nichts über den Wahrnehmungsprozeß selbst ausgesagt. Russische Untersuchungen
werfen etwas Licht auf einige
Aspekte dieses Prozesses und verleihen der MotorTheorie eine gewisse Unterstützung; so ist
z.B. nach-
gewiesen worden, daß bei Versuchen, vorgesprochene CV-Silben nachzuahmen, die nachahmende Bewegung der Artikulatoren einsetzt, bevor der Nachahmende wissen kann, welches Phonem der Sprecher artikuliert; während des Artikulationsverlaufs passen sich die Bewegungen der zusätzlich eintreffenden Information an, bis eine Übereinstimmung beim Abschluß der Artikulation zwischen dem vorgesprochenen und dem nachahmend produzierten Phonem besteht. Dieses Verhalten weist auf einen gang hin,
Perzeptionsvor-
in dem akustische Information sequentiell ver-
arbeitet wird. Phonemidentität wird als "logical function 2 of a series of acoustic e f f e c t s " verstanden. Die schrittweise vorgenommene artikulatorische Verfolgung der zelnen 'akustischen Kennzeichen
1
ein-
(acoustic cues) bei
Konsonanten, die nach den Haskins Experimenten kategoriell wahrgenommen werden, ist
für diese Untersuchung
von größerem Interesse als die Tatsache, daß der Perzeptionsprozeß eng mit dem Produktionsprozeß verbunden
ist.
Es bedeutet z . B . , daß der Geräuschanteil der aspirierten Initialplosive der Wortpaare 'Tip-tip 1 und ' P a ß - p u s 1 , wenn auch unbewußt, doch sequentiell e r f a ß t werden und daher die Basis für die Beurteilung einer abweichenden Realisation bilden kann. Zwar ist für mehrere Sprachen die Rolle der Dauer zwischen Verschlußlösung und Stimmtoneinsatz (VOT)
zur Unterscheidung phonemischer Kategorien
Kozhevnikov und Chistovich, Speech , besonders S. 212-231. 2 Kozhevnikov und Chistovich, o p . c i t . , S. 216.
- 41 -
untersucht worden,
aber der Beitrag des Geräusch-
anteils der 'Aspiration' bei dem Übergang zum Vokal bleibt ungeklärt. Gerade dieser Teil des Signals könnte aufgrund seiner frikativähnlichen Struktur zu einer Differenzierung verschiedener Realisationen einer Phonemkategorie führen. 2.2.3.3.
Schlußfolgerungen
Die Konsequenzen der oben erörterten Fragen der Vokal- und Konsonantenperzeption lassen sich wie folgt zusammenfassen: a) Sofern eine nicht-kategorielle Wahrnehmung der Sprachlaute angenommen wird, ist in betonten Silben jede Abweichung von einer Norm, die es zu ermitteln gilt, als möglicher Hinweis auf das Vorhandensein eines fremden Akzents anzusehen, b) Wenn ein Laut kategoriell wahrgenommen wird, kann er nur dann als Träger fremden Akzents betrachtet werden, wenn seine Realisationsform Merkmale einer anderen Phonemkategorie besitzt bzw. wenn diese Merkmale Grenzwerte haben. Dabei muß die phonemische Interpretation des Lautes trotz der fremden Merkmale gewährleistet sein. Die Vokale müssen als Hauptträger fremden Akzents betrachtet werden, weil sie am wenigsten kategorisch perzipiert werden und im Verhältnis zu den Konsonanten den zeitlich größeren Anteil des Sprachsignals ausmachen. Dies entspricht dem naiven Eindruck jedes Beobachters und ist experimentell schon in Ansätzen beL. Lisker und A.S. Abramson, "The voicing dimension: Some experiments in comparative phonetics", Proc.6th Int. Congr. Phon. Sei., S. 563-567. Dieselben, "Discriminability along the voicing continuum: Cross-language tests", Proc.eth Int. Congr. Phon. Sei., S. 569-573. Vgl. A.M. Liberman, P.C. Delattre und F.S. Cooper, "Some cues for the distinction between voicedand voiceless in initial position", Lang. & Sp_. 1 (1958), S. 153-167. Die Ergebnisse einer Fortsetzung der Untersuchungen von
- 42 -
stätigt worden.
Aber auch die Konsonanten tragen
unter Umständen zum Eindruck des fremden Akzents bei. Dies kann im Sinne des Punktes a) oben bei Frikativen oder Liquiden u . a . geschehen, bei denen die Signaldauer eine Differenzierung der Segmentqualität zul ä ß t . Beispiele h i e r f ü r lassen sich für bestimmte regionale Varianten einer Sprache angeben, wie etwa die unterschiedlichen Realisationen der post-alveolaren und palatalen Frikative /J/ und / / im Deutschen, die sich im Rheinland in einem Zusammenfall· der beiden Laute zu einem prä-palatalen Frikativ [ c + ]» un
1 1
.4-
•
•i
.
i
1
[i
1
1
n
SpterW.-p
B
Ke
RP
La
Te
li Bö
HH
Mü
Ot
K
Abb. 7a: Indexwerte nach den englischen Hörerurteilen für die Wörter 'tip,pus,bush 1 ( t , p , b ) und 'Tip,Paß,Busch* ( T , P , B ) nach regionaler und nationaler Herkunft der Sprecher gruppiert. Index . 1
.9 .i
.4-
1
•2
In/oft: CA— --JL.-.
t
p RP
b
T
P HH
B
n
T
P
B
K
Abb. 7b: Mittelwerte der Indexwerte nach den englischen Hörerurteilen für die Wörter 'tip,pus,bush 1 (t, p, b) von 2 RP-Sprechern gesprochen, sowie für die Wörter 'Tip, Paß, Busch 1 (T, P, B), von jeweils 3 Kölner und Hamburger Sprechern gesprochen.
- 74 -
Abb. 8 (a-c) zeigt einen weiteren Aspekt der englischen Hörtestergebnisse. Im linken Teil der Abbildungen sind die einzelnen Sprecher nach Indexwert geordnet, aber nach Herkunft bezeichnet (einschließlich der Sprecher mit regional englischem Akzent ( R E ) ) . Index 1,0 a) TijD (eiiglische Hörer) O,8 0,6 0,4
0,2
1
0 RP
RPHH
RE
R E H H H H
K
K
K
RP
RE
RP
RE
RP
RE
HH
K
Index 1,0
0,8
b
Pu s (e ngli sehe Hörer)
0,6 0,4 0,2 0 RP
HH
RE
RP
RE
HH
K
HH
K
K
HH
K
Index 1,0
i
O,8
c) Bush (englische Hörer)
0,6 0,4
-
0,2 0 RP
RP
RE
HH
K
K
HH
HH
K
RE
HH
K
- 75 -
Dadurch wird ersichtlich, wie stark die Differenzierung der Sprecher nach Herkunft möglich war. Rechts in den Abbildungen stehen die Gruppenmittelwerte. Die Größe des Unterschiedes in den Mittelwerten steht in einem deutlichen Zusammenhang mit dem Grad der Überlappung der Sprechergruppen
im linken Teil. Bei 'Tip-
tip' sind RP-, HH- und K-Sprecher getrennt, aber die HH-Gruppe wird von den RE-Sprechern gespalten. Bei 'Paß-pus 1 sind die Werte für die HH-Sprecher weiter gestreut und überlappen sowohl die Kölner als auch die RP-Gruppe. Bei 'Busch-bush 1 ist
die Verzahnung der
Kölner und Hamburger Werte vollkommen; allerdings sind die RP-Sprecher deutlich getrennt. Dafür ist
jedoch
eine regionale englische Realisation als unverkennbar fremd eingestuft worden. Im Zusammenhang mit der Interpretation der akustischen Daten stellt diese Einstufung einen interessanten Fall dar.
Abb. 9 a , b geben exempla-
risch dieselbe Information über die Hamburger und Kölner (PH) Hörergruppen. Dort ist
keine Differenzierung nach
der tatsächlichen Herkunft der Sprecher zu erkennen. Tip
Index 1,0
(Hamburger Hörer)
0,8 0,6
0,4· 0,2· O HH
RP
RP
K
K
HH
HH
RE
RE
K
Abb. 9a: Akzeptabilität nach Sprecherherkunft, Hörer.
RP
RE
deutsche
HH
K
- 76 -
Inde
Tip
, ·
0,8
(Kölner (PH) Hörer)
-
O,6 ·
0,4. 0,2 0 HH
RE
RE
RP
RP
HH
K
K
1
-
HH
K
RP
RE
HH
Abb. 9b: Akzeptabilitat nach Sprecherherkunft, deutsche Hörer. Bislang sind die von den Deutschen gesprochenen englischen Wörter nicht in Betracht gezogen worden. Regionale Unterschiede (siehe Abb.lO) kommen in den Urteilen der englischen Hörer nicht zum Ausdruck, aber auch ihr Vorhandensein würde die Schwierigkeiten einer Interpretation nicht wesentlich mindern, weil Faktoren wie außerschulische Erfahrung mit der Sprache, der E i n f l u ß des Lehrers usw., die von der geographischen Herkunft weitgehend unabhängig und schwer überprüfbar sind, die Aussprache stark beeinflussen. Eine überregionale Regelmäßigkeit ist der bessere Indexwert des englischen Wortes gegenüber dem vom selben Sprecher gesprochenen deutschen Wort. Dies ist in 15 der 18 von Deutschen gesprochenen deutsch-englischen Wortpaarender Fall. Die Ausnahmen sind die Sprecher Ke (in zwei Fällen, nämlich 'Tip-tip 1 und 1 Busch-bush 1 ) und Te (in 'Paß-pus 1 , wo das deutsche Wort ohnehin sehr hoch eingestuft wurde); bei beiden handelt es sich um Hamburger. Dieser Sachverhalt spiegelt sich mit wenigen Aus-
K
- 77 -
I n de x 1,0 '
Hamburger Sprecher
0, 8 ' 0,6
0,4 · 0,2 ' de d e Tip-tip
d e
de
de d e Paß-pus
de
de de Busch-bush
Kölner Sprecher
Inde:X 1,0 ' O,8 ' O,6 ' 0,4
'
0,2
·
O
d e de Tip-tip
l
de
de
d e d e Paß-pus
d e
d e de Busch-bush
Abb. 10: Einstufung des von den deutschen Sprechern gesprochenen deutschen (d) und englischen (e) Wortes durch die englischen Hörer. nahmen auch in den Urteilen der deutschen Hörer über die Kölner Sprecher wider (Abb. 11 a-h). Der durchschnittliche Unterschied im Index zwischen dem englischen und deutschen Wort beträgt O , 3 für die deutschen Hörer und 0,28 für die englischen Hörer. Allerdings waren die Urteile der deutschen Hörer nicht so einheitlich wie die der Engländer; aus den 36 beurteilten Wortpaaren ( 3 x 3 Wortpaare
4 Gruppen) wurden
- 78 -
a) Hambur•ger Hörer - H amburger Sprecher
Inde 1,0 0,8' 0,6' 0,4 0,2
1 |
0
de
de Tip-tip
Inde x 1,0
b)
de
de
de d e Pa3-pus
de de d e Busch-bush
Hamburger Hör«5r - Kölner Sprecher
O,8 0,6
0,4
0,2'
1 de
d e Tip-tip
Index 1,0]
c)
d e
d e
I
de de Paß-pus
de
de de Busch-bush
- Hamburger Sprecher
PH Hörer
0,8 0,6
0,4^ 0,2 O
de
Abb.
de Tip-tip
11 a-c:
d e
d e
d e d e Paß-pus
d e
d e d e Busch-bush
Einstufung des von den deutschen Sprechern gesprochenen deutschen (d) und englischen (e) Wortes durch die deutschen Hörer.
- 79 Inde;x 1,0
d)
Kölner Sprecher
PH Hörer
0,8 0,6 0,4 0,2
1 de
d e d e Tip-tip
d e
d e Paß-pus
d e
d e
d e d e Busch-bush
Index
1,0 e)
Ul Hörer
Hamburger Sprecher
0,8 0,6 0,4
0,2 O de
de Tip-tip
de
d e
d e Paß-pus
d e
de d e de Busch-bush
Index 1,0" f)
UI Hörer
Kölner Sprecher
O,8 0,6 0,4 0,2 O
de
de Tip-tip
de
Abb. 11 d-f: Einstufung
de
d e Paß-pus
de
d e d e de Busch-bush
des von den deutschen Sprechern
gesprochenen deutschen (d) und englischen (e) Wortes durch die deutschen Hörer.
- 80 -
?6"| g)
0,8 '
Q u i n t a Hörer
Hamburger Sprecher
0,6
0,4· 0,2
d e
Inde:X 1,0 0,8
'
0,6
·
d e de Tip-tip
h) Quinta Hörer
de
-
d e de Paß-pus
de de de Busch-bush
Kölner Sprecher
0,4 · 0,2 O
de
de d Tip-tip
d e
d e
de d e Paß-pus
de de Busch-bush
Abb. 11 g+h: Einstufung des von den deutschen Sprechern gesprochenen deutschen (d) und englischen (e) Wortes durch die deutschen Hörer. 5 umgekehrt eingestuft bzw. das englische Wort bekam denselben Index wie das deutsche Wort
(drei dieser Fälle
waren bei der Hamburger Hörergruppe zu verzeichnen). Verglichen mit der Beurteilung der Hamburger Sprecher sind diese Ergebnisse ein deutlicher Hinweis dafür, daß die Kölner Sprecher in ihrer Realisierung des englischen Wortes dem näher gekommen sind, was Engländer und Deutsche für Englisch halten. Bei den Hamburger Sprechern dagegen (die in zwei Fällen schon bei den englischen Hörern umgekehrt eingestuft worden waren) ist
in 20 der 36
- 81 Wortpaare das deutsche Wort höher eingestuft worden. Auf der einen Seite weist diese Tatsache darauf hin,
daß die Hamburger Sprecher bei der Realisierung
des englischen Wortes in der Regel nicht in der Lage waren, ihre Artikulation so zu modifizieren, daß die Hörer einen Unterschied zum deutschen Wort festzustellen vermochten. Angesichts der relativ hohen Indexwer te,
die die von Hamburgern gesprochenen deutschen Wör-
ter erhielten, ist auf der anderen Seite diese mangelnde Differenzierungsfähigkeit verständlich. 4.1.2.0. Urteilssicherheit Die Urteilssicherheitswerte für jeden Stimulus und jede Hörergruppe wurden nach der in 3.2.2.1. beschriebenen Methode errechnet (siehe Tab. 5 ) . Die Mittelwerte für die einzelnen Tests mit Variationsbreite und Standardabweichung sind in Tab. 4 dargestellt.
'Tip-tip' 'Paß-pus' 'Busch-bush 1 U-Mittelwert Tab. 4
U V S U V S U V S
EFL 0,85 0,20 O,O6 O, 80 0,26 0,O6 0,82
UCL 0,85 0, 19 O,O7 O, 80 0,21 0,O6 O, 80 0,20 0,06 0,82
PH 0,70 0,49 0, 15 0,67 0,55 0,14 0,57 0,50 0,14 0,64
UI 0,62 0,44 0, 13 0,56 0,35 0,11 0,59 O, 50 0, 15 0,59
Qui. 0,55 0,47 0, 13 0,60 0,50 0,12 0,57 O,4O O, 10 0,57
HH 0,59 0,57 O, 16 0,68 0,50 0,14 0,56 O,66 0,16 0,61
Urteilssicherheitsmittelwerte (U) der einzelnen Hörtests mit Variationsbreite (V) und Standardabweichung ( S ) .
Die wesentlich höhere Urteilssicherheit der englischen Gruppen ist
sofort ersichtlich. Streng gesehen
können die Werte der englischen und deutschen Gruppen aufgrund der unterschiedlichen Hörtestaufgaben nicht direkt verglichen werden. Da jedoch die Möglichkeit, un-
- 82 -
CJ CO
π)
3 ΓΟ CD ^«
C
02
Ρ
-Η
3
σ
(0 Cw ft
•H
Ευ co 3
CQ Η
D
co
(0 Γd m Q
K
νο
^* νο νο οο ιη in n
•r1
EH
ΓΟ
ΓΟ
I-
CN s
I-
ιη
ΓΟ
i-H
00
^*
Γ-
CN
νο
CN
rH Ο^
CN
ο Ο νο
Γ-
VD
in vo in
CO I^Q
·5ί
^· *t σι « ^ ιη
ι-Η
ω
rH
οο
Ο Ο Ο Γ-
ΓVO
Ο
^t
rH
m
ΓΓ-
Is-
rH
00
Γ-
CN ΓΟ
VD in
VD rH
ΟΟ ΓΟs
VD
I-
ιη
00
^
•
VO
VO
rH
VD Γ-
νο Γ~
νο νο
CQ • Ν
rH
σ>
νο
in
rH
Φ
-Ρ Μ
U
CO
C
8,α 3
3 Ο
j υ
CQ
ω
ΓΟ CO
β (0 Cu
00 00
CO
α
Ο
•Η
EH
O
i-H 00
00 ΟΟ
m
CN
ΓΟ οο
ΓΟ
CN
00
Γ-
rH
00
Γ-
Γ-
Γ-
00
VD
ιη
Ο σ. νο σι •^ί· co t— Γ—· Ι^ σ>
σι
Γ-
O ro CN
ΓΟ
CM
Ο ω ο οο ΓΟ Γ- r- co ω οο
Γ00
σ\ σ· σ> σι οο ^
Γ-
Γ-
00 Γ-
CN 00
VD 00
Ο νο
00 VD
ΓΓ-
Γ~ CO
CN Γ-
η ΓΟ
VO ΟΟ
ΓIs-
Γ-
Γ-
Γ-
ω
ο
ΓΟ
Γ-
ΓΟ
00 00
ιη ΟΟ
ΓΟ
οο
οο
σ·
ω ο Ο νΟ
υ (Ο
CO
•Η Γ-Ι
ίτ>
C W
_1
W
3 ΓCO ΟΟ β
£ D
•H
EH
oo ω νο ιη ^ rH σ- rH r- Γ- σ> οο ω Γ- r- οο
Γ-Ι
CN
CO
Γ-
Ο CO Γ-
1^
00
r-
νΟ
Γ-Ι
οο ω
Ο νο
00
Ο
ι
Ι
ι
ι
ι
Ι
ι
νΟ
*Η
η
10
φ Ό φ Φ
CD Ό ίΟ
Κ) φ J ΕΗ
Ι
φ Ό
φ Ό φ Ό :3 Ρ -Ρ Φ Ο ΕΗ CQ g =3 S 0 0
φ Ό
IX
CO
CQ CO
Φ
-μ in
ιϋ
ΕΗ
- 83 -
ter 5 Kategorien zu wählen, wie die englischen Hörer sie hatten, bei gleichbleibender Unsicherheit zu einer größeren Streuung der urteile führen würde, sind die hier gezeigten höheren Werte der Engländer als echte Indikation einer höheren Urteilssicherheit anzusehen. Diese Interpretation wird durch die kleinere Variationsbreite und kleinere Standardabweichung weiter gefestigt. Solch eine höhere Sicherheit ist eventuell bei der Beurteilung von Abweichungen von der Muttersprache gegenüber einer Einstufung in zwei Kategorien Muttersprache und Fremdsprache zu erwarten. Das Verhältnis der Urteilssicherheitswerte zu den Indexwerten wird in Abb. 12 a-c dargestellt. Wie erwartet, ist die Urteilssicherheit hoch für die extrem hohen und niedrigen Indexwerte und, dies jedoch nur bei den deutschen Tests, verhältnismäßig niedrig für die mittleren Indexwerte. Bei den englischen Tests ist dagegen keine wesentlich niedrigere Urteilssicherheit für die mittleren Indexwerte im Verhältnis zu den hohen und niedrigen Indexwerten zu verzeichnen, was auf eine hohe interindividuelle Übereinstimmung im Grad der Fremdheit hinweist. Die Frage, die in 3.2.2.1. hinsichtlich einer dritten Kategorie neben 'englisch' und 'fremd' aufgeworfen wurde, läßt sich anhand dieser Daten nicht eindeutig beantworten. Zwar treten bei der Gruppe UCL in den Tests 'Tip-tip 1 und 'Paß-pus' Spitzen in der Urteilssicherheitskurve (ca. 0 , 9 ) bei Indexwerten von O,75-0,8 a u f , die auf eine sichere Einstufung der Produktion der Sprecher S und H (und bei 'Tip-tip 1 auch des Sprechers Ot ( e ) ) als 'regional gefärbtes Englisch 1 schließen läßt, aber diese Spitzen erscheinen bei der Gruppe EFL in 'Tip-tip 1 nicht. Die Kategorie 'regionales Englisch 1 erhielt den Wert 0 , 7 5 .
- 84 ,
•3.
Abb. 12a: Kurven der Index- und Urteilssicherheitswerte für 'Tip-tip 1 . Angesichts der extrem hohen Urteilssicherheit entlang der ganzen Skala wäre es übereilt, diese Erscheinung als Zeichen der Fähigkeit von Engländern, zwischen 'regional 1 und 'fremd' zu unterscheiden, zu sehen. In Anbetracht der Tatsache, daß eine regionale Realisation von 'bush' als unverkennbar fremd angesehen wurde, wäre dies in der Tat überstürzt.
- 85 -
,
pus - UCL
4.0·
Paß-pus - UI
.3.
Paß-pus - HH
.9
.6 ID .S
Paß-pus - Quinta .6
.4·
Paß-pus - PH
Abb. 12b: Kurven der Index- und Urteilssicherheitswerte für 'Paß-pus'. Die extrem hohen Spitzen in der Urteilssicherheit bei der Gruppe UCL sind aber nicht den Spitzen bei den deutschen Gruppen gleichzusetzen, die bei mittlerer Urteilssicherheit und Indexwerten um O,4 - 0,6 vorkommen. Diese Spitzen, die den normalen U-Verlauf der Kurve stören, sind auf ein ganz bestimmtes Phänomen zurück-
- 86 -
bush - UCL
Busch-bush - PH
bush - EFL
Busch-busn
Busch-busn - HH
. Busch-bush - Quinta
Abb. 12c: Kurven der Index- und Urteilssi ehe rhe it swerte für 'Busch-bush 1 . zuführen. Wenn ein Stimulus bei fünfmaliger Darbietung zwar von den einzelnen Hörern mit verhältnismäßig hoher Sicherheit, aber nicht von allen Hörern einer Gruppe in dieselbe Kategorie eingestuft wird, so wird die Urteilssicherheit hoch sein, aber die gegensätzlichen Einstufungen werden sich zu einem Indexwert um 0,5 aus-
- 87 -
gleichen. Solche extremen Fälle "kommen selbstverständlich nicht vor, aber gewisse Abweichungen von dem zu erwartenden U-Verlauf treten in den Mittelwerten der Einzelurteilssicherheiten a u f . Wenn die Urteilssicherheit als Gruppensicherheit statt als Mittelwert der Hörersicherheitswerte errechnet worden wäre, träten solche Maxima und Minima nicht a u f , aber damit ginge auch ein Teil der enthaltenen Information verloren. 4.1.3.O.
Signifikanztest
Die Höhe der Urteilssicherheitswerte (siehe Tab. 5, S. 82 oben) sowie die Indexwertstreuung lassen vermuten, daß die Reaktion der Hörer auf die Stimuli nicht zufällig gewesen ist.
Eine statistische Prüfung der Testergeb-
nisse vor Anwendung des Korrelationsverfahrens bietet jedoch eine letzte Sicherheit und ermöglicht eine 'Reinigung 1 der Daten. Die Ausschaltung derjenigen Sprecher, die von einer Gruppe z u f ä l l i g beurteilt wurden ( d . h . bei denen die Abweichung von der GleichVerteilung nicht signifikant i s t ) , erhöht die Wahrscheinlichkeit, daß die Wichtung der akustischen Parameter in den multiplen Korrelationen ein unverzerrtes Bild der relativen Bedeutung dieser Parameter ergibt. 2 Ein geeigneter Test der Signifikanz ist der X -Test, wobei eine Gleichverteilung der Urteile als erwartete Verteilung angenommen wird, um den Grad der Abweichung der tatsächlichen Verteilung zu errechnen. Die Formel lautet
wobei x. die Anzahl der Urteile in einer Kategorie, n die Zahl der gefällten Urteile und k die Anzahl der Kategorien ist.
Die Anzahl der Freiheitsgrade ist
immer (k-1).
- 88 -
So ist bei einer englischen Gruppe mit 10 Hörern (= 5O Urteile, n = 5O) und einer Urteilsverteilung von x, = l, x_ = 3, über 5 Kategorien (x, bis . = 32, x = 7 der Chi -Quadratwert x = 7, IQ) 10
10
81 + 49 + 9 + 484 + 9 = 63,2 10
10 =
0,1%
- IQ) 10
- IQ) 10
sig.
Bei den Tests mit deutschen Hörern hätte die Annahme von drei Kategorien (englisch,
unsicher, deutsch)
ausschließlich zu signifikanten Werten geführt, weil die Anzahl der Urteile in der zweiten Kategorie nur 11,4% aller Urteile bekam (9,9% bei 'Tip-tip', 10,3% bei 'Paßpus 1 und 13,9% bei
'Busch-bush'). Auch bei
15% unsiche-
ren Urteilen und Gleichverteilung der restlichen Urteile weicht die Verteilung auf der 1,0%-Ebene signifikant von einer Gleichverteilung ab. Es wurden deshalb zwei Kategorien angenommen, und n wurde für
jeden Sprecher nach
der Anzahl der Urteile in den Kategorien 'deutsch 1 und 'englisch 1 neu berechnet. Die nicht-signifikant beurteilten Sprecher sind in Tab. 6 aufgeführt.
UCL EFL
HH
'Tip-tip 1 _
'Paß-pus 1 L a ( d ) , Bo(e)
Busch-bush 1 La(d) , Te(e)
— L a ( e ) , T e ( d ) L a ( e ) , Bo(d)
— S,Te(e) ,Bo(e) ,Ot(d)
PH
— -
UI
Quinta L a ( e )
La(e)
1
L a ( d ) , T e ( e ) , B o ( e ) , M ü ( e ) ,0t (d)
P,Ke(e) ,La(e) S,Ke(d) ,La(d) ,Te(e) ,Ot(d) P
Ke (d) , L a ( d )
Tab. 6: Nicht-signifikant beurteilte Sprecher. Um die Stelle, die diese Sprecher auf der Indexskala der jeweiligen Gruppe einnahmen, deutlich zu machen,
sind
- 89 -
die entsprechenden Punkte auf den Abbildungen 12 a-c mit einem Kreis versehen. In der Regel sind Sprecher mit einem mittleren Indexwert und einem verhältnismäßig niedrigen Urteilssicherheitswert betroffen. Daß diese Erscheinung nicht die Bedingung für Nicht-Signifikanz, sondern nur eine häufige Begleiterscheinung ist, zeigen die beiden Tests 'Paß-pus 1 und 'Busch-bush 1 bei der Gruppe UCL. Dort haben gegensätzliche Urteile bei verhältnismäßig hoher Urteilssicherheit einen gleichverteilungsnahen Zustand hervorgerufen. 4 . 2 . 0 . O . Auswertung der akustischen Daten 4.2.1.0. Formantdaten Die F,- und F~-Daten sind in Tab. 7 a u f g e f ü h r t . Zunächst ist es von Interesse, welche Unterschiede zwischen den Sprechern unterschiedlicher Herkunft bestehen, und zwar a) zwischen den deutschen und den von Engländern gesprochenen englischen Wörtern, b) zwischen den Hamburger und Kölner Realisationen und c) zwischen den englischen und der deutschen Sprecher. In Abb. 13 eine Formantkarte eingetragen; die
der deutschen Wörter deutschen Wörtern sind alle Werte in Eintragungen sind
nach der Herkunft des Sprechers gekennzeichnet. 4.2.1.1. Herkunftsgebundene Unterschiede Innerhalb des Streubereichs eines jeden Wortpaares zeichnet sich auch bei dieser kleinen Anzahl von Realisationen eine gewisse Tendenz zu Unterschieden bei den verschiedenen Herkunftsgruppen ab. Bei der verschiedenen sprachlichen Zugehörigkeit der betroffenen Gruppen mag dies eventuell zu erwarten sein; in der Tat ist aber die Tendenz zu Unterschieden bei ' T i p - t i p ' für die beiden regionalen deutschen Gruppen in demselben Maße zu beobachten
- 90 -
σ,
(^ en σι Ο r-H
vO vO CO
rο Ο i-H
vO
CN
CN
ο
rH
vD
CO
ro
σ- r»
ro
VD rH
VO
VO
p^ i-H
r- ro
CM 0 ω [^ 0 r~- Ο Ο Ο rH CM
Ο ro
-1
I-H
u ίο 3
r- in in r~. in σι r*· CN
CM
in ro
CN
ro
ro
CM
ι-Η
rH
rH
^t V
^*
ro
CN
CM
CM
CM
CM
CM
^J*
vD
*3*
CO
ι-Η CO
ω
^t
*3*
m
rH
03
i-H
Ο
^
00
03 00
CM
0
CN . r» f*^ in ^ "*
i-H
«* 00
ro
ro "*
ΙΟ
CN VO
r- ro Ο ιη σ>
rH
rH
i-H
i-l
rH
Ο
Ο
ΓCN
ΓΟ CN
^ Ο
i-H
i-H
rH rH
^ 00 CN
rH
rH
rH
i-H
^Jf
cn Ο in 03 i-H ^f σι σ> CO ^ r- ω 03
VD
ro
vO vO
VD
0
VO
r-l
^t
rH
CN
σ> Ο Ό in \φ in
ro
in in ^* in σι σι Ο σ.
ΊΟ
Ο
ro
ro
I-l
^ 00 ro i-H
(d
A i-H fa
PS
« α
•rl
-P
r^
ro
σ. m in
ro fa CN
vo
Ο
*
σ. Ο f·^ in in σ>
1—1
σ. en ω in ro CN rH CM ^ in •5t ΓΟ •5t ιη ro ro in ro •tf ^ i-H rH -1 i-H rH ^ rH i-H i-H rH ro in ro
r> r~ r^
*t r-)
•5t r-4
r-l
i-H
CN
CM
rH
CN co ο o> m r- oo