189 51 48MB
French Pages 478 [496] Year 1971
JANUA LINGUARUM STUDIA MEMORIAE NICOLAI VAN WIJK DEDICATA edenda curat C.H. VAN
SCHOONEVELD
Indiana University
Series Maior,
42
PHONÉTIQUE GÉNÉRALE ET ROMANE ÉTUDES EN ALLEMAND, ANGLAIS, ESPAGNOL ET FRANÇAIS
par
BERTIL MALMBERG
1971
MOUTON THE H A G U E • PARIS
© Copyright 1971 in The Netherlands. Mouton & Co. N.V., Publishers, The Hague. No part of this book may be translated or reproduced in any form, by print, photoprint, microfilm, or any other means, without written permission from the publishers.
LIBRARY OF CONGRESS CATALOG CARD NUMBER 75-141182
Printed in the Netherlands by Mouton & Co., Printers, The Hague.
AVERTISSEMENT
Les articles publiés dans ce recueil ont paru la première fois dans les revues citées ci-dessous: En exprimant notre reconnaissance nous faisons mention de la bienveillante permission des éditeurs à reprendre ces articles. 1. Die "Grundzüge" von N. S. Trubetzkoy, Indogermanische Forschungen LVIII, 1941, (Berlin: de Gruyter & Co.), 266-273. 2. La phonétique, science de sons et de valeurs, Revue de l'Université de Bruxelles, (Bruxelles) juillet-septembre 1963, 1-19. 3. Analyse linguistique et interprétation auditive, Journal français d'oto-rhino-laryngologie XI: 6 1962 (Paris: Société française de Phoniatrie), 807-819. 4. Voyelles longues et voyelles brèves, Studia lingüistica 3, 1949 (Lund: Gleerup), 39-61. 5. Opposition et identité, Journal français d'oto-rhino-laryngologie I, 1959 (Paris: Société française de Phoniatrie), 65-83. 6. Le problème du classement des sons du langage et quelques questions connexes, Studia lingüistica 6, 1952 (Lund: Gleerup), 1-56. 7. Unhörbare Laute? Eine Erwiderung an J. Forchhammer, Studia lingüistica 8, 1954, (Lund: Gleerup). 8. The phonetic Basis for Syllable Division, Studia lingüistica 9, 1955 (Lund: Gleerup), 80-87. 9. Remarks on a Recent Contribution to the Problem of the Syllable, Studia lingüistica 15, 1961 (Lund: Gleerup), 1-9. 10. Juncture and Syllable Division, In Honor of Daniel Jones, 1964, (London: Longmans), 116-119. 11. Voyelle, consonne, syllable, mot, Miscelánea Homenaja a André Martinet "Estructuralismo e Historia" III (Madrid: Gredos), 1-17. 12. Minimal Systems, Potential Distinctions and Primitive Structures, Proceedings of the Ninth International Congress of Linguists, Cambridge, Mass., 1962, 1964 (the Hague: Mouton), 78-84. 13. Couches primitives de structure phonologique, Phonetica XI, 1964 (Basel, New York : S. Karger), 221-227. 14. Stabilité et instabilité des structures phonologiques, Phonétique et Phonation, 1964 (Paris: Masson & Cie), 207-231. 15. Stability and Instability of Syllabic Structures, Proceedings of the Fifth International Congress of Phonetic Sciences, Munster 1964,1965 (Basel, New York: S. Karger), 403-408. 16. Análisis estructural y análisis instrumental de los sonidos del lenguaje: forma y substancia, Proceedings of the Fourth International Congress of Phonetic Sciences, Helsinki 1961 1962 (The Hague: Mouton), 456-475. 17. Bemerkungen zum schwedischen Wordakzent, Zeitschrift für Phonetik XII, 1959 (Berlin: Akademie Verlag), 193-207. 18. A Note on a Footnote (on Swedish Word Accent), Studia linguisticaXVUl, 1964 (Lund: Gleerup), 118-121. 19. Analyse instrumentale et structurale des faits d'accents, Proceedings of the Fourth International Congress of Phonetic Sciences, Helsinki, 1961,1962 (The Hague: Mouton).
4
AVERTISSEMENT
20. Analyse des faits prosodiques — problèmes et méthodes, Cahiers de linguistique Théoretique et appliquée 3,1966 (Bucharest), 99-107. 21. Levels of Abstraction in Phonetic and Phonemic Analysis, Phonetica VIII, 1962 (Basel, New York: S. Karger), 220-242. 22. Distinctive Features of Swedish Vowels: Some Instrumental and Structural Data, For Roman Jakobson, 1956 (The Hague: Mouton), 316-321. 23. Les voyelles suédoises et la notion de "fermeture vocalique", Studia linguistica XIII, 1959 (Lund: Gleerup), 49-61. 24. Ferdinand de Saussure et la phonétique moderne, Cahiers Ferdinand de Saussure XII, 1959 (Geneve: Droz), 9-28. 25. Terminologisches und Begriffliches zum Methodik der phonematischen Geschreibung, Zeitschrift für Phonetik XVI, 1963 (Berlin: Akademie Verlag), 133-135. 26. La notion de force et les changements phonétiques, Studia linguistica XVI, 1962 (Lund : Gleerup), 131-178. 27. Changements de perspectives en phonétique, Conférence faite à l'Université Libre de Bruxelles, le 26 janvier, 1966. II 28. La structure phonétique de quelque langues romanes, Orbis XI, 1, 1962 (Louvain: Centre Internationale de Dialectologie), 131-178. 29. Gémination, force et structure syllabiques en latin et en roman, Orbis litterarum, suppl. III: Etudes dédiées à Andreas Blinkenberg, 1953 (Louvain: Centre Internationale de Dialectologie), 106-112. 30. Note sur l'articulation du [s] et le traitement de l'affriquée [ts] en roman occidental, Omagiu lui Iorgu Iordan (Bucharest), 543-545. 31. Sur quelques faits de différenciation vocalique, Notes de grammaire historique française 1945 (Lund: Gleerup), 33-58. 32. Le passage en an en francien et en picard, extrait de l'éd. précitée de 1940 et de mes, Notes de grammaire historique française, 1945 (Lund: Gleerup), 27-32, 55-58. 33. Le développement lectio>laisse au point de vue phonétique, Volkstum und Kulture der Romanen XIV, 3-4, 1942 (Hamburg: Freidrichsen/de Gruyter & Co.), 236-243. 34. La structure syllabique de l'espagnol, Boletim de filologica IX, 1949, (Lisboa: Centro de Estudos Filológicos), 99-120. 35. Occlusion et spirance dans le système consonantique de l'espagnol, Mélanges de philologia romane offerts à Karl Michaelsson 1952 (Göteborg), 356-365. 36. Phonèmes labio-vélaires en espagnol? Phonetica VII, 1961 (Basel, New York: S. Karger), 85-94. 37. Tradición hispánica e influencia indigena el la fonética hispanoamerica, Presente y futuro de la langua española, tomo II, 1964 (Madrid : Ediciones Cultura Hispanica), 227-243. 38. Notas sobre la fonética del espagnol en el Paraguay, Vetenskaps-Societetens i Lund ársbok, 1947, 3-18. 39. Obtativo y sujuntivo: a propósito de dos grefías, Revista de filolcgia española XLVIII, 1965, (Madrid: Consejo Superior de Investigaciones Científicas), 185-187. 40. A propos du che argentin: Note sur la dite étymologie phonétique, Studia linguistica XVIII, 1, 1965 (Lund: Gleerop), 47-54. 41. Le passage castillan f h — perte d'un trait dedonant, Cercetari de linguistica, Mélanges offerts à E. Petrovici, 1958 (Bucharest), 337-343. 42. A propos d'un fait de phonétique historique castillane, Lingua XI, 1962 (Amsterdam: North Holland Publishing Company), 276-279. 43. Note sur le [z] argentin, Mélanges de linguistique romane offerts à Maurice Delbouille I, 1964 (Gembloux: Duculot), 417-420. 44. Esp. chato, nono, ñamar et questions connexes, Cahiers Ferdinand de Saussure 23,1966 (Genève: Droz), 89-95. 45. Fenómenos de juntura en castellano, Lengua, literatura, folklore, 1967 (Santiago: Univ. de Chile), 285-289.
TABLE DES MATIÈRES
I. PHONÉTIQUE GÉNÉRALE
1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27.
Die "Grundzüge" von N. S. Trubetzkoy La phonétique, science de sons et de valeurs Analyse linguistique et interprétation auditive Voyelles longues et voyelles brèves Opposition et identité Le problème du classement des sons du langage et quelques questions connexes Unhörbare Laute ? Eine Erwiderung an J. Forchhammer The Phonetic Basis for Syllable Division Remarks on a Recent Contribution to the Problem of the Syllable . . . . Juncture and Syllable Division Voyelle, consonne, syllabe, mot Minimal Systems, Potential Distinctions, and Primitive Structures . . . Couches primitives de structure phonologique Stabilité et instabilité des structures phonologiques Stability and Instability of Syllabic Structures Análisis estructural y análisis instrumental de los sonidos del lenguaje: forma y substancia Bemerkungen zum schwedischen Wortakzent A Note on a Footnote (on Swedish Word Accent) Analyse instrumentale et structurale des faits d'accents Analyse des faits prosodiques — problèmes et méthodes Levels of Abstraction in Phonetic and Phonemic Analysis Distinctive Features of Swedish Vowels : Some Instrumental and Structural Data Les voyelles suédoises et la notion de 'fermeture vocalique' Ferdinand de Saussure et la phonétique moderne Terminologisches und Begriffliches zur Methodik der phonematischen Beschreibung La notion de 'force' et les changements phonétiques Changements de perspectives en phonétique
9 16 29 36 54 67 109 115 122 128 131 141 147 152 177 181 192 208 211 222 231 249 256 264 278 281 287
6
TABLE DES MATIÈRES
II. PHONÉTIQUE ROMANE
28. La structure phonétique de quelques langues romanes 301 29. Gémination, force et structure syllabique en latin et en roman . . . . 343 30. Note sur l'articulation du [s] et le traitement de l'affriquée [ta] en roman occidental 349 353 31. Sur quelques faits de différenciation vocalique 32. Le passage en > an en francien et en picard 376 33. Le développement lectio > laisse au point de vue phonétique 382 34. La structure syllabique de l'espagnol 389 35. Occlusion et spirance dans le système consonantique de l'espagnol . . . 405 36. Phonèmes labio-vélaires en espagnol ? 414 37. Tradición hispánica e influencia indígena en la fonética hispanoamericana. 421 38. Notas sobre la fonética del español en el Paraguay 439 39. Obtativo y sujuntivo : a propósito de dos grafías 450 40. A propos du che argentin: Note sur la dite étymologie phonétique . . . 453 41. Le passage castillan/> h — perte d'un trait redondant? 459 42. A propos d'un fait de phonétique historique castillane 464 43. Note sur le [3] argentin 467 44. Esp. chato, ñoño, ñamar et questions connexes 470 45. Fenómenos de juntura en castellano 475
I. PHONÉTIQUE GÉNÉRALE
1 DIE " G R U N D Z Ü G E " VON N. S. TRUBETZKOY
Mit der hinterlassenen Arbeit des großen russischen Sprachforschers Fürsten N. S. Trubetzkoy hat die Phonologie des Prager Kreises ihre erste annähernd vollständige Monographie bekommen. Obgleich die strukturale und systemologische Auffassung der Spracherscheinungen jetzt auf fast jedem Gebiet der Sprachwissenschaft (Formenlehre, Syntax, Wortbildung) von bedeutenden Forschern beachtet wird, 1 haben ihre Vertreter eigentlich nur für das Studium der Sprachlaute diese neuen Gesichtspunkte in größerem Maße verwertet. Man stellt daher mit der größten Befriedigung fest, daß der Meister der Prager Schule diese große Arbeit vor seinem Tode hat beenden können und daß er dabei auch der Wissenschaft eine endgültige, klar formulierte Zusammenfassung seines Systems gegeben hat. Die folgende Besprechung dieses umfangreichen Buches kann keineswegs vollständig werden, sondern muß in erster Linie auf einige besonders interessante Einzelheiten Rücksicht nehmen und selbstverständlich überwiegend auf solche, wo die Auffassung des Besprechers von der des Verfassers abweicht. Die Einleitung zerfällt in zwei Teile und ist zwei besonders wichtigen Problemen gewidmet, einerseits und vornehmlich der Beziehung der Phonetik zur Phonologie, anderseits dem Verhältnis zwischen der Phonologie und der sogenannten Lautstilistik. Das erste dieser Probleme ist schon der Gegenstand zahlreicher Auseinandersetzungen gewesen, ohne daß man sagen kann, die Frage sei endgültig gelöst. Der Verf. weist auf die wichtigsten Arbeiten hin, die sich mit dem Probleme beschäftigt haben (Bühler, Travaux, IV; Bröndal, Proceedings of the International Congress of Phonetic Sciences; Vachek, American Speech, X; Sotavalta, Die Phonetik und ihre Beziehung zu den Grenzwissenschaften [Helsingfors, 1936], usw.), erwähnt aber nicht den Aufsatz von B. Faddegon ("Phonetics and Phonology", Mededelingen der Koninklijke Nederlandsche Akademie van Wetenschappen, 1,10). Die ganze Fragestellung, wie auch diese neue Einstellung zur Sprache und zum Sprachlaute, die die Prager Schule kennzeichnet, geht, wie man weiß, auf Ferdinand de Saussure zurück, der in seinem Cours de linguistique générale zuerst die Grenzen zwischen parole (ein momentanes, indivi1
Siehe Acta Linguistica, I (1939), 2-10.
10
PHONÉTIQUE GÉNÉRALE
duelles physisch-physiologisches Geschehen) und langue (allgemeines konventionell bedingtes System oder Teil dieses Systemes) gezogen hat, Begriffe, die sich ungefähr mit dem Sprechakt und dem Sprachgebilde Trubetzkoys decken. 2 ) Es ist durchaus nicht meine Absicht, hier eine Erörterung der Berechtigung der durchgreifenden Unterscheidung zwischen Sprechakt und Sprachgebilde vorzunehmen, eines Gegensatzes, der seit langem von den meisten Sprachforschern mindestens theoretisch anerkannt wird. Es ist selbstverständlich, daß das augenblickliche Geschehen des Sprechaktes von dem abstrakten, konventionellen in diesem Akte realisierten Zeichen ganz verschieden ist und daß das Studium der physischen und physiologischen Voraussetzungen des Sprachaktes mit anderen Methoden arbeiten muß als das der Systeme und der Struktur dieser Systeme. Für Trubetzkoy ist aber die Phonetik im hergebrachten Sinn eine Naturwissenschaft und muß mithin mit naturwissenschaftlichen Methoden arbeiten. Sie ist Physik und Physiologie. Die Phonetik wäre also, meint er, überhaupt keine rein linguistische Wissenschaft, wenn auch der Sprachforscher der Arbeit der Phonetik mit Interesse folgen und sich ihrer Ergebnisse bedienen muß. Gegen diese meines Erachtens allzu theoretische und allzu absolute Auffassung Trubetzkoys möchte ich einige Einwände erheben. Andere haben es übrigens schon getan. Ich begnüge mich damit, auf E. Zwirners Aufsatz Acta linguistica, I [1939], 29ff. zu verweisen, wo der Verf. hervorhebt, daß die von den Vertretern der Zweiheitslehre verlangte Scheidung auf eine Verwechslung zwischen Methode und Arbeitstechnik beruht. "An der Verschiedenheit von 'Phonem' und 'Sprachlaut' und damit der Arbeitstechnik von Phonologie und Phonetik (im allgemeinsten, im Augenblick noch nicht weiter definierten Sinn) ist in der Tat nicht zu zweifeln. Aber die Frage ist, ob VERSCHIEDENHEIT der Arbeitstechnik schon dasselbe ist wie UNABHÄNGIGKEIT der Methoden, d.h. zweier Wissenschaften, von denen die eine als Phonologie zusammen mit Syntax und Morphologie zur vergleichenden Grammatik und damit zu den sog. 'Geisteswissenschaften', die andere aber als Physik oder Physiologie zur 'Naturwissenschaft' gehört . . . " (S. 33). Zwirner hat dargetan, daß es auch Trubetskoy selbst nicht gelungen ist, die praktischen Folgerungen aus seinen Theorien zu ziehen, und daß die Phonetik durch ihre Zielsetzung selbst eine linguistische Wissenschaft ist. "Durch die Zweiheitslehre hat Trubetzkoy das Feld für die eigentlich linguistische Aufgabe der Phonologie abgesteckt; und nun stellt sich heraus, daß auch alle scheinbar 'naturwissenschaftlichen' Aufgaben der Phonetik VON LINGUISTISCHEN GESICHTS3 PUNKTEN BESTIMMT SIND ) und also zwar eine naturwissenschaftliche Technik in den Umkreis der linguistischen Fragestellungen tragen, sich aber durch die Anwendung dieser Technik linguistischen Methoden fügen und dadurch selbst — mit allen Maßmethoden — in den Umkreis der Linguistik treten" (S. 45). 2
Es sei jedoch daran erinnert, daß schon vor de Saussure ein Bahnbrecher wie Humboldt und später skandinavische Phonetiker wie Noreen in Schweden und Jespersen in Dänemark ähnliche Gedanken ausgesprochen hatten. 3 Von mir hervorgehoben.
DIE "GRUNDZÜGE" VON N. S. TRUBETZKOY
11
Ich möchte diese Kritik noch mehr hervorheben, indem ich ein Beispiel aus meiner eigenen Erfahrung heranziehe. Natürlich will ich nicht behaupten, daß es eine von allen linguistischen Betrachtungen reine Phonetik nicht gebe oder geben könne, deren Ergebnisse für die Sprachwissenschaft von keinem oder nur minimalem Belang wären. Die rein physikalische Analyse der Vokale nach den Methoden Gemellis 4 ) ist z.B. keine sprachwissenschaftliche Aufgabe. Aber in den meisten Fällen muß man wohl sagen, daß auch die Experimentalphonetik, obgleich sie sich physikalischer und physiologischer Methoden bedient, ein rein linguistisches Ziel verfolgt und dem gemäß selbst auch zur linguistischen Wissenschaft gehört, für welche sie eine notwendige Grundlage bildet. Ich denke besonders an die zwei Intonationstypen im Schwedischen. Der Phonologe, der diese von rein phonologischen Gesichtspunkten aus betrachtet, muß absichtlich auf jede Feststellung der musikalischen Natur dieser Akzente verzichten. Er muß sich darauf beschränken, die Opposition festzustellen und die Prinzipien zu definieren, nach denen die Sprache von diesem Ausdrucksmittel Gebrauch macht. Er würde nicht sagen können, ob der Akzent musikalisch oder dynamisch 5 ) sei, ob er die erste oder die zweite Silbe treffe, ob er fallend oder steigend sei. Er würde nur sagen können, daß es eine Opposition gäbe, ohne irgend eine Auskunft über ihre Natur geben zu können. 6 ) Der Stimmbänderverschluß, 7 ) der im Dänischen dieselbe Funktion erfüllt, würde für ihn die gleiche Erscheinung sein. Aber kann der Sprachforscher wirklich auf eine tiefere Kenntnis der untersuchten Phänomene verzichten? Meines Erachtens nicht. Und ist wirklich die wahre Natur der Elemente, die das Lautsystem einer gegebenen Sprache bilden, ihm so gleichgültig, daß deren Studium nicht mehr Linguistik, sondern reine Naturwissenschaft ist? Wenn wir, wenn auch mit physikalischen Methoden, Untersuchungen machen über die Natur der musikalischen Intonationsopposition des schwedischen Wortes und zwei verschiedene Kurven erhalten, von denen die eine den sog. primären, die zweite den sekundären Akzent kennzeichnet, 8 ) haben wir damit ein wertvolles linguistisches Ergebnis erhalten, das trotzdem nicht als phonologisch betrachtet werden kann, da ja von der Funktion der untersuchten Erscheinung im System nicht die Rede ist. Aber die Richtung unserer Untersuchungen werden gerade von unserer Kenntnis der gegebenen Sprache und von der Rolle der studierten Erscheinung im System bestimmt. Der Phonetiker arbeitet nicht aufs geratewohl, wie es ein Physiker, der 4
Siehe Archiv für vergl. Phonetik, III (1939), 65ff. und Archives néerlandaises de phonétique expérimentale, XIV (1938), 126ff. 5 Wenn man nur daran denkt, wie verschieden schwedische Sprachforscher die Akzentverhältnisse der Sprache aufgefaßt haben, so versteht man, daß das Ohr und das unbewußte Sprachgefühl allein nicht genügen, die lautlichen Phänomene richtig zu beurteilen. Die Experimentalphonetik allein hat dieses Problem zu lösen und ein richtiges Bild der Intonationsverhältnisse zu geben vermocht. Siehe meinen Aufsatz in den Archives néerlandaises de phonétique expérimentale, XVI (1940), 162fF. und ebenfalls E. A. Meyer, Die Intonation im Schwedischen, I (Stockholm, 1937), besonders S. 6-10. 6 Siehe S. 181 in Trubetzkoys Arbeit (prosodischer Abschnitt), wo der Verf. selbst diese Ansicht zu vertreten scheint. 7 Oder der Stimmbänderreibelaut, wie Martinet meint {La phonologie du mot en danois, S. 258-259). 8 Siehe meine oben angeführte Arbeit, S. 70 und 75.
12
PHONÉTIQUE GÉNÉRALE
eine gleichartige Aufgabe unternähme, tun würde. Der Phonetiker geht also von seinen linguistischen Kenntnissen aus und sucht das zu bestimmen, was in der Sprache von Belang ist. Es ist dies der große Unterschied zwischen einem rein physikalischen oder physiologischen Studium des Sprechens und zwischen der linguistisch eingestellten Phonetik, die, in diesem Sinn betrachtet, nicht aufhören kann, ein wesentlicher Teil der Linguistik zu sein.9) Diese zwei, die Phonetik und die Phonologie, sind im gleichen Maße notwendig für alle Forschungen über Sprachlaute. Die eine kann die andere nicht entbehren. Die Phonetik beschäftigt sich mit der materiellen objektiven Seite, die andere mit der Funktion, mit der sozusagen subjektiven Seite, mit der Gestalt, welche die formenlose unendliche Masse der physisch-physiologischen Prozesse in der gegebenen Sprache unter dem Einfluß des hergebrachten konventionellen Systems annimmt. Seite 15 sagt der Verf.: "Als ganz verfehlt muß E. Ottos Versuch betrachtet werden, die Phonologie als akustisch eingestellte Lautlehre zu definieren.... sowohl die artikulatorische als auch die akustische Seite der Sprechlaute [sind] Naturerscheinungen, die nur mit naturwissenschaftlichen Methoden untersucht werden können." Es scheint, als ob Trubetzkoy die Auseinandersetzung Ottos (ZF, 52, 1934, S. 177) teilweise mißverstanden hätte. Otto denkt natürlich, wenn er von der Lehre der Sprachakustik (S. 182) redet, an den subjektiven Eindruck, den die Muttersprache oder eine andere bekannte Sprache auf den Zuhörer macht. Denn die bewußten Eindrücke sind gerade die relevanten Bestandteile der Sprache, diejenigen, die eine bestimmte Funktion erfüllen und die folglich mit einem Bedeutungsunterschied verbunden werden können. 10 ) Und der Gehöreindruck ist von dem funktionellen System der betreffenden Sprache abhängig. Ein Franzose ist sich des Unterschieds zwischen einem stimmlosen und einem stimmhaften / nicht bewußt, obgleich die beiden Laute zum Konsonantensystem der Sprache gehören, während dieser Unterschied dem Waliser, in dessen Sprache die Opposition /:/ relevant ist, vollkommen klar erscheint. 11 ) Ich möchte also gegen Trubetzkoy hervorheben, daß wir auf AUDITIVEM WEGE die relevanten Bestandteile unserer Muttersprache am besten feststellen. Hiermit komme ich auf diese zwei Begriffe Subjektivität und Objektivität zurück, die Trubetzkoy meines Erachtens nicht genügend beachtet hat, die aber genau dem Unterschied zwischen Sprechakt und Sprachgebilde, zwischen langue und parole, entsprechen. Die subjektive Seite der Gehöreindrücke entsprechen also den funktionstragenden, bewußten Bestandteilen, die objektive Seite dagegen dem physischphysiologischen Material, woraus jedes Lautsystem notwendigerweise zusammengesetzt ist, woraus aber ein gegebenes System konventionell gewisse Elemente auf Kosten der anderen benutzt. 12 ) 9
Siehe u. a. meinen Aufsatz in Boletim de Filologia, VIII (1941), 5, Fußnote 1. Vergleiche meinen Aufsatz in Moderna spräk (1940), 36. Siehe Moderna spräk (1939), 210-211. 12 Weiter unten (S. 47fF.) scheint der Verf. diesen Zusammenhang zwischen dem Gehöreindruck und seiner intellektuellen oder affektiven Deutung anzunehmen. Die falsche Deutung fremder Sprachlaute oder Lautkombinationen beruht gerade auf dem Unterschied der betreffenden Systeme.
10 11
DIE "GRUNDZÜGE" VON N. S. TRUBETZKOY
13
Es versteht sich von selbst, daß eine auch nur annähernd vollständige Inhaltsangabe des großen und inhaltsreichen Werkes im Rahmen eines kurzen Aufsatzes unmöglich ist. Ich werde mich auf einige bemerkenswerte Einzelheiten beschränken. Der erste Abschnitt (S. 30ff.) ist einigen Grundbegriffen (Opposition, Phonem, Variante) sowie der Definition der Begriffe gewidmet. Die Definition des Phonems ist augenscheinlich eine der schwierigsten Fragen der Prager Phonologie, und das Problem scheint noch nicht endgültig gelöst zu sein. Trubetzkoy hat sich im großen und ganzen der Definition des "Projet de terminologie phonologique standardisée" (TCLP, IV, 311) angeschlossen ("unité phonologique non susceptible d'être dissociée en unités phonologiques plus petites et plus simples"). Trubetzkoy ist zu dieser Auffassung der Natur des Phonems in einer Weise gelangt, die einfach und genial erscheint, wo aber etwas Wesentliches zu fehlen scheint. Der Verf. hat absichtlich von dem Begriff Abstraktion Abstand genommen. Er kritisiert streng Jones, Palmer und Jimbo, die den Begriff "abstrakte Laute" versuchsweise eingeführt haben. Aber wie ich die Sache verstehe, ist gerade diese Abstraktion ein wesentliches Merkmal des Phonems. Das Phonem d z. B. ist in einer gegebenen Sprache das Zusammentreffen aller Eigenschaften, die in der betreffenden Sprache für jedes mögliche d, das objektiv realisiert wird, gemeinsam sind, ein Typus mit gerade so vielen Eigenschaften, die notwendig sind, um es von allen anderen Phonemen der Sprache zu unterscheiden, aber auch nur so vielen. "Gegen diese Definition", meint Trubetzkoy, "muß vor allem eingewendet werden, daß jede Abstraktion einen Grundsatz voraussetzt, nach welchem sie vorgenommen wird." Meines Erachtens ist der Grundsatz in diesem Falle das System. Der Grad der Abstraktion, der in jedem Falle nötig ist, das heißt der Anzahl der relevanten Charaktere, ist gerade vom Lautsystem abhängig. Wenn das System der gewählten Sprache eine Opposition STIMMHAFTER : STIMMLOSER VERSCHLUBLAUT kennt, aber keine Opposition VERSCHLUBLAUT: REIBELAUT, muß man, um das Phonem d zu definieren, von dem okklusiven Charakter absehen und es kurz als STIMMHAFTEN ZAHNLAUT definieren; wenn das entgegengesetzte der Fall ist, lautet die Definition DENTALER VERSCHLUBLAUT. So ist für mich das Phonem notwendigerweise eine Abstraktion. 13 ) Und im Grunde ist ja die ganze phonologische Wissenschaft auf Abstraktionen und Fiktionen gebaut. Das System selbst ist ja nichts anderes. Es ist die Norm, die eine Gruppe von Menschen gewählt hat und die sich unwiderstehlich allen Mitgliedern dieser Gruppe aufzwingt. Sein Wert ist konventionell und fiktiv, bleibt aber trotzdem etwas Wirkliches, an dessen Existenz nicht zu zweifeln ist. 14 ) Der Hörer faßt nur das auf, was in seiner eigenen Sprache relevant ist und was er folglich selbst bewußt ausspricht. 13 Daß es Trubetzkoy nicht gelungen ist, diesen Begriff ganz zu vermeiden, geht aus dem, was er S. 59ff. sagt, hervor. Vgl. hier unten. 14 Gerade weil Grammont den fiktiven Charakter des Systems und der phonologischen Einheiten nicht eingesehen hat, hat er mit Unrecht den ausgezeichneten Aufsatz Martinets (Le français moderne, VI [1938], 131fF.) so streng beurteilen können (ibid. S. 205ff.). Daher kommt es auch, daß diese beiden Forscher einander nicht recht verstanden haben (ibid. VII [1939], S. 33ff.). Der Fehler ist aber in gewissen Maße auch Martinets, der nicht genügend diese fiktive und willkürliche Auffassung des lautlichen Symbols (des Zeichens) und des konventionellen Systems hervorgehoben hat.
14
PHONÉTIQUE GÉNÉRALE
Mit seiner "Logischen Einteilung der distinktiven Oppositionen" (S. 59ff.), wo der Verf. übrigens anfangs dieselbe abstrakte Auffassung des Phonems zu vertreten scheint, die er früher verworfen hat(siehe oben), hat Trubetzkoy auf die hergebrachte Einteilung der Oppositionen verzichtet. In seinem Aufsatz "Essai d'une théorie des oppositions phonologiques" (Journal de psychologie, XXXIII [1936], 5-18) entwickelte er zum erstenmal seine neuen Gesichtspunkte, und es kann nicht bestritten werden, daß die bisherige zweigegliederte Einteilung willkürlich war. Siehe z. B. meine Kritik von Gougenheim (Acta linguistica, II [1940-1941], 56) und Grammont, Le français moderne, VII (1939), 37ff. Es ist interessant festzustellen, daß das ganze System Trubetzkoys in dieser Hinsicht von phonetischen Begriffen ausgeht und daß der Verf. sich seiner Kenntnisse der physiologischen Natur der ausgesprochenen Laute bedient. Er entschuldigt sich ein wenig, indem er darauf hinweist, daß die Sache von wenig Belang ist und daß er die hergebrachte Terminologie benutzt, weil wir noch keine andere haben. Man ist aber geneigt einzuwenden, daß ohne vorherige phonetische Analyse, ohne die von der Phonetik gemachte Einteilung in offene und geschlossene, vordere und hintere Vokale usw. ein System wie Trubetzkoys undenkbar wäre. Ohne die Phonetik könnte der Phonologe in seine Wissenschaft keine Ordnung bringen, und die Ordnung, die Klassifizierung und die Systematisierung sind es gerade, die das Fundament und die Daseinsberechtigung der Phonologie bilden. 15 ) Es folgt daraus die nahe Verwandtschaft der beiden Zweige der Sprachforschung und die Notwendigkeit einer phonetischen Grundlage für jede phonologische Untersuchung. Man schließt daraus auch, wie unhaltbar die strenge Trennung zwischen der einen und der anderen ist, die von den meisten Phonologen verfochten wurde und noch verfochten wird. Es folgt daraus auch, ich wiederhole es, der rein linguistische Charakter der Phonetik. Im prosodischen Abschnitt möchte ich die Aufmerksamkeit auf die falsche Deutung der skandinavischen Intonationsverhältnisse richten. Der Verf. beschäftigt sich besonders mit dem Norwegischen und beruft sich auf Borgström ("Zur Phonologie der norwegischen Schrifsprache", Norsk tidsskrift for Sprogvidenskap, IX [1937], 250ff.). Die Opposition zwischen norweg. lyse 'Licht' und lyse 'scheinen', bönner 'Bauern' und bönner 'Bohnen' ist für Trubetzkoy eine prosodische Erscheinung. Das Norwegische wäre also eine morenzählende Sprache. Borgström hatte behauptet, "daß die norwegische Schriftssprache die Zerlegung der Silbenträger in Moren nicht kennt" (S. 261). Zweifellos hat er recht. Trubetzkoy hat die Akzentverhältnisse der skandinavischen Sprachen ganz falsch aufgefaßt. Im Norwegischen wie im Schwedischen charakterisieren die musikalischen Akzentverhältnisse das ganze Wort, und die Opposition zwischen den angeführten Wörtern gehört zu der Phonologie des 15
Ich verweise auf meinen Aufsatz in Moderna sprdk (1939), 210-211. Für mich ist die Aufgabe des Phonologen gerade die Definition der Oppositionen und des funktionstragenden Systems einer gegebenen Sprache, mit Ausgangspunkt von den phonetischen Kenntnissen der verschiedenen Momente der Artikulation, die die Phonetik bietet.
DIE "GRUNDZÜGE" VON N. S. TRUBETZKOY
15
Wortes, nicht zu der der Silbe, wie Trubetzkoy es meint. Der Intonationsunterschied vollzieht sich zwar ganz oder teilweise in der ersten Silbe des Wortes 16 ), kennzeichnet aber das ganze Wort. Ein Schwede hat keine Ahnung von dem Platz des musikalischen Akzents im Wort, hört aber unmittelbar den Unterschied zwischen büren 'der Käfig' und büren 'getragen' und kann sofort sagen, von welchem der zwei Wörter die Rede ist. Er hört nicht den Unterschied zwischen den zwei Silben bu-, sondern den Unterschied zwischen den betreffenden Wörtern. Erst die Experimentalphonetik hat die Frage beantworten können, wie und wo diese Opposition objektiv verwirklicht wird. 17 ) Von einem funktionellen Gesichtspunkt aus betrachtet werden die Wörter und nicht die Silben differenziert. 18 ) Meines Erachtens verhält es sich auf dieselbe Weise mit dem dänischen "stöd". 1 9 ) Trubetzkoys Versuch, einen Zusammenhang zu finden zwischen der behandelten Intonationsopposition und einer Silbenschnittkorrelation (S. 197), ist außerordentlich interessant und wäre einer näheren Untersuchung wert. Es ist aber eine rein phonetische Frage, die nur auf experimentellem Wege gelöst werden kann. 2 0 ) Jeder Leser von Trubetzkoys großem Werke muß bedauern, daß gewisse Teile der Phonologie nicht den Platz darin gefunden haben, der ihnen zukommt. Sein Tod hat ihn tragischerweise der abschließenden Durchsicht seiner Arbeit entzogen. M a n muß aber hoffen, daß seine zahlreichen Schüler in verschiedenen Ländern einst die von ihm hinterlassenen Bemerkungen (z. B. über historische Phonologie) sammeln und veröffentlichen werden. Es wäre für die heutige wie für die zukünftige Linguistik von größtem Interesse.
16 Die Verhältnisse liegen dialektisch sehr verschieden. 17 Es ist zu bedauern, daß Trubetzkoy nicht den ersten Teil des oben zitierten Werkes E. A. Meyers über die schwedische Intonation gekannt hat, wo das Problem für die Mundarten Mittelschwedens experimentell gelöst worden ist. Was die Untersuchungen E. Stallings (Das phonologische System des Schwedischen, I [Nijmegen, 1935]) betrifft, verweise ich auf meinen Aufsatz Moderna spräk (1940), 237 Anm.). 18 Siehe auch Martinet, Le français moderne, VI (1938), 132. 19 Siehe meinen Aufsatz Moderna spräk (1939), 207 und vgl. Martinet, La phonologie du mot en danois, S. 258. 20 Es ist beachtenswert, daß zwei ausländische Phonetiker, unabhängig voreinander, meine Aufmerksamkeit gerichtet haben auf den Silbenschnittunterschied, den sie in Worten, die ich ihnen vorsprach, zu hören glaubten. Ich hoffe einmal Gelegenheit zu haben, näher auf diese Frage einzugehen.
1 LA PHONÉTIQUE, SCIENCE DE SONS ET D E VALEURS
Cette discipline, à l'honneur en ce jour où l'Université de Bruxelles inaugure son Institut de Phonétique, occupe à plus d'un titre une place très spéciale parmi les sciences naturelles et humaines. Il n'est pas toujours facile d'être phonéticien. Au cours de mon exposé, nous verrons quelles en sont, du point de vue scientifique, les principales raisons. Mais la situation du phonéticien devant le grand public n'est pas moins difficile. Tout le monde sait ce qu'est l'histoire, l'anglais ou les mathématiques, et comprend grosso modo ce que font les spécialistes en ces matières. Mais le phonéticien? Il s'occupe de sons sans être physicien, d'organes de la parole et de leur fonctionnement sans être physiologue, de la perception auditive sans être otologiste ni psychologue, de la prononciation du français, de l'allemand, ou du russe sans être romaniste, germaniste, ni slavisant, etc. Est-ce donc un amateur en toutes choses, qui ne connaît vraiment rien à fond? Il peut en être ainsi dans quelques cas mais, heureusement, ceux-ci sont, je l'espère, assez rares. La phonétique est une branche de la linguistique et relève par là même des SCIENCES HUMAINES, plus exactement de leur aspect social. Il sera donc nécessaire de dire quelques mots sur cette science plus générale dont la phonétique ne constitue qu'une SUBDIVISION.
La position du langage et des recherches linguistiques à l'intérieur des sciences naturelles et humaines a toujours prêté à discussions et à débats. La définition même du langage a beaucoup varié selon les points de vue généraux dont l'envisageaient les différents spécialistes — du philologue au physicien en passant par le sociologue. De la même façon que le langage — dans un sens large la faculté de parler et de communiquer — est un INSTRUMENT et non pas une fin, la linguistique a été aussi pendant très longtemps un instrument au service d'autres sciences (critique textuelle, littérature, histoire, sociologie, archéologie, histoire des religions, etc.). La naissance d'une linguistique autonome a été essentiellement le résultat de deux facteurs: 1. L'application au langage des IDÉES ÉVOLUTIVES du siècle passé (évolutionnisme, darwinisme, spencerianisme) avec, pour conséquences: cette linguistique HISTORIQUE et COMPARÉE d'un Rask, d'un Bopp, d'un Jakob Grimm qui selon l'opinion de certains serait la seule valable; et avec comme point final de cette évolution, l'idée de
LA PHONÉTIQUE. SCIENCE DE SONS ET DE VALEURS
17
progrès dans le langage d'un Jespersen — c'est-à-dire l'optimisme évolutif de Spencer reflété dans la linguistique; 2. L'idée du SIGNE LINGUISTIQUE formulée par Ferdinand de Saussure avec ses conséquences bien connues: les différentes écoles modernes dites structuralistes. Il me semble légitime de réduire toutes les nombreuses écoles linguistiques, d'hier et d'aujourd'hui, à deux types essentiels, deux INVARIANTS si vous voulez: a) LA LINGUISTIQUE D U SIÈCLE PASSÉ, HISTORIQUE et COMPARÉE, dominée par l'influence des sciences naturelles et ses deux concepts principaux — qui étaient aussi ses principales découvertes — la SUBSTANCE et 1'ÉVOLUTION, et b) LA LINGUISTIQUE MODERNE, dominée par les SCIENCES SOCIALES et tirant de cellesci sa méthodologie. Les reflets de ces conditions historiques et idéologiques sont particulièrement nets dans le domaine de la PHONÉTIQUE — science des sons ou de I'EXPRESSION du langage. L'ancienne linguistique, celle qui s'était constituée comme une science autonome au cours du siècle passé, avait pris la forme d'une analyse des CHANGEMENTS des langues, et la phonétique tout naturellement, celle d'une étude des MODIFICATIONS des sons; elle avait été amenée par conséquent à considérer surtout la variation de la substance phonique. La naissance, vers le milieu du siècle passé, de la phonétique dite expérimentale — ou plutôt, à cette époque, instrumentale — s'explique, on le sait, par le désir d'expliquer l'évolution phonétique, de rechercher la causalité des lois phonétiques, et donc par la nécessité de faire de la linguistique historique une science digne de ce nom — une science de LOIS et de FAITS, non pas de fantaisies et de constructions arbitraires. Je ne discuterai pas ici le problème de savoir si cette phonétique, essentiellement physiologique — science des articulations — a contribué ou non à résoudre le problème général des changements phonétiques ou le problème particulier de l'histoire phonétique de chaque langue ou dialecte. Il suffit de souligner qu'une telle contribution — si elle existe ou a existé — ne pourra jamais être que partielle, c'est-à-dire qu'elle nous aidera à la rigueur à mieux comprendre tel ou tel mécanisme phonétique ou à calculer les possibilités, le probable ou l'improbable, mais jamais rien de plus. Aucun résultat instrumental ne pourra nous permettre de déclarer que telle transformation phonétique supposée est impossible, tout au plus pourra-t-on dire qu'elle est improbable. Le problème des changements phonétiques, dans toute sa complexité, se pose, à mon avis, en dehors du langage, et par conséquent en dehors de la linguistique. Ce n'est pas autre chose qu'un aspect particulier du problème général des changements SOCIAUX. Permettez-moi de m'arrêter d'abord un instant à ce vieux problème important aussi pour porter un juste jugement sur la position de la phonétique et de ses méthodes à l'intérieur de la science du langage et de la communication. On a dit souvent, et on a eu raison, que la condition même du fonctionnement du langage, c'est que le système reste le même, et qu'une langue qui change est une contradicho in adiecto; une langue ne peut fonctionner qu'en restant identique à elle-même — e pure si
18
PHONÉTIQUE GÉNÉRALE
muove! L'explication de ces deux faits contradictoires serait, bien entendu, que les changements ont lieu si lentement et que chaque changement touche à la fois à un si petit détail du mécanisme linguistique que l'individu ne s'aperçoit de l'évolution. Les petites différences de système qu'il y a d'un individu à l'autre n'empêchent pas non plus la communication. Mais CE N'EST PAS TOUT, et CE N'EST GUÈRE L'ESSENTIEL. Une langue est une fonction de la vie sociale, cette fonction la détermine et lui donne sa raison d'être. C'est une sous-structure de la structure plus générale qu'est la communauté sociale. Il existe des rapports précis entre le système linguistique et les autres conventions sociales. N'importe quelle modification apportée à l'une d'elles entraîne automatiquement des répercussions sur les conventions linguistiques, notamment si les rapports socio-linguistiques doivent rester inaltérés. Et si la société, et les conventions linguistiques en général, changent — et nous savons qu'elles le font et jusqu'à quel point — il devient naturel — et c'est en réalité une conséquence automatique de notre définition, celle de de Saussure — que la langue change avec la société en fonction des modifications sociales et des rapports entre les hommes. La langue fait partie de la structure sociale. Mais l'expression du langage, la phonétique, fait partie intégrante du système linguistique et ne se laisse pas isoler de l'aspect grammatical ou sémantique de celui-ci en vertu de la thèse saussurienne de la solidarité entre SIGNIFIANT et SIGNIFIÉ. Il n'est plus possible, après de Saussure, Trubetzkoy et Hjelmslev, de reléguer l'expression (les phonèmes ou les 'sons') au seul domaine matériel, à un domaine substantiel où on les soumettrait aux analyses physiques et physiologiques des sciences naturelles en appliquant au problème de leurs modifications diachroniques la fausse analogie des lois physiques. Les valeurs sont réglées, elles aussi, par des lois, mais des lois d'une nature différente. Cette fausse analogie entre les unes et les autres a joué un rôle malheureux dans la linguistique diachronique. La modification de l'approche méthodique due à l'orientation structuraliste moderne a déplacé le centre de gravité des recherches diachroniques en mettant en relief les valeurs communicatives des unités d'expression aux dépens de leurs caractéristiques physiques. C'est pour cela que l'analyse phonétique d'une langue ne peut pas non plus être isolée du contexte social et culturel dans lequel cette langue fonctionne. C'est une des raisons pour lesquelles le phonéticien ne doit jamais rester un INSTRUMENTALISTE PUR.
L'évolution de la science phonétique depuis ses débuts au siècle passé reflète fidèlement celle des sciences naturelles et humaines en général. Si l'idée de l'évolution et de changement en a été le point de départ, les idées évolutives d'un Darwin transposées sur le plan du langage, et supplantant ici, comme en biologie, la rigide structure systématique d'un Linné, c'est plutôt l'orientation positiviste, et plus particulièrement les grandes découvertes en PHYSIQUE et en BIOLOGIE — en un mot les méthodes INSTRUMENTALES et EXPÉRIMENTALES — qui ont conditionné la forme qu'a prise la phonétique depuis les premières analyses vocaliques de Helmholtz, les premiers palatogrammes de Rudolf Lenz, les premières courbes d'intonation de E. A. Meyer ou les premières radiographies (dues également au grand savant suéco-allemand).
LA PHONETIQUE, SCIENCE DE SONS ET DE VALEURS
19
Nous ne tracerons pas ici même les grandes lignes de cette évolution. Contentons-nous de dire que, pour des raisons de ressources techniques, la phonétique prit dans ses premières phases un aspect essentiellement PHYSIOLOGIQUE. Elle fut une science des ARTICULATIONS. Ce n'est que bien plus tard, avec l'invention des moyens électroniques (avec l'oscillographe, les filtres acoustiques, les spectrographes, la synthèse acoustique) que le domaine acoustique a pris lui aussi la place qui lui revient dans l'analyse des sons du langage. Assez tôt survint pourtant, avec le perfectionnement de nos connaissances physiques et physiologiques des unités linguistiques, le problème des rapports entre l'un et l'autre des deux niveaux parallèles des bases matérielles du langage. La phonétique classique avait défini ses unités en termes physiologiques et était partie de la supposition gratuite qu'à n'importe quel facteur articulatoire correspondait automatiquement un fait acoustico-auditif, différent de tout autre. La thèse connue "each new position of the tongue produces a new vowel" — formulée par Henry Sweet — fut longtemps un axiome et l'est toujours pour les nombreux linguistes qui appliquent encore, dans leurs recherches ou leurs raisonnements, les quelques notions de phonétiques apprises tant bien que mal dans les manuels du début du siècle. Depuis les récents résultats acoustico-phonétiques, en particulier ceux obtenus par mon compatriote Gunnar Fant, nous savons que même l'idée — si bien fondée au début, semblait-il — d'une correspondance parfaite entre les deux principaux formants vocaliques — Fi et F2 — et respectivement les cavités du pharynx et de la bouche est inexacte dans ce sens que la structure acoustique de l'onde sonore générée par la glotte est un effet de la forme du tube résonateur TOUT ENTIER — sa longueur, la place et la grandeur du rétrécissement maxima et de l'orifice d'ouverture, et que l'effet d'un de ces différents facteurs peut être modifié par celui d'un autre. Il est impossible de définir une voyelle par le nombre de millimètres qui séparent le dos de la langue du palais à l'endroit le plus rétréci, ou par la grandeur absolue de l'ouverture buccale. Les deux se compensent, et ils se trouvent en relation avec la distance maxillaire. Il suffira de souligner ici que les spécialistes, les techniciens orientés vers la transmission linguistique, sont à l'heure actuelle assez avancés en ce qui concerne les recherches sur les VOYELLES. Il y a des rapports exacts et mesurables entre l'articulation et le son physique qui en est l'effet. Si nous sommes bien moins avancés en ce qui concerne les consonnes, physiquement plus complexes, et si nous tâtonnons encore dans l'obscurité pour certains faits prosodiques (ladite intensité ou sonorité par exemple), c'est néanmoins un fait incontestable que, même si sur ce dernier niveau les calculs et les mesures sont particulièrement difficiles et compliqués, ils sont théoriquement possibles et malgré tout assez poussés. C'est l'affaire des ingénieurs et des physiciens de perfectionner cet aspect de notre problème. Passons maintenant à l'autre aspect de la communication linguistique — la transmission d'informations d'un émetteur à un récepteur et le mécanisme qui rend cette transmission possible. C'est un fait curieux que — grosso modo — toute la phonétique traditionnelle se soit intéressée uniquement à la production du son et au produit émanant de l'émetteur, sans se soucier du récepteur et de la façon dont, chez celui-ci,
20
PHONÉTIQUE GÉNÉRALE
cette onde sonore est perçue et interprétée. En réalité, c'est à ce point du CIRCUIT DE LA PAROLE que se nouent à l'heure actuelle les principaux problèmes phonétiques — problèmes d'information, de physiologie auditive, de psychologie et de linguistique théorique. De là aussi les contacts intimes entre phonéticiens, théoriciens de l'information et de la communication, psychologues, théoriciens du langage. Toute perception — qu'elle soit visuelle, tactile, auditive ou autre — suppose nécessairement et par définition les deux mécanismes de I'IDENTIFICATION et de 1 'OPPOSITION. Les deux supposent à leur tour l'existence d'un MODÈLE, d'un PATTERN. Si je perçois un chien comme un chien, je le fais en l'identifiant avec une classe qui m'est familière et en l'opposant par là même aux autres classes qui font partie de mon répertoire. Déjà de Saussure avait dit que le mécanisme linguistique se base sur un jeu d'oppositions et d'identités. Ce mécanisme vaut, bien entendu, pour toutes les unités du langage, des plus grandes aux plus petites. Si celles-ci (les phonèmes) ne sont pas identifiées consciemment à l'état isolé, ceci ne signifie pas qu'elles ne possèdent pas d'existence indépendante réelle, mais seulement que leur caractère distinctif ne les isole les unes des autres dans les syntagmes que dans les cas où la clarté exige qu'on insiste là-dessus (par ex. /è/ ~ jp¡ dans j'ai dit bordeaux, non pas porto). Toute qualité phonétique, qu'il s'agisse de qualités acoustiques ou de qualités physiologiques, représente un point sur une échelle continue. Les articulations forment un CONTINU INDIVISIBLE sur le niveau syntagmatique et sur le niveau paradigmatique. En passant d'un //>/ à un /a¡ dans le mot pas ¡pa¡ on passe, au moins théoriquement, par toutes les étapes intermédiaires possibles. De la même façon, le phonème ¡e¡ du système français n'est qu'une des innombrables nuances entre le /// le plus fermé et le ¡aj le plus ouvert, etc. Les points sur cette échelle marqués par les quatre phonèmes vocaliques (/// ~ /e/ ~ /e/ ~ ¡a/) du français sont quatre valeurs arbitrairement choisies dans le CONTINUUM INDIVISIBLE qu'est la réalité physique. Déjà la perception pure d'un stimulus suppose que le continu de la réalité physique soit remplacé par un phénomène discret. Déjà les analogies les plus banales de notre vie et de nos activités quotidiennes le prouvent. La température — physiquement la vitesse de mouvement des molécules — est un continu sans déliminations, un passage sans interruption de zéro à 100 et ainsi de suite. Mais dès que nous passons à la mesure, nous recourons à une échelle de 100 unités — 'degrés' — dont le nombre est ARBITRAIRE mais APPROPRIÉ. Cette échelle implique que n'importe quelle valeur absolue de température est référée à et identifiée avec une des cent possibilités admises, même si, dans la réalité physique, il n'y a guère deux températures qui soient absolument identiques. Le continu du monde physique a été remplacé par la 'discrétion' des faits perçus. Les distances entre les villes que nous parcourons en voiture sur les routes sont toujours représentées, nous le savons, par un nombre donné de kilomètres. Nous comprenons tous, et nous acceptons sans trop d'objections, qu'il s'agisse toujours de mesures approximatives et que la véritable distance ne se laisse presque jamais symboliser de façon physiquement exacte par un nombre entier de kilomètres. Toute mesure implique une approximation de ce genre. Entre parenthèses, il est curieux, pour ne
LA PHONÉTIQUE, SCIENCE DE SONS ET DE VALEURS
21
pas dire plus, que le linguiste traditionaliste qui accepte sans objections notre système de mesures malgré son manque d"exactitude' ait eu tant de peine à comprendre et à appliquer la notion de phonème. N o u s savons, grâce à la théorie de la communication, que ce sont ces approximations qui empêchent les modifications successives des valeurs pendant la transmission, modifications qui autrement finiraient par fausser le message. La communication linguistique comme toute transmission d'information suppose des UNITÉS DISCRÈTES déjà par le fait que la perception le demande; l'utilisation des méthodes de mesures et de calcul en phonétique moderne a rendu cette QUANTIFICATION DE LA SUBSTANCE SONORE plus indispensable que jamais. Mais l'identification des unités linguistiques est loin d'être un phénomène de perception auditive pure. Elle n'en est, pour ainsi dire, que la première condition. La difficulté des sourds ou des durs d'oreille en est une preuve. Le langage n'utilise qu'une minime partie de toutes les nuances acoustiques auditivement discriminables. La perception linguistique est déterminée essentiellement par les facteurs suivants : 1. La physiologie de l'oreille humaine, ou plus exactement son aire audible et les degrés différentiels ; 2. La structure du modèle imposé sur l'onde continue, c'est-à-dire le nombre de possibilités présentes dans l'esprit du récepteur, et grâce auxquelles certains points sont enregistrés, d'autres négligés; donc la structure du paradigme et la structure du syntagme; 3. Le contexte sémantique, grammatical et extralinguistique, grâce auquel nous pouvons éliminer tout de suite une série de possibilités comme impossibles ou improbables. Le facteur 1 est responsable de la réaction auditive de l'écouteur dans ce sens que le stimulus crée une attitude positive (de discrimination) et par là une situation linguistique. Si cette situation manque complètement (surdité complète ou manque de transmission mécanique), aucune communication n ' a u r a lieu. Le facteur 2 est décisif pour la réaction linguistique du récepteur qui, si le code utilisé est le bon, identifie l'onde sonore comme un spécimen d'une langue connue. Il implique une SEGMENTATION et une CATÉGORISATION. Le facteur 3 est responsable de l'exactitude de la réaction du récepteur. Il décide si celui-ci comprendra le message ou non, c'està-dire si le message reçu sera identique, ou plutôt quasi identique au message envoyé. Toute communication suppose donc par définition un ÉMETTEUR (a) et un RÉCEPTEUR (b). Le point de départ est un stimulus venant de dehors, de la réalité extra-linguistique qui constitue en elle-même u n continuum (continu). Ce fait extra-linguistique, pour être transmis linguistiquement, doit être STRUCTURÉ, ou FORMÉ, selon un code conventionnel que maîtrise a et qui est supposé connu aussi de b. Cette structuration implique la création de SIGNES — contenus + expressions —, dans le langage ordinaire 'mots', 'formes' ou 'procédés syntaxiques'. C'est la combinaison dans le signe d ' u n contenu avec une expression — les deux également arbitraires et également conventionnels
22
PHONÉTIQUE GÉNÉRALE
par rapport à la substance dans laquelle ils se réalisent — qui constitue le PROPRE DU LANGAGE HUMAIN. Le message ainsi structuré est transformé en impulsions nerveuses — code binaire et par conséquent formé d'éléments discrets — qui aboutissent à leur tour à une ACTIVITÉ MUSCULAIRE de caractère CONTINU et, de là, à une ONDE SONORE, également continue, qui frappe une oreille, dans notre exemple celle de b. La réaction physiologique de b est la même, qu'il comprenne le message ou non, la même chez un enfant de deux mois ou chez un adulte. Mais pour 'comprendre' le message, b doit SEGMENTER l'onde continue en éléments discrets (phonèmes) et doit référer chaque segment à une unité connue du code que lui et a ont en commun. Il rétablit la suite de phonèmes créée par a mais perdue en cours de route. Grâce à sa connaissance de la langue, il rétablit les signes et interprète le message comme une suite de mots, de formes, etc, connus de lui. Et grâce à son EXPÉRIENCE EXTRALINGUISTIQUE il arrive aussi à rétablir et à se figurer la même 'réalité' que celle qui était le point de départ du message envoyé par a, ce qui veut dire que le message est compris entièrement, ou disons, pour être prudents, à peu près. La perception de la parole est donc à considérer comme un acte d'interprétation d'une série de stimuli auditifs, stimuli qui sont des manifestations matérielles d'unités structurales emmagasinées dans le cerveau du récepteur et faisant partie de son répertoire. L'audition linguistique est une AUDITION SÉLECTIVE À UN TRÈS HAUT DEGRÉ. Seules les unités distinctives sont liées dans la conscience linguistique du récepteur à des concepts grammaticaux et sémantiques. Elles seules comptent dans le processus communicatif — ou disons plutôt le processus communicatif-intellectuel. Ceci revient à dire que, pour l'homme parlant et écoutant, les phonèmes sont les seules réalités linguistiques. L'existence d'autre chose dans l'onde sonore — de variantes innombrables, de sons de passage, de phases transitoires, etc. — est la découverte d'une analyse scientifique qui est celle de la phonétique. Mais ceci veut dire que, pour l'homme parlant, la parole est une CHAÎNE OU une série d'unités qui sont indépendantes les unes des autres dans le paradigme et qui correspondent chacune, par là même, à une 'image acoustique' dans la conscience linguistique de l'individu. La parole implique donc un passage incessant de FAITS CONTINUS à des FAITS DISCRETS, de là à des faits continus et ainsi de suite, LE LANGAGE COMMENCE ET FINIT AVEC LES ÉLÉMENTS DISCRETS.
Il serait instructif, à la lumière des faits mentionnés, de suivre l'histoire de la phonétique depuis ses premiers débuts au milieu du siècle passé jusqu'au moment actuel pour voir si, et comment, ce principe linguistique et communicatif est reflété dans les recherches phonétiques. Une telle analyse découvrirait pour ceux qui ne sont pas déjà au courant quelques surprises des plus curieuses. Nous sommes obligés de renoncer à un tel aperçu historique ici. Je me limite à quelques brèves remarques. On s'attendrait a priori à voir l'analyse phonétique partir des faits linguistiques qui sont conscients dans l'esprit de tout homme parlant — de tout enfant dès l'âge de la première maîtrise de sa langue maternelle — pour passer de là à la recherche des PHÉNOMÈNES PSYCHOLOGIQUES qui les engendrent et qui nous permettent de percevoir ces
LA PHONÉTIQUE. SCIENCE DE SONS ET DE VALEURS
23
unités, et de là enfin à la SUBSTANCE PURE — aux phénomènes entièrement physiques qui en sont les manifestations matérielles. En réalité, dans la première édition de la fameuse grammaire de Jakob Grimm, il est encore question de LETTRES ("Die Lehre von den Buchstaben"). Je fais remarquer en passant que l'unité linguistique derrière la lettre, c'est le PHONÈME. La "Buchstabe" chez Grimm n'est évidemment qu'une mauvaise terminologie pour "phonème". Mais il ne fallut attendre que la deuxième édition de cette grammaire pour voir "la lettre" remplacée par le SON ("Sprachlaut"), donc, — sous une terminologie moderne — la FORME par la SUBSTANCE. Ce qui s'est passé au cours de l'histoire, pas très longue, de notre science, c'est que la découverte de la substance et l'invention des méthodes instrumentales analytiques dues à la physique et à la physiologie sont venues TROP TÔT, plus précisément avant que la description scientifique de la forme linguistique eût atteint encore une maturité scientifique suffisante. Il ne fait guère de doute que le comparatisme classique — chez Rasmus Rask aussi bien que chez Jakob Grimm et chez les autres — est basé sur la supposition implicite d'une identité de fonction couvrant des différences de manifestation substantielle. Hjelmslev a attiré l'attention sur la présence d'idées structuralistes chez Rask. Et notre collègue belge M. Buyssens vient d'expliquer la principale thèse saussurienne — celle de la forme — par l'expérience de de Saussure comme comparatiste. Pourtant, l'orientation historique du siècle passé d'un côté, et le prestige des sciences naturelles et de leur prétendue exactitude de l'autre, ont pris le dessus sur la systématisation des unités d'expression qui aurait dû précéder les études instrumentales pour leur donner un sens et pour leur garantir leur place dans cette hiérarchie des analyses qui est indispensable et qu'imposent les fonctions même du langage. En un mot, on a commencé par découvrir les variantes et, d'une façon plus générale, toute la riche complexité de la réalité physique avant d'avoir déterminé de façon méthodique et conséquente les INVARIANTS OU plus exactement les CLASSES OU les CATÉGORIES auxquelles les variantes doivent être référées pour trouver leur place propre dans cette hiérarchie linguistique, sans laquelle elles n'ont guère d'intérêt scientifique. On n'a qu'à ouvrir n'importe quelle description dialectologique du premier tiers de ce siècle — et pas mal de dialectologues appartiennent encore aujourd'hui à ce premier tiers — pour se convaincre que l'auteur a commis une erreur dont aucun écolier de dix ans ne se rendrait coupable — celle d'additionner des litres et des kilomètres. S'il fallait caractériser la linguistique moderne par rapport à celle des générations précédant immédiatement la nôtre, il serait peut-être indiqué de dire qu'elle cherche à considérer le langage et les langues à la lumière de leurs fonctions sociales et psychologiques et dans toute analyse à partir des fonctions communicatives et expressives de l'énoncé linguistique. C'est ainsi que la linguistique devient aussi, éminemment, une science de l'homme — de 1 'homo sapiens et de Vhomo loquens. Si la langue est un moyen de communication et d'expression, il est nécessaire par définition que la notion de STRUCTURE entre en ligne de compte et devienne l'objet essentiel de la recherche. Structure veut dire UNITÉ, TOTALITÉ et RELATIONS, LA TOTALITÉ ÉTANT
24
PHONÉTIQUE GÉNÉRALE
Pour citer Hjelmslev, Prolegomena to a Theory of Language (p. 14): " . . . a totality does not consist of things but of relationships", ou le maître genevois Ferdinand de Saussure: "dans la langue il n'y a que des différences" (Cours, p. 166). Au fur et à mesure que les méthodes analytiques se perfectionnèrent et que les connaissances des faits physiques impliqués dans l'acte de la phonation et dans l'onde sonore s'accrurent, il devint difficile aux linguistes de suivre la route de la phonétique. Déjà le scepticisme de l'école dite classique — d'un Sievers, d'un Sweet, d'un Passy et même d ' u n Jespersen — en fait preuve. Le témoignage de l'oreille fut opposé, comme plus pertinent, à celui des appareils. Les instrumentalistes de leur côté soutinrent l'insuffisance et la subjectivité de l'oreille humaine. Les deux camps se rendirent coupables de la même confusion méthodique. Si les classiques avaient raison en défendant l'oreille — appareil de réception normal de l'homme —, ils n'étaient guère conscients des limitations impliquées dans l'expérience linguistique antérieure — le " p a t t e r n " de l'écouteur, celui qui, dans ce genre de recherches, est en même temps celui qui fait l'analyse. Il est vrai que, grâce à la connaissance de plusieurs systèmes phonématiques, un homme peut augmenter considérablement le nombre de distinctions qu'il est capable d'identifier, mais il est vrai aussi que, de l'autre côté, il restera toujours sous la dépendance de ces limitations et que même le dialectologue le plus habile n'arrivera pas, ou difficilement, à identifier et à interpréter des différences de stimuli acoustiques qui ne lui sont pas familières. Si le professeur Higgins est supérieur à ce point de vue à Elisa encore non éduquée c'est parce que son expérience phonétique est tellement plus grande, non parce que son oreille — son appareil récepteur — fonctionne différemment en principe. U N COMPLEXE DE RAPPORTS.
Si, d'autre part, les instrumentalistes ont eu tort eux aussi, c'est parce qu'ils ont mal compris au début la place de l'analyse instrumentale dans la recherche phonétique. L'APPAREIL — quelles que soient ses qualités techniques — n'est jamais à considérer que comme un instrument plus fin, qui complétera le témoignage insuffisant de l'oreille. Ni l'un ni l'autre ne reflètent fidèlement la réalité dite objective. L'appareil a ses caractéristiques — pensons par exemple au sonographe avec ses filtres qui impliquent déjà une modulation importante de l'onde sonore qui les traverse, modulation choisie par l'instrumentaliste et connue de lui — , I'OREILLE a les siennes. L'appareil et l'oreille nous donnent des informations en principe différentes — et des informations qui appartiennent à des niveaux différents de l'analyse, niveaux qu'il ne faut pas confondre. Si d'une part la forme de l'expression linguistique — ce que nous appelons aussi le système phonologique — est définie en principe par les rapports entre les unités — rapports PARADIGMATIQUES et rapports SYNTAGMATIQUES — et si elle est par conséquent indépendante de sa manifestation matérielle, il est évident d'autre part qu'elle n'est pas entièrement indifférente à la substance qui la réalise. Il y a, semble-t-il, dans chaque système phonématique une tendance assez forte à établir une correspondance entre les unités purement abstraites que Hjelmslev appelle les CÉNÈMES et les
LA PHONÉTIQUE, SCIENCE DE SONS ET DE VALEURS
25
unités physiques qui sont, pour l'homme naïf, les 'sons du langage'. Si la discrépance devient trop grande entre la forme et la substance, il peut y avoir là un facteur de modification diachronique. Bien des changements phonétiques s'expliquent par une tendance à adapter la forme à la substance (un élément sonore aboutit à une nouvelle syllabe comme en anc. esp. crônica devenu parfois corônica, esp. arg. grupa devenu gurupa, etc.). Il ressort déjà des exemples cités que la segmentation de l'onde sonore — sa STRUCTURATION — doit nécessairement se baser sur des critères extérieurs à cette même onde. Elle est par conséquent ARBITRAIRE par rapport à la substance phonique. La façon dont différents peuples entendent la même réalité phonétique en est déjà une preuve suffisante (cf. club, jap. kurabti, film, jap. hirumu, etc.). La thèse saussurienne de l'arbitraire du signe •— si souvent mal comprise et mal interprétée — n'implique pas seulement que la combinaison d'un signifiant avec un signifié dans ledit signe soit arbitraire — à l'exception de quelques cas peu nombreux de formations onomatopéiques — mais aussi, et surtout, que les deux côtés du signe soient, eux aussi, arbitrairement structurés par rapport à ce continuum non structuré qu'est le monde des sons: l'onde sonore et les mouvements articulatoires d'un côté, le monde des réalités et des imaginations qui nous entoure ou qui se cache dans nous-mêmes de l'autre. La structure grammaticale et sémantique est, de la même façon que la segmentation phonématique, une formation arbitraire et conventionnelle d'un continu matériel et spirituel dont l'homme ne peut prendre connaissance qu'à travers une forme linguistique superposée, ou exceptionnellement à l'aide d'une langue scientifique spéciale (mathématique, logique ou philosophique). C'est par le fait d'appartenir à une telle structure conventionnelle et arbitraire— par le fait de représenter certaines VALEURS — que l'analyse des unités même strictement phonétiques ne se laissera jamais réduire à une analyse physique pure, et que ces unités, par un tel traitement cesseraient d'être des faits de langue. C'est cette découverte qui, à mon avis, explique pourquoi tant de linguistes, à partir d'un certain moment, tournèrent le dos à une phonétique instrumentale qui avait perdu tout lien avec les réalités linguistiques et créèrent, de plusieurs côtés plus ou moins à la fois, de nouveaux centres d'etudes consacrés  des questions plus purement LINGUISTIQUES (écoles dites structuralistes, phonolopiques, etc.). C'est ce même fait qui explique le phénomène à première vue étonnant que c'est du camp des techniciens de la transmission sonore qu'est issue l'initiative de cette fusion entre les deux approches qui caractérisent la phonétique moderne. Les ingénieurs, eux aussi, avaient à s'occuper de FAITS D E LANGUE (de phénomènes porteurs de significations et ayant par conséquent une valeur qu'il s'agissait de transmettre de façon à la rendre reconnaissable à l'arrivée du message). En partant de leurs expériences physiques et techniques, les ingénieurs réclamèrent, de la part des linguistes, la définition de CES INVARIANTS sans lesquels aucune transmission d'information n'est possible. C'est étonnant, pour dire le moins, que tant de phonéticiens de la vieille école n'aient pas compris la nécessité de cette exigence méthodique.
26
PHONÉTIQUE GÉNÉRALE
Si la langue est une structure — et il en est ainsi — elle est donc composée d'éléments discrets et est, par conséquent, analysable en de petites unités indépendantes dont les fonctions sont déterminées par leurs relations à d'autres unités avec lesquelles elles sont combinées (1) à I'INTÉRIEUR d'un système de possibilités communicatives, et (2) dans une CHAÎNE OU une SÉQUENCE. Si une linguistique est appelée structurale, ceci implique qu'elle s'occupe surtout de la description, de l'analyse des fonctions et des rapports — en un mot de la FORME de la langue ou d'une de ses parties. Si une étude de 1'EXPRESSION du langage (opposée ici au contenu) est dite structurale (phonologie, phonématique, phonémique, phonétique fonctionnelle, etc.) cette façon de parler impliquerait par conséquent que ce sont les rapports et les fonctions plutôt qu'autre chose qui seraient l'objet des analyses scientifiques. Certains linguistes ont tiré de ceci la conclusion — à première vue logique — qu'il n'y a que les relations abstraites, les schémas, les oppositions et les systèmes qu'elles forment qui appartiendraient au domaine de la linguistique et du linguiste et que l'analyse purement physique de l'onde sonore, des sons, et des processus physiologiques qui sont la cause extérieure de cette onde — ce mouvement vibratoire — ne relèverait pas de la linguistique mais de l'acoustique, de la physiologie, de l'anatomie, etc. C'est à mon avis ce malentendu qui explique la malheureuse division de l'ancienne phonétique en deux branches qui, trop longtemps, se sont battues et se sont fait concurrence, l'une ne sachant pas et ne tâchant pas de comprendre ce que faisait l'autre. A mon avis cette opposition entre les soi-disant phonologues et les soi-disant phonéticiens purs n'existe pas. Je vais jusqu'à prétendre que l'une de ces sciences est impossible sans l'autre. Le mécanisme linguistique suppose un jeu entre des unités discrètes qui sont les unes des autres — qui s'opposent par certaines caractéristiques, les traits dits PERTINENTS. Une langue à trois voyelles /// - /w/ - /a/ se sert donc de deux oppositions: antérieures-postérieures et ouvertes-fermées. Le /// est antérieur par rapport au u et les deux sont fermés par rapport au /a/ qui est neutre au point de vue acuité. Une langue qui connaît aussi un ¡ej et un /o/ connaît encore une distinction d'ouverture, celle qui connaît /e/ et ¡ej en connaît donc quatre, etc. Une langue qui se sert aussi de voyelles labiales \y\ - ¡0/ - ¡œj connaît de plus une distinction de labialisation, et ainsi de suite. Une linguistique qui se limiterait à l'établissement des rapports entre les unités ne saurait par conséquent rendre compte du genre de distinctions utilisées par le système, et passerait sous silence quelque chose d'essentiel. La phonétique telle que je la conçois est l'étude de ces rapports ÉGALEMENT DANS LEURS CARACTÈRES PHYSIQUES. La phonétique instrumentale ou expérimentale, tâche en utilisant toutes les ressources offertes par les sciences naturelles et par la technique, de rendre compte des correspondances physiques des distinctions fonctionnelles. Elle commence par établir le système, le nombre d'unités et le caractère abstrait des rapports — la fonction — et la DISTRIBUTION ( = les possibilités de combinaison des unités), pour passer ensuite à l'étude purement physique des différences établies et constatées par voie linguistique. DIFFÉRENTES
LA PHONÉTIQUE, SCIENCE DE SONS ET DE VALEURS
27
L'analyse phonétique passe par les étapes suivantes : 1. L'ANALYSE STRUCTURALE (d'abord préliminaire, ensuite définitive); méthode LINGUISTIQUE PURE;
2. L'analyse auditive minutieuse qui établit les valeurs auditives des faits phonématiques et fait une DESCRIPTION IMPRESSIONNISTE des principales variantes (analyse dont le résultat est déterminé en grande partie par les expériences linguistiques de celui qui écoute); méthode LINGUISTIQUE ET PSYCHOLOGIQUE; 3. L'ANALYSE INSTRUMENTALE qui vise à découvrir le ou les traits distinctifs porteurs de la valeur diiférentielle des phénomènes ainsi que les qualités physiques de ceux-ci ; méthode PHYSIOLOGIQUE et ACOUSTIQUE; 4. La SYNTHÈSE qui pourra seule répondre à la question de savoir lequel de plusieurs facteurs effectivement présents dans l'onde sonore est le trait pertinent (ou si, éventuellement, plusieurs facteurs possèdent, ensemble ou séparément, cette même force distinctive) ; méthode ACOUSTIQUE. Je fais remarquer que l'analyse structurale définitive n'est souvent possible qu'après cette dernière phase synthétique et que l'établissement de ces différents niveaux n'implique pas nécessairement d'ordre chronologique. Aucun de ces niveaux d'analyse n'est plus important que les autres. Il n'est pas indispensable que celui qui travaille sur un plan doive nécessairement aussi travailler sur les autres, mais il doit savoir ce qui se fait aux autres niveaux et il ne négligera pas impunément les résultats de ses collègues d'orientation différente. Si la langue dans sa qualité de moyen de communication social suppose la perception auditive de certains contrastes acoustiques, le jeu entre les qualités physiques de l'onde sonore et la sensibilité de l'oreille humaine aux stimuli acoustiques — déterminée qu'est cette dernière par la physiologie et par la STRUCTURE LINGUISTIQUE (PHONÉMATIQUE) — est d'une importance capitale pour la compréhension du langage humain et de son fonctionnement. Car, malgré tout, c'est ce jeu mutuel, dans sa stabilité aussi bien que dans son déséquilibre, qui est la condition sine qua non de la LANGUE et de la PAROLE, comme système statique aussi bien que comme phénomène historique toujours changeant. Nous voyons donc comment la phonétique par son aspect linguistique, psychologique, sociologique est, et doit être nécessairement, une science humaine. Les structures phonologiques, qu'on n'isole pas facilement des structures grammaticales et sémantiques, sont obligatoirement et par définition le point de départ de toute analyse phonétique. Mais nous voyons aussi que l'analyse de la substance rapproche la phonétique de certaines sciences PHYSIQUES. C'est grâce à cette double approche — physique et fonctionnelle — que la phonétique peut maintenant donner tant de contributions aux études des TROUBLES de la communication (rééducation des durs d'oreille, phoniatrie, troubles centraux de l'aphasie, etc.), contributions dont les médecins seuls, avec leur formation purement physiologique, ne sont pas toujours capables. Ce sont aussi, enfin, ces mêmes faits qui expliquent le rôle central de la phonétique — théorique et appliquée — dans l'enseignement des langues étrangères.
28
PHONÉTIQUE GÉNÉRALE
La première rencontre de la phonétique instrumentale traditionnelle avec les points de vue structuralistes provoqua un choc dans le camp des linguistes de la vieille école. On avait travaillé tranquillement à l'aide de quelques notions élémentaires de phonétique apprises dans les vieux manuels. Et on s'était adressé de temps en temps aux phonéticiens pour des renseignements de détail — la position de la glotte pour une occlusive sourde, ou la forme d'une courbe tonale. Les progrès acoustiques et physiologiques de la phonétique n'avaient pas trop inquiété ces messieurs qui ne sentaient pas, ou peu, le besoin d'en savoir davantage dans ce domaine. Il semble que ce soit surtout la notion de PERTINENCE (relevance) et sa contrepartie la REDONDANCE, mal présentées et mal interprétées comme l'étaient souvent au début ces notions, qui ont choqué les vieux. Seule la théorie moderne de la communication a rendu clairs le caractère et le rôle de la redondance dans la transmission de messages. L'arrivée du message à l'oreille — ou plutôt au cerveau — du récepteur suppose d'un côté un nombre restreint de stimuli. Une trop grande richesse dépasse les possibilités de l'homme. D'autre part, par une trop grande pauvreté le message risquerait de perdre en cours de route des éléments indispensables et de compromettre l'identification. Les conditions de transmission ne sont jamais optimales. L'identification demande une assurance contre les pertes, mais elle est également mise en danger par une abondance de faits redondants. La communication idéale, le message idéal, c'est le juste milieu entre une redondance extrême et une réduction au minimum des éléments transmis. C'est ce compromis perpétuel qui est une caractéristique essentielle du mécanisme linguistique — qui, au fond, explique qu'il soit possible de communiquer —, mais c'est aussi ce compromis qui est une des raisons des changements incontestables et incessants du langage et des langues. Les fameux changements phonétiques impliquent des modifications aussi bien des SONS que des VALEURS, de la SUBSTANCE et de la FORME. Le langage humain ne fonctionne que grâce aux rapports qu'il y a entre les deux.
3 ANALYSE LINGUISTIQUE ET INTERPRÉTATION AUDITIVE
La phonétique actuelle doit à I'ÉLECTRO-ACOUSTIQUE moderne sa connaissance solide de la structure acoustique du matériel sonore utilisé dans le langage humain et des qualités physiques qui manifestent les oppositions linguistiques sur le plan de I'EXPRESSION 1 du langage. Elle doit à la PHYSIOLOGIE et à la PSYCHOLOGIE D E LA PERCEPTION sa connaissance du comportement de l'oreille humaine devant les stimulus acoustiques émanant d'un appareil phonateur humain. Quelle est, sous ces conditions, la contribution de la phonétique pure, ou d'une façon plus générale de la linguistique, au problème théorique de l'intelligibilité de la parole et au problème pratique de la rééducation et de l'entraînement des sourds et des durs d'oreille? Voilà une question qu'il m'a semblé utile de soumettre à la méditation des membres de ce colloque. L'onde sonore qui sort de la bouche d'un sujet parlant est physiquement un C O N T I N U (continuum, dans le sens mathématique ou philosophique). Elle est INDIVISIBLE dans ce sens qu'il n'y a aucun facteur interne, aucune caractéristique intrinsèque qui en permette une SEGMENTATION objective, univoque. En regardant des spectrogrammes (Fig. 1-3), on est frappé par le caractère dynamique du complexe sonore, par le manque de stabilité, par les mouvements incessants, les mêmes mouvements qu'on retrouve, du reste, sur le plan articulatoire en regardant un film radiographique. Même si, par-ci par-là, il devient possible de découvrir un morceau de spectre présentant une certaine stabilité — par exemple la structure formantielle d'une monophtongue — il reste difficile ou impossible de constater l'existence d'une LIMITE indiquant où commence et où finit la structure en cause. On sait que n'importe quelle partie d'une onde sonore utilisée dans la parole est caractérisée, pas par un seul, mais par toute une série de phénomènes phoniques qui déterminent ensemble l'aspect auditif de celle-ci, interprétés synthétiquement par notre oreille comme une QUALITÉ. Déjà les anciens kymogrammes avaient appris aux phonéticiens que, — pour choisir un exemple —, au passage d'une consonne nasale à une occlusive sourde, la fermeture nasale n'était que rarement synchronisée avec le travail glottal (cessation des vibra1
EXPRESSION prise ici d a n s l e s e n s g l o s s é m a t i q u e , c ' e s t - à - d i r e o p p o s é e a u CONTENU. A u s s i b i e n l ' e x p r e s s i o n q u e l e c o n t e n u o n t u n e FORME e t u n e SUBSTANCE, d a n s le c a s d e l ' e x p r e s s i o n le SYSTÈME PHONÉMATIQUE et le MATÉRIEL SONORE r e s p e c t i v e m e n t .
30
PHONÉTIQUE GÉNÉRALE
tions laryngiennes) et que, par conséquent, il pouvait facilement se produire un élément parasite (nasale sourde ou occlusive sonore), segment sans valeur communicative et par conséquent inaperçu par l'interlocuteur. La synthèse moderne nous a appris l'importance des PHASES TRANSITOIRES (ou TRANSITIONS, INFLEXIONS) pour l'identification des consonnes. 2 La phase transitoire est un segment qui, s'il se laisse quelquefois facilement délimiter du côté de la consonne qui le provoque (surtout si c'est une occlusive ou une sourde), ne se laisse pas du tout délimiter de la voyelle dont il fait dans un certain sens une partie intégrante (Fig. 4-5). On sait, depuis les résultats obtenus aux Laboratoires Haskins de New-York, que, synthétiquement, il est possible de passer par étapes de l'occlusive à la spirante et à la diphtongue (type ab> aw> au) (Fig. 6). Dans le cas concret, aucune analyse purement spectrale ne peut donc décider, de façon sûre, si une figure donnée est à interpréter comme VOYELLE + OCCLUSIVE, VOYELLE + SPIRANTE ou VOYELLE + VOYELLE (donc diphtongue). Et aucune analyse du spectrogramme ne pourra décider si tel segment est une phase transitoire sans valeur communicative ou un élément porteur de signification. J'ai eu l'occasion récemment, à plusieurs reprises, de m'occuper, à différents congrès et colloques, des problèmes relatifs à ces phénomènes, et j'en ai parlé ici, à Paris, il y a quelques années, dans une communication intitulée "Opposition et identité" (imprimée dans le Journal Français d'Oto-Rhino-Laryngologie, I, Mémoires de Phoniatrie, Bulletin de la Société Française de Phoniatrie, VIII, 1 [1959], 65-83) et à laquelle je me réfère. J'y ai souligné, à l'aide de quelques exemples, que ni la durée, ni l'intensité sonore d'une partie donnée de la courbe n'expliquent seules pourquoi tel segment est perçu, et par là responsable d'un effet communicatif, et tel autre segment — égal, ou même supérieur, aux points de vue intensité et durée — reste sans influence aucune sur un auditeur. Les conditions nécessaires pour qu'une onde sonore soit identifiée comme un fait de parole sont essentiellement les suivantes : 1) qu'elle soit susceptible de SEGMENTATION; 2) qu'elle représente une POSSIBILITÉ parmi plusieurs autres (la variabilité étant le facteur qui détermine la quantité d'information contenue dans le stimulus); 3) que chaque segment se laisse IDENTIFIER avec une UNITÉ CONNUE D U SYSTÈME (du modèle) en s'OPPOSANT aux autres. En principe, la variabilité se fait à l'aide de trois paramètres : AMPLITUDE, FRÉQUENCE et TEMPS. Le langage est dit articulé par le fait d'être composé de, et analysable en, UNITÉS DISCRÈTES, arrangées en CHAÎNE. Déjà Saussure parlait du caractère LINÉAIRE du signe linguistique. La segmentation de l'onde sonore et sa décomposition en une série d'unités successives ne peuvent donc pas être réalisées à la base de la structure interne du complexe acoustique. La segmentation en unités discrètes, qui précède à son tour nécessairement son interprétation linguistique définitive, suppose l'existence, en dehors de toute 2
Voir mon livre La phonétique (Que sais-je?, Presses universitaires de France, 3 e éd. [1961]) p. 69, et, pour plus de détails et de références, mon article "Questions de méthode en phonétique synchronique" (Studia lingüistica, X [1956], 1-44).
ANALYSE LINGUISTIQUE ET INTERPRÉTATION AUDITIVE
31
réalité physique, d'un modèle ou d'un schéma ("a pattern") qui met en relief certains segments du continu indivisible de l'onde sonore — délimités arbitrairement par rapport à la substance physique — et en élimine d'autres. Ce modèle est indépendant de la substance dans ce sens que différents modèles peuvent être appliqués au même continu (des exemples dans mon rapport antérieur, cité tout à l'heure). Le même modèle ne convient peut-être pas également bien à toute substance, et il n'y a aucun doute que les qualités purement physiques de celle-ci puissent contribuer au choix du modèle. Nous touchons ici au problème compliqué des rapports entre FORME et SUBSTANCE, problème de base dans le débat théorique actuel sur le langage, mais que nous nous abstiendrons d'approfondir ici. Le modèle, c'est le système phonématique de la langue. Ce système comprend: (1) les VOYELLES et les CONSONNES — PHONÈMES dans un sens restreint —; (2) les faits PROSODIQUES caractérisant les combinaisons de celles-ci (syllabes, groupes) en les opposant les unes aux autres, et (3) les RÈGLES COMBINATOIRES qui déterminent la façon dont on peut combiner les phonèmes les uns avec les autres (les règles DISTRIBU3 TIONNELLES du système). Sans la maîtrise du modèle, la segmentation — et par là aussi l'interprétation — de l'onde sonore devient impossible. Si nous arrivons parfois dans une certaine mesure à décomposer une suite de sons dans une langue inconnue de nous, c'est grâce à la fausse application à ce continu de notre modèle à nous. Mais c'est justement en essayant d'y découvrir nos propres unités phonématiques que nous nous trompons, en reconnaissant à tort des voyelles, des consonnes ou des accents qui ne s'y trouvent pas. 4 L'étude de la façon dont nous percevons les sons d'une langue étrangère est très utile à ce point de vue et a souvent attiré l'attention des phonéticiens d'orientation théorique. J'ai souvent raconté l'histoire de la dame russe qui, devant prononcer le mot finnois yksi 'un', le fit en disant [juksi], c'est-à-dire en décomposant l'unité [y], inconnue du russe, en un segment palatal [7] et un segment labial, sans se soucier du fait que ces deux traits distinctifs, en finnois, caractérisent la même unité phonologique, le même segment. En russe, un phonème est ou bien palatal, ou bien labial, jamais les deux à la fois. Le facteur labialité est nécessairement combiné avec le facteur vélarité, donc [M]. La combinaison [ ju] était donc la seule façon dont cette dame russe pouvait PRECEVOIR et REPRODUIRE le [y] finnois.5 Il est pourtant important de se souvenir dans ce contexte que ce qui, du point de vue de l'interprétation phonologique, est une suite de phonèmes, est dans la réalisa3
Les numéros (1) et (2) constituent la STRUCTURE du dit PARADIGME, le numéro (3) celle du dit
SYNTAGME. 4
En réalité, aucune voyelle, aucune consonne et aucun accent ne s'y trouvent, ceux-là étant le résultat de I'INTERPRÉTATION STRUCTURALE du continu non structuré qu'est l'onde sonore. 5 II va sans dire que, dans le cas concret, on entendra et interprétera le complexe sonore selon son propre système phonématique, donc que le même stimulus acoustique |y] sera identifié par les uns comme un [/], par les autres par un [u] etc. (des exemples dans mon article précité "Opposition et identité"). L'exemple cité a eu pour seul but d'illustrer le fait que la segmentation, et par là même l'ordre temporel perçu, est, elle aussi, un effet de l'application du modèle sur le continu sonore et non pas, nécessairement, un phénomène de substance. Le résultat de la segmentation dépend entièrement du système à l'aide duquel elle se fait.
32
PHONÉTIQUE GÉNÉRALE
tion concrète, acoustiquement et physiologiquement, un complexe de phénomènes simultanés, dont l'ordre temporel dans lequel nous les percevons subjectivement est, dans une certaine mesure, un résultat de notre interprétation structurale (comme le [ju] dans l'exemple mentionné). Un de mes élèves, le phonéticien américain H.M. Truby, a étudié, dans sa thèse de doctorat, soutenue à l'Université de Lund {Acoustico-Cineradiographic Analysis Considérations with Spécial Reference to Certain Consonantal Complexes [Lund et Stockholm, 1959]), le phénomène de la dite COARTICULATION de certains complexes consonantiques. Il ressort de ses résultats que beaucoup de groupes consonantiques qui, auditivement, contiennent consonne + consonne, sont en réalité des ARTICULATIONS et des UNITÉS ACOUSTIQUES COMPOSÉS, OÙ le facteur temps — ou peut-être mieux ORDRE —, loin de se retrouver dans la réalité physique, est le résultat de notre interprétation linguistique. Prenons le français clou [klu]. Les lèvres sont arrondies d'un bout à l'autre de ce complexe, et la langue garde dans la mesure du possible sa position vélaire pendant l'émission de toute la syllabe. L'explosion du [&] a lieu — d'après les recherches de Truby pour l'anglais américain (ce qui est ici sans importance) — APRÈS la formation de l'occlusion 'latérale' apicale du [/] et prend la forme d'une explosion LATÉRALE qui devient une des caractéristiques distinctives du [£:] dans cette combinaison. Donc, le [&] et le [/] se prononcent SIMULTANÉMENT, ne se succèdent pas. Notre oreille fait donc en principe la même analyse du complexe [kl] que la dame russe du finnois [y]. Le système français ne connaît pas de phonème /A:// à double formation (apico-alvéolaire et dorso-vélaire) Notre interprétation du [kl] français comme une suite /k/ + /// est due au fait que l'occlusion dorso-vélaire d'un côté, la latérale apicale de l'autre, se retrouvent ailleurs dans des chaînes sonores françaises sans être liées l'une à l'autre et que le groupe, par conséquent, est décomposable ; [ku] et [lu] sont des mots français. Le secret des nombreux phonèmes africains à 'double articulation' — ceux à deux occlusions par exemple — qui nous paraissent tellement difficiles à reproduire, est très souvent à chercher sur le plan structural. C'est leur caractère monophonématique, qui ne permet pas à l'indigène de les décomposer structuralement en des unités plus petites, non pas leur formation physiologique, ni leur aspect purement acoustique qui les distinguent de nos consonnes à nous. Nous réalisons nous-mêmes, et sans nous en rendre compte, les mêmes tours de force en prononçant nos groupes de consonnes. La difficulté des consonnes 'doubles', africaines est d'ordre structural. Elle n'est ni physiologique, ni auditive. C'est I'INTERPRÉTATION de la substance qui fait difficulté, non pas la substance elle-même.6 Très souvent, dans nos langues européennes, c'est du reste une question de goût, si l'on veut interpréter, dans l'analyse purement linguistique, un groupe comme par exemple comme [&w] (fr. quoi, etc.), comme un seul phonème labio-vélaire, opposé au [k], non labial, ou comme une suite de deux phonèmes: ¡k\ + /R>/. C'est la structure du système entier, et non pas l'analyse physique, qui nous dira laquelle des solutions est à préférer. Si le système connaît à côté de 8
Ceci, bien entendu, est valable pour certains de ces types, non pas pour tous.
Fig. 1. Spectrogramme (Kay-Electric, échelle 2000 p/s, wide) de la phrase française qui est la fille ? [ki-E-la-fij], Noter le contraste entre le spectre diffus du [/'] (de [ki], [ f i j ] , le spectre compact du [a] ([/a]) et le spectre intermédiaire de [E] (la descente du formant 2 au passage de [;'] à [G]).
Fig. 2. Sonagramme de madame Duelos (même échelle).
t
r
e
i
s
.>«
•
»
Fig. 3. Sonagramme des trois noms de nombre suédois tre, fyra, fem ( = trois, quatre, cinq): échelle 2.000 par pouce, filtres "narrow". Rem. par exemple l'importante transition (changement du formant 2) caractéristique des combinaisons avec [/•] postérieur dans tre, fyra.
Fig. 4. Sonagramme de est-un homme. Les phrases transitoires (changement des formants 1, 2 et 3) entre les consonnes [/] et [«] et la voyelle suivante sont particulièrement nettes. Echelie: 2.000 pér. par pouce, filtres "wide".
Fig. 5. Spectrogrammes synthétiques (méthode Haskins, Pattern Playback, spectrogrammes peints à la main) de groupe consonne + voyelle (occlusives et spirantes) et voyelle + voyelle (diphtongues). Des tests faits avec de tels groupes synthétiques ont prouvé que la vitesse de la transition seule est suffisante pour donner l'impression des distinctions en cause. La figure reproduite d'après les publications du groupe Haskins (Cooper, Libermann, Delattre, Gerstman, Harris, etc.).
£
i-
y
f
3
Fig. 6. Spectrogramme de la phrase est-une femme [yn fam]. Noter le contraste entre le [e] et le [>] dont le formant 2 est abaissé par la labialisation, les transitions des formants du [y] au contact des consonnes [/] et [n] et du [a] au contact du / précédent, et le spectre compact du [a], ainsi que le bruit caractéristique de [/].
ANALYSE LINGUISTIQUE ET INTERPRÉTATION AUDITIVE
33
kw un ¡k¡ et un /w/, admissibles dans le même entourage que /kw/, la solution biphonématique est à préférer. Si le /kw/ peut s'opposer à un ¡k\ mais pas à un /w/, c'est la solution monophonématique qui s'impose. 7 Grâce à une combinaison d'analyse et de synthèse, la phonétique acoustique moderne est arrivée à constater que, parmi les éléments fonctionnels utilisés dans l'expression linguistique, un très grand nombre se manifestent pour ainsi dire par une COOPÉRATION de plusieurs phénomènes physiques, qui ne sont pourtant pas tous au même titre indispensables pour une identification correcte. Ces éléments REDONDANTS garantissent l'identification du message et contrebalancent le rôle fatal des perturbations de la transmission et des défectuosités de la réception. C'est surtout le cas pour les CONSONNES, le squelette de la chaîne sonore, bien plus importantes pour l'interprétation de l'expression que les voyelles. Les bruits caractéristiques des consonnes se retrouvent surtout dans le domaine supérieur des fréquences. Mais la découverte du rôle des phases transitoires entre voyelle et consonne ou entre consonne et voyelle et de leur importance pour l'identification des phonèmes consonantiques implique aussi la découverte de stimulus DANS LE DOMAINE GRAVE, stimulus susceptibles de fonctionner provisoirement comme traits distinctifs des consonnes. Pour une oreille normale, ces phases transitoires jouent peut-être un rôle secondaire pour l'identification (cf. les résultats récents de Cohen, etc.). 8 Pour quelqu'un, au contraire, qui n'entend que les fréquences basses et qui, par conséquent, n'arrive pas à distinguer, à l'aide du bruit seul (l'explosion par exemple, s'il s'agit d'une occlusive), entre u n p et un t, peut le faire en apprenant à identifier la différence de transition d'une voyelle à un p et à un t respectivement. 11 est possible que des différences à cet égard jouent aussi un rôle pour l'identification des segments que nous appelons traditionnellement syllabes.9 En réalité, il y a dans ces phénomènes la base phonétique des nombreux résultats obtenus ces dernières années à l'aide de l'entraînement auditif des enfants sourds. 10 Il y a maintenant sept ou huit ans que j'enseigne moi-même que ce sont les transitions — excitations acoustiques basses — qui permettent aux sourds d'apprendre à percevoir, et par là aussi à réaliser les distinctions consonantiques qui leur permettront malgré tout la maîtrise d'un LANGAGE AUDITIF. Il y a peu de jours, il m'est tombé sous la main un petit article, publié en suédois, qui rend compte d'expériences confirmant la justesse de mes considérations théoriques (de M l l e Mary Weiss, d'Upsel; Nordisk Audiologi, X, 7, [1961], 129-134). En éloignant, sur des bandes magnétiques, la partie qui correspond à la consonne 7
Cf. mon article "Phonèmes labio-vélaires en espagnol", à paraître dans Phonetica (volume dédié à Daniel Jones, II). 8 Rapport préliminaire au Congrès international des sciences phonétiques de Helsingfors, septembre 1961. 9 Voir mon article "The phonetic Basis for Syllable Division", dans Studia lingüistica, IX (1955), 80-87 [ici même, pp. 00-00]. 10 Voir surtout Erik Wedenberg, "Auditory Training of Deaf and Hard of Hearing Children" (Acta Oto-lar yngologica, Supplementum XCIV [Stockholm, 1951]) et id., Auditory Training of Severely Hard of Hearing Pre-school Children (ibid., Supplementum CX [Stockholm, 1954]).
34
PHONÉTIQUE GÉNÉRALE
proprement dite et en ne laissant intacte que la phase transitoire, l'auteur a réussi à constater le rôle de ces phases pour l'audition et l'importance de l'entraînement pour la possibilité d'une oreille même très défectueuse d'apprendre à s'en servir pour l'identification. Il en résulte que les sourds arrivaient, après un entraînement auditif systématique, nettement mieux que les sujets à audition normale, à identifier les mots ainsi déformés. Mais l'identification d'un fait de parole n'est pas exclusivement une question de physiologie auditive. Tout acte de perception implique un choix entre un nombre très grand, en réalité toujours trop grand, de stimulations. C'est tout particulièrement le cas de l'audition. Et on sait que la parole contient un nombre excessivement grand de faits redondants. C'est en ceci que consiste l'extrême importance d'une maîtrise parfaite du modèle linguistique pour la perception auditive de celle-ci. On connaît les effets, chez les aphasiques, des perturbations centrales de cette maîtrise du système. Mais il n'est pas indifférent, pour la faculté de se servir d'un système de signes, si les stimulations par lesquelles doivent se manifester acoustiquement les phonèmes, sont forts ou faibles, et si les différences sonores qui sont à la base des oppositions phonologiques sont subtiles, et par là instables, ou solides. Plus les distinctions utilisées dans un système de phonèmes sont fines, plus l'application concrète de ce système devient difficile, et plus le sentiment des oppositions phonétiques s'affaiblit. Le sourd qui n'a à sa disposition qu'un instrument de discrimination défectueux, et utilisable seulement dans le domaine grave, et qui, pour différencier un p d'un t ou d'un b, est obligé de recourir à une subtile différence de timbre — une chute du premier ou du deuxième formant de quelques dizaines de fréquences — réalisée peut-être, au comble du malheur, avec une intensité qui se trouve juste au-dessus du seuil inférieur de sa capacité discriminative, aura bien plus de difficulté à maîtriser le système phonématique que l'individu normal. Une condition pour qu'un individu sourd arrive à réaliser, malgré tout, ce tour de force est qu'il ait une parfaite connaissance de ce système et une expérience solide de la distribution des phonèmes. Il doit bien connaître les possibilités offertes par le système, pour pouvoir bien calculer les probabilités pour que telle stimulation auditive soit la réalisation de tel phonème, ou tel autre. Car dans une très large mesure nous entendons ce que nous nous attendons à entendre. L'expérience linguistique du sujet, basée sur des exercices systématiques des types et des combinaisons les plus courants dans la langue en cause, est une aide importante quand il s'agit d'identifier une unité linguistique. Ce qu'on entend est un p parce que, dans l'entourage en question, ce ne peut pas être un b, etc. L'intérêt qu'offrent les recherches phonétiques pour les problèmes d'audition et d'intelligibilité ne s'arrête donc pas à I'ANALYSE PHYSIQUE de l'onde sonore et de ses composants, ni à la SYNTHÈSE, qui permet d'en déterminer les traits distinctifs et les faits redondants. C'est grâce à l'analyse PHONÉMATIQUE seule que le thérapeute pourra connaître la structure du modèle que le sourd doit maîtriser afin d'arriver, tant bien que mal, à appliquer dans sa communication verbale un système d'excitations sonores. C'est enfin grâce à l'analyse DISTRIBUTIONNELLE et à la STATISTIQUE PHONÉMATIQUE que le thérapeute
ANALYSE LINGUISTIQUE ET INTERPRÉTATION AUDITIVE
35
pourra familiariser l'élève avec les règles combinatoires et, par là, avec le nombre et le genre de possibilités entre lesquelles celui-ci a à choisir, et qu'il pourra lui offrir un choix de modèles représentatifs et de haute fréquence. On sait que, selon la loi de Zipf, les types simples — les plus faciles à apprendre et à distinguer — sont aussi les plus fréquents, les types compliqués et les structures complexes les plus rares. Ceci vaut aussi bien pour les phonèmes que pour les syllabes et pour les mots. Inutile d'ajouter qu'une maîtrise correspondante du système des formes grammaticales, des procédés syntaxiques, de la phraséologie et du vocabulaire contribuera encore à réduire beaucoup, chez le sujet écoutant, le nombre de possibilités et à augmenter ses chances de prévoir ce qui suivra, donc de réduire considérablement la quantité d'information contenue dans les éléments sonores. Cette réduction, pour des raisons évidentes, facilite l'identification des éléments de base (des phonèmes) d'abord, et par là aussi des unités plus grandes formées par ceux-là.
4 VOYELLES LONGUES ET VOYELLES BRÈVES
Marguerite Durand a donné avec le livre dont on lit le titre ci-dessus une contribution importante à la phonétique générale. 1 L'auteur avait publié déjà avant la guerre quelques études sur des questions de quantité vocalique. Nous pensons à son article dans les Études phonologiques dédiées à la mémoire de N. S. Trubetzkoy (Travaux du Cercle linguistique de Prague, VIII [1939], 43-50) et à sa communication au congrès de Gand en 1938 (Proceedings of the Third International Congress of Phonetic Sciences, pp. 261-265). Le problème de la quantité a retenu souvent l'attention des linguistes. On a tâché de le résoudre à l'aide des instruments, et on a aussi voulu l'interpréter au point de vue de sa fonction linguistique. On trouvera un aperçu assez complet des recherches sur la quantité faites sous ces différents points de vue dans le deuxième chapitre du livre dont nous allons nous occuper (historique des recherches sur la quantité vocalique). 2 L'auteur s'appuie dans son étude essentiellement sur trois sources différentes: des recherches personnelles, exécutées dans le laboratoire de phonétique de Paris; les travaux publiés par les autres phonéticiens qui se sont occupés, surtout expérimentalement, de la quantité ou des questions connexes (et dont elle a su tirer grand profit); et troisièmement les mémoires déposés à l'Institut de phonétique de Paris par les étudiants qui passent leur examen de phonétique (dont la plupart sont des ouvrages non publiés). Ces mémoires ont fourni à l'auteur de très précieux renseignements sur la durée et l'intonation dans les langues les plus diverses: anglais, allemand, flamand, hongrois, estonien, chinois, siamois, arabe, etc. L'auteur de ces lignes a retrouvé dans la liste des mémoires utilisés aussi son étude sur les accents suédois, 1 Je cite parmi ses ouvrages antérieurs les deux thèses de doctorat Le genre grammatical en français parlé à Paris et dans la région parisienne, et Étude sur la durée des consonnes parisiennes, de 1936. 2 Parmi les ouvrages particulièrement importants sur notre problème que l'auteur n'a pas consultés je note les articles de Collinder, "Über den begriff der quantität mit besonderer rücksicht auf die lappische Sprache" (Journal de la Société finno-ougrienne, XLII [1928], 1-24), et "Über Quantität und Intensität" (Neuphilologische Mitteilungen, XXXVIII [1937], 97-120), l'étude de R. Ekblom, Quantität und Intonation im zentralen Hochlitauischen (Uppsala, 1925) et les articles de Menzerath, "Deutsche Vokalquantität" (Teuthonista, V [1928-1929], 208 ss) et "Zur deutschen Lautquantität" (ibid., X [1934], 238-248). On trouvera des renseignements très complets sur la littérature récente chez Eli Fischer-j0rgensen dans les Acta linguistica, II (1940-1941), 175-181.
VOYELLES LONGUES ET VOYELLES BRÈVES
37
présentée pour l'examen de phonétique en 1938 (seulement cataloguée fautivement sous l'année 1935, selon les renvois et la bibliographie). 3 Les résultats présentés dans les travaux de ses prédécesseurs et dans les mémoires de l'Institut de phonétique ont paru à l'auteur déconcertants et complexes (p. 32). Déconcertants, parce que, tantôt les longueurs mesurées correspondent à l'impression auditive, tantôt elles en diffèrent. Très souvent, une même durée subjective est comprise dans un intervalle considérable qui empiète largement sur l'intervalle d'une autre. Il peut arriver qu'une brève soit égale, voire même supérieure à des longues. 4 Pour prendre un exemple, dans un mémoire sur la quantité de la voyelle o en angloaméricain (accentuée et inaccentuée) les durées de la longue s'égrènent entre 4 et 43 es, celles des brèves entre 3 et 36 es. En réunissant les matériaux sur quatre langues examinées (anglo-américain, flamand, hongrois et siamois), l'auteur a pu dresser des diagrammes de l'amoncellement des durées qui présentent entre eux des ressemblances frappantes et qui permettent à l'auteur de poser la règle générale que les voyelles brèves présentent une assez grande stabilité, tandis que les longues sont très instables dans leur durée. Pour le flamand, par exemple, les durées s'échelonnent pour les longues entre 10 et 55 es, pour les brèves entre 9 et 27. Pour le hongrois, les longues sont comprises dans l'intervalle 17-45 es, les brèves entre 12 et 25. Pour le siamois, les intervalles sont respectivement 8-60 et 4-35. A la fin de ce même chapitre, l'auteur discute les problèmes que pose l'interprétation phonologique de la quantité vocalique et les tentatives faites, par les phonologues aussi bien que par les phonéticiens purs, pour transformer pour ainsi dire la quantité en qualité (opinions de savants comme E. Richter, Gemelli, Laziczius, Stetson, Trubetzkoy, etc.). 5 L'auteur a eu aussi l'amabilité de citer, dans ce contexte, un petit article que celui qui écrit ces lignes a publié dans les Acta linguistica, III 3
Les matériaux contenus dans ce mémoire ont été publiés, sous une forme quelque peu différente (sous la rubrique Recherches expérimentales sur l'accent musical du mot en suédois), dans les Archives néerlandaises de phonétique expérimentale, XVI, 62-76. 4 On sait que des résultats analogues avaient été obtenus déjà par Ernst A. Meyer dans ses travaux Englische Lautdauer (Uppsala, 1903), "Zur Vokaldauer im Deutschen" (Nordiska studier tillegnade Adolf Noreen [1904], 347-356), article que Mlle Durand n'a pas utilisé, et "Zur Phonetik der ungarischen Sprache", en collaboration avec Z. Gombocz (Le Monde Oriental [1907-1908], 122-187), qui ne figure pas non plus dans la bibliographie de l'auteur. Il me semble que Mlle Durand, qui connaît pourtant le premier de ces travaux de Meyer, a trop peu tenu compte des résultats généraux obtenus par ce savant pour ce qui est des variations de durée dues au timbre de la voyelle (le fait par exemple que la quantité propre, toute condition égale d'ailleurs, est proportionnelle au degré d'ouverture). Le fait qu'un [a] bref (quantité subjective) est plus long qu'un [/] long (quantité subjective) ne gêne pas, tant que les deux [i] et les deux [a] (longs et brefs) ne sont pas confondus.On peut regretter quelque peu que Mlle Durand n'ait pas du tout touché aux problèmes intéressants relatifs à ces phénomènes. Il me semble probable qu'en partant des résultats de Meyer l'auteur aurait posé son problème un peu différemment, et certainement mieux. Je souligne aussi que le classement fait en longueurs phonologiques et non phonologiques n'est pas suffisant. Je renvoie pour tous ces problèmes à mon livre Die Quantität als phonetisch-phonologischer Begriff (Lund, 1944), surtout pp. 5-36 (travail que Mlle Durand n'avait pas encore vu au moment de publier son étude). 5 Voir dans ce contexte aussi l'article de Pierre Naert dans les Cahiers Ferdinand de Saussure, III (1943-1944), 15-25, et, pour l'aspect purement phonologique du problème, P. Eringa, Het Phonologische Quantiteitsbegrip (1948).
38
PHONÉTIQUE GÉNÉRALE
(1942-1943), 44-56, sur la quantité des voyelles françaises, où il a été établi une différence entre les voyelles qui PEUVENT être allongées (les longues, selon l'opinion traditionnelle) et les vraies brèves (qui ne possèdent pas cette faculté). C'est là une théorie que j'ai émise pour concilier deux faits également nets en français: que les voyelles dites longues perdent facilement, dans la chaîne parlée, leur quantité pour s'assimiler aux brèves (des mots comme aile : elle, reine : renne, tête : tette devenant homonymes), et que, d'autre part, il est possible d'insister en français sur la différence de quantité si la compréhension l'exige. Il va sans dire que je n'ai pas voulu attribuer à cette distinction "subtile" (selon Mlle Durand, p. 41) une validité générale.6 Mlle Durand a l'air de vouloir accepter ma thèse pour ce qui est des faits français. Après avoir constaté que les différences dans les durées mesurées très souvent ne suffisent pas à expliquer les différences de longueur que l'oreille croit distinguer — que cette quantité soit "extérieurement déterminée" ("äusserlich bestimmt", selon Jespersen), donc conditionnée par l'entourage et par conséquent dénuée de valeur phonologique, ou qu'elle soit "intérieurement déterminée" ("innerlich bestimmt") et fonctionnelle7 — l'auteur passe, dans le chapitre III, à l'étude du rapport entre la quantité d'une voyelle et son mouvement musical. C'est, me semble-t-il, dans ce chapitre que l'auteur a donné les contributions les plus précieuses à la solution du problème qu'elle a posé. Déjà dans son travail de 1936 sur le genre grammatical en français parlé, Mlle Durand avait constaté que des couples comme grand : grande, gros : grosse — différenciées selon l'oreille par leur quantité — se distinguaient non pas par leur durée mesurée mais par leur intonation: les "longues" étaient dites sur un ton nettement descendant, les "brèves" au contraire sur un ton uni ou légèrement ascendant. Partant de ces faits français, l'auteur s'est tournée vers d'autres langues pour voir si c'est là un phénomène général ou s'il est restreint au français. Les mots flamands kook, koop, meet montrent tous une courbe nettement descendante: de 150 jusqu'à 95 v/s pour kook, de 150 jusqu'à 80 pour koop, de 155 jusqu'à 100 pour la voyelle longue de meet. Dans les mots à voyelle brève ton et ver, le ton monte d'un tiers et d'un quart respectivement, dans toon et veer il descend d'environ un quart et d'une quinte respectivement. Le même résultat revient en anglo-américain: le [/:] de thief (durée mesurée 28 es) descend de sept demi-tons, le [/] (de pip, lip) est ou bien descendant-montant (durée 29 es) ou bien uni jusqu'à la fin. Cela nous mènerait trop loin de nous arrêter sur tous les cas examinés (de sujets libanais, hongrois etc.). Les mesures des voyelles hongroises correspondent assez bien aux chiffres bien plus nombreux de Meyer-Gombocz dont l'auteur aurait pu tirer grand profit. 8 Citons quelques cas estoniens (où nous savons qu'il existe trois degrés de longueur vocalique 6
Cette idée doit être regardée comme une conséquence de mon opinion générale sur la notion de pertinence en phonologie que j'ai émise par exemple dans mon étude Système et méthode (Lund, 1944) et dans Till frâgan om sprâkets systemkaraktär (Lund, 1947). 7 Je renvoie à mon livre Die Quantität, surtout pp. 11 ss. 8 Dans les monosyllabes, les voyelles brèves s'échelonnent entre 9,i et 19,5 es, les longues entre 21,i et 33,9 (plus ou moins les mêmes proportions que pour les voyelles finnoises); Meyer-Gombocz, p. 11.
VOYELLES LONGUES ET VOYELLES BRÈVES
39
à caractère phonologique).9 Dans cette langue, les durées mesurées correspondent bien à l'impression auditive. Les voyelles de la première durée oscillent autour de 10 es, celles de la seconde durée autour de 25 es, et celles de la troisième autour de 45 es. Dans la triade sada (bref): saada (long): saada (extra-long), les mouvements musicaux sont les suivants: a 1 montant de deux demi-tons, o2 montant de quatre demi-tons, puis descendant de deux; a 3 descendant de deux demi-tons. Il semble que, même dans les cas où il y a correspondance entre la durée perçue et les résultats des mesures, les longues soient caractérisées par cette intonation descendante qui, dans une langue comme le français, semble avoir pris la place de la longueur. D'après P. Ariste ("A Quantitative Language", Proceedings of the Third International Congress of Phonetic Sciences [1938], 280), l'opposition entre long et extra-long en estonien serait en train de se transformer dialectalement en une opposition de hauteur musicale ("not so much a real quantity as just a différent pitch"). 10 Pour obtenir, si possible, une confirmation des résultats de Mlle Durand pour ces langues nettement quantitatives, l'auteur de ces lignes s'est permis de les vérifier sur un sujet de langue finnoise, où l'on s'attendrait a priori à trouver les mêmes phénomènes qu'en estonien. Le finnois est caractérisé par une simple opposition de durée très nette. J'ai choisi quelques paires de mots à voyelles longues et à voyelles brèves (toniques), et je les ai fait prononcer par un sujet finnois résidant en Suède (M. P. Virtaranta, lecteur de finnois à l'Université de Lund). Voici d'abord le résultat des mesures: a long devant occlusive sourde géminée 31,3 es (moyenne de dix exemples, à savoir kaappi six fois, et kaakki quatre fois), a bref dans la même position (pappi et takki) 14,° (moyenne de dix exemples), u long devant / (tuuli) 23,8 es (moyenne de six exemples), u bref devant / (tulee) 8,3 es (moyenne de six exemples), u long devant r (suuri) 29,7 (moyenne de quatre exemples), u bref devant r (suru) 17,7 (moyenne de quatre exemples). La moyenne de toutes les longues mesurées est de 29,3 es, celle des brèves de 13,6. Le nombre restreint d'exemples ne nous permet pas d'attribuer à ces chiffres une validité générale (la durée du u bref de suru étonne par exemple, mais l'influence du r y est peut-être pour quelque chose). Quoi qu'il en soit, il me semble que ces mesures confirment le fait, déjà constaté (cf. par exemple les travaux de J. Laurosela 11 et de Kai Donner 12 ), que les durées subjectives, en finnois, correspondent tout à fait aux longueurs mesurées.13
9
On sait que ce serait aussi le cas dans certains parlers allemands (selon Menzerath, ouvrages cités ci-dessus; cf. Malmberg, Die Quantität, pp. 51-52). 10 Voir aussi id., Eesti keele hääldamine (Tartu, 1939), p. 88, et Penttilä-Posti, Finnisch-ugrische Forschungen, XXVII, p. 235. 11 Etelä-pohjanmaan murteesta (Helsingfors, 1922). 12 Salmin murteen kvantiteettisuhteista (extrait de "Suomi") (Helsingfors, 1912). 13 Les mots examinés ont tous été prononcés dans de brèves phrases sur un ton tranquille et indifférent et, dans la mesure du possible, avec le même accent expiratoire (par exemple tulee tuuli 'le vent vient'). Les mots et les phrases ont été proposés par M. Virtaranta.
40
PHONÉTIQUE GÉNÉRALE
Fig. 2. La courbe mélodique du u long de tuuli.
Fig. 1. La courbe mélodique du a long de kaappi.
- 2 0 0 pjs -g •f - e .if
J
t -c Fig. 3. La courbe mélodique du u long de suuri.
u
l
e
e
Fig. 4. Courbe mélodique du « bref et du e long de tulee (la courbe du / a été pointillée pour mettre en relief les mouvements musicaux des voyelles).
La mesure de l'intonation de ces mêmes voyelles, faite avec l'appareil de Meyer 14 sur un tracé kymographique obtenu à l'aide d'un "Kettererschreiber" (voir Studia linguistica, 2 [1949], pp. 106ss) a donné les résultats suivants: les longues sont toutes carac-) térisées par une mélodie descendante dans la deuxième moitié de la voyelle; la première partie est montante dans quelques cas (kaappi, tuuli), plus ou moins unie dans les autres (kaakki, suuri, légèrement montante dans ce dernier mot). La descente est d'environ deux tons (un ton et demi dans suuri et dans un des cas de kaakki)-, la montée, dans les cas où il y a une, est également de deux tons. Les brèves sont montantes au début (un demi-ton ou un ton), puis essentiellement unies. Je reproduis ici les courbes de kaappi, de tuuli, de suuri (longues) et de suru, tulee (brèves). Le e long final de ce dernier mot (durée mesurée 22, 3 es)15 était descendant de presque un ton. 14
Voir la description dans Monatsschrift für die gesamte Sprachheilkunde 1911, ou dans Die Intonation im Schwedischen, pp. 15-37. 15 Moyenne de six exemples enregistrés.
VOYELLES LONGUES ET VOYELLES BRÈVES
41
-a .200 pis— -g.ZJ s u
r
-f Fig. 5. La courbe mélodique du u bref de suru.
De ces langues quantitatives l'auteur passe à l'examen de deux langues dénuées de quantités auditivement perceptibles, l'espagnol et le polonais. On a l'habitude de caractériser les voyelles espagnoles comme des brèves qui peuvent s'allonger selon les circonstances sans jamais atteindre la durée des voyelles longues d'autres langues (Navarro Tomás, Manual de pronunciación española, § 176). Ceci revient à dire que le sujet parlant, dans ces langues, n ' a pas conscience des différences de durée qui, bien entendu, existent (et qui, d'après ce que Mlle Durand a constaté pour l'espagnol, peuvent être assez considérables, dans la proportion 1-2). 16 La raison en serait qu'une langue comme l'espagnol ne possède pas les différences MUSICALES qui, dans les langues dites quantitatives, contribuent à opposer les longues aux brèves. Les voyelles accentuées en espagnol sont d'intonation montante, les inaccentuées de ton uni (p. 95). 17 De même, en polonais les voyelles sont de ton uniforme ou plutôt invariablement montantes (p. 104). C'est pourquoi les voyelles de ces langues ne présentent pas de différences quantitatives perceptibles malgré les différences considérables constatées au point de vue de la durée mesurée (pp. 95-96). Je peux ajouter ici, à propos de l'espagnol, que dans un dialecte de l'espagnol dont je me suis occupé spécialement, l'argentin, les voyelles sont caractérisées par un allongement considérable par rapport aux voyelles de l'espagnol européen. C'est une des caractéristiques les plus saillantes de la phonétique argentine. Et cet allongement est toujours accompagné d'une intonation fortement descendante. Les deux phénomènes vont de pair sans que l'oreille ait de moyen de décider ce qui est plus important, la quantité ou la mélodie. Il est possible aussi que ce que l'on entend comme longueur soit en réalité souvent un phénomène essentiellement musical. On trouvera des indications plus amples sur cette question dans un travail que je prépare. En tout cas, les faits argentins constituent une confirmation évidente de la thèse de Mlle Durand. Il existe, de la main de M. Ernst W. Selmer, des études instrumentales sur une autre langue dénuée aussi bien de quantité que d'intonation fonctionnelles. C'est 16
Selon Navarro Tomás, les différences quantitatives en espagnol sont encore plus importantes, s'élevant jusqu'à la proportion 1-4 (Fonología española, p. 65, Revista de filología española, III [1916], 387-408, et IV [1917], 371-388; il est curieux que ces études instrumentales sur la quantité espagnole ne figurent pas dans la bibliographie de Mlle Durand). 17 L'auteur semble ignorer qu'un examen instrumental très minutieux des faits quantitatifs espagnols a été exécuté par P. Menzerath et J. M. de Oleza (Spanische Lautdauer; eine experimentelle Untersuchung [Berlin-Leipzig, 1928]).
42
PHONÉTIQUE GÉNÉRALE
le géorgien (Georgische Experimentalstudien, Opuscula phonetica, XI [Oslo, 1935]).18 L'intonation est de caractère monotone, en principe descendante. Les voyelles ont leur plus grande durée absolue dans une syllabe ouverte et suivie d'une consonne simple (type AjPA; moyenne 21,59 es). Ce sont les courbes de ce type de mots qui montrent la mélodie la plus nettement descendante (avec quelques exceptions), tandis que les voyelles suivies de groupes plus lourds (type a(pr{qa), a(xwda), etc., avec une moyenne de 13,42 es) montrent, au moins dans quelques cas (par ex. dzodzoxet'i, p. 22), une courbe plus irrégulière (montante ou plus ou moins unie). M. Selmer fait remarquer, à propos des faits quantitatifs de cette langue, qu'une étude systématique de tous les phénomènes connexes et exécutée à l'aide de plusieurs sujets, apporterait probablement beaucoup d'informations d'intérêt général (p. 33). Le même savant a examiné aussi le zoulou (Experimentelle Studien zur Zulu Phonetik, Opuscula phonetica, X [Oslo, 1933]) au point de vue de son intonation musicale. Le mot zoulou umuntu 'homme' a été prononcé seul et dans la phrase umuntu(h)umuntu 'l'homme est un homme'. Dans le mot isolé, le premier u est d'une mélodie légèrement ascendante, le deuxième relativement uni et nettement descendant vers la fin. Cette voyelle a donc l'intonation propre, selon Mlle Durand, à une voyelle "longue". Dans la phrase, par contre, ce même u du premier mot montre une mélodie essentiellement unie et, au moins dans la plupart des cas, nettement ascendante vers la fin, tandis que dans le deuxième mot (le "prédicat" de la phrase) la voyelle en question reste descendante. Le premier mot (le "sujet") a donc été abrégé dans la phrase par rapport à la prononciation isolée, d'où un raccourcissement des voyelles, accompagné à son tour d'une intonation différente. Ces faits zoulou, dans la mesure où il est permis d'y attribuer une validité générale, confirmeraient donc encore une fois les conclusions de Mlle Durand. L'auteur tire des constatations faites la conclusion que les oppositions phonologiques de durée sont intimement liées à des oppositions phonétiques de ton et que le temps perçu, et bien souvent à faux, est lié à un ton non perçu (p. 105). La question se pose maintenant de savoir ce que sera dans ce cas la durée dans les langues dites à ton, où la hauteur musicale occupe déjà une fonction particulière, autre que celle d'indiquer la "longueur". D'une série d'exemples choisis parmi les langues à ton (serbo-croate, plusieurs dialectes de l'Extrême Orient), l'auteur croit pouvoir tirer la conclusion suivante. D'abord, dans certaines langues il y a un rapport direct entre la quantité et l'accent de sorte que le ton descendant est en même temps perçu comme "long". Dans les cas où, par contre, aussi bien un ton montant ou uni qu'un ton descendant peuvent se combiner avec les deux degrés de durée, deux solutions sont adoptées pour résoudre le conflit: (1) donner aux toutes dernières vibrations de la voyelle, quel que soit son 18
Cf. aussi Hans Vogt, Grammaire géorgienne: "Le géorgien ne comporte ni d'accent expiratoire ni d'accent musical net. La prononciation est monotone et le rythme syllabique est constitué par une légère élévation de la voix accompagnée d'un faible accent expiratoire sur certaines syllabes" (cité d'après Selmer, op. cit., p. 6).
VOYELLES LONGUES ET VOYELLES BRÈVES
43
mouvement musical d'ensemble, la descente ou la montée voulues par leur quantité auditive; (2) adopter des rapidités différentes dans les montées et les descentes (pp. 133-134). Pour obtenir si possible une solution de ce problème, l'auteur a eu recours aussi au suédois. Malheureusement elle s'est contentée des indications insuffisantes qu'elle a trouvées dans mon mémoire déposé à l'Institut de phonétique (mais n'aurait-il pas mieux valu renvoyer à l'article publié dans les Archives néerlandaises, XVI, où on retrouve toutes les courbes et qui est à la portée de tout le monde?). Il va sans dire que mes matériaux — réunis pour résoudre un tout autre problème — n'ont pas été suffisants pour répondre à la question du rapport entre longueur et intonation. Dans le dialecte que je parle, l'accent 1 est nettement descendant, l'accent 2 uni ou légèrement montant, indépendamment de la quantité de la voyelle. Il s'agirait donc de constater si, sous l'accent 1, une voyelle longue est plus fortement descendante qu'une brève, et si, sous l'accent 2, la longue est caractérisée par une chute dans les toutes dernières vibrations malgré son caractère en principe montant ou uni. Quelquesunes de mes courbes l'indiquent. Mais est-ce général? Puisque c'est grâce à l'insuffisance de mes matériaux que Mlle Durand a dû laisser ouverte cette question, je me sens obligé de tâcher d'y donner une réponse. Voyons d'abord ce que fournissent les autres études publiées sur le problème. On est étonné de voir que, vu l'importance capitale de cette question pour son problème, l'auteur se soit contentée des maigres renseignements contenus dans un travail fait par un débutant en phonétique expérimentale. Il me semble évident que l'auteur aurait dû se référer en premier lieu au grand ouvrage de E. A. Meyer, Die Intonation im Schwedischen, I (Stockholm, 1937), où elle aurait trouvé une documentation abondante. 19 Un coup d'œil sur les nombreuses courbes de Meyer montre que, dans les monosyllabes — où l'opposition d'accent n'existe pas — les longues sont caractérisées par une chute considérable du ton, normalement entre 3 et 5 tons. Malheureusement, on ne trouve que peu d'exemples de monosyllabes avec voyelle brève, de sorte qu'il est difficile de voir s'il y a éventuellement une différence entre, disons, hat et hatt, fat et katt, svan et spann. J'en note pourtant un (p. 74, sujet de Stockholm): stad (a long) avec une chute de quatre tons (de d jusqu'à g) et stadd (a bref) avec une chute d'un seul ton (de ¿/jusqu'à peu au-dessous de c). Mais puisque, à en juger par la courbe reproduite, la durée objective de la longue a dû être approximativement 50 % de plus de celle de la brève, une telle différence d'intonation dans les deux voyelles n'appuie qu'en partie la thèse de Mlle Durand. Elle peut être une conséquence naturelle de la différence de durée. Un autre exemple (p. 98) parle nettement contre : la brève tombe un peu plus que la longue (3 tons et demi pour la brève de lim, un peu plus de 3 pour la longue de dôd). Parmi les nombreux exemples de mots de plus d'une syllabe — où le problème de l'intonation devient actuel — on en trouve beaucoup qui parlent en faveur de l'opinion 19
Elle aurait pu tirer profit aussi du livre de Emst W. Selmer, Apokope und Zirkumflex phonetica, fasc. suppl. I [Oslo, 1930]).
(Opuscula
44
PHONÉTIQUE GÉNÉRALE
de Mlle Durand : accent 1 dôden (long) avec une petite descente à la fin de la voyelle (p. 97), dillen (bref) avec une courbe montante (ibid.) ; accent 2 dôda (long) avec une chute considérable, presque quatre tons et demi (ibid.), dilla (bref) avec une chute d'un ton et demi seulement (ibid.). On trouve des courbes analogues un peu partout dans le livre (pp. 108, 110, 113, etc.). Mais il y a aussi beaucoup d'exemples de longues montantes et de brèves descendantes (par ex. pp. 117, 119, 121, 126, 129). Les matériaux de Meyer auraient besoin d'être complétés et examinés en détail sur ce point pour qu'il soit possible d'en tirer des conclusions sûres dans un sens ou dans l'autre. Pour contribuer, quoique modestement, au problème qui nous occupe, j'ai fait enregistrer une série de monosyllabes prononcés par deux sujets suédois, dont l'un de l'extrême Sud du pays (et parlant une langue qui se rapproche beaucoup de la mienne propre), et l'autre originaire de la côte ouest du pays (Gôteborg). Je fais remarquer que l'intonation musicale des monosyllabes est en principe identique à celle de la première syllabe accentuée des mots à accent 1 (tant au point de vue auditif que selon les mesures instrumentales). Voici les résultats obtenus de cet examen: 1. Le sujet du Sud du pays. Les longues montraient une durée moyenne de 25,2 es (16 exemples), les brèves une moyenne de 16,1. Il sera donc permis, avec les réserves nécessaires à cause du nombre restreint d'exemples, d'en conclure qu'il y a une durée objective correspondant à la durée perçue. Les mots examinés ont été fat, mat et van avec voyelle longue, et katt, matt et vann avec voyelle brève. Les phrases dans lesquelles les mots ont été prononcés ont été dites sur un ton indifférent, sans aucune accentuation affective ni emphatique. L'accent expiratoire a été le même, ou peu s'en faut. 2 0 Les courbes mélodiques, constatées avec le même procédé que celles reproduites ci-dessus, présentent les caractéristiques suivantes: fat (a long) descente d'un ton et demi ou un peu plus (c-a), suivie d'une légère montée (demi ton au maximum), qui à son tour est suivie dans deux des courbes d'une petite descente dans les toutes dernières vibrations (à peine un demi-ton dans un exemple, bien moins dans l'autre); mat (long) descente d'environ un ton et demi (c-a) suivie d'une légère montée vers la fin (à peine un demi-ton); van (long) descente de deux tons (deux tons et demi dans un cas: c-g), suivie d'une montée d'environ un demi-ton (ou moins) vers la fin; katt (bref) chute rapide — deux tons ou un ton et demi —, précédée dans un cas d'une montée d'un demi ton, et suivie d'une légère montée (plus considérable, presque un ton, dans un cas, inexistante dans un autre); matt (bref) descente d'environ un ton (moins dans un cas) suivie d'une très légère montée dans deux exemples; vann (bref) chute rapide de presque deux tons jusqu'à la fin, pas de montée ni au commencement ni vers la fin. Quoique mes exemples n'aient pas été assez nombreux pour satisfaire aux exigences de la statistique, j'ose tirer de ces mesures la conclusion que les monosyllabes sont caractérisés par une courbe mélodique nettement descendante (celle 20
Voici les phrases prononcées: jag har ett fat, jag har en katt, jag vill ha mat, jag àr sd hati àr inte van, det var han som vann.
matt,
VOYELLES LONGUES ET VOYELLES BRÈVES
45
Quelques courbes typiques du sujet 1:
qui est propre aussi à l'accent 1 dans les mots dissyllabiques), suivie ou non d'une légère montée vers la fin, indépendamment de la quantité de la voyelle. 2. Le sujet de Gôteborg. Les longues montraient une durée moyenne de 22,° es (17 exemples), les brèves une moyenne de 15,3. Les proportions entre les deux catégories me semblent assez analogues aux autres pour me permettre d'en tirer les mêmes conclusions. Les durées mesurées sont en elles-mêmes assez différenciées pour pouvoir accomplir une fonction linguistique. Les courbes mélodiques présentent les caractéristiques suivantes: fat ton uni ou légèrement descendant au commencement (un tiers de la durée de la voyelle), puis montant d'environ un ton (c-d). Il n'y a pas un seul exemple où les dernières vibrations montrent une courbe descendante, mat voyelle descendante d'un ton (ou d'un ton et demi dans un cas), comprenant d'un tiers jusqu'à la moitié de la voyelle, puis montée d'un ton (d-e). Dans un seul cas, il y a une légère descente à la fin de la voyelle: van ton uni, ou montant avec une montée d'un ton ou d'un ton et demi. Il n'y a pas trace de descente à la fin. katt descente d'un demi-ton, ou moins (d'un ton dans
46
PHONÉTIQUE GÉNÉRALE
Quelques courbes du sujet 2:
-200 pis -g -f - e
y
-d m -
t
]). Si, enfin, nous avions affaire à un système connaissant des groupes initiaux consonne + [h] et qui saurait par conséquent opposer [pa] à [pha] et à [ha], il faudrait peut-être interpréter notre groupe phonétique [ph] comme une suite de deux phonèmes. Il est important de souligner que, dans un tel cas, l'analyse purement physique ne nous aide guère dans l'analyse fonctionnelle. U n autre spectrogramme nous montre que la durée et les qualités acoustiques du phonème [h] sont à peu près identiques à celles du souffle combinatoire. Dans le premier cas, on entend une consonne [h], dans le deuxième on n'entend rien (si l'on n'est pas phonéticien ou linguiste de métier). Si dans un spectre acoustique (obtenu à l'aide du sonagraphe) nous voyons un glissement des formants et, par conséquent, un changement graduel du timbre, il est impossible de dire, sans connaître le système vocalique de la langue, combien de segments il faut distinguer au point de vue fonctionnel. Dans un autre spectre on voit un glissement continuel de [/] à [a]. Dans une telle suite de timbres, certaines langues (par ex. langues indigènes de l'Amérique) ne distinguent que deux types, les extrêmes [¡] et [a], toute autre nuance étant interprétée comme une variante d'un de ces deux. Pour un Espagnol il y aura trois types : [/] — [e] — [a], pour un Italien il y en aura quatre: [z] — [e] — [e] — [a], pour un Français cinq: [z] — [e] — [e] — [a] — [a]. Si un Indien de l'Amérique du Sud entend, disons un [e], il sera enclin à l'entendre comme un [a] et aura beaucoup de difficulté à faire la distinction française entre laid et là. U n Espagnol aura de la peine à attribuer une valeur linguistique à la distinction française entre été et était, de même qu'il percevra la différence entre fr. fait et fin, si et su comme des nuances et non pas comme des oppositions. Il y verra identité au point de vue linguistique. Un Anglais identifiera de même les deux unités françaises dans bas [ba] et dans banc [ba] en les interprétant comme des variantes auxquelles il n'arrivera qu'avec peine à attribuer une valeur différentielle. Un Français, quoique habitué à une forte labialisation de ses [y], [0], aura tout de même beaucoup de peine à s'adapter au système suédois avec ses deux degrés de labialisation: — [ui\. Le [d] occlusif et le [ô] spirant, qui sont dans la conscience linguistique de l'Anglais deux unités opposées (day — they), sont pour l'Espagnol deux variantes du même phonème et par conséquent identiques au point de vue phonématique (ex. un dia avec [d] mais hoy dia avec [ô]). Les exemples peuvent se multiplier à l'infini. L a valeur fonctionnelle des unités d'expression est donc basée sur les oppositions qu'elles forment avec toutes les autres unités du système. L'unité A est ce qu'elle est par le fait de ne pas être ni B ni C. Selon la théorie linguistique de l'école glossématique, ces rapports mutuels entre les éléments fonctionnels seraient en réalité leurs caractéristiques purement linguistiques. L a thèse saussurienne que les éléments du langage sont des unités oppositives et négatives est appliquée ici dans sa rigueur la plus extrême. Et il y a sûrement des raisons d'ordre théorique de préférer en linguistique cette définition entièrement abstraite des unités fonctionnelles du langage et de regarder la substance dans laquelle se manifestent ces unités dans la parole comme entièrement
60
PHONÉTIQUE GÉNÉRALE
arbitraire. De fait, il est possible de réaliser le même système à l'aide de différents types de substance (sons articulés, lettres imprimées ou écrites à la main, signes des sourd-muets, des aveugles, etc.), sans que les relations mutuelles entre les éléments soient modifiées et sans que ceux-ci cessent, par conséquent, de rester identiques à eux-mêmes. Et pourtant, pour un linguiste qui a d'autres raisons que la théorie pure de s'occuper du langage, il y a d'autres considérations à prendre. Le langage est un phénomène social, fait pour établir des contacts entre les hommes. Tout spécialiste qui a à s'occuper de l'application pratique des théories linguistiques — dans la parole normale ou pathologique — sera par là même forcé de prendre en considération la substance sonore et les faits physiologiques qui les engendrent. Tout fait de parole sera produit par quelqu'un et entendu et compris par quelqu'un d'autre. Les oppositions doivent être réalisées physiquement par des phénomènes perceptibles à une oreille humaine. C'est grâce à leurs traits distinctifs ("distinctive features") que ce processus est rendu possible. Mais, dans la chaîne articulée, il y a toujours, quoique à des degrés différents, une tendance naturelle à réduire les distinctions, à rendre la syllabe ou le mot aussi homogène que possible au point de vue phonétique. C'est là un trait PRIMITIF. L'expression non différenciée, globale, est antérieure, dans l'histoire de l'espèce humaine aussi bien que dans celle de l'individu, à l'unité composée. Elle est propre à une étape prélinguistique. Le cri de douleur par exemple est une telle expression prélinguistique, non structurée. La faculté de le produire est innée chez l'enfant et ne se perd jamais chez l'aphasique. Sa forme extérieure est indépendante des conventions linguistiques, tout comme l'est le babillage du bébé. L'enfant, même après avoir appris bon nombre de distinctions phonématiques, garde longtemps une certaine difficulté à réunir différents types phonétiques dans la syllabe ou dans le mot {[gókka] pour [dókka], [làlle] pour [nàlle], [póppa] pour [sóppa], pour prendre quelques exemples suédois). Le phénomène dit HARMONIE VOCALIQUE, 1 connu de beaucoup de langues et qui consiste dans une restriction des possibilités d'opposition due à l'influence de la voyelle accentuée du groupe (finnois talossa mais metsàssâ, turc atlar mais gùller) est à ce point de vue un trait de primitivité. Un système qui admet par exemple les quatre types ATA — ÂTÀ — AT À — ÀTA est plus riche en moyens d'opposition qu'un système qui ne connaît que ATA et ÀTÀ. De même, tous les phénomènes d'assimilation qui se produisent dans la chaîne articulée ont cet effet de réduire le nombre de possibilités d'opposition et par là le nombre possible de groupes différenciés. Un Espagnol, qui sait très bien opposer un [m], un [«] et un []i\ à l'initiale de la syllabe, ne le sait plus en fin de syllabe où la qualité de la nasale est réglée automatiquement par la consonne qui suit {[mb], [nd], [ f l t f ] , [tjk] mais pas [md\, [rit] etc.). Un [m] final de syllabe espagnol est donc moins RICHE EN INFORMATION que par exemple le [m] correspondant suédois ou allemand. L'Espagnol ne sait pas 1
Des phénomènes d'harmonie vocalique chez une petite fille anglaise ont été notés par Alan S.C. Ross dans Modem Language, Notes LU (1937).
OPPOSITION ET IDENTITÉ
61
opposer, comme le Suédois, tungt [tûrjt] à tunt [tunt]. L'enfant suédois y arrive tard. 2 On trouve même des adultes qui font des assimilations du type espagnol en appauvrissant ainsi leurs moyens d'expression. L'enfant passe par étapes du signe global, non différencié, au degré de différenciation du signifiant exigée par le système en cause. Nous appellerons ces différences produites à l'intérieur d'une unité complexe des CONTRASTES, et nous dirons que les oppositions se réalisent, dans la parole concrète, PAR DES CONTRASTES qui permettent à l'oreille humaine de réagir sur les signaux en cause et de les attribuer à telle ou telle catégorie d'unités fonctionnelles. Ce n'est qu'en parvenant à identifier certains segments de l'onde sonore — grâce à leurs caractères distinctifs — avec une unité différentielle du système que l'enfant arrive à percevoir et à 'comprendre' ce qui lui est dit. Le [/e] de mon petit garçon d'un an (interjection déictique qui par sa forme s'approche du suédois dâr [de: r] 'là' et qui en est peut-être mais pas nécessairement une imitation) est encore un signe global non différencié au point de vue phonématique, tant qu'il ne sait pas l'opposer à [na], [me], ou à [ta], [tu], ou [ti], L'analyse que nous en faisons, nous autres adultes, en [/] + [e], est due au fait que nous appliquons à cette chaîne notre code phonématique. Les contrastes sont donc nécessaires pour la réalisation des oppositions et ne peuvent être éliminés que jusqu'à une certaine limite. Quand ils dépassent le minimum strictement nécessaire pour la perception des traits distinctifs, il y a perte de l'opposition ou, s'il s'agit de certains contextes seulement, NEUTRALISATION ou SYNCRÉTISME. Il y a par conséquent interdépendance (contrairement aux idées glossématiques) entre la forme (le système fonctionnel) et la substance (manifestation physique) dans ce sens que plus les contrastes sont subtils (par rapport aux possibilités de notre oreille), plus le maintien des oppositions sera difficile. C'est la trop grande ressemblance phonétique entre les unités de la chaîne— contrastes insuffisants — qui explique dans beaucoup de cas la disparition d'une opposition ou d'un phonème. Le (v) intervocalique du latin clavem se maintient en français sous forme d e / {clef, dont l'amuissement de la finale est récent), tandis que le [v] de clavum a disparu (comme toutes les consonnes labiales et vélaires en contact avec des voyelles vélaires) dans le français clou. Les écoliers suédois ont une difficulté particulière à prononcer la semi-voyelle française [i{\ après une labiale (puis leur paraît bien plus difficile que nuit et lui, parce que la labiale tend à baisser le formant haut de la semi-voyelle qui, à cause de cet abaissement, se rapproche du [M] OU du [TV]). Les enfants confondent souvent, pour la même raison, des consonnes telles que [b], [v] et [g] (barage pour garage, barderob [bardro,:b] pour garderob [gardro' \b] chez un enfant suédois de trois ans). Le guëno pour bueno etc. de l'espagnol dialectal 2 Les métathèses et les interventions, courantes chez les enfants, ont le plus souvent pour but de simplifier la structure syllabique et d'éviter des consonnes 'difficiles' en fin de syllabe (ex. suédois gadrin pour gardin où le r implosif devient explosif en se plaçant après d, le groupe dr étant courant en position initiale; et talva pour tavla, où la liquide, plus 'vocalique', se maintient plus facilement en fin de syllabe que le [v]).
62
PHONÉTIQUE GÉNÉRALE
s'explique de façon analogue. Le célèbre linguiste espagnol Amado Alonso est, à ma connaissance, le premier qui ait appliqué un point de vue pareil pour expliquer des faits de phonétique historique en introduisant la notion d'ÉQUIVALENCE ACOUSTIQUE (je préférerais PARENTÉ ACOUSTIQUE). D'une façon générale, les oppositions se maintiennent plus facilement, si l'entourage phonétique est favorable à la perception des traits distinctifs. Ce fait parle à son tour en faveur de l'existence d'une interdépendance entre la substance et le système (la forme). Chaque système d'expression est caractérisé aussi par sa façon de combiner les unités. Il y a des règles conventionnelles qui déterminent la structure de la syllabe, du groupe, du mot, etc. Je ne peux pas m'occuper beaucoup ici du problème syllabique. Il suffira de dire que la syllabe est une unité fonctionnelle plus grande que le phonème, qu'elle est dominée par une voyelle qui y confère son timbre et caractérisée par la façon dont les consonnes se groupent autour du noyau vocalique. Dans tout état de langue primitif, ce sont les consonnes qui sont surtout responsables de la caractérisation fonctionnelle des syllabes, la voyelle ayant pour fonction essentielle de permettre aux consonnes de se réaliser pleinement. Dans l'état phonologique reconstruit hypothétiquement par Cari Hj. Borgstram comme propre au protoindoeuropéen, les voyelles n'ont pas encore de valeur fonctionnelle. Elles sont des éléments d'appui insérés entre les consonnes, pour que celles-ci deviennent audibles. Les consonnes seules sont responsables des différences de sens. Dans un tel système il y a par conséquent identité entre le phonème et la syllabe. Peu importe si un tel système se retrouve effectivement dans une langue existant aujourd'hui. C'est en tout cas une étape par laquelle l'homme a passé au cours de son développement linguistique et dont on trouve des traces chez l'enfant. Les distinctions phonématiques vocaliques caractérisent un état avancé dans le développement linguistique de l'homme. La plupart des langues du monde ne connaissent encore qu'un nombre très restreint de phonèmes vocaliques. Le système à trois est par exemple extrêmement répandu dans les langues (i — u — a). Les distinctions subtiles utilisées par des langues telles que le français (avec ses 16 phonèmes vocaliques) ou le suédois (avec 18) sont très rares. Chez l'enfant, le vocalisme est très peu développé au début, des distinctions telles que [/] — [y], [e] — [0], ou (en français) [fi] — [ë], (en suédois) [y] — [m]) n'étant stabilisées qu'assez tard. Chez mes enfants, les voyelles antérieures labialisées n'ont été que faiblement développées à l'âge où ils ont commencé à aller à l'école. Nous savons que ce sont ces distinctions plus subtiles qui disparaissent les premières chez les aphasiques. Reste le problème de la délimitation syllabique de la chaîne sonore. Je me limiterai à quelques petites observations. L'état prosodique proto-indoeuropéen supposé par Borgstram (et dont nous venons de parler) a dû précéder chez le genre humain, et précède sans doute chez l'individu, la véritable syllabation (des exemples enfantins comme suéd. kolocka pour klocka, belomma pour blomma l'indiquent). Le point de départ de la parole (pas de la langue!) est une série d'ouvertures et de fermetures de la bouche (pa-pa, da-da, ga-ga, ma-ma, etc.), combinés avec une source sonore (la
OPPOSITION ET IDENTITÉ
63
glotte). La syllabe la plus primitive chez l'enfant est de ce type. C'est encore la syllabe la plus répandue dans les langues, la seule qui existe sans exception dans toutes les langues du monde. Les formes Japonaises Kirisuto pour 'Christ', kurabo pour 'club', hirumu pour 'film' sont des exemples souvent cités de cette structure syllabique primitive. Le début d'une syllabe est toujours marquée par une ouverture. La fin en est vocalique. Beaucoup de langues ne connaissent pas de groupes consonantiques initiaux de syllabe (le finnois par ex., qui réduit tous les groupes initiaux dans les emprunts aux autres langues; par ex. suédois strand> finnois ranta). Des exemples analogues abondent dans le langage enfantin. Une de mes filles a connu pendant un certain temps une seule opposition d'initiale syllabique, c'est-à-dire zéro — [h], La règle a été la suivante: toutes les consonnes initiales sonores du langage courant, simples ou en groupes, étaient rendues par zéro, toutes les consonnes sourdes, ainsi que les groupes contenant une sourde, par [h] (par ex. soppa > hoppa.flicka > hicka, docka> ocka). Il n'y a pas de doute que les langues à syllabes ouvertes sont en majorité dans le monde. Et même dans les langues qui connaissent des syllabes fermées, le nombre de phonèmes, ainsi que le nombre d'oppositions possibles, est plus réduit en fin de syllabe qu'à l'initiale. Le développement phonétique de la plupart des langues romanes, par exemple, a été déterminé en grande partie par une tendance à ouvrir les syllabes. L'ibéro-roman (et notamment l'espagnol) en fournit l'exemple le plus frappant (voir mes articles "La structure syllabique de l'espagnol", dans Boletim de filologia, XI [1949], 99-120, et "Notes sur les groupes de consonnes en espagnol" dans Zeitschrift fur Phonetik, II [1948], 239-255). Il y a très peu de langues au monde qui admettent des groupes et des oppositions consonantiques aussi nombreux que le groupe germanique. L'allemand et le suédois en fournissent des exemples extrêmes (ail. sanft, welkt, verbirgst; suéd. skàlmskt, spotskt etc.). Mais il est important de souligner que, dans ces langues, l'enfant arrive tard à maîtriser les groupes trop lourds qu'il simplifie de plusieurs façons. L'enfant fait aussi des assimilations qui réduisent le nombre d'oppositions existant dans le langage des adultes. Dans certains mots suédois, les groupes de ce genre ne se réalisent pleinement que dans une prononciation lente et emphatique (des prononciations comme hems(k)t, svens(k)t, skâlms(k)t étant extrêmement fréquents). Il existe enfin des langues où il y a une opposition entre une consonne finale et une consonne initiale de syllabe (consonne implosive — consonne explosive). C'est le cas du suédois, et ce serait dans un certain degré aussi le cas du français, s'il faut en croire E. Pichon {Le français moderne, VI [1938], 28-43 et 107-124) et Marguerite Durand {Le genre grammatical en français parlé [1935], p. 38; cf. Malmberg, "La coupe syllabique dans le système consonantique du français", Acta linguistica, IV [1944], 61-66). C'est une opposition rare dans les langues et assez instable dans les systèmes qui la connaissent (cf. mon article sur les faits français cité tout à l'heure). En suédois, la prononciation de toute consonne prévocalique comme explosive (ex. han gâr ut 'il sort', où dans une prononciation correcte on ne fait pas de laison du r devant la voyelle) est un phénomène très fréquent même chez les enfants d'un certain âge (6-8 ans).
64
PHONÉTIQUE GÉNÉRALE
C'est aussi une des caractéristiques de la façon de parler des ivrognes et de certains malades. Plus l'élocution est rapide, plus toutes les consonnes ont une tendance à se faire explosives (cf. l'expérience de Stetson qui rappelle que si l'on commence par dire at-at-at et augmente la vitesse, on finira par dire ta-ta-ta; Bases of Phonology, [Oberlin, 1945], pp. 44 ss). Selon les expériences que j'ai faites sur la frontière syllabique, et le témoignage des spectrogrammes véritables, où l'on voit non pas seulement les inflexions mais aussi la coloration des consonnes par le vocalisme environnant la syllabe serait une UNITÉ ACOUSTIQUE dominée par une certaine couleur vocalique. La syllabe se termine là où l'influence de la voyelle cesse de se faire sentir. Si les consonnes implosives sont rares dans les langues et les distinctions en position implosive plus difficiles à réaliser q u ' à l'initiale d'une syllabe, c'est là un fait dû à la tension musculaire moindre de tout l'appareil phonatoire (Grammont, Fouché), à l'activité rythmique des muscles respiratoires (Stetson), aux variations de la pression sous-glottique (Strenger) et à la diminution de l'intensité sonore qui en est sans doute une conséquence et qui, en tout cas, l'accompagne (Zwirner, Stetson, etc.). Mes auditeurs ont dû reconnaître derrière mes réflexions la fameuse théorie de R o m a n Jakobson. 3 Le langage humain est basé sur des oppositions, caractérisées à leur tour par certains traits distinctifs qui se combinent de différentes façons pour former les unités fonctionnelles. Les oppositions les plus extrêmes sont celles qu'on retrouve dans toutes les langues du monde; elles sont les premières à apparaître chez l'enfant et les dernières à disparaître quand la maîtrise du langage s'affaiblit chez l'aphasique. 4 Et on sait que le même principe vaut aussi, mutatis mutandis, pour le plan du contenu du langage, même si les systèmes grammaticaux et sémantiques sont tellement plus complexes, et par là tellement plus difficiles à analyser, leurs unités minima tellement plus rebelles à une délimitation et à une définition exacte, que la validité de la thèse ne se laisse vérifier qu'avec beaucoup de peine. Le fait que des phénomènes identiques se retrouvent dans les langues primitives, dans le langage enfantin et chez les aphasiques prouve en tout cas que le principe de la structure grammaticale et sémantique est aussi général que le principe de structure phonématique. Il y a là un vaste champ de recherches commun aux linguistiques et aux phoniatres. U n autre point sur lequel je le crois possible de compléter un peu les théories jakobsoniennes concerne ce que je voudrais appeler la relativité de la notion d'aphasie. Je l'exprime en le formulant à dessein dans le paradoxe que nous sommes tous des 3
Voir Kindersprache, Aphasie und allgemeine Lautgesetze (Uppsala, 1942), et l'appendice de la traduction française des Grundziïge de Troubetzkoy (Principes de phonologie, par J. Cantineau [Paris, 1949], pp. 367-379. Cf. aussi Fundamentals of Language ['s-Gravenhage, 1956]). 4 Une idée pareille se trouve déjà, quoique moins développée, dans Th. Alajouanine, André Ombrédane et Marguerite Durand, Le syndrome de désintégration phonétique dans l'aphasie (Paris, 1939), pp. 122 ss.
OPPOSITION ET IDENTITÉ
65
aphasiques. Nous le sommes dans ce sens que, souvent, nous nous comportons comme tels. D'abord en parlant, tant bien que mal, une langue étrangère. Notre faiblesse linguistique consiste dans ce cas dans le fait d'être gênés par notre système à nous. Ensuite il peut se produire, chez tout individu, des phénomènes caractéristiques de l'aphasie et du langage enfantin, dans les situations où, pour une raison ou une autre, nous n'arrivons pas à utiliser toutes nos ressources linguistiques (en cas de fatigue, d'indisposition, d'ivresse, d'intoxication, etc.). 5 L'ivrogne, par exemple, qui n'arrive pas à faire de distinction entre consonne sonore et consonne sourde est un tel exemple. Dans ce cas, le trouble linguistique est de caractère passager. Il peut être constant ou d'une très longue durée chez des individus frappés de certaines intoxications, par ex. les intoxiqués par du vif argent (cas que j'ai eu à examiner au point de vue phonétique), sans que leur centre linguistique soit à proprement parler atteint. Si ces malades n'arrivent pas à réaliser toutes les oppositions de leur langue, c'est à cause du fait que l'acte de la parole leur devient trop pénible et que, par conséquent, ils se contentent du strict minimum nécessaire pour se faire comprendre. Enfin, toute communauté linguistique contient un certain nombre de personnes qui n'arrivent jamais à réaliser les oppositions les plus subtiles de leur propre système phonique, sans que pour cela ils soient classés comme des malades. Il existe par exemple en Suède un groupe d'individus qui ne maîtrisent pas notre accent du mot (accent musical qui permet de distinguer entre des mots autrement homonymes, tels que buren 'la cage' — buren 'porté'). Les professeurs trouvent toujours quelques individus de ce genre dans leurs classes. Certains d'entre eux gardent leur défaut pendant toute la vie. Je connais un médecin suédois de mon âge qui prononce tous les mots avec la même prosodie, ce qui donne une impression enfantine. 6 Ces personnes ont souvent aussi une peine particulière à prononcer les langues étrangères, ou des difficultés spéciales à s'exprimer, oralement ou par écrit, en leur langue maternelle. Le temps ne me permet pas de citer des exemples. Leur défaut de prononciation n'est que le signe extérieur d'une faiblesse générale qui peut se faire sentir également dans le domaine du contenu (agrammatisme, surdité et cécité verbales, difficulté graphique, etc.). En d'autres mots, dans toute communauté linguistique on retrouve toute la gamme de facilités et de difficultés linguistiques, depuis l'aphasie cent pour cent jusqu'à la perfection linguistique complète — cette dernière un idéal inaccessible si l'on comprend dans le système linguistique — comme on doit le faire — tous les 5 On peut rappeler dans ce contexte aussi le cas d'individus (surtout enfants) qui savent maîtriser le système mais qui, pour une raison ou une autre, ne veulent pas. J. Sully raconte le cas d'une petite fille anglaise qui savait faire la distinction /d/ - jôl mais qui ne voulait dire autre chose que mudder (se. [màda]) pour mother [mdâa] sauf quand on se moquait d'elle. Tous les parents ont fait l'expéiience que les enfants prononcent correctement quand ils sont surveillés mais retombent dans leurs habitudes enfantines quand ils se sentent libres. 6 Des cas de perte de distinctions prosodiques (accent du mot, quantités, etc.) chez des aphasiques sont décrits dans la littérature (voir par exemple A. Pick, dans Zeitschrift fur die gesamte Neurologie und Psychiatrie, XLV (1919), qui parle d'un déplacement de l'accent initial tchèque chez des aphasiques, phénomène que Roman Jakobson, Kindersprache, p. 21, explique comme un conséquence de la tendance à perdre les oppositions vocaliques de longueur).
66
PHONÉTIQUE GÉNÉRALE
moyens d'expression (stylistiques, artistiques, lexicaux, etc.) d'une grande langue de culture. Il n'y a, selon mon opinion, pas de limite absolue entre normal et pathologique dans le domaine de la langue. Il y a seulement différents degrés de perfection dans notre manière de maîtriser un système de communication. L'idée générale que j'ai voulu exposer en vous racontant ces quelques anecdotes du domaine du langage est que le principe du mécanisme linguistique est le même, qu'il s'agisse du plan du contenu ou du plan de l'expression (idée de Hjelmslev), et que le propre du langage est la combinaison de ces deux plans, de structure parallèle, dans le signe (idée de Saussure). La maîtrise d'une langue implique la faculté intellectuelle de savoir utiliser les unités offertes par le système selon les règles combinatoires prescrites par ce même système, donc de savoir appliquer le principe de 1'OPPOSITION et de 1'IDENTITÉ. Toute faiblesse linguistique — exception faite, dans une certaine mesure, de celles qui sont dues à des troubles extérieurs 7 — implique une difficulté de se servir des unités fonctionnelles d'un système, de les opposer les unes aux autres et de faire la part de ce qui est distinctif et de ce qui ne l'est pas. Il s'agit de la même capacité linguistique, qu'il soit question de maîtriser un système de notions (grammaticales ou lexicales), ou un système de phonèmes ou de prosodèmes. Pour ce qui est de ce dernier, c'est dans la réalisation concrète des unités fonctionnelles dans la parole, que l'imitation inconsciente joue son rôle, pas dans la maîtrise du mécanisme qui implique le même degré d'effort intellectuel et — dans un certain sens — conscient que la maîtrise de mots, de formes et de procédés syntaxiques. C'est en appliquant ce principe de synthèse qu'on arrivera, je pense, à tirer le plus de profit de la collaboration si importante entre linguistiques et phonéticiens d'un côté, médecins et phoniatres de l'autre.
7
Roman Jakobson est de ceux qui établissent une séparation absolue entre un phénomène APHASIQUE et un phénomène ARTHRIQUE. Celui-là est une insuffisance centrale, impliquant la difficulté d'abstraction et de maîtrise d'un système de signes dont les VALEURS (mais pas les caractères physiques) échappent au malade, celui-ci une insuffisance périphérique, impliquant des difficultés d'exécuter les mouvements articulatoires ou d'entendre les sons (en tant que sons) du langage. L'aphasie implique la perte d'une capacité apprise. Nous savons que d'autres savants ont mis en doute le bien-fondé d'une telle distinction absolue, courant pouitant depuis H. Liepmann (Monatschrift für Psychiatrie und Neurologie, XXXIV [1913]). Parmi ceux-là il faut mentionner surtout L. Niesel, von Mayendorf, "Kritische Studien zur Methodik der Aphasielehre" (Abhandlungen aus der Neurologie, Psychiatrie, Psychologie, XXVII [1925]). J'ai voulu attirer l'attention sur le fait que des troubles extérieurs peuvent parfois, par le fait même d'impliquer une gêne (de l'articulation ou de la perception), aboutir à un trouble linguistique qui, même si sa genèse est différente, rappelle les phénomènes aphasiques. Il serait donc possible de garder la séparation extrêmement importante faite par Liepmann et défendue par Jakobson, tout en admettant en partie — et d'un point de vue différent — le bien-fondé de l'opinion de Niessl.
6 LE PROBLÈME DU CLASSEMENT DES SONS DU LANGAGE ET QUELQUES QUESTIONS CONNEXES
ÉTUDE DE PHONÉTIQUE GÉNÉRALE 1
Les phonéticiens de métier connaissent bien l'activité scientifique et pédagogique de M. Jörgen Forchhammer de l'Université de Munich. Les travaux de ce savant sont tous caractérisés par une clarté parfaite qui en fait des outils précieux dans l'enseignement de la phonétique et des disciplines connexes. Je mentionne dans ce contexte surtout son grand livre, écrit en collaboration avec Viggo Forchhammer et intitulé Theorie und Technik des Singens und Sprechens (Leipzig, 1921), et son petit livre Die Sprachlaute in Wort und Bild (Heidelberg, 1942).2 Si tout le monde est d'accord pour admettre les mérites du phonéticien danois en ce qui concerne sa tentative de créer pour ainsi dire une science des articulations, il paraîtra certainement difficile à plus d'un de le suivre jusque dans les conséquences théoriques qui, s'il fallait en croire l'auteur lui-même, se dégageraient de son analyse articulatoire. Je me suis occupé déjà ailleurs (dans le compte rendu cité) de ce que Forchhammer appelle lui-même son ''Weltlautsystem". 3 J'ai tâché de démontrer que la notion même de "Weltlautsystem' ' est une contradictio in adjecto, au moins si par système on comprend ce qu'on a l'habitude de désigner sous ce terme: un ensemble cohérent d'unités solidaires, regardées sous l'aspect de leurs rapports mutuels. 1 Le présent article a été écrit à propos de l'article cité de M. Jörgen Forchhammer (Zeitschrift für Phonetik, II [1948]), et a par conséquent été rédigé essentiellement comme une polémique contre ce savant. Mais les idées générales qui se dégagent de cette critique de Forchhammer offrent, me semble-t-il, un intérêt assez grand pour motiver une publication, même sous cette forme polémique. — Je me suis dispensé de prendre en considération ici le classement articulatoire de Kenneth L. Pike et réserve pour une autre fois la discussion des théories du phonéticien américain. — Le manuscrit de cet opuscule se trouvait déjà chez l'imprimeur quand le livre Preliminaries to Speech Analysis de Jakobson—Fant—Halle m'est tombé sous la main. On y trouve une application concrète des mêmes principes de classement qui n'ont été esquissés que vaguement et en tâtonnant dans mon article. 2 Indogermanische Bibliothek, III, 8, Sonderdruck aus Wörter und Sachen, N. F. (1941-1942). Cf. aussi mon compte rendu dans Nordisk tidsskrift for taie og stemme, VI (1942), 74-79. 3 Forchhammer avait exprimé ses idées du "Weltlautsystem" déjà dans un article de 1914, intitulé "Systematik der Sprachlaute als Grundlage eines Weltalphabets" (Archiv für experimentelle und klinische Phonetik, I, 281-328).
68
PHONÉTIQUE GÉNÉRALE
Quand Forchhammer prend des sons de toutes les langues du monde et les ordonne dans un schéma, il réunit des unités qui n'ont rien à voir les unes avec les autres, qui n'apparaissent ensemble dans aucune langue connue et qui, par conséquent, ne forment pas, et ne peuvent pas former, un SYSTÈME. Ceci vaut si l'on prend système dans le sens PHONOLOGIQUE OU STRUCTURAL aussi bien que si l'on comprend par là un système d'ARTICULATIONS et d'HABITUDES ARTICULATOIRES. On sait que chaque langue a son système phonétique propre, ensemble d'habitudes et de tendances qui en constitue ce qu'on appelle avec un terme populaire la BASE ARTICULATOIRE. Il est impossible d'isoler un membre d'un tel système de l'entourage dont il fait partie et de tâcher de le faire entrer dans un autre système où il ne convient pas. 4 Il n'existe pas, et il ne peut pas exister, de "Weltlautsystem" dans le sens de Forchhammer. Ce qui existe, ce sont des types articulatoires, qu'il s'agit d'étudier et, dans la mesure du possible, de classer. Ces différents types, remarquablement généraux dans les langues (souligné à juste titre par Forchhammer; par exemple Die Sprachlaute, p. 8), sont combinés de différentes façons pour réaliser les phonèmes des différentes langues, tout comme le font les types acoustiques dont nous aurons à nous occuper bientôt. J'ai touché ici en passant à la question du "Weltlautsystem", puisque l'idée qui est derrière cette notion domine toute la pensée scientifique de Forchhammer, aussi l'idée qui fera l'objet de la présente étude. Dans un article récent, intitulé "Lautlehre oder Sprechkunde? (Phonetik oder Latelik?)", publié dans Zeitschrift für Phonetik, II (1948), 65-82, Forchhammer a repris la discussion d'un autre aspect du problème des sons du langage, la question de la base même de leur classement, impliquée pourtant déjà dans les travaux antérieurs.5- 6 Forchhammer veut remplacer la phonétique traditionnelle (science des sons, basée, selon lui, sur des notions acoustiques) par une "lalétique" 7 (c'est-à-dire une science des articulations) qui satisferait mieux aux exigences pratiques (pédagogiques, etc.) aussi bien que théoriques. L'auteur dit (p. 65) : " I m folgenden soll gezeigt werden, dass es unmöglich ist, auf dieser Grundlage [c'est-à-dire la base acoustique] eine wissenschaftlich fundierte, für den praktischen Sprechunterricht taugliche Sprech4
O. Gjerdman a fortement appuyé sur ce point de vue à propos d'une prononciation dialectale suédoise (la prononciation de certaines voyelles / et y, Viby-i, etc.) dans Sprâk och stil, XVI (1916), 26-27. 5 Voir par exemple Die Sprachlaute, p. 7, et la discussion du terme SPRACHELEMENT, avec un renvoi à Flodström, "Zur Lehre von den Consonanten" (Beiträge zur Kunde der Indogerm. Sprachen, VIII [1884], 1-35). 6 Après la rédaction du présent article, M. Forchhammer a exposé, plus en détail, ses théories dans un livre intitulé Einführung in die allgemeine Sprechkunde (Laletik) (Heidelberg, 1951). Le livre, qui a les mêmes qualités que les livres antérieurs de l'auteur — c'est un excellent exposé pédagogique — n'offre rien de nouveau, au point de vue théorique, par rapport à l'article critiqué ici. Pour le présent travail, les ouvrages de Forchhammer ne formeront que le point de départ d'une discussion générale des bases et des principes méthodiques de la phonétique. 7 Le terme n'est pas de Forchhammer mais se trouve déjà chez Merkel, dans Physiologie der menschlichen Sprache; physiologische Laletik (Leipzig, 1866).
LE PROBLÈME DU CLASSEMENT DES SONS DU LANGAGE
69
künde aufzubauen, dass diese Aufgabe vielmehr nur befriedigend gelöst werden kann, wenn man die SPRECHFUNKTION, genauer ausgedrückt die ARTIKULATION, zum Ausgangspunkt nimmt". Et ensuite: "Die Erkenntnis, dass man mit einer artikulatorischen Betrachtungsweise in der Phonetik weiter kommt als mit einer akustischen, ist nicht neu." Je laisserai complètement de côté dans ce qui suivra l'aspect pratique du problème, c'est-à-dire l'importance d'un point de départ purement articulatoire pour l'enseignement des langues étrangères, pour l'enseignement des sourds-muets, p o u i l a diction, etc. C'est l'affaire des spécialistes dans ces différentes matières de juger de l'opinion de Forchhammer dans ces domaines. Nous ne nous occuperons ici que de l'aspect purement scientifique du problème. D'abord une petite remarque en passant. Forchhammer parle tout le temps comme si le classement acoustique était celui de la phonétique classique et son point de vue articulatoire quelque chose de relativement nouveau (malgré l'existence de tentatives antérieures dans la même direction que les siennes; cf. la citation faite ci-dessus). Il fait semblant de vouloir remplacer la vieille p h o n é t i q u e (science acoustique) par la nouvelle lalétique (science articulatoire). A l'appui, il mentionne la terminologie traditionnelle. Mais est-il exact que celle-ci soit entièrement d'origine acoustique? Il est vrai que nous avons des termes comme PHONÉTIQUE, PHONOLOGIE, PHONÈME, etc. (et des termes analogues dans les autres langues), et aussi des traductions du même radical dans all. Sprachlaut, Lautlehre, Lautforschung, Lautwandel, etc., angl. speech sound, sound development, etc., suéd. sprákljud, ljudlära, ljudsystem, ljudutveckling, ljudforskning, dan. lydlœre, sproglyd, lydsystem, finn. änneoppi, etc. On pourrait encore alléguer, en faveur de l'opinion de Forchhammer, les catégories distinguées traditionnellement parmi les consonnes telles que CHUINTANTES, SPIRANTES et LIQUIDES (all. Reibelaut, Zischlaut, suéd. väsljud, etc.) et la distinction générale entre SONORES et SOURDES (all. stimmhaft, stimmlos, suéd. tonande, tonlös, ou plus anciennement klingande, klanglös, etc.). Il sera probablement possible de continuer encore quelques instants l'énumération de termes de la phonétique traditionnelle qui sont incontestablement tirés de l'acoustique. Mais la liste ne sera pas longue. La vieille distinction entre VOYELLES et CONSONNES (SONANTES et CONSONANTES) est de caractère fonctionnel, se rapportant à la fonction dans la syllabe (all. Selbstlaut et Mitlaut, suéd. självljud et medljud). C'est un fait incontestable que presque toute la terminologie de la phonétique traditionnelle se rapporte à des faits articulatoires. Toutes les catégories héritées de la phonétique classique sont basées sur la position des organes de la parole, ou sur leurs mouvements, et sont différenciées à l'aide de termes articulatoires. Pensons au classement en OUVERTES et FERMÉES (de différents degrés), en ANTÉRIEURES et POSTÉRIEURES, en LABIALES et NON LABIALES (arrondies et non arrondies), en ORALES et NASALES, etc., et aux distinctions établies d'après l'organe articulant, telles que LABIALES, LABIO-DENTALES, APICALES (apico-dentales, apico-alvéolaires, etc.), DORSALES, etc., et d'après le lieu d'articulation, telles que DENTALES, ALVÉOLAIRES, PRÉPALATALES,
70
PHONÉTIQUE GÉNÉRALE
etc. On ne s'explique pas comment Forchhammer peut reprocher aux phonéticiens de la vieille école d'avoir pris leur point de départ dans des faits acoustiques et d'avoir négligé à tort l'aspect articulatoire de la phonétique. On comprend très bien que Forchhammer veuille remplacer la phonétique traditionnelle par une autre — basée sur une connaissance plus approfondie du travail des organes de la parole. Seulement on ne comprend pas comment il peut voir dans cette tentative une réaction contre une tradition établie. On aurait moins de peine à comprendre le phonéticien qui demanderait juste le contraire de ce que fait Forchhammer: le remplacement de la phonétique articulatoire traditionnelle par une nouvelle phonétique acoustique qui est encore à créer.8 Déjà Jespersen avait vu très correctement l'intérêt et la nécessité d'une telle orientation nouvelle de la phonétique, dans ses Phonetische Grundfragen ([1904], chap. IV et V; de même Linguistica, pp. 134-159; cf. aussi Fonetik, en danois, chap. XVII et XVIII) où pourtant le célèbre phonéticien danois est obligé de se résigner devant l'impossibilité de trouver la base expérimentale solide, nécessaire pour l'établissement des catégories. "Making a virtue of necessity, phoneticians have developed phonetic theory ENTIRELY UPON THE ARTICULATORY ('genetisch') BASIS,9 and developed it to the point where inadequacy is seldom if ever noticed. Nothing happened to shake Jespersen's conclusion for nearly half a century. During this time the technicians produced no instrument which could deal with the central problem, and phonetic doctrine crystallized in the TRADITION THAT ARTICULATIONS ALONE CAN SUPPORT LINGUISTICALLY USEFUL PHONETIC CATEGORIES;9 now the instruments are suddenly there, and the tradition has kept phoneticians from preparing themselves to use the instruments or the data." (Joos, Acoustic Phonetics [= Language Monographs, XXIII], [Baltimore, 1948], p. 7). On voit que la citation qu'on vient de lire est juste le contraire de l'opinion exprimée par Forchhammer. Pour celui qui a, tant soit peu, suivi le développement de la science phonétique pendant les dernières années, il ne fait pas de doute laquelle des deux opinions est la plus proche de la vérité. Passons maintenant de cette question peu centrale, qui concerne plutôt l'histoire de la phonétique et de sa terminologie, à celle plus importante de savoir lequel des deux aspects de notre science, l'acoustique ou l'articulatoire, se prête le mieux à un classement général des sons du langage. Une des tâches de toute science est celle d'établir les catégories. La classification n'est pas seulement une question pratique, conditionnée par le besoin d'ordre et de clarté. Elle s'impose par la nécessité d'analyse et de définition des notions fondamenPALATALES, VÉLAIRES, uvuLAiRES, PHARYNGALES,
8
II est vrai qu'il y a eu très tôt des défenseurs du point de vue acoustique en phonétique (Auerbach, Lloyd et surtout Hugo Pipping), mais il ne fait pas de doute que c'est l'autre camp, représenté surtout par Sievers, qui a eu le dessus et qui a déterminé l'évolution de notre science, conséquence naturelle du développement énorme de la physiologie d'un côté, des ressources modestes de l'acoustique de l'autre. Ce n'est qu'avec la création de l'électro-acoustique moderne que cet état de choses a été radicalement changé. 9 C'est moi qui souligne.
LE PROBLÈME D U CLASSEMENT DES SONS D U
LANGAGE
71
taies avec lesquelles la science en question a à opérer. Un bon classement est la meilleure preuve d'une bonne analyse. Il semblera à première vue qu'en posant le problème du classement des sons du langage, j'adopte implicitement le point de vue que je viens de critiquer moi-même. Il y aurait donc une possibilité de classification générale des sons, indépendamment de leur fonction dans un système donné. Je fais pourtant observer qu'une classification n'est pas la même chose qu'un système. En classant les articulations ou les phénomènes acoustiques de la parole, je fais l'inventaire des possibilités utilisées par l'homme et les groupes dans des catégories selon des critères pertinents. Les principes de classement provisoire que nous allons discuter ici ne concernent donc pas l'établissement d'un système dans le sens du "Weltlautsystem" de Forchhammer. Nous nous contenterons de discuter, d'une façon tout à fait préliminaire, ce qui constitue la meilleure base d'un groupement général des moyens utilisés par l'homme dans la parole articulée. Pour faire ressortir les avantages de son système, Forchhammer compare son "Lalemsystem" avec le schéma connu de Jones. 10 "Bei der Betrachtung dieser Tabelle — dit Forchhammer — fallt zunächst die unregelmässige Verteilung der Sprachlaute auf. Wir sehen teils überfüllte, teils leere Rubriken. Dies muss van vorn herein bedenklich stimmen ; denn überfüllte Rubriken sagen, dass die Einteilung nicht zu Ende geführt worden ist, leere Rubriken hingegen, dass für die betreffenden Sprechelemente falsche Einteilungsmerkmale verwendet wurden" (p. 70). Admettons que cette critique de Forchhammer soit justifiée. La faute dans le schéma de Jones consiste tout simplement en ceci que celui-ci n'a pas fait expressément des colonnes à part pour les consonnes sonores et les consonnes sourdes, ce qui fait que dans la plupart des colonnes il y a deux signes (p : b, t : d,k : g, etc.). Rien ne serait pourtant plus facile que d'ajouter les lignes verticales nécessaires dans le tableau et de créer ainsi des colonnes à un seul signe qui satisferaient parfaitement Forchhammer ( " u m die Einteilung zu Ende zu führen"). Cette division, qui serait en premier lieu une division entre FORTES et DOUCES, ne se limiterait pas aux occlusives et aux spirantes (s : z,f : j , etc.). Des nasales et des latérales fortes (sourdes) sont parfaitement concevables et existent effectivement (par exemple la distinction [/] : [/] du gallois, avec une valeur différenciatrice 11 inconnue de la plupart des langues occidentales ; le [/] est pourtant relativement fréquent comme réalisation de différents groupes ou comme produit d'assimilation 10 L'ouvrage cité de Forchhammer, p. 70. Voir en outre M. Heepe, Lautzeichen und ihre Anwendung (Berlin, 1928), p. 23, etc. 11 Par ex. galt, llefain [Vévain] : lefain [l'évain]; voir Hjelmslev, Nordisk tidsskrift for taie og stemme, 11 (1938) 154. On aimerait avoir un signe spécial qui permît de distinguer dans la transcription la forte de la douce (puisque [/] signifie aussi la douce sourde de l'ail, klagen, fr. peuple, etc.) sans pour cela symobiser la latérale dite fricative (qui semble être celle du gallois; Principies of the International Association [1949], p. 11), notée par les deux signes de l'alphabet international (pp. cit., p. 10). 12 Par exemple dans les dialectes espagnols qui 'aspirent' le s implosif: los libros [lo íbroh], los niños [lopíjioh] avec une latérale ou une nasale qui, au moins parfois, peut être prononcée comme forte (sans que pour cela le [/] passa dans la catégorie des latérales fricatives).
72
PHONÉTIQUE GÉNÉRALE
dans la composition ou dans la phonétique de la phrase). 12 Reste la catégorie DENTALES ou ALVÉOLAIRES FRICATIVES dans le tableau de Jones, qui comprend cinq phonèmes (0, â, s, z, J). Ici Jones a négligé une différence qui est constitutive pour certaines spirantes, celle de la forme du canal d'ouverture. On sait que Jespersen parlait dans ce cas respectivement de "Rille" et de "Spalt". Dans [0] et [â], l'ouverture est large ; dans [Î] et [z] elle est ronde. En appliquant cette même distinction aux spirantes labiales, Jones aurait obtenu aussi une meilleure définition de la différence entre M (tvl) e t M e t M (de cette dernière paire il n'y a que [cp\ qui figure chez Jones). 13 Il va sans dire que les imperfections dans le schéma de Jones s'expliquent essentiellement par des raisons pratiques. Jones a voulu éviter trop de catégories et a fait abstraction à dessein des types qui ne sont que faiblement représentés dans les langues les plus connues. Le fait que son schéma est boiteux ne prouve donc pas que le principe de classement soit faux. Prenons comme point de départ de notre discussion l'exemple choisi par Forchhammer lui-même, des [J] et des [/]. Forchhammer regarde le lieu d'articulation comme une mauvaise base de classement des sons. "Die Vorliebe der Phonetiker für die Artikulationsstellen als Einteilungsmerkmale mag darauf beruhen, dass ihre Verwendung recht bequem ist. Sie sind verhältnismässig leicht zu bestimmen und bilden eine lückenlose Reihe von vorne nach hinten, die eine scheinbar unangreifbare wissenschaftliche Einteilung der Sprachlaute zulässt" (p. 71). 14 Cette observation est en partie exacte. Un [//] peut être postpalatale, vélaire ou uvulaire sans changer sensiblement de caractère. 15 La différence entre [5] et [ / ] ne dépend pas, comme nous l'enseignent les manuels, essentiellement du lieu d'articulation, [Î] étant dental ou alvéolaire, [ / ] prépalatal. On peut très bien articuler un [s] prépalatal et un [ / ] alvéolaire. La différence consiste, comme le souligne très correctement Forchhammer, dans la différence du volume de la caisse de résonance ("auf der unterschiedlichen Grosse des Anblaseraumes", p. 71). "[¿, z] und [/, 3] können sehr wohl an derselben Stelle artikuliert werden, ohne dadurch ihre Eigenart zu verlieren" (ibid.). 13
La différence entre [b] et [H>] serait, selon le schéma de Jones, que celui-là est une fricative, celui-ci une semi-voyelle ("Halbvokale u. Reibungslose Dauerlaute" dans la terminologie de Forchhammer). Mais les deux types ("large" et "rond") peuvent être prononcés avec ou sans friction perceptible. Le [b] espagnol est souvent "reibungslos", sans pour cela passer au type arrondi [w], et le [w] français ou anglais est souvent prononcé avec une spirance nettement perceptible. Avec le classement de Jones on se prive aussi de la possibilité de mettre la paire sourde [ç>] et [m] ("large" et "rond") sur le même pied que la paire sonore [b] et [w]. Car on ne peut tout de même pas classer la sourde [M] (de l'angl. which, why, etc.) parmi les semi-voyelles ("reibungslos") à moins, bien entendu, d'y voir une variante chuchotée de [w]. 14 On ne voit pas bien pourquoi le fait de former "eine lückenlose Reihe" semblerait particulièrement favorable à un classement. On dirait plutôt le contraire. 15 Nous savons, grâce aux recherches récentes de E. Lundberg (Nordisk tidskrift för dövstumskolan, L [1948], 112-116), que le M est articulé plus en arrière sur le palais mou que les occlusives correspondantes [£] et [#]. Les résultats de Lundberg concernent le suédois, mais il semble qu'il en soit de même dans d'autres langues : danois (communication de E. Fischer-Jörgensen) et finnois (observation de A. Sovijärvi).
LE PROBLÈME DU CLASSEMENT DES SONS DU LANGAGE
73
Une différence articulatoire très importante entre un [s] et un [ / ] consiste dans la position de la partie postérieure du dos de la langue, qui est baissée pour [s], levée vers le palais pour [/]. On n ' a q u ' à regarder, pour s'en convaincre, quelques-uns des roentgenogrammes publiés par Forchhammer lui-même, par Jones ou par E. A. Meyer (fig. 3). Il me semble certain que cette différence est plus importante pour l'identification des deux sons que le dit 'lieu d'articulation'. Cette position différente de la langue amène pourtant naturellement des différences dans les caisses de résonance (donc du "Anblaseraum" de Forchhammer). Mais cette différence des caisses de résonance correspond de son côté, on le sait, à une différence acoustique, le formant constitutif du [J] étant plus haut, celui du [ / ] étant plus bas. Voir par exemple Stumpf, Die Sprachlaute, p. 107, Mercedes de Chaves, Problemas de fonética experimental, pp. 86-87. On peut s'en procurer une idée approximative aussi en regardant les figures chez Potter-Kopp-Green, Visible Speech, pp. 134-149.16 Une des difficultés pour une description articulatoire exacte des [5] et des [ / ] dans les différentes langues réside justement dans le fait que les mêmes effets acoustiques peuvent être obtenus de façons différentes. On sait que, pour prononcer le [/], la plupart des langues renforcent l'effet acoustique produit par l'articulation linguale en y ajoutant un arrondissement labial qui devient plus essentiel, plus le lieu d'articulation est tiré en arrière dans la bouche. Cette labialisation est très sensible par exemple en français, en allemand et en suédois. Dans beaucoup de parlers suédois, le [ / ] est articulé trop en arrière dans la bouche (on se sert dans les transcriptions dialectologiques suédoises d'un signe spécial: [y]), pour que la formation de la caisse de résonance propre au [ / ] soit possible à l'aide de la langue. On y substitue les lèvres, et dans quelques parlers, entre autres dans le mien propre, c'est l'élément labial qui est la caractéristique essentielle du phonème. 1 7 L'effet acoustique produit par ces différentes articulations est, sinon identique, au moins assez semblable pour permettre de classer les sons sous la même rubrique. Ce sont des exemples types du phénomène dit de COMPENSATION. Les deux types [S] et [ / ] sont distingués par une DIFFÉRENCE 16
Les expériences faites jusqu'ici ne permettent pas de constater si l'articulation apicale du s amène un certain relèvement de la partie postérieure de la langue, accentuant ainsi la fréquence plus basse de la consonne et la rapprochant du [ / ] . Mais il semble que, d'une façon générale, l'articulation apicale soit combinée souvent avec une tendance à la vélarisation, propre à certaines langues (l'anglais par exemple). On sait que le [r] apico-alvéolaire vibrant est normalement vélarisé (d'où on a voulu expliquer le passage à [/î] postérieur). Les "plastogrammes" de E. A. Meyer (Untersuchungen tiber Lautbildung, p. 43) des r et l hollandais montrent une forte vélarisation. On aimerait beaucoup savoir si une vélarisation analogue n'est pas en partie responsable aussi de la "couleur sombre" ( = fréquence basse) des occlusives et nasales apico-alvéolaires et apico-palatales (rétroflexes; [?], [d], [«], etc.). 17 Pour se convaincre du rôle des lèvres dans ce cas, on peut prendre comme point de départ un [s] apico-alvéolaire espagnol ou finnois (ayant déjà par la position haute de l'apex une résonance bien plus basse que le Î normal prédorsal). Si, en prononçant un tel [s], on arrondit en même temps les lèvres, on obtient infailliblement un son qui, acoustiquement, est un [/].—Wethlo, Archiv fur vergl. Phonetik, I (1939), 32, souligne aussi l'importance de l'articulation labiale, indispensable surtout dans les cas où la forme de la langue est relativement plate, ce qui est évidemment le cas des variantes postérieures du phonème.
74
PHONÉTIQUE GÉNÉRALE
qui peut être obtenue à l'aide de procédés articulatoires profondément différents. Ces différents procédés — dont nous n'avons pu indiquer ici que les principaux (apex haut, apex bas, articulation essentiellement dorsale, ou essentiellement labiale, combinaison des deux en proportions diverses) — se laissent difficilement classer comme un type articulatoire unique. Ce qui en fait l'unité, c'est la parenté acoustique obtenue par ces différents moyens. Le [/"] n'est pourtant pas le seul exemple d'un effet acoustique obtenu de façons différentes. On a l'habitude de distinguer deux types de [ J ] , APICO-ALVÉOLAIRE ( J en anglais et dans beaucoup de dialectes allemands, 18 encore plus marqué en finnois et en espagnol européen), et PRÉDORSO-ALVÉOLAIRE ( J français, suédois, très répandu en Allemagne). Si la position de l'apex n'est pas trop haute, le s apical peut pourtant se trouver dans plusieurs langues comme variante individuelle, sans que cette différence soit observée par les non-phonéticiens. J'ai cru constater moi-même que le s apical est assez répandu dans le Sud de la Suède. On le reconnaît en y faisant attention, autrement non. Comme types articulatoires, les deux Î sont pourtant tout ce qu'il y a de plus différent. Nous y reviendrons plus loin (pp. 75-76 ss). Il est vrai que le lieu d'articulation (si peu important pour Forchhammer) est souvent, mais pas toujours, le même (les alvéoles). Mais l'organe articulant (d'une importance fondamentale, selon Forchhammer) est différent, 19 et le mouvement articulatoire ainsi que la position de la langue sont entièrement opposés dans les deux cas. On n'a qu'à regarder la fig. 1 ci-dessous pour s'en convaincre. Ce qui est constitutif pour tout [s], caractéristique indispensable pour que l'oreille l'accepte comme tel, est donc la fréquence extrêmement haute qui le caractérise avant tout. Cette fréquence est due, à son tour, à la forme et au volume de la caisse de résonance, lesquels, pourtant, peuvent être obtenus avec des procédés articulatoires différents. 20 D E RÉSONANCE
Fig. 1. [Ï] prédorsal et [s] apical (selon Jones). Observer la position basse du dos de la langue.
On sait que la différence articulatoire constatée entre les deux types de [s] revient dans la prononciation de toutes les consonnes dites apicales. Il y a des [i], [d], [«], 18
Voir l'article cité de Wethlo. Je ne peux pas accepter de mettre, arbitrairement, l'apex et la partie antérieure du dos de la langue sur le même pied. Cf. ci-dessus. 20 "... bei so GRUNDVERSCHIEDENEN ORGANSTELLUNGEN [mis en relief par moi] trotzdem der LAUTKLANG [mis en relief par moi] durchaus ähnlich sein kann" (Wethlo, Archiv., p. 29). 19
LE PROBLÈME DU CLASSEMENT DES SONS DU LANGAGE
75
[/], [e] et \â] prédorsaux à côté des apicales, regardées comme normales. Ces variantes sont régulières dans quelques langues, dialectales ou individuelles dans d'autres. Certaines langues favorisent le type apical, certaines autres le type prédorsal. Les t, d, n sont par exemple très souvent prédorsaux dans le centre de la Suède, tandis que le type apical semble être de règle (avec des exceptions individuelles) en Scanie. 21 Le [ ¿ F ] est normalement prédorsal en danois, apical en anglais. Au point de vue articulatoire, la différence est aussi profonde entre un [i] apical et un [i] prédorsal qu'entre les deux types de [$]. L'unité entre les deux types — qui, à ma connaissance, ne sont jamais opposés phonologiquement — consiste dans l'identité de l'effet acoustique qu'ils produisent. Cette identité est assez grande pour que l'on se dispense de marquer les deux espèces dans les transcriptions phonétiques. Leur emploi est trop peu stable — conséquence naturelle de leur ressemblance acoustique — pour qu'on se soit donné jamais la peine de les distinguer graphiquement. Ces deux variantes ont dû échapper souvent aux dialectologues.
Fig. 2. Position de la langue pour les deux types de s et de / (apical à gauche, prédorsal à droite), selon des roentgenogrammes de Forchhammer, Die Sprachlaute in Wort und Bild.
A cette objection, Forchhammer répondrait probablement que même pour ce qui est du type prédorsal, les sons en question sont toujours articulés avec la partie antérieure de la langue ("Vorderzunge"). Nous avons vu qu'il ne fait pas de distinction entre la pointe de la langue et la partie antérieure du dos — généralisation tout à fait gratuite qui ne rime pas avec son propre principe articulatoire. Il établit par 21
Selon Passy, le type prédorsal serait normal en français, ou plus exactement dans la partie septentrionale du pays. Voir Les sons du français, p. 91. En espagnol et en portugais, au contraire, le t et le d sont normalement apicaux.
76
PHONÉTIQUE GÉNÉRALE
contre une séparation nette entre "Vorderzunge" et "Hinterzunge", toutefois sans indiquer où se trouve exactement la limite entre l'un et l'autre. Quoi qu'il en soit, il est évident — et n'importe qui peut s'en convaincre en faisant une simple expérience — qu'il est possible d'articuler par exemple des occlusives avec presque chaque point du dos de la langue (au moins jusqu'au milieu de celui-ci) contre les dents ou les alvéoles. Ces occlusives auront indubitablement le caractère de t ou de d. L'oreille les classera immédiatement comme tels. Jespersen rappelle dans son Lehrbuch, p. 42, en parlant des occlusives dorsales, que toute articulation de ce genre dans la partie antérieure de la bouche aura plus ou moins le caractère d'un [i] (ou d ' u n [d]), mais q u ' à partir du milieu l'impression acoustique de l'occlusive sera plus ou moins celle d'un [&] (ou d'un [g]). L'oreille n'hésite pas à classer toutes les occlusives prononcées avec la pointe ou le dos de la langue contre les dents ou la partie antérieure du palais comme des espèces de t ou de d, et tous les types dorso-palataux (à partir du milieu du palais dur), dorso-vélaires ou dorso-uvulaires, comme des espèces de k.22 Quelle est la cause de cette ressemblance? Évidemment la structure acoustique des sons produits. Et nous arrivons par là à un autre point dans l'exposé de Forchhammer qui prête à la critique.
Fig. 3. Position de la langue pour s et / selon Jones (en bas) et Meyer (en haut). Le témoignage des figures est unanime dans ce sens que le dos de la langue, dans les deux cas, est plus bas pour s que pour / . La fig. de Meyer est tirée de Untersuchungen über Lautbildung, p. 9.
Celui-ci dit, p. 66, ce qui suit: "Die Notwendigkeit einer terminologischen Umstellung ergibt sich allein schon aus der Tatsache, dass mehrere unserer sog. 'Sprachlaute' überhaupt keine Laute sind, ja nicht einmal von einem Laut begleitet werden. So bleiben z.B. [p, t, k] und die süddeutschen stimmlosen [b, d, g] während der Dauer 22
"... dass man zu Anfang Laute von unverkennbar f-artigem Klang erhält, aber allmählich unmerklich einen Laut, den man ohne Bedenken k nennen wird" (Jespersen, Joe. cit.).
Fig. 4. L'influence acoustique des occlusives sourdes sur les voyelles précédentes illustrée par quelques figures du Visible Speech. On voit que les formants (bande noire sur les fig.) prennent des directions différentes selon la consonne qui suit (pp. 90, 97, 98 de l'ouvrage cité).
LE PROBLÈME DU CLASSEMENT DES SONS DU LANGAGE
77
des Mund- und Nasenverschlusses völlig stumm; und die bei der Öffnung des Verschlusses entstehenden Laute sind von dem nachfolgenden Lalem abhängig, also Übergangserscheinungen, die nicht als charakteristische Merkmale für [p, t, k] und [b, d, g] gelten können." L'idée de Forchhammer de ces occlusives sourdes comme des éléments qui ne s'entendent pas, n'est plus celle de la phonétique actuelle. Il est vrai que l'occlusion même ne peut s'entendre isolément. Ce qui s'entend, c'est le passage du phonème antérieur à l'occlusion, et de celle-ci au phonème suivant (ou à la pause). L'opinion de Forchhammer que ces phases transitoires, comme dépendantes du phonème suivant ou précédent, ne seraient pas susceptibles de caractériser acoustiquement les occlusives, est entièrement fausse. Le travail de Potter-Kopp-Green, Visible Speech (New York, 1947), vient confirmer d'une façon extrêmement intéressante ce que l'on croyait savoir déjà avant, à savoir que c'est la structure acoustique de la phase de transition qui garantit à l'occlusion sourde son identité. Les sons du langage s'influencent réciproquement dans la chaîne parlée. Il y a partout des phases transitoires dont la structure acoustique diffère et du phonème précédent et du phonème qui suit. Mais cette phase n'est pas la même par exemple pour un t et pour un k ou un p, phonèmes qui se laissent distinguer facilement justement par la structure différente de la phase transitoire sur les spectrogrammes reproduits dans le travail cité. Cf. aussi ce que dit à ce propos M. Joos dans Acoustic Phonetics, p. 122: "For if Whereas my hat? is spoken with unexploded final [f], the fact that the [x] effectively overlaps more than the first half of the [i] can be of no use to a listener, since none of the stop itself can be heard. On the other hand, the fact that the final [i] overlaps more than the latter half of the vowel is of prime importance to the listener, for this modification of the vowel is the only evidence he has that the word is not hap or hack. — Such identification of consonants by their effects upon contiguous résonants is apparently depended upon by listeners to a far greater extent than commonly supposed." Les auteurs de Visible Speech — travail sur lequel nous reviendrons à propos des voyelles — ont même pu indiquer (pp. 83 ss) en détail en quoi consiste pour chaque occlusive, sonore et sourde, l'influence exercée sur une voyelle précédente ou suivante. Les spectrogrammes reproduits ayant, comme les commentaires, un but purement pratique, il n'est pas possible de déterminer par ceux-là seuls en quoi consiste en détail les caractéristiques acoustiques de ces phases transitoires. Le type d'appareil dont on se sert pour les buts pratiques ne couvre du reste qu'un domaine de fréquence de 70 jusqu'à 3500 p/s. 23 Ce qui semble assuré, c'est que ces différences existent et jouent un rôle linguistique. Il sera donc permis de supposer que les occlusives, comme toute autre consonne, sont caractérisées par une structure acoustique propre et dans sa phase d"implosion' et dans sa phase d"explosion'. La détermination des détails de ces différences acoustiques est une des nombreuses tâches futures de la phonétique 23 On a construit pour des buts scientifiques des appareils couvrant jusqu'à 11000 p/s, sans que cette amélioration ait influencé considérablement la possibilité de lire les spectrogrammes, ce qui prouve l'extrême importance des phases transitoires (cf. Visible Speech, p. 14).
78
PHONÉTIQUE GÉNÉRALE
acoustique. Il ne fait pas de doute — les résultats déjà obtenus permettent de le prévoir 24 — que cette analyse nous fournira une base solide pour un classement satisfaisant des consonnes — occlusives et autres. Même avec des procédés très primitifs il est pourtant possible de se procurer une certaine orientation générale qui parle dans la même direction que les résultats dont nous venons de parler. En prononçant de suite une série d'occlusives sourdes, en commençant en arrière, au voile du palais, et en avançant successivement le lieu d'articulation jusqu'aux alvéoles et aux dents, on entend facilement comme le ton propre de l'explosion monte au fur et à mesure que l'on s'avance dans la bouche. Il est même possible de reproduire une mélodie reconnaissable en prononçant diverses occlusives dorsales sourdes. L'explosion d'un [&] ou d'un [g] est caractérisée par un ton relativement bas, celui d'un [/] ou d'un [d] par une fréquence bien plus haute. La raison en est évidemment que la caisse de résonance antérieure diminue au fur et à mesure que le lieu d'articulation avance dans la bouche. C'est déjà assez pour réfuter l'idée de Forchhammer que les occlusives sourdes n'auraient pas de caractéristiques acoustiques propres. S'il est vrai dans quelques cas que le lieu d'articulation est un mauvais principe de classement des consonnes (cf. les exemples cités ci-dessus), il faut pourtant observer que celui-ci joue souvent un rôle bien plus important que celui qui y est assigné par Forchhammer. Prenons encore une fois le cas des apicales occlusives. On sait que dans beaucoup de langues il est indifférent si l'occlusion se fait contre les dents on contre la partie du palais dur qui est juste derrière (gencives, alvéoles). Il peut même arriver que le lieu d'articulation ne soit pas exactement le même pour un [?] que pour un [c?] et un [«]. Ainsi par exemple dans les parlers suédois de l'extrême Sud, il semble normal que le [?] soit nettement dental (apical) et que le [d] et le [n] soient formés contre un point qui se trouve juste derrière les dents. En prononçant un [i], l'auteur de ces lignes appuie la pointe de la langue fortement contre les dents mêmes, mais en prononçant un [d] ou un [n] (ou un [/]) je ne touche pas du tout les dents avec l'apex. Ces légères différences du lieu d'articulation n'ont pas de rôle phonologique; elles sont le plus souvent individuelles, et il peut sembler normal de les laisser hors de compte dans un classement général des sons du langage. Les différences acoustiques qui s'ensuivent sont insignifiantes. Mais dès que nous montons encore un peu sur le palais dur, jusqu'aux alvéoles, les faits deviennent parfois différents. Il est vrai que même le [/] ou le [d] apico-alvéolaires sont souvent de pures variantes individuelles ou dialectales des [f] ou [d] dentaux et que, en tout cas, la différence est rarement fonctionnelle. Le plus souvent, une langue généralise l'un ou l'autre des deux types. Ainsi par exemple l'anglais n'a que le type alvéolaire du t, du d ou du n. L'espagnol prononce le / et le d comme dentaux, le n comme alvéolaire. Dans quelques dialectes suédois, le type alvéolaire est le représentant normal des t, d et n (le Nord-Est de la 24 La vérité de cette assertion fut confirmée d'une façon excellente par la magnifique démonstration de sons synthétiques faite au VII e Congrès des linguistes (Londres, septembre 1952) par M Pierre Delattre.
LE PROBLÈME DU CLASSEMENT DES SONS DU LANGAGE
79
province de Scanie). On sait que la différence acoustique entre le type dental et le type alvéolaire est considérable. Celui-ci a un formant bien plus bas que l'autre. Cette différence est parfois utilisée comme moyen distinctif. C'est d'abord le cas du suédois, où, dans la plupart des parlers, les groupes orthographiques -rt-, -rd-, -m-, -rl- sont prononcés avec chute du r et avec une apico-alvéolaire comme représentant unique des deux phonèmes : [i], [d], [«], [/]. Il y a donc opposition entre [/] et [t], et entre [d] et [d], etc. Même si, pour une analyse strictement phonologique, l'alvéolaire est la réalisation de deux phonèmes (r + t, etc.), il reste néanmoins vrai que la différence acoustique entre un [i] et un [/] est utilisée en suédois pour accomplir un rôle différentiel. Un exemple encore plus frappant du caractère fonctionnel de cette différence phonétique nous est fourni par l'araucan — langue indigène du Chili — où le [?] et le [/] sont deux phonèmes indépendants, susceptibles de servir à exprimer une différence de sens. Je renvoie pour les faits araucans à Lenz, Bibl. de dialectología hispanoamericana, VI, 235ss, et à Alonso, Revista de filología hispánica, I (1939), 340-341. La façon dont Forchhammer se dispense de prendre en considération le lieu de l'articulation pour son classement nous montre encore une fois combien son choix de critères est arbitraire, déterminé, semble-t-il, en dernier lieu par le système phonologique de quelques langues qui lui sont familières. Dans le groupe des spirantes sonores, Forchhammer admet l'existence pour certains sons d'une variante avec bruit et une variante sans bruit ("geräuschlos"). Ce serait par exemple le cas de [v] et de [y], qui peuvent être articulés avec ou sans bruit perceptible.25 Forchhammer voit dans le dernier type une forme affaiblie, réduite de l'autre. Il est vrai que, pour l'articulation du [y] ou du [v] ([w], [y], etc.), le degré de fermeture et, de là, le degré de spirance est extrêmement varié, non seulement selon les langues mais aussi, et surtout, selon le degré de force et d'emphase de la prononciation, la place dans la syllabe, etc. 26 Pour une spirante sonore, le degré du bruit est bien moins important pour l'identification du phonème — à cause de la présence des vibrations laryngiennes — que pour les sourdes. C'est évidemment ce qui explique pourquoi les sourdes sont normalement des FORTES, les sonores normalement des DOUCES.
Il me semble pourtant important d'attirer ici l'attention sur une distinction établie il y a déjà longtemps par le phonéticien allemand Rudolf Lenz, connu plus tard surtout à cause de ses contributions à la phonétique hispano-américaine. Dans ses Chilenische Studien (contenues dans les tomes V et VI des Phonetische Studien de Viëtor)27 Lenz prétend que l'articulation des fricatives sonores (et tout particulièrement [v] et [z]) est caractérisée par ce qu'il appelle une "Schlimmhautvibration", 25
Cf. la distinction entre latérales fricatives et latérales non fricatives discutée plus haut (p. 00). En espagnol, par exemple, la variante nettement spirante (avec bruit) est de règle à l'initiale d'une syllabe, la variante plus affaiblie (plus ouverte et par conséquent non spirante) est la seule qui soit connue en fin de syllabe (semi-voyelle, phon. [j]. A l'initiale, le phonème devient souvent affriqué ([J et en [/i] en castillan, où la distinction GEMINÉE: SIMPLE est remplacée par une distinction PALATALE: NON PALATALE. Une assimilation qui aboutit à un changement de système ou de structure phonologiques implique l'adoption par un phonème d'un nouveau trait distinctif, parfois un trait qui a appartenu à un phonème disparu. Une altération de ce dernier type est en parfaite harmonie avec l'idée de Collinder de l'unité phonétique du mot. Une palatale disparaît en laissant derrière elle une mouillure de certains éléments survivants du syntagme (ou, parfois, du mot tout entier!). Toutes les palatales romanes nées de groupes latins -f- yod (i ou e prévocaliques inaccentuées du latin classique) s'expliquent comme un fait de compensation analogue. Peu importe si le résultat définitif est une consonne p a l a t a l e ( c o m m e d a n s vinea >
f r . vigne [viyi], filyu >
ital. figlio [fiXXo],
sapeat >
fr.
sache [anc. fr. satfa, fr. mod. sa/]) ou un groupe palatalisé aboutissant plus tard à une diphtongue (variu > anc. fr. vair)14 ou à une monophtongue secondaire (caseu > esp. queso [keso]).1^ Il est donc légitime de conclure que, si nous devions expliquer l'umlaut par une étape intermédiaire à consonantisme mouillé (dans le sens strict de ce terme, c'est-à-dire une consonne aiguë ou "sharp", distincte d'un type normal [Jakobson: "plain"]), il faudrait chercher l'explication de la naissance de cette mouillure ailleurs que dans la seule action dilatrice de la voyelle palatale finale. Le fardeau de la preuve incombe à celui qui défend une telle théorie. L'objection de M. Wickman (loc. cit) contre mon explication des faits acoustiques 14 Les cas français de ce genre (cf. encore ratione > raison, angûstia > angoisse, frûstiat > froisse, lûtria > anc. fr. !oir[r]e) sont souvent allégués comme exemple d'une palatalisation de la consonne dont l'élément palatal se serait ensuite dégagé de la consonne pour se combiner avec la voyelle, d'où une diphtongue (souvent plus tard réduite). Vue d'un point de vue structural, l'altération prend pourtant un aspect quelque peu différent. Pour une raison dont il reste encore à rendre compte, le système n'a pas pu accepter des consonnes palatales du type [/•'], [d'z'], [i'f'J, et la palatalité nécessaire pour maintenir l'équilibre du mot a dû se réaliser autrement (a 'sauté par dessus' la consonne). Ceci ne veut pas dire que les consonnes n'aient pas été palatalisées. Au contraire. Il serait impossible qu'elles ne l'aient pas été. Seulement ça n'a pas été une palatalité distinctive, à laquelle le système, pour une raison ou une autre, a répugné, mais une palatalité combinatoire ('allophonique'). La palatalité étant une marque distinctive du mot, elle a dû pourtant se réaliser, et elle l'a fait autrement. Si nous devons parler dans ces cas de palatalisation consonantique ou non, dépend donc du point de vue choisi (phonématique ou phonétique pure; forme ou substance). 15 J'ai expliqué ailleurs (Rapport au Colloque international de civilisations et de langues romanes [Bucarest, 1959], p. 11 de l'exemplaire dactylographié) le passage anc. esp. -}t > ch (*mujfo > mucho, *fe}to > hechc) par un déplacement de la frontière syllabique (tendance propre à la structure syllabique de l'ibéro-roman depuis l'origine; voir mon article "La structure syllabique de l'espagnol", Boletim de filologia, IX [1948], 99-120), qui aboutit à une fusion de la palatale et de la dentale, d'où la nouvelle palatale [f/]).
138
PHONÉTIQUE GÉNÉRALE
est que, même si la consonne intervocalique est un peu affectée par le passage de [a] à [e], elle ne devient pas pour cela une véritable palatale (le [/] du germ. *foti ne devient pas [/'], c'est-à-dire n'entre pas dans la catégorie des palatales russes etc.; "sharp consonants"), Ceci est exact. Il y a une différence nette entre une consonne à couleur palatale (le n du suédois flinig) et une consonne vraiment palatalisée, mais il y a aussi en même temps toute une série de possibilités intermédiaires. En réalité, il y a deux distinctions à faire et qui n'avaient pas été faites dans les discussions antérieures du problème. Je pense surtout à la polémique entre B. Collinder et E. Rooth (dans Studia neophilologica, XIII [1940-1941], 103-117 et 291-297). Cette remarque, par contre, ne s'applique pas à l'article récent de M. Wickman. 16 Selon ma manière de voir, il s'agit d'une part d'examiner si les prétendues patalales (n\ t\ etc.) ont été des phonèmes distincts des n, t, etc., ou si elles ont été uniquement des variantes combinatoires de ceux-ci. S'il s'agit de variantes, le degré de leur palatalisation a dû dépendre des habitudes phonétiques et des tendances articulatoires des différentes langues (ou dialectes) en cause (cf. encore une fois la différence entre l'anglais et le français). D'autre part, les linguistes qui avaient discuté notre problème avaient négligé de dire exactement ce qu'ils comprenaient par "palatalisé" et "palatalisation" (M. Collinder fait pourtant en passant la remarque, "Das Wort als phonetische Einheit", p. 71, répété dans Studia neophilologica, XIII, 291, que les consonnes subissent normalement [mais pas toujours; cf. ma remarque ci-dessus, note 4] l'influence des voyelles). C'est cette négligence de deux importants principes de méthodes qui m'a fait mettre en doute la justesse de la façon dont tout ce problème avait été posé jusqu'ici. Si les prétendues palatales étaient à interpréter comme des phonèmes indépendants, tout le problème de 1'umlaut se poserait sur un plan différent. Personne ne nie le caractère phonologique de palatales dues à une fusion de consonnes avec un élément palatal D I S P A R U (un [z], un [/] ou un [/]), altération qui me semble être un phénomène entièrement différent de la métaphonie proprement dite. Au point de vue structural — ou psycho-phonétique, si M. Collinder préfère ce terme —, il y a une différence de principe entre d'un côté les altérations de type [lali] > [lel'] (> [/e/]),17 ou > [/«/'] (sans changement de la voyelle ; cf. lat. alliu > fr. ail), où un élé16
Au contraire, M. Wickman souligne (p. 28) l'importance de distinguer d'une part entre "métaphonie alternation" et "metaphonic change" (points de vue synchronique et diacronique), de l'autre entre changement allophonique et changement phonématique. Il a raison de distinguer aussi, sur le plan diachronique, entre MÉTAPHONIE ("the quality of the metaphonized vowel can be regarded synchronically as conditioned by the following vowel, as being a function of the latter") et ALTERNANCE ("such an alternation as that found English forms man ~ men or foot ~ feet is not a metaphonic alternation synchronically, for there is no other alternation in the word by which it is conditioned. In such a case these is simply an alternation between two independent phonemes, and the alternation may be regarded synchronically as the same kind of phenomenon as that which is called apophony [ablaut]"). Ces remarques de M. Wickman, quoique d'une évidence hors discussion, constituent une contribution importante et nouvelle à un problème dont la discussion a été, jusqu'ici, trop souvent altérée par une fausse perspective. 17 Si la palatale perd plus tard sa palatalité, c'est là un phénomène différent qui ne nous regarde pas ici (en castillan, par exemple, c'est le cas quand, pour une raison ou une autre, la consonne devient finale).
VOYELLE, CONSONNE, SYLLABE, MOT
139
ment phonologique (souvent grammatical) disparaît tout en conférant au reste du mot (à la consonne, à la voyelle ou aux deux) sa caractéristique distinctive (la palatalité), et de l'autre un passage [lali] > [leli] où une voyelle se règle d'après une autre. Dans le premier exemple, il s'agit d'un phénomène de compensation avec, du moins au premier stade, conservation des caractéristiques distinctives du syntagme comme tel (quoique réalisé différemment), et, par là, conservation de son équilibre phonologique. Dans le deuxième, il s'agit de la dominance d'une résonance sur une chaîne plus ou moins longue (syntagme, mot, groupe phonétique, etc.). Le mécanisme 'psycho-phonétique' est tout à fait différent dans les deux cas. Le passage à de véritables consonnes palatalisées ("sharp", "aiguës") implique une altération qui va pour ainsi dire au delà de la 'palatalité' (l'acuité) d'un [/]. C'est le RENFORCEMENT d'un trait phonétique, rendu nécessaire parce que celui-ci devient distinctif et pour conserver l'équilibre phonologique du syntagme (mot, etc.) en cause. Le passage roman filiu > *[fiï-(u)] demande une forte palatalisation delà latérale pour que la distinction ~ [fil] (