220 48 20MB
English Pages 217 [240] Year 1974
JANUA
LINGUARUM
S T U D I A MEMORIAE NICOLAI VAN W I J K D E D I C A T A edenda curat C. H. V A N S C H O O N E V E L D Indiana
University
Series Maior,
61
STUDIES IN
PHONETICS
by
MILAN R O M P O R T L
1973 ACADEMIA P U B L I S H I N G HOUSE OF T H E CZECHOSLOVAK ACADEMY OF SCIENCES
PRAGUE
MOUTON THE HAGUE • PARIS
Scientific
Editor:
Professor Dr. Josef Vachek, DrSc. Scientific
Adviser:
Professor Dr. Karel Ohnesorg, DrSc.
©
Milan
ROMPORTL
1973
All rights reserved No part of this book may be reproduced in any form, b y print, photoprint, microfilm, or any other means without written permission f r o m the publishers P r i n t e d in Czechoslovakia
5 CONTENTS
Preface
7
A. Phonetics and Phonology 9 I. On the Phonic Analysis of Language 11 II. Zentrum und Peripherie im phonologischen System 21 III. Vocalic Formants and the Classification of Vowels 28 IV. On the Vowel System of Russian 37 V. On the Phonic Realization of the Russian Morphoneme (o) . . . . 59 VI. The Acoustic Nature of Occlusives and their Classification 65 VII. Zur Identifizierung der Engelaute 71 VIII. Zur akustischen Analyse und Klassifizierung der Nasale 78 IX. R und das tschechische Konsonantensystem 84 X. On the Czech System of Consonants 105 XI. Trends in the Development of Standard Russian Pronunciation . . . 118 B. Intonology XII. Intonological Typology XIII. On the Synonymy and Homonymy of Means of Intonation . . . . XIV. Zum Problem der Fragemelodie XV. Sprechmelodie und andere satzphonetische Mittel in der Hochlautung XVI. Zum vergleichenden Studium der Satzphonetik
129 131 137 147 165 176
Appendix XVII. Ein Beitrag zur phonetischen Methodik
187 189
Bibliography List of Abbreviations Editorial Notes Index
203 210 211 213
PREFACE
The reader will find in this volume a selection of chapters in phonetics in the widest sense of the word which the author published in their original form between the years 1955 and 1970 in various specialized journals and miscellanies. The first part is devoted to articles dealing with general problems of phonetics and phonology, many of the theses being supported by material from concrete languages, especially the Slavonic languages, and applied to the phonic analysis of the various categories of speech sounds. The second part deals with central problems of the phonetics and phonology of running speech, brought together under the heading of intonology. In both parts attention is also paid to the orthoepic viewpoint. By way of appendix a joint work by P. Janota and M. Romportl has been included mainly as a demonstration of the use of the segmentator in the audio-analysis of speech. It is the author's hope that the main principles of his approach to the phonic analysis of speech, as applied systematically in his monographic analyses of concrete language systems, will become best apparent from a set of articles arranged in this way. He recalls with gratitude the aid of his colleagues at the Institute of Phonetics at Charles University and at the Phonetics Laboratory of the Institute for the Czech Language attached to the Czechoslovak Academy of Sciences, and also the discussions with them and other colleagues to whom thanks are due as being the only source thanks to which certain of the ways of solving some of the problems involved could take shape in the fruitful atmosphere of the Prague linguistic milieu. M. R.
A. PHONETICS AND
PHONOLOGY
I. O N T H E P H O N I C A N A L Y S I S O F
LANGUAGE
0. If, from a spoken text and in a context which does not facilitate comprehension, a listener is able to identify a language-unit differing by at least one phoneme from another unit of the same order in the same language, but having a different meaning, 1 we must assume that the phoneme in question differs in each of its realizations (wherever the opposition between the phoneme in question and the phoneme to which it is to be compared is not eliminated) from each realization of another phoneme in the same position by at least one feature (above all an acoustic feature). This is an assumption which has already been formulated numerous times and which has doubtless stood at the beginning of each previous enquiry which has led to the distinction in phonology of phonologically relevant [from phonologically irrelevant] features, as was the case, for instance, in the Prague linguistic school from its inception. 2 Nevertheless we deem it necessary to mention this assumption at this point and in this form as it stands at the starting-point of our observations and considerations which lead to conclusions not in every point identical to the conclusions reached by other schools of phonology which also work with distinctive properties (features). 3 1. We are aware that in the normal processual aspect of communication 1
E.g. the phoneme /b/ in the Czech sentence Beru si kapcsuik (I take m y handkerchief) as opposed to /p/ in Peru si kapesnik.(I wash m y handkerchief) or the phoneme /uI in the first of these sentences as opposed to /e/ in Bere si kapesnik (He takes his handkerchief) etc. 2 Cf. N. T r u b e t z k o y , Grundzuge der Phonologie, TCLP 7, Praha 1939, p. 35 and elsewhere. 3 A t the present, for example, the group represented by R. J a k o b s o n und M. H a l l e and their collaborators (e.g. Fundamentals of Language, 's-Gravenhage 1956); in another sense for example S. K. S h a u m j a n (Problemy teoreticheskoj fonologii, Moskva 1962). Also, though of course from other standpoints, K. H o r ^ l e k in a number of papers, reviews and discussions (e.g. in Proceedings of the 5th Intern. Congress of Phonet. Sciences — henceforth Proceedings Munster — Basel 1965, p. 364).
12 (when the listener can nol only hear but also see the speaker) the bearer of information is not only the acoustic signal but also the optic signal, which also transmits information on articulatory values. Moreover, in addition to (and in concert with) the acoustic component, it produces the phenomenon which we may designate as motor resonance, manifested for example in so-called inner speaking, muscular activity which corresponds wholly or in part to that of the ordinary sound elements of speech during actual articulation. This component cannot be neglected in the analysis of speech. Because this motor resonance, no matter how important to the perception of the speech signal and its analysis, is evoked predominantly by the acoustic signal, we hope it will not be an oversimplification if in illustration of our thesis we consider primarily the acoustic component; it is generally agreed that in speech communication this is the dominant component. For the analysis of the acoustic component in speech there are at present in use a number of instruments about which there also exists a relatively rich literature. 4 The basic source of information on the acoustic components is still—in spite of all reservations regarding its universal applicability and reliability:—the sound spectrograph of the Visible Speech type. 5 It is well-known that the main advantage of this recording method over others is that it gives a 3-dimensional record (with the parameters of time, frequency and intensity). It is also well-known, however, that the weak point of this method lies in the recording of the dynamic component, and that it is frequently necessary to confront the recording with 2-dimensional recordings (frequency—intensity, e.g. in sections directlyonthesona-graph,ortime—intensity measured on a sound level meter). It is not however suitable for recording the course of fundamental frequency in time, and particularly not for recording the so-called fundamental tone, for which one of the types of pitch meters (melographs) is more suitable. By using these and other methods of acoustic analysis we discover a number of acoustic elements (features) in the speech signal. We shall try to indicate at least their main types: (1) Presence or absence of an acoustic signal, duration of the segment, in which the signal is present or absent, the relationship of the duration of these two segments; (2) overall level of loudness in the given segment, or the relation of the 4
5
Cf. among others the conspectus in F. S. C o o p e r ' s Instrumental Methods for Research in Phonetics, Proceedings Münster, p. 142 seq. Be it the Sona-Graph we use here and manufactured under licence from K a y Electric Co., or another apparatus of this kind, e.g. the developing t y p e of spectrograph of the Prague Electro-acoustic Research Institute (cf. B. B o r o v i ö k o v ä , K otazce spektralni anatyzy mluvene feci, SaS 22, 1961, p. 263 seq. esp. p. 265).
13 overall level in several segments, change of level in the time in the duration of the segment, or differences in the course of the overall level in different segments; (3) discrete acoustic spectrum, continual, or mixed acoustic spectrum, the ratio of discrete to continual components; (4) concentration of energy (intensifications, formants) in the acoustic spectrum, frequency of the individual formants, the number of formants, the relations of their frequencies and their intensity, stationariness or mobility of the formants (existence or non-existence of a "vanishing point", locus, or a whole area of vanishing, its frequency); (5) concentration or dispersal of the overall energy, concentration of energy in different parts of the spectrum; (6) duration of the segment, ratio of the duration of several segments, duration of a segment in relation to the duration of greater wholes; (7) presence or absence of a fundamental tone, its pitch, changes in its pitch in a segment, the relation of its pitch and the course of its pitch in different segments, the relation of the course of pitch in the segment to that in greater wholes. We present here the most significant types of acoustic features without expressing their mutual relations. This does not mean that we are not aware that various types of -dependence exist between many of them. Some of these acoustic elements may be labelled primary if they are the direct acoustic expression of articulatory "intention" (for example the concentration of overall energy in a narrow band in the lower region of the frequency sound spectrum; this concentration may be the expression of a long resonator, possibly with reduced rounding of the labial orifice). In contrast a number of elements may be considered secondary since they appear only as side effects, as symptoms of a certain articulatory process which tends to a different acoustic objective (e.g. frequency changes of the vocalic formants in the neighbourhood of consonants, their tendency towards the so-called areas of vanishing, loci). We do not consider the difference between primary and secondary acoustic elements to be important for evaluation from the synchronic point of view in our further considerations, and if we arrive at similar conclusions anywhere in the hierarchization of acoustic elements this will be as a rule coincidental. Cases are not rare where a secondary element outweighs in importance a primary element. Of the above-mentioned acoustic elements (features), only those which the listener can register by ear are significant to any further analysis. Accordingly we shall respect only those acoustic elements (features) accessible to hearing whether it be a question not only of frequency range and intensity but also of segment duration. It is known for instance that the possibility of identifying pitch exactly
14 in very short tonal segments is indirectly dependent on their duration. If the segment is not longer than one period, then tone pitch cannot he established and the spectrum is practically continuous (the peak in the area of the fundamental frequency does not stand out). 6 The situation is even more complicated in sounds of non-periodic character. In addition another important factor is often present, the so-called poststimulational adaptation of hearing which frequently causes a marked reduction in the perception of the frequency field in a segment having a considerably lower overall specific loudness than has the precedent segment. To establish the importance of the individual acoustic elements it is frequently necessary to have recourse to methods which we place together under the name of methods of hearing analysis 7 (in addition to the basic methods of hearing tests with an undeformed sound signal). Among the methods of hearing analysis we include the use of the segmentator in various modifications, the use of a deformed signal with a limited number of variable parameters, 8 etc. 2. The phonemes of a language cannot be established by any acoustic or purely phonetic analysis. This can be carried out only by a phonological analysis based on rules for establishing a phoneme. 9 Our analysis can only set out from correctly established phonemes and look for the phonetic (acoustic) equivalents and features (acoustic elements) which distinguish them from one another. Commencing from the consideration made at the beginning of this article w.e might arrive at the opinion that from n realizations of the given phoneme f A (distinct in each realization from the realization of all the other phonemes of the language) in each of which we discover the set of acoustic elements (features) Ak, it will be possible to consider as the acoustic equivalent of this phoneme the intersection (L)
A =N
k=l
AK
(and as the equivalents of the other phonemes f B , f c , . . . P1 the analogical intersections B, C... N respectively). However even a trial analysis shows that sometimes we might arrive at the empty set, since there are cases, by no means exceptional, where the " Cf. here and elsewhere K. S e d l ä c e k , Zdklady audiologie, Praha 1956, p. 126 etc.; G. L i n d n e r , Grundlagen der pädagogischen Audiologie, Berlin 1966, p. 84 seq. 7 P. J a n o t a - M. R o m p o r t i , Ein Beitrag zur phonetischen Methodik (in this book p. 189 — also here the description of the Janota segmentator). 8 E.g. B. B o r o v i c k o v ä , op. cit. esp. p. 265 seq. etc. 9 We make no decision here as to the correctness of the rules used. The rules in T r u b e t z k o y ' s Grundzüge, p. 41 seq., remain our basis.
15 realization of the phoneme in different positions is constituted by not entirely identical features; and if the phoneme appears in a larger n u m b e r of positions, there may be cases where from the whole number of acoustic elements (features) not one is to be found in all positions (for example, for an occlusive at the beginning of the word before the vowel V, the sonant consonant (sonorant) S and the consonant C; at t h e end of a word after Y, S, or C; in t h e middle of a word in t h e neighbourhood of representatives of t h e same categories — provided, of course, it is not a case of a neutralising position). The situation is of course quite different if we carry out the analysis for the individual positions from a to v, for which by the same method we would arrive at t h e resultant intersections Aa to Ar. The acoustic equivalent of the given phoneme would be only a system of sets which we m a y designate b y Gothic 21, t h u s (2) The set i. e. the phoneme f A from any as t h e complement of allophones of the two
31 ={Aa,
A^,
Ay,...AJ
sum of the elements (features) which distinguish the other phoneme in the position a, will be expressed t h e intersections of the sets, corresponding to t h e phonemes in position a t h u s
(3)
Le.Di
=
Att-(AariBn).
If we carry out the analysis for the whole inventory of phonemes in a given language, t h e n we shall arrive for the individual positions at the smallest sets of features of type D which cannot be f u r t h e r broken down in the language and b y which as the smallest sound media are differentiated the realizations of two phonemes are otherwise not distinct phonically. This means t h a t — using traditional terminology — such smallest sets of acoustic elements of type D are the phonic expression of a distinctive phonological feature (property). 1 0 However, because even here we m a y arrive at different equivalents for t h e various positions, we shall, for t h e sake of accuracy, consider as t h e phonic equivalent of a distinctive feature (property) only such a system of sets, denoted by Gothic that (4) 10
2>
D,,...Dy}.
In the present book we use the term "distinctive feature" in the sense in which it is used in the works of Harvard (or M.I.T.) group. Only in cases which might lead to uncertainty we use the term "distinctive property" additionally. And on the other hand we use more frequently the designation "acoustic element" instead of the term "acoustic feature".
1G If for at least one position it holds that (5a) (5b)
Aa-Ba=X Ba-Aa = Y
and the conditions are fulfilled that a) X ^ Y, and that b) neither X nor Y are further divisible in the analysis of the same system in the same position, then the two phonemes are in a distinctive phonological opposition. If equations (5a) and (5b) hold for the same X and Y and for a further pair of phonemes, then in the language in question we have a proportional opposition; in the reverse case we have an isolated opposition. If equations (5a) and (5b) hold only for some positions, whereas for another position it holds that As = Be, then in position e we have a breach or neutralisation of the opposition. At this point we may make a preliminary formulation in a simplified form for some further assumption which, however, we shall make more precise in the third part of this chapter. For the time being let us assume that a) when the condition Y = {a | a e X} is fulfilled, by (5a) and (5b) a so-called privative opposition is expressed, b) if it holds for each a 6 X, b e Y, then a < b, we have a gradual opposition, and c) if the condition is fulfilled that X f l Y = 0 and that if a e X, then for each b e Y it does not hold that a < b, b < 1, and if there exists b and it is not true that a = b, and if there exists a and it is not true that a = b, and if there exists a and b and it is not true that a = b, then we have a socalled equipolar opposition.11 We shall return to the matter of testing the correctness of the statements when we come to consider the importance of the individual acoustic features (elements) which constitute a distinctive feature (property). 3. It follows from the above conclusions that we do not exclude the possibility that a distinctive feature may be acoustically expressed by a collection of acoustic elements. Our research so far has shown that cases where we might be led to assume that the acoustic correlate of a distinctive feature (property) is one single acoustic element are quite exceptional. Let us introduce by way of example the difference between Czech voiced and unvoiced consonants demonstrated on the alveolar occlusive [t] and [d] which are the representatives of the Czech phonemes /t/ and /d/, members of a single voiced — unvoiced correlated pair; we shall consider 11
My thanks are due to L. Nebesky of the Department of Linguistics and Phonetics at the Philosophical Faculty of Charles University in Prague for his kindness in checking the mathematical expressions used in this chapter.
Table 1
Fig.2
Table II
IMMNK
17 t h e m in the intervocalic position in the words (a) medem and (b) metem. We present sonagrams of the pronunciation of two persons, (1) a m a n and (2) a woman. Although the absolute values will differ in t h e two persons, we can see at first glance certain correspondences, notably a) difference in voicedness (the presence of a vocal tone in t h e realization of /d/, its absence in /t/ — Vc), b) difference in the character of the explosion, especially in intensity (I) seen here in the unvoiced consonant in the greater intensification especially in the higher regions, and moreover, particularly in the man, the markedly longer duration of t h e explosion (QEx), c) t h e longer duration of t h e stopped section in the unvoiced consonant (QC), d) the longer duration of the following vowel after the voiced consonant (QVp), e) t h e rather longer duration of the preceding vowel (QVa). At the same time it is obvious t h a t even in these cases of t h e pronunciation of only two people we do not find t h e same absolute values for the analogical elements, nor the same ratios of the values (e.g. QCT : QCD, or QC : : QVp etc). The use of further methods of acoustic and hearing analysis would in general confirm these results and perhaps even expand them. However, we shall consider this example as a satisfactory sample. Now by using equation (3) it will hold for the intervocalic position t h a t (6)
D T = {Vc—, I + , Q C + , QVp— Q V a - , Q E x + } ;
D D will contain the same terms with opposite signe. For comparison we give in fig. 3 the Czech occlusives [t] and [d] in the pronunciation of speaker (1) at the beginning of a word before a vowel in the examples (a) tomu and (b) domu. Here as in further material from other speakers is once again clear a) Vc the voicedness distinction, also b) I the intensity of the explosion, d) duration of the following vowel QVp, or f) duration of the explosion QEx, though understandably properties c) QC and e) QVa are missing. The characterization of the distinctive feature in the initial position will be the poorer by these two elements. It is not without interest t h a t some of these differences between [t] and [d] are to be found also in German (although — as we shall show in due course — their significance will be different). In figure 4 we offer at least one example of these consonants in the intervocalic position, namely in the words Seide and Seite (female speaker). The most marked non-correspondence with Czech lies here in the practical absence of the a) distinction of voicedness. On the other hand the differences c) QC and f) QEx are very marked, and the differences e) QVa or even d) QVp are in general accordance. If we allow t h a t a multi-member set of acoustic elements corresponds to the distinctive feature (property), then we must assume t h a t the whole of
18 the distinctive feature (property) is redundant (and that its redundancy will be mathematically calculable). In the next stage we must employ methods to explore the importance of the individual components. For the most part these will be listening tests, such as are usual in hearing analysis when we are investigating natural, deformed and synthetic signals, while confronting the results with those of other tests, for example psychological.12 However none of the methods employed hitherto is sufficiently reliable for us to be able to consider the results obtained by them as definitive;13 though the confrontation of the results of differing methods may lead to relatively reliable conclusions. It has been seen that all the acoustic elements (features) which make up a set corresponding to a distinctive feature (property) are not usually of equal importance; within the whole distinctive feature shows a certain structure with a hierarchy of the acoustic components. It is thus apparent that these are not disordered sets, but usually ordered (or partially ordered) sets. Firstly it is necessary to differentiate those elements which are fundamental components and form the core of the structure of the distinctive feature — we call them internal or central components — from elements which stand on the fringe and which we call here external or peripheral components. It is frequently the case that these latter are some of the features which we designated in the first part of this chapter as secondary, symptomatic; however, it is not a matter only of these, and on the other hand far from all these secondary components can be evaluated as external. Wherever it is necessary to express the relationship of central elements (A, B ) to peripheral elements (c) we shall use the schema
u-
As we have stated elsewhere14 the relationship between the basic central components is not always the same. In addition to cases where one (or more) of the acoustic elements which we designate as relevant (A) is clearly higher placed relative to the other elements which we have called redundant " Cf. e.g. G. U n g e h e u e r , Extensional-paradigmatische Bestimmung auditiver Qualitäten phonetischer Signale, Proceedings Münster, p. 556 seq. cf. also notes 7 and 8. 11 The question is particularly discussed whether a change of the normal relationships, e.g. the transference of the segment into another environment, produces so great an alteration in the relationship that the results cannot be considered demonstrative. (Cf. E . P e t r o v i c i , Mozhet-li peresadka zvukov... reshat' fonologicheskije voprosy?, Slavica Pragensia 4, 1962, p. 69 seq.). 14 E.g. Zu akustischen Korrelaten der distinktiven Merkmale, Proceedings Münster, p. 506 seq.; in greater detail on the relations between internal and external features cf. K rozboru zvukovi strdnky jazyka in the volume of lectures delivered at the I X Summer School of Slavonic Studies in Prague in 1965 (Praha 1966, p. 49 seq.).
19
(B), and whose relation is expressed by the formula
iA]
there may exist
between the elements a relation where it is impossible to establish the supremacy of any of them; both, (A x , A 2 ) are then relevant and their relationship may be expressed by the formula { A x — A J . Even in this case, however, the whole feature (property) is redundant. ( A similar relation may however exist also between redundant, or even external, components.) If on the basis of the empirical discoveries made so far we were to put in an order the acoustic elements which we have by analysis established as members of a set expressing the acoustic correlate of the distinctive feature (property) "voicedness" of the Czech language in the intervocalic position, Vc then we would arrive at the schema I — QC — QVp . In another lan(QEx)-(QVa)) guage — and on the assumption that we would discover a like repertoire of features — their hierarchy need not be identical. If we were to investigate a greater number of examples from German we would most probably be able to characterize the difference in the intervocalic position by the schema
Qyp
Vc^}'
positions of
course (e.g. at the beginning) I will be situated higher; and in another type of German (e.g. the northern variety) the position of voicedness Vc will also be beyond all doubt higher. According to the classical phonological terminology which we find above all in the works of Trubetzkoy the "voicedness" (or voice) opposition is considered to be privative (i.e. one member is characterized by the presence of the feature, the other by its absence). Starting from this we attempted, in the conclusion of the second section, to express the privative opposition by equations (5a) and (5b) under the condition that Y = {a | a e X } . Our analysis has shown, however, that this assumption of the presence and absence of the component can be related only to the acoustic element "voicedness" ( V c ) out of all the elements which go to make up the distinctive feature (property) "voicedness". All the other elements of this feature (property) may be characterized only by the greater or lesser amount of the quality in question; rather are they then "gradual" features (elements). A t the same time — at least those which we have called redundant — they are an inseparable part of the distinctive feature (property) according to our discoveries. If it is necessary to preserve the difference between privative and gradual oppositions we should have to alter condition (a) to equations (5a) and (5b) as follows: if the condition is fulfilled that at least for the highest component in the
20 hierarchy of elements (components) it holds that x e X, X e Y, the equations (5a) and (5b) express a privative opposition. Similarly we must adapt condition (b) : if the relationship holds that a and b, the highest components in the hierarchy, where a e X, b e Y, are in the relationship a < b, then we have a gradual opposition. Condition (c) may remain unchanged. 4. In our opinion it is desirable to respect one of our conclusions above all, that is that it is no longer possible to adhere to the opinion that a distinctive feature (property) is characterized by but a single relevant acoustic element (feature), and that the other elements have only a supplementary role in cases where the relevant element is lacking. The distinctive feature (property) is acoustically realized in a complex structure which functions as a whole. If we designate some of its components as relevant and others as redundant, this is purely a matter of terminology; the difference lies only in their greater or lesser share in the functioning of the whole distinctive feature (property). 15
11
Cf. also M. R o m p o r t i , Zur akustischen Struktur der distinktiven Merkmale, ZPSK 16, 1963, p. 191 seq.
II. ZENTRUM U N D P E R I P H E R I E IM PHONOLOGIS CHEN SYSTEM
0. Zum Ausgangspunkt nehmen wir die These, daß es auf der phonologischen Ebene ein Zentrum und eine Peripherie des Systems gibt, d. h. zentrale und periphere Erscheinungen bzw. Teilsysteme. Hier soll nur untersucht werden, ob objektive Kriterien für eine Abgrenzung von Zentrum und Peripherie vorhanden sind, ob sich zwischen Zentrum und Peripherie scharfe Grenzen ziehen lassen. 1.1 Es kann vorausgesetzt werden, daß eines der wichtigsten Kriterien für die Unterscheidung zwischen einem zentralen und einem peripheren Glied des phonologischen Systems (zentralen und peripheren Phonem) der Grad seiner Integrierung ist (um Martinets Terminus anzuwenden).1 Ein Phonem, das im gegebenen Phonemsystem an einer größeren Anzahl von distinktiven Oppositionen beteiligt ist (d. h. in höherem Maß integriert ist), steht offenbar dem Zentrum des Systems näher, als ein weniger integriertes Phonem. Es ist in diesem Zusammenhang nicht entscheidend, wie die distinktive Opposition, bzw. das einer Opposition zu Grunde liegende Merkmal („distinctive feature") definiert wird. Im ersten Kapitel dieses Buches haben wir unsere Auffassung der phonologischen Merkmale dargestellt, doch wegen Vereinfachung benutzen wir hier die Bezeichnung der Klassen der distinktiven Oppositionen des M. I. T.-Systems. 2 Wir wollen aus unserer Untersuchung den gegenseitigen Vergleich der 1
A. M a r t i n e t , Économie des changements phonétiques, 1955, S. 79 f. Mit dem Begriff der Integrierung arbeitet sehr oft J. Y a c h e k , der in bedeutsamer Weise verwandte Probleme mehrmals behandelt hat (On Peripheral Phonemes in English, BSE 4, 1965, S. 9 f.). Vgl. auch seine Abhandlung in TLP 1, 1964, S. 15 f. und in TLP 2, 1966, S. 23 f. 2 Als M. I. T.-System bezeichnen wir das in den Werken von R. Jakobson und seiner Gruppe angewandte Klassifikationsystem. Aus der zahlreichen Literatur verweisen wir auf die bereits zitierten Arbeiten Preliminaries to Speech Analysis, *1955, und Fundamentals of Language, 1956.
22 Integrationstufe von vokalischen und konsonantischen Phonemen ausscheiden. Dieser Vergleich würde nämlich ergeben, daß der größte Teil der Konsonanten, die an einer größeren Anzahl der Oppositionen teilnehmen, dem Systemzentrum näher steht, als die meisten Vokale. Wir müssen also die Verhältnisse innerhalb dieser zwei Teilsysteme getrennt betrachten. Ist z. B. im Tschechischen im Teilsystem der Konsonanten das Phonem /d/ gegenüber dem Phonem /z/ am Gegensatz a b r u p t — k o n t i n u i e r l i c h , 3 gegenüber /t/ am Gegensatz s t i m m h a f t — s t i m m l o s , gegenüber /n/ am Gegensatz n a s a l — oral, gegenüber /d,/ (in tschechischer Orthographie d) am Gegensatz k o m p a k t — d i f f u s und gegenüber /b/ am Gegensatz d u n k e l — hell, 4 so ist /d/ zweifellos in einem höheren Maße integriert als /j/, das nach demselben Klassifikationssystem in einer einzigen Opposition allen anderen konsonantischen Phonemen des Tschechischen als nichtkonsonantisch gegenübersteht. 6 Dieser Unterschied ist markant und bestätigt die intuitive Einschätzung, daß im tschechischen Konsonantensystem (und ebenso auch in vielen anderen Sprachen, wo beide Phoneme vertreten sind) das Phonem /j / am Rande, das Phonem /d/ dagegen im Zentrum des Systems steht. Wenn man versucht, die Stellung der tschechischen Phoneme /k/ und /d,/ im Verhältnis zu den genannten Phonemen zu beurteilen, so wird man geneigt sein, beide Phoneme näher an das Zentrum als /j/, doch höchstwahrscheinlich etwas weiter vom Zentrum als /d/ zu rücken. Dabei würde wohl /k/ etwas zentraler zu stehen kommen als /d,/. Doch wenn man die Integrationsstufe beider Phoneme auf die angegebene Weise feststellt, so kommt man zum Ergebnis, daß das Phonem /d,/ in gleichem Maße integriert ist wie /d/, da es an denselben Oppositionen beteiligt ist, wogegen /k/ weder an dem Stimmbeteiligungsgegensatz (das Verhältnis [k] : [g] ist bekanntlich im tschechischen intelektuellen Wortschatz bloß als eines von zwei positionsbedingten Varianten anzusehen,6 noch an der Opposition n a s a l — o r a l teilnimmt (das velare [YJ] ist wieder nur ein Allophon des Phonems /n/).
Wir sehen also, daß eine bloß quantitative Bewertung der Teilnahme » Ich benutze hier die deutschen Äquivalente der englischen Termini nach G. F. M e i e r s Übersetzung der Fundamentals (Grundlagen der Sprache, Berlin 1960). * Die Reihenfolge der einzelnen Oppositionen bezeichnet nicht ihre Hierarchie. » Unserer Klassifikation nach steht /j / als Glied der Gruppe der Ton- und gleichzeitig konsonantischen Phoneme (d. h. der Sonoren) in der Opposition t i e f — h o c h gegenüber /l/ (gegenüber /r/ noch zusätzlich im Gegensatz h o m o g e n — n i c h t h o m o g e n ) , ähnlich wie im Russischen (vgl. M. R o m p o r t i , Zvukoujj rozbor ruStiny (Phonische Analyse des Russischen), Praha 1962). 4 Zur Stellung der Phoneme /k/ und /g/ im Tschechischen vgl. v. a. die Arbeiten von V. M a t h e s i u s , z. B. Zur synchronischen Analyse fremden Sprachguts, EStn 70, 1934, S. 21f.
23 eines Phonems an den Oppositionen keine verläßliche Antwort auf unsere Frage bietet. 1.2 Es fragt sich, ob nicht noch ein anderer Aspekt der Beteiligung eines Phonems an einer Opposition mitzuberücksichtigen ist, nämlich die Eigenschaft dieser Opposition, in erster Linie der Grad ihrer Proportionalität (bzw. der Unterschied zwischen einem isolierten und einem proportionalen Gegensatz).7 Wenn das Phonem /k/ im tschechischen Konsonantensystem an drei Oppositionen teilnimmt (1. k o m p a k t — d i f f u s , 2. d u n k e l — hell, 3. a b r u p t — k o n t i n u i e r l i c h ) und das Phonem /n/ ebenfalls (1. komp a k t — d i f f u s , 2 . d u n k e l — hell, 3. n a s a l — oral), so unterscheiden sie sich nur durch einen einzigen Gegensatz. An der Opposition a b r u p t — k o n t i n u i e r l i c h nehmen aber im Tschechischen mindestens 5 Phonempaare, dagegen am Gegensatz, n a s a l — o r a l nur 3 Paare teil; man könnte also schließen, daß dieser quantitative Unterschied die vermutete Differenz der Entfernung beider Phoneme vom Systemzentrum widerspiegelt. Doch wenn der Unterschied der Beteiligung an einer isolierten oder proportionalen Opposition — bei Teilnahme an einer gleichen Anzahl von gleichwertigen Gegensätzen — für die Bewertung der zentralen oder peripheren Stellung der Phoneme sehr wichtig ist, sind wir uns nicht ganz sicher, ob diesem Unterschied dieselbe Bedeutung zukommt, wenn es sich um zwei proportionale Gegensätze von verschiedenem Umfang handelt (z. B. /k/ — /n/ im Tschechischen). Hier scheint die Tatsache wichtiger zu sein, daß z. B . an der Opposition n a s a l — o r a l neben dem Nasal /n/ eine weit kleinere Anzahl von Phonemen als auf Seiten der oralen Phoneme, zu denen auch /k/ gehört (obwohl es zu keinem nasalen Laut in einem direkten Gegensatz steht). Man könnte hier allerdings auch den Unterschied zwischen den sog. Sonorlauten und den übrigen (Geräusch-)Konsonanten in Erwägung ziehen, wobei die Gruppe der Sonorlaute wieder kleiner ist. In der M. I. T.-Klassifikation kommt dieser Unterschied unserer Meinung nach nicht deutlich zum Ausdruck. Wir sind der Ansicht, daß der Gegensatz t o n h a f t — g e r ä u s c h h a f t , den wir in unseren Arbeiten verwenden (Tonkonsonanten werden die Sonoren genannt, die durch periodische Struktur der Hauptverstärkungen im diskreten akustischen Spektrum gekennzeichnet sind, Geräuschkonsonanten weisen dagegen unperiodische Verstärkungen und kontinuierliches Spektrum auf), den tatsächlichen Verhältnissen im System mehr entspricht.*
Auch die Tatsache z. B., daß im französischen Vokalsystem nur vier Nasalvokale gegenüber einer größeren Anzahl von oralen Vokalen stehen 7
s
Wir benutzen diese Termini im großen und ganzen in Übereinstimmung mit der klassischen Definition von T r u b e t z k o y , Grundzüge der Phonologie, Praha 1939, S. 63. Vgl. auch in diesem Buch S. 16. Vgl. Zvukovt) rozbor ruitiny, S. 158 f., auch hier S. 40fl.
24 (man stellt hier z. B. bis 11 betonte kurze Vokale fest), wird wahrscheinlich für die Randstellung der Nasalvokale charakteristischer sein als ihr niedrigerer (doch nicht allzu viel niedrigerer) Integrationsgrad. Wir sind der Ansicht, daß die Analyse der Beteiligung der Phoneme an distinktiven Oppositionem einen Beitrag zur Bestimmung der zentralen oder peripheren Stellung der Phoneme leistet; die Ergebnisse sind jedoch nicht so eindeutig und entscheidend, daß man auf weitere Kriterien verzichten könnte. 2. Wir wollen zuerst fragen, welche Bedeutung hier der Distribution, der kombinatorischen Potenz eines Phonems zukommt. Es bieten sich mehrere bekannte Beispiele an, von denen wir als erstes das periphere deutsche Phonem ¡t\f anführen wollen.9 Es nimmt an allen Oppositionen wie die anderen deutschen Nasalphoneme (/m/ und /n/) teil, sein Vorkommen ist aber wesentlich beschränkt. Es tritt nicht im Anlaut auf, in vorkonsonantischer Stellung innerhalb des Wortstamms steht es nur vor /k/ (in Lehnwörtern noch vor /g/), es kann nur vor einem Vokal, dem unbetonten /a/ stehen. Die silbischen [}], [ip], [IJ], bzw. [B] sind im Deutschen als Realisierungen biphonematischer Verbindungen, d. h. /al/, /am/, /an/, bzw. /ar/ zu beurteilen, obwohl in diesem letzteren Fall das Problem komplizierter ist.
Ähnlich ist auch die Kombinationsfähigkeit der tschechischen palatalen Verschlußlaute /t,/, /d,/, /n,/ (in tschechischer Orthographie f, d, h) beschränkt, die im neutralen heimischen Wortschatz — um nicht von anderen Stellungen zu reden — vor den hinteren (M. I. T.: dunklen, Gravis-)Vokalen /o/, /u/ nicht vorkommen. Sonst nehmen sie an denselben Oppositionen teil, wie die ihnen entsprechenden alveolaren Verschlußlaute /t/, /d/, /n/; es bleibt hier nur ihr Verhältnis zu den kontinuierlichen Konsonanten ///, /3/ problematisch, die nach der M. I. T.-Klassifikation ebenfalls kompakt • A. I s s a t s c h e n k o hat im Aufsatz Der phonologische^Status des velaren Nasals im Deutschen, ZPSK 16, 1963, S. 77f., u.a. einen interessanten Versuch unternommen zu beweisen, daß ¡r)l im Deutschen kein Einzelphonem ist, sondern eine Realisierung der biphonematischen Verbindung /ng/. Die möglichen Einwände gegen seine Stellungnahme sind im einzelnen schwach, hauptsächlich deshalb, weil man Beispiele entweder nur aus peripheren Systemen anführen kann (Lehnwörter und fremde Namen wie Kongo, noch zusätzlich methodisch nicht ganz korrekt mit heimischen Wörtern zusammengeworfen, heimische Eigennamen wie Ingolstadt, bzw. auch die Wörter, die als einheimisch empfunden werden, z. B. Gen. Angstes — Angster, wo aber die phonologische Interpretation — /-gst-/ oder /-Kst-/? — nicht ganz klar ist), oder aus einem noch entfernteren Bereich, d. h. aus dem der Grenzsignale, denn als solches ist die Anwendung des [n] oder [r/] vor [k] anzusehen (vgl. Anker — Ankunft usw.). Zusammengenommen erhöht sich aber das Gewicht der Argumente. — Zur Problematik des englischen ¡rjl vgl. J. V a c h e k in der Festschrift In Honour of Daniel Jones, London 1964, S. 191f.
25 sein sollten. Es scheint, daß die Distribution in diesem Fall ihre nicht völlig zentrale Stellung besser zum Ausdruck bringt als der Grad ihrer Intergrierung. Wir haben schon früher zu zeigen versucht, 10 inwieweit die Analyse der Verteilung der Konsonantenphoneme mit Rücksicht auf deren Teilnahme an der zentralen Korrelation des Konsonantensystems einer Sprache auf ihre zentrale oder periphere Stellung schließen läßt. Die Untersuchung des Verhältnisses der tschechischen Konsonanten zur Stimmhaftigkeitskorrelation, die in dieser Sprache als wichtigste distinktive Opposition des ganzen konsonantischen Teilsystems zu betrachten ist, hat zu Ergebnissen geführt, die an anderer Stelle dieses Buches zu finden sind.11 Obwohl wir auch das aktive Assimilationsvermögen der einzelnen tschechischen Konsonanten untersucht haben,12 ist für uns in diesem Zusammenhang v. a. die Problematik der phonetischen Realisierung der einzelnen (Mor-)Phoneme in bestimmten Stellungen im Hinblick auf die Stimmhaftigkeit interessant. Den Resultaten (vgl. z. B. die Tabelle auf S. 114) können wir entnehmen, daß man die sub A angeführten Phonempaare (d. h. p : b, t : d, t,: d , , s : z, J : 3) für das Zentrum des Teilsystems der Stimmbeteiligungskorrelation halten kann. Diesem Zentrum schließen sich am engsten das Paar x : h, etwas loser f : v an. Die Gruppen D (k : g) und E (Affrikaten) nehmen im heimischen Wortschatz an dieser Korrelation nicht teil, sie folgen bloß durch die phonetische Form ihrer Allophone den Vertretern der stimmlosen Paarglieder in der neutralisierenden Position. (Dabei knüpft sich insbesondere die Gruppe D dieser Korrelation sehr eng an, da sie — wie wir weiter zeigen werden — in peripheren Konsonantensystemen ausnahmslos die Beziehungen der Gruppe A wiederholt). Die Gruppe F (r) fügt sich der Korrelation bloß am Rande bei. Die Sonorlaute (G) stehen völlig außerhalb des Teilsystems der Stimmbeteiligungskorrelation und bilden eine völlig abgesonderte Gruppe (bzw. Teilsystem), die mit dem tschechischen Konsonantensystem relativ lose zusammenhängt (in der M. I. T.-Klassifikation durch den Gegensatz der Nasalität, außerdem /I/ und /r/ und v. a. /j / stehen völlig abseits), viel loser, als z. B. in jenen slawischen Sprachen, wo die Mouillierungskorrelation existiert, die durch ihre Wichtigkeit die Stimmbeteiligungskorrelation überragt. Die Integrierung der Nasale und Liquiden ist z. B. im Russischen voller als im Tschechischen, um so mehr fällt die periphere Stellung von /j / auf. 10
M. R o m p o r t i , K ieskimu. souhläskovimu nantensystem), SaS 19, 1958, S. 265f. 11 Vgl. hier S. 113f. u Vgl. daselbst, S. 274.
systimu
(Zum tschechischen Konso-
26 3. Wir wollen noch ein weiteres, indirektes Kriterium anführen, das zur Bestimmung der Stellung des Phonems im Zentrum oder am Rande des gegebenen phonologischen Systems angewendet werden kann. Wir haben schon einigemal die peripheren Systeme erwähnt. Wenn wir, wie üblich, jenes System als zentral bezeichnen, das sich in der Lautform des heimischen intellektuellen Wortschatzes kundgibt, bezeichnen wir jene Systeme als peripher, die in den Lehnwörtern, deren fremder Ursprung noch empfunden wird, in den Emotionalausdrücken, doch auch in den Eigennamen (hier wieder in verschiedenem Maße in den einheimischen und den fremden) zum Vorschein kommen. In den einzelnen Sprachen ist der Grad der Übereinstimmung und Verschiedenheit zwischen dem zentralen und den peripheren Systemen ohne Zweifel verschieden. Auf den ersten Blick unterscheidet sich z. B. im Deutschen das periphere System der Lehnwörter und der fremden Namen von dem zentralen (es hat z. B. zusätzlich die Opposition n a s a l — o r a l im Vokalsystem) weit mehr als im Tschechischen, wo das periphere System durch das zentrale viel stärker beeinflußt wird. Gewöhnlich aber stimmen die Zentren dieser Systeme überein und die Unterschiede betreffen eher Randerscheinungen. Die peripheren Systeme sind manchmal um einige Glieder ärmer, z. B. im Tschechischen ist in Lehnwörtern der Stimmbeteiligungsgegensatz der Konsonanten /s/ — /z/ stark herabgesetzt, 18 sehr wenig kommt hier auch der Gegensatz /t,/ — /d,/ zur Geltung. Aber sie können auch um eine Opposition (Korrelation) reicher sein. So ist eben im Tschechischen die Stimmbeteiligungskorrelation (vgl. pontón — bontón, teismus — deismus, (portièra — barrandien), sonáta — zonálnt, Sovinismus — zouiálnU chordála — horda; fokálnl — vokální) in diesem peripheren System erweitert, u. zw. besonders um das Paar der in diesem Randsystem völlig integrierten Konsonanten /k/ — /g/; vgl. eine ganze Reihe von Minimalpaaren, wie kófe — góje (Gen. v. gój), kraal (bzw. král) — grál, loku (Gen. v. lokus) — logu (Gen. v. logos). Im beschränkteren Ausmaß schließen sich auch die Affrikaten an, v. a. das Paar /Í/ — /$/ (d. h. c — dz), z. B. éuvaé — diuueö, cokoláda — giocoso. Da auch in weiteren peripheren Systemen ähnliche Verhältnisse zu finden sind (vgl. in den emotionellen und onomatopoetischen Wörtern, z. B. kakat — gágat, in Eigennamen wie Kabul — Gabun, in den Hypokoristika, z. B. Kába — Gába), ist nicht unwahrscheinlich, daß dieses konsequente Vorkommen in Randsystemen auch die Beurteilung der Elemente des zentralen Systems beeinflussen kann. Man empfindet im Tschechischen das Ver18
Vgl. F. DaneS, Some Remarks on. the Phonemic Status of Loan-words in Czech, ZPSK 17, 1964, S. 161 f. — Vgl. hier auch den bereits zitierten Aufsatz von VI. Mathesius.
27 hältnis /k/ — /g/ viel fester als /!/ — /$/ bzw. /s/ — /£/, und unvergleichbar fester als die Beziehung des stimmlosen und stimmhaften r, und diese volle Integrierung des Phonems /k/ in peripheren Systemen gibt ihm eine festere (und zentralere) Stellung im Zentralsystem, als man nur aus seiner Beteiligung an der daselbst zentralen Opposition schließen könnte. 4. Unsere Bemerkungen wollten auf einige Aspekte hinweisen, die sich bei der Abgrenzung des Zentrums und der Peripherie des phonologischen Systems ergeben. Einige sind bereits in den Arbeiten, die dieses Problem behandeln, berücksichtigt worden, andere aber wurden in diesem Zusammenhang noch nicht in Betracht gezogen. Es bleibt noch die Frage nach der Bedeutung dieser einzelnen Aspekte, ihrer Hierarchie. Wir haben darauf aufmerksam gemacht, daß die Beteiligung an einer größeren oder kleineren Anzahl von distinktiven Oppositionen, rein quantitativ gewertet, über die Stellung des Phonems im System nicht allein entscheidet, daß manchmal der Grad der Proportionalität der Opposition, an der das Phonem teilnimmt, ebenso wichtig oder sogar noch wichtiger ist. Am wichtigsten aber mag sein, wie zahlreich das Phonem vertreten ist. Dagegen wird die Stellung des Phonems in peripheren phonologischen Systemen (im nicht heimischen und nicht intellektuellen Wortschatz) bloß modifizierende Bedeutung haben, u. zw. häufiger in dem Sinne, daß sie die Position des Phonems im Zentralsystem stärkt, als daß sie seine Stellung schwächt, wenn es im Randsystem nicht fest ist. Wenn hier von Zentrum und Peripherie des phonologischen Systems gesprochen wird, so soll das nicht bedeuten, daß diese Teile des Systems scharf voneinander abgetrennt wären. Es handelt sich gewöhnlich um einen abgestuften (nicht fließenden) allmählichen Übergang zwischen einem ausgeprägten Zentrum und einer viel undeutlicheren Peripherie. SUMMARY
THE CENTRE AND PERIPHERY OF THE PHONOLOGICAL SYSTEM For the delimitation of the centre and periphery of a phonological system, or for the evalution of its members as being central or peripheral, a single criterion is not adequate e.g. (1.1) participation in a greater or lesser number of distinctive oppositions. In addition to this criterion it is necessary to respect (1.2) the properties of these oppositions, above all, whether they are isolated or proportional (or as the case may be what in the degree of its proportionality), further (2) the distribution of the phoneme and the degree of its combinational potence, (3) the place of the phoneme in the central phonological system (in the domestic, intellectual vocabulary) and in the peripheral systems (in the emotional words, loan-words, proper names etc.). There is a discussion as to the hierarchy of these criteria.
I I I . VOCALIC F O R M A N T S A N D T H E C L A S S I F I C A T I O N OF VOWELS
0. Our initial presupposition is the recognition of the fact that it is possible to classify the phonemes of a language on the basis of the acoustic properties of their realizations. On several previous occasions we have dealt with the investigation of the limits to which this is possible, giving analysis of concrete cases by way of illustrations.1 The present study also aims at the further elucidation of some questions concerning the system of vowels. 1. As early as 1952 there appeared the by now classic study of Jakobson, Fant and Halle2 based on the presupposition that decisive for the classification of vocalic phonemes is the relation between the frequencies of the first three formants; on this relation are based the distinctive features (and on them the distinctive oppositions) g r a v e — a c u t e and c o m p a c t — d i f f u s e , or, if need be, f l a t — plain. Later definitions of these features (oppositions) no longer speak verbis expressis of this relation of frequencies but only of zones of the concentration of overall energy.3 However in certain phonetic and phonological studies the minimum of three vocalic formants and their relations continues to be applied in the classification of vowels. 4 Further intense acoustic and perceptual analyses have led to differing opinions as to the relevance of the vocalic formants. There are studies which even deny outright the significance of the formants (or at best 1
E.g. M. R o m p o r t l , Zu akustischen Korrelaten der distinktiven Merkmale, Proceedings Miinster, pp. 506—510; Ibid. Zur akustischen Struktur der dinstinktiuen Merkmale, ZPSK 16, 1964, pp. 191—198; cf. also in this book On the Phonic Analysis of Language, pp. 11 seq. 2 Preliminaries to Speech Analysis, Cambridge (Mass.) 1952. 3 Fundamentals of Language, 's-Gravenhage 1956, paragraphs 3.61 and 3.62. 4 E. g. W. J a s s e m , A Phonologic and Acoustic Classification of Polish Vowels, ZPSK 11, 1958, pp. 299 seq.
29 express scepticism),8 side by side with studies which respect — albeit in differing degrees — four formants (although G. Fant, for example, is clearly concerned above all with the degree of acoustic naturalness and the acceptability of four-formant vowels, rather than with the evaluation of the relevance of the fourth formant).6 In our analyses of the vowel system of Russian7 we have treated as relevant above all the frequency (frequency band) of the first and second formant (Fx, F2), and their relationship which — expressed in graph form in the logarithmic network in a way modified from the works of Joos, Peterson — Barney, Fant and others8 — has served for the mapping of relations among positional variants (allophones) of the vocalic phonemes, and for the resolution of the problem concerning the realization of the Russian vocalic system in strong and weak positions. At the same time we were of course aware that here too — as has demonstrated similarly for Czech the analysis of Borovickova and Mal&59 — the third, and maybe even a further formant, may have a certain informational value, which, in accordance with our theory, we accord even to the so-called redundant (or also irrelevant) acoustic elements which together with a relevant element produce the realization of a distinctive feature.10 More on the basis of intuition than analysis we have accorded this value to the third formant particularly in languages with a larger inventory of vowel phonemes, languages which therefore usually also have a more complex vocalic system. At the same time we have not excluded the possibility that not without significance may also be here differing intensity (physiological more than physical), or the mutual relation between the intensities of the individual formants; however we shall be rather concerned with more or less constant relations of intensity for the individual vowels," and it will continue to be necessary to consider * W. T s c h e s c h n e r , Ergebnisse bei der Analyse von deulschen Sprachlauten, ZPSK 17, 1964, pp. 1—19; also in Proceedings Prague, pp. 949—954; — H. Y i l m a z , A Theory of Speech Perception, Bulletin of Mathematical Biophysics 29, 1967, pp. 793—825, II. Part mimeographed, pp. 1—37. 6 G. Fant, Acoustic Analysis and Synthesis of Speech with Application to Swedish, Ericson Technics No. 1, 1959, pp. 3—108. 7 M. R o m p o r t l , Zvukovy rozbor ruStiny (Phonic Analysis of Russian), Praha 1962; also K ruskimu vokalickemu systimu, Slavica Pragensia 3, 1961, pp. 101—118; cf. in this book On the Vowel System of Russian, pp. 37 seq. * M. Joos, Acoustic Phonetics, Language Monograph 23, Baltimore 1948, p. 49 seq.; G. E. P e t e r s o n - M. L. B a r n e y , Control Methods Used in a Study of the Vowels, JASA 24, 1952, p. 175 seq.; G. F a n t , op. cit. * B. Boro v i £ k o Physikalische und perzeptionelle Identifikation der tschechischen Vokale, ZPSK 17, 1964, pp. 137—148; also B. BoroviCkovd - V. Mal46, The Spectral Analysis of Czech Sound Combinations, Praha 1967, p. 13. 10 Cf. here On the Phonic Analysis..., pp. 11. 11 Cf. G. F a n t , Acoustic Theory of Speech Production, 's-Gravenhage 1960, p. 107 seq.
30 as decisive above all the frequencies and frequency ratios of the individual formants, provided their intensity reaches the necessary minimum. 2. We shall then leave aside the question of intensity and endeavour to discover the extent to which the first four vocalic formants are relevant as a factor distinguishing a vowel from all the other members of the given vocalic system. We set out from the assumption that all the basic features necessary to the identification of vowels are contained within the time limits of the realizations of the vocalic phoneme (whereas the consonantal phonemes are established by features, some of which are outside these time limits). 12 W e have selected examples from a number of languages which differ from one another not only in the wealth of their inventory of vowel phonemes and their phonetic realizations but also in the structure of their vocalic systems. Czech represents a type with a small number of vowel phonemes (five short and at most five long, where the difference of timbre between the corresponding long and short vowels is slight and from our point of view negligible);13 similarly Slovak (with six short vowels and five long vowels with similar relationships obtaining). 14 If we leave aside the diphthongs, which differ markedly from the monophthongs above all in changes in their formant frequencies, we also find in these two languages only very slight variability of timbre in the realizations of vowels depending on position. (Of course we do not overlook the variability of the formants in their duration when in the neighbourhood of consonants which occurs in all languages; however we consider this to be an acoustic feature characteristic for the neighbouring consonant — cf. p. 43.) On the other hand we take French as an example of a language with a large number of vowels. Because the use of different criteria for finding the phonemes of French produces vocalic inventories of different sizes, we make no decision here as to the correctness of the method employed for establishing the phonemes and we take account of the possible maximum number of basic types of phonetic realizations. In cases where we have to deal with the complementary distribution of two vocalic types we shall have to break down our general statements into subdivisons differentiated according to position, similarly as we do later for Russian. We leave out of our statements the nasal vowels whose interrelations are analogous to the relations between the corresponding non-nasal vowels; in any case as Cf. our Zvukovfi rozbor ruStiny, On the Phonic Analysis... etc. " E . g. B. H&la, Akustickd podstata samohldsek (Acoustic Nature of Vowels), Praha 1941 and others. 14 Cf. A. I s s a t s c h e n k o , Spektrograficka analtjza slovenskijch hldsek ¡(A Spectrograph«: Analysis of Slovak Speech Sounds), Bratislava 1968. 12
31 members of the category of nasal vowels they all differ markedly from each member of the category of non-nasal vowels.15 As a transitional type we take the vocalic system of Russian where the number of phonemes is small (five, or let us say five in strong positions, in weak positions less, usually three), but with marked distinctions of timbre in their positional variants of which there are a great number.16 As our basis we have taken the previously mentioned graphic expression which maps the relations between the vocalic phonemes on the basis of the first and second formants in the relations of the relevant phoneme. We are of course aware that there are here only the positional relationships in articulation (as developed from Hellwag's triangle to the various polygonal representations e. g. Jones').17 Nevertheless this is beyond doubt the representation which best corresponds to the intuitively established relations between the individual vocalic phonemes especially in the less complex systems (or in some partial systems). This basic, and nowadays widely used representation is here supplemented by others which express the relations between the vocalic phonemes on the basis of relations of the other formants. That is to say, in the individual diagrams we proceed gradually in the representation of frequency ratio of Fx (or F2) to F 3 and then F 4 , in the logarithmic net. For the sake of completeness we finally record the ratio F 3 : F 4 . We add, for the sake of precision, that for simplicity we use the mean formant values from the total of the relations analysed from one test subject. In fact the individual relations are dispersed over a greater or lesser area. Essentially however the ratios remain analogous in each case. 2.1 Let us take one of our Czech examples as a beginning. In figure 1 there are recorded the average values for the five Czech vowels in the pronunciation of one person (Cz 3, male). Similarly as in the cases of our other speakers (and in agreement with the results of Borovickov& and Mal&6, op. cit.) the representation of Fa : F 2 offers a clear picture of the distinctiveness and interrelations of the representatives of the vocalic phonemes (the position of [e] and especially [o] points to their quite marked open character, typical for speakers from Prague). On the other hand the representation of Fx : F 3 and F2 : F 3 merely shows the interrelations of the second and third formants respectively for the individual vowels, with only a slight variability of F 3 . The case is the same in the representations of Fx : F 4 and F 2 : F 4 although the frequency variations of F 4 are slightly greater (the differences 15
On this point we may accept the characterization of Fundamentals of language, par. 3.61, VI. 16 Gf. our Zvukovtf rozbor ruStiny. 17 Cf. especially F a n t ' s monographs quoted above (notes 6 and 11).
32 of F 3 fluctuate for the most part within the space of one semitone, F 4 within the space of something under a whole tone). Finally the representation of F 3 : F 4 gives almost indistinguishable results for all vowels. Thus for this speaker we may assume that the acoustic elements by which the individual vowels are distinguished are the frequency and relation of
Figi
the first two formants, not however the frequency and relation of the other two formants, not even their relation to the first two, still less their mutual relation. f51 If we compare this representation with graphs for the pronunciation of other Czech speakers, which we do not give here, we find that in general they agree though the dispension of the frequency values for F 3 and F 4 is sometimes rather greater. As a rule it does not exceed three semitones, a negligible value as far as we are talking about the pitch not of the fundamental tone but of the higher tone which is a component of the acoustic spectrum of a complex tone. The greatest difference recorded was five semitones (Cz 6, male) between F g of [u] and [i]. In this respect it would be possible to consider the difference in this speaker as a concomitant feature to the frequency of F 2 (not of course consistent since the F 3 of the vowels [e], [o] and [a] is almost identical). Thus we have here a difference characteristic of the individual pronunciation, in the same way as, for example, the variations of frequency and
33 range of the frequency zones of the third and fourth formants, and not a feature typical for the Czech vocalic system where we cannot even treat it as redundant but at best irrelevant. 2.2 It appears that the situation in Slovak is not unlike that in Czech. For Slovak, in the representation of relationships among the short vowels according to F x : F2, the vowel [se] (in so far as it is realized in the speaker's pronunciation) comes between [a] and [e]. The differences of frequency of
e o
F3
3
a
y^a«0
Ii
1
3-
i
I
€
\
5
a.
a a
(
01
u I
y i
3
u
o u u 0 .8
t
( < a , o) and i ( < i , e) in the second degree of reduction after hard consonants, as shown in Fig. 5. Here of I
ro
Ls
2
0, Lu
/i
Fig. 5. Distribution of unstressed vowels after hard consonants in the second degree of reduction
course the extreme possibilities of the realization of t> and i are further apart, and in some persons are quite distinguished; even so, in a certain area we do find overlapping and fusion. Thus the realization of the system fluctuates between F2
T> U
ù
i
Ï
I would point out that our 'inability' to discover using our mode of
55 analysis, clear distinguishing features between the realization of what may be two different phonemes is not caused by any lack of 'fineness' in our method. We would not be helped out of this difficulty even by respecting the so-called third formant. On the contrary this impossibility of precise delimitation is given by the unstable relation between the two sound types in the language itself.
0.5
s' 0,25
( i 1J V
V iv}\
1
\
e/ VN
H '
)
Fig. 6. Distribution of unstressed vowels alter soft consonants in the first degree of reduction
2.32 If we take a look at Fig. 6 which represents the distribution of the realizations of vocalic phonemes in the first degree of reduction after soft consonants (i.e. -SvH, -SvS), we can see at first glance that here too we have a problem analogous to that of the relation between 8 and i after hard consonants. Our diagram restricts clearly the area of reduced u, which is marked by low F„ and against which stand the areas of reduced e and ! penetrating each other. It is superfluous further to explain that in this point our method well illustrates the problem of so-called ikanie in contemporary Russian. In some cases, and especially where the speaker feels the necessity of distinguishing between words with etymological e from those with i (e.g. jieca x Jinca, etc.), we may find (certainly most often under the influence of spelling) maximum differentiation (i. e. in our test subject: e: Fj 320 Hz, F2 1300 Hz; i: F t 230 Hz, F 2 1700 Hz, all figures approximate). Then we may consider a relationship e Fx
u
i
which we would prefer (in view of the relationship between unstressed vowels after hard consonants) to the expression
F, e Fx
u
I
56 If however we were to take systematic ikanie as the basic type then we might express the relation as F, a
i
In this way the relation between unstressed vowels after soft consonants in the first degree of reduction would be quite similar to that in the second degree of reduction (viz Fig. 7) which can only be expressed as F2 Ü
b
2.33 I think that similarly as we did not treat as separate partial systems those of the stressed basic and palatalized (in the first and second degree) vowels, we cannot do so with the unstressed vowels either. I
C\
Ls
) V
2
.» 6 1
Fig. 7. Distribution of unstressed vowels after soft consonants in the second degree of reduction
From the analysis of the material we may arrive at the conclusion that in the unstressed position there are three vocalic phonemes, which we designate as /S/, /u/, and /I/, which are realized as follows: after H
after S
1st degree 2nd degree l r t degree 2nd degree ä
ä(e)
T>
5(1)
b
ü
ü
ü
ü
ü
x
1(8)
i
b
i W
Table III
Table IV
4»
*
57 Whereas the phoneme /ii/ always retains its independence in the literary language, the opposition between the phonemes /S/and /!/ is only potential in some positions (in the second degree after H, in the first degree after S),*8 being in the second degree of reduction after S even cancelled out (only hypercorrect pronunciation preserves it here). A special case is that in position I (1st degree) after H where the pronunciation [S] after ¡i, s/ and /c/is possible. This [e] behaves here as a kind of parasite on the three basic phonemes, and it is not easy to decide whether it is a realization of the phoneme /!/ (as acoustic analysis would rather seem to indicate) or of /&/ (as etymology would tempt us to assume), or whether we ought not after all to allow for this very infrequent position a separate system of four members (having three degrees according to FJ. Since the absence of one or the other opposition in any position (I do not wish to speak of its neutralization here) does not mean eo ipso the loss of the existence of a phoneme in the language, I think that we may conclude by expressing the relations between the members in the system of unstressed vowels thus: (4) F,T -
+
—
+ —
Fjj
ä ü
i
2.4 I consider that our mode of analysis has indicated the basic nature of a number of problems which we encounter in the Russian vowel system, and that it has also indicated ways of solving them. It has also been shown that the frequency and ratio of the formants we use are basic components of some of the distinctive features (properties), and that the limitation of the number of formants with which we work not only does not restrict the possibilities our analysis affords, but has even made it possible to cast light on some problems which are not easily explicable by respecting the third tone as third formant. In conclusion it remains for me to give a concise picture of the Russian vowel phonemes in the form of a table which at the same time expresses our opinion as to how to proceed in the identification of these phonemes. 28
As to its potentiality I would compare it, for example, to the opposition of long closed and open e in literary German (cf. the possible differentiation of pronunciation of the words Ehre — Ähre, Beeren — Bären, etc., but also the possible identical pronunciation with closed [e],not however with open [e]). Also, for instance,unstressed etymol. 2 and I in Russian may fuse though in the direction of [I] and not [6].
58 u (1) (2) (5) (3) (4)
Tone — Noise Tg (C) - I (V) Str — nonStr F x | — FxJ,. F,t - Fa|
+ -
o +
a +
e +
±
+ + o
+ ± +
i +
+
u +
S +
i
-
+ 0
+
In the case that we should replace opposition (4) by opposition (4a) then the fifth row would be changed to (4a) Cc — D
+
+
0 —
—
+
0
—
Key to tables III and IV Stressed: a 1, 2; ì 3, 4, 8; à 5 e 6; é 7; è 9 i11;i10 o 12; ò 13; 5 14 u 16; ù 15, 17; ti 18 Unstressed: After hard consonants: à 3, 12, 13; T, 2, 10, 11, 13; 6 9; i 15 Unstressed: After soft consonants: -è 1, 4; I 8; b 9, 12, 14
V. ON THE PHONIC REALIZATION OF THE R U S S I A N MORPHONEME
rvani
Abb. 3
zvanl
Tafel XII
10-
Tafel XIII
\f :
/>
rs \
\ in \ J M
J
/N
t
/X
rv \
I
r\J
rada
-n
\
\
I ' V .
fada
r
/
V
N
iàdd Abb. 5
/ li-
N
\\
N
Tafel X I V
rvani
rvani Abb. 6
ivani
89 Konsonantexigeräusche (darunter des stimmhaften [r] und des stimmlosen [r°] für weitere Laboratorversuche von den ersten vier Personen zu gewinnen. Außer der akustischen und Gehöranalyse mit Anwendung der obenangeführten Methoden hat man für Kontrollzwecke auch einige Versuche mit akustischer Umwandlung dieser und auch anderer Aufnahmen und mit Abhören dieser umgewandelten Aufnahmen durchgeführt. Auch die Resultate einiger von diesen Versuchen werden wir hier erwähnen. 2.1 Wir wollen zuerst die Analysen jener Beispiele in Betracht ziehen, wo wir ganz absichtlich einzelne Wörter gegenübergestellt haben, die sich voneinander nur durch ein einziges Phonem, u. zw. in der normalen Hochlautung (in expliziter Form) unterscheiden. Unter den untersuchten Realisierungen jener Phoneme befanden sich immer die Realisierungen des /r/. Seine stimmhafte Variante [r] wurde immer in analoger Stellung mit der Realisierung der Phoneme /r/, /z/, bzw. auch /!/ verglichen, seine stimmlose Variante [f°] dann vor allem mit den Realisierungen der Phoneme /r/, /s/ (bzw. mit dem Repräsentanten des Phonems /z/ in Neutralisierungsposition, d. h. [J]), bzw. auch /s/ (resp. /z/ in Neutralisierungsposition, d. h. [s]), manchmal auch /l/. Dabei haben wir die größte Aufmerksamkeit dem Verhältnis [f] : [r], [f] : [3] gewidmet (bzw. hat man auch die möglichen Analogien der Beziehung [f] : [3] und [r] : [1] gesucht), aber auch dem Verhältnis [r°] : [J]. Die stimmhafte Variante [r] im Worte rada [rada] (Reihe) vergleicht man mit dem [r] im W. rada [rada] (Rat) und [3] im W: Sddä [3a:da:] (verlangt), bzw.iauch [1] im W. lada [lada] (Heide) und [z] in zdda [za:da] (Rücken). Außerdem wird dieselbe Variante im Worte fvani [rvan,i:j (Geheul) mit dem [r] im W. rvarti [rvan,i:] (Raufen) und [3] in zvani fövan,i:] (schwätzt) verglichen. Die stimmlose Variante [r°] wird in diesem Teil unseres Materials im absoluten Wortauslaut dargestellt, u. zw. im Worte var [var] (koch'!), mit dem wir [r] im Worte var [var] (Kochpunkt) (das wieder mit dem [1] im W. val [val] (Schanze) verglichen wird), das [J] im Auslaut (das in dieser neutralisierenden Stellung das Phonem /£/ vertritt) im W. vai [vaj](bindel)' bzw. [s] (das diesmal das Phonem /z/ im Worte vaz [vas] (Genick) vertritt). Außerdem haben wir die stimmlose Variante [f°] untersucht, die einem anderen stimmlosen paarigen Konsonanten entweder folgt oder vorangeht. Das [r°] im Worte krovi [kr°ovi:] (Gebüsch) vergleichen wir mit dem [r] im W. krovy [kravi] (Dachstühle) (dieses wieder mit [1] im W. klove [klovej (pickt) und mit [s] in der Wortverbindung k soM [ksobje] (zu sich). Die stimmlose Variante [r°] im Worte pekarstvi [pekar°stvi:] (Bäckerei) wird weiter mit [r] in carstvi [tsarstvi:] (Tsartum) und mit [J] in velikäSstvi [velika:Jstvi:] (Größenwahn) verglichen.
90 2.11 Wie wir schon e r w ä h n t haben, ist Issatschenko auf Grund der Sonag r a m m e der Aussprache seines Sprechers zu dem Schluß gekommen, d a ß das tschechische f keine V i b r a n t a in eigenem Sinne des W o r t e s darstellt, wie es z. B. beim tschechischen r der Fall ist. Wir werden also versuchen unsere A u f m e r k s a m k e i t vorerst ebenfalls dfcn sonagraphischen Analysen unserer Belege des expliziten Aussprachestils zu widmen, erst später werden wir sie mit den R e s u l t a t e n konfrontieren, die wir mit A n w e n d u n g noch weiterer (von Issatschenko nicht b e n u t z t e n ) Methoden gewonnen haben. 2.111 W i r f ü h r e n vor allem die S o n a g r a m m e der W ö r t e r rada, rada und zddd an, u. zw. in der Aussprache des Mannes E (Abb. 1) und der F r a u B (Abb. 2 — hier wird von dem W o r t e zdda bloß der Teil [3a : d ] reproduziert). In beiden Fällen h a n d e l t es sich u m eine zwar sorgfältige, doch immer völlig natürliche Aussprache. Der Sprecher E setzt hier (ähnlich, wie sehr oft in anderen Fällen, wo das Wort mit einem s t i m m h a f t e n K o n s o n a n t e n a n f ä n g t ) vor dem K o n s o n a n t e n mit einem vokalischen L a u t des g-Typus ein, der dem folgenden Konson a n t e n akustisch a n g e p a ß t wird. In m a n c h e n Fällen wird dieses vokalische E l e m e n t sogar h a r t eingesetzt. Dieses E l e m e n t erscheint in unseren Belegen wie vor [r] (hier mit dem h a r t e n Stimmeinsatz), als auch vor [r] u n d [3] (mit weichem Einsatz). Man m u ß zugeben, d a ß dieses vokalische E l e m e n t (von 6 Perioden) eine ähnliche F o r m a n t e n s t r u k t u r vor [r] und [r] aufweist (F x 0,6 k H z , F 2 1,4 k H z , bzw. F 4 2,5 k H z , F 4 4 kHz), wogegen vor [3] F 2 höher liegt (1,8 k H z ) und abgeschwächt ist, obwohl nicht in dem Maße wie F x , der von einem S o n a g r a m m (bei der b e k a n n t e n begrenzten D y n a m i k dieses Verfahrens) nicht ablesbar ist. Von den Unterschieden der Spektra dieser Vokalelemente abgesehen k a n n m a n selbstverständlich einen gemeinsamen Zug feststellen, u. zw. ihren unbestreitbar periodischen C h a r a k t e r (mit diskretem S p e k t r u m und scharf abgegrenzter F o r m a n t e n s t r u k t u r ) , unabhängig davon, was f ü r einen K o n s o n a n t e n sie einleiten. Sollten wir unser Beispiel der Aussprache des |r] auf der Abb. 1 isoliert betrachten, wäre es verlockend Issatschenkos These a n z u n e h m e n , d a ß das tschechische [r] ein K o n s o n a n t des T y p u s einer A f f r i k a t a sei; sein erster Teil wäre ein Element, das dem [r] bzw. einem Vokal sehr nahe s t e h t , sein zweiter Teil d a n n einem Geräuschkonsonanten (bzw. einem Zischlaut) ähnlich ist (wie m a n auch unseren S o n a g r a m m e n e n t n e h m e n k a n n ) . D a n n m ü ß t e m a n aber nach unseren Belegen auch den K o n s o n a n t e n [3] in der Aussprache von E als Affrikata b e t r a c h t e n , wogegen [r] als reine Vibranta, wo der vokalische E l e m e n t durch eine D ä m p f u n g unterbrochen würde, zu bezeichnen wäre.
91 Erst eine Konl'rontierung mit den übrigen Belegen zeigt, daß man hier (bzw. wenigstens hier) das vokalische Anlautsegment f ü r ein nicht entscheidendes (irrelevantes) Element halten muß, das als ein potenzieller Bestandteil der Ausspracherealisierung eines s t i m m h a f t e n Anlautkonsonanten im Tschechischen anzusehen ist (u. zw. am häufigsten im absoluten Anlaut und in der Lentoaussprache). Wir wollen an dieser Stelle die einzelnen akustischen Phänomena im Spektrum des Konsonanten [r] nicht ausführlich analysieren, wir machen bloß auf die unbestreitbare Differenz des akustischen Verlaufs aufmerksam, wenn wir die E-Aussprache des [r] und [1] vergleichen (bei [r] eine ausgeprägt periodische Struktur auch während des abgeschwächten Segments, die bei [r] fast nicht zu entdecken ist), aber auch auf den Unterschied der Verteilung der Hauptverstärkungen während der Realisierung des [r] und [3], (bei [f] ein H a u p t z e n t r u m zwischen 2,5 und 4,3 k H z mit einem schwächeren, doch deutlichen Nebenzentrum cca um 9 kHz, bei [3] zwei auffallende Gipfel um 2,5 und 3,5 k H z mit viel schwächeren höheren Zentren), bzw. auf das Vorhandensein von 3 bzw. 4 D ä m p f u n g e n im Frequenzbereich von 0,5 bis 1,5 kHz (vgl. in Vergrößerung auf Abb. 4) die den drei (bzw. noch einer schwächeren vierten) Schwingungen entspricht, was bei [3] nicht zu finden ist. F 2 der folgenden Vokale zielt nach [r] und [r] in die Frequenzzone u m 1,5 kHz, wo der Lokus der Alveolaren in der Aussprache dieses Tschechen zu suchen ist, F 2 nach [3] zielt zu dem Lokus der Alveopalatalen, d. h. um 1,9 k H z . Dabei zielt auch F 2 bei diesem Sprecher in eine tiefere Frequenzzone. Auch in der Aussprache von B ist ein Anfang periodischen Charakters vor allen drei Anlautkonsonanten zu finden, doch bloß bei [r] weist er einen „vokalischen" Charakter auf, wogegen vor [r] und [3] auf dem Sonagramm periodische Schwingungen bloß um den Bereich des Grundtons zu entdecken sind. (Oszillographische Registrierung h a t aber auch hier vokalische Anlange gezeigt, doch mit deutlichem Übergewicht des Grundtons.) Das Sonagramm des [r] zeigt deutlich zwei stärkere und eine schwächere D ä m p f u n g (wobei während der letzten, bei der die Intensität unter die untere Grenze des Registriervermögens des Geräts nicht gesunken ist, die periodische S t r u k t u r bewahrt geblieben ist). Bei [r] und [3] wird die Stimmhaftigkeit beider Laute deutlich registriert, der Unterschied zwischen beiden besteht (gleich wie bei E und anderen Personen) darin, daß in [3] zwei (oder noch mehr) deutliche Verstärkungszonen vorhanden sind (hier um 3, 3,8 bzw. noch 4,7 kHz), wogegen sie bei [r] überwiegend voneinander nicht abgegrenzt werden (oder die Abgrenzung ist meistens nicht so klar). Die einzelnen Dämpfungen sind hier nicht so deutlich zu sehen, wie bei E, doch im Vergleich mit [3] sind in dem entscheidenden Frequenzbereich ohne unperiodische Elemente Spuren von 4 Schwingungen zu sehen.
92 Auch für B entspricht der Lokus von [r] und [f] dem der Alveolaren (d. h. hier cca 1,7 kHz), der von dem [3] unterschiedlich ist (cca 2,1 kHz). Die stimmhafte Variante kommt auch in dem Worte fvani vor, das wir wenigstens. auf Abb. 3 (rvani, fvani, iuani) in der Aussprache von E anführen. Diese Sonagramme (gleich wie die Analysen der Aussprache der übrigen Personen) bestätigen die bereits festgestellten Tatsachen. Bei E ist der Anfang vor dem Konsonanten wieder vokalischen Charakters (bloß bei [r] erscheint schon nach der ersten Vibration die erste von den zwei Dämpfungen — bei B ist z. B. vor [r] und [3] wieder der stimmhafte Anlaut vor dem Erscheinen des Zischlautgeräusches gut entdeckbar). Die Verteilung der Hauptverstärkungen entspricht auch den schon früher angeführten Werten. In dem Sonagramm des [r] entdeckt man bei E 3 Schwingungen, die sich v. a. in dem bereits erwähnten Bereich von 0,5 bis 1,5 kHz geltend machen, wogegen sie bei [3] fehlen. Auch das Zielen des F 2 des folgenden Lautes (der in diesem Fall kein Vokal ist, sondern ein [v], dessen zwei erste Formanten auf den meisten Sonagrammen gut sichtbar sind), entspricht den schon erwähnten Angaben über Loci der entsprechenden tschechischen Konsonanten bei den einzelnen Sprechern. 2.112 Wir wollen unsere Untersuchung der sonagraphischen Analysen an dieser Stelle unterbrechen und noch andere Methoden der akustischen Analyse heranziehen. Die Sonagramme haben uns in den meisten Fällen z. B. den Unterschied zwischen dem stimmhaften [r] und [3] in der Schwankung bzw. NichtSchwankung der Intensität in den tieferen Frequenzzonen gezeigt, doch ist der Unterschied nicht dermaßen ausgeprägt, daß man bloß auf Grund der Sonagramme endgültige Schlüsse ziehen könnte. Es interessiert uns, ob vielleicht die Messung der Gesamtintensität über den Charakter des [r] aussagen könnte. Auf Abb. 5 führen wir die Pegelregistrierungen der Wörter rada, fada und zddä in der Aussprache unserer fünf Personen. (Die waagrechten Linien bezeichnen den Abstand von 5 dB.) Wenn man die Registrierungen der Intensität betrachtet, geht klar hervor, daß bei allen Aufnahmen des Lautes [r] klare Schwankung der Gesamtintensität vorhanden ist, die den Vibrationen entspricht. Aber auch bei [f] sind in allen Fällen deutliche Intensitätsschwankungen zu sehen, die meistens häufiger sind, doch überschreiten sie nicht 5 dB, meistens sind sie noch kleiner. Bei den Personen A, B und D ist dagegen der Verlauf der Intensität in [3] ganz verschieden, sie wächst allmählich (oder stufenweise) ohne zu schwanken. Bei C ist am Anfang ein Sprung zu sehen (das Sinken vor dem neuen fließenden Ansteigen beträgt 3 dB), der dem vokalischen Anfang entspricht. Am merkwürdigsten ist in der Tabelle der Verlauf in [3] bei E. Man sieht da zwei Schwankungen, die denen in [r] ziemlich ähnlich sind (die Intensitätschwankung überschreitet nicht 2 dB) — die erste entspricht wieder dem vokalischen Element am Anfang des Wortes, für die
93 zweite finden wir z. B. im Spektrogramm kein auf den ersten Blick auffallendes Gegenstück. Im großen und ganzen gibt uns die Übersicht auf Abb. 5 doch eine gewisse Vorstellung, die von einem Unterschied im Intensitätverlauf der sgn. Vibranta [r] und der Spiranta [3] zeugen könnte. Wollten wir in dem Verlauf der Gesamtintensität das entscheidende Zeichen dieses Unterschieds sehen, so bringt uns schon die nächste Abb. 6 mit Pegelschreiberregistrierungen der Wörter rvani, fvani und zvani eine Enttäuschung. Der Konsonant [r] wir hier zwar immer durch deutliche Schwankungen charakterisiert, in den Registrierungen von [f] und [3] dagegen findet man keine großen Unterschiede, wenn man die zwei Belege immer in der Aussprache derselben Versuchsperson vergleicht. Wenn man das erste Anwachsen der Intensität im Anlaut dem vokalischen Element zuschreibt, so kann man sagen, daß die Intensität bei einigen Personen in beiden Lauten gleich fließend (resp. stufenweise) anwächst (und dann zum [v] gleich steil absinkt — bei A, B, aber auch C und D), bloß bei E ist doch ein Unterschied in [r] zu merken. Wenn man jetzt zu den Registrierungen des [r] zurückkehrt und sie mit den übrigen auf dieser Abb. vergleicht, so sieht man auch da (außer bei A), eine ziemlich auffallende Ähnlichkeit, die davon zeugt, daß der Verlauf der Gesamtintensität in der Stellung des stimmhaften Konsonanten vor einem anderen nicht zu den entscheidenden akustischen differenzierenden Zügen gehören wird. Wir haben weiter versucht, den Verlauf des Grundtons zu registrieren. Auf Abb. 7 wird der Verlauf der Tonhöhe während der Realisierung der Laute [r] und [3] in den Wörtern fada und iddd darstellt, wobei der Verlauf im eventuellen vokalischen Anfang ebenfalls (bzw. zum Teil) ausgemessen wird. Es ist klar, daß die zur Verfügung stehenden Methoden den Verlauf des Grundtons in den stimmhaften Zischlauten nicht völlig verläßlich registrieren. Wir haben uns des Ausmessens der oszillographischen Aufzeichnung bedient, die wir mit anderen Methoden konfrontiert haben, so daß man unsere Abb. für relativ verläßlich halten kann. Bei den Personen C und D, aber auch A ist der Unterschied des Verlaufs auffallend. Der Laut [r] wird durch ausgeprägte Schwankung der Tonhöhe, vor allem im eigenen „Geräuschteil", charakterisiert, wobei in der Aussprache C und D die Tonhöhe dreimal sinkt und zwei Erhöhungen aufweist, bei A ist nur klares Sinken im ersten Teil des Lautes zu sehen, dagegen sind im Verlauf des [3] keine solche Schwankungen vorhanden und die Tonhöhe verändert sich fließend. Bei E ist fast kein grundsätzlicher Unterschied in dem Tonhöhenverlauf beider Konsonanten zu merken, in beiden schwankt der Ton sehr wenig und allmählich. (Wir haben hier den ganzen vokalischen Anfangsteil ausgemessen und es sind keine wesentlichen Unterschiede — außer dem etwas tieferen Ton im „Konsonantenteil" — zu entdecken.)
94
rd
rd
ho
fl>
ho
cd
fD
>s_
n>
NO I O
o O
£ -"Ï. ^ O LU
^ JD < J>
95 Dagegen sind bei B in beiden Fällen auffallende Schwankungen vorhanden, obwohl in [f] viel deutlicher als in [3]. W i r haben noch einzelne Segmente mit dem Schall-Analysator analysiert um akustische Spektra zu gewinnen. Sie haben in Einzelheiten die Verteilung der Intensitätszentra gezeigt, die wir schon durch die sonagraphische Analyse gewannen, doch ihr Stärkeverhältnis wird hier genauer ausgedrückt. ( W i r führen später einige dieser Analysen an — vgl. Abb. 13.) 2.12 W i r wollen j e t z t unsere Aufmerksamkeit den Belegen des stimmlosen [r°] zuwenden, und werden ähnlicherweise die sonagraphische Analyse mit den weiteren Resultaten konfrontieren. 2.121 Auf der A b b . 8 und 9 werden Sonagramme der W ö r t e r var, vaf, uaz und val in der Aussprache von E und B dargestellt. In der Auslautposition weist das [r] in der Realisierung von E eine deutliche Dämpfung auf, bzw. eine schwächere zweite (in einem Zeitabstand von cca 100 ms), wobei die periodische S t r u k t u r auch hier bewahrt bleibt. (In diesem Sinne weist auch das [1] außer der durchlaufenden Periodizität — wobei die Formantenzonen fast übereinstimmen — eine gewisse Änderung der Intensität im Zeitverlauf auf, doch handelt es sich hier eher um abwechselnde Übertragung des Hauptzentrums der Intensität vom F x zum F 2 und umgekehrt, als um eine Dämpfung, die das ganze akustische Spektrum betrifft.) D a s stimmlose auslautende [r°] wird durch die Ausweitung eines H a u p t geräuschzentrums auf eine Frequenzzone von cca 2,5 bis 4,5 k H z (d. h. ungefähr wie beim stimmhaften [r] bei denselben Sprechern) mit einem schwächeren Zentrum über 6 k H z charakterisiert. Dabei kann man zwei bis drei kurze Dämpfungen innerhalb der ersten 6 0 ms (ungefähr im ersten Drittel des Gesamtdauer), u. zw. wieder in den tieferen Frequenzzonen finden, doch in den zwei letzten Dritteln sind ähnliche Schwingungen nicht zu entdecken (bzw. man könnte auf zwei Stellen in und nach der Mitte noch eine schwache Spur von zwei weiteren Schlägen finden). Im optischen Bild k ö n n t e man aber eine solche Spur auch im ersten Drittel des auslautenden [J-] finden, wo bei der Artikulation keine Schwingungen vorkommen und wo man durch die Gehöranalyse keine hörbaren Spuren erfassen kann. Sonst weist die akustische S t r u k t u r des L a u t e s [J] die Formantenzonen in denselben Frequenzbereichen auf, die man in den sonagraphischen Registrierungen des [3] entdecken konnte, d. h. um 2 , 5 und 3,5 k H z außer einigen höheren Verstärkungen (um 4,5 bzw. eine sehr schwache zwischen 6 — 8 kHz). Selbstverständlich fehlen wie bei [f] als auch bei [r°] die Grundfrequenzschwingungen. E s ist zu erwähnen, daß das [f°] bei- diesem Sprecher in dieser Position kürzer ist (ungefähr 2 0 0 ms) als [f] (cca 2 7 0 ms). Das Zielen des F 2 der vorangehenden Vokale ist vor [1], [r] und [r°] fast
96 gleich und entspricht ungefähr der Lokuszone für alveolare Laute, dagegen vor [J] steigt F 2 des vorangehenden [a] und zielt in die Zone der alveopalatalen (bzw. der palatalen) Laute, wobei F x wieder etwas sinkt. Ähnliche Relationen sind auch auf Abb. 9 für die weibliche Aussprache festzustellen. Das auslautende [r] wird durch zwei deutliche Dämpfungen mit einer schwächeren dritten charakterisiert, dagegen sind beim [1] keine Dämpfungen vorhanden; sonst ist die Formantenstruktur beider Liquiden fast gleich. Es ist merkwürdig, daß die Formantenstruktur des stimmlosen [r°] und des [J] hier beinahe übereinstimmt (d. h. [f°] F x 2,7, F 2 3,7—3,8, bzw. F 3 4,8, F 4 6,5 kHz, [J] F x 2,9—3, F 2 3,9—4, bzw. F 3 4,8, F 4 6,5 kHz), d. h. daß [r°] ihren bisher spezifischen Zug verliert (d. h. ein unbegrenztes Verstärkungszentrum) bloß die Gesamtintensität des auslautenden [r°] ist geringer. Am Anfang des [r°] sind zwei Dämpfungen zu sehen, die diesmal nicht nur in tieferen Frequenzzonen, sondern auch um 6,5 zu entdecken sind (also ähnlich wie z. B. bei Issatschenko, Abb.11, wo es sich aber im ersten Fall — wenn nicht in beiden — eher um die k-Explosion handelt). — F 2 der torangehenden Vokale zielt auch hier in die üblichen Lokuszonen. Wir wollen wenigstens auf einem Bild (Abb. 10) die E-Realisierung des stimmlosen [r°] in einer anderen Position, u. zw. im Worte pekarstvi (mit dem [J] in velikaästvt verglichen) anführen. Das Zentrum der Verstärkung verschiebt sich hier vor [s] in eine höhere Frequenzzone als üblich (ungefähr von 3 bis 5 kHz, außer der schwächeren höheren Zone zwischen 6,5 bis 8 kHz) — der Übergang zum [s] ist hier fließend. Auch beim [J] sind vor [s] die höheren Verstärkungen ausgeprägter, der Übergang zum [s] ist fließend, doch die Abgrenzung der typischen Verstärkungszonen der postalveolaren Zischlaute bleibt hier wenigstens am Anfang klar. Jedenfalls bilden diese Beispiele einer Realisierung der Laute in mehrsilbigen Wörtern einen Übergang zum Stand in der zusammenhängenden Rede. Im [r°] sind noch die Spuren einiger Dämpfungen in den tieferen Frequenzbereichen (diesmal von 0,5 bis 2,5 kHz) zu entdecken, u. zw. v. a. in den ersten zwei Dritteln der Gesamtdauer des [r0]. ^ 2.122 Wir wollen jetzt noch die anderen Methoden zu Hilfe ziehen. Es handelt sich im Falle des stimmlosen [r°] v. a. um die Messungen der Intensität (bzw. um Bestimmung der akustischen Spektra, wobei bei stimmlosen Lauten die Untersuchung der Grundfrequenz selbstverständlich entfallen muß). Auf Abb. 11 sieht man die Pegelregistrierungen in den Wörtern var, vaf, vai und val in der Aussprache unserer 5 Personen. Die auslautenden [r] weisen immer eine Schwankung der Intensität während der Realisierung auf (die bei E am schwächsten ist), dagegen zeigt die Realisierung des [1] ein fließendes Abnehmen der Intensität ohne Sprün-
Tafel
XV
, . vor
JC
a
i
yai
val
Abb.8
pekarstvi
velikdSstvi Abb.10
j
Tafel X V I
var
var
voz Abb. 11
voz
Tafel X V I I
Abb. 12
Tafel X V I I I
Abb. 13
Tafel X I X
A driv se mu ten trik podaril
Abb. 14
trikrdt
Tafel X X
Trikrdt m i r a jednou rez A b b . 15
97 ge (wieder mit der Ausnahme von E, wo ein kleiner Ausschlag der Intensit ä t — 2 dB — am Anfang der Realisierung des [1] vorhanden ist). Auch die Schwankung der Intensität in allen Realisierungen des auslautenden stimmlosen [r°] ist klar ersichtlich, wieder am kleinsten bei E, wo die Sprünge nicht 1 dB überschreiten. Ähnliche ganz kleine Schwankungen, die außerdem kurz sind und unter der Wahrnehmungsgrenze liegen, entdeckt man im [J] in allen Belegen, außer in der Aussprache von A. Man kann diesmal sagen, daß die untersuchten Laute in einer Auslautposition durch den Verlauf der Intensität am wenigsten bei E (bzw. auch bei B) unterschieden werden, wogegen bei anderen (A, C, D) die Unterscheidung der sog. Vibranten und Nichtvibranten ganz klar ist. Auf Abb. 12, wo in den Wörtern krovy, kfovi und klove die entsprechenden Konsonanten nach einem anderen Konsonanten vorkommen, zeigen alle Aufnahmen des [r] klare Schwankung der Intensität, die aber auch beim stimmlosen [f°] vorhanden ist, wogegen beim [1] das Ansteigen der Intensität nach der Explosion des [k] (die v. a. bei C ganz klar auftritt) ohne Unterbrechung durchläuft. Auf Abb. 13 wollen wir einige akustische Spektra vorlegen. (Die Frequenzskala ist logarithmisch, die fünf durch die Unterbrechung abgegrenzten Abschnitte stellen die Frequenzzonen 0,06—0,2, 0,2—0,6, 0,6—2, 2—6, 6—20 kHz dar). Man kann hier außer dem Spektrum des [r] im Worte rada (Sprecher A), in dem diskrete Elemente überwiegen (außer der Grundfrequenz noch ihre Harmonischen und Formanten), eine ähnliche Tendenz in dem stimmhaften [f] (in rada), sowie in [3[ im W. zddä entdecken, dazu aber noch zusätzlich Verstärkungen im 4. Sektor, u. zw. bei A für [r] umd 4—5 kHz und [^zwischen 3 bis 5 kHz, bei C für [r] zwischen 2,5 bis 4 kHz, für [3] etwas niedriger. Dieselben Verstärkungen sind auch beim stimmlosen [r°] und [J] zu finden, wobei die tieferen Frequenzen fast fehlen (wenn ein schwacher Rest des Grundtons von dem vorangehenden Vokal bis in den Anfang des Konsonanten nicht übergreift). Im großen und ganzen kann man sagen (wenn man auch die Spektra von anderen Personen vergleicht), daß der Unterschied der akustischen Spektra der Vibranten und der postalveolaren Zischlaute gewöhnlich noch kleiner ist, als Issatschenko für seinen Gewährsmann voraussetzt, daß ein solcher Unterschied bei einigen Sprechern (z. B. B) manchmal überhaupt nicht vorhanden ist, was auch die Sonagramme bestätigen können. Sonst haben aber die Sonagramme (mit linearer Skala) einige Unterschiede in höheren Frequenzbereichen mehr hervorgehoben, als^es dem Perzeptionsvermögen des Gehörs entspricht; sie bedürfen auch einer vorsichtigen Interpretierung und einer Konfrontation mit den Spektrogrammen mit
98 logarithmischer (bzw. Mel-) Skala und selbstverständlich noch einer parallelen gehöranalytischen Bewerttung der Ergebnisse. 2.13 Die Anwendung von Janotas Segmentator (vgl. Anm. 17) bzw. die Versetzung der konsonantischen Elemente in eine andere Lautumgebung (die wir zwar mit Vorbehalt benutzen, da sie die natürlichen Verhältnisse verändert, 18 die aber zu Kontrollzwecken gut geeignet ist) zeigt bei Isolierung der konsonantischen kurzen Segmente verschiedene Verhältnisse zwischen den [r] und [r°] einer- und [3] und [J] andreseits, u. zw. von einer völligen Übereinstimmung bis zu einer klaren Differenz. Größere Abschnitte führen zu einer fast klaren Differenzierung, an welcher auch die Vibrationen entweder im ganzen Verlauf oder wenigstens am Anfang (bzw. auch in anderen Teilen) der [r] und [r°] klar zu identifizieren sind (außer einigen Fällen des [r°] in Finalposition). Der Abschnitt mit dem Vokalübergang zum Konsonanten führt dann klar zu völliger Identifizierung des Konsonanten. 2.2 Wir wollen jetzt noch ganz kurz die zwei Varianten des /r/ in zusammenhängender Rede erwähnen. Man weiß, daß in der Allegroaussprache manche der akustischen Züge, die die Struktur der distinktiven Merkmale bilden,19 beschränkt oder abgeschwächt werden. 20 In der Beilage (Tafel X I X und XX) führen wir zwei Sätze an, die von unseren fünf Sprechern in einem umfänglicheren Zusammenhang gesprochen worden sind. Es handelt sich um den Satz (A) dfiv se mu ten trik podafil trikrät (za sebou) [(?a) dfi:f se mu ten trikpodafiltf°ikra:d (zaseboy)] (Und früher ist ihm dieser Trick dreimal nacheinander gelungen) auf Abb. 14 und Trikrät mer a jednou rez! [tr°ikra:t mn,ef° ? a jednou rej] ((Dreimal miß und einmal schneide) auf Abb. 15 (Tafel X I X und XX). Man findet hier also wieder Beispiele des stimmhaften [f], u. zw. in der Position vor dem Vokal (bzw. zwischen den Vokalen) in den Wörtern rei und podaril, weiter nach einem stimmhaften Konsonanten, d. h. im Worte dfiv, neben den Beispielen des stimmlosen [r°] im Wortauslaut (vor dem stimmlosen Kehlkopfverschlußlaut) im Worte mer, sowie nach einem stimmlosen paarigen Konsonanten in trikrät (2x). Man kann es noch weiter v. a. mit dem [r] in trik und trikrät (2x) bzw. mit [f] in rei vergleichen. Das stimmhafte [r] in der Anlautposition (rez) weist eine deutliche Kürzung im Vergleich mit der isolierten Aussprache auf (am auffallendsten bei E, wo die Dauer auf cca 50 ms gesunken ist). Sonst entspricht die Ver18
Vgl. E. P e t r o v i c i , Mozhet Ii peresadka zvukov (na kinoplenke ili magnitnoj lente) reshat fonologicheskije voprosy, Slavica Pragensia IV, Praha 1962, S. 69—74. 11 Vgl. in diesem Buch S. 12 seq., bzw. unseren Aufsatz Zu akustischen Korrelaten der distinktiven Merkmale, Proceedings Münster, S. 506ff. 20 Vgl. J . N o v o t n ä , Konsonantickd spojeni na akustickem spektru, SaS 28, 1967, S. 291ff.
99 teilung der Geräuschverstärkungen den Werten, die wir in der Lentoaussprache entdeckt haben und bewahrt im großen und ganzen das Verhältnis zu der Formantenverteilung in den postalveolaren Zischlauten. (D. h.: Bei A, C, D, E ist in [r] ein Hauptzentrum, in den Zischlauten zwei oder mehrere vorhanden, bei B ist die Verteilung in beiden Kategorien ungefähr entsprechend, bei [r] ist bloß die Gesamtintensität etwas geringer; die Schwingungen bei [r] sind nicht auffallend, doch sind sie bei A, B, C und D hier —• und auch auf den Pegelregistrierungen — zu entdecken, obwohl die Ausmessung der Oszillogramme nur kleine Tonbewegungen gezeigt hat). — Fast dasselbe kann man über das [r] in der intervokalischen Position in podafil konstatieren. Dieselbe stimmhafte Variante nach den stimmhaften Konsonanten im Worte dtlv (das fast am Anfang des Satzes steht und deshalb ein auf den ersten Blick reicheres Spektrum, doch eher eine größere Gesamtintensität aufweist) zeigt eine Dauer, die der in der expliziten Form entspricht (außer der E-Realisierung) und weist (v. a. bei A, C, D) deutliche Schwingungen und vor [i:] und Geräuschlauten [fs] eine unbedeutende Erhöhung des Verstärkungszentrum auf. Außer dem Grundton sind entsprechende Parameter auch bei dem stimmlosen [r° ] zu entdecken (interessant ist der Vergleich des [r°] in zwei Realisierungen des Wortes tfikrdt gegen Ende des Satzes und am Anfang des anderen: die Gesamtintensität, bzw. der Reichtum des Spektrums ist verschieden, doch die Verteilung der Energie und der Verlauf ist hier fast übereinstimmend). In der Auslautposition kann man hier [r°] im Worte mef sehr gut mit dem [J] in fez vergleichen. Die Dauer ist — wie üblich — vor der Pause etwas größer, doch kann man nicht sagen, daß der eine oder andere Laut eine üblich größere Dauer aufweist; das Verhältnis schwankt nach den Sprechern, aber auch nach einzelnen Registrierungen. Außer B (und diesmal auch A), wo die Spektra sehr ähnüch aussehen, bewahren sie bei anderen Sprechern ihre Verschiedenheit (ähnlich wie der Sprecher von Issatschenko). In [r°] sind diesmal die Dämpfungen, die den Zungenschlägen entsprechen, bei A und B im ganzen Verlauf, bei anderen nur zum Teil (bei D eher gegen Ende) zu entdecken. Was aber auffallend ist, ist das Zielen des F a des vorangehenden Vokals in beiden Fällen. Die sinkende Tendenz (das Zielen zum Lokus der Alveolaren) und das Verharren vor [J] (d. h. Zielen zum Lokus der Alveopalatalen) ist ebenso überzeugend, wie der Vergleich der Unbeweglichkeit des F 2 zwischen [d] und [r] im Worte podafil und der Vergleich der Formantenbewegungen um [r] und [r°] mit den Bewegungen in der Nachbarschaft von Nicht-Praealveolaren und -Dentalen. 3. Unsere Analysen haben uns einige Ergebnisse geboten, die zum Teil
100 mit denen von Isatschenko übereinstimmen, zum Teil sie ergänzen, zum Teil sie in mehreren Hinsichten korrigieren. 3.1 Wir wollen einige der wichtigsten Tatsachen hier kurz zusammenfassen: a) Das Phonem /f/ hat zwei Varianten, [r] und [r°], deren Beteiligung (oder besser: Nichtbeteiligung) an der Stimmhaftigkeitskorrelation bereits befriedigend beschrieben worden ist.21 Sie unterscheiden sich voneinander durch das Vorhandensein oder Nichtvorhandensein des Grundtons. Die Sonagramme zeigen die Anwesenheit des Grundtons nicht immer verläßlich an, man benutzt hier die oszillographische Registrierung oder die Gehöranalyse u. ä. Der Grundton schwankt manchmal während der Realisierung des [r] was Intensität und/oder Frequenz anbelangt. b) Die Verteilung der Hauptverstärkungen im akustischen Spektrum des [r] und [r°] ist meistens von derselben im Spektrum von [3] und [J] verschieden (ähnlich, wie Issatschenko über die Aussprache seines Gewährsman schreibt), doch kann man bei einigen Sprechern eine große Ähnlichkeit entdecken, v. a. bei [r°] und [f] im Auslaut (bei uns v. a. bei B). Das Spektrum des [r] und [r°] einer- und der praealveolaren Zischlaute [z] und [s] andererseits unterscheidet sich durch verschiedene Frequenzcharakteristik der Energiezentra, gemein ist ihnen bloß, daß in beiden Kategorien fast immer ein (obwohl verschieden hohes) Zentrum dominiert (außer den Fällen, wo das r-Geräusch dem der hinteren Zischlaute ähnlich ist — vgl. oben). c) Die Lokuslage (resp. das Zielen der Formanten) entspricht bei beiden f-Allophonen der (resp. dem) der Praealveolaren und ist von dem der hinteren Zischlaute verschieden. d) In den meisten Realisierungen des [f], aber auch des [r°] (am seltensten in der Auslautposition) kann man in den Registrierungen Spuren von Schwingungen feststellen, die artikulatorisch vorhanden sind und die man durch Gehöranalyse auch in der Aufnahme leicht entdecken kann. Auf den Sonagrammen sind sie manchmal v. a. in dem Bereich des Grundtons und dann in der Frequenzzone von 0,5 bis 2,5 kHz zu entdecken, gewöhnlich findet man ihren akustischen Korrelat eher in der Schwankung der Gesamtintensität (doch braucht nicht jeder Ausschlag der Intensitätkurve — v. a. wenn es sich um Sprünge, die unter 2 dB liegen, handelt — einer Artikulationsschwingung, die hörbar ist, zu entsprechen), oder noch häufiger 81
Bei Z i m a , V a c h e k , auch bei K u ü e r a , bzw. bei uns in SaS 19,1958 (oder in diesem Buch S. 113f.). V a c h e k macht neulich in seinem Buch Dynamika fonologickiho systimu... darauf aufmerksam, daß man vom phonologischen Standpunkt nicht berechtigt ist, von der Beteiligung des /f/ an der Stimmbeteiligungskorrelation zu sprechen.
101 in der Bewegung des Grundtons in der stimmhaften Variante (wieder aber nicht ganz verbindlich; man kann Grundtonbewegung in anderen Zischlauten manchmal auch entdecken, und umgekehrt ist manchmal in einer Vibranta keine Grundfrequenzschwankung vorhanden). e) Die Dämpfungen (mit den eben erwähnten Begleitrescheinungen), die den Artikulationsbewegungen entsprechen, sind manchmal (v. a. in der stimmhaften Variante) während der ganzen Dauer zu entdecken (gewöhnlich mit 3 bis 4 Schwingungen), manchmal — was Issatschenko durch die Analyse der Aussprache seines Gewährsmanns entdeckt hat — nur in dem Anfangsteil der Realisierung, manchmal aber auch in dem Mittel- oder sogar Schlußabschnitt der Realisierung. In einigen Fällen (v. a. in dem [r°] im Auslaut) finden wir eine Variante ohne analysierbare Schwingungen. 3.2 Die bis jetzt zusammengefaßten Ergebnisse könnten also Issatschenkos Hypothese über den nichtvibrantischen Charakter des tschechischen f eher unterstützen als zu ihrer Korrektur führen. Die Vibration (abwechselnde Dämpfung) scheint kein ständiger Zug der r-Laute zu sein, die Ähnlichkeit mit den Affrikaten (die wir für die Vibranten nicht bestreiten und von der wir früher noch stärker überzeugt waren)22 bietet sich sicher an, die akustische Differenz von den beiden Kategorien der Zischlaute scheint wichtig zu sein. Kuceras distributive Analyse, die die Stellung des /r/ im System in der Nähe der Sonorlaute bestätigt, könnte bloß über die Verhältnisse in einer anderen Sprachebene zeugen, ebenso die Alternation des jfj mit /r/ in der Morphonologie.28 i Wir haben aber meiner Meinung nach einen wichtigen Faktor unterschätzt, u. zw. die Potenzialität der sprachlichen Erscheinungen. Unsere Abhörteste haben eindeutig gezeigt, daß ein kontinuierliches akustisches Element (ein Segment in der Dauer eines Konsonanten) immer als eine Spiranta identifiziert wird. Welches von den Phonemen wahrgenommen wird, hängt v. a. von dem akustischen Spektrum dieses Segments (bzw. von seiner relativen Intensität) und von der Lautumgebung (bzw. der Bewegung der Formanten der Nachbarlaute) ab.24 Wird aber dieses Segment unterbrochen, entweder völlig, oder durch eine oder mehrere Dämpfungen, und/oder wird die Grundfrequenz in gleichem Rhythmus abgeändert, wird nicht mehr eine Spiranta, sondern Vibranta wahrgenommen (im äußersten Falle — wenn das Spektrum von dem einer in der Sprache existierenden Vibranta völlig abweicht — z. B. ein Verschlußlaut mit verschiedenen Übergangslauten). Die tschechischen " Vgl. unsere Klassifizierung der russischen Vibranten noch in unserer Monographie Zvukovy rozbor ruütiny. 23
Vgl. bei V a c h e k The Place...
21
Vgl. hier Zur Identifizierung der Engelaute, S. 71.
and Dgnamika...
I. c.
102 Hörer identifizieren solche Segmente mit überwiegend diskretem Spektrum meistens als /r/, wenn aber das Spektrum kontinuierlich (oder überwiegend kontinuierlich) ist, wird es dann als /r/ erkannt. Diese Untersuchung zeugt eindeutig davon, daß man zwar alle durch die akustische Analyse in allen zur Verfügung stehenden Realisierungen der Phoneme entdeckten akustischen (und artikulatorischen) Züge, die der Hörer mit normalen Gehör zu erfasen imstande ist, in Betracht zieht (vgl. Anm. 19), doch darf man nicht vergessen, daß der in den meisten Positionen wichtige Zug nicht immer (bzw. nur in einigen Positionen) vorhanden sein muß. Trotz allen Ergebnissen der akustischen Analyse müssen wir voraussetzen, daß der periodisch gedämpfte Schall (mit entsprechenden Begleitzügen) für den wichtigsten Zug der tschechischen Vibranten (r und f) gehalten werden muß, denn durch diesen Zug können ausschließlich diese Vibranten und kein anderer tschechischer Konsonant (bzw. kein Phonem) charakterisiert werden. 4. Die tschechischen Vibranten unterscheiden sich von den übrigen Konsonanten durch ein Bündel akustischer (und artikulatorischer) Züge, die zusammen ein Merkmal bilden, das wir für das Tschechische für distinktiv halten und das zur Grundlage einer distinktiven Opposition dient, durch die die Vibranten als flatternde (vibrante) Phoneme von den Nichtvibranten als nichtflatternden (nicht-vibranten) unterschieden werden. Es ist für uns jetzt nicht entscheidend, welches der Klassifikationssysteme hier angewendet wird. 25 Wenn wir unser System bevorzugen, so ist es auch deshalb, daß unsere Analyse auch diesmal durch dieses System am besten ausgenützt werden kann. Wir klassifizieren beide tschechische vibrantische Phoneme begreiflicherweise als konsonantisch (transgressiv; die besondere Stellung des silbischen T bleibt mit den übrigen „silbischen Konsonanten" in diesem Zusammenhang unberücksichtigt), weiter müssen wir sie aber schon scheiden. Das Phonem /r/ ist ein klares „Tonphonem" gegenüber dem /r/ als „Geräuschphonem" in unserer Klassifizierung. Doch würden wir es nicht einmal bei Anwendung des M. I. T.-Systems wie Kucera wagen, das /r/ als „vocalic" zu bezeichnen, 86 denn es widerspricht allen Ergebnissen aller Analysen (von der Empirie ganz abgesehen). Die Differenz gegenüber den Verschlußkonsonanten (momentanen K., d. h. Nasalen einer-, Geräuschokklusiven andererseits) ist klar, die Nicht25
Wir denken v. a. an das Klassifizierungssystem, das wir hier als M. I. T.-System bezeichnen (vgl. hier S. 21), bzw. an seine Modifizierung bei KuCera (o. c.) oder an unseren Versuch in Zvukovtj rozbor ruitiny. " H. K u é e r a , o. c., S. 24 u. a.
103 beteiligung an den Gegensätzen, die auf verschiedener Verteilung der Hauptverstärkungen im akustischen Spektrum als akustischen Hauptphänomen beruhen, ist m. E. klar. Es bleibt bloß der Gegensatz flatternd (vibrant) — nicht flatternd (nicht vibrant), in dem /r/ gegenüber dem /I/ innerhalb der Gruppe der Sonoren steht, /r/ dann gegenüber anderen Geräuschdauerlauten (Spiranten). Während im Falle des tschechischen /r/ das Flattern (d. h. akustische Dämpfung der Intensität — ID) und Schwanken der Tonhöne (TS) als die einzigen wichtigen akustischen Züge das Zentrum der akustischen Struktur des Merkmals in allen Fällen bilden, d. h. schematisch {ID — TS} (vgl. Anm. 19), wird das /r/ von den übrigen Spiranten durch diese Züge auch unterschieden (das Schwanken der Tonhöhe TS kommt nur in dem Allophon [r] vor, ID mit der obenerwähnten Beschränkung), doch von den hinteren Zischlauten (und Velaren) außerdem durch die „Konzentrierung" (Kz — d. h. durch ein einziges Hauptzentrum, aber gleichzeitig durch einen Lokus des F2 — Lc, uws.), von den vorderen Zischlauten durch eine andere Höhe des Energiezentrums (ZH) und andere Lokushöhe (LcH), bzw. — wenn man /r/ mit den Labialen (labiodentalen Spiranten) vergleicht (v. a. /f/), durch eine größere Gesamtintensität (I) — außer der verschiedenen Lokushöhe. Im Falle, daß wir den Grund finden, den Gegensatz vibrantisch (flatternd) — nicht vibrantisch (nicht flatternd) in der Hierarchie der Merkmale ziemlich hoch zu stellen, würde das Merkmal „flatternd" für /r/ ungefähr folgende Struktur aufweisen müssen: (Kz — Lc — ZH — LcH ID — TS (I) Diese ziemlich komplizierte Struktur mit vielen redundanten Zügen würde sich (scheinbar) dann vereinfachen, wenn man für sehr viele Positionen Korrelate des Merkmals getrennt finden würde. Erst die Summe solcher „Teilkorrelate" würde dem Merkmal entsprechen. Für die meisten Positionen, wo das stimmhafte [r] vorkommt, könnte das obenangeführte Schema ohne Veränderung bleiben, doch für [r°] in der Nachbarschaft eines stimmlosen Konsonanten im Wortinlaut wird die erste Zeile auf ID vereinfacht, für den Wortauslaut (wenn kein stimmhafter Konsonant — im folgenden Worte — folgt) verschmelzen die zwei ersten Zeilen in eine einzige mit fünf fast gleichwertigen Zügen, usw. Dieses ganze Mengensystem wird man dann für ein Korrelat des Merkmals halten müssen. Die Kompliziertheit dieses Systems zeugt außer anderem von der besonderen (peripheren) Stellung des Phonems /r/ im heutigen Tschechisch, die zum Teil auch der folgenden schematischen Darstellung des tschechischen
104 Konsonantensystems nach unseren Klassifizierungskriterien zu entnehmen ist. 27
Abb. 16 Das tschechische Konsonantensystem (Variante mit ternären Oppositionen) 1. vokalisch (inherent) — konsonantisch (transgressiv), 2. tonhaft — geräuschhaft (ternäre Opp.), 3. momentan — kontinuierlich (ternäre Opp.), 4. nicht-vibrant —vibrant, 5. tief — hoch, 6. konzentriert — dispers, 7. stimmlos — stimmhaft (in Klammern: positionbedingte Varianten der Phoneme) SUMMARY
fi AND THE CZECH SYSTEM OF CONSONANTS A detailed acoustic analysis and hearing analysis have shown that vibrancy is an essential feature even of the Czech consonant r in both its variants (i.e. voiced and unvoiced), although it need not be involved in every single realization. However, if the fricative noise is repeatedly suppressed (or if the fundamental tone also fluctuates in the voiced variant), a Czech listener will identify the respective segment no more than as a realization of the phoneme /r/. Thè peripheral position of /r/ (and the vibrants generally) in the Czech consonantal system has its equivalent in the complex structure of the distinctive feature of "vibrancy". The place of /r/ in the system can be seen in fig. 16 on page 104. 87
Den Entwurf haben wir in unserer Vorlesung Vergleichende Phonetik und Phonologie der slavischen Sprachen im Sommersemester 1964/65 an der Karlsuniversität zu Prag dargestellt (vgl. Phonetica Prag. 1, S. 83, 88f.).
X. ON T H E CZECH SYSTEM OF C O N S O N A N T S (The place o f f and v in the system of Czech consonants)
0. In dealing with the analysis of the Czech consonantal system we sometimes come across the view that the consonant / is not in Czech a legitimate phoneme having failed to become fully incorporated in the system of Czech. On the one hand it is said that it "has no correlative relation to v", and on the other hand that the "antithetical nature of the sound / in words of intellectual import is... still a feature of foreignness (or also, as the case may be, of expressiveness) even where it occurs in the most colloquial words". 1 However, since this is not the only opinion as to the place of / and v in the Czech consonantal system, 2 I think it is well worth the trouble to take a closer look at the problem and at the same time to bring light to bear on some more general questions. 1. Although only the analysis of the present state of affairs is decisive to the evaluation of the contemporary position of the sound / and v in the language, I consider it not without use to give a brief review of the origin and development of the two sounds and their mutual relations. There is no doubting the fact that the consonant / was not one of the basic phonemes of Czech in its earliest stages. It penetrated into the language fairly early and gradually, however, in a number of ways. One of these was the adoption of originally alien words, in particular proper names (e.g. Filip, Filota, etc.), the terminology and other words of the Church and religion generally (fara, farar, firmament, etc.), but of course others as well, so that / already occurs in the earliest manuscripts and becomes quite a regular feature of texts of the 14th century and later (though the oldest Old Slav texts of Czech redaction present a rather more complicated situation). Independently but evidently running parallel to 1 1
B. T r n k a , 0 fonologickych cizostech v resting, SaS 8, 1942, pp. 23 seq. This follows from the writings of V. M a t h e s i u s among others, e.g. in his article Vvod do fonologickiho rozboru ceski slovni zasobij (CeStina a obecny jazykozpyt, 1947, pp. 62, 81, but also p. 68; also in TCLP 1, 1929, pp. 67 seq.) where he finds it necessary to point to the exceptional nature of the pair h : x, but not v : f .
106 this, the consonant / began to appear in onomatopoeic words and interjections (fukati, frkati, ft, etc.). Finally the third place where the Czech / could emerge was in the phonetic development of the Old Czech verb *uptvati> tifati. In registering these three sources of the Czech / we make no conclusions, nor can we make any, as to the sequence of occurrence of these /-s of different origin, nor can we make any certain judgements as to their phonetic nature and mutual relations. 3 It is possible t h a t the primary / was in onomatopoeic words imitating phonetically the noise produced by vibrations in a current of air etc. (foukanl, ficeni and so on), which could be realized as a bilabial or labiodental constrictive consonant; this might then have been the model to which was assimilated the / in loan-words (by substituting it for the similar sound in the original language), as well as possibly the / of ufati and its derivatives. However, we cannot exclude the possibility that for a time at least the / in onomatopoeic words (and expressive words generally) was originally pronounced in one way, and that in borrowed words (or at least in some of them) and in the verb ufati was pronounced in another. Foreign words (including those from Latin) containing the sound / and adopted into Czech were in great measure borrowed through German. In no case is it absolutely clear from which form or dialect the loan was made, from the literary German of the time or from one of the southern dialects, which I would not consider impossible, thus we may assume that only certain words (e.g. faleS, houf and others) contained in their German from initial constrictive / (or v with weak voicing), while many others (e.g. fara, faraf, fortna, flint, etc.) contained the affricate p/. 4 If we further consider that / in Old Czech ufati developed from the original group - p t v - after the disappearance of weak semi-vowels (jer), then it appears that we cannot exclude the possibility of the primary but temporary articulation of this sound (in certain borrowed words and in the verb tifati and its derivatives) with an initial occlusive phase (evidently weak, as in affricates) as the product of the assimilation of unvoiced bilabial occlusive p and voiced (bi-)labial constrictive v into a constrictive unvoiced labial (bilabial or labiodental) sound. 5 8
We can make no sound judgements on the basis of old text partly because of a certain fluctuation in the spelling of the time ( f , f f , ph and even pf, as we shall see later), partly because of the lack of homogeneity and the different frequency of occurence of the individual word categories where the sound f occurs. Borrowed words are more frequent in early texts than onomatopoeia or onomatopoeic interjections. 4 It is interesting to note here that in some words we find only p for the original German pf (panev, peniez, pluh, etc.). 8 While this development in the verb tifati has been fully accepted by the literary language, the development -ptv-)-pf-)-f- in the word droptva (Otis) and its derivatives (droptwa Boh 21b, dropfa Rozk 387, droffie ApatFr. 84b) has not taken root.
107 We could only with difficulty support this idea by an analysis of the graphics of manuscripts. The designations f , f f , ph are used either exclusively or promiscuously; pf recorded by Gebauer in K a t B r n 454 (upfagy) is too isolated a case to allow us to draw any conclusions, even disregarding the fact t h a t the p was later erased. Of greater interest is rather the spelling / in AlxB and AlxBM where against uphal B 229, Phares B 116, uphasta BM 7, douphayu BM 124 we find firmamenta B 66; however, we must treat this with due reservations as such thoroughness in distinction is not, so far as I am able to judge, to be found in any other manuscript. The question as to whether the assumed fricative / occuring only in onomatopoeic words (that is, a sound which according to all hypotheses was not one of the phonemes of Old Czech and whose phonetic quality is not even clear) has brought about the assimilation of an assumed affricate, or whether this / was itself the sound which was used as a substitute for alien phonemes in loans (and with which the product of assimilation in lifati became also identified), thus remains without any definite answer. At the same time it should be borne in mind t h a t the position of / of onomatopoeic words was not being strengthened at the period in question (beyond all doubt certainly in the 14th century) b y any positional variant of another sound having identical phonetic properties. I think t h a t we can take it as certain t h a t the sound v in Czech was at the time a voiced bilabial which was subject neither to voiced - unvoiced assimilation nor to loss of voicedness at the end of a word. At least I have no documentary evidence, not even in so-called scribal errors, to show t h a t final v standing before unvoiced members of consonantal pairs was changed to /, whereas for other sounds which could be subject to voiced-unvoiced assimilation evidence, albeit sporadic, is available.® It is clear then t h a t the sound / in Old Czech of the 14th century and apparently later was not a definite phoneme. On the other hand there is no doubt t h a t v — evidently bilabial — was a phoneme. It took no p a r t of course in any voicedness correlation and could be considered as a single consonant. 7 2. I do not wish to trace the whole course of the development of the phonetic nature and mutual relations of the consonants / and v in the centu" Apparent evidence for this of the type hav — haf or kavka — kafka is in my opinion evidence only of doublets where both are of onomatopoeic origin. ' There exists a very extensive literature on this sound. Let us mention here at least A. F r i n t a ' s well-known monograph Foneticka povaha a historicky vyvoj souhldsky 'v' ve slovanStini (1916 — although we cannot agree with certain parts of this acount, especially on the articulatory nature of this sound — e.g. the differentiation between 'occlusive' v and 'constrictive' v; cf. SaS 19, 1959, p. 267, note 7). Cf. also F. C u f i n , Studie z historicki dialektologie a toponomastiky Cech, Praha 1967.
108 ries which followed since the testimony of the texts available for those points which interest us is considerably fragmentary and, let us admit it, unreliable, so that it could not furnish us with satisfactory answers to the questions when the two consonants fused in their articulation, and when they began to function (at least partially) as members of a voiced-unvoiced pair analogically with the members of other previously existing pairs of voiced-unvoiced correlates. Of the problems which interest us here we should be able with least difficulty to find the answer to the question whether the sound / has become a phoneme in Czech and when this occurred. Even on this point, however, I consider it more practical to start with the contemporary state of the language and to look back here and there at the beginnings of this state only for the sake of comparison. Our attention will be turned to the literary norm of the language, our use of dialect material being confined to evidence introduced for confrontational purposes. 2.1 In contemporary literary Czech there exists a large number of words of onomatopoeic origin in which the sound / is an important factor in the sound picture. In many of them their onomatopoeic character has been fully preserved as in the verbs ficeti, frceti (or frnceti),8 fuceti and of course in the interjections from which they have been derived. It is understandable that the existence of the sound / in such words is no cause for our considering / as a phoneme (though pairs of the type frceti —• vrceti can be found). It is generally known that the stock (or even system) of language and non-language sounds occurring in onomatopoeic and expressive words generally is not always identical with the stock (system) of phonemes of the given language.9 Not without importance is also the circumstance that onomatopoeic (and other expressive) words are not always subject to sound changes carried out systematically elsewhere as this would lead to the loss of their very onomatopoeic (emotional) character (e.g. tukat, doubat and so forth). Among originally onomatopoeic words should be included the verb foukati (to blow). There is evidence of its occurence at approximately the same time as the previous words and there is no reason to doubt that it existed together with them much earlier than it began to appear in written texts. The fact that it occurs more frequently in the texts was evidently caused at least in part by the birth of new transferred and derived meanings. It is also interesting that this verb was subjected to the sound change which led to the diphthongization of long u, although originally the latter sound certainly also played a part in the onomatopoeic character of the word 8
On this expressive n cf. V. M a c h e k , Studie o tvofeni vyrazH expresivnich, 1930, especially p. 26 seq.
• Cf. e.g. V. M a t h e s i u s , op. cit., pp. 51 seq.; also here pp. 26 seq.
Praha
109 which was thus considerably weakened by this diphthongization. Nevertheless I have no doubt t h a t this word continued to be felt as onomatopoeic, especially when used in its original meaning. 10 I think t h a t it was not until the 19th and the 20th centuries, which gave rise to much wider derivations the results of which are words which but remotely recall their onomatopoeic origin, e.g. foukac (glass-blower), or which completely lack any association with sound, e.g. vyfuk (exhaust pipe), vijfukovQ (exhaust (fumes)), and so on, t h a t these words could have had a backward influence on the evaluation of the original word in whose meaning, in my opinion, the idea of the movement of the air (or gas generally) predominates by far over the idea of the sound sometimes caused by this movement. This last remark, however, I do not consider as central. I was above all concerned to show t h a t derivation from unquestionably onomatopoeic base words can lead to the birth of new words which may subsequently develop a much freer association with the base word, and the more so where they are taken over b y technical language as terms, so t h a t they are not themselves felt to be onomatopoeic. Consequently they must be treated as constituents of the normal word-stock of the language and be phonetically and phonologically analyzed as such. 11 2.2 A considerable number of words beginning with the consonant / and adopted into Czech from foreign languages and on the other hand the absence of native words of this type are the cause behind the opinion mentioned above t h a t initial / in non-onomatopoeic words is for Czech a sign of a word of alien origin. There is no question t h a t the majority of words beginning with / have preserved this foreign character. However, I consider t h a t a further factor contributed to the words being felt as foreign, namely t h e rest of their sound structure and often the discrepancy between spelling and pronunciation as against their normal relation in native words. Any number of examples could be given, such as fabrikàt, faetòn, fagot, fajans, faksimile, fakt, etc., not to mention those words with typically foreign endings such as filosofìe, fìlolog, fyziologie, fundament, etc. However, I am convinced t h a t not all words which have been adopted into Czech from other languages, even where / has been preserved, can be "Merely for the sake of interest I would mention that J. D r a c h o v s k ^ gives the verb faukati as the model for the first conjugation (Grammatica bohemica, 1660) while his other models are just unquestionably non-onomatopceic verbs. 11 It would also be possible — in addition to the t y p e of examples we have given — to mention, for instance, the type represented by the zoological term frlek which designate a rodent of the family Alactaga saliens. It is clearly of onomatopoeic origin. Is, however, this word as a component in zoological terminology really felt and evaluated as onomatopoeic?
110 placed in this category. In my opinion not only the relative length of time since the words have passed into Czech, but also and mainly the degree of their assimilation both phonetic and morphological, which will be roughly in proportion to the degree of their domestication, will be decisive. I have attempted to put together an orientational review of the degree of domestication of a number of words representing the types which are of interest to us. This was done in the following way: Seven test subjects completely uninitiated as to the purpose of the experiment and all answering the requirements of a user of the literary norm, of which three ( A born 1924, B born 1902 and C born 1884) had secondary or technical non-philological education, three ( D born 1897, E born 1927, F born 1928) had at least partial higher education though not specially philological, and one (G born 1903) had a university philological education but not in Czech studies, heard me read a number of words of various degrees of domestication including several with the sound f which were mixed among them so as to be in some relation to them, either semantic, phonetic or other (as will be seen from a glance at the list of words given below in the order in which they were read). This was done to draw the test subjects' attention away from the problem under investigation. The test subject was to state immediately, at most within two seconds after hearing the word to be of Czech origin (marked below + ) or of foreign origin (marked — ) . The results were as follows: Word zouvat
(to remove one's shoe) (coffee) kdoa film (film) doufat (to hope) houf (crowd) vitat (to welcome) foukat (to blow) filosofie (philosophy) dêkan (dean) knëz (priest) lev (lion) faräf (minister-rel.) firma (firm) vijfuk (exhaust pipe) (church) kostel gardé (garage) pfifafit (to associate with a parish) zoufalij (desperate) fialka (violet)
A
B
C
D
E
F
G
+
+
+
+
+
+
+
— —
+ + + + —
+
+ —
+ + + +
+ + +
—
+ + + +
+
+ + +
+
+ +
+ +
+
+
+
+
+ +
+ +
—
+ +
—
—
+
+ + + — — —
+ —
—
+ —
—
+ —
+
+
+ —
+ + + —
+ —
—
+ + + + + + —
+ —
+ + +
—
+ + + —
— — —
+ —
—
+ —
Origin Czech loan foreign Czechz Old Cech loan Czech onomatopoeic foreign 0 . Czech loan Old Slav, loan 0 . Czech loan 0 . Czech loan foreign onomatopoeic 0 . Czech loan foreign 0 . Cz. loan + Cz. prefix and suffix Czech 0 . Czech loan
The aim of the experiment was not of course to establish the test subjects' knowledge of the origin of the words (in conversation after the experiment they changed their opinions in some cases after reflection), but by recording their immediate reactions to discover whether they feel the word to be Czech or foreign. In spite of the relatively small amount of evidence, which there is little point in using for drawing
Ill up any statistics, they can I think lead to some quite important conclusions. Thus it seems to me quite clear that some originally foreign words with a high degree of domestication and a sound structure (except for f ) corresponding to the sound structure of Czech words, are mostly felt to be native especially by those language-users who have not had the benefit of more detailed instruction in the development of the language (and who therefore do not k n o w that the word is of foreign origin). For these subjects, words such as houf, fardf and pfifafit are native words, they fluctuate, doubtless for different reasons, with flalka or lev (and of course with kava and, against our expectation, with dékarì), while as foreign beyond a shadow of doubt they consider film, filosofìe (and likewise, for instance, garai). The remaining subjects, who had more systematic and deeper instruction in the history of the language, show a clearer awareness of the foreign origin of the more controversial words, yet even here we find fluctuation, for instance with houf, faraf and pfifafit (but similarly as with fialka, but also lev or kostel). Without question their knowledge here corrects to a greater measure their linguistic consciousness.12
2.3 We have attempted to show that in modern Czech there is a whole number of words which are native or at least are felt as native and non-expressive, in which the sound / occurs beyond question in the middle of the word (e.g. doufat, zoufat, zoufalfj, vyfuk, etc.), with certain reservations at the beginning of the word (e. g. foukaé, faraf, etc.), and even at the end where it is not felt as a realization of the phoneme (morphoneme) v — e.g. houf. From the moment when we can assume the parallel occurrence in Czech of labiodental / and labiodental v, that is both constrictive labiodental consonants 13 distinguished by a single feature which in the case of analogical pairs of phonemes of the same language (p : b, t : d, s : z, etc.) is a relevant property, distinctive feature, i. e. voicedness, we must put the question whether the two sounds are realizations of two phonemes in contrast or whether they are merely phonetic variants of a single phoneme. I consider that the answer to this question is beyond dispute, whichever of the recognized criteria we use for establishing a phoneme. 14 Each of the two consonants, which are marked by the same set of distinctive features (apart from voicedness), would, I think, be realizations of different phonemes even if there existed only one pair of words which were distinguished by these two consonants only. Such a pair is, for instance, zoufat — zouvat. Both are native words of relatively very early date. The first ( z ù f a t i — to despair) is to be found in texts from the 14th century onwards, and the 12
Except for G's obvious error in the case of foukati. " Or according to their acoustic classification (system M. I. T.) : 1) non vocalic, 2) consonantal, 3) diffuse, 4) grave, 5) oral, 6) continuant. 14 So for example N. S. T r u b e t z k o y ' s well-known rules in Grundzilge der Phonologie, 1939, pp. 41 seq., or the more recent rules of B. Trnka, Uréovani fonému, AUC 1954, 7, pp. 16 seq.
112 second sporadically since the 15th century, 16 t h a t is at a time when the articulatory difference between the two sounds was probably greater t h a n it is today. This pair of words has been joined by others as words have been gradually derived from loan-words or words of onomatopoeic origin whose foreignness had already been considerably weakened as mentioned above. Thus by t h e formation of words such as pfifafit (or derivatives pfifafenfi •— associated with a parish, vyfafit — exclude from a parish, etc.), which begin to appear in the first half of the 19th century (V. Dundr 1838, K. V. Zap 1848, according to the material of the Institute for the Czech Language at the Czechoslovak Academy of Sciences), and are quite current from the eighties onwards both in the original and in the transferred sense elsewhere, right up to the present, as in the pair pfifafit — pfivafit (concoct) new analogical pairs are seen to arise. It would be possible to mention other pairs where, however, it is open to discussion whether the example is not a little artificially contrived (nadoufa se — nad.ou.va. se), or whether the two members of the pair to be compared are not completely free of elements of foreigness (fenku — uenku, farskfi — varskjj, farni — varni), or expressiveness (frci — urct, frka — vrka). These are, however, but secondary objections which do not weaken the reasons presented above. I consider, therefore, t h a t the sound / should be treated in Czech as the realization of an independent phoneme, even if we were to confine its phonemic validity to a single, mid-word, intervocalic position. 16 3. We have still not exhausted all t h e objections against recognizing / as a legitimate phoneme of Czech. We should now see to what extent our question is affected by the objection t h a t the correlation between / and v is incomplete, and how the place of the two consonants in the Czech consonantal system is influenced by this fact. It is beyond question t h a t the voiced-unvoiced correlation is the most striking feature of the Czech consonatal system. At the same time it is also a well-known fact t h a t not all Czech consonantal phonemes — leaving aside of course unpaired consonants — participate in this correlation in the same measure and at the same level. We can without question consider the pairs p : b, t: d, t: d, s : z, § : z as voicedness correlates typical for Czech in their mutual relations and the use of each member. In the remaining cases these 15
Gf. B. RyneSovd Listaf a listinaf, 1442 (material from the Institute for the Czech Language at the Czechoslovak Academy of Sciences). 19 More analogical cases can certainly be found in languages. Thus for instance, in the southern and Austrian form of literary German the consonants n and t] are independent phonemes in spite of the fact that they stand in opposition only in one position (intervocalic). In literary German and especially German of the stage this is further joined by word-final position. (Cf. here pp. 24.)
113 mutual relations diverge in some respects from this basic type so that it may be open to debate which other pairs of consonants may be considered as voicedness correlates and which not. 3.1 We shall now attempt a brief outline of the main features which determine the completeness or incompleteness of a voiced-unvoiced correlattion in Czech. For the initial review we shall not be taking into account whether both members of a pair of consonants having the same (or as with x : h analogical) features are independent phonemes or variant? of the same phoneme. In the review we shall give in group A those pairs with unquestionably complete correlative relations, in B the pair x : h, in G f: v, in D A-: g, in E the affricates c, 6 with their voiced variants (i. e. c : c*, c : c*), in F unvoiced f° : voiced f , and Anally in G unpaired consonants (m, n, n, I, r,j) which in Czech do not have unvoiced equivalents even as variants. For these categories we shall trace what is the nature of the consonants in a word as far as voicedness is concerned,17 namely I. in the vicinity of vowels and unpaired consonants 1) at the beginning of a word, 2) in the middle of a word, 3) at the end, II. in the vicinity of paired consonants, al) before unvoiced, a2) before voiced, b l ) after unvoiced, b2) after voiced.18 The following table shows schematically but clearly in which positions the consonants are unvoiced (U) and in which voiced (V), and also whether they exist side by side and preserve the ability to distinguish words || or whether they fuse and lose this ability—. Square brackets [] will be used in cases where the word is unquestionably of foreign or onomatopoeic origin and are felt as such in literary Czech, and parentheses () where the foreign (or onomatopoeic) origin has been weakened so as to be frequently not felt. 0 expresses the absence of examples for the given item. Where there is no phonetic possibility of the second case, only a single example is cited (likewise wherever it would be possible to make up only rather artificial evidence by using a compound from a foreign base which practically does not exist in the language). (I further use the abbreviations: Vo — vowel, J — unpaired consonant, and P — paired consonant.) From this table there follow, I think, a few quite clear conclusions. Above all it is apparent that with respect to voicedness two groups of consonants emerge clearly in Czech represented b y our group G (unpaired consonants) and A (true paired consonants); the remaining groups are rather closer to the t y p e represented b y group A but with varying degrees of consistency in the" application of the relations of A (excepting group F). 17
Moreover irrespective of whether it is a morpheme boundary or not, since the influence of this boundary on the voicedness of consonants is not manifested in literary Czech. (The sole exception is the 1st person plural of the imperative of verbs — cf. Vyslovnost spisovne cestiny 1,21967, p. 55. Fluctuation in the pronunciation [sx] — [zh] in Bohemia, e.g. shoda — shora, is always at the morpheme bounddary and is dependent on the varying degree of markedness of this boundary.) " Cf. our illustrative material for each category in our study in SaS 19, 1958, p. 272 seq.
114 I. in vicinity Vo, J 1. init.
3. end
al
a2
! i
bl
b2
A
U||V
' U||V
U-U
U-U
v-v
U||V
U||V
B
U||V
U||]V
U-U
U-U
0-V
UIIV/U
U||V
C
(U)||Y
U||V
(U)-U
0-U
0-V
(U)||V
U-IU]
V-[V]
p : b etc. x: h f:v D k :g E affricates f
2. mid.
II. in vicinity P
F
G unpaired
u-m
(U)||V U||[V]
U||[V]
unm
U||[V]
u
u
U-0
V-0
U
U
V
V
u
U
V
u
V
V
Y
V
V
V
V
V
U-[U]
Closest to group A is group B (a;: h). It is clear that the two sounds represent two different phonemes. The most significant divergence away from group A is not the absence of original (x) before voiced consonants (IIa2), but the more important possibility of both progressive and retrogressive assimilation of /h/ (the well-known type shoda [sxoda] or [zhoda] — Ilbl). At first glance it might seem that the next closest group to A is type D (k : g). However the opposition voiced — unvoiced, although it is applied in all positions as in group A and neutralized likewise in analogical positions, is conditioned purely and simply by the occurence of g in words of foreign origin. Thus it cannot be treated as an opposition of two phonemes of the central system from any of the traditional phonological viewpoints. 19 On the other hand in group C containing the consonants / and v which are the main subject of our interest here, we do not find original / at all in positions H a l and IIa2, but in all other positions both sounds do occur in relations analogical with those in group A — in absolute correspondence in position 12, with reservations in the others as described in this article in part 2.1—2.3. The remaining two groups, E and F, show a much freer relation to group A and from this table it is already clear enough t h a t the voiced — unvoiced 19
Cf. in this book, p. 26 seq.
115 relationship is here merely a relationship between variants of the same phoneme governed by context. 3.2 In order that our look at the relation between voiced and unvoiced consonants in Czech will be as complete as possible we shall briefly demonstrate the active assimilational ability of the individual consonants. In the following table (III) is given sub 1 a review of the ability of unvoiced and voiced consonants to assimilate to themselves from the point of view of voicedness consonants which precede them in the same word. Sub 2 we can see whether voiced consonants at the beginning of words are capable, in perfectly continuous pronunciation, of assimilating the final unvoiced consonant of the preceding word, namely a) if they precede another sound than a paired voiced, and b) if they precede a paired voiced consonant. 40 2. between words Ill
1. within the word a. before Vo, J
b. before V
A
+/+
+
+
B
+ /+ —
+
+
C
(+)/— "
D
+ /[+]
E
—
+
[+ (-)l
[+]
+ 10
0
[+]
F
—
+
+
G
—
—
+ (-)
The table above gives the ability ( + ) or inability (—) of consonants to assimilate the preceding consonant. As far as concerns assimilation across word boundaries, P. Zima in his manuscript work21 has pointed out that we cannot treat it as nearly so regular as assimilation within a word, because it is much more dependent on a number of other factors, especially factors of modulation (and in particular on tempo). Although in this simplified table we shall treat the intermediate degree of voicedness, with which Zima works, as a shade of voicedness (this is the iesser voicedness of the assimilated consonant), the table, which is based In part on Zima's statistics and in part on my own findings, nevertheless M
81
Cr. M. N o h a ' s article K vtjslovnosti souhlaskovtjch skupin v £eStin£ (SaS 17, 1956, p. 78 seq. and 82 seq.), which for the first time demonstrated the possibility of voicedness assimilation between words before unpaired (sonorous) consonants in literary Czech. P. Z i m a , K otazce foneticke samostalnosti slova, thesis presented at the Philological Faculty of Charles University, 1957.
116
shows definite fluctuation for some positions. This fluctuation is marked in the table by giving both signs without any dividing or joining mark, and where there is a slight predominance of one case then the other is given in brackets. If in continuous pronunciation there is a clear predominance of one type then only one sign is given. I think that it follows quite clearly from the table that, as far as concerns active assimilational ability, group C, that is strictly speaking the consonant v, comes closest to the sounds group G, the unpaired consonants; however not even in this respect do the other groups (not even B , i. e. % : h) behave exactly in agreement with group A. 4. In conclusion we may say the following: The consonants / and v are independent phonemes in contemporary Czech, for they satisfy all the requirements which determine a phoneme and are capable, at least in one position (within a word, intervocalically), but in my opinion in other positions where the opposition of voiced and unvoiced paired consonants is preserved, of acting as a means to distinguishing the meanings of words. Both consonants take part in a voicedness correlation, though their mutual correlational relation, albeit analogical to that of the consonants p : b, t : d, t: d, s : z, s : &, and x : h, is in some respects restricted. Similarly though to a lesser degree, the relation between the phonemes /x/ and /h/ is also restricted. This, however, in no way detracts from their phonemic validity since participation in a correlation is not decisive for evaluating a sound as a representative of the phoneme. (The consonants k and g behave in all decisive positions in accordance with the consonants of our group A, but we still cannot treat g as an independent phoneme in any of the traditional views since it fails to satisfy one of the deciding conditions placed on a phoneme, that is, it does not occur in native words.) In my opinion, the pairs of phonemes given here in group A should be taken to be the core of the voicedness correlation; the remaining consonants and their variants given in D and E reflect this relation only to a degree. The consonants in G (unpaired) and also F (r) lie outside its bounds.23 M It is also interesting note that the consonants which form the core of this partial system have remained in roughly the same relations for a long time already with but very few modifications since the proto-Czech period, but with the development of new relations after the disappearance of the The familiar case of progressive assimilation of the type tvuj, kv(t: [tfuj, kfjet] which occurs in the Lach and Doudleb dialects, is of course a feature of the dialectal consonantal system which in many respects diverges from the literary system, and does not penetrate into the literary language at all. 23 In accordance with the critical remarks of J . V a c h e k in Dynamika fonologickiho systemu soutasne spisovne deStiny, 1968, p. 93 and elsewhere. M;
117 semi-vowels and the emergence of voicedness assimilation. The sounds which are not included in this core and whose relations diverge from it to a greater or lesser degree from the foregoing (e.g. h, /, or v, and also r) developed at a relatively later date. However, not even the centuries during which they have existed in a form roughly equivalent to their present form, or have even functioned as phonemes, have yet been efficient to bridge completely the differences between the relations to their 'new' opposite members and the relations between 'old' phonemes. Although we do not possess for this purpose sufficient phonologically differentiated statistics (which would determine, for instance, which is a case of a phoneme in its basic form and which is the consequence of neutralization), nevertheless even the detailed phonetic statistics of V. Mazlovâ24 demonstrate the divergent ratio between / and v (7 : 39) in comparison with the remaining unvoiced and voiced consonants where there is a clear predominance of the unvoiced. The fact that the converse, though by no means so marked, is also true of x (spelling ch) and h (14 : 16), again indicates the fringe position of these pairs, through it can in no way limit the validity of their members as phonemes in contemporary literary Czech.
" Une contribution à l'analyse de la langue tchèque au point de vue acoustique (Lingua 2, 1949/50, pp. 198 seq.) and elsewhere.
XI. T R E N D S IN THE DEVELOPMENT OF S T A N D A R D R U S S I A N PRONUNCIATION
1. The main features of the development of standard Russian pronunciation are generally familiar and so I shall only make fleeting mention of them here. The relatively stable pronunciation of the pre-revolutionary period, based mainly on the pronunciation of the Moscow intelligentsia1 and represented in its purest form by the pronunciation forested by the Moscow Maly Theatre, was upset by the revolutionary and post-revolutionary changes brought about in the formation of Soviet (and especially Muscovite) society, so that not even in the period prior to the Second World War were all its standards perfectly crystallized, and in many respects the trends in its development could be guessed at only with difficulty.2 These fluctuations and obscurities are still apparent in the first post-war works which already have to a great degree the character of normative guides (e. g. rpaMamum pyccKoeo a.3una AH CCCP, 1952; C. H. Owceeoe, Caoeapb pyccKozo
mbiKa, 4
1 9 5 2 , 1 9 5 3 ; P. M. Aeanecoe,
Pyccnoe
Aumepamypuoe
npo-
1968) and especially when we come to compare them. It may be said that it was the work of an Academy collective under the leadership of Professors Avanesov and Ozhegov, published originally under the title Pyccme Aumepamypnoe ydapeHue u npou3HOiueuue in 1955 and subsequently as Pyccnoe Aumepamypnoe npou3HoiueHue u ydapeuue in 1959 (1st ed.), which first marked the end of the era of hesitation and confusion. It may be considered as the relatively definite codification of the u3HomeHue,
1
A small number of divergences, e.g. in the pronunciation used in Leningrad, have usually been treated as non-literary. The most integrated description of Moscow pronunciation is given byV. C h e r n y s h e v i n his work 3anoHbi u npaeujia pyccmzo npouaHouiemw, 1915, and also by, for example, P. KoSutic in his rpaMamuna pyccKoeo aauKa, vol. I, 1919 (in Serbian), D . U s h a k o v , Pyccnan zadanu in t h e miscellany Pyccnaa. Penb III, 1928.
0p@03nun
u ee
» This follows from the articles of L. N. S h c h e r b a and A. S. B e r n s h t e j n in the journal PyccKuu R3biK e uiKOJie 1, 1935, N o . 5 (IH,., O HopMax o6paai\oeozo pyccKOZO npoyaHouieHua., pp. 105—107; E., Ha3pe8wu.il eonpoc, pp. 108—119).
119 standard pronunciation of contemporary literary Russian. By this I do not mean to say that this work gives an absolutely unambiguous decision as to the literary pronunciation of Russian down to the finest details; on the contrary, even here we find a number of doublets and pronunciational variants the state of which future developments in many cases will certainly change, though by and large it is clear from this work which phenomena may be treated as the manifestation of living, progressive tendencies in pronunciation which we may assume will assert themselves in the future, and which phenomena are already receding. In this article I wish to add a few remarks to the question of the trends of development in the standard pronunciation of contemporary literary Russian and to the question of their codification. 2. The c o n c e p t of o r t h o e p y and i t s d e f i n i t i o n . By orthoepy (literary pronunciation) we usually understand the sum of the; principles and rules by which pronunciation (or in some cases the phonic aspect generally) is governed in speech using the literary language. Literary pronunciation is based as a rule on one form of pronunciation already existing in the language. Its basis, the source of its norms, is not the same, however, for all languages. Thus in the spoken Czech of the present time the existing conventional pronunciation of the language in correct speech has been codified as literary, orthoepic (without being restricted to any one locality),3 while pre-revolutionary Russian was, as we have mentioned above, based on the pronunciational norms of a single centre of pronunciation. In contrast, the general literary pronunciation of, for instance, German is based on thé rather artificially constructed pronunciational norm of the theatre which was codified at an earlier date.4 Not all the phenomena of pronunciation which go to make up the phonic side of a single literary language have the same importance from the orthoepic point of view. They frequently belong to different levels. This is certainly what Avanesov has in mind when he draws attention in his book 6 to the need to distinguish between matters of pronunciation in the narrowest sense of the word, and matters of stress. The question of the placing of the stress in Russian — not unlike the question of, for example, the utilization * Cf. Vysloonost spisovné leStiny I, elaborated by B. H â l a with a special committee, under the auspices of the Institute for the Czech Language ( 1 1955, 2 1967). 4 T . S i e b s , Deutsche Bühnenaussprache — Hochsprache, 16 1930 (reelaborated from 16. in Deutsche Hochsprache — Bühnenaussprache, 1957). Other codifications also take theatre pronunciation as their basis, e.g. Wörterbuch der deutschen Aussprache (Ed. f H. Krech, 1964), or Der große Duden 6, Aussprachewörterbuch (Ed. M. Mangold — P. Grebe, 1962). • PyccKoe jiumep. np0U3H0uienue, p. 8 (1954) or. 11 (1968).
120 of quantitative differences in Czech — is not, in m y opinion, a matter for orthoepy in t h e strict sense of the word. The place of the stress in a Russian word (just as the presence of a long or short vowel in Czech) is not governed b y any norms of pronunciation but by those of lexis (cf. e. g. the difference between Mijm and Myna, njim$ and njimy in Russian, just as in Czech pece and pece, draha and draha) on the one hand, and those of grammar on the other (cf. in Russian eopoda and zopoda, and in Czech pracuji — pracuji, or Russian pyxa — P$KU, and Czech skala — skal). The location of phonematic stress (as also the realization of phonematic quantity in Czech) in a given word is taken by us here to be a phenomenon of approximately the same category as is, for instance, the use of a certain phoneme from a given language system in a certain word. Thus I consider t h a t from the orthoepic point of view there is no essential difference between the evaluation of the fact t h a t , for example, in the word uoza the stress is on the second syllable and not the first (and similarly in Czech t h a t in the word para the first a is long and not short) and the assessment of the fact t h a t in Russian dy6 and Czech dub the initial consonant is d and not t (nor n, nor d, etc.). I am aware t h a t for practical reasons (especially where in certain cases there is fluctuation in the location of stress) it is useful and possible to include information on the position of the stress in Russian (and likewise information on quantity in Czech, or on any element of pronunciation in a n y language) in the orthoepic guide, although for the reasons stated above we ought to look for information on the position of the stress in words in the dictionary, and information on its position in the forms of words in the grammar (just as, for instance, we should look there for information on vowel alternation in the different forms of words). However, not even the other features of pronunciation which interest us from the orthoepic point of view are all of the same kind. When evaluating t h e m we often find it useful to distinguish between the pronunciation of the individual sound elements (speech sounds), and also where necessary those combinations of them (in Russian moreover in dependence on stress) which are regularly and generally applied in the given language and are not dependent on the nature of the word in which they occur, and features of pronunciation whose form is not merely given by the regularities of the phonic plane but by the fact t h a t they occur in a particular word or in a word of a particular category. In Czech orthoepic terminology we usually use the designation orthophony for the aggregate of principles of the first type (i.e. those which determine what is the correct pronunciation of the sounds of the literary language and their combinations), and the term orthoepy in the narrower sense is used for the aggregate of principles and rules of the second type (i.e. those which determine the correct use of the orthophonically formed elements).
121 3. S o m e q u e s t i o n s of o r t h o p h o n y . It may be said that orthophonically Russian does not present such great development changes and fluctuations as it does in the area of orthoepy proper. The orthophonic principles which have become stabilized on the basis of Moscow pronunciation of the pre-revolutionary period have in essence maintained their validity right up to the present. Not even during the period of the greatest measure of fluctuation in the literary pronunciation, including that of Moscow, as a result of the flood of immigrants to the capital from the provinces, 8 was there any doubt as to the fact that, for instance, the speech sound g should be pronounced as an occlusive voiced velar consonant and not as voiced £*[Y] as it is pronounced in the South Russian dialects, 7 and that it is necessary to distinguish between the affricates c [tj,] (soft) and c [ts] (hard) instead of pronouncing a single affricate as is the case in the dialects with with so-called tsokanie; nor was there any doubt as to the literary character of ikanie, however frequent might be pronunciation with okanie among speakers of the North Russian dialects, nor as to the necessity of considerable qualitative reduction of vowels in unstressed syllables generally. Equally uncontested orthophonic standards are the loss of voice of paired voiced consonants at the end of the word, regressive voice assimilation, nor has there been any question as to, for instance, the orthophonic articulation of the individual consonants, that only literary v is labiodental and not bilabial, that hard 1 is a alveodental consonant with strong velarization, and the so-called "bilabial 1" (y = [w]) is only a non-literary form whether it be an individual divergence or one based on dialect pronunciation, etc. Nevertheless there have remained a number of fringe questions of an orthophonic character where changes have come about. It is a fact of some interest that in many of these cases some fluctuation or at least the germ of it could already be traced in the pre-revolutionary standard pronunciation. The first such problem was the pronunciation of the sound equivalent of the grapheme m. As is familiar, the earlier literary pronunciation, based on the pronunciation of Moscow, required that a double soft s' [JJ,] be pronounced. • As recorded, for example, by the above-mentioned articles by Shcherba and Bernshtejn. ' The pronunciation of voiced [y] (or at the end of a word unvoiced [x]) for g in certain words of theological origin is in itself merely a question for orthoepia and not orthophony. Moreover there is a clear tendency in contemporary pronunciation to remove this fricative variant of Russian phoneme /g/ from literary speech. The pronunciation of a voiced [y] (or [h]) in certain interjections is of course quite a different matter since we often find in interjections sounds which otherwise form no part of the sound resources of the respective language.
122 We quite frequently find here references to long soft I think that it is this designation that has often led to incorrect ideas as to its articulation, which is always marked by a new articulatory impulse at the beginning of the second part of its duration (roughly of the type common in double consonants). However, the difference between this kind of pronunciation and the conspicuous pronunciation s'c' [J,tJ,], which ill the pre-revolutionary period used to be considered as an admissible alternative, is not usually very great nowadays. If we can judge from the contemporary state of affairs (the pronunciation [J,tJ,] is permitted as a second variant on the standard) there is between the two types of pronunciation a smooth transition, to be seen in the realization of this sound by different speakers of the literary language, from the extreme pronunciation of a double (though of course not merely long) [J,J,] through a combination of a soft fricative with a soft affricate, which is however marked to a greater or lesser degree by a weakened implosion, to the combination [J,tJ,] (though never [J, t, J,]). Thus I think t h a t instead of speaking of two variants of the orthophonic pronunciation we may speak of defining the bounds or scope of the literary pronunciation of this sound (or combination of sounds). 8 In contrast to this the orthophonic pronunciation of a double soft 2 T [3>3>]> which occurs in relatively very few cases, is considerably more uniform.® The second problem where we can discover fluctuation in the orthophonic pronunciation is the complex of phenomena which we call ikanie. Earlier Muscovite pronunciation drew a distinction between the pronunciation of unstressed vowels equivalent to the grapheme H with on the one hand a and e, and on the other hand a (that is also a after h and m), and in particular in the syllable standing immediately before the stress (whereas in other unstressed syllables the pronunciation roughly coincided). This distinction, 8
9
This range is of course considerably reduced in word-final positions or after consonants which are members of a voicedness correlation, where pronunciation close to the type of double soft §'$' more frequently occurs. This itself is very often shortened (that is, the second element is either weakened or even left out). It seems, however, that this pronunciation is on the boundary between literary and colloquial pronunciation. Cf. also in our monograph Zvukovfi rozbor rustiny, 1962, pp. 117 seq., 192 seq. By this I do not mean that any other literary pronunciation is permitted (thus for example in OKyMcwcamb, dpe3Mcumb hard [55] in addition to soft [3,3,] and in doMcdn [3d,] in addition to [3,3,], etc.). These types of pronunciation are, however, sharply crystallized. As against the orthophonically unfluctuating type of double [3,3,], there exists as a literary variant in pronunciation a combination of two consonants already existing in the phonemic system of Russian as independent phonemes.
123 while not being particularly great, was generally recorded by contemporary (as well as later) handbooks of the earlier orthoepy.10 However, we know not only from a number of South and Central Russian dialects but also as a characteristic feature of the pronunciation of the young Muscovite intelligentsia at the time before the revolution, that a complete fusion of all the etymological vowels mentioned after soft consonants came about even in a pre-stress syllable; they formed a single sound very close to the vowel [i] when rather relaxed. This pronunciation, which was at first rejected out of hand (cf. the derisive nickname niiTyxH for those with this pronunciation), gradually took root so that it appeared as a parallel, and at one time dominant pronunciation even in correct speech. It is interesting to note that opinions on the thorough implementation of this ikanie have shown quite some differences; as against the generally tolerant opinions (e. g. in Ushakov's dictionary) we find the negative standpoint of Shcherba in the article quoted (p. 118). Shcherba's argument against allowing this pronunciation, that spelling would become too far removed from pronunciation, doubtless had no weight in the normalization of contemporary literary pronunciation, though the results are the same. For the new norm now more or less coincides with the old (i.e. without ikanie) Muscovite pronunciation in that it prescribes different pronunciations of reduced i and reduced e and a after soft consonants. Because this is far from being a pronunciation decreed from above but is indeed based on actual pronunciation in correct speech, we may safely assume that this development in a typically orthophonic phenomenon, as vocalic reduction is, has been unquestionably retarded by the influence of orthography. The norm then prescribes the pronunciation i (let us add "reduced i" [i]) for etymological i, the pronunciation of a sound between [i] and [e] though closer to [i] (roughly then a considerably open relaxed [i] with a slight tendency towards [e]) for etymological e and a after soft consonants. Moreover, in certain positions it allows of i-type pronunciation (before soft consonants, for example in the words aepeBHH, HCCHTOK, pflSuHa, maBenb). Avanesov in his phonetics of literary Russian11 allows of universal ikanie as an equally valid pronunciational variant. I consider that the true state of affairs in literary Russian is approximately as follows: Reduced i in the pre-stress syllable is realized in the literary language only as a relaxed [i]. Reduced e and a after soft consonants in the same syllable is realized within a scope extending from the same sound to a very open relaxed [i] with a slight tendency towards [e]. The needs of semantic differentiation, in 10
Cf. Chernyshev, op. cit., p. 36.
11
(fjoHemtiKa
coepeMeHHozo
pyccnoao
AumepamypHoeo
¡tauna,
1956, p. 109 seq.
124 places where t h e context is n o t an a d e q u a t e factor, will evidently p l a y an i m p o r t a n t role for t h e choice of t h e more open (more e-like) variant. 1 4 A similar relation as t h a t between t h e p r o d u c t s of t h e reduction of t h e sound i, e a n d a a f t e r soft consonants can also be found between t h e results of t h e reduction of t h e sounds i (i.e. h ) and e a f t e r t h e h a r d sibilants z, s and c [3, J, ts]. — The earlier Muscovite norm, which required t h a t t h e results of t h e reduction of t h e vowels e a n d a a f t e r these h a r d sibilants should coincide, is n o w a d a y s t r e a t e d as out-of-date. 1 3 The few cases allowed b y t h e n o r m (jiomauen . . . , k co>KajieHHio, uBajmaTH, TpHHuaTu etc.) should be t r e a t e d as orthoepic (not orthophonic) exceptions. In other cases t h e influence of spelling has m a d e itself strongly felt. As for t h e other unstressed positions (and in p a r t i c u l a r t h e p e n u l t i m a t e pre-stress syllable), I t h i n k t h a t here too t h e relationship between t h e reduction of t h e sound i and those of a and 0 a f t e r h a r d consonants is analogical to t h e relationship between t h e products of reduction as mentioned above in t h e case of ikanie in t h e pre-stress syllable. 14 T h e m a i n t e n a n c e of differences within t h e range allowed b y t h e n o r m is here too evidently conditioned b y t h e needs of semantic differentiation in more expressive pronunciation. I feel t h a t f r o m t h e few examples given, which are f a r f r o m e x h a u s t i n g t h e whole problem, t h e m a i n t r e n d s and tendencies in which t h e c u r r e n t codification of t h e Russian orthophonic n o r m is proceeding become quite a p p a r e n t . Essentially t h e principles of Moscow p r o n u n c i a t i o n still r e m a i n valid here; in some cases we find t h a t — w h e t h e r under t h e influence of originally non-Moscow p r o n u n c i a t i o n or under t h a t of o r t h o g r a p h y •— some pronunciational v a r i a n t s are allowed which in m y opinion are r a t h e r t h e expression of t h e scope within which it is p e r m i t t e d t o realize t h e individual sounds w i t h o u t disrupting t h e literary character of t h e utterance. 4. S o m e n o t e s o n o r t h o e p y p r o p e r . E v e n in t h e earlier guides t o t h e s t a n d a r d Moscow pronunciation t h e r e was t h e need t o record a whole n u m b e r of orthoepic prescriptions concerning only individual words or word categories which represented exceptions f r o m t h e general principles of pronunciation. The reasons for these "irregularities" in pronunciation were various. In some cases it was t h e Church Slav origin of t h e words. B u t most frequently, however, t h e cause of t h e irregularity was in t h e " In m y opinion there is here a very similar relationship between the two sounds as in everyday literary German (not that of the stage) between closec^and open long e (i. e. e—a [e:]—[s:]). While both may be realized in the closed form, only the second of them may be pronounced in the form which is within a certain scope more open. 18 Cf. here On the Vowel System of Russian, p. 37 seq. 14 Cf. also here p. 54 seq.
125 difference between orthography and pronunciation caused by the fact t h a t t h e spelling preserved a relatively historical form while pronunciation had developed in a different direction (e.g. in the endings of the genitive singular masculine and neutre of adjectives in -oro and -ero where v used to be and is pronounced), or on the contrary t h a t the orthography created new forms while pronunciation more or less preserved the earlier type (as in unstressed adjectival endings -KHA, -run and -xnii where the Moscow pronunciation corresponded to the spelling -Koii etc.). At other times the orthoepic standard accepted assimilative (as well as the so-called dissimilative) changes, especially in consonantal groupings, which were not reflected in the orthography. Finally there was also the strong effect of the circumstance t h a t a sound was sometimes — apparently in the same position — in a grammatically important ending and sometimes not, and t h a t sometimes sounds come together within a word and sometimes at the junction in compounds or across word boundaries, etc. We have mentioned t h a t in this section of orthoepia certain m a j o r changes have taken place in literary Russian. Some of the disproportions between spelling and pronunciation have indeed disappeared with the spelling reform of 1917 (we may quote at random en, oH-fe, etc.), but others have of course emerged. We do not wish to, nor can we give in this brief article a full list of the changes which have taken place in the development of the Russian orthoepic standard. We are more concerned merely to illustrate the tendencies which latterly have been or are being asserted in it. It may be said t h a t in contemporary Russian orthoepy two tendencies are primarily manifest. One is the tendency towards (phonetic) regularity, the other towards correspondence with the orthography. In many cases both tendencies act parallel and in the same direction. So, for example, in the adjectives mentioned as ending in -KHH, -THS, and -XHH the pronunciation with soft consonants is now permitted alongside the older pronunciation. The development of this pronunciation proceeded even further in verbs ending in -KHBaTb, -rHBaTh, -xHBaTb (e.g. pa3MaxnB a T b ) , where the soft pronunciation has thoroughly asserted itself, the old Moscow pronunciation with hard consonants being considered as quite outdated. On the other hand, for example, the regularity of the pronunciation of a consonant before the dividing sign at the boundary in a compound has been considerably upset by the lack of agreement between phonetic tendencies and spelling. If it is assumed t h a t consonants (that is, those which can also occur in the soft form) are pronounced softly before palatally pronounced [j] (just as when the soft sign is written, e.g. in 6bio, ceMbH etc. — in this case the tendencies in pronunciation and spelling are in accord), then with the use of the hard sign (which still carried with it the
126
idea t h a t it marks hardness) a certain fluctuation occurs, which in the currently valid norm can be seen, for instance, in the fact that the consonants s and z in the prefixes c-, M3-, pa3- are softened (e.g. in CT>e3H, H3tHBHTb, pa3i>e3fl), while t, d and b in the prefixes OT-, non-, 06-, etc. remain hard (oTT>e3H etc.).
The influence of orthography and the effort to approximate pronunciation to it have upset pronunciation in whole groups of words whose pronunciation in the Muscovite norm was almost regular. An example of this is the group written -HH- for which the Moscow norm prescribed the pronunciation [Jn] much more often than is the case today. Thus, for example, KHioiHHua is nowadays pronounced only with [tj,n,], and in the words MOHOHHHH, 6YJIOHHAH, KANAQHHK, JIABOHHHK the pronunciation [Jn] (or [Jn,] where applicable) is merely a second alternative allowed by the norm. The pronunciation of the suffixes of reflexive verbs written -CH and -Cb was always hard in Muscovite pronunciation. It is generally familiar that this obligatory hardness has been preserved in the infinitive and 3rd person singular present only (here the assimilation of [t] ([t,]) with [s] has given rise to the affricate [ts] which is always hard in Russian) while in the other forms we meet only with soft pronunciation influenced by the orthography. Only in the forms where -CH is preceded by [s] do we find a preference for the hard pronunciation. In spite of having passed over a number of the orthoepic phenomena of current standard Russian pronunciation (e.g. the so-called softness assimilation) I think we can summarize the main features in the development of this norm even on theba sis of the few examples given. In spite of the ever clear divergences from the Moscow pronunciation which are still traceable, this pronunciation continues to be the foundation of the norm. The divergences which arise in development are caused by trends towards greater regularization and towards equivalence with spelling. However, in the present stage they often represent a violation of a certain regularity in originally closed groups. It will be interesting to follow how Russian will cope with these irregularities in the future, and whether it will tend to remove differences in pronunciation or to resort to certain adjustments in the orthography. 5. N o t e s in c o n c l u s i o n . There is no question that recording the norms of the pronunciation of speech sounds and their combinations, the pronunciation of groups dependent on the structure and type of words and the norms of stress, will not give us all the norms for the pronunciation, or phonetic side, of literary Russian. There are clearly other norms at play, e. g. norms of intonation, though no attempt at a codification of the latter has so far been undertaken —• nor (as far as I know) for any other language for that matter. It appears, however, that in this sector too there has been
127 some development in literary Russian. At any rate the intonational types given in earlier literature as proper to literary Russian do not correspond in all respects to the types which occur in literary Russian today. This, however, is another and relatively complex question, not to mention the fact that, purely from the point of view of orthoepy, it is a point in question whether, as in the case of the norms of stress in Russian, the norms of intonation do not belong to a different level, most probably the level of grammar (strictly speaking, that of syntax). 15 From a glance at the overall development of the Russian orthoepic norm for the last few decades we may come to-an interesting conclusion. The old literary pronunciation was based, as we have already emphasized, on the pronunciation of a single cultural centre, Moscow, or rather on one population grouping there, the inteligentsia. It was preserved and consistently elaborated longest on the stage of the Maly Theater in Moscow. The general standard pronunciation has continued to be derived from this norm which was relatively the most stable at a period of otherwise quite considerably fluctuation. The divergences in pronunciation to be found in other centres (Petrograd — Leningrad) and other demographic groupings have not been recognized as literary. As far as the pronunciation of the stage is concerned, special requirements must be placed on its norm. (This stems from the need for consistency and the requirement of the possible restriction of variants.) The current state of affairs in Russian is such that in certain cases there is a tendency to prefer more archaic forms, which is evidently motivated by this very effort to be more consistent.14
15
11
Cf. in this book Sprechmelodie und andere satzphonetische Mittel..., p. 165 seq. and Zum Problem der Fragemelodie, p. 147 seq. Cf. e. g. the stage pronunciation of the suffixes -CH and -cb of reflexive verbs*
B. INTONOLOGY
X I I . INTONOLOGICAL TYPOLOGY
0. When defining the typological construct, V. Skalicka uses for each language type a bundle of linguistic phenomena, mainly from the sphere of morphology (including here word-formation), speechsound combination, or also syntax. 1 He does not give a place in his universal typology2 to that which has been designated and elaborated by some as phonological typology (e.g. in the work of Trubetzkoy). It might be possible to say, however, that certain phonematic elements do act as criteria for the delimitation of the typological construct in that universal (macro)typology, while others — unquestionably the majority — do not. Nevertheless, going beyond universal typology as thus conceived, it is possible to speak of a phonological or phonematic (or perhaps phonic) typology, in which a role may be played both by those elements used in the typological construct and by some of the others. I wish to introduce this case as an example of a partial typology. Syntactic criteria are an even more frequent component in the bundle of characteristic features in the typological construct. In spite of this I do think it possible to agree with certain others in speaking of a possible syntactic-typology which is not merely one component of a universal typology. If we accept this idea, we might further consider other part typologies (e.g. lexical). 1. It will not be immediately apparent why I begin with these thoughts. I am concerned with the possibility of considering an intonological typology the criteria of which are not (or at least usually not) even partially applied in the delimitation of the typological construct in general (universal) typology. I use here the term intonological typology, which may in part signify the same as what is sometimes called prosodic typology. However, I prefer this new term of mine 1 2
V. S k a l i C k a , Ein „typologisches Konstrukt", TLP 2, Praha 1966, pp. 157—163. V . S k a l i C k a , Die phonologische Typologie, Phonetica Prag. 1, AUC-Philologica, Praha 1967, pp. 73—78.
132 since it covers neither the same content-matter nor the same range, as will perhaps be clear from what follows.
Within the range of our part typology we shall treat as intonological criteria those which are based on distinctions between, or the presence or absence of, what are called prosodic properties. However, of those properties which in human speech distinguish between units of a language by the aid of differences in frequency, intensity and duration, and only quite exceptionally in modifications of the acoustic spectrum, we shall primarily be respecting differences in frequency and in its variations. Further we shall only be considering those properties which are exploited in the phonic means usually described as suprasegmental (i.e. those which are not properties of the elementary unit, usually the phoneme, but of higher units, at the very least the syllable). If we trace the interconnections and interdependencies of such means, we find a number of criteria of intonological nature in several earlier works in typology and especially in those dealing with microtypology. Of these we might mention the principle of the incompatibility of free quantity and free stress 3 or the principle of the incompatibility of functional quantity and penultimate stress which is sometimes formulated in the microtypology of the Slavonic languages. 4 Attempts have been made at a general classification of intonological properties in accordance with their phonetic features and their use in language. 6 We too wish to suggest here an approach which takes as its starting-point similarities in the use and functions of intonological means rather than their (phonic) form, and we shall be attempting to delimit groups of languages which use these means in a similar way. 2. We delimit here four basic groups of languages which we shall go so far as to designate as intonological types. 1) In the first group we include those languages where the intonological characteristicon is a property of the syllable and is confined within the limits of the syllable. Moreover we may add that in this type the syllable is usually a semanteme. 2) The second group covers languages where it is the next higher semantic 3
Cf. J. K r i m s k ^ , On the Phonological Law of Incompatibility of Free Quantity and Free Stress, TCL 2, Praha 1966, pp. 133—145. 4 E.g. E. S . t a n k i e w i c z , Towards a Phonemic Typology of the Slavic Languages, Amer. Contributions to the 4th Intern. Congress of Slavistics, 's-Gravenhage 1958, pp. 301—319, and others. 6 E.g. N. S. T r u b e t z k o y , Zur allgemeinen Theorie der phonologischen Vokatsysteme, TCLP I, Praha 1929, pp. 39—67; and, in a different sense, I. M a h n k e n , Studien zur serbo-kroatischen Satzmelodie, Opera Slavica III/2, Gottingen 1964. similarly in Folia Linguistica I, 1967, pp. 59—79, and elsewhere.
133 units (words) that are characterized intonologically. These are at least monosyllabic but more frequently longer. 3) Languages in which the intonological means (and particular tonal progression) are functional in the phonology of the sentence form the third group. 4) The fourth group is for those languages where intonation is not applied linguistically. If we were to adapt our initial assumption, it might be conceivable to consider one more type, namely where intonological features are functionally loaded properties of phonemes. However, these would be properties of the phonemic, phonological system and could at best be included among the criteria of a phonological typology (if, that is, their occurrence were not bound to the occurrence of one or other property in one of the intonological types). Furthermore we may assume that in all types the intonational elements may function as a means of delimiting the unit of utterance (or sentence), not only as a matter of course in our third type, but also in both the fourth and in the first two. The intonological means are also used in all types outside the limits of language system on the plane of emotional colouring. We know of no language where the intonological means are not used either as a means of delimitation or as a means of expressing emotion. If there are any such languages then we should add another type or types. 2.1 I think it is quite apparent that we include in the first group those languages which are usually designated as tonal or tonemic. In a language like Chinese monosyllabic semantemes are distinguished by differences in pitch and the progression of the basic vocal tone. In addition to the obviously relevant tonal element, the toneme is also quite clearly characterized here by other, redundant, features, on the one hand differences in the course of the intensity throughout the syllable, and on the other hand variations in duration, though timbre modifications are more dubious and open to debate.6 I have taken the example of Chinese and not another of the so-called tonal languages of East and South-East Asia (e.g. Thai)7 or Africa8 for reasons of better access to material on Chinese. At the same time I am aware that it may be objected that in the Kuo-yii form, for instance, which 6
7
8
Cf. M. R o m p o r t l , Zum Problem der Tone im Kuo-yil, Archiv orient&lni 21, Praha 1953; O. S v a r n y , Pekinese Tones — Proposal of a New Approach, Phonetica Prag. 3, 1972, pp. 257 seq. Cf. e.g. A. S. A b r a m s on, The Vowels and Tones of Standard Thai, Intern. Journal of American Linguistics, Vol. 28, Nr. 2, Part III, Bloomington 1962. E.g. P. Z i m a , On the Function of Tones in African Languages, T L P 2, pp. 151 to 156.
134 is based on Peking Chinese, the situation is essentially deviant and that it may be interpreted in the way found, for example, in Martinet. 9 However, not only for the other forms and layers (dialects) of the language but for this form too, we may assume, even from synchronic points of view, that tone is bound to the monosyllabic semanteme, as long as we are not dealing with the considerably limited number of semantemes which are always tonefree (or never carry tone) and are of course also unstressed. 2.2 Otherwise this form of Chinese might be treated as a transition to the next type which includes first and foremost the group of languages with what is called tonal (melodic) stress. The fact that intonational differences (primarily in the progression of the tone) are bound to the stressed syllable (which here has culminative function) clearly shows that in languages such as Serbo-Croat, Slovene, Lithuanian, Swedish or Norwegian (and, with a pinch of salt, Kuo-yu and perhaps some African languages — Yoruba?) the intonological means are employed at the level of the phonology of the word. Unlike the previous group, there is the possibility here that intonational elements may be used as means in the phonology of the utterance, although some theories have doubted this.10 Wherever allusion is made to prosodic typology, this is usually taken to mean the classification of the types and sub-types which we have included in our first two groups.11 Relations and constructions which we here leave aside for the time being, e.g. the classification of languages as their basic unit is the syllable or mora, are of course also considered there.12 2.3 We are aware that the difference between the first two types is — to put it carefully — of a different nature than that between types two and three. Group three comprises those languages in which the intonological means are applied in the phonology of the whole sentence (utterance). We must here again recall that when making this formulation we usually have in mind the application of the tonal progression component, while the dynamic, temporal (and the more so timbre) component is left aside. This means, for instance, that we include here not only languages where quantity is a property of speech sounds (Czech) or syllables (Slovak — in this case some might prefer to speak of a difference between languages having * A. M a r t i n e t , Accent et tons, in the book La linguistique synchronique, Paris 1965, pp. 141—161. 10 E.g. A. B e l i e , L'accent de la phrase at I'accent du mot, TCLP 4, Praha 1931, pp. 183—188, etc. 11 Cf. e.g. A. M a r t i n e t , op. cit.; J. K r ^ m s k y , op. cit. Martinet also considers a tonal typology in addition to accentological typology (p. 156). 12 E.g. N. S. T r u b e t z k o y as early as in his Grundzilge der Phonologie, TCLP 7 Praha 1939, p. 169 seq., and in other authors.
135 syllables and those with morae), but also those where the so-called dynamic stress has to be used in the phonology of the word, as is the case in Russian. 2.4 As against this third type the clear-cut fourth type, having no linguistic relevance of the intonological means, is perfectly clear. We are aware that we are here speaking of a kind of intonologico-typological construct rather than of any concrete language (though examples are sometimes given, e.g. Tamil), which would completely and utterly satisfy the restriction that intonological means (again melodic means first and foremost) are simply not employed at all at the level of the phonology of the sentence (as previously they were not used in the phonology of the word or syllable), and that they may only have the function of delimiting the utterance, if we are not to speak generally of the function of phonically constituting the utterance, or — equally generally — of the function of phonically expressing the degree and nature of emotion. Our main disadvantage here is the lack of accessible systematic works giving a thorough treatment to these languages "without intonation". 3. However, let us return now to our third type to see what possibilities of variation within one of the types there are. We are not interested in differences in the realizations of essentially corresponding intonational systems (e.g. Czech and Russian) where the relation between the individual intonological components (e.g. the placing of pauses, stress peak, and the location and extent of a decisive melodic form, cadence, or realization of a melodeme) is analogous (or binding). What interests us is that the relations between these components are not the same in all languages of this type, nor are the relations of any component to other, non-intonological components. Taking Czech as an example of this type, we may state that 1) by the use of intonational means (in the widest sense of the word) a) the utterance is delimited and organized, b) its validity as to factual meaning is determined, and 2) that the location of the melodic cadence (melodeme) is obligatorily bound to the location of the stress peak (usually the place of the stressed syllable of the core, kernel of the utterance), the scope of this cadence (in our terminology the relevant allomel) being given by the distance of the stress peak from the break realized potentially by a pause.13 It will, however, be possible to apply this generally formulated definition almost universally within this type — we might mention at random Polish or Russian, German and French or Hungarian. u
On this see above all F. D a n e § ' work, Inlonace a vita ve spisovne Ve$tini,_ Praha 1957, or his Sentence Intonation from a Functional Point of View, Word 16, 1960, pp. 34—54, also a number of the present author's works. For the terms melodeme, allomel, see the chapter On the Synonymy and Homoitymy of Means of Intonation in this book, pp. 140.
136
As for the first group of features which we have given, there are certain differences from language to language. Leaving aside the sphere of expressiveness, we may observe that in these languages intonational means serve at the level of factual meaning (1) to express whether an utterance is ended or not, and (2) to express whether a given utterance is a question or not. To take a more detailed look at the way in which the last-mentitmed difference is expressed: it is seen that there is a considerable difference, for fexample, between Czech and Russian on the one hand and German or French on the other. It is true that in all these languages no marked cadence (melodeme) is used in wh-questions since interrogative validity is clearly and chiefly expressed by other non-intonational means, or, that is, an intonational means may be at best redundant or irrelevant as the case may be. In Czech and Russian, however, the intonational means (here again we chiefly have in mind melodic means) are hierarchically highest and unquestionably relevant to the identification of the factual meaning of an utterance as a yes-no question, since no other formal (non-intonational) means is available here (except, that is, for the cases of Russian questions with JIH, pa3Be, etc.). On the other hand, in German or French, where there also unquestionably exist intonational means for indicating the interrogative validity of an utterance, these function alongside other linguistic means, e. g. inversion in German and even special interrogative constructions in French. I would even go so far as to say that the intonational means come lower than the non-intonological means on the scale of all means indicating a question.14 We might in similar fashion also investigate the differences in the form of the means of intonation. At this point we wish at least to draw attention to how the stock of possible melodemes may be affected by the place of wordrstress in this or that language. Thus, for example, Czech with its word-initial stress allowing quite regularly of polysyllabic cadences (alloméis) offers a much more varied stock (inventory) of melodemes than, for example, Polish with its penultimate stress. However, we deal with this problem in a separate chapter. 18 4. In conclusion I should like once more to emphasize that I do not consider intonological typology to be a part of universal typology. The boundaries between intonological types need not, and very frequently do not coincide with the boundaries between the language types of universal typology (founded mainly on morphological features). Very often —- as in the case of the types delimited in, for instance, phonological typology — they cut across the boundaries between the types in universal typology. 14 u
Cf. the study Zum Problem der Fragemelodie in this book, pp. 162. Cf. here On the Synonymy and Homonymy..., pp. 137.
X I I I . ON T H E S Y N O N Y M Y A N D HOMONYMY OF M E A N S OF I N T O N A T I O N
0. The means of intonation in a language comprise a system. The authors who hold this thesis, and I count myself among them, are not always at one as to the definition of the system nor in their opinions as to the way in which the system is realized. However, these differences are not material to our considerations. Using the example of one kind of intonational means, that is melodic means, we shall be mainly looking not at the structure of their whole systems, but rather at the ways in which the individual means are realized, their variability and their homonymy or synonymy. 1. Let us take as the starting-point of our observations and deliberations the situation in languages of the intonological type 1 where melody (the frequencies of the basic vocal tone and their modifications) is exploited as a linguistic device only in the phonology of the sentence. Thus we leave aside those languages where it is used in the phonology of the syllable (in the so-called tonal languages) or in the word (in languages with so-called melodic stress), or where it can function on more than one level. However, even in the languages which interest us here, the modifications in the frequency of the fundamental tone serve not only at the level of factual meaning, but also, and sometimes predominantly, at the level of expression. 2 Furthermore we also find individual modifications where speech realizations are penetrated by modifications or whole melodic forms from other systems (from another language, or from systems of other forms of the same language, e.g. dialects). These interferences are of course also traceable in modifications or restrictions in the functioning of some components of the system, such as we know from other subsidiary language systems. 1 2
Cf. t h e chapter Intonological Typology in this book, p. 131. References to t h e m u l t i p l e function of intonation, t h o u g h formulated w i t h v a r y i n g degrees of gravity, are to be found in a n u m b e r of quite early works, e.g. in M. S c h u b i g e r ' s The Role of Intonation in Spoken English, Cambridge-St. Gall 1935, or P. T r o s t ' s article 0 problemech vllne intonace, SaS 3, 1937, pp. 226 seq.
138 1.1 In the languages of interest to us here the means of intonation (melody) function in the domain of factual meaning (at the level of communication). They serve here as a means of constitution (they form — or better co-form — the sentence, utterance, or as the case may be sentence segment), and primarily as a means of differentiating (they distinguish a finished from an unfinished sentence, and so on). In giving a random selection of such languages — Czech, Polish, Russian, German, French, Hungarian — we are at the same time aware that even with the description of intonation given, these languages do not all exploit the means of melody in quite the same way. This difference is given by the difference in the place of melody in the overall hierarchy of means serving in any given language for the formulation and differentiation of sentences (utterances), moreover not only of phonic means (e.g. the localization of the dynamic peak, the placing of pauses), but also others, e.g. lexico-grammatical means (the use of question words, special forms — e.g. the imperative), word order, etc.3 We are aware of course that in the concrete realization of the individual systems there are frequently substantial differences in the form of the means serving analogical functions, and vice versa — though less often — the same or similar melodic forms have different validity in different languages and occupy different places in the system.4 We might even say that there is a certain kind of inter-language synonymy and homonymy, which is understandably dealt with above all in the domain of comparative lexicology. 1.2 Our attention here will be bound to similar phenomena, though only such as occur in the realization of a single system. Our taking the Czech intonation system as starting-point has a number of reasons. First of all, melody is more heavily laden functionally in Czech than in some of the mentioned languages of similar intonational type where, for example, questions (including those expecting the answer yes or no) are expressed, or co-expressed by non-phonic means (e.g. in German usually by inversion, and by similarly special means essentially in the realm of word order in French or English, or by the use of interrogative particles such as czy in Polish). Furthermore the delimitation of segments of the sentence, whether final or not, is in Czech more frequently and more significantly marked by intonational means than in some other languages (e.g. in German the close of many segments formed by subordinate clause is marked by the position of the finite verb form). Finally, if the characteristic melodic form (in Danes's terminology ca8 4
Cf. Zum Problem der Fragemelodie in this book, pp. 147 seq. We have already drawn attention to this phenomenon, for example, in the study Melodie ruski a ieski vtty, Sovitskd jazykoveda 4, 1954, pp. 207—222.
139 dence; on this term see below) is in the great majority of cases realized beginning with the stressed syllable of the core of the utterance, or at most with the syllable preceding this stress, Czech is also suitable for our analysis, since in Czech, as a language with first syllable stress we meet cadences having different numbers of syllables even in quite neutral passages where the core of the utterance is most frequently represented by the last word (which is the same as, for instance, in Hungarian, but quite different from the case in Polish where the penultimate stress confines these neutral forms to a maximum scope of two syllables). 2.1 In Czech each intonational cadence has (may have) forms differing in the number of syllables. 5 Let us take as an example the melodies of the Czech sentences: Pfijde zitra v pet / vecer / navecer / dopoledne / po jedenade (lit. He will come tomorrow at five / in the evening / towards evening / in the morning / after eleven) pronounced 1) as neutral indicative sentences, 2) as the second type of the yes-or-no question, 6 and to round off, 3) with the melody of warning, 7 that is in sentences which are by no means neutral emotionally but fulfil simultaneously an appellative function (more or less in the sense: He's coming tomorrow at five / .../ and no later; if you don't adapt yourself accordingly you can expect undesirable consequences). The following is a review of the respective melodic forms of the cadences represented schematically: 1 Number of syllables 1. indicative
2
3
\
4
5
V»
"N
2. interrogative
3. warning Pfijde
zitra
r v pit
/
veler
/
naveler
/
dopoledne
/
po
jedendcti
Fig. 1
There is no doubt t h a t the only differences in the meanings of the sentences pronounced with the given cadences in one line are those given by the 5
Cf. K tdnovemu pr&bihu v mluvene (eStini, Praha • B. H61a considers this to be the basic question ieStiny na obecni fonetickem zakladl, Praha 1962, ' Gf. S. P e t f i k , O hudebni strance stfedoieski vlty, K tdnovemu pr&bihu..., pp. 19 seq.; 32 seq. and
1951, passim. form — viz. Uvedenl do fonetikg p. 344 and elsewhere. Praha 1938, pp. 55 seq.; author, elsewhere.
140 differences in the meanings of the lexical units in the final breath group; this apart, the factual meaning is the same. On the basis of analysis and other material we must assume that the functions of the melodic types (cadences —• viz. further) in one line are also the same, and the« that their place in the system and the "meaning" of these cadences will also be the same. We are slightly at a loss as to what term should be used to designate the melodic forms which we are dealing with here. Is a cadence any separate form, or ar6 we to call a cadence that type which is represented by different forms? We are very loath to consider using a new term. However if we wish to designate a melodic type with a clear-cut function, then we ought to select a term adequate to those used for other functions of a linguistic unit, and, moreover, it should be a term allowing of further derivation. We shall attempt here to introduce, at least for working purposes, the term melodeme (in contrast to intoneme, which would be a unit with other properties than merely melodic). Thus we have given examples above of three distinct melodemes having distinct "meanings". It is self-evident that each of them may occur in different variants, the form of which is conditioned by the distance of the stress peak from the end of the sentence. I- consider these to be variants of a melodeme which — once the given melodeme has been selected — are binding in the respective position (for the respective number of syllables). Thus I treat them as dependent positional variants (and it would not be out of the question to call them — in accordance with the usages of the terminological system chosen here — allomels). It is I think evident that among the languages which we have mentioned there is, for instance, a marked difference in the number of variants of the individual melodemes. We find on the one hand a high number in languages with first syllable stress, e.g. Czech, Hungarian, or even German, but also in those with free stress, such as Russian, and on the other hand only a limited number of these variants (allomels) in languages where the stress is bound on the final syllables, e.g. Polish or French (or in these latter languages we find at best an absolute predominance of variants with few syllables, while those with several syllables are quite exceptional). However the differences among these languages are not merely of a quantitative nature. 2.2 Another kind of modification in the course of the melody may occur during the realization of one of the positional variants (allomels). By way of example let us take the polysyllabic variants of the 2nd interrogative form given under 2 in Fig. 2. The form, which is given here as four-syllable and longer, is beyond question the basic form of this variant. 8 8
Cf. K tonovemu priibihu . . . , pp. 39 seq.; also F. D a n e S , Intonace cestint, Praha 1957, pp. 110 seq.
a vita ve
spisovni
141 However, in addition to this form there also sometimes occurs the form where the melodic peak is reached not immediately following the stress but on the next syllable (sometimes, where there is a particularly long final breath group, it may even fall on some other unstressed non-final syllable). Diagramatically :
dopoledne /
po jedendcti
Fig. 2
Moreover there is of course no doubt that the validity of the utterance is in no way changed by interchanging these forms (nor is there any change in the degree or quality of their emotional colouring). Thus again we are dealing with variants of a melodeme, this time not governed positionally but facultatively (or even individually). We might also assess the interrogative intonational forms in Russian in a similar way. Here the melodic peak falls on the stressed syllable of the core of the utterance, then the following unstressed syllables drop with a greater or lesser degree of abruptness without the difference here being connected with any difference having the validity of a melodeme.* These are apparently realizations of a single functional melodic unit, while a concrete realization is polymorphous. I do not think that such variants are employed as stylistic devices. 3. It is quite a different situation where there exist in a language, side by side and in parallel, different cadences (melodemes) having the same factual meaning. 3.1 Let us again use the example of the intonation of the Czech yes-no question, which is already notorious from Czech intonological literature. There are essentially two melodic forms here (for the time being we shall avoid using the term melodeme) which in literary Czech lend an otherwise indefinite utterance (sentence) the validity of a yes-no question. Both formations I (Danes' rising form of anticadence) and I I (according to Danes, the rising falling form) 10 are used very widely and in almost the same range of possibilities. • On this matter see here Zum Problem der Fragemelodie, ruske a ceske vitg, pp. 216 seq. 10 F. DaneS, Intonace a vita..., pp. 110 seq.
p. 147, and also Melodie
142 The following diagrams (Fig. 3) again represent the two formations in. their variants for different numbers of syllables (the text from Fig. 1 may again be fitted here).
s
•
Fig. 3
Leaving aside for the time being the mono- and disyllabic variants, it is clear that the forms with three syllables and more are conspicuously different. Only the pitch of the first syllable is the same and usually also that of the close of the last syllable, while over the remainder the progression is as a rule different (even in the final syllable). The question automatically arises as to what is the relation between these two melodic formations from the point of view of their factual meaning. Are they independent melodemes, or merely variants of a single melodeme? Or again, are they stylistic variants if they are used by the same speakers with stylistic intent, or are they individual or facultative variants (perhaps even dependent on local intonational usage brought by the speaker from his maternal dialect or interdialect)? I do not deny that arguments could be found for any one of these opinions. As has been mentioned there is not even any unity of opinion as to the place of these melodic forms in the intonational system.11 Differences of opinion are apparently motivated precisely by the different usages of the students of this problem for whom that which carries most weight in any evaluation is agreement with the system in their "mother dialects" (in the widest sense of the word). However, I consider that the circumstance that form I is beyond all doubt the form occuring in emotionally neutral yes-no questions in standard speech over the whole territory of the language, while form II is to be found in perfectly neutral questions at most in the area of (central) Bohemia, elsewhere being used only in sentences with a greater or lesser degree of emotional colouring (which is also to be found in the Central Bohemian area), speaks for our evaluating form I as the fundamental unmarked form.12 11 12
Cf. note 6. Our opinion here is I think very close to that of D a n e S in Intonace a vita..., loc. cit., while the opinion of H á l a that we have mentioned is, or so I consider, based
143 There is no doubt that in either case these intonational forms are means having the same factual meaning. However, if we do not confine ourselves merely to the point of view of factual meaning and if we question the differences in their validity on the level of emotional colouring, then we ought to consider the two forms as representing two distinct melodemes. The relation between them — again having regard to the agreement in their factual meaning — might be designated as synonymy. 3.2 This relationship is, in my opinion, far from being the only such among melodic means. We can illustrate it — to take an example from another language — for example, by the relation of synonymy between the two question melodemes in Russian which are nowadays regularly given in descriptions of the system of intonational means in that language.13 At the same time, however, it seems that the rising form is receding to a great degree (is it being gradually restricted to a quite neutral "bookish" type of question utterances?) and the "falling" form (i.e. that with a high rising tone on the stressed syllable and with lower tones on the following syllables — for the most part unstressed) is gaining in importance. 3.3 Returning to the Czech intonation system, we might quote, as will be familiar, still other question forms. In Prague and parts of Central Bohemia we find in the vernacular a melodic form which is even penetrating into colloquial speech and which in form to a degree recalls the "falling" form in Russian.14 This form too is unquestionably the representative of an independent melodeme (let us call it III) which, however, does not belong in the system of the literary language but only to that of vernacular Czech. Here it roughly takes the place occupied by question melodeme II in the literary language, which in turn in the system of vernacular Czech — or at least in its (Central) Bohemian variant — approximately takes the place of literary melodeme exclusively on the consciousness of a Prague native and pays no regard to the extent and limits of the occurrence of the type within the total range of the language. " S. G. B o y a n u s , A Manual of Russian Pronunciation, '1935 (and elsewhere) recorded the "falling" form, but I think we have paid more systematic attention to it in our quoted works of 1954 and 1955. For more recent works cf. Je. A. B r y z g u n o v a , npaKmutecKaa tpOHemuna pyccnozo H3UKa,Moskva 1963, p. 239; J. S k o u m a l K melodii koncového úseku véty v ¿eStiné a o ruStiné, Ceskoslovenská rusistika 15, 1970, pp. 74 seq. 14 There exists a considerable literature on this form. Of the earliest works we may mention at least: L. P e t f í k o v á , Intonace praíské mluvy, CCF 3, 1944—5, pp. 14—19; our article, Melodie (tónovy prübSh) otázky zjiStovacl v hovorové stfední éeStiné, L F 75, 1951, pp. 268—274 and elsewhere; more recently J. S k o u m a l , loe. cit., J. V a c h e k , Dynamika..., pp. 113 seq.
144 I (which in the vernacular appears to be extinct or at least to stand at the very periphery of the system). The realization of melodeme I I I by one of its variants in literary speech is up to a point isomorphic with the use of a non-literary expression or form in a literary context, and its unwitting or deliberate use will be duly so evaluated in any stylistic assessment. 4.1 In comparing question melodemes I and II an 3.1 we left aside the mono- and disyllabic variants. The similarity among the variants (alloméis) having few syllables is quite apparent, especially in the monosyllabic forms. This similarity might be what led to the conjecture that "the rising falling type does not occur at all in monosyllabic breath groups". 15 However, I think that after all there is usually a certain difference in the form of the disyllabic variants (the progression in the unstressed syllable usually differs — with I rising, and with II more frequently level or even slightly falling), and this difference is perceptible. Moreover, utterances are to be encountered having the monosyllabic form where the degree and quality of the emotional colouring can be described as concurrent with question utterances having an incontestable melodeme II in the polysyllabic variant. Thus I think that the monosyllabic (or sometimes the disyllabic) variant is a bearer of both melodeme I and melodeme II, and that the 1 difference (opposition) between these two forms is broken down here. Thus we might say that it is a position of neutralization. 16 4.2 We can of course find cases where the realizations of the two functionally distinct melodemes take, either always or at least in some of their variants, one and the same or a very similar form. I am not thinking here of those cases where one formation (the realization of one melodeme) might have come to have two meanings in the course of development (one such case of polysemy is I think the twin function of the Russian "falling" form which serves as question melodeme and pre-pause melodeme). 17 In paragraph 2.1 we gave under 3 (Fig. 1) variants of the melodeme which together with Petrik we call the "melody of warning". 18 In spite of the fact that this is a melodeme which produces utterances with a considerable degree of emotional colouring, it is firmly integrated in the system of the intonational means of the language (and not only of Czech) with fixed validity (in the plane of factual meaning: 1. terminated sentence, 2. not a yes-no question; in the plane of expression: 3. appeal — warning). 15 15
17 18
F. D a n e S , Irdonace a véla..., p. 49. I feel t h a t Skoumal (op. cit., p. 76) shares a similar opinion. His a r g u m e n t s are based on n e w material s h o w i n g further f a c u l t a t i v e variants. Cf. our. Melodie ruské a ceské vthj, especially p. 219. S. P e t f í k , O hudební stránce..,, pp. 56 seq.
145 In my monograph on the stock of melodic means of Czech19 I gave several "special" cases of melodic forms in wh-questions. One intonational form which we noted among t h e m is a form where what we call 'melodic accentuation' (melodicke vytykani) in non-question terminated sentences is contaminated with a final rise which strengthens — or so we feel — the questioning character of a wh-question by giving it a marked melodic feature of question melodeme I (see examples 105 and 106 in the monograph). Let us take as an example the sentence Proc ji nepozvala'? containing the four-syllable variant of a) the basic melodeme (falling), b) the accentuating melodeme, c) the combined (accentuating + the rise from question melodeme I) melodeme. In diagram form the four-syllable variants of these three melodemes for the final breath group nepozvala will be as follows: a
b
c
Fig. 4
This combined form (melodeme) c) certainly does not belong among the f u n d a m e n t a l intonational means b u t on the contrary stands quite on t h e edge of the system of melodic means in literary Czech (though it is a productive form). When compared with the progression of the warning melody (in Fig. 1) it betrays such similarities t h a t it might be possible to speak of melodic homonymy "(or homotony"). At the same time of course the differences in t h e gramatical structures of sentences and differences of context do not allow of any interchanging of the meaning of an utterance. 5. Using material mostly from a single language, Czech, we have endeavoured to draw attention to problems connected with the form and meaning of intonational (melodic) means. In languages of the same intonological type similar phenomena appear, though not always in t h e same extent. It is self-evident, for example, t h a t in languages such as Polish only monoand disyllabic variants of a melodeme are possible in utterances not having the core shifted forward away from the end of the sentence. This restriction in scope also carried with it considerable restrictions in the number of possible different melodic forms (notwithstanding the fact t h a t the part played b y t h e tonal element in Polish stress is quite considerable). 20 And " K tónovému prábéhu..., p. 42. 20 W. J a s s e m , The Phonology of Polish Stress, Word 15, 1959, pp. 252—269 and elsewhere. Of course we do not agree with the evaluation of stress in Polish as tonal.
146 insofar as other melodic forms do exist (for polysyllabic variants) and do have specialized meanings, then the differences between them are obliterated in the short forms. Thus we might be able to speak of the homonymy (homophony) of these means more frequently than in the case of languages of the type to which Czech belongs. Languages of a quite different intonological type (i.e. tonal languages having melodic stress) certainly demonstrate other relations within their intonational systems. Nevertheless many of the phenomena which we have briefly outlined here are also to be found in them, albeit modified by interferences from the levels at which melody (tonal progression) is applied as a language device.
X I V . ZUM PROBLEM D E R FRAGEMELODIE
0. In disem Aufsatz wird unsere Aufmerksamkeit den Problemen der Melodie des Fragesatzes gewidmet. Wir wollen andere — obwohl in einem anderen Zusammenhang wichtige — Probleme, wie z. B. jenes, ob die Frage zu den Hauptfunktionen der menschlichen Sprache gehört oder nicht, wie es beispielsweise Hermann (Probleme der Frage, 1942) oder Bergsveinsson (Archiv f. vgl. Phon. 7, 16 ff.) einerseits, bzw. Bühler (Sprachtheorie, 1934 u. a.) andererseits beurteilen, außer acht lassen und bloß von der unbestreitbaren Tatsache ausgehen, daß in der Sprache die Frage als besondere Satzkategorie existiert, den Äußerungen anderer Art in gewisser Hinsicht gegenübersteht und im Gegensatz zu diesen durch gewisse spezielle Mittel charakterisiert wird. Unter diesen Mitteln spielen die Intonationsmittel, und unter diesen wieder die Sprechmelodie die bedeutendste Rolle. Wir wollen also v. a. zu entdecken versuchen, wodurch sich diese für die Frage charakteristischen melodischen Mittel auszeichnen, wie ihr Verhältnis zu den Mitteln anderer Art aussieht, bzw. ob diese melodischen Mittel auch in verschiedenen Sprachen gewisse allgemeine Züge aufweisen. Um aber diesem Ziel etwas näher zu kommen, erweist es sich als nötig, unsere Beobachtungen gewissermaßen abzugrenzen. In der deutschen Sprache z. B. wird der Fragesatz durch eine spezielle melodische Form charakterisiert. Gewöhnlich aber nicht durch dieses Mittel ausschließlich. Der eine Satz, wie z. B. Er kommt morgen nachmittags, wird von dem anderen, Kommt er morgen nachmittags?, als neutrale Behauptung von einer neutralen Frage nicht nur durch seine melodische Form, sondern auch (bzw. vor allem) durch ein anderes ausgeprägtes Mittel, d. h. durch die Wortfolgeveränderung, differenziert. Wenn wir auch die Funktion der beiden Mittel abzugrenzen und ihre Hierarchie zu bestimmen versuchen könnten, so wäre es trotzdem unvorteilhaft, ähnliche Fälle zum Ausgangspunkt unserer Beobachtungen zu wählen. Und aus demselben Grund wollen wir von dem Material auch anderer Sprachen, z. B. der englischen, holländischen, polnischen u. a. nicht ausgehen, denn auch in diesen beteiligen sich an der Bestimmung
148 der Fragebedeutung des Satzes gewöhnlich außer den melodischen Mitteln verschiedene Sprachmittel anderer Art, obwohl deren Charakter in den einzelnen Sprachen verschieden ist (neben den Abänderungen der Satzkonstruktion sind es verschiedene Fragepartikel usw.). Auf Schwierigkeiten einer anderen Art stoßen wir bei der Erforschung der Fragesatzmelodie (wie der Satzmelodie überhaupt) in solchen Sprachen, in denen der Tonverlauf nicht nur zur Differenzierung der Satzkategorien dient, sondern wo außerdem die sogenannten Intonationen (im Sinne des musikalischen Akzentes) existieren. Ob es sich schon um die skandinavischen Sprachen oder von den slavischen um die serbokroatische bzw. slovenische, oder um die baltischen Sprachen handelt, so kommt es hier gewöhnlich zur gegenseitigen Infiltration beider melodischer Faktoren, deren Isolation sich beim Erforschen unseres Problems als ziemlich schwierig zeigt. Noch schwieriger ist dann die Isolation und Bestimmung der Form und Funktion der satzmelodischen Mittel in solchen Sprachen, wie es z. B. das Chinesische in seiner Kuo-yü-Form ist, in denen einerseits die Satzkategorieli durch entsprechende Partikeln (z. B. Fragepartikeln) bestimmt werden, andererseits der Tonverlauf als Bestandteil des Tonems im höchsten Grad zur Geltung kommt. Wir werden also zum Ausgangspunkt unserer Beobachtungen die Analyse der Fragesatzmelodie in solchen Sprachen wählen, in denen der Tonverlauf und in diesem Maße kein anderes Sprachmittel zum Unterscheiden der Satzkategorien (in erster Linie der Entscheidungsfrage von anderen Kategorien) dient und wo der Tonverlauf außerdem nur als Ausdruckmittel der Gefühlsfärbung der Äußerung, nie aber als Mittel der Wortphonologie dient. Von den mir zugänglichen Sprachen habe ich zwei, u. zw. das Tschechische und das Russische gewählt, die — obwohl nicht im gleichen Maße und nicht mit gleichen Mitteln — diesen Anforderungen entsprechen, das Tschechische außerdem deshalb, da es sich um meine Muttersprache handelt.
1. DIE MELODIE DES FRAGESATZES IM TSCHECHISCHEN
1.1 Wir wollen unsere Aufmerksamkeit vorerst darauf richten, was für eine Stelle die Fragesatzmelodie im tschechischen Intonationssystem einnimmt. Wie schon an anderen Stellen erwähnt wurde, 1 wird der Tonverlauf in dieser Sprache (a) als sprachliches Mittel, (b) als Mittel der Gefühlsfärbung ausgenützt. Im Bereich (a) wird durch Tonhöhe- und Tonverlaufs1
Vgl. K tönooemu prübihu v mluveni ieitinS, Praha 1951, S. 54f., 74f. u. a.; auch hier Intonological Typology, S. 131.
149 -Veränderungen entweder die Tatsache ausgedrückt, daß es sich um einen abgeschlossenen oder nicht abgeschlossenen Satz (Satzabschnitt, ein Kolon) handelt (Ebene 1), oder wird der Unterschied einer Nichtfrage oder (Entscheidungs-)Frage ausgedrückt (Ebene 2), im Bereich (b) wird eine emotional neutrale Aussage von einer gefühlsgefärbten unterschieden (Ebene 3). Wird der Satz Pfijde zitra odpoledne'i (Kommt er morgen nachmittags?) mit dem melodischen Verlauf ausgesprochen, wie er auf Diagramm Nr. 1 dargestellt wird, 2 so wird er mittels dieses Tonverlaufs in der ersten Ebene als abgeschlossen bestimmt, u. zw. zum Unterschied von demselben, aber mit einer auf Diagr. 2 dargestellten Melodie ausgesprochenen Satz (bzw. Satzabschnitt), nach dem von uns eine Fortsetzung erwartet wird (z. B.: E r k o m m t morgen nachmittags, es wird aber schon zu spät sein). In der Ebene 2 wird dieser abgeschlossene Satz als Fragesatz bestimmt, u. zw. im Gegensatz zu einem sonst gleichlautenden, aber mit dem auf Diagr. 3 dargestellten Melodieverlauf ausgesprochenen Satz, der eine bloße K u n d machung ausdrückt (Er kommt morgen nachmittags). Und endlich in der Ebene 3 wird jener abgeschlossene Fragesatz als neutral von einer anderen Frage unterschieden, die z. B. mit einer auf Diagr. 4 dargestellten Melodie ausgesprochen und durch diese als gefühlsgefärbt charakterisiert wurde. 8
'prijde
tj ho
'neznaf
veau des vorhergehenden Satzteils beginnt und in ihrem Verlauf wiederum bis in die mittlere Lage steigt, u. zw. gewöhnlich konkav, nie konvex. Diese Form kann man aus unserem Schema des Satzes Ui ti to dall (Hat er dir das schon gegeben? — Diagr. 7) ersehen. Wenn der Aussagekern hervorgehoben und der Satz dabei ohne Gefühlsfärbung bleiben soll, zeigt sich die Hervorhebung — begreiflicherweise außer der gewöhnlichen Akzentverstärkung der betonten Silbe des hervorgehobenen Satzgliedes — melodisch nur in einer Vergrößerung der üblichen Intervalle. Die betonte Silbe weist hier nur die Tendenz zu weiteren Herabsetzung, die Schlußsilbe zum weiteren Aufstief (in der einsilbigen Variante handelt es sich bloß um einen größeren Umfang des Steigens). Wenn in einem solchen Fall das wichtigste Wort des Aussagekerns sich nicht am Ende des Satzes, sondern an einer anderen Stelle befindet, so bekommt der ganze mit der betonten Silbe dieses Wortes beginnende Teil des Satzes die beschriebene Tonform (ein mehrsilbiges Allomel). So hat die auf Diagr. 1 dargestellte Frage beim hervorheben des Wortes zitra (morgen) die Gestalt, welche auf Diagr. 8 zu finden ist. Es muß allerdings erwähnt werden, daß diese Form bei der Hervorhebung nur selten vorkommt.
7
8 uj t,i to 'dal
'pfijde
"z/;tro
l?
otpoledne
Wenn man diese Melodie mit der sinkenden Form, die wir als Grundform des ganzen Systems bezeichnet haben, vergleicht, so muß man von den Eigenschaften dieser Frageform den nichtsinkenden Tonverlauf mit einer steigenden Tendenz in der Schlußphase einerseits und die tiefe Stimmlage der betonten (bzw. auch der weiteren, mit Ausnahme der letzten) Silbe mit einer Tendenz nach ihrer weiteren Herabsetzung bei der Akzentverstärkung andererseits als typisch und relevant bezeichnen.
153 Die Verschiedenheit der Züge dieser beiden auf der Ebene 2 entgegengesetzten Formen ist allerdings auf den ersten Blick ersichtlich. Weniger auffallend, doch ganz bestimmt sind die Unterschiede zwischen dieser Frageform und der weiterweisenden Melodie, die auf unserem Diagr. 2 dargestellt wird. Beide Formen weisen eine steigende Tendenz auf — jede ist nämlich auf einer anderen Ebene als merkmalhaltig im Gegensatz zur merkmallosen sinkenden Form anzusehen — trotzdem gibt es einen auffallenden Unterschied im Charakter des Steigens der beiden Melodeme. Die Vorpauseform weist eine Tendenz nach einem konvexen Steigen auf, die unbetonten Silben sind immer um ein kleines Intervall höher als die vorangehenden Silben. Außerdem ist die betonte erste Silbe zwar am tiefsten im ganzen Melodem, doch ist sie nich immer zutiefst im ganzen Satz; diese Tiefe ist gewöhnlich der unmittelbar vor der Betonung vorangehenden Silbe zueigen. Im Vergleich mit dieser Form zeigen sich also bei der Frageform folgende Züge als relevant: das Höhen Verhältnis zwischen ihrer betonten und der vorangehenden unbetonten Silbe, die tiefe Stimmlage in ihrem Anfangsteil und ein ausgeprägtes Steigen am Ende mit konkaver Tendenz. 1.22 Außer der angeführten Frageform wird im Tschechischen noch eine andere, auf einem größeren Teil des tschechischen Sprachgebiets (sogar noch häufiger) vorkommende melodische Frageform (Melodem) angewendet, welche auf unserem Diagramm 4 dargestellt wurde. Nach unserer Meinung wird mit diesem Melodem eine Frage ausgesprochen (u. zw. in einer schriftsprachlichen Äußerung), die von einer schwächeren oder stärkeren Gefühlsfärbung verschiedener Art begleitet wird (die Unterschiede werden sich v. a. in der Größe der Intervalle widerspiegeln). 8 Die betonte Silbe in der dreisilbigen oder längeren Form ist wieder am niedrigsten vom ganzen Satz, aber die nach dieser folgende unbetonte Silbe ist durchschnittlich um eine Quint bis Sext höher, die weiteren Silben dann etwas niedriger. Die zweisilbige Form ist hier der neutralen Frageform ziemlich näher, sie unterscheidet sich aber von ihr durch die Größe der Intervalle einerseits, sehr oft auch durch die Andeutung des Sinkens in der letzten unbetonten Silbe andererseits. Beim Vergleichen der Diagramme 9, welches den Verlauf eines neutral ausgesprochenen Satzes Nekdo priSelt (Ist jemand gekommen?) repräsentiert, und Nr. 10, auf dem der Verlauf desselben Fragesatzes, der aber mit Neugier und Interesse ausgesprochen 8
Es scheint, daß diese Form nur in der Umgangssprache in Mittelböhmen auch in emotional neutralen Äußerungen angewendet werden kann und daß ihre Stelle im melodischen System dieses Interdialekts eine andere Form eingenommen hat (unser Melodem III, vgl. hier S. 143; auch in unserem Aufsatz in Listy filologicke 75, 1951, S. 268ff.).
154 wurde, registriert ist, wird sicher der Unterschied dieser beiden Formen klar ersichtlich werden. Was die einsilbige Form anbelangt, haben wir schon in diesem Buch darauf aufmerksam gemacht (S. 144), daß ihre Ähnlichkeit mit der neutra-
9
10 •n.egdo
'pfijel
'n,egdo
'pfijel
len einsilbigen Form noch größer ist. Es scheint, daß eine einzige Silbe zur Durchführung des ziemlich komplizierten Tonverlaufs des zweiten Melodems nicht genügt. V. a. der abschließende melodische Zug, das Tonsinken, geht hier völlig verloren, sodaß wir sagen konnten, daß es in dieser Position zur Neutralisierung des Gegensatzes zwischen diesen zwei Melodemen gekommen ist.® Wenn in einem Fragesatz nicht das Schlußwort, sondern ein anderer Teil des Aussagekerns hervorgehoben wird, beginnt die ganze Form mit der betonten Silbe dieses Wortes, die folgende Silbe wird da wieder zum melodischen Gipfel dieser Form, die weiteren weisen wieder ein ganz leichtes Sinken auf (welches nur ausnahmsweise und in einer vollkommen eindeutigen Situation unter die mittlere Stimmlage herabsteigen kann). Die Intervalle können da etwas vergrößert werden, aber sonst bewahrt sich die Form alle oben erwähnten Züge des Melodems. Sehen wir aber nach, wie sich diese melodische Form von den übrigen Formen des melodischen Systems unterscheidet. Im Vergleich mit der sinkenden Grundform sind ihre Eigenschaften evident. Die Hauptzüge dieser Form sind in dieser Hinsicht mit denen der neutralen melodischen Form (Melodem I) der Fragesätze gemeinsam: nichtsinkender Charakter, eine tiefe betonte Silbe mit einer weiter sinkenden Tendenz bei Hervorhebung. — Von der neutralen weiterweisenden Form unterscheidet sich diese Form (wieder gemeinsam mit der Frageform I) durch den tiefen Ton der betonten Silbe einesteils, durch das Verhältnis zur Tonhöhe der vorangehenden unbetonten Silbe anderenteils. In dem einsilbigen Allomel weiter noch durch die Tendenz nach einem konkaven Steigen gegenüber dem konvexen vor der Pause. Hiezu kommt noch in dieser zweiten Form ein markantes Intervall zwischen der betonten und der folgenden Silbe einerseits, die Tendenz zum leichten Sinken in allen Schlußsilben (dem leichten Aufstieg in der weiterweisenden Form gegenüber) andererseits. " Vgl. in diesem Buch S. 144.
155 Die Unterschiede zwischen den zwei Frageformen sind meiner Meinung nach klar ersichtlich. Im Vergleich mit der häufig vorkommenden melodischen Form der abgeschlossenen Nichtfragesätze mit Gefühlsfärbung, von welcher wir bisher nicht gesprochen haben, die (ähnlich wie die zweite Frageform) durch eine tiefe betonte und höhere folgende unbetonte Silbe charakterisiert wird, muß man außer eines normal größeren Intervalls zwischen den zwei ersten Silben in der Frage noch die Tatsache betonen, daß im Nichtfragesatz die Schlußsilben bis in die tiefe Lage herabsteigen, wogegen in dem Fragesatz das Sinken leicht ist und sich gewöhnlich in der mittleren Lage bewegt. Man muß also den Unterschied zwischen der Melodie des emotionalen Nichtfragesatzes und des Fragesatzes (Melodem I I ) vor allem in der Größe des Sinkens in den Schlußsilben suchen. Die erwähnten Tonverlaufmerkmale unterscheideil dieses Melodem klar von allen übrigen Melodemen des ganzen tschechischen melodischen Systems in allen drei Ebenen. 1.23 Wir haben schon gesagt, daß bei den Ergänzungsfragen ihre Fragebedeutung schon durch das Fragewort (Pronomen, Adverb) bestimmt wird und daß es also nicht nötig ist, die Melodie als Mittel auszunützen, welches dem Satz erst seine Bedeutung verleiht. Infolgedessen ist der Tonverlauf in einem neutralen Ergänzungsfragesatz wirklich sinkend und in einem gefühlsgefärbten Satz kommen dieselben Formen zur Geltung, welche sonst einen mit Gefühlsfärbung ausgesprochenen Aussage- bzw. B e fehlssatz charakterisieren. Trotzdem sind auch solche Fälle nicht als Ausnahmen anzusehen, in denen der Schlußtakt die Gestalt des Entscheidungsfrage-Melodems I I annimmt, wie z. B . im Satze Copak to dää§'? (Was machst du denn? — Diagr. 11; vgl. mit der neutralen Form, Diagr. 12).
12
11 'tsopak
to 'd,elaf
'tsopak
to
'd,ela:J
Meiner Meinung nach ist es nötig auf zwei Tatsachen aufmerksam zu machen. Erstens wirkt ein so ausgesprochener Satz nicht neutral und man fühlt ihn in einer schriftsprachlichen Äußerung als fremdes Element. E s zeigt sich also, daß die erste Frageform, die man normal als merkmalhaltig ausschließlich in unserer zweiten Ebene ansehen muß, zur merkmalhaltigen auch auf der dritten Ebene wird, wenn sie in einem solchen Satz angewendet wird, wo sie ihre primäre Funktion nicht erfüllen kann (oder wenigstens nicht muß). Dabei, weil sie nicht als normales und automatisiertes
156 Mittel der entsprechenden Stilebene zur Geltung kommt, verleiht sie dem Satz einen anderen stilistischen Wert. Zweitens ist es notwendig, darauf aufmerksam zu machen, daß es nicht möglich ist, hier die zweite (auf der dritten Ebene mekmalhaltige) Frageform normal anzuwenden; wahrscheinlich deshalb, daß sie schon im zweiten, aber auch im dritten Plan funktionell belastet ist. Sollte sie in diesem Fragesatz angewendet werden, so würde sie auf der dritten Ebene mit der melodischen Form konkurrieren, die den emotional gefärbten abgeschlossenen Nichtfragesätzen eigen ist, über welche wir schon gesprochen haben und welche man als melodisch ausgeprägter ansehen muß.10 1.24 Zum Schluß und nur in margine muß noch erwähnt werden, daß in einzelnen tschechischen Mundarten oder Interdialekten noch andere, v. a. auf der dritten Ebene merkmalhaltige Melodeme in den Entscheidungsfragen vorkommen können, aber immer neben der melodischen Fragegrundform, manchmal auch neben der Form II. Wir haben mehrmals auf eine umgangssprachliche Form, die v. a. in Mittelböhmen vorkommt, aufmerksam gemacht, wo die betonte Silbe des Aussagekerns «inen hohen Ton und die folgenden unbetonten ein leichtes Sinken aufweisen,11 ein ähnliches Melodem findet man auch in den schlesischen Mundarten, 14 wogegen in südwestlichen Dialekten Böhmens eine der schriftsprachlichen Grundform ähnliche Form vorkommt, die aber in der letzten unbetonten erhöhten Silbe einen ausgeprägt sinkenden Verlauf (mit gleichzeitiger Dehnung dieser Silbe) aufweist, und anderer mehr. Alle diese Formen sind aber nur als Bestandteile des betreffenden dialektischen Systems anzusehen. Ihre Anwendung in einer schriftsprachlichen Äußerung wirkt fremdartig und könnte nur ausnahmsweise in stark emotional gefärbten Sätzen als ein Aktualisierungsmittel angewendet werden. 1.3. Man könnte unsere Ausführungen über die tschechische Fragemelodie folgendermaßen zusammenfassen: Im Tschechischen wird der Fragesatz (d. h. Entscheidungsfrage) mittels spezieller melodischer Mittel charakterisiert, welche, mit dem sogenannten Aussagekern verbunden sind.13 Als ihre gemeinsamen relevanten Züge müssen die tiefe Tonlage der betonten Silbe und ein markant steigendes 10
Als einen Ausnahmefall muß man die Anwendung der Entscheidungsfrage-Melodeme bei einer Rückfrage ansehen, wenn die Frage die grammatisch-lexikalische Form einer Ergänzungsfrage bewahrt. 11 Vgl. Anm. 8. 12 Vgl. S. P e t f i k , Zur Satzintonation der mährisch-schlesischen Mundarten, Slavia 17, S. 511 u. a.; auch M. R o m p o r t i , Pfizouk, kvantita a melodie u näfed na Jablunkovsku, Opava 1954, S. 35f., Zvukovä strdnkn souvislf Mi v nüfecich na TiSlnsku, Ostrava 1958, S. 73 u. a. " V g l . v. a. bei D a n e S , op. cit., S. 28f. u. a.
157 Element im Verlauf des Melodems angesehen werden. Die Stellung und Realisierung dieses steigenden Elements unterscheidet zwei automatisierte melodische Formen voneinander (Frage-Melodem I und II — im M. I steht es am Ende, im M. II am Anfang). Während die erste Form von allen anderen Formen markant differenziert wird, unterscheidet sich die zweite (in emotional gefärbten Fragen) durch ein leichtes Schlußsinken erstens von der emotionalen Form des abgeschlossenen Nichtfragesatzes (mit starkem Sinken), zweitens von der neutralen Vorpauseform (mit leichtem Steigen). Eine Ausnahme bilden da die einsilbigen Formen, die in den beiden Frage-Melodemen nicht differenziert werden (wo man von einer Neutralisierung sprechen könnte). Die absolute Tonhöhe und das absolute Tonintervall sind als nicht typisch anzusehen; bloß bei der zweiten Form könnte man von einer Tendenz zum Quint- bis Sextsprung zwischen der ersten und zweiten Silbe der Form sprechen. Als notwendige Bedingung, daß der mit einer der melodischen Formen ausgesprochene Satz wirklich als Frage begriffen werden kann, muß eine Situation anwesend sein, die die Fragebedeutung des Satzes nicht ausschließt. Ausnahmsweise kann eine eindeutige Situation einem Satz ohne Fragemelodie den Charakter der Frage verleihen.
2. DIE MELODIE DES FRAGESATZES IM RUSSISCHEN
2.1. Auch diesmal wird es nötig sein sich zuerst klar zu machen, was für eine Stelle die Melodie des Fragesatzes im Intonationssystem des Russischen einnimmt. Im Aufbau des Systems wird da kein wesentlicher Unterschied im Vergleich mit dem Tschechischen sein — wir haben ja auch deshalb diese Sprachen zum Ausgangspunkt unserer Beobachtungen gewählt. 14 Auch in dieser Sprache werden also durch die melodischen Mittel (a) die Unterschiede (1) in der Abgeschlossenheit und Unabgeschlossenheit des Satzes, (2) in seiner Entscheidungsfragebedeutung und Nichtfragebedeutung, (b) gleich wie (3) in seiner Gefühlsfärbung ausgedrückt. Trotzdem kann man da auch gewisse Unterschiede zwischen beiden Systemen entdecken. Eine relativ unbedeutende Differenz wird darin bestehen, daß zu den „Nichtfragesätzen", d. h. zu den Sätzen, deren Bedeutung in erster Reihe mittels anderer als melodischer Mittel bestimmt wird, außer den Ergänzungsfragesätzen auch solche Entscheidungsfragen zugefügt werden müssen, deren Fragebedeutung durch die Partikel AU, pa3«e 14
Aus ähnlichem Grund wie hier in der Studie Inlonological beide Sprachen zum 3. Typ gerechnet werden.
Typology,
S. 131, wo
158 ausgedrückt wird. Im gesprochenen Russisch kommen sie ziemlich selten, überwiegend in der negativen Form vor. 16 Einen weit größeren Unterschied könnte man darin sehen, daß es im Russischen keine besonders ausgeprägte Mittel gibt, welche dem unabgeschlossenen Satz (dem Vorpausekolon) eigen sind. Größtenteils nähern sie sich den Formen der Entscheidungsfrage oder stimmen, sogar mit diesen überein. Die größte Differenz besteht aber in der Realisierung des Systems selbst. Als neutrale, auf allen drei Ebenen merkmallose Form (Melodem) muß man hier eine ähnlich wie im Tschechischen als sinkend bezeichnete Form ansehen. Wir führen als Beispiel dieser Form den Satz OHU zoeopvuiu o Bacujiuu HeaHoeme (Sie haben über Vasilij Ivanovitsch gesprochen. — Diagr. 13) an.
ä'n,i
7
gdva'r,llj
ä
vä's,ll,J}i
f1 v a n a v, /" tßj
Bei der Analyse einer größeren Anzahl von Belegen würden wir wieder zum Schluß kommen, daß die Melodie des Satzanfangs zwar gewisse Tendenzen aufweisen kann, daß sie aber für die Bestimmung der Satzkategorie ohne Bedeutung bleibt und in einzelnen Fällen verschieden sein kann; als relevant muß man auch hier wieder die mit dem Aussagekern verbundene Melodie des Schlußteils des Satzes ansehen. Diesmal breitet sich aber — und zwar deshalb, da die russische Betonung nicht an die erste Silbe wie im Tschechischen gebunden, sondern frei ist — die relevante Form (das Melodem) nicht immer über das ganze Schlußwort aus, sondern nur von seiner betonten Silbe bis zum Satzschluß. Wenn ein anderes als das letzte Wort hervorgehoben wird, so breitet sich wieder die ganze Form von seiner betonten Silbe bis zum Satzende aus. In unserem Beispiel ist also die Form viersilbig. Wie man daraus ersehen kann, hat die betonte Silbe einen von der mittleren in die tiefe Stimmlage sinkenden Verlauf, die folgenden unbetonten Silben sind eben und verbleiben in der tiefen Lage. Bei der Hervorhebung eines Wortes wird nur das Intervall des Sinkens der betonten Silbe vergrößert, sodaß diese manchmal schon in der hohen Stimmlage anfangen muß. 2.2 Die Melodie des russischen Fragesatzes ist von dieser merkmallosen melodischen Form verschieden. Ähnlich wie im Tschechischen gibt es auch 16
Ähnliche Fragen könnten ausnahmsweise auch im Tschechischen vorkommen, sie hätten aber eher einen exklamativen Charakter. Ihre melodische Form stimmt dann mit deren der Nichtfragesätze überein.
159 hier zwei funktionelle melodische Formen (Melodeme) der Frage; was aber die Abgrenzung ihrer Funktion und ihr gegenseitiges Verhältnis auf der Ebene der Gefühlsfärbung anbelangt, wage ich es nicht, irgendwelche von ihnen als merkmallos bzw. merkmalhaltig zu bezeichnen. Beide kommen nämlich sowohl in neutralen, als auch — gewöhnlich mit einer gewissen Vergrößerung der üblichen Intervalle — in emotional gefärbten Sätzen vor, obwohl die Form, welche wir als zweite bezeichnen werden, häufiger als die erste in neutralen Sätzen vorkommt. 2.21 Dieser erste Typus (russisches Melodem I) wird gewöhnlich als steigend bezeichnet. Wir finden ihn in den Sätzen Bbi udeme? (Sie gehen?.— Diagr. 14) bzw. im Satze Bbi enojiHe yeepeHW? (Sind Sie völlig überzeugt? — Diagr. 15), wo das Wort enonue (völlig) hervorgehoben wird. Im Vergleich
15
14
yf
T'd,ot,i
vi
fpäl'n.e
u,v,er,in+
mit den unabgeschlossenen Nichtfragesätzen ist hier ein ausgeprägt steigender Charakter ersichtlich, u. zw. sowohl im ganzen Verlauf der funktionellen melodischen Form, als auch im Verlauf einzelner Silben, vor allem der Schlußsilben. Dieser steigende Charakter, der auch in der einsilbigen Form (Allonjel) bewahrt bleibt, ist als Hauptmerkmal dieser Form auf der zweiten Ebene anzusehen. Im Russischen kommt aber auch in einem abgeschlossenen Nichtfragesatz, der von einer Gefühlsfärbung begleitet ist, eine steigende Form vor, die auf den ersten Blick dieser Frageform sehr ähnlich ist.16 Beim näheren Vergleichen beider Formen kann man aber einwandfrei festeilen, daß der steigende Verlauf in der Frage weit markanter ist, so daß die Melodie manchmal bis in die hohe Stimmzone steigt, wogegen im Aussagesatz das Steigen in der tiefen, höchstens in der mittleren Zone durchgeführt wird.17 Außerdem weisen die Schlußsilben — wie schon erwähnt — eine steigende Tendenz auf. Diesen ausgeprägt steigenden Charakter muß man meiner Meinung nach für die Frageform im Vergleich mit der emotionalen Nichtfrageform für relevant halten. Demgegenüber finden wir beim Vergleichen dieses Melodems mit der gewöhnlichen Form im weiterweisenden Takt vor der Pause keine solchen " S. C. B o y a n u s hält im Buche A Manual of Russian Pronunciation, 1 1935, '1944 beide Formen für einen einzigen Typus. " Vgl. Nr. 23, 25, 26 einer- und Nr. 34—40 andererseits in unserem Aufsatz Melodie ruski a öesk£ vity, SovStskä jazykovSda 4, 1954, S. 207—222.
160
Unterschiede, so daß z. B. die angeführten Beispiele nicht nur eine Frage, sondern auch ein Vorpausekolon repräsentieren können. Es scheint, daß hier nur — oder wenigstens vor allem — der Kontext und die Situation dem Satz (Satzabschnitt) die entsprechende Bedeutung verleihen (was z. B. im Tschechischen nur ausnahmsweise vorkommt). 2.22 Die zweite Frageform, welche im Russischen häufig vorkommt, wurde von den Autoren sehr lange außer acht gelassen. Es muß Boyanus als Verdienst zugeschrieben werden, daß er auf diese Form aufmerksam gemacht hat und ihre Hauptzüge an einigen Stellen beschrieben hat. 18 Es hat sich jedoch als nötig erwiesen, einige seiner Beobachtungen noch zu präzisieren. Diese Form wird dadurch gekennzeichnet, daß die betonte Silbe im Aussagekern einen hohen Ton aufweist und ihr Verlauf steigend ist. Nach Boyanus sind die folgenden Silben tief und bewahren ihren ebenen Verlauf bis zum Schluß des Satzes wie es aus dem Verlauf der letzten Silbe des Satzes Bu cneuiume? (Sie eilen? — Diagr. 16) ersichtlich ist. Unsere Beobachtungen zeigen aber, daß in den Fragen der Verlauf der letzten Silben gewöhnlich anders ist, daß die unbetonten Silben öfters als Teile der sinkenden Linie auftreten, die in einer längeren Form (im mehrsilbigen Allomel) bis in die tiefe Lage hinabsteigt. Die angeführte Frage wird also wahrscheinlich öfters in der Weise ausgesprochen, wie Diagramm 17 zeigt.
vi
s p j ' f i t j
vi
spj'fit,J
Als eine weitere Besonderheit dieser Melodie muß man die Tatsache ansehen, daß ihre relevante Form (Melodem) nicht immer mit der betonten Silbe des letzten Wortes im Satz beginnt, sondern sich näher zum Anfang des Satzes, gewöhnlich auf die betonte Silbe der bestimmten Verbalform verschiebt, wie z. B. im Satze Ecmb y eac npueMHUK? (Haben Sie einen Empfänger? — Diagr. 18).
'jes,t, 18
Vgl. A Manual\
u ,vos
prj^'omnik
S. 62; Proceedings London, S. llOf.
161
Der Unterschied zwischen dieser und der ersten Frageform ist ganz klar. Eine gewisse Ähnlichkeit beider Melodeme kann man bloß in ihrer einsilbigen Realisation finden, wo in beiden Fällen die Schlußsilben einen steigenden Verlauf aufweisen, wo es aber eine Differenz in deren Höhe gibt: in der ersten Form ist sie tief, in der zweiten hoch. Die Höhe und gleichzeitig der steigende Verlauf der betonten Silbe der zweiten Form sind als ihre relevanten Züge im Vergleich mit der merkmallosen Nichtfrageform anzusehen, denn der Verlauf und auch die Höhe der folgenden unbetonten Silben können gleich sein. Wie schon erwähnt wurde, stimmt diese Form mit einer der weiterweisenden Formen überein und es gilt also für diese Form im großen und ganzen dasselbe, was über die erste Form gesagt wurde. 19 2.3 Für das Russische sind wir zu folgenden Schlußfolgerungen gekommen : Ein Satz, der durch keine anderen Sprachmittel als Frage bestimmt wird, wird mit Hilfe spezieller melodischer Mittel als Fragesatz charakterisiert. Diese Mittel sind gewöhnlich mit dem Schlußwort, das dem Aussagekern angehört, bzw. mit der bestimmten Verbalform verbunden. Ausschließlich die Melodie des Satzteils von der betonten Silbe zum Satzende (das Melodem) ist als relevant anzusehen. Im Gegensatz zur merkmallosen Form des abgeschlossenen Nichtfragesatzes muß man die Fragemelodie als merkmalhaltig ansehen. Sie wird sich von jener durch ein markant steigendes Elements, welches in den beiden häufigsten melodischen Formen der Fragemelodie vorkommt, unterscheiden. Die zweite Form wird außerdem durch den hohen Ton der steigenden betonten Silbe unterschieden. Von der emotionellen Nichtfrageform unterscheidet sich die zweite Form ganz klar, die erste durch ein markantes Schlußsteigen. Es scheint, daß das Vorpausekolon keine ausgeprägte eigene Melodieform besitzt, die ausschließlich ihm eigen wäre. Das Kolon wird als Frage oder Vorpausekolon wahrscheinlich vor allem aus der Situation und aus dem Kontext entsprechend begriffen. Auch in dieser Sprache sind die absolute Tonhöhe und das absolute Intervall als nicht relevant anzusehen. 3. SCHLUßBEMERKUNGEN
Wir haben die Hauptzüge der Fragesatzmelodie in zwei Sprachen kurz behandelt. Auf Grund dieser kurzen Übersicht wollen wir jetzt versuchen, zu einigen Fragen allgemeineren Charakters zu übergehen. Diese Ähnlichkeit k a n n m a n auch den Belegen aus dem Buch J e . A. B r y z g u n o v a , IIpaKmuHecKa.H0onemuKa u mimoHaifua pyccnoeo .i3UKa, Moskva 1963, entnehmen.
162 3.1 Der Charakter einer Frage kann dem Satz durch verschiedene Mittel verliehen werden. In den Sprachen, über die wir gesprochen haben, sowie auch in anderen kann man fast allgemein drei Kategorien dieser Mittel feststellen: a) die Situation (bzw. den Kontext), b) verschiedene grammatisch-lexikalische Mittel (d. h. Inversion, Anwendung der Fragewörter bzw. Fragepartikel usw.), c) die Fragemelodie. Man könnte nach der Hierarchie dieser Mittel fragen. Ihre wechselseitige Beziehung ist nicht gleich und ist in den einzelnen Sprachen verschieden. Das erste von diesen Mitteln, die Situation, wirkt nur ausnahmsweise allein; öfters, wenn sie wenigstens neutral ist, ermöglicht oder sogar unterstützt sie die Möglichkeit, daß die übrigen zwei Mittel überhaupt völlig zur Geltung kommen können. Wenn die Situation nicht entsprechend oder sogar widersprechend ist, so kann der Satz — sei er schon von einem Fragewort eingeleitet oder mit einer Fragemelodie versehen — keine Frage werden, sondern z. B. ein Ausrufsatz. In den zwei Sprachen, in den wir die Fragemelodie untersucht haben, ist das Verhältnis beider weiterer Mittel fast ausgeglichen. Durch die Anwendung des Fragewortes oder der Partikel ist die Anwendung der melodischen Frageform normal ausgeschlossen. Wenn sie trotzdem angewendet wird, ändert sich die Gefühlsfärbung des Satzes. Dies ist aber nicht in allen Sprachen der Fall. In mehreren, wie z. B. in der deutschen, schließen die lexikalisch-grammatischen Mittel (z. B. die Inversion) die Anwendung der Fragemelodie nicht aus, im Gegenteil, beide unterstützen sich einander. Man könnte von gleichzeitiger Relevanz beider Mittel sprechen.20 Dies gilt aber nicht allgemein. Für die deutschen Ergänzungsfragen ist die Nichtfragemelodie charakteristisch. In diesem Falle sind die lexikalischen Mittel den melodischen auch im Deutschen übergeordnet. 3.2 In gegebenen, begreiflicherweise in einzelnen Sprachen mehr oder weniger verschiedenen Umständen kommt also die Melodie als ein wichtiger, dem Satze die Fragebedeutung verleihender Faktor zur Geltung. Das Vergleichen der melodischen Mittel zweier Sprachen hat uns gezeigt, daß diese (obwohl es sich um verwandte Sprachen mit einer ähnlichen Struktur des melodischen Systems handelt) nicht gleich sind, wenn sie auch verschiedene gemeinsame Züge, wie z. B. die Anwendung des steigenden Elements ist, aufweisen. Beim Vergleichen mit anderen Sprachen entdecken wir noch größere Unterschiede. Ich bin überzeugt, daß es unmöglich ist (aber gleichzeitig auch unnütz), die allgemeinen Züge der Fragemelodie zu suchen. Der Charakter der MeM
Vgl. die Relevanz mehrerer Komponenten z. B. im Ganzen eines distinktiven Merkmals (distinctive feature) — in diesem Buch S. 18 f.
163 lodie des Fragesatzes wird in jeder beliebigen Sprache, in welcher eine funktionelle Fragemelodie existiert, durch ihre Stellung im melodischen System dieser Sprache, durch ihr Verhältnis zur merkmallosen Nichtfragemelodie und begreiflicherweise durch die Möglichkeit und Notwendigkeit der Differenzierung der Mitglieder des melodischen Systems (der Melodeme) gegeben. Die Möglichkeiten der Verallgemeinerung werden auch von Karcevskij in seiner beachtenswerten, doch an mehreren Stellen diskutablen Studie in TCLP 4 meiner Ansicht nach überschätzt.21 Führen wir wenigstens ein Beispiel an. Auf S. 202f. vergleicht er einige französische und russische Fragesätze. Außer der Tatsache, daß er die Wichtigkeit der Intervalle im allgemeinen überschätzt und (v. a. im Französischen) die Bedeutung der Situation unterschätzt, beachtet er ungenügend die verschiedene Stellung der Melodie der Fragesätze im ganzen Intonationssystem beider Sprachen. Außerdem scheint es mir, daß er ein so wichtiges Element übersehen hat, wie es im Russischen der Tonverlauf der betonten Silbe einer funktionell belasteten melodischen Form (des Melodems) ist. In seinen Beispielen Tu zomoe? (Bist du fertig?), sowie auch 3decb OHCL? (Ist sie da?) ist in beiden Fällen, welche (nach Karcevskijs Beschreibung) mit unserer zweiten Fragemelodie ausgesprochen worden sind, die betonte Silbe steigend. Obwohl — auf den ersten Blick — der Verlauf beideT Sätze verschieden ist, u. zw. im ersten Fall steigend, im zweiten sinkend, gehören sie beide zu demselben melodischen Typus, denn der Verlauf der unbetonten Silben ist für die Bedeutung des Satzes irrelevant. Sollten da beide Sätze als Aussagesätze identifiziert werden, so müßten ihre betonten Silben einen ausgeprägt sinkenden Verlauf aufweisen und könnten dann nie (außer in einer eindeutigen „Fragesituation") als Fragen begriffen werden. Es ist also klar, daß der Verlauf der von Karcevskij angeführten französischen und russischen Fragesätze aus ganz verschiedenen Gründen ähnlich sein kann. 3.3 Schließlich halte ich es von Nutzen, noch einmal zu betonen, daß in einer Sprache auch mehrere Frageintonationsformen (Fragemelodeme) nebeneinander bestehen können, u. zw. aus dem einfachen Grunde, daß jede Form mehr als von einer Funktion belastet werden kann und daß sie nicht nur als Merkmal der Fragegeltung des Satzes (auf Ebene 2), sondern auch seiner Gefühlsfärbung bzw. seiner Neutralität (Ebene 3) anzusehen ist.
a
S. Karcevskij, Sur la phonologie de la phrase, TCLP 4, Praha 1931, S. 188ff.
164 SUMMARY
THE QUESTION OF THE MELODY OF THE INTERROGATIVE SENTENCE In the majority of languages, sentence melody, in addition to grammatical and lexical devices and to situation, which is in a sense superior to all these other items, serves as an aid to distinguishing yes-and-no questions from other categories of sentences. The interrelations between these various means vary from language to language. The difference between languages (even between related languages) also lies in the character and form of the tonal devices used to give a sentence the meaning of a question. For the relevant features depend on the position of the melodic form in the intonational system of the language, on functional sentence perspective, the relation between melodic and dynamic features, etc. Question melody forms may differ from language to language while having the same validity, and on the contrary there may be concurrence of forms having different validities. These theses are demonstrated primarily on the intonational devices of Czech and Russian.
XV. S P R E C H M E L O D I E UND ANDERE
SATZPHONETISCHE
MITTEL IN D E R
HOCHLAUTUNG
0. Die Grundsätze, nach welchen die Hochlautung, Orthoepie, normiert wird, sind in einzelnen Sprachen verschieden. Trotzdem könnte man gewisse Grundsätze für allgemeingültig bzw. für die verbreitesten halten. Ich bin der Ansicht, daß man als einen dieser Grundsätze allgemeineren Charakters das Prinzip ansehen könnte, daß vor allem die Aussprache bzw. die Lautung derjenigen phonetischen Elemente normiert wird, die zum Aufbau der Silben und Wörter bzw. Wortformen ausgenützt werden, also u. a. die Aussprache der Realisierungen der Glieder des phonologischen (genauer: phonematischen) Systems der Sprache. Es handelt sich nicht nur um eine Normierung der Grundvarianten einzelner Glieder des Systems, sondern es wird öfters in verschiedenen Sprachen auch die Aussprache anderer, z. B. ausgesprochen positionsbedingter Varianten normiert. So wird im Tschechischen außer der alveolaren Grundvariante des Phonems /n/ auch die velare Positionsvariante desselben Phonems vor den velaren Verschlußlauten, im Deutschen die Aussprache beider Varianten des Phonems /x/, als Ich- und Ach-Laut, im Russischen nicht nur z. B. beide Varianten des vokalischen Phonems /i/ — d. h, [i] und [i], sondern gewissermaßen auch verschiedene weitere positionsbedingte Variationen einzelner Vokale in der Nachbarschaft verschiedener Konsonanten normiert. 0.1 Von den in den erwähnten Sprachebenen ausgenützten phonetischen Elementen werden aber nicht alle allgemein und in demselben Maße normiert. Es ist klar, daß in den Sprachen vor allem und fast ohne Ausnahme die phonetische Gestalt der Laute und die Grundsätze ihrer Bewahrung oder Umwandlung in Lautkombinationen geregelt werden. Aber weniger oft (und sicher nicht allgemein) wird eine normierte Form der sog. prosodischen Eigenschaften vorgeschrieben, d. h. vor allem der Quantität, die sog. dynamische oder melodische Betonung usw. Wenn die Qualitäten auch dieser Elemente in einigen Sprachen normiert werden, so handelt es sich überwiegend um solche Sprachen, in denen diese prosodischen Eigenschaf-
166 ten funktionell sind, d. h. wo sie in der phonematischen Ebene als Sprachmittel ausgenützt werden. In diesem Sinn werden z. B. die deutsche und tschechische Vokalquantität, die russische Wortbetonung, die serbokroatische oder schwedische melodische Betonung, die Intonationen, wenn man von den sog. Tonsprachen, wie z. B. vom Chinesischen nicht sprechen will, in der Sprache ausgenützt, und diese Mittel haben in den betreffenden Sprachen auch ihre im großen ganzen normierte Form. Damit will ich nicht sagen, daß die Aussprache dieser Elemente in anderen Sprachen, in denen sie nicht mit einer phonematischen Funktion belastet sind, nicht normiert werden kann. Zum Beispiel existiert im Tschechischen eine Norm der Wortbetonung, deren Funktion nicht phonematisch, sondern delimitativ ist. 0.2 Ist aber die Aussprachenorm dieser prosodischen Elemente in den Sprachen festgesetzt und kodifiziert, so handelt es sich öfter nur um eine Bestimmung ihrer Ausnützung, ihres Vorkommens — es wird z. B. vorgeschrieben, welche Silbe lang, betont usw. ausgesprochen werden soll — als um eine Normierung der phonetischen Gestalt dieser prosodischen Eigenschaften. So wird in den Sprachen mit der funktionellen (phonematischen) Quantität meistens geregelt, welche der Silben kurz und welche lang sind, gewöhnlich aber nicht, wodurch die Länge von der Kürze unterschieden wird, d. h. in welchem Verhältnis die Länge zu der Kürze steht, ob da auch gewisse Begleitmerkmale, z. B. Unterschiede in der Tonhöhe, im Tonverlauf, im Lauttimbre usw. vorhanden sind und wie sie sind. In den Sprachen mit dem funktionellen Akzent wird wieder bestimmt, auf welcher Silbe die Betonung beruht, gewöhnlich aber nicht, ob die Betonung bloß durch die Stärke der Tonsilbe charakterisiert wird, oder ob auch (wie meistens) das Verhältnis zwischen der Stärke der betonten und der unbetonten Silbe wichtig ist, ob weitere Begleiteigenschaften — Quantität, Tonhöhe, Lauttimber — vorhanden sind oder nicht. In Sprachen mit Tonakzent sollte es sich außer um die Feststellung, ob die Silbe entweder betont oder unbetont, weiterhin ob die betonte steigend oder sinkend ist, darum handeln, wie der Charakter dieses Steigens, bzw. Sinkens ist, ob gewisse Begleiteigenschaften mitspielen. 1. Die phonischen Elemente nehmen in den Sprachen nicht nur an dem Aufbau niedrigerer Einheiten, Silben, Wörter, bzw. Betonungstakte, sondern auch in ziemlich großem Maße an dem Aufbau höherer Einheiten, des Sprechtakts (Satzabschnitts, Kolons), des Ausspruchs usw. teil. Es ist in diesem Zusammenhang nicht entscheidend, ob die phonischen Elemente als bedeutungsunterscheidende oder bloß als delimitative oder andere Mittel dienen. Ich will im folgenden nur zeigen, daß auch die Realisierung
167 dieser Mittel größtenteils eine normierte Form aufweisen kann, obwohl diese gewöhnlich in den Sprachen bisher nicht kodifiziert wurde. 1.1 Im großen ganzen kann man voraussetzen, daß von den vier Eigenschaften des Schalls, der Höhe, Stärke, Farbe und Dauer, in jeder höheren Sprachebene als relevante Elemente eines prosodischen Merkmals vor allem die ausgenützt werden, die in keiner der niedrigeren Ebenen als Sprachmittel dienen, oder daß sie nur in den Bestandteilen genutzt werden, deren Anwendung in keiner der niedrigeren Ebenen gekreuzt wird. Dabei können die satzphonetischen Elemente als Mittel der Bedeutungsunterscheidung (die Melodie kann z. B. einzelne Satzarten von einander unterscheiden), als delimitative Mittel (die Pause kann beispielsweise den Sprechtakt abgrenzen), oder als Mittel zum Ausdrücken der Gefühlsfärbung, u. zw. entweder in der Apell- oder Kundgabeebene (z. B. verschiedene kleinere Abänderungen des Lauttimbres) gebraucht werden. Es ist begreiflich, daß die Lauttimbreabänderungen in den höheren Sprachebenen am seltensten und nur ausnahmsweise vorkommen, da sie in den Sprachen meistens schon im phonematischen Plan am vollkommensten verwendet werden. Führen wir ein Beispiel zur Illustration an: Im Tschechischen ist die Labialisierung, die Rundung der Vokale, nicht als phonologisch relevante Eigenschaft anzusehen, wie es im Deutschen der Fall ist, d. h. den tschechischen Vokalpaaren i — u, e — o, bzw. i: — u:, e: — o: stehen im Deutschen immer drei Vokale, d. h. i — ü — u, e — ö — o, bzw. i: —- ü: — u:, e: — ö: — o: gegenüber. Es ist im Tschechischen also nicht unmöglich, daß ausgeprägtes Lippenrunden als Mittel einer emotionellen Färbung ausgenützt wird, entweder — mit niedrigerem Sprechton — bei Ärger, Abneigung, als Mittel der Intensivierung, 1 oder — ohne diesen Ton — z. B. in schmeichelhafter Rede. Meiner Ansicht nach ist dieses Mittel im Deutschen nicht gang und gäbe, wenigstens nicht in allen Positionen, denn die Interferenz der funktionellen Labialität, die in der phonematischen Ebene ausgenützt ist, wäre zu stark.
1.2 Ob und in welchem Maße auch die anderen Eigenschaften des Schalles in den Oberbauebenen, also auch in der Ebene der Satzphonetik und -phonologie in Frage kommen, hängt ebenfalls gewöhnlich von ihrer Ausnützung in den Grundebenen ab. Diesen in dem Mittel dominierenden Eigenschaften entsprechend könnte man die bedeutendsten dieser satzphonetischen Mittel in drei Gruppen einteilen, und zwar in 1. Ton-, 2. dynamische und 3. quantitative Mittel. 1.21 Unter der Bezeichnung „Tonmittel" wird man solche Mittel verstehen, die in erster Reihe (im höchsten Element des Ganzen des Mittels) durch die Grundtonhöhe und ihre Umwandlungen charakterisiert werden und die u. a. in der Sprechmelodie zum Vorschein kommen. Die Tonmittel können sich wiederum am meisten in solchen Sprachen 1
Vgl. S. P e t f i k , 0 hudebnl strdnce stredoceski vity, 1938, S. 15111.
168 geltend machen* in denen das Tonelement in keiner der niedrigeren Ebenen von einer Funktion belastet ist, also weder in den Tonsprachen (z. B. dem Chinesischen, Vietnamischen) noch in anderen Sprachen mit dem sog. Tonakzent (z. B. dem Schwedischen, Norwegischen, Serbokroatischen, Slowenischen, Litauischen, Lettischen usw.). Doch auch in den Tonakzentsprachen kommt die Melodie öfters als Satzbau-und bedeutungsunterscheidendes Mittel zur Geltung, wenn z. B. Fragen von Aussagen, abgeschlossene von unabgeschlossenen Sätzen melodisch unterschieden werden. Es handelt sich da vor allem um jene Tonverlaufsteile, die in der phonematischen Ebene unausgenützt geblieben sind, d. h. vor allem um die Tonhöhenfolge in den unakzentuierten Silben.2 Begreiflicherweise wird nicht einmal in den Nichtttonsprachen die Sprechmelodie in gleichem Maße als Sprachmittel in der satzphonetischen (bzw. -phonologischen) Ebene gebraucht. Es hängt begreiflicherweise davon ab, wie in der betreffenden Sprache die Bedeutung des Satzes auch mit Anwendung anderer als phonetischer Mittel bestimmt wird und wie die Hierarchie dieser phonetischen, d .h. u. a. der melodischen, und nichtphonetischen, u. a. lexikalisch-grammatischen Mittel aussieht. 3 1.22 Unter den „dynamischen Mitteln" wird man solche Mittel verstehen, wo in der Hierarchie aller Komponenten das Element der Intensität am höchsten steht, d. h. vor allem die Verteilung und das gegenseitige Verhältnis der (sog. dynamischen) Akzente in dem Ausspruch bzw. schon im Satzabschnitt, sowie den gesamten dynamischen Verlauf im Ausspruch verstehen. Es ist klar, daß man in der Satzphonetik mit dem Wortakzent als mit einer schon gegebenen Tatsache rechnen muß und daß die Satzdynamik auf diesem wortdynamischen Untergrund gebaut werden muß. Die Umstellung der Wortbetonung — wenn sie als satzphonetisches Mittel dienen soll, d. h. z. B. als Mittel der Gefühlsfärbung — ist begreiflicherweise zusammen mit Umwandlungen der Stärke und der gesamten dynamischen Linie des Satzes in den Sprachen mit ausgeprägt nichtphonematischer Betonung, z. B. dem Tschechischen oder Polnischen, eher möglich als in Sprachen, wo der Akzent gewissermaßen schon von einer Sprachfunktion, obwohl manchmal nur als Mittel auf dem Übergang von der delimitativen zur phonematischen Funktion, belastet ist, wie im Deutschen, 4 oder wo die Betonung ganz klar phonematische Funktion hat wie z. B. im Russischen. Damit soll nicht gesagt werden, daß es in solchen Sprachen zu ' V g l . z. B. I. M a h n k e n - J. M a t e ä i c , Akzentoppositionen Dialekten..., Proceedings Prague, S. 593ff.
in den
serbokroatischen
Vgl. dazu hier Zum Problem der Fragemelodie, S. 162. VgJ. gleichlautende Wörter mit trennbaren und untrennbaren Vorsilben (z. B. übersetzen), oder mit Anlaut- und schwebender Betonung (z. B. steinreich). 4
169 keiner ähnlichen Akzentverschiebung kommen kann, doch die Frequenz dieser Verschiebung ist dabei ziemlich gering. 1.23 Was die Mittel des quantitativen Typus anbelangt, so versteht man darunter nicht nur die Abwandlungen der Lautdauer, sondern auch weitere Mittel, die durch Abänderungen im Zeitverlauf charakterisiert werden. E s gehören hierher auch das Sprechtempo und die Sprechpausen. Unter Sprechtempo als Sprachmittel wird man Abänderungen der Geschwindigkeit beim Aussprechen innerhalb eines Ausspruchs verstehen, d. h. das sog. Sachtempo, nicht die Verschiedenheiten des Personentempos. Die Pause wird zwar gewöhnlich im Gegensatz zu anderen phonischen Mitteln als Abwesenheit des Tons (Schalls) charakterisiert, für ihre Klassifizierung ist aber ihre Dauer am bedeutendsten, obwohl wir uns bewußt sind, daß außer ihr auch andere Eigenschaften mitspielen können (vgl. 1.31). Was die Modifizierungen der Vokallänge anbelangt, so machen sie sich gewöhnlich als satzphonetische Mittel erst dann geltend, wenn in der Sprache keine phonematische Quantität vorkommt. So wird z. B . die Abänderung der Vokaldauer viel mehr in der polnischen Satzphonetik benutzt, wo die Vokalquantität nicht phonologisch ist, als z. B . in der deutschen oder tschechischen Phonetik, in der letzteren noch viel weniger als in der ersteren. Denn der Gegensatz der Vokallänge und -kürze kommt im Tschechischen in allen Positionen zur Geltung, wogegen er im Deutschen in den unbetonten Silben abgeschwächt, in den offenen Schlußsilben sogar aufgehoben wird. 1.3 Das Wesen der satzphonetischen Elemente (die meistens als Mittel in einer der obenangeführten Oberbauebenen ausgenützt werden) ist nicht immer ganz einfach. 1.31 Der älteren Meinung gegenüber, daß jedes der satzphonetischen Elemente (Mittel) ähnlich wie die prosodischen Eigenschaften überhaupt bloß durch einen Zug, durch eine Eigenschaft, die dann als relevant anzusehen ist, charakterisiert wird, ist es heutzutage klar, daß gewöhnlich jedes dieser satzphonetischen Mittel (ähnlich wie fast jedes distinktive Merkmal auf der phonematischen Ebene) 5 durch ein ganzes Bündel (Menge) dieser Züge unterschieden wird. Unserer Ansicht nach bildet erst die ganze Summe (geordnete Menge) dieser Züge den relevanten Zug. So wird im Tschechischen die Pause als Mittel der Gliederung und Abgrenzung des Satzabschnitts bzw. Ausspruchs (bzw. der Äußerung) nicht bloß durch die Dauer der Schallabwesenheit bestimmt, sondern auch durch die Anwesenheit der funktionellen melodischen Form (des Melodems, der ' Vgl. hier On (he Phonic Analysis of Language, S. 21 f.
170 Kadenz) 6 bzw. durch eine Quantitätsmodifizierung der Schlußsilbe. Man darf nicht einmal solche Fälle ausscheiden, wo (z. B. im Tschechischen) eine Schallabsenz (d. h. die Pause im traditionellen Sinne des Wortes) überhaupt fehlt und trotzdem als Gliederungsmittel einer bestimmten Kategorie erfaßt wird und auch gewertet wird. Weitere Bestandteile ersetzen, supplieren da die Absenz des Schalls. Doch trotzdem ist die Dauer der Schallabwesenheit in der Hierarchie der die Pause bestimmenden Züge als die erste anzusehen, die anderen werden dieser untergeordnet. 1.32 Einzelne Sprachen stimmen aber nicht darin überein, wie die Struktur und Hierarchie einzelner Bestandteile eines jeden satzphonetischen Mittels, ähnlich wie die Struktur der Mittel in den niedrigeren Ebenen aussieht. So kann man sagen, daß bei der Wertung des Gegensatzes „akzentuiert — unakzentuiert" im tschechischen Akzent gleich wie im deutschen die Stärke, Intensität, in der Hierarchie der Züge als der erste, höchste Zug hervortritt, gewissermaßen (nach gewissen Grundzügen der Beziehung zu der Satzmelodie) sich auch die Tonhöhe als ein wichtiger Begleitzug geltend macht. Man kann nicht weitere Züge ausschließen, die werden v. a. im Tschechischen wahrscheinlich nur als irrelevante Züge mitspielen. Dagegen im Deutschen muß man noch einzelne Vokaldauer- und -timber-Verschiedenheiten der betonten und unbetonten Silben dazurechnen. Beiden Sprachen gegenüber ist der Inhalt der russischen Betonung viel reicher und weist nicht nur ausgeprägte Stärke- und Quantitätsunterschiede auf, sondern auch bekannte Unterschiede im Timbre der Vokale und größere Tonunterschiede, d. h. volle Tonentwicklung in den betonten und rudimentäre in den unbetonten Silben. Als der höchste (oder einer der zwei höchsten) in der Hierarchie der Bestandteile der russischen Betonung wird wieder die Stärke, d. h. der große Stärkeunterschied zwischen der betonten und unbetonten Silbe, angesehen. Dabei wird in allen diesen drei Sprachen die Betonung als dynamisch bezeichnet.7 2. Gehen wir aber nun dazu über, was man für das zentrale Problem dieses Kapitels halten könnte: Kann man überhaupt diese satzphonetischen Elemente (Mittel) vom Standpunkt der Orthoepie, der Hochlautung, betrachten? Ist dies möglich, welche der Formen dieser Mittel soll man dann • Zum Terminus Melodem vgl. hier S. 140 u. a., zum Terminus Kadenz bei F. D a n e S , Inlonace a vita ve spisovni CeStinS, S. 35f. u. a. ' Von diesen Verschiedenheiten hängt die schlechte Erfassung einzelner prosodischer und satzphonetischer Elemente einer Sprache durch Fremde ab. So erscheint z. B. die lange unbetonte silbe im Tschechischen den Russen und gewöhnlich auch den Deutschen als betont. Im Tschechischen ist die Länge von der Betonung unabhängig, im Russischen ist sie immer nur ein Begleitmerkami des Akzents, im Deutschen kommt sie meist nur in akzentuierten Silben vor.
171 als orthoepisch, hochsprachlich, beurteilen und welche nicht? Ist es überhaupt möglich, irgendeine Norm in diesem Bereich zu entdecken und sogar zu regeln, zu kodifizieren? 2.1 W i e schon erwähnt, sind wir der Ansicht, daß auch für die Formen der Realisierung der satzphonetischen Mittel in den Sprachen eine Norm besteht, obwohl sie gewöhnlich nicht kodifiziert ist oder ihre Kodifizierung nicht geplant wird. Ich bin überzeugt, daß man in jeder beliebigen Sprache (die eine standardisierte, Literatur- bzw. Hochsprache-Form besitzt) keine mündliche Äußerung für hochsprachlich halten könnte, wenn darin der orthoepischen Aussprache der Laute und ihrer Kombinationen eine Intonation oder andere satzphonetische Mittel mit Spuren eines ausgeprägt mundartlichen oder sogar vulgären Ursprungs entspricht. Gewöhnlich kann man einige satzphonetische Elemente ohne großes Überlegen und ohne Analyse als orthoepisch und andere als nicht orthoepisch bezeichnen. Consensus omnium läßt in solchen Fällen keine andere Klassifizierung zu. Ich will ein Beispiel aus dem Tschechischen anführen, welches wir auch anderswo erwähnen: 8 Wenn wir den tschechischen Satz Prijde zitra odpoledne mit einer sinkenden Melodie aussprechen, so bekommen wir einen neutralen Aussagesatz: Er kommt morgen nachmittag. (Vg, 1. c. Abb. 3) Wollen wir diesen Satz in einen Fragesatz umwandeln, bekommt die Melodie — bei demselben Satzbau und Wortfolge — eine andere Form. Die Frage K o m m t er morgen nachmittag? kann man in Prag in dreierlei Form hören: Prijde zitra odpolednet mit der Intonation im letzten W o r t (1) — — ~ (1. c. Abb. 1), oder (2) _L_ — — _ (1. c. Abb. 4), oder (3) — _ _ _ . Die beiden ersten Formen sind ohne Zweifel schriftsprachlich, die erste kommt — wie gesagt — seltener vor und ist völlig neutral, die zweite hört man (v. a. in Mittelböhmen) etwas öfter, auch in den Fragen mit schwächerer Gefühlsfärbung. 9 Die dritte Form dagegen ist ohne Zweifel nicht hochsprachlich, obwohl die Häufigkeit ihres Vorkommens in Prag, besonders in den Kreisen der Jugend, ziemlich groß ist, und zwar in umgangssprachlichen Äußerungen. Ihre Übertragung in eine sonst schriftsprachliche Äußerung hat eine stilistische Herabsetzung dieser Äußerung zur Folge. Auch in dieser Hinsicht ist die Situation in den einzelnen Sprachen nicht gleich. Wenn man z. B. die Sachlage im Deutschen mit der in anderen Sprachen beispielsweise im Tschechischen vergleicht, so ist sie hier zweifelsohne viel komplizierter. Die Unterschiede zwischen den einzelnen Mundarten sind auch im Punkte der Intonation beträchtlich groß und kommen begreiflicherweise auch in den schriftsprachlichen Äußerungen zum Ausdruck. Vgl. hier Zum Problem der Fragemelodie, S. 149 f. » Vgl. hier S. 142 u. a.
3
172 Doch auch hier, wie v. a. von Essen gezeigt hat, 10 kann man zu dem Schluß kommen, daß auch für das Deutsche ein hochsprachlicher Intonationsusus existiert. Ich möchte es wagen, vorauszusetzen, daß auch im Deutschen ganzes schriftsprachliches Intonationssystem existiert. 2.2 Manchmal reicht aber die bloße Übereinstimmung nicht aus. Gibt es überhaupt Kriterien für die Bestimmung, welche Formen welcher satzphonetischen Mittel orthoepisch sind und welche nicht? Auch diesmal muß man betonen, daß die Situation in jeder Sprache sui generis ist, doch den Grundsatz, daß man von dem Usus ausgehen soll und einzelne Formen analysieren und werten muß, könnte man als das führende Prinzip bezeichnen, das fast allgemein anwendbar sein kann. Wenn man jede Form, z. B. die Melodie, die in einer gesprochenen Äußerung vorkommt, danach beurteilen wird, a) ob sie für alle Benutzer der Schriftsprache eindeutig verständlich ist, b) ob sie von diesen Benutzern oder wenigstens von einem Teil von ihnen nicht als mundartlich oder auf eine andere Weise unschriftsprachlich empfunden wird, so kann man durch Eliminieren der nicht eindeutigen und mundartlichen Formen eine Gruppe solcher Formen isolieren, die gewöhnlich den Grund des Systems bilden und die man für orthoepisch halten könnte. Es ist nicht ausgeschlossen, daß dieser Grund des Systems der hochsprachlichen satzphonetischen Mittel Dubletten aufweist. Es kann geschehen, daß für dieselbe Funktion zwei Varianten eines satzphonetischen Mittels, z. B. der Intonation, dienen können. Jede dieser Varianten kann z. B. nur in einem Gebiet angewendet werden, doch beide werden von allen Sprechern übereinstimmend als hochsprachlich beurteilt, mit gleicher Funktion und ohne mundartliche Färbung. So hat z. B. jene schon erwähnte erste Form der Melodie der Entscheidungsfrage im Tschechischen im großen ganzen zwei Varianten, von denen die angeführte Form eher in Böhmen verbreitet ist, die weitere mit einem ausgeprägteren Tonsteigen in den letzten Silben mehr in Mähren vorkommt. Beide Varianten werden jedoch eindeutig im ganzen Sprachgebiet als hochsprachlich und mit derselben Funktion erfaßt. 11 Es könnte zu dem außergewöhnlichen Fall kommen, daß man mit einer Eliminierungsmethode alle satzphonetischen bzw. alle melodischen Formen ausscheiden würde. Das könnte geschehen, wenn in einer Sprache zwei verschiedene Intonationssysteme nebeneinander existieren, in denen z. B. das Verhältnis der Melodik und Dynamik fast umgekehrt sein kann. Ich meine ungefähr eine solche Situation, zu der man bei der Lösung dieser Probleme " V g l . z. B. O. v o n E s s e n , Hochdeutsche
Satzmelodie,
ders., Grundzüge der hochdeutschen Salzintonation, 11
ZPSK 9, 1956, S. 75—85;
Ratingen b. D. 1956.
Beide Varianten registriert auch D a n e S , Intonace a vlta...,
S. 53.
173 im Deutschen gelangen könnte, wenn man die zwei lange diskutierten Intonationssysteme, das alemanische oder schwäbische, nicht richtig auch als oberdeutsch bezeichnete, und das Intonationssystem des übrigen deutschen Sprachraums als gleichwertig ansehen würde. Sollten beide Intonationstypen in den schriftsprachlichen Äußerungen konsequent angewendet werden, so bliebe nichts anderes übrig, als möglichst genaue Grenzen zwischen den beiden Systemen zu ziehen und innerhalb dieser Grenzen nach den erwähnten Grundsätzen für jeden Typus neutrale und hochsprachliche Formen ihrer Realisierung zu bestimmen. Ich bin aber der Meinung, da es nicht einmal im Deutschen zu dieser Situation gekommen ist, daß sich nur der eine dieser Typen, und zwar der sog. niederdeutsche, mit dem Grundverhältnis „akzentuiert : hoch" und „unakzentuiert : tief" in der neutralen Aussage, und nicht der sog. schwäbische, wo ein Verhältnis „akzentuiert : tief" und ,unakzentuiert : hoch' gelten sollte, in der Hochlautung durchgesetzt hat. Die „schwäbischen' Formen würden dann als mundartlich und infolgedessen als nicht orthoepisch angesehen. 3. Wir sind also von der Voraussetzung ausgegangen, daß die satzphonetischen Formen, die den Grund des Systems bilden und die zur Norm ihrer phonischen Realisierung werden können, gewöhnlich im Sprachusus aller Benutzer der gesprochenen Schriftsprache enthalten sind. Jene Formen, oder wenigstens die Mehrzahl jener Formen, die als mundartlich oder besser als nicht-hochsprachlich anzusehen sind, sind darüber hinaus gleichfalls im Usus der Sprecher enthalten. 3.1 Unter diesen Umständen würde die Kodifizierung der satzphonetischen Hochlautung (d. h. hauptsächlich der Intonationsnorm) u. a. eine Aufzählung, eventuell eine Bestimmung der schriftsprachlichen Formen und ein Verbot oder eine Aufforderung zum Meiden der unorthoepischen Formen bedeuten. So einfach stehen die Dinge allerdings nicht. Wir wollen nicht über den Extremfall sprechen, wenn ein vollkommen abweichendes System in einem Teil des Sprachgebiets, z. B. das .schwäbische' System dem hochsprachlichen gegenüber existiert. Die Sprecher dieses Gebiets müßten eigentlich alle orthoepischen Formen beherrschen lernen oder wenigstens — was aber noch schwerer sein dürfte — die phonetisch verwandten Formen ihres eigenen Usus mit der abweichenden Funktion der ähnlichen hochsprachlichen Melodieform zu koordinieren versuchen. Aber auch anderswo kann es dazu kommen, daß im Usus des Sprechers eine der hochsprachlichen völlig entsprechende Form fehlt. 3.2 Hier könnte man fragen, auf welche Weise man z. B. die melodischen Formen aufzeichnen soll, damit der zukünftige Benutzer eindeutig erfassen
174 kann, wie Form und Funktion jedes einzelnen satzphonetischen Mittels sein sollen. 3.21 Wir sind also zum Problem des Fixierens der satzphonetischen Elemente gekommen. Wenn man auf das geschriebene Wort angewiesen ist, so wird sich das Problem darauf beschränken, was man Problem der satzphonetischen Transkription bezeichnen kann, die der phonetischen Lautschrift analog sein sollte. Als Grund sollte da eine Wortbeschreibung, eine Erklärung dienen, für die Aufzeichnung einzelner Formen und Beispiele wäre aber ein „Transkriptionssystem" nötig. Ohne Zweifel richtet sich die Wahl einer möglichst einfachen Transkription nach den Verhältnissen in der Satzphonetik jeder einzelnen Sprache. In einer Sprache, in der man in der Intonation bloß mit vier relevanten und zwar relativen Tonhöhen und mit deren gegenseitigen Kombinationsmöglichkeiten als sprachlichem Mittel rechnen kann, wäre es möglich, die einfache Pikesche Zifferntranskription anzuwenden: 1 — der höchste, 4 — der tiefste Ton, 0 vor der Zahl — betonte Silbe.12 Wo man aber mit der Tonbewegung innerhalb der Silbe, d. h. dem Steigen oder Sinken, oder sogar mit dem Charakter dieser Tonbewegung, z. B. der Konkavität oder Konvexität, als mit relevanten Zügen rechnen muß, wird diese einfache Transkription nicht ausreichen, und man muß eine Art der graphischen Aufzeichnung mit Strichen innerhalb eines die relativen Stimmzonen bezeichnenden Liniensystems anwenden. Es wäre sicher nicht ohne Nutzen, den Versuch einer gewissen Normierung der satzphonetischen Transkription im internationalen Maßstab zu untersuchen. 18 3.22 Wenn man in das Stadium einer offiziellen Kodifizierung der Aussprachenorm der satzphonetischen Mittel gelangen soll, so wäre es nicht ohne Bedeutung, die Möglichkeit der Fixierung musterhafter Realisierungen in der Form einer beigefügten Tonaufnahme, gleichgültig ob Schallplatte oder Tonband, zu überprüfen. Man müßte außer den Grundtypen der satzphonetischen Mittel (u. zw. wahrscheinlich z. B. nicht nur der Melodeme, sondern auch ihre Varianten, Allomele) auch gewisse Beispiele ihrer Anwendung im Kontext fixieren. Ich würde eine solche Aufnahme aber nicht für die einzig mögliche Lösung halten, im Gegenteil, ich bin der Ansicht, daß sie sich erst in der Kombination mit Wortbeschreibung und Transkription völlig geltend machen kann. Erst dann kann sie zu einem äußerst instruktiven und allen verständlichen Mittel werden. 4. Wie ersichtlich nehmen wir keine pessimistische Stellung zur Mög" K. L. P i k e , The Intonation of American English, Ann Arbor 1946. " Zur Transkriptionsfrage vgl. in P. R. L é o n - Ph. M a r t i n , Prolégomènes à l'Étude des Structures Intonatives, Montréal—Paris—Bruxelles 1969, S. 26ff.
175 lichkeit der Kodifizierung und dabei auch der Aufzeichnung der satzphonetischen Mittel ein. Man könnte sich noch mit der Problematik der Norm der satzphonetischen Mittel in der Bühnenaussprache auseinandersetzen. Diese Problematik würde aber schon die Grenzen unseres Problemkreises sprengen, da sie mehr mit der Problematik der Theorie der Bühnensprache überhaupt zusammenhängt. 14 Zum Schluß wollen wir also die Hauptgedanken resümieren: In den meisten Sprachen existiert eine Aussprachenorm auch für die satzphonetischen Mittel, u. a. für die Sprechmelodie, die Satzdynamik, für die Gliederung der Rede mit Pausen, gewissermaßen auch für das Sprechtempo. Eine Äußerung, deren satzphonetische Gestalt von der schriftsprachlichen Form abweicht, verliert gewöhnlich ihren hochsprachigen Charakter. Diese Norm ist in der ganzen Breite gewöhnlich noch nicht kodifiziert, aber ihre Kodifizierung ist grundsätzlich möglich. Die satzphonetischen Erscheinungen dienen gewöhnlich als Sprachmittel. Obwohl ihre Funktion in jeder einzelnen Sprache verschieden sein kann, kann man sagen, daß sie — und vor allem die Intonation (Melodie) — eine bedeutende Rolle sowohl in der Ebene der Darstellung des Sachverhalts als auch in der Apell- und Kundgabeebene spielen. Die satzphonetischen Mittel bilden gewöhnlich ein System. SUMMARY
SENTENCE MELODY AND OTHER INTO NATIO NAL DEVICES IN ORTHOEPY In most languages there exists a standard for the literary pronunciation of sentential phonic devices, i. e. speech melody, dynamics, segmentation by pauses, and to a degree tempo. A speech made in a phonic form that departs from the literary standard will usually lose its literary character. No such standard has as yet been codified, though in principle such codification is possible. Phonetic phenomena at the level of sentence are usually devices of the language. Although their function may vary in different languages, it can be safely asserted that they fulfil a significant role both at the level of meaning (this is particularly true of intonation) and at the levels of appeal and expression. Very often these devices make up a system. M
Vgl. z. B. unseren Aufsatz Zur Theorie der Bühnensprache, Theatralia II, AUCPhilosophica et Histórica, Praha 1971, S. 7f.
X V I . ZUM V E R G L E I C H E N D E N S T U D I U M DER SATZPHONETIK
0. Die verhältnismäßig große Anzahl von Arbeiten, die bis heute und vor allem in den letzten Jahrzehnten den Fragen der Phonetik und Phonologie der zusammenhängenden Rede, darunter v. a. der Satzphonetik verschiedener Sprachen gewidmet wurde, läßt vermuten, daß man heutzutage an die Lösung der Probleme der vergleichenden Satzphonetik (und -phonologie) mit größerer Aussischt auf Erfolg gehen kann, als es früher möglich war. Wir wollen hier einige Gedanken zur Möglichkeit und Richtung der weiteren Forschung auf diesem Gebiet ganz kurz darstellen. Vorerst wird es hier nicht ohne Nutzen sein, einige terminologische Anmerkungen zu machen. Wenn hier von satzphonetischen Elementen gesprochen wird, so werden damit solche Elemente gemeint, die nicht nur an der Bildung des Satzes (bzw. der Aussage) teilnehmen, sondern die sich gewissermaßen schon an dem Konstituieren anderer, einfacherer Einheiten der gesprochenen Sprache (Rede), z. B. des Satzabschnitts (Kolon), des Betonungstaktes bzw. schon der Silbe, beteiligen (oder beteiligen können) und in verschiedenen Sprachen auch in verschiedenem Maß ausgenützt und funktionelle belastet werden (also ähnlich wie hier im Kapitel Sprechmelodie und andere satzphonetische Mittel in der Hochlautung, S. 165). In der bisherigen Literatur spricht man öfter von den prosodischen Eigenschaften bzw. Elementen, 1 von der Intonation im weitesten Sinne des Wortes, 2 von den Modulationen der zusammenhängende Rede (den Sprechmodulationen). 3 1
Z. B. in der Mehrzahl der phonologischen Literatur (vgl. bei T r u b e t z k o y , Grundzüge der Phonologie, TCLP 7, 1939, S. 166f., v. a. 198f. u. a.). 2 Sehr oft z. B. in den sowjetischen Arbeiten, aber auch beim tschechischen Linguisten S. P e t f i k (der aber auch von der „musikalischen" Seite des Satzes spricht: vgl. 0 hudebni strdnce stredoceske vity, Praha 1938 u. a.), ähnlich auch bei F. D a n e 5, Iritonace a vSla ve spisovne cestint, 1957. • V o r allem in der Prager phonetischen Schule, v. a. bei B. H ä l a , z. B. Üvod do fonetiky, Praha 1948 u. a.
177
1. Unter dem vergleichenden Studium der Satzphonetik kann man verstehen: a) Das vergleichende Studium der satzphonetischen Sprachmittel und ihrer Systeme in einzelnen — auch nicht verwandten — Sprachen in ihrem gegenwärtigen Stand (d. h. das konfrontative bzw. kontrastive Studium). b) Einen Versuch, die Entwicklung dieser Mittel in einer Sprache zu entdecken bzw. auf Grund der Ähnlichkeit, sowie auch der Unterschiede dieser Entwicklung, in einzelnen verwandten Sprachen den älteren Stand zu rekonstruieren. Von beiden Aufgaben ist die erste (die Konfrontation) in größerem Maße und mit geringeren Schwierigkeiten als die zweite (die Komparation) lösbar. Jedenfalls muß als Ausgangspunkt das Studium dieser Mittel in einzelnen Sprachen in ihrer gegenwärtigen Form dienen. 1.1 Es wird also nötig sein, vorerst eine ausführliche und präzise Analyse der satzphonetischen Elemente und Mittel in jeder der in Betracht kommenden Sprachen, u. zw. wie von phonetischen, so auch vom phonologischen Standpunkt durchzuführen. 1.11 Damit soll nicht gesagt werden, daß man bei dieser Untersuchung den phonetischen mit dem phonologischen Standpunkt vermischen oder sogar verwechseln soll. Ich bin aber überzeugt davon, daß man, zum Unterschied von der Analyse des Laut- bzw. Phonem-Inventars, resp. -Systems einer Sprache, wobei man z. B. eine rein phonetische, den phonologischen Standpunkt nicht respektierende Analyse dieser Erscheinungen noch heutzutage gewissermaßen zulassen könnte, 4 eine im engeren Sinne des Wortes phonetische Untersuchung der Satzmodulationen, sowie jede Klassifizierung dieser einzelnen Erscheinungen ohne Rücksicht auf ihre sprachliche Funktion mit Erfolg nicht durchführen kann, oder daß eine solche Untersuchung vollkommen unnütz wäre. 1.12 Man kann die phonetische Feststellung, daß z. B. für das tschechische lange e [e:] das akustische Spektrum nach Häla zwei (bzw. drei) Formantenzonen aufweist, die für diesen Laut typisch sind (u. zw. 1630—1860 Hz, 450—590 Hz, bzw. auch 1900—2500 Hz), 6 als sehr wichtig und relativ definitiv ansehen, ohne dabei die Stellung dieses Lauts im phonologischen System berücksichtigt zu haben. Dagegen eine präzise Beschreibung z. B. des Tonverlaufs im tschechischen Satz Dal ti tu knihul (Hat er dir das Buch gegeben?) kann für uns überhaupt keinen Wert haben, und wir wür* Dagegen sollte meiner Ansicht nach eine phonologische Analyse (wenn es sich nicht um eine deskriptive Phonologie handelt) gewisse Ergebnisse der phonetischen — darunter meine ich selbstverständlich auch der (mikro) akustischen — Untersuchungen nie außer acht lassen. »Vgl. z. B. B. H ä l a Akustickd podslata samohldsek, Praha 1941, S. 2173. u. a.
178 den nur zu völlig konfusen Schlüssen kommen, wenn wir uns nicht dessen bewußt wären, 1. daß es sich um einen Entscheidungsfragesatz handelt, 2. daß für diese Sätze ausschließlich die Melodie des letzten Teils des Satzes, der mit der betonten Silbe des Aussagekerns anfängt, (d. h. der Kadenz, des Melodems) charakteristisch und typisch ist, 3. daß dieser Tonverlauf nur im Vergleich mit dem Tonverlauf aller anderer Satzarten als typisch angesehen werden kann. Auf Grund dieses Vergleichens können also z. B. einerseits einzelne phonetische Züge dieser melodischen Formen als phonologisch relevant oder irrelevant (bzw. redundant) beurteilt werden, andererseits werden die einzelnen melodischen Formen nur deshalb als phonetische Erscheinungen phonetisch untersucht und klassifiziert, da sie als Realisationen der Elemente eines satzphonologischen Systems anzusehen sind. 1.21 Von diesem Standpunkt betrachtet, zeigen sich einige der zahlreichen bisherigen Analysen der satzphonetischen Elemente in einzelnen Sprachen als diesen beiden Anforderungen nicht völlig entsprechend. Manche der Linguisten, die zwar das Funktionnieren, das Ausnützen einzelner phonischer Elemente in der Sprache richtig analysiert und bewertet haben, waren nicht immer imstande, ihr phonetisches Wesen genau zu entdecken. Dies wäre kein so großer Fehler gewesen, wenn es sich bloß um verschiedene Varianten (sog. phonetische Varianten) einer und derselben Form mit derselben Sprachfunktion handeln sollte. Sie identifizierten und vermischten aber auch formell ähnliche Formen mit verschiedener Funktion und waren dann nicht fähig, die phonetische Gestalt eines Zuges, der als relevanter Zug eines phonischen Mittels (bzw. eines prosodischen Merkmals) anzusehen war, festzustellen. Infolgedessen war es ihnen manchmal unmöglich, das gesamte satzphonetische Teilsystem zu erfassen. So berücksichtigt z. B. Petrlk in seiner schon erwähnten beachtenswerten und sonst durch relativ präzise Beschreibungen einzelner phonischer Formen hervorragenden Arbeit über die „musikalische" Seite des (mittel) tschechischen Satzes nicht immer den Tonverlauf innerhalb der Silbe, der im Tschechischen manchmal als relevanter Zug einzelner Melodeme (z. B. in der Ebene der Gefühlsfärbung) anzusehen ist. Deshalb kommt er dann in Verlegenheit, wenn er zwei sehr ähnliche, doch nicht identische Melodeme im tschechischen Ergänzungsfragesatz mit diametral verschiedenen Funktionen voneinander sondern soll.6 An einer anderen Stelle (S. 163) haben wir darauf aufmerksam gemacht, daß die Nichtbeachtung der Relevanz des Tonverlaufs in der betonten Silbe (im Aussagekern) im Russischen Karcevskij an einigen Stellen seiner 6
Vgl. näheres beim Verf., K tönovimu u. a.
prüblhu v mluverie öe&tini, Praha 1951, S. 43
179 bahnbrechenden Arbeit in TCLP 4 7 zu einigen Fehlern geführt hat, die dann zu Fehlschlüssen bei der Feststellung der allgemeinen Züge der Frageintonation führen. 1.22 Manche Forscher auf diesem Gebiet dagegen, die imstande waren, die einzelnen satzphonetischen Formen sogar mit einer erstaunlichen Genauigkeit zu beschreiben, konnten entweder überhaupt nicht, oder nur in beschränktem Maße und manchmal nicht ganz richtig bewerten, wie und wieweit diese Mittel auch als Sprachmittel ausgenützt werden, welche ihrer Züge als relevant anzusehen sind und welche nicht, und in welcher Sprachebene sie ausgenützt werden. Z. B. gibt das für die tschechische Phonetik sehr wichtige Werk von J . Chlumsky über die tschechische Vokallänge, Akzent und Melodie8 zwar wertvolles (obwohl bei weitem nicht komplettes) Material zum Studieren der tschechischen Satzmelodie, doch man findet keine linguistische Bewertung seiner Beobachtungen. So bleibt diese Arbeit eine Sammlung von Rohmaterial, welches erst durch gleichzeitige satzphonetische und -phonologische Analyse gewertet werden muß. Das bekannte, für die Entwicklung der Untersuchungen auf dem Gebiet der Satzphonetik sicher wichtige Werk von S. Bergsveinsson 9 analysiert phonometrisch (leider •— wie schon mehrere Besprechungen betont haben — unter Anwendung eines zu beschränkten Materials) einzelne satzphonetische Elemente des Isländischen, wobei er auf sehr wichtige Beziehungen zwischen einzelnen Elementen aufmerksam macht, aber die Belehrung, die man da über ihre Verwendung als Sprachmittel findet (vor allem was den Aufbau und die Bedeutung des Satzes anlangt), ist nur sehr bescheiden. — Auch der Verfasser muß gestehen, daß er gewissen Mängeln dieses Typus nicht einmal in einigen seiner älterer Arbeiten (z. B. K tönovemu prübehu ...) auszuweichen wußte. 10 1.3 Wenn man schon die bisher angeführten Forderungen annimt, so halte ich noch eine andere Forderung für selbstverständlich: vor der satzphonetischen Analyse die Untersuchung der phonetischen (phonischen) Seite jeder betreifenden Sprache durchgeführt zu haben, um die Gestalt, sowie auch und vor allem die Rolle einzelner Mittel in der zusammenhängenden Rede richtig beurteilen zu können. Es wird sich um Gründe folgenden Typus handeln: Obschon z. B. der ' S. K a r c e v s k i j , Sur la phonologie de la phrase, TCLP 4, 1931, S. 188—227. J. C h l u m s k y , Ceskd kuantita, melodie a pfizvuk, Praha 1928. 9 S. B e r g s v e i n s s o n , Grundfragen der isländischen Satzphonetik, Kopenhagen—Berlin 1941. 10 Vgl. einige Anmerkungen bei D a n e S , Intonace a vita..., z. B. S. 49 u. a., oder C. L. E b e l i n g s Besprechung in Lingua 4, 1954, S. 235f. (vgl. dazu meinen Aufsatz in Lingua 5, 1955, S. 95 i 97). 8
180 Gegensatz der Quantität als einer der Hauptzüge des tschechischen vokalischen Systems anzusehen ist, so werden gewisse Modifizierungen der Vokallänge im Tschechischen beim Aufbau der Aussage (des Satzabschnitts) nur in einem sehr beschränkten Maße ausgenützt, zum Unterschied z. B. vom Polnischen und dessen Mundarten, in welchem — da hier die Qualität nicht phonematisch ist — die Quantitätsmodifizierungen als ein ziemlich wichtiger Faktor, der an der Abgrenzung des Satzabschnitts (bzw. der Aussage) teilnimmt, anzusehen ist, obwohl die Bedeutung (Geltung) des Satzabschnitts selbst dadurch nicht bestimmt wird.11 Ein anderes Beispiel: Wenn sich z. B. der Tonverlauf im Serbokroatischen in erheblichem Maße schon an dem Aufbau des Wortes und seiner Formen (in dem sgn. Tonakzent) beteiligt und schon in dieser Ebene funktionelle (phonematisch) ist, so ist die Anwendbarkeit des Tonverlaufs als satzbildendes Element entweder von vornherein ziemlich beschränkt, oder die relevanten Züge der satzmelodischen Mittel werden in dieser Sprache grundsätzlich andere, kompliziertere phonische Züge aufweisen, als es z. B. im Tschechischen, Polnischen, Russischen, Deutschen usw. der Fall ist, wo die Melodie erst — sagen wir — in der syntaktischen Ebene ausgenützt wird.12 1.4 Bei dieser Analyse muß man sich einer sehr wichtigen Tatsache bewußt sein. Die einzelnen prosodischen Elemente werden als sprachliche Mittel (im Vergleich mit anderen Mitteln desselben Sprachsystems) durch solche Merkmale (Eigenschaften) gekennzeichnet, die bloß durch einen Zug manchmal sehr schwer zu charakterisieren sind. Ist man dann berechtigt, über 6ine relevante Eigenschaft jenes Mittels zu sprechen, oder soll man lieber (wie wir es —• ähnlich wie bei anderen Mitteln der phonematischen Ebene — bevorzugen), alle einzelnen, das prosodische Mittel konstituierenden Eigenschaften, oder noch besser ihre Menge (Summe), Hierarchie und Mitwirkung in Betracht ziehen? Aus dem Vergleich einzelner prosodischer Mittel mit ähnlicher Funktion in verschiedenen Sprachen wird es sich dann manchmal zeigen, daß diese Mittel nicht immer durch dieselben Eigenschaften, durch identische Summe und Hierarchie dieser Eigenschaften charakterisiert werden. Die sog. chinesischen Töne (Toneme) werden in der Sprachform Kuo-yü nicht bloß durch Tonverlauf und Tonhöhe (die jedenfalls in der Hierarchie der Eigenschaften als die höchsten anzusehen sind), sondern auch durch 11
Prägnanter macht sich selbstverständlich das Ausnützen der Vokallängeunterschiede und -modifizierungen in der Ebene der emotionalen Färbung geltend. (Ausführlicher behandeln wir einige dieser Probleme in unserer Monographie Zvukoud stränka souvisli feii v närelich na TiSlnsku, Ostrava 1958.) 1S Vgl. hier Sprechmelodie und andere satzphonetische Mittel..., v. a. S. 165 f.; auch Intonological T.ypology, S. 131 f.
181 verschiedene Ausbreitung der Intensität innerhalb der Silbe, durch verschiedene Silbendauer (bzw. auch durch einzelne Timbremodifizierungen) gekennzeichnet. Bei der Abwesenheit des Sprechtons (z. B. beim Flüstern) können diese nicht relevanten (redundanten, irrelevanten) Begleitzüge zu den wichtigsten Kennzeichen des Tones werden. 13 Wenn man von der sprachlichen Funktion des Akzents im Russischen und Tschechischen absieht (im Russischen hat er eine phonematische, dagegen im Tschechischen nur eine delimitative Funktion), wird er in den beiden Sprachen übereinstimmend als dynamisch bezeichnet. Im Kapitel über die Sprechmelodie und andere satzphonetische Mittel in der Hochlautung (S. 170,1.32) haben wir auf die verschiedene phonische Struktur des Akzents in beiden Sprachen aufmerksam gemacht. 1.5 Wir sind also der Ansicht, daß die satzphonetische Analyse einer Sprache, die zur Unterlage des vergleichenden satzphonetischen Studiums dienen soll, nicht nur die Unterschiede in der Form einzelner satzphonetischer Faktoren (der Satzdynamik, der Melodie, des Tempos, der Pausen, bzw. der Quantität im engeren Sinne usw.), sondern auch in ihrer sprachlichen Funktion zeigen soll. Da aber diese Faktoren manchmal in der Sprache demselben oder einem ähnlichen Zweck außer und neben anderen Sprachmitteln dienen, so wird es nötig sein, nach der Hierarchie aller dieser Mittel zu suchen. Endlich, wenn wir behaupten, daß diese satzphonetischen Mittel ein System bilden, wird sich die Notwendigkeit der Bestimmung der Stellung dieses Teilsystems im gesamten Sprachsystems zeigen. Die satzphonetische und zugleich -phonologische Analyse einer Sprache, die dem vergleichenden Studium des ersten Typus (der Konfrontation) als Unterlage dienen soll, wird also in mancher Hinsicht noch gründlicher sein müssen, als es für die bloße Beschreibung dieser Sprache (ohne die Absicht, sie mit einer anderen zu vergleichen) nötig wäre. Denn, was das eigentliche Vergleichen dieses Typus anlangt, sind wir überzeugt, daß es nicht möglich ist, bloß einzelne satzphonetische Elemente bzw. die Ähnlichkeiten und Unterschiede ihrer Formen zueinander zu vergleichen, sondern daß diese Elemente immer als Bestandteile der betreffenden Sprachsysteme behandelt werden müssen, daß man ihre Stellung im gesamten Sprachsystem berücksichtigen muß. Man wird also eher die ganzen Systeme dieser Mittel (u. zw. mit Rücksicht auf ihre Bedeutung für das ganze System der betreffenden Sprache), selbstverständlich solche Systeme, deren einzelne Glieder gründlich analysiert worden sind, als bloß die einzelnen Formen miteinander vergleichen. Man könnte z. B. die Melodie des tschechischen und deutschen Frage" Vgl. beim Verf., Zum Problem der Töne im Kuo-yü, Archiv orientälni 21, 1953, S. 312ff. u. a.
182
satzes für fast identisch erklären, was den bloßen Tonverlauf anlangt. Wenn man sich aber der Unterschiede in den Akzentverhältnissen, die jedenfalls von dem Aufbau des Satzes abhängig sind, und auch der Unterschiede in der Beziehung zu anderen satzbildenden Sprachmitteln (z. B. Wortfolge) und der Verschiedenheit der Hierarchie dieser Sprachmittel bewußt ist, zeigt es sich, daß der in beiden Sprachen identische Tonverlauf als Sprachmittel und Glied des Sprachsystems auf verschiedene Weise beurteilt werden muß. 2. Das vergleichende Studium der Satzphonetik und -phonologie einzelner gegenwärtigen, nicht ausschließlich verwandten Sprachen ist also — obwohl immer noch mit ziemlich großen Schwierigkeiten und nach noch vielen Vorarbeiten — als eine erfüllbare Aufgabe anzusehen. Dagegen das Studium (und vor allem das vergleichende, komparative Studium) der Entwicklung der phonetischen Gestalt des Satzes und der Ausnützung einzelner satzphonetischer Elemente in der Sprache ist viel komplizierter. Manchmal wird man sich bloß mit Teilergebnissen begnügen müssen. 2.1 Als: Grundlage der Rekonstruktion des älteren Standes (denn es wird sich da vor allem um eine Rekonstruktion handeln müssen) wird nicht nur der Stand der Modulationen in der gegenwärtigen Form der gesprochenen Schriftsprache, sondern auch und vor allem in den Dialekten dieser und auch der nächstverwandten Sprachen dienen. Man kann voraussetzen, daß die Schriftsprache als eine mehr oder weniger künstliche Schöpfung in ihrer gesprochenen Form (noch mehr als in anderen Gebieten) wenigstens einzelne satzphonetische Elemente (wenn nicht das ganze Teilsystem) von den Dialekten (Interdialekten) übernommen, diese gewissermaßen modifiziert und den spezifischen Bedürfnissen der Schriftsprache angepaßt hat, bzw. ein neues, von dem ursprünglichen mundartlichen abweichendes System aus dem Material der von den Mundarten übernommenen Elementen ausgebaut hat. Deshalb wird es nötig sein, auch das satzphonetische System der Dialekte und diesmal möglicherweise auch der einzelnen Elemente (u. zw. vor allem der archaistischen Mundarten, aber auch der für die Beurteilung der Richtung der Entwicklung wichtigen Dialekte bzw. Interdialekte) zu studieren. Der Vergleich der Ergebnisse wird wenigstens die wahrscheinliche Richtung der Entwicklung andeuten. Dabei wird man aber sehr vorsichtig beurteilen müssen, welche der Erscheinungen archaisch sind und welche man für Innovationen halten muß (dabei sollte auch die Richtung der Anhäufung anderer archaischen Sprachzüge in einzelnen Dialekten berücksichtigt werden), welche den Kern des Systems bilden, als solche sich länger erhalten konnten und z. B. in die Schriftsprache leichter übernommen werden konnten und welche dieser Faktoren dagegen als Randerscheinungen anzusehen sind. Meiner Ansicht nach wird man vor allem deshalb vorsichtig sein müssen, da besonders
183 einige der Modulationselemente (vor allem die Melodie) größeren und schnelleren Umwandlungen als andere Sprachelemente unterliegen können, wobei sie trotzdem einzelne, manchmal nicht auffallende und sogar nur bei einer gründlichen Analyse auffindbare archaische Züge ziemlich lange behalten können. 2.2 Bei der Beurteilung der Entwicklungsmöglichkeiten einzelner satzphonetischer Elemente in einzelnen verwandten Sprachen, bzw. beim Studieren des gemeinsamen Ursprungs einer Erscheinung, die heutzutage manchmal verschiedene Züge aufweist, wird es nicht ohne Bedeutung sein, nicht nur die auffallendste (oberflächlich betrachtet, .relevante') Eigenschaft, sondern die schon erwähnte Summe (Menge) aller in Betracht kommenden Züge, ihre Hierarchie und in diesem Fall vor allem die Möglichkeiten der Verschiebung und Umwandlung derer Hierarchie im Verlauf der Sprachentwicklung zu respektieren. Wenn z. B. die Akzententwicklung in den westslawischen Sprachen studiert wird, wird es nicht ohne Nutzen sein, die Tatsache zu beachten, daß der Akzent im Polnischen außer durch die Intensität viel mehr durch das Tonelement gekennzeichnet wird, 14 als es im Tschechischen der Fall ist. 16 Man könnte dann aus einigen mit dem Akzent nicht verbundenen Tonelementen in den archaistischen tschechischen Mundarten auf die ältere Akzentstelle (sowie auch auf die Akzentform) schließen. 16 2.3 In gewisser Hinsicht werden für die Rekonstruktion des älteren Standes (selbstverständlich nur in einem sehr beschränkten Maße, z. B. für die Rekonstruktion der Melodie) nicht einmal die älteren schriftlichen Denkmäler ohne Bedeutung sein. Ich meine insbesondere solche, die die schriftliche Aufzeichnung der gesprochenen Sprache darstellen (z. B. die Gerichtsprotokolle), in denen man — vor allem in der Wortfolge und manchmal auch in der Interpunktion bzw. in der An- oder Abwesenheit der Lautassimilation usw. (und selbstverständlich im Vergleich mit den analogen gegenwärtigen, z. B. mundartlichen Aufzeichnungen) — die Spuren ihrer ursprünglichen phonischen Gestalt finden kann. Denn vor allem in den primitiven geschriebenen Äußerungen wird die Gestalt des geschriebenen Satzes gewissermaßen auch durch ihre phonetische Gestalt bestimmt. Man könnte außerdem voraussetzen, daß das Verhältnis der gesprochenen Form der Sätze zu der geschriebenen in der Vergangenheit ähnlich 11
So daß ihn Jassem sogar für einen Tonakzent hält; vgl. W. J a s s e m , The Phonology ofPolish Slress, Word 15, S. 252—269. 15 Vgl. P. J a n o t a , An Experiment Concerning the Perception of Stress by Czech Listeners, Phonetica Prag. 1, 1967, S. 45—68 u. a.; es wird da auch im Tschechischen die Wichtigkeit der weiteren Elemente untersucht. 19 Vgl. beim Verf., Zur Akzentstabilisierung in den westslawischen Sprachen, Zft. f. Slawistik 3, 1958, S. 8fl.
184
sein konnte, wie in einer entsprechenden Situation in der Gegenwart, wo beide Formen (die gesprochene wie die geschriebene) uns bekannt sind. Doch man muß sehr vorsichtig sein, um die Verhältnisse des heutigen Systems in die Vergangenheit nicht mechanisch zu projizieren. 3. Für die Möglichkeit der oben angedeuteten Rekonstruktion, sowie für das bloße Vergleichen des ersten Typus wird auch das Auffinden und die Kenntnis der Tendenzen (wenn man noch nicht von Gesetzen sprechen kann), die sich in den Beziehungen einzelner satzphonetischen Komponenten zueinander und auch zu anderen Sprachmitteln innerhalb dessen, was man als den satzphonetischen Typus (oder Untertypus) bezeichnen könnte, 17 geltend machen, eine bedeutende Rolle spielen. Unseren Erfahrungen nach wird der satzphonetische Typus (bzw. Intonationstypus eventuell -untertypus) vor allem dadurch charakterisiert, in welchem Verhältnis z. B. der melodische und dynamische Verlauf zueinander stehen (d. h. ob z. B. im emotional neutralen abgeschlossenen Nichtfragesatz der Verstärkung grundsätzlich ein Tonerheben entspricht oder umgekehrt usw.), wie die Stelle und der Charakter der Betonung ist und wie dadurch die Stellung und Länge der funktionellen melodischen Form (des Melodems) im Satzabschnitt beeinflußt wird (ob z. B. die typische melodische Frageform im Polnischen bloß auf zwei letzte Silben beschränkt ist, da die „Wortbetonung" in dieser Sprache gewöhnlich auf der vorletzten Wortsilbe beruht, zum Unterschied vom Tschechischen, wo man infolge der Betonung der ersten Wortsilbe auch längere Melodeme finden kann, oder von anderen Sprachen, wo dieses Verhältnis noch freier ist)18 usw. Dabei muß es berücksichtigt werden, in welchem Maße und in was für einer Form die satzphonetische Gestalt der Aussage von der Kontextgliederung des Satzes abhängt, d. h. z. B., ob dem Aussagekern eine Verstärkung, bzw. auch eine Tonveränderung, resp. eine Vokallängemodifizierung usw. entspricht, 19 ob der Aussagekernteil (Rhema-Teil) vom Aussagegrundteil (Thema-Teil) durch eine Pause getrennt wird und ob es da zu gewissen Tonverlaufmodifizierungen kommt oder nicht usw.20 Ich bin mir dessen bewußt, daß dieses vergleichende (mit einer gewissen Einschränkung sogar historisch-vergleichende) Studium der Satzphonetik und -phonologie in den Sprachen — wie schon gesagt — manchmal nur Teilergebnisse leisten wird und daß man seine Schlüsse in erster Etappe eher z. B. zur Erläuterung der Probleme eines anderen Typus (beispiels17
Vgl. hier Intonological Typology, S. 131. " Vgl. hier On the Homonymy and Synonymy of Means of Intonation, S. 137. 19 Vgl. A. S k a l i C k o v ä , K otdzce vitneho pflzvuku v £eätini, Universitas Carolina — Philologica 2, 1, 1956, S. 56—66. 20 Zur Problematik der Kontextgliederung im Tschechischen vgl. v. a. bei D a n e § , Intonace a vSta..., passim. u. a.
185 weise der vergleichenden Akzentologie) als der der historischen Satzphonetik (-phonologie) selbst ausnützen wird. 21 4. Durch die kritischen Bemerkungen zu den bisherigen Arbeiten und durch das Aufmerksammachen auf die Schwierigkeiten des vergleichenden Studiums beider Typen will man keineswegs zu völlig pessimistischen Schlüssen gelangen. 22 Wenn die Vorarbeiten den angedeuteten Anforderungen genügen, so kann man schon in absehbarer Zeit zu guten und nützlichen Ergebnissen beim Vergleichen in diesem wichtigen Bereich kommen. E s ist nicht entscheidend, von welcher Seite man an die Probleme herantritt, man sollte sie bloß von allen angedeuteten Aspekten zu lösen versuchen. Und es ist ebenfalls nicht entscheidend, ob die Arbeit die Linguisten oder die Phonetiker durchführen werden; jedenfalls ist es nötig, daß die Linguisten phonetisch und die Phonetiker linguistisch geschult sind.
SUMMARY ON T H E COMPARATIVE STUDY OF T H E PHONETICS OF T H E SENTENCE In this chapter thoughts are given to the possibility of the comparative study of intonational means in different languages. It is stressed that in the confrontational study of modern languages (even those unrelated) what must be compared are not merely the individual devices and the differences in their acoustic structures, but first and foremost their place in the whole system of intonation. Relative to the comparative historical study of intonation some thoughts are given on the possibility of reconstructing intonation forms valid at earlier stages.
Vgl. auch beim Verf., Zvukovâ strânka..., z. B. S. 87f., bzw. Zur Akzentstabilisierung ..., S. 8—25. M Wenn manche der bisherigen Versuche des vergleichenden Studiums der satzphonetischen und -phonologischen Probleme (z. B. bei Karcevskij einer-, oder bei Meinsma andererseits) allen unseren heutigen Anforderungen nicht entsprechen und gewissermaßen — da sie etwas vorzeitig waren — sogar gescheitert sind, so darf man sie keineswegs völlig ablehnen und muß sich der Situation und der Möglichkeiten, die ihren Autoren der Stand der Forschung im Gebiete der Satzphonetik und das zur Verfügung stehende Material in der Zeit des Entstehens dieser Arbeiten bietet, bewußt sein. 11
APPENDIX
XVII. E IN B E I T R A G Z U R P H O N E T I S C H E N METHODIK* Die Gehöranalyse als Bestandteil der experimentalphonetischen Arbeit
0. Die Entstehung der Experimentalphonetik gegen Ende des vorigen Jahrhunderts führte bald zu Zwistigkeiten zwischen der bisherigen traditionellen Phonetik, die sich vor allem der Erforschung phonetischer Erscheinungen durch das Gehör widmete — daher auch die spätere Bezeichnung „Gehörphonetik" bzw. „Ohrenphonetik" — und der neuen Experimentalphonetik, die sich neben der Gehöranalyse auch objektiver Gerätemethoden bedient. Diese damals heftigen Streitigkeiten bilden heute nur noch einen Teil der Geschichte der Phonetik und man findet unter den Phonetikern schwerlich noch ausgesprochene Gegner der Anwendung phonetischer Apparate, obwohl auch heute noch verschiedene phonetische Schulen mehr oder weniger „ohrenphonetisch" oder „experimentell" orientiert sind. In den heutigen phonetischen Laboratorien begegnen wir einer Menge komplizierter, meist elektronischer Apparate, von denen einige auch schon auf anderen Gebieten der sprachwissenschaftlichen Arbeit Anwendung finden (z. B. Apparate zur Klangaufnahme, vor allem das Magnettongerät). 1. Die Aufgabe dieser Abhandlung besteht nicht darin, eine lückenlose Aufzählung und Wertung der einzelnen modernen phonetischen Methoden zu geben — hier kann man auf einige Referate hinweisen, die eine gute Übersicht bieten 1 —, sondern wir möchten eher die Aufmerksamkeit auf den vom methodologischen Standpunkt aus bisher etwas vernachlässigten „gehöranalytischen" Aspekt der experimentalphonetischen Arbeit lenken und eine der neuen, in unserem Prager Laboratorium angewand* Gemeinsame Arbeit von Pfemysl Janota und Milan Romporti. 1
G. F a n t , Modern Instruments and Methods for Acoustic Studies of Speech, RIT Stockholm, Report No 8, June l l t h , 1957; E. F i s c h e r - J o r g e n s e n , What Can theNew Technique of Acoustic Phonetics Contribute to Linguistics? Reports for the Eighth International Congress of Linguists, Vol. I, Oslo 1957, S. 50—94. P. D e l a t t r e , Les indices acoustiques de la parole: Premier rapport, Phonetica 2, 1958, S. 108—118; F. S. C o o p e r , Instrumental Methods for Research in Phonetics, Proceedings Münster, S. 142—171.
190 ten Methoden eingehender beschreiben, die eben den erwähnten Aspekt besonders berücksichtigt. 1.1 Ältere phonetische, meistens aus der physiologischen und physikalischen Laboratoriumpraxis übernommene Experimentalmethoden sind mit einigen Fehlern behaftet, die in Übereinstimmung mit der Entwicklung der Elektronik nach und nach zu einem Ersatz durch modernere, unzweifelhaft geeignetere und leistungsfähigere Verfahren geführt haben. 2 Die Hauptmängel der älteren Methoden äußerten sich in einigen Fällen vor allem (a) in ihrer zu geringen Genauigkeit und Empfindlichkeit, (b) andere Verfahren verhinderten eine natürliche Sprachäußerung; hierher gehört auch noch (c) der große Zeitaufwand, den manche Methoden erfordern. Neben den obenerwähnten Schwierigkeiten, die bei einzelnen Verfahren in größerem oder kleinerem Ausmaß in Erscheinung traten, war bei den meisten klassischen Methoden auch eine andere auf den ersten Blick minder wichtige Schwierigkeit charakteristisch — nämlich die Unmöglichkeit der akustischen Wiedergabe entweder der graphischen Ergebnisse selbst oder einer gleichzeitig mit der Registration aufgenommenen reproduzierbaren Kontrollaufnahme. 3 Eine Gehörkontrolle war nur im Augenblick der Registrierung möglich, nach deren Analyse bestand keine Möglichkeit mehr, die Ergebnisse mit dem ursprünglichen Text zu vergleichen. Es ist begreiflich, daß ein derartiger Zustand ohne Zweifel an der Verläßlichkeit gewonnener Ergebnisse herbeiführte. Diese Verhältnisse haben denn auch, unseres Erachtens, nicht unwesentlich zu den Meinungsverschiedenheiten, zwischen der Ohren- und Experimentalphpnetik beigetragen: man war praktisch gezwungen, bei der Arbeit als Grundlage e n t w e d e r das Gehör o d e r die Ergebnisse der Instrumentalmethoden zu nehmen; eine wechselseitige Kontrolle war meistens sehr schwierig. Erst die Entwicklung der Elektroakustik während der letzten Jahrzehnte verschaffte der Phonetik geeignete Anlagen zur Registration und Sprachanalyse. Moderne Magnettongeräte ermöglichen heutzutage nicht nur, dasselbe Material auf verschiedene Weise nacheinander zu bearbeiten, sondern bieten auch eine willkommene Möglichkeit, das betreffende Material vor, während und nach der Analyse abzuhören, und zwar so gut wie ohne Qualitätseinbuße, auch bei vielfacher Wiederholung. Die Transkription der Tonbandaufnahme ist sowohl in der Phonetik als auch in der Mundartenkunde üblich, j a man kann sogar behaupten, daß heutzutage die Transkription von Tonbandaufnahmen viel häufiger vorkommt als die unmittelbare Aufzeichnung des lebendigen Wortes. Bei der Transkription wendet man oft verschiedene Vorrichtungen und Zusatzgeräte zum Magnettongerät an, die diese Arbeit erleichtern. Zu diesen, meist nicht speziell für die Phonetik konstruierten Vorrichtungen gehört z. B. ein Zusatzgerät zum schnellen Stoppen bzw. Rücklauf des Bandes, das bei Diktaphonen gang und gäbe ist, ein rotierender Magnettonkopf, der ursprünglich zum Auffinden einer bestimmten Stelle das Magnettonbandes beim 2
8
Andererseits kann man von den meisten modernen phonetischen Geräten nicht behaupten, sie hätten eine vollkommen neue Anschauung oder eine grundsätzlich abweichende Arbeitsweise in die Phonetik gebracht; es handelt sich hier eher um eine beträchtliche Verfeinerung und Beschleunigung der Untersuchung jener Sprachaspekte, die die Phonetiker schon längst interessierten, deren Feststellung und Messung jedoch auf verschiedene Schwierigkeiten stoßen. Eine Ausnahme bildeten Apparaturen wie der Lioretgraph. Hier ließ jedoch schon die mangelhafte Qualität der zu analysierenden Aufnahme Zweifel an der Zuverlässigkeit der Ergebnisse aufkommen.
191 Cuttern bestimmt war,4 oder endlich die Verwendung einer ähnlich funktionierenden Magnettonbandschleife, bzw. einer rotierenden Scheibe. 6 Alle obengenannten Vorrichtungen ermöglichen die Wiederholung eines beliebigen Aufnahmeabschnitts. Eine besondere Gruppe bilden Zusatzgeräte zur zeitlichen Raffung und Dehnung, deren Zweck ist, die Reproduktion so zu verlangsammen (bzw. beschleunigen), daß keine Frequenztransposition der Aufnahme eintritt. 8 Das Magnettonband bietet dem Phonetiker noch weitere beachtenswerte Möglichkeiten; gewisse Teile der Aufnahme rückwärts abzuhören, 7 bestimmte Abschnitte auszuschneiden oder zu löschen, oder durch Cuttern bestimmte Aufnahmeteile zu vertauschen. 8 Joos 9 benutzt eine Modifikation des Schallspektrographen zur Isolierung von kurzen Abschnitten des registrierten Textes, eine ähnliche Vorrichtung erwähnt auch Delattre 10 u. a. Eine zur gehöranalytischen Bearbeitung der Magnettonaufnahme gut geeignete Vorrichtung wandte zum Studium der Behauchung H. Krech an: 11 die stetig sich wiederholende Reproduktion eines Textabschnittes wird regelmäßig so unterbrochen, daß immer etwa die Hälfte des Textes zu hören ist. Die einzelnen Unterbrechungen erfolgen jedoch nicht an derselben Stelle des Textes, sondern verschieben sich entsprechend der jeweiligen Einstellung des Gerätes. Der sich langsam in der Zeit bewegende Augenblick der Unterbrechung bietet die Möglichkeit, den gegebenen Abschnitt gehöranalytisch genauer bearbeiten zu können. 12
1.2 Eine Weiterentwicklung dieser Vorrichtung stellt die nachstehend beschriebene Apparatur vor, die, im Jahre 1957 im Prager Phonetischen Institut entwickelt, beim Abhören und bei der Registration der untersuchten Texte gute Dienste leistet. F. W i n c k e l , Repetier-Zusatzgerät zum Magnetophon, für Lautuntersuchungen, Z P S K 5, 1951, S. 15—23. 5 P. L a d e f o g e d , The Function ofa Phonetics Laboratory, Orbis 6 , 1 9 5 7 , S. 211—219; R . K . P o t t e r - G. A. K o p p - H. C. G r e e n , Visible Speech, New York 1947, S. lOff. 6 M. J o o s , Acoustic Phonetics, Language Monograph 23, Supplement to Language 24, 1948, S. 127ff.; F. V i l b i g , An Apparatus for Speech Compression and Expansion and for Replaying Visible Speech Records, J A S A 22, 1950, S. 754—761; A. M. S p r i n g e r , Acoustical Time Regulator, J A S A 29, 1957, S. 341—343. 7 W. M e y e r - E p p l e r , Reversed Speech and Repetition System as Means of Phonetic Research, J A S A 22, 1950, S. 804—806. 8 Z. B . E . F i s c h e r - J e r g e n s e n , op. cit., u. a. 9 M. J o o s , op. cit., S. 121ff. 10 P. D e l a t t r e , op. cit., S. 115. 11 H. K r e c h , Kurze Mitteilung zur Behauchung der deutschen Explosivae im Inlaut, Wiss. Zeitschrift der Martin-Luther-Universität Halle-Wittenberg 4 , 1 9 5 5 , S. 625 und 626. 12 Eine ausführliche Übersicht verschiedener Methodischen Verfahren dieser Art bis zum Jahre 1964 vgl. J . ' t - H a r t - A. C o h e n , Gating Techniques as an Aid in Speech Analysis, Language and Speech, Vol. 7, Part 1, 1964, p. 22—39. Bei N. I. D u k e l ' s k i j , Principy segmentacii rechevogo potoka, Moskva—Leningrad 1962, wird eine ähnliche Einrichtung als Separator bezeichnet. Von vielen späteren Modifizierungen vgl. z. B . bei W. T s c h e s c h n e r in Z P S K 15, 1962, S. 227—245 (v. a. 234f.) oder Z P S K 18, 1965, S. 325—246; oder bei G. F. M e i e r - J . K y r i t z , Einige Kriterien für die Erkennung akustischer Signale, Proceedings Prague, S. 637ff. 4
192 Das Prinzip des Gerätes ist einfach: von einem regelmäßig sich wiederholenden Teil des Textes schaltet das Gerät nur einen kurzen Ausschnitt, ein Segment ein (daher werden wir im weiteren dieses Gerät als S e g m e n t a t o r bezeichnen), u. zw. in der Weise, daß bei üblichem Gebrauch des Gerätes die nacheinander folgenden kurzen Segmente einander teilweise überdecken (siehe Abb. 1. und 2.). Aus den Abbildungen geht deutlich hervor, daß diese Segmente langsam durch den gesamten abzuhörenden Text gehen;
JkJ^JkJMUML • v v ^ y v / y
Y
V
W
Abb. 1, 2. Schematische Darstellung der Segmentierung
es handelt sich hier also um eine gewisse Analogie zu der stroboskopischen Erscheinung auf akustischem Gebiet. Die Geschwindigkeit des Segmentganges auf den betreffenden Textabschnitt bezogen ist beliebig regulierbar, auch die Breite (Dauer) der Segmente läßt sich ändern. Technisch besteht die ganze Vorrichtung aus zwei im Laboratorium
193 universal benützten Studiomagnettongeräten mit zugehörigen Aufsprechund Wiedergabeverstärkern, aus einem Umschaltkasten und aus dem Segmentator selbst. Beide Magnettongeräte sind derart gekoppelt, daß in der einen Schalterstellung (siehe Abb. 3a) das Signal vom linken Tonbandgerät (wo sich die zu analysierende Schallaufzeichnung befindet) auf die im rechten Gerät eingelegte Magnettonbandschleife aufgenommen wird. Bei diesem Aufsprechvorgang ist auch — wie üblich — der Löschkopf eingeschaltet, so daß das auf der Schleife gespeicherte Signal wieder gelöscht wird, jedoch erst unmittelbar bevor es vor den Aufsprechkopf kommt und die entsprechende Stelle der Schleife neu bespielt wird. Durch das Umkippen des Schalters (Abb. 3b) wird das linke Gerät abgeschaltet und
Abb. 3. Prinzipschaltbild der im Text beschriebenen Apparatur a) Aufsprechvorgang b) Wiedergabe vorgang, bzw. Segmentierung
die rechte Maschine gleichzeitig auf Wiedergabe umgeschaltet; die sich unmittelbar vor der Umschaltung auf der Tonbandschleife befindende Schallaufzeichnung wird nun wiederholt reproduziert. Nach dem Einschalten des Segmentators (S) wird von der Schleife nicht der ganze Text wiedergegeben, sondern nur dessen sich regelmäßig wiederholende Segmente.
194 Wenn der Zeitabstand der einzelnen Impulse (Segmente) genau mit der Umlaufzeit der Schleife übereinstimmt, wird immer dasselbe Segment der untersuchten Aufzeichnung abgehört. Falls wir die Wiederholungsfrequenz der Impulse um einiges ändern, werden verschiedene aufeinanderfolgende mehr oder weniger einander überdeckende Segmente der Aufnahme wiedergegeben. Durch die Regulierung der Segmentwiederholungsfrequenz können wir auf beliebige Weise die Richtung und die Geschwindigkeit des Segmentvorlaufs einstellen. Eine eingehende technische Beschreibung des Segmentators würde den Rahmen dieser Abhandlung sprengen. Im Grunde genommen handelt es sich um einen asymetrischen Multivibrator mit positiver Steuergittervorspannung, die zusammen mit der Anodenspannungsstabilisierung eine genügende Frequenzstabilität des Gerätes gewährleistet. Bei der erwähnten Schaltung ist die Stabilität des Multivibrators besser als die Konstanz der Schiingenumläufe, die v. a. durch die plastische Dehnung des Magnettonbandes und durch die zulässige Tonmotorgeschwindigkeitsschwankung bestimmt wird. Wird das Stillstehen des Segmentes für eine sehr lange Zeit erforderlich, so muß man den Multivibrator durch die von den einzelnen Schleifenumläufen abgeleiteten Impulse synchronisieren.
Die Tätigkeit. des Segmentators kann man auch so umschalten, daß der ganze Text von der Schleife mit Ausnahme der Segmente wiedergegeben wird; außerdem ist auch eine andere Vorrichtung vorhanden, die das Aussuchen eines bestimmten Segmentes ermöglicht. Der Segmentator bietet ferner Synchronisationsimpulse, die um eine einstellbare Zeitspanne den eigentlichen Segmentimpulsen vorangehen. Diese Impulse benutzen wir zur Steuerung der einmaligen Zeitablenkung des Elektronenstrahloszillographen; durch diese Maßnahme lassen sich die einzelnen Segmente auf den Schirm der Elektronenstrahlröhre bequem beobachten, bzw. photographisch festhalten. Die einzelnen Segmente entstehen durch plötzliche Ein- und Ausschaltung der niederfrequenten Spannung. Diese Schaltvorgänge bleiben begreiflicherweise nicht ohne Einfluß auf das Frequenzspektrum der Segmente. Akustisch äußert sich diese Erscheinung bei den meisten Lauten ähnlich wie ein harter Einsatz; da sich aber die Segmente gleichmäßig in der Zeit bewegen, ist die Gefahr einer Verwechslung praktisch ausgeschlossen. Beim Oszillographieren bleiben die Schaltvorgänge natürlich ohne Einfluß auf den Verlauf der Kurve; die erwähnte Spektrumveränderung ist aber bei eventueller Frequenzanalyse der Segmente in Betracht zu ziehen. 2. Neben der Verwendung der Apparatur in der pädagogischen Praxis wurde der Segmentator bei der Lösung verschiedener Probleme benützt. Am klarsten zeigt sich die Verwendbarkeit des Segmentators in solchen Fällen, wo es nötig ist, einen solchen Laut genau zu bestimmen und analysieren, dessen Timbre im Verlauf der Lautrealisierung schwankt. E s han-
195 delt sich vor allem um die sgn. Bewegungsdiftonge (bzw. Triphtonge), Diphtongoide und um alle Fälle von gleitenden Lautübergängen, insbesondere um solche, bei denen die sog. Übergangslaute entstehen. 2.1 Zur illustration wollen wir einige Beispiele der Analyse russischer Vokale anwenden.18 Wie allgemein bekannt ist, unterliegen die russischen Selbstlaute beträchtlichen Einflüssen der Nachbarkonsonanten, sodaß man häufiger über ihre Palatalisierung (in der Nachbarschaft der palatalisierten bzw. palatalen Konsonanten) oder Velarisierung (z. B. vor dem „harten" I) usw. spricht. Wenn man entweder die einfache Gehörmethode, z. B. das Abhören der sich wiederholenden Tonaufnahmen, oder eine der experimentalphonetischen Methoden, die Analyse mittels eines Tonspektrographen (z. B. RFT SSp 10), bzw. eines anderen Frequenzanalysators (z. B. RFT SA IIa), gekoppelt mit einem Pegelschreiber anwendet, dann kann man den Bewegungscharakter dieser palatalisierten, velarisierten (bzw. labialisierten usw.) Laute kaum, oder nur mit großen Schwierigkeiten entdecken. Bei Anwendung der einfachen Gehöranalyse kann man (begreiflicherweise nach einer gewissen Praxis) feststellen, daß der Anfang (bzw. das Ende, nur ausnahmsweise beide diese Phasen) eines Vokals gleiten; aber über den Umfang, in dem sich der Laut bewegt, über die Phasen, welche er durchläuft (was alles auch für die sprachwissenschaftliche Beurteilung dieser Lauterscheinungen eine gewisse Bedeutung haben kann) auf Grund des bloßen Abhörens zu entscheiden, ist fast unmöglich. Man könnte sagen, daß sich die Möglichkeiten der üblichen Spektrographen und Analysatoren in dieser Hinsicht als noch beschränkter erwiesen. Man muß sicher zugeben, daß es möglich ist, mit Anwendung dieser Methoden die Töne (Laute) von einer bestimmten Minimaldauer (in unserem Fall cca 100 ms) verläßlich zu analysieren, wenn sich während dieses Zeitabschnitts ihr Charakter (d. h. ihre Höhe, Farbe, Tonstärke) nicht ändert. Sind aber diese Faktoren im Verlauf dieses Zeitabschnitts in Bewegung, so kann man Veränderungen aus guten Registrierungen zwar gewissermaßen herauslesen (z. B. von den RFT-Spektrogrammen aus der ungleichen Intensität der einzelnen Teile der Ordinaten; aus den Anälysatorregistrierungen kann man — obwohl nicht eindeutig — auf eine Formantenbewegung von größerer Breite und flacherer Form ihrer Intensitätsgipfel schließen), aber weder ihren Charakter, noch die Richtung dieser Bewegung erfassen. 18
Hier wird .nur die Methode der Untersuchung dargestellt. Der . Analyse des russischen Lautbestandes wird unsere Monographie ZviikovQ rozbor rustiny (bzw. mehrere andere Abhandlungen, z. B. hier S. 37 u. a.) gewidmet. . ..
196 Eine genauere Vorstellung von liesen Lauteigenschaften kann uns — obwohl wiederum mit gewissen Einschränkungen (die denen, die sich mit dieser Methode befassen, klar sind) — die mathematische Fourier-Analyse einer guten oszillographischen Registrierung vermitteln. Doch durch ihre außergewöhnliche Mühsamkeit und Langwierigkeit (es wäre nötig, praktisch alle Perioden jedes in Betracht kommenden Lauts zu analysen) muß auch diese Methode — wenn eine größere Menge von Material analysiert werden soll — ausgeschieden werden.
Am vollkommensten entspricht unseren Anforderungen das Verfahren, daß unter der Bezeichnung „Visible Speech" bekannt ist, d. h. die Analyse mit Anwendung des Spektrographen, v. a. des Sona-Graphs (Kay Electric Co.) bzw. einer ähnlichen Einrichtung, 14 obwohl gegen diese Methode auch gewisse Einwände öffters erhoben werden. Die Anwendung des Segmentators zeigt sich neben dieser Methode als sehr nützlich, sei es zu einer späteren Kontrolle des Analysierten, oder zur parallelen Gehöranalyse des Textes. 2.2 Bei unserer Analyse der russischen Laute haben wir den Segmentator in folgender Einstellung benützt: Die Dauer eines Segments war 150 ms. Für unsere Zwecke erwies sich dieser Wert am günstigsten, denn bei einem kürzeren Abschnitt (unter 120 ms) war es manchmal schon schwer, den gehörten Lautabschnitt genau zu identifizieren, bei einer Verlängerung des Segments machten sich bei der Gehöranalyse die Nachbarlaute schon störend geltend. Der Zeitabstand zwischen den Anfängen der nacheinanderfolgenden Impulse war um 30 ms größer als die Dauer eines Umlaufs der Bandschleife. Der Anfang des Segments verschiebt sich also nach jedem Schleifenumlauf um 30 ms, so daß das Auflösungsvermögen in der Zeitachsenrichtung größer ist als die Länge der einzelnen Segmente. Wenn sich das Timbre eines auf diese Weise analysierten Lautes nicht ändert, wird in mehreren nacheinanderfolgenden Segmenten begreiflicherweise derselbe Laut wahrgenommen. Schwankt aber das Timbre im Verlauf eines Lauts, so zeigt sich diese Timbrebewegung darin, daß man gewöhnlich schon in zwei nacheinanderfolgenden Segmenten zwei sich voneinander unterscheidende Lautnuanzen identifizieren kann. In unserer, zu diesem Zweck adaptierten phonetischen Umschrift werden die Beispiele des ersten Typus (d. h. mehrmaliges Ertönen desselben Lauts) durch einen gewöhnlichen Buchstaben in normaler Größe, dagegen die Fälle des zweiten Typus (d. h. bloß ein- oder zweimaliges Ertönen des Lauts) durch einen kleineren, etwas erhöhten Buchstaben bezeichnet. 14
H. S u n d , A Sound Spectrometer for Speech Analysis, Göteborg 1957; B. H. E d g a r t h , Der Tonfilmspectrograph, IVA-Zeitschrift für technisch-wissenschaftliche Forschung 22, 1951, 5, S. 134—153; ebenfalls bei F a n t , op. cit.; vgl. auch B. Bor o v i ö k o v ä - V. MaläC, The Spectral Analysis of Czech Sound Combinations, Praha 1967 u. a.
197
Wenn man also das Wort oroHb in unserer Transkription als [äg9oön,] schreiben kann, so bedeutet das, daß man bei Anwendung des Segmentators in der zweiten, betonten Silbe nach der Explosion des Lauts [g] zweimal einen Vokalklang hörte, den man als geschlossenes o [9] bezeichnen konnte, danach war mehrmals ein mittleres 0 [0], und endlich — vor dem [n,] — zweimal eine Abart von 0, die man als schwach palatalisiert bezeichnen konnte — [ö], zu hören. 3. Wir wollen jetzt einige unserer auf verschiedene Weise analysierten Belege zur Konfrontation vorlegen. Wir sind überzeugt, daß es nicht ohne Nutzen ist, einige sonagraphische (Visible-Speech-) Analysen,18 RFT-Spektrogramme 16 und Analysen mit Anwendung eines mit Brüel-&-Kjaer-Pegelschreiber kombinierten RFT-Analysators 17 mit unseren von diesen unabhängig und im voraus hergestellten Segmentator-Umschriften derselben Tonaufnahmen zu vergleichen, denn bloß durch eine solche Gegenüberstellung können die Vor- und Nachteile einzelner Methoden, sowie ihr gegenseitiges Verhältnis klar hervortreten. Als erstes Beispiel wollen wir die Analysen des Wortes naji [dal] anführen, 18 u. zw. Sonagramm (Visible-Speech-Analyse, weiter VS), auf der Tafel XXI, Bild la, RFT-Spektrogramm (Weiter: SG) auf der Tafel XXII, Bild 2a, RFT-Analyse (weiter: An) auf der Tafel XXII, Bild 3. Die Transkription mit Anwendung des Segmentators (weiter: Segm) [dal] zeigt uns klar, daß vor dem „harten" [1] das vorangehende [a] velarisiert und in seiner Endphase o-artig gefärbt wurde. Wenn man dann alle drei Instrumentalanalysen (VS, SG, An) im gleichen Maßstab ausdrückt (Abb. 4a) und sie mit der Segmentator-Umschrift konfrontiert, kann man eine gute Vorstellung davon gewinnen, daß nur durch VS und Segm. jene Erscheinungen dargestellt werden, die uns hier in erster Reihe interessieren, da dadurch die Timbreveränderungen widerspiegelt und ausgedrückt werden. Zum Konfrontieren des Spektrums der Schlußphase dieses Vokals mit dem Spektrum eines [o] führen wir auf der Tafel XXI, Bild ld (in graphischer Darstellung Abb. 4c) VS des Wortes coH[son]. Obwohl die ganzen Spektra beider Laute nicht völlig übereinstimmen, ist ihre Ähnlichkeit in den entscheidenden Phasen klar ersichtlich. Auf ähnliche Weise haben wir auch VS (Tafel XXI, Bild lb), SG (Tafel XXII, Bild 2b) und An des Wortes najib [däl,] mit der ersten Palatalisie" Sona-Graph, Kay-Electric Comp. 19 Es wurde der RFT-Spectrograph SSp 10 angewendet. " Die Adaptation durch Dipl. Ing. V. Maläö vom Institut für Fernmeldetechnik, Prag. " Um alle Beispiele gut miteinander vergleichen zu können, führen wir alle Belege in der Aussprache desselben Sprechers, u. zw. V. K. (Mann), geb. 1934 in Moskau, an.
198
II D I
III
i
/i
l
• ^ *