192 4 70MB
German Pages 328 [329] Year 1976
FACHSPRACHEN UND SPRACHSTATISTIK
SAMMLUNG AKADEMIE-VERLAG
41
SPRACHE
FACHSPRACHEN UND SPRACH STATISTIK Beiträge zur angewandten Sprachwissenschaft
Herausgegeben und redaktionell bearbeitet von LOTHAR
HOFFMANN
A K A D E M I E - V E R L A G • B E R L I N
1975
Erschienen im Akademie-Verlag, 108 Berlin, Leipziger Str. 3 - 4 © 1975 by Akademie-Verlag, Berlin Lizenznummer: 202 • 100/154/75 Geaamtherstellung: IV/2/14 VEB Druckerei »Gottfried Wilhelm Leibniz«, 445 Gräfenhainichen/DDR • 4354 Bestellnummer: 752 425 8 (7541) • LSV • 0805 Printed in GDR
EVP 2 4 , -
Inhaltsverzeichnis
Vorwort
7
LOTHAB HOFFMANN
Z u m Forschungsstand der statistischen Linguistik
9
LOTHAB HOFFMANN
Häufigkeitswörterbücher der Subsprachen von Wissenschaft u n d Technik (Einige Bemerkungen über Prinzipien u n d Methoden ihrer Erarbeitung) KABLHEINZ
HECKEL
F r a g e n der Theorie u n d Praxis statistischer E r h e b u n g e n zur Lexik in der sowjetischen Presse, dargestellt a m Zentralorgan „Izvestija" . . CHRISTINE
. . . .
81
SCHNEIDER
Einige Besonderheiten der Fachsprache russischer T e x t e der marxistisch-leninistischen Philosophie GERHARD
103
ALEXANDER
Z u m russisch-englisch-französischen Medizin FRITZ
43
PUCHTA
Einige Besonderheiten russisehsprachigerTexte der Physik RENATE
25
Häufigkeitswörterbuch
der 119
SCHOLZ
Termini u n d Begriffsumschreibungen
135
L O T H A B HTTMS
Zur russischen Terminologie des E i s e n b a h n b a u s HELGA
155
STARKE
Die Beziehung zwischen S t r u k t u r des Terminus u n d semantischem Feld GERHARD
175
BBENDLEB
Linguistische Aspekte bei der E r a r b e i t u n g eines mehrsprachigen Thesaurus
193
5
WEBNER
REINECKE
Einige Bemerkungen Analysegrammatik GUSTAV-ADOLF
zum
„SatzVerzeichnis" im R a h m e n
einer 217
KRAMPITZ
Zu den Besonderheiten der (Teil-)Programmierung von Lehr- u n d Lernprozessen in der fachbezogenen Sprachkundigenausbildung . . RENATE
237
SCHNEIDER
Häufigkeitsliste des russischen Wortschatzes in T e x t e n der Philosophie u n d des wissenschaftlichen K o m m u n i s m u s MARIANNE
251
LEHMANN
Häufigkeitsliste des russischen schaftlichen Texten FRITZ HEINZMANN u n d LOTHAR
Wortschatzes in
literaturwissen279
HOFFMANN
Kleines Glossar der Sprachstatistik (Deutsch — Russisch — Englisch — Französisch) 311
Vorwort
Im J a h r 1967 hat das Forschungskollektiv „Fachsprachen" der Sektion Theoretische und angewandte Sprachwissenschaft der Karl-Marx-Universität Leipzig mit der systematischen Untersuchung der sprachlichen Spezifik wissenschaftlicher Texte begonnen. Angeregt wurde diese Arbeit zunächst durch die Bedürfnisse der spezialsprachlichen Ausbildung an den Universitäten und Hochschulen der Deutschen Demokratischen Republik. Im Vordergrund standen Bemühungen um die Schaffung lexikalischer Minima für eine größere Zahl von Wissenschaftsdisziplinen. Es stellte sich jedoch sehr bald heraus, daß die fachsprachliche Forschung durchaus auch zur Lösung anderer Aufgaben der angewandten Sprachwissenschaft beitragen kann. So entstanden über das ursprüngliche Programm hinaus Untersuchungen zur Terminologie und zur automatischen Verarbeitung sprachlicher Informationen. Neben der Lexik rückte die fachsprachliche Syntax ins Feld der Betrachtungen. Da die Spezifik der Fachsprachen gegenüber der Gemeinsprache vor allem quantitativer Natur ist, spielten statistische Methoden eine außerordentlich große Rolle. Um eine möglichst große Menge sprachlicher Elemente und Merkmale speichern und verarbeiten zu können, wurde in vielen Fällen die maschinelle Lochkartentechnik und später die elektronische Datenverarbeitung eingesetzt. Bei den Untersuchungen zur Terminologie waren moderne linguistische Verfahren wie die Konstituentenanalyse eine wichtige Hilfe. Zur Schaffung eines mehrsprachigen Thesaurus wurden unter anderem auch Methoden der mathematischen Logik erprobt. Wenn von Fachsprachen die Rede ist, dann denkt man noch immer zuerst an die Naturwissenschaften — Physik, Chemie, Mathematik, Biologie usw. — oder an die Technik. I n den Untersuchungen des Leipziger Kollektivs wurde darüber hinaus der 7
Medizin und so wichtigen Gesellschaftswissenschaften wie Philosophie, Pädagogik und Literaturwissenschaft der ihnen gebührende Platz eingeräumt. Auch Informationen der Tagespresse über wissenschaftliche Forschungsergebnisse wurden berücksichtigt. Dadurch konnte ein viel breiteres Spektrum sprachlicher Möglichkeiten zwischen künstlerischer Literatur und Forschungsbericht erfaßt werdeil. Die Leipziger Untersuchungen wollen kein Beitrag zur Stilistik sein. Sie sind eher in die Kommunikationsforschung einzuordnen. Erstrebt werden Aussagen über das Funktionieren der Sprache in Lebensbereichen, in denen das Wesen unserer Epoche, der Übergang vom Kapitalismus zum Sozialismus und damit der ideologische und wissenschaftlich-technische Fortschritt, besonders deutlich zutage tritt. Einige Forschungsergebnisse sind der Öffentlichkeit bereits vorgelegt worden. Neben Aufsätzen in Zeitschriften und Vorträgen auf wissenschaftlichen Konferenzen ist besonders die Reihe dreisprachiger Häufigkeitswörterbücher zu nennen, in der die Hefte „Fachwortschatz Medizin", „Fachwortschatz Physik" und „Fachwortschatz Chemie" bereits erschienen und weitere in Vorbereitung sind. Aus der Arbeit des Forschungskollektivs sind auch mehrere Dissertationen hervorgegangen. Der vorliegende Sammelband will den Leser mit einigen Ergebnissen der fachsprachlichen Forschung bekanntmachen. Die Mehrzahl der Aufsätze trägt den Charakter von Materialdarstellungen. In einigen Beiträgen werden auch prinzipielle und methodologische Fragen aufgeworfen. Um eine thematische Zersplitterung zu vermeiden, wurden fast ausschließlich Untersuchungen zur Lexik aufgenommen. Die Besonderheiten der fachsprachlichen Syntax und andere Forschungsergebnisse hoffen wir in einem späteren Sammelband darstellen zu können, in dem auch eine größere Anzahl von Mitarbeitern anderer Universitäten und Hochschulen zu Worte kommen soll. Um die Entwicklung der noch jungen fachsprachlichen Forschung und Lehre zu fördern, werden Herausgeber und Autoren kritische Hinweise dankbar entgegennehmen. Leipzig, Dezember 1972 Prof. Dr. phil. habil. 8
LOTHAK HOFFMANN
LOTHAB HOFFMANN
Zum Forschungsstand der statistischen Linguistik
Nachdem in den letzten Jahren einige Veröffentlichungen erschienen sind, aus denen man einen Überblick über Entstehung und Entwicklung der statistischen Linguistik gewinnen kann1, und nachdem auch mehrere Übersichtsdarstellungen des Verfassers vorliegen2, kann sich der folgende Beitrag mit einer Reihe spezieller Fragen beschäftigen. Bei der Einschätzung des Forschungsstandes der statistischen Linguistik empfiehlt es sich, die zahlreichen Untersuchungen nach 1
P . GTJIRAUD, Bibliographie critique de la statistique linguistique, Utrecht/ Anvers 1954; ders., Les caractères statistiques du vocabulaire, Paris 1954; ders., Problèmes et méthodes de la statistique linguistique, DordrechtHolland 1959 bzw. Paris 1960; G. HERDAN, Language as Choice a n d Chance, Groningen 1956; ders., Type-Token Mathematics, 's-Gravenhage 1960; ders., The Calculus of Linguistic Observations, 's-Gravenhage 1962; ders., Quantitative Linguistics, London 1964; D. HARKIN, T h e History of Word Counts. Babel 3/1957; V. A. MOSKOVIC, Statistika i semantika, Moskva 1969; G. V. ERMOLENKO, Lingvisticeskaja statistika, Alma-Ata 1970; CH. MULLER, E i n f ü h r u n g in die Sprachstatistik (Übersetzung aus dem Französischen), Berlin 1972; B. N. GOLOVIN, J a z y k i statistika, Moskva 1971; R . M. FRUMKINA, Statisticeskie metody izuôenija leksiki, Moskva 1964; K v a n t i t a t i v n i Lingvistika, P r a h a
2
L. HOFFMANN, Vorwort zu Ch. Muller, E i n f ü h r u n g in die Sprachstatistik (Übersetzung aus dem Französischen), Berlin 1972; ders., Vorwort zum Sammelband „Sprachstatistik" (Übersetzung aus dem Russischen), Berlin 1973; ders., Rezension zum Sammelband „Statistika reci", Leningrad 1968. Fremdsprachenunterricht 7—8/1969; ders., Rezension zu V. A. Moskovic, Statistika i semantika, Moskva 1969. Fremdsprachenunterricht 1/1970; ders., Rezension zu Ch. Muller, Initiation à la statistique linguistipue, Paris 1968. Fremdsprachenunterricht 1/1970.
1962ff.
9
bestimmten Problemkreisen zu Gruppen zusammenzufassen. Das ist besonders deshalb nötig, weil die meisten von ihnen ganz verschiedene Sprachen zum Gegenstand haben, also nur von der Problematik und der Methodologie, nicht aber von den Ergebnissen her interessant sind. P. GUIRAUD unterscheidet in seiner „Bibliographie critique de la statistique linguistique"3 und im ersten Kapitel der „Problèmes et méthodes de la statistique linguistique"4, in dem er eine Bilanz der statistischen Linguistik bis zum Ende der fünfziger Jahre zieht, zehn Sektionen: I. Principes généraux et méthodologie; II. Phonétique; I I I . Métrique et versification ; IV. Index et concordances ; V. Distribution et fréquence des mots; VI. Sémantique; VII. Morphologie; V I I I . Syntaxe; I X . Langage de l'enfant; X. Problèmes philologiques. GUIRAUDS Bibliographie erfaßt etwa 2500 Titel, von einfachen Zählungen bzw. Häufigkeitslisten über Arbeiten rein deskriptiven Charakters bis zu verallgemeinernden Untersuchungen im eigentlichen Sinne der Statistik. Die Einteilung GUIRAUDS mag für die praktischen Bedürfnisse der bibliographischen Erfassung ihre Vorzüge haben. Ihr offensichtlicher Nachteil besteht darin, daß sie ihre Gliederungstitel ganz unterschiedlichen Begriffsebenen entlehnt : Traditionelle Einteilung der Grammatik (Phonétique, Morphologie, Syntaxe) ; Anwendungsbereich der Sprache (Métrique et versification, Langage de l'enfant) ; statistisches Element (Distribution et fréquence des mots) ; Art der Erfassung statistischer Elemente (Index et concordances); Probleme, die auf statistischem Wege gelöst werden sollen (Sémantique, Problèmes philologiques). G. HERDAS, der sich in „Language as Choice and Chance"5 bemüht, „to find tlie system of this branch of science which would enable him to arrange the vast material in an orderly fashion", nimmt eine große Vierteilung der Problematik und der Untersuchungen dazu vor: I. Stylostatistics; I I . Statistical linguistics; I I I . Information theory; IV. Linguistic duality, von der hier vor allem die beiden ersten Kapitel interessieren. In der „Stil-Statistik" werden fast ausschließlich Probleme der lexikalischen Häufigkeit untersucht, so daß der Eindruck entstehen muß, als wäre der Stil 3
4
5
P . GUIRAUD, Bibliographie critique de la statistique linguistique, Utrecht/ Anvers 1954. P. GUIRAUD, Problèmes et méthodes de la statistique linguistique, Dordrecht-Holland 1959, S. 5. G. HERDAN, Language as Choice and Chance, Groningen 1956, S. V I I .
10
nur eine Frage der Lexik. In der „Statistischen Linguistik" treten neben das Wort auch das Phonem und die grammatische Form in ihrer statistischen Distribution. Es bleibt unerfindlich, wozu die Trennung in „Stylostatistics" und „Statistical linguistics" nötig ist, hat doch jeder Text einen bestimmten Stil 6 , der sowohl durch lexikalische als auch durch morphologische, syntaktischeund sogar phonologische, d. h. durch die Gesamtheit der sprachlichen Ausdrucksmittel geprägt ist. Die Untersuchung der Besonderheiten der einzelnen Stile und Genres, aber auch des ihnen Gemeinsamen, für die ganze Sprache Charakteristischen, mit statistischen Methoden ist das Anliegen der statistischen Linguistik. Die Besonderheit der statistischen Linguistik liegt also in ihren Methoden, nicht in ihrem Untersuchungsgegenstand, den sie mit der übrigen Linguistik gemeinsam hat. Die H E R D A N S C I I C Einteilung ist deshalb ebenfalls nicht geeignet, klare Grenzen zwischen den statistischen Untersuchungsgebieten zu ziehen. Auch R . M. F R U M K I N A gelangt bei der Darstellung der „Statistischen Methode zur Beschreibung einzelner sprachlicher Erscheinungen" zu keiner strengen Systematik, sondern führt vor allem Beispiele an: statistische Methoden bei der Erforschung der Lexik; die Distribution der Wörter nach der Silbenzahl in verschiedenen Sprachen; die Anwendung statistischer Methoden zur Untersuchung der Versstruktur. Bei der Darstellung des Forschungsstandes ist es ratsam, von der Gliederung des Forschungsgegenstandes auszugehen. Untersuchungsgegenstand der statistischen Linguistik ist die Sprache. Die Methoden der Statistik erfordern deren Auflösung in zählbare Einheiten (statistische Elemente). Diese Elemente sind: Phoneme bzw. Grapheme, Morpheme, Lexeme und Syntagmen sowie die verschiedenen Verbindungen der letzteren bis hin zum vollständigen Satz. Der Forschungsstand ist also darzustellen als Antwort auf die Fragen: Welche Methoden wurden angewandt und welche (allgemeinen) Ergebnisse liegen vor für die statistische Untersuchung — der Phoneme bzw. Grapheme, der Morpheme, der Lexeme, der Syntagmen und ihrer Verbindungen ? Quantitative bzw. statistische Untersuchungen zur P h o n e t i k bzw. P h o n o l o g i e wurden bereits sehr früh angestellt und sind im 7
6
vgl. auch N. S. TRUBECKOJ, Osnovy fonologii, Moskva 1960, S. 289.
7
O.
S . ACHMANOVA, I . A . M E L ' C U K , E .
V . PADUCEVA, R .
M.
FRUMKINA,
O tocnyoh metodach issledovanija jazyka, Moskva 1961, S. 67—97. 11
allgemeinen weiter gediehen als die statistischen Analysen auf anderen Ebenen der Sprachbetrachtung. Das liegt wohl daran, daß die Zahl der Laute bzw. Phoneme recht begrenzt ist und daß diese leicht zu identifizieren und zu messen sind. Ihr Gebrauch unterliegt keiner bewußten Wahl und Kontrolle; ihre Distribution ist sehr stabil8. Gegenstand der Untersuchung waren und sind: die relative Häufigkeit der Phoneme in den verschiedenen Sprachen ; die Phoneme in Wort und Silbe (innere Struktur des Wortes); die Betonung, die Aussprache und die Länge der Wörter; mehr psychologischer Natur ist die Erforschung der Entwicklung der Sprache bei Kindern und gewisser Sprech- und Hörstörungen. In engem Zusammenhang mit der Untersuchung von Laut und Phonem steht die ihrer schriftlichen bzw. gedruckten Komponenten — Buchstabe bzw. Graphem. Die quantitative Erfassung dieser Phänomene entsprang zunächst durchaus nicht linguistischen Interessen, sondern rein praktischen Erfordernissen, z. B. denen der Dechiffrierung, der Stenographie, der Blindenschrift usw., weckte aber im Laufe der Zeit auch die Aufmerksamkeit der Sprachwissenschaftler. Während die rein deskriptive Darstellung der Verhältnisse in einzelnen Sprachen bis in die erste Hälfte des 19. Jahrhunderts zurückreicht9, beginnt die Auseinandersetzung mit grundsätzlichen Problemen der statistischen Analyse von Laut bzw. Phonem und Buchstabe bzw. Graphem erst in den zwanziger Jahren des 20. Jahrhunderts. Wie für die statistische Linguistik überhaupt, so kann auch hier G. K. Z I P F 10 das Verdienst für sich in Anspruch nehmen, als erster echte statistische Gesetzmäßigkeiten entdeckt und die einfache quantitative Darstellung überwunden zu haben. Er wies nach, daß die Häufigkeit der Phoneme umgekehrt proportional ihrer artikulatorischen Kompliziertheit ist, daß z. B. die stimmlosen Konsonanten in allen Sprachen häufiger sind als die stimmhaften. P . GUIRAÜD, Problèmes et méthodes de la statistique linguistique, Dordrecht-Holland 1959, S. 6. 9 P . GUIRAUD, Bibliographie critique de la statistique linguistique, Utrecht/ Anvers 1954, S. 9ff. 10 G. K . ZIPF, Relative Frequency as a Déterminant of Phonetic Change. Harvard Studies in Classical Philology, Cambridge (Mass.) 40/1929, S. 1—95; ders., Selected Studies of the Principle of Relative Frequency in Language, Boston 1935. 8
12
Auf ZiPFs Arbeiten stützen sich die anderer Linguisten wie C. H . VOELKER 1 1 , K . Z W I R N E R 1 2 , N . S . TRUBECKOJ 14
15
13
, H . H . JOSSEL-
16
SON , P . CHAVASSE , C. D . CHRETIEN , B . TRNKA 17 , L . G. JONES 18
u. a. P. G U I R A U D hat die Frage der Lautveränderung (des Lautwandels) aufgeworfen und nachgewiesen, daß es nicht nur Laute mit größerer Häufigkeit, sondern auch solche mit größerer Beständigkeit gibt, die historischen Veränderungen weniger oder gar nicht unterworfen sind 19 . Von nicht geringer Bedeutung ist auch die Feststellung, daß sich die Häufigkeit der Phoneme des Französischen in den verschiedenen Genres unterscheidet, so z. B. in dem stärker auf dem Latein fußenden Französisch wissenschaftlicher, abstrakter Abhandlungen 20 . Ähnliche Beobachtungen hat N. S. TRUBECKOJ am Deutschen gemacht 21 . Neuere Untersuchungen zum Ukrainischen stammen von V. S. PEREBEJNOS22. Bei beiden finden sich auch Angaben zur Spezifik wissenschaftlicher Texte. Statistische Untersuchungen zum Laut- bzw. Phonembestand einer Sprache können zur Lösung spezieller Aufgaben der ange11
C. H . V O E L K E R , Technique for a Phonetic F r e q u e n c y Distribution Count in F o r m a l American Speech. Archives Néerlandaises de P h o n é t i q u e expérimentale, L a H a y e 11/1935, S. 6 9 - 7 2 . 12 K . Z W I R N E R , Das Eindringen statistischer Forschungsmethoden in die Sprachvergleichung. Archiv f ü r vergleichende P h o n e t i k 1/1937, S. 116—120. 13 N . S. T R U B E T Z K O Y , Grundzüge der Phonologie. T r a v a u x d u Cercle Linguistique de Prague, P r a h a 7/1939, S. 230-241. 14 H . H . J O S S E L S O N , Stress P a t t e r n s in Russian N o u n Inflection. Studies in Linguistics, O k l a h o m a 6/1948, S. 5 3 - 6 2 . 15 P . C H A V A S S E , Essai sur la phonétique statistique de la langue française et son application à l'étude de l'intelligibilité d ' u n e conversation. Annales de télécommunications, vol. 3, J a n v i e r 1948. 16 C . D . C H R E T I E N , Stress P a t t e r n s in Russian N o u n Inflection. Studies in Linguistics, Oklahoma 7/1949, S. 5 3 - 5 7 . 17 B. T R N K A , K v y s t a v b e fonologické statistiky. Slovo a Slovesnost, P r a h a 11/1949, S. 5 9 - 6 4 . 18 L . G. J O N E S , Relative Occurrence of Speech Sounds : a Comparison of Several Counts. Electronics Research Project, Boston March 1952. 19 P . G U I R A U D , Bibliographie critique de la statistique linguistique, U t r e c h t / Anvers 1954, S. 6. 20 s. A n m . 19. 21 N . S . T R U B E C K O J , Osnovy fonologii, Moskva 1 9 6 0 , S . 2 8 6 - 2 9 9 . 22 Statistiôni p a r a m e t r i stiliv, K i ï v 1967.
13
wandten Sprachwissenschaft — etwa im Zusammenhang mit Entropieberechnungen im Sinne der Informationstheorie^ oder bei typologischen Untersuchungen 24 — beitragen, sind aber für die Beschreibung der Sprache insgesamt wenig ergiebig; denn die Phonetik ist — zufolge der TßUBECKOJschen Definition 25 — „die Wissenschaft von der materiellen Seite (der Laute) der menschlichen Sprechakte (parole)". Sie hat also die physikalisch-physiologische bzw. akustisch-artikulatoi'ische Seite zu untersuchen, nicht die funktionelle. Nun sind zwar die „Artikulationsbewegungen und die ihnen entsprechenden Lautungen, die in der „parole" entstehen, bis zur Unendlichkeit vielfältig 26 und deshalb wohl für statistische Untersuchungen geeignet, aber diese Vielfalt ist weder für den Sprachwissenschaftler noch für den Sprachlehrer interessant. Ihn interessieren vielmehr die „Lautnormen, aus denen sich die Einheiten des Bezeichnenden (signifikant) zusammensetzen", und diese sind „endlich, auszählbar, quantitativ begrenzt" 2 7 . Dennoch hat es Versuche gegeben, mit Hilfe einer besonderen Methode die Mittelwerte der Laute auf statistischem Wege festzustellen. Die bedeutendsten Vertreter dieser Richtung — der sogenannten Phonometrie — waren E. Z W I R N E R und K . Z W I R N E R . Mittelwerte der Laute sind aber keine echten Normen, nach denen sich die Sprechenden richten. Solche Normen sind nur im Bereich der „langue" zu finden, werden also von der Phonologie bestimmt 2 9 . Die Häufigkeit der Grapheme oder Buchstaben ist ebenfalls für bestimmte Anwendungszwecke von Belang, so etwa für das Druckereiwesen, die Entschlüsselung chiffrierter oder gestörter Texte, die Gestaltung der Stenographie und der Blindenschrift u. a. Auch bei den Vorarbeiten für die Maschinenübersetzung hat sie eine gewisse Rolle gespielt 30 . Von einer echten statistischen Analyse im Bereich der M o r 2 8
G. P I O T R O V S K I J , Informacionnye izmerenija jazyka, Leningrad 1 9 6 8 . D . A N D R E E V , Statistiko-kombinatornye metody v teoretiüeskom i prikladnom jazykovedenii, Leningrad 1967. 25 N. S . T R U B E C K O J , Osnovy fonologii, Moskva 1 9 6 0 , S . 1 7 . » s. Anm. 25, S. 8. 2 ? s. Arirn. 25, S. 8f. 28 E. Z W I R N E R und K. Z W I R N E R , Grundfragen der Phonometrie, Berlin 1936; E. Z W I R N E R , Aufgaben und Methoden der Sprachvergleichung durch Maß und Zahl, Phonometrie. Zeitschrift für Mundartforschung 2/1936. 29 N . S. T R U B E C K O J , Osnovy fonologii, Moskva 1 9 6 0 , S. 1 4 . 30 A . G. O E T T I N G E R , Automatic Language Translation, Cambridge (Mass.) 1 9 6 0 .
23
R.
24
N.
14
p h o l o g i e kann man bisher kaum sprechen. Das mag unter anderem daran liegen, daß sich eine solche nur bei stark flektierenden Sprachen lohnt, bei denen zudem keine eindeutige Zuordnung der Formantien zu den grammatischen Kategorien herrscht. Zuweilen werden grammatische Kategorien wie Genus, Kasus und Numerus oder Person, Tempus, Aspekt usw. als Merkmale des Einzelwortes bei lexikostatistischen Untersuchungen mit berücksichtigt 31 . Der entgegengesetzte Weg besteht in der isolierten Zählung der Endungen für die Formenbildung und der Präfixe und Suffixe für die Wortbildung. Zählungen dieser Art — zum Teil bereits mit repräsentativen Ausmaßen — liegen schon für eine ganze Reihe von Sprachen vor32. Früher dienten sie in erster Linie der Lösung von Problemen der Chronologie und Autorschaft, wie z. B. für die Werke Homers oder die Veden, oder der Analyse des Stils großer Autoren, nicht aber der Aufhellung der statistischen Struktur der Sprache. In neuerer Zeit spielt die Häufigkeit der formenbildenden Morpheme eine Rolle bei der Vorbereitung der Maschinenübersetzung bzw. automatischen Textanalyse33, bei der statistischkombinatorischen Modellierung von Sprachen34 und auch im Fremdsprachenunterricht 3». Sind schon statistische Untersuchungen zu den formenbildenden Morphemen selten, so gilt das noch viel mehr für die wortbildenden. Allerdings liefert hier die Texthäufigkeit kaum wesentliche Erkenntnisse. Von weit größerer Bedeutung ist die Untersuchung der Systemhäufigkeit oder Produktivität. Sie führt zu einer echten Bereicherung der Lehre von der Wortbildung. Für die fachsprachliche Forschung ergibt sich dabei ein Überblick über die bevorzugten 31
H. H. JOSSELSOST, The Russian Word Count and Frequency Analysis of Grammatical Categories of Standard Literary Russian, Detroit 1953; E. A. STEJNFEL'DT, Öastotnyj slovar' sovremennogo russkogo literaturnogo jazyka, Tallin 1963; Leipziger Untersuchungen. 32 P. GUIRAUD, Bibliographie critique de la statistique linguistique, Utrecht/ Anvers 1954, S. 65-72. 33 A. G. OETTINGEB, Automatic Language Translation, Cambridge (Mass.) 1960. 34 Statistiko-kombinatornoe modelirovanie jazykov, Moskva-Leningrad 1965; N. D. ANDREEV, Statistiko-kombinatornye metody v teoretißeskom i prikladnom jazykovedenii, Leningrad 1967. 35 V. NIKOLAEV, Nekotorye dannye o öastotnosti upotreblenija padeznych form v sovremennom russkom literaturnom jazyke. Russkij Jazyk v Nacional'noj Skole 5/1960.
15
Wortbildungsmodelle der Terminologie, die auf dem Wege der Derivation entstehen 36 . Erstes Ausgangsmaterial für die statistische Untersuchung der Lexik lieferten die sogenannten Indizes und Konkordanzen, Sammlungen aller Wörter zu einem Text mit Hinweis auf alle Stellen, an denen sie auftreten37. Zahlreiche Konkordanzen als älteste Vertreter dieser Gattung lexikalischer Sammlungen existieren zur Bibel und zu anderen kirchlichen oder religiösen Schriften. Die Indizes erfassen in erster Linie den Wortschatz eines oder mehrerer Werke eines bestimmten Schriftstellers oder Dichters. Ein vollständiger Index oder auch eine Konkordanz gestattet folgende statistische Ermittlungen : 1. Gesamtzahl der Wörter eines Textes ; 2. Zahl der verschiedenen Wörter; 3. Zahl der verschiedenen Formen; 4. Zahl der Wörter oder Formen für jede Wortart; 5. Distribution der Wörter eines Textes, ihre Häufigkeit38. Die ältesten Indizes und Konkordanzen weist G U I R A U D S Bibliographie für das Englische aus, so einen Wortindex zur gesamten MiLTONschen Dichtung33 aus dem Jahre 1809, eine Konkordanz zu 40 S H A K E S P E A R E S Dramen aus dem Jahre 1846 oder eine Konkordanz 41 zu einem Gebetbuch von 1851. Doch auch in den letzten Jahren noch ist eine ganze Reihe solcher nützlicher Sammlungen entstanden, und einige stammen sogar aus der Feder eines so bekannten Vertreters der statistischen Linguistik wie G I X I R A U D selbst42. Seit der Wende vom 19. zum 20. Jahrhundert führt das Interesse an der Häufigkeit der Lexeme zur Schaffung direkter Häufigkeits36
37
38
39
40
41
42
Fachwortschatz Medizin, Leipzig 1970; Fachwortschatz Physik, Leipzig 1970; Fachwortschatz Chemie, Leipzig 1973. P . GTJIRADD, Bibliographie critique de la statistique linguistique, Utrecht/ Anvers 1954, S. 31—40, führt etwa 300 solcher Sammlungen an. P. GUIBATJD, Bibliographie critique de la statistique linguistique, Utrecht/ Anvers 1954, S. 30; ders., Problèmes et méthodes de la statistique linguistique, Dordrecht-Holland 1959, S. 8. H. J. T O D D , Works of John Milton . . . with a Verbal Index to the Whole of Milton's Poetry, London 1809. M. V. C L A B K E , The Complete Concordance to Shakespeare : Being a Verbal Index to Ail the Passages in the Dramatic Works of the Poet, New York 1846. J. G R E E N , Concordance to the Liturgy, or Book of Common Prayer, London 1851. P. GtJXRAUD, Index des Mots des Poésies de Paul Valéry. Le Vocabulaire du Symbolisme, Groningen 1953.
16
Wörterbücher, die sich vor allem durch die Anordnung ihres Materials von den Konkordanzen und Indizes unterscheiden: die lexikalischen Einheiten erscheinen entweder in der Reihenfolge ihrer Häufigkeit bzw. ihres Ranges oder in alphabetischer Ordnung mit Angabe der Häufigkeit bei jedem Wort. Als Prototyp dieser Gattung kann F. W. KAEDINGS „Häufigkeitswörterbuch der deutschen Sprache"43 gelten. Als erster, weit bescheidenerer Anfang für das Englische muß T. A. REEDS „Table of the Frequency of the Most Common Words in the English Language"44 gewertet werden, der erst 1911 R. C. ELDRIGES umfangreichere Sammlung folgte 45. Als modernstes und bestes Häufigkeitswörterbuch der englischen Sprache ist u. E. das von E. L . THORNDIKE und L. LORGE 46 anzusehen. Für das Französische sind an erster Stelle das „Français élémentaire" und das „Français fondamental"47 zu nennen. Die Häufigkeit der Lexeme des Russischen wurde von H. H. JOSSELSON48 und E. A. STEJNFEL'DT 4 9 untersucht. Seit 1962 entsteht in Leningrad ein neues großes Häufigkeitswörterbuch der russischen Sprache50. Einmalig in seiner Art ist ein vierbändiges Wörterbuch mit dem Wortschatz PUSKINS 5 1 . Die Worthäufigkeit war nicht nur für die Linguisten von großem Interesse. Die Tatsache, daß eine sehr kleine Anzahl sich häufig 43
F. W . K A E D I N G , Häufigkeitswörterbuch der deutschen Sprache, Berlin 1898. 44 T. A . R E E D , Table of the Fréquency of the Most Common Words in the English Language. The Speller, Bath and London 1895, S. 19—23. 45 R. C. E L D B I D G E , Six Thousand Common English Words ; their Comparative Frequency and What can be done with them, Niagara Falls N. Y . 1911. « E . L . T H O B N D I K E and L . L O B G E , The Teacher's Word Book of 3 0 0 0 0 Words, N e w York 1944. 47 G . G O U G E N H E I M , R . M I C H É A , P. R I V E N C , A. S A U V A G E O T , L'élaboration du français fondamental, Paris 1 9 6 4 ; J . D . H A Y G O O D , Le vocabulaire fondamental du français, Paris 1 9 3 7 ; R . D O T T B E N S , D . M A S S A B E N T I , Vocabulaire fondamental du français, Neuchâtel/Paris 1948; 2. éd. 1952. 48 H . H . J O S S E L S O N , The Russian Word Count and Frequency Analysis of Grammatical Categories of Standard Literary Russian, Detroit 1953. 49 E. A. S T E J N F E L ' D T , Castotnyj slovar' sovremennogo russkogo literaturnogo jazyka, Tallin 1963. 50 s. dazu L. N . Z A S O B I N A , Avtomatizacija i statistika v leksikografii, Leningrad 1966. 51 Slovar' jazyka Puskina, I—IV, Moskva 1956—61; s. dazu auch: Materialy k èastotnomu slovarju Puskina, Moskva 1963. 2 Fachsprachen
17
wiederholender lexikalischer Einheiten einen relativ großen Teil jedes Textes ausmacht, hat auch die Aufmerksamkeit der Lehrbuchverfasser und Fremdsprachenpädagogen geweckt. Das bekannteste Beispiel für den Versuch, eine Sprache auf der Grundlage von nur 850 Wörtern zu lehren, ist wohl das „Basic English"52, in das die Bibel und die großen Schriftsteller „übersetzt" wurden, um sie dem Englisch lernenden Ausländer leichter zugänglich zu machen. In etwa die gleiche Richtung zielen auch die Bestrebungen zur Schaffung eines „Français élémentaire" bzw. „Français fondamental"53. Häufigkeitsuntersuchungen zur Lexik wurden in größerem Rahmen zuerst in den USA durchgeführt und dem Fremdsprachenunterricht dienstbar gemacht54. Inzwischen hat die Sowjetunion die Führung auf diesem Gebiet übernommen. Die Arbeitsgruppe „Statistika reëi" hat bereits eine große Zahl von Häufigkeitsverzeichnissen veröffentlicht, die zusammen mit früheren Arbeiten dem Fremdsprachenunterricht zugute kommen55. Dabei wurde auch die russische Sprache erfaßt. Seit den zwanziger Jahren wird auch ein verstärktes Streben nach der Lösung theoretischer Fragen spürbar, die mit der statistischen Erforschung der Lexik zusammenhängen. Erste Schritte auf diesem Gebiet unternahmen G. H . THOMSON und J. R . T H O M S O N 5 6 , 52 C. K. OGDEN, The ABC of Basic English, London 1932; ders., Basic English, a General Introduction with Rules and Grammar, London 1944; H. E. PALMER and A. S. HORNBY, Thousand Words English, London 1937. 53 s. Anm. 47. 54 P. GUIRATJD, Bibliographie critique de la statistique linguistique, Utrecht/ Anvers 1954, S. 44ff., führt etwa 110 Titel auf. 55 Statistika reëi, Leningrad 1968; Statistika reëi i avtomatiëeskij analiz teksta, Leningrad 1971; I. V. RACHMANOV, Slovar' naibolee upotrebitel'nych slov anglijskogo, nemeckogo i francuzskogo jazykov, Moskva 1960; A. I. GREKUL, Slovarnyj minimum po russkomu jazyku dlja V—VII klassov chakasskich skol, Moskva 1958; I.I.CHMELEVSKIJ, Opytsostavlenija ob'jazatel'nogo minimuma russkich slov dlja aktivnogo usvoenija uëasëimisja I—IV klassov kazachskoj skoly, Taskent 1958; N. Z. BAKEEVA, Slovarnyj minimum po russkomu jazyku dlja I—IV klassov tatarskich skol, Moskva 1958 ; V. N. CITOVIÖ, Slovar'-minimum po russkomu jazyku dlja II—IV klassov latysskich skol, Riga, 1957 u. a. 56 G. H. THOMSON and J. R. THOMSON, Outlines of a Method for the Quantitative Analysis of Writing Vocabularies. British Journal of Psychology, London 8/1915, S. 52-69. 18
G. A . CAMPELL57, E . L. THORNDIKE 58 u n d E . V . CONDON 59 . ZU u m -
fassenden Erkenntnissen aber gelangten erst G. K. ZIPF60, der trotz aller Abwegigkeiten, die in seinen Arbeiten enthalten sind, als eigentlicher Begründer der statistischen Linguistik angesehen werden darf, und G . U . YTJLE 6 1 . Die bedeutendsten Untersuchungen der neusten Zeit, die unter Anwendung exakter Prüfverfahren zu einer expliziten Darstellung der statistischen Textstruktur und der Distribution des Wortschatzes gelangen, gehören P. G U I R A U D 6 2 , G . H E R D A N 6 3 , R . M . FRTTMKINA64 und R . G. PIOTROVSKIJ mit seiner großen Arbeitsgruppe „Sprachstatistik"65. Berücksichtigung haben die statistischen Forschungen zur Lexik interessanterweise auch bei den Kybernetikern gefunden, vor allem bei C. E . SHANNON 60 , der, gestützt auf die Analyse der ZiPFschen Beispiele, zu der Feststellung gelangt, daß die Distribution der Lexeme mit den Gesetzen der kybernetischen Wahrscheinlichkeit übereinstimmt. Auch einige A. C A M P E L L , Probability Curves Showing Poisson's E x p o n e n t i a l S u m m a t i o n . Bell System Technical J o u r n a l , N e w Y o r k 2/1923, S. 9 5 - 1 1 3 . 58 E . L . T H O R N D I K E , On t h e N u m b e r of W o r d s of a n y Given F r e q u e n c y of Use. Psychological Record, Bloomington/Lancaster 1/1937, S. 399—406. 59 E . V. C O N D O N , Statistics of Vocabulary. Science, Cambridge (Mass.) 67/1928, S. 300. 60 G. K . Z I P F , Observations of t h e Possible E f f e c t of Mental Age U p o n t h e F r e q u e n c y - D i s t r i b u t i o n of Words, f r o m t h e Viewpoint of D y n a m i c Philology. J o u r n a l of Psychology, Princetown (Mass.) 4/1937, S. 2 3 9 - 2 4 4 ; ders., T h e Meaning-Frequency Relationship of Words. J o u r n a l of General Psychology, Worcester (Mass.) 33/1945, S. 2 5 1 - 2 5 6 ; ders., T h e Repetition of Words, Time-Perspective, a n d Semantic Balance, ebd. 32/1945, S. 127— 148; ders., Cultural Chronical S t r a t a in Speech. J o u r n a l of t h e Acoustical Society of America, Lancaster/New Y o r k 41/1945, S. 355—361; ders., H u m a n Behavior a n d t h e Principle of Least E f f o r t , Cambridge (Mass.) 1949. 57
G.
61
G. U. YULE, The Statistical S t u d y of Literary Vocabulary, Cambridge 1944.
62
P . G U I B A U D , S. A n m .
63
G . H E R D AN, s. A n m .
6I
R . M . F R U M K I N A , S. A n m .
66
Statistika reci, Leningrad 1968; Statistika reci i avtomaticeskij analiz teksta, Leningrad 1971. C. E . S H A N N O N , A Mathematical Theory of Communication. Bell System Technical J o u r n a l , New York 27/1948, S. 3 7 9 - 4 2 3 u n d 6 2 3 - 6 5 6 ; ders., Prediction a n d E n t r o p y in P r i n t e d English, ebd. 30/1951, S. 5 0 - 6 4 .
66
2»
1. 1. 1.
19
P h y s i k e r , w i e z. B . C. E . SHANNON u n d B . MANDELBROT 67 h a b e n auf
die große Bedeutung der Erforschung der Wortdistribution für eine ökonomische Nachrichtenvermittlung hingewiesen. Die statistische Untersuchung rein quantitativer Merkmale wie der Wortlänge, die für verschiedene Anwendungsgebiete wichtig ist, lassen wir hier außer Betracht. Eine sehr zweckmäßige Klassifizierung der bisher vorliegenden Häufigkeitswörterbücher und -Verzeichnisse nach formalen und inhaltlichen Gesichtspunkten hat P. M. A L E K S E E V 0 8 gegeben. Er unterscheidet: 1. nach der Anordnung des Materials: nach der Häufigkeit oder nach dem Alphabet geordnet ; 2. nach dem Umfang : vollständige und unvollständige, die nur die häufigsten Einheiten enthalten; 3. nach dem Umfang des untersuchten Materials: große, mittlere und kleine ; 4. nach Genre, Thema oder Autorschaft des untersuchten Materials: Wörterbücher oder Verzeichnisse des mündlichen und des schriftlichen Sprachgebrauchs, allgemeine und spezielle, Verzeichnisse einzelner Werke oder Autoren; 5. nach der Art der lexikalischen Einheiten: Verzeichnisse von Wortformen, von Wörterbuchgrundformen, von Stämmen und von Wortverbindungen ; 6. nach der Art der Häufigkeitsangabe : Wörterbücher, die die absolute Häufigkeit, die relative Häufigkeit oder den „ränge" (die Zahl der Quellen) angeben; 7. nach der Art, wie das Material analysiert worden ist : Wörterbücher, die auf einem geschlossenen Text basieren, und solche, die aus Stichproben entstanden sind. Vorläufig überwiegt noch die Zahl der allgemeinen Häufigkeitswörterbücher. Infolge der steigenden Bedeutung der Fachsprachen, zum Teil auch im Zusammenhang mit den Bemühungen um die Maschinenübersetzung und die automatische Informationsverarbeitung, sind allerdings in den letzten Jahren auch spezielle Häufigkeitswörterbücher entstanden. Zumindest aber wird der Wortschatz der wissenschaftlich-technischen Literatur jetzt in stärkerem Maße auch in den allgemeinen Häufigkeitswörterbüchern berücksichtigt69. B. MANDELBROT, Méchanique statistique et théorie de l'information. Comptes rendus des séances de l'Académie des Sciences, Paris 232/1951, S. 1638-1640 und 2003-2005. 68 P . M. ALEKSEEV, öastotnye slovari i priemy ich sostavlenija. Statistika reöi, Leningrad 1968, S. 61-63. 69 25% der für das neue Häufigkeitswörterbuch der russischen Sprache analysierten Literatur sind wissenschaftlich-technische Texte, vgl. dazu L. N . ZASORINA, Avtomatizacija i statistika v leksikografii, Leningrad 1966, S. 18. 67
20
Die Leipziger fachsprachlichen Häufigkeitswörterbücher70 wären also nach A L E K S E E V wie folgt einzuordnen: 1. nach Häufigkeit und Alphabet geordnet ; 2. unvollständig ; 3. mittlere ; 4. spezielle ; 5. Wörterbuchgi'undformen; 6. relative Häufigkeit; 7. aus Stichproben entstanden. Leider sind bisher neben der Leipziger Reihe nur wenige fachsprachliche Häufigkeitswörterbücher und Wortlisten im Druck erschienen71. Die meisten werden direkt zur Verwirklichung der obengenannten Aufgaben eingesetzt. Eine gewaltige Arbeit zur Schaffung vollständiger Häufigkeitswörterbücher einzelner französischer Autoren leistet das Laboratoire d'Analyse Lexicologique unter Leitung von B . Q U E M A D A in Besançon72. Nicht weniger bekannt sind die Arbeiten von R . B U S A im Centro per l'Automazione dell' Analisi Letteraria dell' Aloisianum in Gallarate73. Die Lexikostatistik hat nach wie vor eine Reihe wichtiger Probleme zu lösen. Dazu gehören : die eindeutige Definition des statistischen Elements und seine Abgrenzung im Text ; die Einbeziehung der Semantik in die statistische Analyse; die Entwicklung spezifischer Prüfverfahren; die Berechnung von Korrelationen zwischen einer großen Zahl von Elementen und Merkmalen; die weitere ?« s. A n m . 36. 1. SCHILLING, Allgemeinwissenschaftlicher Wortschatz des Russischen, Leipzig 1965; Castotnyj slovar' obsèenauônoj leksiki, Moskva 1970; V. V. LEVITSKIJ, Statistiéeskie osnovy otbora i planirovanija leksiceskogo materiala. V pomosë' prepodavateljam russkogo jazyka kak inostrannogo, Moskva 1965, S. 71—93; ders., Castotnyj slovnik k a k predposylka Iingvostatisticeskogo izuôenija leksiêeskoj sistemy jazyka ucebnych posobij, ebd. S. 94—149; A. N. KOLGUSKIN, Lingvistika v voennom dele, Moskva 1970; Statistika reöi. Leningrad 1968 ; Statistika reöi i avtomaticeski j analiz teksta, Leningrad 1971 ; A. S. KOZAK, High Frequency Words a n d Occurrence Forms in Russian Physics. R a n d Corporation, Santa Monica (California) ;
71
L . N . ZASORINA,
T . I . ZUBKOVA, K . P .
KAPLINSKAJA, C a s t o t n y j
slovar'
pö slesarnomu delu, Leningrad 1966; M. BREUER, Effektive Gestaltung der fachspezifischen Russischausbildung a n Ingenieur- u n d Fachschulen durch linguo-statistische Untersuchungen des Wortschatzes russischsprachiger Fachliteratur. Schriftenreihe f ü r den Fachschullehrer, Reihe Weiterbildung 42, Karl-Marx-Stadt 1971 u. a. 72
73
Bulletin d'Information d u Laboratoire d'Analyse Lexicologique, Besançon 1960ff. R . BUSA, Primenenie perfokart v lingvistièeskom analize. Perforirovannye k a r t y i ich primenenie v nauke i technike (Übersetzung aus dem Englischen), Moskva 1963, S. 395-413. 21
Mechanisierung bzw. Automatisierung der Speicherung, Bearbeitung und Ausgabe der Daten usw. Für die statistische Analyse der S y n t a x gilt nahezu das gleiche wie für die Morphologie: es gibt eine große Menge von Zählungen7^ die der Stilanalyse, der Chronologie oder der Autorschaftsermittlung dienen, meistens auf Grund der Satzlänge, daneben eine Gruppe von Arbeiten, die die Grundlage für eine Häufigkeitsgrammatik abgeben könnten, aber statistische Arbeiten im eigentlichen Sinne des Wortes sind noch selten. Als interessant für die Methodologie empfiehlt GUIRATJD die Arbeit von H. F R E I 7 5 , in der die Konzeption einer sogenannten funktionellen Grammatik mit Angabe des Häufigkeitskoeffizienten bei jedem Glied des Systems entwickelt ist. Ebenfalls wichtig, wenn auch auf ein rein quantitatives Charakteristikum des Satzes gerichtet, ist der Aufsatz von G. U . Y U L E „On Sentence-Length as a Statistical Characteristic of Style in Prose: with Application to two Cases of Disputed Authorship"76. Den letzten Stand der Forschung repräsentiert die ausgezeichnete Arbeit von H. W E I S S 7 7 zum Satz bei G O E T H E , K A N T und T H O M A S M A N N , die aus der Schule von W. FUCKS 7 8 hervorgegangen ist. Einige vorläufige statistische Untersuchungen zu den syntaktischen Besonderheiten der wissenschaftlichen im Vergleich zur künstlerischen Prosa des Russischen stellte G. A. LESSKIS 7 9 an. 74
75
76
77
78
79
P. GUIKÄUD, Bibliographie critique de la statistique linguistique, Utrecht/ Anvers 1954, S. 72-87, führt 250 Titel an. H. FREI, Qu'est-ce qu'un dictionnaire de phrases t Cahiers Ferdinand de Saussure, Genf 1/1941, S. 4 3 - 5 6 . G. U . YULE, On Sentence-Length as a Statistical Characteristic of Style in Prose: with Application to two Cases of Disputed Authorship. Biometrica 30/1939, S. 363ff. H. WEISS, Statistische Untersuchungen über Satzlänge und Satzgliederung als autorspezifische Stilmerkmale (Beitrag zur mathematischen Analyse der Formalstruktur von Texten), Diss. Aachen 1967. W. FUCKS, Mathematische Analyse von Sprachelementen, Sprachstil und Sprachen, Köln und Opladen 1955; ders., Mathematische Analyse des literarischen Stils. Studium Generale 6. Jahrgang, Heft 9, Berlin—Göttingen— Heidelberg 1953; V. FUKS, Matematiceskaja teorija slovoobrazovanija (Übersetzung aus dem Deutschen). Teorij a peredaöi soobsöenij, Moskva 1957. G. A. LESSKIS, O razmerach predlozenij v russkoj naucnoj i chudozestvennoj proze 60-ch gg. X I X v. Voprosy Jazykoznanija 2/1962; ders., O zavisimosti mezdu razmerom predlozenija i charakterom teksta, ebd. 3/1963; ders., O nekotorych razliöijach prostogo predlozenija v naucnoj i chudozestvennoj proze. Russkij Jazyk v Nacional'noj Skole 6/1963.
22
Allerdings entstammen die von ihm analysierten Texte den 60er Jahren des 19. Jahrhunderts, entwerfen also ein Bild des Entwicklungsstandes der wissenschaftlichen Prosa vor mehr als hundert Jahren. Auch läßt L E S S K I S nichts über den Umfang seiner Untersuchungen, über die angewandten Methoden und über die Zuverlässigkeit der Ergebnisse verlauten. Dennoch sind die von ihm vorgelegten Zahlen von großem Interesse; sie stimmen im wesentlichen mit neueren eigenen Untersuchungen überein. Außerdem verspricht ein Vergleich zwischen der statistischen Struktur der wissenschaftlichen Fachsprache der sechziger Jahre des 19. Jahrhunderts und der sechziger Jahre des 20. Jahrhunderts gewisse Einsichten in die Veränderung bzw. Entwicklung der Sprache von quantitativen Gesichtspunkten her. L E S S K I S hat neben der Satzlänge, die ja bereits bei G. U. Y U L E 8 0 eine große Rolle spielte, die statistische Distribution der von ihm so genannten Prädikatsgruppe und bestimmter Gruppen bzw. Typen von Prädikaten und Subjekten wie auch die Stellung der Satzteile zueinander analysiert. In die gleiche Richtung gehen Untersuchungen des Leipziger Forschungskollektivs „Fachsprachen". Sie liefern vor allem Angaben über die Häufigkeit bestimmter Syntagmen und Phrasenstrukturen der Subjekt- und Prädikatsgruppe in Texten der wissenschaftlichen Literatur und schlagen die Brücke zur lexikalischen Ebene durch die syntaktische und lexikologische Analyse von Wortverbindungen. Nicht unerwähnt bleiben dürfen auch die Arbeiten von S. I. KAUFMAN 81 , in denen vor allem die Häufigkeit nominaler Elemente und bestimmter sprachlicher Mittel zum Ausdruck solcher Kategorien wie „logische Folgerichtigkeit", „Unpersönlichkeit", „Exaktheit" und „Kürze" in technischen Texten ermittelt wird. Sie zeigen den Weg von der Zählung syntaktischer Konstruktionen als formale Einheiten zur statistischen Analyse ihrer Funktion, den die fachsprachliche Forschung zu beschreiten hat, wenn sie auch in der Syntax von den quantitativen Parametern zur qualitativen Interpretation gelangen will. 80 a . Anm. 76. S. I. KAUFMAN, Ob imennom Charaktere techniöeskogo stilja. Voprosy Jazykoznanija 5/1961; ders., Kolicestvennyj analiz obscejazykovych kategorij, opredeljajusöich kacestvennye osobennosti stilja. Voprosy romano-germanskogo jazykoznanija, Kolomna 1966, S. 34—45; ders., Vyrazenie logiceskoj posledovatel'nosti v techniceskom stile, ebd. S. 45-55.
81
23
Wir haben in unserem Beitrag stärkeres Gewicht auf die lexikalische Ebene gelegt, weil das dem Charakter des vorliegenden Sammelbandes entspricht und weil die Spezifik der Fachsprachen am ehesten durch statistische Untersuchungen zur Lexik deutlich wird. Béstimmte Gebiete der statistischen Linguistik sind gar nicht erwähnt worden, da sie unserem Forschungsanliegen zu fern stehen und einen kurzen Überblick nur belastet hätten. Dazu gehören z. B. die Metrik und Verskunst — obwohl GTJIRATJD diese als „le domaine privilégié de la statistique linguistique" 82 bezeichnet, die schon immer mit Zählungen operiert hat —, die Kindersprache, die Sprache als pathologisches Phänomen (Sprachstörungen) u. a.83 82
P. GurRAUD, Bibliographie critique de la statistique linguistique, Utrecht/ Anvers 1954, S. 18.
83
N a c h t r a g z u A n m . 4 7 : A . JUILLAND, D . B B O D I N , C. DAVIDOVITCH, F r e -
quncy Dictionary of French Words, The Hague/Paris 1970; zu Anm. 65: Statistika reëi i avtomaticeskij analiz teksta 1972, Leningrad 1973.
LOTHAR
HOFFMANN
Häufigkeitswörterbücher der Subsprachen von Wissenschaft und Technik (Einige Bemerkungen über Prinzipien und Methoden ihrer Erarbeitung)
0. Während die traditionelle Philologie und der Fremdsprachenunterricht früherer Jahrzehnte ihre Aufmerksamkeit sehr lange Zeit fast ausschließlich auf die Sprache der künstlerischen Literatur einerseits und die Umgangssprache andererseits konzentriert hatten, hat die Entwicklung in den letzten zwanzig Jahren ein ständig wachsendes Interesse am Gebrauch von Sprache(n) für spezielle, berufliche Zwecke mit sich gebracht. Es gibt viele Ursachen für diesen Trend: die wachsende Bedeutung von Wissenschaft und Technik auf fast allen Gebieten der gesellschaftlichen Reproduktion; die zunehmende Förderung der Bildung durch Hochschulen, Fachschulen, Berufsschulen, allgemeinbildende Schulen, Fernsehen, Rundfunk, Zeitschriften, Zeitungen und Publikationen anderer Art; die große Aktivität hochspezialisierter Verlage; vor allem aber die Internationalisierung der wichtigsten Zweige des gesellschaftlichen Lebens durch politische, ökonomische, technische, wissenschaftliche und kulturelle Kooperation. Eine der unmittelbaren Folgen ist die Forderung nach einer fachbezogenen Fremdsprachenausbildung, d. h. nach einer Beschränkung auf die Bedürfnisse beruflicher Kommunikation, auf die entsprechenden Subsprachen von Wissenschaft und Technik. Es hat wenig Sinn, angesichts dieser Tätsache über eine mögliche Schmälerung der Allgemeinbildung, besonders der Kenntnis fremder Literatur, Kultur und Lebensweise zu klagen, handelte es sich dabei in der Vergangenheit doch allzu oft nur um ein oberflächliches Attribut bürgerlicher Bildung. Im übrigen enthält der Fremdsprachenunterricht an den allgemeinbildenden Schulen der sozialistischen Staaten eine starke landeskundliche Komponente, die eine spätere sprachliche Spezialisierung ohne weiteres gestattet. Die Vertreter der angewandten Sprachwissenschaft und die Fremdsprachenlehrer der weiterführenden Bildungseinrichtungen tun also 25
gut daran, den Tatsachen in die Augen zu sehen und aus den obengenannten Forderungen einige prinzipielle Schlußfolgerungen zu ziehen. Eine der ersten Konsequenzen wird es sein, den traditionellen Gegenstand und folglich das sprachliche Material durch neue Gegenstände und Materialien zu ersetzen. Ein anschauliches Beispiel für diese Art von Veränderungen ist die über 20jährige Geschichte der spezialsprachlichen Ausbildung in der Deutschen Demokratischen Republik.1 Seit 1951 lernen alle Studenten an den Universitäten und Hochschulen zwei Fremdsprachen, im allgemeinen Russisch und Englisch oder Französisch; sie sollen die Fähigkeit erlangen, die für sie wichtige fremdsprachige Fachliteratur im Original zu lesen und sich an Gesprächen über Fragen ihres Faches zu beteiligen. Während der ersten zehn Jahre dieser spezialsprachlichen Ausbildung war die Auswahl des sprachlichen Materials vorwiegend durch Intuition, Empirie und guten Willen bestimmt. Als Lehrmaterialien dienten einfache Texte und Textsammlungen des jeweiligen Fachgebiets, die nur wenig oder gar nicht für die Bedürfnisse des Fremdsprachenunterrichts aufbereitet waren. Die Grammatik wurde relativ unabhängig davon gelehrt. Wenn die Ergebnisse trotz dieser Mängel nicht schlecht waren, dann ist das dem Enthusiasmus der Lehrenden und Lernenden und nicht der Vollkommenheit der Materialien und Methoden zuzuschreiben. Wo dieser Enthusiasmus fehlte, da waren die Resultate nicht zufriedenstellend. Deshalb galt es, zuverlässige Prinzipien und effektive Methoden vor allem für die Auswahl und Restriktion der sprachlichen Phänomene zu finden, die in den Sprachkurs eingehen sollten2, und dann 1
L. H O F F M A N N , G.-A. K R A M P I T Z , W . R E I N E C K E , Zwanzig Jahre fachsprachliche Ausbildung und Forschung an der Karl-Marx-Universität Leipzig. Wissenschaftliche Zeitschrift der Karl-Marx-Universität Leipzig, Gesellschafts- und Sprachwissenschaftliche Reihe, 21. Jahrgang (1972), Heft 1. 2 L. H O F F M A N N , Überlegungen zum linguistischen Vorlauf für eine (teil-)programmierte fachbezogene Sprachkundigenausbildung. Wissenschaftliche Zeitschrift der Karl-Marx-Universität Leipzig, Gesellschafts- und Sprachwissenschaftliche Reihe, 21. Jahrgang (1972), Heft 1; ders., Probleme der linguistischen Fundierung eines modernen fachbezogenen Fremdsprachenunterrichts. Probleme der strukturellen Grammatik und Semantik, Leipzig 1968; ders., Prolegomena zu einem Programm für die Untersuchung der
26
ihren Platz im Programm zu bestimmen3. Hier sollen einige linguistische Aspekte dieser Aufgabenstellung angedeutet werden. 1. Die linguistischen Besonderheiten der Subsprachen von Wissenschaft und Technik sind in erster Linie quantitativer Natur4. Bestimmte sprachliche Elemente, Formen oder Strukturen treten in der wissenschaftlichen Prosa mit signifikanter Häufigkeit auf. Deshalb spielen statistische Methoden bei der linguistischen Analyse von Fachtexten eine wichtige Rolle. Die bisherigen Untersuchungen haben gezeigt, daß die Besonderheiten, die uns in diesem Zusammenhang interessieren, nicht auf allen sprachlichen Ebenen mit gleicher Deutlichkeit hervortreten5. Am ergiebigsten sind Untersuchungen zur Lexik und zur Phrasenstruktur, die uns die häufigsten lexikalischen Einheiten und syntaktischen Konstruktionen liefern. Deshalb wollen wir hier einige Betrachtungen über die Erarbeitung von fachsprachlichen Häufigkeitswörterbüchern anstellen und an den beiden ersten im Druck erschienen Bändchen6 einer ganzen Reihe, die in einem Forschungs-
3
4
3
6
Wissenschaftssprache u n d der methodischen Probleme der fachbezogenen Fremdsprachenausbildung. Festschrift Irmgard Schilling. Wissenschaftliche Zeitschrift der Humboldt-Universität zu Berlin, J a h r g a n g X V I I I (1969), H e f t 3. G.-A. K R A M P I T Z , Modell der Sprachkundigenausbildung der D D R . Wissenschaftliche Zeitschrift der Karl-Marx-Universität Leipzig, Gesellschafts- u n d Sprachwissenschaftliche Reihe, 21. J a h r g a n g (1972), H e f t 1; W . R E I N E C K E , Zur Stellung der G r a m m a t i k in einem (teil-)programmierten Lehrmaterial f ü r die Sprachkundigenausbildung, ebd. L. H O F F M A N N , Zur quantitativen Charakteristik der Sprache wissenschaftlicher Texte. Linguistische u n d methodologische Probleme einer spezialsprachlichen Ausbildung, Halle 1967 u n d Wissenschaftliche Zeitschrift der Karl-Marx-Universität Leipzig, Gesellschafts- u n d Sprachwissenschaftliche Reihe, 16. J a h r g a n g (1967), H e f t 1/2; ders., Zur Spezifik der Fachsprache in sprachstatistischer Sicht. Fremdsprachenunterricht 11/1968; ders., Methoden zur quantitativen Charakterisierung der Wissenschaftssprache. Actes du X e Congrès International des Linguistes (Bucarest, 28 Août - 2 Septembre 1967), I I I , Bucarest 1970. s. Anm. 4 u n d L . H O F F M A N N , Angewandte Sprachwissenschaft, Fachsprachen u n d sprachliche Ebenen. Wissenschaftliche Zeitschrift der T U Dresden, J a h r g a n g 20 (1971), H e f t 5. Fachwortschatz Medizin. Häufigkeitswörterbuch Russisch—Englisch— Französisch, Leipzig 1970; Fachwortschatz Physik. Häufigkeitswörterbuch Russisch—Englisch—Französisch, Leipzig 1970.
27
kollektiv der Sektion Theoretische und angewandte Sprachwissenschaft der Karl-Marx-Universität Leipzig entsteht, erläutern. Es handelt sich dabei um Häufigkeitswörterbücher der Medizin und Physik, denen 1973 der Fachwortschatz Chemie, 1976 der häufigste Wortschatz der Mathematik und EDV und später andere Fachgebiete wie Bauwesen, Tierproduktion usw. folgen werden7. In den Bänden dieser Reihe sind jeweils drei Sprachen (Russisch, Englisch, Französisch) erfaßt. Darüber hinaus liegen für das Russische allein Häufigkeitslisten der Fachgebiete Philosophie8, Pädagogik, Literaturwissenschaft, Zeitungsinformation9, Elektrotechnik, Ökonomie der Land- und Nahrungsgüterwirtschaft, für das Englische zwei Untersuchungen zum Maschinenbau und andere Arbeiten vor. Weitere sind im Gange. Sie werden vorläufig nicht veröffentlicht, sondern als Grundlage für die Schaffung programmierter Lehrmaterialien verwendet. 2; Häufigkeitswörterbücher sollten in Anbetracht der Entwicklung der statistischen Linguistik während der letzten Jahrzehnte10 nicht länger das Ergebnis einfacher Zählungen sein, wie wir sie seit langer Zeit als Mittel der sprachwissenschaftlichen Beobachtung aus Indizes und Konkordanzen zu bestimmten Büchern und Texten kennen, wie sie aber auch noch in jüngeren Aussagen über Sprache (langue), Rede (parole, discours), Literatur u. a. zu finden sind. 7
Zur technischen Seite dieser Arbeiten s. L. H O F F M A N Î J , Zur maschinellen Bearbeitung sprachlicher Daten bei linguostatisti sehen Untersuchungen. Deutsch als Fremdsprache 2/1971. 8 R . S C H N E I D E R , Fachsprachliche Besonderheiten der Lexik und Morphologie des Russischen in Texten der marxistisch-leninistischen Philosophie, Diss. (Masch.) Leipzig 1971. 9 K . H E C K E L , Fragen der Theorie und Praxis statistischer Untersuchungen zur Lexik in der sowjetischen Presse, dargestellt am Zentralorgan Izvestija, Diss. (Masch.) Leipzig 1971. 10 Literatur dazu findet sich vor allem in: P. G U I R A U D , Bibliographie critique de la statistique linguistique, Utrecht/Anvers 1954; ders., Problèmes et méthodes de la statistique linguistique, Dordrecht-Holland 1959 bzw. Paris 1960; G. H E B D A N , The Calculus of Linguistic Observations, 's-Gravenhage 1962; D. H A R K I N , The History of Word Counts. Babel 3/1957; G. V. Ermolenko, Lingvisticeskaja statistika, Alma-Ata 1970; Ch. M U L L E R , Einführung in die Sprachstatistik (Übersetzung aus dem Französischen), Berlin 1972; B. N. G O L O V I N , Jazyk i statistika, Moskva 1971; R. M. F R U M K I N A , Statisticeskie metody izucenija leksiki, Moskva 1964; Kvantitativni Lingvistika, Praha 1962ff.
28
Eine Häufigkeitsuntersuchung, die Anspruch auf Allgemeingültigkeit erheben will, hat mindestens zwei Kriterien zu berücksichtigen 11 : die R e l i a b i l i t ä t und die E f f e k t i v i t ä t . 2.1. Die R e l i a b i l i t ä t wird mit mathematischen Methoden nach bestimmten Formeln berechnet und in Werten für Intervalle und Abweichungen (Fehler) ausgedrückt 12 . Für unsere betont praktische Aufgabenstellung genügt zunächst die Kenntnis des Vertrauensintervalls, d. h. der Grenzen für die Abweichungen der relativen Häufigkeiten bzw. Wahrscheinlichkeiten von ihrem Mittelwert. Dieses Intervall wird nach E S A N und ALEKSEEV 1 3 mit Hilfe der folgenden Formeln berechnet: -
hn + jg*
- g
]/ä(1 - h)n + —-j
ä» + ^g2 + 9 ]/ÄU
jpa =
^r+7
2
- h)n +
^
jfif2
(untere Grenze),
(obereGrenze
)'
wobei h — Häufigkeit des Wortes, n = Umfang der Stichprobe, g = Konstante von 1,96 (bei einer statistischen Sicherheit von 95%). Betrachten wir ein Beispiel: Wenn ein Wort in einer Stichprobe von n — 400000 mit einer absoluten Häufigkeit von 852 auftritt, dann beträgt die relative Häufigkeit 0,00213. Diese relative Häufigkeit ist aber ein Mittelwert, der zwischen 0,00199 und 0,00228 liegt. Je kleiner das Intervall, desto zuverlässiger ist der Wert der relativen Häufigkeit. Das wird noch zusätzlich durch die Berechnung des relativen Fehlers für die Vertrauensgrenzen nachgewiesen, bei der die Werte von und^»2 i n die folgenden Formeln eingesetzt werden: P1 i>2 So gelangen wir zu den Werten ^ = 0,07035 und e2 = 0,06578, d. h., der relative Fehler beträgt in unserem Fall 7,035 bis 6,578 Prozent; das ist ein ziemlich gutes Ergebnis14. 11
s. dazu auch E . A . K A L I N I N A , Izucenie leksiko-statisticeskich zakonomernostej na osnove verojatnostnoj modeli. Statistika reöi, Leningrad 1968. 12 Näheres dazu s. Literatur Anm. 10. 13 L. I. E § A N , P. M. A L E K S E E V , Rezension zu E . A . S T E J N F E L ' D T , Castotnyj slovar' sovremennogo russkogo literaturnogo jazyka, Tallin 1963. Voprosy Jazykoznanija 6/1964; s. auch Anm. 9. 14 Andere Berechnungsmöglichkeiten s. Anm. 1 0 , besonders G U I B A U D , H E B D A N , M U L L E E , GOLOVIN, FRUMKINA.
29
Seit unsere Häufigkeitsverzeichnisse mit Hilfe eines R 300 hergestellt werden, erscheinen Vertrauensintervall und relativer Fehler neben der absoluten, der relativen und der kumulativen Häufigkeit sowie dem „ränge" als Begleitinformationen zu jeder lexikalischen Einheit. Nehmen wir einige Beispiele aus der französischen Wortzählung der Chemie15, die auf einer Stichprobe von n = 35000 beruht: Wort
/ / a b s //rel
//cum
pt
p2
de 3740 0,106857 0,106857 0,103487 0,110337 Solution 149 0,004257 0,288114 0,003626 0,004998 utiliser 70 0,002000 0,365342 0,001583 0,002527 constante 30 0,000857 0,483911 0,000600 0,001224 changement 10 0,000286 0,669598 0,000155 0,000526
et
e2
0,032567 0,173985 0,263324 0,427604 0,841198
0,031540 162 0,148191 60 0,208419 53 0,299487 22 0,456780 9
ränge
Aus diesen wenigen Beispielen, die — wie das ganze Verzeichnis — in der Reihenfolge der abnehmenden Häufigkeit angeordnet sind, wird ersichtlich, daß die relativen Fehler an der Spitze und in den oberen Häufigkeitszonen gering sind. Im unteren Teil werden sie immer größer. Die Ursachen dafür sind in der einfachen statistischen Tatsache zu sehen, daß die Größe des relativen Fehlers und des Vertrauensintervalls dem Umfang der Stichprobe und der Häufigkeit der Elemente bzw. ihrer Merkmale umgekehrt proportional ist. Mit anderen Worten: je größer der Stichprobenumfang, desto kleiner sind die Vertrauensintervalle und die relativen Fehler; je häufiger ein Element in einer Stichprobe bestimmten Umfangs auftritt, desto geringer ist der für seine Häufigkeit berechnete relative Fehler ; oder noch anders formuliert : je größer die Stichprobe und je häufiger das Element, desto mehr nähern sich die Häufigkeiten in der Stichprobe den tatsächlichen Häufigkeiten in der Grundgesamtheit an. Diese Beobachtungen führen uns zu der Schlußfolgerung, daß es für jede statistische Analyse, die auf dem Stichprobenverfahren beruht, irgendwo eine Grenze geben muß, wo Vertrauensintervall oder relativer Fehler zu groß werden, um die Rehabilitât der für die relativen Häufigkeiten ermittelten Werte zu garantieren. Wo man sie sieht, das hängt von den Erwartungen und Forderungen, aber auch von den Absichten ab, die man mit einer solchen Untersuchung verbindet. 15
Durchgeführt von K .
30
LEUBE.
E S A N und A L E K S E E V fixieren sie, einen Stichprobenumfang von n — 400000 vorausgesetzt, bei der relativen Häufigkeit 0,00012 in einem Intervall von 0,00009—0,00016 mit einem relativen Fehler von 33,33—25. Diese Forderung ist theoretisch berechtigt und auch praktisch zu verwirklichen, wenn im Hinblick auf die Rechentechnik, die Arbeitskräfte, die Zeit und die Kosten großzügige Bedingungen gegeben sind. Untersuchungen einer Vielzahl von Fachsprachen, die noch dazu akuten Bedürfnissen dienen sollen, sind in dieser Hinsicht Grenzen gesetzt, die schwerer zu überschreiten sind als die Konfidenzgrenzen des Statistikers. Wir haben deshalb — und aus Gründen, die später dargelegt werden — dem Kriterium der Effektivität den Vorzug vor der Reliabilität gegeben. Die 1200 häufigsten lexikalischen Einheiten, die in unseren Verzeichnissen erfaßt sind, liefern eine so hohe Textdeckung, daß keinerlei Anlaß besteht, den Teil von ihnen, für den ein relativer Fehler von mehr als 33,33% errechnet worden ist, gegen andere auszutauschen. Der offensichtliche Unterschied zwischen Reliabilität und Effektivität sollte eher Anlaß dazu sein, die Anwendbarkeit der üblichen statistischen Prüfverfahren auf die statistische Distribution der Lexik in sprachlichen Texten noch einmal genauer zu überprüfen. Diese Überprüfung hätte mit der Grundfrage zu beginnen, ob die Verwendung einer lexikalischen Einheit im Text tatsächlich ein zufälliges, d. h. von Kontexteinflüssen unabhängiges Ereignis ist und ob nicht für bestimmte Wörter oder Wortklassen die Häufigkeit von vornherein bis zu einem gewissen Grade determiniert ist. Ehe wir zum Begriff der Effektivität kommen, muß noch ein sekundäres Kriterium erwähnt werden, dessen Anwendung im Hinblick auf die Ermittlung der Häufigkeit zu einer notwendigen Modifizierung führt: dieser Modifikator ist der sogenannte „ränge" (nicht zu verwechseln mit dem Rang!) oder die Zahl der Teilstichproben, in denen das sprachliche Element - in unserem Fall das Wort — auftritt. Selbst bei einer rein zufälligen Auswahl der Teilstichproben und unter Beachtung aller Vorsichtsmaßnahmen des Stichprobenverfahrens gibt es keine sichere Gewähr dafür, daß es nicht an einigen Stellen zu einer thematisch bedingten Konzentration von lexikalischen Einheiten kommt, die in der beobachteten Häufigkeit nicht für die Grundgesamtheit charakteristisch sind oder in anderen Texten überhaupt nicht auftreten. Ein beinahe klassisches Beispiel
31
dieser Art ist PUSKINS „kapitanskaja dockä" (Hauptmannstochter) geworden. In der Erzählung gleichen Namens ist es über 300mal vertreten, während es an anderer Stelle in PUSKINS Werken nicht wieder auftritt. In der wissenschaftlichen Prosa sind solche thematischen Konzentrationen ganz normal, weil in vielen Monographien und Aufsätzen ganz spezielle, zuweilen singulare Probleme und Phänomene untersucht werden und weil die meisten Wissenschaften eine rigorose Klassifizierung ihrer Begriffe und ihrer Terminologie durchgesetzt haben. Um den negativen Einfluß solcher thematischer Konzentrationen auf die Repräsentativität unserer Häufigkeitswörterbücher zu vermeiden, werden Wörter mit einem „ränge" kleiner als 4 so weit wie möglich eliminiert. Das bedeutet, daß ein Verzeichnis von etwa 1200 lexikalischen Einheiten auf ungefähr 1150 reduziert wird. Die 50 Wörter mit einem „ränge" unter 4 lassen sich unter Umständen durch weniger häufige mit größerem „ränge" ersetzen. 2.2. Wenden wir unsnundemzweitenKriterium, der E f f e k t i v i t ä t , zu. Unter Effektivität verstehen wir den Grad, bis zu dem unser Worthäufigkeitsverzeichnis Texte der betreffenden Wissenschaftsdisziplin „deckt" oder, andersherum gesehen, das Maß, in dem die Wörter der Fachtexte in unserem Verzeichnis erfaßt sind. Die Effektivität wird meistens durch Textdeckungstests ermittelt und in Prozenten ausgedrückt. Die statistische Linguistik hat uns einige allgemeine Angaben über die Effektivität von Wortschätzen geliefert. So wissen wir v o n GUIRAUD 16 , d a ß
die 100 häufigsten Wörter 60% eines Textes, die 1000 häufigsten Wörter 86% eines Textes und die 4000 häufigsten Wörter 97,5% eines Textes ausmachen („decken"). Wenn auch die Effektivität oder Textdeckung nicht mit dem Grad des Textverständnisses gleichgesetzt werden darf 17 , so ist sie doch ein sehr wichtiger Gesichtspunkt für den Fremdsprachenunterricht im allgemeinen und für die spezialsprachliche Ausbildung im besonderen. Der Lernende sollte sich diese häufigsten Wörter 16
17
P. GUERAUD, Problèmes et méthodes de la statistique linguistique, Dordrecht-Holland 1959, S. 93f. A. MABTINET, Éléments de linguistique générale, Paris 1960 (Russische Übersetzung in „Novoe v lingvistike" III, Moskva 1963, S. 544).
32
unter allen Umständen aneignen; sie sollten Bestandteil jedes Grundwortschatzes und jedes lexikalischen Minimums sein, weil das Funktionieren von Sprachen und Subsprachen ohne sie nicht möglich ist 18 . Die Effektivität einer Worthäufigkeitsliste kann, wie wir bereits festgestellt haben, durch Tests ermittelt werden; sie entspricht in diesem Fall dem arithmetischen Mittel der Ergebnisse aller Tests. Man kann sie aber auch durch Kumulation der relativen Häufigkeiten für die Wörter im Verzeichnis finden. Der russische Teil unseres Häufigkeitswörterbuches der Medizin mag dafür als Beispiel dienen. Die Kumulation der ersten 6 Wörter führt zu folgendem Ergebnis: Wort
//rel.
//rel.cum.
B (in) H (und) npn (bei) c (mit) Ha (auf) ßoJibHOfi (Patient)
0,041714 0,032685 0,015428 0,013085 0,009400 0,008342
0,041714 0,074399 0,089827 0,102912 0,112312 0,120654 usw.
Diese 6 Wörter konstituieren also im Durchschnitt 12% jedes medizinischen Fachtextes. Die weitere Kumulation ergibt eine Effektivität von 0,28 oder 28% für die Wörter von Rang 1 bis Rang 50 und von 0,841 oder 84% für alle 1225 Einheiten. Eine Textdeckung von 84-89% durch die häufigsten 1200 lexikalischen Einheiten-ist nicht nur für medizinische Texte typisch; wir begegnen ihr ebenso in Publikationen der Physik, der Chemie, der Philosophie und anderer Natur- und Gesellschaftswissenschaften. Bei der Fortführung der Liste bleiben die Häufigkeiten niedrig. Selbst eine beträchtliche Erweiterung des Bestandes der Häufigkeitswörterbücher ließe die Effektivität nur geringfügig steigen. Das ist der Hauptgrund dafür, daß wir unsere untere Grenze bei etwa 1200 Wörtern ziehen. Andere Ursachen liegen bei den Kosten und dem Zeitaufwand, der durch die Vergrößerung der Stichprobenumfänge verursacht würde. 3. Wenn man die beiden Kriterien - Reliabilität und Effektivität - von den praktischen Bedürfnissen des Fremdsprachenunter18
Näheres dazu s. L. H O F F M A N N , Die Bedeutung statistischer Untersuchungen f ü r den Fremdsprachenunterricht. Glottodidactica I I I / I V , Poznan 1969.
3 Fachsprachen
33
richts her miteinander vergleicht, dann erweist sich das zweite als wichtiger und leichter handhabbar. Aber es existiert noch ein anderer Grund dafür, daß wir letzterem den Vorzug geben. Man sollte zwei Arten von Effektivität unterscheiden : die theoretische und die praktische. Die theoretische Effektivität entspricht, wie schon gesagt worden ist, der kumulativen relativen Häufigkeit oder der mittleren Textdeckung; sie erreicht im allgemeinen 84—89%. Die praktische Effektivität liegt beträchtlich höher, weil sie zusätzliche Faktoren berücksichtigt, die Textdeckung und Textverständnis ohne direkten Zuwachs im Häufigkeitswörterbuch selbst steigern. Diese Faktoren sind: 1. die Sachkenntnis des Spezialisten, die ihm bei der Entscheidung hilft, was in einem bestimmten Kontext möglich oder sogar obligatorisch ist; 2. das Auftreten von Internationalismen, Lehnwörtern und ähnlichen lexikalischen Einheiten, die jedem Fachmann hinlänglich bekannt sind; 3. die Kenntnis der Wortbildungsmodelle einer Sprache, speziell der Derivation, die es dem Lernenden gestattet, Wurzeln und Stämme unseres Häufigkeitswörterbuchs in anderen Wörtern des Textes zu erkennen; 4. die Modelle, nach denen eine Wortart von der anderen abgeleitet werden kann, z. B. das Adverb vom Adjektiv. Infolgedessen steigt die Effektivität der häufigsten 1200 Wörter einer Subsprache von Wissenschaft und Technik über 90% hinaus, zuweilen bis auf 93%. 4. Wenn wir dem Kriterium der Effektivität den Vorzug geben, dann ist das auch in anderer Hinsicht vorteilhaft. So kann der Stichprobenumfang beträchtlich reduziert werden, sofern die Stichprobe nur genügend homogen ist. Das ist von großer Bedeutung für die ökonomische Seite der Sprachstatistik. Einige Autoren, wie z. B. FBUMKINA 19 , EPSTEIN 2 0 und GTTIRAUD21, sind nach Berechnungen verschiedener Art zu einem sehr großen Stichprobenumfang gelangt. Ihre Forderungen zur Gewährleistung der Réhabilitât der ersten 1000 lexikalischen Einheiten liegen bei n = 400000 bis 1000000. Wollte man die Berechnungen von Frumkina auf die Texte bestimmter Subsprachen von Wissenschaft und Technik übertragen, in denen die Wiederholungsrate der Lexik weit höher und die unterschiedliche Lexik weit geringer ist als in Werken der 19 20
21
s. Anm. 10. H. H. JOSSELSON, The Russian Word Count and Frequency Analysis of Grammatical Catégories of Standard Literary Russian, Detroit 1953. s. Anm. 10.
34
künstlerischen Literatur, so gelangte man zu einem Stichprobenumfang von n = 103000 für jede wissenschaftliche oder technische Disziplin. Nachdem jetzt die Untersuchungsergebnisse für etwa 15 Subsprachen vorliegen, kann man zu gewissen Verallgemeinerungen übergehen. Dabei stellt sich heraus, daß im Hinblick auf die Effektivität ein Stichprobenumfang von n = 35000 als günstig gelten kann. Wenn der Stichprobenumfang auf 50000 oder darüber hinaus erweitert wird, ergibt sich nur ein geringfügiger Anstieg der Textdeckung. Der Gewinn an Reliabilität läuft auf einen begrenzten Austausch von lexikalischen Einheiten und gewisse Umbesetzungen in den unteren Rängen hinaus. Eine Reduzierung des Stichprobenumfangs auf n = 20 000 22 hingegen bringt nur einen Verlust von 50 bis 100 Wörtern in den letzten Positionen mit sich; die Textdeckung sinkt dabei um höchstens 1% ab. Diese interessanten Vergleiche haben nicht nur praktische Bedeutung; sie bestätigen außerdem die Richtigkeit der Hypothese, daß auch gut ausgewählte kleine Stichproben für bestimmte Grundgesamtheiten repräsentativ sein können. Positive Ergebnisse wurden in unserem Fall auch dadurch erzielt, daß Gegenstand der statistischen Untersuchungen (statistisches Element) nicht Wortformen, sondern Lexeme bzw. Wörterbuchgrundformen waren. Die Anzahl der Einheiten, d. h. der verschiedenen Wörter, wird dadurch klein, ihre Häufigkeiten und folglich auch die Kumulation oder Textdeckung höher gehalten als bei der gleichen Zahl von Wortformen. Das ist natürlich für die Wortzählung im Russischen mit seinem ausgeprägten Flexionssystem von weit größerer Bedeutung als für analoge Ermittlungen zum Englischen, wo die Zahl flektierter Formen im untersuchten Text viel kleiner ist. Viele Fragen, die mit der Reliabilität und Effektivität sprachstatistischer Untersuchungen zusammenhängen, bedürfen noch der Klärung23. Aber auch andere Probleme müssen gelöst werden, 22 23
3*
s. Anm. 9. s. dazu Mezvuzovskaja konferencija po voprosam castotnych slovarej i avtomatizacii lingvisticeskich rabot, Leningrad 1966 (Thesen); Castotnye slovari i avtomaticeskaja pererabotka lingvisticeskich tekstov, Minsk 1968 (Thesen); Statisticeskoe izucenie stilej jazyka i stilej reci, Gor'kij 1970 (Thesen); Avtomatiöeskaja pererabotka teksta metodami prikladnoj lingvistiki, Kisinev 1971 (Thesen); Statistika reöi, Leningrad 1968.
35
Probleme, die sich nicht aus der statistischen Analyse, sondern aus dem Wesen der Sprache selbst ergeben. 5. Wenn wir einfach sagen, daß wir Wörter zählen, dann liegen die Dinge gar nicht so einfach24. Die Schwierigkeit besteht allerdings nicht darin, daß wir keine Definition des sprachlichen Phänomens Wort hätten; im Gegenteil: es gibt zu viele Begriffsbestimmungen. Es bleibt uns deshalb für unsere Zwecke nichts anderes übrig, als mit den Mitteln des gesunden Menschenverstandes festzulegen, was ein Wort sein soll. Und es gibt noch ein anderes Argument, das unsere Vorstellung vom Wort als statistischem Element prägt: das Argument der EDV. Die Segmentierung muß so einfach und exakt wie möglich sein, so daß die Definition in den meisten Fällen nur lauten kann: das Wort ist eine Graphemkette, die am Anfang und am Ende von einer Lücke begrenzt ist. Einer der Nachteile dieser Lösung besteht darin, daß alle analytischen Formen auf ein Wort reduziert werden müssen, wobei Hilfswörter ebensogut ausgelassen wie auch gesondert gezählt werden können. Eine noch schlimmere Folge dieser Art von Segmentierung ist die Isolierung von „Wörtern", die zusammengehören, weil sie — in den Subsprachen von Wissenschaft und: Technik meistens Termini — eine Bedeutung tragen, die nichts mit der Summe der Bedeutungen ihrer Teile (Konstituenten) zu tun hat. Diese Schwierigkeit kann allerdings durch ein System von Verweisen überwunden werden. Der Benutzer des Häufigkeitswörterbuches erkennt dann, daß die Häufigkeit des jeweiligen Wortes nicht aus seinem isolierten Auftreten, sondern aus seinen Kookkurrenzen zu erklären ist, die sich ebenfalls als Einzelwörter im Verzeichnis finden oder, wenn ihre Häufigkeit so gering ist, daß sie unberücksichtigt bleiben müssen, den häufigsten Kookkurrenten zugeordnet werden. Diese Lösung ist auf jeden Fall praktikabler als die Einführung eines notwendigerweise stets unvollständigen Kookkurrenz-Registers, dessen Einheiten im Text schwer zu identifizieren und deshalb als diskrete statistische Elemente nicht zu zählen sind. Außerdem käme es auf diese Weise zu einem Absinken vieler Häufigkeiten. 24
Morfologiöeskaja struktura slova v jazykach razliönych tipov, MoskvaLeningrad 1963; L . HOFFMANN, Zur Definition des Wortes als Grundeinheit (statistisches Element) in lexikalischen Häufigkeitsuntersuchungen. Wissenschaftliche Zeitschrift der Karl-Marx-Universität Leipzig, Gesellschafts- und Sprachwissenschaftliche Reihe, 21. Jahrgang (1972), Heft 1.
36
6. Ein ganz anderes Problem tritt uns bei der weiteren Analyse des Einzelwortes entgegen. F ü r den Fremdsprachenunterricht ist die Kenntnis der Häufigkeiten bestimmter Affixe, ihrer Produktivität bei der Bildung oder Derivation neuer Wörter von Nutzen. Aus diesem Grunde lohnt es sich, die Affixe, besonders die Suffixe der Substantive, auch unabhängig von den Wurzeln und Stämmen zu zählen, bei denen sie auftreten. Das ist einmal möglich, wenn man sie gesondert erfaßt, speichert und zählt. Sie werden dabei praktisch wie selbständige Wörter behandelt. Bei Versuchen haben wir uns davon überzeugt, daß dieses Verfahren zu aufwendig ist. Ein weiterer Nachteil ist die fehlende Assoziierbarkeit und Korrelierbarkeit verschiedener Affixe einerseits und verschiedener Wurzeln und Stämme anderseits. Günstiger ist ein anderer Weg: die Herstellung spezieller alphabetischer Wortlisten, die nach Wortarten getrennt sind. Von dieser Grundlage aus lassen sich Häufigkeit und Produktivität der Affixe insgesamt, im Hinblick auf bestimmte Wortarten und bei jedem Einzelwort leichter beobachten 25 . F ü r unsere Wörterbücher genügte eine Rangliste der häufigsten Affixe ohne Angabe genauer Werte, belegt mit einigen Beispielen. Genauere Angaben sind anderen Beiträgen des vorliegenden Sammelbandes zu entnehmen. Hier soll nur festgehalten werden, daß in den Fachtexten von Wissenschaft und Technik einige wenige Suffixe besonders häufig auftreten, wobei sich die Häufigkeiten von Subsprache zu Subsprache unterscheiden können. Wenn wir diese Suffixe kennen, dann können wir hinter die extensive Behandlung der Wortbildung im fachsprachlichen Unterricht einen Schluß punkt setzen. Die Affixe können in zweckmäßiger Reihenfolge eingeführt werden, zuerst die in der betreffenden Subsprache häufigsten und produktivsten, dann die selteneren, und auf einen beträchtlichen Teil der in der normativen Grammatik aufgeführten kann man ganz verzichten 26 . 7. Eine der wichtigsten Voraussetzungen für die Reliabilität und Effektivität unserer Häufigkeitswörterbücher ist die Homogenität der Texte, aus denen die Stichproben entnommen werden. Es werden nur gedruckte Texte berücksichtigt; dabei handelt es sich vorwiegend um allgemein verwendete Standardwerke und Hoch25 26
Denkbar wäre auch der Weg über rückläufig alphabetisierte Verzeichnisse. Beispiele s. Anm. 6. 37
schullehrbücher mit Überblickscharakter (60%) sowie um nicht allzu spezielle Fachzeitschriften der letzten Jahre (40%). Eines der Haupthindernisse, die der Auswahl homogener Stichproben im Wege stehen, ist die wachsende Differenzierung und Integration der modernen Wissenschaft(en). Jedermann weiß, daß es heute kaum noch möglich ist, feste Grenzen zwischen solchen Wissenschaften wie Medizin, Chemie, Biologie usw. zu ziehen, und daß anderseits die Untergliederung der Wissenschaften in Teildisziplinen auf ernste Schwierigkeiten stößt. Das nächste Ärgernis entsteht bei der Frage, welche der Teildisziplinen die wichtigste ist, welche den zweiten Platz einnimmt und — diese Frage sollte man nie stellen - welches die unbedeutendste ist. Wenn wir uns in diesem Zusammenhang eines elementaren physikalischen Begriffs bedienen wollen, so können wir vom spezifischen Gewicht der Stichproben sprechen. In diesem Punkt wird und kann es keine vollständige Einmütigkeit, sondern nur eine gegenseitige Übereinkunft geben. So sind wir z. B. nach Beratungen mit Vertretern der Medizin zu der Auffassung gelangt, daß diese Wissenschaft in etwa 25 Teildisziplinen aufgegliedert werden kann: Chirurgie, Innere Medizin, Stomatologie, Orthopädie usw. Unter Berücksichtigung der internationalen Entwicklung und folglich auch der Notwendigkeit, sich über diese durch die Lektüre fremdsprachiger Publikationen zu informieren, wurde der Chirurgie und der Inneren Medizin das größte spezifische Gewicht zugesprochen, so daß sie je 25% zur Gesamtstichprobe Medizin beisteuerten. Die 23 anderen Disziplinen trugen dann oft ebenfalls mit unterschiedlichen Anteilen - die übrigen 50% bei. Die Anatomie blieb völlig unberücksichtigt. Nach diesen grundsätzlichen Entscheidungen im Hinblick auf die Zusammensetzung der Textbasis kann eines der üblichen Stichprobenverfahren angewendet werden. Analog wurde bei den statistischen Untersuchungen zum Wort^ schätz der Physik, der Chemie, der Mathematik und auch bei den Gesellschaftswissenschaften vorgegangen. Die Ergebnisse waren in bezug auf die Distribution der Lexik außerordentlich günstig. Selbst Texte aus Disziplinen, die bei der Auswahl der Stichproben unberücksichtigt geblieben waren oder einen unbedeutenden Platz eingenommen hatten, wurden von unseren 1225 lexikalischen Einheiten in hohem Maße gedeckt (mindestens zu 75%). Zweifellos droht dieser Art der Stichprobenauswahl der Vorwurf der Einseitigkeit. Aber dazu sind drei Bemerkungen zu machen: 38
1. Der überwiegende Teil der wissenschaftlichen Information und Kommunikation wird in schriftlicher bzw. gedruckter Form veröffentlicht und ausgetauscht, so daß die Wahl der Quellen gerechtfertigt erscheint; 2. in vielen Subsprachen von Wissenschaft und Technik gleicht sich die mündliche Sprachausübung (Vorlesungen, Diskussionsbeiträge, Berichte u. a.) der schriftlichen immer mehr an; besonders im Wortschatz gibt es kaum Unterschiede; 3. unser praktisches Ziel ist es, wie eingangs erwähnt, die Studenten zur Lektüre ihrer Fachliteratur zu befähigen; dazu ist der Wortschatz durchaus angemessen, wenn er noch durch einige Schlüsselwörter der Terminologie und Regeln zur Wortbildung ergänzt wird. Noch einige abschließende Bemerkungen zum Stichprobenverfahren : Die Stichprobe wird einem Textkorpus von mindestens 5000 Seiten wissenschaftlicher Literatur entnommen. Ihr Gesamtumfang beträgt n = 35000 Wortstellen. Nach ein paar Experimenten, bei denen die Stichprobe in Teile von 1000, 500, 200 und 100 Wortstellen untergliedert wurde, stellte sich heraus, daß ein Teilstichprobenumfang von 200 den Bedürfnissen am ehesten gerecht wird. So werden 175 Textausschnitte mit einer Länge von je 200 Wörtern in regelmäßigen Intervallen aus dem für die betreffende Wissenschaft repräsentativen Textkorpus entnommen und auf ihren Wortschatz hin untersucht. Die Intervalle sind nicht zu groß, und wir können sicher sein, daß uns nicht zu viele wichtige Themen entgehen. 8. Nachdem wir die Reliabilität, vor allem aber die Effektivität unserer Häufigkeitswörterbücher im wesentlichen nachgewiesen haben, können wir nun zu der Feststellung zurückkehren, die wir zu Beginn getroffen haben, nämlich daß die Spezifik der Subsprachen von Wissenschaft und Technik auf der Ebene der Lexik weit deutlicher hervortritt als auf den anderen sprachlichen Ebenen. Die Prämisse war, daß sich unser Student, gedrängt durch die Bedürfnisse seines künftigen Berufs, einen speziellen Wortschatz aneignen muß, der gegenüber dem Allgemeinwortschatz der Schule und den Wortschätzen anderer Subsprachen signifikante Unterschiede aufweist. Außerdem lassen sich die Kosten und der Arbeitsaufwand für mechanisierte oder automatisierte lexikostatistische Untersuchungen nur rechtfertigen, wenn sie wirklich einen so speziellen Wortschatz zutage fördern. Wo sollte man nun die Signifikanzschwelle ansetzen? Wenn man von anderen Untersuchungen ausgeht, dann erscheint es gerecht39
fertigt, einen Unterschied von ^ 0,5 im Wortschatz als signifikant anzusehen, d. h. mindestens 50% der 1200 häufigsten Wörter sollten für die Lexik einer Subsprache charakteristisch sein. Um herauszufinden, ob das für unsere Häufigkeitswörterbücher zutrifft, mußten wir diese mit anderen für das Russische, Englische und Französische existierenden vergleichen, die auf Stichproben aus der künstlerischen Literatur, der Publizistik und der Alltagskonversation basieren 27 . Danach wurden die Häufigkeitsverzeichnisse der untersuchten Subsprachen miteinander konfrontiert. Ohne allen Korrelationen im einzelnen nachzugehen, kann man jetzt schon einige allgemeingültige Feststellungen treffen: Der Vergleich zwischen den ersten 1200 Einheiten einer fachsprachlichen Worthäufigkeitsliste einerseits und einer allgemeinsprachlichen Worthäufigkeitsliste andererseits zeigt eine Identität zwischen 25% und 37%. Hier einige Beispiele: Wissenschaft
Sprache
Identität m. Gemeinsprache 28
Physik Medizin Philosophie
Russisch Russisch Russisch
2 6 , 3 8 o/ 0 28,69% 3 7 , 0 8 o/o
Die Prozentsätze für das Englische liegen ein wenig, die für das Französische beträchtlich darüber. Eine der Ursachen für die positivere Korrelation im Französischen liegt in der geringen Anzahl von Fremdwörtern bzw. Lehnwörtern in Texten der wissenschaftlichen Prosa. Der Vergleich zwischen Worthäufigkeitslisten der Subsprachen, bei dem ebenfalls die häufigsten 1200 Einheiten berücksichtigt wurden, ergab eine stärkere Identität (40-50%). Die Korrelation ist enger innerhalb der Gesellschaftswissenschaften einerseits und innerhalb der Naturwissenschaften andererseits, weniger eng zwischen Gesellschafts- und Naturwissenschaften. Hier einige Beispiele: The Russian Word Count and Frequency Analysis of Grammatical Categories of Standard Literary Russian, Detroit 1953; E. A. § T E J N F E L ' D T , Castotnyj slovar' sovremennogo russkogo literaturnogo jazyka, Tallin 1 9 6 3 ; E. L . T H O R N D I K E and I. L O R G E , The Teacher's Word Book of 3 0 0 0 0 Words, New York 1 9 4 4 ; H . S. E A T O N , An English, French, German, Spanish Word Frequency Dictionary, New York 1961; G. E. V A N D E R B E K E , French Word Book, New York 1 9 3 4 . 28 s. Anm. 8. 27
40
H . H . JOSSELSOST,
Wissenschaft A
Wissenschaft B
Sprache
Identität
Physik Physik Physik Philosophie Philosophie
Medizin Philosophie Chemie Medizin Pädagogik
Russisch Russisch Russisch Russisch Russisch
46,5 % 46,0% 50,0% 40,08% 51,7%
Aus diesen wenigen Beispielen ist zu ersehen, daß zwischen den Fachwortschätzen von Wissenschaft und Technik und dem Wortschatz der Gemeinsprache schon in den oberen Häufigkeitszonen, von denen oft behauptet wird, sie enthielten nur „allgemeine Wörter", signifikante Unterschiede bestehen. Die negative Korrelation macht das Anliegen der spezialsprachlichen Ausbildung besonders deutlich. Aus weniger negativen oder stärker positiven Korrelationen zwischen den einzelnen Fachwortschätzen lassen sich unter Umständen Schlußfolgerungen für die Zusammenfassung der Lernenden verschiedener Wissenschaften in bestimmten Ausbildungsphasen und für die Herstellung gemeinsamer Lehrmaterialien ziehen. 9. Die eben angeführten Vergleiche, besonders die mit der Gemeinsprache, tragen auch zur allgemeinen semantischen Charakterisierung der häufigsten lexikalischen Einheiten wissenschaftlicher Texte bei. Unter den ersten 400 treffen wir natürlich nahezu alle Präpositionen, Konjunktionen und Pronomen an. Dann gibt es da einige Wörter mit einer ziemlich weiten und allgemeinen Bedeutung, in der englischen Wortliste der Medizin z. B. die Substantive result, form, time oder die Verben cause, find, make usw. Aber es gibt auch eine ganze Menge von Wörtern, die die betreffende Wissenschaft sofort kennzeichnen. Das erste Substantiv ist patient (19), gefolgt von anderen wie blood (22), disease (28), cell (29), fibre (36), lesion (40) usw. Von diesen 400 Wörtern lassen sich 81 Substantive und 17 Adjektive im russischen, 56 Substantive und 13 Adjektive im englischen sowie 48 Substantive und 19 Adjektive im französischen Verzeichnis ziemlich eindeutig als Lexik medizinischer Texte identifizieren. Einige andere werden nur in ihrer speziellen wissenschaftlichen Bedeutung verwendet, z. B. Operation, treatment, symptom, concentration usw. Die gleichen Relationen sind auch für die Häufigkeitswörterbücher der Physik, der Chemie und der anderen Natur 41
Wissenschaften gültig; geringer ist der Grad der Spezialisierung bei den Gesellschaftswissenschaften. Wenn in diesem Beitrag — wie in dem Sammelband überhaupt — vorwiegend von der quantitativen Analyse der Fachsprachen die Rede war, so deshalb, weil deren Spezifika in statistischen Parametern am besten' zu erfassen sind. Gerade in den letzten Bemerkungen zur Semantik deutet sich jedoch die Notwendigkeit einer gründlicheren qualitativen Interpretation und Klassifizierung des Fachwortschatzes an, die künftigen Untersuchungen vorbehalten bleibt.
KARLHEINZ
HECKEL
Fragen cler Theorie und Praxis statistischer Erhebungen zur Lexik in der sowjetischen Presse, dargestellt am Zentralorgan IZVESTIJA
Aus dem Grundtenor des VIII. Parteitages der SED, das Leben der Werktätigen in der D D R schöner und reicher zu gestalten, resultiert die Hauptaufgabe des Fünfjahrplanes: das materielle und kulturelle Lebensniveau auf der Grundlage eines hohen Entwicklungstempos der sozialistischen Produktion, der Effektivierung und Intensivierung des wissenschaftlich-technischen Fortschrittes und des Wachstums der Arbeitsproduktivität kontinuierlich zu steigern. F ü r die wissenschaftliche Forschung insgesamt und die Linguistik insbesondere harren in dieser Hinsicht mehrere unaufschiebbare Aufgaben der Lösung 1 . Eine davon ist die „Erarbeitung wissenschaftlicher Grundlagen und rationeller Verfahren für die Verbesserung des Sprachunterrichts" 2 , wie sie im Beschluß des Politbüros des ZK der SED „Die weitere Entwicklung der marxistischleninistischen Gesellschaftswissenschaften in der D D R " als langfristige Forschungsarbeit in den siebziger Jahren postuliert wird. Es ist kaum möglich, gleichzeitig auf allen Ebenen des Zeichensystems der Sprache mit der Analysearbeit zu beginnen. Aus pragmatischen Gründen wurde Untersuchungen zur Lexik, d. h. der Ermittlung und Bearbeitung von Wortschätzen, das Primat eingeräumt, was auf dieser Elementarstufe der Herstellung wissenschaftlicher Grundlagen für die Vermittlung sprachlicher Fähigkeiten und Fertigkeiten gerechtfertigt erscheint. Die lückenlose Aneignung der Lexik einer Fremdsprache kann allerdings - zumindest f ü r die hier interessierenden Ziele - schwerlich Orientierungspunkt einer Strategie des Lehrens und Lernens sein. Wir 1
2
Zu den Aufgaben der Sprachwissenschaft in der D D R nach dem VIII. Parteitag. Fremdsprachen 3/1972, S. 159. Die weitere Entwicklung der Gesellschaftswissenschaften. Einheit 12/1968, S. 1401.
43
stimmen deshalb einer Konzentration auf das Grundlagenwissen 3 , einer Restriktion des Stoffes auf das Wesentliche, Typische, Charakteristische, Häufige 4 zu, um den Lernenden auf rationelle Art und kürzester Wegstrecke zu dem für unsere Zwecke gewünschten sprachlichen Endverhalten zu führen. Eine mathematische (quantitative) Methode f ü h r t dabei, da sie dieser Zielstellung und dem Charakter des Untersuchungsgegenstandes, der über eine asymptotische Zahl von Zufallsvariablen verfügt, entspricht, zur exakten Formalisierung und objektiven Quantifizierung der Verhältnisse und Beziehungen im Gegenstandsbereich, d. h. sicher zum Ziel, die hochfrequentierten sprachlichen Zeichen (Lexeme) bestimmter Kommunikationssphären, die ein wissenschaftlich begründetes Fundament für Lehrmittel, Lehrbücher, Wortschatzminima, Häufigkeitswörterbücher, lexikographische Arbeiten u. ä. abgeben können, zu ermitteln und abzubilden. Die Verfahren der Psychometrie fanden in unserer Erhebung keine Verwendung 5 . Untersuchungsgegenstand ist in unserem Falle die Lexik im Zentralorgan IZVESTIJA, die Bestandteil der spezialsprachlichen Ausbildung an der Sektion Journalistik der Karl-Marx-Universität ist. Diese Lexik umfaßt nicht nur „eine thematisch eingeengte Kommunikationssphäre 0 ", sondern nahezu sämtliche Kommunikationsbereiche einer Sprachgemeinschaft. Aus diesem Grunde sind wir nicht nur berechtigt, sondern genötigt, einen unserer Erhebung angepaßten, eigenständigen methodischen Weg zu beschreiten, der eingängige, graduierte Lösungsangebote realisierbar machen soll. Vorliegende Arbeit beschäftigt sich deshalb mit der Problematik der ersten Etappe eines langfristigen Forschungsvorhabens, in der vor allem beabsichtigt ist, ein theoretisch begründetes, technologisch praktiziertes und experimentell auf Réhabilitât geprüftes Muster 3
4
5
6
A . N E U B E R T , Die Hauptaufgaben der Sektion 'Theoretische und angewandte Sprachwissenschaft' an der KMU. Fremdsprachen 2/1969, S. 85. L . H O F F M A N N , Prolegomena zu einem Programm für die Untersuchung der Wissenschaftssprache und der methodischen Probleme der fachbezogenen Fremdsprachenausbildung. Wissenschaftliche Zeitschrift der HumboldtUniversität zu Berlin, Ges.-Sprachw. R. XVIII, 3/1969, S. 369. F . A T T N E A V E , Psychological probability as a function of experienced frequency. Journal of Expérimental Psychology 2/1953. J. P. G U I L F O R D , Psychometric methods, New York 1954. P. F R A I S S E , G . N A I Z E T , C . F L A M E N T , Fréquence et familiarité du vocabulaire. Problèmes de Psycho-linguistique, Paris 1963 und andere. L. HOFFMANN, a. a. O., S. 369.
44
für Folgeerhebungen zur Lexik in der sowjetischen Presse vorzulegen. Besondere Aufmerksamkeit gilt hierbei der Entwicklung einer Methode zur repräsentativen Darstellung der Zusammensetzung der Grundmenge durch thematisch konfinierte Teilmengen und der repräsentativen Verteilung der Zahl der Versuche, die notwendig sind, um signifikante Resultate zu erhalten. Die traditionelle Nominalskalierung der erfaßten Merkmalsausprägungen wird durch eine umfangreiche, rechnergesteuerte Fehlerrechnung ergänzt. Im Mittelpunkt steht dabei die Berechnung der Konfidenzgrenzen der relativen Häufigkeiten. Die Rangoszillation soll uns die Handhabe für eine wissenschaftliche Einteilung der Menge A (hochfrequentierte sprachliche Zeichen) in eine stabile und instabile Klasse von Lexemen geben. Explizite Reliabilitätstests liefern das positive Urteil über die Tragfähigkeit der vorgeschlagenen und praktizierten Methoden und Technologien der Erhebung. In der zweiten Etappe des Forschungsvorhabens werden bei veränderter Technologie (Lochstreifen, Reduzierung der Zahl der Versuche, Eliminierung stabiler Merkmalsausprägungen u. ä.) Erhebungen zu weiteren thematisch konfinierten Teilmengen der Grundmenge unternommen. Die gewonnenen Statistiken können u. a. dazu benutzt werden, um Lehrmaterialien auszurüsten, die den Übergang vom Lehrtext der EOS zur Fachprosa entsprechender Wissenschaftsdisziplinen stützen und erleichtern. Jetzt wird es auch möglich, die gewonnenen Statistiken bei gleichzeitiger Erarbeitung einer zuverlässigen Korrelationstheorie für vielgliedrige linguistische Reihen untereinander vergleichbar zu machen, wodurch signifikante Informationen über Gemeinsamkeiten und Besonderheiten der Grundmenge gewonnen werden. Die Korrelation mit andersgearteten Grundmengen kann ebenfalls in Angriff genommen werden. Durch eine Faktorenanalyse der Korrelationskoeffizienten können die Distanzen verschiedener Grundmengen exakt mathematisch ausgedrückt werden. Auch terminologische Arbeiten finden reiches Material vor. Für eine befriedigende quantitative Bescheibung der Verteilungsverhältnisse in der Grundmenge sind aber die Daten der lexikalischen Ebene allein nicht ausreichend. Deshalb wird in der dritten Etappe des Forschungsvorhabens die Verteilung auf syntaktischer Ebene erforscht werden müssen, die auch stilistische und semantische Probleme einschließen kann. Die Zahl statistischer Erhebungen auf verschiedenen Zeichenebenen, die an unterschiedlichen Sprachen vorgenommen wurden, 45
ist kaum hinreichend zu belegen. Die Erforschung und quantitative Beschreibung statistischer Gesetzmäßigkeiten in den Massenkommunikationsmitteln im allgemeinen und in der sowjetischen Presse insbesondere erfreute sich nur in einer geringen Zahl von Publikationen spezieller Aufmerksamkeit. Die zeitlich erste und repräsentative Erhebung legte R. C. ELDRIDGE 7 vor. Ziel seiner Erhebung war die Einführung eines begrenzten Vokabulars für eine universale Verwendung, welches er am sichersten in der Zeitung zu finden glaubte. Der Anstoß, die häufigste Lexik tschechischer Tageszeitungen zu erfassen, geht auf V. PRIHODA 8 zurück. Über zehn J a h r e arbeiteten dann J . K O R E J S und H . KOREJSOVÄ 0 an der Fertigstellung ihres Häufigkeitswörterbuches. Da sie erstmals für diese Grundmenge auch die Merkmalsausprägung .morphologische Kategorie' registrierten, brachten sie für die Erhebungstechnologie Neues, für die repräsentative Darstellung der Grundmenge jedoch keine Orientierungshilfen. Eine Erhebung f ü r das Arabische stammt von M. BRILL j0 , die erstmals das Ziel verfolgte, Schüler und Studenten zu befähigen, arabische Tageszeitungen lesen zu können, die in „Palestine and the neighbouring countries" erschienen. Die Statistiken sollten den Grundwortschatz der arabischen Tageszeitungen bilden. Eine beachtenswerte Erhebung legte für das amerikanische Englisch A. TURYGINA u vor, die ihre Grundmenge von 100000 Zufallsvariablen auf die Jahre 1961-66 verteilte. I n diesem Zeitraum untersuchte sie 15 (Tages-)Zeitungen. Sie gliederte ihre Grundmenge in sieben Hauptgenres. F ü r das Französische hat I. A. ISENIN*2 eine Erhebung realisiert. Die Grundmenge betrug 120000 Zufallsvariable aus 16 Presseerzeugnissen. Die gewonnenen Statistiken sollen die Hauptstile und Genres widerspiegeln. I m Laboratorium für mathematische Linguistik am Institut f ü r Sprache und Literatur der Akademie der Wissenschaften 7
R . C. E L D R I D G E , Six Thousand Common Words, their Comparative Frequency and what can be done with them, Niagara Falls 1911. 8 V. PÄIHODA, Mereni zäsoby slovni u deti. Zprävy III. sjezdu pro vyzkum ditete, Praha 1927. 9 J. K O R E J S , H. K O R E J S O V Ä , Slovnik nasich novin, Praha 1938. 10 M. BRILL, The Basic Word List of the Arabic Daily Newspaper, Jerusalem 1940. 11 A. T U R Y G I N A , Öastotnyj slovar' anglijskich i amerikanskich gazetnych tekstov. Statistika reci, Leningrad 1968. 12 1. A. I S E N I N , O dastotnom slovare pod-jazyka sovremennoj francuzskoj pressy. Statistika reci, Leningrad 1968.
46
der Lettischen SSR wurde 1966-67 die Lexik von sieben Zeitungen und drei gesellschaftspolitischen Zeitschriften untersucht 13 . Die Grundmenge bestand aus 300000 Zufallsvariablen, die zu Je 1000 Wortstellen auf 300 Stichproben verteilt wurden. Auf Grund der Vielschichtigkeit und Differenziertheit der Sprache der Presse muß ein einheitliches Prinzip der Selektion praktiziert werden. Die Autoren konfinieren in fünf thematische Gruppen: 1. Literaturwissenschaft, Malerei, Musik, Theater, Architektur und Filmkunst ; 2. Sport und Artikel zu verschiedenen Themen, die sich nicht klassifizieren ließen; 3. Wissenschaft, Technik, Landwirtschaft und Industrie; 4. Innen- und Außenpolitik; 5. Volksbildung, Pädagogik und moralisch-ethische Probleme. Für die „¿idové kursy ruätiny pri SCSP" in Houstec wurde im Rahmen eines Studentenwettbewerbs in den Jahren 1948-50 aus sechs sowjetischen Zeitungen und Zeitschriften eine Menge von 113032 Wortstellen erfaßt und von F R . M A L T R 1 4 ZU einem Häufigkeitswörterbuch zusammengestellt, das für eine Verständigung und die Lektüre der sowjetischen Presse ausreichen sollte. Vor der Erhebung wurden die sprachlichen Zeichen in drei Kategorien eingeteilt : a) Wörter, die in Schrift und Bedeutung im Russischen und Tschechischen gleich sind (otec, novy, délat) ; b) Wörter, die in der Schrift gleich sind, deren Bedeutungen aber differieren (strana — russ: Land, tsch. : Partei)-, c) Wörter, die in der tschechischen Sprache andersgeartet sind. Registriert wurden nur die sprachlichen Zeichen der Kategorien b und c. Diese Erhebung erfüllt zweifellos die Anforderungen für Hörer in Russischkursen mit Tschechisch als Muttersprache. Da unsere Studenten Deutsch als Muttersprache sprechen, dürfen die sprachlichen Zeichen der Kategorie a nicht fehlen. Eine weitere, nach Abschluß unserer ersten Arbeiten veröffentlichte Erhebung unterbreiteten G. P. P O L J A K O V A und G. J. S O L G A N I K 1 5 , die eine statistische Erhebung von je 100000 Wortstellen aus den Zentralorganen IZVESTIJA und PRAVDA für die Jahre 1960-69 nach zehn Themenkreisen vornahmen. In jede thematisch konfinierte Teilmenge gelangten 10000 Wortstellen aus beiden Zentral13
T . JAKTJBAITE, D . GULEVSKA, V . OZOLA, R . P R Ü S E , A . RTTBINA, N .
SIKA,
Latviesu valodas biezuma vardnice, I I sëj, Laikraksti un zurnali, Riga 1969. 14 F. MALÎB, Russko-ëesky slovnik nejdûlezitëjsich slov pro ëetbu sovetského tisku, Praha 1952. 15 G . P . POLJAKOVA, G . J. SOLGANIK, Castotnyj slovar' jazyka gazety, Moekva 1971. 47
Organen. Ziel ihrer Arbeit war, jene hochfrequentierten sprachlichen Zeichen statistisch zu ermitteln, die das Fundament für Wortschatzminima und Lehrtexte zur Zeitungslektüre bilden könnten, sowie über die Struktur der Zeitungssprache (gazetnyj jazyk) Aussagen zu machen und nach Möglichkeit stilistische Besonderheiten der Zeitungssprache zu illustrieren. Alle diese Erhebungen lieferten uns wichtige Orientierungshilfen für die eigene Technologie oder bestätigten bei Grundsatzfragen den von uns gewählten Weg. Die Kardinalfrage, deren explizite Beantwortung kein Statistiker umgehen darf, berührt den Reliabilitätsgrad der gewonnenen Statistiken. Werden sämtliche im Sinne der Erhebung definierte Zufallsvariable — wie das bei endlichen Kollektiven möglich ist — registriert, reflektieren die Statistiken die tatsächlichen Parameter der Grundmenge. Vollerhebungen werden aber immer nur in wenigen Fällen praktizierbar sein. Sie bilden den statistischen Idealfall. Die Erfassung sämtlicher Zufallsvariablen einer Grundmenge ist dagegen oft unmöglich, nicht notwendig oder unzweckmäßig. Das bedeutet aber nicht, daß man über die unbekannten Parameter von Grundmengen mit asymptotischer Zahl von Zufallsvariablen keine oder nur dubiose Informationen sammeln kann. Die Restriktion auf Stichproben, deren Werte allerdings nur mit den tatsächlichen Parametern der Grundmenge konvergieren, bleibt dann der einzige Ausweg, um überhaupt Kenntnisse über die in der Grundmenge herrschenden Distributionsgesetzmäßigkeiten zu erwerben. Um größtmögliche Approximation an die unbekannten Parameter der Grundmenge zu erzielen und dadurch das Unterlaufen der Reliabilität der Statistiken zu erschweren, sind flankierende Vorkehrungen, die von der Methodenlehre der Statistik präskribiert werden, unabdingbar. Sie sollen Störfaktoren ausschalten helfen. Diese dirigistischen Maßnahmen bezwecken, äaß die in die Teilmenge gelangten Partien bezüglich bestimmter Gesichtspunkte das annähernd gleiche Ergebnis bringen, das die Erfassung sämtlicher Zufallsvariablen ergeben hätte. Neben der eindeutigen Definierung der Zähleinheit in A und NON-A ist die sachliche, zeitliche und territoriale Abgrenzung der Grundmenge zu postulieren. Weiter ist die Zahl der Versuche, die dem Gesetz der großen Zahlen genügen muß, relevant. Die repräsentative Art und Weise der Distribution der Zahl der Versuche schließt den Kreis prophylaktischer Maßnahmen zur Sicherung der Reliabilität der Statistiken. 48
Es bedarf kaum eines Beweises, daß die hier interessierende Grundmenge außerordentlich heterogen zusammengesetzt ist. Diese Heterogenität rührt daher, daß nahezu alle Kommunikationssphären vertreten sein, daß alle Menschen Partner der Zeitung werden können. Die Interessen dieser Partner sind unterschiedlich, was sich in vielgestaltigen Inhalten niederschlägt. Man geht dabei wohl nicht fehl in der Annahme, daß alle Situationen, die in der objektiven Realität anzutreffen sind, sprachlich formuliert in der Grundmenge auftreten können. Die Beseitigung der Ungleichförmigkeit der Zusammensetzung, die sich störend auf die Reliabilität der Statistiken auswirkt, bleibt Wunschbild. Ihre Zurückdrängung und Milderung ist aber möglich. Wir gehen von der Prämisse aus, daß das Kommunikationsnetz der natürlichen Sprache, wenn wir die einzelnen Kommunikationssphären mit s2, s3 . . .sn kodieren, für alle Kommunikationssphären S=
z
s(
=1 beträgt. Jede dieser Kommunikationssphären beinhaltet eine gewisse Menge Informationen, die hauptsächlich in dieser Sphäre entstehen und weitergegeben werden16. Diese Formel erlaubt für die repräsentative Darstellung der komplizierten Zusammensetzung unserer Grundmenge eine geeignete Entscheidungsfindung und ist ein wichtiger Markstein zu reliablen Statistiken. Dadurch wird zum Ausdruck gebracht, daß die Ursachen für die Heterogenität letzten Endes in der menschlichen Tätigkeit zu suchen sind, daß für diese differente menschliche Tätigkeit ein bestimmter, für jeden dieser Kommunikationsbereiche charakteristischer, den potentiellen kommunikativen Effekt gewährleistender Vorrat sprachlicher Zeichen vorhanden sein muß. Diese Mengen sprachlicher Zeichen und deren Bedeutungen, die auf dieser Stufe unbeachtet bleiben mußten, werden in unterschiedlichen Kommunikationssphären unterschiedlich sein - und demnach unterschiedliche statistische Strukturen aufweisen. Durch die repräsentative Darstellung der heterogenen Grundmenge vermittels kommunikativer (thematisch konfinierter) Teilmengen wird dieser Gesetzmäßigkeit Rechnung getragen. Auf Grund von Voruntersuchungen erhielten wir Aufschluß über die wesentlichen Teilmengen der Grundmenge. Es ergaben sich 16
i
i
L . D O L E Z E L , Verojatnostnyj podchod k teorii chudozestvennogo stilja. Voprosy Jazykoznanija 2/1964, S. 19.
Fachsprachen
49
zwölf kommunikative (thematisch konfinierte) Teilmengen: 1. Bereich der Gesellschaftswissenschaften, 2. Bereich der Politik, 3. Bereich der Produktionssphäre, 4. Bereich der Landwirtschaft, 5. Bereich der Kultur, 6. Bereich der Landesverteidigung, 7. Bereich des Handels, 8. Bereich des Gesundheitswesens, 9. Bereich des Sports und der Körpererziehung, 10. Bereich der Naturwissenschaften, 11. Bereich der literarischen Publizistik und 12. Bereich der Miszellaneen. Hierbei kann nicht verschwiegen werden, daß die Übergänge zwischen den Teilmengen fließend sind, da es mitunter nicht möglich ist, bestimmte Texte nur einer kommunikativen Teilmenge zuzuordnen (Doppeltitel, fachliche Überforderung des Autors usw.). Außerdem liegt es auf der Hand, daß die Widerspiegelung der komplizierten Zusammenhänge der objektiven Realität durch die Presse eine derart exakte Limitierung kaum zuläßt. Nur weiterführende Analysen können erbringen, ob die Zahl der kommunikativen Teilmengen erhöht oder reduziert werden muß, was ja bei unserem langfristig angelegten Forschungsvorhaben ohne Schaden zu realisieren sein wird. Die zeitliche Abgrenzung wird durch einen synchronen Schnitt von 1963—72 garantiert. Als territoriale Abgrenzung ist sinngemäß die Einengung auf ein Zentralorgan - die IZVESTIJA - zu begreifen. Der Umfang jeder Teilenquete wurde in Übereinstimmung mit anderen Arbeiten17 auf 35000 Wortstellen je kommunikative Teilmenge festgelegt. Besondere Relevanz kommt dem Umfang der Einzelstichprobe und der Distribution der Zahl der Versuche zu. Um einem ungerechtfertigten Vordringen themenorientierter sprachlicher Zeichen entgegenzuwirken, ist der Umfang der Einzelstichprobe auf 200 Wortstellen limitiert worden. Nach der Pars-pro-toto-Methode wurden die einzelnen Teile so arrangiert, daß sie ein Miniaturbild des Ganzen abgeben, d. h. das Ganze in verkleinertem Maßstab repräsentieren. Als Alternative zu anderen Verteilungsmöglichkeiten der Zahl der Versuche, die aus den Besonderheiten der Textstellen publizistischer Materialien (unterschiedliche Textlänge und stilistische Kompositionsteile) resultiert, wurde die Arealverteilung entwickelt, die die Zusammensetzung der Teilmengen repräsentativer widerspiegelt und die Gleichmöglichkeit der Ausgänge sichert. Vor allem räumt sie auch die Möglichkeit ein, überzufällige Unterschiede in der statistischen 17
L. HOFFMATW, Zur maschinellen Analyse der statistischen wissenschaftlicher Texte (Masch.), Leipzig 1966, S. 129—130.
50
Struktur
Struktur der sprachliehen Zeichen der stilistischen Kompositionsteile sichtbar zu machen. Die vorgeschlagene Arealverteilung, die eine modifizierte Form des spreäd sampling ist, kommt als optimale Variante dem geforderten Miniaturbild nahe. Die zur Erhebung ausgewählte kommunikative Teilmenge 10 setzte sich aus 301 Textstellen zusammen. Durch Losentscheid wurden 175 Texte ermittelt. An diesen 175 Texten wurden 175 Versuche, die j e 200 aufeinanderfolgende sprachliche Zeichen umfaßten, unternommen. An jeder Textstelle wurde nur ein Versuch durchgeführt. Auf Grund des Umfanges der Einzelstichproben teilten wir die Textstellen in Areale zu je 200 aufeinanderfolgenden sprachlichen Zeichen. So entstanden z. B . an einer Textstelle mit 1000 sprachlichen Zeichen fünf Areale. Das erste Areal wurde durchgängig als Einleitungs- und das letzte Areal als Schlußfolgerungsteil betrachtet. Von den durch Losentscheid erhaltenen 175 Texten umfaßten 32 drei Areale, 31 vier Areale, 41 fünf Areale, 28 sechs Areale, 25 sieben Areale und 18 acht und mehr Areale. Wir erhielten somit sechs Gruppen mit Texten relativ gleicher Länge. Die Texte wurden von 1—175 auf Losen durchnumeriert und zu den sechs Gruppen zusammengestellt, d. h. die Gruppe mit drei Arealen erhielt 32 Lose, die Gruppe mit 4 Arealen 31 Lose usw. Die Lose wurden verschlossen. Letzter Schritt war die relative Gleichverteilung der Versuche auf die Areale der jeweiligen Gruppe. Für die Gruppe mit drei Arealen wurden drei Mengen zu 11, 11 und 10 Losen gebildet; für die Gruppe mit vier Arealen vier Mengen zu 8, 8, 8 und 7 Losen usw. Es ergab sich die Arealverteilung auf Tafel 1. Damit war die Vorbereitung der Technologie abgeschlossen. Durch die Darstellung und Bearbeitung der Statistiken werden bestimmte Informationen über den tatsächlichen Zustand der Grundmenge vermittelt. Es ist dies die erste Stufe eines Erkenntnisprozesses. Auf dieser Stufe erhalten wir nur Informationen über die monovariable Verteilung der sprachlichen Zeichen und deren quantitative und qualitative Merkmalsausprägung in der Grundmenge. Die Gewinnung einer solchen Information ist ein wesentliches Anliegen unserer Arbeit auf dieser Etappe. Um zu bestimmten Erkenntnissen über die monovariable Verteilung der sprachlichen Zeichen in einer Grundmenge vorzudringen, besteht das Bedürfnis, die unübersichtliche Mannigfaltigkeit und scheinbare Regellosigkeit in der Grundmenge zu überwinden. Dies kann u. a. dadurch geschehen, daß die Reihen der absoluten Zahlen4«
51
Tafel 1 Zahl der Zufallsvariablen
1. 2. 3. 4. 5. 6. 7. 8. Zahl Areal Areal Areal Areal Areal Areal Areal Areal der Textstellen
600 1. Gruppe
023 048 089 110 121 138 143 151 166 080 169 007 020 044 061 103 135 158 173 022 040 052 065 100 120 134 147 157 010 028 034 122 153 055 078 102 161 098 155 160
006 043 071 096 113 123 127 137 142 163 168 005 031 041 072 087 114 139 075 009 017 045 062 076 094 109 154
012 090 105 111 118 133 140 144 159 167 001 014 046 081 104 125 141 170 002 018 050 097 070 146 172 130
013 047 091 107 069 136 162 016 059 079 082 106 128 132 175
021 032 053 093 129 149 165 148
015 033 067 084 164 039 095 126
008 024 030 124 035 101 112 150 086 115
004 019 037 051 145 025 056 117 156 049 119
026 029 060 099
083 066
027 038 088 116 171 011 036 063 152 042 077
40
37
37
25
19
800 2. Gruppe
1000 3. Gruppe
1200 4. Gruppe
1400 5. Gruppe 1600 6. Gruppe
52
32
31
41
28
074 057 092
064 054 073
085 058
003 068 174
108 131
9
6
2
25 18 175
werte geordnet, zu Klassen und Gruppen vereint und zu ihrer Charakterisierung abgeleitete Zahlenwerte errechnet werden, die zu Erkenntnissen über die statistische Struktur, über die in der Grundmenge herrschenden statistischen Gesetzmäßigkeiten usw. führen können. Diese abgeleiteten Zahlen liefern uns eine verwertbare Primärinformation. Bei Teilerhebungen sind sämtliche Werte an die unbekannten Parameter der Grundmenge angenäherte (mittlere) Werte. Trotz des nicht zu vermeidenden Fehlers, der ihnen anhaftet, kommt diesen approximativen Daten Erkenntniswert zu. Unumgänglich ist es aber auch, daß das Maß der Variabilität dieser Mittelwerte — das Streuungsmaß — angegeben wird, denn dieses Streuungsmaß hat ebenfalls einen von den Mittelwerten unabhängigen Erkenntniswert. Das Streuungsmaß vertieft die Erkenntnis über den Charakter der Mittelwerte. Die umgearbeitete Grundmenge kann graphisch oder tabellarisch angeordnet werden. Werden Statistiken nach bestimmten Prinzipien gegliedert, spricht man von Skalierung. Es gibt unterschiedliche Möglichkeiten der Datenskalierung. Für die monovariable Verteilung interessiert uns die Nominalskalierung, die für ein sprachliches Zeichen x (Lexem) verschiedene Klassen und Kategorien definiert. Unsere Orientierungstafel der abnehmenden Häufigkeit (OAH) enthält sowohl die traditionellen Spalten für Rang (rank), Zahl der Lexeme, kumulierte Zahl der Lexeme, kumulierte relative Häufigkeit, sprachliches Zeichen, absolute Häufigkeit, relative Häufigkeit, Quellen (ränge) als auch die neuen Spalten für die untere und obere Konfidenzgrenze (Konfigurationsgrenze) der Streuung und die unteren und oberen Werte der Irrtumswahrscheinlichkeiten sowie die qualitative Merkmalsausprägung ,Wortart'. Da es sich um einen rechnergesteuerten Ausdruck handelt, ist die Spaltenabfolge den Potenzen des R 300 angepaßt (Tafel 2). Von den 35000 im primären und sekundären Datenspeicher registrierten sprachlichen Zeichen waren 5634 unterschiedliche Lexeme, die sich auf 105 Ränge verteilten. Im 1. Rang treffen wir ein sprachliches Zeichen, das 1299mal aufgenommen wurde, während im 105. Rang 2855 Lexeme mit der Häufigkeit 1 stehen (Tafel 3). Die 5634 unterschiedlichen sprachlichen Zeichen teilten wir in die Menge A (häufige sprachliche Zeichen) und die Menge B (weniger häufige sprachliche Zeichen). Die sprachlichen Zeichen der Menge A wurden nach den quantitativen Merkmalsausprägungen ,absolute Häufigkeit ^ 5' und ,ränge ^ 4' ausgesondert. Die absolute Häufigkeit 5 wird im 101. Rang erreicht. Für die Ränge 1-101 hat der R 300 1343 sprach53
Tafel 2.
WORTAUSWAHL RUSS-JOURN WORTGRUNDFORM
RANG 023
RANG 022
RANG 021
RANG 020 RANG 019 RANG 018 RANG 017 RANG 016 RANG 015 RANG 014
ZAHL DER LEXEME
KUM. Z . D. LEXEME
KUM. REL. HAEUFIGKEIT
0002
00033
0,234574
ZAHL DER LEXEME
KUM. Z . D. LEXEME
KUM. REL. HAEUFIGKEIT
0003
00030
0,224860
ZAHL DER LEXEME
KUM. Z . D. LEXEME
KUM. REL. HAEUFIGKEIT
0003
00027
0,214756
ZAHL DER LEXEME
KUM. Z . D. LEXEME
KUM. REL. HAEUFIGKEIT
0004
00023
0,200768
ZAHL DER LEXEME
KUM. Z . D. LEXEME
KUM. REL. HAEUFIGKEIT
0001
00022
0,197141
ZAHL DER LEXEME
KUM. Z . D. LEXEME
KUM. REL. HAEUFIGKEIT
0001
00021
0,193255
ZAHL DER LEXEME
KUM. Z . D. LEXEME
KUM. REL. HAEUFIGKEIT
0001
00020
0,189110
ZAHL DER LEXEME
KUM. Z . D. LEXEME
KUM. REL. HAEUFIGKEIT
0001
00019
0,184835
ZAHL DER LEXEME
KUM. Z . D. LEXEME
KUM. REL. HAEUFIGKEIT
0002
00017
0,176027
ZAHL DER LEXEME
KUM. Z . D. LEXEME
KUM. REL. HAEUFIGKEIT
0002
00015
0,166959
ABSOLUTE HAEUFIGKEIT
PRI
0023
VREM = KORABL NO
0025 0025 0025
OT PROCESS C < ASTICA
0026 0026 0026
ZA ISSLEDOVANIE NAUKA NOVYI!
0027 0027 0027 0027
0028
MY
0030
PO
0032
IZ
0033
N AS < # NERGIA
0034 0034
GOD C < ELOVEK
0035 0035
RELATIVE HAEUFIGKEIT
K O N F I G U R A T I O N S G R E N Z E N IRRTUMSWAHRSCHEINL. UNTERE OBERE U N T . WERT O B . WERT
QUELLEN
0,002979
0,001985
0,004471
0,500717
0,333604
021
0,003238 0,003238 0,003238
0,002193 0,002193 0,002193
0,004781 0,004781 0,004781
0,476354 0,476354 0,476354
0,322610 0,322610 0,322610
022 017 022
0,003368 0,003368 0,003368
0,002298 0,002298 0,002298
0,004935 0,004935 0,004935
0,465359 0,465359 0,465359
0,317530 0,317530 0,317530
025 024
0,003497 0,003497 0,003497 0,003497
0,002404 0,002404 0,002404 0,002404
0,005089 0,005089 0,005089 0,005089
0,455050 0,455050 0,455050 0,455050
0,312696 0,312696 0,312696 0,312696
0Z6
0,003627
0,002509
0,005242
0,445358
0,308089
026
0,003886
0,002722
0,005547
0,427604
0,299487
028
0,004145
0,002936
0,005851
0,411714
0,29160S
030
0,004275
0,003044
0,006003
0,404371
0,287902
031
0,004404 0,004404
0,003152 0,003152
0,006154 0,006154
0,397388 0,397388
0,284344 0,284344
023 030
0,004534 0,004534
0,003260 0,003260
0,006305 0,006305
0,390736 0,390736
0,280922 0,280922
032
016
021 026 024
028
WORTART
o 1-t © O IM
r» TH iO •pH
• .© 0 Ssa
t» O
i
I < H H T H X H H < H > H N
M n ^ N o o a o - i i i n M M c i i N o c i n n n n
a •s h M «e 5 ® NTSrf
33
—i Oí CO oo 9» co a> M t- IN t- OC t- io IN © œ «M o co (M (N IN IN « i-l i-t IN 5*5 •>* io CO
fH
56
*H ® QO M IN >o 00 00 t- CO CD « M l-H 1-1 1-1 tH
i—1 « eo 00 05 O «S ce t»—1 « r t 1-1H - rT—t1-1r4ti^i—ii -i^ H - r t M
(MININMINMfIMCICO
o" IO to to 4 I N n ^ l S O t > 0 0 0 0 -n n ra io ^^i^i^i^i^i^i^i^ito lowioionioioio«)® ® e s o o
57
M i.
oo'
t» 10
t- IO IO
LI N IO
05aoOt-*-«ot-o>®eo->l 5 und range > 4
Anteil in % an der an N Menge A
591 243 88 12 228 30 30 18 7 12 18
(46)
4 6 , 2 4 4 o/ 0
(12)
19,014% 6,8860/0
1277
(64)
(5) (1)
3 7 , 9 8 o/o 15,440/o 4 , 5 6 0/0
0 , 9 3 8 o/o 17,840% 2,3480/o
l,070/o 12,78% 7,180/0
2,348% 1 , 4 0 8 o/o 0 , 5 4 7 o/ 0 0 , 9 3 8 o/ 0 1 , 4 0 8 o/ 0
11,28% 5,80% 0,550/o
99,919%
99,92%
0 , 5 1 o/ 0 2,770/0
1
0 , 0 7 8 0/0
0 , 0 8 o/„
1278
99,9970/o
100,00%
64
~
Maschinenfehler
1342 1
Vom R 300 ausgedruckt
1343 sprachliche Zeichen
63
Tafel 6 Verteilung der qualitativen Merkmalsausprägung .Wortart' in der Klasse der 403 Lexeme des Zeichenzentraums
in der Menge A Differenz von 1278 Lexemen in % auf die Menge A als 100 bezogen
Wortart
Zahl der Lex.
in %
Zahl der Lex.
in %
Substantive Adjektive Adverbien Prädikative Verben Pronomen Präpositionen Konjunktionen Kopulae Modalwörter Partikeln
189 63 21 5 53 20 21 11 4 1 15
46,898% 15,633% 5,220% 1,241 o/o 13,151 o/o 4,9630/n 5,220% 2,720% 0,991% 0,244% 3,718 o/0
591 243 88 12 228 30 30 18 7 12 18
46,244% 19,014% 6,886 o/0 0,938% 17,840% 2,348 % 2,348 o/0 1,408% 0,547 o/0 0,938% 1,408%
403
99,999%
1277 1
99,919% 0,078 o/0
403
99,999%
1278
99,9970/ 0
Abkürzung
+ + + + + + -
0,654% 3,3810/0 1,6660/ 0 0,303 o/o 4,6890/ 0 2,615% 2,872% 1,312% 0,4440/ 0 0,6940/o
+
2,3100/o
der Verben, d. h. daß es überhaupt weniger Verben gibt, die eine beträchtliche Generalisation aufweisen. Das gleiche kann auch für die Adjektive gelten, die im Zeichenzentrum allgemeinste Eigenschaften der objektiven Realität zum Ausdruck bringen und deshalb weniger variierbar zu sein scheinen. Zu erwarten war, daß die Zahl der Synsemantika einen größeren Anteil am Zeichenzentrum ausmachen würde als an der Menge A. Allerdings erwiesen sich die Differenzen als weitaus geringer als angenommen. Ihr prozentualer Anteil am Zeichenzentrum rechtfertigt aber keineswegs die Behauptung, daß dieses Zeichenzentrum vorwiegend aus ihnen bestehe - ihr Anteil ist nur höher als an der Menge A. Einen hohen Prozentsatz erreichten auch die Partikeln, die ein stilistisches Merkmal unserer Grundmenge sein könnten. Allgemein kann man wohl die Meinung vertreten, daß die qualitative Merkmalsausprägung ,Wortart' in den prozentualen Summenwerten der Menge A und im Zeichenzentrum der Menge A kaum signifikante Unterschiede aufweist. 64
Um einige weitere Fragen beantworten, die erforderliche Grundlage für die Rationalisierung der aufwendigen Erhebungstechnologie und den empirischen Beweis für die Reliabilität der Rangoszillation erbringen zu können, ließen wir Kontrollsets zu 20000 und 7800 sprachlichen Zeichen anfertigen. Zuerst vergleichen wir die qualitative Merkmalsausprägung .Wortart' der Teilauswertungen bis zur absoluten Häufigkeit > 3 und ränge > 3 (Tafel 7). Tafel 7 Wortart
Prozentualer Anteil der qualitativen Merkmalsausprägung ,Wortart' bei 35000 sprachl. Zeichen
Substantive Adjektive Adverbien Prädikative Verben Pronomen Präpositionen Konjunktionen Kopulae Modalwörter Partikeln
Abkürzung
bei 20000 spr. Zeichen
bei 7 800 spr. Zeichen
für 403 Lexeme
für 1278 Lexeme
für 1321 Lexeme
für 858 Lexeme
46,898% 15,633% 5,220% 1,241% 13,151% 4,963 o/o 5,220% 2,720% 0,991% 0,2440/0 3,718%
46,244% 19,014% 6,886 o/0
44,2O90/o 19,531 % 6,9620/0 0,984% 19,304%
43,0170/o
99,999%
99,919 o/o
—
99,999%
0 , 9 3 8 o/0
17,840% 2,348%
17,9490/0 6 , 5 6 5 o/0 l,0490/o 2 0 , 0 4 7 o/0
2,4220/o
3,228%
2 , 3 4 8 o/0
2 , 4 9 8 o/0
3 , 2 2 8 o/0
1,408% 0 , 9 3 8 o/0
1,363% 0,530 0/0 0,833%
1,408%
1 , 2 8 7 o/0
1,7480/0 0,466 0/0 0,710% 1,982%
0 , 5 4 7 o/0
99,9230/0 0,076%
99,989%
0 , 0 7 8 o/0
99,9970/0
99,9990/0
99,989%
—
Ein Vergleich der qualitativen Merkmalsausprägung .Wortart' für 35000, 20000 und 7800 sprachliche Zeichen zeigt, daß der prozentuale Anteil der Adverbien, Prädikative, Pronomen, Präpositionen, Konjunktionen, Kopulae, Modalwörter und Partikeln an den Mengen der häufigsten Lexeme nahezu konstant bleibt. Auch die Prozentquoten der Adjektive unterscheiden sich bei 20000 und 35000 sprachlichen Zeichen kaum. Eine merkliche Bewegung machen nur die Substantive und Verben durch. Je größer die Zahl der Versuche, desto größer der prozentuale Anteil der Substantive 5 Fachsprachen
65
an den häufigsten Lexemen. Je größer die Zahl der Versuche, desto geringer der prozentuale Anteil der Verben an den häufigsten Lexemen. Durch einen Vergleich der OAH soll festgestellt werden, ob sich bereits bei einem Erhebungsumfang von 20000 sprachlichen Zeichen eine befriedigende Annäherung an die unbekannten Parameter der Grundmenge erzielen läßt (Tafel 8). Tafel 8 Qualitative Merkmalsausprägung ,Wortart'
Bei 35000 sprachlichen Zeichen
Bei 20000 sprachlichen Zeichen
waren davon vorhanden Substantive Adjektive Adverbien Prädikative Verben Pronomen Präpositionen Konjunktionen Kopulae Modelwörter •Partikeln Abkürzung
Es fehlten in %
waren davon nicht vorhanden
591 243 88 12 228 30 30 18 7 12 18 1
485 213 81 11 188 29 30 18 5 11 18 1
106 30 7 1 40 1 0 0 2 1 0 0
± ± ± ±
17,9% ll,20/ 0 8,0% 8,3% 17,5% 3,5% o.o% 0,0% 28,5% 8,3% 0,0% 0,0%
1278
1090
188
-
14,7%
Aus dieser Mehrfeldertafel ist ersichtlich, daß von den 1278 Lexemen der Menge A 1090 Lexeme = 85,3% auch bei 20000 sprachlichen Zeichen vorhanden sind, d. h., lediglich 14,7% der sprachlichen Zeichen konnten nicht erfaßt werden. Dies ist eine oberflächliche Erkenntnis. Jetzt muß untersucht werden, was das für Lexeme sind, die die fehlenden 14,7% ausmachen. Welchen Anteil die einzelnen Ränge an den fehlenden 188 Lexemen haben, zeigt Tafel 9. Von den häufigsten 403 Lexemen fehlen 490 Lexemen fehlen 580 Lexemen fehlen 66
0,157%, 0,312%, 0,704%,
IN o CO tI I o o
o o o o o o í O hs iaœ n ot- b—i «os -h -rt in co us oo"
OUI0X91 •lep iq^z aqjSTjnuinjf
I I
co o co O T* t- r-co ocd00oo •rt IN
auiaxeq; apuajqaj
I I
°H SAi^ejaj 9í(jai[mim5j[
U9í}l9S[álJTiejJ eAi^iGy;
O ce o o o o
J9ÍJOM]epOJ\[
I I
bO tí 9 0 f t 0 i 0 1 0 ï 0 ) OÄ 0 5 0 ï 0 5 0 5 0 i 0 5 0 > 0 i ®
M O S ® ^ ® GQ
? 2 S 3 i-^
S
s3 M
o i o ^ i o œ r t H o o i o i o i o - i œ w o ' i « ®
iOSrtH. e î n ^ t í o " o " s í (»* oT e í o ra o " o
oí co
o
i - o o a a i a i o i œ a o œ » w o o c œ » o o o i N W oN ot o -O O Nb i û- M n xr ti ro taan^' CHOO' fHl ti -t ^^ li iol Q œ Ct O DO ^w
co (M
c3 .fi O fti,« 'S g
o
P5 ¿3 5 s
rtNHrtWNW
CO
THIM^H
lOMOOOOlMnsONiÓa^lSNNOOrt o a i n ( o i o N « œ « « i » o ^ o n o o> o " s í f-" h o ^T oo" t>* os m i> ra* « œ" h t-OOOi054
CO Í5 O C-T IO « í
«
" I l cß œ Öß fi " fi 3 o o_~ ® R.S -2
oo" o " « 3 0 u : « ) o a o n t - e ^ o o M s i i o T i i 1-4 1-t
»H
l-t
-»H
T-t C co IN ©
io co >o © TH 1-1
H P 00 S
i-i •-H
Ti CO IN IO co
Grundmenge (im vorliegenden Falle der Teilmenge Naturwissenschaften'). Es gilt nun den Nachweis zu führen, ob die vom R 300 errechnete erwartete Textdeckung durch den empirischen Reliabilitätstest erreicht wird oder nicht. Nach den Leitsätzen der Statistik waren wir berechtigt, unserer Meinung nach unwesentliche Zufallsvariable nicht in die Erhebung einzubeziehen. Solche Auslassungen waren: Kardinalia und Ordinalia, internationale Maß- und Gewichtsbezeichnungen, die Namen der Wochentage und Monate, geographische Bezeichnungen, Marken- und Firmenbezeichnungen, Personennamen, die Partikeln He, HH, JIH, 6H und grammatische Hilfswörter. In den Mehrfeldertafeln 15 und 16 sind weitere Informationen eingetragen, die für den eigentlichen Reliabilitätstest unseres probabilistischen Modells irrelevant sind. Ihre Skalierung wurde aus sprachpraktischen Erwägungen ergänzt. Eine Steigerung der Textdeckung kann durch Internationalismen (wobei wir auf eine ausführliche Darlegung verzichten) erreicht werden. Für unsere Belange genügt die subjektive Entscheidung, ob man vom Lernenden erwarten kann, daß er die Bedeutung solcher Internationalismen vom Deutschen her erschließen kann. Als solche ,erschließbare' Internationalismen KJiaccHHecKHii,
g e l t e n z. B .
njieKCHraac,
ce30H, cTapT, MeTOflHKa, cyMMa,
npoeKT,
pearnpoBaTb.
Eine
weitere
Prozentspalte könnte einen Eindruck davon vermitteln, welcher rezipierbare Wortschatz zur Erhöhung der Textdeckung beitragen könnte. Unter rezipierbarem Wortschatz verstehen wir für unsere Zwecke, daß in der Menge A : a) das Substantiv oder Verbalsubstantiv vorhanden ist, das Verb aber fehlt; b) das Verb vorhanden ist, das Substantiv (Verbalsubstantiv) fehlt; c) das Substantiv vorhanden ist, das Adjektiv (Adverb) jedoch fehlt; d) die Konstituenten von Komposita isoliert vorhanden sind, die Komposita aber fehlen; d) das Lexem ohne Präfix vorhanden ist, mit bekanntem Präfix aber fehlt. Es wurden 18 zusammenhängende Texte mit 14650 nicht in der Erhebung vorhandenen Wortstellen aus sechs Jahrgängen (19641970) des Zentralorgans I Z V E S T I J A und 11 zusammenhängende Texte mit 10574 Wortstellen aus dem Zentralorgan P R A V D A mit unserem probabilistischen Modell empirisch getestet. Zu der erwarteten mittleren Textdeckung (76,25%) ist noch die Standardabweichung zu berechnen. Wir finden sie, indem wir die Formel s = Y (log a -{- log p) — log 100 benutzen. Im einzelnen erhalten wir danach : 77
= =
0,88224 0,37566
—1 —1
= =
0,25790 2,00000
—1
(log n + log p) — log 100 =
0,25790
- 3
^-(log n + log p) — log 100 =
0,62895
2
log 0,7625 + log 0,2375 log n -f log p — log 100
8 = dt 4,2555 % Die einfache Standardabweichung beträgt somit gerundet i 4,25%, die doppelte Standardabweichung i 8,5% und die dreifache Standardabweichung ^ 12,75%. Nach den Lehrsätzen der Statistik bedeutet das, daß durch die einfache Standardabweichung 66%, durch die doppelte Standardabweichung 95% und durch die dreifache Standardabweichung 99% der Fälle erfaßt werden. In unserem Falle ist nun zu prüfen, wie oft der Mittelwert der erwarteten Textdeckung von 76,25% erreicht worden ist. Die untere Grenze der einfachen Standardabweichung lag bei 72%, die der doppelten Standardabweichung bei 67,75% und die der dreifachen Standardabweichung bei 63,5%. Ein Blick auf die Mehrfeldertafeln zeigt, daß nur in drei Fällen bei Reliabilitätstests in der IZVESTIJA (Nr. 1 - 72,58%, Nr. 12 - 74,40%, Nr. 17 - 73,87%) der Mittelwert der erwarteten Textdeckung nicht erreicht wurde. Bei allen Reliabilitätstests wurde demnach nur in 10% aller Fälle die postulierte Bedingung nicht erfüllt. Da aber diese 10% von der einfachen Standardabweichung erfaßt werden, handelt es sich um eine normale Erscheinung, die keiner Interpretation bedarf. Obwohl Korrelationsversuche mit Statistiken anderer Grundmengen durchgeführt wurden, die Erkenntnisse über die monovariable Verteilung hinaus lieferten, konnte diese Problematik noch nicht bewältigt werden, da eine tragfähige Theorie zur Korrelation vielgliedriger linguistischer Reihen fehlt. Trotzdem konnten zumindest Denkansätze erarbeitet werden, die nach Abschluß noch ausstehender Untersuchungen publiziert werden. Die gewonnenen und dargelegten Ergebnisse mögen in ihrer Knappheit gesicherter klingen, als sie es in Wirklichkeit sind oder auch sein können. Eine restlose Aufhellung der vordringlich interessierenden Problematik ist erst nach Abschluß des gesamten geplanten Forschungsvorhabens zu erwarten. Trotzdem geben die vorgelegten Teilergebnisse zu einigen wichtigen auf die gesellschaft78
liehe Praxis bezogenen Verallgemeinerungen berechtigten Anlaß: Sie können für die Planung und Realisierung statistischer Erhebungen zu der hier interessierenden Grundmenge, für die Rationalisierung des Fremdsprachenunterrichtes an der Sektion Journalistik der Karl-Marx-Universität (und an ähnlichen Institutionen) und für die Lösung lexikographischer Aufgaben eingesetzt werden.
CHRISTINE PUCHTA
Einige Besonderheiten russischsprachiger Texte der Physik
Die statistischen Untersuchungen zur Fachsprache der Physik stellen einen Teil der vorwiegend quantitativen Arbeiten des Forschungskollektivs Fachsprachen an der Sektion Theoretische und angewandte Sprachwissenschaft der Karl-Marx-Universität dar. Unmittelbarer Anlaß für diese statistischen Untersuchungen des Wortschatzes russischsprachiger Fachtexte der Physik war das Bestreben, die Effektivität des Fremdsprachenunterrichtes durch Rationalisierung der Lehrmethoden und durch Anwendung wissenschaftlich fundierter Lehrmaterialien zu erhöhen. Dazu jedoch mußte als wesentliche Voraussetzung ein lexikalisches Minimum geschaffen werden, das dem Studenten gerade den Wortschatz vermittelt, den er benötigt, um seine fremdsprachige Fachliteratur in ökonomisch vertretbarer Zeit lesen und auswerten zu können. Ist auch zur Ermittlung eines solchen lexikalischen Minimums, das wiederum Grundlage eines effektiven programmierten Lehrmaterials ist, die Aufstellung der häufigsten Lexik nicht das einzige Verfahren, so stellen die Häufigkeitsermittlungen doch eine äußerst wesentliche Komponente dabei dar, indem sie gewissermaßen den Kern des lexikalischen Minimums ergeben. Weitere Verfahren und Schritte zur Gestaltung eines lexikalischen Minimums f ü h r t L. H O F F M A N N in seinen „Überlegungen zum linguistischen Vorlauf für eine (teil-)programmierte fachbezogene Sprachkundigenausbildung" an, wobei er die Ergebnisse statistischer Häufigkeitsuntersuchungen an den ihnen gebührenden Platz in den Gang zur Schaffung von modernen und hocheffektiven Lehrmaterialien einordnet 1
L. HOFFMANN, Überlegungen zum linguistischen Vorlauf für eine (teil-) programmierte fachbezogene Sprachkundigenausbildung. Wissenschaftliche Zeitschrift der KMU Reihe 1/1972, S. 13-14.
6 Fachsprachen
81
Erstes Ergebnis der Häufigkeitsuntersuchungen zur Fachsprache der Physik war das Häufigkeitswörterbuch der Physik f ü r Russisch, Englisch u n d Französisch „Fachwortschatz Physik. Häufigkeitswörterbuch Russisch, Englisch, Französisch", das im J a h r e 1970 im Druck erschien 2 . Jedoch schon bei der Arbeit an der Zusammenstellung dieses Häufigkeitswörterbuches, aber auch bei der weiteren Bearbeitung u n d Auswertung der maschinell ermittelten D a t e n ergaben sich, vor allem natürlich im Vergleich mit anderen Untersuchungen, einige wesentliche lexikalische u n d auch einige morphologische Besonderheiten russischsprachiger F a c h t e x t e der Physik, deren wichtigste hier dargelegt werden sollen. 1.1. Das in dem Häufigkeitsverzeichnis enthaltene, im Stichprobenverfahren mit Hilfe der Lochkartentechnik ermittelte Häufigkeitsverzeichnis f ü r das Russische u m f a ß t 1114 lexikalische Einheiten, die der abnehmenden Häufigkeit nach angeordnet sind, wobei als Kontrollgröße die Stichprobenverteilung (ränge) eingeschaltet wurde, so d a ß 1114 lexikalischen Einheiten eine absolute Häufigkeit von mindestens 4 haben u n d in mindestens 3 Stichproben vorkommen. Insgesamt wurden — wie bei allen von Mitgliedern unseres Forschungskollektivs bisher durchgeführten Untersuchungen — Stichproben von 35000 lexikalischen Einheiten aus russischsprachigen F a c h t e x t e n der Physik untersucht. E s wurden 175 Stichproben m i t je 200 W ö r t e r n ausgewählt. Davon e n t s t a m m e n 86 Stichproben (also etwa die Hälfte) mit 17200 lexikalischen Einheiten zwei Hochschullehrbüchern u n d stellen einen Querschnitt durch fast alle wichtigen Teilgebiete der Physik dar. 21 Stichproben mit 4200 lexikalischen Einheiten wurden aus dem Standardwerk der theoretischen P h y s i k v o n L . D . LANDAU u n d E . M . LIFSIC, u n d z w a r d e n B ä n d e n
„Mechanika" u n d „Teorija P o l j a " entnommen. F ü r weitere 42 Stichproben mit 8400 lexikalischen Einheiten wurden verschiedene Fachbücher über Mechanik u n d Elektrizitätslehre herangezogen, u n d 26 Stichproben mit 5200 lexikalischen'Einheiten wurden aus Fachzeitschriftenartikeln ausgesucht. 1.2. Aus der so zusammengesetzten Gesamtstichprobe (N = 35000) wurden mit Hilfe der Lochkartentechnik u n d des Rechen2
Fachwortschatz Physik. Häufigkeitswörterbuch Russisch, Englisch, Französisch, Leipzig 1970; 2. Aufl. 1973.
82
automaten ZRA 1 3228 unterschiedliche Lexeme ermittelt (L)3. Dieser unterschiedliche Wortschatz wurde in drei Gruppen eingeteilt : 1.2.1. Dieerste Gruppe bildeten alle Lexeme, die in das Häuf igkeitswörterbuch aufgenommen wurden, mit absoluter Häufigkeit von 1392 bis einschließlich 4 und einem ränge von mindestens 3. In diese Gruppe fallen 1114 Lexeme. 1:2.2. Der zweiten Gruppe gehören alle Lexeme mit den absoluten Häufigkeiten 3, 2, 1 an. Das sind 1937 unterschiedliche Lexeme, 1.2,3. In der dritten Gruppe schließlich wurden die Lexeme zusammengefaßt, deren absolute Häufigkeit zwar 4 und mehr beträgt, die jedoch in weniger als drei Stichproben vorkommen. Mit einer Anzahl von 175 sind das im Verhältnis zu dem zahlenmäßig geringen unterschiedlichen Wortschatz relativ viele. 1.3. Die 1114 Lexeme des Häufigkeitswörterbuches verteilen sich auf 126 Ränge. Im Vergleich mit den ermittelten Häufigkeitswörterbüchern anderer Fachsprachen und auch in bezug auf die relativ geringe Anzahl der in dieses Wörterbuch aufgenommenen Lexeme ist dies eine recht hohe Rangzahl. So verteilen sich im Häufigkeitswörterbuch der Medizin'», Russisch, 1225 Lexeme auf nur 102 Ränge. Und die 1278 Lexeme des Häufigkeitsverzeichnisses zur Sprache naturwissenschaftlicher Texte der Zeitung (Russisch) nehmen auch nur 102 Ränge ein5. Im Häufigkeitsverzeichnis zur 3
4
5
6
6*
Dazu ist zu bemerken, daß diese Zählungen im Jahre 1969 mit heute bereits veralteter Technik vor sich gingen. Die aus unserem Forschungskollektiv folgenden Arbeiten wurden dann mit Hilfe des R 300 durchgeführt und brachten bedeutend exaktere Ergebnisse. Die bei der Wortschatzermittlung Physik erhaltenen Resultate waren auf Grund überalterter Technik und auf Grund der Tatsache, daß mehrere verschiedene Personen in die Kodierungs- und Eingabearbeiten eingeschaltet waren, sehr fehlerhaft und bedurften einer aufwendigen Überarbeitung. Das traf besonders für die Feststellung des unterschiedlichen Wortschatzes zu, der von der Maschine äußerst ungenau ausgegeben worden war. Fachwortschatz Medizin. Häufigkeitswörterbuch Russisch, Englisch, Französisch, Leipzig 1970, S. 11-22. K . H e c k e l , Fragen der Theorie und Praxis statistischer Untersuchungen zur Lexik in der sowjetischen Presse, dargestellt am Zentralorgan IZVESTIJA, (Diss.) Leipzig 1971. R. S c h n e i d e r , Fachsprachliche Besonderheiten der Lexik und Morphologie des Russischen in Texten der marxistisch-leninistischen Philosophie, (Diss.) Leipzig 1971.
83
Fachsprache der marxistisch-leninistischen Philosophie6 sind 1290 Lexeme auf 123 Ränge verteilt, und das Häufigkeitsverzeichnis der Fachsprache der Chemie7 weist eine Verteilung von 1116 Lexemen auf 110 Ränge auf. Trotz dieser Unterschiede bleibt allerdings die Rangverteilung in der Tendenz auch im Häufigkeitswörterbuch Physik mit den anderen angeführten fachsprachlichen Häufigkeitsverzeichnissen gleich: Die obersten Ränge werden — wie in allen Häufigkeitslisten - nur mit einem bzw. zwei Lexemen besetzt. Das trifft im wesentlichen auf die ersten 42 Ränge des Häufigkeitswörterbuches der Physik zu, wobei die Ränge 10, 18, 20 und 22 von je zwei, alle anderen nur von einem Wort eingenommen werden. Ab Rang 43 bis Rang 94 besetzen je 2, 3, 4 bis 8 Wörter einen Rang, und erst ab Rang 95 bis Rang 111 kommen 10 und mehr Wörter auf einen Rang, ab Rang 112 mehr als 20, ab Rang 116 mehr als 30, ab Rang 121 mehr als 50 Wörter. Die Ränge 124,125 und 126 schließlich umfassen jeder mehr als 100 Wörter. 1.4. In den bisher angeführten Zahlen zeigt sich, vergleicht man sie mit den Häufigkeitsverzeichnissen anderer, besonders nichtnaturwissenschaftlicher Wortschätze, auch mit Medizin, bereits eine auffällige Wortarmut der Fachsprache der Physik und neben ihr möglicherweise auch der anderen naturwissenschaftlichen Bereiche. Denn auch das Verzeichnis der Chemie umfaßt nur 1116 lexikalische Einheiten, während das Häufigkeitsverzeichnis der Mathematik und EDV 8 erwartungsgemäß nur 1100 lexikalische Einheiten enthält. Die Eintönigkeit des Wortschatzes der Physik kommt aber noch deutlicher zum Ausdruck beim Vergleich der Gesamtzahl der unterschiedlichen Lexeme, die bei all den angeführten gleichgearteten Untersuchungen jeweils aus der Gesamtzahl von 35 000 lexikalischen Einheiten ermittelt wurden, und in dem Verhältnis von L zu N, das nach M I S T R I K 9 einen Index ergibt (auch L. N . Z A S O R I N A 10 führt ihn bei ihren Untersuchungsergebnissen an), der auch als Variabilitätskoeffizient bezeichnet wird und über die Vielfalt des Wortschatzes 7
8
9
10
Fachwortschatz Chemie. Häufigkeitswörterbuch Russisch, Englisch, Französisch, Leipzig 1973. H. K R U G , Häufigkeitsverzeichnis der Fachsprache der Mathematik und EDV (unveröff.). J . MISTRIK:, Matematiko-statisticeskie metody v statistike. Voprosy Jazykoznanija 3/1967. L . N . ZASORINA, Avtomatizacija i statistika v leksikografii, Leningrad 1966, S. 59.
84
des jeweiligen Sprachbereiches Auskunft gibt. Bei den meisten zugänglichen Untersuchungen umfaßt der unterschiedliche Wortschatz bei 35000 untersuchten lexikalischen Einheiten über 4000, für die Physik wurde, wie bereits angeführt, ein L von 3228 festgestellt. Das ergibt einen Variabilitätskoeffizienten von 0,0913. Zum Vergleich dazu: Fachtexte der Philosophie: 0,116, naturwiss. Texte der Zeitung: 0,1609, Fachtexte der Pädagogik: 0,137 Diese Besonderheit des geringen Wortreichtums der Sprache der Physik ist wohl auf bestimmte Spezifika dieser Wissenschaft selbst zurückzuführen, u. a. auch auf deren Besonderheit bei der Bildung von Wörtern und in der Definition der Begriffe. W. G E R L A C H , der sich als Physiker zugleich intensiv mit der Sprache seiner Wissenschaft beschäftigte (wie auch andere bedeutende Physiker, z. B. W. HEISENBERG), weist darauf hin: „Denn das, was in ihnen auszudrücken ist, war vorher in dem Vorstellungsbereich des Menschen nicht vorhanden und hat damit in unserer Sprache auch kein Äquivalent, kein Symbol. Es kann sogar eine Denkweise erfordern, welche der in unserer Sinneswelt geprägten Denkweise nicht äquivalent ist" i:! . So muß sich die Physik in starkem Maße anderer Symbole als der sprachlichen bedienen, eben der mathematischen Formeln. „Wenn eine Erkenntnis einmal gewonnen ist," sagt W. G E R L A C H , „SO genügen diese Symbole, über sie und mit ihnen zu handeln" J4 . Als Beispiele führt er aus der modernen Physik die mathematisch begründete Voraussage des Positrons, des Mesons der Antimaterie an, und dabei „nicht nur die Voraussage von Dingen, sondern auch das Hinführen zu neuen Denkweisen mit Hilfe der mathematischen Symbole." Damit weist er der Mathematik einerseits und den sprachlichen Formulierungen andererseits bestimmte Rollen zu. „Die Mathematik als Sprache der Physik ist gewissermaßen eine Endstufe" 15 . 11
G. NOWAK, Untersuchungen zum Wortschatz der Pädagogik (unveröff.), Seminarreferat im Forschungskollektiv Fachsprachen. 12 Die Ergebnisse der Untersuchungen für Chemie und Mathematik hierzu waren mir noch nicht zugänglich. 13 W. GERLACH, Die Sprache der Physik. Begleitmanuskript zur Schallplatte 15/2, Stimme der Wissenschaft, Diskographische Dokumente, Frankfurt am Main. 14 ebenda, S. 3. 15 ebenda, S. 3.
85
Die sprachlichen Mittel hingegen bezeichnet er als „Hilfsmittel, welche die Physik benötigt und gebraucht, um von einer Sinneswahrnehmung, von dem Sein der Dinge zu den Ursachen der Dinge zu gelangen" JC . Eine weitere wichtige Rolle für die Wortarmut der Sprache der Physik spielt auch der hohe Abstraktionsgrad dieser Wissenschaft und damit im Zusammenhang die Tatsache, daß die Sprache der Physik die Mehrdeutigkeit vieler Wörter der Gemeinsprache bei ihrer Verwendung im physikalischen Kommunikationsbereich ausschaltet, ihnen eine ganz scharfe Definition gibt und sie so zu einer Art terminus technicus macht. W. GEKLACH zeigt das am Beispiel der beiden Farbadjektive schwarz und w e i ß d i e aber für viele andere stehen. 1.5. Durchgeführte Signifikanztests ergaben, daß die relativ geringe Anzahl lexikalischer Einheiten des Häufigkeitswörterbuches der Physik einen hohen Grad an Textdeckung erbringt. Das ließ auch der errechnete Wert für die kumulative relative Häufigkeit des gesamten Häufigkeitsverzeichnisses, die 0,875385, also 87,5% Textdeckung beträgt, erwarten. Es war also anzunehmen, daß die mittlere Textdeckung der Signifikanztests einen ähnlichen Wert ergab, was auch zehn Textdeckungsproben an Fachtexten, die nicht der Stichprobe angehörten, bestätigten. Es wurden zwei Tests an Band 7 „Teorija uprugosti" des achtbändigen Werkes „Teoreticeskaja fizika" von L. D. L A N D A U und E. M . L I F S I C durchgeführt, die eine Textdeckung von 89,0 und 89,5% ergaben. Rechnet man noch die Internationalismen des Textes dazu, d. h. die Fremdwörter, die in mindestens beiden Sprachen auftreten und für den deutschen Leser sofort Erfaßbar sind, so steigt die Textdeckung in diesen beiden Proben sogar auf 92,5%. F ü r weitere 7 Textdeckungstests wurde aus 7 Fachzeitschriften der Physik des Jahrganges 1969 je ein Abschnitt mit jeweils 200 Wörtern entnommen. Die Textdeckung für die einzelnen Tests bewegte sich hier zwischen 75,0% und 89,5% (einschließlich Internationalismen zwischen 88,0% und 93,5%). Eine Probe entstammte der populärwissenschaftlichen Zeitschrift „Priroda". Diese brachte erwartungsgemäß eine bedeutend geringere Textdeckung, und zwar nur 67,5% (mit Internationalismen 86,5%). iß ebenda, S. 3. " ebenda, S. 9.
86
Insgesamt betrug die mittlere Textdeckung dieser 10 Tests 85,4% Internationalismen 90,5%). Nimmt man die Probe aus dem populärwissenschaftlichen Text heraus, so erhält man als mittlere Textdeckung der 9 an Fachtexten vorgenommenen Signifikanztests 86,2%. 2. Da die Besonderheiten der fachsprachlichen Kommunikation vor allem auf der Ebene der Lexik auftreten, sollen hier im Vergleich mit dem Wortschatz anderer gleichgearteter Untersuchungen und dem der Gemeinsprache die lexikalischen Besonderheiten angeführt werden. 2.1. So seien zur Konfrontation mit der Gemeinsprache die Häufigkeitswörterbücher der russischen Sprache von J O S S E L S O N , S T E J N 18 F E L ' D T und Z A S O K I N A herangezogen . Vergleiche des Wortschatzes mit anderen fachsprachlichen Häufigkeitswörterbüchern, erarbeitet von Mitgliedern unseres Forschungskollektivs Fachsprache, wurden - soweit die Daten zugänglich waren - durchgeführt mit dem Häufigkeitswörterbuch Medizin, Marxistisch-leninistische Philosophie, Chemie, Mathematik/EDV und dem Häufigkeitsverzeichnis zur Sprache naturwissenschaftlicher Texte der Zeitung 19 . Schließlich wurde der Wortschatz noch mit einem Häufigkeitsverzeichnis verglichen, dem eine Analyse von Texten der Fachgebiete Biologie, Chemie, Geologie, Medizin, Mathematik und Physik zugrundeliegt und das unter dem Titel „Castotnyj slovar' obäcenaucnoj leksiki" 1970 an der Lomonosov-Universität Moskau erschien 20 . Weiter wurde für einige Vergleiche zum Wortschatz auch ein bereits vorhandenes Häufigkeitsverzeichnis der Physik von A. S. KOZAK benutzt 2 1 , das die 1 0 2 6 häufigsten von 6 8 4 7 ermittelten unterschiedlichen Wortformen enthält. Die 1114 lexikalischen Einheiten des Häufigkeitswörterbuches der Physik stimmen überein mit: 18
19 20 21
H . H . J O S S E L S O N , The Russian Word Count and Frequency Analysis of Grammatical Categories of Standard Literary Russian, Detroit 1953. E. A. S T E J N F E L ' D T , Castotnyj slovar' sovremennogo russkogo literaturnogo jazyka, Tallin 1963. L . N . Z A S O K I N A , Avtomatizaeija i statistika v leksikografii, Leningrad 1 9 6 6 . vgl. Anm. 2 und Anm. 4 sowie Aura. 6, auch Anm. 5. Castotnyj slovar' obseenaucnoj leksiki, Moskva 1970. A . S . K O Z A K , High Frequency Words and Occurence Forms in Russian Physics, Santa Monica (California) o. J.
87-
Gemeinsprache den 1300 den 1197 den 1024
häufigsten lexikalischen Einheiten des Häufigkeitswörterbuches der russischen Sprache v. E. A. S T E J N F E L ' D T häufigsten lexikalischen Einheiten des Häufigkeitswörterbuches der russischen Sprache v. H . H . J O S S E L S O N häufigsten lexikalischen Einheiten des Häufigkeitsverzeichnisses der russischen Sprache v. L . N . ZASORINA
ZU
26,4%
zu 34,5% ZU 2 8 , 4 %
Fachsprachen den 1290 den 1 2 2 5
häufigsten lexikalischen Einheiten des Häufigkeitsverzeichnisses der Philosophie von R. S C H N E I D E R häufigsten lexikalischen Einheiten des Häufigkeitsverzeichnisses der Medizin von G. A L E X A N D E R und W . ORTLEB
den 1116 den 1100 den 1126 den 1026
häufigsten lexikalischen Einheiten des Häufigkeitsverzeichnisses der Chemie von G. F I E D L E R häufigsten lexikalischen Einheiten des Häufigkeitsverzeichnisses der Mathematik/EDV von H . K R U G häufigsten lexikalischen Einheiten des „Castotnyj slovar' obscenaucnoj leksiki" häufigsten lexikalischen Einheiten des Häufigkeitsverzeichnisses des russischen Wortschatzes der Physik v o n A . S . KOZAK
ZU
46,0%
ZU 4 6 , 5 %
ZU
54,2%
ZU 5 5 , 5 %
zu 57,0%
zu
67,8%
Diese Übersicht gibt Auskunft darüber, daß sich im häufigsten Wortschatz der Fachsprachen ein großer Anteil fachspezifischer Lexik befindet. Das zeigt sich darin, daß die Lexik des Häufigkeitswörterbuches der Physik mit den drei zum Vergleich herangezogenen Verzeichnissen der Gemeinsprache nur zu einem Viertel bis zu einem Drittel übereinstimmt, während sich eine Übereinstimmung von 46 bis 57% mit den fachsprachlichen Häufigkeitsverzeichnissen ergibt. Das läßt Schlußfolgerungen über das Vorhandensein eines gewissen allgemeinwissenschaftlichen Wortschatzes, der möglicherweise 10-15% der fachspezifischen Verzeichnisse ausmachen könnte, ziehen. Diese Frage müßte jedoch noch gründlich untersucht werden. 88
Eine etwas größere Übereinstimmung wäre mit dem Häufigkeitsverzeichnis der Physik von A. S. K O Z A K ZU erwarten gewesen. Man muß jedoch in Betracht ziehen, daß dieses Verzeichnis immerhin fast 100 lexikalische Einheiten weniger enthält als unseres. Ferner sind durch die Verschiedenheit der Methode bei der Aufnahme in diesem Verzeichnis noch etwa 30 lexikalische Einheiten vorhanden, die in unserem Verzeichnis gar nicht erfaßt wurden, wie z. B. Numeralia, Partikeln usw., und damit auch noch aus dem Vergleich herausfallen. Schließlich spielt auch eine gewisse Rolle, welche Quellen den Stichproben zugrundegelegt wurden. Aus alledem mag sich die Übereinstimmung von nur reichlich zwei Dritteln für die Verzeichnisse der gleichen Fachsprache ergeben. Sicher gewänne man auch noch ein anderes Bild, wenn es gelänge, unsere 1114 lexikalischen Einheiten mit eben der gleichen Anzahl von lexikalischen Einheiten des KozAKschen Verzeichnisses zu vergleichen. 2.2. Nach einer Gegenüberstellung mit der Lexik anderer Verzeichnisse bleibt nunmehr die Frage nach dem Wortschatz, der nur im Häufigkeitswörterbuch der Physik anzutreffen ist. Die Zählung ergab, daß von den 1114 lexikalischen Einheiten des Verzeichnisses 150 in keinem anderen der hier aufgeführten Häufigkeitsverzeichnisse vorkommen (ausgenommen ist dabei allerdings das Häufigkeitsverzeichnis der Mathematik/EDV, da ein detaillierter Vergleich des Wortschatzes mit diesem leider noch nicht möglich war). Dieser Teil des Verzeichnisses enthält vorwiegend Substantive (49,3%), etwa je 24% Adjektive und Verben und so gut wie keine anderen Wortarten (3,33%). Untersucht man diesen Teil des häufigsten Wortschatzes nach abnehmender Häufigkeit, so taucht das erste von diesen Lexemen im Rang 78 mit einer relativen Häufigkeit von 0,001514 auf (Es ist das Substantiv TpeHiie). Die Hälfte aller dieser Lexeme befindet sich auf den letzten vier Rängen des Häufigkeitsverzeichnisses. Man kann natürlich nicht etwa sagen, daß dies der fachspezifische Wortschatz sei. Dieser setzt sich aus mehr Lexemen zusammen, die auch unter dem Wortschatz anderer Fachsprachen zu finden sind. Und unter den 150 Lexemen, die nur im Häufigkeitsverzeichnis der Physik angesiedelt sind, befinden sich durchaus auch einige keinesfalls fachspezifische. Doch die Frage der Fachspezifik des Wortschatzes bedarf wohl noch eingehender Untersuchungen und soll auch hier nicht erörtert werden. Wortschatz, der nur im Häufigkeitsverzeichnis Physik vorkommt, geordnet nach abnehmender Häufigkeit : 89
1 TpeHHe 2 KOHfleHcaTop 3 HHAyKIÍHH 4 3aMHKaTb 5 OTClëT 6 npoBOA 7 BpamaTbCH 8 aneKTpocTaTHiecKHñ 9 npoeKi^HH 10 BHXpeBOft 11 OÖMOTKa 12 njiacTHHa 13 aHaJioriiH 14 HHepiJHH 15 reoMeTpHiecKHií 16 OKpyjKHOCTb 17 Booônje roBopH 18 KJIáCCHHeCKHÍt 19 HHTb 20 npHJiaraTb 21 pa3pHAHbiü 22 $HJIbTpaiKHraHHe 79 3aMewaHne 80 3aMKHyTbiñ 81 H30JIHp0BaTb 82 HHAyKTHBHHft 83 MHHMLlit 84 MOmHOCTb 85 npeoßpaäoBbiBaTb 86 nponopi^HOHaJibHOCTb 87 npocTOTa 88 nycTOTa 89 cnepBa 90 TaK ITO 91 ynpyrocTb 92 ypaBHOBeuiHBaTb 93 m a p H K 94 aneKTpoAHHaMHqecKHii 95 3JieKTpOJIH3 96 aJIIOMHHHeBHií 97 BbipOJKAaTbCH 98 HOnOJIHHTb 99 3aKpenjieHHe 100 KCKOMblft
101 KopoÖKa 102 0flH03Ha, HHflymipoBaTjb, HHTerpiipoBaTb, (JniKciipoBaTB und xapaKTepii30BaTi>. Unter den 227 Adjektiven befinden sich 66 Internationalismen und unter den 456 Substantiven 118. 3. Morphologische Untersuchungen der erfaßten Lexeme erbrachten im wesentlichen eine Bestätigung der bereits für die Wissenschaftssprache aufgestellten Besonderheiten gegenüber der Gemeinsprache. Einige morphologische Charakteristika seien hier angeführt. 3.1. Wie bei anderen fachsprachlichen Untersuchungen zeigte sich auch für die Fachsprache der Physik in bezug auf die Reihenfolge der Kasus der Substantive nach abnehmender Häufigkeit als besonders charakteristisch das Überwiegen des Gebrauchs des Genitivs. So stehen von allen 13646 vorkommenden Substantiven der Stichprobe der Physik 5413 im Genitiv, bei der Stichprobe der Medizin sind von 14734 Substantiven 6511 im Genitiv gebraucht. Die Untersuchungen zur Fachsprache der Philosophie ergaben, daß 41% aller Substantive im Genitiv stehen, während in den Untersuchungen zur Gemeinsprache (STEJNFEL'DT) nur 26% aller Substantive im Genitiv vorkommen, dagegen 28,3% im Nominativ aufgeführt sind, der dort im Gebrauch der Kasus an der Spitze rangiert. Der auffallend häufige Gebrauch des Genitivs in der fachsprachlichen Kommunikation ist vor allem darauf zurückzuführen, 93
daß der Genitiv ein wichtiges Mittel zur Attribuierung ist, was wiederum im Zusammenhang zu sehen ist mit der hohen Häufigkeit der Substantive bei der Wortartenverteilung als Ausdruck der Bildung einer hohen Anzahl von Verbalsubstantiven, die dann statt des Akkusativobjektes beim Verb ein Genitivattribut besitzen. 3.2. Ein Vergleich der Verteilung der Substantive auf die Deklinationstypen ergab keinerlei wesentliche Unterschiede zwischen den Ergebnissen der fachsprachlichen Untersuchungen der Physik, der Medizin und der Philosophie. Die Verhältnisse ähneln sich in allen drei Kommunikationsbereichen: das Überwiegen der I. Deklination, in weitem Abstand die II., danach die III. und nur verschwindend wenige Substantive, die den übrigen Deklinationstypen angehören. 3.3. In bezug auf den Stammauslaut hat sich beim Vergleich mit Medizin und Philosophie eine Besonderheit der Ergebnisse der Physik bei den neutralen Substantiven herausgestellt: das häufige Vorkommen des weichen Stammauslautes im Verhältnis zu den beiden anderen Stichproben (Physik 363, Medizin 49, Philosophie 27). Das relativ häufige Auftreten des weichen Stammauslautes bei den Neutra in der Stichprobe der Physik ist sicher zurückzuführen auf die hohe Häufigkeit des Substantivs nojie, das im Häufigkeitsverzeichnis der Physik mit einer relativen Häufigkeit von 0,006028 den Rang 14 einnimmt, in den Häufigkeitsverzeichnissen der Medizin und Philosophie jedoch nicht vorhanden ist. Somit drückt diese Tatsache eigentlich eine lexikalische Besonderheit aus, da sie an die hohe Häufigkeit eben dieses einen Lexems gebunden ist. Überhaupt scheinen sich hinter manchen morphologischen Merkmalen doch lexikalische Besonderheiten, d. h. die besonders hohe Vorkommenshäufigkeit eines oder mehrerer bestimmter konkreter Lexeme zu verbergen, wie das meiner Meinung nach z. B. auch bei den Mitteln zur Bildung der Superlativformen der Adjektive der Fall sein kann und bei einer Reihe anderer Erscheinungen. Solche Merkmale würden wohl nur ein reales Bild ergeben, wenn man sie im Zusammenhang mit dem konkreten Wortbestand untersuchte. 3.4. Bei der Untersuchung der Verben werden im Bereich der Fachsprache der Physik im wesentlichen Besonderheiten der fachsprachlichen Kommunikation gegenüber der Gemeinsprache wie z. B. das Dominieren des imperfektiven Aspektes, der überwiegende Gebrauch des Präsens, des Indikativs usw. sichtbar. Besonderheiten im fachsprachlichen Kommunikationsbereich der Physik 94
'
ergeben sich beim Gebrauch der Partizipien. Hier zeigen sich auch erhebliche Unterschiede gegenüber den Fachsprachen der Medizin und der Philosophie. Bei der Wortartenverteilung zeigte sich bereits ein höherer Anteil an Verben in der Fachsprache der Physik als in den beiden anderen untersuchten. Insgesamt enthält die Stichprobe der Physik 4707 Verbformen, die der Philosophie 3980 und die der Medizin 3556. Davon sind Partizipien: Physik Philosophie Medizin
1375 784 1107
29,2% 19,7% 30,7%
Es ergibt sich also ein Unterschied von Physik und Medizin zu Philosophie von ca. 10%. Für die Gemeinsprache dagegen wurde bei den Untersuchungen von S T E J N F E L ' D T ein Anteil der Partizipien von 7,69% ermittelt. In den angeführten drei fachsprachlichen Stichproben gliedern sich die Partizipien wie folgt auf:
Part. Part. Part. Part.
Prät. Präs. Präs. Prät.
Pass. Akt. Pass. Akt.
Physik
Medizin
Philosophie
720 500 126 29
624 352 63 68
348 303 44 90
Mit 126 Formen des Partizips Präsens Passiv weist die Stichprobe Physik einen sehr hohen Anteil gegenüber Philosophie und Medizin auf, wie überhaupt den bedeutendsten Teil aller Partizipien die Passivformen ausmachen. Sie bilden mit insgesamt 846 Formen gegenüber 529 aktiven Partizipien 63% des Gesamtbestandes an Partizipien. An Adverbialpartizipien kommen in der Stichprobe der Physik 222 vor gegenüber nur 66 in der Stichprobe der Medizin. Hier offenbaren sich deutliche Unterschiede einmal zur Gemeinsprache, aber auch innerhalb der einzelnen fachsprachlichen Kommunikationsbereiche. Das gesamte Gebiet der Verben verdient noch eingehendere Untersuchungen. Die wenigen angeführten Beispiele zeigen, daß es zwar nicht sehr wesentliche, aber immerhin einige interessante fachsprachliche Besonderheiten auf der Ebene der Morphologie gibt. 4. Es sollen nun einige Gegenüberstellungen des konkreten Wortbestandes verschiedener Häufigkeitsverzeichnisse in ihren Anfangs95
teilen vorgeführt werden. L . N. Z A S O K I N A bringt in ihren Untersuchungsergebnissen solche Gegenüberstellungen zwischen ihrem Häufigkeitsverzeichnis und dem von E. A. S T E J N F E L ' D T 22. Sie trennt dabei nach Wortarten und ordnet die entsprechenden Lexeme der beiden Verzeichnisse nach abnehmender Häufigkeit an. Hier seien jedoch zunächst die ersten 20 Wortstellen des Häufigkeitsverzeichnisses Physik denen des gemeinsprachlichen Verzeichnisses von L. N. Z A S O R I N A gegenübergestellt, danach den zwei fachsprachlichen, dem der Medizin und dem der Chemie. 4.1. Wie aus diesem Vergleich hervorgeht, befinden sich bereits unter den ersten 20 Wortstellen des Verzeichnisses der Physik 5 fachspezifische Substantive, von denen keines unter den ersten 20 Wortstellen des gemeinsprachlichen Verzeichnisses und auch nicht unter den ersten 20 Wortstellen der zum Vergleich herangezogenen Verzeichnisse der Medizin und der Chemie vorkommt. Die Verbindungslinien geben Aufschluß darüber, wie weit oder nahe die in beiden Verzeichnissen vorkommenden Lexeme zueinander stehen. Erwartungsgemäß zeigt der Vergleich mit dem gemeinsprachlichen Verzeichnis auch bereits für die häufigsten Lexeme sehr wenig Verbindungslinien, also schon in dieser Reihe nur wenig gemeinsame Lexik, lediglich 5 Präpositionen sind dieser Aufstellung gemeinsam, von denen c und K auch noch ziemlich entfernt voneinander vorkommen. Anders sieht die Gegenüberstellung mit den beiden fachsprachlichen Verzeichnissen aus. Hier kommen jeweils 13 Lexeme gemeinsam vor, wenn auch jede Liste ihre Besonderheiten — speziell in den ersten Substantiven — aufweist. Schon in diesen wenigen Wortstellen bietet sich ein deutliches Bild von Unterschieden und Gemeinsamkeiten. 4.2. Noch deutlicher tritt die fachsprachliche Spezifik der Lexik beim Vergleich der jeweils ersten häufigsten Lexeme der einzelnen Wortarten auf. Dabei geben die Synsemantika, wie z. B. hier angeführte Präpositionen, mehr Einblick in die allgemeinen Gesetzmäßigkeiten ihrer Verteilung, da sie thematisch nicht vom Inhalt einer Wissenschaft abhängen. Sie sind jedoch, wie sich zeigt, in ihrer Reihenfolge zumindest bereits unterschiedlich in der Gemeinsprache und im fachsprachlichen Bereich. Zur Verdeutlichung dessen sei auch der Anfangsteil der Gegenüberstellung der Präpo22
L . N . ZASORINA, Avtomatizacija i statistika v leksikografii, Leningrad 1966, S. 64-69.
96
sitionen des Verzeichnisses von L. N.
ZASORINA
; mit denen des
ÖTEJNFBL'DTschen Verzeichnisses angeführt. ZASORINA 1.
B -
2. s a -
3. c 4.
K -
STBJNFEL']
•B Ha •c K
5. y-
-no
6. 3a-
-113 -y
7. noS. H3-
9. o-
Hier sind in beiden Verzeichnissen alle neun ersten Stellen von den gleichen Präpositionen belegt, die ersten vier sogar in dergleichenAnordnung. Diefolgenden gehen außer 3a nur um zwei Stellen auseinander.
-o -aa
Vergleich der 9 häufigsten Präpositionen der Häufigkeit«Verzeichnisse Physik
Chemie
Physik
. Medizin
Physik
Philosophie
Physik
Gemeinsprache (ZASORINA.)
1. B 2. HU
B na
I.B 2. ua 3. npM
4. a
1. Auswurfschacht2. Rohrleitung
•rpyöonpoBOA
1. Standardisierung 2. Normal glühen
• H0pMaJIH3aUHH
Durch die Wahl geeigneter Deskriptorformen und die Fixierung der Deskriptorbedeutung im jeweiligen alphabetischen Register kann diese für unsere Belange unerwünschte fakultative Äquivalenz für die Funktionsphase des mehrsprachigen Thesaurus eliminiert •werden: AS-System Auswurfschacht Rohrleitung Hahn Kran Standardisierung Normalglühen Senkvorgang (A Hydraulikanlage) Senkbohrung Schwadmäher Schneidwerk
ZS-System HanpaBJiHiomaH Tpyöa .TpyôonpoBOR
«pan
noÄteMHMÄ KpaiJ
CTaHRapTH3aUHH }[opMajiH3amiH
onycKaHHe
3eHK0BKa
pH^HOBan H>aTKa waTBeHHa« naerb
Nulläquivalenz Die Null-Äquivalenz hat ihre Ursachen in der unterschiedlichen Organisation einzelner Bereiche des abgesteckten Sachgebietes. Dieser Umstand hat zwangsläufig eine unterschiedliche sprachliche Erschließung des jeweiligen Ausschnittes der objektiven Realität zur Folge. Daher ist es nur verständlich, wenn in der Erarbeitungsphase keine absolute'Deckungsgleichheit zwischen den
207
einzelnen Deskriptorfeldern des AS- und ZS-Systems erreicht wurde. Aus unseren Untersuchungen wird ersichtlich, daß z. B. in der Organisierung des lexikalischen Materials zur Bezeichnung der Heuwerbemaschine beträchtliche Differenzen vorliegen, die eindeutig auf beträchtliche Differenzen in der Organisierung der Prozesse der Heuwerbung zurückzuführen sind, d. h., für diese Null-Äquivalenzen sind extralinguale Faktoren die Ursache. Unterschiede auf der Objektebene führen in unserem Fall zu Unterschieden auf der sprachlichen Ebene. So erklären sich auch die Fälle der NullÄquivalenz in der Erarbeitungsphase für TpocoBan BOJioKyma paMOHHaa BoJioKyma n0«60pmHK-CT0r006pa30BaTejib mapHHpHO-ptiqajKHHfi CToroMeTaTejit nepeKHHHOü CToroMeTaTenb K p a H O B B i i i CToroMeTaTeJib
Wir wollen diesen Typ als historisch bedingte Null-Äquivalenz bezeichnen, die natürlich ihre Ursachen im extralingualen Bereich hat, konkret in den sozial-ökonomischen und Umweltbedingungen der jeweiligen Sprachgemeinschaft. Bei der Erarbeitung eines mehrsprachigen Thesaurus sind AS- bzw. ZS-Deskriptoren, die durch eine historisch bedingte Null-Äquivalenz gekennzeichnet sind, unbedingt zu berücksichtigen, da ansonsten das mehrsprachige System wesentliche Elemente der Teilsysteme nicht aufweisen würde, wodurch die Funktionsfähigkeit des Gesamtsystems in entscheidenden Punkten in Frage gestellt wäre. Daher haben wir festgelegt, daß das AS-System um relevante Deskriptoren des ZS-Systems erweitert wird, die auch als solche dort gekennzeichnet werden. Weiterhin wurde festgelegt, daß sich auch das ZS-System verändert und den vom AS-System vorgegebenen Bedingungen anpaßt. Auf die gleiche Weise ist für den gesamten Deskriptorvorrat der AS und ZS eine semantische kontrastive Analyse durchzuführen, um somit mögliche Nullstellen aufzudecken. Das ist um so wichtiger, als eine Informationsrecherchesprache alle potentiellen Sachverhalte ausdrücken muß. Neben der historisch bedingten Null-Äquivalenz ließ sich ein weiterer Typ der Null-Äquivalenz feststellen: die zeitweilige NullÄquivalenz. Darunter verstehen wir eine 1 : O-Relation zwischen einem AS- und ZS-Deskriptor, die jedoch schnell im Verlaufe der Informätionsvermittlung im Raum zu einer 1 : 1-Relation wird. Dieser Vorgang erklärt sich damit, daß eine Neuentwicklung in 208
Wissenschaft und Technik sogleich eine sprachliche Erschließung des neuen Objektes zur Folge hat. Bei der Überwindung der zeitweiligen Null-Äquivalenz sind wir so vorgegangen, daß, wenn ein gemeinsamer superordinierter Deskriptor in beiden Teilsystemen vorhanden ist, eine Äquivalenzbeziehung zwischen den AS-Deskriptoren mit den größeren Begriffsinhalten und dem übergeordneten ZS-Deskriptor hergestellt wird: AS-System
ZS-System
Walzenpresse mit Wälzdruckverfahren Walzenpresse mit Matrizenring Scheibenwalzenpresse mit Matrizenring Ringwalzenpresse mit Matrizenring Schneckenpresse Ringwalzenpresse Brikettpresse Verdrillverfahren Normaldruckverfahren Radialdruckverfahren Brikettverfahren
> ßpHKeTHHfi npecc
CnOCOß ÖpiIKeTHpoBaHHH
Es dürfte zu erwarten sein, daß die ersten Versuche der sprachlichen Erschließung zu umfangreichen Wortverbindungen führen, d. h., zunächst werden sicherlich Paraphrasen entstehen, die sich dann jedoch bei zunehmender Benutzungsfrequenz abschleifen, z.B.: Doppelmessermähwerk
1. A s a HO»a, ABHraroinHXCH HaBCTpeqy
oahh HpyroMy
2. A s a ABHraiomHXCH HaBCTpeny Hpyry Howa
ZS-Deskriptor
aByHomeBoö peHtymntt
Apyr
annapaT
Approximative Äquivalenz Bei diesem Äquivalenztyp handelt es sich darum, daß die Merkmalsbündel des AS- undZS-Deskriptors nicht völlig deckungsgleich sind, so daß hier durch Absprachen ein einheitlicher Gebrauch beim Indexiervorgang gewährleistet werden muß. Bei unseren Untersuchungen konnten hier zwei Untertypen festgestellt werden: Der erste Typ ist dadurch gekennzeichnet, daß AS- und ZSDeskriptor auf Grund ihrer differenten Deskriptorbedeutung unterschiedliche Kategorien im alingualen Ordnungsschema zugeordnet 14 Fachsprachen
209
sind. Das könnte natürlich in der Funktionsphase zu einer Doppelbelegung von Kategorien führen, was vom System her nicht zulässig ist. Damit wäre unser mehrsprachiger Thesaurus nur bedingt funktionsfähig. Daher wird die Kategoriendifferenz nicht durch Belegung unterschiedlicher, sondern gleicher Kategorien gekennzeichnet, wobei jedoch vermerkt werden muß, welche andere Kategorie der jeweilige Deskriptor zu belegen hat, z. B . : in den einsprachigen Thesauri Deskriptor
Kategorie
Schichtlinienfahrt Fallinienfahrt
Tätigkeit (Tä) \ Tätigkeit (Tä) J Eigenschaft (Ei) Eigenschaft (Ei)
KpeH
npOROJIbHHÖ HcLKJIOH
deutschsprachiger Thesaurus Ì russischsprachiger I Thesaurus
im mehrsprachigen Thesaurus (das deutschsprachige System als AS-System) Kategorie (Tä) -Deskriptor
Notation
¿2-Deskriptor
npOAOJIbHblÖ HcLKJIOH Fallinienfahrt 0046 0128 KpeH Schichtlinienfahrt im mehrsprachigen Thesaurus (das russischsprachige System als AS-System) Kategorie (Ei) ¿2-Deskriptor KpeH
npoAonbHUä HaKJioH Kategorie (Tä) KpeH npOAOJIbHblft HäKJIOH
Notation mit zu verwendender Kategorie
Lt -Deskriptor
/CM./Tä/0I28 /CM./Tä/0046
Schichtlinienfahrt Fallinienfahrt
0128 0046
Schichtlinienfahrt Fallinienfahrt
Durch diese Regelung wird es möglich, daß AS- und ZS-Deskriptoren mit approximativer Bedeutung der gleichen Kategorie zugeordnet werden. Dabei ist für die Funktionsweise unseres mehrsprachigen Thesaurus unerheblich, ob das russisch- oder deutschsprachige Deskriptorsystem als AS-System gebraucht wird. In keinem Fall tritt eine unterschiedliche Belegung der Kategorien ein. 210
Der zweite T y p einer approximativen Äquivalenz bei Deskriptoren ist durch eine unterschiedliche Merkmalsbündelung verursacht, die jedoch noch ein derartiges Maß an Übereinstimmung zeigt, daß man nicht von einer Null-Äquivalenz sprechen kann. Der unterschiedliche Umfang des Merkmalsspektrums der AS- und ZS-Deskriptoren bedeutet, daß die jeweiligen Deskriptoren in ihren Systemen eine unterschiedliche Informationsmenge charakterisieren. In einem mehrsprachigen Thesaurus wird jedoch auf Grund des Anteils übereinstimmender Merkmale und des übereinstimmenden Stellenwertes der vergleichbaren AS- und ZS-Deskriptoren in den Teilsystemen eine funktionsfähige Äquivalenzbeziehung hergestellt, die wir als approximativ bezeichnen, die jedoch den Anforderungen eines mehrsprachigen Thesaurus genügt : Druckstromerzeuger Bereifung Messerkette rotatorischer Motor Warneinrichtung Schiebeschild Innenwirtschaft HeekPellet Heumehl
Hacoc iuhhu p e m y m a H ueilb riijipoMOTop cwrHajihHoe ycTpoÄCTBO 6yjiLß03ep
jkhbothobosctbo
C3anii 6pHKeT TpaBHHa« Myna
Lediglich eine approximative Äquivalenz besteht auch zwischen technische Kultur
TexHHHecKan KyjibTypa.
„Technische Kultur" umfaßt im deutschsprachigen Thesaurus folgende Einzelkulturen: Hanf, Faserlein, Baumwolle, Sisal. TexHHiecKaH K y j i t T y p a umfaßt Baumwolle, Flachs, Kartoffeln, Rüben, Hanf und Lein. Der Grad der Nichtübereinstimmung kann so weit gehen, daß es fast angebracht ist, von einer historisch bedingten Null-Äquivalenz zu sprechen, z. B . : Getreide
KpynHHa« K y j i b T y p a .
KpyiraHaH K y j i b T y p a umfaßt von den im systematischen Register (Deskriptorfelddarstellung) aufgezählten Getreidekulturen lediglich Hirse und Buchweizen, weshalb uns eine approximative Äquivalenz ungerechtfertigt erscheint. Dieser Entscheidung kommt auch die Tatsache entgegen, daß es im russischsprachigen System einen superordinierten Deskriptor 3epH0BHe gibt, der sich gegenüber dem 14»
211
deutschsprachigen Deskriptor durch totale Äquivalenz auszeichnet. Daher ist KpynjmaH KyjibTypa zum Nicht-Deskriptor erklärt worden und verweist im russischsprachigen alphabetischen Register auf den Deskriptor 3epH0Btie. Zu diesem Äquivalenztyp läßt sich feststellen, daß für die Funktionsphase des mehrsprachigen Thesaurus eine ausreichende Übereinstimmung in den jeweiligen Deskriptorbedeutungen erzielt wurde, obwohl die Systeme der natürlichen Sprachen infolge differierender Merkmalsbündelungen und deren Kodifizierung mitunter stark auseinandergehen. Totale Äquivalenz Sie ist durch weitestgehende Übereinstimmung der Merkmalsbündel zweier vergleichbarer AS- und ZS-Deskriptoren gekennzeichnet. Diese Übereinstimmung lag bereits in der Erarbeitungsphase des mehrsprachigen Thesaurus vor und brauchte nur für die Punktionsphase ausgenutzt zu werden. Hierunter fallen einmal alle Länderund Werkstoffdeskriptoren. Aber auch international eingeführte Termini führen zu Deskriptoren, die sich durch totale Äquivalenz Totale Äquivalenz mit gleichem Informationsanteil Landtechnik Presse Gespannselbstfahrend Drehzahl Messerhub Dreschwerk Haspel Asbest Esparsette Belgien
x o h HOHta
Heu
ceHO
centcKaH
TexHHKa
npecc KOHHMK caMOXOHHbifi HHCJIO O6OPOTOB
M0Ji0THHbH0e ycTpoiicTBo MOTOBHJIO
acöecT acnapijeT Eejibrnn
Totale Äquivalenz mit unterschiedlichem Informationsanteil Mähdrescher Feldhäcksler Bestand Flachland innerbetrieblicher Transport Bodentrocknung Trogrückwand 212
3epHOy6opOHHHÜ KOMÖafiH C H n o c o y ö o p o i H H ä KOMÖaüH xJießocToft paBHHHa Me>Ki(exoBaH nepeB03Ka c y u i K a B noJieBbix ycnoBunx OTpaHtareJib HtaTKH
auszeichnen. Wir unterscheiden bei diesem Äquivalenztyp die totale Äquivalenz mit gleichem Informationsanteil und die totale Äquivalenz mit unterschiedlichem Informationsanteil. Die letzteren Deskriptorformen bringen bestimmte Informationen zum Ausdruck, die für die Deskriptorbedeutung irrelevant sind. Es interessiert uns tatsächlich wenig, ob es ein JfäA-drescher ist, der den gemähten Schwad aufnimmt und drischt. Es ist unwahrscheinlich, daß ein russischer Muttersprachler mit entsprechenden Fachkenntnissen bei der Begegnung mit einem Feldhäcksler sofort von der inneren Wortform her auf Silo, Silage und Silierung schließt. Aus diesem Grunde ordnen wir derartige Fälle dem Typ der totalen Äquivalenz zu, obwohl, wie zu ersehen ist, keine völlige Deckung im Informationsgehalt vorliegt. Zusammenfassend können wir über die Äquivalenzbeziehungen bei Deskriptoren sagen: - Da Deskriptoren in der Funktionsphase durch Eineindeutigkeit gekennzeichnet sein müssen, kann es sich nur um Äquivalenzbeziehungen zwischen monosemen Einheiten handeln, die in der Erarbeitungsphase eines mehrsprachigen Thesaurus hergestellt worden sind und im konkreten Recherchefall aktualisiert werden müssen. - I n der Funktionsphase des mehrsprachigen Thesaurus haben nur die Formen der approximativen und totalen Äquivalenz eine Berechtigung, so daß alle Formen der Null-Äquivalenz und der fakultativen Äquivalenz auf diese Typen reduziert werden müssen. 4.
Die Funktionsphase
4.1.
Der Indexiervorgang
eines mehrsprachigen
Thesaurus
Wir gehen davon aus, daß unser Thesaurus ein w-sprachiges System ist. Damit ist es möglich, daß eine der n Sprachen das AS-System darstellt. Um den Indexiervorgang zu demonstrieren, nehmen wir an, daß in der Sprache L{ (bei Ln Teilhabesprachen) eine bestimmte Menge von Dokumenten vorliegt. Diese werden von den jeweiligen Sprachträgern zunächst analysiert und möglicherweise in einer Sachwortfolge L{ (Sx . . . S2) charakterisiert, die sogleich auf eine Deskriptorfolge Lv (Dx . . . Dz) reduziert wird. Die Elemente der Informationsrecherchesprache werden im nächsten Schritt in eine Notationsfolge der Zwischensprache umgewandelt und werden somit einmal maschinell speicherbar und zum anderen mit den 213
Sprachen L2 . . .„ maschinell vergleichbar. Diese Operationsfolge ist mit Hilfe eines mehrsprachigen Thesaurus in jeder der n Teilhabesprachen durchführbar. Die Funktionsweise eines zweisprachigen Thesaurus (Sprachen Ll und L2) im Rahmen eines zweisprachigen Informationssystems läßt sich wie folgt darstellen:
Entscheidend für ein mehrsprachiges Informationssystem ist ein gemeinsamer Informationsspeicher auf der Grundlage eines mehrsprachigen Thesaurus. Die sprachabhängigen Dokumentenspeicher können getrennt organisiert sein, jedoch muß die Zugänglichkeit für alle Nutzer der Mitgliedsländer gesichert sein.
214
4.2.
Der Recherchevorgang
Wie aus dem obigen Schema zu ersehen ist, kann eine Anfrage in einer der n Teilhabesprachen eingebracht werden. Sie durchläuft eine Operationsfolge, so daß sie schließlich als maschinell lesbare Folge von Elementen einer Maschinensprache Grundlage für maschinelle Vergleichsoperationen mit dem eingespeicherten Informationsfonds wird. Bezüglich der Anfrage relevante Informationen können aufgefunden und abgerufen werden, da die Vergleichsoperationen auf logischen, nicht auf linguistischen Gesetzmäßigkeiten beruhen. Die Basis hierfür bildet die numerische Zwischensprache, zu deren Elementen die Elemente der Deskriptorsysteme fixierte Beziehungen haben, die in dieser Etappe der Funktionsphase ausgenutzt werden. Auf Grund dieser sprachunabhängigen Operationen einer EDVA wird es verständlich, daß mit einer Anfrage in Ly der g e s a m t e Informationsfonds und nicht nur der -Informationsfonds recherchiert wird. Es werden nicht nur die relevanten L r -Dokumente, sondern alle relevanten Dokumente des Dokumentefonds ausgegeben, da die Äquivalenzbeziehungen automatisch hergestellt werden. Hierin dürfte ein wesentlicher Vorzug eines mehrsprachigen Thesaurus bestehen. Er setzt natürlich die Lösung eines maschinentechnischen Problems voraus: Die von uns explizit aufbereiteten Äquivalenzbeziehungen sind in der Anlage zu speichern, und bei Bedarf sind zwischen den entsprechenden Teilhabesprachen über die Zwischensprache die jeweiligen Äquivalenzbeziehungen zu aktualisieren. Dieser in der Funktionsphase automatisch ablaufende Prozeß der Aktualisierung relevanter Äquivalenzbeziehungen setzt, wie wir bereits zu demonstrieren versuchten, eine tiefgründige kontrastive Analyse der semantischen Komponenten und die explizite Aufbereitung der relevanten Äquivalenzbeziehungen zwischen den Teilhabesprachen und der Zwischensprache voraus. 5.
Schlußbemerkungen
Aus diesen Überlegungen ergibt sich nun die Problemstellung, ob der bisherige Translationsbegriff auf die linguistisch relevanten informationsbearbeitenden Prozesse des Informationsverarbeitungszyklus bei unterschiedlichen AS und ZS anzuwenden ist. Es muß bei der Beantwortung dieser Frage darauf hingewiesen werden, daß die Theorie der Translation auf die hier aufgezeigten Probleme 215
bisher gar nicht oder nur am Rande eingegangen ist. Trotzdem werden damit die praktischen Sprachmittler in Informationszentren in immer stärkerem Maße konfrontiert. Eine Lösung kann u. E. nur einer interdisziplinären Zusammenarbeit entspringen. Dabei hat die Informatik zusammen mit der Linguistik die Prozesse der Redundanzminderung bei der Referateerstellung bzw. der Aufstellung von Deskriptorbedeutungen im allgemeinen zu klären. Sobald translatorische Teilschritte in die Redundanzminderung eingebettet sind, ist die Translationswissenschaft im besonderen heranzuziehen. Diese translatorischen Prozesse laufen unter spezifischen Bedingungen ab und sind sicher bereits als inhaltsbearbeitendes Übertragen anzusehen, da bereits die Indexierung (Aufstellen der Deskriptorfolgen) und das Referieren eine Wertung der Information darstellen. Als Wertungskriterium ist das objektiv vorgegebene Informationsbedarfsprofil z. B. einer Wirtschaftseinheit anzusehen. Die Wertung bezieht sich vor allem auf Feststellung der Dokumentierwürdigkeit der Quelle und stellt nachfolgend eine rezipientbezogene Äquivalenz des Ausgangstextes und des komprimierten Textsegmentes her (nutzerorientierter, pragmatischer Aspekt der Komprimierungsphase). Diese rezipientbezogene Äquivalenz ist Grundvoraussetzung für ein jedes Informationssystem, will es nicht Selbstzweck, sondern Entscheidungsinstrument sein. Um sie zu erreichen, sind gleichzeitig zwei weitere Aspekte der Komprimierungsphase bei unterschiedlichen Ausgangssprachen zu berücksichtigen: — Ausnutzung konventionalisierter Regeln für die Substitution lexikalischer Einheiten durch standardisierte Deskriptoren (semantischer Aspekt der Komprimierungsphase). — Ausnutzung konventionalisierter Regeln für die Substitution syntaktischer Beziehungen durch standardisierte Deskriptorrelationen (syntaktischer Aspekt der Komprimierungsphase). Beim derzeitigen Erkenntnisstand wäre es anmaßend, wollte man annehmen, daß die Forderung nach Berücksichtigung dieser Aspekte, die spezifische Belange der informationsbearbeitenden Praxis widerspiegeln, in der Theorie der Sprachmittlung gerechtfertigt ist. Es wäre jedoch zu begrüßen, wenn die vorliegenden Überlegungen einen lebhaften wissenschaftlichen Meinungsstreit auslösen würden und somit Linguistik und Informatik miteinander ins Gespräch kämen. 216
WERNER REINECKE
Einige Bemerkungen zum „Satzverzeichnis" im Rahmen einer Analysegrammatik
0. Die folgenden Bemerkungen beziehen sich auf die Effektivierung der Sprachkundigenausbildung der Stufe IIb1, die in wesentlichen Punkten mit einer fachbezogenen Fremdsprachenausbildung an den Hoch- und Fachschulen der DDR korreliert. Die vorgetragenen Ansichten liegen im Bereich der russistischen linguistischen Grundlagenforschung für den programmierten Fremdsprachenunterricht des charakterisierten Typs und lassen sich von methodischen und psycholinguistischen Intentionen leiten. Die ausdrückliche fremdsprachenmethodische Realisierung konnte in die hier entwickelte Konzeption nicht mit einbezogen werden. Dieser Beschreibung werden wir uns in weiteren Veröffentlichungen zuwenden. 0.1. Unsere Grammatik für den programmierten Fremdsprachenunterricht stellt eine Einheit dar von a) Analyse- und Syntheseteil der Grammatik b) grammatischem System als Summe aller Einzelelemente der Grammatik (Gesamtgrammatik) und kontrastivem Teil der Grammatik c) statischem und prozessualem Teil der Grammatik. Der Analyse- und der Syntheseteil beziehen sich beide auf die Fremdsprache Lx (Russisch). Die Beziehungen zwischen dem Analyseteil der Grammatik (A-G), dem Syntheseteil (S-G) und dem kontrastiven Teil (K-G) veranschaulichen wir in der Skizze auf S. 218. Interpretation zur Skizze: (1) A-G und S-G operieren vorzugsweise in der Fremdsprache Lv. Die Beziehungen zu L2 werden als gegeben angesetzt. (2) S-G kann als Minimum eingerichtet werden. Sie hat entweder einen determinierenden Ausgangspunkt in L2 (Das entspricht 1
Die Stufe IIb ist lese- und übersetzungsorientiert. 217
eigentlich der Hinübersetzung und ist für die Herausbildung produktiver Sprachfähigkeiten nicht bevorzugt geeignet) oder läßt eine explizite Beziehung zu L2 unberücksichtigt (Das entspricht stärker dem Prinzip der Verknüpfung von Sprache und Denken im fremdsprachigen Bereich).
(3) Die K - G wählt aus der A - G die Elemente aus, die auf Grund von gegenüber der Muttersprache anders gestalteten Ordnungskriterien im begrifflich-semantischen und grammatischen System formale Unterschiede aufweisen. 0.2. Die Einheit von statischer und prozessualer Grammatik spiegelt sich in der Gesamtanordnung der A—G wider. Sie stellt sich als in drei Verzeichnisse gegliedert dar: (1) Satzverzeichnis (einfacher Satz mit Anwendungsregeln für den zusammengesetzten Satz), (2) Phrasenverzeichnis, (3) Morphologieverzeichnis. Diese Verzeichnisse werden als Elemente einer prozessualen Grammatik wirksam, indem sie mit Operationsregeln verknüpft werden. Dabei untergliedert sich das Morphologieverzeichnis in eine Suchund eine Adressenliste, das Satzverzeichnis enthält eine qualitative abstrakte Charakterisierung (Tabellen 1.1. und 1.2.) und eine Aufzählung konkreter Satzmuster (Liste 1). Analoges gilt für das PhrasenVerzeichnis.
1.1. Wir stellen zunächst die Tabelle 1.1. vor, um aus dem konkreten Beispiel theoretische und praktische Erörterungen zur Problematik des einfachen Satzes abzuleiten und zu verdeutlichen, welche Gesichtspunkte für die Aufstellung dieser Tabelle maßgeblich sind. 1.1.1. Den Ausgangspunkt für die Ableitung von Tabelle 1.1. bildet der Konstitutivsatz 1 (mit formal ausgedrücktem Subjekt): SP + PP (Subjektphrase + Prädikatsphrase). 218
Dabei ist P P ->• P K + Z (Prädikatskern + Zusatz) und Z bzw. Z 0 (adverbieller Zusatz bzw. Objekt(zusatz). Kombinationen (Permutationen) des Konstitutivsatzes 1 : Tabelle 1.1. l a SP + PK + Za l b S P -f P K + Z 0
CBOüCTBa onpefleJiHK)TCH TOHHO 9jieKTpoA nojiy>iaeT 3apHR CBOüCTBa TOHHO onpejjenHiOTCH
3 a P K -f S P + Z a 3b P K + S P + Z0
EejieeT n a p y c Ha Mope OÖpaTHJICH JIH OH K HaM (Bbimeji Ha n o p o r y napeHb MOJIOHOÖ) . . . roBopirr eMy coJi«aT TeopeTHiecKH OH n p a ß HaM pe3yjibTaTi>i HeH3BecTHM H a oneKTpone noJiynaeTCH 3apH«
2a SP + Za + PK 2 b SP + Z0 + PK 4a PK + Za + SP 4b 5a 5b 6a
PK Za Z0 Za
+ + + +
Z0 SP SP PK
+ + + +
SP PK PK SP
6b Z0 -f PK + SP
Pe3yjibTaTfci HaM Hen3BecTHu
Hac yflHBJineT pesyjibTaT
1.1.2. Bevor wir die weiteren Bestandteile der A—G vorstellen, wollen wir uns mit einigen allgemeineren Fragen zur Problematik des Satzes beschäftigen. Es steht außer Zweifel, daß völlig andere Kriterien für den Aufbau des Satzverzeichnisses denkbar sind. Eine grundsätzliche theoretische Erörterung des Begriffs des Satztyps findet sich z. B. bei R . R Ú Z I C K A [ 1 8 ] . Dort werden die Schwierigkeiten, die einer Klassifikation überhaupt im Wege stehen, hervorgehoben. Diese Schwierigkeiten zeigen sich schon in einem so elementaren Ansatzpunkt wie der Einteilung in ein- und zweigliedrige Sätze. I n jüngerer Zeit mehren sich Auffassungen, nach denen die Differenzierung von Ein- und Zweigliedrigkeit als sekundäre Spezifizierung betrachtet wird. Das zeigt sich in der Akzeptierung der sogenannten Nullphrasen bei L. H O F F M A N N [7] oder der Interpretation der unbestimmt-persönlichen und unpersönlichen Sätze als Transformationsergebnisse mit ausschließlicher Relevanz in der Oberflächenstruktur bei R. R Ú Z I C K A [17], Trotz aller Bewegung, die in diese und andere Fragen der Grammatik hineingetragen worden ist, scheint es im gegebenen Fall jedoch nicht angebracht, die Trennung in. ein- und zweigliedrige Sätze für den Fremdsprachenunterricht zu eliminieren. Zum einen wird diese Differenzierung auch weiter in der normativen russischen Grammatik beibehalten [12], zum anderen muß jede theoretisch abzuleitende Gemeinsamkeit aus Bereichen, die nicht der Oberflächenstruktur angehören, als überhöhte Anforderung an eine linguistische Kompetenz gewertet werden, die 219
keineswegs sui generis explizit im Fremdsprachenunterricht entwickelt werden kann. 1.1.3. Die Einteilung der Sätze in ein- und zweigliedrige in der russischen Syntax geht bekanntlich auf S A C H M A T O V zurück [20]. P E S K O V S K I J hatte die eingliedrigen Sätze, die nur aus einem Wort bestehen, z. B. noch zu den Wortverbindungen (cji0B0C0HeTaHHe) gezählt [13]. Insofern man die Wortverbindung mit dem Syntagma gleichsetzt ( P R O K O P O V I C t u t das konsequent [15]), finden sich Parallelen in der Verwischung der Grenzen des definierten Gegenstands. Diese Ausweitung des Begriffs liegt beim Syntagma allerdings kaum in der Richtung eines Syntagmas, das aus einem Element bestehend definiert würde, sondern in der Ausweitung des Syntagmabegriffs 2 . Immerhin definiert T. N. M O L O S N A J A „ K p a c i i ß " als Konfiguration, die aus e i n e m Element besteht [9]. Gegenüber der vielgestaltigen theoretischen Diskussion um die Abgrenzung von Satz und Syntagma und den umfangreichen Erörterungen darüber, ob ein einzelnes Wort Syntagma oder Satz sein kann, nimmt sich die Formulierung in den Thesen des Prager Linguistenkreises recht einfach, aber für den Praktiker wohl doch ausreichend aus. Nach der Fixierung des Tatbestandes, daß sich die Verknüpfung der Wörter im Ergebnis der syntagmatischen Tätigkeit vollzieht, folgt die Feststellung: „Diese Tätigkeit zeigt sich manchmal auch in Form eines einzelnen Wortes." (Übersetzg. W. R.) [14, S. 23]. Wenn auch vor allem in den Arbeiten sowjetischer Linguisten eine ganze Reihe von Fragen des einfachen Satzes in theoretischer Hinsicht eine weitere Aufhellung erfahren haben und ein reiches Faktenmaterial zusammengetragen worden ist, das nicht zuletzt für die Verbesserung des Russischunterrichts genutzt werden kann 3 , so bleiben doch deutlich einige wesentliche Lücken in bezug auf den Gesamtzusammenhang einer Theorie des einfachen Satzes im Russischen bestehen. V. V. B A B A J C E V A nennt drei dieser offenen Probleme [3, S. 5]: 1. Die Prinzipien zur Abgrenzung der eingliedrigen von den zweigliedrigen Sätzen sind ungeklärt. 2. Die Kriterien einer Klassifizierung der eingliedrigen Sätze sind völlig offen. 2
V g l . z . B . d a s Supersyntagma syntagma
3
b e i IOHDANSKAJA [ 8 , S . 1 0 ] o d e r d a s
Makro-
b e i AGRICOLA [ 1 , S . 1 0 ] .
W i r n e n n e n hier nur exemplarisch u n d ungeordnet N a m e n wie
MUCHIN,
SVEDOVA, VLNOGRADOV, G A L K I N A - F E D O K U K , KRUSEL'LILCKAJA, S u C H O T I X , ROGOVA, KOSTOMAROV U . a . 220
3. Die Typen von Übergängen zwischen ein- und zweigliedrigen Konstruktionen sowie zwischen den Unterarten der eingliedrigen Sätze sind nicht festgelegt. 1.1.4. Eine der ersten Fragen, vor die wir uns bei der Aufstellung eines Satzverzeichnisses gestellt sehen, ist demnach die nach der von S A C H M A T O V übernommenen Akzeptierung der grundsätzlichen Zweigliedrigkeit des Satzes. Diese Frage findet, wie aus Tabelle 1.1. ersichtlich, eine positive Beantwortung. Hier sind die mathematisch möglichen Permutationen eines einfachen zweigliedrigen Satzes zu drei Elementen aufgeführt, wobei das dritte Element einen Bestandteil des zweiten bildet. 2.1. Wir wollen im folgenden untersuchen, wie die eingliedrigen Sätze in Form einer Tabelle 1.2. anzuordnen sind, so daß auf diese Satzmuster aus dem Text heraus rückgekoppelt werden kann. 2.1.1. Innerhalb der eingliedrigen Sätze haben wir eine Unterteilung in solche, die durch subjektlose Prädikate und solche, die durch prädikatslose Subjekte gekennzeichnet sind, zu beachten 4 . Weiterhin dürfen wir die sogenannten Einwortsätze vom Typ OroHb! O C T O P O J K H O ! Criacirre! sowie die Infinitivsätze nicht völlig aus dem Auge verlieren. 2.1.2. Ein ausgesprochenes Spezifikum stellen im Russischen die eingliedrigen Sätze dar, die auf subjektlosen Prädikaten beruhen. Diese Sätze sind durch einige Besonderheiten determiniert: 1. durch das Auftreten von unpersönlichen Ausdrücken (up) wie: M05KH0, HejIi>3H,
TpyflHO5;
2. dadurch, daß ein Wort, das den logischen Urheber der Handlung ausdrückt, im Genitiv steht 6 ; 3. dadurch, daß ein Wort, das den logischen Urheber der Handlung ausdrückt, im Instrumental steht. Für die Anordnung der Elemente dieser Sätze im Rahmen von Satzmustern ist es aus praktischen Gründen vorteilhaft, solche Aus4
5
6
Wir müssen uns hier an eine formale Einteilung der eingliedrigen Sätze halten, damit die Tabelle knapp und überschaubar bleibt. In der Literatur werden diese Sätze traditionell als unpersönliche Sätze aufgeführt. Wie problematisch selbst die Einteilung in ein- und zweigliedrige Sätze wirklich ist, zeigt die Klassifizierung, die A . M . M U C H I N vornimmt, wenn er den Satz Tenepb y>K MHe BJIIOSHTLCH T p y j j H O als zweigliedrig und den Infinitiv als Subjekt dieses zweigliedrigen Satzes ansieht [10, S. 134]. Das gilt nicht nur bei Verneinung. Vgl. z. B. A e H e r X B a T a e t [10, S. 135].
221
drücke wie MOJKHO, HEJII»3H etc. und solche wie (.nopory) 3AHECJIO . . . gemeinsam als up zu klassifizieren, um die Ausweitung der anzulegenden Tabelle einzuschränken. 2.1.3. Eine gesonderte Struktur weisen die sogenannten verallgemeinert persönlichen Sätze vom Typ BejniiHHy H3MepiiJiH auf. Formal ließen sie sich in Tabelle 1.1. leichter unter Annahme einer Nullbelegung der SP aufnehmen als die Sätze mit up-Ausdrücken. Eine andere Frage ist allerdings, ob die dadurch erforderliche Modifizierung des Eingangs in Tabelle 1.1. letzten Endes nicht aufwendiger wird als eine gesonderte Aufführung dieser eingliedrigen Sätze in der zu entwickelnden Tabelle 1.2. Wenn wir diese Sätze in Tabelle 1.1. eingliedern, so haben wir demnach die eingliedrigen Sätze mit up-Ausdrücken und die sogenannten verallgemeinert persönlichen Sätze in Tabelle 1.2. aufzunehmen. 2.1.4. Betrachten wir jetzt die eingliedrigen Sätze, die auf prädikatslosen Subjekten aufbauen. Da für sie die spezifischen Züge wie für Sätze mit up nicht zutreffen, erscheint eine Zuordnung dieser Sätze zu Tabelle 1.1. unter Annahme einer Nullstufe des Prädikats angebracht. Es wäre außerdem möglich, die Sätze innerhalb des Phrasenverzeichnisses über die N P rückzukoppeln, obwohl hier der Wechsel der Ebenen zu beachten ist. Die gleiche Regelung erscheint für die Einwortsätze angebracht. Dabei brauchen wir uns nicht in den Streit einzumischen, ob es sich bei ihnen überhaupt um Sätze, Syntagmen oder andere Gebilde handelt. Wir hatten uns bereits der Definition des Prager Linguistenkreises angeschlossen. 2.1.5. Wir haben uns schließlich mit den eingliedrigen Infinitivsätzen zu beschäftigen. Sie treten uns in vielfältiger Gestalt entgegen. Wir enthalten uns auch bei ihnen einer funktional-semantischen Auslegung und erfassen nur die erforderlichen Modifizierungen in der Satzstruktur. Diese Abweichungen müssen wiederum als so spezifisch betrachtet werden, daß wir sie in Tabelle 1.2. aufnehmen. 2.2. Im vorliegenden Zusammenhang könnte die Meinung auftreten, daß einige dieser eingliedrigen Sätze aus kommunikativen Gründen kaum noch sinnvoll in eine A - G für die Sprachkundigenausbildung eingeordnet werden sollten. Tatsächlich trifft dieser Einwand jedoch nicht zu. So hatten wir zunächst in einer ersten Variante geglaubt, die Konstruktion V jnf + Z nicht in Tabelle 1.2. aufnehmen zu müssen. Als wir jedoch im Zusammenhang mit der 222
Kombinationen (Permutationen) des Konstitutivsatzes 2: Tabelle 1.2. 7a
„
(Dat/Instr + ) u p +
7b 8a 8b
«
9a
5)
9b
5J
„
10a
>>
10b IIa
„
IIb 12a 12b 13a 13b 14a 14b Ida 15b
(JleHHHHM) BHHBJieHO TOHHO, (iTO . . .)
+
z0
(CHeroM) 3aHecJio aopory
Za Z0
+
up
( E M y ) B ^ p y r XOJIORHO
( H a M ) npHXORHTCH H3MepHTb BejIHMHHy
+ Za +Z0
+ V^f ( H a M ) npHXOAHTCH T o i H e e H3Mepim> + Vinf ( H a M ) npHXORHTCH BejIHMHHy H3MepHTb
Za
+V
+
Zo Za Z0
+ V i n f + u p B c e x naHHbix H3MepHTb He H a s o öyneT + up + V i n f ( H a M ) TOMHee npnxoÄHTCH H3MepHTb + up + V i n f ( H a M ) BejIHMHHy npHXOÄHTCH H3MepHTb
i n f
i n f
v i n f + Za vinf + z0
+
Vfi„3. PI.
20
(Interrog. pron.) +
21
0
up up
19
18
3aHecno (CHeroM)
( H a M ) npHXOJJHTCH H3MepHTb TOMHee
+ V + V
i n f
+ Z + Z
a
up up
Zo + V fin 3. PI. Vinf za Zo
17
+ up flopory
up
up
( H a M ) TOMHee H3MepHTb npHXORHTCH
( H a M ) H3MepHTb TOMHee n p o c T o He06x0RHM0
+ up ( H a M ) H3MepHTb BejIHMHHy npOCTO HeOÖXOflHMO ?» Vinf + up + Z a ( H a M ) H3MepHTb npHXORHTCH TOMHee Vi„f + up + z 0 ( H a M ) H3MepHTb npHXOAHTCH BejIHMHHy V f i n 3.Pl. + Z a H3MepHJIH HeCKOJIbKO p a 3 V f l n 3.Pl. +Z0 H3MepHK)T BejIHMHHy »5
16a Z a + 16b
Za
up
up
Dat. +
Vinf
HeCKOJIbKO p a 3 H3MepHJin BejIHMHHy H3MepHJIH BcTaTb! H a KOJieHH!
+
OroHb! K a « MHe 6bm>? HHTepecHO!
(Für up muß eine Inventarisierung erfolgen.)
Betreuung einer Dissertation zur Spezifik der Sprache des Sports auf die Kommandosprache im Bereich der Bewegungsabläufe stießen, wurde uns klar, daß diese Sätze auch unter fachsprachlichem Aspekt eine Aufnahme in Tabelle 1.2. finden sollten. 2.3.1. Mit den voranstehenden Erörterungen zur Differenzierung der ein- und zweigliedrigen Sätze haben wir zunächst nur eines der zahlreichen grundsätzlichen Probleme angeschnitten, die sich aus theoretischer wie praktischer Sicht schon im ersten Ansatz der Entwicklung der A—G aufdrängen. Bevor wir uns weiteren grundlegenden Fragen des Satzes zuwenden, wollen wir die Überlegungen zum eingliedrigen Satz jetzt in Gestalt einer Tabelle 1.2. veranschaulichen. 2.3.2. Den Terminus „Konstitutivsatz" verwenden wir im Ergebnis der Tatsache, daß sich aus dieser einfachen Grundstruktur von SP und PP bzw. SP + P K + Z rein mathematisch 6 (bzw. 12) Permutationen zu diesem Satz konstituieren. Es gibt in der Linguistik 223
seit langem Errechnungen zu möglichen Wortstellungsvarianten innerhalb des Satzes und zu der Frage der Anzahl von Satzmustern. 7 Typisch für diese Betrachtungen ist die Annahme einer außerordentlich hohen Zahl solcher Varianten, die unsere mnemische Kapazität übersteigt und für eine Objektivierung und Optimierung des Satzbauplanes nicht in Betracht kommt. Für uns war daher bei der Entwicklung eines Verzeichnisses von Satzmustern der Gedanke ausschlaggebend, daß diese Satzmuster so systematisch und vollständig sein müssen, wie das für ihre erforderliche operative Koppelung mit konkreten Sätzen der parole (des Textes) notwendig ist. Dabei gestattet es der analytische Aspekt, auf Disambiguierungen in der Satzstruktur zu verzichten, die gewöhnlich in den theoretischen Grammatiken einen großen Raum einnehmen und meist nicht ohne Bezug auf abstrakte grammatische Grundstrukturen zu behandeln sind. 8 Die Anwendung so einfacher mathematischer Prozeduren wie der der Kombinatorik ist im Bereich der langue dort sinnvoll, wo sie das potentielle Gefüge dieses Konstrukts bloßlegt. I m Fall der Wortstellungsvarianten wird das seit jeher getan, ohne daß damit der Begriff der mathematischen Linguistik bemüht werden müßte. 9 Geht man vom einfachen zweigliedrigen Satz zu drei Elementen aus und errechnet seine 6 Permutationen, dann stellt man fest, daß nicht eines dieser mathematischen Resultate ohne Belegung im Bereich der natürlichen Sprache bleiben muß, d. h. alle mathematischen Kombinationen (Permutationen) genügen gleichzeitig dem linguistischen Kriterium der Grammatizität. Diese Tatsache besagt natürlich noch nichts über die Frequenz der einzelnen Satzmuster als Spiegelung objektiver Sätze der parole. Außerordentlich interessant ist auch die stilistische Ungeordnetheit und die Vermischung solcher Kriterien wie Aussagesatz, Fragesatz, derivierter Satz unter einem Phrasenmarker u. ä. inner7
8
9
Neben J U N G , P E S K O V S K I J U. a. geht auch C H . M U L L E R auf diese Frage ein [11, S. 37ff.]. Hier erübrigen sich z. B. solche Disambiguierungen wie die von Die Erziehung der Erzieher aus: Die Erzieher erziehen X und: X erzieht die Erzieher. Es würde wohl niemand auf den Gedanken kommen, von einer mathematischen Viehzucht zu sprechen, wenn die Milchleistung der Kühe oder die Vermehrung des Schweinebestandes einer Genossenschaft, eines Kooperationsverbandes, innerhalb eines Kreises, Bezirks oder Landes mit Hilfe einfacher mathematischer Verfahren berechnet wird — auch dann nicht, wenn dazu Rechenautomaten verwendet werden.
224
halb der Tabellen. Eine solche Streuung ist bei den gewählten formalen Ausgangskriterien ganz natürlich. Sie bestätigt, daß die volle Ausnutzung des überhaupt möglichen Stellungspotentials des Konstitutivsatzes in diesem elementaren Bereich das Satzes eine sehr reale kommunikativ bedingte Determination für das Russische aufweist. Auch aus dieser Motivierung heraus läßt sich der Terminus Konstitutivsatz zusätzlich charakterisieren. 3.1. Als nächstes bleibt jetzt zu klären, welche Schlußfolgerungen wir aus den in der Literatur so stark divergierenden Definitionen der Bestandteile des Satzes ziehen, warum wir im wesentlichen nur ein Element als Ergänzung zum Kern des Prädikats ansetzen und welche zusätzlichen Bedingungen aus dieser Beschränkung für die Spezifizierung der Tabellen erwachsen. Wir haben uns für traditionelle Termini wie Subjekt- und Prädikatsgruppe (Prädikatsphrase) entschieden, da uns scheint, daß ihre häufig kritisierte Determinierung aus logischen Kategorien kaum je ein unüberwindliches Hindernis für ihre formale definitorische Fixierung darstellt. Wir sind der Auffassung, daß die Vermischung der Kriterien bei der Einteilung, Ableitung und Definition der Satzglieder und Wortarten, die sich für die meisten Konzeptionen von Grammatiken nachweisen läßt, vorläufig nur bedingt aufgelöst werden kann. So sind die Konstituenten des Satzes auf der syntaktischen Ebene als zwei Satzgliedgruppen (Subjektphrase und Prädikatsphrase) anzusprechen, wobei eine integrierte Definition weiterer Satzglieder innerhalb der Prädikatsphrase über Z erfolgt (Za und ZJ. 3.1.1. Nicht unerheblich für unsere Belange ist die Entscheidung darüber, welcher Auffassung über die „Nebenglieder" des Satzes bzw. die „sekundären Satzglieder" wir uns anschließen wollen. Für den fachbezogenen Fremdsprachenunterricht, in dem nicht eine formale Analysefähigkeit, sondern die Realisierung der kommunikativen Absicht im Mittelpunkt steht, erscheint es möglich und angebracht, innerhalb der Prädikatsphrase neben der Isolierung eines Elements PK prinzipiell mit einer Ergänzung Z auszukommen. Damit werden die Schwierigkeiten vermindert, die sich gewöhnlich bei der Abgrenzung von Objekt, Attribut und Adverbialbestimmung ergeben. Diese Schwierigkeiten verschärfen sich bekanntlich bei einer funktional orientierten Einteilung der Nebensätze. 10 In diesem 10
setzen die Vertrautheit des Lesers mit diesen, weithin bekannten Beispielen voraus und verzichten auf entsprechende Beispiele.
15 Fachsprachen
225
Zusammenhang ist übrigens bemerkenswert, daß die funktional motivierte Interpretation der formalen Satzelemente offensichtlich keine direkte Beziehung zur Realisierung der Kommunikationsintention bedingt. Daraus folgt die Feststellung, daß die kommunikative Intention keine vordergründige Determination der formalfunktionalen Struktur des Schemas einfacher und zusammengesetzter Sätze als zwingend erscheinen läßt. Dieser Umstand korreliert mit dem Redundanzprinzip innerhalb natürlicher Sprachen. Semantisch äquivalente und in der graphischen wie phonetischen Realisierung identische Nebensätze wie in (a), (b), (c) (a) Mbi 3HaeM, HTO OHH He nponajiyT. (b) Hac NOCTABHIIH B H3BECTHOCTB o TOM, HTO OHH HE nponanyT. (c) HaM H3BecTH0, HTO OHH He nponaayT.
Objektsatz Attributsatz Subjektsatz
unterscheiden sich keineswegs nach der ihnen innewohnenden kommunikativen Intention voneinander, obwohl sie unterschiedlich auf Satzglieder bezogen sind und dementsprechend verschieden formal-funktional interpretiert werden. 3.1.2. Die Tendenz, Abgrenzungsschwierigkeiten der genannten Art zu überwinden, findet sich in ähnlicher, wenn auch nicht identischer Form in Gestalt der M o d i f i k a t o r e n (modifier) im Bereich der Phrasenstrukturgrammatik. Auch in der generativen Grammatik werden die ungelösten Probleme einer „Einteilung der Nebensätze nach ihrer Funktion" hervorgehoben. 11 Die Reduktion der Nebenglieder des Satzes auf ein Element Z weist Ähnlichkeiten mit der Lösung (3) in G. HELBIGS Darstellung der attributiven Beziehungen auf. HELBIG führt drei Konzeptionen für die Interpretation des Attributs im Deutschen an: [5, S. 81—82] (1) Beifügung n u r zum Substantiv; Beispielsatz: Er ist ein sehr begabter Schüler (sehr 4= Attribut). (2) J e d e Beifügung zu j e d e m Wort im Satz a u ß e r zum Verb (sehr = Attribut). (3) J e d e Beifügung zu j e d e m Wort. Danach sind auch Adverbialbestimmungen und Objekte als Attribute zu klassifizieren. Wenn wir die Vereinheitlichung in Lösung (3) entsprechend dem Vergleich mit dem Begriff des Modifikators auch in Gestalt unseres 11
Wir verwenden den Terminus „funktional" bei der Einteilung der Nebensätze jetzt bedingt, nachdem wir die Irregularitäten in den Beziehungen zwischen Kommunikationsintention und formal-funktionalem Klassifikationsprinzip der Nebensätze hervorgehoben haben.
226
Elementes Z im Satzschema erreichen, so läßt sich deshalb noch keine formale Identifizierung von Modifikator und Z herstellen. Trotz der Reduktion auf Z als Komplement zum P K werden innerhalb der Prädikatsphrase Attribute und Adverbien im Sinne der Lösung (1) und in Fortführung der Auffassungen der Schulgrammatik beibehalten. Damit vermeiden wir, daß Attribute mit den Nebengliedern des Satzes auf eine Stufe gestellt werden. Diese Notwendigkeit war bereits durch Verfahren einer frühen strukturellen Linguistik (etwa durch die Verschiebeprobe bei GLINZ) explizite nachgewiesen worden. Eine Einebnung der Differenzierung, wie sie uns in Gestalt der Modifikatoren entgegentritt, halten wir für unangemessen. Die Definition von Z vermeidet die Einbeziehung dieses Nachteils. Zu erklären bleibt der Umstand, warum wir trotz der partiellen Parallelität von Z und der Attributskonzeption (3) nach H E L B I G andererseits die Lösung (1) (Unterscheidung von Attribut und Adverb) anstelle der Konzeption (2) (Einbeziehung des Adverbs in die Definition des Attributs) vorziehen. Diese Entscheidung hat Gründe, die sich aus unserem Bestreben erklären, mit wenigen Ausgangselementen eine eingeschränkte Kombinatorik dieser Elemente zu erzielen und gleichzeitig die Binnenstruktur dieser Glieder auf der Phrasenebene nicht zu kompliziert zu gestalten. Das wird damit erreicht, daß auf der Phrasenebene Adverbien durch eine besondere Zusatzregel hinsichtlich ihres Auftretens oder Fehlens beschrieben werden können. Durch diese gesonderte Verbindung über eine Regel zum Adverb wird auch auf der Phrasenebene die Anzahl der Elemente eingeschränkt und die Kombinatorik bleibt übersichtlicher. Obwohl also ein Element A d v e r b in seiner gesonderten Klassifizierung gegenüber bestimmten Konzeptionen erhalten bleibt und damit gewissermaßen den Bestand an Einheiten erweitert, bedeutet dieser Umstand keine Komplizierung, sondern eine Vereinfachung der Grammatik. Darüberhinaus bleibt des Nachdenkens wert, ob die in logischsemantischer und funktionaler Sicht durchaus gewichtigen Gründe für eine Differenzierung von Attribut und Adverb(ialbestimmung) tatsächlich völlig unbeachtet bleiben dürfen. Stimmt man H. PAUL zu, der das Attribut als degradiertes Prädikat betrachtet 1 2 , so rückt das Attribut, dem in anderer Hinsicht seine Qualifikation selbst als s e k u n d ä r e s S a t z g l i e d abgesprochen wird, seiner >2 Vgl. dazu 15»
SOLNCEV
[22, S. 202]. 227
qualitativen Bestimmung nach indirekt näher an ein H a u p t g l i e d des Satzes (das Prädikat) heran als etwa Objekt und Adverb. Dieses „Vibrieren" des Attributs im Satzschema äußert sich schließlich auch in seiner Stellung zum Objekt. S A P I R O hat das in seiner historischen Reflexion der Nebenglieder des Satzes anschaulich demonstriert. [ 1 9 , S. 7 1 ; 2 ] Während VOSTOKOV das heutige russische Genitivattribut (YiHTejib ßpaTa 3a6ojieji) noch als Objekt klassifiziert, gilt diese Bestimmung für die moderne russische Grammatik längst nicht mehr. Insgesamt ergibt sich für die Einteilung der Nebenglieder des Satzes in der russischen grammatischen Literatur ein von starken Divergenzen geprägtes Bild, das auf Grund der unterschiedlichen Ausgangspunkte zustande kommt. Die Eliminierung der gesamten Fragestellung durch die Analyse der Beziehungen innerhalb der Wortverbindung (cjiOBocoHeTamie) bei P E T E R S O N und P E S K O V S K I J — eine Methode, die nicht ohne Parallelen in der Gegenwart geblieben ist — erlangt bei der generellen Legitimität ihres Vorgehens keine unmittelbare Bedeutung für den hier zur Rede stehenden Gegenstand. Zu erörtern bleibt allerdings der rationale Kern dieser Auffassung, nach der die Konkretheit des unmittelbar gegebenen Sprachmaterials nicht in der wie auch immer akzentuierten logischsyntaktischen oder formal-syntaktischen Abstraktion untergeht. Mit unseren Bemerkungen zu Z wollten wir das Abgrenzungsproblem innerhalb der Nebenglieder des Satzes relativieren. Zugleich räumen wir die Möglichkeit einer Spezifizierung von Za und Z0 ein. 3 . 1 . 3 . Einer der häufigsten Einwände gegen eine Gliederung der Prädikatsphrase in PK -f Z stützt sich auf die Interpretation von Beispielsätzen wie fljjpa aTOMOB pa3JiHiHbix 9JieMeHT0B oßjiaaaiOT pa3JiHHHHMH 3apHjjaMii. Die Tatsache, daß eine Eliminierung von Z hier einen unvollständigen Satz erzeugt *Hflpa . . . oßjiaaaioT, wird zum Anlaß dafür genommen, ein homogenes Element Z generell zu verwerfen. H E L B I G bringt diese Meinung zum Ausdruck, wenn er schreibt: „Es sträubt sich ohnedies auch unser Empfinden, im deutschen Satz „Berlin liegt an der Spree" die notwendige Präpositionalgruppe (im Sinne der Valenztheorie) als bloßen Modifikator anzusprechen, denn das, was modifiziert werden könnte, ist grammatisch und semantisch noch gar nicht vollständig." [5, S. 84] Diese Argumentation ist ohne Zweifel einleuchtend und im Rahmen der Valenztheorie völlig motiviert. Für eine Analysegrammatik im zur Rede stehenden Sinne werden diese Einwände 228
jedoch unerheblich. Konkrete Sätze des Typs *Berlin liegt oder *Hapa . . . oßjiaaaiOT treten eben in Texten nicht auf. Damit wird auch die Fragestellung für die Analysegrammatik hinfällig. Sie reduziert sich auf den Hinweis, daß ein entsprechendes A u f t r e t e n oder Fehlen von Z nicht gleichzusetzen ist mit einer E i n f ü g u n g oder Eli minier ung von Z.13 Wir sehen uns danach nicht veranlaßt, die stereotype sekundär spezifizierte Dreiteilung des Satzes (als Ableitung aus einer primären Zweiteilung) für den charakterisierten kommunikativen Zweck zurückzuweisen. In dieser Auffassung stützt uns auch die Argumentation, die sich in der wissenschaftlichen Grundlegung zur Akademiegrammatik der modernen russischen Literatursprache findet. Die Meinung von F R . DANES, wonach den beiden Sätzen OTei; CIIHT und OTei; iiHiueT niictMO zwei „Satzformeln" (Satzmodelle) zugrunde gelegt werden, wird von dem Kollektiv unter Leitung ,von SVEDOVA mit der Bemerkung zurückgewiesen, daß das Auftreten eines direkten Objekts nach dem transitiven Verb keine Frage des Satzbaus, sondern eine Frage der Wortverbindung sei. [12, S. 132-133] 3.2. Wir wollen jetzt unsere bisherigen Erörterungen zur Prädikatsphrase noch in bestimmter Hinsicht relativieren.1'1 Unsere Argumentation stützt sich auf die differenzierte Betrachtung von vorwiegend analytisch bzw. vorwiegend synthetisch orientierten Arten der Kommunikation. Wir bestreiten nicht, daß eine komplexe Behandlung der Prädikatsphrase, die gewöhnlich in der Grammatik anzutreffen ist, bestimmte Vorteile aufweist. Die konkreten sprachlichen Muster etwa eines „Valenzstrukturmodells" [6] sind für eine vorwiegend synthetisch orientierte Art der sprachlichen Kommunikation unentbehrlich. L. HOFFMANN zeichnet z. B. wesentliche Züge eines systematischen Verzeichnisses von Prädikatsphrasen. [7] Ein solches vollständiges Verzeichnis dieser sprachlichen Muster ist durchaus geeignet, dem Benutzer auch für eine vorwiegend analytisch orientierte Art der sprachlichen Kommunikation rationelle Arbeitsmittel an die Hand zu geben. Aller Wahrscheinlichkeit nach stellt eine Liste derartiger konkreter Muster, die im wesentlichen dem Herangehen an die Fragestellung auf der Ebene der Wortverbindung verpflichtet ist und damit, wie schon angedeutet, metasprachliche strukturelle und/oder logisch-semantische Abstraktionen nicht zum Ausgangspunkt für die Realisierung 13 14
Vgl. Anmerkung 16. W i r berühren hier zum Teil schon Probleme der Phrasenebene.
229
der wissenschaftlich-praktischen Zielstellung erhebt, die rationellste Lösung für eine operative Rückkopplung zur Identifizierung der im Text auftretenden Prädikatsphrasen dar. Vorläufig bereitet die Aufstellung einer solchen Liste allerdings noch einige Schwierigkeiten, wenn man an die notwendige Erfassung des gesamten Bestands der Prädikatsphrase denkt, der ungeheuer weit sein dürfte und auch die Nominalphrase mit in sich einschließt. 3.2.1. Zumindest für den analytischen Bereich halten wir die Trennung der Prädikatsphrase P P in P K und Z gegenwärtig aus zwei Gründen für angebracht: (1) Die Darstellung von P K ist wesentlich leichter und übersichtlicher möglich als die der PP. [16a, S. 56] (2) Die Ableitung von Kombinationen zu 3 Elementen ergibt einen brauchbareren Spiegel von im Text auftretenden Sätzen als die Entwicklung von Kombinationen zu 2 Elementen. Aus (1) folgt, daß die Tabelle bzw. Liste zu P K durch eine Beschreibung in Richtung Z ergänzt werden muß, um die P P zu erfassen. Aus (2) ergibt sich mit anschaulicher Deutlichkeit, daß eine Entscheidung für PP -> P K + Z sich exakt im mittleren Bereich zwischen zwei charakterisierten Positionen befindet. Die Lösung PP ->• P K + Z geht differenzierter vor gegenüber der Konzeption des PP-Verzeichnisses15 und generalisierender gegenüber der auf unterschiedlichen Ausgangsbeständen aufbauenden Vielfalt einer Theorie und Praxis der sekundären Satzglieder. Im Ergebnis dieser Überlegungen formulieren wir die folgende Spezifizierung Z Spezifizierung Z (1) Za und Z0 können in beliebiger Anordnung und Häufigkeit auftreten1®: vor jeder Kombination der Konstitutivsätze nach „ „ „ „ innerhalb „ „ „ „ (Das bedeutet, daß bei der Rückkopplung zusätzlich zur Ziffer der jeweiligen Kombination Angaben zu ^ Z erfolgen.) (2) Za und Z0 können in jeder Position fehlen.16 (3) Z kann P K spalten. 15
16
Diese Differenzierung gilt bedingt im Hinblick auf die Struktur des Satzschemas. Auf der Phrasenebene ist die Differenzierungskraft des PP-Verzeichnisses größer. Auftreten und fehlen sind hier nicht identisch mit einfügen bzw. eliminieren.
230
3.2.2. Es ist nicht uninteressant, den Gedanken zu verfolgen, welche Alternative sich im Rahmen der entwickelten Konzeption für eine Spezifizierung Z ergibt. Vermeidet man diese Spezifizierung und nimmt statt dessen Za und Z 0 in die Kombinatorik zum Konstitutivsatz auf, so erhält man statt der 6 bzw. 12 Permutationen 370 kombinatorische Ketten. Wollte man die Existenz eines weiteren Elements auf der Satzebene in die Kombinatorik einbeziehen, so entstünde bereits die außerordentlich hohe Zahl von 53188 Permutationen von Elementenfolgen innerhalb des einfachen Satzes. (Ausführlicher betrachten wir diese Ableitung in [16].) Wir wollen nicht unerwähnt lassen, daß in dem hier zur Rede stehenden Bestand an Kombinationen bereits eine Eingrenzung auf die natürliche Sprache vorliegt. Der Ausgangspunkt für einen Satz S max (oder eine maximale Ausdehnung der Phrase P m a x ) ist ja zunächst durchaus nicht unbedingt an eine natürliche Sprache gebunden. So konstituiert etwa im applikativen Modell S A U M J A N S der abstrakte Kalkül sogenannter R-Symbole ein rein tektogrammatisches System von Elementen. R. C O N R A D weist mit Recht darauf hin, daß Teile dieser abstrakten Strukturformeln in bestimmten Sprachen keine Entsprechung finden werden. Darüberhinaus besteht sogar die Möglichkeit, daß tektogrammatische Strukturen existieren, die in keiner der natürlichen Sprachen der Erde als belegt nachgewiesen werden können. [4, S. 117-118] So zitiert C H . MTJLLER den folgenden Satz aus Le Bourgeois Gentilhomme: „Belle marquise, vos beaux yeux rae fönt. mourir d'amour". für den aus einer Liste von 235 Varianten nur 5 als realisierbar' angenommen werden. [11, S. 37] 4.1. Nach den Erörterungen zur Problematik der Tabellen 1.1. und 1.2., die wir als qualitativ-abstrakte und der langue gemäße Verzeichnisse definiert haben, wenden wir uns jetzt der Aufgabe zu, die Belegung dieser Tabellen in Gestalt von der parole näher stehenden Listen vorzunehmen. Damit entstellt ein Verzeichnis von Mustersätzen, die stärker mit der realen sprachlichen Kommunikation verbunden sind. Die Besonderheit der Anordnung und Aufzählung dieser Mustersätze gegenüber anderen derartigen Verzeichnissen besteht darin, daß uns von vornherein auf Grund der systematischen Kombinatorik der Tabellen eine Basis als Ausschnitt aus dem Bereich der Kompetenz zur Verfügung steht, anhand dessen diese Mustersätze eine sinnvolle Gestaltung und Anordnung erfahren. Wir legen Wert darauf, daß unsere Liste der Mustersätze 231
dem Kriterium der potentiellen Vollständigkeit genügt. Im Bereich syntaktischer Strukturen ist diese Vollständigkeit kaum allein über eine linguostatistische Konzeption zu erlangen, die sich ausschließlich auf die parole bezieht. Mit den Angaben zur Kombinatorik der Tabellen stoßen wir auf die Problematik, daß eine „Statistik der Kompetenz" und damit der langue evident werden kann. Anhand der systematischen und überschaubaren Kombinatorik im Performanzbereich kann eine linguostatistische Konzeption ihre Ergebnisse auf Vollständigkeit überprüfen und Häufigkeitskriterien relativieren. Dabei läßt sich u. U. die Berechnung zum Umfang der Stichprobe in Richtung auf eine quantitative Einschränkung hin modifizieren. Wenn auch damit noch kein Häufigkeitsverzeichnis entsteht und den klassischen linguostatistischen Anforderungen nicht in ausreichendem Grade entsprochen wird, so erscheint uns doch wesentlich, daß sich hier gewisse Ansätze für die Überwindung der Schwierigkeiten im Bereich linguostatistischer Untersuchungen zum Satz (vgl. [7]) finden lassen. Man darf vielleicht sogar annehmen, daß die Probleme, die sich vor der Linguostatistik beim Übergang vom Wort und der Wortverbindung zum Satz auftun, eng damit zusammenhängen, daß mit diesem Übergang nicht zugleich die Einbeziehung der langue erfolgt und daß die Kombinatorik im Bereich der langue nicht berücksichtigt wird. Diesem Umstand steht wohl die allgemeinere Feststellung VINOGRADOVS nicht allzu fern, die davon ausgeht, daß eine unklare Definition solcher zentraler Begriffe wie der des Wortes und des Satzes die Grammatik entweder in einen Katalog äußerer Formen der Rede oder in ein abstraktes Schema elementarer logischer Kategorien verwandelt. [23, S. 3—4] 4.2. Bei der Belegung der Tabellen und der Darstellung der Muster in Gestalt von Listen - wir müssen diesen Abschnitt hier aus Platzgründen aussparen — ergaben sich einige interessante Aufschlüsse: (1) Die in Zusammenhang mit den Tabellen 1.1. und 1.2. angedeutete funktionalstilistische Relevanz (bzw. die stilistische Ungeordnetheit) fand bei der Aufstellung der entsprechenden Listen eine Bestätigung. So ergab sich in knappen Stichproben, daß die Muster 3 b und 4 b in einer erstaunlichen Häufigkeit in der Volksliteratur und im Märchen auftreten. Die ersten 13 Sätze des Märchens „CojiAaT h cMepTt" enthalten 5 Sätze vom Typ 3 b bzw. 4 b (z. B . 3 b :
CjiyjKHJi cojißaT 6 o r y . CjiysKHJi h u a p r o 2 5
tot.
BtiHyji
cojiflaT nocJieflHHÖ cyxapb; und 4 b : HeMHoro noro«H noaaeTCH eMy 232
apyroü Hiimi™. KjiaHneTCH eMy cTapeu.) Unter funktional-stilisti-
schem Gesichtspunkt scheint auch eine Konzentration der Belegung etwa von 6 b auf Vorwörter, Einleitungen, Berichte u. ä. interessant. Zu verifizierende Untersuchungen dieses Aspekts könnten eine differenzierte Behandlung der Tabellen und Listen zur Folge haben. (2) Eine Reihe von Kombinationen der Tabellen sind vorzugsweise innerhalb der Hypotaxe belegt. Das bezieht sich vor allem auf die Muster 3 und 4. Während 3 und 4 entsprechend der funktionalstilistischen Charakterisierung in (1) (volkstümliche Literatur, Märchen) auch als einfache Sätze belegt sind, fanden wir im angegebenen Bereich der wissenschaftlichen Literatur diese Belegungen nur im Rahmen der Hypotaxe und indirekter Fragesätze. (BußaioT H Tanne cjiyian, Kor^a . . . OöpaTiwic« JIH OH K BaM?) (3) Es ergaben sich ausgesprochene Konzentrationen gesteigerter Vorkommenshäufigkeit bei einzelnen Mustern. An der Spitze der unerwartet hohen Vorkommenshäufigkeit steht dabei offenbar die Belegung für 6 a. Sie fand sich sechsmal in den ersten acht Sätzen einer Literaturstelle aus dem Gebiet der Kernspektroskopie.17 Die Vorkommenshäüfigkeit von l b überraschte nicht. Interessanter ist wohl das gehäuftere Auftreten von 6b, für das es allerdings auf Grund der distinktiven Funktion der russischen Morphologie seit jeher empirische Vermutungen und auch bestimmte quantitative Resultate gibt. Die Häufigkeit des Auftretens von 5 a und l a entspricht den empirischen Erwartungen. Für 2 b und 5 b ließ sich im Rahmen des begrenzten Suchverfahrens keine Belegung finden. Die Schwierigkeiten der Belegung konzentrierten sich vor allem auf Tabelle 1.2. Hier mußte der größere Teil der Kombinationen noch ohne Belegung aus dem Text bleiben. Konzentrationen des Vorkommens deuteten sich für 9b, 12b, 13a und 16b an. Die Belegungen für 17-20 sind charakteristisch für die Kommandosprache im Sport (und wahrscheinlich auch in anderen Fachgebieten). Eine hohe erwartete Vorkommenshäufigkeit ergab sich für Konstruktionen vom Typ 9 a. (4) Als wesentlich für die Entwicklung der Listen erweist sich die Nutzung der Spezifizierung Z (vgl. 3.2.1.), die das zusätzliche Auftreten oder Fehlen innerhalb der Kombinationen bestimmt. Das ist insofern von Belang, als die im Text auftretenden Satzkonstruktionen naturgemäß mit Spezifizierungen von ^ Z zu finden sind. 17
Vgl.
SKRIPOV [21, S .
3]. Dabei ist diese Konzentration sicher auch zufällig.
233
(5) Die Belegung der Tabellen hat bestätigt, daß die Tabellen bzw. Listen in ihrer Totalität"neben der Respektierung der Spezifizierung Z nur im Rahmen des Satzgefüges bestätigt werden können. Die Entwicklung der entsprechenden Regel zur Erfassung der Hypotaxe stellen wir hier nicht dar, da dazu die Ableitung des Phrasenverzeichnisses erforderlich ist, die im Rahmen dieses Artikels nicht beschrieben werden kann. 5. Wir wollen zum Schluß hervorheben, daß nach abgeschlossenen Untersuchungen zu den Strukturmustern des Satzes und ihrer wahrscheinlichen funktionalstilistischen Relevanz eine andere hierarchische Anordnung der Kombinationen zu den Konstitutivsätzen als zweckmäßig erscheinen kann. Außerdem läßt sich dann die auf Grund des begrenzten Umfangs der Stichprobe unvollständige Belegung der Strukturmuster an exakter ermitteltem Material vervollständigen. Als Fazit zur hier dargestellten Problematik darf festgestellt werden, daß die Methodik des Vorgehens offenbar aufschlußreich ist und eine systematische Arbeit und Detailforschungen auf diesem Gebiet Erfolg versprechen. Wir wollen schließlich betonen, daß hier lediglich die Grundkonturen und einige spezifische Züge sowie wahrscheinliche Ergebnisse angedeutet werden konnten. Wir hoffen, daß der Hintergrund der Methodik sichtbar und deutlich wurde, welche Detailforschung auf diesem Weg möglich und nützlich sein kann.
Literaturangaben E . A G R I C O L A , Syntaktische Mehrdeutigkeit (Polysyntaktizität) bei der Analyse des Deutschen und des Englischen, Berlin 1968. [ 2 ] R. I . A V A N E S O V , Vtorostepennye cleny predlozenija kak grammaticeskie kategörii. Russkij jazyk v skole 1/1936. [3] V . V . BABAJCEVA, Odnosostavnye predlozenija v sovremennom russkom jazyke, Moskau 1968. [4] R. C O N R A D , Über das Verhältnis von Wortklassengenerator und Phrasengenerator im applikativen Modell. Probleme der strukturellen Grammatik und Semantik, Leipzig 1968, S. 115—132. [5] Gr. H E L B I G , Zum Problem der Wortarten, Satzglieder und Formklassen in der deutschen Grammatik. Probleme der strukturellen Grammatik und Semantik, Leipzig 1968, S. 55—86. [6] G. H E L B I G , W. Schenkel, Wörterbuch zur Valenz und Distribution deutscher Verben, Leipzig 1969. [1]
234
Studie zur E r a r b e i t u n g der linguistischen Grundlagen eines (teil)programmierten Lehrmaterials f ü r die fachsprachliehe Ausbildung in der D D R , Leipzig 1971, unveröff. Manuskript. [8] L . N . J O R D A N S K A J A , Avtomaticeskij sintaksiceskij analiz, Novosibirsk 1967. [ 9 ] T . N . M O L O S N A J A , O p o n j a t i i grammaticeskoj konfiguracii. Strukturno-tipologiceskie issledovanija, Moskau 1962. [10] A. M . M U C H I N , S t r u k t u r a predlozenij i ich modeli, Leningrad 1968. [ 1 1 ] C H . M Ü L L E R , E i n f ü h r u n g in die Sprachstatistik, Berlin 1 9 7 2 . [12] Osnovy postroenija opisatel'noj g r a m m a t i k i sovremennogo russkogo literaturnogo jazyka, Moskau 1966. [ 1 3 ] A. M. P E S K O V S K I J , Russkij sintaksis v naucnom osvescenii, Moskau [7] L . HOFFMANN,
1965.
[14] Prazskij lingvisticeskij kruzok. Sbornik statej, Moskau 1967. [ 1 5 ] N . N . P R O K O P O V I C , Slovosocetanie v sovremennom russkom literat u r n o m jazyke, Moskau 1966. [16] W . REINECKE, Objektivierungsprobleme im Beziehungsfeld von Maschinen- u n d H u m a n ü b e r s e t z u n g . Inauguraldiss., Leipzig 1968. [16a] W . R E I N E C K E , Zur Stellung der G r a m m a t i k in einem ( t e i l p r o g r a m mierten Lehrmaterial f ü r die Sprachkundigenausbildung. Wissenschaftliche Zeitschrift der Karl-Marx-Universität Leipzig, Gesellschafts- u n d Sprachwissenschaftl. Reihe 1/1972. [17] R . R Ü Z I C K A , O transformacionnom opisanii t a k n a z y v a e m y c h bezlic riyoji predlozenij v sovremennom russkom l i t e r a t u r n o m jazyke. Voprosy jazykoznanija 3/1963, S. 22—31. [18] R . R Ü Z I C K A , Bemerkungen zum Begriff des „ S a t z t y p s " . Ztschr. f ü r Slawistik 5/1969. [19] A. V. S A P I R O , K uceniju o vtorostepennych clenach predlozenija v russkom jazyke. Voprosy jazykoznanija 2/1957. [20] A. A. S A C H M A T O V , Sintaksis russkogo jazyka, Leningrad 1941. [ 2 1 ] F . I . S K R I P O V , K u r s lekcij po radiospektroskopii, Leningrad 1 9 6 4 . [ 2 2 ] V. M. SOLNCEV, J a z y k k a k sistemno-strukturnoe obrazovanie, Moskau 1971. [23] V . V . V I N O G R A D O V , Russkij jazyk (Grammaticeskoe ucenie o slove), Moskau-Leningrad 1947.
G U S T A V - A D O L F KRAMPITZ
Zu den Besonderheiten der (Teil-)Programmierung von Lehr- und Lernprozessen in der fachbezogenen Sprachkundigenausbildung
1.0. Die Besonderheiten der (Teil-)Programmierung von Lehr- und Lernprozessen in der fachbezogenen Sprachkundigenausbildung werden durch ihre Zielstellung, ihre inhaltliche, didaktisch-methodische und organisatorische Gestaltung sowie durch das Wesen des Gegenstandes bestimmt, das den Fremdsprachenunterricht generell von anderen Disziplinen abhebt. 1.1. Beim Fremdsprachenunterricht haben wir es mit einem Ausbildungsfach zu tun, in welchem der der sprachlichen Kompetenz zugrunde liegende Regelmechanismus zum großen Teil erarbeitet und die für die fremdsprachliche Kommunikation erforderlichen sprachlichen Fertigkeiten und Fähigkeiten entwickelt werden müssen, d. h., daß beim Erlernen einer Sprache neue phonische, phonologische, morphologische, lexikalische und syntaktische Erscheinungen vermittelt werden müssen, die in die für die Verständigung gleichzeitig zu entv/ickelnden Sprachfertigkeiten und -fähigkeiten ständig einzugliedern sind. L . Z A B R O C K I stellt den Unterschied zwischen der Erlernung von „nichtsprachlichen" Fächern und der Sprache folgendermaßen dar: Repertoire d. Senders (Lehrer) Sprache andere Fächer
Repertoire d. Empfängers (Lernender) Sprache andere Fächer
Phonische Einh. Phonolog. Einh. Morpholog. Einh. Wörter
bekannt bekannt bekannt bekannt
bekannt bekannt bekannt bekannt
unbekannt unbekannt unbekannt unbekannt
Wortsemanteme
bekannt
bekannt
Gram. Strukturen Satzsemanteme
bekannt bekannt
bekannt bekannt
unbekannt/ bekannt unbekannt unbekannt/ bekannt
bekannt bekannt bekannt bekannt/ unbekannt unbekannt bekannt unbekannt
237
Bei den Wortsemantemen geht Z A B R O C K I davon aus, daß dem Lernenden der größte Teil von ihnen bekannt sein dürfte, da sie aus dem Wortsemantembestand der Muttersprache stammen. Den bekannten Wortsemantemen werden die fremden Wörter zugeordnet. Dagegen kann es sich nach seiner Meinung beim Erlernen anderer Fächer nur um unbekannte Wortsemanteme handeln. Anders ist es nach seiner Auffassung bei Wörtern. Sie können den Adressaten sowohl bekannt als auch unbekannt sein, wobei aus bekannten Wörtern neue, d. h. unbekannte Satzsemanteme aufgebaut werden.1 Hieraus ergeben sich prinzipielle Unterschiede zwischen den Methodiken „nichtsprachlicher" Fächer und der Fremdsprachenmethodik, deren spezifische Aufgabe darin besteht, effektive Verfahren zu entwickeln, die den Adressaten zu „einer brauchbaren und ausbaufähigen Sprachbeherrschung" 2 im Rahmen eines gesellschaftlich bedingten Ziels führen. Dabei spielt die Vermittlung von Sprachkenntnissen im Unterrichtsgeschehen eine untergeordnete Rolle, da sie nur Grundlage der Entwicklung von Sprachfertigkeiten und -fähigkeiten ist. Aus diesen prinzipiellen Besonderheiten des Fremdsprachenunterrichts im Vergleich zu anderen Disziplinen resultiert die Spezifik der (Teil-)Programmierung von Lehr- und Lernprozessen in der Fremdsprachenausbildung, die uns dazu veranlaßt, zwischen einer inneren und ä u ß e r e n Programmierung zu unterscheiden, die der Differenzierung zwischen der introvertierten und extrovertierten Rückkopplung weitgehend entspricht, sowie den Begriff „Programmierung" durch „(Teil-)Programmierung" zu ersetzen. 1.2. Unter der inneren Programmierung von Lehr- und Lernprozessen, die im wesentlichen auf der introvertierten Rückkopplung beruht, verstehen wir die Modellierung der sprachlichen Tätigkeiten in Form von Algorithmen und Regeln. Hier sollen Prozesse rückgekoppelt werden, die im Bereich der Kommunikation selbst liegen. Bei der Lösung dieses Problems stößt die Forschung gegenwärtig auf sehr große Schwierigkeiten, weil sie nur dann Kommunikations1L.
2
ZABROCKI, Bemerkungen zur Spezifik des Fremdsprachenerlernens. Glottodidactica 2/1967, S. 6f.; H. HELLMICH, Lerntheorie und Applikation linguistischer Theorien im Fremdsprachenunterricht. Deutsch als Fremdsprache 5/1969, S. 360ff. H. HELLMICH, Lerntheorie und Applikation linguistischer Theorien im Fremdsprachenunterricht, a. a. O., S. 360.
238
prozesse modellieren und simulieren kann, wenn sie in den Bereich der inneren Programmierung eindringt. 3 Aber gerade das ist Voraussetzung dafür, daß auch die Automatisierung von Sprachabläufen und die bisher noch nicht programmierten Kontrollprozesse in die Regelung des Unterrichtsprozesses einbezogen werden können. Da die weitere Entwicklung des programmierten Fremdsprachenunterrichts von der Lösung dieses Problems entscheidend bestimmt wird, sollte der Forschung auf diesem Gebiet künftig besondere Aufmerksamkeit geschenkt werden. 4 1.3. Den Begriff ä u ß e r e Programmierung gebrauchen wir im Sinne der (Teil-)Programmierung von fremdsprachlichen Lehr- und Lernprozessen, deren wesentliches Merkmal die extrovertierte Rückkopplung ist, mit deren Hilfe die Aneignung des Lehrstoffes mit den zu akzeptierenden Einschränkungen operativ kontrolliert und der Unterrichtsprozeß in bestimmten Grenzen adaptiert wird. Die extrovertierte Rückkopplung wird durch programmierte Strecken mit weitgehender Einbeziehung moderner technischer Lehr- und Lernmittel realisiert. 5 1.4. Die (Teil-)Programmierung von fremdsprachlichen Lehrund Lernprozessen ist ein qualitativ neues, didaktisch, lerntheoretisch, linguistisch und fremdsprachenmethodisch begründetes, Verfahren zur methodischen und organisatorischen Gestaltung des fremdsprachlichen Ausbildungsprozesses, das durch die Synthese der auf den regelungstechnischen Anschauungen der Kybernetik beruhenden Regelung und Steuerung von fremdsprachlichen Lehrund Lernprozessen mit technisch hochentwickelten Lehreinrichtungen und den besten Elementen der traditionellen Fremdsprachenausbildung ein intensiv angeleitetes effektives Lernen mit 3
4
5
W. R E I N E C K E und G.-A. K R A M P I T Z , Einige grundsätzliche wissenschaftliche Probleme bei der Gestaltung der (teil-)programmierten Sprachkundigenausbildung in der DDR. Wissenschaftliche Zeitschrift der T U Dresden, Gesellschaftswissenschaftliche Reihe 1/19, S . 1274; W . R E I N E C K E , Objektivierungsprobleme des Übersetzens. Fremdsprachenunterricht 11/ 1968, S. 505; W. R E I N E C K E , G.-A. K R A M P I T Z , A. F R A N Z , Modell der Sprachkundigenausbildung der D D R (Stufen I I a und IIb), Leipzig 1971 (Manuskriptdruck), S. 54ff. W . R E I N E C K E , Zur Modellierung sprachlicher Fertigkeiten. Linguistische Arbeitsberichte 2/1970, S. 18ff. G.-A. K R A M P I T Z , Programmierte spezialsprachliche Ausbildung im kybernetischen Ansatz. Linguistische Arbeitsberichte 2/1970, S. 35.
239
Hilfe von Lehrprogrammen ermöglicht. Die (Teil-)Programmierung von fremdsprachlichen Lehr- und Lernprozessen ist somit ein überwiegend methodisch-organisatorisches Verfahren, dessen Stellung im Ausbildungsprozeß der Stellung der Methoden (und der Organisation) in der Relation der Elemente des pädagogischen Prozesses entspricht. Die (Teil-)Programmierung ist ihrem gesellschaftlich determinierten Ziel und ihrem Inhalt untergeordnet, wobei sie allerdings beide rückwirkend beeinflußt.6 1.4.1. Wie der Begriff (Teil-)Programmierung zum Ausdruck bringt, werden von der Regelung auf Grund des gegenwärtigen programmierungstheoretischen Standes im wesentlichen nur die präkommunikativen7 Phasen des Unterrichtsprozesses sowie die immanente Kontrolle von Sprachkenntnissen erfaßt. Dagegen entziehen sich die kommunikative Phase und die immanente Kontrolle von Sprachfertigkeiten und -fähigkeiten weitgehend der Programmierung, weil die Rückkopplung in diesem Bereich nur zu einem sehr geringen Teil möglich ist, wie z. B. bei der Textanalyse durch Verwendung der Analysegrammatik bzw. durch die Interlinearübersetzung, beim Hinübersetzen durch Vorgabe entsprechender ÜbersetzungsVarianten, die Kontrolle der Lese- und Hörfähigkeit durch Auswahlantworten u. ä. 8 Die Phase des freien Sprechens wird von der Regelung nicht erfaßt. Von größtem Interesse sind deshalb Versuche, die Grenze der Programmierung von Lehr- und Lernprozessen in diesem Bereich mit Mitteln der inneren und äußeren Programmierung (Modellierung von Sprachfertigkeiten, gesteuerte Konversation u. a.) zu überwinden. 1.4.2. Im Gegensatz zu „nichtsprachlichen" Fächern stellt das Übungssystem ein Kernstück des Fremdsprachenunterrichts dar, da nur durch Training die Entwicklung von Sprachfertigkeiten und -fähigkeiten im Rahmen der Zielstellung möglich ist, wobei die Übungsgestaltung durch ihre eigenen Gesetzmäßigkeiten und Prinzipien bestimmt wird. Das Übungssystem, das linguistisch determiniert ist, muß so gestaltet werden, daß es kommunikativ 6
7
8
Thesen über Ausgangspositionen und Probleme der Forschung des Forschungszentrums für Theorie und Methodologie des Programmierten Unterrichts, Leipzig 1972 (Masch.), S. 2ff. W . R E I N E C K E , G . - A . K B A M P I T Z , A . F R A N Z , Modell der Sprachkundigenausbildung . . ., a. a. O., S. 54ff. G.-A. K B A M P I T Z , Modell der Sprachkundigenausbildung der D D R (Stufen I I a und I I b ) . Wissenschaftliche Zeitschrift der K M U , Gesellschafts- und Sprachwissenschaftliche Reihe 1/1972, S. 27 und 33 ff.
240
sprachliche und geistige handlungsmäßige Operationen entfaltet, die die Adressaten „zum schöpferischen Einsatz ihrer fremdsprachlichen Mittel in Übereinstimmung mit ihrem kommunikativen Anliegen führen." 9 Die programmierten Übungstypen und ihre Abarbeitungsformen dienen der Aneignung der unter kommunikativer Zielstellung ausgewählten und bereitgestellten Sprachzeichen durch Erfassen, Nachahmen und Variieren des vermittelten Sprachstoffes, ihrer Anwendung in rezeptiven, reproduktiven und reproduktiv-produktiven einfachen und kombinierten Sprachtätigkeiten sowie dem Herausarbeiten von Teilautomatismen zur Entwicklung von Sprachfertigkeiten und -fähigkeiten. Die programmierten Übungstypen sind entweder Erfassungsübungen, die mit Reproduktionsübungen (Imitation) verknüpft sein können, oder Fertigkeitsübungen reproduktiv-produktiven Charakters, wie z. B. Formationsübungen, Substitutionsübungen und Transformationsübungen. Sowohl die Erfassungsübungen als auch die Fertigkeitsübungen sind in der Regel technikgebunden. Im mündlichen Bereich ist der Einsatz technischer Unterrichtsmittel, mindestens von Sprachtonbändern, obligatorisch. Die Fähigkeitsentwicklung erfolgt dagegen im wesentlichen mit Hilfe nichtprogrammierter Übungsformen, die allerdings mit Elementen sprachlicher und bildlicher Art gesteuert werden. 1.4.3. Obwohl die Programmierung von Lehr- und Lernprozessen nicht an technische Unterrichtsmittel gebunden ist, kann auf ihren Einsatz in einer (teil-)programmierten Fremdsprachenausbildung ohne Minderung des Lernerfolgs nicht verzichtet werden, da wir es hier vor allem mit der Vermittlung und Aneignung der Lautsprache zu tun haben, die zumindest die akustische Präsentation des Sprachmaterials voraussetzen. Der Einsatz von Sprachtonbändern, die mit visuellen Mitteln kombiniert werden können, entspricht deshalb nur den Mindestanforderungen einer (teil-)programmierten Fremdsprachenausbildung. Dagegen erfordert die Maximal-Variante den Einsatz videophonischer Lehr- und Lernmaschinen und des Fernsehens, das mit entsprechenden Rückkopplungsmechanismen kombiniert und mit EDV-Anlagen gekoppelt ist. 1.4.4. Im Gegensatz zu anderen Disziplinen überwiegen in einem (teil-programmierten Fremdsprachenunterricht lineare Programmstrecken, da sie den Gesetzmäßigkeiten des fremdsprachlichen Lehrund Lernprozesses besser entsprechen und die Geschlossenheit des 9
Fremdsprachenunterricht und Programmierung. Deutsch als Fremdsprache 2/1972, S. 91.
H . HELLMICH,
16 Fachsprachen
241
Lernkollektivs (gebundene Zeitstrategie) ermöglichen, auf die beim gegenwärtigen Stand der Forschung zur Formalisierung von Ausbildungsprozessen in der kommunikativen Unterrichtsphase nicht verzichtet werden kann.10 Mehrweg-Programme sind in der Fremdsprachenausbildung nur dann effektiv, wenn sie der Vermittlung von Sprachkenntnissen dienen und mit Lehr- und Lernmaschinen abgearbeitet werden. 1.4.5. Einen positiven Einfluß auf den Lernerfolg im (teil-)programmierten Fremdsprachenunterricht übt die Freiwahlmethode aus, da sie dem Adressaten durch das freie Konstruieren der Antwort und das Reproduzieren des vermittelten Sprachstoffes viel Aktivität in der Sprachausübung abverlangt. Dagegen ist die Auswahlmethode, die dem Adressaten eine Auswahl möglicher Alternativen anbietet, von denen er sich in der Regel für eine zu entscheiden hat, nur in begrenztem Maße anwendbar, weil sie die Entwicklung von Sprachfertigkeiten und -fähigkeiten zu wenig fördert. Sie leistet allerdings bei der Erarbeitung und Kontrolle von Sprachkenntnissen gute Dienste, vorausgesetzt, daß die Auswahlantwort keine sprachlich falschen Elemente enthält. Mit gewissen Einschränkungen ist sie auch im Rahmen der Fähigkeitsentwicklung einsetzbar. Sie kann hier die Überprüfung der Aufnahme des Sinngehalts von Hörund Lesetexten erleichtern und die Auslösung entsprechender Reaktionen sprachlich steuern.11 1.4.6. Um die Adressaten durch fortwährende Erfolgsbestätigung bewußt zu aktivieren und positiv zu motivieren, werden die programmierten Strecken eines (teil-)programmierten fremdsprachlichen Lehr- und Lernprozesses in kleine Prozeßabschnitte, d. h. in kleine Lehr- und Lernschritte sowie Lehr- und Lerneinheiten aufgegliedert, die entsprechend dem Leistungsvermögen der Adressaten an Größe zunehmen. Besonders bei der Aufnahme und Verarbeitung von Informationen in der Fremdsprache und von Informationen über die Fremdsprache trägt eine große Dichte von Kontrollpunkten wesentlich zur Erhöhung des Lernerfolgs bei. 1.4.7. Eine didaktisch und lerntheoretisch begründete Anpassung an das individuelle Lernverhalten in bezug auf Lerntempo und Lernweg ist in einer (teil-)programmierten Fremdsprachenausbildung durch die gebundene Zeitstrategie nur in sehr begrenztem Maße G.-A. KBAMPITZ, Modell der Sprachkundigenausbildung . . ., a. a. O., S. 25. 11 H. HELLMICH, Fremdsprachenunterricht und Programmierung, a. a. O., 10
S. 85.
242
möglich. So wird die Anpassung an das individuelle Lerntempo dadurch bestimmt, ob die programmierten Strecken im Selbststudium oder im Gruppenverband unter Aufsicht der Lehrkraft abgearbeitet werden. Im Gegensatz zur individuellen Abarbeitung der programmierten Strecken im Kollektiv ist im Selbststudium eine weitgehende Anpassung an das individuelle Lerntempo möglich. Sie wird allerdings durch den Zeitpunkt der folgenden Gruppenunterrichtsphase begrenzt, deren Erfolg vom mehr oder minder ausgeglichenen Kenntnisniveau der Adressaten abhängt. Dieselben Einschränkungen gelten auch für die Anpassung des Lehrprogramms an das individuelle Lernverhalten in bezug auf den Lernweg. Sie ergeben sich einerseits aus der gebundenen Zeitstrategie, andererseits aus dem begrenzten Einsatz des Mehrweg-Programms, den Möglichkeiten des Einweg-Programms und nicht zuletzt aus der Art der eingesetzten technischen Unterrichtsmittel. 2.0. Die (Teil-)Programmierung von Lehr- und Lernprozessen in der fachbezogenen Sprachkundigenausbildung wird — wie bereits erwähnt - nicht nur durch die vom Wesen des Gegenstandes bedingten Möglichkeiten und Grenzen der (Teil-)Programmierung des Fremdsprachenunterrichts bestimmt, sondern auch von ihren eigenen spezifischen Merkmalen. 2.1. Ein wesentlicher Unterschied der fachbezogenen Sprachkundigenausbildung zum Fremdsprachenunterricht anderer Art besteht in ihrer gesellschaftlich determinierten Zielstellung. Sie hat die Aufgabe, Erwachsene zu einer solchen Sprachbeherrschung zu führen, die ihnen die Teilnahme an der internationalen wissenschaftlichen Kommunikation im Rahmen der gesetzlich fixierten Zielstufen ermöglicht, die eine der wesentlichen Voraussetzungen zur gemeinsamen Lösung großer Produktions- und Forschungsaufgaben und zur Erzielung von Höchstleistungen auf dem Gebiet der Wissenschaft und Technik ist. Damit unterscheidet sich die fachbezogene Sprachkundigenausbildung in ihrer Zielstellung, die ihre inhaltliche, didaktisch-methodische und organisatorische Gestaltung weitgehend bestimmt, maßgeblich vom Fremdsprachenunterricht in der Schule und im Bereich der Fremdsprachenlehrerund Sprachmittlerausbildung. Die Unterschiede der fachbezogenen Sprachkundigenausbildung zum Fremdsprachenunterricht im Bereich der Fremdsprachenlehrer- und Sprachmittlerausbildung bestehen vor allem in ihren besonderen Zielfertigkeiten und -fähigkeiten und zum Schul16»
243
Unterricht vorwiegend in den lernpsychologischen Differenzierungen zwischen dem Kindes- und Erwachsenenalter und in der spezifischen Sprachbeherrschung. Letztere wird in einer (teil-)programmierten fachbezogenen Spraclikundigenausbildung in der Regel entwickelt, indem die dem Adressaten im Schulunterricht bekanntgemachte Kommunikationsbasis durch Erarbeitung der unter kommunikativer fachsprachlicher Zielstellung ausgewählten und bereitgestellten Sprachzeichen und durch ihre ständige Eingliederung in die für die wissenschaftliche Kommunikation gleichzeitig zu entwickelnden Fertigkeiten und Fähigkeiten weiter herausgearbeitet wird. 2.2. Eine (teil-)programmierte fachbezogene Spraclikundigenausbildung unterscheidet sich vom Fremdsprachenunterricht anderer Art auch in der Eingangsgröße, d. h. in den Momenten Inhalt, Methode und Organisation. 2.2.1. Die Besonderheiten des Inhalts einer (teil-)programmierten fachbezogenen Spraclikundigenausbildung werden durch die Spezifik der Wissenschaftssprache im allgemeinen und der betreffenden Subsprache im besonderen bestimmt. Die wichtigsten, d. h. die f ü r die Praxis relevanten, lexikalischen, morphologischen und syntaktischen Besonderheiten der Fachsprache werden in lexikalischen und grammatischen Minima erfaßt. Der Ausgangspunkt für die Ausarbeitung des grammatischen Minimums ist die Wissenschaftssprache, die sich von der künstlerischen Prosa durch eine Reihe von qualitativen Besonderheiten unterscheidet, wie z. B. „Nominalstil", „logische Folgerichtigkeit", „Informationsdichte" und „abstrakte Darstellungsweise". 12 Dagegen wird das lexikalische Minimum auf der Grundlage der Analyse der betreffenden Subsprache ermittelt, deren Wirkungssphäre sich nur auf einen begrenzten Personenkreis erstreckt. Auf Grund dieser Tatsache kann ihr lexikalischer und morphologischer Bestand im Vergleich zur Allgemeinsprache, die Grundlage des Schulunterrichts ist, leichter analysiert und das für die Praxis relevante lexikalische Minimum mit Methoden der Sprachstatistik, dem Einsatz der maschinellen Lochkartentechnik und der elektronischen Datenverarbeitung sowie anderer angemessener Methoden schneller ermittelt werden. 13 12
13
Zur Spezifik der Fachsprache in sprachstatistischer Sicht. Fremdsprachenunterricht 11/1968, S. 469. L . H O F F M A N N , G.-A. K R A M P I T Z , W . R E I N E C K E , Zwanzig Jahre fachsprachliche Ausbildung und Forschung an der Karl-Marx-Universität.
L . HOFFMANN,
244
2.2.2. Die didaktisch-methodischen Besonderheiten einer (teil-)programmierten fachbezogenen Sprachkundigenausbildung werden auch weitgehend von der Spezifik derPsychostruktur des Erwachsenen und den Ausbildungsbedingungen im Hoch- und Fachschulbereich bestimmt. 2.2.2.1. I n einer (teil-programmierten Sprachkundigenausbildung ist entsprechend den Besonderheiten der Psychostruktur des Erwachsenen bei der Erarbeitung, Festigung und Aktivierung von fremdsprachlichen Elementen stärker als im Schulunterricht der bewußten, diskursiv-logischen Komponente Rechnung zu tragen. Das sinnvolle und verstandesmäßige Einprägen von lexikalischen und grammatischen Erscheinungen ist für die rationelle und intensive Aufnahme und Verarbeitung von Informationen in der Fremdsprache und von Informationen über die Fremdsprache im Erwachsenenbereich unentbehrlich. Nach H. L Ö W E ist in der Erwachsenenbildung der Energieaufwand für das Einprägen dem Grad der Einsicht in kausale Zusammenhänge umgekehrt proportional. 1/1 Das gilt in vollem Maße auch für die Sprachkundigenausbildung. Deshalb muß hier die Vermittlung sprachlicher Elemente in größeren strukturgebundenen Zusammenhängen mit Hilfe von Bildern, Schemata, Skizzen u. ä. erfolgen. Das ist auch bei der Übungsgestaltung zu beachten. Besonders positiv auf den Behaltenseffekt bei Erwachsenen wirken sich auch systematische Zusammenfassungen vermittelter lexikalischer und syntaktischer Erscheinungen in Form von Basaltexten, Schemata, Skizzen u. ä. aus, da die Informationsverdichtung die Aufnahme und Verarbeitung von Informationen bei Erwachsenen wesentlich erleichtert. Von sehr großer Bedeutung für den Lernerfolg bei Erwachsenen sind auch die Aktivität und Motivation sowie die ständige Bewußtmachung der Fortschritte auf dem Wege zum Lernziel, wobei sich stärkere Aktivierung besonders günstig auf den Lernfortschritt leistungsschwacher Erwachsener auswirkt. 15 Auch die Lernintimität, die durch die (Teil-)Programmierung von Lehr- und Lernprozessen in der Fremdsprachenausbildung er-
)4
Wissenschaftliche Zeitschrift der KMU, Gesellsehafts- und Sprachwissenschaftliche Reihe 1 / 1 9 7 2 , S. 4ff.; W . R E I N E C K E , G.-A. KRAMPITZ, A. F R A N Z , Modell der Sprachkundigenausbildung . . ., a. a. O., S. 85ff. und 93ff. H. LÖWE, Lernpsychologie (Einführung in die Lernpsychologie des Erwachsenenalters), Berlin 1971, S. 148.
15 H . LÖWE, a. a. CH, S. 1 9 7 - 1 9 9 .
245
reicht wird, wirkt sich besonders bei leistungsschwachen Erwachsenen sehr positiv auf den Lernerfolg aus. Die genannten lernpsvchologischen Besonderheiten im Erwachsenenbereich zeigen, daß eine stärkere didaktisch-methodische Differenzierung zwischen dem Schul- und Erwachsenenunterricht notwendig ist. Aus diesen lernpsychologischen Besonderheiten folgt aber auch, daß die (Teil-)Programmierung von Lehr- und Lernprozessen in der fachbezogenen Sprachkundigenausbildung besonders erfolgversprechend ist, da die programmierungstheoretischen Grundsätze die Spezifik der Psychostruktur des Erwachsenen weitgehend berücksichtigen. 2.2.2.2. Die didaktisch-methodischen Besonderheiten einer (teil-)programmierten fachbezogenen Sprachkundigenausbildung werden auch durch die besonderen Organisationsformen der spezialsprachlichen Ausbildung im Hoch- und Fachschulbereich bestimmt. Ein Lehrprogramm muß in diesem Bereich so gestaltet werden, daß es sowohl im Gruppenunterricht mit zwei und mehr Wochenstunden als auch in Intensivkursen bis zu zwanzig Wochenstunden eingesetzt werden kann. Einen gewissen Einfluß auf die didaktischmethodische Gestaltung einer (teil-)programmierten fachbezogenen Sprachkundigenausbildung übt auch die im Vergleich zum Schulunterricht geringere Kursstärke (Normalkurse: 1 0 - 1 5 Teilnehmer; Spezialkurse: 6 - 1 0 Teilnehmer) aus. Das gestattet eine effektivere Abarbeitung der nichtprogrammierten Strecken und eine rationellere und intensivere Gestaltung der Zwischenkontrollen. 2.3. Um eine zielgerichtete und kontinuierliche Entwicklung von Spraehfertigkeiten und -fähigkeiten unter den Bedingungen der spezialsprachlichen Ausbildung im Hoch- und Fachschulbereich zu erreichen, wird das Lehrprogramm einer fachbezogenen Sprachkundigenausbildung nach den Gesichtspunkten eines komplex angelegten Lehrmittels gestaltet, in welchem die programmierten und nichtprogrammierten Strecken zu einer didaktisch-methodischen Einheit verschmelzen, wodurch eine weitgehende Steuerung der nichtprogrammierten Strecken erreicht wird. Diese Kombination bewirkt darüber hinaus eine Lernsituation, in der die Vermittlung, Festigung und Aktivierung von fremdsprachigen Elementen weitgehend selbständig und die Entwicklung von Sprachfertigkeiten und -fähigkeiten bei unmittelbarer Führung durch den Sprachlehrer erfolgt. 2.3.1. Das Lehrprogramm der fachbezogenen Sprachkundigenausbildung, in welches bei seiner Erarbeitung und Erprobung die 246
Erfahrungen sowie die pädagogischen, lerntheoretischen, didaktischmethodischen und linguistischen Kenntnisse mehrerer Sprachlehrer einfließen, vermittelt dem Adressaten den fachsprachlichen Lehrstoff und die Zielfertigkeiten und -fähigkeiten in einer didaktisch geordneten Folge von rückgekoppelten und nichtrückgekoppelten Lehr- und Lernschritten und Lehr- und Lerneinheiten und regelt und steuert den Lernfortschritt auf Grund kontinuierlicher immanenter Kontrollen des Lernerfolgs. Es übt damit die Funktion „einer didaktisch, lerntheoretisch und fachmethodisch begründeten Vorschrift für den Vollzug von Aneignungsoperationen" , e aus. 2.3.2. Das Lehrprogramm der fachbezogenen Sprachkundigenausbildung wird durch ein allgemeinsprachliches Lehrprogramm, das nach ähnlichen programmierungstheoretischen Gesichtspunkten zentral ausgearbeitet wird, und durch Texte für die Anwendungsund Vertiefungsetappe ergänzt, die zur Eigeninformation bzw. zum Nutzen der Wissenschaftsgebiete vom Adressaten z. T. selbständig ausgewählt und ausgewertet werden. 2.3.3. Das Lehrprogramm der fachbezogenen Sprachkundigenausbildung trägt ebenso zur Entwicklung der Überzeugungen und Einstellungen bei wie andere Lehrmaterialien. Es muß allerdings von vornherein so angelegt sein, daß es in seiner Grundkonzeption und seinen Untereinheiten einen deutlichen Beitrag zur ideologischen klassenmäßigen Erziehung leistet. 17 2.4. Wie bereits erwähnt, wird der Lehr- und Lernprozeß einer (teil-)programmierten fachbezogenen Sprachkundigenausbildung in Prozeßabschnitte aufgegliedert, die den praktisch bewährten Gliederungselementen eines Lehrprogramms entsprechen. Um der Spezifik des Fremdsprachenunterrichts im allgemeinen und der fachbezogenen Sprachkundigenausbildung im besonderen Rechnung zu tragen, ist es notwendig, die Anzahl der Gliederungselemente im Vergleich zu anderen Disziplinen wesentlich zu erhöhen. Nach den Empfehlungen des Leipziger Forschungszentrums für Methodologie und Theorie des programmierten Unterrichts sollte ein Lehrprogramm in — Lehrschritte, — Lehreinheiten und — Programmabschnitte 16
17
Thesen über Ausgangspositionen und Probleme der Forschung . . ., a. a. O., S. 4. W. RERNECKE, G.-A. K B A M P I T Z , A. F R A N Z , Modell der Sprachkundigenausbildung . „ a. a. O., S. 28.
247
untergliedert werden, wobei unter einem Lehrschritt das kleinste Element eines Lehrprogramms verstanden wird, welches eine Fragebzw. Aufgabenstellung, die Darbietung und Kontrolle beinhaltet und unterschiedliche Funktionen ausübt. In der Regel werden mehrere Lehrschritte unterschiedlicher didaktischer Funktion, darunter zumeist ein Kontrollschritt, zu einer Lehreinheit vereinigt. Mehrere Lehreinheiten werden zur Realisierung einer oder mehrerer didaktischer Funktionen in einem Programmabschnitt zusammengefaßt. 18 Im Unterschied dazu wird ein Lehrprogramm der fachbezogenen Sprachkundigenausbildung in folgende didaktisch-methodische Elemente untergliedert: -
Lehrschritte, Lehreinheiten, Sequenzen, Programmabschnitte, Programmkomplexe und Programmzyklen.
Durch die Einführung zusätzlicher Gliederungselemente, d. h. der Sequenzen, Programmkomplexe und Programmzyklen, werden wir den didaktisch-methodischen und organisatorischen Besonderheiten der fachbezogenen Sprachkundigenausbildung besser gerecht. So faßt die Sequenz Operationen mit gleichartigen sprachlichen Elementen bzw. gleicher didaktisch-methodischer Zielsetzung zu einer didaktischen Einheit zusammen. Der Programmkomplex vereinigt Programmabschnitte gleicher Fachthematik zu einer Einheit mit natürlichen Kommunikationsakten, deren "sprachliche Grundlagen in relativ kurzzeitigen Zyklen zielstrebig entwickelt werden. Dagegen umfaßt ein Programmzyklus jeweils drei Programmkomplexe, in der Regel gleicher Fachthematik, und eine Zwischenkontrolle. Die Einführung von Programmzyklen ist notwendig, um der Entwicklung aller gesetzlich fixierten Zielfertigkeiten und -fähigkeiten gleichermaßen gerecht zu werden und die vom Lehrprogramm geregelten und gesteuerten Lehr- und Lernprozesse den Bedingungen der spezialsprachlichen Ausbildung im Hoch- und Fachschulwesen unserer Republik (in der Regel Gruppenunterricht bei zwei Wochenstunden) weitgehend anzupassen. 19 18
19
Thesen über Ausgangspositionen und Probleme der Forschung . . ., a. a. O., S. 5. S. K O H L S und G.-A. KRAMPITZ, Zur Konzeption der neuen Lehrmittel-
248
3.0. Aus den skizzierten Besonderheiten der (Teil-)Programmierung des Fremdsprachenunterrichts im allgemeinen und der fachbezogenen Sprachkundigenausbildung im besonderen können folgende Schlußfolgerungen für die programmierungstheoretischen und programmierungspraktischen Forschungsvorhaben im Rahmen der fachbezogenen Sprachkundigenausbildung gezogen werden: 3.1. Die (Teil-)Programmierung von fremdsprachlichen Lehrund Lernprozessen wird maßgeblich von den Grundsätzen und Hauptzielen der Sprachaneignung bestimmt. Sie unterscheidet sich demzufolge wesentlich von der Programmierung von Lehr- und Lernprozessen in „nichtsprachlichen" Fächern. Die von der marxistisch-leninistischen Pädagogik und Psychologie ausgearbeiteten allgemeinen programmierungstheoretischen Prinzipien müssen deshalb unter besonderer Berücksichtigung sprachwissenschaftlicher, psycholinguistischer und fremdsprachenmethodischer Erkenntnisse sowie unterrichtspraktischer Einsichten und Erfahrungen modifiziert werden. 3.2. Um die Programmierung der Fremdsprachenausbildung weiterzuentwickeln, sollte sich die Forschung im Bereich der Theorie des Fremdsprachenunterrichts auf Untersuchungen zur Modellierung sprachlicher Tätigkeiten, auf die weitere Umsetzung programmierungstheoretischer Erkenntnisse der marxistisch-leninistischen Pädagogik und Psychologie, auf die Auseinandersetzung mit bürgerlichen programmierungstheoretischen Ansätzen und die deutliche Abgrenzung von den Positionen der bürgerlichen Pädagogik sowie auf den Einsatz moderner audio-visueller technischer Unterrichtsmittel konzentrieren, die ein wesentliches Mittel zur Objektivierung des Unterrichtsprozesses und zur Automatisierung von Kontrollprozessen sind. 3.3. Die Weiterentwicklung der Programmierung im Bereich der fachbezogenen Sprachkundigenausbildung hängt unter anderem auch davon ab, inwieweit sie die Spezifik der Erwachsenenbildung berücksichtigt. Aus diesem Grunde ist Untersuchungen zu den lernpsychologischen Besonderheiten des Erwachsenen im Rahmen der Sprachkundigenausbildung größere Aufmerksamkeit zu schenken. 3.4. Angesichts der Diskussionen um das Für und Wider des programmierten Unterrichts möchten wir betonen, daß die Prokomplexe für die Sprachkundigenausbildung in der DDR. Fremdsprachenunterricht 3/1972, S. 124/125.
249
grammierung von Lehr- und Lernprozessen keine Modeerscheinung ist, wie das z. T. noch behauptet wird, sondern sie ist ein Verfahren, welches - wie die vorliegenden praktischen Ergebnisse beweisen eine höhere Erfolgssicherheit als andere Methoden und Verfahren gewährleistet. Das ist sowohl auf die logische, mathematische und statistische Durchdringung des Unterrichtsprozesses und seiner Inhalte als auch auf die intensive pädagogische Anleitung des Ausbildungsprozesses zurückzuführen.
RENATE
SCHNEIDER
Häufigkeitsliste des russischen Wortschatzes in Texten der Philosophie und des wissenschaftlichen Kommunismus
Rang
Wort
relative Häufigkeit
1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16.
H B 3TOT Ha ITO K C ÒHH TOT pa3BHTHe Beet OT OÖmeCTBO CBOft KOTOpHÄ OH MeJioBeK KJiacc
0,041829 0,040486 0,013086 0,010229 0,009743 0,009371 0,009057 0,008486 0,007943 0,007400 0,007 371 0,006629 0,006343 0,006314 0,006029 0,005314 (0,010628) 0,005257 0,005086 0,005057 0,004714 0,004600 (0,009200) 0,004543 0,004457 0,004400 0,004200 0,004171
17. 18. 19. 20. 21. 22. 23. 24. 25. 26.
OÖmeCTBeHHHft 0 a COmiaJIHCTHHeCKHtt cTpaHa HBJIHTbCH OHa 6opt6a MOHb napTHH
27.
paßoHHä
0,004143
28.
$opMa
0,004114
29.
6UTI> KOMMyHHCTHHÖCKHÄ
30.
3JIH
0,004086 (0,008172) 0,003800
251
Bang
Wort
relative Häufigkeit
31.
H3 oTHomeHHe CHJia «pyroa npOB3BOflCTBO C0UHaJIH3M MHp ÄBHJKeHHe HBJieHHe
0,003714 (0,011142)
32. 33. 34. 35. 36. 37. 38. 39. 40.
41. 42. 43. 44. 45. 46. 47. 48. 49. 50. 51.
HJIH
no 3âKOH Me?K«y
npoijecc ycnoBHe Macca HOBMli HO 7KH3HL 3a Hayna npoTHBOpeHHe peBOJIIOUHH onpeneJiHTb no3HaHHe COBeTCKHÜ coBpeMeHHbiö KOMMyHH3M co3HaHne KÖLK npw
52. 53.
ce6a CBH3B TaKOii
54.
BpeMH TeopHH
55.
6yp>Kya3Hi>iii KanHTaomcTHiecKHÄ
0,003571 0,003486 0,003457 0,003429 0,003400 0,003314 0,003257 (0,006514) 0,003114 0,003029 (0,009087) 0,003000 (0,006000) 0,002943 0,002800 0,002743 0,002686 (0,005372) 0,002629 0,002543 (0,005086) 0,002486 (0,004972) 0,002457 0,002429 0,002400 (0,004800) 0,002343 0,002314 (0,004628) 0,002286 (0,004572) 0,002200 (0,008800)
06T>eKTHBHHÜ Tpyn 56.
CHCTeMa
BKOHOMHMeCKHÄ 57. 58. 59. 60.
252
MaTepHH
npapo^a OHO HMeTb KaniiTaJiB3M
0,002171 (0,004342) 0,002143 (0,004286) 0,002086 0,002057 0,002029
Hang 61.
Wort
relative Häufigkeit
HCTOpHMeCKHÖ
0,002000 (0,006000)
H a p OA TaK
62. 63.
Bonpoc OCHOBa TpyAHUHHäCH
64.
B03M0JKH0CTb MaTepwajm3M
0,001971 0,001943 (0,003886) 0,001914 (0,011484)
npeAMeT npOTHB CO 103
87.
CTpOHTeJIbCTBO rnnpoKHö MOWHO HanpHMep
88.
nepexoH caM B03HHKaTb nonomeHHe
0,001143 (0,004572) 0,001114 (0,004456)
npHHqnn
89.
HTO6H RO M03r
0,001086 (0,006516)
noKastiBaTb
90. 91.
npeRCTaBiiHTb npon 3BO«CTBeHHHÄ CBH3bIBaTb e^HHCTBO HHTepec peBOJIIOIfHOHHblit ßojibiiioÄ BHÄ BJiaCTb
254
0,001057 (0,003171) 0,001029 (0,008232)
Bang
92. 93.
Wort BbipaXOTb AaHHbiä HeMOKpaTHH 3HaneHHe OTHeitbHblÜ BHyTpôHH HÜ noJiHbiit n03T0My ôasa HeöcTBHe
relative Häufigkeit
0,001000
(0,003000) 0,000971 (0,004855)
KaKoii
noHHMaHHe X03HÜCTB0
94.
95.
HeMOKpaTHiecKHit KanecTBo HaUHOHaJIbHhIH He TOJIbKO . . . HO H oôJiacTb npOH3BORHTejII>HHit paccMaTpHBaTb CymHOCTb 6asuc BCHKHÖ
200. Wort 96.
3HaHne MHCJIb imcaïb ïipOTHBOnOJIOHiHOCTb yTBepjKflaTb BejIHKMil nporpaMMa
97.
pa3BHBaTb 3aKOHOMepHOCTb H«TH KOHKpeTHHÖ
0,000943 (0,007544)
0,000914 (0,006398)
0,000886 (0,002658) 0,000857 (0,005999)
MapKCHCTCKHÄ
MeHKeHHe 3peHHe KpeCTbHHHH npaKTimecKHft npHXOflHTt CKanoK COCTaBJIHTL TpeöoBaHHe TpeßoBaTb $HJIOCO eKTHBHO-H«eaOIHCTHHeCKHfi cyBepeHHTBT
cy«b6a CXOJiaCTHHeCKHÜ TO
TpyHHTbCH yBameHHe ynpaBJiHTb yCKOpHTb
ycTpaHeHHe yMäCTBOBäTb
(jpeoRaJiii3M ^eoflaJibHbiö HcneHKe OKOJIO OKOHiaTejIbHblS onHpaTbCH onnopTyHHCT onnopTyHHCTHieCKHü onpoßepraTb ocHOBaHwe OCHOBHOe
OTRejIHTb OTKpblTO OTHOCHTb
OTHIORb OIllIlÔOHHblft naCCHBHBlii naTpHOTH3M nepeJioM IIOBTOpHGMOCTb
1200. W o r t
noRBepraTb nOArOTOBJIHTb
noAOÖHo nonteM nocjieacTBHe nOCTOHHCTBO nocTynaTejibHMii npaBHno
276
relative Häufigkeit
Bang
Wort
relative Häufigkeit
npaBHTejii npaBOTa
npejjejibHO npe^nonaraTb npe»HHö npeTepneßaTt npHHHMaTb nptJHOCHTB npHHUHnHanbHHä npHpOflHblÖ npwneM npoROJiHtaTb npoH3BeAeHHe np0THB0«eiiCTBHe npOTHBOnOCTaBJIHTb npoTHJKeHHe npoxoAHTb npOHHHii npHMOÖ paBHbiìt pa3Max pa3H0BH«H0CTb pa3yMHbiii pacKon
peBH3H0HHCT peMecneHHHK pOflHHa CaMOCTOHTeHBHOCTb CBÖT CB060ÄHHÖ ceitaac CHTyai;HH CKOBHBaTb CKOJIbKO CJiejiyiomHii CMeUIHBaTb
cornaciie coKpamaTb COJIHRapHOCTb conpoTHBjieHHe couHan-AeMOKpaT C0I03HHK cnaceHHe
cnjiaiHBaTb cnop cpa3y cTaHOBjieHHe
277
Rang
Wort
relative Häufigkeit
CTapaTbCH CTHXHÜHO CTpanatt CTpoHTent CTpyKTypa cyMMa cepa cxeMa
CXORCTBO TaKOBOä TBopnecKH TeM ne MeHee TeMn TeopeTHK TepMHH
TeCHO TOJIKOBaHHe
Tpa«HIopMHpoBaHiie (jiyHRaMeHT xapaKTepacTHKa
1290. Wort
liejIHKOM necTb HpKHÄ HCHO
Die in Klammern stehenden Zahlen sind die Werte für die kumulative relative Häufigkeit aller unter einem Rang vereinten lexikalischen Einheiten.
MARIANNE LEHMANN
Häufigkeitsliste des russischen Wortschatzes in literaturwissenschaftlichen Texten
Bang
1 2 3 4 5 6 7 8
Wort
relative Häufigkeit
kumulative relative Häufigkeit
B
0,051200 0,038800 0,020771 0,013114 0,012229 0,009829 0,009371 0,007 943
0,051200 0,090000 0,110771 0,123885 0,136114 0,145943 0,155314 0,171200
0,007800 0,007514 0,007114 0,006543 0,006343 0,006086 0,005800 0,005600
0,179000 0,186514 0,193628 0,200171 0,206514 0,212600 0,218400 0,229600
0,005229 0,005171
0,234829 0,245171
0,004943 0,004914 0,004800 0,003771 0,003429
0,250114 0,255028 0,259828 0,263599 0,270457
0,003371 0,003343 0,003200
0,273828 0,277171 0,283571
0,002914
0,286485
K OH C 3T0T K Ha 0 CBOft
9 10 11 12 13 14 15 16
r0A KOTOpHÄ OHa OHH TOT HTO Becb JKH3Hb
HejioBeK 17 18
pOMaH
19 20 21 22 23
Kau
HO OT H3 ÖHTb nwcaTeJib
no npoH3BeneHire
24 25 26
jiHTepaTypa «JIH 3a HHCaTb
27
6opb6a
279
Rang
28 29 30 31 32 33 34
Wort
relative Häufigkeit
kumulative relative Häufigkeit
repoü
0,002829 0,002600 0,002543 0,002457 0,002400 0,002371 0,002200
0,289314 0,291914 0,294457 0,296914 0,299314 0,301685 0,312685
0,002171 0,002086
0,314856 0,319028
0,002057
0,323142
0,002029 0,001971 0,001943
0,325171 0,327142 0,331028
0,001914 0,001886 0,001800 0,001771 0,001743 0,001714
0,332942 0,334828 0,336628 0,338399 0,340142 0,343570
0,001686 0,001629 0,001600 0,001571 0,001543 0,001514
0,345256 0,346885 0,348485 0,350056 0,351599 0,354627
0,001486 0,001457
0,356113 0,359027
0,001429
0,361885
0,001400
0,367485
0,001371 0,001343
0,368856 0,371542
«pyroit HOBHÖ
y ßojibmoii ceÔH 6yp»ya3HHit Ben o6pa3 OflHH TBopnecTBo
35 36
Hapofl; HCKyCCTBO KHHra
37 38 39 40 41 42 43 44 45 46
n09T HBJIHTbCH
ItJIH BpeMH paßOHHÖ TaKOÜ CTaHOBHTbCH pyCCKHÜ a BOÜHa HeMeiiKHii MHp oSmecTBeHHHü
47 48 49 50 51 52
xapaKTep necHH HCTOpHieCKHÖ pa3BHTHe npOTHB jiHTepaTypHHii peBOJIKIiHH
53 54
II033HH HapOÄHBlii coiiiiajibHtiii
55
AO MOHb
56
HCTOpHH paccKa3 co3HaBaTb $paHiiy3CKHtt
57 58
CBH3HBaTb OÄHaKO ciijia
280
Rang
59
Wort
relative Häufigkeit
kumulative relative Häufigkeit
OÖmeCTBO
0,001314
0,374170
0,001286
0,378028
0,001257
0,381799
0,001229
0,385486
0,001200
0,392686
0,001171
0,395028
0,001143
0,406458
0,001114
0,410914
0,001086
0,418516
0,001057
0,423801
caM
60 61 62 63
64 65
66
MBICJIh peBOJIIOIJHOHHHÄ $opMa HaiHHaTi. noKa3HBaTi> npwpoAa CTopoHa
TaK Tpy« rOBOpHTI) OTHOiueHHe npn COBeTCKHÜ y»e xyROJKecTBeHHHit BejIIIKHÜ nOJIHTHHeCKHfi aMepuKaHCKHö Bonpoc KBHJKeHHe HeäCTBHTeJIbHOCTB Hpaiwa H3o6pa>«aTb nbeca caMLiit CTpana TeMa Kor^a MCWIOROft CTHXOTBOpeHHe
67
TpaAHIiHH jjaBaTb AOJIHteH Mbl Hayna HaXORHTb
68
Ha^ajio cjiobo HeHTenbHOCTB nroßoBb nocne ponb coBpeweHHbiÄ
281
Rang
Wort
relative Häufigkeit
kumulative relative Häufigkeit
69
HMeTb no« nyn> aHrjiirfiCKHii BbicTynaTb xapaKTepHHü emë
0,001029
0,426888
0,001000
0,429888
0,000971
0,433772
0,000943
0,439430
0,000914
0,447656
0,000886
0,452086
0,000857
0,458942
0,000829
0,465574
70 71
Hani
72
73
74
CTapbiii anoxa BJIHHHlie ropoA «ejio 3HaneHHe TBopnecKHit nepTa aBTop r«e MeCTO na« OCHOBHOft nepHOA niiCfaMO nocjieAHHÄ coôiiTHe H3o6paHteHHe Kpyr HeKOTOpUft OCHOBa
75
76
282
ycjioBwe KOHeii MHOrO nepe« npej(CTaBJiHTb npoi;ecc PHA CTHX HyBCTBO H«eH napTHH npoßjieiua CBH3b CMtICJI coaepwaHHe TpareAHH HTOÖH
Bang
Wort
relative Häufigkeit
kumulative relative Häufigkeit
77
BfcixoflHTb «ejiaTb
0,000800
0,476774
0,000771
0,482942
0,000743
0,488143
0,000714
0,492427
0,000686
0,499287
«yx
3HaHHTejIbHbIÄ Me>KHy Ha3HBaTb oSpamatb oneHb
nOJIHHÖ peajiH3M CTpeMHTbCH
78
CblH XOTH miipOKHÖ rJiaBa HeÄCTBHe 3ffecb n3yieHHe OKasbiBaTbCH paÔoTa
79
xopouiHtt H3bIK BaiKHHit BHfleTb rjiyßoKHü KJiacc
80
OHO OCTaBaTbCH MeM Htanp
HHTepec
OTMeMaTb nOHJIHHHHtt nOCBHmaTb
81
pOMaHTHieCKHÜ BecTH rnaBHMft 3a«ana H3BeCTHblft MHpOBOÖ oömHö njiaH pasBHBaTb pacKpHBaTb CMJIbHbltt
283
Bang
Wort
relative Häufigkeit
kumulative relative Häufigkeit
82
JKHBOÜ KaKOli MHorae
0,000657
0,507171
0,000629
0,514719
0,000600
0,527319
HaitHOHaJIBHblä He TOJibKO . . . HO n nonHTKa pHCOBâTb CaTHpHHeCKHK CT&TBH CHHTaTb
83
84
HHTaTenb H BJiacTb BMecTe c BHHMafliie KpMTHKa no3Ma n03THieCKHÜ npeACTaBJieHwe npOTHBOnOCTaBJIHTb IipOHBJIflTB peanbHbiii CeMbH COmiaJIHCTHHeCKHit 6ea BHyTpeHHHfl BHpaJKaTb BblCOKHfi KJiaCCHIiH3M KyjibTypa nnpHKa JIIOÖHTb
Macca OTHeJItHHfi nO«HëpKHBaTb n03HIJHH nojiynaTb noHHMaTb npoìioJiwaTb paHHHÖ pOJKflaTbCH epe«« ljeub anonen HBJieHHe
284
Rang
Wort
relative Häufigkeit
kumulative relative Häufigkeit
85
«yxoBHHü 2KH3H6HHblä JKHTB HtypHaji aaHHMaTb HflTH KaK H KanHTajiMCTHiecKHit nepeflOBOit nepcoHam npwHaHJie)KaTb npHHiiwn npoTHBopeMHe COM3 CTpeMJieHHe TeHAeHI(HH HenoBe^ecKHii nepe3 BOJIH Bcerna «pyr 3aK0H KapTHHa JIHIJO oTpawaxb no6e«a noßecTb noHHMaHHe npeBpamaTb npeflCTaBHTejit npwBjieKaTb npHBOJJHTh npHXOAHTb . npoHHKaTb npocBeTHTejit nyßjiHKOBaTb THn
0,000571
0,537597
0,000543
0,548457
0,000514
0,558737
86
niTaT
87
repomecKHö rJiyöoKO ÄaJieKO HMH KpHTIMeCKHft KpynHbiit JinpuiecKHü MeTOA
285
Rang
Wort
relative Häufigkeit
kumulative relative Häufigkeit
0,000486
0,568457
0,000457
0,578968
HeCMOTpH Ha OTHOCHTbCH nOHBJIHTBCH npHHHMaTb
npOHCXOÄHTb paccKa3UBaTb peajiHCTHqecKHii cSopHHK COeflHHHTb CTâBHTb XyflOÎKHHK
88
flpKIlfi BecbMa
BbipaTKeHHe Hy ina jKeHmHHa 3ByiaTb HrpaTb
HEOÖ
HCn(MIb30BaTb
KpeCTbHHHH jiHTepaTypoBeseHHe Mepa
HOBejina onpeflejiHTb ocoôeHHO OTeii
npoJieTapnaT npoxoflHTb CBOÖOflHblft CMepTb
89
$aKT
BHfl BHI3bIBaTb BbICOKO H . . . H KTO
HanpHMep HayHHHü OTJMWaTb
oTpaweHHe npaBO npodoit po«
CJiyJKHTb cnyiafi 286
Rang
90
91
Wort
relative Häufigkeit
kumulative relative Häufigkeit
6JIH3KHÖ
0,000429
0,587119
SypwyaBHH
0,000400
0,596319
coßcTBeHHMä cpefla cijeHa Tenepb TparHHecKHä y^aBaTbCH ycnex (})HJIOCO(|)CKHii MyBCTBOBâTb BHeiUHHfi ÄeMOKpaTHiecKHö ÄOCTHraTb HfleilHblii KajKRbiä MOtftHO HanpaBJieHHe OrpOMHHft ocoSuii nonowemie nonaji;aTb npeîKHe peaKaHOHHtia CHCTeMa cnejioBaTb CJIOJKHHft TOHKa I^HKJI B3rJIH« B03HHKaTb BCë «eHb «eHTeJib ROM «paMaTHHecKHfi eCJIH . . . TO KJiaCCOBMft MOTMB HeCKOJIbKO HpaBbi OÖtHCHHTb onepK noJiowHTeJiBHbiil pa3JIH1HHit pOMaHTI13M
287
Rang
92
Wort
CBoßofla cy«b6a TeneHHe yKa3bIBaTb HjieH ßoraTHß
relative Häufigkeit
kumulative' relative Häufigkeit
0,000371
0,607449
0,000343
0,620483
BOeHHHÖ
BOCnpHHHMaTb BCTynaTb
HBOpHHCTBO ectecTBeHHiiä 3eMHH
3HaTb 3peHHe HsnaHne KOMe^HH KOHeiHO MaTepnaJi MHp0B033peHHe MOpanbHHß HeoßxOAHMHÖ HH4T0 HOCHTb onacaHHe
93
288
noMomb npno6peTaTb nporpeccHBHHÄ C03HcLHHe CTOHTb cTpamma CTpaCTb CIOÎKeT yMeTb xoporno qacTO B03M0JKH0CTb BCTpenaTb BCHKHit Bbi«aiomHiicH raSejib ryMaHHCTHiecKHä HBOpHHCKHfi HeMOKpaTHH «paMaTypr ecjiH
Rang
Wort
relative Häufigkeit
kumulative relative Häufigkeit
0,000314
0,633357
we HCTOHHHK Ka3aTBCH
HenocpescTBeHHufi oSjiacTb oôpameKHe OAa OCOÖeHHOCTb OTBepraxb noflBeprarb nofloÔHbifi noJioBHHa npo3a npyccKHü paHO
pOflHOft CBoeo6pa3HHä CBOftCTBeHHUÄ co3«aHwe
ciacTbe TaM reaTp TpeSoBaTb ycHJiHBaTb iieHTpaubHbiä MHCJIO ajieMeHT HpKO 94
IS Fachsprachen
ßonbiiiHHCTBo
6bIT BocnpHHTHe BXOAHTb «aaeKuä; «opora AOCTHJKeHHe ApaMaTyprHH 3HaMeaHTHü H«ean JIHHHhlß Mano Me^TaTb HanoMHHaTB HeT oScTaaoBKa onbiT ocyìKjiaTb
289
Rang
Wort
relative Häufigkeit
kumulative relative Häufigkeit
0,000286
0,650517
oiteHKa nofltëM n0JIb30BaTbCH nocTpoeHHe ncHXOJiorHqecKHÄ paßoTaTb pacKptiTHe pe3KO pejiHrno3HbiH peib pernaTb CBeT CBeTCKHÖ
CKa3tIBaTbCH cjiaBa COBpeM6HHHK
COCTaBJIflTb THMtëJIHfi ({ìOJlbKJIOp xapaKTepncTHKa
95
290
AeHTp 6obhhü MaTb MewÄyHapoAHHÄ HaKOHeu HaMeiaTb HpaBCTBeHHblfi oßoßmemie oßCTOHTeJIbCTBO OÔteKT OTTeHOK
OTlëTJUIBO nepexoHHTb
neiaTaTb nOAHHMaTb n03AHHÄ noKunaTb nopTpeT nOpHflOK nocueBoeHHbift nOMTH npeflMeT npecjiefloßamie 295
Bang
Wort
relative Häufigkeit
kumulative. relative Häufigkeit
0,000171
0,733338
npii^aBaTt npii3HaBaTi> npH3iiBaTt npOBOÄHTb npOHH3UBaTb npocBemeHHe npocaenuiBaTt npo$eccHH npo$eccop pe3KHÖ
pe3yjibTaT po«HHa caTHpa
CKpMBaTb cMejibiii CMOTpeTb
COÖHpaTb coôpamie coBepiuaTb COBpeMeHHOCTb cnop cnocoÔHuit CTHJIb CTOJIKHOBeHHe CymHOCTb TaKOB
99
TecHbiö THnHieCKHÔ TpMJIOrHH yHHITOHtaTb ypo«CTBo $yHKI