Einführung in die Sprachstatistik [Aus dem Französischen übersetzt, Reprint 2021 ed.]
 9783112478684, 9783112478677

  • 0 0 0
  • Like this paper and download? You can publish your own PDF file online for free in a few minutes! Sign Up
File loading please wait...
Citation preview

CHARLES MULLER • EINFÜHRUNG IN DIE SPRACHSTATISTIK

SAMMLUNG AKADEMIE-VERLAG 31

SPRACHE

CHARLES MULLER

EINFÜHRUNG IN DIE SPRACHSTATISTIK

Aus dem Französischen übersetzt von Fritz Heinzmann, herausgegeben und redaktionell bearbeitet von Lothar Hoffmann

AKADEMIE-VERLAG 1972

• BERLIN

Titel der Originalausgabe: Charles Muller Initiation à la statistique linguistique („langue et langage") Librairie Larousse, Paris 1968

Erschienen im Akademie-Verlag G m b H , 108 Berlin, Leipziger Str. 3—4 Copyright der deutschen Ausgabe 1972 by Max Hueber Verlag, München Lizenz : 202 . 100/98/72 Herstellung: I V / 2 / 1 4 . V E B Druckerei »Gottfried Wilhelm Leibniz«, 445 Gräfenhainichen / D D R • 3867 Bestellnummer: 7531 . ES 7 B E D V : 752 069 5 18,-

Vorwort zur deutschen Ausgabe

Das Zählen, noch heute elementare Grundoperation und Voraussetzung der Statistik, hat wohl auch am Anfang der Sprachstatistik gestanden. Sein Ergebnis waren zunächst Angaben über Mengen und Häufigkeiten sprachlicher Phänomene. Gezählt wurden Phoneme, Laute und Buchstaben, Morpheme und Silben, Lexeme und Wortformen, Phraseologismen und Syntagmen, Verse und Reime, später auch Sememe, Phrasen, Sätze u. a. m. Wer zuerst auf den Gedanken kam, sprachliche Einheiten zu zählen, läßt sich heute nicht mehr eindeutig bestimmen. Außer Zweifel aber steht, daß das Bedürfnis nach quantitativen Angaben bei der Beschreibung und dem praktischen Umgang mit Sprache(n) schon sehr alt und eine natürliche, ja oft notwendige Ergänzung zur Darstellung ihrer qualitativen Merkmale ist. Die bewußte oder unbewußte Einordnung sprachlicher Erscheinungen im Hinblick auf ihre Regelmäßigkeit oder ihren Ausnahmecharakter, die Fixierung sprachlicher Normen, die Entscheidung über Produktivität oder Unproduktivität, die Wahl der sprachlichen Mittel und ihre stilistische Wertung — um nur ein paar Beispiele zu nennen — waren selten völlig unabhängig von Vorstellungen über Menge und Häufigkeit, mögen diese auch noch so ungenau gewesen sein. Die ersten entscheidenden Impulse zu genaueren Zählungen erhielt die Sprachwissenschaft allerdings von außerhalb. Noch ehe ein modernerer Sprachunterricht zu Beginn unseres Jahrhunderts den Nutzen kleinerer oder größerer Worthäufigkeitsuntersuchungen erkannte, traten andere praktische Vorhaben mit der Forderung nach quantitativen Angaben über die Sprache auf den P l a n : sie standen vor allem mit dem Druckereiwesen, der Schaffung von Blindenschrift und Stenographie, der Nachrichtenübermittlung, der Dechiffrierung u. ä. im Zusammenhang. Mathematiker wie W. J . Bunjakowski und A.A. Markow suchten in der Sprache die Bestätigung der von ihnen für andere Gebiete entdeckten Gesetzmäßigkeiten. 1

Es ist nur natürlich, daß die ersten Zählungen leicht isolierbare Einheiten zum Gegenstand hatten und dabei auf Feinheiten in der Definition keine Rücksicht nahmen. So sind uns schon aus der ersten Hälfte des 19. Jahrhunderts sogenannte Indizes und Konkordanzen, Sammlungen aller Wörter zu einem Text mit Hinweis auf alle Stellen, an denen sie auftreten, erhalten, z . B . f ü r das Englische zum Gesamtwerk Miltons (1809), zu Shakespeares Dramen (1846), zu religiösen Schriften usw. Ihnen folgte eine Vielzahl weiterer Sammlungen, und noch in jüngster Zeit sind neue hinzugekommen, sogar von so bekannten Theoretikern der statistischen Linguistik wie P. Guiraud zu den Gedichten von P . V a l é r y (1953). Ein vollständiger Index oder auch eine Konkordanz gestattet folgende statistische Ermittlungen: 1. Gesamtzahl der Wörter eines Textes, 2. Zahl der verschiedenen Wörter, 3. Zahl der verschiedenen Wortformen, 4. Zahl der Wörter oder Formen f ü r jede Wortart, 5. Häufigkeit und Verteilung der Wörter eines Textes. I n unserem J a h r h u n d e r t f ü h r t e die Entwicklung der Wortzählungen auf exakten Grundlagen zur Entstehung von Häufigkeitswörterbüchern und -Wortlisten, f ü r die hier nur einige Beispiele genannt werden können: Vander Beke, G. E., French Word Book, New York 1935; Thorndike, E . L., Lorge, I., The Teacher's Word Book of 30000 Words, New York 1944; West, M., A General Service List of English Words with Semantic Frequencies and a Supplementary Word List, New York 1953; Josselson, H . H . , The Russian Word Count and Frequency Analysis of Grammatical Categories of Standard Literary Russian, Detroit 1953; Gougenheim, G., Michéa, R., Rivenc, P., Sauvageot, A., L'élaboration du français élémentaire, Paris 1956; Eaton, H . S., An English, French, German, Spanish Word Frequency Dictionary, New York 1961; Stejnfel'dt, E „ Öastotnyj slovar' sovremennogo russkogo literaturnogo jazyka, Tallin 1963 ; Meier, H., Deutsche Sprachstatistik, Hildesheim 1964, deren Vorgänger — F. W. Kaedings Häufigkeitswörterbuch der deutschen Sprache — bereits 1898 in Berlin erschienen war. Auch Buchstaben, Laute und Phoneme sind als diskrete, leicht quantifizierbare sprachliche Elemente sehr bald gezählt worden. Selbst der Begründer der modernen Phonologie, N. S. Trubetzkoy, hat der phonologischen Statistik ein Kapitel seines Hauptwerkes gewidmet. Eine weitere „privilegierte Domäne" f ü r die Ermittlung sprachlicher Mengen und Häufigkeiten war und ist die Poetik. Da sie in dem vorliegenden Buch zu ihrem Recht kommt, sei hier nur auf die inter2

essanten Untersuchungen des bekannten Mathematikers A. N. Kolmogorow zu Majakowskis Gedichten hingewiesen. Untersuchungen zu den Einheiten der höheren sprachlichen Ebenen (Syntagma, Phrase, Satz) sind seltener. Hier sind vor allem die Namen G. U. Yule und G. A. Lesskis zu nennen. Die Ursachen f ü r die Zurückhaltung auf diesem Gebiet liegen wohl vor allem in der Uneinheitlichkeit der syntaktischen Lehren, die die Quantifizierung erschwert, und in einem Mangel an Vorstellungen über die praktische Verwertbarkeit solcher Untersuchungen. Während sich nun die Statistik zu einer selbständigen Wissenschaft mit eigenen theoretischen Grundlagen entwickelte und andere Wissenschaften, wie die Soziologie, die Psychologie, die Pädagogik, die Medizin, die Ökonomie u. a. — gar nicht zu sprechen von den experimentellen Naturwissenschaften — ihre Prinzipien und Methoden mit Nutzen auf ihren jeweiligen Untersuchungsgegenstand anwendeten, scheuten sich allgemeine Sprachwissenschaft und Einzelphilologien noch lange Zeit, den Schritt vom Sammeln und Zählen zur Verallgemeinerung und Prüfung zu tun. Sofern quantitative Merkmale überhaupt berücksichtigt wurden, fanden sie eine unterschiedliche, zuweilen widersprüchliche Interpretation. Lange noch dominierte die Neigung zur ausschließlich qualitativen Analyse, die zu einer einseitigen Psychologisierung (Steinthal, Wundt), Ästhetisierung (Croce, Voßler, Spitzer) oder Soziologisierung (Marr) führte. Eine der Ursachen dafür war die zunehmende Isolierung der Sprachwissenschaft von den Naturwissenschaften und der gesellschaftlichen Reproduktion. Hinzu kam noch eine vom Wesen der Sache her unbegründete, aber bei vielen Philologen tief eingewurzelte Abneigung gegen mathematisches Denken und Formelwerk. So blieben die Forderungen einzelner Sprachwissenschaftler, die die heutige Mathematisierung aller Wissenschaften und die Einbürgerung exakter Methoden in der Linguistik vorausgesehen haben mögen, noch lange ungehört. Baudouin de Courtenay, in vielem der Vorgänger des Begründers der neueren Sprachwissenschaft Ferdinand de Saussure, h a t t e schon 1901 unter insgesamt 17 Aufgaben für die Sprachwissenschaft des 20. Jahrhunderts die folgende genannt, die als Motto über der Sprachstatistik stehen könnte: „Man muß in der Sprachwissenschaft häufiger das quantitative, mathematische Denken anwenden und sie so immer mehr den exakten Wissenschaften annähern." Aber noch 1949 mußte Marcel Cohen wegen der anhaltenden Vernachlässigung statistischer Methoden in der Linguistik warnend darauf hinweisen, daß die weitere Ignorierung der Zahlen bei der Unter3

suchung sprachlicher Erscheinungen die Entwicklung der Sprachwissenschaft nur aufhalten könne, und P. Guiraud stellte 1954 zur Darstellung der Prinzipien und Methoden fest, daß es weder allgemeine Studien noch ein Handbuch der Statistik f ü r den Bereich der Sprache gebe. Woher rührt diese Unzufriedenheit, wenn doch eine stattliche Vielzahl von Zählungen und anderen quantitativen Einzeluntersuchungen vorlagen? Es war vor allem das Fehlen exakter, einheitlicher Prinzipien und Methoden, insbesondere zuverlässiger Prüfverfahren, das einen großen Teil der bestenfalls in Prozentzahlen vorgelegten Ergebnisse unbrauchbar oder zumindest vieldeutig machte und das P. Guiraud selbst veranlaßte, 1960 ein Buch unter dem Titel „Problèmes et méthodes de la statistique linguistique" zu veröffentlichen. Die Anwendung statistischer Methoden in der Sprachwissenschaft muß mindestens viererlei leisten : 1. sie muß eine exakte Beobachtung sprachlicher Erscheinungen vorbereiten helfen; 2. sie muß die Zuverlässigkeit der Ergebnisse von Beobachtungen überprüfbar machen ; 3. sie soll die Wahrscheinlichkeit sprachlicher Ereignisse, d. h. die Verwendung sprachlicher Mittel voraussagen; 4. sie soll Schlüsse von Stichproben auf das sprachliche Ganze ermöglichen bzw. — moderner formuliert — die Linguistik von der Empirie zur Erfassung von Gesetzmäßigkeiten und deren Modellierung führen. Vollends deutlich wurde das erst in den vierziger Jahren unseres Jahrhunderts. Die Sprache als Hauptmittel zur Weiterleitung der Information wurde in der damals durch die Arbeiten A. N. Kolmogorows, N. Wieners, C. E. Shannons u. a. begründeten Informationstheorie zum Code. Dadurch rückt die strukturelle Betrachtung der Sprache mit ihrer logisch-mathematischen Analyse in den Vordergrund. Gleichzeitig ist die Sprache aber auch ein Code mit bestimmten statistischen Beschränkungen, die sprachliche Kommunikation ein Wahrscheinlichkeitsprozeß. Diese Erkenntnis verhalf der statistischen Linguistik in den beiden verflossenen Jahrzehnten zu einem gewaltigen Aufschwung. Es erschienen die grundlegenden Arbeiten von G. Herdan, P. Guiraud, R . G. Piotrowski, N. D. Andrejew, R. M. Erumkina, B. N. Golowin, W. I. Perebejnos, L. N. Sassorina, W. A. Moskowitsch, L. Dolezel, B. Mandelbrot, R. Moreau, W. N. Toporow, J . Whatmough, L. R. Sinder, G. Gougenheim, R.Michéa, H . Hoijer u . a . sowie Sammelbände wie die kürzlich ebenfalls ins Deutsche übersetzte „Statistika reci" (Sprachstatistik) und viele Einzeluntersuchungen. Wenn auch schon früher Versuche unternommen wurden, aus sprachstatistischen Untersuchungen allgemeingültige Gesetzmäßigkeiten und 4

weiterreichende Schlußfolgerungen abzuleiten - z. B. von G. K. Zipf, G. U. Yule, A. Nordling, M. Joos, D. W. Reed, M.Cohen, B. Trnka, J . W. Chotlos, J . B. Carrol, E. V. Condon u. a. - , so wurde doch erst zwischen 1950 und 1970 der H a n g zu teilweise gewagten Hypothesen, voreiligen Verallgemeinerungen und tendenziösen Interpretationen weitgehend überwunden. Die statistische Linguistik hat wesentlich an wissenschaftlicher Strenge gewonnen und stellt heute an ihre Vertreter präzise Anforderungen. Nicht unbeachtet bleiben darf auch der Umstand, daß die stürmische Entwicklung der maschinellen Lochkartentechnik und der elektronischen Datenverarbeitung einerseits zur Erleichterung der Bearbeitung großer Sprachdatenmassen geführt, anderseits aber auch zu definitorischer Klarheit und strenger Formalisierung gezwungen hat. Nicht nur im Zusammenhang mit der Maschinenübersetzung und der automatischen Informationsrecherche, sondern auch zur Lösung linguo-statistischer Aufgaben haben sich in aller Welt Sprachdatenverarbeitungszentren entwickelt, z. B. in Moskau, Leningrad, Minsk und Kiew (UdSSR), in Cambridge, Boston, Santa Monica, Georgetown (USA), in Manchester, Cambridge, Edinburgh, Teddington (Großbritannien), in Besançon (Frankreich), in Gallarate (Italien) usw. Im deutschsprachigen Raum ist die theoretische Seite der Sprachstatistik noch wenig entwickelt. Nennenswert sind eigentlich nur die Arbeiten von W. Fucks, W. Meyer-Eppler und P. Menzerath. Im übrigen erschöpfen sich die Aktivitäten in der Anwendung vorhandener Erkenntnisse bei praktischen Vorhaben. Dabei fällt oft die mangelnde Kenntnis wichtiger Veröffentlichungen auf, die in der Sowjetunion, den USA, Großbritannien, Frankreich, der ÖSSR und anderen Ländern erschienen sind. Besonders mangelt es an einer verständlichen und systematischen Einführung in die Sprachstatistik, die den Zugang zu den im Ausland zahlreich publizierten Forschungsergebnissen erschließt. Die Übersetzung des Buches von Ch. Muller soll diese Lücke schließen helfen. Ein einleitender Kommentar ist hier entbehrlich. Aufbau und Inhalt dieser „Einführung in die Sprachstatistik" sprechen f ü r sich selbst. Lassen wir es bei einem Zitat aus einer eigenen Rezension bewenden: Mullers Darstellung des „Begriffs- und Methodenarsenals der Statistik entspricht dem neuesten Stand. Sie ist vorläufig der einzige systematische Versuch dieser Art auf dem Gebiet der Linguistik. Sie besticht durch Einfachheit und Klarheit. Da, wo die Dinge f ü r den Sprachler nicht sofort auf der Hand liegen, wird an allgemein bekannte statistische Untersuchungen demographischen oder soziolo5

gischen Charakters angeknüpft. . . Hier sind Dinge übersichtlich und verständlich zusammengefaßt, die man sonst in der Literatur verstreut und z. T. in komplizierter Darstellung findet". Wenn Muller sich vorwiegend auf Fragen der Lexikostatistik konzentriert und seine Beispiele in erster Linie aus Untersuchungen zur klassischen französischen Dramatik schöpft, so ist das durch die französische Tradition in der statistischen Linguistik motiviert und tut seiner Arbeit keinen Abbruch. Die dargestellten Verfahren lassen sich mit einiger Überlegung auf die anderen sprachlichen Ebenen übertragen. In seiner Unterscheidung von Lexem (Einheit der Lexik), Vokabel (im Discours aktualisierte Einheit der Lexik) und Wort (Einheit des Textes bzw. Wortform) geht Muller letztlich auf Saussure zurück. Für die statistische Theorie von Grundgesamtheit und Stichprobe ist diese Auffassung sehr attraktiv. Wenn man sie aus linguistischer Überzeugung nicht teilt, dann läßt sich auch hier eine andere Lösung finden. Für den Übersetzer bot die Übertragung ins Deutsche einige erhebliche Schwierigkeiten. Sie ergaben sich vor allem aus dem Umstand, daß die statistische Linguistik im Deutschen nicht über eine ausgebildete Terminologie verfügt. Wir haben deshalb an einigen Stellen der Verständlichkeit den Vorrang vor dem noch nicht kodifizierten Usus gegeben. In einigen Fällen waren die französischen Vorstellungen von Spiel und Zufall den unseren so fremd, daß wir sie durch andere, vertrautere ersetzen mußten. Wir werden deshalb helfende Hinweise auf sich daraus ergebende Unzulänglichkeiten gern entgegennehmen. Einen offensichtlichen Mangel des Buches haben wir in der deutschen Ausgabe auszumerzen versucht: Das Literaturverzeichnis ließ eine Reihe für den Benutzer wesentlicher Titel vermissen. Wir haben es deshalb stark ergänzt. Ch. Mullers „Einführung in die Sprachstatistik" kann sowohl Sprachwissenschaftlern und Philologen als auch Sprachlehrern an Schulen, Fachschulen, Hochschulen und Universitäten sowie Studenten, die in ihrer Ausbildung irgendwie mit Sprache(n) zu tun haben, zur Lektüre und ständigen Benutzung als Nachschlagewerk empfohlen werden. Sie dient nicht nur der Bereicherung sprachwissenschaftlicher Untersuchungen, sondern in fast noch stärkerem Maße der Förderung der muttersprachlichen und fremdsprachlichen Praxis. Leipzig, März 1971 6

Prof. Dr. phil. habil. Lothar Hoffmann

Vorwort

Erst durch die grammatische und lexikographische Statistik kann man etwas Exaktheit und Sicherheit in die Literatur bringen. P. Lejay, Vorwort zur Syntaxe latine von O. Riemann, 1894. Die Linguistik ist die typische statistische Wissenschaft; die Statistiker wissen das sehr wohl, allein die meisten Linguisten berücksichtigen das noch nicht. P. Guiraud, Problèmes et Méthodes . . ., 1960. Läuft die Statistik, da sie zumeist ein Werkzeug in der Hand von Leuten mit nur rudimentärer mathematischer Bildung ist, nicht Gefahr, sich gegen diese zu kehren, und zwar so, daß sie aus ihnen Zauberlehrlinge macht, die die Elemente, deren sie sich bedienen, nicht mehr meistern können? G. Reeb et A. Fuchs, Statistiques

commentées,

1967.

Dieses Buch -wurde für Linguisten ohne spezielle mathematische Ausbildung geschrieben. Es wird denen, die bereits mit Sprache und Methoden der Mathematik und besonders der Statistik vertraut sind, nicht viel bieten; ja, es wird sie möglicherweise sogar verärgern durch die geflissentliche Erklärung und Kommentierung ihnen banal scheinender Begriffe, durch die Fülle konkreter Beispiele und numerischer Anwendungen, durch die Wiederholung bestimmter wichtiger, aber einfacher Operationen und schließlich durch einen gewissen Empirismus. All das verträgt sich wenig mit der maßvollen, stolzen Eleganz der Theoreme und Beweise ; dennoch ist das für die „blutigen Anfänger", die wir nun einmal sind, der einzige Weg, der zum Ziel f ü h r t . Seine Absicht ist klar und begrenzt. Es geht darum, die hauptsächlichsten statistischen Operationen in den Grundregeln und in der Praxis bei ihrer Anwendung auf sprachliche oder stilistische Fakten darzulegen und zu erklären, dabei den Leser darüber zu informieren, welche Art von Fragen unsere Disziplinen der Statistik stellen können und welche Art von Antworten diese uns geben kann. Da nicht erstrebt wird, eine oberflächliche Neugier zu befriedigen, sondern in der Praxis verwendbare, wenn auch elementare Kenntnisse zu vermitteln, 7

ging es auch darum, den Sprachwissenschaftler mit der statistischen Argumentation vertraut zu machen und ihn an die Sprache der Algebra, die dieser Argumentation als Stütze dient, zu gewöhnen oder wiederzugewöhnen. Ökonomen, Biologen, Mediziner, Psychologen, Pädagogen und sehr viele andere verfügen über ausgezeichnete Werke, um sich in die Methoden der Statistik einzuarbeiten. Jedes dieser Bücher ist gespickt mit Beispielen aus der Disziplin, f ü r die es gedacht ist, und bietet eine solche Einführung, nachdem aus dem Arsenal der Statistik das für den Zweck Geeignetste ausgewählt wurde. Die Grundmaterie haben sie gemein; aber da sie sich im Anwendungsbereich unterscheiden, unterscheiden sie sich auch durch das, was sie von ihren Lesern an mathematischen Vorkenntnissen und Fähigkeiten fordern. F ü r uns Sprachwissenschaftler gab es nichts. Und da wir oft zu den Geistern zählen, die gegenüber mathematischen Formeln am widerspenstigsten sind, und uns unsere Arbeiten zu einem gewissen Mißtrauen gegen die geometrische Beweisführung verleiten, sobald sie sich auf unsere Disziplinen angewandt wissen will, ist es vielleicht verwegen, dieses Werkzeug schaffen zu wollen. Es wurde dennoch versucht, ohne indes zu behaupten, daß sich alle seine Kapitel ohne Mühe lesen, aber es geschah mit dem steten Bedacht, dieses Bemühen zu erleichtern und so produktiv wie möglich zu machen. Das Ziel war also, die Prinzipien und nicht die Ergebnisse der Sprachstatistik darzulegen und ihre Forschungsmethoden, nicht ihre Entdeckungen oder ihre Errungenschaften zu beschreiben. Daher sind unsere Beispiele nicht wegen ihres wissenschaftlichen Interesses, sondern wegen ihrer leichten Darstellbarkeit ausgewählt. In der Tat erfordern die glücklichsten Anwendungen dieser Methoden, die nämlich, die die Lösung echter literarischer oder linguistischer Probleme bringen, eine eingehende Darlegung des aufgeworfenen Problems, der bereits erzielten Ergebnisse sowie der f ü r das Sammeln des quantitativen Materials gewählten Verfahren und sodann eine kritische Interpretation der von der Statistik gelieferten Antworten. I n seinen Problèmes et Méthodes behandelt Pierre Guiraud seine Untersuchungen über die Beziehung, die zwischen den Entlehnungen aus fremden Sprachen und dem phonologischen System der entlehnenden Sprache bestehen könnte, ein kühnes Vorhaben, da seine Darstellung darauf hinauslaufen würde, eine beweiskräftige Untersuchung über das phonologische Gleichgewicht durch lexikalische Zugänge vorzulegen, den Häufigkeitsbegriff in die Beschreibung dieses Systems einzuführen und darin eine Finalität aufzudecken. Um nun dieses Problem auch 8

nur summarisch darzustellen, um die angewandte Methode zu erklären und zu rechtfertigen und um die Schlußfolgerung abzuwägen, braucht dieser Autor etwa zehn Seiten; das statistische Verfahren, eine Berechnung der relativen Abweichung, ist in ein paar Zeilen enthalten. Gewiß möchte man gern jedes einzelne unserer Kapitel durch ein Beispiel von dieser heuristischen Tragweite illustrieren, aber dazu müßte man ein weiteres Buch schreiben. Es erfolgte also eine Beschränkung auf eine kleine Zahl von sehr einfachen, in ein paar Sätzen dargelegten Beispielen, im allgemeinen aus gut bekannten, leicht zugänglichen Texten, f ü r die zumeist schon ein Index vorhanden war. Das erklärt auch den dem klassischen französischen Theater eingeräumten Platz, wofür uns die reichste Sammlung von Indizes und Konkordanzen, die es überhaupt gibt, zur •Verfügung steht, und dies in erster Linie dank R.-L. Wagner und P. Guiraud sowie den von ihnen ausgebildeten Mitarbeitern und ferner dank der Initiative B. Quemadas und der Arbeit des Laboratoire d'analyse lexicologiqtie in Besançon. Aber die auf diesem Gebiet erprobten Verfahren lassen sich mit Hilfe der Adaptionsvorschläge, die gemacht werden, wenn es angebracht scheint, leicht auf andere literarische Gattungen, andere Zeitabschnitte und andere Sprachen übertragen. Ein Minimum an Verfahren der Mathematik und Wahrscheinlichkeitsrechnung, ohne das die Statistik nur trügerischer Schein oder eine Sackgasse ist, ist ebenfalls vorhanden, und das läßt sich nicht vermitteln ohne algebraische Formeln, ohne die Symbolgerüste, die manch einem ehrfurchtsvolle Scheu einflößen (graecum est, non legitur). Daher galt das Bemühen, den Leser an der Aufstellung dieser Formeln teilnehmen und darin nicht ein Mittel zur Einschüchterung, sondern eine Hilfe für den Verstand erblicken zu lassen. Auch wurde angestrebt, jeder Formel Zahlenbeispiele folgen zu lassen, die ihr etwas die Strenge nehmen sollen. Besonderer, vielleicht etwas schwerfällig wirkender Nachdruck wurde auf bestimmte, jeder statistischen Operation zugrunde liegende Arten der Beweisführung in der Wahrscheinlichkeitsrechnung gelegt sowie auf bestimmte Termini von grundsätzlicher Bedeutung, deren genaue Tragweite man ermessen haben muß, um einer statistischen Argumentation folgen und berechtigterweise darüber diskutieren zu können : Wahrscheinlichkeit, Stichprobe, Vertrauensbereich (-intervall), Erwartungswert, relative Abweichung, Korrelation, Verteilung, all das sind präzise Grundbegriffe, ohne die man nichts Solides unternehmen kann. 9

Dagegen wurden mehr theoretische Ausführungen, deren unmittelbares Interesse nicht ersichtlich war, hintenangestellt; sie sind ohne Mühe in spezielleren Werken zu finden, denen wir viele Leser zuzuführen hoffen. Es wurde weder auf die Logarithmenrechnung noch auf die Mengensymbolik eingegangen, die zwar manchem Sprachwissenschaftler vertraut ist, von den anderen aber eine zusätzliche Mühe erfordert hätte. Die Poisson-Verteilung, die allerdings in der Sprachwissenschaft angewendet wird, wurde nicht erörtert, sondern nur beiläufig erwähnt. Die Normalverteilung, die den meisten unserer Tests zugrunde liegt, wurde fast empirisch behandelt : nicht einmal die Formel ist zu finden, die im übrigen dem Gebrauch, den wir davon machen müssen, nichts hinzufügen würde. Dagegen wurde die Zahl der Tabellen vermehrt, um die Anwendungen zu erleichtern und mühselige Rechnungen zu vermeiden. Ebenso wurden für die Tests manchmal mehrere Methoden nebeneinandergestellt, die sich voneinander ableiten lassen, von denen aber die eine oder die andere je nach der Lage für den Praktiker mehr oder weniger bequem ist. Was hier fehlt, ist leicht anderswo zu finden. Aber ich glaube hier vieles dargestellt zu haben, was nirgends sonst zusammengefaßt war. Dem Verfasser bleibt nur noch, seinen Lesern ein wenig Geduld und viel Vertrauen zu wünschen, um einen Weg zu durchschreiten, auf dem er ihnen in kurzem Abstand vorangeht; die ersten Etappen sind zuweilen hart, aber das Ziel ist weniger weit, als man am Anfang meint. B e m e r k u n g . Ich habe aus zwei früheren Arbeiten (Essai de Statistique lexicale: l'Illusion comique de P. Corneille und Etude de Statistique lexicale: le vocabulaire du théâtre de Corneille) einige Ausführungen und viele Beispiele übernommen; das habe ich jedoch nur angegeben, falls Interesse bestehen sollte, wegen einer ausführlicheren Darstellung in diesen Arbeiten nachzuschlagen. Mein Freund und Kollege A. Fuchs, Professor an der Mathematischnaturwissenschaftlichen Fakultät in Strasbourg und Verfasser mehrerer Werke zur mathematischen Statistik, war so liebenswürdig, mein Manuskript zu lesen. Seine Hinweise und Ratschläge waren sehr wertvoll für mich, und ich möchte ihm dafür hier meinen Dank aussprechen. Die statistischen Methoden wurden so weit wie möglich in fortschreitender Darstellung geboten ; nur die Fußnoten, die die einzelnen Kapitel miteinander verbinden, beziehen sich zuweilen auf im Buch später behandelte Begriffe. Auf die Anwendungsübungen am Schluß des Buches werden die Leser besonders hingewiesen. Ch. Muller 10

Erster Teil Prinzipien und Methoden der Sprachstatistik

1. Quantitative und qualitative Merkmale Quantifizierung Jedermann weiß, daß die Statistik nur mit Zahlengrößen operiert. Nichts kann ihr zur Bearbeitung vorgelegt werden, sofern es nicht vorher quantifiziert wurde. Das setzt voraus, daß der untersuchte Gegenstand quantifizierbare Merkmale besitzt und daß man es für angebracht hält, bestimmte von diesen Merkmalen zu isolieren, um sie mit statistischen Operationen zu bearbeiten. Quantitative

Merkmale

So hat von den Menschen, die die Bevölkerung eines Dorfes, einer Stadt oder eines Landes bilden, jeder ein Alter, eine Größe, ein Gewicht, eine Anzahl „Unterhaltsberechtigter" (wobei diese Zahl Null sein kann), eine Wohnfläche, ein mittleres Einkommen usw. Jede dieser Größen ist ein quantitatives Merkmal, das sich für jeden einzelnen, gegebenenfalls nach Annahme einer Maßeinheit, in einer Zahl ausdrückt. Die Zahlen, die für mehrere Einzelpersonen das gleiche Merkmal darstellen, können miteinander verglichen oder addiert werden, den Gegenstand einer Mittelwertsberechnung bilden usw. Qualitative

Merkmale

Andere Merkmale bei denselben Personen sind qualitativ und lassen sich nicht in Zahlen ausdrücken: Geschlecht, Farbe der Augen und Haare, Beruf, geographische oder soziale Herkunft, religiöse oder politische Zugehörigkeit usw. Diese Merkmale antworten nicht auf eine Bestimmungsfrage nach der Anzahl oder Menge („wieviel?"), sondern auf eine oder mehrere Entscheidungsfragen nach der Eigenschaft. Selbst wenn man übereinkäme, manche von ihnen durch Zahlen darzustellen, die den von ihnen bestimmten Kategorien zugeordnet 2

Sprachstatistik

13

sind 1 , würde es sich dabei nur um eine „Kodierung" handeln. Ein solches Verfahren würde keine arithmetischen Operationen rechtfertigen und nur als Einordnungskriterium dienen. Gesamtmengen und

Klassen

Wenn wir aber die Personen, die nach einem bestimmten qualitativen Merkmal (zum Beispiel männliches Geschlecht, blondes Haar oder im Ausland Gebürtige . . .) in ein und dieselbe Klasse gehören, zählen, erhalten wir Gesamtmengen, also Zahlengrößen, mit denen man statistische Operationen vornehmen kann. Es ist selbstverständlich, daß auch quantitative Merkmale die Bildung von Klassen, also die Aufstellung von Gesamtmengen zulassen. Stetige und unstetige Größen Quantitative Merkmale sind stetig oder unstetig (man sagt auch diskret). Die Zahl der Kinder (oder Unterhaltsberechtigten) ist ein unstetiges Merkmal: Zwischen der Klasse der Personen, die zwei Kinder haben, und der Klasse derjenigen, die drei haben, gibt es nichts. Man geht von dem einen Wert zum anderen, ohne daß man sich einen Zwischenwert vorstellen kann. Dagegen ist die Größe der Personen ein stetiges Merkmal: Zwischen einer Person, die 165 cm, und einer anderen, die 166 mißt, existiert theoretisch eine unendliche Zahl von möglichen Fällen; allein die Genauigkeit unserer Messungen bzw. der Instrumente, denen wir sie übertragen, setzt uns eine Grenze. Wenn man im Fall einer Länge beim cm haltmacht, gilt als vereinbart, allen Personen, die zwischen 165 und 166 cm oder zwischen 165,5 und 166,5 cm messen, ein und dieselbe Größe zuzuweisen, und man ordnet sie in dieselbe Klasse ein. Wenn man bis zum mm gehen wollte, gäbe es zehnmal mehr Klassen, aber das Prinzip bliebe das gleiche: Durch diese Übereinkunft führt man das Stetige auf das Unstetige zurück. Und das Prinzip bliebe auch das gleiche, wenn man von 2 cm zu 2 cm oder von 5 zu 5 fortschreiten wollte, nicht aus Gründen der Genauigkeit, sondern um die Ergebnisse mehr zu verdichten und eine kleinere Zahl von Klassen zu erhalten. 1

Zum Beispiel: Von den Personen sind geboren in der Gemeinde: 1, im Kreis: 2, in anderen Kreisen desselben Bezirks: 3, in anderen Bezirken: 4, in einem anderen europäischen Land: 5 usw. Ein Kodierungsbeispiel findet sich S. 185.

14

Man wird bemerken, daß der Unterschied zwischen stetig und unstetig nicht mit dem zusammenfällt, den man zwischen einer Messung nach ganzen Zahlen und der Verwendung von Bruchzahlen machen k a n n : Ein quantitatives Merkmal, das nur die Werte 0,0 0,5 1,0 1,5 2,0 2,5 usw. annehmen kann, ist trotz der Dezimalen unstetig. Der Lehrer, der seine Arbeiten benotet, wendet ein unstetiges System an, das den Begriff der Gleichheit impliziert, auch wenn er halbe oder Viertelpunkte benutzt. Stetige Merkmale sind in "praxi nicht gleichartig; wenn man trotzdem solche vorfindet, so deshalb, weil man sich mit einer konventionellen Abgrenzung zwischen den Klassen abgefunden h a t . 2 Quantifizierung

der Sprache

Wir werden auf diese Grundbegriffe wieder stoßen, wenn wir unseren Gegenstand, die Sprache, untersuchen. Eine beliebige Manifestation der Sprache, eine beliebige „sprachliche Äußerung" (discours), schriftlich oder mündlich (in einer Aufzeichnung), lang oder kurz, in der Literatur oder in der Sachprosa, kann uns Zahlenangaben liefern. Einen Text kann man in Sätze, Wörter und Phoneme einteilen, die man zählen kann. Jede dieser Einheiten kann nach dem Umfang, den sie in der linearen sprachlichen Äußerung (discours) einnimmt, charakterisiert werden: nach der Dauer, wenn man mit Aufnahmen (zum Beispiel Oszillogrammen) arbeitet, oder nach der Zahl der Einheiten der niedrigeren Ebenen, wenn man die geschriebene Form betrachtet: für den Satz die Zahl der Wörter, für das Wort die Zahl der Silben oder Phoneme. I n bestimmten literarischen Formen wird man den Vers als Einheit ansehen können. Bei Aufnahmen kann man Stärke oder Höhe der Laute messen. Alle diese Merkmale sind quantitativ. Die Merkmale, die man an geschriebenen Texten feststellen kann, sind im allgemeinen unstetig. Stetiges erscheint vor allem in Aufnahmen der gesprochenen Sprache. Qualitative Merkmale treten ebenfalls auf den verschiedenen Ebenen der sprachlichen Äußerung (discours) auf: So erhält man auf der Ebene des Phonems eine Gesamtmenge von Konsonanten und eine Gesamtmenge von Vokalen und innerhalb einer jeden von ihnen eine Gesamtmenge f ü r jedes der identifizierten Phoneme; unter den ausgezählten Wörtern im Text kann man grammatische oder semantische Kategorien unterscheiden und die Anzahl der davon abhängigen Einheiten feststellen. 2

2'

Zu einer Anwendung dieser Unterscheidung siehe S. 75.

15

Statistik

und

Sprachwissenschaft

Mit allem Nachdruck muß hier auf einen Grundsatz hingewiesen werden, dem wir häufig begegnen werden. Die Aufgabe des Statistikers beginnt wirklich erst nach der Auswahl und dem Sammeln der Zahlengrößen. Zu entscheiden, ob es interessiert, Größe oder Gewicht der Personen in einer bestimmten Gruppe von Menschen zu messen und wie man sie messen soll, ist nicht seine Angelegenheit, sondern die des Demographen oder Anthropologen. Ebenso ist es Sache des Sprachwissenschaftlers oder Philologen zu entscheiden, ob es interessiert, die Adjektive in bestimmten Texten zu zählen, und mit hinreichender Genauigkeit zu sagen, was er „Adjektiv" nennt, damit in der Folge die Einordnung in die Kategorie „Adjektiv" oder „NichtAdjektiv" zu keinerlei Zweifel mehr Anlaß gibt. Schließlich ist es seine Sache, die Texte, an denen die Zählung vorgenommen werden soll, auszuwählen und dies zu begründen. Mit anderen Worten, Auswahl und Definition der Merkmale sowie ihre Messung oder Identifizierung stehen dem Fachmann zu, in unserem Falle dem Sprachwissenschaftler oder dem Philologen. Sicherlich wird ihm die Erfahrung, die er möglicherweise mit statistischen Operationen hat, gewisse Vorsichtsmaßnahmen und gewisse Arbeitsgrundsätze diktieren; und er ist auch daran interessiert, sich ein Bild davon zu machen, wie die Daten, die er sammeln will, verarbeitet werden. Daraus ergibt sich die Nützlichkeit des vorherigen Gesprächs zwischen dem Statistiker und dem Vertreter der betreffenden Disziplin. Aber in der vorbereitenden Phase, die uns hier beschäftigt, gehört die Verantwortung im wesentlichen dem Fachmann. Soll das nun heißen, daß die Anwendung der Statistik auf Erscheinungen der Sprache immer auf die Lösung eines genau fixierten Problems gerichtet sein muß wie die schon allzu bekannten Fragen der Datierung oder der Autorschaft anonymer oder pseudonymer literarischer Werke? Gewiß nicht. In der Linguistik wie in jeder anderen Wissenschaft muß m a n zuweilen experimentieren, „um nur einmal zu sehen", ohne jede vorgefaßte Idee. Unsere Kenntnisse über die Mechanismen der Sprache sind noch zu lückenhaft, als daß solche Versuche nicht berechtigt und oft fruchtbar wären, sowohl auf eigentlich linguistischem Gebiet als auch bei der Untersuchung literarischer Texte.

16

2. Grundgesamtheit und Stichproben Individuen

und

Population1

Von ihren demographischen Anwendungen her, die die ältesten sind, hat die Statistik die Gewohnheit beibehalten, jede Menge von beliebigen, ihr zur Analyse vorgelegten Gegenständen Population und jeden von diesen Gegenständen, jedes der Elemente dieser Menge, Individuum zu nennen. Von diesem Standpunkt aus kann man einen Text als eine „Population" von Sätzen oder Wörtern oder Phonemen usw. betrachten. Nichts verpflichtet uns im übrigen, alle Elemente des Textes auf der gewählten Ebene zu berücksichtigen: Interessiert man sich zum Beispiel für die Häufigkeit — dieser Ausdruck wird noch zu präzisieren sein — der Substantive männlichen oder weiblichen Geschlechts, so kann man entweder den Text als eine Population von Wörtern ansehen, von denen manche das Merkmal „Substantiv" mit einer Unterteilung in „männliche Substantive" und „weibliche Substantive" haben; oder aber man kann aus dem Text eine „Population von Substantiven" unter Vernachlässigung aller übrigen Kategorien, deren Zählung dann überflüssig ist, herausziehen und alle Individuen dieser Population nach dem Merkmal „Geschlecht" sortieren. Man darf aber nicht glauben, daß diese beiden Verfahrensweisen stets indifferent seien; wir werden noch Gelegenheit haben, darauf zurückzukommen. Abgrenzung Wie die untersuchten Merkmale, so müssen auch die Population und die Individuen, oder wenn man lieber will: die Menge und ihre Elemente, sorgfältig, ja mit peinlicher Genauigkeit definiert werden. Wählt man einen literarischen Text als Versuchsfeld, wird man genau angeben müssen, mit welcher Ausgabe man arbeitet, und die Begrenzung des Textes festlegen. Wenn man sagt, daß es in Le Cid2 2943 Substantive gibt, mag es überflüssig scheinen zu präzisieren, daß man nur den von den Schauspielern gesprochenen Text ohne Vorwort, Bühnenanweisungen und Personennamen, die vor jeder Antwort und jeder Szene stehen, usw. berücksichtigt hat. Es gibt jedoch sehr viele 1

Im heutigen deutschen Sprachgebrauch der Statistiker entspricht der Population die „Grundgesamtheit" und dem Individuum das „Element". (Anm. des Übersetzers.) - Wenn nicht anders vermerkt, sind diese Zahlenangaben den Konkordanzen und Indizes des Centre von Besancon entnommen. 17

Fälle, in denen solche Anweisungen notwendig- sind, um die Grenzen der untersuchten Grundgesamtheit festzulegen. Anderseits wird man gut daran tun, Ausdrücke wie „Wort", „Substantiv" usw. genau zu definieren; denn wenn man sagt, daß in Le Cid 4,01% der Wörter Adjektive sind, während deren Anteil in Phedre 5,99% beträgt, ist das nur von Interesse, wenn man in beiden Texten streng identische Kriterien angewandt hat, sowohl f ü r die Segmentierung des Textes in Wörter als auch f ü r die Identifizierung der Wörter, die das Merkmal „Adjektiv" besitzen. Aufgezeichnete Texte (für Untersuchungen zur gesprochenen Sprache ausgewertete Gespräche, Rundfunkaufnahmen usw.) bieten größere Schwierigkeiten als gedruckte Texte und erfordern im allgemeinen eine mehr oder weniger konventionelle „Behandlung"; sie wimmeln von parasitären Elementen: wiederholte Wörter oder Silben, angefangene Wörter oder Sätze, Rückgriffe, nichtssagende Ausrufe usw. Bevor man hier an Zählungen oder quantitative Erhebungen geht, muß man entscheiden, wie diese Elemente zu behandeln sind, ob sie als lexikalische oder phonetische Einheiten in die Zählung eingehen sollen oder nicht. Auch das gehört zur Definition der Grundgesamtheit und erfordert vorherige Überlegung. Stichproben Jeder kennt heute das Prinzip der öffentlichen Meinungsforschung: Um sich von der Einstellung der Bevölkerung zu irgendeiner Frage ein Bild zu machen, befragt man nicht etwa alle Personen, die dazu gehören, sondern eine gewisse Anzahl, die dann eine Stichprobe bilden. So begnügen sich die Meinungsforschungsinstitute, um die Haltung der Franzosen bei Wahlen zu einem bestimmten Zeitpunkt mit hinreichender Genauigkeit kennenzulernen, damit, eine ziemlich geringe Anzahl der auf den Wählerlisten eingetragenen Personen zu befragen. Die Erfahrung hat die Wirksamkeit dieser Methode bestätigt, deren Fehlschläge eher einem Meinungsumschwung (auf den die Veröffentlichung der Befragungsergebnisse manchmal einen Einfluß ausübt) als Fehlern in der Methode oder Interpretation zuzuschreiben sind. Repräsentativität Damit aber eine Befragung f ü r die gesamte Bevölkerung gültige Informationen liefert, muß die Stichprobe für diese Bevölkerung repräsentativ sein. Zu diesem Ergebnis kann man im großen und ganzen 18

auf zwei Wegen gelangen. Der eine g r ü n d e t sich auf eine sehr g u t e K e n n t n i s der Bevölkerung. So k e n n t m a n bezüglich der auf den Wählerlisten eingetragenen Franzosen genau ihre Verteilung n a c h geographischer H e r k u n f t , gesellschaftlich-beruflicher Stellung, Alter, Geschlecht usw. Folglich k a n n m a n eine Stichprobe zusammenstellen, bei der n a c h einer feinen „Schichtung" jedes dieser Merkmale in denselben Proportionen verteilt ist wie im gesamten L a n d . Der andere besteht darin, die Stichprobe durch zufällige Auswahl (auf diesen Ausdruck k o m m e n wir noch zurück) zusammenzustellen, wobei m a n jeder Person die gleiche Chance gibt, in der Stichprobe zu erscheinen, u n d sich auf den Zufall verläßt, d a ß die Zusammensetzung der Stichprobe die Zusammensetzung der Bevölkerung richtig widerspiegelt. W e n n m a n mit einer sehr kleinen Stichprobe arbeiten will, ist die erste Methode vorzuziehen, unter der Bedingung selbstverständlich, d a ß m a n die Merkmale der Menge k e n n t ; die zufällige E n t n a h m e ist sicherer, wenn es u m eine ziemlich große Stichprobe geht. Schätzung Bevor die Stichprobenverfahren von der Meinungsforschung aufgegriffen wurden, dienten sie der Produktionskontrolle u n d e r f u h r e n dabei ihre Vervollkommnung. E s gibt in der T a t Fälle, in denen die Ü b e r p r ü f u n g eines ganzen Postens gefertigter W a r e n unmöglich ist. U m zu wissen, wie hoch in einem Posten K a r t u s c h e n die Ausschußquote ist u n d ob diese Quote die in dem Fertigungsplan festgelegte Toleranz übersteigt oder nicht, wäre es wenig angezeigt, die ganze Grundgesamtheit zu testen, das heißt alle K a r t u s c h e n a b z u b r e n n e n ; m a n wird eine kleinere Stichprobe e n t n e h m e n müssen, die d a n n geopfert wird. Eine solche Schätzung bringt eine wesentliche Größe mit sich, nämlich die Fehlerspanne (die aus der Terminologie der Artilleristen entlehnte „Gabel" bei Meinungsumfragen u n d bei Teilergebnissen der Wahlen). Stichprobe

eines

Textes

W e n d e n wir diese Prinzipien auf linguistische U n t e r s u c h u n g e n an. Will m a n zum Beispiel wissen, wie groß im D u r c h s c h n i t t die Zahl der W ö r t e r (oder die Zahl der Substantive oder Verschlußlaute . . .) je Vers in Rodogune (1844 Verse) ist, k a n n m a n zwar diese Zahl in allen Versen (d. h. der Grundgesamtheit) untersuchen, u n d das ist das 19

einzige vollkommene Mittel, aber um diese mühselige Arbeit zu vermeiden oder um sich bis zu einer vollständigen Aufnahme eine erste Vorstellung davon zu machen, kann man dieser Grundgesamtheit eine Stichprobe von zum Beispiel 100 Versen entnehmen und darin die mittlere Wortzahl je Vers bestimmen; so erhält man eine Näherung oder eine Schätzung. Dafür gibt es zwei Mittel: entweder die Stichprobe zusammenzustellen, indem man aus jeder Rolle oder aus jedem für das Stück charakteristischen Teil eine dem Umfang proportionale Anzahl von Versen nimmt, was dann gerechtfertigt ist, wenn man vermutet, daß das untersuchte Merkmal mehr oder weniger von den Stilunterschieden zwischen diesen Teilen abhängig ist; oder aber, viel einfacher, man wählt willkürlich 100 Verse aus, an denen man die Zählung vornimmt. Genauso könnte man, wenn man eine für die Sprache eines Schriftstellers repräsentative Stichprobe auswählen wollte, sowohl die Einteilung seines Werkes in Gattungen, Zeitabschnitte, Titel usw. als auch den jedem dieser Teile eigenen Umfang berücksichtigen, um jedem eine bestimmte Zahl von Zeilen oder Seiten zuzuweisen; oder aber man verlaßt sich auf den Zufall und wählt willkürlich aus einer Gesamtausgabe des Autors Seiten aus, jedoch in genügend großer Zahl, damit die verschiedenen Stile bzw. die verschiedenen Teile ihrem Umfang entsprechend vertreten sind. In der Praxis sieht man sich oft veranlaßt, die beiden Methoden zu kombinieren. Zur Aufstellung einer Stichprobe, die für eine Schriftsprache der Gegenwart (1920—1940) repräsentativ ist, beabsichtigt A. Juilland 3 , ein Korpus zu schaffen, das zu gleichen Teilen Romanwerke, Bühnenwerke, Essais, Presseartikel und wissenschaftlichtechnische Texte umfaßt. Im Anschluß daran aber nimmt er innerhalb dieser fünf Kategorien eine Zufallsauswahl vor, um zuerst die Werke und dann die Sätze auszuwählen, die in das Korpus eingehen sollen. Zufallsstichprobe

und

Fragment

Die Begriffe der Grundgesamtheit und der Stichprobe finden auf unserem Gebiet hauptsächlich zwei Anwendungen. Einmal bildet ein Teil eines Textes eine Stichprobe dieses Textes; wenn er aus sehr zahlreichen Fragmenten besteht, die aus dem gesamten Textumfang entnommen (z. B. in Le Cid die Verse 101 bis 110, 201 bis 210, . . . 1801 bis 1810) oder aber so ausgewählt sind, daß der gesamte Text 3

The Romance Languages dictionnaire de frequence

20

and their Structures, 1964. — Dazu s. Ch. Muller, Tin de t'espagnol moderne, Z R P h , 1965.

darin vertreten ist, kann die Stichprobe als repräsentativ f ü r den Text gelten. Wenn dagegen das Fragment innerhalb des Werkes seine eigene Einheit besitzt (die Stanzen des Rodrigue, der Sehlachtbericht, die Rolle des Rodrigue . . .), läßt sich voraussehen, daß es seine eigenen Merkmale haben wird. Der Vergleich zwischen einem Fragment und einer Zufallsstichprobe gleichen Umfangs ist eine sehr fruchtbare Methode der Stilforschung, wenn sie streng angewandt wird. Sprache (langue) und sprachliche Äußerung

(discours)

Wenn wir weiterhin die klassische Unterscheidung zwischen Sprache (langue) und sprachlicher Äußerung (discours), also zwischen Virtualit ä t und Aktualisierung, einführen, müssen wir jede sprachliche Äußerung als eine Realisierung, eine Stichprobe der Sprache ihres Autors betrachten. Die Sprache kann nur ipdirekt über die sprachliche Äußerung beobachtet werden, und jede Statistik wird notwendigerweise an Texten, also an Stichproben der Sprache, betrieben. Daraus folgt, daß jedesmal, wenn man aus einer Statistik einen Schluß auf die Sprache zu ziehen behauptet, man induktiv schlußfolgert; man fällt lediglich ein Urteil auf Grund einer Stichprobe, was die Anwendung der Rechenverfahren erfordert, die zu einem solchen Vorgehen gehören. Häufigkeit Das wiederholte Vorkommen eines und desselben qualitativen Merkmals oder desselben Wertes eines quantitativen Merkmals liefert uns Gesamtmengen: Gesamtmenge der Adjektive, Gesamtmenge der Verse zu 8 Wörtern, zu 9 Wörtern usw. Diese Gesamtmengen, bezogen auf die Gesamtmenge der untersuchten Grundgesamtheit oder auch nicht, stellen die Häufigkeit des betreffenden Merkmals oder Wertes dar. I n Rodogune gibt es 436 Verse zu 8 Wörtern (absolute Häufigkeit) gleich 23,64% bzw. 0,2364 (relative Häufigkeit); in Phedre findet man 855 Adjektive, das sind 5,99% der vorhandenen Wortstellen. Wenn ich Le Cid als eine Menge von 16424 Wörtern oder Wortstellen betrachte und wenn ich finde, daß 3409 von diesen Wörtern Verbformen sind und 45 von diesen Formen zum Verb perdre gehören, kann ich sagen, daß die absolute Häufigkeit der Verben in meinem Text 3409, die des Verbs perdre 45 beträgt. Weiter kann ich sagen, daß die relative Häufigkeit der Verbformen 3409/16424 =.• 0,2075, die des Verbs perdre 45/16424 = 0,00274 und schließlich die relative Häufigkeit dieses Verbs unter den Verbformen 45/3409 = 0,0132 beträgt. 21

Fragmente und

Abschnitte

Ein als eine Menge betrachteter Text kann auch als aus mehreren Teilmengen bestehend behandelt werden. Man kann entweder seine natürlichen Einteilungen berücksichtigen oder künstliche Einteilungen schaffen. So besteht die Komödie Illusion comiqtie nach Aussage des Autors selbst aus einem Prolog, einer Komödie und einer Tragödie (der größte Teil des 5. Aktes, in dem die Personen der Komödie Schauspieler geworden sind und ein tragisches Stück aufführen)/' Jeder dieser drei großen Teile läßt sich in Rollen untergliedern. Man kann auch eine natürliche Einteilung vornehmen, indem man zum Beispiel zwischen Monologen und Dialogen unterscheidet oder indem man in Stücken wie Esther die lyrischen Stellen isoliert. I n einem Roman könnte man als Teilmenge einerseits alle Äußerungen der handelnden Personen (durch Anführungszeichen oder sonstwie drucktechnisch gekennzeichnete direkte Rede) betrachten, andererseits alles übrige, worin der Autor als Sprecher auftritt. Selbstverständlich ergeben diese Einteilungen Fragmente wechselnden und ungleichen Umfangs. Selbst die fünf Akte eines klassischen Stückes haben selten die gleiche Verszahl. Den so geschaffenen Teilmengen wollen wir die Bezeichnung Fragment vorbehalten. I m Gegensatz dazu kann man einen Text auch ohne Rücksicht auf natürliche Gliederungen in Abschnitte gleichen Umfangs einteilen. Diese Abschnitte können sogar aus Segmenten gebildet werden, die verschiedenen Stellen des Textes entnommen sind. So kann man, um den Text von Phèdre (1654 Verse) in 10 bis auf 1 Vers gleiche Abschnitte, also zu je 165 oder 166 Versen zu teilen, entweder bei den Versen 165, 330, 496 usw. einen Einschnitt machen oder aber einen ersten Abschnitt aus den Versen 1,11, 21, . . ., 1641, 1651, einen zweiten aus den Versen 2, 12, 2 2 , . . . , 1642, 1652 usf. bilden. 5 Durch dieses letztere Verfahren nähern sich die Abschnitte den Zufallsstichproben. Verteilung Diese Schnittverfahren, die weitgehend durch die Indexierung des Textes 6 erleichtert werden, ermöglichen es, die Verteilung der sprach'' Über diese Einteilung s. Cb. Muller, Essai de Statistique lexicale, S. 8—11. 5 Dieses Verfahren habe ich angewandt in Essai de Statistique lexicale, S. 136—140, und in Calcul des probabilités et calcul d'un vocabulaire, note I I (Trav. de Ling. et de Litt., IIj, 1964). B Über die Indexierung der Texte s. weiter unten S. 184 und: Lexicologie et

22

liehen Fakten über den ganzen Text zu untersuchen. Wenn irgendein solcher F a k t (Vorkommen eines Phonems, einer Vokabel, einer grammatischen oder semantischen Kategorie, einer syntaktischen Konstruktion usw.) in der Gesamtmenge eine ziemlich große Häufigkeit besitzt (weit größer als die Anzahl der Fragmente oder Abschnitte), dann wird er in den Fragmenten und Abschnitten Subhäufigkeiten aufweisen, die zu untersuchen und, genauer gesagt, mit statistischen Tests zu prüfen sein werden. Man errät schon, daß, wenn die Verteilung einer Erscheinung in den Abschnitten und in den Fragmenten gleichmäßig ist, man darin entweder eine Konstante der Sprache des Autors (des Sprechers) oder nach genauer Überprüfung sogar eine Konstante der Sprache selbst sehen kann. Wenn dagegen die Verteilung in den Abschnitten regelmäßig, in den 'Fragmenten aber unregelmäßig ist, hat man es mit einem stilistischen Phänomen zu tun ; wenn sie schließlich überall unregelmäßig ist, wird man anerkennen müssen, daß die Häufigkeit der untersuchten Erscheinung völlig instabil ist. Die Häufigkeit eines sprachlichen Fakts sollte niemals von der Stabilität dieser Häufigkeit, seiner mehr oder weniger regelmäßigen Verteilung getrennt werden. Aber diese ist erst zu erkennen, wenn man eine Teilung des Textes oder des Korpus vorgenommen hat.

3. Zufall und Zufallsauswahl Zufall und Spiele Wir werden sehr oft von Elementen einer Menge (Wörter eines Textes, Verse einer Dichtung, Seiten eines Buches . . .) zu sprechen haben, die „zufällig ausgewählt" oder „ausgelost" werden. Diese Ausdrücke müssen sehr genau gefaßt werden : denn es ist komplizierter, als man gemeinhin glaubt, eine vollendete Auswahl zu treffen, bei der nur der Zufall spielen soll. Das geht nicht „auf gut Glück" ! lexicographie françaises et romanes, S. 53—68 (Mitteilung von B. Quemada und Diskussion); Ch. Muller, Les Index de vocabulaire (Bull, des Jeunes Romanistes, Nr. 4, 1961; Cahiers de Lexicologie, hauptsächlich Nr. 1 und 3; Bulletin d'information du laboratoire d'analyse lexicoloißque. In den Indizes ist für jede Wortstelle der genaue Ort im Text angegeben; bei den Verstexten, wie sie uns als Beispiele dienen, ist dieser Verweis eine Versnummer. Es ist also sehr leicht, die Wortstellen nach Fragmenten oder nach Abschnitten anzuordnen. Unmittelbar am Text vorgenommen, wäre diese Arbeit äußerst langwierig und von sehr zweifelhafter Genauigkeit.

23

Prinzip dieser Operation ist es nicht nur, daß der Wille oder die Vorliebe dessen, der sie ausführt, keinerlei Einfluß auf das Ergebnis ausüben dürfen, sondern auch, daß jedes der Elemente der Menge von Anfang an die gleiche Chance hat, ausgewählt zu werden. Diese Voraussetzungen sind auf ziemlich einfache Weise in allem erfüllt, was die Glücksspiele betrifft 1 . Nachdem diese uns das Ebenbild-des Zufalls selbst und das diesbezügliche Vokabular geliefert haben, haben sie auch zur Entstehung der Wahrscheinlichkeitsrechnung geführt und bleiben deren bevorzugtes Gebiet. So müssen, wenn man in einem Spiel eine Karte zieht (oder mehrere beim Geben erhält), die Karten gut gemischt worden sein, damit keinerlei Vermutung bezüglich der Lage einer jeden Karte im Stoß mehr möglich ist. Die Karten müssen alle die gleiche Stärke besitzen und vom Rücken gesehen für das Auge des Spielers ganz gleich sein, keine für den Blick oder den Tastsinn bemerkbare Markierung tragen usw. Nur so ist der Wille des Spielers ausgeschaltet, und er hat die gleichen Chancen, den Herzkönig oder die Kreuzacht, ein Herz oder ein Kreuz, einen König oder eine Acht zu ziehen. Die Spielwürfel sind so beschaffen und müssen so zu handhaben sein, daß bei jedem Wurf eine und nur eine der sechs Seiten erscheint und daß die Chancen für jede Seite gleich sind. Diese Überlegung läßt sich mühelos auf das Roulett, die Glücksräder bei der Lotterie, die Lottospielmarken, das Münzenwerfen oder das Hälmchenziehen ausdehnen. Die Bernoullische

Urne

Die Bernoullische Urne bietet uns ein vollendetes Abbild von den äußerst komplizierten Mechanismen der Zufallsauswahl, und es wird häufig darauf zu verweisen sein. Obwohl man sie materiell darstellen und experimentell benutzen kann, ist sie vor allem eine ideale Konstruktion, deren Handhabung nur Überlegung erfordert. Sie soll eine große oder kleine, bekannte oder unbekannte Zahl von Kugeln gleicher Größe und gleicher Konsistenz enthalten. Die Kugeln unterscheiden sich voneinander nur durch die Farbe oder andere Kennzeichen, das heißt durch ein qualitatives Merkmal, das die Hand des Spielers beim Ziehen nicht wahrnehmen, das folglich seine Wahl nicht beeinflussen kann und erst nach dem Ziehen festgestellt wird. Es ist selbst1

Eine gewisse Erfahrung im Umgang mit möglich ohne Überlegungen zum „Zufall". spiel empfohlen., werden E . Borel, Prubahilité (illustrierte) Bändchen von J . - L . Boursin,

24

statistischen Methoden ist nicht Als Lektüre dazu kann zum Beiet certitude und das ausgezeichnete Les structures du hasard.

verständlich, und trotzdem sei daran erinnert, daß der Inhalt der Urne vollkommen durchgemischt sein muß, um jegliche Gruppierung zu vermeiden und um jegliche Beziehung zwischen der Farbe oder der Markierung der Kugeln und ihrer Position auszuschalten. Urnenmodelle In Gestalt von „Urnenmodellen" läßt sich eine Anzahl grundlegender Operationen beschreiben, auf die wir stoßen werden und in denen die obigen Bedingungen immer als erfüllt angesehen werden können. Die geläufigsten sind die folgenden: 1. Man kennt die Zusammensetzung des Urneninhalts, das heißt die Gesamtmenge oder die relative Häufigkeit (den Anteil) der Kugeln von jeder Farbe, und stellt Vermutungen über die zu erwartenden Ergebnisse beim Ziehen der Stichproben von n Kugeln an. 2. Man kennt die Zusammensetzung nicht und versucht, sie durch eine oder zwei Stichproben zu bestimmen (Stichprobenurteil). 3. Man verfügt über eine oder mehrere Stichproben und fragt sich, ob sie aus ein und derselben Urne stammen können oder nicht (oder ob die Urnen, aus denen sie stammen, die gleiche Zusammensetzung haben oder nicht). A uswahlverfdhren Wie können wir nach dem Gesagten aus einem Text eine Zufallsauswahl vornehmen, die in ihrem Ergebnis mit einer Ziehung aus der Urne vergleichbar ist? „Zufällig ein Wort aus einer Seite" oder „eine Seite aus einem Buch" herausnehmen ist sehr schwer, wenn man wirklich will, daß jedes Wort der Seite oder jede Seite des Buches die gleiche Chance haben soll. Wenn man ein Buch „zufällig" aufschlägt, nimmt man im allgemeinen weder die ersten noch die letzten Seiten, wodurch das Ergebnis bereits verzerrt wird. Wenn man „zufällig" den Blick auf die Wörter eines Textes wirft, nimmt man unbewußt eine Auswahl vor; wenn man die Augen schließt und mit einer Nadel ein Wort „heraussticht", bevorteilt man die langen Wörter usw. Man darf also nicht mit Wörtern, Zeilen oder Seiten operieren, sondern mit ihren Ordnungsnummern; man muß Ziffern wählen, die dann zu Ordnungsnummern der Seiten, Zeilen und Wörter in der Zeile werden. Man darf sich nicht sagen: Ich nehme das erste Wort der ersten Zeile auf der linken Seite, die aufgeschlagen wird; bedenkt man dabei, daß die Wörter mit vokalischem Anfang weniger Chancen 25

haben, am Zeilenanfang zu stehen, als die anderen, weil sie immer dann, wenn sie auf eine elidierte Form (£', n', qu', s', . . .) folgen, durch eine drucktechnische Vorschrift aus dieser Stellung entfernt werden? Wenn man über einen alphabetischen Index aller Wortstellen des Textes verfügt, kann man auch eine Seitenzahl des Index und eine Wortordnungszahl auf der Seite auswählen. Für solche Auswahloperationen existieren Tafeln der „Zufallszahlen", von denen auf S. 277 ein Auszug zu finden ist. Geschlossene

Erfassungsgruppen

Nehmen wir an, wir wollen aus den 1840 Versen, die den Text von Le Cid bilden, zufällig 100 auswählen. Dazu entnimmt man einer solchen Tafel vierziffrige Zahlen, bis man eine gefunden hat, die gleich oder kleiner als 1840 ist, zum Beispiel 0675. Da es ziemlich mühselig ist, diese Operation, zu der dann noch die Suche nach dem so bezeichneten Vers kommt, lOOmal zu wiederholen, ist man versucht zu glauben, daß der Zufall seine Rolle hinreichend gespielt hat, indem er unseren Ausgangspunkt bestimmt hat, und daß man zu dem Vers 675 die 99 folgenden oder besser 99 weitere im Abstand von 10 zu 10 oder von 20 zu 20 hinzufügen kann. Auf diese Weise kommt eine „Gruppenauswahl" zustande. Es scheint, daß so die Hauptvoraussetzung respektiert wird, da ja zu Beginn die Chancen auf Vertretung in der Stichprobe für jeden der 1840 Verse gleich waren. Dennoch sind hier einige Vorsichtsmaßnahmen zu treffen. Vorsichtsmaßnahmen Nimmt man die Verse 675 bis 774, hat man wenig Aussicht, eine für die Gesamtmenge wirklich repräsentative Stichprobe zu bekommen; die verschiedenen Teile des Stücks, die verschiedenen Rollen und die verschiedenen Stilformen (Dialog, Monolog, Bericht, Stanzen, . . .), wären nicht als gleichberechtigt behandelt. Das Risiko vermindert sich, wenn man die Verse im Abstand von 10 zu 10 nimmt: 675, 685, . . ., 1645, 1655, 1665; und dennoch hat man so nicht das ganze Stück „durchgekämmt", sondern nur etwas mehr als die Hälfte. Da wäre es besser, im Abstand von 20 zu 20 vorzugehen: 675, 695, . . ., bis 1835, sodann am Anfang des Stückes neu zu beginnen: 15, 35, . . ., wobei der Text als „Schleife" betrachtet wird, in dem Vers 1 auf Vers 1840 26

folgt. 2 Da aber 1840 ein Vielfaches unseres 20-Verse-„Schrittes" ist, werden wir auf die ausgewählten ersten Verse wieder stoßen und sie zweimal zählen. Also besser bei 5, 25, . . . usw. wieder beginnen oder eine neue Auswahl vornehmen, um einen Ausgangspunkt in den ersten Versen des Stückes festzulegen. Bleibt der Nachteil, daß der Textabschnitt von 675 bis 875 doppelt so viele Verse geliefert hat wie der Rest. Kurz, man sieht sehr bald, daß bei diesen Auswahlproblemen die einzige strenge Methode darin besteht, sich dem Zufall anzuvertrauen und die Tafeln zu feenutzen. Damit muß man sich bescheiden, hat man nicht gute Gründe anzunehmen, daß sieh die untersuchten Fakten unterschiedslos auf den ganzen Text verteilen. 3 Auf jeden Fall muß die gewählte Lösung diskutiert und begründet werden, wenn man will, daß die Stichprobe die Bezeichnung „zufällig" verdienen soll. Erschöpfende

oder nichter schöpf ende

Ziehungen

Es ist ferner zwischen erschöpfender und nichterschöpfender Ziehung zu unterscheiden, und wir werden später sehen, daß diese Unterscheidung von sehr großer Bedeutung für die Linguistik werden kann. Wenn man nach einem Urnenschema Schlüsse zieht, muß man genau angeben, ob die Kugel, die gezogen und identifiziert wurde, vor der nächsten Ziehung beiseite gelegt oder in das Spiel zurückgegeben wird. Wird sie in das Spiel zurückgelegt, sagt man, die Ziehung ist nichterschöpfend, und man weiß, daß die Zusammensetzung des Urnen2

3

Mir scheint, dies ist die einzige korrekte Verfahrensweise. Wenn die Zusammensetzung der Stichprobe aus einem Fragment oder einem Abschnitt durch die Auswahl ihrer ersten Einheit (Wort, Vers oder Seite) bestimmt wird, dann muß tatsächlich jedes Resultat allen Einheiten der Menge eine gleiche Chance auf Vertretung in der Stichprobe, dem Fragment oder dem Abschnitt bieten. Nimmt man Fragmente und schließt dabei von vornherein die aus, die am Textende stehen (geordnete Menge), vermindert man die Chance der ersten und der letzten Elemente des Textes, in dem Fragment zu erscheinen. Daher halte ich die Überlegung R. Moreaus in seinem Artikel in Cahiers de Lexicologie Nr. 3, S. 145ÍF. für anfechtbar. Das ist auch die Ansicht E. Evrards (Actes du premier colloque international de linguistique appliquée, S. 160). Diese Einschränkung betrifft zweierlei Sachverhalte: Einerseits kann vor allem im lexikalischen Bereich, aber auch in der Syntax, eine Häufung bestimmter Erscheinungen in einem oder mehreren Teilen des Textes vorliegen (zum Beispiel ein bestimmter Wortschatz oder syntaktische Typen wie die Frage, das Futur usw.); andrerseits schaffen sich gewisse literarische Formen eine „Schwelle", das heißt die Wiederkehr eines und desselben Typs in festen Intervallen; Reim und Refrain sind dafür die geläufigsten Beispiele.

27

inhalts während der ganzen Operation dieselbe bleibt. Wird dagegen die Kugel nicht in die Urne zurückgegeben, spricht man von erschöpfender Ziehung und weiß, d a ß jede Ziehung die Zusammensetzung der Urne und demnach die Wahrscheinlichkeit der folgenden Resultate verändert. Die Konsequenzen dieser Unterscheidung und wie sie zu berücksichtigen sind, werden wir später kennenlernen. F ü r den Augenblick wollen wir uns mit der Feststellung begnügen, daß, wenn wir auf die eben angenommene Weise verfahren, um 100 Verse aus Le Cid zu bekommen, dieses Vorgehen eine erschöpfende Auswahl darstellt, da wir so vorgegangen sind, daß ein einmal gezogener Vers nicht ein zweites Mal gezogen werden kann. Bei Benutzung einer Tafel der Zufallszahlen kann man beide Verfahren anwenden, je nachdem man eine aufgetauchte Zahl eliminieren will oder nicht. Man muß auch wissen, daß der Unterschied zwischen den beiden Verfahren minimal und folglich o f t zu vernachlässigen ist, wenn die Zahl der Ziehungen im Verhältnis zu der Anzahl der im Spiel befindlichen Einheiten klein ist. Wählt man 10 Verse von 1840 aus, ist diese Unterscheidung nahezu belanglos; denn die Wahrscheinlichkeit, denselben Vers allein durch das Spiel des Zufalls zweimal erscheinen zu sehen, ist gering. Bei 100 Versen und noch mehr bei einer größeren Zahl ist das schon nicht mehr gleichgültig. 4 Der Mensch und der Zufall Die folgenden Betrachtungen mögen wenig realistisch, ja vielleicht nichtssagend erscheinen. Dennoch muß man sie in vielen Fällen berücksichtigen, wenn man einem Experiment und seiner Interpretation solide Grundlagen verleihen will. Was diese umständlichen Verfahren 4

Wir haben es hier mit dem Problem des „zufälligen Zusammentreffens" zu tun, wozu sich ein merkwürdiges Beispiel in Structuredu Hasard von J.-L. Boursin, S. 138—140 findet. Es ist dies ein Fall, in dem uns die Intuition und der gesunde Menschenverstand ständig täuschen: Man hat Mühe zu glauben, daß die Chancen, von 40 zufällig ausgewählten Personen mindestens zwei zu finden, die am selben Tage Geburtstag haben, 9 zu 10 stehen. Wenn wir in unserem Fall 10 Verse aus einem Text auswählen, der insgesamt 1840 umfaßt, beträgt die Wahrscheinlichkeit, unterschiedliehe Verse zu erhalten, 0,970; bei 100 Versen beträgt sie nur noch 0,064. Die Formel für beide Wahrscheinlichkeiten lautet: _ P(10) =

28

1840! 1830! 1840 10

_ P(100) =

1840! 1740! 1 8 4 0 ^

rechtfertigt, ist die T a t s a c h e , d a ß der Mensch den Zufall nicht nacha h m e n k a n n . W e n n m a n Versuchspersonen a u f f o r d e r t , die Ziffern 0 u n d 1 in einer langen „zufällig" verteilten Folge zu schreiben, bek o m m t m a n Ergebnisse, die entweder unregelmäßiger oder regelmäßiger sind als die, die eine Ziehung aus einer U r n e mit den ZifFern 0 u n d 1 in gleichen Mengen ergäbe. W e n n es d a r u m ginge, die zehn Ziffern von 0 bis 9 auf diese Weise zu mischen, wäre der Mißerfolg noch offensichtlicher. W a s die Verteilungen a n g e h t , die in der Folge behandelt werden sollen, so ist es noch schwieriger, solche zu ersinnen, die den vom E x p e r i m e n t gelieferten ähnlich sind. D a h e r also die komplizierten Techniken, die verfeinert werden m u ß t e n , um dem Statistiker „Zufallszahlen" zu liefern, und der W e r t , den er ihnen beimißt.

4. Grundregeln der Kombinatorik Permutationen,

Variationen, Kombinationen,

Fakultäten

Permutationen Der Sprechakt verläuft linear. W a s in der Sprache (langue) vorh a n d e n ist, ordnet sich bei der Realisierung in einer sprachlichen Äußerung (discours) notwendigerweise in einem eindimensionalen R a u m an. J e d e s E l e m e n t n i m m t dabei einen b e s t i m m t e n Platz im Verhältnis zu den anderen ein u n d f ü g t sich so in eine Ordnung. I n einer Aussage, bei der wir Segmente unterscheiden, die wir „ W ö r t e r " nennen, sind diese Wörter in einer b e s t i m m t e n Reihenfolge angeordnet, u n d ebenso stehen die das W o r t bildenden P h o n e m e in einer festgelegten Reihenfolge. Diese Reihenfolge k a n n m a n zu der Folge der ganzen Zahlen in Beziehung setzen, das heißt die E l e m e n t e von 1 bis n numerieren. N u n stellen wir fest, d a ß diese Reihenfolge semantisch relevant ist. Mit den drei P h o n e m e n A, L u n d P k a n n ich unterschiedliche „ W ö r t e r " bilden, je n a c h d e m ich sie in die eine oder die andere Reihenfolge bringe: A + L + P alpe A + P + L *aple P + A + L pal, pale, pale P + L + A plat L -f A + P lape L+P-f A l(e) pas 3

Sprachstatistik

29

Ebenso kann man die Wörter eines Satzes permutieren und sich fragen, ob die Ergebnisse akzeptabel sind, ob sie dem syntaktischen Gebrauch entsprechen, ob sie einen Sinn haben, ob zwei dieser Ergebnisse denselben Sinn haben usw. Puer, abige muscas istas Puer, muscas abige istas Puer, istas muscas abige Puer, abige istas muscas Abige, puer, muscas istas usw. Setzte man dieses Permutationsspiel fort, so fände man 24 verschiedene Möglichkeiten, diese vier Wörter zu schreiben. Mit sechs Wörtern gäbe es 720. Es ist üblich, die Zahl der möglichen Permutationen mit dem Buchstaben P zu bezeichnen, dem als Index die Zahl der dazugehörigen Elemente beigesetzt ist, und so kann man, was wir soeben empirisch festgestellt haben, folgendermaßen schreiben: P , = 24 P c = 720 usw. Das Prinzip der Berechnung ist sehr einfach. Wenn man sechs Wörter und sechs Stellen hat, gibt es sechs Möglichkeiten für die erste Stelle. Ist diese besetzt, bleiben fünf Möglichkeiten f ü r die zweite, was bedeutet, daß die beiden ersten Stellen auf 6 • 5 = 30 verschiedene Arten besetzt werden können. Bezüglich der dritten Stelle bleiben für jeden dieser 30 Anfänge vier Möglichkeiten, also 30 • 4 = 120 mögliche Wortfolgen, bei der vierten drei Möglichkeiten, bei der fünften nur zwei. Die letzte Stelle läßt nur noch eine Möglichkeit übrig, nachdem für die fünf ersten alle Reihen gebildet wurden. Das kann man schreiben PG = 6 • 5 • 4 • 3 • 2 • 1 = 720 und folgendermaßen formulieren: „Die Zahl der Permutationen von 6 Elementen ist gleich dem Produkt aus den ganzen Zahlen von 1 bis 6". Dieses empirische Ergebnis läßt sich leicht verallgemeinern und schreiben Vn = n • (n -

1) • (n - 2) . . . • 3 • 2 • 1,

was besagt, daß „die Zahl der Permutationen von n Elementen gleich dem Produkt aus den ganzen Zahlen von 1 bis n ist".

30

Fakultäten An dieser Stelle soll der Begriff der Fakultät eingeführt werden. Man nennt „«-Fakultät" das Produkt aus den ganzen Zahlen von 1 bis n ohne Auslassung und Wiederholung, dargestellt durch die Zahl n mit Ausrufungszeichen: n\ Man kann also schreiben: 6 ! = l - 2 - 3 - 4 - 5 - 6 = 720, woraus folgt: P 6 = 6! und allgemeiner: n\ = 1 • 2 • 3 . . . • (n - 2) • (n — 1) • n Aus dieser Definition folgt, daß die Fakultät einer Zahl das Produkt aus dieser Zahl und der Fakultät der nächst kleineren Zahl ist: 6! = 6 • 5! n\ = n • (n — 1)! Teilt man die beiden Seiten dieser Gleichung durch n, so erhält man n! — = (n- 1)! n So läßt sich, ausgehend von einer Fakultät, zum Beispiel der Fakultät 6 (6! = 720), rückläufig die Fakultät der voraufgehenden Zahl finden: 720 5! = — = 120 6 und weiter, indem man die Reihe der ganzen Zahlen nach unten durchläuft : 120 4! = —— = 24 5 24 3! = — = 6 4 6 2 ! = - = 2

2

! ! = - = !

und wenn man die Operation auf 0 ausdehnt: 1 0! = - = 1. 1 3»

31

Daraus ergibt sich die etwas paradoxe Folgerung, deren Gültigkeit wir in der Folge jedoch feststellen werden, daß die Fakultät 0! nicht 0, sondern 1 ist. Wir können also die Reihe der ersten Fakultäten bilden, die zeigen wird, daß man sehr schnell zu sehr großen Zahlen gelangt: 0! = 1

1! = 1 2! =

2

3! = 6 4! = 24 5! = 120 6! = 720 7! = 5040 8! = 40320 9! = 362880 10! = 3628800 usw. I n der Praxis kommt es im übrigen kaum vor, daß man die Fakultäten großer Zahlen berechnen und schreiben muß. Variationen Wir wollen nun annehmen, daß wir, vorausgesetzt eine Menge von n verschiedenen Elementen ist vorhanden, nicht mehr, wie wir es soeben getan haben, Folgen aus n Elementen, sondern nur aus einem Teil dieser Elemente, und zwar in einer Anzahl von k ohne Wiederholung bilden wollen. Das ergibt Variationen von jeweils k aus n Elementen. Mit den 26 Buchstaben des Alphabets (n = 26) können wir Variationen von k — 3 Buchstaben bilden: ABC BAC ACD ALD AST SDT CDT CFR D G H usw., von denen jede aus drei verschiedenen Buchstaben 1 des Alphabets in einer bestimmten Reihenfolge gebildet wird. Die Anzahl der verschiedenen Variationen, die mit jeweils k aus n Elementen gebildet werden können, wird gewöhnlich mit Vjj bezeichnet. Welches ist nun 1

Entfällt diese Einschränkung, ist die Berechnung einfacher: Mit n Buchstaben kann man nk verschiedene Folgen von k Buchstaben bilden, in unserem Fall 26 3 = 17576, darunter 26 mit wiederholtem gleichen Buchstaben und 26 • 25 • 3 = 1950 mit zwei verschiedenen Buchstaben, da jede Auswahl von zwei Buchstaben (26 • 25 Möglichkeiten) drei Folgen ergeben kann: ABB, BAB, BBA.

32

in unserem Beispiel der Wert von V| 6 ? Mit anderen Worten, wieviel verschiedene Trigramme aus je drei verschiedenen Buchstaben kann man sich vorstellen? Wir haben 26 Elemente und drei Stellen zur Verfügung. Für die Besetzung der ersten Stelle haben wir die Wahl zwischen den 26 Buchstaben. Danach bleiben für die zweite Stelle 25 Möglichkeiten, für die beiden ersten Stellen zusammen folglich 26 • 25 = 650 Möglichkeiten. Für die dritte Stelle bleibt eine Auswahl von 24. Insgesamt bekommen wir also 26 • 25 • 24 = 15600 mögliche Variationen: V| 6 = 2 6 - 2 5 - 24 = 15600. Verallgemeinernd kann man sagen, daß die Zahl der möglichen Variationen von jeweils k aus n Elementen gleich dem Produkt aus k aufeinanderfolgenden, von n abnehmenden ganzen Zahlen ist. Das ist weder sehr bequem auszusprechen noch sehr leicht zu merken. Es ist aber viel einfacher in algebraischer Form auszudrücken. Stellen wir doch fest, daß 2 6 - 2 5 -24 -23 • 22 . . . • 3 • 2 • 1 26! 26 • 25 • 24 = 23 • 22 • 21 . . . 3 • 2 • 1 23!' Wir haben also über den Bruchstrich das -Produkt aus den ganzen Zahlen von 1 bis 26 und somit die Fakultät 26 geschrieben, darunter das Produkt aus den ganzen Zahlen von 1 bis 23 und damit die Fakultät 23, das heißt also (26 — 3)!. Dafür kann man schreiben: V* =

(n - k)! ' n\ Die Formulierung -— ist nur eine bequeme Art, das Produkt (n — k)! aus k ganzen Zahlen von (n — k) ausschließlich bis n einschließlich darzustellen. Die Übertragung dieses Ausdrucks in Zahlen macht weder die Berechnung von n! noch von (n — k)! und die Division beider durcheinander nötig. Es genügt, k Zahlen bei n beginnend und gegen 1 gehend auszuzählen und dann ihr Produkt zu bilden, was bei kleinem k sehr einfach ist. Kombinationen Ausgehend von einer Menge von n Elementen (den 26 Buchstaben des Alphabets), haben wir Variationen von k Elementen (in unserem Beispiel drei Buchstaben) gebildet und die Anzahl der unter diesen Bedingungen möglichen unterschiedlichen Variationen berechnet. 33

Jede derartige Operation läßt sich in zwei Arbeitsgänge zerlegen: a) die Auswahl eines Postens von k Elementen, die in die Variation eingehen sollen; b) die Anordnung dieser k Elemente in einer bestimmten Reihenfolge. Um hier den Terminus Kombination einzuführen, kann man sagen, daß der Posten von k Elementen nach seiner Auswahl, aber vor seiner Ordnung eine Kombination bildet. Wenn ich so unter den 26 Buchstaben des Alphabets die drei Buchstaben A, L und P auswähle, stelle ich eine der möglichen Kombinationen auf, indem ich drei Buchstaben aus den 26 herausnehme. Diese drei Buchstaben kann ich dann ordnen, um die Variationen ALP, APL, LAP, LPA, PAL und PLA zu erhalten, die die sechs möglichen Permutationen dieser Kombination sind. Unsere drei gebräuchlichen Termini sind somit genau definiert. Permutationen sind die verschiedenen Arten, alle Elemente einer Menge ohne Auslassung und Wiederholung zu ordnen. Kombinationen sind die Teilmengen von k Elementen, die man durch Entnahme aus einer Menge von n Elementen erhalten kann. Variationen sind dieselben Teilmengen geordnet. Nun existieren aber für jede Kombination von k Elementen ebensoviel Variationen, wie es Permutationsarten für ¿Elemente gibt, das heißt kl Daraus läßt sich ableiten, daß, wenn man mit C* die Zahl der möglichen Kombinationen von jeweils k aus n Elementen bezeichnet 2 , sich folgende Beziehung ergibt: V^CJ-P*

oder

C - g . r

k

Ersetzt man die rechte Seite der letzten Gleichung durch die bereits bekannten Werte, so erhält man: k " =

C

n' kl (n - k)T '

Damit können wir die Zahl der weiter oben erwähnten Trigramme feststellen, ohne eine vollständige Liste derselben aufstellen zu müssen: - Die Sehreibweise C* wird nicht allgemein angewandt. In nichtfranzösischen Arbeiten findet sich im allgemeinen das Zeichen (£), gelesen: „n über fc"; auch gebrauchen manche französische oder nichtfranzösische Werke nCk. C* liest man: ,,C n k".

34

26! 26!

Q3

1 •2 • 3 . . . • 2 4 - 2 5 • 26

3! (26 - 3)!

26

daraus durch Kürzung: Cor =

1 • 2 • 3 • 1 • 2 • 3 . . . • 22 • 23 ' ¿Ti

23!

24 • 25 • 26 , n — = 4 • 25 • 26 = 2600. 1-2-3

Man sieht, daß bei jeder Entnahme von k Elementen zur Bildung einer Variation zwei Teilmengen entstehen: die der ausgewählten k Elemente und die der (n — k) verbleibenden, was uns zeigt, daß G nk — nn-k • Ein letztes Beispiel soll uns helfen, diese grundlegenden Begriffe zu behalten und anzuwenden 3 . Ich habe n Bücher gekauft und habe k freie Plätze auf einem Bücherbrett, wobei ich k < n nehme. Um diese Plätze zu besetzen, kann ich einen Posten von k Büchern aussuchen: Das ist eine Kombination, und dafür habe ich die Wahl zwischen

.

n\

Cn Lösungen oder — — . Danach bleiben mir P k — k\ Möglichkeiten, die k Bände des Postens aufzustellen: Das sind die Permutationen, von denen mir jede eine Variation liefert. Solange ich weder die k Bücher ausgewählt noch die ihnen zu gebende Reihenfolge bedacht habe, habe ich V* mögliche Variationen vor mir, das heißt .



n!

=

Lösungen.

Bei acht Büchern und fünf Plätzen findet man: 8! C2 = — ; — = 8 5! 3!

6-7-8 1-2-3

= 56 Kombinationen,

von denen jede P 5 = 1 • 2 • 3 • 4 • 5 = 120 Variationen ergibt. Insgesamt gibt es also 56 • 120 = 6720 Variationen, was man direkt hätte finden können: V |

3

= ( 8 ^ 5 ) ! = 4 . 5 . 6 - 7 . 8 = 6720.

Wenn jemand bei einer Dreierwette unter den n startenden Pferden seine drei Pferde aussucht, hat er die Wahl zwischen C? Kombinationen, von denen eine und nur eine „ungeordnet" gewinnt. Legt er sich auf ihr Klassement fest,

35

Das Pascalsche

Dreieck

Alle Zahlen der möglichen Kombinationen für alle W e r t e von n und k enthält das arithmetische oder Pascalsche Dreieck, das vielfältig angewandt wird und das wir wiederholt zu zitieren haben werden. U m dieses Dreieck zu erhalten, schreibt m a n unter jede Zahl die Summe aus dieser und der links daneben stehenden Zahl. Sp. 0 Zeile

0 1 2 3 4 5 6 7 8 9 10 usw.

1 1 1 1 1 1 1 1 1 1 1

1

1 2 3 4 5 6 7 8 9 10

2

3

1 3 6 10 15 21 28 36 45

1 4 10 20 35 56 84 120

4

6

1 5 15 35 70 126 210

1 6 21 56 126 252

1 7 28 84 210

7

1 8 36 120

8

1 9 45

9

1 10

10 11 usw. Zeilensurame

1

1 2 4 8 16 32 64 128 256 512 1024

Diese Tabelle, die m a n unendlich fortsetzen kann 4 , könnte ebensogut geschrieben werden: ©O

0 1

Co

ci

2

CS

c|

r

3

c?

CJ

c 23

usw.

4

2 2

hat er die Wahl zwischen P 3 = 6 Permutationen, von denen eine einzige „geordnet" ( = „großer Einlauf", Anm. des Übersetzers) gewinnt. Würden die Wetter das Klassement auslosen, wäre der Gewinn geordnet sechsmal so groß wie der Gewinn ungeordnet; ist er kleiner als diese Zahl, dann haben sie in der Mehrzahl gute Vorhersagen über die Reihenfolge abgegeben. Ist er höher, dann waren ihre Vorhersagen sehlecht. Als Beispiel sei hier die 20. Zeile des Dreiecks angeführt, von der sich auf S. 67 eine graphische Darstellung findet: 1 20 190 1140 4845 15504 38760 77520 125970 167960 184756 167960 125970 77520 38760 15504 4845 1140 190 20 1.

36

Bei der Anwendung bedient man sich sowohl der Spalten als auch der Zeilen des Dreiecks. So ist die Zahl der Kombinationen für unsere acht 3 zu 3 zu nehmenden Bücher in der dritten Spalte der achten Zeile zu finden: 56. Hätte man mit acht Büchern 0, 1, 2, . . ., 8 Plätze besetzen müssen, hätte man 1, 8, 28, 56, 70, 56, 28, 8 und 1 mögliche Kombinationen erhalten. Wenn man, um drei Plätze auf dem Bücherbrett zu besetzen, 3, 4, 5, . . . Bücher gehabt hätte, hätte man 1, 4, 10, 20, 35 . . . Lösungen gefunden. Diese Zahlen sind in der achten Zeile und in der dritten Spalte abzulesen. Zusammenfassung Die in diesem Kapitel summarisch erläuterten Begriffe dienen vor allem zur Aufstellung eines theoretischen, aber vollständigen Inventars bestimmter Möglichkeiten. Muß hier besonders gesagt werden, daß die Sprache im allgemeinen nicht alle realisiert und daß die vorhandenen nicht alle dieselbe Verwendungswahrscheinlichkeit haben? Man wird hierbei an die von dem Lehrer der Philosophie in Le Bourgeois Gentilhomme angedeutete Permutation erinnert: „Belle marquise, vos beaux yeux mefont mourir d'amour". Er gibt davon nur fünf Varianten, aber ein rascher Überschlag zeigt, daß 235 bleiben, die nicht genutzt werden. Der Satz umfaßt nämlich fünf unauflösbare Elemente: /Belle marquisejvos beaux yeuxjme fontjmourirjd'amour/, was Permutationen in einer Anzahl von P 5 = 5 ! = 120 gestattet. Dabei kann eines der Elemente selbst wieder permutieren : vos beaux yeux\ vos yeux beaux j , wodurch die Zahl der Variationen verdoppelt wird: 240. Gewisse Variationen des Inventars können übrigens ausgeschlossen werden. Wenn man die Zahl der Reihen von drei Phonemen sucht, die mit einem System von n Phonemen, darunter k Konsonanten und v Vokalen, gebildet werden können, ist man berechtigt, von der theoretischen Zahl n\ bestimmte Variationen, die man als unmöglich erkannt hat, abzusetzen: zum Beispiel die Variationen von drei Konsonanten, die h\ Vik = { k - 3)! ausmachen würden. Schließlich kann man die Zahl der in einem Korpus tatsächlich festgestellten oder als möglich erkannten Variationen zu der von 37

der Berechnung gelieferten theoretischen Zahl in Beziehung setzen. I m Fall der Wortstellung (puer, obige muscas istas!) würde diese Beziehung zu einem Maß für die einer Sprache auf diesem Gebiet eigene Freiheit und zu einem Vergleich zwischen verschiedenen Sprachen von diesem Gesichtspunkt herführen. Dies weist uns auf eine der Hauptoperationen der Statistik hin, nämlich den Vergleich zwischen einem theoretischen Modell und einer beobachteten Realität, der das Maß und die Interpretation der zwischen beiden bestehenden Abweichung ergibt.

5. Grundregeln der Wahrscheinlichkeitsrechnung Schätzung

und Wette

Der Begriff der Wahrscheinlichkeit ist uns vertraut. Sprechen wir von einem Ereignis, das noch nicht eingetreten oder dessen Ausgang uns noch nicht zur Kenntnis gelangt ist, so schätzen wir seine Wahrscheinlichkeit ein, indem wir es entweder näher zur Gewißheit oder zur Unmöglichkeit stellen. Die Gemeinsprache verfügt über ziemlich elementare Mittel, um diese Schätzung auszudrücken: Das Ereignis wird als unmöglich, undenkbar, unwahrscheinlich, zweifelhaft, möglich, wahrscheinlich, sicher usw. bezeichnet. Die Wette setzt diese Schätzung in Handlung um. Wetten, daß das Ereignis stattfinden wird (oder daß es stattgefunden hat), heißt, es näher zur Gewißheit als zur Unmöglichkeit zu stellen, heißt, daß man schätzt, daß es mehr Aussichten auf das Eintreten als auf das Nichteintreten hat (oder hatte). Und wenn man 10 gegen 1 wettet, heißt das, daß man glaubt, daß es zumindest zehn Chancen gegen eine hat (oder hatte), AVirklichkeit zu werden. Wie man Wahrscheinlichkeiten

schreibt

Die Wahrscheinlichkeitsrechnung ersetzt diese vagen Einschätzungen durch eine bezifferte Skala, die einer sehr präzisen algebraischen Sprache als Grundlage dient, an die man sich gewöhnen muß und deren Syntax hier geboten werden soll. Diese Skala hat als Grenzen die Null (0), die die Unmöglichkeit, und die Eins (1), die die Gewißheit darstellt. Das bedeutet, immer wenn wir eine Wahrscheinlichkeit in Zahlen ausdrücken sollen, können wir nur positive Zahlen von 0 bis 1 einschließlich dieser Grenzwerte 38

benutzen: „1/5", „0,20" oder „20%" können eine Wahrscheinlichkeit messen; „5/4", „1,25" oder „125%" können es in keinem Fall. Gegeben sei ein Ereignis A. Üblicherweise bezeichnet man mit A („A quer" oder „A überstrichen") das entgegengesetzte Ereignis. Die Wahrscheinlichkeit von A stellt man durch die Schreibung ,,P(A)", von Ä durch ,,P(Ä)" dar. Beispiele : A „Es wird morgen regnen" „Morgen mittag wird das Thermometer in . . . zwischen + 10 und + 20 anzeigen" „Barnabe wird seine Prüfung ablegen" „Dieses Wörterbuch enthält mindestens 50000 Wörter" „Der Vers, den ich auswählen werde, enthält ein Adjektiv" „Das Wort, das ich auswählen werde, wird männlich sein".

A „Es wird morgen nicht regnen" „Morgen . . . wird das Thermometer unter + 1 0 oder über + 20 anzeigen" „Barnabe wird seine Prüfung nicht ablegen" „Dieses Wörterbuch enthält weniger als 50000 Wörter" „Der Vers . . . enthält kein Adjektiv oder mehrere Adjektive" „Das Wort . . . wird nicht männlich sein".

Wenn man diese Beispiele aufmerksam prüft, wird man sehen, daß Ä alles einschließen muß, was nicht A ist. Das Gegenteil von „die Prüfung ablegen" ist hier nicht „durchfallen": Barnabe kann ebensogut verhindert sein, seine Prüfung abzulegen. Das Gegenteil oder genauer das „Komplement" zu männlich ist alles, was nicht männlich ist einschließlich der Wörter, für die die Kategorie des Genus nicht existiert. Nur wenn man den Begriff des gegenteiligen Ereignisses so strikt definiert, darf man schreiben: P(A) + P(Ä) = 1, denn jeder andere Ausgang als A oder Ä wird ausgeschaltet. Würde das Ereignis „Dieses Wörterbuch enthält über 50000 Wörter" mit A und „. . . unter 50000 Wörter" mit Ä bezeichnet, bliebe außer diesen beiden Ereignissen noch eine Möglichkeit, nämlich daß das Wörterbuch genau 50000 Wörter enthält. Die obige Formel wäre also falsch, oder vielmehr die Beziehung, die A und Ä vereinen soll, wäre nicht realisiert. Wenn zwei Personen, die ein Wörterbuch durchblättern, die Zahl der "Eintragungen" (Stichwörter) zu schätzen versuchen, sagt die eine vielleicht: „Ich wette, es enthält keine 50000 Wörter". Nennen wir 39

das Ereignis „Das Wörterbuch enthält weniger als 50000 Wörter" A, dann kann die Ansicht dieser Person geschrieben werden: P ( A ) > P(Ä), woraus folgt: P(A) > 0,5 und P(Ä) < 0,5. Hält der Partner die Wette, dann heißt das, daß er im Gegenteil der Meinung ist, daß: P(A) < P(Ä) oder daß P(A) < 0,5 und P(Ä) > 0,5 ist. Die Wette beruht also auf dieser Schätzungsdivergenz. Um zwischen den Wettenden zu entscheiden, bleibt sodann nur die Auszählung der Artikel des Wörterbuchs. Bezieht sich die Schätzung oder Wette auf ein quantitatives Merkmal, kann man das Ereignis in Form eines algebraischen „Satzes" ausdrücken. So könnte man die unbekannte Zahl der Wörter des Wörterbuchs mit x bezeichnen une} schreiben: P(* < 50000) > P(a; ^ 50000) oder F(x < 50000) > 0,5. Die Zeichen für die Ungleichheit gestatten auch die Angabe der Grenzen. Wenn man für sicher hält, daß die Zahl qp zwischen 10000 und 100000 liegt, schreibt man: P(10000 ^ * ^ 100000) = 1, und wenn man für fast sicher hält, daß sie zwischen 40000 und 60000 liegt, kann das formuliert werden: P(40000 a; ^ 60000) > 0,9. Einzelwahrscheinlichkeiten Nehmen wir ein anderes Beispiel. Wir wollen einen Vers aus Phèdre von Racine auswählen und uns fragen, ob er wenigstens ein Adjektiv enthält. Als Hinweis soll uns die Angabe dienen, daß das Stück 1654 Verse hat und daß die Indizes darin ungefähr 850 Adjektive feststellen (Guiraud zählt 855 und die Konkordanz von Besançon 852), also etwas mehr als eine Okkurrenz für zwei Verse. Nennen wir A das Ereignis: „Der Vers enthält wenigstens ein Adjektiv" und Ä: „Der Vers enthält kein Adjektiv". 40

Kennt man die obigen Zahlenangaben, wird es klüger sein, auf Ä zu setzen ; denn es soll ziemlich oft vorkommen, daß ein Vers mehrere Adjektive enthält: . . . Mais fidèle, mais fier, et même un peu farouche, Charmant, jeune, traînant tous les cœurs après soi . . ., woraus folgt, daß die Zahl der Verse ohne Adjektiv überwiegen muß. Das würde auf die Feststellung hinauslaufen, daß P(A) < 0,5 ist. Aber um das Ungleichheitszeichen durch ein Gleichheitszeichen ersetzen zu können und um den Wert dieser Wahrscheinlichkeit mit Sicherheit zu beziffern, müßte man die Zahl der Verse kennen, die ein oder mehrere Adjektive enthalten, eine Zahl, die für den Augenblick eine Unbekannte, x ist. Dann bekäme man das Verhältnis der „günstigen" 1 Fälle zur Zahl der möglichen Fälle, das die Definition der Wahrscheinlichkeit selbst darstellt: x V = n-> wo n die Zahl (1654) der Elemente der Menge bezeichnet, von denen das eine zufällig ausgewählt werden soll. Wenn ich also weiß, daß Phèdre 14217 Wörter, darunter 3005 Verbformen umfaßt, kann ich sagen, daß bei der zufälligen Auswahl eines Wortes aus dem Text die Wahrscheinlichkeit, eine Verbform zu treffen, 3005/14217 = 0,2113 beträgt. Die komplementäre Wahrscheinlichkeit, die nämlich, ein beliebiges Wort, das nicht Verbform ist, zu erhalten, beträgt dann 1 - 0,2113 = 0,7887. Das Prinzip

der

Additivität

Die Konkordanz zu Phèdre liefert uns die Verteilung der grammatischen Kategorien in diesem Text: 1

Diesem Ausdruck ist keinerlei affektiver Wert beizumessen. In einem Versuch, der nur zwei Ergebnisse liefern kann, bezeichnet man üblicherweise oft das eine als „Erfolg" oder „günstigen Ausgang", das andere als „Mißerfolg" oder „ungünstigen Ausgang", um einen Gegensatz festzustellen, nicht aber einen Vorzug (vgl. S. 95).

41

Substantive (ohne Eigennamen) Verbformen Adjektive Adverbien und koordinierende Konjunktionen Übrige .Kategorien

0,1789 0,2113 0,0599 0,0986 0,4513 1,0000

Legen wir die S: V: Adj: Adv:

folgenden Symbole fest : „Das Wort ist ein Substantiv" „Das Wort ist eine Verbform" „Das Wort ist ein Adjektiv" „Das Wort ist ein Adverb oder eine koordinierende Konjunktion" B: „Das Wort gehört einer anderen Kategorie an (Strukturwörter oder Eigennamen)".

Dann kann man schreiben: P(S) = 0,1789 P(S) = 0,8211 P(B) = 0,4513 P(B) = 0,5487 usw. Die Ereignisse S und V gehören ein und derselben Menge an und schließen sich wechselseitig aus'1. Wenn wir einen Versuch machen, das heißt wenn wir ein Wort zufällig auswählen, ist V unmöglich, wenn S erscheint und umgekehrt. Andererseits gehören die Ereignisse S, V, Adj, Adv und B ein und derselben Reihe an und schließen sich wechselseitig aus; außerdem bilden sie aber eine vollständige Reihe, und es ist kein anderer Ausgang möglich. Das ergibt sich aus der Tatsache, daß wir ein vollständiges Verzeichnis der möglichen Ergebnisse aufgestellt haben, was folgendermaßen ausgedrückt werden kann: P(S) + P(V) + P(Adj) + P (Adv) + P(B) = 1. Wenn mehrere Ereignisse ein und derselben Reihe angehören und sich wechselseitig ausschließen, dann ist die Wahrscheinlichkeit, daß das eine oder das andere eintritt, gleich der Summe ihrer jeweiligen Wahrscheinlichkeiten: P ( S oder V) = P(S) + P(V). a

Die Terminologie ist hier schwankend und manchmal irreführend. Es wird zuweilen versucht, diese Unterscheidung dadurch auszudrücken, daß man von gleichzeitigen Ereignissen spricht, aber der Wurf zweier Würfel kann gleichzeitig erfolgen, und ihr Ergebnis ist unabhängig. Umgekehrt schließen sich die unterschiedlichen Ergebnisse für denselben Würfel aus und sind nicht gleichzeitig im strengen Sinne des Wortes.

42

Mit anderen Worten, die Wahrscheinlichkeit, ein Substantiv oder ein Verb zu ziehen, beträgt 0,1789 + 0,2113 = 0,3902. Ebenso: P(S oder V oder Adj) = P(S) + P(V) + P(Adj) = 0,1789 + 0,2133 + 0,0599 = 0,4501. Wir sagten, daß eine Wahrscheinlichkeit größer als 1 widersinnig ist. Man kann also keine Wahrscheinlichkeit erhalten, wenn man zwei Wahrscheinlichkeiten addiert, deren Summe größer als 1 wäre. Damit diese Operation zu einer Wahrscheinlichkeit führt, müssen sich folglich die beteiligten Wahrscheinlichkeiten wechselseitig ausschließen. Gemeinsame

Wahrscheinlichkeiten

Führen wir jetzt ein weiteres Merkmal des auszuwählenden Wortes ein: die Zugehörigkeit zu dem einen oder anderen der fünf Akte. Bezeichnen wir mit A, B, C, D und E diese Zugehörigkeit zu dem 1., 2., . . ., 5. Akt. Nach dem an der Zahl seiner Verse gemessenen Umfang jedes Aktes können wir die Wahrscheinlichkeit für jedes dieser fünf Ereignisse berechnen: I : 366 Verse von 1654 also P(A) = 0,2213 11:370 P(B) = 0,2237 I I I : 264 P(C) = 0,1596 IV: 328 P ( D ) = 0,1983 V: 326 P(E) = 0,1971 1,0000

Es ist offensichtlich, daß A, B, C; D und E eine vollständige Reihe bilden (Summe der Wahrscheinlichkeiten = 1 ) und sich wechselseitig ausschließen und daß man folglich das Prinzip der Additivität auf sie anwenden kann. Wenn wir aber jetzt das Ereignis S („Das Wort ist ein Substantiv") dem Ereignis A („Das Wort gehört zum ersten Akt") gegenüberstellen, haben wir es mit zwei Ereignissen zu tun, die zwar aus ein und demselben Versuch stammen, aber voneinander unabhängig sind: Das eine schließt das andere nicht aus, impliziert es nicht und übt auch keinerlei Wirkung darauf aus 3 . Nichts garantiert uns a 'priori, daß die Summe ihrer Wahrscheinlichkeiten kleiner oder gleich 1 ist. 3

Ereignisse, die, ohne einander auszuschließen, trotzdem nicht unabhängig voneinander sind, •werden im Kapitel über die Korrelation behandelt. Wenn zum Beispiel der Anteil der Substantive am 1. Akt viel stärker oder schwächer 43

Außerdem können wir entweder die Wahrscheinlichkeit von A oder S oder die Wahrscheinlichkeit von A und S in Betracht ziehen, wohingegen bei S und V die Hypothese „S und V" widersinnig war und laut Definition eine Wahrscheinlichkeit Null hatte. Wir betreten hier den Bereich der gemeinsamen Wahrscheinlichkeiten, in dem nicht mehr von Addition die Rede sein kann. Untersuchen wir zunächst den Fall „und", das heißt den Fall, in dem der Versuch A und S ergibt. Hier sind vier Ausgänge möglich: A und S („Das Wort ist ein Substantiv des ersten Akts") A und S (Das Wort steht im ersten Akt, ist aber kein Substantiv") Ä und S („Das Wort ist ein Substantiv außerhalb des ersten Akts") Ä und S („Das Wort steht außerhalb des ersten Akts und ist kein Substantiv"). Die Wahrscheinlichkeit f ü r jeden dieser Ausgänge ist eine gemeinsame Wahrscheinlichkeit-, sie ist an das Eintreten zweier voneinander unabhängiger Ereignisse gebunden. Man erhält sie durch Multiplikation der Wahrscheinlichkeit für jedes von ihnen. P ( S und A) = P(S) • P(A) P ( S und Ä) = P(S) • P(Ä) usw. Wenden wir dieses Prinzip auf unser Zahlenbeispiel an: P ( S und A) = 0,1789 • 0,2213 = 0,0396 P ( S und Ä) = 0,1789 • 0,7787 = 0,1393 P ( S und A) = 0,8211 • 0,2213 = 0,1817 P ( S und Ä) = 0,8211 • 0,7787 = 0,6394 TTöööo Wir stellen fest, daß die Summe der gemeinsamen Wahrscheinlichkeiten genau 1 ist. Da sie eine Reihe bilden, deren Glieder einander ausschließen, kann man das Prinzip der Additivität auf sie anwenden. Folglich stehen die Chancen etwa 4 zu 100, daß das gezogene Wort ein Substantiv des ersten Akts, 14 zu 100, daß es ein Substantiv aus einem als an den anderen wäre, gäbe es keine Unabhängigkeit zwischen A und S: Je nachdem A eingetreten ist oder nicht, ändert sich nämlich dann die Wahrscheinlichkeit von S. Unsere Schlußfolgerung beruht hier auf einer Nullhypothese über die Verteilung des Substantivs auf die Akte.

44

andern Akt, 18 zu 100, daß es ein anderes Wort des ersten Akts ist und schließlich 64 zu 100, daß das Wort keine der beiden Bedingungen (ein anderes Wort aus einem anderen Akt) erfüllt. Diese Aufstellung gestattet es, die Frage des „oder" bei zwei unabhängigen Ereignissen zu lösen. Unter den vier möglichen Ausgängen lassen drei die eine oder die andere der beiden Bedingungen oder beide eintreten; ein einziger schließt sie alle beide aus. Man kann also schreiben 4 : P ( J . oder S) = P ( A und S) + P ( Ä und S) + P ( A und S) = 1 - P ( Ä und S) = 1 - 0,6394 = 0,3606. Wiederholter

Versuch

Die Grundregeln der gemeinsamen Wahrscheinlichkeiten lassen sich ebensogut auf zwei Ereignisse gleicher Art, die jedoch aus zwei voneinander unabhängigen Versuchen stammen, anwenden. An Stelle eines Wortes wollen wir zwei Wörter willkürlich auswählen, wobei wir uns für das Merkmal „Substantiv" oder „Nicht-Substantiv" der ermittelten Wörter interessieren. Was kann eintreten? Daß beide Substantive sind, daß nur eins von ihnen, das erste oder das zweite, und schließlich daß keines ein Substantiv ist. Schreiben wir die Wahrscheinlichkeit für diese vier Ergebnisse in Zahlen: Das erste Das zweite ist ein Substantiv 2 Subst.: . 1 Subst.: 0 Subst.:

JA (JA |NEIN NEIN

Wahrscheinlichkeit

JA

0,1789 • 0,1789 = 0,0320

0,0320

NEIN

0,1789-0,8211 =¡ 0,14691 0,8211-0,178® = 0,140»} 0,8211-0,8211 = 0,6742 1,0000

°'2938 0,6742 1,0000

J A

NEIN

Es bestehen etwa 32 Chancen gegen 1000, daß beide Wörter Substantive sind, 294, daß es das eine oder das andere ist, und 674, daß keines der beiden diese Bedingung erfüllt. Die Wahrscheinlichkeit, daß wenigstens eines Substantiv ist, berechnet man durch 0,0320 + 0,2938 oder einfacher durch 1 - 0,6742 = 0,3258. '' Halten wir schon jetzt fest, denn dieser Punkt spielt später (s. S. 206 usw.) eine wichtige Rolle, daß es einfacher ist, die Wahrscheinlichkeit für den einzigen „ungünstigen" Ausgang zu berechnen und sie von 1 abzuziehen, falls man sich nur für die Gesamtwahrscheinlichkeit der drei „günstigen" 4

Sprachstatistik

45

Und wenn wir, immer noch auf Grund des Zufalls, drei Wörter auswählten? Das Prinzip der gemeinsamen Wahrscheinlichkeiten bleibt weiter gültig, und die Beweisführung ist die gleiche, aber die Tabelle der möglichen Ausgänge wird länger. Wort Nr. 3 Subst. i

2 Subst,

1

2

3

Wahrscheinlichkeit

S

s s s s

s s s s

0,1789 • 0,1789 • 0,1789 0,1789 • 0,1789 • 0,8211 0,1789 •• 0,8211 • 0,1789 0,8211 •0,1789' • 0,1789

= 0,0057 = 0,02631 = 0,0263 = 0,0263.

's s s s

s s s s

0,1789 •• 0,8211 • 0,8211 0,8211 • 0,1789 • 0,8211 0,8211 •0,8211 • 0,1789 0,8211 • 0,8211 • 0,8211

= O^OÖ1 = 0,1206 = 0,1206, = 0,5536

S

S

|s ls

1 Subst.

s

ls s

0 Subst,

1,0000

0,0057 0,0789

0,3618 0,5536

lToööö

Bevor wir diese Überlegung fortsetzen, wollen wir die im Verlauf dieses Kapitels aufgestellten Grundregeln zusammenfassen: Wahrscheinlichkeit von A und B

von A oder B

A und B schließen sich aus (unmöglich) 0 Addition P(A) + P(B)

A und B sind unabhängig Multiplikation: P(A) • P(B) Multiplikation, dann Addition (oder Subtraktion): P(A und B) + P(A und B) + P(Ä und B) oder: 1 — P(Ä und B)

6. Die BinomialVerteilung Begründung Wir sind hier bei einem Gesetz angelangt, das in der Statistik von Lexik und Syntax eine große Rolle spielt und im weiteren Verlauf zu mehreren Schlußfolgerungen führt. Die Operation, die wir soeben beschrieben haben und die darin besteht, ein Wort unter Beachtung aller möglichen Vorsichtsmaßnahmen Ausgänge interessiert. So ist es für die Berechnung der Gesamtmenge der in einem Fragment vorhandenen Vokabeln ohne Berücksichtigung ihrer Häufigkeit (weitaus!) bequemer, die Gesamtmenge der darin fehlenden zu berechnen (S. 2. Teil, Kap. 10).

46

aus einem T e x t zu ermitteln, damit die Auswahl ja zufällig erfolgt, mag dem Sprachwissenschaftler wie ein nichtiges und sogar ziemlich verdächtiges Spiel erscheinen; denn er weiß sehr wohl, d a ß den T e x t nicht n u r die N Wörter ausmachen, die ihn konstituieren und die der I n d e x in alphabetischer Reihenfolge neu anordnet, sondern er k e n n t auch die Bedeutung der Stellung dieser Wörter, einer Stellung, ohne die der Text keinen Sinn mehr h a t . N u n gestattet es aber gerade die Untersuchung eines auf der Wahrscheinlichkeitsrechnung beruhenden theoretischen Modells, den Einfluß von Sprachzwang oder Stilwahl auf die Aufeinanderfolge der grammatischen Kategorien genau zu bestimmen. Diese Frage wird später unter Berücksichtigung weiterer, noch zu behandelnder Begriffe wieder aufgenommen werden. Wir setzen also unsere Berechnung fort, die sich auf eine theoretische Situation stützt, auf einen hypothetischen Text, der nicht als Folge von Wörtern, sondern als Masse betrachtet wird, und auf das mehr oder weniger imaginäre Experiment, bei dem Wörter auf Grund des Zufalls ermittelt und die sich dabei ergebenden Resultate untersucht werden. Suche nach einer Formel Soll man aber weiter immer längere Tabellen aufstellen, um gleichsam empirisch zu bestimmen, was eintreten kann, wenn m a n aus dem Text Folgen von 4, 5, . . ., n Wörtern herauszieht? E s ist besser, eine allgemeine Formel zu finden, die f ü r eine beliebige Anzahl von Wörtern, das heißt von Ziehungen gültig ist. Sehen wir uns dazu an, was bei der Auswahl von zwei und drei Wörtern festgestellt wurde. Bei der vollständigen Erfassung der möglichen Ergebnisse fanden wir vier Möglichkeiten f ü r zwei Wörter u n d acht f ü r drei Wörter. Da wir f ü r jeden Versuch nur zwei mögliche Ausgänge betrachten: „Substantiv" und „Nicht-Substantiv", das heißt 8 und S, sieht man, d a ß der erste Versuch zwei Ergebnisse, die zwei ersten 2.2, die drei ersten 2.2.2 und so weiter erbringen können; mit anderen Worten, die Anzahl der Ergebnisse nach n Versuchen beträgt 2, n-mal mit sich selbst multipliziert, also 2n (2 hoch n). E s sei hier daran erinnert, daß a{) = aja = 1 a1 = a a2 = a • a a3 = a • a • a usw. 4*

47

Demnach sind vorauszusehen: f ü r 1 Wort 2 mögliche Ergebnisse 2 Wörter 4 8 3 4 16 5 32 usw. 1 . In unserem Beispiel „Substantiv" oder „Nicht-Substantiv" läßt sich das schematisch durch folgenden (umgekehrten) „Baum" darstellen:

Die 2" Ergebnisse stellen ebensoviel Wege dar, die man einschlagen kann, um von dem Ausgangspunkt 0 des Schemas zu einem der Äste zu gelangen, die in der n-ten Zeile enden 2 . Aber man sieht, daß bei Vernachlässigung der Reihenfolge, in der die Zeichen S und S auf diesem Wege auftreten, und bei der reinen Feststellung der Zahl der „Erfolge" (von Substantiven S) oder der „Mißerfolge" (Nicht-Substantive, S) manche der möglichen Ergebnisse äquivalent werden. Bei zwei Wörtern konnten wir SS und SS als äquivalent ansehen; bei drei Wörtern können wir SSS, SSS und SSS einander gleichstellen. Insgesamt ist das dieselbe Unterscheidung, die auf S. 34 zwischen den Variationen, bei denen die Reihenfolge der Elemente als distinktiv gilt, und den Kombinationen, bei denen sie außer Betracht bleibt, gemacht wurde. Man stellt dann fest, daß es f ü r n Ziehungen 2" mögliche Ergebnisse gibt, aber nur (n + 1) unterschiedliche Ergebnisse bezüglich der Anzahl der „Erfolge". 1

Also beträgt die Anzahl der Ausgänge bei Betrachtung nur zweier Ergebnisse nach n Versuchen 2". Wenn man eine größere Zahl von Ergebnissen in Erwägung zöge (das Wort ist ein Substantiv, eine Verbform, ein Adjektiv, . . .), bekäme man offensichtlich für k Möglichkeiten kn Ausgänge. Wir befänden uns nicht mehr im Bereich der Binomialverteilung, sondern im Bereich der Multinomialverteilung, die hier nicht behandelt werden soll. - Jedes „Ergebnis" wird aus der Zeichenfolge gebildet, die vom Ausgangspunkt bis zum Ende eines der Äste führt. Es gibt also ebenso viele Ergebnisse wie Zeichen auf der Zeile, mit der die Zeichnung abgebrochen wurde (hier 16).

48

Zählung Sehen wir uns näher an, wie m a n von 2 " zu n -j- 1 k o m m t , indem m a n die äquivalenten Ergebnisse zusammenfaßt, immer in der Absicht, unsere empirischen Ergebnisse zu verallgemeinern u n d zu einer allgemeinen Formel zu gelangen. Nehmen wir dazu wieder die f ü r zwei und drei Wörter bereits aufgestellten Tabellen und stellen wir uns die vor, die m a n f ü r die folgenden Zahlen noch aufstellen könnte. Wie groß n, die Zahl der gezogenen Wörter, auch sei, s t e t s g i b t es zwei Ergebnisse, die kein Äquivalent haben, d a sie homogen s i n d : d a s eine, bei dem jede Ziehung ein S u b s t a n t i v gebracht h a t (man h a t ra-mal S und 0-mal S), und d a s andere, bei d e m kein S u b s t a n t i v herausgekommen ist (w-mal S und 0-mal S). E s sind diejenigen, die wir an die Spitze und an d a s E n d e unserer Tabellen u n d a u f der graphischen Darstellung als B a u m an die beiden Seiten der Zeichnung gestellt haben. S o d a n n gibt es die Ergebnisse, bei denen ein einziges S oder ein einziges S a u f t r i t t ; wieviele gibt es davon ? Ebensoviel, wie es Möglichkeiten gibt, d a s einzige S (oder S) in einer Reihe von n Elementen unterzubringen, wobei dieses Zeichen den 1., 2 w-ten P l a t z einnehmen kann. Diese Überlegung läßt sich mühelos a u f die anderen F ä l l e übertragen. Wenn 2, 3, . . ., h S u b s t a n t i v e (oder eine gleiche Anzahl von N i c h t - S u b s t a n t i v e n ) vorhanden sind, erhält m a n ebensoviel äquivalente Ergebnisse, wie es Möglichkeiten gibt, 2, 3, . . ., k Gegenstände in einer Reihe von n Gegenständen 1 2 3 4 5 6 zu verteilen, d a s heißt Illug g strieren wir d a s durch ein konkretes g g Beispiel, etwa Reihen v o n sechs S g Wörtern, die zwei S u b s t a n t i v e entS S halten. S S Wir finden 15 Möglichkeiten, die S S beiden S unterzubringen; d a s heißt, s s d a s E r g e b n i s „ 2 S u b s t a n t i v e und S S 4 N i c h t - S u b s t a n t i v e " konnte in g g g g

k

g

g S

g S

' 1 5 Varianten erzielt werden (und d a s gilt auch f ü r 4 S u b s t a n t i v e g und 2 N i c h t - S u b s t a n t i v e ) . Statt es empirisch zu finden, konnte S dieses E r g e b n i s auch berechnet S werden: 49

J e t z t weiß man also, daß f ü r eine Reihe von sechs Wörtern die Zahl der Ergebnisse, die 0, 1 , 2 , 3, 4, 5 oder 6 Substantive enthalten, C» + CJ + CS + CS + et + CJ + CS = 2« und in Zahlen werten: 1 + 6 + 15 + 20 + 15 + 6 + 1 = 64 beträgt, was nichts anderes ist als die sechste Zeile des Pascalschen Dreiecks. Man kann also verallgemeinern und die Formel für die Anzahl der Ergebnisse aufstellen, die nach n Ziehungen 0, 1,2, . . ., n — 1, n Erfolge enthalten: CS + C i + CZ • • • e r 1 + c - = 2«. Wahrscheinlichkeiten Suchen wir jetzt die Wahrscheinlichkeit, die zu jeder dieser Erfolgszahlen gehört. I n unserem Beispiel hatten wir f ü r P(S) den Wert 0,1789 und für P(S) den Komplementärwert 0,8211. Wir ersetzen diese arithmetischen Werte durch algebraische Zeichen; üblicherweise bezeichnet man die Wahrscheinlichkeit für das „günstige" Ereignis, den „Erfolg", mit p, die komplementäre Wahrscheinlichkeit mit q. Daraus folgt: q = i — p,

p + q=

l.

Nimmt man wieder das Beispiel der Auswahl zweier Wörter, so findet man folgende gemeinsame Wahrscheinlichkeiten:

2 Substantive 1 Substantiv 0 Substantiv

4 mögliche 3 unterschiedliche Ergebnisse Ergebnisse SS p •p oder p\SS SS

P q-pj q •q

2pq 2

q

Die Wahrscheinlichkeit für die drei unterschiedlichen Ergebnisse (bei denen nur die Anzahl der Erfolge berücksichtigt wird) beträgt jeweils: pl + 2pq + q1, das heißt, man erhält sie durch Entwicklung des Ausdrucks (p + qP = + 2pq + q*, mit anderen Worten durch das Quadrat des Binoms. 50

Bei drei Wörtern findet man ebenso: (p + q) 3 = p3 + 3p*q + 3pq* + g3, wobei die vier Glieder (n + 1) die Wahrscheinlichkeit ausdrücken, 3, 2, 1 oder 0 Substantive zu erhalten. Aufstellung

der Formel

Es handelt sich um die Binomialformel oder Newtonsehe Formel. Sie wird gebildet aus der in die w-te Potenz erhobenen Summe von p und q, die laut Definition gleich 1 ist. Ihre Entwicklung umfaßt n + 1 Glieder, deren Summe gleich 1 ist. Wenn sie auch ziemlich abschreckend aussieht, ist sie doch sehr leicht zu beherrschen. Es geht nicht darum, sie auswendig zu lernen, sondern zu verstehen, wie man sie aufstellt, was für jeden, der die Argumentation auf den voraufgehenden Seiten verfolgt hat, einfach ist. I n dem ersten Glied steht p in der Potenz n, im zweiten in der Potenz 7i — 1 und so weiter bis zum letzten, wo es in der Potenz 0 steht, wodurch es gleich 1 wird, welches auch sein Wert ist. q steht im ersten Glied in der Potenz 0 und wird damit gleich 1; in den folgenden Gliedern kommt es in die Potenz 1, dann 2 und so weiter und steigt an bis zum letzten Glied, wo es in der Potenz n steht. Außerdem besitzt jedes Glied einen Koeffizienten, der eine der Zahlen aus der w-ten Zeile des Pascalschen Dreiecks darstellt und die Zahl der Möglichkeiten für das betreffende Ergebnis angibt. Die vollständige Formel lautet also: (P + +

qY =

cfry-

c > y 2

+

+

c ; - y - y

c > y - '

+

+

c°nPy.

c j-'V'V • ••

Man kürzt sie, indem man die Faktoren mit dem Wert 1 ausläßt (C°, CT, p°,q°) und e i oder C ^ 1 durch n ersetzt: (p + q)n = pn + ntf^q Benutzung

+ Cf-'VY

1- Clp2qn~2 + npqn~l + qn.

der Formel

Wozu soll uns diese Formel dienen? Man stellt sich eine Reihe von n ähnlichen und unabhängigen Versuchen vor, von denen jeder zwei Ausgänge haben kann: entweder einen „Erfolg", dessen Wahrscheinlichkeit bei jedem Versuch gleich p ist, oder einen „Mißerfolg" mit der Wahrscheinlichkeit q. So bietet das Glied pk die Wahrscheinlichkeit dafür, -51

daß die Zahl der Erfolge genau gleich k ist (und nicht „mindestens k", was die Summierung aller Glieder bis zu pk erfordern würde)3. Jeder der Werte, die man k geben kann (die aufeinander folgenden ganzen Zahlen von 0 bis n), wird als ein „Ereignis" betrachtet und schließt die anderen Werte aus. Die Summe der Wahrscheinlichkeiten ist also gleich 1 (man erinnere sich daran, daß p +