233 11 24MB
German Pages 341 [352] Year 1970
HASELOFF — HOFFMANN KLEINES LEHRBUCH DER
STATISTIK
KLEINES LEHRBUCH DER STATISTIK Für Naturwissenschaft und Technik, Psychologie, Sozialforschung und Wirtschaft von Prof. Dr. med. OTTO W . HASELOFF und D i p L - P s y c h . HANS.-J. HOFFMAJSTN
4., neubearbeitete und erweiterte Auflage, mit 59 Figuren und 99 Tabellen, einem Anhang statistischer Arbeitstabellen und Übungsaufgaben und 1 Ausschlagtafel
WALTER
DE
GRUYTER&CO.
vormals G. J . Göschen'sche Verlagahandlung — J . Guttentag, Verlagsbuchhandlung Georg Reimer — Karl J . Trübner — Veit & Comp.
B E R L I N 1970
1. Auflage 1960 2. Auflage 1965 3. Auflage 1968 4. Auflage 1970
© Copyright 1960,1965,1968, 1970 by Walter de Gruyter & Co., vormals G. J . GtSachen'sche Verlagshandlung—J. Gattentag, Verlagsbuchhandlung — Georg Reimer — Karl J . Trübner— Veit Min. Für diesen Fall muß die 1. Ableitung 0 sein: y' = 2 Z(x — x) = 0. Lösen wir die Klammer auf, so nimmt die Gleichung folgende Gestalt an: 2)
2Zx — 2Zx = 0.
4*
52
Statistische Beschreibung
Die Berechnung des arithmetischen Mittels x erfolgt also durch die Ermittlung der Summe aller Beobachtungen, geteilt durch die Anzahl dieser Beobachtungen. Der griechische Buchstabe E (sigma) bedeutet „Summe von". E x ist also eine verkürzte Schreibweise für „Summe aller xWerte". Wenn wir das arithmetische Mittel der 28 Fälle des Beispiels der Tabelle 7 bilden wollen, ergibt Formel (7) 8 + 7 + 10 + 6 + 28
•••+7 + 9
214 28
= 7,64
Liegen viele Beobachtungen vor und sind diese bereits in eine Häufigkeitstabelle eingetragen, so kann man das arithmetische Mittel schneller errechnen, indem man den Umstand nutzt, daß in der Häufigkeitstabelle Beobachtungen gleichen Variablewertes zusammengefaßt sind. Im obenstehenden Beispiel erhält man E x als Summe aus 28 Werten. In Tabelle 8, in der wieder die in einer Rechenprobe errechneten Punktzahlen mitgeteilt werden, sind zwei Werte der Größe x = 5, vier der Größe x = 6 usw. zusammengefaßt. Die Summe der 28 Werte kann daher aus der Summe von 2 x 5, 4 x 6 usw. ermittelt werden. Diese Berechnung geschieht in der Tabelle am leichtesten dadurch, daß man in jeder Zeile / • x bildet, d. h. die Häufigkeitszahl mit dem entsprechenden «-Wert multipliziert. Tabelle 14
(1)
(2)
(3)
X
/
10 9 8 7 6 5
3 5 7 7 4 2
f-x 30 45 56 49 24 10
28
214 =
214
* = ~28~ =
7 64
'
Zfx
Da wir die Häufigkeit der Fälle, in denen eine jeweils bestimmte Punktzahl erreicht wurde, als Zwischenglied für die Berechnung Teilen wir beide Seiten der Gleichung durch 2 und setzen wir gleichzeitig £ x = n • x, so ergibt sich: S x — n • x = 0 Ziehen wir auf beiden Seiten 2 x ab, so gelangen wir zu: —
n•x =
—
Ex
Teilen wir schließlich durch — n, so erhalten wir
-—— =
—n Hieraus ergibt sich die abzuleitende Berechnungsformel:
- E x
—
—n
Mittelwerte
53
benutzen, erhält die rechnerisch zweckmäßigere Formel für das arithmetische Mittel folgendes Aussehen: Zf-x
(8)
Die gleiche Methode kann auch bei bereits klassifiziertem Material eingesetzt werden. Als «-Wert verwendet man dabei die Klassenmitte der jeweiligen Klasse. Tabelle 15, die die Häufigkeitsverteilung von Intelligenzquotienten beschreibt, gibt hierzu ein Beispiel: Tabelle 15
(1)
(2)
(3)
IQ
Klassenmitte
/
126—130 121—125 116—120 111—115 106—110 101—105 96—100 91—95 86—90 81—85 76—80 71—75
128 123 118 113 108 103 98 93 88 83 78 73
2 3 5 5 7 11 12 9 7 8 4 3
256 369 590 565 756 1133 1176 837 616 664 312 219
76
7493
t n
t Zf • x
(4) f'X
Tabelle 15 zeigt im übrigen, daß die hier untersuchte Menschengruppe eine der Gesamtbevölkerung gegenüber etwas verminderte Intelligenz aufweist, da 98,6 unter 100 bleibt, und dies obgleich 15 Versuchspersonen (Vpn) der vergleichsweise kleinen Probandengruppe deutlich überdurchschnittliche Intelligenzquotienten aufweisen. Die an Tabelle 15 gezeigte Berechnungsmethode erweist sich als sehr umständlich, sobald eine große Zahl von Beobachtungen vorliegt. Man bedient sich dann statt dessen mit Vorteil einer provisorischen Skala, wie dies in Kapitel 6 noch näher besprochen wird. Bei dieser Methode spielt der sogenannte geschätzte Mittelwert eine wichtige Rolle. Nicht selten kommt es vor, daß mehrere Beobachtungsreihen mit unterschiedlichen Mittelwerten vorliegen, die einer zusammenfassenden Betrachtimg unterzogen werden sollen. Hier hilft uns das
Statistische Besehreibung
54
sog. gewogene Mittel. Dieses wird der Tatsache gerecht, daß die zur Zusammenfassung anstehenden Mittelwerte aus unterschiedlich großen Beobachtungsreihen stammen. Die Berechnung des gewogenen Mittels erfolgt nach der folgenden Formel: • x1 + nt • +. .. + nk • xk (9) %+ + + »t Hier bedeutet k die Anzahl der Beobachtungsreihen, die von 1 bis k numeriert wurden. Jeder Mittelwert der am Gesamtergebnis beteiligten Beobachtungsreihen fällt in dem Maße ins Gewicht, in dem die jeweilige Beobachtungsreihe einzelne Fälle oder Beobachtungen umfaßt. Aus diesem Grunde wird jeder Mittelwert x t mit der zugehörigen Anzahl der Beobachtungen multipliziert. Die entstehenden Produkte sind dann zu addieren und durch die zusammengefaßte Anzahl aller Einzelbeobachtungen zu dividieren3). Beispiel: Unter den Interessenten für einen neuen Kraftwagen befanden sich sowohl Autobesitzer wie auch Nichtautobesitzer. Da es sich um ein relativ aufwendiges Fahrzeug handelte, sollte ermittelt werden, wie sich die bekundete Kaufneigung zur Kaufkraft verhielt. Bei jedem einzelnen Interessenten beider Teilgruppen war hierzu das Jahreseinkommen ermittelt worden. Dabei ergab sich für die Autobesitzer ein durchschnittliches Jahreseinkommen von 11.692,86 DM, dem bei den Nichtautobesitzern ein Durchschnittseinkommen von 8.945,65 DM gegenüberstand. Der Kreis der befragten Interessenten für den neuen Kraftwagen setzte sich aus 98 Autobesitzern und 46 Nichtautobesitzern zusammen. Demnach berechnet sich gemäß Formel (9) das durchschnittliche Jahreseinkommen aller befragten Interessenten in folgender Weise: x'
98 • 11692,86 + 46 • 8945,65 98 + 46 1 145 900,28 + 411499,90 _ 10815,28 DM 144
Das gewogene Mittel der Angehörigen des gesamten Befragtenkreises liegt also um etwa 500,— DM höher als dies ohne Berücksichtigung des Umfangs der Teilgruppen der Fall gewesen wäre. Liegt in einer Verteilung ein Teil der beobachteten Werte sehr weit auseinander, während andere Werte dicht beieinander stehen, dann kann das arithmetische Mittel ein Bild des Materials geben, 3 ) Genauer betrachtet handelt es sich allerdings darum, daß jeder Mittelwert an Stelle der Fälle seiner Beobachtungsreihe benutzt wird
Durch diese Substitution werden im Zähler alle Fälle quasi neu addiert. Danach wird der (gewogene) Gesamtmittelwert bestimmt.
Mittelwerte
55
das zu ausgeprägten Fehler-Wartungen in bezug auf den Einzelfall füliren kann. Ein viel zitiertes Beispiel hierfür ist die Einkommensverteilung in einem Lande. Das Einkommen der meisten Arbeitnehmer liegt in Deutschland unter 10000,— DM pro Jahr. Es gibt aber doch viele Arbeitnehmer, die ein höheres Einkommen haben, und selbst Einkommen über 100000,— DM pro J a h r kommen vereinzelt vor. Diese letzteren bekämen ein allzu großes Gewicht, wenn das Durchschnittseinkommen mit Hilfe des arithmetischen Mittels berechnet werden würde. Ein zutreffenderes Bild gibt in diesem Falle der Zentralwert Z, der in der angelsächsischen Literatur auch Median genannt wird. E r gibt denjenigen beobachteten Wert an, der die Verteilung in zwei gleich große Hälften teilt, so daß jeder Teil 50% aller Fälle enthält. I m Beispiel der Einkommensverteilung bezeichnet der Zentralwert also die Grenze zwischen der Hälfte der Personen mit dem höheren und der Hälfte mit dem niedrigeren Einkommen. Der Zentralwert der Einkommen ist hier kleiner als das arithmetische Mittel der Einkommen. Bei einer ungeraden Anzahl von ihrer Größe nach geordneten Beobachtungen, beispielsweise 16, 19, 23, 32, 36 repräsentiert der Wert der genau in der Mitte stehenden Beobachtung, d. i. hier 23, den Zentralwert. Liegt dagegen eine gerade Anzahl von ihrem Wert nach geordneten Beobachtungen vor, z. B. 10, 13, 15, 18, 23, 28, dann ist der Zentralwert gleich dem arithmetischen Mittel der beiden mittelsten Werte, hier also 16,5. Die Bestimmung des Zentralwertes als eines wichtigen Mittelwertes wird etwas umständlicher, wenn die Werte in einer Häufigkeitstabelle geordnet sind. Als angenäherten Zentralwert kann man die Klassen mitte derjenigen Klasse nehmen, in welcher der oder die mittelsten Fälle liegen. I m Beispiel der Tabelle 16, die 28 Beobachtungen enthält, sind die vierzehnte und fünfzehnte Beobachtung die beiden mittelsten. Diese liegen in Klasse x = 8. Also ist der Zentralwert — gemäß der beiden wichtigsten von uns oben mitgeteilten Konventionen zu seiner Bestimmung — gleich 8. Will man den Zentralwert genauer berechnen, muß m a n denjenigen P u n k t in der Klasse x = 8 bestimmen, der die Grenze zwischen der vierzehnten und fünfzehnten Beobachtung darstellt. Hierzu sind die kumulativen Häufigkeiten erforderlich, die wir der Tabelle 16, die weiterhin die statistische Beschreibung der Rechenprobe (Tab. 7) behandelt, entnehmen können.
Statistische Beschreibung
56 Tabelle 16
(1) (1)
(2) (2)
(3)
I n unserem Beispiel haben dreizehn Versuchspersonen X / cf (Vpn) die Punktzahl 7 oder 3 28 10 weniger erreicht. In Klasse 9 5 25 x = 8 befinden sich weitere 7 8 7 20 Beobachtungswerte. Der Zen7 7 13 4 6 6 tralwert liegt an der Grenze 2 5 2 zwischen dem niedrigsten von n = 28 ihnen und den sechs übrigen Werten. Die Klasse x = 8 erstreckt sich, wie unten in Figur 10 gezeigt wird, vom Wert 7,5, also der unteren Klassengrenze, bis zur oberen Grenze bei 8,5. Die sieben Beobachtungen nehmen jeweils
der Strecke von
7,5 bis 8,5 ein. Daher müssen wir zum Wert der unteren Klassengrenze -i- hinzuzählen, um zum Zentralwert zu gelangen.
Anzahl der Beobachtungen unter 7,5 = 13 Vpn 6,5
7,5
Anzahl der Beobachtungen zwischen 7,5 und 8,5 = 7 Vpn
Fig. 10
Anzahl der Beobachtungen über 8,5 = 8 Vpn 8,5
9,5
Wie die Figur 10 veranschaulicht, muß hier zur Bestimmung des Zentralwertes die Klasse um denjenigen Variablewert, in dem der mittelste Fall liegt, so aufgeteilt werden, daß die Teilung dem Verhältnis der über dem Zentralwert liegenden zu der unter ihm liegenden Anzahl von Fällen in dieser Klasse entspricht. In unserem Beispiel liegt der mittelste Fall beim Variablewert 8, also in der Klasse 7,5 bis 8,5. In dieser Klasse befinden sich insgesamt 7 Fälle. Davon liegt 1 Fall unter und 6 Fälle über der vorzunehmenden Teilung, da (13 + 1) und (6 + 8) der Hälftung unserer Beobachtungsreihe entsprechen. Demnach können wir hier den Zentralwert auf folgende Weise berechnen Z = 7,5 + y = 7,64
Das arithmetische Mittel in diesem Beispiel ist hier zufällig ebenfalls 7,64. Eine solche Übereinstimmung von Zentralwert und arithmetischem Mittel kommt unter anderem dann zustande, wenn die Verteilung symmetrisch ist. Die größte praktische Bedeutung in der heutigen Statistik hat das arithmetische Mittel (Mittelwert). Seltener findet der Zentral-
Mittelwerte
57
wert noch Verwendung. Er hat seine besondere Bedeutung für die Darstellung der Haupttendenz diskontinuierlicher Variabler. Früher wurde häufiger der sogenannte „Gipfelwert" (G; engl, mode) errechnet, der denjenigen Wert in einer Verteilung repräsentiert, auf den die meisten Fälle oder Beobachtungen entfallen. Dieser Gipfelwert ist bei in Klassen aufgeteilten kontinuierlichen Variablen mit Vorsicht zu verwenden, da dann sein Wert von der willkürlichen Wahl der Klasseneinteilung abhängig ist. Interessant ist schließlich noch, daß die den Schwerpunkt von Verteilungen beschreibenden Maßgrößen x, Z und G meist dicht beieinander stehen. Im Falle einer symmetrischen Verteilung, vor allem der Normalverteilung (Kap. 7) stimmen ihre Werte genau überein. Je „schiefer" jedoch eine Verteilung ist, um so größer sind die Unterschiede zwischen den verschiedenen Mittelwerten. Und zwar ist der Gipfelwert meist am stärksten von der Schiefe betroffen, während das arithmetische Mittel am unempfindlichsten gegen die Lage des häufigsten Wertes ist. Beispiel: In einer Befragung wurde nach der Anzahl der Illustrierten gefragt, die in der letzten Woche gelesen worden sind. x ist also die Anzahl der wöchentlich gelesenen Illustrierten, / gibt die Anzahl der Befragten an, die die jeweilige Lesehäufigkeit von sich behaupteten. Tabelle 17
(1)
(2)
(3)
X
/
x-f
0
8 23 28 17 11 8 5 7 3 2 7
0 23 56 51 44 40 30 49 24 18 70
1
2 3 4 5 6 7 8 9 10
n
= 119
405
Dabei sind: O = 2 (die meisten Befragten lesen zwei Illustrierte pro Woche) Z = 2,56 (der 60. Fall = 2,5 + ^ = 2,56) 405
58
Statistische Beschreibung
Die Aussagefunktion der verschiedenen Mittelwerte können wir uns verdeutlichen, wenn wir die in Tabelle 17 wiedergegebene Verteilung anschaulich darstellen: n
—
20-
10-
—1__
0
1
2 3 i H t/t ^t
5
S
7
8
9
t t x (wöchentlichgelesene Illustriertenanzohl)
Fig. 11 Noch deutlicher wird die unterschiedliche Lage der drei Mittelwerte, wenn wir die Verteilung der Illustriertenleser auf die Stufen der Leseaktivitäten (gemessen an der Anzahl der wöchentlich gelesenen Illustrierten) in einem Häufigkeitspolygon darstellen (Figur 12):
fit/V Fig. 12 Die hier diskutierten Mittelwerte werden häufig in der Literatur unter der abkürzenden Bezeichnung „Statistika" zusammengefaßt.
KAPITEL 5
Streuungsmaße Vergleichen wir zwei Schulklassen hinsichtlich ihrer Schulerfolge in einem bestimmten Fach. Dabei können sich trotz ungefähr gleicher Durchschnittszensur die Zensurenverteilungen in den beiden Gruppen dennoch stark unterscheiden. In der einen Klasse hat beispielsweise die Mehrzahl der Schüler die gleiche Note erzielt, während in der Vergleichsklasse sehr unterschiedliche Zensuren gegeben wurden. Die Zensuren konzentrieren sich also in der einen Klasse stärker um den Mittelwert als in der anderen. In diesem Falle befriedigt es uns nicht, wenn wir nur den Mittelwert des vorliegenden Materials kennen. In unserem Beispiel würde es sich darum handeln, zu beschreiben, in welcher Dichte in den beiden Klassen die Zensuren in dem fraglichen Fach um das arithmetische Mittel streuen: Wir wollen die Streuung der verschiedenen Beobachtungen um den Mittelwert feststellen1). Um diesen Sachverhalt zahlenmäßig beschreiben zu können, benötigt man ein Streuungsmaß. Das einfachste Maß für die Streuung ist die Variationsbreite (engl.: ränge). Diese gibt an, wie groß der Abstand zwischen dem höchsten und dem niedrigsten Wert der Verteilung ist. Im Beispiel der Tabelle 7 war der höchste Wert 10 und der niedrigste 5. Die Variationsbreite ist also 10 — 5 = 5. Sicher läßt sich die Variationsbreite auf diese Weise leicht berechnen ; nachteilig ist dabei jedoch, daß das so ermittelte Maß allzusehr von den extremen Werten der Verteilung abhängt. Ein Streuungsmaß, das diese Schwäche nicht aufweist, ist der halbe Quartilahntand Q (engl.: semiinterquartile ränge)2). Q ist definiert 1) D. h. wir wollen etwas darüber erfahren, wie unterschiedlich dicht sich die beobachteten Werte um den aus ihnen berechneten Mittelwert gruppieren. 2 ) Die Fälle jeder Beobachtungsreihe lassen sich der Größe nach ordnen. Teilen wir die so gewonnene Reihe in vier gleiche Abschnitte auf, so enthält jeder Abschnitt 25% der Fälle. Ein so definierter Abschnitt wird ein Quartil genannt. Er ist der praktisch wichtigste Sonderfall der sogenannten Quantile. Quantile zerlegen die Gesamtzahl der Fälle in eine gegebene Anzahl gleicher Teile. Bei Quintilen sind es 5, bei Dezilen 10 und bei Perzentilen 100 gleiche Teile.
60
Statistische Beschreibung. Streuungsmaße
als die Hälfte desjenigen Bereiches einer Verteilung, innerhalb dessen die mittelsten 5 0 % der Beobachtungen liegen. Dabei wird der halbe Quartilabstand auf folgende Weise berechnet : Zuerst bestimmt man die Lage des oberen Quartiis, das oft auch 75. Perzentil (P 7 5 ) genannt wird. Es gibt an, wo die Grenze zwischen denjenigen 2 5 % der Beobachtungen mit den höchsten Meßwerten und den restlichen 7 5 % Beobachtungen mit den niedrigeren Meßwerten liegt. Danach wird die Lage des unteren Quartiis in umgekehrter Weise bestimmt (-Pas) - Dieses 25. Perzentil bezeichnet die Grenze zwischen den oberen 7 5 % und den niedrigsten 2 5 % der Beobachtungen. Der halbe Quartilabstand ist dann die Hälfte der Differenz zwischen diesen beiden Werten oder — in einer Formel ausgedrückt — Q=
P , s
7Pa5
(10)
Im Beispiel der Tabelle 16 ist das obere Quartil gleich 8,70 und das untere gleich 6,64. Wenn die Anzahl der Fälle n nicht durch 4 teilbar ist, also die Perzentile nicht genau zwischen zwei Fällen liegen, ist es notwendig, ihre Lage auf die gleiche Weise zu berechnen wie den Zentralwert. In unserem Beispiel der Tabelle 16 trennt das obere Quartil die 28 Beobachtungen zwischen der 21. und der 22. Diese Grenze ist gleich 8,5 + ^jr = 8,7. Die Grenze des unteren Quartiis liegt dann zwischen der 7. und 8. Beobachtung. Diese Grenze ist gleich 6,5 +
= 6,64. Der halbe Quartilabstand ist also
Ein früher häufig verwendetes Streuungsmaß ist die durchschnittliche Abweichung DA (engl.: average deviation) vom Mittelwert. Dieses Maß errechnet sich als das arithmetische Mittel aller Abstände der einzelnen Fälle von ihrem arithmetischen Mittel. Bei dieser Berechnung ergibt sich die Schwierigkeit, daß etwa die Hälfte aller Abweichungen negativ sind. Dies kann durch Zeichenänderung 3 ) korrigiert werden. Die Formel lautet deshalb:
8 ) Die zwei lotrechten Striche in | x — x I bedeuten, daß das Ergebnis der Subtraktion ohne Rücksicht auf das Vorzeichen weiter verwandt werden soll. In unserem Falle müssen also die Subtraktionsergebnisse ohne Rücksicht auf ihre Vorzeichen addiert und dann durch n dividiert werden.
61
Varianz
Varianz Der Wert der durchschnittlichen Abweichung für die statistische Arbeit wird dadurch eingeschränkt, daß eine Formel mit Absolutzeichen (durch die Beseitigung der Vorzeichen) in weiterreichenden statistischen Berechnungen nicht verwendbar bleibt. Deshalb ist es vorteilhafter als ein Maß für die Streuung die mittlere quadratische Abweichung zu verwenden. Diese mittlere quadratische Abweichung wird in der Statistik Varianz (s2) genannt. Sie berechnet sich nach der Formel: _
bzw. bei einer größeren Zahl von Fällen
£ (x x)2 n — 1
gt
_
x)2 % f (x n — 1
'
Da besonders in der Sozialstatistik (zum Beispiel der Vergleich der Einkommensverhältnisse zweier Gruppen) oder in der Biologie (z. B . Vergleich der Wirkimg von Medikamenten bei mehreren Gruppen von Versuchstieren) sehr häufig Streuungen verglichen werden müssen, ist als ein wichtiger Zweig der Statistik die Varianzanalyse (vgl. Kap. 18) entstanden. Beispiel: In einem Experiment zur Intensitätsanalyse von Vorurteilen wurde u. a. Studenten unterschiedlicher Fachrichtungen eine Reihe von 20 häufig anzutreffenden Vorurteilen in Gestalt von Sprichwörtern vorgelegt. Die Vpn wurden aufgefordert, jedes dieser Sprichwörter entweder als richtig oder als falsch zu beurteilen. I n der untenstehenden Tabelle 18 wurden in die x-Spalte die Anzahl der jeweils akzeptierten Vorurteile sowie in die /-Spalte die Häufigkeit der auf sie jeweils entfallenden Vpn eingetragen. In den nachfolgenden vier Spalten folgt die Berechnung der Varianz gemäß der Formel (12). Tabelle 18
(1)
(2)
X
/
6 7 8 9 10 11 12 13 14 15
1 3 3 8 17 26 18 11 5 1 n
Sfx
=
(3) f-x
6 21 24 72 170 286 216 143 70 15
93
_ 1023 93
(4) (x—x)
—5 —4 —3 —2 —1 0 1 2 3 4
(5) {x—xf
(6) j{x-x)*
25 48 27 32 17 0 18 44 45 16
25 16 9 4 1 0 1 4 9 16
272
1023 =
u
a 2 =
£/(*-*)» ii — 1
=
272_2)96 92
62
Statistische Beschreibung. Streuungsmaße
Die Varianz beträgt in unserem Beispiel also 2,96. Diese Zahl besagt für sich allein noch nichts. Vielmehr ist die Varianz vor allem für Vergleiche wertvoll. In unserem Beispiel könnte es etwa um die Klärung der Frage gehen, ob die Tendenzen zur Akzeptierung von Vorurteilen bei Studenten naturwissenschaftlicher Fächer ihrem Ausprägungsgrad nach einheitlicher sind, als bei Studenten geisteswissenschaftlicher Fächer. Wollen wir dagegen über die Streuung allein in dieser speziellen Untersuchung genaueres wissen, so müssen wir uns eines anderen Streuungsmaßes bedienen: der Standardabweichung. Standardabweichung Die Varianz ist, ohne daß sie mit anderen Varianzen verglichen wird, kein geeignetes Maß zur direkten Schätzung der Streuung, da sie nicht die einfachen Abweichungen vom Mittelwert verarbeitet, sondern deren Quadrate. Dies müssen wir jetzt rückgängig machen, indem wir die Wurzel aus s 2 ziehen. Wir gelangen auf diesem Wege zu dem heute gebräuchlichsten Streuungsmaß, der Standardabweichung s:
r
2(x
*n
— —
xY
11
(13)
Die Standardabweichung ist also gleich dem absoluten Wert der Wurzel aus der Varianz4). Tabelle 19 zeigt die Berechnung der Standardabweichung (an einem Teilergebnis). Die Testleistungen der Vpn A bis G wurden nach Punkten bewertet: Tabelle 19
n
X
X
A B C D E F G
15 14 11 10 9 7 4
+ + + + — — —
5 4 1 0 1 3 6
25 16 1 0 1 9 36
70
± 0
88
Summe:
4)
x
Vp
= 7
Sx
(x —
X(x
xf
—
xf
Für den seltenen Fall, daß der Mittelwert bereits bekannt ist — wir schreiben ihn dann p — müssen wir an Stelle von n — 1 den Wert n einsetzen. Die entsprechende Standardabweichung wird mit s* (sprich: s Stern) symbolisiert:
Standardabweichung
63
= — = 10
x = —
n
7
2 (x — x):
=
J / ^
= [ ^ 6 7
=3,83
Zuerst berechnet man die Summe der erzielten Testergebnisse: £ x = 70. Danach bestimmt man das arithmetische Mittel, hier x = 10. Dies ermöglicht die Berechnung der Abweichungen vom Mittelwert, d. h. x — x6). Diese Abweichungen werden quadriert, wodurch die negativen Vorzeichen verschwinden. Die Summe der Quadrate der Abweichung, H (x — x)2 = 88, wird dann durch die um 1 verminderte Anzahl der Personen, n — 1 = 6 , dividiert. Das Resultat lautet 14,67. Der absolute Wert der Quadratwurzel aus diesem Ergebnis ergibt dann die Standardabweichung s = 3,83. Bei einem größeren Material wird die Berechnung dadurch erleichtert, daß man eine Häufigkeitstabelle benutzt. Die Tabelle 20 bietet hierzu ein Beispiel. Es handelt sich hier um die weitergeführte Darstellung der Ergebnisse der Rechenprobe (s. Tab. 7). Tabelle 20 (3)
(1)
(2)
X
/
X X
10 9 8 7 6 5
3 5 7 7 4 2
2,36 1,36 0,36 —0,64 —1,64 —2,64
(5)
(x—xf
/•(*-*)»
5,57 1,85 0,13 0,41 2,69 6,97
16,71 9,25 0,91 2,87 10,76 13,94 54,44
28
n = 28
(4)
X = 7,64
Sf(x — xY
Das arithmetische Mittel in diesem Beispiel wurde bereits auf S. 52 berechnet und beträgt 7,64. Die Spalte 3 enthält die Abweichungen der x-Werte von diesem Mittelwert. In Spalte 4 sind die Quadrate dieser Abweichungen aufgeführt. Die negativen Vorzeichen sind durch die Quadrierung weggefallen. Es muß darauf Rücksicht genommen werden, wie viele Abweichungen im Material vorkommen. Deshalb werden die quadrierten Abweichungen mit den zugehörigen Häufigkeiten multipliziert. Die Resultate dieser Operation finden sich dann in Spalte 5. 5 ) Dabei muß die Summe der Abweichungen stets = 0 sein. Hierin liegt zugleich die Möglichkeit, die vorangegangene Rechnung zu überprüfen.
64
Statistische Beschreibung. Streuungsmaße
Die Summe der Werte in Spalte 5, d.h. E f • (x — s")2 = 54,44, ist die gesuchte Summe der quadrierten Abweichungen. Diese Summe entspricht dem Zähler in der unten stehenden Formel 15 für die Standardabweichung. Nach der Division durch n und anschließendem Wurzelziehen erhält man s = 1,42. Die Berechnung erfolgt also nach der Formel:
\
w
_!
C1»)
Wenn die Zahl der Fälle hundert und mehr beträgt und die graphische Darstellung ihrer Verteilung im Häufigkeitspolygon 2 sich der Glockenform annähert, fallen ungefähr -y aller Beobachtungen in denjenigen Bereich der Skala, der zwischen einem Punkt mit dem Abstand der Standardabweichung links vom Mittelwert und einem anderen Punkt, der genauso weit rechts von ihm Hegt. Variabilitätskoeffizient Bestimmte Fragestellungen fordern zu ihrer Lösung, daß man Streuungen miteinander vergleicht. Wenn aber zwei Verteilungen sehr unterschiedliche Mittelwerte aufweisen, ist es nicht immer ratsam,die Streuungsmaße einfach einander gegenüberzustellen.Selbst wenn sie aus der gleichen Skala hervorgehen, ist dies unzweckmäßig. Die Streuung der Körperlänge bei Neugeborenen zum Beispiel ist, in absoluten Maßen gemessen natürlich kleiner als diejenige bei Erwachsenen. Es kann jedoch beispielsweise für einen Wirtschaftspolitiker von Interesse sein, die Streuung der Höhe der Sparguthaben bei einer Stadtbevölkerung zu vergleichen mit der entsprechenden Streuung der Sparguthaben bei einer Landbevölkerung. Ein anderes Beispiel wäre die unterschiedliche Streuung der Krankheitsdauer (in Tagen) wie es sich bei zwei Gruppen von Patienten ergeben kann, die mit unterschiedlichen Medikamenten behandelt wurden. In jedem Falle müssen bei dem Vergleich von Streuungen empirische Normen berücksichtigt werden, da bei einem in einer Gruppe zufällig hohem Mittelwert die Wahrscheinlichkeit einer großen Streuung unangemessen erhöht ist. Aus diesem Grunde muß die Streuung in Beziehung zum Mittelwert gesetzt werden. Will man also Vergleiche der oben geschilderten Art durchführen, so berechnet man am vorteilhaftesten den Variabilitätskoeffizienten (V), der das Hundertfache der Standardabweichung, dividiert durch den zugehörigen Mittelwert 6 ) darstellt. Die Multiplikation mit 100 erfolgt, um die Dezimalen zu vermeiden. Die Formel für den Variabilitätskoeffizienten lautet also: 6
) Unberücksichtigt bleibt das Vorzeichen des Mittelwertes.
Variabilitätskoeffizient
65
Der Variabilitätskoeffizient kann nur verwendet werden, wenn die folgenden beiden Voraussetzungen erfüllt sind: 1. Die zur Quantifizierung der Beobachtungen dienende Skala muß einen absoluten Nullpunkt haben. 2. Diese Skala muß konstante Klassengrößen aufweisen. I n psychologischen Untersuchungen sowie in den methodisch und thematisch verwandten Forschungsgebieten sind diese beiden Bedingungen verhältnismäßig selten erfüllt 7 ). Beispiel: I n Untersuchungen zur „social perception" bedient man sich gern des Tachistoskops, eines Gerätes mit einer Vorrichtung zur sehr kurzen Darbietung von Wörtern und Bildern. I m vorliegenden Falle waren zwei Gruppen von Studierenden untersucht worden: die Eltern der ersten Gruppe blieben mit ihrem monatlichen Einkommen unter 500,— DM, die Eltern der 2. Gruppe lagen über 1000,— DM. Beiden Studentengruppen wurde im Rahmen einer Reihe neutraler Wörter u. a. das Wort „Sparsamkeit" im Tachistoskop angeboten. Für die durchschnittlich erforderliche Zeit zum Erkennen des Wortes ergaben sich folgende Werte: Gruppe 1: x1 = 5,4 msec8) Gruppe 2: za = 3,1 msec
=- 2,9 msec s2 = 1,6 msec
Die Gruppe 1 benötigt also eine durchschnittlich längere Auffassungszeit. Außerdem scheint der Vergleich beider Streuungen zu zeigen, daß die Vpn der Gruppe 1 in ihren Auffassungen weniger einheitlich waren. Doch zeigt die Verwendung des Variabilitätskoeffizienten, daß die Streuungen der Lesezeiten für das Testwort bei beiden Gruppen nahezu identisch sind: _ 100 • 2,9 5,4 ~
5 4
100 • 1,6 _ 3,1
Ob der geringe Unterschied beider Werte mit hinreichender Sicherheit eine Aussagefunktion hat oder aber zufällig ist, kann hier zunächst nicht entschieden werden. Wir werden später Probleme solcher Art ausführlich behandeln. 7 ) Während die Forderung nach konstanten Klassengrößen meist aus methodischer Sorglosigkeit unbeachtet bleibt, ist das Fehlen eines absoluten Nullpunktes oft im untersuchten Gegenstandsbereich begründet. Thurstonk hat eine Methode zur Bestimmung eines „künstlichen" absoluten Nullpunktes entwickelt, und zwar für den Bereich der Intelligenzforschung, die jedoch auf inhaltlich andersartige Skalen und ihre Meßwerte anwendbar ist. L. L. Thurstone, The Absolute Zero of Intelligence Measurement, Psychol. Rev. 35 (1928). 8 ) 1 msec (Millisekunde) ist der tausendste Teil einer Sekunde. 3,1 msec sind also 0,0031 sec oder etwas weniger als eine dreihundertstel Sekunde.
6
Haseloff, Statistik,
4. Aufl.
KAPITEL 6
Vorteile provisorischer Skalen Wenn die Beobachtungen aus vielen hohen stark gebrochenen und/oder stark variierenden Werten bestehen, kann die Berechnung von Mittelwert und Standardabweichung bei Verwendung der bisher besprochenen Formeln sehr langwierig werden. Die notwendige Rechenarbeit kann dann gegebenenfalls mit Hilfe der hier angegebenen Methoden abgekürzt werden. Alle diese Rechenverfahren beruhen auf dem Grundgedanken, die ursprünglich der Variable x zugeordnete Skala zwischenzeitlich durch eine (x)-Skala zu ersetzen. Zu dieser (a;)-Skala gelangen wir, indem wir den erwarteten Mittelwert m provisorisch = 0 setzen. Dies gelingt, indem wir von den x-Werten den provisorischen Mittelwert abziehen: (x) — x — m. Durch diese Transformation werden die W e r t e in der (x)-Spalte unterhalb des provisorischen Mittelwertes m negativ. Die oberhalb des Mittelwertes liegenden Werte bleiben positiv. Die so aus der «-Skala hervorgegangene (x)-Skala muß in ihren Meßwerten dann am Ende des Rechenganges wieder in die ursprüngliche «-Skala überführt werden. Dabei ist sorgfältig darauf zu achten, daß bei der Aufstellung der Tabelle für die Umrechnung auf eine provisorische Skala die Spalte (1) die Variablewerte so enthält, daß der höchste W e r t am Anfang der Tabelle zu stehen kommt 1 ). Die Anwendungsweise dieser Methode soll an der Bearbeitung des Beispiels in Tabelle 21 gezeigt werden. Beispiel: Die Studenten einer Hochschule für Leibesübungen wurden von einem Arzt untersucht. Dabei wurde auch ihre Körperlänge gemessen. Die Meßergebnisse sind in der folgenden Tabelle zusammengestellt:
Möglich wäre auch die entgegengesetzte Reihenfolge der Variablewerte. Dann ist allerdings in Formel (17) das Pluszeichen durch ein Minus zu ersetzen.
Provisorische Skalen
67
Tabelle 21
(2)
(1)
/
X
1 1 1 2 3 11 5 12 29 36 52 49 78 83 64 62 45 31 33 22 8 12 4 1 1 1
191 188 187 185 183 182 180 179 178 177 176 175 174 173 172 171 170 169 168 167 166 164 163 161 159 158
m = 173
(3)
y
V
z
f
-
18 15 14 24 30 99 35 72 145 144 156 98 78 0 — 64 —124 —135 —124 —165 —132 — 56 —108 — 40 — 12 — 14 — 15
647
— 61
t n
t Sf(x)
7 " +173 -
w
n - 1
n • (n — 1)
(5)
-
] / 10103 )' 646
(6)
/(*)•
/(*)
18 15 14 12 10 9 7 6 5 4 3 2 1 0 — 1 — 2 — 3 — 4 — 5 — 6 — 7 — 9 —10 —12 —14 —15
Zfx , x = — i — -J- m = n a =
(4)
(X)
324 225 196 144 100 81 49 36 25 16 9 4 1 0 1 4 9 16 25 36 49 81 100 144 196 225
324 225 196 288 300 891 245 432 725 576 468 196 78 0 64 248 405 496 825 792 392 972 400 144 196 225 10103 £f}x)*
172,91 cm (-61)2 = 3,96 om 647 • 646
Wir wählen zunächst den provisorischen Mittelwert. Dabei sollte derjenige Variablewert als provisorischer Mittelwert gewählt werden, dem allgemein die größte Häufigkeit entspricht, also der Gipfelwert. Dieser Wert wird als provisorischer Mittelwert m zum Nullpunkt der neuen (x)-Skala. In unserem Fall der Tabelle 21 wählen wir demgemäß versuchsweise m = 173. Die (a;)-Skala entsteht nun dadurch, daß wir m von jedem »-Wert abziehen: (x) = x — m. Die so entstandenen (a;)-Werte der Spalte (3) werden mit den jeweiligen Häufigkeiten / multipliziert (Spalte 4). Die Spaltensumme beträgt in unserem Beispiel — 61. 6«
68
Statistische Beschreibung
Der Mittelwert — ausgedrückt in den neuen Skalenwerten — wird dann n
647
= -0,094
Danach muß der Mittelwert der (x)-Skala wieder in die ursprüngliche Skala überführt werden, deren Nullpunkt ja tiefer liegt. Dies geschieht einfach durch Addition des provisorischen Mittelwertes zu dem in der (x)-Skala errechneten Mittelwert: x=—
+
m
(17)
n Für das Beispiel der Tabelle 21 ergibt sich dann + 173 = 172,91 cm _ —61 647 Die Standardabweichung der in Tabelle 21 erfaßten Meßwerte wird auf analoge Weise berechnet. Nach Formel (15) ist a -
1 1' S f {x
x)* . Für x wird auch hier n—1 m in die Formel eingesetzt. In der gleichen Weise wie bei der üblichen Berechnung von s sind die provisorischen (a;)-Werte zu quadrieren. In Tabelle 21 finden wir diese quadrierten Werte in Spalte (5). Danach werden in Spalte (6) die entsprechenden Werte / • (x)2 gebildet, deren Summe =27/(x) 2 = 10103 beträgt. Zur weiteren Berechnung der Standardabweichung muß diese Summe durch n — 1 dividiert werden:
n—• 1
646
j/l5,639 ist noch nicht die gesuchte Standardabweichung. Dieser Wert ist zu hoch, da die Abweichungen von m und nicht vom wahren Mittelwert x berechnet wurden. Deshalb subtrahieren wir ^ J i ^ l von (x — m)2. Da aber x = + m ist, beträgt die quadrierte Differenz zwischen x und m (x — m)2 {Sf{x)Y i • (n — 1) Die Formel für die Standardabweichung nach dieser Kurzmethode lautet also Sf-(x)* /•(»))* (18) n—1 n • (n — 1) In unserem Beispiel der Tabelle 21 beträgt die Standardabweichung nach der Formel (18)
f
V
10103 646
(—61)2 647 • 646
= | (/15.639—0.009 | = 3,95 cm
69
Provisorische Skalen
Ist das Material in Klassen eingeteilt, muß das statistische Vorgehen jedoch etwas modifiziert werden: Man wird am besten diese Klassen so betrachten, als repräsentierten sie einzelne Variablewerte. Dadurch wird es möglich, die gesamte, am häufigsten besetzte Klasse provisorisch = 0 zu setzen. Tabelle 22 soll das Gesagte anschaulich machen. Tabelle 22 (1) X
(2)
(3)
/
126—130 121—125 116—120 111—115 106—110 101—105 96—100 91—95 86—90 81—85 76—80 71—75
2 3 5 5 7 11 12 9 7 8 4 3
(*) 6 5 4 3 2 1 0 —1 —2 —3 —4 —5
Summa:
76
to = 98 i = 5
t n
Zf(x) x — i• n EtV- il
1
(4)
+ TO = -
•(» — i )
5
/•(*)
(5) (xf
(6) i-(xf
12 15 20 15 14 11 0 — 9 —14 —24 —16 —14
36 25 16 9 4 1 0 1 4 9 16 25
72 75 80 45 28 11 0 9 28 72 64 75
+9
559
t Zf(x)
t £f(xy
9 = 9i*,6 "76+98
—K
559 75
9* = 13,1 76-75
In der Tabelle 22 ist wieder die Verteilung der Intelligenzquotienten von 76 Probanden erfaßt. Dabei sind immer fünf Skaleneinheiten des Intelligenzquotienten zu einer Klasse zusammengestellt. Die Klassenbreite i beträgt also — wie auch Spalte (1) der Tabelle zeigt —5. Die Klassenmitte wird in der Klasse 96—100 zum provisorischen Mittelwert gewählt. Da 98 der mittelste der fünf Werte dieser Klasse ist, schreiben wir m = 98. Dieser Wert wird der Nullpunkt in der neuen (x)-Skala. Die Berechnung von Mittelwert und Standardabweichung geschieht dann auf gleiche Weise, wie im vorangegangenen Beispiel, nur daß man bei der endgültigen Korrektur außerdem auf die Klassenbreite Rücksicht nehmen muß. Der Ausdruck
in n Formel (17) gibt zwar an, wieviel zu m hinzugezählt werden muß,
Statistische Beschreibung
70
lim zu x zu gelangen. Jedoch ist dieser Wert in einer (x)-Skala ausgedrückt, die wesentlich weniger differenziert ist als die eigentliche Skala (Klassenbreite i = 5). Der Ausdruck ^ ^ ^ n
muß daher mit der Klassenbreite i multi-
pliziert werden. Damit erhält man eine allgemeinere Berechnungsformel für den Mittelwert eines in Klassen eingeteilten Materials: 2= i.
+
n
(19)
m
Die Formel zur Berechnimg des Mittelwertes mit Hilfe einer provisorischen Skala (17) erweist sich als ein Sonderfall der Formel (19), bei der die Klassenbreite i = 1 beträgt. Wie die Berechnung vorzunehmen ist, geht aus den Spalten 4—6 der Tabelle 22 hervor. Die Summe der / (x) -Werte in Spalte (4) gibt Z / (x) = 9. Danach berechnet man x = 5 • -^jr + 98 = 98,6
Die Berechnung der Standardabweichung bei in Klassen zusammengefaßtem Material geschieht nach Formel (18), nur daß der Wurzelausdruck mit der jeweiligen Klassenbreite multipliziert werden muß. Die generelle Berechnungsformel für s lautet also
t
7i — 1
n-(n — 1)
Da der Ausdruck unter dem Wurzelzeichen nur in provisorischen (a;)-Einheiten ausgedrückte Werte enthält, die infolge ihrer Zusammenfassung zu Klassen fünfmal gröber als die Werte der ursprünglichen «-Skala sind, muß der so berechnete s-Wert um das i-fache zu klein ausfallen. Die Korrektur geschieht einfach dadurch, daß man den Wurzelausdruck mit der jeweiligen Klassenbreite multipliziert. Die näheren Einzelheiten gehen aus den Spalten (5) und (6) der Tabelle 22 hervor. Die Spalte (5) enthält die quadratischen Abweichungen vom provisorischen Mittelwert, gemessen in (x) -Einheiten, und die Spalte (6) das Produkt aus diesen Werten und den zugehörigen Häufigkeiten. Die Summe der Spalte (6) gibt dann das gesuchte 2 f (x)2 = 559
Die Standardabweichung beträgt nun nach Formel (20) 559
75
92
75 • 76
13,5
Das Rechnen mit provisorischen Mittelwerten und provisorischen Skalen ist besonders vorteilhaft, wenn die Variablewerte Dezimalbrüche sind. Hierzu das folgende
Provisorische Skalen
71
Beispiel: In einem Werk wurden die Höchstgeschwindigkeiten einer Serie von 193 Kraftfahrzeugen eines neuen Typs gemessen. Zu berechnen ist hier die mittlere Höchstgeschwindigkeit der getesteten Fahrzeuge sowie die Streuungen der erreichten Geschwindigkeiten: Tabelle 23
(1)
(2)
X
/
(3)
1 5 12 29 48 45 33 14 4 2
146,9—149,0 144,7—146,8 142,5—144,6 140,3—142,4 138,1—140,2 135,9—138,0 133,7—135,8 131,5—133,6 129,3—131,4 127,1—129,2
(4)
(5)
(X)
/(*)
(X)*
4 3 2 1 0 —1 —2 —3
4 15 24 29 0 —45 —66 —42 —16 —10
—5
(6)
t(xf
16 9 4 1 0 1 4 9 16 25
16 45 48 29 0 45 132 126 64 50
—107
193 t
555
27 f(x)
n
2
/(!)«
in = 139,15 i = 2,2 x
=
2,2 -
2,2
107 + 139,15 = 137,93 km/h 193 555 192
(—107) 2 = 3,53 km/h 193 • 192
Die Klassenbreite war in unserem Beispiel recht ungewöhnlich gewählt, ohne provisorische Skala würde die Rechnung zusätzlich erschwert sein. Sie beträgt i = 2,2. Als provisorischer Mittelwert wurde wieder die Klassenmitte desjenigen Intervalls gewählt, das die meisten Fälle enthält: m = 139,15. Die Rechnung nach den Formeln (19) und (20) führt dann zu einem niedrigeren Mittelwert x = 137,93 km/h sowie einer relativ kleinen Streuung s = 3,53 km/h. Erwähnt sei schließlich, daß für die meisten praktischen Belange eine einfachere Form der Wurzel in den Formeln 18 und 20 ausreichend ist, sofern n > 100 ist:
t
n—1
2f(x) 71 — 1
n—1
(W)2
(21)
KAPITEL
7
Verteilungen Empirische Verteilungen Wir waren davon ausgegangen, daß in Gestalt von Zahlen oder Meinungsäußerungen vorliegende Untersuchungsergebnisse statistisch aufbereitet und ausgewertet werden können, wenn diese Fälle oder Beobachtungen über mehrere Variablewerte oder Klassen verteilt sind. Betrachten wir noch einmal die Verteilungen, die uns in den Beispielen begegnet sind, so hatten sie meist annähernd eine Glockenform. Dieser Form sind auch sonst die in Untersuchungen meist anfallenden Verteilungen ähnlich. Doch gibt es hiervon auch mehr oder weniger grobe Abweichungen. Die wichtigsten Abweichungen sind: 1. Schiefe Verteilungen: Die Fälle verteilen sich hier also asymmetrisch um den Mittelwert. Der Gipfel der Verteilung hegt dann weiter rechts oder auch links von der Mitte. Wir sagen, die Verteilung sei „schief". Bei solchen Verteilungen liegt der größere Teil der Werte auf der einen Seite vom Mittelwert, während eine geringere Anzahl von Werten über den anderen Teil der Skala breit streut. A
B
C
Fig. 13
Dabei unterscheidet man zwischen positiver und negativer Schiefe. Einer Verteilung, deren Hauptanteil auf der linken Seite der Skala konzentriert ist, spricht man eine positive Schiefe zu, sofern links auf der Skala die kleineren Variablewerte angeordnet sind. Siehe Verteilung A in Figur 13. Die Verteilung G der gleichen Figur ist
Empirische Verteilungen
73
dagegen negativ scbief, da sich das Beobachtungsmaterial auf der rechten Seite, bei den höheren Variablewerten häuft. Die Schiefe wirkt sich dahingehend aus, daß das arithmetische Mittel und der Zentralwert unterschiedliche Werte ergeben. J e größer der Unterschied zwischen ihnen ist, um so größer ist auch die Schiefe. Diese Tatsache kann zur Erstellung eines Maßes für die Verlagerung einer Verteilung verwendet werden 1 ). 2. Flache und steile Verteilungen: Die Glockenform kann sehr flach, aber auch sehr steil ausfallen. Diese Abflachung oder „Übertreibung" der Glockenform wird als Exzeß bezeichnet. Der Exzeß gibt darüber Aufschluß, ob sich das Material spitz um die Mitte der Verteilung sammelt oder ob die Verteilung vergleichsweise abgeflacht ist. Dabei verwendet man die Normalverteilung als Vergleichsmaßstab. Eine Verteilung, die spitzer als die Normalverteilung ist, zeigt einen positiven Exzeß. Ist sie dagegen abgeflachter als die Normal Verteilung, so spricht man von einem negativen Exzeß. 3. Mehrgipflige Verteilungen: Eine empirische Verteilung muß keineswegs nur einen Gipfel haben. Sie kann, wie man sagt, auch „zweigipflig" oder gar „mehrgipflig" sein. Meist deutet sich in der Zwei- oder Mehrgipfligkeit die Tatsache an, daß wir es mit der Überlagerung mehrerer Verteilungen zu tun haben. Empirisch gefundene Verteilungen lassen sich mehr oder weniger zwanglos als Abweichungen von der symmetrisch, eingipfligen Glokkenform beschreiben. Daher stellt diese Idealform, wenn wir sie einmal so nennen dürfen, den theoretisch wichtigsten Fall einer Verteilung dar. Er steht am historischen, aber auch am praktischen Ausgangspunkt aller wahrscheinlichkeitstheoretischen Überlegungen über das Zustandekommen von Verteilungen. Die mathematischen Modelle jener symmetrischen eingipfligen Verteilung liegen den meisten statistischen Rechenvorschriften zugrunde, die uns im folgenden noch begegnen werden. Ihnen entsprechen die binomialen, hypergeometrischen, normalen oder Gauß-Laplaceschen Verteilungen 2 ). Die häufigsten Abweichungen von der eingipfligen Glockenform zeigen das Merkmal der Asymmetrie. Sie sind vor allem bei einseitigen Begrenzungen anzutreffen, wenn z. B. Null nicht in negativer Richtung unterschritten werden kann. In diesem Falle ist ') Als Maß für die Schiefe einer Verteilung benutzt man nach K . P E A B S O N eine Größe, die sich folgendermaßen errechnet: Man zieht vom arithmetischen Mittel den Gipfelwert (Wert mit der größten Frequenz) ab und dividiert das erhaltene Ergebnis durch die Standardabweichung. Im Fall A (Fig. 18) ist der erhaltene Wert positiv, im Fall B — der symmetrischen Verteilung •—• gleich Null und für den Fall C negativ. 2 ) Wir werden die wichtigsten Eigenschaften dieser Verteilungen diskutieren. Wer aber an ihrer wahrscheinlichkeitstheoretischen Ableitung interessiert ist, sei auf die weiterführende Literatur verwiesen.
74
Statistische Beschreibung. Verteilungen
unter Umständen eine so extreme Schiefe zu beobachten, daß der Abstieg auf der einen Seite praktisch wegfällt. Dies beobachten wir zum Beispiel bei der Alters- oder Einkommenverteilung in der Bevölkerung, oder auch bei Unfallhäufigkeiten begegnen uns gleichfalls diese J-förmigen Verteilungen. Wir haben es in diesen Fällen häufig mit sogenannten Poissonschen Verteilungen zu tun, auf die wir weiter unten noch zu sprechen kommen. Beispiel: Typisch J-förmige Verteilungen begegnen uns beispielsweise auch in soziometrischen Untersuchungen, und allgemein in der sogenannten Kleingruppenforschung. Hier geht es darum, die Kontakte zwischen den Mitgliedern einer Gruppe quantitativ zu analysieren. Auf Befragen geben hierzu die Gruppenmitglieder über ihre wechselseitigen Kontaktwünsche und -erwartungen Auskunft. So wurde zum Beispiel eine größere Gruppe von Studenten gefragt, wem der Kommilitonen sie ein Geheimnis anvertrauen würden. E s ergab sich dabei folgende Verteilung der Studenten hinsichtlich der Häufigkeit, mit der jeder einzelne Gruppenangehörige von anderen Gruppenmitgliedern genannt wurde: Die Ergebnisse der sozio•IttUVUU ät , i TT . t metrischen Untersuchung Nennungshäufigkeit P% zeigen, daß gut ein Drittel 0 mal 34 der Angehörigen der Grup32 1 „ pe ungenannt bleibt, daß 15 2 „ ihnen also kein Gruppen7 3 „ mitglied ein Geheimnis an4 4 „ 3 5 „ vertrauen möchte. Ein 1 6 „ weiteres Drittel wird genau 2 7 einmal genannt. E s handelt 0 8 „ sich dabei meist um dieje1 9 „ 10 „ 0 nigen Gruppenmitglieder, 0 11 „ die in stabilen Einzelkon12 „ 1 takten stehen. Studierende mit mehr als sieben Nen100 nungen sind selten. E s sind meist Gruppenmitglieder, die auch in anderer Hinsicht den Mittelpunkt der Gruppe bilden. Graphisch übersetzt stellt sich die gefundene Verteilung in Figur 14 auf Seite 75 dar. Einen interessanten und nicht so seltenen Fall stellt schließlich die zweigipflige U-förmige Verteilung dar. Das am häufigsten f ü r sie angeführte Beispiel ist die Verteilung der Grippesterblichkeit auf die Altersklassen der Bevölkerung. An dieser Krankheit sterben nämlich am häufigsten Säuglinge und sehr alte Menschen. Es gibt jedoch auch typische Urteils- und Meinungsverteilungen, bei denen dieser Verteilungstypus sich herausstellt. Meist handelt es sich
75
Empirische Verteilungen P%
30
20
10
0
2
k
6
8
Nennungshäufigkeit
10
12
Fig. 14
dabei um Stellungnahmen und Urteile zu einem peniblen oder wirklich wichtigen Problem, über das jedoch eine nur sehr Tinvollständige Information zur Verfügung steht. Beispiele wären: „Es gibt ein Fortleben nach dem Tode", „Der Mars ist von menschenähnlichen Wesen bewohnt" oder „Durch den technischen und wirtschaftlichen Fortschritt sind die Menschen heute glücklicher geworden". Beispiel: Im folgenden Beispiel sollten 326 Vpn u. a. beantworten, für wie wahrscheinlich sie es halten, daß Menschen ferne Sterne des Milchstraßensystems jemals besuchen werden: Die Eintrittswahrscheinlichkeiten wurden in verbaler Form vorgegeben : Tabelle 25 P% bestimmt wahrscheinlich möglicherweise WN vermutlich nicht sicher niemals es ist unmöglich
34 15 8 4 9 23 100
Der typische Charakter dieser Verteilung wird in graphischer Darstellung besonders deutlich (Fig. 15).
76
Statistische Beschreibung. Verteilungen
Binomialverteilung Unter den Glockenkurven kommt den symmetrisch geformten die größte Bedeutimg zu. Man nennt sie deshalb auch normale Verteilungen. Sie bilden sich überall dort heraus, wo Ereignisse nur durch Zufälle bestimmt, um eine Zielgröße streuen. Dies ist zum Beispiel der Fall, wenn ein Schütze vielfach hintereinander auf eine Schießscheibe schießt oder wenn eine ganze Reihe von Messungen an ein und demselben Objekt ausgeführt werden3). Wir können uns dies im kleinen Maßstab besonders an der GALTONschen Zufallsmaschine veranschaulichen: Man schlägt in ein Brett eine größere Anzahl von Nägeln so ein, daß sie Reihe für Reihe genau „auf Lücke" stehen (vgl. Fig. 16): s ) Es ist in diesem Zusammenhang von gutem heuristischem Wert, Treffgenauigkeit („Akkuranz") und Wiederholungsgenauigkeit („Präzision") zu unterscheiden. I m ersten Falle handelt es sich um die durchschnittliche Abweichung von der Zielgröße, im zweiten Fall dagegen um die Streuung der Nennungen um einen den Zielpunkt im bestimmten Grade verfehlenden Wert. Beim Schießen z. B. würde einer hohen Treffgenauigkeit eine enge Streuung u m die 12 entsprechen. Die Wiederholungsgenauigkeit besagt demgegenüber, daß die Waffe mit mehr oder weniger hoher Konstanz immer wieder die gleiche systematische Abweichung vom Zielpunkt erzeugt, so daß beispielsweise die Mehrzahl der Treffer im Bereich von „zwei oben rechts" liegen. I n Kurzform könnte man sagen: Wiederholungsgenauigkeit ist gleich Treffgenauigkeit am falschen Ort.
Binomialverteilung
77
o o os 'o o o oN N 'o o o o o 'o o o o o oN 'o o o o o o o' 'O o o o o o o o" ' o o o o o o o o o ' (f ° o o o o o o o o o \
m111m
fräs
Fig. 16
Stellt man dieses Nagelbrett dann schief und leitet von einer trichterförmigen Öffnung aus Kugeln (die möglichst nur wenig kleiner sind, als der Nagelabstand) in das Quadrat ein, so sammeln sich die Kugeln in unten angebrachten Fächern. Im mittleren Fach kommen stets die meisten Kugeln zu liegen, während nach den Seiten hin die rechten und linken Fächer immer weniger gefüllt sind. Es bildet sich auf diesem Wege eine Zufallsverteilung heraus. Allerdings geschieht dies nur, wenn die Anzahl der Kugeln hinreichend groß ist und der Einfüllvorgang keinen Einfluß auf den Weg der einzelnen Kugel zu nehmen vermag. Die so entstehende Zufallsverteilung läßt sich mathematisch darstellen. Und zwar gelingt dies, wenn wir den zweigliedrigen Ausdruck, das sogenannte Binom (a-j-b) der Reihe nach lmal, 2mal, 3mal usf. mit sich selbst multiplizieren. Wir erhalten so: (a+6) 1 = (a+6) 2 = {a+b?
=
ci + b a" - 2ab +
a 3 + 3 a2b+
ö2
3 a ö 2 + b3
(o+6) 4 = a 4 +f- 44aa336b ++ 6a 6a22ö ö22 ++ 4aö 4aö33 +-4 64 und so fort bis:
(•a+b)» =
anb°-
n
1
n n-1
Statistische Beschreibung. Verteilungen
78
Die Beizahlen der Summanden bezeichnet man also als Binomialkoeffizienten 4 ). Sie lauten in der zweiten Zeile z. B. 1 2 1 oder in der vierten Zeile 1 4 6 4 1. Jede einzelne Zahl stellt dabei die Summe der beiden, über ihr stehenden Zahlen dar, in deren Lücke sie steht. Diese Binomialkoeffizienten lassen sich in Form des sogenannten PASCALSchen Dreiecks anordnen: Binomialkoeffizienten
für die Potenz n
1
0 1
1
1
1 2 1 1 3 3 1 1 4 6 4 1 5 10 10 5 1 1 1 6 15 20 15 6 1 1 7 21 35 35 21 7 1
2 3 4 5 6 7
Jede Zeile in diesem PAscALschen Dreieck entspricht der Verteilung in einer speziellen GALTONschen Zufallsmaschine : Die erste Zeile käme zustande, wenn die Kugeln nur in ein Fach fallen können, die vierte Zeile dagegen würde sich ergeben, wenn vier Fächer zur Verfügung stehen und die dreiundzwanzigste Zeile schließlich resultiert bei einer Zufallsmaschine mit dreiundzwanzig Fächern. Die Binomialkoeffizienten müssen hierbei als Verhältniszahlen verstanden werden: Angenommen, wir haben ein GALTONbrett mit vier Fächern und lassen genügend viele Kugeln hinunter rollen. Es werden sich die Anzahlen der Kugeln in den einzelnen Fächern wie 1:3:3:1 verhalten. Diese Verteilung wird eine Binomialgenannt. verteilung Beispiel: Nehmen wir an, wir hätten 2000 Familien mit je vier Kindern. Wie viele Familien werden wahrscheinlich keine Jungen, einen Jungen usw. bis schließlich vier Jungen haben ? Logisch gibt es insgesamt fünf Möglichkeiten: 4
) Hierin ist z. B.
lies „sieben über drei" eine abgekürzte Schreibweise
7•6•5 für ——-—-- = 35. Dementsprechend bedeutet der Binomialkoeffizient /11\ \4 J
111 -2-3-4 10-9-8
= 33°
Dabei bestimmt sich die Anzahl der Faktoren im Zähler durch den Wert der untenstehenden Zahl, wobei im Nenner prinzipiell mit 1 zu zählen begonnen wird. Der Zähler des Binomialkoeffizienten beginnt prinzipiell mit der angegebenen Zahl und erreicht in fallender Reihe so viele Glieder wie im Nenner angegeben sind.
79
BinomialverteUung 4 Jungen 3 Jungen 2 Jungen 1 Junge kein Junge
kein Mädchen 1 Mädchen 2 Mädchen 3 Mädchen 4 Mädchen
Wir können davon ausgehen, daß es praktisch zufällig ist, ob ein Junge oder ein Mädchen geboren wird. Demnach ist jede der fünf Aufteilungsmöglichkeiten einem Fach in der GALTONSchen Zufallsmaschine vergleichbar. Wir hätten demnach ein Brett mit fünf Fächern und 2000 Kugeln. Wie sich die Kugeln etwa verteilen würden, sagtuns die fünfte Zeile im Pascalschen Dreieck, nämlich 1 : 4 : 6 : 4 : 1 . Diese Zahlen hätten wir dann so umzurechnen, daß ihre Summe 2000 ergibt : Tabelle 26 (1)
(3) f
(2)
F 1 2 3 4 5
0 Jungen und 4 Mädchen 1 Junge und 3 Mädchen 2 Jungen und 2 Mädchen 3 Jungen und 1 Mädchen 4 Jungen und 0 Mädchen
125 500 750 500 125
Familien Familien Familien Familien Familien
n = 2000 Familien
In komplizierteren Fällen ist es geboten, die jeweilige Häufigkeit / direkt zu berechnen. Dies ist mit folgender (unseren didaktischen Prinzipien entsprechend geschriebener) Formel möglich6).
F ist hier die Anzahl der Variationsmöglichkeiten von x. In unserem Beispiel ist F = 5. p dagegen stellt die Wahrscheinlichkeit dar, mit der eine der Alternativen tatsächlich realisiert wird, hier also die Wahrscheinlichkeit, daß die Eltern einen Jimgen bekommen. p = 1 würde bedeuten, daß es in jedem Falle ein Junge wird. Jungen und Mädchen sind aber praktisch fast gleichwahrscheinlich. Also beträgt in unserem Beispielp = 0,5; würde dagegen nur jedes zehnte Kind ein Junge werden, so wäre p =0,1. Deshalb lautet die Berechnungsformel (22) für unser Beispiel: / = 2000 • Q
• 0,5* • 0,5 4 _ a :
6 ) Die Formel (22) geht aus der Wahrscheinlichkeit W hervor, in n Fällen K-mal ein bestimmtes Ereignis anzutreffen, wenn die Einzelwahrscheinlich-
keit p ist: W„ . x =
• pn~x
• (1—pf
80
Statistische Beschreibung. Verteilungen
Der Rechengang geht aus folgender Tabelle hervor: Tabelle 27 (1)
(2)
(3)
(4) 1
X
xl
0,5
0 1 2 3 4
1 4 6 4 1
1 0,5 0,25 0,125 0,0625
F = 5
0,5
(5) 4-x
0,0625 0,125 0,25 0,5 1
/ 125 500 750 500 125 n = 2000
(6)
P% 6,25 25,0 37,5 25,0 6,25 100
Die Spalte (6) enthält die prozentuale Häufigkeitsverteilung. In der ersten Reihe beträgt P % — 6,25. Dieser Wert besagt zweierlei: Erstens ist es die prozentuale Häufigkeit des Falles, daß alle Kinder Mädchen sind. Zweitens drückt P% zugleich die Wahrscheinlichkeit aus, daß wir in einer zufällig aus der untersuchten Gruppe herausgelösten Familie mit vier Rindern ausschließlich Mädchen antreffen. Wegen der forschungstechnischen Wichtigkeit derartiger prozentualer Zufallsverteilungen teilen wir einige davon im Anhang mit (Tafel G). Poisson-Yerteilung Innerhalb einer großen Reihe von Beobachtungen, Messungen oder Testergebnissen können die jeweils untersuchungswichtigen Klassen von Ereignissen sich als nur selten besetzt herausstellen, die erwarteten Fälle oder die untersuchungswichtigen Aussagen werden dann nur in kleiner Anzahl angetroffen. Mit diesem Problem hat sich der französische Mathematiker und Physiker P O I S S O N 6 ) schon sehr früh (1837) beschäftigt. Er fand für die Behandlung des Problems eine geeignete Formel. Diese blieb 61 Jahre lang unbeachtet und wurde erst im Jahr 1898 durch L. v. B O R T 7 K I E W I C Z wiederentdeckt ). 1907 hat dann der Chemiker W . S . G Ö S S E T , der seine bedeutenden statistischen Arbeiten unter dem Pseudonym „ S T U D E N T " veröffentlichte, die Formel zum dritten Male entdeckt8). 6 ) QUETELET (Seite 9) hielt das GAüss-LAPLACÉsche Fehlergesetz für ein fundamentales Naturgesetz, von dem er erwartete, daß es sich auch in allen Ereignisverteilungen des sozialen Lebens durchsetzen müßte. K. POISSON, der selbst für das Fehlergesetz die heute noch übliche Bezeichnung „Normalverteilung" eingeführt hat, erkannte demgegenüber, daß mindestens für die Sozialstatistik die Gaußsche Verteilung keineswegs die Regel, sondern eine Ausnahme darstellt. Er demonstrierte viele Verteilungstypen, die in Kurvendarstellung durchaus asymmetrische und auch zweigipflige Formen aufweisen. ') L. v. BORTKIEWICZ „Das Gesetz der kleinen Zahlen", Leipzig (1898). 8 ) STUDENT „On the error of counting with haemacitometer", Biometrica Vol. V, (1907J.
Poisson-Verteilung
81
Weisen unter 2000 Fällen nur 50 das Merkmal x auf, dann ist die Wahrscheinlichkeit sehr klein, daß in einer zufälligen Auswahl dieses Merkmal x angetroffen wird. Wir bezeichnen diesen Sachverhalt als „seltenes Ereignis". Hier wird die Binomialverteilung zu einer Verteilung seltener Ereignisse, wie sie P O I S S O N beschrieben hat. Diese sogenannte „Poisson-Verteilung" ist also dadurch charakterisiert, daß p gegen Null geht, ohne diesen Wert jedoch zu erreichen, während die Anzahl der Variationsmöglichkeiten F unendlich groß wird. Jedoch behält das Produkt von p und F stets einen konstanten, kleinen Wert. Klein ist also nicht p allein, sondern F • p9). Die PoissoNsche Formel findet heute in der Physik, aber beispielsweise auch in der Treffertheorie der Biologie, in der Bevölkerungsstatistik und in der modernen psychologischen Testtheorie wichtige Anwendungen. Dabei ist die Verteilung nach P O I S S O N durchaus als Spezialfall aus der Binomialverteilung abzuleiten. Erinnern wir uns zunächst an die Formel der Binomialverteilung: f ( x ) ^ n - ( F ~ 1 ) - p c - ( 1-3»)*—1 Für die Poisson-Verteilung können wir p =
setzen, wenn ¡j,
(z. B. in der GALTONschen Zufallsmaschine) die mittlere Anzahl von Kugeln pro Fach bedeutet, dabei beschreibt F die Anzahl der Fächer, also den der Variationsmöglichkeit. Setzen wir in der Formel der Binomialverteilung p =
, so ist
» • » — i ' r H f - N 1 - - * I n der Verteilung der seltenen Ereignisse soll nun F, wie wir gesehen haben, sehr groß sein. Wir lassen deshalb F unendlich groß werden. Dann geht der Ausdruck H
\F-x-l
ITj
und
geg6n
®
IF— 1\ 1 1 F—1 F—2 F—3 F—x gegen \ x I F* x\ F F F F ° ° x\ da alle anderen Faktoren gleich 1 werden. Beachten wir beides beim Grenzübergang F-+ oo, so erhalten wir als Formel für die Poissonsche Verteilung: / (X)
=
x,\ er
(23)
9 ) Demgegenüber ist das Vorliegen einer Normalverteilung daran gebunden, daß F • p sehr groß ist.
6
Haseloff, Statistik,
4. Aufl.
82
Statistische Beschreibung. Verteilungen
Hier ist hervorzuheben, daß sich die Parameter der PoissonVerteilung vergleichsweise leicht bestimmen lassen, da die als die Elemente der Formel sich manifestierenden Realbedingungen mit den Parametern der Grundgesamtheit direkt verknüpft sind. So stellt sich vor allem das arithmetische Mittel als das Produkt von Variationsmöglichkeit und Eintrittswahrscheinlichkeit dar 10 ). V=
(24)
Die Standardabweichung der Poisson-Verteilung ist dann die Quadratwurzel aus dem arithmetischen Mittel der Verteilung: ct = VJt =
(25)
Die Aussagefunktion der Poisson-Verteilung soll das folgende Beispiel verdeutlichen. Beispiel: Zur Erfolgskontrolle einer Werbeaktion und zur Überprüfung der Prognose wurden Werbemittel in n — 472 gleichgroßen Ortschaften der B R D gestreut. Als Erfolg wurde die Einsendung eines Coupons gezählt. Es kam zu 441 Coupon-Reaktionen. Die mittlere Anzahl von Coupon-Reaktionen pro Ort beträgt also (j, = 4 4 1 : 4 7 2 = 0,9343. Für den Fall, daß die Bevölkerungsstruktur der Ortschaft für den Erfolg der Werbeaktion bedeutungslos wäre, müßte die Verteilung der Coupon-Reaktionen zufällig sein, d. h. in diesem Falle der Poisson-Verteilung folgen. Für diesen Fall müßte die tatsächliche Verteilung der Coupon-Reaktionen hinreichend mit der Verteilung nach Formel (23) übereinstimmen. ,, . 0,9343* • e"0,9343 / (x) = r n= xl
0,9343* • 185,389 x!
Hier sei jedoch hervorgehoben, daß die Rechenarbeit durch die Verwendung von Logarithmen stark vereinfacht werden kann. Die hierzu erforderliche Formel lautet: log f (x) = x • log 0,9343 + log 185,389 — log (xl). Danach berechnen sich die Werte der Spalte (2) in der Tabelle 28. Unser Beispiel zeigt, daß die Übereinstimmung der empirischen und der nach Poisson errechneten Daten so groß ist, daß tatsächlich angenommen werden kann, daß der Erfolg der Werbeaktion nicht von Einflußgrößen abhängig ist, die mit der Größe, dem Charakter oder der Struktur der beworbenen Ortschaften verknüpft sind. Diese Erkenntnis schließt natürlich nicht aus, daß die Zufallsverteilung Ausdruck einer großen Anzahl anderer Einflußgrößen ist, die beispielsweise mit dem Alter, Geschlecht oder Einkommen 10 ) Hier ist zu beachten, daß wir es im folgenden nicht mit den aus der Stichprobe bestimmten Maßwerten zu tun haben, sondern eben mit den Parametern der Population. Die Parameter werden deshalb — wie wir es später auch tun werden — mit griechischen Buchstaben symbolisiert.
Normalverteilung
83
Tabelle 28 (2)
(3)
X
/(*)
/
0 1 2 3 4 5 6 7
185,4 173,2 80,9 25,2 5,9 1.1 0,2 0,0
186 171 76 28 9 1 0 1
0 171 152 84 36 5 0 7
471,9 r i = 472
455
(1)
nach P O I S S O N errechnet: F u = — = 0,93 n = 0,97
(4)
(5)
f-x
(7)
(6) (x—
(»—«) 0,96 0,04 1,04 2,04 3,04 4.04 5,04 6,04
f(x-x)
0,92 0,00 1,08 4,16 9,24 16,32 25,40 36,48
171 0 82 116 83 16 0 36 504
empirisch ermittelt:
_ _ Sf-x X~~ . = J
/
__ 455 = 0,96 472" ^
?
-
f
m
= ^
=
^
der umworbenen Individuen zusammenhängen. Nur die Frage der Ortsabhängigkeit des Werbeeinsatzes wurde geklärt. Normalverteilung
Die Normalverteilung ist für die Statistik von größter Bedeutung. Sie wurde nach M O I Y R E ( 1 7 3 3 ) und L A P L A C E ( 1 7 7 4 ) von G A U S S ( 1 8 2 3 ) berechnet. G A T J S S gab ihr damals den Namen „ F e h l e r kurve", weil er sie im Zusammenhang mit den bei physikalischen Messungen entstehenden Fehlern erarbeitete. Auch heute noch wird bei entsprechenden Problemen von „Fehlerkurve" gesprochen. Ein typisches Problem solcher Art ist die vielfache Wiederholung von Messungen an ein und demselben Objekt, zum Beispiel der Abstand eines Doppelsterns. Alle diese Messungen weichen mehr oder weniger stark voneinander ab. Bei hinreichend großer Anzahl ist jede der Abweichungen von dem zu suchenden tatsächlichen Wert als zufällig zu betrachten, sofern keine systematischen Fehler auftreten (durch Temperaturschwankungen, Wechsel des Versuchsleiters u. ä.). Alle Meßwerte gruppieren sich dabei wie einer Regel entsprechend um einen Mittelwert. Eine wichtige Leistung von C. F. G A U S S ist es nun, diese „Regel" als eine mathematische Gesetzmäßigkeit formuliert zu haben, die die Gruppierung der Meßwerte um den Mittelwert aufzeigt. Es gibt viele theoretische und praktische Anlässe dafür, eine große Zahl von Messungen an ein und demselben Objekt zu vollziehen. Jedoch besteht ein wichtiger Unterschied zwischen biologischen, anthropologischen und verhaltenswissenschaftlichen Mes6*
84
Statistische Beschreibung. Verteilungen
sungen einerseits und denjenigen der klassischen Physik andererseits11) . Im ersten Falle beschränken sich die Messungen nämlich nicht auf ein einzelnes Objekt. Vielmehr konstituiert jede Messung ein neues Objekt, da der „Gegenstand" der Messung im theoretischen Kontext nur als Meßwert figuriert. Denken wir an die Verteilung von Intelligenzquotienten, die mit Hilfe eines Tests ermittelt •wurden, so ist die dabei sich ergebende Verteilung der GATTSSschen Fehlerkurve in anderer Hinsicht hinreichend ähnlich. Die Unterschiede der jeweils ermittelten Intelligenzmaße resultieren aus einer Fülle unterschiedlicher Einflußgrößen. Hier sind die unterschiedlichen biologischen Leistungsdeterminationen hervorzuheben ; hinzu kommen stark differierende Erziehungsverhältnisse und Ausbildungsmöglichkeiten, schließlich fügt die Testbatterie selbst einige (nur teilweise kontrollierbare) Bedingungen hinzu. Alle diese Einflußgrößen wirken in ihrem Zusammenspiel wie die Nägel auf dem GALTONbrett und bedingen daher, sofern allerdings genügend viele Fälle vorhanden sind, eine GAUsssche Normalverteilung. Immer natürlich vorausgesetzt, daß keine systematischen — z. B . im Untersuchungsverfahren oder in der Auswahl der Untersuchungspersonen begründeten — Fehler den Kurvenverlauf der Ergebnisse verzerren. Die Normalverteilung stellt nun den weitaus wichtigsten Grenzfall der Binomialverteilung dar. Allgemein kann gesagt werden: Die Binomialverteilung geht dann in die NormalVerteilung über, wenn F gegen Unendlich geht und p = 0,5 ist. Bedingungen für das Auftreten der Normalverteilung sind, daß unendlich viele Variationsmöglichkeiten zugänglich sind und daß die Abweichung vom Mittelwert nach jeder Seite hin gleichwahrscheinlich ist. Die dabei entstehende Verteilungskurve ist durch eine Exponentialfunktion12) beschreibbar. In der hier verwendeten Symbolsprache hat die die Normalverteilung betreffende Exponentialfunktion folgendes Aussehen : _ (x-yi)' f=U-e (26) Dabei ist e — wie schon gesagt — die Basis der natürlichen Logarithmen, also e = 2,7183. f^ ist die Höhe der Ordinate am Mittelwert ¡j,. In der Normalverteilung beträgt gleich \ja Yi^., für den Fall, daß die Fläche zwischen Kurve und Abszissenachse gleich 1 ist. Die Gestalt dieses Ausdrucks für die Höhe der Gaußschen Verteilung im Mittelwert hängt damit zusammen, daß in der Fehn ) In der modernen Atomphysik haben wir entsprechende Verhältnisse, die gleichfalls keine wiederholten Messungen am selben Objekt erlauben. 12 ) Exponentialfunktionen sind von der Art f (z) = ez.T>ie hier hochgestellte Veränderliche z ist der Exponent.
Normalverteilung
85
lertheorie die Treffgenauigkeit („Akkuranz", Anm. 3, S. 76) das Reziprok der Standardabweichung multipliziert mit [/2 ist. Dieses Maß entspricht dem Wert h. Damit gewinnt die Formel für die Normalverteilung folgende Gestalt: / = _A_ . Vn
e-h\x-v)*
Dabei ist h = — — . Wenn h anwächst, wird die Normalverteia-V 2
lung schmaler, d. h. sie bekommt einen positiven Exzeß. Demgemäß mißt h auch die Dichte, mit der die Beobachtungen um ¡j, streuen. Die wichtigsten Eigenschaften der Normalverteilung werden in der Figur 17 veranschaulicht.
Fig. 17
Diese wichtigen Eigenschaften sind die folgenden: 1. Die Kurve reicht auf der x-Achse von — oo bis + oo. Das bedeutet, daß die Normalverteilung — anders als die Binomialverteilung — unendlich viele Variationsmöglichkeiten F aufweist. Da jede einzelne Variationsmöglichkeit besetzt sein muß, muß zwangsläufig auch n unendlich groß sein. 2. Die Kurve hat ihr Maximum bei ¡x und fällt von dort aus nach beiden Seiten symmetrisch ab. 3. Die beiden steilsten Anstiege der Kurve (ihre sogenannten Wendepunkte) liegen bei (i — a und bei ^ + er, so daß der zwischen ihnen liegende Abszissenabschnitt gleich 2 a ist. 4. Die Tangenten in den Wendepunkten schneiden die Abszissenachse in den Punkten /x — 2 a und ¡i + 2 a.
Statistische Beschreibung. Verteilungen
86
5. Es ist genau bekannt, wieviel Prozent der Fälle oder Beobachtungen in bestimmten Abschnitten der Normalverteilung zu liegen kommen.
Mit Hilfe der Berechnung der Standardabweichung gelangen wir zu einer statistisch wichtigen und praktischen Ordnung der Fälle: 68,3% aller Beobachtungen liegen um den Mittelwert ¡j, und innerhalb der Grenzen, die durch (ß + o) und (¡u, — er) definiert sind. 95,5% aller Fälle oder Beobachtungen liegen zwischen den Grenzen (/» + 2 p > 1%
Sind die Stichproben groß (n > 30) und sind gleich groß, kann Formel (51)
und s2 ungefähr
r »i »a im allgemeinen als angenäherter Nenner in Formel (60) angewendet werden. Dabei ist die Annahme gemacht, daß Sj = s2 = a ist. Signifikanz von Unterschieden zwischen paarweise geordneten Gruppen Beim Vergleichen zweier Stichproben kann ein irrelevanter Faktor einen Unterschied zwischen den Mittelwerten verursachen, ohne daß ein für die Fragestellung bedeutsamer Unterschied besteht. Will man z. B . die Wirkung zweier Unterrichtsmethoden untersuchen, dann kann die eine Methode schon deshalb bessere Resultate ergeben, weil die nach ihr unterrichteten Schüler intelligenter als die Schüler der anderen Gruppe sind, bessere Vorkenntnisse haben usw. Diese Fehlerquelle läßt sich dadurch unter Kontrolle halten, daß man die beiden Stichproben nach dem Zufall
Paarweise geordnete Gruppen
169
auswählt. Eine andere und oft besonders effektive Kontrollmöglichkeit bietet die Auswahl solcher Vpn, die paarweise in den Merkmalen oder Eigenschaften übereinstimmen, die für die Untersuchung wichtig sind. Diese Paare werden getrennt und zwei verschiedenen Stichproben zugeteilt. Die Paare sollen in jeder Hinsicht so ähnlich wie möglich sein, außer natürlich in der Variablen, die untersucht werden soll. Ein typisches Beispiel für derartige Untersuchungspaare bilden eineiige Zwillinge. Bei der Überprüfung der Differenz d zwischen paarweise aufgeteilten Gruppen bedient man sich der Formel t = -3— = — ^ |/ Z(d-, yfc F ]/ n(n n(n— — 1)
(65)
d ist der Mittelwert der Differenzen zwischen n Paaren und d die Differenz zwischen den einzelnen Paaren im Hinblick auf untersuchungsrelevante Merkmale, Eigenschaften oder Leistungen. 1/ j) 2 sd = 1/ - — ^ — — schätzt die Standardabweichung der Unterschiede zwischen Paaren. Diese muß mit |/jT dividiert werden, um die Standardabweichung in der Stichprobenverteilung der durchschnittlichen Abweichungen d errechnen zu können. Der Freiheitsgrad beträgt auch in diesem Falle n — 1. Beispiel: In einem Vergleich zweier Erziehungsmethoden wurden 10 Paare eineiiger Zwillinge in zwei Gruppen aufgeteilt, so daß jede Gruppe jeweils einen Zwilling jeden Paares erhielt. Die eine Stichprobe wurde nach Methode A, die andere nach Methode B unterwiesen, um feststellen zu können, welche der beiden Methoden die besten Erfolge erzielt. Die Ergebnisse nach Methode A finden wir in Spalte 1 der Tabelle 50 und die Ergebnisse der Methode B in Spalte 2. Tabelle 50 (2) (3) (4) (5) (6) (1) 19 16 13 25 29 15 24 20 0 20
26 20 8 15 34 3 23 18 0 20
d
d—d
(d — df
d2
— 7 — 4 + 5 + 10 — 5 + 12
— 8,4 — 5,4 + 3,6 + 8,6 — 6,4 + 10,6 — 0,4 + 0,6 — 1,4 — 1,4
70,56 29,16 12,96 73,96 40,96 112,36 0,16 0,36 1,96 1,96
49 16 25 100 25 144 1 4 0 0
344,40
364
+ +
1
2 0 0
14
170
Schätzungs- und Prüfverfahren. Hypothesenprüfung
n
10
a
'
I' » ( » — 1)
C 10x9
Freiheitsgrad = 10 — 1 = 9 p > 20% In Spalte 3 sind die Differenzen zwischen den Werten der Spalte 1 und 2 aufgeführt. Spalte 4 enthält die Abweichungen dieser Differenzen vom Durchschnittsunterschied d = 1,4 Punkte und Spalte 5 die Quadrate dieser Abweichungen. Der durchschnittliche Unterschied erweist sich als nicht signifikant, da der i-Wert nur 0,71 beträgt. Wie man Tabelle K entnehmen kann, beträgt bei 9 Freiheitsgraden die Wahrscheinlichkeit 20%, daß man einen i-Wert größer als + 1,38 oder kleiner als —1,38 erhält. Der Wert Z{d — 5)2 in Formel (65) läßt sich leichter berechnen nach der Formel (66) Die Formel (65) erhält damit folgendes Aussehen: t = —
**
(67)
— 1) Das Beispiel der Tabelle 50 ergibt nach dieser Formel \
t -
^
2
'364-(ii) .10
10-
n(n
-; Q 71
=
l/
344 4
' 10 • 9
^
2
Ed erhält man dabei aus Spalte 6 der Tabelle 50. Im übrigen geschieht die Berechnung nach Formel (65). Signifikanz von Unterschieden zwischen Standardabweichungen Die Nullhypothese a 1 — 30) nach Formel
überprüft. 6 ) Die Prüfung von Differenzen zwischen Standardabweichungen (Varianzen) kleiner Stichproben wird von Dixon-Massey, S. 102—110, besprochen.
Prozent werte
171
Beispiel: Eine Intelligenzprobe ergab für 100 Jungen die Standardabweichung s1 = 14,5 und für 200 Mädchen s2 = 15,3. Die Nullhypothese a t — cr2 = 0 soll überprüft werden. Die Alternativhypothese lautet: a 1 — cr2 gg 0. Die Werte unseres Beispieles eingesetzt in die Formel (68) ergeben: 14,5 — 15,3
0,8
V
(14,5)2 (15,3)2 2 X 100 ' 2 x 100
P > 50%.
^1,64
= — 0,62
Für einen Standardwert z = — 0,62 können wir aus Tabelle I entnehmen, daß die Nullhypothese mehr als 50% Wahrscheinlichkeit hat. Der Unterschied zwischen den Standardabweichungen ist also nicht signifikant. Signifikanz von Unterschieden zwischen Prozentwerten Will man die Differenz zwischen den beiden Prozentwerten P x und P 2 untersuchen, wenn sie aus zwei großen Stichproben Wj und « 2 gewonnen wurden, dann benutzt man eine Formel die derjenigen analog ist, nach der man die Differenzen von Mittelwerten auf ihre Signifikanz hin prüft. Die Standardabweichung für die Differenz zwischen Prozentzahlen ist nach Formel (65):
yz
(100 — P J
P 2 (100 — p a :
Da die Nullhypothese besagt, daß kein signifikanter Unterschied zwischen den Prozentzahlen vorliegen soll, wenn wir versuchsweise Px — P2 = Pt setzen, geht unsere Formel (55) über in: ^ - P ^ l / ^ i o o - p ^ - f - ^ )
(69)
PT ist die Prozentzahl, die man durch das Mitteln der Prozentwerte beider Stichproben erhält, und die die bestmögliche Schätzung des Prozentwertes der Population repräsentiert. Zur Prüfung der Nullhypothese wird nun ein z-Wert nach folgender Formel gebildet: Pi-P*
(70)
Pt {100 —PT)
Beispiel: Es soll untersucht werden, ob es einen Unterschied zwischen den Bevölkerungen zweier Städte im Hinblick auf das
172
Schätzungs- und Prüfverfahren. Hypothesenprüfung
Verhältnis zwischen Schwimmern und Nichtschwimmern gibt. Aus der Bevölkerung von Stadt I wurde eine Stichprobe von 150 Vpn genommen, unter denen sich 72 Schwimmer fanden. I n der Stichprobe von 250 Vpn. der Stadt I I konnten 130 Personen schwimmen. 72 • 100
Der Prozentwert der Schwimmer beträgt demnach P1 = ——— = 48%undPa = i ? ^
= 5 2 %.
In beiden Stichproben zusammen finden sich unter 400 Vpn. 202 Schwimmer. Dies ergibt den Prozentwert PT = 2 0 2^Q• 1 0 0 = 5®>5Nach Formel (70) nimmt z dann folgenden Wert a n : 4 8
L/
5 0
'
5
-
4 9
~52 '
5
— - n . «
(W
+
I
)
Wie sich aus Tabelle I ablesen läßt, ist der Unterschied nicht signifikant, da 42,4% der Normalverteilung außerhalb des Intervalls z = i 0,8 liegen. Signifikanz von Korrelationskoeffizienten Die Stichprobenverteilung von PEAitsoN-Korrelationen folgt nicht der Nor mal Verteilung. Wie F I S H E R nachgewiesen hat, ist die Verteilung stark asymmetrisch. Die Hypothesenprüfung an PEAitsoN-Korrelationen oder an Unterschieden zwischen ihnen macht daher unbedingt die Transformation der Korrelationen in z-Werte notwendig 6 ). Dies geschieht wie wir bereits ausführten, nach F I S H E R mit Hilfe der Formel (56) 1
l + r
'" p' = - ^r " ' -y : • r 2 ' In
Um die Umrechnung von r in zp nach dieser Formel zu erleichtern, haben wir im Tabellenanhang eine Umrechnungstafel (Tab. N) beigefügt. In der ersten Spalte stehen die z^-Werte mit einer Dezimale; die zweite Dezimale findet sich in der obersten Zeile. Die Unsicherheit (mittlerer Fehler) von zp beträgt "t =
/
1
(71)
Es ist bedeutsam, daß man einer Korrelation nicht ohne weiteres anzusehen vermag, ob sie einen statistisch verläßlichen Zusammenhang wiedergibt. Durch die Untersuchung des Verhältnisses von •) Genaueres siehe z. B . GÜILFORD, Seite 194, oder P . R . HOFSTÄTTEE,
Seite 94 ff.
173
Korrelationskoeffizienten
z zu Oz können wir dies prüfen. Hierbei orientiert man sich meist an der 3ff-Grenze, die sichert, daß die fragliche Korrelation 99,7% Wahrscheinlichkeit hat; z soll also größer als 3CT2 sein. Ist die Korrelation sehr klein, liegt sie in der Nähe von 0, und handelt es sich gleichzeitig um eine größere Stichprobe, so können wir auf die «-Transformationen nach F I S H E R verzichten. Die Standardabweichung dieser Stichprobenverteilung errechnet sich dann nach der Formel J
(72)
r=o
Mit dieser Formel kann man die Nullhypothese prüfen. Der hierfür zuständige 7 ) 2-Wert kann nach folgender Formel gebildet werden: z = r ]/n — 1
(73)
Beispiel: In einer Stichprobe von 400 Schulanfängern, die im Zusammenhang mit einer Untersuchung zur Reifungsbeschleunigung erhoben wurde, ergab sich eine PEARSON-Korrelation zwischen Körpergröße und Intelligenz von r = 0,04. Wir stellen die Nullhypothese auf, daß die entsprechende Korrelation in der Gesamtpopulation 0 betrage. E s ergibt sich folgende Rechnung: z = 0,04 • j/400 — 1 = 0,80
Die Korrelation r = 0,04 weicht nicht signifikant von 0 ab, da nach Tabelle I Korrelationen größer als 0,04 und kleiner als — 0 , 0 4 rein zufällig in 42,4% aller Fälle vorkommen können. Die bisher genannten Prüfverfahren sind auch auf die Rangkorrelation R anwendbar, soweit ihre Bedingungen so sind, daß eine Umrechnung in r mit Hilfe von Formel (44) vorgenommen werden konnte. Einen anderen Weg müßten wir für den TauKoeffizienten beschreiten (vgl. Formel (45)). Ist n > 10, so läßt sich für R t ein normalverteilter kritischer Bruch bestimmen 8 ): •t"-1* (2 n + 5)
( 7 4)
1
J
') Zwar steht dieses z für ein standardisiertes r ; es ist jedoch nicht mit den z-Werten nach FISHER (Tab. N) zu verwechseln, sondern stellt einen auf die Normalverteilung bezogenen Näherungswert dar. _ 8
jl
) der kritische Bruch lautet im einzelnen: z = — -
-
Prüfen wir die Nullhypothese, so ist Jiz — 0 Außerdem gilt
= |/
s
Rt
-
174
Schätzungs- und Prüfverfahren. Hypothesenprüfung
Beispiel: (vgl. Beispiel S. 125) Nehmen wir an, der dort gewonnene Taukoeffizient wäre aus einer ausreichend großen Stichprobe gewonnen worden, so würde sich ergeben:
- - rv^ -
Wir könnten hier also die Nullhypothese mit einer Irrtumswahrscheinlichkeit von 6% zurückweisen.
KAPITEL 13
Entscheidungsstatistik Die Entscheidung über die Annahme oder Zurückweisung einer Hypothese setzt zunächst eine Erwartung hinsichtlich der Parameter der Grundgesamtheit voraus, auf die die Hypothese sich bezieht. So zum Beispiel erwartet man, daß 50% der möglichen Würfe mit einem Geldstück den Kopf zeigen oder daß 65% aller 10 bis 12jährigen Kinder eines Landes schwimmen können. Hiernach wäre dann zu prüfen, ob der Wert der untersuchten Stichprobe von der Grundgesamtheit abweicht (Alternativhypothese) oder ob die Stichprobe als dieser Grundgesamtheit entnommen aufgefaßt werden kann (Nullhypothese). Die tatsächlichen Parameter der Grundgesamtheit sind jedoch im allgemeinen unbekannt. Beim Werfen eines bestimmten Geldstücks zeigen in Wahrheit vielleicht 48,93% aller möglichen Würfe den Kopf oder es sind 69,2% der Kinder, die schwimmen können, ohne daß wir dies zunächst wissen. Die in Kapitel 12 besprochenen Methoden der Hypothesenprüfung testen den Grad der möglichen Übereinstimmung mehrfacher Stichprobenergebnisse (Stichprobenverteilung). Wir haben es bei der Hypothesenprüfung also mit den Fragen der Wiederholungsgenauigkeit (Präzision), nicht aber mit denen der Treffgenauigkeit (Akkuranz) zu tun (vgl. Seite 76). Gilt es nun, nach erfolgter Hypothesenprüfung eine konkrete Entscheidung zu treffen, so müssen wir diesen Umstand berücksichtigen. Wir haben uns beispielsweise zu fragen, welche Kosten mit einer gegebenenfalls durchzuführenden „akkuraten" Erhebung verbunden sind und ob der dadurch zu vermeidende Fehler und seine praktischen Auswirkungen zu den aufzuwendenden Kosten in einem angemessenen Verhältnis steht. Damit befinden wir uns mitten im Raum der sogenannten Entscheidungstheorie. Die in Wirtschaft und Militärwesen zunehmend wichtigen Probleme einer exakten Theorie der Entscheidung liegen außerhalb des hier gegebenen Rahmens. Jedoch sollen einige Hinweise zur Methodik rationaler Entscheidungen gegeben werden: (1) Entscheidungen werden möglich und notwendig, soweit Alternativen gesehen werden. Alternativen können nur bemerkt und
176
Schätzungs- und Prüfverfahren. Entscheidungsstatistik
erkannt werden, sofern entsprechende Erwartungen und Hypothesen bereitstehen. Die Entscheidungsalternativen können also — unerkannt bleiben, — vorgestellt, erwartet und irrtümlich angenommen oder — faktisch bestehen und als zutreffend erkannt sein. Damit wird ein Regelsystem erforderlich, das die methodische Auffindung und Prüfung tragfähiger Alternativen ermöglicht. (2) „Entscheidung" ist die Wahl einer unter mehreren (zumindest von zwei) Handlungsalternativen. Diese Wahl setzt eine vergleichende Bewertung der zugänglichen Alternativen voraus. Diese Bewertung der zugänglichen Alternativen erfolgt (2.1) gemäß der „Präferenzordnung" des Entscheidungsträgers, die sich aus seinem persönlichen Wertsystem einerseits und seiner Beurteilung der Lage andererseits ergibt. (2.2) gemäß der Wichtigkeitsordnung der angestrebten Ziele. „Ziele" haben in der modernen Entscheidungstheorie die Funktion von Entscheidungsregeln, die unter anderem eine Erfolgsmessung der aus der jeweiligen Alternativenwahl hervorgehenden Aktionen ermöglichen. (2.3) gemäß der jeweils erwarteten Folgen der Wahl der einzelnen Alternativen. Zur Bewertung der Entscheidungsauswirkungen ist zu klären: — die Wahrscheinlichkeit ihres Eintretens, — ihr erfaßbares Verhältnis von Nutzen und Schaden für den Entscheidungsträger, — die möglichen Rückwirkungen auf andere, von der Entscheidung betroffenen Personen oder Gruppen sowie deren mögliche Reaktionen, — der Sicherheitsgrad, mit dem die Entscheidungsfolgen identifiziert, isoliert und geprüft werden können sowie — der für die einzelnen, gegebenenfalls durchzuführenden Aktionen, jeweils erforderliche Aufwand hinsichtlich Information, Vorbereitungszeit und Kosten. Die zur Bewertung von Entscheidungsalternativen bereitstehenden statistischen Methoden sind allerdings noch nicht sehr ausgebaut, und weit davon entfernt, eine umfassende Theorie der Entscheidung tragen zu können. Dennoch ist ihre Anwendung unzweifelhaft bereits lohnend.
177
Entscheidungsstatistik
Gehen wir von einem Beispiel aus: Ein pharmazeutischer Hersteller steht vor der Wahl, gegebenenfalls ein neues Medikament einzuführen. Von dem bisherigen Medikament A kann nach hinreichenden Erfahrungen angenommen werden, daß es etwa jedem zweiten Patienten hilft. Welchen Heilerfolg müßte ein neues Medikament B (bei einer Stichprobe von 300 Patienten) haben, damit man das bereits bewährte Mittel A berechtigterweise zurücknimmt und statt dessen B in den Markt einführt 1 In der Entscheidung für oder gegen die Neueinführung von B können uns zwei Irrtümer unterlaufen. Mithin gehen wir bei der Entscheidung zwei Risiken ein: Tabelle 61 Entscheidung:
Unbekannte Wirklichkeit A ist besser B ist besser
Bei A bleiben B einführen
richtig
Risiko zweiter Art
Risiko erster Art
richtig
Wir kennen die therapeutische Wirkung von A im wesentlichen nur aus Berichten von niedergelassenen Ärzten. Die tatsächlichen durchschnittlichen Heilerfolge könnten sich bei methodischer Prüfung jedoch als seltener erweisen. Sie könnten statt der vorausgesetzten 50%-Wirkung nur bei 35% der Patienten einen Heilerfolg erbringen. Gegenüber dieser Möglichkeit ist nun folgendes zu berücksichtigen : erstens: B soll nur eingeführt werden, wenn seine therapeutische Wirksamkeit nach Prüfung an Kontrollgruppen signifikant größer als 50% ist. Dabei ist die Voraussetzung gemacht, daß A bereits 50% erreicht, zweitens: Erreicht die tatsächliche Heilwirkung von A jedoch nur 35%, so besteht die Gefahr, daß die Einführung von B zurückgestellt wird, weil eine Prüfung „nur" 45% Heilwirkungen zeigt. Dies wäre jedoch eine Fehlentscheidung, die auf einem statistischen Irrtum zweiter Art beruht. drittens: Es besteht also das Problem, daß die tatsächliche Heilwirkimg von A nicht sicher bekannt ist. Es ist auch möglich, daß A tatsächlich nicht 35 %, sondern 55 °/0 Heilwirkung erreicht. Für diesen Fall wäre es fehlerhaft, für B „nur" 50 °/0 Heilwirkung als hinreichend für die Neueinführung zu fordern. Geschieht dies doch, so begehen wir einen Irrtum erster Art. Wir führen dann B aufgrund unseres 12
Haseloff, Statistik,
4. Aufl.
178
Schätzunga- und Prüfverfahren. Entscheidungsstatistik Stichprobenergebnisses in Verbindung mit einer falschen Annahme über die Wirksamkeit von A ein, obwohl A etwa ebenso wirksam ist wie das neue Medikament B.
Wir sehen, daß wir uns beim Fällen einer Entscheidung über die Akkuranz unserer Kenntnisse der Populationsparameter Rechenschaft geben müssen. I n der Praxis kommt hinzu, daß Entscheidungen unterschiedliche Kosten verursachen. Man würde in unserem Falle vernünftigerweise schon aus Gründen der erheblichen zusätzlichen Werbeaufwendungen und Risiken, die mit einer Neueinführung verbunden sind, einen geringfügigen Fehler zweiter Art in Kauf nehmen. Auf jeden Fall ist es hier zweckmäßig, exakte Methoden zur Hilfe zu nehmen. Dabei ist davon auszugehen, wie wahrscheinlich es ist, daß wir einem Irrtum erster oder zweiter Art unterliegen. Die Irrtumswahrscheinlichkeit steigt bis zum „Entscheidungspunkt" (in unserem Beispiel = 50%) steil an und zwar bis auf 50%. In diesem Punkt sind die „richtige Entscheidung" und der „Irrt u m " gleich wahrscheinlich. Danach fällt dann die Kurve wieder steil ab. Sie hat folgende Verlaufsform:
Wirkung des Medikamentes in Prozent der geheilten Falle
Fig. 39 Den einzelnen Wert der Kurve können wir nach Formel (70) bestimmen. Zum Beispiel ergibt sich für den Fall, daß der tatsächliche Entscheidungspunkt bei 40% Hegt: _ d_ = 50 — 40 _ 10 _ Od~~ 1/40 • 60 ~ 2,83 ~ "3wr
\
Entscheidungsstatistik
179
Nach Tabelle H bedeutet dies 0,0% Wahrscheinlichkeit für einen Irrtum erster Art. Liegt der tatsächliche Entscheidungspunkt dagegen bei 45%, so gilt: _
50 — 45 _ _ 5 _
~ 587
1,1
300
Dies entspricht 4,5% Irrtumswahrscheinlichkeit. Es ist jedoch meist nicht übhch, eine Kurve der Irrtumswahrscheinlichkeit zu berechnen und zu zeichnen. Vielmehr werden sogenannte Operations- Charakteristik-Kurven
bevorzugt.
Die OC-Kurve ist in Figur 40 entsprechend der Figur 39 gezeichnet worden (bezieht sich also wieder auf n = 300):
20
40
SO
80
%
Wirkung des Medikamentes B in Prozent der geheilten Falle
Fig. 40
Die jeweilige Ordinate der OC-Kurve ist zunächst für Werte unterhalb des „Entscheidungspunkts" (50%) berechnet worden. Dabei wird davon ausgegangen, daß die Entscheidung richtig ist. Die Ordinate berechnet sich dann zu „1 minus der Irrtumswahrscheinlichkeit". Oberhalb von 50% stimmt die OC-Kurve mit der Irrtumswahrscheinlichkeits-Kurve in Figur 39 überein. Nun hatten wir uns aber klar gemacht, daß die Auswirkungen der Entscheidung für das neue Medikament B denjenigen des Beibehaltens von A ungleich sind. Vielmehr ist die Entscheidung für 12*
180
Schätzunga- und Prüfverfahren. Entscheidungsstatiatik
B immer mit einem Risiko zusätzlicher Art verbunden (Umstellungskosten, Werbekosten, werblicher Mißerfolg usf.) Daraus folgt, daß wir gut beraten sind, wenn wir den „Entscheidlingspunkt" nicht bei der nach Beobachtung geschätzten Wirkung von A ansetzen, sondern etwas höher. Aber wie hoch ? Aus der oben benutzten Formel (70) kann eine Formel abgeleitet werden, die es gestattet, diesen zur Berücksichtigung des Risikos gemäß höherer Forderung angesetzten Entscheidungspunkt zu berechnen. Diese Formel zur Festlegung des Entscheidungspunktes bei Einbeziehung des Risikos lautet 1 ): l / P - (100 —P) PmMo - P + z- (/ *
(75)
z drückt hier das Risiko aus, das wir einzugehen bereit sind. Je geringer die Irrtumswahrscheinlichkeit ist, die wir zu akzeptieren bereit sind, desto größer wird z zu wählen sein. Entscheiden wir uns in unserem Beispiel für z = 2, so berechnet sich pRiHko=
1/50-50 5 0 + 2 - ) / - ^ - = 55,8%
Wir legen damit also den Entscheidungspunkt an eine Stelle, für die (nach z = 2) nur noch eine Irrtumswahrscheinlichkeit von 2,3% gilt. Nur für den Fall also würden wir uns für die Aufgabe von A zugunsten von B entscheiden, daß die Untersuchung für das Medikament B eine Erfolgsquote erbringt, die höher als 55,8% ist. Wie sieht aber die OC-Kurve für den neu gewählten Punkt aus ? Die Kurve erfährt Punkt für Punkt um genau den Betrag von 5,8% eine Verschiebung nach rechts. Wir erhalten daher folgendes Bild: (siehe S. 181 oben) Die Figur 41 zeigt deutlich, daß das Risiko erster Art (in der Fig. geschwärzt) stark vermindert ist. Allerdings sind umgekehrt nun die „Irrtumsbeträge" für das Risiko zweiter Art erhöht. Wir würden einer Selbsttäuschung erliegen, uns an Figur 40 zurückzuerinnern und diese als „im Grunde" gültig für das Risiko zweiter Art erklären. Die hier dargestellte Operations-Charakteristik-Kurve für Differenzen von Prozentwerten berechnet sich für andere Parameter nach den jeweils entsprechenden, in Kapitel 12 diskutierten ForFür n < 100 muß noch der Korrekturbetrag 100/2 • n hinzugezählt werden.
Entscheidungsstatistik
181
bedeutsames Risiko erster Art
t
100
%
1
80
Fehler erster Art A
Fehler zweiter Art A
Ü
^ | 60 Jb rS i l 1 ^ 1
20 1 20
1 W neuer
l
' SO
.
so %
Entscheidungspunkt
Wirkung in Prozent der geheilten Fälle
Fig. 41 mein. Weiter ist darauf hinzuweisen, daß bei kleinen Stichproben (n < 30) nicht mehr mit z gerechnet werden darf. Hinzu kommt, daß wir auch nicht mehr mit der Normalverteilung rechnen können, wenn der Entscheidungspunkt stark von 50% abweicht und damit am oberen oder unteren Ende der Skala liegt. Auch wenn wir eine Normalverteilung nicht voraussetzen können, sondern eine diskontinuierliche Verteilung (wie z. B. die Binomialverteilung) vorliegt, müssen kompliziertere als der hier dargestellte Rechenweg beschritten werden2). (Siehe weiter Kap. 16.) 2 ) siehe hierzu E. WEBEB, Grundriß der biologischen Statistik, 4. Auflage, 320ff., 1961.
KAPITEL
14
Prüfverteilungen Die Berechnung von Mutungsintervallen, von Signifikanzen sowie die Prüfung einfacher Hypothesen bedient sich der Normalverteilung oder bei sehr kleinen Stichproben der t- Verteilung. Die Prüfung komplizierterer Hypothesen, wie sie beim Vergleich von Verteilungen oder im Umkreis der Varianzanalyse auftreten, bedarf besonderer Prüfverteilungen. Die beiden wichtigsten sind die Chi-Quadrat- und die -F-Verteilung. Wir wollen beide Verteilungen kurz betrachten: Verteilung 1 )
Diese Verteilung ist von großer Wichtigkeit, wenn wir zwei Verteilungen miteinander zu vergleichen haben, so etwa eine empirisch ermittelte Stichprobenverteilung mit einer erwarteten Verteilung. Die in der Stichprobe gefundene Verteilung wird bei jedem Variablewert mehr oder weniger von der erwarteten Verteilung abweichen. Hätten wir nur eine einzige Abweichung auf ihre Zufälligkeit hin zu beurteilen, so würde dies keine Schwierigkeit bedeuten, weil die möglichen Differenzen wiederum einer Normalverteilung folgen. In unserem Fall nun kann nicht mehr mit der Normalverteilung operiert werden, denn wir haben es ja mit n verschiedenen, voneinander abhängigen Differenzen zu tun. Die Zufälligkeit dieser Differenzen wird nun nicht für jede einzelne Differenz gesondert überprüft. Vielmehr findet die Überprüfung an der Summe der Differenzenquadrate statt, die wir als Chi-Quadrat ( x 2 ) bezeichnen. Die Berechnung der Wahrscheinlichkeit dafür, daß jene Summe zwischen y2 und (% + d liegt, führt schließlich zu der %2-Verteilung. Sie folgt der Funktion: n — 2
1 • i f )
2
-
^
x
2
'
(76)
!) Lies: „Chi-Quadrat-Verteilung". —• Die mit dieser Verteilung verbundene Methode wurde von K. PEABSON entwickelt : On the J;2-Test of Goodness of Fit. Biometrica. Vol. 14, 1922/23.
183
F-Verteilung
Diese Funktion kann nur positive Werte annehmen. Ab n S; 3 beginnt die Kurve im Ursprung und nähert sich mit wachsendem n der NormalVerteilung. Dies ist recht deutlich an der folgenden Figur zu erkennen: V 0,5
t
«f
0*
V 3_
0,1
0
B
f x
1
S —
8
10
Flg. 4 2
Die Figur 42 zeigt auch deutlich, daß mit wachsendem n die Kurve zunehmend flacher und zugleich symmetrischer wird. Es läßt sich — wie bereits gesagt — zeigen, daß sie für wachsendes n schließlich in die Normalverteilung übergeht. Andererseits ist die Funktion auch mit der t-Verteilung verwandt. Denn auch in ihr erscheint n als ein Ausdruck für den Umfang der Teilmenge. Auf die praktische Anwendung dieser Verteilung kommen wir im folgenden Kapitel 15 „Übereinstimmung empirischer und theoretischer Verteilungen" zurück. Schließlich sei noch auf die F-Verteilung nach R. A. F I S H E R hingewiesen. Sie ist von Bedeutung für die statistische Arbeit mit der Varianzanalyse (Kapitel 19), dann nämlich, wenn wir das Verhältnis der Varianzen zweier verschieden großer Stichproben beurteilen wollen, die beide aus derselben normalverteilten Population entnommen wurden. Die Varianzen beider
184
Schätzungs- und Prüfverfahren. Prüfverteilungen
Stichproben folgen den y?-Verteilungen (p{%\) und
x
,
13
* = !ö
,,
x 4
~
* 5
7 — log X 10 — 1 X 10e^j
Anhang. Arbeitstabellen
288 2
0
1
10 11 12 13 14
0000 0414 0792 1139 1461
0043 0453 0828 1173 1492
0086 0128 0492 0531 0864 0899 1206 1239 1523 1553
15 16 17 18 19
1761 2041 2304 2553 2788
1790 2068 2330 2577 2810
1818 1847 1875 2095 2122 2148 2355 2380 2405 2601 2625 2648 2833 2856 2878
20 21 22 23 24
3010 3032 3054 3075 3222 3243 3263 3284 3424 3444 3464 3483 3617 3636 3655 3674 3802 3820 3838 3856
25 26 27 28 29
3979 3997 4150 4166 4314 4330 4472 4487 4684 4639
80 31 32 33 34
4771 4786 4800 4814 4914 4928 4942 4955 5051 5065 5079 5092 5185 5198 5211 5224 5315 5328 5340 5353
35 36 37 38 39
5441 5563 5682 5798 5911
5453 5465 5575 5587 5694 5705 5809 5821 5922 5933
40 41 42 43 44
6021 6128 6232 6335 6435
45 46 47 48 49
Num.
3
4
5
6
7
8
9
D
0170 0212 0253 0294 0334 0374 40 0569 0607 0645 0682 0719 0755 37 0934 0969 1004 1038 1072 1106 33 1271 1303 1335 1367 1399 1430 31 1584 1614 1644 1673 1703 1732 29 1903 2175 2430 2672 2900
1931 2201 2455 2695 2923
1959 2227 2480 2718 2945
2014 2279 2529 2765 2989
27 25 24 23 21
3096 3304 3502 3692 3874
3118 3324 3522 3711 3892
3139 3345 3541 3729 3909
3160 3181 3201 3365 3385 3404 3560 3579 3598 3747 3766 3784 3927 3945 3962
21 20 19 18 17
4031 4048 4200 4216 4362 4378 4518 4533 4669 4683
4065 4232 4393 4548 4698
4082 4249 4409 4564 4713
4099 4116 4265 4281 4425 4440 4579 4594 4728 4742
4133 4298 4456 4609 4757
17 16 16 15 14
4829 4969 5105 5237 5366
4843 4983 5119 5250 5378
4857 4871 4886 4997 5011 5024 5132 5145 5159 5263 5276 5289 5391 5403 5416
4900 5038 5172 5302 5428
14 13 13 13 13
5478 5599 5717 5832 5944
5490 5611 5729 5843 5955
5502 5623 5740 5855 5966
5514 5635 5752 5866 5977
5527 5539 5647 5658 5763 5775 5877 5888 5988 5999
5551 5670 5786 5899 6010
12 12 12 12 11
6031 6138 6243 6345 6444
6042 6053 6149 6160 6253 6263 6355 6365 6454 6464
6064 6170 6274 6375 6474
6075 6085 6180 6191 6284 6294 6385 6395 6484 6493
6096 6201 6304 6405 6503
6107 6212 6314 6415 6513
6117 6222 6325 6425 6522
11 10 10 10 10
6532 6628 6721 6812 6902
6542 6637 6730 6821 6911
6551 6646 6739 6830 6920
6561 6656 6749 6839 6928
6571 6665 6758 6848 6937
6580 6675 6767 6857 6946
6590 6684 6776 6866 6955
6599 6693 6785 6875 6964
6609 6702 6794 6884 6972
6618 6712 6803 6893 6981
10 9 9 9 9
50 51 52 53 54
6990 7076 7160 7243 7324
6998 7007 7084 7093 7168 7177 7251 7259 7332 7340
7016 7101 7185 7267 7348
7024 7033 7110 7118 7193 7202 7275 7284 7356 7364
7042 7126 7210 7292 7372
7050 7135 7218 7300 7380
7059 7143 7226 7308 7388
7067 7152 7235 7316 7396
9 8 8 8 8
N
0
6
7
8
9
D
1
4014 4183 4346 4502 4654
2
3
4
5
1987 2253 2504 2742 2967
Log 1 --1000 Num.
2
0
1
3
55 56 57 58 59
7404 7482 7559 7634 7709
7412 7490 7566 7642 7716
60 61 62 63 64
7782 7789 7796 7853 7860 7868 7924 7931 7938 7993 8000 8007 8062 8069 8075
7803 7875 7945 8014 8082
65 66 67 68 69
8129 8136 8195 8202 8261 8267 8325 8331 8388 8395
70 71 72 73 74
8451 8513 8573 8633 8692
75 76 77 78 79
5
6
7
8
9
D
7459 7536 7612 7686 7760
7466 7543 7619 7694 7767
7474 7551 7627 7701 7774
8 8 7 8 8
7839 7910 7980 8048 8116
7846 7917 7987 8055 8122
7 7 6 7 7
8176 8182 8241 8248 8306 8312 8370 8376 8432 8439
8189 8254 8319 8382 8445
6 7 6 6 6
8494 8555 8615 8675 8733
8500 8561 8621 8681 8739
8506 8567 8627 8686 8745
7 6 6 6 6
7435 7513 7589 7664 7738
7443 7451 7520 7528 7597 7604 7672 7679 7745 7752
7810 7882 7952 8021 8089
7818 7889 7959 8028 8096
7825 7832 7896 7903 7966 7973 8035 8041 8102 8109
8142 8209 8274 8338 8401
8149 8156 8215 8222 8280 8287 8344 8351 8407 8414
8162 8228 8293 8357 8420
8169 8235 8299 8363 8426
8457 8519 8579 8639 8698
8463 8525 8585 8645 8704
8470 8531 8591 8651 8710
8476 8537 8597 8657 8716
8482 8488 8543 8549 8603 8609 8663 8669 8722 8727
8751 8808 8865 8921 8976
8756 8814 8871 8927 8982
8762 8820 8876 8932 8987
8768 8825 8882 8938 8993
8774 8779 8831 8837 8887 8893 8943 8949 8998 9004
8785 8791 8842 8848 8899 8904 8954 8960 9009 9015
8797 8854 8910 8965 9020
8802 8859 8915 8971 9025
6 6 6 5 6
80 81 82 83 84
9031 9085 9138 9191 9243
9036 9090 9143 9196 9248
9042 9096 9149 9201 9253
9047 9101 9154 9206 9258
9053 9106 9159 9212 9263
9063 9069 9117 9122 9170 9175 9222 9227 9274 9279
9074 9128 9180 9232 9284
9079 9133 9186 9238 9289
6 5 5 5 5
85 86 87 88 89
9294 9345 9395 9445 9494
9299 9350 9400 9450 9499
9304 9355 9405 9455 9504
9309 9360 9410 9460 9509
9315 9320 9325 9365 9370 9375 9415 9420 9425 9465 9469 9474 9513 9518 9523
9330 9380 9430 9479 9528
9335 9385 9435 9484 9533
9340 9390 9440 9489 9538
5 5 5 5 4
90 91 92 93 94
9542 9547 9552 9590 9595 9600 9638 9643 9647 9685 9689 9694 9731 9736 9741
95 96 97 98 99
9777 9823 9868 9912 9956
N
O
19
7419 7427 7497 7505 7574 7582 7649 7657 7723 7731
4
289
9782 9786 9827 9832 9872 9877 9917 9921 9961 9965 I
Haseloff, Statistik,
2 4. Aufl.
9058 9112 9165 9217 9269
9557 9562 9605 9609 9652 9657 9699 9703 9745 9750
9566 9614 9661 9708 9754
9571 9576 9581 9586 9619 9624 9628 9633 9666 9671 9675 9680 9713 9717 9722 9727 9759 9763 9768 9773
4 5 5 4 4
9791 9836 9881 9926 9969
9795 9841 9886 9930 9974
9800 9845 9890 9934 9978
9805 9850 9894 9939 9983
9809 9854 9899 9943 9987
9814 9859 9903 9948 9991
9818 9863 9908 9952 9996
5 5 4 4 4
3
4
5
6
7
8
9
D
Anhang. Arbeitstabellen
290
C. Log 1000—2000 Diese Arbeitstabelle ist die Fortsetzung der vorangegangenen Tabelle. Sie enthält die Logarithmen der Zahlen 1000—2000. Zum Umgang mit dieser Tabelle siehe Einführung zu A. Num.
0
1
2
3
4
5
6
7
8
9
D
100 101 102 103 104
0000 0043 0086 0128 0170
0004 0048 0090 0133 0175
0009 0052 0095 0137 0179
0013 0056 0099 0141 0183
0017 0060 0103 0145 0187
0022 0065 0107 0149 0191
0026 0069 Olli 0154 0195
0030 0073 0116 0158 0199
0035 0077 0120 0162 0204
0039 0082 0124 0166 0208
4 4 4 4 4
105 106 107 108 109
0212 0253 0294 0334 0374
0216 0257 0298 0338 0378
0220 0261 0302 0342 0382
0224 0265 0306 0346 0386
0228 0269 0310 0350 0390
0233 0273 0314 0354 0394
0237 0278 0318 0358 0398
0241 0282 0322 0362 0402
0245 0286 0326 0366 0406
0249 0290 0330 0370 0410
4 4 4 4 4
110 111 112 113 114
0414 0453 0492 0531 0569
0418 0457 0496 0535 0573
0422 0461 0500 0538 0577
0426 0465 0504 0542 0580
0430 0469 0508 0546 0584
0434 0473 0512 0550 0588
0438 0477 0515 0554 0592
0441 0481 0519 0558 0596
0445 0484 0523 0561 0599
0449 0488 0527 0565 0603
4 4 4 4 4
115 116 117 118 119
0607 0645 0682 0719 0755
0611 0648 0686 0722 0759
0615 0652 0689 0726 0763
0618 0656 0693 0730 0766
0622 0660 0697 0734 0770
0626 0663 0700 0737 0774
0630 0667 0704 0741 0777
0633 0671 0708 0745 0781
0637 0641 0674 0678 0711 0715 0748 0752 0785 0788
4 4 4 3 4
120 121 122 123 124 125 126 127 128 129
0792 0828 0864 0899 0934 0969 1004 1038 1072 1106
0795 0831 0867 0903 0938 0973 1007 1041 1075 1109
0799 0835 0871 0906 0941 0976 1011 1045 1079 1113
0803 0839 0874 0910 0945 0980 1014 1048 1082 1116
0806 0842 0878 0913 0948 0983 1017 1052 1086 1119
0810 0846 0881 0917 0952 0986 0121 1055 1089 1123
0813 0849 0885 0920 0955 0990 1024 1059 1092 1126
0817 0853 0888 0924 0959 0993 1028 1062 1096 1129
0821 0856 0892 0927 0962 0997 1031 1065 1099 1133
0824 0860 0896 0931 0966 1000 1035 1069 1103 1136
4 4 3 3 3 4 3 3 3 3
130 131 132 133 134
1139 1173 1206 1239 1271
1143 1176 1209 1242 1274
1146 1179 1212 1245 1278
1149 1183 1216 1248 1281
1153 1186 1219 1252 1284
1156 1189 1222 1255 1287
1159 1193 1225 1258 1290
1163 1196 1229 1261 1294
1166 1199 1232 1265 1287
1169 1202 1235 1268 1300
4 4 4 3 3
135 136 137 138 139
1303 1335 1367 1399 1430
1307 1339 1370 1402 1433
1310 1342 1374 1405 1436
1313 1345 1377 1408 1440
1316 1348 1380 1411 1443
1319 1351 1383 1414 1446
1323 1355 1386 1418 1449
1326 1358 1389 1421 1452
1329 1361 1392 1424 1455
1332 1364 1396 1427 1458
3 3 3 3 3
N
0
2
3
8
9
D
1
4
5
6
7
Log—1000—2000 Num.
0
1
2
3
4
291
5
6
7
8
9
D
140 141 142 143 144
1461 1492 1523 1553 1584
1464 1495 1526 1556 1587
1467 1498 1529 1559 1590
1471 1501 1532 1562 1593
1474 1504 1535 1565 1596
1477 1508 1538 1569 1599
1480 1511 1541 1572 1602
1483 1514 1544 1575 1605
1486 1517 1547 1578 1608
1489 1520 1550 1581 1611
3 3 3 3 3
145 146 147 148 149
1614 1644 1673 1703 1732
1617 1647 1676 1706 1735
1620 1649 1679 1708 1738
1623 1652 1682 1711 1741
1626 1655 1685 1714 1744
1629 1658 1688 1717 1746
1632 1661 1691 1720 1749
1635 1664 1694 1723 1752
1638 1667 1697 1726 1755
1641 1670 1700 1729 1758
3 3 3 3 3
150 151 152 153 154
1761 1790 1818 1847 1875
1764 1793 1821 1850 1878
1767 1796 1824 1853 1881
1770 1798 1827 1855 1884
1772 1801 1830 1858 1886
1775 1804 1833 1861 1889
1778 1807 1836 1864 1892
1781 1810 1838 1867 1895
1784 1813 1841 1870 1898
1787 1816 1844 1872 1901
3 2 3 3 2
155 156 157 158 159
1903 1931 1959 1987 2014
1906 1934 1962 1989 2017
1909 1937 1965 1992 2019
1912 1940 1967 1995 2022
1915 1917 1920 1923 1942 1945 1948 1951 1970 1973 1976 1978 1998 2000 2003 2006 2025 2028 2030 2033
1926 1928 1953 1956 1981 1984 2009 2011 2036 2038
3 3 3 3 3
160 161 162 163 164
2041 2068 2095 2122 2148
2044 2071 2098 2125 2151
2047 2049 2074 2076 2101 2103 2127 2130 2154 2156
165 166 167 168 169
2175 2177 2180 2201 2204 2206 2227 2230 2232 2253 2256 2258 2279 2281 2284
170 171 172 173 174
2304 2307 2330 2333 2355 2358 2380 2383 2405 2408
2310 2312 2335 2338 2360 2363 2385 2388 2410 2413
175 176 177 178 179
2430 2455 2480 2504 2529
2433 2458 2482 2507 2531
2435 2460 2485 2509 2533
2438 2440 2443 2463 2465 2467 2487 2490 2492 2512 2514 2516 2536 2538 2541
180 181 182 183 184
2553 2577 2601 2625 2648
2555 2579 2603 2627 2651
2558 2582 2605 2629 2653
2560 2584 2608 2632 2655
2562 2565 2567 2586 2589 2591 2610 2613 2615 2634 2636 2639 2658 2660 2662
N
0
2
3
4
19*
1
2052 2079 2106 2133 2159
2066 2092 2119 2146 2172
2 3 3 2 3
2183 2185 2188 2191 2193 2196 2198 2209 2212 2214 2217 2219 2222 2225 2235 2238 2240 2243 2245 2248 2251 2261 2263 2266 2269 2271 2274 2276 2287 2289 2292 2294 2297 2299 2302
3 2 2 3 2
2315 2340 2365 2390 2415
2055 2082 2109 2135 2162
2057 2084 2111 2138 2164
2060 2063 2087 2090 2114 2117 2140 2143 2167 2170
2317 2320 2343 2345 2368 2370 2393 2395 2418 2420
5
2322 2325 2348 2350 2373 2375 2398 2400 2423 2425
2445 2470 2494 2519 2543
6
2448 2472 2497 2521 2545
2327 2353 2378 2403 2428
3 2 2 2 2
2450 2453 2475 2477 2499 2502 2524 2526 2548 2550
2 3 2 3 3
2570 2572 2594 2596 2617 2620 2641 2643 2565 2667 7
8
9
2574 2598 2622 2646 2669 D
3 3 3 2 3
292
Anhang. Arbeitstabellen
z
0
1
2
3
4
5
6
7
8
9
D
185 186 187 188 189
2672 2695 2718 2742 2765
2674 2697 2721 2744 2767
2676 2700 2723 2746 2769
2679 2702 2725 2749 2772
2681 2704 2728 2751 2774
2683 2707 2730 2753 2776
2686 2709 2732 2755 2778
2688 2711 2735 2758 2781
2690 2714 2737 2760 2783
2693 2716 2739 2762 2785
2 2 3 3 3
190 191 192 193 194
2788 2810 2833 2856 2878
2790 2813 2835 2858 2880
2792 2815 2838 2860 2882
2794 2817 2840 2862 2885
2797 2819 2842 2865 2887
2799 2822 2844 2867 2889
2801 2824 2847 2869 2891
2804 2826 2849 2871 2894
2806 2828 2851 2874 2896
2808 2831 2853 2876 2898
2 2 3 2 2
195 196 197 198 199
2900 2923 2945 2967 2989
2903 2925 2947 2969 2991
2905 2927 2949 2971 2993
2907 2929 2951 2973 2995
2909 2931 2953 2975 2997
2911 2934 2956 2978 2999
2914 2936 2958 2980 3002
2916 2938 2960 2982 3004
2918 2940 2962 2984 3006
2920 2942 2964 2986 3008
3 3 3 3 2
0
1
2
3
4
5
6
N
7
8
9
D
Die Anwendung der L o g a r i t h m e n erleichtert viele R e c h n u n g e n . Dies h ä n g t d a m i t zusammen, daß wir m i t Hilfe von L o g a r i t h m e n die R e c h e n o p e r a t i o n prinzipiell eine Stufe niedriger abwickeln können: Operation mit Numera addieren und subtrahieren multiplizieren und dividieren potenzieren und radizieren
Operation mit Logarithmen — addieren und subtrahieren multiplizieren und dividieren
W e n n wir also j / 2 , 3 4 8 rechnen wollen, so können wir uns helfen, indem wir log 2 , 3 4 8 : n r e c h n e n : yr,348"= x log 1,348 : 2 = log X 0,0648 = log X 1,161 = X
D. Quadrate Z 1.0 1.1 1.2 1.3 1.4 Z
0 1,000 1,210 1,440 1,690 1,960 0
1
2
3
1,020 1,232 1,464 1,716 1,988
1,040 1,254 1,488 1,742 2,016
1,061 1,277 1,513 1,769 2,045
1
2
3
4
5
1,082 1,300 1,538 1,796 2,074 4
6 1,103 1,323 1,563 1,823 2,103
5
6
7
8
1,124 1,346 1,588 1,850 2,132
1,145 1,369 1,613 1,877 2,161
7
8
9 1,166 1,392 1,638 1,904 2,190 9
D 1,188 1,416 1,664 1,932 2,220 D
22 24 26 28 30
Quadrate Z
0
1
2
3
4
5
293 6
7
8
9
D
1,5 1,6 1,7 1,8 1,9
2,250 2,560 2,890 3,240 3,610
2,280 2,592 2,924 3,276 3,648
2,310 2,624 2,958 3,312 3,686
2,341 2,657 2,993 3,349 3,725
2,372 2,690 3,028 3,386 3,764
2,403 2,723 3,063 3,423 3,803
2,434 2,756 3,098 3,460 3,842
2,465 2,789 3,133 3,497 3,881
2,496 2,822 3,168 3,534 3,920
2,528 2,856 3,204 3,572 3,960
32 34 36 38 40
2,0 2,1 2,2 2,3 2,4
4,000 4,410 4,840 5,290 5,760
4,040 4,452 4,884 5,336 5,808
4,080 4,494 4,928 5,382 5,856
4,121 4,537 4,973 5,429 5,905
4,162 4,580 5,018 5,476 5,954
4,203 4,623 5,063 5,523 6,003
4,244 4,666 5,108 5,570 6,052
4,285 4,709 5,153 5,617 6,101
4,326 4,752 5,198 5,664 6,150
4,368 4,796 5,244 5,712 6,200
42 44 46 48 50
2,5 2,6 2,7 2,8 2,9
6,250 6,760 7,290 7,840 8,410
6,300 6,812 7,344 7,896 8,468
6,350 6,864 7,398 7,952 8,526
6,401 6,917 7,453 8,009 8,585
6,452 6,970 7,508 8,066 8,644
6,503 7,023 7,563 8,123 8,703
6,554 7,076 7,618 8,180 8,762
6,605 7,129 7,673 8,237 8,821
6,656 7,182 7,728 8,294 8880
6,708 7,236 7,784 8,352 8,940
52 54 56 58 60
3,0 3,1 3,2 3,3 3,4
9,000 9,610 10,24 10,89 11,56
9,060 9,672 10,30 10,96 11,63
9,120 9,734 10,37 11,02 11,70
9,181 9,797 10.43 11,09 11,76
9,242 9,860 10,50 11,16 11,83
9,303 9,923 10,56 11,22 11,90
9,364 9,986 10,63 11,29 11,97
9,425 10,05 10.69 11,36 12,04
9,486 10,11 10,76 11,42 12,11
9,548 10,18 10,82 11,49 12,18
62 6 7 7 7
3,5 3,6 3,7 3,8 3,9
12,25 12,96 13,69 14,44 15,21
12,32 13,03 13,76 14,52 15,29
12,391 13,10 13,84 14,59 15,37
12,46 13,18 13,91 14,67 15.44
12,53 13,25 13,99 14,75 15,52
12,60 13,32 14,06 14,82 15,60
12,67 13,40 14,14 14,90 15,68
12.74 13,47 14,21 14,98 15,76
12,82 13,54 14,29 15,05 15,84
12,89 13,62 14,36 15,13 15,92
7 7 8 8 8
4,0 4,1 4.2 4,3 4,4
16,00 16,81 17,64 18,49 19,36
16,08
16,16 16,24 16,32 16,40
17,06 17,89 18,75 19,62
17,14 17,98 18,84 19,71
17,22 18,06 18,92 19,80
16,48 17,31 18,15 19,01 19,89
16,56 17,39 18,23 19,10 19,98
16,65 17,47 18,32 19,18 20,07
16,73 17,56 18,40 19,27 20,16
8 8 9 9 9
4,5 4,6 4.7 4,8 4,9
20,25 21,16 22,09 23,04 24,01
20,34 20,43 20,52 21,25 21,34 21,44 22,18 22,28 22,37 23,14 23,23 23,33 24,11 24,21 24,30
20,61 21,53 22,47 23,43 24,40
20,70 21,62 22,56 23,52 24,50
20,79 21,72 22,66 23,62 24,60
20,88 21,81 22.75 23,72 24.70
20,98 21,90 22,85 23,81 24,80
21,07 22,00 22,94 23,91 24,90
9 9 10 10 10
5
6
7
Z
0
Beispiele: 1) 2) 3) 4)
16,89 17,72 18,58 19,45
1
16,97 17,81 18,66 19,54
2
3
4
2,432 = 5,905 24,32 = 2,432 • 102 = 5,905 • 100 = 590,5 243a = 2,432 • 1002 = 5,905 • 10000 = 59050 |/19~M = 4,375
8
9
D
294 Z
Anhang. Arbeitstabellen 0
1
2
3
4
5
6
7
8
9
D
5,0 5,1 5,2 5,3 5,4
25,00 26,01 27,04 28,09 29,16
25.10 25,20 25.30 26.11 26,21 26,32 27,14 27,25 27.35 28,20 28,30 28.41 29,27 29,38 29,48
25,40 26,42 27,46 28,52 29,59
25,50 26,52 27,56 28,62 29,70
25*60 26,63 27,67 28,73 29,81
25,70 26.73 27,77 28,84 29.92
25,81 26,84 27,88 28,94 30,03
25,91 26,94 27,98 29,05 30,14
10 10 11 11 11
5,5 5,6 5,7 5,8 5,9
30,25 31,36 32,49 33,64 34,81
30,36 31,47 32,60 33.76 34,93
30,47 31,58 32,72 33,87 35,05
30,58 31,70 32.83 33,99 35,16
30,69 31,81 32,95 34,11 35,28
30,80 31,92 33,06 34,22 35,40
30,91 32,04 33,18 34,34 35,52
31,02 32.15 33.29 34,46 35,64
31,14 32,26 22,41 34,57 35,76
31,25 32,28 33,52 34,69 35,88
11 11 12 12 12
6,0 6,1 6,2 6,3 6,4
36,00 37,21 38,44 39,69 40,96
36.12 37,33 38.56 39,82 41,09
36,24 37,45 38,69 39,94 41,22
36.36 37,58 38,81 40,07 41,34
36,48 37,70 38,94 40,20 41,47
36,60 37,82 39,06 40,32 41,60
36,72 37,95 39,19 40,45 41,73
36.84 38,07 39.31 40,58 41,86
36,97 38,19 39,44 40,70 41,99
37,09 38,32 39,56 40,83 42,12
12 12 13 13 13
6,5 6,6 6,7 6,8 6,9
42,25 43,56 44,89 46,24 47,61
42,38 43,69 45,02 46.38 47,75
42,51 43,82 45,16 46,51 47,89
42.64 43.96 45,29 46.65 48,02
42,77 44,09 45,43 46,79 48,16
42,90 44,22 45,56 46,92 48,30
43,03 44,36 45,70 47,06 48,44
43.16 44,49 45,83 47,20 48,58
43,30 44,62 45,97 47,33 48,72
43,43 44,76 46,10 47,47 48,86
13 13 14 14 14
7,0 7,1 7,2 7,3 7,4
49,00 50,41 51,84 53,29 54,76
49,14 50,55 51.98 53,44 54,91
49,28 50,69 52,13 53,58 55,06
49.42 50.84 52,27 53,73 55.20
49,56 50,98 52,42 53,88 55,35
49,70 51,12 52,56 54,02 55,50
49,84 51,27 52,71 54,17 55,65
49,98 51,41 52.85 54.32 55,80
50,13 51,55 53,00 54,46 55,95
50,27 51,70 53,14 54,61 56,01
14 14 15 15 15
7,5 7,6 7,7 7,8 7,9
56,25 57,76 59,29 60,84 62,41
56,40 57,91 59,44 61,00 62.57
56,55 58,06 59,60 61,15 62,73
56,70 58,22 59.75 61.31 62,88
56,85 58,37 59,91 61,47 63,04
57,00 58,52 60,06 61,62 63,20
57,15 58,68 60,22 61,78 63,36
57.30 58,83 60,37 61,94 63,52
57,46 58,98 60,53 62,09 63,68
57,61 59,14 60,68 62,25 63,84
15 15 16 16 16
8,0 8,1 8,2 8,3 8,4
64,00 65,61 67,24 68,89 70,56
64,16 65.77 67,40 69,06 70,73
64,32 65,93 67,57 69,22 70,90
64,48 64,64 64,80 66,10 66,26 66,42 67.73 67,90 68,06 69,39 69,56 69,72 71,06 71,23 71,40
64,96 66,59 68,23 69,89 71,57
65,12 66,75 68,39 70,06 71.74
65,29 66,91 68,56 70,22 71,91
65,45 67,08 68,72 70,39 72,08
16 16 17 17 17
8,5 8,6 8,7 8,8 8,9
72,25 73,96 75,69 77,44 79.21
72,42 74.13 75,86 77,62 79.39
72,59 74,30 76,04 77,79 79,57
72.76 74,48 76.21 77.97 79.74
72,93 74,65 76,39 78,15 79,92
73,10 74,82 76,56 78,32 80,10
73,27 75,00 76,74 78,50 80,28
73,44 75.17 76,91 78,68 80,46
73,62 75,34 77,09 78,85 80,64
73,79 75,52 77,26 79,03 80,82
17 17 18 18 18
9,0 9,1 9,2 9,3 9,4
81,00 82,81 84,64 86,49 88,36
81,18 82.99 84,82 86,68 88,55
81,36 83,17 85,01 86,86 88,74
81,54 83,36 85,19 87,05 88,92
81,72 83,54 85,38 87,24 89,11
81,90 83,72 85,56 87,42 89,30
82,08 83,91 85,75 87,61 89,49
82,26 84,09 85.93 87,80 89,68
82,45 84,27 86,12 87,98 89,87
82,63 84,46 86,30 88,17 90,06
18 18 19 19 19
2
3
7
8
Z
0
1
4
5
6
9
D
Dritte Potenzen
295
z
0
1
2
3
4
5
6
7
8
9
D
9,5 9,6 9,7 9,8 9,9
90,25 92,16 94,09 96,04 98,01
90,44 92,35 94,28 96,24 98,21
90,63 92,54 94,48 96,43 98,41
90,82 92,74 94,67 96,63 98,60
91,01 92,93 94,87 96,83 98,80
91,20 93,12 95,06 97,02 99,00
91,39 93,32 95,26 97,22 99,20
91,58 93,51 95,45 97,42 99,40
91,78 93,70 95,65 97,61 99,60
91,97 93,90 95,84 97,81 99,80
19 19 20 20 20
Z
0
1
2
3
4
5
6
7
8
9
D
E. Dritte Potenzen Z
0
1
2
3
4
5
6
7
8
9
D 36 43 50 58 67
1,0 1,1 1,2 1,3 1,4
1,000 1,331 1,728 2,197 2,744
1,030 1,368 1,772 2,248 2,803
1,061 1,405 1,816 2,300 2,863
1,093 1,443 I,861 2,353 2,924
1,125 1,482 1,907 2,406 2,986
1,158 1,521 I,953 2,460 3,049
1,191 1,561 2,000 2,515 3,112
1,225 I,602 2,048 2,571 3,177
1,260 1,643 2,097 2,628 3,242
1,295 1,685 2,147 2,686 3,308
1,5 1,6 1,7 1,8 1,9
3,375 4,096 4,913 5,832 6,859
3,443 4,173 5,000 5,930 6,968
3,512 4,252 5,088 6,029 7,078
3,582 4,331 5,178 6,128 7,189
3,652 4,411 5,268 6,230 7,301
3,724 4,492 5,359 6,332 7,415
3,796 4,574 5,452 6,435 7,530
3,870 4,657 5,545 6,539 7,645
3,944 4,742 5,640 6,645 7,762
4,020 76 4,827 86 5,735 97 6,751 108 7,881 119
2,0 2,1 2,2 2,3 2,4
8,000 9,261 10,65 12,17 13,82
8,121 9,394 10,79 12,33 14,00
8,242 9,528 10,94 12,49 14,17
8,365 9,664 II,09 12.65 14,35
8,490 9,800 11,24 12,81 14,53
8,615 9,938 II,39 12,98 14,71
8,742 10,08 11,54 13,14 14,89
8,870 10,22 II,70 13,31 15,07
8,999 10,36 11,85 13,48 15,25
9,129 132 10,50 15 12,01 16 13,65 17 15,44 19
2,5 2,6 2,7 2,8 2,9
15,63 17,58 19,68 21,95 24,39
15,81 17,78 19,90 22,19 24.64
16,00 17,98 20,12 22,43 24,90
16,19 18,19 20,35 22,67 25,15
16,39 18,40 20,57 22,91 25,41
16,58 18,61 20,80 23,15 25,67
16,78 18,82 21,02 23,39 25,93
16,97 19,03 21,25 23,64 26,20
17,17 19,25 21,48 23,89 26,46
17,37 19,47 21,72 24,14 26,73
21 21 23 25 27
3,0 3,1 3,2 3,3 3,4
27,00 29,79 32,77 35,94 39,30
27,27 30,08 33,08 36,26 39.65
27,54 30,37 33,39 36,59 40,00
27,82 30.66 33,70 36,93 40,35
28,09 30,96 34,01 37,26 40,71
28,37 31,26 34,33 37,60 41,06
28,65 31,55 34,65 37,93 41,42
28,93 31,86 34,97 38,27 41,78
29,22 32,16 35,29 38,61 42,14
29,50 32,46 35,61 38,96 42,51
29 31 33 34 37
1
2
6
7
9
D
Z
0
3
4
5
Beispiele: 1) 4,733 = 105,8 2) 47,33 = 4,733 • IO3 = 105,8 • 1000 = 105800 3) 0,4733 = 4,733 • l /i 0 3 = 105,8 • Viooo = 0,1058 4) y70,50 = 4,131
8
296 Z
Anhang. Arbeitstabellen 0
1
2
3
4
5
6
7
8
9
D
3,5 3,6 3,7 3,8 3,9
42,88 46,66 50,65 54,87 59,32
43,24 47,05 51,06 55,31 59,78
43.61 47,44 51,48 55,74 60,24
43,99 47,83 51,90 56,18 60,70
44,36 48,23 52,31 56,62 61,16
44,74 48,63 52,73 57,07 61,63
45,12 49,03 53,16 57,51 62,10
45,50 49,43 53,58 57,96 62,57
45,88 49,84 54,01 58,41 63,04
46,27 50,24 54,44 58,86 63,52
39 41 43 46 48
4,0 4,1 4,2 4,3 4,4
64,00 68,92 74,09 79,51 85,18
64,48 69,43 74,62 80,06 85,77
64,96 69,93 75,15 80.62 86,35
65,45 70,44 75,69 87,18 86,94
65,94 70,96 76,23 81,75 87,53
66,43 71,47 76,77 82,31 88,12
66,92 71,99 77,31 82,88 88,72
67,42 72,51 77,85 83,45 89,31
67,92 73,03 78,40 84,03 89,92
68,42 73,56 78,95 84,60 90,52
50 53 56 58 61
4,5 4,6 4,7 4,8 4,9
91,13 97,34 103,8 110,6 117,6
91,73 97,97 104,5 111,3 118,4
92,35 98,61 105,2 112.0 119.1
92,96 99,25 105,8 112,7 119,8
93,58 99,90 106,5 113,4 120,6
94,20 100.5 107.2 114,1 121.3
94,82 101,2 107,9 114,8 122,0
95,44 101,8 108,5 115,5 122,8
96,07 102,5 109,2 116,2 123,5
96,70 103,2 109,9 116,9 124,3
64 6 7 7 7
5,0 5,1 5,2 5,2 5,4
125,0 132,7 140,6 148,9 157,5
125,8 133,4 141,4 149,7 158,3
126.5 134.2 142,2 150.6 159,2
127,3 135,0 143,1 151,4 160,1
128,0 135,8 143,9 152,3 161,0
128.8 136.6 144.7 153,1 161.9
129,6 137,4 145,5 154,0 162,8
130,3 138,2 146,4 154,9 163,7
131,1 139,0 147,2 155,7 164,6
131,9 139,8 148,0 156,6 165,6
8 8 9 9 9
5,5 5,6 5,7 5,8 5,9
166,4 175,6 185,2 195,1 205,4
167,3 176,6 186,2 196,1 206,4
168,2 177,5 187,1 197.1 207.5
169,1 178,5 188,1 198,2 208,5
170,0 179,4 189,1 199,2 209,6
171.0 180.4 190.1 200.2 210,6
171,9 181,3 191,1 201,2 211,7
172,8 182,3 192,1 203,3 212,8
173,7 183,3 193,1 203,3 213,8
174,7 184,2 194,1 204,3 214,9
9 10 10 11 11
6,0 6,1 6,2 6,3 6,4
216,0 227,0 238,3 250,0 262,1
217,1 228,1 239,5 251,2 263,4
218.2 229,2 240.6 252.4 264,6
219,3 230,3 241,8 253,6 265,8
220,3 231,5 243,0 254,8 267,1
221.4 232.6 244,1 256,0 268.3
222,5 233,7 245,3 257,3 269,6
223,6 234,9 246,5 258,5 270,8
224,8 236,0 247,7 259,7 272,1
225,9 237,2 248,9 260,9 273,4
11 11 11 12 12
6,5 6,6 6,7 6,8 6,9
274,6 287,5 300,8 314,4 328,5
275,9 288,8 302,1 315,8 329,9
277,2 290.1 303.5 317.2 331,4
278,4 291,4 304,8 318,6 332,8
279,7 292,8 306,2 320,0 334,3
281.0 294.1 307.5 321.4 335.7
282,3 295,4 308,9 322,8 337,2
283,6 296,7 310,3 324,2 338,6
284,9 298,1 311,7 325,7 340,1
286,2 299,4 313,0 327,1 341,5
13 14 14 14 15
7,0 7,1 7,2 7,3 7,4
343,0 357,9 373,2 389,0 405,2
344,5 359,4 374,8 390,6 406,9
345,9 360,9 376.4 392.2 408.5
347,4 362,5 377,9 393,8 410,2
348,9 364,0 379,5 395,4 411,8
350.4 365.5 381,1 397,1 413,5
351,9 367,1 382,7 398,7 415,2
353,4 368,6 384,2 400,3 416,8
354,9 370,1 385,8 401,9 418,5
356,4 371,7 387,4 403,6 420,2
15 15 16 16 17
7,5 7,6 7,7 7,8 7,9
421,9 439,0 456,5 474,6 493,0
423,6 440,7 458,3 476,4 494,9
425.3 442,5 460.1 478.2 496,8
427,0 444,2 461,9 480,0 498,7
428,7 445,9 463,7 481,9 500,6
430.4 447,7 465.5 483,7 502,5
432,1 449,5 467,3 485,6 504,4
433,8 451,2 469,1 487,4 506,3
435,5 453,0 470,9 489,3 508,2
437,2 454,8 472,7 491,2 510,1
18 17 19 18 19
2
3
6
7
9
D
Z
0
1
4
5
8
Dritte Potenzen Z
0
1
2
3
4
5
297 6
7
8
9
D
8.0 8.1 8.2 8.3 8.4
512,0 531,4 551,4 571,8 592,7
513,9 533,4 553,4 573,9 594,8
515,8 535,4 555,4 575,9 596,9
517,8 537,4 557,4 578,0 599,1
519,7 539,4 559,5 580,1 601,2
521,7 541.3 561,5 582,2 603.4
523,6 543,3 563,6 584,3 605,5
525,6 545,3 565,6 586,4 607,6
527,5 547,3 567,7 588,5 609,8
529,5 549,4 569,7 590,6 612,0
19 20 21 21 21
8.5 8.6 8.7 8.8 8.9
614,1 636,1 658,5 681,5 705,0
616,3 638,3 660,8 683,8 707,3
618,5 640,5 663,1 686,1 709,7
620,7 642,7 665,3 688,5 712,1
622,8 645,0 667,6 690,8 714,5
625.0 647,2 669,9 693,2 716,9
627,2 649,5 672,2 695,5 719,3
629,4 651,7 674,5 697,9 721,7
631,6 654,0 676,8 700,2 724,2
633,8 656,2 679,2 702,6 726,6
23 23 23 24 24
9.0 9.1 9.2 9.3 9.4
729,0 753,6 778,7 804,4 830,6
731,4 756,1 781,2 807,0 833,2
733,9 758,6 783,8 809,6 835,9
736,3 761,0 786,3 812,2 838,6
738,8 763,6 788,9 814,8 841,2
741,2 766.1 791.5 817,4 843,9
743,7 768,6 794,0 820,0 846,6
746,1 771,1 796,6 822,7 849,3
748,6 773,6 799,2 825,3 852,0
751,1 776,2 801,8 827,9 854,7
25 25 26 27 27
9.5 9.6 9.7 9.8 9.9
857,4 884,7 912,7 941,2 970,3
860,1 887,5 915,5 944,1 973,2
862,8 890,3 918,3 947,0 976,2
865,5 893,1 921,2 949,9 979,1
868,3 895,8 924,0 952,8 982,1
871.0 898.6 926,9 955.7 985.1
873,7 901,4 929,7 958,6 988,0
876,5 904,2 932,6 961,5 991,0
879,2 907,0 935,4 964,4 994,0
882,0 909,9 938,3 967,4 997,0
27 28 29 29 30
1
2
3
6
7
9
D
Z
0
4
5
8
Anhang. Arbeitstabellen
298
F. Normalverteilung Die folgende Tabelle gibt die Ordinaten der standardisierten Normalverteilung wieder (mit der Fläche 1): z
0,00
0,01
0,02
0,03
0,04
0,0
0,39894
0,39892
0,39886
0,39876
0,39862
0,1 0,2 0,3
0,39695 0,39104 0,38139
0,39654 0,39024 0,38023
0,39608 0,38940 0,37903
0,39559 0,38853 0,37780
0,39505 0,38762 0,37654
0,4 0,5 0,6
0,36827 0,35207 0,33322
0,36678 0,35029 0,33121
0,36526 0,34849 0,32918
0,36371 0,34667 0,32713
0,36213 0,34482 0,32506
0,7 0,8 0,9
0,31225 0,28969 0,26609
0,31006 0,28737 0,26369
0,30785 0,28504 0,26129
0,30563 0,28269 0,25888
0,30339 0,28034 0,25647
1,0
0,24197
0,23955
0,23713
0,23471
0,23230
1,1 1,2 1,3
0,21785 0,19419 0,17137
0,21546 0,19186 0,16915
0,21307 0,18954 0,16694
0,21069 0,18724 1,06474
0,20831 0,18494 0,16256
1,4 1,5 1,6
0,14937 0,12952 0,11092
0,14764 0,12758 0,10915
0,14556 0,12566 0,10741
0,14350 0,12376 0,10567
0,14146 0,12188 0,10396
1,7 1,8 1,9
0,09405 0,07895 0,06562
0,09246 0,07754 0,06438
0,09089 0,07614 0,06316
0,08933 0,07477 0,06195
0,08780 0,07341 0,06077
2,0
0,05399
0,05292
0,05186
0,05082
0,04980
2,1 2,2 2,3
0,04398 0,03547 0,02833
0,04307 0,03470 0,02768
0,04217 0,03394 0,02705
0,04128 0,03319 0,02643
0,04041 0,03246 0,02582
2,4 2,5 2,6
0,02239 0,01753 0,01358
0,02186 0,01709 0,01323
0,02134 0,01667 0,01289
0,02083 0,01625 0,01256
0,02033 0,01585 0,01223
2,7 2,8 2,9
0,01042 0,00792 0,00595
0,01014 0,00770 0,00578
0,00987 0,00748 0,00562
0,00961 0,00727 0,00545
0,00935 0,00707 0,00530
0,0
0,1
0,2
0,3
0,4
3,0
0,00443
0,00327
0,00238
0,00172
0,00123
Normalverteilung
299
0,05
0,06
0,07
0,08
0,09
0,39844 0,39448 0,38667 0,37524 0,36053 0,34294 0,32297 0,30114 0,27798 0,25406 0,22988 0,20594 0,18265 0,16038 0,13943 0,12051 0,10226 0,08628 0,07206 0,05959 0,04879 0,03955 0,03174 0,02522 0,01984 0.01545 0,01191 0,00909 0,00687 0,00514 0,5 0,00087
0,39822 0,39387 0,38568 0,37391 0,35889 0,34105 0,32086 0,29887 0,27562 0,25164 0,22747 0,20357 0,18037 0,15822 0,13742 0,11816 0,10059 0,08478 0,07074 0,05844 0,04780 0,03871 0,03103 0,02463 0,01936 0,01506 0,01160 0,00885 0,00668 0,00499 0,6 0,00061
0,39797 0,39322 0,38466 0,37255 0,35723 0,33912 0,31874 0,29659 0,27324 0,24923 0,22506 0,20121 0,17810 0,15608 0,13542 0,11632 0,09893 0,08329 0,06943 0,05730 0,04682 0,03788 0,03034 0,02406 0,01889 0,01468 0,01130 0,00861 0,00649 0,00485 0,7 0,00042
0,39767 0,39253 0,38361 0,37115 0,35553 0,33718 0,31659 0,29431 0,27086 0,24681 0,22265 0,19886 0,17585 0,15395 0,13344 0,11450 0,09728 0,08183 0,06814 0,05618 0,04586 0,03706 0,02965 0,02349 0,01842 0,01431 0,01100 0,00837 0,00631 0,00471 0,8 0,00029
0,39733 0,39181 0,38251 0,36973 0,35381 0,33521 0,31443 0,29200 0,26848 0,24439 0,22025 0,19652 0,17360 0,15183 0,13147 0,11270 0,09566 0,08038 0,06687 0,05508 0,04491 0,03626 0,02898 0,02294 0,01797 0,01394 0,01171 0,00814 0,00613 0,00457 0,9 0,00020
z 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3,0
300
Anhang. Arbeitstabellen
m in «1 00 10 H h !C (O CO CD H cs (o H n 1—1 CO 00 o o CDCD^eO oio g Ci OS OO »O -TjT CO OÍ" CO ci ci ci ci to iiî oIN ^ (M OS oo "5 ^r co" co" CO ci ci o co cn cn fh fh .-h o © os^ oo t-^ OT oo" « Tt O !D M H Ci CD ^ Pï Oí (N N H fh © © OS 00 CO »O >0 IO IO Tí" - co" co" oi co" iq r i co co" co" e i e i ci oi ci ci cf cf -h fh m •^oJcot^nffiiocOHHto co^niOHfflt-os^o^
tOOTMMrtlOMW-^Mffl® QOOlO^rtWHHOlXlO«
© ^ eo CO eq O 00 O lO i-H >13 e} ® t- so >a M n N O, 05 I> io co co* co" ei oi ei e i ei ei ei e i e i i-h i-T —< ® aO)i co INcoH® «> io >o o Tt co o io n h w co ^ oo io « o ® ® c^ ® co io co « o oo eJ oi co" •>*" os" t-- cd >n V co co co co" e i e i e i e i e i e i ei e i e i h oi eq I-H iHtOOlQ^nNMtOOTfcOtOtOM _" t-" oi i> co >d >o TjT co co co co co" co" ei ei e i e i e i e i e i COa> NH (OOWi'^^NWCOIOOitffiH^cO^öjnMOOHM io ^ c^toooqcq^oqe^oo co cd co >q cc N h o o q a t^ o n 2 fa f lf-" o o o io co" co" co co" co" co co co" e i e i e i e i e i ® «HH 00 i ) l» « H 0O o^-i O »5 H OS ^ io IN H ffl® q o S10 os a eq i-" -H O co c i m* « n e i n n « i c i c i c i ^ oo" co" co io o ®nHHt»t>oi>ooiN!OOHt-cot>o>e,)M»aifflO io w q « q h coaoco oo INOtO" t> t> t-" cd H i s e o ' i i i o i o ^ o o aH o eHi H 'iH i cH o oNo« oMe ei ii iec