243 105 10MB
German Pages 173 [176] Year 2002
Formelsammlung Statistik Von
Professor Dr. Karl Bosch Institut für angewandte Mathematik und Statistik der Universität Stuttgart-Hohenheim
R. Oldenbourg Verlag München Wien
Bibliografische Information Der Deutschen Bibliothek Die Deutsche Bibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über abrufbar.
© 2 0 0 3 Oldenbourg Wissenschaftsverlag GmbH Rosenheimer Straße 145, D-81671 München Telefon: (089) 45051-0 www.oldenbourg-verlag.de Das Werk außerhalb lässig und filmungen
einschließlich aller Abbildungen ist urheberrechtlich geschützt. Jede Verwertung der Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzustrafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverund die Einspeicherung und Bearbeitung in elektronischen Systemen.
Gedruckt auf säure- und chlorfreiem Papier Druck: Grafik + Druck, M ü n c h e n Bindung: R. Oldenbourg Graphische Betriebe Binderei G m b H ISBN 3-486-27312-4
Inhaltsverzeichnis Vorwort Symbole und Bezeichnungen
IX X
1.
Beschreibende (deskriptive) Statistik
1.1. 1.2. 1.2.1. 1.2.2. 1.2.3. 1.2.4. 1.2.5. 1.3. 1.3.1. 1.3.2. 1.3.3. 1.3.4. 1.3.5. 1.3.6. 1.3.7.
Grundbegriffe Eindimensionale Stichproben Häufigkeiten bei diskreten Merkmalen Mittelwerte (Lokalisationsmaße) Klasseneinteilung Streuungsmaße Konzentrationsmaße Zweidimensionale Stichproben Grundbegriffe Häufigkeiten und bedingte Häufigkeiten Mittelwerte und bedingte Mittelwerte Korrelationsrechnung Regressionsrechnung Indexzahlen Zeitreihen
1 1 1 2 5 7 9 13 13 13 15 16 19 23 24
2.
Wahrscheinlichkeitsrechnung
28
2.1. 2.1.1. 2.1.2. 2.2. 2.3. 2.3.1. 2.3.2. 2.3.3.
Zufällige Ereignisse Grundbegriffe Ereignisfeld (Ereignissystem, cr-Algebra) Häufigkeiten von Ereignissen Wahrscheinlichkeiten Definitionsversuch von Richard von Mises Klassische Wahrscheinlichkeit nach Laplace Kombinatorische Methoden zur Berechnung von klassischen Wahrscheinlichkeiten Axiomatische Wahrscheinlichkeit nach Kolmogorow . Geometrische Wahrscheinlichkeiten und Simulationen . Bedingte Wahrscheinlichkeiten Definition der bedingten Wahrscheinlichkeit Multiplikationssatz für bedingte Wahrscheinlichkeiten . Satz von der totalen (vollständigen) Wahrscheinlichkeit Bayesche Formel Unabhängige Ereignisse Unabhängigkeit von zwei Ereignissen
28 28 30 31 31 31 32
2.3.4. 2.3.5. 2.4. 2.4.1. 2.4.2. 2.4.3. 2.5. 2.5.1.
1
. . . .
. . und
33 35 36 38 38 39 39 40 40
VI
Inhaltsverzeichnis
2.5.2. 2.5.3. 2.5.4. 2.5.5. 2.5.5.1. 2.5.5.2.
Unabhängigkeit von n Ereignissen Unabhängigkeit von n Zufallsexperimenten Unabhängige Wiederholungen eines Zufallsexperiments Spezielle Verteilungen Binomialverteilung Geometrische Verteilung
3.
Zufallsvaxiablen
42
3.1. 3.2. 3.2.1. 3.2.2. 3.2.3.
Definition einer Zufallsvariablen Eindimensionale diskrete Zufallsvariable Verteilung und Verteilungsfunktion Kenngrößen einer diskreten Zufallsvariablen Spezielle diskrete Zufallsvariablen Indikatorvariable Gleichmäßige diskrete Verteilung auf W = {1, 2 , . . . , m} . . Binomialverteilung Binomialverteilung beim Ziehen mit Zurücklegen . . . . Hypergeometrische Verteilung beim Ziehen ohne Zurücklegen Poisson-Verteilung Negative Binomialverteilung Geometrische Verteilung Zweidimensionale diskrete Zufallsvariable Gemeinsame Verteilung und Randverteilungen Unabhängige diskrete Zufallsvariablen Bedingte Verteilungen und bedingte Erwartungswerte . . . Kennngrößen bei zweidimensionalen Zufallsvariablen . . . Eindimensionale stetige Zufallsvariable Dichte und Verteilungsfunktion Kenngrößen Spezielle stetige Zufallsvariablen Gleichmäßige Verteilung Exponentialverteilung Normalverteilung Logarithmische Normalverteilung (Lognormalverteilung) . . Erlang-Verteilung Weibull-Verteilung Gammaverteilung Chi-Quadrat-Verteilung t-Verteilung F-Verteilung Zweidimensionale stetige Zufallsvariable Gemeinsame Verteilung und Randverteilungen Unabhängige stetige Zufallsvariablen Bedingte Verteilungen und bedingte Erwartungswerte . . . Kenngrößen Zweidimensionale Normalverteilung
42 42 42 44 46 46 46 46 48 48 48 49 49 49 49 51 51 52 54 54 54 56 56 57 57 59 59 60 60 61 62 63 64 64 65 65 66 68
3.3. 3.3.1. 3.3.2. 3.3.3. 3.3.4. 3.4. 3.4.1. 3.4.2. 3.4.3.
3.5. 3.5.1. 3.5.2. 3.5.3. 3.5.4. 3.5.5.
.
.
40 40 41 41 41 41
Inhaltsverzeichnis 3.5.6. 3.6. 3.6.1. 3.6.2. 3.6.3.
VII
3.7. 3.8. 3.8.1 3.8.2. 3.8.3.
Summe zweier stetiger Zufallsvariabler Mehrdimensionale Zufallsvariable Gemeinsame Verteilungsfunktion Unabhängigkeit Mehrdimensionale stetige Zufallsvariable (stetiger Zufallsvektor) Ungleichungen bei Zufallsvariablen Gesetze der großen Zahlen Zentrale Grenzwertsätze Das schwache Gesetz der großen Zahlen Das starke Gesetz der großen Zahlen
71 72 74 74 76 78
4.
Beurteilende (induktive) Statistik
79
4.1. 4.2. 4.2.1. 4.2.2. 4.2.3. 4.2.4. 4.3. 4.3.1. 4.3.2. 4.3.3. 4.3.4. 4.3.4.1. 4.3.4.2. 4.3.4.3. 4.3.4.4. 4.3.4.5. 4.3.4.6.
Zufallsstichproben und Stichprobenfunktionen Parameterschätzungen (Punktschätzungen) Eigenschaften von Schätzfunktionen Die Ungleichung von Rao-Cramer Maximum-Likelihood-Schätzung Schätzwerte für spezielle Parameter Konfidenzintervalle (Intervallschätzung) Allgemeine Konfidenzintervalle (Vertrauensintervalle) . . . Konfidenzintervalle nach Clopper-Pearson Asymptotische Konfidenzintervalle Spezielle (empirische) Konfidenzintervalle Konfidenzintervalle für einen Erwartungswert Konfidenzintervalle für eine Varianz Konfidenzintervalle für eine Standardabweichung . . . . Konfidenzintervalle für eine Wahrscheinlichkeit Konfidenzintervalle für den Parameter einer Poisson-Verteilung Konfidenzintervalle für den Parameter einer Exponential Verteilung 4.3.4.7. Konfidenzintervalle für den Parameter i? einer in [0;t9] gleichmäßig stetigen Verteilung 4.3.4.8. Konfidenzintervalle für die Differenz zweier Erwartungswerte 4.3.4.9. Konfidenzintervalle für den Quotienten der Varianzen zweier unabhängiger Zufallsvariabler 4.3.4.10. Asymptotische Konfidenzintervalle für die Differenz zweier Wahrscheinlichkeiten 4.3.4.11. Konfidenzintervalle für den Median stetiger Zufallsvariabler 4.3.4.12. Konfidenzintervalle für Quantile stetiger Zufallsvariabler . 4.4. Parametertests 4.4.1. Grundlagen 4.4.2. Parametertests bei Einstichprobenproblemen 4.4.2.1. Test eines Erwartungswertes 4.4.2.2. Test einer Varianz 4.4.2.3. Test einer Wahrscheinlichkeit
69 70 70 70
79 79 80 80 82 84 85 85 85 86 87 87 88 89 89 90 91 92 92 94 95 95 96 97 97 100 100 101 102
VIII 4.4.2.4. 4.4.2.5. 4.4.2.6. 4.4.2.7. 4.4.2.8. 4.4.3. 4.4.3.1. 4.4.3.2. 4.4.3.3. 4.4.3.4. 4.4.4. 4.4.4.1. 4.4.4.2. 4.4.4.3. 4.4.4.4. 4.4.4.5. 4.4.4.6. 4.5. 4.5.1. 4.5.1.1. 4.5.1.2. 4.5.1.3. 4.5.1.4. 4.5.2. 4.5.2.1. 4.5.2.2. 4.5.2.3. 4.5.3. 4.5.3.1. 4.5.3.2.
Inhaltsverzeichnis Test des Parameters einer Poisson-Verteilung . . . . Test des Parameters einer Exponentialverteilung Vorzeichen-Test Test des Medians einer stetigen Zufallsvariablen Test eines Quantiis einer stetigen Zufallsvariablen . . . . Parametertests bei Zweistichprobenproblemen Test des Korrelationskoeffizienten bei Normalverteilungen Test der Differenz zweier Erwartungswerte Test des Quotienten der Varianzen zweier unabhängiger Normalverteilungen Test auf Gleichheit der Wahrscheinlichkeiten eines Ereignisses in zwei unabhängigen Grundgesamtheiten . . Parametertests bei Mehrstichprobenproblemen T e s t auf Gleichheit der Korrelationskoeffizienten zweier unabhängiger Normal Verteilungen Test auf Gleichheit der Korrelationskoeffizienten mehrerer unabhängiger Normalverteilungen Test auf Gleichheit der Erwartungswerte mehrerer unabhängiger Normalverteilungen Test auf Gleichheit der Varianzen unabhängiger normalverteilter Zufallsvariabler - B a r t l e t t - T e s t Test auf Gleichheit der Varianzen unabhängiger stetiger Zufallsvariabler - Chi-Quadrat-Test von Scheffe . . . Test auf Gleichheit der Wahrscheinlichkeiten eines Ereignisses in verschiedenen unabhängigen Grundgesamtheiten Nichtparametrische Tests Chi-Quadrat-Tests Chi-Quadrat-Test der Wahrscheinlichkeiten einer vollständigen Ereignisdisjunktion Chi-Quadrat-Anpassungstest für eine beliebige Verteilung Chi-Quadrat-Unabhängigkeitstest Chi-Quadrat-Homogenitätstest Test auf Gleichheit mehrerer Verteilungen Kolmogorow-Smirnow-Tests Kolmogorow-Smirnow-Einstichproben-Test Konfidenzbereiche für eine unbekannte Verteilungsfunktion Kolmogorow-Smirnow-Zweistichproben-Test Wilcoxon-Tests Der Vorzeichen-Rangtest (Symmetrie-Test) nach Wilcoxon Der Wilcoxon-Rangsummentest
.
103 104 105 106 107 108 108 109 111
.
111 113 113 113 114 114
.
115
.
115 116 116
.
.
.
116 117 118 120 121 121 122 123 124 124 126
Literaturverzeichnis
128
Tabellenanhang
130
Stichwortverzeichnis
156
Vorwort In der vorliegenden Formelsammlung sollen die wichtigsten Begriffe, Formeln u n d Verfahren der Statistik zusammengestellt werden. Viele dieser Verfahren werden in den Vorlesungen für Angewandte Statistik behandelt. Der Autor ist bemüht, die einzelnen Formeln und Verfahren sehr ausführlich darzustellen. Durch viele Hinweise sollen die Anwendungsmöglichkeiten deutlich gemacht werden. Die gewählte Darstellung soll gewährleisten, dass spezielle Formeln und Verfahren auch dann benutzt werden können, wenn der jeweilige Stoff in der Vorlesung nur ganz k n a p p oder ü b e r h a u p t nicht behandelt wurde. Dadurch wird diese Formelsammlung zu einem ausführlichen Nachschlagewerk für viele Studierenden an den Universitäten und Fachhochschulen und für alle Personen, die in ihrem Berufsleben statistische Methoden anwenden müssen. Wer sich für die theoretischen Grundlagen näher interessiert, kann diese in den in der Literaturliste angegebenen Lehrbüchern nachlesen. Für die kritische Durchsicht von Teilen des Manuskripts möchte ich mich bei F r a u Dr. S. Kröner, Frau Dipl. Math. R. Ritz, Herrn Dipl. M a t h . A. Janßen und Herrn Dipl. Math. A. Meister recht herzlich bedanken. Allen Personen, welche diese Formelsammlung benutzen, wünsche ich viel Erfolg. Für Hinweise und Verbesserungsvorschläge bin ich jederzeit dankbar.
Stuttgart-Hohenheim
Karl Bosch
Symbole und Bezeichnungen n
Stichprobenumfang absolute Häufigkeit relative Häufigkeit
Fn(x),xeR
(empirische) Verteilungsfunktion einer Stichprobe
x, xq
Median bzw. q-Quantil der Stichprobe
n
E-i i=l 00 Ea; i=l
x 1 + x 2 + . . . + x n (endliche Summe)
Ea; 1
endliche oder unendliche Summe
a j + a 2 + . . . (unendliche Summe)
n
ri*; i=l — x
Xj^ • x 2 • . . . • XJJ (endliches Produkt)
1 " = n E xi i=l
s ^ ^ E i x i - x ) 11 1 ¡=1
Stichprobenmittel (arithmetisches Mittel)
2
(empirische) Varianz einer Stichprobe
AÊ(*i-*)2 s2 = i=l (empirische) Standardabweichung Kovarianz der verbundenen Stichprobe ( x , y) Korrelationskoeffizient der Stichprobe (x , y) r
s
Spearmanscher Rangkorrelationskoeffizient
R(x ; )
Rangzahl des Stichprobenwertes x^ in der geordneten Stichprobe
y - y = b • (x - x)
Regressionsgerade von y bezüglich x Regressionskoeffizient von y bzgl. x
u
Versuchsergebnis
A
(zufälliges) Ereignis
|A|
Anzahl der Elemente aus A
n
sicheres Ereignis
0
unmögliches Ereignis
Symbole und Bezeichnungen
XI
AHB
A und B tritt ein (Durchschnitt)
A fl B = 0
A und B sind unvereinbar (disjunkt)
n
p| A j i=l oo Pl A ¡ i=l
aller Ereignisse A j , A 2 , . . . treten ein (Durchschnitt abzählbar unendlich vieler Ereignisse)
A UB
A oder B (tritt ein)
A + B
A U B, falls A D B = 0 (disjunkte Vereinigung)
alle Ereignisse A j , A 2 , . . . , A n treten ein (Durchschnitt endlich vieler Ereignisse)
n
(Vereinigung)
U A¡ 1=1
mindestens eines der Ereignisse A j , A 2 , . . . , A n tritt ein (Vereinigung endlich vieler Ereignisse)
£ A; i=l
steht für |J A ; , falls A: n A k = 0 für j ^ k i=l Vereinigung paarweise disjunkter Ereignisse
oo t j A¡ 1=1
mindestens eines der Ereignisse A j , A 2 , . . . tritt ein (Vereinigung abzählbar vieler Ereignisse)
A
A nicht
A\B = A H B
Differenz von A und B ( A , aber nicht B )
P(A)
Wahrscheinlichkeit des Ereignisses A
,
.
. _ P ( A D B)
bedingte Wahrscheinlichkeit von
*
'
'
A unter der Bedingung B
P(B)
—
P(A n B) = P ( A ) • P(B) n • (n — k + 1) 1 • 2 •... • k
A und B unabhängig Binomialkoeffizient
n ! = l - 2- 3- . . . - n
n Fakultät
F ( x ) = P ( X < x), x G R
Verteilungsfunktion der Zufallsvariablen X
F(x, y ) = P ( X < x, Y < y ) gemeinsame Verteilungsfunktion von ( X , Y ) (x,y)GR2 p— = P ( X = x ; , Y = y j )
Pj. =
Pij
=
= x;)
j
gemeinsame Wahrscheinlichkeiten der zweidimensionalen disktreten Zufallsvariablen ( X , Y ) Randwahrscheinlichkeit der zweidimensionalen diskreten Zufallsvariablen ( X , Y )
P - i = E P i i = P ( Y = yj) i fi = E ( X )
Erwartungswert von X
er2 =