266 123 11MB
German Pages 388 Year 2004
Grundkurs Statistik Lehr- und Übungsbuch der angewandten Statistik
Von
Dr. Bärbel Elpelt und
o. Prof. Dr. Joachim Härtung Fachbereich Statistik der Universität Dortmund
Mit ausführlichen Übungs- und Klausurteilen
Dritte Auflage
R.Oldenbourg Verlag München Wien
Bibliografische Information Der Deutschen Bibliothek Die Deutsche Bibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über abrufbar.
© 2004 Oldenbourg Wissenschaftsverlag GmbH Rosenheimer Straße 145, D-81671 München Telefon: (089) 45051-0 www.oldenbourg-verlag.de Das Werk einschließlich aller Abbildungen ist urheberrechtlich geschützt. Jede Verwertung außerhalb der Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulässig und strafbar. Das gilt insbesondere fur Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Bearbeitung in elektronischen Systemen. Gedruckt auf säure- und chlorfreiem Papier Druck: R. Oldenbourg Graphische Betriebe Druckerei GmbH ISBN 3-486-27592-5
Kapitelverzeichnis
EINFÜHRUNG
1
KAPITEL
1:
Rechnen mit Wahrscheinlichkeiten
5
KAPITEL
2:
Kombinatorik
29
KAPITEL
3:
Z u f a l l s v a r i a b l e und Verteilungen
39
KAPITEL
4:
Kenngrößen von Z u f a l l s v a r i a b l e n
63
KAPITEL
5:
Einige s p e z i e l l e Verteilungen
83
KAPITEL
6:
Punktschätzungen für die Kenngrößen und Parameter von Verteilungen
KAPITEL
7:
101
Interval 1 Schätzungen für zukünftige Beobachtungen und für Parameter von Verteilungen
115
KAPITEL
8:
S t a t i s t i s c h e Tests
129
KAPITEL
9:
R e g r e s s i o n s - und Korrelationsrechnung
159
KAPITEL 10:
Varianzanalyse
185
KAPITEL 11:
Ausblick auf weitere Verfahren
201
KAPITEL 12:
Lösungen zu den Übungsaufgaben
209
KAPITEL 13:
Klausuren
287
ANHANG
343 Ende
374
Inhaltsverzeichnis
EINFÜHRUNG KAPITEL
1:
1 RECHNEN MIT WAHRSCHEINLICHKEITEN
5
1
Zufällige Ereignisse und Wahrscheinlichkeiten
5
2
Beispiele zum Rechnen mit Wahrscheinlichkeiten
10
2.1
Vereinigung und Durchschnitt von Ereignissen: P a r a l l e l - und Seriensysteme
2.2
10
Bedingte Wahrscheinlichkeiten: Formel von der totalen Wahrscheinlichkeit und Bayessche Formel
3
Axiomatische Definitionen des Wahrscheinlichkeitsbegriffes
ÜBUNGSAUFGABEN ZU KAPITEL KAPITEL
2:
1
KOMBINATORIK
21 24 26 29
1
Permutationen
29
2
Variationen
30
3
Kombinationen
34
ÜBUNGSAUFGABEN ZU KAPITEL KAPITEL
3:
2
ZUFALLSVARIABLE UND VERTEILUNGEN
36 39
1
Der Begriff der Zufallsvariablen
39
2
Diskrete Verteilungen und empirische Verteilungsfunktion
40
3
Stetige Verteilungen
44
3.1
Verteilungsfunktion und Wahrscheinlichkeitsdichte
44
3.2
Empirische Dichten und empirische Verteilungsfunktionen
48
4
Gemeinsame Verteilung und Unabhängigkeit
51
5
Die Faltungsformel
56
ÜBUNGSAUFGABEN ZU KAPITEL
3
59
VIII
Inhaltsverzeichnis
KAPITEL
4:
KENNGRÖSSEN VON Z U F A L L S V A R I A B L E N
63
1
Der Erwartungswert einer Verteilung
63
2
Die Quantile einer Verteilung
65
3
Varianz, Standardabweichung und V a r i a t i o n s k o e f f i z i e n t
67
4
Kovarianz und K o r r e l a t i o n
70
5
S t a n d a r d i s i e r t e Z u f a l l s v a r i a b l e , Tschebyscheffsche Ungleichung, Gesetz der großen Zahlen und Fehlerfortpflanzungsgesetz
ÜBUNGSAUFGABEN ZU KAPITEL KAPITEL 1
5:
EINIGE
75
4
80
S P E Z I E L L E VERTEILUNGEN
83
Die Normalverteilung und daraus abgeleitete Verteilungen
83
1.1
Die Normalverteilung und der Zentrale Grenzwertsatz
83
1.2
Die Lognormal Verteilung
88
1.3
Die Prüfverteilungen
89
2
Die G l e i c h v e r t e i l u n g und die D r e i e c k s v e r t e i l u n g
92
3
Die Exponentialverteilung
94
4
Die Binomialverteilung
96
5
Die P o i s s o n v e r t e i l u n g
98
ÜBUNGSAUFGABEN ZU KAPITEL KAPITEL
6:
5
PUNKTSCHÄTZUNGEN
99 FÜR D I E
KENNGRÖSSEN
UND
PARAMETER VON V E R T E I L U N G E N
101
1
Schätzen der Kenngrößen von Verteilungen
101
2
Der Q - Q - P l o t zur Überprüfung von Verteilungsannahmen
105
3
Das Stem - and - Leaves - Diagramm und der B o x - P l o t
107
4
Schätzen der Parameter einer Verteilung
109
ÜBUNGSAUFGABEN ZU KAPITEL KAPITEL
7:
6
INTERVALLSCHÄTZUNGEN
112 FÜR Z U K Ü N F T I G E
BEOBACH-
TUNGEN UND FÜR PARAMETER VON V E R T E I L U N G E N
115
1
Toleranz- und Prognoseintervalle
115
2
Konfidenzintervalle
116
Inhaltsverzeichnis
2.1
Konfidenzintervalle für den Parameter μ einer Ν ( μ , σ 2 ) - Verteilung
2.2
117
Einhaltung vorgegebener Genauigkeiten bei Konfidenzinter2 Valien für den Parameter μ einer Ν(μ,σ ) - V e r t e i l u n g
2.3
Konfidenzintervalle für den Parameter σ
2
2.4
119
einer
Ν ( μ , σ 2 ) - Verteilung
122
Konfidenzintervalle für den Parameter ρ einer ß(n,p) - Verteilung
ÜBUNGSAUFGABEN ZU KAPITEL
KAPITEL 1
IX
8:
124 7
127
STATISTISCHE TESTS
129
Tests über die Parameter einer Normal Verteilung
130
1.1
130
Tests über den Mittelwert μ 2
1.2 2
Tests über die Varianz σ
132
Tests zum Vergleich der Parameter zweier Normal Verteilungen
134
2.1
Vergleich der Mittelwerte μ^ und μ^ 2 2
134
2.2
Vergleich der Varianzen σ^ und σ^
137
3
Tests über den Parameter ρ einer Binomialverteilung
4
Vergleich der Parameter p^ und P2 zweier
139
Binomialverteilungen
und der χ 2 - Unabhängigkeitstest für zwei Ereignisse
140
5
Der Vorzeichenrangtest nach Wilcoxon
144
6
Der Wilcoxon - Rangsummentest, der U - Test von M a n n - W h i t n e y 2
147
7
Der χ
150
8
Tests in allgemeinen rxs - Kontingenztafeln
- Anpassungstest
ÜBUNGSAUFGABEN ZU KAPITEL
KAPITEL 1
2
9:
8
REGRESSIONS- UND KORRELATIONSRECHNUNG
152 156
159
Einfache Regressions- und Korrelationsrechnung
159
1.1
Lineare Regression und die Methode der kleinsten Quadrate
150
1.2
Einfache Korrelationsrechnung
166
Multiple Regressions- und Korrelationsrechnung
171
2.1
Multiple Regressionsrechnung
171
2.2
Multiple Korrelationsrechnung
181
X
Inhaltsverzeichnis
ÜBUNGSAUFGABEN ZU KAPITEL KAPITEL
10:
9
183
VARIANZANALYSE
185
1
V e r g l e i c h mehrerer Meßreihen - e i n f a c h e V a r i a n z a n a l y s e
186
2
Das Blockexperiment - zweifache V a r i a n z a n a l y s e
192
ÜBUNGSAUFGABEN ZU KAPITEL 10
199
KAPITEL
201
11:
AUSBLICK
AUF W E I T E R E V E R F A H R E N
Versuchsplanung · StLchprobentheorie · Deskriptive Statistik · Explorative Statistik · Robuste Statistik · Graphische Verfahren · Skalierung von Merkmalsausprägungen · Qualitätskontrolle · Zeitreihenanalyse · Zuverlässigkeitstheorie · Mehrdimensionale Kontingenztafeln · Diskrete Regressionsanalyse · Multivariate Statistische Methoden · Multivariate Ein-, Zwei- und Mehrstichprobenprobleme · Diskriminanzanalyse " Multivariates Lineares Modell · Multivariate Regressionsanalyse · Multivariate Varianzanalyse · Multivariate Kovarianzanalyse · Multidimensionale Skalierung · Clusteranalyse · Faktorenanalyse KAPITEL
12:
LÖSUNGEN ZU DEN Ü B U N G S A U F G A B E N
209
1 Lösungen zu den Aufgaben i n K a p i t e l
1
209
2 Lösungen zu den Aufgaben in K a p i t e l
2
219
3 Lösungen zu den Aufgaben in K a p i t e l
3
225
4 Lösungen zu den Aufgaben i n K a p i t e l
4
237
5 Lösungen zu den Aufgaben in K a p i t e l
5
243
6 Lösungen zu den Aufgaben i n K a p i t e l
6
249
7 Lösungen zu den Aufgaben i n K a p i t e l
7
255
8 Lösungen zu den Aufgaben i n K a p i t e l
8
261
9 Lösungen zu den Aufgaben i n K a p i t e l
9
271
10 Lösungen zu den Aufgaben i n K a p i t e l
10
281
KAPITEL KLAUSUR
13:
KLAUSUREN
A
Lösungen zur KLAUSUR KLAUSUR
289 A
Β
Lösungen zur KLAUSUR
287
295 315
Β
321
Inhaltsverzeichnis
XI
ANHANG
343
1
343
Tabellenanhang Tab. 1:
Verteilungsfunktion Φ(χ) der Standardnormal Verteilung N(0,1)
344
Tab. 2:
Quantile
Tab. 3:
Quantile t der t-Verteilung 2 2 Quantile χ der χ - Verteilung η ;γ
Tab. 4: Tab. 5:
Quantile F„
der Standardnormal Verteilung N(0,1)
„
345 346 347
der F - Verteilung
349
2
Griechisches Alphabet
356
3
Symbolverzeichnis
357
4
Literaturhinweise
361
5
Stichwortverzeichnis
362 Ende
374
Vorwort
In a l l e n Bereichen der Wissenschaft, aber auch der Technik, der W i r t s c h a f t , des Handels, der Administration etc. i s t der E i n s a t z s t a t i s t i s c h e r Methoden und Vorgehensweisen u n e r l ä ß l i c h , zumal mit f o r t s c h r e i t e n d e r
Technisierung
immer komplexeres Datenmaterial gesichtet und ausgewertet werden muß. Dieses Buch b a s i e r t auf Grundvorlesungen und zugehörigen Übungen, die in den letzten Jahren für Studenten quasi a l l e r Fachrichtungen (z.B. Ingenieur- und Naturwissenschaftler, A g r a r w i s s e n s c h a f t l e r , W i r t s c h a f t s - und S o z i a l w i s s e n s c h a f t l e r ) an den U n i v e r s i t ä t e n Bonn und Dortmund gehalten wurden. Aufgrund der langjährigen didaktischen Erfahrung hat s i c h g e z e i g t , daß das Konzept dieses Buches für den s t a t i s t i s c h e n Anfänger überaus geeignet, sowohl vorlesungsbegleitend a l s auch zum Selbststudium, i s t : Methoden der d e s k r i p tiven (beschreibenden) S t a t i s t i k und der induktiven (schließenden)
Statistik
werden derart kombiniert behandelt, daß der Lernende d i r e k t die verhandenen Zusammenhänge zwischen beiden Bereichen erkennt. Zudem werden zu den e i n z e l nen Kapiteln Übungsaufgaben mit v o l l s t ä n d i g e n Lösungen dargeboten, so daß man das eigene Verständnis des Erlernten lückenlos überprüfen kann. Hinzu kommt noch ein K l a u s u r t e i l mit 'echten' Klausuraufgaben nebst Lösungen e i n s c h l i e ß l i c h Punktwertung und Benotung, der zur Überprüfung des generellen Verständnisses
dient.
Insgesamt haben wir uns bemüht, die e r f o r d e r l i c h e n mathematischen Grundkenntn i s s e so gering wie möglich zu halten und die einzelnen Kapitel weitgehend unabhängig voneinander lesbar zu g e s t a l t e n , so daß das Buch sowohl für mathematisch U n t r a i n i e r t e a l s auch für T r a i n i e r t e geeignet i s t und überdies a l s Nachschlagewerk für grundlegende s t a t i s t i s c h e Methoden dienen kann. Natürlich s t e l l t das Buch auch eine nützliche und breitgefächerte B a s i s für das Verständnis weiterführender und s p e z i e l l e r e r s t a t i s t i s c h e r L i t e r a t u r dar, was noch unterstützt wird durch den Ausblick im Kapitel
13, in dem a l l e
rele-
vanten Teilgebiete der S t a t i s t i k in i h r e r Grundthematik und Arbeitsweise vorg e s t e l 1 t werden.
XIV
Vorwort
Wir möchten es nicht versäumen, an dieser S t e l l e den Herren Dr. Karl-Heinz Klösener und Dr. Norbert Kuhlmeyer zu danken, die durch ihre M i t a r b e i t an früheren Vorlesungen bzw. Übungen i n d i r e k t zum Gelingen und Entstehen dieses Buches beigetragen haben. Außerdem danken wir Frau cand. s t a t . Meike Deiters und Frau cand. s t a t .
Bir-
g i t K e l l e r , die uns beim Nachrechnen der B e i s p i e l e , übungs- und Klausuraufgaben bzw. beim E r s t e l l e n des Typoscripts b e h i l f l i c h waren. Nicht z u l e t z t g i l t unser Dank dem R. Oldenbourg-Verlag und insbesondere dem L e k t o r a t s l e i t e r Herrn Martin Weigert für die problemlose Zusammenarbeit und größtmögliche F r e i h e i t bei der Gestaltung des Buches. Bärbel E l p e l t Joachim Härtung
Einführung
Statistische Methoden werden in zunehmendem Maße überall dort eingesetzt, wo empirisch bzw. experimentell gearbeitet wird. d.h. wo Daten aufbereitet und verarbeitet werden müssen. Sie lassen sich im wesentlichen in zwei Teile aufspalten, nämlich in Methoden der deskriptiven und Methoden der induktiven Statistik. Die de.ik>UpCivi Statiitik dient der Aufbereitung und Beschreibung verhandenen Datenmaterials. Ihre Ursprünge finden sich im 16.-18. Jahrhundert im Zusammenhang mit der Zustandsbeschreibung von Staaten (Aufzeichnung von Geburtsund Todesfällen, Beschreibung von Heer und Gewerbe etc.). Hierdurch wird auch der Ursprung des Wortes Statistik deutlich: Gottfried Achenwall (1719 - 1772) bezeichnet seine Staatsbeschreibungen als Statistik und bezieht sich auf das neulateinische Wort "status", was soviel wie "Staat" oder auch "Zustand" bedeutet. Die früheste Erwähnung deskriptiver statistischer Methoden läßt sich jedoch noch weit eher finden. Im vierten Buch Moses, dem Buch Numeri,wird von der "Musterung des Volkes", einer von Gott angeordneten Volkszählung gesprochen. Die -induktive StatiitA.k befaßt sich im Gegensatz zur beschreibenden Statistik damit, aufgrund von Daten Rückschlüsse zu ziehen. Basierend auf Beobachtungen an einer Auswahl, Stichprobe von Objekten, will man diejenige, in den Daten enthaltene Information extrahieren, die auf andere Objekte übertragbar ist. Die induktive Statistik entwickelte sich - abgesehen von einigen Grundlagen und Ansätzen - erst in diesem Jahrhundert und basiert im wesentlichen auf Resultaten der Wahrscheinlichkeitstheorie, die ihren Ursprung in der Berechnung von Chancen beim Glücksspiel hat. Die ersten wirklich mathematisch orientierten Betrachtungen in dieser Richtung wurden durch eine Anfrage des Chevalier de
Mere' im Jahre 1654 an den französischen Mathematiker Blaise Pascal
(1623- 1662) angeregt, vgl. Kapitel 1, der daraufhin mit Pierre der Fermat (1601 - 1665) eine Korrespondenz begann, die zur Bestätigung der Vermutung de Me're's aufgrund häufigen Spielens führte.
2
Einßhrung
Der näher an den historischen Entwicklungen und auch philosophischen Grundlagen der Statistik interessierte Leser sei hier verwiesen auf die ausführliche Einführung in Härtung et al. (1986). Wir werden in diesem Buch die wesentlichen Grundlagen der Wahrscheinlichkeitsrechnung und Statistik behandeln und grundlegende statistische Methoden darstellen. Das Kapitel 1 beschäftigt sich mit der Berechnung, d.h. mit den Rechenregeln für Wahrscheinlichkeiten sowie mit der formalen Definition des Wahrscheinlichkeitsbegriffes. Im Ka.p-U.il ΐ sind kombinatorische Grundlagen zusammengestellt, die bei der konkreten Bestimmung von Wahrscheinlichkeiten sehr nützlich sind. Im Kapitel 3 werden dann Zufallsvariablen und ihre Verteilungen betrachtet; auf diesem Instrumentarium gekoppelt mit zugehörigen Kenngrößen, die im Kapitel 4 behandelt werden, basieren die Methoden der induktiven Statistik. Im Kapitel 5 werden dann Eigenschaften der gebräuchlichsten Verteilungen zusammengestellt. Die induktive Statistik beschäftigt sich im wesentlichen mit der Punktschätzung von Kenngrößen und Parametern von Verteilungen, vgl. Kapitel 6, mit Interval Ischätzungen für zukünftige Beobachtungen und Parameter von Verteilungen, vgl. Kapitel 7, sowie mit statistischen Tests zur Überprüfung von Hypothesen, vgl. Kapitel S. In diesen drei Kapiteln werden konkrete Schätzungen und Tests insbesondere im Ein- bzw. Zweistichprobenfall der Normal- und Binomial Verteilung direkt mitbehandelt. Das Kapitel 8 beinhaltet zudem Tests zur Überprüfung von Verteilungsannahmen, nichtparametrische Lokationstests und Tests in allgemeinen Kontingenztafeln. Im Kapitel 9 werden die Grundlagen der einfachen und multiplen Regressionsund Korrelationsrechnung dargestellt. Die Regressionsrechnung beschäftigt sich mit der Bestimmung und Analyse funktionaler Zusammenhänge zwischen Variablen bzw. Merkmalen und die Korrelationsanalyse dient der Untersuchung der Stärke von Zusammenhängen zwischen Merkmalen. Das Kapitel 10 ist dann der Varianzanalyse gewidmet, die zur Untersuchung des Einflusses von Faktoren auf ein interessierendes Merkmal dient. Speziell erfolgt der Vergleich mehrerer Stichproben oder Meßreihen mit Hilfe der einfaktoriellen Varianzanalyse und des Blockexperimentes, bei dem ein zusätzlicher Störfaktor berücksichtigt wird. Das Kapitel 11 beinhaltet dann noch einen überblick über weiterführende sta-
Einführung
3
tistische Methoden.
Die Methoden der deskriptiven Statistik werden hier nicht gesondert behandelt; sie sind vielmehr an entsprechender Stelle in die einzelnen Kapitel integriert. So werden z.B. das Histogramm und die empirische
Verteilungsfunk-
tion in Zusammenhang mit der entsprechenden theoretischen Dichte bzw. Verteilungsfunktion behandelt. Deskriptive Maßzahlen für Lokation und Streuung von Daten oder für die Stärke des Zusammenhanges zweier Datenreihen sind gerade die Punktschätzungen für die entsprechenden theoretischen
Am Ende der Kapitel
1 bis 10 findet man stets übungiauigabzn
Größen.
zum behandelten
Stoff, die zur Kontrolle und Übung des Gelernten dienen. Die ausführlichen Losungen
zu diesen Übungsaufgaben sind im Kap-ctel 12 zusammengestellt.
Schließlich sind im Kapitel
13 KlauiuAzn
mit
Löiungzn
enthalten. Hier kann
man feststellen, ob man den gesamten Stoff beherrscht und
Problemstellungen
richtig einordnen kann. Zur Einschätzung des eigenen Wissens und Könnens sind Punkte - Bewertungen für die einzelnen Aufgaben, Notenschemata für die einzelnen Klausuren und in den Lösungen auch Angaben zur Bewertung
innerhalb
der Aufgaben gegeben.
Als H-inweii zum ΑΛbeJXzn
mit dem vorliegenden Buch sei hier noch erwähnt,
daß einzelne Teile (insbesondere in den Kapiteln 3 und 4) dem mathematisch weniger Geübten vielleicht zunächst Schwierigkeiten bereiten. Dies ist jedoch kein Grund zum Aufgeben, da spätere Passagen i.d.R. trotzdem noch verstanden werden können. Man sollte solche Problemstellen also zunächst einfach übergehen und erst später wieder auf sie zurückkommen.
Kapitel 1: Rechnen mit Wahrscheinlichkeiten
1. Zufällige Ereignisse und Wahrscheinlichkeiten Ein Ereignis, das zwar a u f g r u n d von zum Beispiel
physikalischen oder ökono-
m i s c h e n Gesetzmäßigkeiten z u s t a n d e k o m m t , aber w e g e n der Komplexität der Gesetzmäßigkeiten trotzdem nicht e r f a ß b a r , erklärbar bzw. vorhersehbar n e n n t man ein zu{ä&tige4
ist,
EitigyvLi.
Zufällige Ereignisse - w i e etwa das Ergebnis eines M ü n z - oder
Würfelwurfes,
der Ausfall einer M a s c h i n e o d e r der Konkurs e i n e r Firma zu einem bestimmten Zeitpunkt - sind Ergebnisse von ΖαίαίΐΛζχρζκ-ύηιηΧζη
oder
Zu^atiivoigängzn.
über das Eintreten eines bestimmten Ergebnisses läßt sich hier einzeln betrachtet nichts a u s s a g e n , wohl a b e r über das
'durchschnittliche'
Ergebnis-
v e r h a l t e n , d.h. A u s s a g e n können sich nur auf das m i t t l e r e Verhalten bei len R e a l i s a t i o n e n eines zufälligen Ereignisses
vie-
beziehen.
8exip-te-d: Es bezeichne Α das E r e i g n i s , daß e i n e Glühbirne in einer Ampel
we-
niger als 90 Tage intakt ist, also A = { Lebensdauer einer A m p e l - G l ü h b i r n e < 90 Tage } Für e i n e e i n z e l n e , bestinrite Glühbirne läßt sich dann nicht im Vorhinein
sa-
gen, o b das Ereignis Α eintritt. Wohl aber kennt m a n in der Umgangssprache Aussagen folgender Art: - Im D u r c h s c h n i t t werden 97% a l l e r Glühbirnen mindestens 90 Tage a l t ; - M i t 97% Sicherheit w i r d e i n e Glühbirne m i n d e s t e n s 90 Tage a l t ; - Die W a h r s c h e i n l i c h k e i t , daß e i n e Glühbirne w e n i g e r als 90 Tage lebt das Ereignis Α tritt e i n ) , liegt bei 3% .
Man s c h r e i b t dann auch P(A) = 3% = 0.03 wobei Ρ für 'Probability'
, (= W a h r s c h e i n l i c h k e i t ) s t e h t , bzw. w e n n
(d.h.
6
Kap. 1: Wahrscheinlichkeiten
Ä = { Lebensdauer einer Ampel-Glühbirne > 90 Tage } das zu Α komplmentäKz
bezeichnet,
Eieignii
P(Ä) = 97% = 0.97
.
Inhaltlich bedeutet die Aussage dieses Beispiels, daß von 'vielen' AmpelGlühbirnen etwa 3% in den ersten 90 Tagen ausfallen.
|
Ist Α ein Ereignis und Ä das zu Α komplementäre Ereignis, so gilt natürlich stets P(A) + P(Ä) = 1 0 0 « = 1
bzw.
P(Ä) = 1 - P(A)
Wie kommt man zur Wahrscheinlichkeit für ein Ereignis, wie etwa zur Wahrscheinlichkeit 3% für das Ereignis Α im obigen Beispiel?
Im konkreten Fall wird man etwa η = 2 0 0 0 0 Glühbirnen, die in Ampeln eingesetzt sind, bzgl. ihrer Lebensdauern beobachten. Wir entnehmen der Produktion von Ampel-Glühbirnen zufällig eine Stichprobe zeichnen mit H n ( A ) die abiolute
Häufigkeit
von η Glühbirnen und be-
des Ereignisses A , d.h die An-
zahl von Glühbirnen, die weniger als 90 Tage intakt waren. Dann bestimmen wir die n.elative
des Ereignisses A
Häufigkeit
hn(A)4Hn(A)
,
die natürlich stets zwischen 0 und 1 liegt, und werden feststellen, daß sich bei Vergrößerung des Stichprobenumfang*
n , falls sich an Produktion und Ex-
periment nichts ändert, die relative Häufigkeit h n ( A ) einer gewissen Zahl ρ nähert, die dann die Wahrscheinlichkeit h (Α)
P(A) des Ereignisses Α definiert:
> ρ = P(A)
Für 'große' η gilt also eine ungefähre hn(A)~P(A)
Gleichheit:
.
(Ober die Güte dieser Anpassung werden wir in den folgenden Kapiteln noch Aussagen machen.)
Von der Funktion Ρ wollen wir die gleichen Eigenschaften die relative Häufigkeit h
verlangen, wie sie
hat, und natürlich ist Ρ definiert auf der Menge
Kap. 1:
der jeweils interessierenden E r e i g n i s s e A^
7
Wahrscheinlichkeiten
f ü r die g i l t
P ( A , ) + P(A-) + . . . = 1 (wenn Α , , Α , , . . . s i c h ausschließen, d i s j u n k t 1 2 1 1 sind), 04Hn=TÄ=0·178
A
( Ä
> 4 V >
=
S
=
A
> = Ä
= 0
0
=1
-850
·
1 5 0
·
-hn0
f a l l s Α und Β (itochaitiich)
unabhängig
sind. Exakt d e f i n i e r t man zwei E r e i g n i s s e Α und Β a l s unabhängig, wenn letztere Gleichung g i l t .
2. Beispiele zum Rechnen mit Wahrscheinlichkeiten 2.1
V E R E I N I G U N G E R E I G N I S S E N :
UND
D U R C H S C H N I T T
P A R A L L E L -
UND
VON S E R I E N -
S Y S T E M E Wir wollen im folgenden anhand einiger Beispiele überlegen, wie groß die Wahrscheinlichkeit der Vereinigung und des Durchschnitts mehrerer Ereignisse i s t . Solche Vereinigungs- bzw. Durchschnittsereignisse lassen sich dann auch graphisch a l s VcuiallilläMigkeAXm
bzw. Suü.qi>twLvt ( S H R ) , v g l . Abb. 4. Z(SHR) d i e s e s
A6b. 4:
bzgl.
s i n d , a u s g e r ü s t e t . Brennen a l l e G l ü h b i r n e n bzw. Fäden Wie groß i s t d i e
mit
Zuverlässigkeit
Systems?
Z u v e r l ä s s i g k e i t s s c h a l t b i l d e i n e r Ampelanlage aus 4 R o t l i c h t s i c j n a l e n mit j e w e i l s h e i ß e r Reserve
Jedes R o t l i c h t s i g n a l
RS^, j = 1
4 , i s t e i n P a r a l l e l s y s t e m mit zwei
unabhängigen Komponenten, so daß g i l t Z ( R S . ) = 1 - [1 - P(GB· , i n t a k t ) ] · [1 - P(GB. , i n t a k t ) ] J J >l J »t = 1 - 0 . 0 3 - 0 . 0 3 = 0.9991
D i e Z u v e r l ä s s i g k e i t des Gesamtsystems b e t r ä g t s o m i t dann
Z(SHR) =
|| Z ( R S . ) = 0 . 9 9 9 1 4 = 0.996 3 j =1
.
D i e Z u v e r l ä s s i g k e i t konnte durch Redundanz a l s o im V e r g l e i c h zu ( i )
be-
Kap.
1: Wahrscheinlichkeiten
17
trächtlich erhöht werden, nämlich von 88.5% auf 99.6% . Je größer die Ampelanlage i s t , desto mehr wirkt sich die Redundanz in den Rotlichtsignalen aus. So ergibt sich z.B. für N = 8 Z(SOR) = 78.4%
,
Z(SHR) = 99.3%
,
Z(SHR) =98.6%
und für Ν = 16 Z(SOR) =61.4%
.
Eine weitere Erhöhung der Zuverlässigkeit i s t durch Verwendung sogenannter S y i t m z
mit
möglich, bei denen die zweite Birne im Rotlicht-
k a l t e A ReieAve.
signal erst anfängt zu brennen, wenn die erste Birne a u s f ä l l t . Eine ausführliche Diskussion solcher Probleme findet man in Härtung et a l . (1986, Kap. X I I I ) . Β ί Λ Λ ρ Ι ί Ι :
(e) Ein Gehäuse bestehe aus Vorder- und H i n t e r t e i l , die mit 10% bzw. 8% Wahrscheinlichkeit fehlerhaft sind, sowie einem Dichtungsring, der mit 95% Sicherheit intakt i s t . Mit welcher Wahrscheinlichkeit i s t das Gehäuse v ö l l i g fehlerfrei gearbeitet, wenn man davon ausgeht, daß die Produktion der drei Teile unabhängig voneinander erfolgt? Sei Α das Ereignis "Vorderteil intakt", Β das Ereignis "Hinterteil
in-
takt" und C das Ereignis "Dichtungsring i n t a k t " ; dann i s t P(A) = 0.90
,
P(B) = 0.92
und
P(C)=0.95
.
Das Gehäuse i s t ein Seriensystem mit drei Komponenten, vgl. Abb. 5, so daß seine Intaktwahrscheinlichkeit gleich dem Produkt der KomponentenIntaktwahrscheinlichkeiten
ist:
P(An Bn C) = P(Gehäuse intakt) = P(A) · P(B) · P(C) = 0.90 · 0.92 · 0.95 = 0.7866 (f) Eine Firma hat drei Monteure M 1 , M 2 , Mj für spezielle Wartungsaufgaben ausgebildet, die mit unterschiedlicher Wahrscheinlichkeit unabhängig voneinander z.B. wegen Krankheit ausfallen:
18
Kap. I: Wahrscheinlichkeiten
Abb.
5: Darstellung des Gehäuses als Seriensystem m i t drei Komponenten
unabhängigen
P(M 1 fällt aus) = 1 0 % = 0.1 P(M 2 fällt aus) = 20% = 0.2 P ( M 3 fällt aus) = 3 0 % = 0.3
.
(i) Wie groß ist die Wahrscheinlichkeit, daß wenigstens ein Monteur zur Verfügung steht?
Da das Wartungssystem intakt ist, solange wenigstens ein Monteur zur Verfügung steht, ist das interessierende Ereignis gerade das
Komplement
des Ereignisses "alle Monteure fallen aus", so daß gilt P(Wartungssystem intakt) = 1 - P(Wartungssystem defekt) = 1 - P(M 1 fällt a u s n M 2 = 1 - P(M 1
fällt aus η M 3 fällt aus)
fällt aus) · P ( M 2 fällt aus) · P ( M 3 fällt aus)
= 1 - 0 . 1 - 0.2 · 0.3 = 0.994
.
Das Wartungssystem ist somit ein Parallelsystem m i t 3 unabhängigen
Kom-
ponenten, den Monteuren, vgl. Abb. 6,und die Zuverlässigkeit Ζ des Systems läßt sich auch schreiben als Ζ = P(Wartungssystem
intakt)
= 1 - [1 - P(M, intakt)] · [1 - P(M 2 intakt)] · [1 - P ( M 3 = 0.994
intakt)]
.
(ii) Wie groß ist die Wahrscheinlichkeit, daß die Produktion wegen Ausfalls der Monteure gestoppt werden m u ß , wenn mit 80% Wahrscheinlichkeit eine der zur Produktion benötigten Maschinen MA (unabhängig
Kap. 1: Wahrscheinlichkeiten
19
Abb. 6: Darstellung des Wartungssystems aus 3 Monteuren m i t t e l s eines P a r a l l e l systems
vom A u s f a l l der Monteure) defekt i s t ? Gesucht i s t die Wahrscheinlichkeit eines Produktionsstops, a l s o P(MA f ä l l t aus und Μ,, M 2 > M 3 f a l l e n aus) = P[(MA f ä l l t aus) η (Wartungssystem defekt)] = P(MA f ä l l t aus) · P(Wartungssystem defekt) = 0.8 · (0.1 · 0.2 · 0.3) = 0.8 · (1 - 0.994) = 0.0048
,
d.h. mit ca. 0.5% Wahrscheinlichkeit muß die Produktion gestoppt werden. Das gesamte System läßt s i c h wiederum a l s P a r a l l e l s y s t e m , v g l . Abb. 7, d a r s t e l l e n und seine Z u v e r l ä s s i g k e i t
ist
Z = 1 - [1 - P(MA i n t a k t ) ] · [1 - P(M 1 i n t a k t ) ] · [1 - P(M 2 i n t a k t ) ] • [1 - P(M 3 i n t a k t ) ] = 1 - 0.8 · 0.1 · 0.2 · 0.3 = 1 - 0.0048 = 0.9952
.
(
Wir wollen nun noch einmal die in den B e i s p i e l e n (a) - ( f ) gewonnenen E/igebruAiz zusammenstellen.
Kap.
20
Abb.
1:
Wahrscheinlichkeiten
7: Darstellung des kombinierten Wartungs-Maschinen-Systems als Parallelsystem mit vier unabhängigen Komponenten
Sind A^
(stochastisch) unabhängige Ereignisse, so gilt P(A1 η A2fl ... n A m ) = P(A1} · P(A 2 ) · ... · P(A m )
und
P(A1 U A 2 U ... u A m ) = 1 - [1 - P(A t )] · [1 - P(A 2 )] ·...· [1 - P(A m )] .
Eine Anwendung dieser beiden Regeln sind Serien- bzw. Parallelsysteme: P(Seriensystem intakt) = P(1. Komponente intakt)· ...· P(m-te Komponente intakt)
,
P(Parallelsystem intakt) = 1 - [1 - P(1. Komponente intakt)]· ...· [1 - P(m-te Komponente intakt)] Zum Abschluß dieses Abschnitts 2.1 wollen wir nun die Frage beantworten, die der Chevalier de Me're im Jahre 1654 an den französischen Mathematiker Blaise Pascal richtete: Stimmt es, daß von den beiden folgenden Wetten die erste größere Gewinnchancen bietet? I.
Ein fairer Würfel wird viermal geworfen und man setzt auf das Ereignis "mindestens eine Sechs";
II. Zwei faire Würfel werden 24-mal geworfen und man setzt auf das Ereignis "mindestens ein Sechserpasch". Bezeichnet A^ bei der ersten Wette das Ereignis, daß im i-ten Wurf,
Kap. 1: Wahrscheinlichkeiten
i=1
21
4 , eine Sechs gewürfelt wird, so i s t P ( V
=
F
für i = 1 , . . . . 4
und es ergibt s i c h P(Wette I gewonnen) = P(A 1 U A z U A 3 υ A 4 ) = 1 - [1 - P(A,)] · [1 - P(A 2 )] · [1 - P(A 3 )] · [1 - P(A 4 )] - ι - (1 - - ) 4 - 1 - 1
U
τ
)
- 1
= 1 - 0.482 = 0.518 I s t für i=1 1ichkeit
11-
625
w
.
24 bei der zweiten Wette B i das Ereignis mit der Wahrschein-
daß im i - t e n Wurf ein Sechserpasch gewürfelt wird, so i s t P(Wette I I gewonnen) = P ( B 1 U B 2 U . . . U B 2 4 ) - 1 - [1 - P(B 1 )] · [1 - P ( B 2 ) ] · . . . · [1 - P ( B 2 4 ) ]
= 1 - 0.509 = 0.491 Die Frage des Chevalier
de Me're' muß also mit " j a " beantwortet werden, denn
bei Wette I beträgt die Gewinnchance 51.8%, wohingegen s i e bei Wette I I l e d i g l i c h bei 49.1% l i e g t .
2.2
B E D I N G T E FORMEL L I C H K E I T
WAHRSCH E I N L I C H K E I T E N : DER Τ O T A L E N W A H R S C H E I N UND BAY ES S C Η Ε F O R M E L
VON
Wichtige Rechenregeln für bedingte Wahrscheinlichkeiten sind die fomrnl von den. totalen
WahAichexntichke-ct
und die Ba.yei6c.he. Vo>mel, die wir im folgen-
den anhand eines B e i p i e l s herleiten wollen.
Kap.
22
I:
Wahrscheinlichkeiten
BbLbpieZ: Die Produktion eines Bauteils e r f o l g t auf einem von zwei unabhängig voneinander arbeitenden Fließbändern F^ und F^. Bei der Qualitätskont r o l l e wird ein Bauteil dann in die Qualitätsklasse Q1 oder Qg eingeordnet. F^ l i e f e r t 900 Bauteile pro Stunde, von denen 80% in Q1 f a l l e n , und von den 1000 Bauteilen pro Stunde, die F 2 f e r t i g t , f a l l e n 70% in die Qualitätsstufe Q^. Das Bauteil wird montiert und in der Endkontrolle i s t nicht mehr f e s t s t e l l b a r , von welchem Band es h e r g e s t e l l t worden i s t . ( i ) Wie groß i s t die Wahrscheinlichkeit, in der Endkontrolle ein Bauteil der Qualitätsstufe Q^ zu finden? Bezeichnet Β das Ereignis "Bauteil in Q^" und Α das E r e i g n i s "Bauteil kommt von F.|", dann wissen wir, daß g i l t
K
'
1900
19
da von insgesamt 1900 Bauteilen, die pro Stunde g e f e r t i g t werden, 900 von F^ kommen. Weiterhin ergeben sich aus der Aufgabenstellung die bedingten Wahrscheinlichkeiten P(B | A) = 80% = 0.8
und
P(B | Ä) = 70% = 0.7
Nun i s t Β = ( A n B ) u (An B) = Cu D und C und D schließen einander aus, d.h. sind
d l i j u n k t ,
da ein Bauteil
g l e i c h z e i t i g von F^ und F^ produziert worden sein kann, d.h. P(C η D) = 0 Damit erhalten wir P(B) = P [ ( A n B) U (Ä η B)] = P(C U D) = P(C) + P(D) - P(C η D) = P(C) + P(D) - 0 = P(Aη Β) + P(Än Β) und mit der Formel P(B|A)=^nO für bedingte Wahrscheinlichkeiten ergibt s i c h
nicht
Kap. 1: Wahrscheinlichkeiten
Ρ(ΑΠΒ) = Ρ(Β I A) . P(A) = 0 . 8 · ^
23
,
P(Ä η Β) = Ρ(Β I Ä) · P(Ä) = Ρ(Β I Ä) · [1 - Ρ ( Α ) ] = 0.7· so daß mit der
fom&l
von
d&t
=
,
totalen
WakucheintichkeiX
gilt
P(B) = P(B | A) · P(A) + P(B | Ä) · P(Ä) = 0.8
0.7 ·
=
°-747
•
Mit 74.7% Sicherheit gehört ein Bauteil in der Endkontrolle zur Qualitätsstufe Q r ( i i ) Mit welcher Wahrscheinlichkeit P(A | B) kommt ein in der Endkontrolle der Qualitätsstufe Q^ zugeordnetes Bauteil vom Fließband F ^ Mit den Ergebnissen aus Teil ( i ) ergibt sich Pf A I R l - P ( - A . " . B ) - n R . '
I
— P X B - J — °· 8
9
/7·2*7
- " · § ' g-
T5/ ~Τ9
7·2
- 0 507 -u-bu/·
Τ7ΣΤΎ-νΓΪ
Ausführlich aufgeschrieben haben wir hier die Formel ρ/Α , Bηλ . P(A Π Β) . P(B I A) · P(A) I ) ρητ) ^ PCB I A) · P(A) PCB I A) · P(A) + PCB I Ä) · P(Ä) benutzt, die auch
Ba.ytiic.he.
Fonmet
heißt.
Fassen wir die Ergebnisse des Beispiels noch einmal zusammen. Die den.
totalen
UahAicheintLchkiAX
formet
ist
- für zwei Ereignisse Α und Ä mit 0 < P ( A ) < 1 P(B) = P(B | A) · P(A)+ P(B | Ä) · P(Ä)
,
- für m paarweise disjunkte, d.h. einander ausschließende A 1 , . . . , A [ n mit
PCA1) + . . . + P f A j = 1
m PCB) = l PCB | A.) · P(A.) 1 1 i=1
,
und
Ρ(Α^>0
Ereignisse
für i = 1
m
von
24
ΚαΡ· l:
Wahrscheinlichkeiten
und die FonmdL von Ba.yzi i s t - für zwei Ereignisse Α und Ä mit 0 < P(A) < 1 : P(A | Β)
Ρ(Β|Α)·Ρ(Α)
P(B | A) · P(A) + P(B | Ä) · P(Ä)
,
- für m paarweise disjunkte Ereignisse A ^ , . . . ,Am mit P(A 1 ) + . . . + P(A m ) = 1 und P(A.j) > 0
für i = 1 , . . . , m :
P(B i A.) · P(A.) 1 1 P(A. 1I B) =ι m [ P(B | A.) · P(A.) J J j=1
3. Axiomatische Definitionen des Wahrscheinlichkeitsbegnfles Wir wollen an dieser S t e l l e zwei verschiedene Definitionen des Wahrscheinl i c h k e i t s b e g r i f f e s , nämlich die klassische und die allgemeine Definition aufführen. Dazu benötigen wir zunächst noch den Begriff des Grundraums. Der
Giund-
laum Ω, auf dem wir eine Wahrscheinlichkeit definieren, i s t die Vereinigung a l l e r möglichen, interessierenden Ereignisse. Zufällige Ereignisse werden dann auch als Teilmengen von Ω aufgefaßt. Besteht ein Grundraum Ω aus den endlich v i e l e n , paarweise disjunkten mentcumfLiL-ignXAiin
, d.h.
Ω = E1 U E 2 U . . . U E$ E i η Ej = 0
Elt-
,
( " l e e r e Menge")
für i,j=1
s
und i ^ j
,
und sind a l l e Elementarereignisse 'gleichwahrscheinlich', d.h. die Wahrscheinlichkeit von E.j sei d e f i n i e r t als P(Ei)=j so i s t die
ktaatiahe.
für i=l oder
s
,
Lapiacz-UahAichzintichkeUJ:
eines Ereignisses A,
das sich aus r < s Elementarereignissen zusammensetzt, d e f i n i e r t durch
25
Kap. 1: Wahrscheinlichkeiten
p m 1
'
. A n z a h l der f ü r Α g ü n s t i g e n Fäl 1e _ r Anzahl der mog möglichen F ä l l e s
e i n " f ü r Α g ü n s t i g e r F a l l " i s t n a t ü r l i c h d e r , daß e i n s der i n Α enthaltenen Elementarereignisse
eintritt.
BiAApliZ:
(a) I n e i n e r P a r t i e von s Schrauben s i n d r s c h a d h a f t . G r e i f t man eine Schraube h e r a u s , so e r g i b t
sich
--ι.,.ίί.,.Ε^ _ Anzahl schadhafter Schrauben _ r P(Schraube s c h a d h a f t ) Anzahl a l l e r Schrauben s
(b) Beim Würfeln mit einem f a i r e n Würfel s i n d d i e sechs Zahlen
"
1,2,...,6
a l l e gleichwahrscheinlich, d.h. P ( " D = P("2") = ... = P("6")
.
Die W a h r s c h e i n l i c h k e i t des E r e i g n i s s e s A, e i n e gerade Zahl zu w ü r f e l n , i s t dann P(A)=|=0.5
,
da s i c h das E r e i g n i s Α aus den d r e i E l e m e n t a r e r e i g n i s s e n " 2 " , " 4 " und " 6 " zusammensetzt.
|
I s t Ω e i n b e l i e b i g e r Grundraum, so wird die W a h r s c h e i n l i c h k e i t Ρ auf Ω durch d i e d r e i Koimogoio 0
kxlomz
f ü r jedes E r e i g n i s Α aus Ω
(PoiitiviXät)
P(fi) = 1
(
oo
\
u 1
(N o n m i i i t h z U ) °°
) 1
=
l
Λ
ϊ
^
J e d e Folge paarweise d i s j u n k t e r Ereignisse A ^ A ^ , . . .
aus Ω (σ -
Αdd-Ltiv-ität)
d e f i n i e r t , aus denen s i c h a l l e von uns h e r g e l e i t e t e n Rechenregeln f ü r Wahrscheinlichkeiten ableiten
lassen.
Der Grundraum fi, auf dem eine W a h r s c h e i n l i c h k e i t Ρ d e f i n i e r t w i r d , h e i ß t wegen Ρ (Ω) = 1
Kap.
26
auch das
1:
Wahrscheinlichkeiten
i-tcheAi
unmögtichei
E i & i g n i i
E i z l g n ü , ,
und das zu Ω komplementäre Ereignis Ω - 0 heißt
da gilt
p(0) = Ρ(Ω) = 1 - Ρ(Ω) = ο
.
Es sei davor gewarnt, aus P(B) = 1 oder Ρ(C) = 0 zu schließen, daß gilt 8 = Ω oder C = 0 . Zum Beispiel ist die Wahrscheinlichkeit 0, daß ein Würfel beim Würfeln auf der Kante stehen bleibt, aber dieses Ereignis ist prinzipiell nicht unmöglich.
ÜBUNGSAUFGABEN ZU KAPITEL 1
Aufgabe 1.1: Bei der Untersuchung von Produktionsfehlern an einem Stückgut wurde festgestellt, daß die Fehlerhaftigkeit im wesentlichen auf drei Quellen (Material, Maschine, Bediener) zurückzuführen ist. Bezeichnen wir mit Α das Ereignis "Materialfehler", mit Β das Ereignis "Maschinenfehler" und mit C das Ereignis "Bedienungsfehler", so ergab die Untersuchung folgende Fehlerwahrscheinlichkeiten: P(A) =P(B) =0.05
und
P(C)=0.1
Abhängigkeiten treten nur zwischen den Ereignissen Α und Β zutage, und zwar ergab sich P(An B) = 0.01 a) Interpretieren Sie folgende Ereignisse, stellen Sie sie graphisch durch Flächenschraffierung in einem Mengendiagramm wie in Abb. $ dar und berechnen Sie die Wahrscheinlichkeiten dieser Ereignisse: (1)
AuB
(2)
AuBuC
(3)
ΑΠ Β
(4)
, ,
(ÄuB)nc
Kap. 1: Wahrscheinlichkeiten
27
Abb. i: Mengendiagramm für die Ereignisse A , B, C im Raum aller möglichen Ereignisse fi
b) Stellen Sie folgende Ereignisse durch Mengen und Mengendiagranme dar und berechnen Sie ihre Wahrscheinlichkeiten: (1) mindestens zwei Fehler treten auf; (2) höchstens einer der Fehler tritt auf.
Aufgabe 1.2: In einem Produktionslos von n = 1300 Schrauben stellt man fest, daß 120 Schrauben außerhalb der Querschnittstoleranz und 180 Schrauben außerhalb der Längentoleranz liegen. Außerdem weiß m a n , daß 40 Schrauben zu lang und ausserhalb der Querschnittstoleranz sind ufid daß von den zu kurzen Schrauben 90 einen akzeptablen Querschnitt haben. Insgesamt 1050 Schrauben genügen den Qualitätsanforderungen. Stellen Sie eine Kontingenztafel keiten folgender
auf und bestimmen Sie die relativen Häufig-
Ereignisse:
a) mindestens einer der Fehler "zu lang" und "außerhalb der Querschnittstoleranz" tritt auf; b) sowohl in Länge als auch in Querschnitt ist eine Schraube
fehlerhaft;
c) eine Schraube, die den Querschnittsanforderungen genügt, ist zu lang; d) eine Schraube mit akzeptabler Länge liegt außerhalb der Querschnittsanforderungen.
28
Kap. 1: Wahrscheinlichkeiten
Aufgabe 1.3: Die Färberei einer Textilfabrik benötigt, um einen reibungslosen
Färbeablauf
zu gewährleisten, ein Vorfärbebecken, ein Hauptfärbebecken und ein Wasserbad zum Entzug überflüssiger Farbe. Jedes der drei vorhandenen ken V.|, V 2 > V^ ist mit zwei Hauptfärbebecken H.,· j , H^ ^ f ü r Übergangsschleusen ü^ ^ 2 serbäder W ^ , . . . ^
f
ü r
Vorfärbebek-
i = 1,2,3 durch
i =1,2,3 gekoppelt. Außerdem stehen vier Was-
zur Verfügung, zu denen von jedem Hauptfärbebecken
pro-
blemlose Übergangsbahnen zur Verfügung stehen. Die Vorfärbebecken V^ und sind mit 95% Sicherheit gebrauchsbereit, das dritte Vorfärbebecken
funktio-
niert mit einer Wahrscheinlichkeit von 2% nicht. Die Übergangsschleusen
und
Hauptfärbebecken arbeiten alle mit einer Zuverlässigkeit von 90% und die Wasserbäder W ^ , W,,, W j und W^ haben Intaktwahrscheinlichkeiten von 0.9, 0.92, 0.94 bzw. 0.87. Wie groß ist die Wahrscheinlichkeit dafür, daß die Färbung von Stoffen möglich ist?
Aufgabe
1Λ:
Aufgrund langjähriger Erfahrungswerte einer Flughafenverwaltung hat sich gezeigt, daß von 100000 Passagieren nur einer ein Luftpirat ist, so daß bei Abfertigung von durchschnittlich 2000 Passagieren pro Tag alle 50 Tage ein Luftpirat unter den Fluggästen ist. Totzdem werden zum Schutz der Passagiere alle Fluggäste einer unauffälligen Kontrolle unterzogen. Ein Luftpirat wird dabei mit 98% Sicherheit entdeckt, und e i n f r i e d l i c h e r Passagier bleibt in 99% aller Fälle unbehelligt. a) Wieviele Passagiere werden durchschnittlich im Laufe eines Jahres (365 Tage)
"festgenommen"?
b) Lohnt es sich, die "Festgenommenen" zur Vermeidung von Protesten einer nochmaligen, aufwendigeren Kontrolle zu unterziehen?
Kapitel 2: Kombinatorik
Die Komb-inato'u.k oder "die Kunst des Zählens1' ist ein wichtiges Hilfsmittel zur Berechnung von Laplace-Wahrscheinlichkeiten. Wir wollen hier die wichtigsten Regeln der Kombinatorik behandeln, nämlich die für die Bestimmung der Anzahl möglicher Permutationen, Variationen und Kombinationen von Objekten.
1. Permutationen Jede Anordnung von η verschiedenen Objekten in einer Reihe heißt eine Peimutatlon
de'ι η Objekte..
BexApieZ: Die n = 3 Buchstaben a,b,c lassen sich auf sechs Arten anordnen: abc , acb , bac , bca , cab , cba
,
d.h. es gibt 6 Permutationen der drei Objekte. Allgemein ist n! = 1 · 2 · 3 · ... · η die Anzahl möglicher Permutationen von η verschiedenen Objekten, denn es gibt η Möglichkeiten, den ersten Platz in der Reihe zu besetzen, n - 1
Möglichkei-
ten, den zweiten Platz zu besetzen, ... und eine Möglichkeit.den letzten, n-ten Platz zu besetzen.
Die Interpretation einer Permutation in einem sogenannten
Kugel-Zeiten-ModeiZ
ist die folgende: η unterscheidbare, z.B. durchnumerierte Kugeln (Objekte) werden auf η unterscheidbare Zellen (Plätze in der Reihe) derart verteilt, daß keine Zelle mehrfach besetzt ist.
30
Kap. 2: Kombinatorik
BeAAp-ie.1: Herr Schmidt hat vier Briefe und vier zugehörige Umschläge vorbereitet. Seine Sekretärin steckt die Briefe ohne hinzusehen in die Umschläge. Wie groß ist die Wahrscheinlichkeit des Ereignisses A , daß jeder Brief im richtigen Umschlag steckt? Es gibt 4! = 1 · 2 · 3 · 4 = 24 Möglichkeiten der Zuordnung der Briefe zu den Umschlägen, von denen nur eine die richtige ist, so daß gilt oin\ _ Anzahl der für Α günstigen F ä l l e _ P(A) Anzahl der möglichen Fälle
w
1 -
„ ηΔ17 , 17ϊ 0.0417 - 4.17*
.
|
2. Variationen Werden aus η verschiedenen Objekten genau k Objekte ausgewählt und in einer Reihe angeordnet, so heißt jede Anordnung mit Berücksichtigung der Reihenfolge der Objekte eine l ' a j i i a t i o n oder geoidneie P/iobe. von k aus η Objekten.
Kann jedes Objekt mehrfach in der Anordnung vorkommen, dann ist auch möglich, so spricht man von einer VovUation
mit
k>n
UiideAholung.
8«ΛΛρ-ίζΙ: Zwei Buchstaben sollen aus den drei Buchstaben a,b,c ausgewählt werden, wobei Wiederholungen möglich sind. Die mögliche Zahl
verschiedener
Variationen mit Wiederholung ist dann gerade 9, nämlich: aa , ab , ac , ba , bb , bc , ca , cb , cc
.
|
Allgemein ist die mögliche Anzahl der Variationen von k aus η Objekten mit Wiederholung
η
k
=η·η·...·η
,
k-mal denn für die Besetzung von jedem der k Reihenplätze stehen η verschiedene
Ob-
jekte zur Verfügung.
Im Zellen-Kugel-Modell
entspricht einer Variation mit Wiederholung die Be-
setzung von η unterscheidbaren Zellen durch k unterscheidbare Kugeln, wobei jede Zelle auch mehrfach besetzt sein kann.
31
Kap. 2: Kombinatorik
Β i i l & p l z l : Das F u ß b a l l t o t o (11er-Wette) i s t e i n B e i s p i e l f ü r eine V a r i a t i o n mit Wiederholung. Für jedes von e l f ausgewählten F u ß b a l l s p i e l e n
(Kugeln)
kann eine der Zahlen 1, 0 oder 2 ( Z e l l e n ) angekreuzt werden, je nachdem ob man auf S i e g der Heimmannschaft, auf Unentschieden oder auf S i e g der G a s t mannschaft s e t z t . Jemand, der keine Ahnung vom Fußball hat und die Zahlen z u f ä l l i g a n k r e u z t , hat 3 1 1 = 3 · 3 . . . . . 3 = 177147 M ö g l i c h k e i t e n des T i p p e n s , von denen nur eine v ö l l i g r i c h t i g i s t . Die Chance e i n e s r i c h t i g e n T i p s Α b e l ä u f t s i c h somit f ü r ihn auf P(A ) = τ Τ π τ γ = 0.00000565
Kann jedes der η verschiedenen Objekte i n der Auswahl von k Objekten höchstens einmal vorkommen, was n a t ü r l i c h k < n v o r a u s s e t z t , so s p r i c h t man von e i n e r VaAiaXion
ohne
W-Le.d&nholung.
8 i i i p - i i l : Die Anzahl der V a r i a t i o n e n ohne Wiederholung von zwei aus den d r e i Buchstaben a, b, c i s t s e c h s , denn es g i b t nur d i e M ö g l i c h k e i t e n ab, a c , ba, bc, c a , cb Allgemein i s t d i e Anzahl der V a r i a t i o n e n ohne Wiederholungen von k aus η Objekten ( n ) k = n · (n - 1) · . . . ·
("-k+D^-f^^r
da es f ü r d i e Besetzung des e r s t e n R e i h e n p l a t z e s η M ö g l i c h k e i t e n , f ü r die Besetzung des zweiten P l a t z e s η - 1 M ö g l i c h k e i t e n k-ten Platzes n - k + 1 Möglichkeiten
f ü r d i e Besetzung des
gibt.
Eine V a r i a t i o n ohne Wiederholung e n t s p r i c h t im Z e l l e n - K u g e l - M o d e l l
gerade
der Besetzung von η unterscheidbaren Z e l l e n durch k unterscheidbare
Kugeln,
wobei in jeder Z e l l e höchstens eine Kugel l i e g e n d a r f . Siliplit:
Bei der 3 e r - E i n l a u f w e t t e beim Trabrennen mit 10 Pferden
(Zellen),
d i e von 1 b i s 10 durchnumeriert s i n d , gewinnt man ( E r e i g n i s A ) , wenn man d i e e r s t e n d r e i P l a z i e r u n g e n (Kugeln) r i c h t i g g e t i p p t hat. Es g i b t ( 1 0 ) 3 = 10 · 9 · 8 = 720
32
Kap. 2: Kombinatorik
mögliche T i p s , von denen e i n e r r i c h t i g i s t , so daß d i e Gewinnchancen P(A) = 7 ^ = 0.0014 = 0.14% b e t r a g e n , wenn man z u f ä l l i g
setzt.
Betrachten w i r noch e i n w e i t e r e s BeXipizl:
Beispiel.
In einem Raum befinden s i c h k n a t ü r l i c h unterscheidbare
Personen.
Wie groß i s t dann d i e W a h r s c h e i n l i c h k e i t des E r e i g n i s s e s A , daß mindestens 2 Personen am g l e i c h e n Tag Geburtstag haben, wenn man S c h a l t j a h r e v e r n a c h l ä s s i g t , d . h . wenn man von η = 365 Tagen im Jahr a u s g e h t ? Da die Personen (Kugeln) u n t e r s c h e i d b a r s i n d und g l e i c h e Geburtstage mögl i c h s i n d , i s t die Anordnung der Geburtstage der Personen e i n e V a r i a t i o n mit Wiederholung von k aus η = 365 Tagen, so daß g i l t k 365
= A n z a h l möglicher Geburtstagsanordnungen von k Personen = A n z a h l möglicher
Fälle
Das zu Α komplementäre E r e i g n i s Ä b e s a g t , daß a l l e k Personen an u n t e r s c h i e d l i c h e n Tagen Geburtstag haben. Die Zahl der F ä l l e , in denen Ä e i n t r i t t , somit die Anzahl der V a r i a t i o n e n ohne Wiederholung von k aus η = 3 6 5 d.h. (365). = A n z a h l der f ü r Ä g ü n s t i g e n F ä l l e
Somit e r g i b t s i c h d i e gesuchte W a h r s c h e i n l i c h k e i t zu (365) P(A) = 1 - P(Ä) = 1 365
f
k
Benutzt man zum Rechnen die Abschätzung
so e r g i b t s i c h zum B e i s p i e l
für
ist
Objekten,
Kap. 2: Kombinatorik
(365) k = 30 :
P(A) = 1
365
- ^ > 1- e "
/JU
33
^ =1-0.304
= 0.696 = 69.6%
k = 50 :
(365)™ ^ > 1- e 365 "
P(A) = 1
= 0.965 = 96.5%
k = 100 :
< JWb ö\ ^ 'inn
P(A) = 1
365
/JU
=1-0.035
, 100-99 Tin— /JU
1-e
= 0.9999987 = 100%
= 1 - 0.0000013
.
Wieviel Personen müssen nun mindestens im Raum s e i n , so daß man bei einer Wette mit einer S i c h e r h e i t von mindestens 50% gewinnt? Gesucht i s t das k l e i n ste k d e r a r t , daß g i l t . k ( k - 1) P(A) > 1 - e
T3Ü
~
> 0.5
Die Ungleichung k ( k - 1) 1- e i s t i d e n t i s c h mit . k(k - 1) "73ΪΓ
, < 0n . 5
und diese i s t wiederum identisch mit - k ( k - 1 ) / 730 < I n 0.5 - k 2 + k < 730 · In 0.5
bzw. bzw.
k 2 - k > - 730 · In 0.5 Durch quadratische Ergänzung e r g i b t s i c h dann ( k - ^ ) 2 > - 730 · I n
0 . 5 b z w .
k - j - > \ / - /30 · In 0.5 + 0.25
bzw.
34
Kap. 2: Kombinatorik
k > v - 73D · I n 0.5 + 0.2b
+ 0.5 = 22.99
,
d . h . d i e gesuchte Mindestzahl von Personen i s t k = 23 .
_ J
3. Kombinationen Werden k Objekte aus η verschiedenen Objekten ausgewählt, ohne d i e Auswahlr e i h e n f o l g e zu beachten, so s p r i c h t man von e i n e r Kombination neten
Probe
oder
Kann jedes Objekt auch mehrfach ausgewählt werden (dann i s t k > n so h e i ß t d i e Probe eine Kombination
Beispiel:
ungeord-
von k aus η Objekten.
mit
möglich),
Wiederholung.
Aus den d r e i Buchstaben a , b, c werden zwei Buchstaben ohne Be-
r ü c k s i c h t i g u n g i h r e r Reihenfolge a u s g e w ä h l t , wobei d i e G l e i c h h e i t der b e i den Buchstaben möglich i s t . Es g i b t sechs M ö g l i c h k e i t e n aa, ab, ac, bb, bc, cc e i n e r solchen Kombination mit Wiederholung von zwei aus d r e i Generell
Buchstaben
i s t die Zahl der Kombinationen mit Wiederholung von k aus η Objekten
gerade (n + k - 1)
k
k!
(n + k - 1) · ( n + k - 2) · . . . . η 1.2 k
was man s i c h wie f o l g t ü b e r l e g t . E i n r e c h t e c k i g e r Kasten werde durch η - 1 p a r a l l e l e , bewegliche Zwischenwände, d i e u n t e r s c h e i d b a r s i n d , in η Z e l l e n unterteilt.
In d i e s e Z e l l e n werden dann i n b e l i e b i g e r Anordnung k u n t e r -
scheidbare Kugeln g e l e g t . B e t r a c h t e t man d i e n - 1 Zwischenwände und die k Kugeln a l s n + k - 1 unterscheidbare Symbole, d i e a l l e b e l i e b i g i n n e r h a l b des Kastens nebeneinander angeordnet werden können, so g i b t es (n + k - 1)^ mögl i c h e Lagen der k Kugeln i n n e r h a l b d i e s e r Anordnung, was gerade der Anzahl von V a r i a t i o n e n mit Wiederholung von k aus n + k - 1 Objekten e n t s p r i c h t . Da d i e Reihenfolge der Kugeln keine R o l l e s p i e l e n s o l l , f a l l e n j e w e i l s k! der V a r i a t i o n e n zu e i n e r Kombination zusammen, denn k! i s t d i e Anzahl
möglicher
Permutationen der k Kugeln.
Im Z e l l e n - K u g e l - M o d e l l
l ä ß t s i c h eine Kombination mit Wiederholung auch a l s
Zuordnung von k ununterscheidbaren Kugeln zu η unterscheidbaren Z e l l e n
inter-
Kap. 2: Kombinatorik
35
pretieren, wobei Mehrfachbesetzungen der Zellen möglich sind. Be-capi.il: Ein Schiff führt zur Signalgabe jeweils zwei blaue, grüne, schwarze, rote, gelbe und weiße Wimpel mit. Zwei aufgezogene Wimpel bilden jeweils ein Signal, wobei die Reihenfolge der Wimpel keine Rolle spielen darf, wenn die Signale aus jeder Richtung verständlich sein sollen. Wie groß i s t die Anzahl möglicher Signale, die das Schiff geben kann? Da Wimpel in 6 Farben mitgeführt werden, handelt es sich hier um die Bestimmung der Zahl möglicher Kombinationen von 2 aus 6 Objekten mit Wiederholung, d.h. die Anzahl möglicher Signale i s t (6 + 2 - 1 ) 2
7-6 42
21
_ J
Setzt man k0
,
Fx(-oo) = 0
P({X>x}) = 1 -Fx(x)
,
,
Fx(~)=1
P i = P(X = x i ) = F x ( x i ) - F x ( x i . 1 )
und Fw(χ) i s t von rechts s t e t i g , d.h. lim F y (x + 6) = F y ( x )
für 6 > 0 .
B & l i p M : Bei einer Serie von η unabhängigen Versuchen unter konstanten Versuchsbedingungen interessieren die komplementären Ereignisse ß und Β (z.B. Erfolg und Mißerfolg, gut und schlecht). Beschreibt man das Ergebnis des i-ten Versuchs durch die 0-1-wertige Zufallsvariable
Y.
1, f a l l s Β e i n t r i t t 0, f a l l s Β e i n t r i t t
für
i=1..,n
Kap. 3: Zufallsvariable und Verteilungen
43
SO i s t Π X = 7 n
1 =1
Y. 1
gerade diejenige Z u f a l l s v a r i a b l e , die beschreibt, wie o f t das E r e i g n i s Β bei η Versuchen eingetreten i s t . Die möglichen Realisationen von X n sind dann die Werte x^ = 0, x 2 = 1 , . . . , χ η + ^ - η .
I s t nun P(B) = P(Y i = 1) = p > 0
f ü r i = l . . . . ,n
,
so i s t P(B) = P ( Y i = 0) = 1 - p = q > 0
und
ρ+q=1
Wir i n t e r e s s i e r e n uns dann z.B. für die W a h r s c h e i n l i c h k e i t , daß bei den η Versuchen höchstens k-mal das E r e i g n i s Β e i n t r i t t , a l s o f ü r k F x (k) - P ( { X n < k}) = J
P(X n = i )
,
d.h. wir benötigen die Wahrscheinlichkeit P(X
= i ) für i = 1
k .
I s t η = 2, so g i b t es v i e r mögliche Auskommen der V e r s u c h s s e r i e , nämlich BB , BB , BB und BB , so daß s i c h wegen der Unabhängigkeit der Versuche und wegen P(B) = p , P(B) = q e r g i b t : P(X 2 = 0) = q 2
,
P(X 2 = 2) = p 2
.
P(X 2 = 1) = q · ρ + ρ · q = 2pq
und
Bei den acht möglichen Auskommen BBB , BBB , BBB , BBB , BBB , BBB , BOB im F a l l e n = 3 erhalten wir
und
666
44
Kap. 3: Zufallsvariable und Verteilungen
P(X 3 = 0) = q 3
P(X 3 = 1) = pq2 + qpq + q 2 p = 3pq2
,
P(X 3 = 2) = p 2 q + pqp + qp 2 = 3p2q
und
3 P(X 3 = 3) = p'
Allgemein ergibt sich
d.h. die Verteilungsfunktion der diskreten Zufallsvariablen X i s t η
η
i
, x ^
(X1
x
n > = P ( X 1 ί X1 \ X
*n - x n ' ••·
1 i - X1
x
Σ
P(Xi=x,i
X
n
heißt, wenn die möglichen Realisationen von Xj für j=1,...,n gerade Xj2>
x
j 3 » · · · sind. VeAJteAMmgiiunktLon
texXung
des Zufallsvektors (X^
dit
= x
ni ^
ni - xn
gemz-üuamn,
n-cLummionatzn
X n ) . Die Verteilung der
Xjp VeA-
Zufallsvariablen
Xj, die auch R a n d v e A t z - L t u n g von Xj heißt, ergibt sich dann gerade zu
52
Kap. 3: Zufallsvariable und Verteilungen
p ( V
Fx ( X j ) = l l l j J X J. . < X .J k=1 *=1
J
x
j i ' V
*
J
Entsprechend nennt man im F a l l e i t z t i q u i Z u f a l l s v a r i a b l e n [stetige]
die
Funktion F
(x1
χη) = Ρ ( Χ
Xn)(x1
ΐίχ1
X1
xn
• ί - ί —CO
d i e ViitoJXangi(5imktioη Funktion f j y (X^,...,Xn).
(X1,...,Xn)(u1
^ j ( x ^ » . . . . x n ) auch gmelmame Die RandcUchte.
' *
f
l
-
Un}
du
1"-dun
—00
dzn gemeinsamen VeAteXZung
OO
W
W
und d i e n i c h t - n e g a t i v e des Z u f a l l s v e k t o r s
Vichtz
der V e r t e i l u n g von X j i s t dann gerade
00
l
f
-oo
(xr...,xn)
( u
1
Y l ' W l
-oo
un
du1...duj.1duj+1...dun
ß z l i p l i t : Wir b e t r a c h t e n d i e Z u f a l l s v a r i a b l e n X^ und X 2 m i t der gemeinsamen Dichte
,füra 2b
=
2
-—7. f du, 2 (b-a) J x^-b
— y C Z b - x .1) (b-a)
Kap. 3: Zufallsvariable und Verteilungen
55
Schreibt man 1
· (x, - 2a)
, für 2a < x, < a + b •
- — · (2b - χ , ) 1 (b-a)
, für a + b < x, < 2b "
0
, sonst
T
(b-a)2
yv
1
in der äquivalenten Form
,
f T
,
ί f I j · ( 1 - ^ ·
Ixr(a
+
b)|)
x/V "\
, für 2a-3T =
-(λ.+Xj
λ^ 7T
"(λ1 + X 2 )
1
)
, λ1 + λ, X j
'{ —
e
d.h. die Verteilung von +
vj
'(φ
(x, + x 2 ) J
X = X1
/λ.
e
)
-(λ 1 + χ 2 )
Χ = Y^ + Y 2
ist eine Poissonverteilung mit Parameter
X2.
_ J
ÜBUNGSAUFGABEN ZU KAPITEL 3
Aufgabe 5.1: Zwischen einem Produzenten von Transistoren und einem Hersteller von Fernsehgeräten wird vereinbart, daß bei der Eingangskontrolle nicht mehr als 10% der Transistoren defekt sein dürfen. Der Hersteller entnimmt und überprüft zur Kontrolle dieser Vereinbarung 10 Transistoren. a) Wie groß ist die Wahrscheinlichkeit, daß eine Lieferung zurückgewiesen wird, wenn der Lieferant weiß, daß 5% der Transistoren defekt sind? b) Mit welcher Wahrscheinlichkeit wird eine Lieferung angenommen, obwohl 20% der Transistoren defekt sind?
Kap 3: Zufallsvariable und Verteilungen
$0
Aufgabe 5.2: Eine Zufallsvariable X besitzt die Dichte
c · (2x
- 3)
, für
2)
,
P({X < 3})
,
P({3 < X < 5})
.
Aufgabe 3.5: In der Qualitätskontrolle eines Betriebes wurden die Längsschnittabweichungen von η = 3 0 Werkstücken gemessen, vgl. Tab.
Tab. 2: Längsschnittabweichungen x.
i
1 2 3 4 5 6 7 8 9 10
X.
1
2.65 -1.37 -0.24 0.73
1.47 -2.01
2.50 0.07 0.13 -1.46
2.
x , n von η = 3 0
i
X.
i
11 12 13 14 15 16 17 18 19 20
-1.98
21 22 23 24 25 26 27 28 29 30
1
0.31 -0.79 -1.48
1.31 -2.68 0.00
0.36 1.14 -0.87
X
Werkstücken
i
-1.34 -0.12
0.65 -0.73 -1.21
1.54 0.88 -1.41 -0.36 -0.75
Bestimmen Sie Histogramm und empirische Verteilungsfunktion (unter Verwendung von Klassenmitten) als Approximation für Dichte und Verteilungsfunktion der Zufallsvariablen X, welche die Längsschnittabweichungen beschreibt. Verwenden Sie dabei die Klasseneinteilung K^ = (-3 , -1.5] , K^ = (-1.5 , -0.5] , K 3 = (-0.5 , 0.5] , K 4 = (0.5 , 1.5] und K g = (1.5 , 3] .
Kap. 3: Zufallsvariable und Verteilungen
61
Aufgabe 5.4: Bestimmen Sie die Randdichten der Zufallsvariablen X und Y mit der gemeinsamen Dichte
für x,ye[0,4] fx>Y(x,y) = sonst
und berechnen Sie die Dichte der Zufallsvariablen Z = X + Y.
Aufgabe 3.5: Es sei X eine binomialverteilte Zufallsvariable mit Parametern n = 3 und ρ = 0.3 und Y eine von X unabhängige Zufallsvariable mit Dichte
e~y
, für y > 0
fY(y) = [ 0
, sonst
d.h. Y ist exponentialverteilt mit Parameter λ = 1 . Bestimmen Sie die Verteilungsfunktion der Zufallsvariablen Z = X + Y.
Aufgabe 3.6: Berechnen Sie die Randverteilungen der Zufallsvariablen X und Y mit
P(X = k , Y = j) =
0.512 Τ Π Τ '
0
wobei e = e
1
= 2.718—
0.25*
, für k=0,1,2,3 und j=0,1,2,...
, sonst
ist, und bestimmen Sie die Wahrscheinlichkeiten P(Z = z)
für die Zufallsvariable Z = X + Y.
Kapitel 4: Kenngrößen von Zufallsvariablen
Wir wollen in diesem Kapitel einige Kenngrößen von Zufallsvariablen bzw. deren Verteilung betrachten. Solche Kenngrößen beschreiben zum Beispiel die Lage oder die Streuung einer Zufallsvariablen bzw. ihrer Realisationen oder auch den Zusammenhang zwischen abhängigen Zufallsvariablen.
1. Der Erwartungswert einer Verteilung Der EAMvUungiuMX oder HiXteluieAt
beschreibt das durchschnittliche Auskom-
men einer Zufallsvariablen X und entspricht dem Schwerpunkt in der Mechanik. Im Falle seiner Existenz i s t er definiert als
E(X)=
00 I x i ·Ρ(Χ = χ.)
A -1
1
1
f a l l s X eine diskrete Zufallsvariable mit Realisationen X|, x ^ , . . . i s t , bzw. als αο
-oo f a l l s X stetig mit Dichte f x ( x ) i s t . Er e x i s t i e r t , wenn obige Reihe absolut konvergiert bzw.
wenn
oo
e x i s t i e r t . Häufig schreibt man statt E(X) auch μ bzw. μ, X"
BeJ-ipiet: (a) I s t X itmdaAdnomalve.'tf&M ist
(kurz: X ^ N ( 0 , 1 ) ) , d.h. die Dichte von X
64
Kap. 4: Kenngrößen
fY(x)
=Φ(Χ)
x
so e r g i b t
e"x
\/2i
/2
sich
E(X)=
J
χ · —ί- e \/Zi
1
x
dx
IxI · e " x
/2
dx - {
Μ
-x /2 dx · e"x
0
--
(b) I s t X txponmtial\iz>Uiitt
mit Parameter λ > 0 (kurz: Χ ^ Ε χ ( λ ) ) , d . h . be-
s i t z t X d i e Dichte
Xe
λχ
für χ > 0
fx(x) = für χ < 0
so
ist
χ λ ε " λ χ dx
E(X) = | U
e •
[
»
•
(
-
«
u
0
-λχ
. dx
» • ( - ! )
OD = (0-0)+]·
| f x ( x ) dx = l .
1 = λ
(c) Genügt d i e d i s k r e t e Z u f a l l s v a r i a b l e X e i n e r Po^aonveAtexlung mit Parameter λ (kurz: X ^ P o ( X ) ) , so
P(X = j ) = 4 r e" A und w i r
ist
für j=0,1,2,...
,
erhalten
E(X>=
I j=o
J
-
I j=i
λ
xj"1
. u
„-λ. =
J X -λ λ e A = = λλ ·* 11 ==λλ I ^ e" .. J j=o · I
Kap. 4: Kenngrößen
Für den Erwartungswert gelten die folgenden Rzch.ervie.getn. variable
Y = g(X)
Ist die Zufalls-
definiert als Funktion der Zufallsvariablen X, so gilt
für den Erwartungswert von Y, wenn er existiert, OD
E(Y)= | g(x) · f x (x) dx
,
-a>
falls X stetig mit Dichte ίχ(χ) verteilt ist, und
E{Y) = l
g(x ) · P(x = x i )
i=1
1
,
1
falls X diskret mit Realisationen x^, x 2 > Υ = αΧ + β
x
3»···
speziell für
(α, Β reelle Zahlen)
ergibt sich hieraus E(Y) = α · E(X) + β
(LineivUXiU
Weiterhin gilt für η Zufallsvariablen
dei
BmaAXungiuieitei).
mit existierenden Erwar-
tungswerten E(X1 + X 2 + ... + X n ) = E(X 1 ) + E(X 2 )+ ... + E(X n ) und, falls X^,...,X
stochastisch unabhängig sind,
E(X, · X 2 - . . . · Χ η ) - Ε ( Χ 1 ) · Ε ( Χ ζ ) · ...·Ε(Χ η )
.
2. Die Quantile einer Verteilung Ein weiteres neben dem Erwartungswert gebräuchliches Lagemaß ist der Median ξβ g , für den gilt
P(X
- ζ 0.5 } - °· 5
und
p
(xi£0.5)-0·5
'
wenn X irgendeine Zufallsvariable ist. Allgemein nennt man für a e (0,1) die Größe ξ mit et P(X < ξ ) > α
und
P(X > ξ ) > 1 - α
65
66
Kap. 4: Kenngrößen
das α - QuantiZ oder
(I - o ) - fiaktit der Verteilung der Zufallsvariablen X.
Ist die Zufallsvariable X stetig mit der Dichte fyix) verteilt, so gilt ξ, 'α -co d.h. das oe-Quantil 'Kurve' von
ξ^ ist derjenige Wert, so daß die Fläche unterhalb der
und oberhalb der x - A c h s e gerechnet von
bis zum Wert ζ(
gerade die Größe α besitzt.
Ist hingegen X diskret, so gilt Fx(5a)>a
und
F^(x) 0 und Varianz σ ) den Va/UatLomkoeHizienten ν = σ/μ
.
b I s t X eine Zufallsvariable, so nennt man allgemein E(X ) (also den Erwarte k tungswert von X ) das k-te Moment von X und E ( X - E ( X ) ) das k-te zentAate Moment von X. Der Erwartungswert einer Zufallsvariablen X i s t also gerade ihr erstes Moment und die Varianz von X i s t das zweite zentrale Moment von X. Im folgenden setzen wir stets die Existenz der jeweiligen Momente voraus, wenn wir sie verwenden.
4. Kovarianz und Korrelation Kovarianz und Korrelation sind Maße für den Zusammenhang von zwei Z u f a l l s variablen X und Y. Die KovaJvLanz i s t dabei gerade Cov(X.Y) = σ χ γ = E[(X - E(X))(Y - E(Y))] = E(XY) - Ε(X) · E(Y)
,
Kap. 4: Kenngrößen
wobei sich der Erwartungswert von XY, im Falle seiner Existenz, zu CO CO E(XY)= |
| xy · f ( X > Y ) ( x . y ) dx dy
ergibt, wenn ί χ y(x,y) die gemeinsame Dichte des Zufallsvektors (X,Y) i s t , bzw. zu CO oo E(XY) = l l x,y, •P(x = x i ,Y = y i ) 1 3 i = 1 j=1 1 J ergibt, wenn X und Y diskrete Zufallsvariablen mit Ausprägungen x^, x^,... respektive y^, y ^ . . . . sind.
ßexip-LeZ: Wir wollen die Kovarianz
Cov(X,Y) der Zufallsvariablen X und Y
mit der gemeinsamen Dichte
1
f(x>Y)(x,y) =
(b-a)
2
0
, für a < y < b und
a+y
2b ( x 2 - 2ax) dx +
2a
|
( 2 b x - x 2 ) dx
a+b 2b
1 3 2 3 χ -ax
1
a+b
(b-a)' ( b - 1a ;
(b-a)
τ
7
( ( j (a + b ) 3 - a ( a + b ) f (\
2
- § a
+ ^4b
2
+^
(
f
(a
3
-| b3-b(a + b)
+ b ) - - j (a + b ) "
3
+ 4a3)
(a + b ) 3
dx
73
Kap. 4: Kenngrößen
1 — - · (a 3 + b 3 - a 2 b - a b 2 ) (b - a) : a + b
E(Y)= J
yfy(y)
dy= j
-00
y ·^
l [ a > b ] ( y ) dy
-00
•ΪΜ'^ΊΓΜ}'1]!·*^»'" a
a + b
ergibt sich Cov(X.Y) = E(XY) - E(X) · E(Y) _3(a + b ) 2 ( b - a ) + 4 ( b 3 - a 3 ) 12(b - a)
, a +b (a + b) · —
_ 4 ( b 3 - a 3 ) - 3(a + b ) 2 ( b - a) 12(b-a) . (b-a)3 ~ 12(b - a)
^ • ( b - a )
2
.
Im Gegensatz zur Kovarianz ist die
Corr(X,Y) = p YXY -
J
KovizlcuUon
X Yσ γ σ j j° ·
ρ zweier Zufallsvariablen X und Υ mit Varianzen
ρ > 0 und O y > 0 ein normiertes
Maß für den Zusammenhang zwischen X und Y ; die Korrelation nimmt stets Werte im Intervall
[-1.+ 1] an. Ist Ρ χ γ = 0, so sagt man auch "X und Υ sind iwfeo/iAe-
tie.>U"·, für ρ χ γ = 1 besteht eine positive, strikt lineare Beziehung X und Y, für Ρ χ γ -
ein
zwischen
e negative, strikt lineare Beziehung. Weitere Aus-
führungen hierzu findet man im Kapitel
9.
Für die Berechnung von Kovarianzen gelten die folgenden Rechen*ege£n: Cov(aX + β,γΥ + δ) = cryCov(X,Y)
74
Kap. 4: Kenngrößen
Covix, + X 2 , Y ) = Cov(X,,Y) + Cov(X 2 ,Y) Cov(X,Y 1 +Y 2 ) = COV(X,Y 1 )+COV(X,Y 2 )
,
wobei Χ, Υ, Χ^, X 2> Y^ und Y 2 Z u f a l l s v a r i a b l e n und α, 8, γ , S r e e l l e Zahlen sind. Unter Verwendung der Kovarianzen kann auch die VajUanz gigen Z u f a l l s v a r i a b l e n X 1
dzA Summe von abhän-
X n bestimmt werden:
Var(X. + . . . + X ) = l V a r ( X . ) + 2 \ J 1 i=1 i = 1 j=1 i e ) Var(X
3-1 σ'
)
für alle Zahlen e > 0 ;
man sagt auch, X n konvtLnyivut
gegen μ.
AtochaitUch.
Konkret besagt das Gesetz der großen Zahlen, daß sich das durchschnittliche Ergebnis von η unabhängigen Zufallsexperimenten mit wachsender Zahl η von Versuchen immer besser beim wahren Mittelwert
stabilisiert.
Oft kann eine eigentlich interessierende Zufallsvariable Y nicht direkt beobachtet werden. Vielmehr ergibt sie sich als Funktion anderer, beobachtbarer Zufallsgrößen. Beispielsweise werden Rechtecksflächen durch Multiplikation der Seitenlängen, Geschwindigkeiten durch Division von Weg durch Zeit und spezifische Gewichte durch Division von Masse durch Volumen ermittelt.
Das VihZzi( i onXpilanzuyig6gue.tz erlaubt nun die approximative Bestimmung von Varianz (und Erwartungswert) einer Zufallsvariablen Y, die sich als Funktion anderer Zufallsvariablen Χ.,,.,,Χ
ergibt,
Y = f(X.,...,X ) η falls f(Xj,...,X
η
) nach den X· differenzierbar ist. Und zwar ist
E[f(X1,...,Xn)]=äf(M1,...,yn) η Varmx,,...^)].
^
und
3f
3X7 i 1
Χ=μ
78
wobei
Kap. 4: Kenngrößen
u.j u n d σ^ d e n E r w a r t u n g s w e r t
b z w . d i e V a r i a n z v o n X^ ( i = 1 , . . . , n )
σ · . d i e K o v a r i a n z von X. und X . ( i , j = 1 , . . . , n , i < j ) b e z e i c h n e n ; J J 3f I steht jyf ü r die p a r t i e l l e Ableitung der Funktion f(X. 1 i Χ=μ i X i an d e r S t e l l e ( X , XR) = (μ, μη).
Es e r g i b t
sich,
v g l . auch A b s c h n i t t e
Y = X,|+X2
:
1 und 4 , z . B .
Ε ( Υ ) = μ^ + μ 2
und
weiterhin X ) n
nach
für
und
Var(Y) = 12 · σ 2 + I 2 · σ2 + 2 · 1 · 1 · σ , 2
2 σ1
2 2
+ σ
, falls
2 2 σ^ + 02 + 2 σ ^ 2
Υ = x i - Χ2
:
Ε(Υ) = μ,
-μ
σ
2 1
2
+ ( - 1 ) 2 · σ2
2
:
Ε(Υ)~μ
Γ
μ
+
,
2 2 V a r ( Y ) = ^ 2 · o 2 + μ, · ο 2 + 2μ,
μ
Y = x1 / X2
:
2 · 1 · (-1) · σ12
Χ ^ , Χ2
unabhängig
sonst
, mit exakter Gleichheit, X^ u n d Xg u n a b h ä n g i g ,
2
μ
sonst
, falls
σ2
2 2 σ^ + σ 2 - 2 σ ^ 2
Υ = Χ, · Χ2
unabhängig
und
2
Var(Y) = 12 .
,
Xj,
2
2
2, ·ο, +
2 2 '
μ ι
2
2 · 2 02 , f a l l s
2
·σ
1 2
Χ^
Χ2
2 ο σ2 + 2μ1 · μ 2 · σ 1 2
σ1
E ( Y ) Ä μ^ / μ 2
·μ
falls
unabhängig
, sonst
und 2
Var(Y) ä - ^ · · σ2 + μ2
1 2.9 1 · Τ • σ 2, + Ζ · — μ2 μ2 μ
"
V " .
μ
1 ' 2
σ12
79
Kap. 4: Kenngrößen
1
1
1 Τ '
1 "Ζ* μ
μ
2
2 2
σ,1 +—rrΖ · Οο2 μ.
f a l l s Χ^
12
unabhängig
, sonst
2
iexApiit: Die Höchstgeschwindigkeit Υ eines PKW - Typs wird aus dem Weg X^ und der Zeit X~ ermittelt. Sind Erwartungswert bzw. Varianz von X, und X, 2 2 ? ? nun u 1 = 1000 m, u 2 = 2 0 sek, bzw. σ] = 4 m , σ ^ 0.09 sek und i s t die Kovarianz von X 1 und X 2 gerade σ 1 2 = 0.1 m - s e k , so ergibt sich wegen Y = X 1 / X 2 dann 50 m
E(Y) =* ^ / U 2
/sek
=
3600 · 50 m / h
= 3.6 · 50 km / h = 180 km/h sowie
2
Var(Y) ~ U2
1
(4 + 225 - 5)
224 m 400 sek
μ
μ
1
σ,, 12
2
.2 1000 m 4 πϊ2 , 1000000 m' £-•0.09 s e k ' 0 . 1 400 sek
1
400 sek 1
2
J« + —ö Ολ 1 y2 2
2
0.56
m . sek
m2 sek .2
sek
d.h. die Standardabweichung σ γ = v^Var(Y) vom Erwartungswert 180 km/h der Höchstgeschwindigkeit beträgt σγ~
m/ sek^0.748 m/ sek = 3.6 · 0.748 km/h
= 2.6928 km/h
,
also ca. 2.7 Stundenkilometer.
J
Werden Erwartungswerte, Varianzen und Kovarianzen von Zufallsvariablen erst aufgrund von Experimenten "geschätzt", v g l . Kap. 6, so können die Schätzungen a l s Näherung anstelle der theoretischen Größen im Fehlerfortpflanzungs-
80
Kap. 4: Kenngrößen
gesetz eingesetzt werden.
ÜBUNGSAUFGABEN ZU KAPITEL 1
Aufgabe n.l: Bestimmen Sie Erwartungswert und Varianz der Zufallsvariablen X mit der Dichte
c · (2x2 - 3)
, für 2 < x < 7
f x (x) )
, sonst
vgl. auch Aufgabe 3.2.
Aufgabe 4.2: Berechnen Sie für die diskreten Zufallsvariablen X und Y, deren gemeinsame Verteilung aus Tab. 1 ablesbar ist, die Erwartungswerte, Varianzen, Mediane sowie obere und untere Quartile und bestimmen Sie die Kovarianz sowie die Korrelation von X und Y.
Tab. 1: Gemeinsame Verteilung der Zufallsvariablen X und Y
'Ν
P(X=i , Y=j)
j
1
2
3
1
0.1
0.2
0.1
2
0.3
0.2
0.1
Kap. 4: Kenngrößen
81
Aufgabe 4.5: Bei einem Spiel mit einem fairen Würfel kann man auf die Ereignisse Zahl" bzw. "ungerade Zahl"
"gerade
, "eine der Zahlen 1,2,3" bzw. "eine der Zahlen
4,5,6" sowie auf jede einzelne Zahl von 1 bis 6 setzen. Man gewinnt bei den erstgenannten Zahlen das Doppelte seines Einsatzes und bei richtig gesetzter Zahl den 5 - fachen Einsatz. Sie spielen 21-mal und setzen stets 1 DM auf "gerade Zahl", 1 DM auf "eine der Zahlen 4,5,6" und 1 DM auf die Zahl 4. Welchen Gewinn haben Sie zu erwarten?
Aufgabe H A : Die Haltbarkeit von H - M i l c h beträgt im Mittel 90 Tage; lediglich 5% der Packungen sind höchstens 85 Tage brauchbar und 7% der Packungen sind mindestens 95 Tage haltbar. Was können Sie Uber die Varianz der Haltbarkeitsdauer
aussagen?
Aufgabe 4.5: Die durchschnittliche Lebensdauer eines Batterietyps beträgt 45 Stunden mit einer Standardabweichung von 5 Stunden. Welche Abschätzung für Mittelwert und Varianz der logarithmierten
Lebens-
dauer, deren Verteilung Sie besser im Griff haben, können Sie geben?
Kapitel 5: Einige spezielle Verteilungen
Um ausgehend von Beobachtungen an einer Stichprobe von η Objekten Aussagen über das Verhalten des an ihnen beobachteten Merkmals in der Gesamtheit aller interessierenden Objekte, machen zu können, unterlegt man oftmals ein Verteilungsmodell, d.h. man nimmt an, daß die η Beobachtungen *|
*
Re-
alisationen von unabhängigen, identisch verteilten Zufallsvariablen Xp...,X
sind. Die hier am häufigsten unterlegten Verteilungstypen der Zu-
fallsvariablen Χ.,.,.,Χ
wollen wir im folgenden kurz vorstellen.
1. Die Normalverteilung und daraus abgeleitete Verteilungen 1.1
DIE
N O R M A L V E R T E I L U N G
DER
Z E N T R A L E
UND
G R E N Z W E R T S A T Z
Die in der Statistik wohl wichtigste Verteilung ist die Noima.lvZuteilung. ο Eine Zufallsvariable X heißt normal verteilt mit Parametern μ und σ (kurz: X-V- Ν(μ, σ 2 )), falls ihre Vichtz
. (x^uli f x (x):
- -— · e \/Έϊ·
2
°
ist, vgl. auch Abb. 1. Die Kurve von und besitzt an der Stelle μ - σ
(χ) ist symmetrisch um den Wert μ
sowie μ + σ
Wendepunkte, vgl. auch Abb. 1.
ο Ist Χ%Ν(μ,σ ), so ist weiterhin Υ =αΧ + 0-\,Ν(οψ + β,α 2 σ 2 ) wobei α und β reelle Zahlen bezeichnen, und sind X.
X
unabhängige Zu-
84
K"P S: Spezielle Verteilungen
o.c
Abb.
1: Dichte ί χ (χ) der N(81,0.5) - , N(81,1) - und N(81,2) - Verteilung
2 fallsvariablen derart, daß für i = 1,... ,n gilt X i
l η
/Π
»i · η
ιΌ
, σ^), so ist
·
ρ Die VeAteXhingiFunktion
der Ν(μ,σ ) - V e r t e i l u n g
χ F x ( x ) = | f x (u) du
, vgl. Abb.
2 ,
-00
ist nicht analytisch bestimmbar, jedoch ergibt sich wegen Ε (X) = μ
und
Var(X) = o"
d.h. die Normal Verteilung ist vollständig durch ihren EiuxvutungiuieAt ihre VcuuAnz variable γ
und
charakterisiert, daß die zu X gehörige standardisierte Zufalls-
_X-μ σ
einer StandaAdnonmtveAteXZung
N(0,1) mit der tUcfcte
Kap. 5: Spezielle Verteilungen
(y) =
f
ip(u) du = 1 - 4>(-y)
in der Tab. 1 des Anhangs vertafelt ist. Aus der Verteilungsfunktion bzw. Dichte der N(0,1)- Verteilung können dann beliebige Werte der Verteilungsp funktion bzw. der Dichte einer Ν(μ,σ ) - Verteilung bestimmt werden: Ρ
χ
(χ)=φ(^)
und
f
x
(
x
, . i . ^ )
.
Auch die a - QuantUe
u mit ψ(υ ) = α der N(0,1)-Verteilung sind für einiqe α α α > 0 . 5 vertafelt, vgl. Tab. 2 im Anhang; aus ihnen ergeben sich die entsprep chenden Quantile einer Ν(μ,ο ) - V e r t e i l u n g zu 2 w (μ,σ ) = ou + μ α α Die entsprechenden
Quantile für ci Ο , v g l . auch Abb. 3
Ο
, für χ < Ο
Abb. 3: Dichte f y (χ) der Lognormal Verteilung mit Parametern μ = 1 und σ
EiuxvUunU
D I E
=0.5
und VtvUxinz von X s i n d dann gegeben a l s
Ε(Χ)=βμ
1.3
2
+
°
2 / 2
,
Var(X)=e2lJ
+ a 2
. (e°2-1)
.
P R Ü F V E R T E I L U N G E N
2 Die P r ü f v e r t e i l u n g e n , a l s da s i n d t - , χ - u n d F - V e r t e i l u n g , s i n d wesentlich bei der Bestimmung von Konfidenzintervallen und bei der Durchführung s t a t i s t i s c h e r T e s t s , v g l . Kapitel 7 und 8. Sind XQ,X.| , . . . ,X n unabhängige, standardnormal v e r t e i l t e Z u f a l l s v a r i a b l e n , so heißt die Verteilung von
die f ü r n > 2 den E w a A t w q m w t E(t) = 0
90
Kap. 5: Spezielle Verteilungen
und f ü r η > 3 d i e 1hvuRnz
Var(t) b e s i t z t (für n = 1 bzw. für n = 1, 2 e x i s t i e r e n Erwartungswert und Varianz n i c h t ) , eine (zentAali)
t - VeAteltung
In der Abb. 4 sind die Dichten
phisch veranschaulicht. Die Quantitz t der t - V e r t e i l u n g g i l t t
n;α ~ _tn;1-α
mit
η Fn^ihextigiadzn
f ( x ) der t 2 η ;α
(kurz: t ^ t
).
und t^Q - Verteilung gra-
V für die aufgrund der Symmetrie
'
sind in der Tab. 3 des Anhangs v e r t a f e l t .
2 Die zweite wichtige PrUfverteilung i s t die χ - V e r t e i l u n g . Sind X 1 unabhängige, N ( 0 , 1 ) - v e r t e i l t e Z u f a l l s v a r i a b l e n , so genügt 2 X
5
Ι
v2
2
ο
einer (ze.nViale.n) χ - Vvctzilung E>wxvitungmeAt
und Va/Uanz
mix η Fiex.hiiXigiaden
gegeben sind a l s
(kurz: χ
p
^x^),deren
Kap. 5: Spezielle Verteilungen
Ε(χ2) = η d i e QuantiZz
χ
2
V a r ( y 2 ) = 2n
und
;
2
der χ - V e r t e i l u n g s i n d i n der Tab. 4 des Anhangs v e r t a -
n»et
2
In der Abb. 5 s i n d d i e Vlchtzn
feit.
91
2
2
der χ^ - , χ^ - und χ^ - V e r t e i l u n g
gra-
η kann d i e χ 2 - V e r t e i l u n g durch eine Nor-
p h i s c h d a r g e s t e l l t . Für ' g r o ß e s '
mal V e r t e i l u n g mit Erwartungswert η und Varianz 2n, N(n,2n) a p p r o x i m i e r t werden, d . h . f ü r ' g r o ß e s ' F χ
Abb.
?(x)
η gilt
=P(x2 2 e x i s t i e r t der EiwaAtungAwejtf
M ' n h und für n > 4 auch die VtvUanz
Var(y) =
m(n - 2) (n - 4)
der Zufallsvariablen F. Die QuantUe. F der F - V e r t e i l u n q3 sind für m,n;a m,n einige Kombinationen von m und η sowie für einige α in der Tab. 5 des Anhangs vertafelt und es g i l t
2. Die Gleichverteilung und die Dreiecksverteilung Die GlzlchwUtUluna
U(a,b) auf dem Intervall [a,b] haben wir bereits aus-
führlich in den Beispielen der Kap. 3 und 4 behandelt. I s t X ^ U ( a . b ) , so sind bzw. Vichte.
\Je.nXe.iZungiFunktion
0 F x ( x ) = . jj-rf 1
von X g e g e b e n
, für χ < a 1
· ^r
a-
0 Der EfuMAXangimit
, sonst und d i e Va/Uanz
der Z u f a l l s v a r i a b l e n X s i n d 2
E(X)=^p-
bzw.
Var(X) =
( b
^
a )
und das α - Quantlt i s t f ü r a e ( 0 , 1 ) wegen ζ
- a!
W ' T = T ' * gerade £a=a'(b-a) + a=a-b+(1-a)-a Sind X 1 und X,, unabhängige
,^
- v e r t e i l t e Z u f a l l s v a r i a b l e n , so genügt
die Z u f a l l s v a r i a b l e Υ = Χ^ +X,, e i n e r VieJ-tckAvziXexJiung lung
mit Parametern a und b; d i e Vickte.
l y ^ l )
fy(y); 0
oder
Simpt>on\3inX 9 ( F a u s t r e g e l ) die B(n ,p) - Verteilung durch eine N(np , np(1 - p)) - V e r t e i l u n g , a l s o dusich tintL appioximizmn,
NolmalveAtzilung
d.h. für die Verteilungsfunktion einer B(n ,p) - v e r t e i l t e n Zu-
f a l l s v a r i a b l e n X g i l t dann F v ( x ) = P(X < χ) ο; Φ f x ' W — ) X " V n p ( 1 - p) >
.
B z g l . einer Approximation durch die P o i s s o n v e r t e i l u n g sei auf den nächsten Abschnitt verwiesen.
98
Kap. 5: Spezielle Verteilungen
5. Die Poissonverteilung Die ?o-iA6on\ieAteJMmq
heißt auch die \ZeAX.eJMmg
E^eign-cwe. Sie
deA 6elte.ne.ti
fand Ende des 19. Jahrhunderts bei Bortkiewics' Untersuchung von Todesfällen durch Hufschläge bei der preußischen Armee im Laufe von 20 Jahren eine der schönsten Anwendungen; vgl. z.B. Härtung et al. (1986, Kap. IV). Eine Zufallsvariable X heißt poissonverteilt mit Parameter λ (kurz: Χ ^ Ρ ο ( λ ) ) , falls für j=0,1,2,... gilt
P(x=j ) =yj- β"λ d.h. ihre VeAteJZungi
. ist
Funktion
ι F x (x) = P(X < x) =
Enm/tfungweM.
l jr e j 0 ; F x (x) = 0
fürxvt
.
werden kann die Verteilungsfunktion der Poissonverteilung für
großes λ (Faustregel: λ > 9 ) duAch metern μ = λ und σ 2 = λ: F x (x) = P(X < x ) ^ Φ
Die Po-LuonueAtbUung
die der NotonalveAtiutung
selber kann aZi
Ν(λ,λ) mit Para-
·
Αρρ-ΊοxA/nation deA
B^nomlaZve'uteii.ung
verwandt werden. Ist Χ ^ Β ( η , ρ ) und ist ρ klein, η groß (Faustregel: η > 3 0 ,
Kap. 5: Spezielle Verteilungen
ρ < 0.1), so ergibt sich (GimzuKAtAcutz
P(X=3)~^e"
n p
von
99
Poliion)
für j=0,1,... ,n ,
d.h. die Binomialwahrscheinlichkeiten werden durch die entsprechenden Poissonwahrscheinlichkeiten einer Poissonverteilung mit Parameter λ = n p approximiert.
ÜBUNGSAUFGABEN ZU KAPITEL 5
Aufgabe 5.1: Bestimmen Sie mit Hilfe des Tabellenanhangs die folgenden o - Q u a n t i l e für α = 0.01 , α = 0.05 , α = 0.95 und α = 0.99: u
. a '
2 2 10;α ' τ 17;α ' χ 10;α ' χ 15;α ' h 3,7;a ' V ^ c i
'
Aufgabe 5.2: An einer Fußgängerampel kommen innerhalb einer Minute auf der einen Straßenseite durchschnittlich zwei, auf der anderen durchschnittlich 4 Fußgänger an. a) Mit welcher Wahrscheinlichkeit warten während der Rotphase von 2 Minuten (bei Annahme einer Poissonverteilung) (1) auf jeder Straßenseite mindestens vier und (2) zusammen mindestens vier Leute? b) Bestimmen Sie approximativ die Wahrscheinlichkeit dafür, daß in 500 Rotphasen im Mittel höchstens 11.7 Fußgänger (auf beiden Straßenseiten zusammen) gewartet haben.
100
Kap. 5: Spezielle Verteilungen
Aufgabe
5.5:
In einem Experiment mit 100 Kühlaggregaten aus einer Produktion wurde f e s t g e s t e l l t , daß die mittlere Lebensdauer der Aggregate 2 Jahre beträgt. Berechnen Sie bei Annahme exponentialverteilter Lebensdauern die approximative Wahrscheinlichkeit dafür, daß die Gesamtlebensdauer von 400 Kühlaggregaten aus der selben Produktion kleiner als 750 Jahre i s t .
Aufgabe
5.4:
Bestimmen Sie die a - Q u a n t i l e ξ^ der Po(5) - Verteilung für α = 0.25 , α = 0.5 und α = 0.95.
Kapitel 6: Punktschätzungen für die Kenngrößen und Parameter von Verteilungen Hat man an η Objekten aus einer interessierenden Grundgesamtheit von Objekten z.B. ein oder zwei interessierende Merkmale X und ij gemessen bzw. beobachtet, so können diese Beobachtungen
und y^
yn als Reali-
sationen von jeweils unabhängigen, identisch v e r t e i l t e n Z u f a l l s v a r i a b l e n X , , . . . , X n und Υ^,.,.,Υ
aufgefaßt werden, die der gleichen Verteilung genü-
gen wie die Z u f a l l s v a r i a b l e n X und Y, welche den Merkmalen X und μ zugehör i g sind. Die Schätzung
dm
den. Kenngioßcn
PaAameXii der Verteilungen von X und Y bzw. die
Schätzung
zu diesen Verteilungen e r f o l g t dann natürlich auf der Basis
der Daten χ . , . , . , χ
und y . , . . . , y .
1. Schätzen der Kenngrößen von Verteilungen Sind x ^ , . . . , x n und y ^ , . . . , y n Realisationen von unabhängigen, identisch v e r teilten Zufallsvariablen
bzw. Υ ^ , . , . , Υ , die der gleichen Vertei-
lung wie X und Y genügen, derart, daß das Paar (x^
die Beobachtung zum
Merkmalspaar (X,JJ) am i - t e n Objekt ( i = 1 , . . . , n ) aus der interessierenden Grundgesamtheit d a r s t e l l t , so sind d ie aAAXkmcXAAchen IKvtizZ. oder VuA.chichruXtiuieiXe
-
1
n
- W i ^ i
·
y =
1
n ^
n
y
i
Schätzungen für die EnwaflXungiui&nXe. E(X) und E(Y) der Z u f a l l s v a r i a b l e n X und Y, d.h. Schätzungen für die erwarteten, durchschnittlichen Merkmalswerte in der Grundgesamtheit. Die VcuUanzm Stichprobe
Var(X) und Var(Y) werden durch die ejup-i/Uichm
Vasuanzen
102
Kap. 6: Punktschätzungen
Χ
« V ^ - n M j ,
?"ηί2)
bzw.
d.h. durch die Summe der quadratischen Abweichungen vom jeweiligen Durchschnittswert,dividiert durch die um 1 reduzierte Anzahl der Objekte in der Stichprobe, geschätzt. Schätzungen für Sta.ndan.da.bu)elchu.ngzn bzw.
Vajujutlorn-
koe-ülzimtzn (wenn x^, y ^ O , x , y > 0 ) sind dann natürlich
S
X = vAx
·
S
Y
Schließlich wird die Kovarianz
=
/*Y
bzw
·
v
f
·
v
Y
=
y
Cov(X,Y) zwischen den Zufallsvariablen X und
Y durch
s
XY=TTT i ,
und die KoiKitation
c ^ i - x X v i - P ) =H4-T
v r ™ * )
Corr(X,Y) =p^y als normiertes Maß für die Stärke des Zu-
sammenhangs zwischen X und Υ (zumeist) durch
S5
XY
r x y
" V
s
Y "
_
η I (χ, - χ) · (yi - y ) 1 i=1 ] ra :—η / I ( x1 r 5 ) 2 · l V i=1 i=1
r ( 1y ^ y ) 2
geschätzt, wenn s^, S y ^ O . Wie p^y nimmt auch r^y nur Werte zwischen -1 und +1 an; man vgl. hierzu aber auch Kap. 9. Wir haben hier natürlich stillschweigend vorausgesetzt, daß y^
und
y n Zahlen sind und nicht etwa Farben, Berufe oder ähnliches; aber wir
haben Zufallsvariablen und damit ihre Kenngrößen ja auch nur für solche Fälle definiert. Β e l i p l e £ : Bei η =10 PKW's eines Typs und Baujahrs wurden die bisherige Kilometerleistung X und der von Gebrauchtwagenhändlern erzielte Wiederverkaufspreis y beobachtet. Die Daten χ ^ , . , . , χ ^ und y^
y^Q sind in der Tab. 1
Kap. 6: Punktschätzungen
103
zusammengestellt.
Tab.
1: K i l o m e t e r l e i s t u n g X und W i e d e r v e r k a u f s p r e i s Typs und B a u j a h r s
PKW i
2
1
Kilomet e r l . X.j
4
3
5
y bei η = 1 0 PKW's
7
6
8
9
eines
10
35200 6 2 3 5 0 5 4 1 2 0 2 3 4 8 0 7 5 3 6 0 4 1 2 0 0 5 2 3 4 0 4 5 6 8 0 3 4 7 3 0 6 2 9 6 0 5700
P r e i s y^
3200
4800
5600
2800
4000
4200
B a s i e r e n d a u f d i e s e n Daten w o l l e n w i r E r w a r t u n g s w e r t e lometerleistung schätzen.
4800
-
1
y =
10
1
l
x i = y g · 487420 = 4 8 7 4 2
.f,
= Τ Ο ' « 1 0 0 = 4310
und V a r i a n z e n d e r
5
Υ
9 V-j^
=
Ki-
ΐ ( . ^
x 2 - 10 · ; 2 Ν ) 4 ι } 9
y
i~
10
=
'
d . h . das a r i t h m e t i s c h e M i t t e l e i n e r Standardabweichung
sich
und
,
und d i e z u g e h ö r i g e n e m p i r i s c h e n V a r i a n z e n
X
3100
und des P r e i s e s f ü r a l l e PKW's d i e s e s Typs und B a u j a h r s
A l s Schätzungen f ü r d i e Erwartungswerte ergeben
x = yp
4900
sind
2221863760 = 246873751 .1
und
9509000 = 1 0 5 6 5 5 5 . 5 5 6
der K i l o m e t e r l e i s t u n g e n
b e t r ä g t 48742 km mit
von s ^ = 1 5 7 1 2 . 2 2 km und das a r i t h m e t i s c h e
Mittel
der P r e i s e b e t r ä g t 4 3 1 0 DM m i t e i n e r S t a n d a r d a b w e i c h u n g von S y = 1 0 2 7 . 8 9 DM.
Die Kovarianz zwischen K i l o m e t e r l e i s t u n g schätzt
und W i e d e r v e r k a u f s w e r t w i r d
durch
S
X Y
=
1 / 10 i ( . ^
V i
"
10
*
x y
\ j
=
1 i '
(-129103200) = -14344800
so daß s i c h a l s S c h ä t z u n g f ü r d i e K o r r e l a t i o n ρ γ γ d e r Wert
,
ge-
104
Kap. 6: Punktschälzungen
r r
- SxY - .__'1^4489°_ . X Y ' i " T ^ · - 1 5 7 1 2 . 2 2 · 1027.09 _
ergibt. Da r ^
0 ,m8 8 m 8
sehr stark negativ ist, besteht ein starker negativer
(line-
arer) Zusammenhang zwischen Kilometerleistung und Preis, vgl. auch Kap. 9. |
Kommen wir nun zur Schätzung Mzdian
von
a-
Quantil&n
ξ
und insbesondere auch
vom
(0.5 - Quantil) ξρ g einer Verteilung. Sind an η Objekten die Realisa-
tionen von unabhängigen, identisch verteilten Zufallsvariablen X p . . . , X » die wie X verteilt sein mögen, bzw. die Merkmalsausprägungen
zum
Merkmal * beobachtet worden, so müssen diese Werte x,,...,x zunächst der 1 η Größe nach geordnet werden:
x
(1) - x(2) - " · ί χ ( η )
·
Das α - Quantil ζ α der Verteilung von X wird dann für ae(0,1) ausgehend von dieser geordneten Beobachtungsreihe
Χ/.)
x
( i ) · - - - > x ( n ) geschätzt als
, falls η · α keine ganze Zahl ist: k ist dann die auf η · α folgende ganze Zahl
7(x(k)
+ x
(k+1)'
, falls η · α eine ganze Zahl k=η ·α
ist: dann ist
Speziell für den Median ξ^ ^ läßt sich dieser Schätzer auch in der Form
( x
0.5
((n+1)/2)
'
fa11s
n
un
9erade
:
7(x(n/2)
+ x
((n+2)/2)>
·
fa11s
n
9erade
schreiben, d.h. der empirische Median bzw. der Median einer reihe x ^ , . . . , x n ist der mittlere Wert in der geordneten
Beobachtungs-
Beobachtungsreihe,
wenn η ungerade ist, und das arithmetische Mittel der beiden mittleren Werte in der geordneten Beobachtungsreihe, wenn η gerade ist.
Be-ύpint·.
In einem Laborversuch werden die Lebensdauern von η = 1 0
Kühlschrän-
ken einer Produktion unter extremer Belastung untersucht. Die geordnete Beobachtungsreihe ergab sich dabei zu x { 1 J = 0.15
, X ( 2 ) = 0.34 , x { 3 ) = 0.57
, x ( 4 ) = 0.78 , x ( 5 ) = 1 .13 ,
X ( 6 ) = 1.45 , x ( ; ) = 1 .90 , X ( 8 ) = 2.39 , x ( g ) = 3.18 , x ( 1 0 ) = 4 . 2 5
.
105
Kap. 6: Punkischätzungen
Wir wollen nun die D e z i l e , Q u a r t i l e und den Median der Verteilung der Lebensdauer a l l e r Kühlschränke dieses Typs unter den vorliegenden extremen Belastungen schätzen. Für die Dezile
1
und
η - 0.1 = 10 - 0.1 = 1 = k: x ^ , = ^ ( x ( 1 )
g
+
e r g i b t s i c h wegen
x ( 2 ) ) = ^ ( 0 . 15 + 0.34) = 0.245
bzw. wegen η · 0 . 9 = 10 · 0 . 9 = 9 = k: x Q _ g = für die Q u a r t i l e ξ^ ^
und
^
+ x ( , Q ) ) = ^-(3.18 + 4.25) = 3.715 ,
erhalten wir mit
η · 0 . 2 5 = 10 · 0.25 = 2 . 5 , d.h. k = 3: xQ 25
= x
η · 0.75 = 10 · 0.75 = 7.5, d.h. k = 8: xQ
= x ( 8 ) = 2.39
(3)
=
°-57
bzw. mit
?5
und s c h l i e ß l i c h i s t der Schätzer für den Median ζρ j gerade
X
0.5=?(x(10/2)
+x
(12/2)} 4 ( x ( 5 )
+ x
(6)} 4
( 1
·13+
1
·45)
= 1
"29
·
da η = 1 0 eine gerade Zahl i s t .
|
2. Der Q-Q-Plot zur Überprüfung von Verteilungsannahmen Insbesondere i s t für i = 1 , . . . , n der Wert x ^
ein Schätzer f ü r das i / ( n + 1 ) -
Quantil 5 - j / ( n + i ) der Verteilung von X. Diese Tatsache macht man s i c h zunutze, um eine Ve.Kt&iZu.ngiannahm
für X graphisch zu übzipAüiin.
einem Koordinatensystem die empirischen Quantile * i / ( n + l )
= x
Trägt man in ( i ) 9 e 9 e n die
theoretischen Quantile i - j / ( n + i ) d i e s e r angenommenen Verteilung ab, so müssen die Punkte ( ? - j / ( n + i ) > x ( - j ) ) zumindest näherungsweise auf der Ursprungsgeraden mit Steigung 1 l i e g e n , f a l l s die Verteilungsannahme z u t r i f f t . Eine s o l che Graphik nennt man auch einen O-Q-Plot
(Quan£ilz-9ua.ntLit-Plot);
Q-Plot e n t s p r i c h t dem sogenannten MaknAckzintichkzi£ipa.pi.
der QNatürlich
ist
diese graphische Methode der Überprüfung von Verteilungsannnahmen nicht exa k t , so daß wir an dieser S t e l l e b z g l . exakter Aussagen auf Kapitel 8 v e r weisen.
106
Kap. 6:
Punktschätzungen
Βzlipi&t: Anhand der Daten des vorhergehenden Beispiels (Lebensdauer von 10 Kühlschränken) aus Abschnitt 1 wollen wir mittels eines Q-Q-Plots überprüfen, ob die Verteilung der Lebensdauer solcher Kühlschränke eine Ex(0.6) 3 Verteilung, also eine Exponentialverteilung mit Parameter λ = 0.6 = 5- ist. In 1 sind die empirischen Quantile x -j/( n +l) = x ( i)
der Tab.
unc
'
t^eoreti-
sehen Quantile 5-j/( n+ i) der Ex(0.6) - Verteilung, die sich aus
zu
5ΐ/(η+1)"-χ·
1 η ( 1
-
1 /
(
= -!·
η + 1 ) )
1 η ( 1
-ΤΓΪ
ergeben,für i = 1,...,10 = n zusammengestellt. Der zugehörige Q-Q-Plot findet sich dann in der Abb. 1.
Tab. 2: Empirische Quantile
x
i/(n+i)
= x
(-j) der Verteilung der Lebensdauer
von Kühlschränken und theoretische Quantile £-j/( n+ i) der Ex(0.6) Verteilung für i=1,...,10
i
x
i/11
= X
ξ
(i)
ί/11
=
"
l-lnd-TV)
1
0 15
0 .159
2
0 34
0 .334
3
0 57
0 .531
4
0 78
0 .753
5
1 13
1 .010
6
1 45
1 .314
7
1 90
1 .686
8
2 39
2 165
9
3 18
2 .841
10
4 25
3 .996
Da alle Punkte ( ζ , / ^ * x (i)^
se
^r
na
'ie
an
Ursprungsgeraden liegen, sind
zumindest keine extremen Abweichungen von einer Ex(0.6) - Verteilung feststellbar.
Kap. 6: Punktschätzungen
107
4-
3-
2 •
7
1
2
3
4
Afafa. /: Q-Q-Plot zur Überprüfung der Ex(0.6) - Verteilung der Lebensdauer von Kühlschränken
3. Das Stem-and-Leaves-Diagramm und der Box-Plot Das Stem-and-Leaves-Diagramm und der Box-Plot dienen dazu, einen visuellen Überblick über die Verteilung der Daten Xj
χ
schnellen
einer Beobach-
tungsreihe zu gewinnen, und zwar wird die Häufigkeitsverteilung sowie die Lage und Streuung der Daten
repräsentiert.
Zunächst wird der Bereich, in dem sich die Daten χ^,.,.,χ gleichgroße, aneinanderstoßende
bewegen, in
Intervalle zerlegt und die Anzahl der Daten
in jedem Intervall gezählt. Das Stem-and-L&avzi-Viagiamm Diagramm) erhält man dann, indem man die Intervalle
(Stamm-und-Blätteruntereinanderschreibt
und hinter jedes Intervall soviele Kreuze einzeichnet, wie Daten in dem Intervall vorliegen; macht man an Stelle der Kreuze Striche wie auf einem Bierdeckel, so erhält man eine sogenannte
SVvichtUtz.
Neben einem solchen Diagramm kann dann der Box-Plot
gezeichnet werden: Auf
einem senkrechten Strich, dessen Enden den kleinsten bzw. den größten Be-
108
Kap. 6:
Punktschätzungen
obachtungswert x ^ j bzw.
c h a r a k t e r i s i e r e n , werden das arithmetische
Mittel χ und der Median Xg ^ durch e i n Kreuz bzw. durch einen Kreis eingezeichnet. Z u s ä t z l i c h werden waagerechte L i n i e n dort gezogen, wo auf dem senkrechten S t r i c h unteres Quartil Xg 25 und oberes Quartil Xg yg der Beobachtungsreihe liegen. Die Enden dieser waagerechten L i n i e n werden dann noch untereinander verbunden, so daß ein Kasten (Box) e n t s t e h t , der (mindestens) 502! der Daten b e i n h a l t e t ; o b e r - u n d unterhalb der Box liegen dann j e w e i l s (mindestens) 25% a l l e r Daten. S c h l i e ß l i c h werden auf dem senkrechten S t r i c h noch a l l e Werte, die außerhalb des 3s x - Bereiches [x - 3s x , x + 3 s x ] liegen .durch Punkte markiert. Solche Werte kann man dann auch a l s Α υ Λ Ί ί ί β ί Ί ansehen und eventuell aus der Beobachtungsreihe e l i m i n i e r e n .
ΒeXip-tei.: In der Abb. 2 sind Stem-and-Leaves-Diagramm sowie Box-Plot f ü r die Lebensdauern
x ^ von n = 10 Kühlschränken d a r g e s t e l l t , v g l . auch das
l e t z t e B e i s p i e l in Abschnitt 1. Der k l e i n s t e Wert der Beobachtungsreihe x
der Wert x ^ j = 0.15, der größte der Wert
ist
( 10) = 4.25 und a l s gleichgroße
t e r v a l l e für das Stem-and-Leaves-Diagramm wurden die I n t e r v a l l e
In-
[0,1.5),
[1.5,3) , [3,4.5) gewählt, in denen 6, 2 und 2 Beobachtungen l i e g e n . Für den Box-Plot benötigen wir den Median sowie die Quartile der Beobachtungsreihe, die s i c h zu X
0 5
= 1 .29
,
X 0 .25
= 0
·57
bzw
"
*0.75 = 2 · 3 9
ergeben, v g l . auch Abschnitt 1. Weiterhin müssen wir das arithmetische M i t tel -
χ
1
1 0
x
= Τσ h
1
i=Tü
1 0
1
J, «(O-TV-
16-14-1.614
und die empirische Standardabweichung
v/i£2 »yi ex x? -10. 5z) =
y 4 1 . 9 4 7 8 - 10 · 1 . 6 1 4 2 = - j .
\/15.89764
= 1.329 berechnen und s t e l l e n f e s t , daß keiner der Werte χ ^ , . , . , χ ^ außerhalb des 3s y - I n t e r v a l l s
liegt.
Kap. 6: Punktschätzungen
109
Ol
[0,1.5): X X X X X X Q
2-
[1.5,3): XX 3-
,
[3,4.5): XX
4 ·
Abb.
2: Stem-and-Leaves-Diagramm und Box-Plot ( K r e u z = M i t t e l w e r t , K r e i s s Median) für die Lebensdauern x . , . . . , x l n von η = 10 Kühlschränken
Verfeinerte Formen von Stem-and-Leaves-Diagramm und Box-Plot findet man in Härtung et al. (1986, Kap. XIV).
4. Schätzen der Parameter einer Verteilung Unterstellt man für die Zufallsvariablen x^>...>x
, deren
Realisationen
an einer Stichprobe von η Objekten beobachtet w e r d e n , bzw. für
die Zufallsvariable X , welche die gleiche Verteilung besitzt wie die unabhängigen, identisch verteilten Zufallsvariablen X^
Xn
, einen bestimm-
ten Verteilungstyp, so kann man aufgrund der Daten χ^,.,.,χ Parameter dieser Verteilung schätzen. Entstammen χ ρ . , . , χ Ν(μ,σ
2
) - Verteilung, so möchte man die Parameter μ und σ
2
natürlich die z.B. einer
schätzen.
Natürlich möchte man eine "möglichst gute" Schätzung für einen Parameter gewinnen, d.h. man sucht eine Schätz Funktion θ(χρ...,χ
θ(Χ^
X n ) mit Realisation
), die den Daten einen Wert zuordnet, der dem wahren, unbekannten
Parameter θ möglichst nahe kommt.
110
Kap 6: Punktschätzungen
Wünschenswerte Eigeni chatten
von Schätz Funktionen
X n ) sind etwa Er-
wartungstreue, Konsistenz und minimaler Mean Squared Error (MSE, mittlerer quadratischer Fehler). Eine Schätzfunktion heißt eMM/itungitim,
wenn sie
im Mittel den richtigen Wert liefert, d.h. wenn gilt Ε(Θ(Χ 1
Χη)) = θ
sie heißt komlitent,
;
wenn sie mit wachsendem Stichprobenumfang η immer bes-
sere Werte 1iefert : Ρ(|θ(Χ1,...,Χη)-θ| >ε) — > Der Mean Squared
0
für jedes
ΕΛΛΟΊ einer Schätzfunktion § =
ε>0.
.. ,X ) für θ
MSE(§,6) = Ε(θ - θ) 2 = Var(§) + (E(§) - θ) 2 ist gleich der Varianz von § plus dem Quadrat des Slai oder der Ve>izzituna Ε ( § ) - θ von Ü; ist § erwartungstreu, so entspricht der MSE von § gerade der Varianz von §. Eine Schätzfunktion § mit minimalem MSE ist also eine solche, für die gilt MSE(§,θ)< MSE(§,e) für alle betrachteten Schätzfunktionen θ für Θ.
Verfahren zur Bestimmung von Schätzfunktionen sind etwa die Μome.ntenmeX.hode, die Ma.XA.mum- Llk&LLhood. - Methode
oder die Methode
den. kleinsten
QuadKate,
vgl. Kap. III in Härtung et al. (1986) und für einen Spezialfall der Methode der kleinsten Quadrate auch Kap. 9.
Wir wollen hier nicht weiter auf die Punktschätzung von Parametern eingehen und verwenden als Schätzungen im folgenden diejenigen, die sich aus den Schätzungen für die Kenngrößen von Verteilungen im Abschnitt 1 ergeben, d.h. wir stellen die Parameter einer Verteilung durch die Kenngrößen dar und ersetzen diese zur Schätzung der Parameter durch die entsprechenden Schätzungen.
Ist z.B. Χ ^ Ν ( μ , σ
μ = E(X)
2
), so sind wegen
und
o 2 = Var(X)
Kap. 6: Punktschätzungen
111
dann -
-
μ = χ
σ- 2 = s
und
x
2
2 Schätzer für die Parameter μ und σ
der Verteilung. Ist Χ ^ Ε χ ( λ ) , so werden
wir wegen E(X)=1
, d.h.
als Schätzer für λ die Größe
X verwenden. Ist Χ ^ Β ( Ι , ρ ) , so gilt mit Ε(X)= ρ
,
daß ~ - m P-x-„ _ A n z . der Vers., in denen das interessierende Ereignis eintritt Gesamtzahl der Versuche ein Schätzer für ρ ist.
Be-Lspizl:
Geht man davon aus, daß die Lebensdauer von Kühlschränken expo-
nentialverteilt i st, so ergibt sich roit den Daten
^j**·*»*(^qj aus Ab-
schnitt 1, vgl. etwa Tab. 2, als Schätzung für den Parameter λ dieser Exponential Verteilung der Wert
112
Kap. 6: Punktschätzungen
ÜBUNGSAUFGABEN ZU KAPITEL 6
Aufgabe 6.1: Zeigen Sie, daß die Schätzfunktionen
x = l . ( x 1 + ... + x n ) und
s
2 n
^1
2 Σ (Xi-X) 1
i=1
.
(also arithmetisches Mittel und empirische Varianz) erwartungstreu für den ρ Erwartungswert E(X) = μ bzw. die Varianz Var(X) = a
einer Zufallsvariablen X
sind, wobei die unabhängigen, identisch verteilten Zufallsvariablen der gleichen Verteilung wie X genügen.
Aufgabe 6.2: In der Tab. 3 sind die Längen der Kelch- und Blütenblätter x^, y.. von η - 1 2 Pflanzen einer Art angegeben.
Tab. 3: Längen von Kelchblättern x^ und Blütenblättern y^ für i=1,...,12 von η = 12 Pflanzen einer Art
i 1 2 3 4 5 6 7 8 9 10 11 12
x
i
7.8 6.9 5.4 5.8 6.3 7.2 5.1 6.1 5.8 7.4 6.4 6.6
2.4 2.1 1.7 1.9 2.0 2.3 1.5 1.9 1.8 2.3 2.1 2.0
Kap. 6: Punktschätzungen
113
Interpretieren Sie die x. und y^ als Realisationen unabhängiger Zufallsvariablen, die alle die gleiche Verteilung wie X bzw. Y besitzen, und schätzen Sie die Erwartungswerte und Varianzen von X und Y sowie die Kovarianz und die Korrelation zwischen den Zufallsvariablen X und Y.
Aufgabe 6.3: Bestimmen Sie die empirischen a - Q u a n t i l e x^
*o 5
ur,
d Xg g der Länge der
Kelchblätter aus Tab. 3 in Aufgabe 6.2 und prüfen Sie mittels Q-Q-Plot, ob die zugehörige Zufallsvariable X einer Normalverteilung genügt. Ermitteln Sie außerdem ein Stem - and - Leaves - Diagramm sowie einen B o x - P l o t für die Länge der Kelchblätter; verwenden Sie hierbei die Intervalle [5,6) , [6,7) , [7,8).
Kapitel 7: Intervallschätzungen für zukünftige Beobachtungen und für Parameter von Verteilungen Wir haben in Kapitel 6 die Parameter der Verteilung einer Z u f a l l s v a r i a b l e n X aufgrund der Realisationen x 1 ten Z u f a l l s v a r i a b l e n
x n von η unabhängigen, i d e n t i s c h v e r t e i l mit der gleichen Verteilung wie X geschätzt.
Oft möchte man zudem aufgrund von
zukünftige Realisationen oder
Funktionen zukünftiger Realisationen aus der zugrundeliegenden Verteilung p r o g n o s t i z i e r e n ; diesem Zweck dienen sogenannte Toleranz υαΖίζ.
- und
Piognoi&intei-
Außerdem w i l l man häufig n i c h t nur eine Punktschätzung f ü r den Para-
meter einer Verteilung angeben, sondern vielmehr ein I n t e r v a l l , das den festen, aber unbekannten Parameter mit vorgegebener S i c h e r h e i t überdeckt, d.h. man möchte ein Kon^idcnzint&Kuati
oder VMXlau.e.niinXzfivail
für den unbekann-
ten Parameter bestimmen.
1. Toleranz- und Prognoseintervalle Kennt man die Parameter der Verteilung einer Z u f a l l s v a r i a b l e n X , so l i e g t jede zukünftige Beobachtung aus dieser Verteilung mit Wahrscheinlichkeit ρ im I n t e r v a l l [ξ
(1-ρ)/2 · ξ(1+ρ)/2]
'
d.h. zwischen dem (1-p)/2 - und dem (1+p)/2 - Quantil dieser V e r t e i l u n g . Man nennt dieses I n t e r v a l l dann ein ToleAanzintzivcill ich&inlichkeit
mit
minimale.*
TAc^eAuahA-
ρ für eine zukünftige Beobachtung, v g l . z.B. die ko - I n t e r -
v a l l e im Abschnitt 1 von Kapitel 5. In der Regel kennt man die Parameter der Verteilung von X jedoch n i c h t . Man kann dann sehr o f t ein mit
minimaiil
Tldfäe.luia.h'Uich&intichkesit
ρ and
lolM.a.nzintzn.vaJUL
Sichi^hiitiiMhUcheinZichkiAX
1 - a angeben, in dem mit einer s t a t i s t i s c h e n S i c h e r h e i t von (1 - αϊ · 100% mindestens p · 100% der zukünftigen Beobachtungen l i e g e n . Möchte man den Mittelwert χ einer zukünftigen Stichprobe χ . , . , . , χ
progno-
116
Kap. 7: Intervallschätzungen
s t i z i e r e n . s o kann man e i n sogenanntes ?iognoiei.nte.n.vaU icheintickkeAX
mit Τ-Ίε^εΛαιαίΐΛ-
1 - α verwenden. In diesem l i e g t der M i t t e l w e r t von m z u k ü n f -
t i g e n Beobachtungen dann mit der W a h r s c h e i n l i c h k e i t
1 - α . Für m = 1 e r g i b t
s i c h n a t ü r l i c h e i n B e r e i c h , i n dem e i n e i n z e l n e r z u k ü n f t i g e r Wert mit (1 - α) · 100% S i c h e r h e i t
liegt.
Für d i e konkrete Bestimmung von Toleranz - und P r o g n o s e i n t e r v a l l e n s e i verwiesen auf Härtung et a l .
hier
(1986).
2. Konfidenzintervalle Unter einem Konfiide.nzinte.iva.tJL iidenzinteKvatt
zum Nive.au
v e r s t e h t man e i n I n t e r v a l l
1 - α oder kurz einem (1 - α) - Kon[ θ ^ ^ ] , das den wahren, unbe-
kannten, f e s t e n Parameter θ e i n e r V e r t e i l u n g mit W a h r s c h e i n l i c h k e i t überdeckt; es g i l t
1- α
also
Ρ({θ1 < θ < θ 2 } ) = 1 - α
, 0< α< 1
Man s a g t auch k u r z : Der Parameter θ l i e g t mit W a h r s c h e i n l i c h k e i t schen θ^ und 02· Ein s o l c h e s (1 - α) - K o n f i d e n z i n t e r v a l l
1-a
zwi-
kann o f t aus der
Punktschätzung θ f ü r θ, v g l . Kap. 6 , k o n s t r u i e r t werden. Dazu wird θ i n e i n e Größe θ t r a n s f o r m i e r t , deren V e r t e i l u n g F n i c h t vom unbekannten Parameter θ abhängt. Ein K o n f i d e n z i n t e r v a l l [α/2-Quantil
zum Niveau 1 - α f ü r θ i s t dann
von F , (1 - α/2) - Quantil von F]
denn es g i l t P({α/2 - Quantil von F < θ < (1 - α/2) - Quantil von F ) = 1 - α
.
Durch Rücktransformation von θ und entsprechende Transformation der Q u a n t i l e von F e r h ä l t man dann e i n (1 - α) - K o n f i d e n z i n t e r v a l l
f ü r den unbekannten Pa-
rameter θ. Dies i s t a l l e r d i n g s n i c h t immer so e i n f a c h möglich wie i n den nachfolgenden
Fällen.
Wir wollen nun e i n i g e s p e z i e l l e K o n f i d e n z i n t e r v a l l e f ü r d i e Parameter von Normal - und B i n o m i a l v e r t e i l u n g betrachten. Für weitere s e i verwiesen auf Härtung et a l .
(1986).
Konfidenzintervalle
117
Kap. 7: Intervallschätzungen
2.1
K O N F I D E N Z I N T E R V A L L E T E R
μ
E I N E R
Ν ( μ , ο
Sind die Zufallsvariablen X^
2
F Ü R
D E N
P A R A M E -
) - V Ε R Τ Ε I L ö Ν G
X n unabhängig identisch normal verteilt mit
unbekanntem Mittelwert y und b z h u m t v ι Varianz
, so besitzt die Punkt-
schätzfunktion
1
2
eine Ν ( μ , — σ
) - V e r t e i l u n g und für die zugehörige standardisierte
Zufalls-
variable gilt v ^ . >2 2
l
= ( 4 · 1.96)2 = 61.4656
d . h . er muß mindestens d i e Abfüllmenge von η = 6 2
F l a s c h e n messen.
V e r n a c h l ä s s i g t er d i e H e r s t e l l e r a n g a b e und verwendet d i e Daten aus Tab. 1 a l s V o r s t i c h p r o b e z u r Abschätzung von σ , so e r g i b t s i c h mit s = 4.457
und
e i n Stichprobenumfang
n>(2 '
4
'45g '
t
... „ = t 1 K n 0 7 C = 2.131 ηQ-1;1-α/2 15 ;U.975
von
2
·131^=
(4.457 · 2.131 ) 2 = 90.209
.
I s t d i e gewünschte G e n a u i g k e i t des (1 - α) - K o n f i d e n z i n t e r v a l l s
|
f ü r ν i n Ab-
h ä n g i g k e i t vom M i t t e l w e r t χ der Beobachtungen v o r g e g e b e n , d . h . s o l l pfLoz^ntaali 2 rianz σ
GcnaiUgkexX
das VafiXtiJU,oniza.klve.>i{tahrizn
probenumfangs.
eine
ε e i n g e h a l t e n werden, so d i e n t bei unbekannter Vaz u r Bestimmung des notwendigen
Stich-
Kap. 7: Intervallschätzungen
121
Das Konfidenzintervall für μ s o l l hier die Gestalt [μ 1 ,μ 2 ] = [x - εχ , χ + ex] mit ε
=7Τ·νΐ;1-α/2·® Vn χ
(«ΓΪ>0)
b e s i t z e n ; der Name V a r i a t i o n s z a h l v e r f a h r e n rührt daher, daß in den Wert ε der empirische V a r i a t i o n s k o e f f i z i e n t v = s / x eingeht, der auch zahl
VtvUcutiom-
genannt wird.
I s t nun die prozentuale Genauigkeit ε vorgegeben, so schätzt man zunächst aus einer kleinen Vorstichprobe vom Umfang n 1 den V a r i a t i o n s k o e f f i z i e n t e n durch ν ab und bestimmt dann das k l e i n s t e n " mit
ν-1;1-α/2'ν
Sodann wird eine Stichprobe vom Umfang n " gezogen und überprüft, ob die Gen a u i g k e i t e eingehalten wird. I s t dies der F a l l , so i s t n " der gesuchte Stichprobenumfang. Sonst wiederholt man das Verfahren, indem man ν aus den n " Daten bestimmt, dann n ' " nach obiger Formel berechnet usw. Be-Cip-cel:
Der Getränkeproduzent aus dem B e i s p i e l in Abschnitt 2.1 möchte bei
Vernachlässigung der Herstellerangabe σ = 4 mi ein 95% - Konfidenzinterval 1 mit prozentualer Genauigkeit ε = 0.4% = 0.004 bestimmen. A l s Vorstichprobe vom Umfang π'=16 verwendet er die Abfüllmengen aus Tab.1,so daß s i c h a l s Abschätzung für den V a r i a t i o n s k o e f f i z i e n t e n v = I = 4.457 500.5625
0.0089
e r g i b t . Der Stichprobenumfang n " e r g i b t s i c h dann wegen
20 £
^9^0.975 · ° · 0 0 8 9 OÜ3
—
t
21 i
20;0.975 ' 0 · 0 0 8 9 ' oü3
2
. /2.093 · 0.0089V 1 _ „ 21 - {—ου*—) ·687
'
_ ^2.086 · 0.0089N 2 = O M
{
)
21.542
·
Kap. 7; Intervallschätiungen
122
21 ;0.975 OÜT
22 >
0.0089
^2.080 · 0.0089^
l — o u ? — )
21.418
zu n " = 2 2 . Der Getränkeproduzent müßte nun die Abfüllmenge von 22 z u f ä l l i g ausgewählten Flaschen bestimmen und überprüfen, ob die Genauigkeit von 0.4% eingehalten wird.
|
Ein weiteres, allerdings nur approximatives Verfahren zur Bestimmung notwendiger Stichprobenumfänge zur Einhaltung prozentualer Genauigkeiten von (1 - α) - Konfidenzintervallen für μ i s t das sogenannte StAeazcLhlveA^ah/Len. Für die gia.plu.iche.
Be.iCimmu.ng von Stichprobenumfängen bei Variationszahl -
und Streuzahl verfahren gibt es sogenannte Leiteita^etn.
Wir verweisen an
dieser Stelle auf Härtung et. a l . (1986, Kap. IV, Abschnitt 1), wo auch rein sequentielle Verfahren beschrieben sind.
2.3
K O N F I D E N Z I N T E R V A L L E TER
σ
2
E I N E R
I s t der HUtztmeit
N ( y , a
FÜR 2
DEN
P A R A M E -
) - V E R T E I L U N G
μ einer Normal Verteilung mit Parametern μ und σ
2
be.ka.nnt,
so genügt die Größe
σ
1=1
einer χ - Verteilung mit η Freiheitsgraden, f a l l s X. ο
X
unabhängige,
Ν(μ,σ ) - v e r t e i l t e Zufallsvariablen sind. Damit i s t η l (x-μ)2 i=1
Λ
~2
[-f-f]·
χ
η;1-α/2
η I i=1
9
(χ-μ)2
~ ι χ
η ;α/2
wobei χ. χ Realisationen von Χ 1. , . , . , Χ n sind, ein Konfidenzintervall zum i n 2 9 Niveau 1 - α für die Varianz σ der Normal Verteilung; χ η i s t hierbei das 2 im Anhang vertafelte γ - Q u a n t i l der χ - Verteilung. I s t hingegen der MLtteluieAX μ unbekannt,
so
ist
(n - 1) · S 2 2 "" x n-1 wobei
123
Kap. 7: Intervallschätzungen
η ·
j i=1
(χ, - χ ) 2
die Punktschätzfunktion für σ
i=1
bezeichnet. Mit der empirischen Varianz
2
(xri)
die sich aus den Daten x^,...,x n ergibt, hat das Konfidenzintervall
zum Ni-
veau 1 - α für die Varianz σ 2 die Gestalt
(η - 1) · s 2 7 χ η-1;1-α/2
Γ 2 h • °
·
( η - 1) · s 2 Τ χ η-1;α/2
BeXipleZ: Der Getränkeproduzent aus dem Beispiel
in Abschnitt 2.1 hat seine
Anlage auf eine Abfüllmenge von 500 mi. eingestellt und möchte überprüfen, 2 ob die Herstellerangabe σ = 4 mi., d.h. σ = 1 6 , realistisch ist. Dazu bestimmt er anhand der Daten aus Tab. 1 ein Konfidenzintervall 2 Varianz σ
zum 95% Niveau für die
der Anlage. Arbeitet er mit dem Einstellwert μ = 500 mi,, so er-
gibt sich wegen 16 I i=1
16 (X.--W)
=
l i=1
4 ; 0 . 9 7 5 =2 8 · 8 5 das
(x, - 500)' = 303 1
'
und
Xl6;0.025 = 6 · 9 0 8
Intervall
R
» 4} - [ Ä
» ora]
= [10 503
·
· 43·862]
·
Verwendet man anstelle von μ = 5 0 0 mi den Mittelwert der Daten aus Tab. 1, so erhält man mit
s 2 = 4.457 2 = 19.865
4;0.975
= 27
·49
und
'
X?5;0.025
= 6
·262
gerade
=
= Π 0.839 . 47.5851
.
J
124
Kap. 7: Intervallschätzungen
Koniidinz-intiivatte.
^üi
diz
σ einer Normal Verteilung e r 2
S£andaAda.tM&-ickang
geben sich natürlich aus denen für die Varianz σ , indem die Wurzeln aus den dortigen Grenzen gezogen werden.
2.4
K O N F I D E N Z I N T E R V A L L E T E R
ρ
E I N E R
Β ( η
F O R
D E N
P A R A M E -
, p ) - V E R T E I L U N G
Aufgrund von η unabhängigen Versuchen soll ein Konfidenzintervall
zum Niveau
1 - α für die unbekannte Wahrscheinlichkeit ρ des Eintretens eines Ereignisses Α bestimmt werden.
Ist η groß und ρ und 1 - p nicht klein (etwa n p ( 1 - p ) > 9 ) , so ist nach dem Zentralen Grenzwertsatz, vgl. Kap. 5, die Größe
v'pTFpT approximativ standardnormal verteilt, d.h. P«-"l-a/2SZwcLU,
=
Ein zxakt&i
"· ( 2np •
Konildrnzlntzivalt
[p^,p 2 ]
Τ u,.a/2 · J
ergibt
für ρ mit
• 4np(1 - p) )
zum Niveau 1 - α für die Wahrscheinlichkeit ρ
ergibt sich aus der Beziehung zwischen Binomial - und F - Verteilung, vgl. Kap. 5, zu [pj,p 2 ] mit
m
'F2m,2(n-m+1);a/2
H ~ n - m + 1 + m · ^2m,2(n-m+1) ;a/2 η
(m+1)
n
-
-F2(m+1),2(n-m);1-a/2
m+(m+1)
.
-F2(m+l),2(n-m);1-a/2
Kap. 7. Intervallschätzungen
die Größen p, und p, heißen auch I L.
ΡΖΟΛΑΟΠ-
das im Anhang v e r t a f e l t e γ - Q u a n t i l
CloppeA
der F
- Wtttz,
wobei Γ
125
V ^ , V2 lY
- V e r t e i l u n g bezeichnet.
v
1'v2
Β t i i p i i l : Ein Produzent w i l l ein 95% - Konfidenzinterval1 für die
Intaktwahr-
s c h e i n l i c h k e i t ρ eines elektronischen B a u t e i l s bestimmen. Dazu entnimmt er der Produktion z u f ä l l i g η = 1000 Bauteile und s t e l l t f e s t , daß von diesen 1000 Bauteilen m = 980 Bauteile korrekt h e r g e s t e l l t , d.h. i n t a k t s i n d . Die Anzahl i n t a k t e r Bauteile i s t n a t ü r l i c h die R e a l i s a t i o n einer B(1000,p) - Vert e i l u n g und a l s Punktschätzung für ρ e r g i b t s i c h hier der Wert s . m _ 980 . . q R " TÜÜU " ° · 9 8
·
Das 95% - Konfidenzintervall m i t t e l s Normalverteilungsapproximation
ergibt
s i c h dann mit u
1-a/2
= u
0.975 = 1 · 9 6
u 2 _ a / 2 = 1,96 2 = 3.8416
'
und
P 1 . 2 = 2 . ( I Q O o l 3.8416) - ( 2 -
1000
- 0.98 + 3.8416
* 1.96 · \/3.8416 + 4 · 1000 · 0.98 · O.O2) °200716832 * (1963.8416Ϊ 17.7747) = 0.9782 + 0.0089
[p 1 ,p 2 ] = [0.9782 - 0.0089 , 0.9782 + 0.0089] = [0.9693 , 0.9871] Will man nun das exakte Konfidenzintervall
zum 95% Niveau bestimmen, so be-
n ö t i g t man Quantile der F - V e r t e i l u n g : r
-ρ 2m,2(n-m+1);α/2 ~ 1960,42;0.025 "
|mi t
c =
V 9 7 5 _ ^
=
φ
=
0
.
1
4
F
0
1
4 2 ,1960;0.975
3
~
u
1 0.975 "
a
"
b
126
Kap. 7: Intervallschätzungen
a =v/2d + ccT = νΌ.0499 = 0.2234
und
= 0.0478 - 0.9653 = 0.046l] 1 . 1 ' 1 . 9 6 · 0.2234 - Ö.0461 " 0.3Ö1Ö e e u F
2(m+1),2(n-m);1-a/2
u Γ 0 975 " [mit c = g
d
= im+-k
3
= F
1962,40;0.975 ~
0.975 '
a
"
b
= 0.1403
= 0 · 0262
, = \[τΑcd += νΌ.0525 = 0.2291 b = 2
e
0.6759
' (ΤΜΤ" ή ) ' (c
+
l"l)
=
und
- ° · 0 5 0 3 ' 0-9649 = -0.0485j
_ 0 1.96 · 0.2291 + 0.0485 0.4975 =e = e = 1.6446
,
vgl. auch die Approximation für Quantile der F - V e r t e i l u n g im Anhang. Damit ergibt sich dann Γη η l - Γ 980 - 0.6759 981 · 1.6446 ιρ 1 2 " (.21 + 580 · 0.6759 ' 20 + 981 · 1.6446 f662.3820 1613.3526] [683.3820 * 1633.3526J [0.9693 , 0.9878] als exaktes 95% - Konfidenzintervall für die Intaktwahrscheinlichkeit ρ eines Bauteils aus der Produktion. |
Kap. 7: IntervaUschätzungen
127
ÜBUNGSAUFGABEN ZU KAPITEL 7
Aufgabe 7.1: Um die Belastbarkeit eines Bowdenzug - Typs zu ermitteln, wurde an η =9 Proben die Zugkraft gemessen, die zur Zerstörung des Bowdenzuges notwendig ist. Die ermittelten Werte in kp, von denen angenommen werden kann, daß sie einer Normal Verteilung entstammen, sind in Tab. 2 zusammengestellt.
Tab. 2: Zur Zerstörung des Bowdenzuges notwendige Zugkräfte x.,...,x q in kp
i x
i
1
2
3
4
5
6
7
8
9
30.5
27.4
29.3
32.3
31.0
30.9
28.7
30.6
29.8
a) Bestimmen Sie 95% Konfidenzintervalle für die erwartete Zerstörungszugkraft und deren Varianz. b) Wie groß ist die prozentuale Genauigkeit ε des Konfidenzintervalles für die erwartete Zerstörungszugkraft? c) Wieviele Messungen müssen Sie voraussichtlich machen, um ein 95%-Konfidenzintervall für die durchschnittliche Zerstörungszugkraft mit Genauigkeit ε =2.5% angeben zu können? ο d) Wieviele Messungen müssen Sie voraussichtlich machen, wenn die Breite d = 1 eines 95% - Konfidenzintervalles für die erwartete Zerstörungszugkraft abzusichern ist?
Aufgabe
7.2·.
In der Endkontrolle einer Produkti on wurde festgestellt, daß in einer Stichprobe von 100 Transistoren genau 89 intakt waren. Geben Sie ein exaktes und ein approximatives Konfidenzintervall mit 98% Sicherheitswahrscheinlichkeit für die Intaktwahrscheinlichkeit eines Transistors aus der Produktion an.
Kapitel 8: Statistische Tests
Mittels
statistischer
T e s t s können z . B . H y p o t h e s e n über d i e Parameter
bekannten V e r t e i l u n g s t y p s
(paAam&t>Uiche
TeAti),
H y p o t h e s e n über d i e
t i o n ( L a g e ) o d e r S t r e u u n g b e i unbekanntem V e r t e i l u n g s t y p ichi
Teiti),
H y p o t h e s e n über d i e A r t e i n e r V e r t e i l u n g
eines Loka-
(rUcktpcuuuw.tAi-
(Anpaaungitiiti)
oder
H y p o t h e s e n über d i e A b h ä n g i g k e i t von Merkmalen (UnabhänglgkiititeAti) prüft
ge-
werden.
Ein s t a t i s t i s c h e r
T e s t b e s t e h t a u s einem Paar (Hg
n a n n t e HuJLthijpothtit
o d e r k u r z Hypothz&e.
) , wobei Hg d i e
soge-
und H^ d i e AtteMivUvhifpotheiz
oder
A t t i i n a t i v e . des T e s t s b e z e i c h n e t . A u f g r u n d e i n e r a d ä q u a t e n Ρ ι ϋ ^ Ί ΰ & ζ
oder
T&itltCUttitik
, x
Τ = T(X1
n
) ,
d i e a u f η unabhängiger,, i d e n t i s c h v e r t e i l t e n s i e r t , deren V e r t e i l u n g k a n n t bzw. a b s c h ä t z b a r der Z u f a l l s v a r i a b l e n Η^
X^
Zufallsvariablen
u n t e r d e r Hypothese Hg ( b e i
ba-
V o r l i e g e n von Hg ) b e -
i s t , w i r d dann a u f g r u n d von R e a l i s a t i o n e n
χ^,.,.,χ
X n e i n e E n t s c h e i d u n g z u g u n s t e n von Hg o d e r von
getroffen.
Bei einem Tea-t zum N-tueau ο (0 < et< 1) g e h t man so v o r , daß man den W e r t e b e r e i c h von Τ p r o b l e m a d ä q u a t i n zwei T e i l b e r e i c h e a u f g l i e d e r t . Teilbereiche
fällt
T(x^,...,xn)
k e i t g r ö ß e r oder g l e i c h
u n t e r d e r H y p o t h e s e Hg m i t
o d e r α = 0 . 0 1 = 1%. L i e g t nun T ( x ^ , . . . , x
dieser
Wahrscheinlich-
1 - α , i n den a n d e r e n m i t W a h r s c h e i n l i c h k e i t
o d e r g l e i c h α ; d a b e i w i r d α i n d e r Regel
scheinlichkeit
In einen
kleiner
k l e i n g e w ä h l t , z . B . α = 0 . 0 5 = 5%
) i n demjenigen T e i l b e r e i c h m i t Wahr-
k l e i n e r o d e r g l e i c h a , so w i r d d i e H y p o t h e s e Hg v e r w o r f e n
wie man auch s a g t :
" D i e A l t e r n a t i v e H 1 i s t zum N i v e a u α s i g n i f i k a n t " .
F e h l e r b e i d i e s e r E n t s c h e i d u n g , d . h . HQ f ä l s c h l i c h e r w e i s e
k l e i n e r o d e r g l e i c h dem N i v e a u α des
Man s p r i c h t auch vom α - fehlzn.
o d e r vom FehteA
i u m t w . h u c k i U ) i t M i h k e A X oder S i g n l i l k a n z n A . v i a u .
Der
zu v e r w e r f e n ,
gerade eine W a h r s c h e i n l i c h k e i t
a n d e r e n B e r e i c h , s o b l e i b t man b e i d e r H y p o t h e s e H n .
hat
Tests.
1. AnX und n e n n t α auch Fällt T(x^,...,xn)
oder
i n den
Ιαλ-
130
Kap. 8: Tests
Entscheidet man s i c h f ü r die Hypothese Hg, so begeht man mit Wahrscheinlichk e i t ß einen Fehler (ß - FihlnA, FthleA 2. KnX), d.h. mit Wahrscheinlichkeit β v e r w i r f t man die Hypothese n i c h t , obwohl die A l t e r n a t i v e H^ v o r l i e g t . Diesen Fehler hat man in der Regel bei s t a t i s t i s c h e n Tests n i c h t im G r i f f ; er kann mitunter sehr groß s e i n . Daher s p r i c h t man auch nicht davon, daß Hq v o r l i e g t , sondern sagt vielmehr: "Die Abweichung von der Hypothese Hg (oder die A l t e r n a t i v e H^) i s t zum Niveau α nicht
signififkant."
Mit den Eigenschaften s t a t i s t i s c h e r Tests wollen wir uns h i e r nicht beschäft i g e n ; man v g l . aber Härtung et a l . (1986). Vielmehr wollen wir im folgenden parametrische Tests f ü r die Parameter von Normal - und Binomial V e r t e i lung sowie für den Vergleich der Parameter zweier Normal - und Binomialverteilungen behandeln. Außerdem wollen wir einen nichtparametrischen Test für die Lokation bzw. für den Lokationsvergleich von zwei Verteilungen, einen Test auf Unabhängigkeit zweier E r e i g n i s s e bzw. zweier B e r n o u l 1 i - V a r i a b l e n , 2
den χ
- Anpassungstest sowie Tests in allgemeinen Kontingenztafeln
vorstel-
len. Für weitere Tests vergleiche man Kapitel 9 und 10 sowie Härtung et a l . (1986), wo auch das Problem der Bestimmung notwendiger Stichprobenumfänge zum Absichern vorgegebener Differenzen behandelt wird.
1. Tests über die Parameter einer Normalverteilung Sind χ·|,...,χ π (unabhängige) Realisationen aus einer Ν(μ ,σ^) - Verteil ung, so möchte man zum einen Hypothesen über den Mittelwertparameter μ und zum anderen Hypothesen über die Varianz σ^ testen.
1.1
T E S T S
ÜBER
DEN
M I T T E L W E R T
μ
I s t μρ ein vorgegebener Vergleichswert f ü r den Mittelwert μ einer NormalV e r t e i l u n g , so können s t a t i s t i s c h e Tests für die Paare H0: μ = μ 0
H^: μ t μ ρ J
u1
H 1 : μ > μ«
0
μ
-μ0
H : 0 durchgeführt werden.
ΗΓ
μ U
1-a/2
·
Die einseitigen Hypothesen werden beim Gauß-Test zum Niveau α verworfen, f a l l s im Falle von hJ g i l t Τ > u. 1-a 2 bzw. im Falle von HQ g i l t ΤUtiicheA Ueit des Gauß - Tests. I s t die Vanianz unbekannt,
so wird sie zunächst durch
geschätzt, und die Prüfgröße * " μ0 t = t ( x 1 . . ,x n ) = — i s t unter der Hypothese
HQ:p = y 0
lung. Beim sogenannten t - Teit I^Vljl-a/Z
'
hJ verworfen, f a l l s ^Vlsl-a ?
und HQ verworfen, f a l l s
'
Vn eine Realisation aus einer t
^ - Vertei-
zum Niveau α wird dann Hg verworfen, f a l l s
132
Kap. 8: Tests
t < t n-1;a , wobei t^
'
das im Anhang vertafelte γ - Q u a n t i l der t^ - Verteilung bezeichnet.
BziipieZ: Der Getränkeproduzent aus dem Beispiel in Kapitel 7, Abschnitt 2.1 möchte anhand der Daten aus der dortigen Tab. 1 prüfen, ob signifikante Abweichungen zum 5% Niveau von der Abfüllmenge μ^ = 500 ms. auftreten, d.h. er testet die Hypothese
H q : μ = 500
gegen
Η,: μ $ 500
Legt er die Herstellerangabe σ = 4 zugrunde, so ergibt sich mittels Gauß Tests | T | = | * - a 5 0 ° . y W | = | 500.5625 - 500 , - 0.5625 Η - 9 6 = u 0 - 9 7 5 = U l . a / 2
|
,
daB er die Nullhypothese Hq nicht verwerfen kann. Läßt er die Herstellerangabe außer acht, so führt dies zum t - T e s t . Auch hier kann er die Hypothese Hq zum 5% Niveau nicht verwerfen, da mit dem kritischen Wert t^.Q g ^ g i l t It| = | i = i 2 2 . „ F | . | 500.5625 - 500 . = 0.5048^2.131 = t 1 5 ; 0
975
| __ | 0^625 Μ |
= tn_1;1_a/2
.
Bei beiden Tests können also keine signifikanten Abweichungen von uQ = 500 mJt bei zugelassener Irrtumswahrscheinlichkeit S% konstatiert werden. |
1.2 Sind
TESTS
OBER
DIE
VARIANZ
σ2
ο Realisationen aus einer Ν(μ,σ ) - V e r t e i l u n g , so sind bei GUI -
2 tigkeit von ο2 = a^2 mit einem Vorgabewert Oq die Prüfgrößen
η p I (x-j-y)2 2 i=1 χ =— 5 αά 0 2 (η - 1 )s 2 χ =— σ 0
(für bekanntes μ) .. mit
2 s =
1 ~
.
bzw.
? , -v2 . . ^ ι ( x ^ - x ) (fur unbekanntes μ)
1=1
133
Kap 8: Tests
2 Realisationen aus einer χ - Verteilung mit η bzw. n - 1 F r e i h e i t s g r a d e n . Daher wird im zweiseitigen Test von 2
2
H q : σ =OQ
gegen
2
2
Η,: σ
+σ0
die Hypothese HQ zum Niveau α verworfen, f a l l s χ2>χ
η;1-α/2
oder
χ2χ
η-1;1-α/2
oder
χ2 < x
η;α/2
( f ü r bekanntes μ)
n - 1 ;a/2
bzw.
(für unbekanntes μ)
Bei den e i n s e i t i g e n Testproblemen 1 2 2 HQ: σ < OQ 2
2
2
H q : σ >OQ
gegen
1 2 2 H^: σ >Og
gegen
Η 1 : σ < Og
2
2
und
2
wird die Hypothese Hg zum Niveau α verworfen, f a l l s
x
2
>χ
2
.
bzw
η;1-α
x
"
2
>x
2 und Hg wird zum Niveau α verworfen, f a l l s 2
2
.
Χ M2
gegen
H 1 : μ1 < μ 2
und
2
Bezeichnen wir mit
X l
1
X i ? i
X
1 i
1
Und
"2 x
2i
die Mittelwerte der Meßreihen χ ^ , . , . , χ ^ und χ 2 ΐ ' · · · » χ 2 η · 1 2 2 . 2 kannten
VaxMinzzn
σ^ und σ 2 d i e
Prüfgröße
so
ist
bei
fae
"
Kap. 8: Tests
135
~ *2
τ =.
π — ?
σ-,
"Τ
+ π
2
unter G ü l t i g k e i t von μ^ = μ 2 R e a l i s a t i o n einer standardnormalverteilten Zuf a l l s v a r i a b l e n , so daß wir die Hypothese Hg zum Niveau α verwerfen müssen, falls |τ|>υ,.α/2
.
1 2 Entsprechend werden die e i n s e i t i g e n Hypothesen Hg bzw. Hg zum Niveau α v e r worfen, wenn g i l t T>u,_a
bzw.
Sind d i e Vaiianzen
unbekannt
T t
nl+n2-2;1-a/2
2
und Hg bzw. Hg werden zum Niveau α verworfen, f a l l s t>t
gilt
lf, n,|+n 2"
2
und
X1; 1 - 2 a
m1 (n 2 - m 2 ) > m 2 (n 1 - m 1 )
2 und HQ wird verworfen, f a l l s 2 x
2 >x
und
1;1-2o
m 1 (n 2 - m 2 ) < m 2 (n 1 - m 1 )
2 Der gleiche approximative χ - Test kann zur übiipiü^ung zuizlzn.
dlchotome.>L
MzikmaZz,
d.h.
von Merkmalen mit
dzn.
nur je
2
UnabkänglgkeJX Ausprägungen,
so daß s i e durch eine 2x2 - Tafel beschreibbar s i n d , herangezogen werden. Man würde dann im obigen B e i s p i e l die Unabhängigkeit von Produktqualität und Maschinen prüfen. Bezeichnet etwa Α das E r e i g n i s "Ausschuß" und Β das E r e i g n i s "Maschine 1 " , so können mit η = n1 + n2
,
n1
2
+
n2-mrm
n 1 = H n (B) = H n (Ä)
n 1 - m1 = H n ( Ä n B)
und
,
n 2 = H n (B)
,
,
m^HtAnB),
n^ + m2 = H n (A) ra^H^fAnB)
,
n 2 - m2 = H n ( Ä n B)
die Versuchsergebnisse in einer V i e r f e l d e r t a f e l der absoluten bzw. r e l a t i v e n Häufigkeiten d a r g e s t e l l t werden, v g l . Tab. 2. Die Tafel der r e l a t i v e n Häuf i g k e i t e n kann a l s R e a l i s a t i o n einer entsprechenden E r e i g n i s s ewerden. Α und Β g i l t fDa e l ,fürv g lunabhängige . Tab. 3, angesehen
Wahrscheinlichkeitsta-
142
Kap. 8: Tests
P(Aη Β) = P(A) · P(B)
bzw.
lautet die Unabhäng-igkzitAhypothue H
0:pij
= p
i
'
p
j
ρ,^ρ,
.ρ ,
,
Hg gerade
für a l l e Paare (i ,j)
und die zugehörige Alternative H^ i s t H
1:
p
ij^pi
"p j
"""bestens
e n
i
Paar ( i » j )
Tab. 2: Vierfeldertafeln der absoluten und relativen Häufigkeiten zweier Ereignisse Α, Β und ihrer Komplementärereignisse Ä und Β
Ä
Β
h (ΑΠΒ) η
h (ÄflB) η
h n (B)
Η η (Β)
Β
h (Α Π Β) η
h (Äni) ri
h„(B)
η
I
h n (A)
h n (Ä)
1
Ä
I
Β
Η (Α η Β) η
Η (ΑΠΒ) η
Η η (Β)
Β
Η (Α η Β) η
Η (Ä Π Β) η
Η η (Α)
H n (Ä)
n
ι
ι
Α
A
H
h
n
Tab. 3: Wahrscheinlichkeitstafel für zwei Ereignisse Α, Β und ihre Komplementärereignisse Ä, Β
Ρ
A
Ä
I
Β
Ρ (Α Π Β) = ρ η
P(Ä η Β) = Ρ 2 1
Ρ(Β) = Ρ > 1
Β
Ρ (Α Π Β) = ρ 1 2
Ρ (Α η Β) = Ρ 2 2
Ρ(Β) = ρ
I
Ρ(Α) =
Ρι
P(Ä) = ρ 2 >
2
1
Die Hypothese Hg wird dann zum Niveau α verworfen, f a l l s g i l t
(η π (ΑΠ Β) · H n ( Ä n B ) - H ( Ä n B ) · 2 X =η·^ : : H n (A) · Η (A) · Η (Β) · Η (Β)
> x'
Kap. 8: Tests
143
1 2 Die den Hypothesen Hg und Hg analogen einseitigen Hypothesen beim Unabhängigkeitstest H
s i n d d i e Hypothiii
0:
P
11 - p 1. ' P .1
bzw. d i e Hypothese
H
2 o:
dvi
p
gegen
den. positiven
i i - P1."
p
mgativzn
H
Abhängigkeit
P
11 > P 1. ' P .1
Γ
itochaituch&n
gegen
.i
Η
itochaitlichen
Abhängigkeit
2 r
P
11 < p i . * P .1
Im Abschnitt 1 des Kapitels 1 wurde eine Vierfeldertafel für die
Beiipief.: Ereignisse
A = Länge einer Schraube außerhalb der Toleranz, Β = Querschnitt einer Schraube außerhalb der Toleranz betrachtet, die in Tab.
Tab.
4 nochmals dargestellt
4: Vierfeldertafel der absoluten Häufigkeiten der Ereignisse Α, Β und Ä, Β
ι
A
Ä
Β
60
118
178
Β
90
732
822
ι
150
850
1000
H
ist.
n
Wir haben bereits in Kapitel 1 vermutet, daß die Fehler in Länge und Querschnitt voneinander abhängig sind. Ob diese Abhängigkeit zum 1% Niveau sig2 nifikant i s t , wollen wir mittels χ - Unabhängigkeitstest prüfen. Es ergibt sich
x
2
(60 » 732 - 118 · 90)2 ° · 150 · 850 · 178 · 822 =
,nnn =100
1108890000 ' 18655290000
1flnn 1000
= 59.441 >6.635 = χ ξ . 0 - 9 9 = χ 2 ; 1 _ α
,
so daß sich also tatsächlich die Ereignisse Α und Β bzw. die Merkmale A "Qualität der Länge" mit den Ausprägungen Α und Ä und Β "Qualität des Querschnitts" mit den Ausprägungen Β und Β als signifikant abhängig erweisen^
|
144
Kap. 8: Tests
Es sei noch erwähnt, daß die erste Hypothese
Hq: p^ =
dieses Abschnitts,
die sich mit der Notation der 2x2 - Tafel auch in der Form
H
0:pi1
=
Pi2
für i=1,2
schreiben läßt, auch HomogzniXätAhypothuz
für die Vierfeldertafel
genannt
wird.
5. Der Vorzeichenrangtest nach Wilcoxon Beim VoizeÄ.ck&n>iang£ei£
nach
Wilcoxon
{WLtcoxon
- S-Lgned - Rank - Te.it)
werden
Hypothesen über das Symmetriezentrum einer Verteilung nichtparametrisch getestet. Stamrien die Beobachtungen
aus einer stetigen Verteilung
mit Verteilungsfunktion F, so wird geprüft, ob diese Verteilung
symmetrisch
um einen Wert ζ^ ist, d.h. ob für alle χ gilt F(?0-x) = 1-F(c0
+
x)
.
Dazu bilden wir zunächst die transformierten Größen X· = x i - ? 0
für i = 1
η
und vergeben ohne Berücksichtigung des Vorzeichens von x.· R1,...,Rn:
Ι
RangzahZen
Sind χ
( 1 )
Ι < | χ
( 2 ) Ι
0
145
Kap. 8: Tests
a p p r o x i m a t i v R e a l i s a t i o n a u s e i n e r S t a n d a r d n o r m a l V e r t e i l u n g , wenn d i e t e i l u n g um den Wert ζ ^ s y m m e t r i s c h
Falls
f ü r e i n e n Wert x ! = 0 g i l t ,
so w i r d d i e s e r b e i der Vergabe der
z a h l e n und s o m i t b e i d e r Bestimmung der Größe Τ n i c h t
U n t e r Verwendung d e r Größe Τ a l s
Ver-
ist.
Rang-
berücksichtigt.
P r ü f g r ö ß e w i r d dann d i e
Hypothese
Hg: F i s t s y m m e t r i s c h um ζρ
zum N i v e a u α v e r w o r f e n , |T|>u1.a/2
Die e i n s e i t i g e n
falls .
Hypothesen
h J : F i s t s y m m e t r i s c h um ζ < ζ ^
bzw.
2 HQ: F i s t s y m m e t r i s c h um ζ > ς^
werden e n t s p r e c h e n d zum N i v e a u α v e r w o r f e n , f a l l s
T > u
Be-cipizl:
bzw
1-a/2
I n Tab.
·
T < u
a/2
gilt
· von η = 25 PKW's e i n e s
Typs
und B a u j a h r s nach 5 J a h r e n a n g e g e b e n . A u f g r u n d des V o r z e i c h e n r a n g t e s t s
nach
Wilcoxon s o l l
die
5 sind die Kilometerleistungen
Hypothese
Hg: " D i e V e r t e i l u n g s f u n k t i o n
F der K i l o m e t e r l e i s t u n g
ist
symme-
t r i s c h um ζ 0 = 70000 km" zum 5% N i v e a u g e t e s t e t werden. Dazu s i n d i n d e r Tab. 5 auch b e r e i t s d i e
Grös-
sen = x i - 70000
,
d i e R a n g z a h l e n R^ s o w i e d i e v o r z e i c h e n b e h a f t e t e n R a n g z a h l e n R^ und d i e sen c.j m i t a n g e g e b e n .
Aus den Daten d e r Tab. 5 e r g i b t s i c h wegen
Grös-
146
Kap. S. Tests
Tab. 5: Kilometerleistungen x^ von η = 25 PKW's, transformierte Daten xi, Rangzahlen R^, vorzeichenbehaftete Rangzahlen R.. sowie Größen c^ für i=1
i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
x
i
*i
52700 63500 48600 97300 71000 62400 83500 79100 42000 105300 87200 38700 57900 53400 79000 87800 24600 53200 73100 86500 47000 29100 102400 112000 68100
+
25
25
-17300 -6500 -21400 27300 1000 -7600 13500 9100 -28000 35300 17200 -31300 -12100 -16600 9000 17800 -45400 -16800 3100 16500 -23000 -40900 32400 42000 -1900
R
i
14 4 16 18 1 5 9 7 19 22 13 20 8 11 6 15 25 12 3 10 17 23 21 24 2
S
C
1
-14 -4 -16 18 1 -5 9 7 -19 22 13 -20 -8 -11 6 15 -25 -12 3 10 -17 -23 21 24 -2
i
0 0 0 1 1 0 1 1 0 1 1 0 0 0 1 1 0 0 1 1 0 0 1 1 0
-
Τ = I ^ Λ - = 18+1 + 9 + 7 + 2 2 + 1 3 + 6 + 1 5 + 3 + 1 0 + 2 1 + 2 4 i=1 1 1 = 149 dann T
_
149 - 25 - 26 / 4
=
V25 - 26 - 51 / 24
-13.50
=
V13Ö1.2S
so daß wir die Hypothese H n nicht verwerfen können, da gilt |T| = 0.363 + 1 .96 = u 0
975
=Ul_a/2
.
Für den exakten Wilcoxon - Vorzeichenrangtest und den Fall, daß Bindungen auftreten (d.h. mehrere Werte xj..-.,χ^ sind betragsmäßig gleich) verweisen wir auf Härtung et al. (1986, Abschnitt 5 in Kap. IV).
147
Kap. 8: Tests
6. Der Wilcoxon-Rangsummentest, der U-Test von Mann-Whitney Sind
und x^^
x2n
unabhängige R e a l i s a t i o n e n aus
V e r t e i l u n g e n mit V e r t e i l u n g s f u n k t i o n F^ bzw. F 2 und s i n d d i e s e
stetigen
Verteilungen
v e r g l e i c h b a r i n dem S i n n e , daß s i c h d i e V e r t e i l u n g s f u n k t i o n e n F^ und F 2 nicht
schneiden,
Tut)
zum V e r g l e i c h der V e r t e i l u n g s f u n k t i o n e n F^ und F 2 >
so
dient
der
Uilaoxon
- Rangiurnmentes-t
(UiM.cox.on
Bei diesem n i c h t p a r a m e t r i s c h e n T e s t w i r d d i e z w e i s e i t i g e HQ: F , = F 2
gegen
- Rank
- Sum
-
Hypothese
H1: F1 \ ? z
zum Niveau α g e t e s t e t ; zudem s i n d e i n s e i t i g e T e s t s zum Niveau α von
π0.
J
tx)> Fgix)
für alle χ
F 1 ( x ) < F^Cx)
für alle χ
und F,|(x)< F ^ i x )
geaen
f ü r mindestens e i n χ
und von
F1(X) F 2 ( x )
für alle χ
und F ^ ( x ) > F g i x )
gegen
f ü r mindestens e i n χ
d u r c h f ü h r b a r . U n t e r s t e l l t man e i n sogenanntes additivu
lokeUlonimodM,
der U n t e r s c h i e d zwischen F 1 und F 2 b e s t e h t nur i n e i n e r
Lokationsverschie-
bung: F 1 ( x ) = F 2 ( x - Δ) so l ä ß t s i c h der T e s t HQ gegen H 1 s c h r e i b e n Hq: δ = 0
gegen
als
H1: Δ f 0
und d i e e i n s e i t i g e n T e s t s s i n d gerade gegeben durch
H
0: Δ < 0
gegen
η] : Δ > 0
2 Ηη: Δ > 0
gegen
2 Η.: Δ < 0
bzw.
d.h.
148
Kap. 8: Tests
Zur Durchführung des Wilcoxon - Rangsummentests werden nun zunächst den Daten
*11
"in,
'
X
x
21
2n 2
R
an?zahlen
R
H'"-'
R
l
n i
'
R
2T"-'R2n2
zu
"
geordnet. Und zwar erhält der kleinste a l l e r Beobachtungswerte den Rang 1, der zweitkleinste den Rang 2 , . . . , der größte den Rang n^ + n 2 · Treten Bindungen auf, d.h. sind mehrere der n^ + n 2 Beobachtungswerte g l e i c h , so werden sogenannte midnankA (nüXtleAe. Rangzahlm)
vergeben. Wir wollen
diesen Fall hier nicht behandeln und auch nur einen approximativen Test vors t e l l e n ; für den exakten Wilcoxon - Rangsummentest und für das Vorliegen von Bindungen sei hier verwiesen auf Härtung et a l . (1986, Abschnitt 1.2 in Kap. V I I I ) , wo auch die Äquivalenz von Wilcoxon - Rangsummentest und U von Mann - Wkütmy
verdeutlicht
Tut
wird.
Als Prüfgröße für den Wilcoxon - Rangsummentest kann bei genügend großen n^ und n 2 (etwa n j , n 2 > 2 0 ) die bei G ü l t i g k e i t von Hg approximativ einer Standardnormalverteilung entstammende Größe n1
l
R
, i - n , · (n 1 + n 2 + 1) / 2
y n 1 · n 2 · (n, + n 2 + 1) / 12 verwendet werden; hier bezeichnet ersten Stichprobe χ ^ , . , . , χ ^ verworfen, f a l l s m
> U
n1
Υ R,· die Summe der Ranqzahlen in der i=1 1 1
. Die Hypothese Hg wird dann zum Niveau α
gilt
1-a/2
. 1
2
und die e i n s e i t i g e n Hypothesen Hg bzw. Hg werden zum Niveau α verworfen, falls
gilt Τ > u.
ßzliplel:
bzw.
Τ< u
Um zu überprüfen, ob s i c h ein angeblich blutdrucksenkendes Medika-
ment s i g n i f i k a n t auf den Blutdruck auswirkt, werden in einer DoppelblindStudie n^ =25 Patienten mit dem Medikament und n 2 = 23 Patienten mit Placebo (Kontrolle) behandelt, wobei a l l e Patienten in der Altersgruppe von 4 0 - 4 5 Jahren unter Bluthochdruck leiden. In der Tab. b sind die Blutdruckdifferenzen vor Behandlung und 2 Stunden nach Medikamentengabe zusammengestellt; außerdem enthält die Tabelle noch die zugehörigen Rangzahlen R ^ bzw. R ^ .
Kap. 8: Tests
Tab. 6: Blutdruckdifferenzen x ^
bei n ^ = 2 5 Medikament - Patienten und n^ - 23
Placebo - Patienten sowie zugehörige Rangzahlen R ^
i
X
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
für j=1,2 und
25 (23)
R
1i
10 9 25 7 18 21 6 4 0 13 17 14 0 10 -0 13 20 12 18 5 3 10 8 17 17
5 6 3 0 1 2 5 2 8 7 1 5 0 2 7 2 6 4 0 6 2 7 8 6 3
1i
x
28 26 48 21 43 46 20 15 9 36 39 38 7 27 6 35 45 33 42 18 12 30 24 41 40
2 3 -0 4 7 12 0 14 9 -3 -5 12 4 2 19 -8 6 -10 21 12 8 5 10
rv>
i=1
149
2i 4 6 9 8 2 5 7 1 4 6 8 2 0 8 5 2 1 4 6 0 7 2 6
Ist das Medikament dem Placebo überlegen, so muß
10 13 5 16 22 34 8 37 25 4 3 32 14 11 44 2 19 1 47 31 23 17 29
F-(x) < F_(x)
für alle χ 1
und
F1(x) 1.6449 = u n Q C = u, 1 a °·95 '
die Hypothese h J verwerfen können, d.h. zum 5% Niveau ist das Medikament der Kontrolle bzgl. der blutdrucksenkenden Wirkung signifikant überlegen.
J
150
Kap. 8: Tests
7. D e r x 2 - A n p a s s u n g s t e s t Wir haben im Abschnitt 2 des Kapitels 6 den Q-Q-Plot als graphisches Verfahren zur Oberprüfung einer Verteilungsannahme kennengelernt. Diese Methode ο
l i e f e r t natürlich keine exakten Aussagen, wohingegen beim χ
-
Anpaiiung&teAt
zum Niveau α signifikante Abweichungen von einer vorgegebenen Verteilung f e s t g e s t e l l t werden können. Es wird also zum Niveau α die Hypothese Hg: "Die Daten
entstammen einer Grundgesamtheit mit vor-
gegebener Verteilung." gegen die Alternative H^: "Die Daten entstammen einer Grundgesamtheit mit anderer Verteilung." 2 getestet. Zu diesem Zweck wird beim χ - Anpassungstest (i)
die reelle x - A c h s e in k Intervalle
(ii)
die Anzahl 0. (0= "observed") der Realisationen unter den x 1 , . . . , x n gezählt, die in das i - t e Intervall
unterteilt;
fallen (für i = 1 , . . . , k ) ;
( i i i ) die Wahrscheinlichkeit P i = P(X e ^ ) für i = 1,... ,k bestimmt, mit der unter der Hypothese Hg eine Beobachtung in das i - t e Intervall (iv)
die erwartete Intervallhäufigkeit E i = η · p i für i = 1 , . . . , k
fällt;
(E="expec-
ted") berechnet. Dann i s t unter der Hypothese Hg die Prüfgröße
2 Realisation einer approximativ x k 1 - verteilten Zufallsvariablen und die Hypothese Hg wird verworfen, f a l l s g i l t X
2
>
2
*k-1;1-a
;
die Approximation i s t hinreichend genau, wenn höchstens 20% der Werte E 1 . . , E k kleiner als 5 und keiner der Werte E^
E k kleiner a l s 1 i s t
(Faustregel). Generell sind die Intervalle I.. natürlich so zu wählen, daß ρ. > 0 für i = 1 , . . . ,k g i l t .
151
Kap. 8: Tests
2 Der χ - Anpassungstest besitzt mitunter einen sehr großen Fehler 2. Art 8. so daß man bei der Interpretation eines Nichtverwerfens von HQ als Nachweis für das Vorliegen der in der Hypothese H Q spezifizierten Verteilung äußerst vorsichtig sein sollte. Be.-Upi.el: In der Tab. 7 sind die Lebensdauern von η = 20 Transistoren aus einer Produktion zusammengestellt.
Tab. 7: Lebensdauern χ.,.,.,χ,- von η = 2 0 Transistoren
j
χ. J
j
χ. J
j
χ. J
j
χ. J
1
1.37
6
2.17
11
3.76
16
5.76
2
1.42
7
2.85
12
3.97
17
6.13
3
1.68
8
2.93
13
4.51
18
6.18
4
1.92
9
3.24
14
4.86
19
7.29
5
2.13
10
3.46
15
5.32
20
8.30
2 Mittels χ -Anpassungstest soll nun zum 5% Niveau getestet werden, ob die Verteilung der Lebensdauer in der Produktion signifikant von einer Exponentialvertei1ung mit Parameter
abweicht. Dazu bilden wir zunächst drei Intervalle V ' -
0 0
· ^
1
'
l
Z=
(ζ
0.3 ' ζ 0.7 ]
·
Ι
3=(ξ0.7'")
·
wobei
V
" ÖT4"
1π(1
"
α)
ί 0.892
, für ο = 0 . 3
[ 3.010
, für α = 0.7
=
das α-Quantil der Εχ(0.4) - Verteilung bezeichnet. Im Intervall I^ = (-=>. 0.892] liegen 0 Beobachtungswerte, im Intervall I 2 = (0.892 , 3.010] liegen 8 Beobachtungswerte und im Intervall Ij = (3.010 , obachtungswerte, d.h. es ist
liegen 12 Be-
152
Kap. 8: Tests
0t = 0
,
02 = 8
und
03=12
·
Die erwarteten Anzahlen sind hingegen E 1 = η · p 1 = 20 · 0.3 = 6 E 2 = η · p 2 = 20 · 0.4 = 8 E 3 = η · p 3 = 20 · 0.3 = 6 so daß die Hypothese Hg einer Ex(0.4) - Verteilung der Lebensdauern wegen
X2= j =
ή-· ( 0 . - E . ) 2 =
36 0 36 T +S+T
(0-6)2+^· (8-8)2
+
^ · (12-6)2
2 2 12>5.991 = x 2 ; 0 > 9 5 = x k _ 1 ; 1 _ a
=
zum 5% Niveau verworfen werden muß, d.h. die Abweichungen von einer Ex(0.4) Verteilung sind zum 5% Niveau s i g n i f i k a n t .
|
Gibt man in der Hypothese Hg nur den Verteilungstyp an und schätzt die Parameter dieser Verteilung aus den Daten
, so i s t obiges Testver-
fahren natürlich nicht mehr anwendbar; man v g l . hierzu aber Härtung et a l . (1986, Kap. IV, Abschnitt 1).
8. Tests in allgemeinen r χ s-Kontingenztafeln Werden zwei Merkmale * und ü mit r bzw. s möglichen Ausprägungen A j , . . . , A r bzw. B ^ , . . . , B S jeweils an insgesamt η Objekten beobachtet, so kann man die Versuchsergebnisse übersichtlich in Form einer 1*4 -
der ab-
Kon£inge.nzta(,e.t
soluten Häufigkeiten darstellen, die mit W
= ni.
'
W
= n.j
und
H
n(AinBj)
= n
ij
die in Tab. i angegebene Gestalt hat. Zu dieser Tafel der absoluten Häufigkeiten resp. der Tafel der relativen Häufigkeiten mit hn(Ai) = n
i.
/ n
'
h n ( B j ) = n _ j / n und
hp(Ai η Β.) =
ni
• /η
korrespondiert nun natürlich wie im F a l l der V i e r f e l d e r t a f e l , vgl. Ab-
153
Kap. 8: Tests
Tab.
S:
r * s - Tafel prägungen
B
X N. A
n
1
d e r a b s o l u t e n H ä u f i g k e i t e n f ü r zwei Merkmale X m i t und l i m i t A u s p r ä g u n g e n
B2
1
..
11
n
22
* •
* •
12
A2
n
21
n
A
n
rl
n
r2
*
n
.l
n
.2
* •
r
I
B
• n
s n
l.
2s
n
2.
rs
n
r.
1s
n
η
n
η
.s
s c h n i t t 4, eine Tafel
der t h e o r e t i s c h e n W a h r s c h e i n l i c h k e i t e n
p r ä g u n g e n von X und 8
. v g l . Tab.
Tab.
χ
B
A
B2
1
.
B
-
11
P
12
· •
p
1s
p
l.
A2
P
21
p
22
* •
p
2s
p
2.
A
P
r1
p
r2
* •
p
rs
p
r.
p
.1
P.2
*
p
.s
r
l
•
für die
Ausprä-
1
Möchte man nun p r ü f e n , ob d i e Merkmale X und y v o n e i n a n d e r u n a b h ä n g i g d.h. will
(UnabhängigkexXihypothe.6e),
H
0:
p
ij
= p
i."
p
.j
Aus-
I
s
P
1
f ü r die
9.
9: r * s - T a f e l d e r t h e o r e t i s c h e n W a h r s c h e i n l i c h k e i t e n gungen z w e i e r Merkmale X und H
X
Aus-
man
(für alle
i,j)
gegen
sind
154
Kap. 8: Tests
Η": P-jj ^ P-j * P j
für mindestens ein Paar ( i , j )
zum Niveau α testen, so kann man die unter der Hypothese HQ der Unabhängigkeit approximativ χ^ - verteilte
(mit ( r - 1 ) ( s - 1 ) Freiheitsgraden) Prüf-
größe mit der Realisation
V'ij
η
j
verwenden. Die Hypothese H^! wird zum Niveau α verworfen, f a l l s g i l t : x
2
x
2
(r-1)(s-1);1-a
Mit dem selben Testverfahren läßt sich auch die H
0:
Η :
ί
p
ij
= p
i'j
P-ii^P-i'i
Homoginltätihypothiiz
9e9en mindestens ein i =}= ϊ ' und ein j
prüfen, die gerade besagt, daß die Zeilen der Kontingenztafel in Tab. 9 gleich sind, d.h. daß die Verteilung der zum Merkmal y gehörigen Z u f a l l s variablen unabhängig von der zugrundegelegten Ausprägung des Merkmals X i s t . Insbesondere läßt sich mittels des hier vorgestellten Testverfahrens natürl i c h die
GLeXiMizit
de*
VeJutzilungtn
gungen des Zeilenmerkmals X") und die
mehrerer Zufallsvariablen ("AuspräUnabhSngigki-üt
zweier Zufallsvariablen
prüfen, vgl. auch Abschnitt 4; im Falle stetiger Zufallsvariablen müssen diese dann natürlich d i s k r e t i s i e r t , d.h. die Ausprägungen in Klassen einget e i l t werden. BeXiplet: Um zu überprüfen, ob sich die Verteilungen der Zufallsvariablen "Bierpreis" in vier Regionen zum 5% Niveau signifikant unterscheiden, wurde der Preis für 0.3 i Bier in jeweils einigen Lokalen jeder Region ermittelt. Insgesamt schwankte der Preis zwischen 1.50 DM und 3.80 DM. In der Preisklasse 1 "bis 2 DM" fanden sich in den Regionen 3, 12, 5 bzw. 3 Lokale, in der Preisklasse 2 "zwischen 2 DM und 3 DM" gerade 8, 6, 14 bzw. 10 Lokale und in der Preisklasse 3 "3 DM und mehr" 15, 2, 7 bzw. 5 Lokale. Diese Ergebnisse sind in Tab. 10 in Form einer 4 * 3 - Kontingenztafel zusammengestellt.
Kap. 8: Tests
155
Tab. 1ΰ: 4»3 - Kontingenztafel der B i e r p r e i s e in v i e r Regionen
^\Preis
1
2
3
l
RegiorN^ 1
3
8
15
26
2
12
6
2
20
3
5
14
7
26
4
3
10
5
18
I
23
38
29
90
Wir prüfen nun zum 5% Niveau die Homogenitätshypothese
H
0:
p
1j
= p
2j
=
P3j
= p
4j
=
·
die gerade besagt, daß die Verteilung der Z u f a l l s v a r i a b l e n " B i e r p r e i s " 2
in
den v i e r Regionen g l e i c h i s t , m i t t e l s χ - T e s t . Es e r g i b t s i c h 4
0
3
„
90 (. " 26 - 23 ' V *
90
/
η,·
n
,·\2
26 · 23\2 . 90 (a 90 ) 26 · 3δ Λ ft
26 · 38\2 ΨΓ~) +
—
"·
18 · 29~\2 90 )
=23.989 und die Hyothese der Gleichheit der Verteilungen wird zum 5% Niveau verworfen, d.h. die Verteilung des B i e r p r e i s e s in den Regionen i s t s i g n i f i k a n t zum S% Niveau verschieden, da g i l t χ 2 = 23.989 > 12.59 = Xg.g.gs = X ( r - i ) ( s - 1 ) ; 1 - a
·
B z g l . weiterer Verfahren in r * s - Kontingenztafeln sei verwiesen auf Härtung et a l . (1986, Kap. V I I ) .
J
156
Kap. 8: Tests
ÜBUNGSAUFGABEN ZU KAPITEL 8
Aufgabe 8.1: Prüfen Sie ausgehend von den Daten der Tab. 2 in Kapitel 7 (Aufgabe 7.1), ob zum 5% Niveau signifikante Abweichungen a) der erwarteten Zerstörungszugkraft von 28 kp, ρ b) der Varianz der Zerstörungszugkraft von 4 (kp) feststellbar sind.
Aufgabe 8.2: Zur Untersuchung der Ertragsunterschiede von zwei Getreidestämmen wird der Ertrag beider Stämme auf je 12 gleichgroßen Parzellen ermittelt, vgl. Tab.
11.
Tab.
11:
Erträge x ^
und x,^
für i=1,...,12 von zwei Getreidestämmen in kg
auf je 12 Parzellen
i
X
1 2 3 4 5 6 7 8 9 10 11 12
23 25 27 26 22 26 25 22 27 28 26 21
x
1i 4 8 2
0 1 7 5 6 8
1 5 4
2i
27.3 25.9 28.4 26.2 29.7 25.0 24.3 29.6 28.2 26.4 27.0 29.1
a) Prüfen Sie unter der Annahme normal verteilter Erträge mit gleicher Varianz für beide Stämme, ob Sorte 2 zum 5% Niveau im Mittel signifikant höhere Erträge als Sorte 1 bringt. b) Gehen Sie der Fragestellung aus a) nach, wobei Sie jetzt jedoch keine
Kap. 8: Tests
157
Normalverteilung unterstellen. c) Sind die Abweichungen von der Annahme identischer Varianzen in a) zum 5% Niveau signifikant? d) Prüfen Sie, ob der Ertrag pro Parzelle bei Sorte 1 symmetrisch um den Wert 25 verteilt ist; wählen Sie hierzu das Niveau von 5%, und führen Sie einen nichtparametrischen Test durch.
Aufgabe 8.5: Ein Betrieb fertigt eines seiner Produkte an zwei Standorten Α und ß. In der Endkontrolle werden die Produkte in zwei Güteklassen I und II eingeteilt. Eine Stichprobenerhebung mit 500 Produkten pro Standort ergab bei einem Anteil von 30% in Güteklasse I, daß 40% der Produkte dieser Güteklasse am Standort Α gefertigt wurden. a) Prüfen Sie, ob der Anteil der Produkte in Güteklasse I am Standort Α zum 5% Niveau signifikant kleiner als 30% ist. b) Ist der Zusammenhang zwischen Produktionsgüte und Standort signifikant zum 5% Niveau, und welche Interpretation hat die Schlußfolgerung, wenn Sie die Ergebnisse der Endkontrolle an den Standorten als unabhängige Meßreihen auffassen?
Aufgabe 8.4: Rutherford und Geiger beobachteten in 2608 Zeitintervallen von je 1/8 min insgesamt 10094 Szintillationen eines Poloniumpräparates. Die Anzahl n^· der Zeitintervalle mit genau j Szintillationen (wobei j = 0 bis j = 12 vorkommt) geht aus der Tab. 12 hervor.
Tab. 12: Anzahl n^· der Zeitintervalle mit genau j Szintillationen eines Pol on i umpräparates
j n
j
0
1
2
3
4
5
6
7
8
9
10
57
203
383
525
532
408
273
139
45
27
10
11
12 4
2
158
Kap. 8: Tests
Benutzen Sie die
Intervalleinteilung
Ι,Μ-,0.5]
,
I 2 = (0.5,2.5]
,
I 3 = (2.5,4.5]
I 4 = (4.5,6.5]
,
I 5 = (6.5,9.5]
,
I g = (9.5, - )
,
und testen S i e , ob zum 1% Niveau s i g n i f i k a n t e Abweichungen von einer Poissonverteilung mit Parameter λ = 3 . 9 vorliegen.
Aufgabe
8.5:
In einer Untersuchung wurde bei n = 150 Personen die mittlere Oberfläche der Erythrozyten ermittelt. In der Tab. 13 sind die Ergebnisse in Form einer 2 * 3 - Kontingenztafel zusammengestellt, wobei a l s Zeilenmerkmal X das Geschlecht der Personen und a l s Spaltenmerkmal y die mittlere Oberfläche der Erythrozyten, die natürlich e i g e n t l i c h ein stetiges Merkmal i s t , e i n g e t e i l t in die drei Klassen 1 ( < 9 5 · 10~ 6 mm2), 2 (zwischen 95 und 105· 10~6 mm2) und 3 ( > 105 · 10~6 mm2) sind.
Tab. 13: 2«3 - Kontingenztafel der Merkmale X "Geschlecht" und y "mittlere Oberfläche der Erythrozyten" in 3 Klassen bei n=150 Personen
8
1
2
weibl.
38
männl.
5
1
43
X
3
I
29
6
73
31
41
77
60
47
150
Welche Aussagen können S i e , abgesichert zum \% Niveau, aufgrund dieser Daten treffen?
Kapitel 9: Regressions- und Korrelationsrechnung
Regressions- und Korrelationsrechnung dienen der Untersuchung des Zusammenhangs zwischen Merkmalen. Bei der Regneniomiechnung
wird ein funktiona-
l e r Zusammenhang zwischen den Merkmalen h e r g e s t e l l t und bestimmt, wohingegen bei der KoiAeiatxamiechnung
die Stärke des (linearen) Zusammenhangs unter-
sucht wird.
1. Einfache Regressions- und Konelationsrechnung Untersucht man den (linearen) Zusammenhang zweier Merkmale X und II, so spricht man von einfachem
RegleiAioni-
Sind χ und i) die AuiplägungivaJiiable.n Regressionsrechnung der funktionale.
und
KolAelationiAechnung.
der Merkmale X und U, so wird bei der Zusammenhang
U = ß 0 + ß, · χ untersucht. Die Ausprägungsvariable υ des sogenannten R e g A e a a n d e n y wird l i n e a r , vermittels einer Geradengleichung mit Absolutglied ßg und Steigungsparameter β^ durch die Ausprägunnsvariable χ des R e g i e a o / u , X e r k l ä r t ; man spricht dann auch von einer tineaAzn
Hegie6ilon
von U auf X. Die Parameter
ßjj und ß^ der Geradengleichung sind dabei unbekannt und müssen aufgrund von Beobachtungspaaren (x^
) , . . . , ( x n , y n ) , η^>3 , für die Ausprägungen der
Merkmale χ und y an η Objekten aus einer interessierenden Grundgesamtheit geschätzt werden. In der Korrelationsrechnung wird die Stänke. de& LLneanm schen den Merkmalen X und (1 aufgrund der Daten ( x ^ y ^ ) und untersucht.
ZuAatmenhangi
zwi-
( x n > y n ) geschätzt
160
1.1
Kap. 9: Regression und Korrelation
L I N E A R E DER
R E G R E S S I O N
K L E I N S T E N
Sind
UND
D I E
M E T H O D E
Q U A D R A T E
Realisationen von dem Merkmal J) zugeordneten Z u f a l l s v a r i a b l e n und s i n d
χ
( f e h l e r f r e i ) erhobene bzw. gemessene Werte zum
Merkmal X, so können die Parameter ßg und ß^ der Geradengleichung a = ß0 + ausgehend von der Μ o d e l Z g l z i c h u n g Yi = ßQ+ ß1xi + e i
für
i=1,...,n
wobei e ^ , . . . , e n unabhängige, i d e n t i s c h v e r t e i l t e Z u f a l l s v a r i a b l e n mit E r wartungswert
E(e^) = 0
und Varianz
Var(e.) = a 2
für i = 1 , . . . , n s i n d , ge-
schätzt werden. B e i d e r Methode
duA
kltivuten
werden d i e S c h ä t z u n g e n bg und b^
Ouad/iate
fur
die Parameter ßg und ß^ derart bestimmt, daß die Summe der quadratischen Abweichungen zwischen y^ und y.j = bQ + b 1 x i
für i = 1 , . . . ,n
minimal wird, d.h. man minimiert
S2(bg,b1)= ^
(y.-bg-b^)
2
über a l l e möglichen Zahlen bg, b^ und verwendet diejenigen Werte bg und b^, die den Minimalwert l i e f e r n , a l s KleXrutz Squanzi
- Quadrate. - Schätze*
f ü r d i e P a r a m e t e r ß Q und
EitvnaXoAi)
[Leait-
ß^.
Die Größen e, = y i - y-j =yj - bg - b 1 x i
für
i=1,...,η
die ja gerade Schätzungen f ü r die sogenannten FuhlziteAmz nennt man auch Rzildum
s2=
Ϊ
i=1
{ y 1
und bezeichnet
r
y /
1
sind,
Kap. 9: Regression und Korrelation
als RiildaaJL -
161
QuadfiaXiimw. 2
-
Bei der Minimierung von S ( b ^ )
geht man nun konkret so vor, daß man die
p a r t i e l l e n Ableitungen
as2(bn ,B1) 0
0
--2
3S2(bn,b.) — Σ 3b^
η
_
Σ
1 =1
η 1=1
_
( y j - V W
xi
·
(y
·
_ _ i - b0 " b 1 x i }
b i l d e t , und dann die Schätzungen bg und b^ für ßg und ß^ aus den sogenannten NoimaZingteichange.n
"2 J t
(y
-2 ^
i " b0 "
b
lXi}
=
°
v ' f r V V i »
5
0
e r m i t t e l t ; hierbei ergibt sich mit den arithmetischen Mitteln
-
1 5
- ι 5
dann η
Σ
(xi - x)(yi - y ) —
Σ (x-i i =1 1
und
!>„ = * - l y
x)2
Die geschätzte Geradengleichung, d.h. die Kigiza^omgiiade. in den Ausprägungsvariablen von X und ij i s t dann natürlich M = b0 + b l X und
162
Kap. 9: Regression und Korrelation
i s t eine Schätzung für die Varianz σ
2
der Fehlerterme e^
en-
Will man zu einem vorgegebenen Wert, an einer festen S t e l l e x = x * die Ausprägung von S vorhersagen, so verwendet man nun n a t ü r l i c h die P^ognoie y* = b o
+ b
ix*
·
U n t e r s t e l l t man z u s ä t z l i c h , daß die Fehlerterme s i n d , und damit, daß y j , . . . , y
normal v e r t e i l t
Realisationen normal v e r t e i l t e r
riablen s i n d , so kann man auch ein PiognoiiUnteAvcM
mit
lickkeAJt 1 - a iüA a = y * an einer Stelle x = x * angeben; dieses
.1
y*
+ s
(xri)
· t nn-2 - o .;1-α/2 i..^ ·
Zufallsva-
TAe.üiiwahi6che.lnIntervall
2
( χ * - χ)2
/1+7η Γ+ /
η
,
Σ überdeckt eine zukünftige Realisation a = y * an einer festen S t e l l e x = x* mit der Wahrscheinlichkeit 1 - α. Berechnet man an jeder S t e l l e x = x* ein solches Prognoseintervall, so kann man einen sogenannten PAogno6eitA.e-i^en um die Regressionsgerade legen, der an der S t e l l e χ = χ am schmälsten i s t und immer breiter wird, je mehr man s i c h mit dem Wert χ = χ * von χ entfernt. Die Breite des Prognosestreifens wird durch die Gate deA t i m c u z n Reg-tealon bestimmt. Die lineare Regression i s t n a t ü r l i c h umso besser, je kleiner die 2
Residual - Quadratsumme S
i s t . Als normiertes Maß für diese Güte verwendet
man auch das sogenannte BtitimmtheUXimaß
R-1 D- 1
s
2
η 1 (yry) 1 i=1
0 2
. - 1
der linearen Regression
ϊ ( y i - ? / 1 1 i=1 η , I (yry)2 1 i=1
5 i=1 - — η I i=1
(?i-y)2 1
(yry) 1
η
2
S
s2 Y
—χ s
ί,
,
y
das stets Werte zwischen Null und Eins annimmt und den Anteil der empiri2 sehen Varianz Sy des Merkmals y angibt, der durch die Regression e r k l ä r t wird. Natürlich i s t die Regression umso besser, je größer das Bestimmtheitsmaß Β i s t . Es sei noch erwähnt, daß s i c h das Bestimmtheitsmaß Β auch unter Verwendung des Steigungsparameters bj der Regressionsgeraden bestimmen l ä ß t :
Kap. 9: Regression und Korrelation
I n
•
-
χ
)
163
?
%HAj>plnl·. Um die Parameter der linearen Regression vom Verkaufspreis ü auf den Einkaufspreis * in einer Branche zu schätzen, wurden die Einkaufspreise x.j und Verkaufspreise y^ von η = 1 5 Produkten erhoben, v g l . Tab.
1. In d i e -
ser Tabelle sind auch bereits die aus der Regressionsrechnung resultierenden Größen y^ und e^ angegeben.
Tab.
1: Einkaufspreise x i , Verkaufspreise y^, Schätzungen y^ und Residuen e^ für i = 1 , . . . ,15
i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
xi
30 25 15 35 17 10 21 28 32 18 23 16 19 32 29
y
5 4 7 6 2 8 0 3 5 7 9 1 5 8 0
i
55 50 30 68 35 19 42 53 63 36 45 35 38 65 57
7 9 0 5 0 6 3 5 0 0 2 0 5 0 5
59 49 31 68 33 21 41 54 62 36 46 31 38 63 56
03695 40254 07827 67136 91192 82168 09050 88093 81515 74557 56889 83391 25685 38188 20330
-3 1 -1 -0 1 -2 1 -1 0 -0 -1 3 0 1 1
33695 49746 07827 17136 08808 22168 20950 38093 18485 74557 36889 16609 24315 61812 29670
Mit 1 * = TT 13
15
l
i=1
x
-j1 = 23.8
und
1 y = IS ^
15
J
i=1
y1. =46.38
ergeben s i c h die Schätzer bp, b^ für die Parameter der linearen Beziehung B = ß 0 + ß,x zwischen Verkaufs- und Einkaufspreis nach der Methode der kleinsten Quadrate zu
164
Kap. 9: Regression und Korrelation
15 I (x.· - x X y . - y) h -1'1.. b 1 Γ5 :
bQ=y-b1x
1474 41 . , ooqi 780.48 " 1 · 8 8 9 1
und und
= 4 6 . 3 8 - 1.8891 - 23.8 - 1.4194
d.h. es ist a = 1.4194+ 1.8891 · X
und
y. = 1.4194 + 1.8891 · für i=1
15
Der Verkaufspreis ist also in dieser Branche etwa das 1 . 9 - f a c h e des Einkaufspreises zuzüglich 1.4. In der Tab. 1 sind die Größen y^ sowie die Residuen e.j = y i - y i
für i=1,...,15
bereits mitangegeben. Aus den Residuen berechnet sich die Residualquadratsumme zu
S
, 1 5 , 15 = I (y,- - y-,-) = Σ 1 1 i=1 i=1
, ef - 40.9062 2
und somit erhält man als Schätzer für die Varianz σ e ^ . . d e n
der Fehlerterme
Wert
s ^ ^ ^ - S
2
= y j · 40.9062 = 3.1466
In der Abb. 7 sind die Beobachtungspaare (x^,y·), die geschätzte Regressionsgerade sowie der Prognosestreifen mit 95% Trefferwahrscheinlichkeit eingezeichnet. Letzterer ergibt sich aus den Prognoseintervallen mit Trefferwahrscheinlichkeit 95%, die an einer Stelle x = x die Grenzen
1.4194+1.8891 · χ ΐ 1.7739 . t 1 3 ; 0 ^
·/
= 1.4194+ 1.8891 · x + 1 .7739 - 2.160 · J
1+^
+
^ m f /
1+
+ &7"8^4g)2
besitzen und die für einige Werte χ = χ in Tab. 1 zusammengestellt sind.
165
Kap. 9: Regression und Korrelation
50-
10
10 Abb.
15
20
1: Streudiagramm der Werte ( x ^ )
25 für i = 1
30
35
χ
15 , Regressionsgerade
8 = 1.4194 + 1.8 91 · χ sowie 95% - Prognosestreifen
Wir wollen nun noch die Güte der linearen Regression prüfen und berechnen zu diesem Zweck ihr Bestimmtheitsmaß:
B - 1 - T Ü -
5
Γ • ' - ^ T T O T
- '-0.0145.0.9855
d.h. 98.55% der Varianz des Verkaufspreises werden durch den Einkaufspreis (linear) erklärt.
166
Tab.
Kap. 9: Regression und Korrelation
2: Grenzen der Prognoseintervalle mit 95% Trefferwahrscheinlichkeit für den Verkaufspreis an einigen S t e l l e n x = x
X
u n t e r e Grenze
10 12 14 16 18 20 22 χ = 23.8 24 26 28 30 32 34 36
1.2
15 19 23 27 31 35 39 42 42 46 50 54 57 61 65
E I N F A C H E
obere Grenze
924 813 687 546 387 210 015 423 800 567 315 045 757 452 131
24 28 32 35 39 43 46 50 50 54 58 62 65 69 73
697 364 046 744 460 193 945 337 715 505 313 140 985 846 723
K O R R E L A T I O N S R E C H N U N G
Die KoineJLaXÄjün Corr(X,Y)=PXY=
^ ( M L y/Var(X) · Var(Y)
beschreibt die Stärke des LinejViw
Ziuanme.nh.Mgi zwischen zwei Merkmalen X
und U bzw. den zugehörigen Z u f a l l s v a r i a b l e n X und Y mit positiven Varianzen; v g l . auch Abschnitt 4 in Kap. 4. Die Korrelation p^y l i e g t stets zwischen - 1 und +1, nimmt bei totalem negativ linearen Zusammenhang den Wert - 1 , bei totalem p o s i t i v linearen Zusammenhang den Wert +1 an. Besteht kein ( l i n e a r e r ) Zusammenhang zwischen X und Y, so i s t ρ χ γ = 0 (man sagt auch, X und Y sind unkoiA&tieAt)
und die Z u f a l l s v a r i a b l e n X und Y sind dann auch (stocha-
s t i s c h ) unabhängig, wenn X und Y normal v e r t e i l t sind. Die Korrelation ρ χ γ kann aufgrund von η Beobachtungstupeln ( x p , y n ) für ( X , Y ) , die an η Objekten aus einer interessierenden Gesamtheit gemessen oder erhoben wurden, durch den KoiAeZaXÄ.omkoe.iii.z^enten
167
Kap. 9: Regression und Korrelation
η l (χ.·-χ) · (y k + 2. Unterstellt man, daß y p . . . , y
Realisationen von unabhängigen Zufallsvari-
ablen Y^,...,Y n zum Merkmal 'J sind und daß die Regressorenwerte χ^,.,.,χ^· für i=1,...,n fehlerfrei gemessen bzw. erhoben sind, so kann man ausgehend von der Model 1 gleichung W wobei
ß
1
x
1 i
+
••• + 6 k x k i + e i
für
1=1
n
·
unabhängige, identisch verteilte Fehlerterme mit Erwartungs2 sind, die Vcuumitvi ßp.ßj,• · · >ßk nach der Methode der
wert 0 und Varianz σ Varia kleinsten Quadrate Die Klzinitz
ichätzen.
- Qua.dh.atz - Schätze.*.
bg,bj,...,b k sind gerade diejenigen, welche
die Summe der quadratischen Abweichungen
S 2 (b 0 ,b 1 ,...,b k ) = j
i
(y1-EI0-b1x11-...-bkxki)Z
bezüglich bg,bj,...,b k minimieren. Wie im Fall der einfachen Regression sind die Lösungen bg,b.|,... ,bk des Minimierungsproblems gerade diejenigen, die das NoA.malzngleA.chungayite.m des Systems
lösen: b^,...,b k ergeben sich als Koeffizienten
173
Kap. 9: Regression und Korrelation
b
1
S
%
b
1
S P
X
b
i
s
V i
t b
2 X l
+ b
+ b
S P
Z
2
2
*
S
S
s
V
1
x +
2
-
+ b
k
s
- - -
+ b
k
S
+
2
' "
+
+ b k S
V k V
k
%
=
S
V
=
S
V
= S P
¥'
und bp a l s S c h ä t z e r f ü r 0g i s t g e r a d e gegeben a l s
b
Hier
o
=
y
_ b
i * i - •·• - V k
·
bezeichnen 1 y =„
? I
y,·
-
.
x
1 ν j = n ,Σ
f ü r j = 1,...,k
d i e M i t t e l w e r t e d e r Beobachtungen zu einem Merkmal, η sQv
*j
=
l
i=1
?
( x - j i - X-:) 31
f ü r j=1
J
k
d i e Summe d e r q u a d r a t i s c h e n A b w e i c h u n g e n d e r B e o b a c h t u n g e n χ ^ , . . . , χ · Mittelwert
η
vom
χ^,
S P
* A
^
r
= S
V j * J l
(XJ1
"*J
) ( X
Ai"*Ä
fUr
)
j,i=1,...,k,jH
und
^
f U r
J=1
k
d i e Summe d e r P r o d u k t e d e r A b w e i c h u n g e n v o n x ^ . und x ^ · b z w . y^ vom j e w e i l i g e n M i t t e l w e r t Uber a l l e
i=1,...,n.
Man n e n n t
S2 = S 2 ( b 0 , b r . . . , b k )
= ^
(yi-b
0
-blx
1 i
-...-b
k
x
k i
)
2
174
Kap. 9: Regression und
Korrelation
η
-
η
• ά auch die
-
Λ *
Ru-idual
hier i s t
- QuacUcutiumm;
= b 0 + b 1 x 1i +
···
+ b k x ki
fUr
1=1
n
eine Schätzung für die Realisationen von Y.. und ^ =y i - y i
für i=1,...,n
eine Schätzung für die Fehler e . , die man auch die.
V p Regressoren be-
r e i t s zur Erklärung von H ausreicht (bzw. ob q = k - p Regressoren überflüssig sind). Unterstellt man, daß die Fehlerterme e j , . . . , e
des Modells v e r t e i l t sind ge-
mäß einer Ν(Ο,σ^) - Verteilung, so kann die Hypothese HQ: X ^ j , . . . , X j p j reichen zur Erklärung von ij aus gegen die Alternative H^:
*(p) reichen nicht zur Erklärung von »J aus
mittels F - Test zum Niveau α geprüft werden. Als T e s t s t a t i s t i k dieses R e d u k t i o n i t e s t i verwendet man eine normierte Differenz der Res idual " Quadratsumroen S ß
W
i
x
i i
+
2
und
••• + ß k x k i + e i
2
^ fUr
Ausgangsmodell i=
i.····"
und im reduzierten Modell V
ß
(0)
+ B
( 1 ) x ( 1 ) i + ••• + ß ( p ) x ( p ) i + e i
für i =1 ,.. ,n
,
Kap. 9: Regression und Korrelation
176
nämlich
(p)
(k - p) · S B
(k-p)-s2
a,(x1,....xk)-By,(x(
χ(ρ))
1 )
( k - p) · s 2
η i=1
2
1
und verwirft die Hypothese Hq zum Niveau α , falls gilt F>F
k-p,n-k-1;1-a
'
Man sagt dann auch: Bei alleiniger Berücksichtigung der Regressoren * ( 1 ) ' ···»*(p) tritt ein zum Niveau α signifikanter Erklärungsverlust gegenüber dem Ausgangsmodell ein. Kann die Hypothese Hq nicht verworfen werden, so besagt dies in der Regel allerdings nicht, daß die im reduzierten Modell vernachlässigten Regressoren keinen Einfluß auf das Regressanden - Merkmal 11 haben, sondern eben nur, daß sie keinen (wesentlichen) zusätzlichen
Beitrag
zur Erklärung von y leisten.
8eAApiel:
Um den Einfluß von Strahlstärke
Spritztemperatur X^ auf die Porosität zu untersuchen, wurde 'X1i'x2i'x3i^
Tab.
FSD
2.083= FSD0t05
und
|y2."
,
? 3 . l = 2 . 3 > 2.083= FSD0-(j5
gilt
d . h . d i e D i ä t 3 u n t e r s c h e i d e t s i c h s i g n i f i k a n t zum 5% N i v e a u von den D i ä t e n 2 und 4 .
2. Das Blockexperiment - zweifache Varianzanalyse Beim e-in^acfren ΒZcckcxpeA 1 O b j e k t e zu j e d e r d e r r · s S t u f e n k o m b i n a t i o n e n d e r F a k t o r e n Α und Β g e hören. Wir u n t e r s t e l l e n w i e d e r u m , daß d i e Daten y ^ ^ f ü r i = 1 , . . . , r k=1,...,t
, j=1
s und
, d i e gerade d i e Beobachtungen am k - t e n O b j e k t a u f d e r i - t e n S t u f e
des F a k t o r s Α und d e r j - t e n S t u f e des F a k t o r s 8 d a r s t e l l e n ,
Realisationen
von η Z u f a l l s v a r i a b l e n Y
ijk^ij
+
= M + ai mit
e
ijk + ßj +
r V α· = 0 i=1 1
eijk und
für i =1 , . . . . r s l
j ==11
ß, = ο J
, j = 1 , . . . ,s , k = 1 , . . . , t
Kap. 10: Varianzamlyse sind,
wobei der Erwartungswert
Ε(Y - - . ) = μ - ιJΚ
z e r l e g t werden kann i n e i n
1J
Gesamtmittel μ, einen A n t e i l α. der i - t e n Stufe des Faktors Α sowie einen A n t e i l ß. der j - t e n Stufe des Faktors ß und wobei e · , , % N(0 ,σ2 ) unabhängige, J
'J κ
normal v e r t e i l t e Reste bezeichnen. Somit sind also die Zufallsvariablen Y..^ unabhängig und normal v e r t e i l t m i t Var(Y, .. ) = σ 2 . Eine 1j κ w-cAfeung zwischen den Stufen der Faktoren Α und Β w i r d also ausgeschlossen.
lntiA.a.ktion, Wuchitt.-
Die Gesamtstreuung der Daten r s t SSG= [ l l (yiik-y )2 1JK i=1 j=1 k=1 '·· w i r d nun z e r l e g t i n den Streuungsanteil
SSA = s t
l (y . 1 i =1
) 2 = st · ( { y ] - r · y2 M=1 1 · ·
-y
\
J '
der auf den Faktor Α zurückzuführen i s t , i n den Streuungsanteil
SSB = r t
f
(y
j =1
i
)2 = r t · ( {
-y
-J.
···
\j
y2.
- s · y2
-J.
=1
)
,
•••)
der auf den S t ö r f a k t o r 8 zurückzuführen i s t , und i n einen Rest r
s
SSE = 1
t
?
ι
ι
( y . ^ - y , 1JK
II ül-
i Ji Kk 1
-J
·
für
II
y
,
i-
r t I Σ i=1 k=l
1-
t-
s t I j =1
II
i = 1 j = 1 k=1 Hier bezeichnen
- y
+y
)
= s s g - s s a - ssb
.
·
.. , r
j = 1 , . . · ,s
d i e S t u f e n m i t t e l zu den Faktoren Α und Β bzw. das Gesamtmittel der Daten und ^i.."^...
f
ür i=1,...,r
bzw.
y . -y
für j = 1
s
können als geschätzte d i f f e r e n t i e l l e E f f e k t e der Stufen des Faktors Α bzw. B, d . h . a l s Schätzer f ü r o^ bzw. ß. i n t e r p r e t i e r t werden; y
ist
natürlich
194
Kap. 10: Varianzanalyse
ein Schätzer für μ. Mit der analogen Zerlegung der η - 1 Gesamtfreiheitsgrade in r - 1 Freiheitsgrade für den Faktor A, s - 1 Freiheitsgrade für den Faktor Β und n - 1 - ( r - 1 ) - ( s - 1 ) = n - r - s + 1 Restfreiheitsgrade ergibt sich die in Tab. 4 angegebene Varianzanalysetafel des einfachen Blockexperimentes. Die Hypothese Hg: Der Faktor Α hat keinen Einfluß auf
(d.h. a 1 = ... = a = 0 )
wird also zum Niveau κ verworfen, f a l l s F
-msa>F
und die Hypothese Η®: Der Blockfaktor Β hat keinen Einfluß auf !1 (d.h. ß1 = ... = ß =0) wird zum Niveau κ verworfen, wenn g i l t F
-MSB>F
Β Α
s-1 ,n-r-s+1 ;1-κ
'
Β
Wird HQ bzw. Hg zum Niveau κ verworfen, so kann man mittels muJUULpliK Vviglelcht
nach Schede noch untersuchen, ob es ein Paar von Stufen des Fak-
tors Α bzw. Β gibt, das zu diesem Niveau signifikant verschieden i s t . Die i - t e und i ' - t e Stufe ( i , i ' = 1 , . . . ,r , i ^ i 1 ) des Faktors A, d.h. a i und cu , sind s i g n i f i k a n t verschieden zum Niveau κ, f a l l s und die j - t e und j ' - t e Stufe ( j ,j ' = 1 , . . . ,s , j ^ j ' ) des Blockfaktors 8, d.h. ßj und ßj, sind signifikant verschieden zum Niveau κ, f a l l s |y.j.-y.j'J>FSDK=
\ A S " ^ " F s - 1 ,n-r-s+1 ;1-κ " 7 t "
2 Auch hier i s t MSE ein Schätzer für die gemeinsame Varianz σ .
MSE
Kap. 10: Varianzamlyse
195
196
Kap. 10: Varianzanalyse
ZzAApidi: Im Beispiel aus Abschnitt 1 sind die Beobachtungen y ^ für j=1,2,3 jeweils an Personen mit weniger a l s 80 kg Körpergewicht und für j=4,5,6 j e weils an Personen mit wenigstens 80 kg Körpergewicht vorgenommen worden. Berücksichtigt man das Körpergewicht als Blockfaktor 8 mit den Stufen 1 = " 80 kg", vgl. Tab. 5, so kommt man zum einfachen Blockexperiment mit Beobachtungen y ^ ^ für i = 1 , . . . , 4 , j=1,2 und k=1,2,3, also insgesamt η = 4 · 2 · 3 = 24 Daten.
Tab. 5: Differenzen y . . ^ der Blutzuckerwerte bei r = 4 Diäten und s = 2 Körpergewichtsklassen für je t = 3 Versuchspersonen
Diät i Gewicht j
Person k
1
2
2
1 y
3 y
1jk
y
1
6.8
10.1
5.3
9.1
2
9.4
9.8
7.5
10.6
3
9.0
7.4
7.8
10.9 8.4
2jk
y
4jk
1
6.2
7.9
5.2
7.1
8.6
5.9
7.9
3
6.5
8.4
6.7
9.5
J, j1 yijk=r45·0 = 7·5 > 2..=8·7
»
y
3..=6·4
'
y
4..
= 9
·4
des Faktors Α bzw. den Stufenmitteln
j, y_2_
3jk
2
Mit den Stufenmitteln
y
4
y
i 1 k = T ? · 103.7^ 8.642
88.3a; 7.358
des Faktors Β und dem Gesamtmittel
,
197
Kap. 10: Varianzanalyse
4
2
3
ergibt sich
SSA = 2 · 3 · f £ y? -4-y2 ) = 6 · (261.26 - 4 · 8.0 2 ) = 31.56 \i=1 i·· ···/
,
2 SSB = 4 · 3 · f f y 2 · - 2 - y 2 % Vj=1 -J. ···; SSG=
4 2 3 l l l i=1 j=1 k=1
?
? 2 - 24 · y c i jk
12 · (128.824 - 2 · 8.0 2 ) = 9.888 , = 1595.56 - 24 · 8.(Γ = 59.56
und somit SSE = S S G - SSA - SSB = 59.56 - 31.56 - 9.888 = 18.112 Die resultierende Varianzanalysetafel mit den Freiheitsgraden
r-1=3,
s - 1 = 1 , η - r - s + 1 = 24 - 4 - 2 + 1 = 19 und η - 1 = 23 ist in Tab. 6 angegeben.
Tab. 6: Varianzanalysetafel des Diätversuches bei Berücksichtigung des Blockfaktors "Körpergewicht"
Streuungsursache
Freiheitsgrade
SS
MS
kritischer Wert
Prüfgröße F
(< =
5%)
Diät
3
31.56
10.52
10 52 · = 11.039 0.953
F
3,19;0.95=3·127
Gewicht
1
9.888
9.888
9.888 0.953=10·376
F
l,19;0.95
Rest
19
18.112
0.953
-
-
Gesamt
23
59.56
-
-
-
= 4
-381
Gemäß der Varianzanalysetafel erweisen sich sowohl die Diäten als auch die Körpergewichtsklassen als signifikant zum 5% Niveau, d.h. die Hypothesen
8
und HQ werden zu diesem Niveau verworfen. Die multiplen Vergleiche nach Scheffe* liefern mit |y,..-y2..M-z
»
Ι * ι . . - y 3 . . l = 1·1
·
1*1..-y 4 ..l = '· 9
.
198
Kap. 10: Varianzanalyse
I y 2 .. -
.1 =2.3
,
| y 2 > > - y 4 J =0.7
,
ΙΫ3.. " V 4 J
= 3.0
und FSD A
0 .05 = / 3 - F 3 , 1 9 ; 0 . 9 5 - 7 f r MSE = /
3
'
3 J 2 7
- r
°·953 ~
1
"726
bzw. mit |y.i.-y.2.i
= 1
·284
und
FSD B
0 .05 = /
1
' F 1,19;0.95 ' Τ ^ Γ
MSE
=/
'4 · 3 8 1 ' Κ ' ° · 9 5 3 ^ ° · 8 3 4 '
daß sich Diät 1 von Diät 4 und Diät 3 von den Diäten 2 und 4 signifikant zum 5% Niveau unterscheidet sowie daß sich die Körpergewichtsklassen zum 5% Niveau unterscheiden. Durch die Berücksichtigung des Blockfaktors B, der für die Varianzanalysetafel lediglich zur Folge hat, daß der Rest der einfachen Varianzanalyse aufgespalten wird in den Rest des einfachen Blockexperimentes und den Einfluß des Blockfaktors, können also zusätzlich signifikante Unterschiede zum 5% Niveau zwischen den Diäten 1 und 4 herausgearbeitet werden. Hinzuweisen ist auch auf den im Vergleich zur einfachen Varianzanalyse wesentlich höheren Wert der Prüfgröße F beim Globaltest auf signifikante Unterschiede in den Diäten sowie auf den wegen der verminderten Restfreiheitsgrade erhöhten zugehörigen kritischen Wert.
|
Für die Auswertung komplexerer und unbalancierter Versuchsanlagen sowie für weitere Methoden der Varianzanalyse, insbesondere nichtparametrische Verfahren, Modell Uberprüfung, andere multiple Vergleiche, Modelle mit zufälligen Effekten, gemischte Modelle (Modelle II und III der Varianzanalyse) Schätzen von Varianzkomponenten etc. sei hier verwiesen auf Härtung et al. (1986, Kap. XI), Härtung / Elpelt (1986, Kap. X).
199
Kap. 10: Varianzanalyse
ÜBUNGSAUFGABEN ZU KAPITEL 10
Aufgabe 10.1: Um zu untersuchen, ob die Biegezugfestigkeit von Gießharzbeton von der Körnigkeit des Zuschlags abhängt, wurde bei jeweils 10 Proben mit grobem, mittlerem und feinem Zuschlag von Rheinkiessand (Körnunaen 0 / 3 0 2 ermittelt, vgl. Tab. 7.
,0/15
,0/7)
die Biegezugfestigkeit in kp / cm
2 Tab.
7: Biegezugfestigkeit y ^
(in kp / cm ) für i = 1,2,3 und j = 1,..., 10 von
je 10 Proben Gießharzbeton mit Zuschlägen der Körnung 0 / 3 0 und
^"~\Körnung i Probe j
, 0/15
0/7
^ ^ ^
1 2 3 4 5 6 7 8 9 10
1(0/30) y
ij
205 227 229 218 212 207 220 215 224 210
2(0/15) y
2j
207 195 199 203 212 197 190 203 215 217
3(0/7) y
3j
201 194 183 205 184 189 193 181 185 188
Prüfen Sie, ob zum \% Niveau signifikante Unterschiede in den Körnungen vorhanden sind und, falls dies der Fall ist, welche der Körnungen zu diesem Niveau signifikant verschieden sind. Gehen Sie davon aus, daß die Biegezugfestigkeiten Realisationen unabhängiger, normal verteilter Zufallsvariablen mit identischer Varianz sind.
Aufgabe 10.2: An vier Standorten wurden Wasserproben von Elbwasser entnommen, deren Gehalt an anorganischen Wasserinhaltsstoffen in einem Ringversuch mit fünf beteiligten Laboratorien analysiert werden soll. Dazu werden jedem Laboratorium je drei gleichgroße Teilproben jedes Standortes zugestellt; die Analyseergeb-
200
Kap. 10: Varianzanalyse
n i s s e s i n d i η der Tab. 8 zusammengefaßt.
Tab. S: Analyseergebnisse y ^ . ^ ( f ü r i=1
4 , j=1,...,5
, k=1,2,3) für je
drei Proben Elbwasser pro Laboratorium j und pro Standort i
1
Standort i Laboratorium j
Probe k
y
2
3
1jk
y
1
1 2 3
937 968 924
1031 1067 1079
1015 965 989
952 988 993
2
1 2 3
952 968 998
954 963 998
924 955 918
1010 927 895
3
1 2 3
897 930 912
986 957 973
986 1005 974
935 891 930
4
1 2 3
875 864 905
971 943 952
932 980 971
920 987 915
5
1 2 3
1045 1087 964
912 957 938
1120 1010 1054
974 835 925
2jk
y
4
3jk
y
4jk
Gehen Sie davon aus, daß die Analyseergebnisse Realisationen unabhängiger, normal v e r t e i l t e r Z u f a l l s v a r i a b l e n mit g l e i c h e r Varianz s i n d , und prüfen Sie zum 2.5% Niveau, ob Unterschiede zwischen den Standorten und ob Unterschiede zwischen den Laboratorien vorhanden s i n d . Untersuchen S i e gegebenenfalls, welche Standorte bzw. Laboratorien s i c h zu diesem Niveau s i g n i f i k a n t
unter-
scheiden. Welche Aussage können Sie über die Standorte t r e f f e n , wenn Sie die v e r s c h i e denen Laboratorien außer acht l a s s e n ?
Kapitel 11: Ausblick auf weitere Verfahren
In diesem Kapitel s o l l e n s t a t i s t i s c h e V e r f a h r e n , d i e im Rahmen d i e s e s Buches b i s h e r n i c h t behandelt wurden, i n i h r e n Grundzügen d a r g e s t e l l t werden. Dabei wird n i c h t d i e konkrete Methodik, b z g l . derer verwiesen s e i auf Härtung et al.
(1986) und Härtung / E l p e l t ( 1 9 8 6 ) , sondern vielmehr d i e Z i e l s e t z u n g der
Verfahren und damit d i e ihnen zugrundeliegende F r a g e s t e l l u n g
vorgestellt.
Eines der Grundprobleme s t a t i s t i s c h e r Analysen i s t d i e VattngtmLnnung analysegerechte V a i m a u i b z A e A X u n g . N ü t z l i c h e H i l f s m i t t e l
und
s t e l l t hier die
VERSUCHSPLANUNG zur Verfügung, welche auch Problematiken s p e z i e l l e r Anwend u n g s b e r e i c h e , z . B . bei der Planung k l i n i s c h e r S t u d i e n , b e r ü c k s i c h t i g e n muß: Welche Daten müssen in welcher Form erhoben bzw. gemessen werden, damit d i e i n t e r e s s i e r e n d e n F r a g e s t e l l u n g e n auch durch eine s t a t i s t i s c h e Analyse beantwortbar s i n d ? Die Anlegung e i n e s konkreten Versuchsplanes i s t d i r e k t mit dem Problem, der Gewinnung " r e p r ä s e n t a t i v e r " S t i c h p r o b e n g e k o p p e l t ; h i e r
leistet
d i e STICHPROBENTHEORIE, d i e s i c h z . B . mit der g e s c h i c k t e n und erhebungstechn i s c h g ü n s t i g e n Planung und Durchführung von Untersuchungen b e s c h ä f t i g t , nen w i c h t i g e n B e i t r a g . So s o l l t e man etwa bei e i n e r InventuA bai-ii
au.6
ei-
Si-ichp/iobin-
das gesamte Lager dem Warenwert entsprechend in S c h i c h t e n a u f t e i l e n und
dann in jeder S c h i c h t z . B . p r o p o r t i o n a l
zur S c h i c h t g r ö ß e e i n e gewisse Anzahl
von Proben entnehmen. Stehen d i e gewünschten Daten e r s t einmal zur Verfügung, so s t e l l t s i c h d i e Frage nach der Größe und A r t von möglichen Meß^eWeAn; man v g l . h i e r z u etwa auch d i e Ausführungen zum F e h l e r f o r t p f l a n z u n g s g e s e t z
in
A b s c h n i t t 5 von Kapitel 4. Zudem muß ü b e r p r ü f t werden, ob eventuell
AuiiziUeA
in den Daten verhanden s i n d ; zu diesem Zwecke b i e t e n s i c h s p e z i e l l e
Ausreis-
s e r t e s t s an. S c h l i e ß l i c h s o l l t e man noch ü b e r l e g e n , ob v i e l l e i c h t eine O a X m thaM^onnatAxin n ü t z l i c h s e i n kann, um z . B . das V e r t e i l u n g s g e s e t z der den Daten zugrundeliegenden Gesamtheit b e s s e r in den G r i f f zu bekommen. H i e r b e i
ist
a l l e r d i n g s zu beachten, daß R e s u l t a t e f ü r t r a n s f o r m i e r t e Daten n i c h t ohne weiteres auf d i e Ursprungsdaten übertragbar
sind.
Im nächsten S c h r i t t s o l l t e man dann versuchen, einen Oberblick über das v o r l i e g e n d e Datenmaterial
zu gewinnen. Hier b i e t e n s i c h d i e Methoden der
202
Kap. 11: Ausblick
DESKRIPTIVEN resp. EXPLORATIVEN und ROBUSTEN STATISTIK a n . die zum Teil bereits in den vorausgegangenen Kapiteln mitbehandelt wurden. Diese Teilgebiete der Statistik stellen grob gesprochen Verfahren bereit, die große Datenmengen zusammenfassen, strukturieren und auch graphisch reprä'sentierbar machen. In diesem Zusammenhang ist auch auf spezielle GRAPHISCHE VERFAHREN hinzuweisen, die etwa Objekte oder Merkmale, die an Objekten erhoben wurden, in vergleichbarer Form darstellen, wobei z.B. bei der Darstellung von Objekten in Einzelgraphiken basierend auf mehreren Merkmalen (mehrdimensionale, multivariate Daten) auch Ähnlichkeiten, Zusammenhänge oder Wichtigkeit der Merkmale berücksichtigt werden können.
Hat man Daten erhoben, die rein qualitativer oder zumindest teilweise qualitativer
Natur sind, und möchte anhand dieser Daten Fragestellungen
beantwor-
ten, die besser oder nur mit einem Verfahren für quantitative,stetige
Daten
angehbar sind, so müssen diese qualitativen Daten mittels Methoden zur SKALIERUNG VON MERKMALSAUSPRÄGUNGEN
in quantitative Daten verwandelt werden.
Eine solche Skalierung erfolgt in der Regel auf der Basis maximal
erreich-
barer Merkmalskorrelationen, so daß die Skalierung direkt auch Anhaltspunkte für die Relevanz einzelner, erhobener Merkmale liefert. Welches konkrete Skalierungsverfahren anzuwenden ist, richtet sich hier nach der statistischen Methode, die man anschließend auf die neu skalierten Daten anwenden möchte.
Im Bereich der Produktion ist die QUALITÄTSKONTROLLE ein notwendiges
Instru-
mentarium zur Sicherung der Güte von Produkten. Sie stellt mehr oder weniger komplexe Systeme für Eingangs- und Ausgangskontrollen, aber auch für die Kontrolle der laufenden Produktion zur Verfügung. Wann muß z.B. eine Maschine wegen eventuell mangelnder Güte der von ihr produzierten Produkte gestoppt werden? Vor allem in diesem Bereich finden auch i&quw£LelZe.
itaiiitii>c.hi
VeA^ahAcn ihre Anwendung, bei denen ausgehend von einer Hypothese die Objekte nacheinander geprüft werden und nach jeder Objektprüfung erneut entschieden w i r d , ob die Hypothese zu verwerfen oder ob weiterzuprüfen
Die ZEITREIHENANALYSE dient zur Untersuchung von zeitlichen
ist.
Entwicklungen.
Hat man ein oder mehrere Merkmale z.B. über eine Reihe von Monaten hinweg beobachtet, so stellt sich die Frage, ob etwa ein Tn.wd Schwankung
oder eine
icUionale.
in den Daten verhanden ist, ob sich Verläufe mehrerer Merkmale ge-
genseitig beeinflussen usw. Außerdem ist es natürlich nicht zuletzt im wirtschaftlichen Bereich von Interesse, aufgrund der Daten aus der Vergangenheit den weiteren Verlauf der Zeitreihe, mithin die zukünftige Entwicklung zu pfiognoAtiz-LeAW.
203
Kap. 11: Ausblick
Im Zusammenhang mit der Berechnung von Wahrscheinlichkeiten in Kapitel 1 haben wir uns mit der Zuverlässigkeit von Systemen beschäftigt. Allgemein stellt die ZUVERLÄSSIGKEITSTHEORIE ein Methodenspektrum zur Verfügung, das es erlaubt, Zuverlässigkeiten und Lebensdauern von Objekten zu untersuchen. So werden z.B. komplexe oder auch mehrphasige Systeme vermittels resp. ?kaatd
- Uiii-Lon
- AnaZyitn
von Objekten analysiert, indem man sie etwa in
LzbmicbiuiLKve.>Uiiltu.ngw Klanen
FehleAbäumen
betrachtet. Auch werden die Strukturen der
solcher Verteilungen einordnet. Bei sehr langlebigen Objekten können
Lebensdaueruntersuchungen oft nur in Form von zeJ£na(l{le.nde.n
Piüiunge.n
im La-
borversuch (unter extremen Bedingungen) durchgeführt werden; hier stellt die Zuverlässigkeitstheorie Methoden bereit, welche die Extrapolation der Resultate auf normale Umgebungsbedingungen ermöglichen. Ein weiterer Problemkreis der Zuverlässigkeitstheorie ist die Festsetzung adäquater WaiXungi-, haltungi-
und
Initand-
EineaeAungntAate.g'Len.
Wir haben uns in den Kapiteln 1 und 8 mit Verfahren für Vierfeldertafeln und rxs - Kontingenztafeln beschäftigt, bei denen etwa Zusammenhänge zwischen zwei diskreten bzw. diskretisierten Merkmalen untersucht wurden. Um die Stärke des Zusammenhangs solcher Merkmale zu messen, verwendet man sogenannte Α a o z l a tLani-
bzw. Kontingznzkoz^izlentzn,
denen die Korrelationskoeffizienten
im
stetigen Fall entsprechen. Ein wichtiges Hilfsmittel bei der gleichzeitigen Analyse mehrerer diskreter Merkmale in MEHRDIMENSIONALEN ist das' Logllnmie
Modelt,
KONTINGENZTAFELN
mit dessen Hilfe z.B. gezielt ganz spezielle Hypo-
thesen über die Abhängigkeiten der Merkmale untereinander geprüft werden können.
Bei der Regressionsanalyse im Kapitel 9 haben wir stets vorausgesetzt, daß das Regressanden - Merkmal stetig bzw. sogar normalverteilt ist. Ist das interessierende Merkmal hingegen diskreter bzw. qualitativer Natur, so kann man sich der sogenannten DISKRETEN REGRESSIONSANALYSE bedienen. Die wohl wichtigsten Modelle in diesem Zusammenhang sind das Lineale. modell,
das
P/iobit
- ModeZl
und das
Log-iX
- Modell.
Uahi&ch&±nlichke>Lti-
Hier werden
insbesondere
Wahrscheinlichkeiten geschätzt, mit denen bei vorgegebener Konstellation der Regressor - Merkmale die einzelnen Ausprägungen des Regressanden eintreten.
Wir wollen uns nun mit Verfahren beschäftigen, die man gemeinhin unter dem Namen MULTIVARIATE STATISTISCHE METHODEN zusammenfaßt. Das sind Analysemethoden, bei denen man sich gleichzeitig für mehrere an einem Objekt erhobene oder gemessene Merkmale interessiert. Zu diesen Verfahren muß man strenggenommen natürlich auch die Analysemethoden für mehrdimensionale Kontingenztafeln, den Vergleich von Zeitreihen, einige graphische Verfahren sowie auch
204
Kap. 11: Ausblick
e i n i g e Verfahren zur Skalierung von Merkmalsausprägungen rechnen, auf die wir hier b e r e i t s Bezug genommen haben. Werden bei EIN-,ZWEI- UND MEHRSTICHPROBENPROBLEMEN g l e i c h z e i t i g mehrere Merkmale an den Objekten der Stichproben beobachtet, und möchte man z.B. aufgrund dieser Daten untersuchen, ob s i c h die den Stichproben zugrundeliegenden Gesamtheiten b z g l . a l l e r Merkmale g l e i c h z e i t i g , gemeinsam unterscheiden, so gelangt man n a t ü r l i c h automatisch zu denjenigen m u l t i v a r i a t e n Verfahren, die den von uns behandelten sogenannten univariaten Verfahren ( f ü r ein Merkmal) analog sind. In den Rahmen von Mehrstichprobenproblemen f ä l l t aber z.B. auch die DISKRIMINANZANALYSE, aufgrund derer man, ausgehend von den Beobachtungen zu den interessierenden Merkmalen, ein Objekt (von dem man n i c h t weiß, zu welcher der in Frage stehenden Grundgesamtheiten es gehört) einer der Grundgesamtheiten zuordnen kann. Für die Güte dieser Zuordnung s i n d die v e r s c h i e denen Merkmale n a t ü r l i c h u n t e r s c h i e d l i c h w i c h t i g ; die wesentlichen Merkmale kann man dann mit H i l f e von Tiennmaßen
bestimmen, die angeben,wie gut man auf-
grund einzelner Merkmale bzw. Gruppen von Merkmalen zwischen den Grundgesamtheiten unterscheiden, d i s k r i m i n i e r e n kann. Hiervon ausgehend kann dann event u e l l auch eine Meikmxlifiedaktion
vorgenommen werden, d.h. bei zukünftigen
Objekten, die man einer der Grundgesamtheiten zuordnen möchte, müssen dann nur noch die für die Zuordnung w i r k l i c h relevanten Merkmale beobachtet werden.
Das Mehrstichprobenproblem e n t s p r i c h t n a t ü r l i c h wie im F a l l e nur eines essierenden Merkmals gerade einer nun multivcuiMiten
einlachen
inter-
VaAianzanalya,
bei welcher der E i n f l u ß eines Faktors auf endlich v i e l e n Stufen (diese entsprechen gerade den verschiedenen Grundgesamtheiten von Objekten) auf die interessierenden Merkmale untersucht wird. Allgemein werden Versuche mit einem oder mehreren Einflußfaktoren im F a l l e mehrerer i n t e r e s s i e r e n d e r Merkmale mit den Methoden des MULTIVARIATEN LINEAREN MODELLS ausgewertet. Sind die Einflußfaktoren wie in der Regressionsanalyse q u a n t i t a t i v e r Natur, so s p r i c h t man von nultivaAMUeA
s i n d s i e q u a l i t a t i v e r Na-
RigtLeJsAion6a.ncd.yie.,
tur (Faktoren mit endlich v i e l e n S t u f e n ) , so s p r i c h t man von nuttivaiMiXeA VafUa.nza.naly&z,
sind s i e s c h l i e ß l i c h gemischt q u a l i t a t i v - q u a n t i t a t i v , so
s p r i c h t man von maltivivUaXeA
KovasUanzanalyie..
Speziell
im Fall der m u l t i -
variaten Varianzanalyse unterscheidet man, wie im F a l l e eines Merkmals in Kapitel
10 angedeutet, zwischen festen und z u f ä l l i g e n Effekten der E i n f l u ß -
faktoren. I n t e r e s s i e r e n nur die im Versuch konkret b e r ü c k s i c h t i g t e n Stufen eines
F a k t o r s , s o g e l a n g t man zum Modell
mit
iuten
ΕRekten
(Modell
I).
Handelt es s i c h bei den Stufen hingegen um eine z u f ä l l i g e Auswahl aus (unendl i c h ) v i e l e n Stufen und möchte man einen generellen Schluß über den E i n f l u ß -
205
Kap. II: Ausblick
faktor ziehen, so spricht man vom McideM
II oder vom Μ o d e M . irüX
zu^äMlgen
E^jJefe-ten. Hier wird dann die Variation zwischen den Stufen eines Einflußfaktors bzgl. des oder der interessierenden Merkmale betrachtet;
insbeson-
dere beschäftigt man sich mit der Schätzung dieser Variation, der von
Schätzung
I / i v U a . n z k o m p o M n X e . n . Treten in einem Varianzanalysemodel 1 Einflußfaktoren
sowohl mit festen als auch mit zufälligen Effekten gleichzeitig auf, so spricht man vom HodM
III oder gemiichtm
der Varianzanalyse.
Moduli
Bei der MULTIDIMENSIONALEN SKALIERUNG (MDS) will man η Objekte durch eine q - dimensionale Datenmatrix darstellen. Aufgrund einer Ausgangsinformation über die η interessierenden Objekte in Form einer Distanzmatrix, welche die paarweisen Verschiedenheiten
(Distanzen) der Objekte beinhaltet, wird also
bei der Multidimensionalen Skalierung eine Skala gesucht, die jedem Objekt einen q - dimensionalen Vektor derart zuordnet, daß die z.B. euklidischen Abstände zwischen den Vektoren die Verschiedenheiten der Objekte möglichst gut widerspiegeln.
Ist die gewählte Dimension des Repräsentationsraums
klein
( q < 3 ) , so können die η Objekte dann auch graphisch dargestellt werden. Je nachdem, in welcher Form die Verschiedenheitsinformationen
über die Objekte
vorliegen, können bei der MDS verschiedene Verfahren gewählt werden. Hat man an den η Objekten etwa p > q Merkmale beobachtet, so kann aufgrund der mensionalen Beobachtungsvektoren eine "zahlenmäßige" Distanzmatrix werden, die dann z.B. mittels Nontin&aA
Mapping
oder
ρ-di-
bestimmt
HaaptkooidinatmmeXhodi
durch eine Distanzmatrix basierend auf einer q - dimensionalen Skala approximiert wird. Kennt man dagegen nur eine Rangfolge aller Objektpaare bzgl. ihrer Verschiedenheiten, so wird durch das VeA. Rahlen
von
KA.LU>KAL eine q - dimen-
sionale Skala derart bestimmt, daß die daraus resultierenden Distanzen möglichst genau diese Reihenfolge einhalten. Hat man schließlich nur für jedes einzelne Objekt individuell gesehen eine Rangfolge der übrigen Objekte bzgl. ihrer Verschiedenheit von diesem einzelnen Objekt (individual kann mittels Unfolding
- Technik
scale), so
eine gemeinsame (q - dimensionale) Skala
(joint scale) für die Objekte gefunden werden.
Die CLUSTERANALYSE stellt ein Instrumentarium bereit, mit dem Objekte zu Klassen zusammengefaßt werden können. Dabei möchte man erreichen, daß die Klassen (cluster) der konstruierten Klassifikation der Objekte in sich möglichst homogen und untereinander möglichst heterogen sind. Die in einer Klasse zusammengefaßten Objekte sollen sich also möglichst ähnlich sein und die verschiedenen Klassen sollen sich bzgl. der in ihnen enthaltenen Objekte möglichst stark unterscheiden. verschiedene Typin
von
In der Clusteranalyse unterscheidet man nun
Ktaaii-Lkatxonin,
nämlich Partitionen, Oberdeckungen,
Hierarchien und Quasihierarchien. Eine PtvUMxon
von η Objekten ist eine
206
Kap. 11: Ausblick
Einteilung der Objekte in disjunkte, sich nicht überschneidende Klassen, wohingegen sich bei einer übeAdeckung
die Klassen überlappen können, jedoch
keine Klasse vollständig in einer anderen enthalten sein darf. Eine chie
HienaA-
wird gebildet durch eine Folge von Partitionen. Geht man etwa von den
η einelementigen Klassen aus, so werden auf der nächsten Stufe der Hierarchie Klassen zusammengefaßt und zwar derart, daß auch diese Stufe eine Partition darstellt; die dritte Stufe der Hierarchie entsteht durch Zusammenfassen von Klassen aus der zweiten Stufe, wobei wiederum beachtet werden m u ß , daß eine Partition entsteht, usw. Vollkommen analog besteht eine QuaiihieAatchie aus einer Folge von Oberdeckungen. Für die verschiedenen typen gibt es nun diverse KonitnuktionAueAiahien,
dann
Klassifikations-
bei denen i.d.R. jeweils
noch ein Maß für die Homogenität der Klassen und für die Heterogenität zwischen den Klassen gewählt werden muß; aufgrund dieser Maße wird dann die Güte.
einet
Klaai{,ikation
beurteilt. An dieser Stelle seien nur noch bei-
spielhaft drei häufig verwandte Heterogenitätsmaße, also Maßzahlen für die Verschiedenheit von je zwei Klassen erwähnt. Complete
linkage
mißt die Ver-
schiedenheit aufgrund des maximalen Abstandes, iingle
linkage,
aufgrund des
minimalen Abstandes und average
linkage,
aufgrund des durchschnittlichen
Ab-
standes zwischen den Objekten aus der einen und den Objekten aus der anderen Klasse.
Bei der FAKTORENANALYSE, die wir hier als abschließendes Verfahren kurz schildern wollen, werden ausgehend von ρ interessierenden Merkmalen, die jeweils an η Objekten aus einer Gesamtheit gemessen bzw. erhoben werden, qUa.blen,
kreten Verfahren der Faktorenanalyse, als da sind die lenVioidmethode, Maximum - Likelihood tofienanalyie
latenten
d.h. einer nicht direkt meßbaren Größe beeinflußt werden. Die kon-
- Methode,
die kanonische
faktoKenanalyie,
die
etc. konstruieren nun eine sogenannte Ladungimat'u.x
die Haupt^akL für q
orthogonale, künstliche Faktoren derart, daß L L T eine um merkmalseigene Varianzen reduzierte Korrelationsmatrix der ρ Merkmale möglichst gut approximiert; die Elemente der Ladungsmatrix L sind dabei gerade die Korrelationen zwischen den ρ Merkmalen und den q latenten Faktoren. In der Regel wird diese Ladungsmatrix dann noch so rotiert, daß sie einer sogenannten itmktuA
Ein^ach-
möglichst nahe kommt; unter einer Einfachstruktur versteht man da-
bei grob gesprochen, daß jeder Faktor mit einer Gruppe von Merkmalen hoch und mit den übrigen Merkmalen möglichst schwach korreliert ist sowie daß die Merkmalsgruppen zu den verschiedenen Faktoren disjunkt sind. Die verschie-
207
Kap. 11: Ausblick
denen Ro£a£ion6veA{ahien
drehen die Faktoren (gesehen als q - dimensionales
Koordinatensystem) entweder so, daß wiederum orthogonale Faktoren entstehen ( z.B. Vajujmx
-
oder QuauUirax
- Methode),
oder so, daß die resultierenden
Faktoren schiefwinklig, d.h. miteinander korreliert sind (z.B. Methode P>UinäAiaktoien);
verschiedene orthogonale bzw. schiefwinklige
den.
Rotationsver-
fahren unterscheiden sich in der Art und Weise, wie sie die Güte der Näherung einer Einfachstruktur messen. Nicht zuletzt dient die auch der VaXejuiedukXxon
Faktorenanalyse
für weitere statistische Analysen. Unter Verwendung
der unrotierten oder rotierten Ladungsmatrix werden sogenannte
VaktoimuieAte
oder PeAiäntcchkeZt6pAoi
-CO
so daß sich mit
J
fx(x)
dx
= J
-o°
c · ( 2 - x 2 - 3) d x
= c · | ( 2 - x 2 - 3) d x
2
2
= c ·
-
c ,
„
· χ 3 - 3·χ] /686
16
^-r-T"
2 1
= ε · ^ | · 343 - 3 · 7 - | · 8 + 3 · 2 ^
+6
y -
c
r
686 - 16 - 6 3 + 18
J — —
625
ergibt:
=
625
= 0.0048
Weiter ist die Verteilungsfunktion der Zufallsvariablen X gerade χ
χ
Fx(x) = |
f x (u) du = | c · (2-u 2 - 3) du 2
= 0.0048 · ( § · χ 3 - 3 · χ + | ) = und 0
, für χ < 2
1
, für χ > 7
Fx(x) =
b) Mit F x (x) = P ( { X < x } )
(2·χ 3 - 9·χ + 2)
für
2 z ]
dy
(y).l
[ 0 > 4 ]
(y)dy
, für ze[4,8]
z-4
e
-2z
z
J
e2y · ( l - | - y )
dy
, für ze[0,4]
1 - e 0
, sonst
an der S t e l l e ζ = 4 b e s i t z t f z ( z ) eine
Sprungstelle.
Nun i s t f ü r b e l i e b i g e Zahlen a , b mit a < b
f e
2 y
. ( l - { . y )
dy
a
2
y-|.y.e
2
v)
dy
a
=
1
.
=^ ' ( e
1
2 b
·
2a
1 . 2b 1 2a 1 2b 1 2a -Ts·· be + *· · ae +-r-»-· e --Λ-· e TF ΤΪ
(9-2b)-e2a·
^ • ( e
8
^ • ( e
2 z
^
so daß sich
= }(e
·
(9 - 8) -
·
(9-2a))
e 2 ( z _ 4 )
(9-2z)-e
0
· (9-2· (z-4)))
· (9-0))
, f ü r a = z - 4 , b=4
, f ü r a=0, b=z
( e 8 - e ~ 8 · e2z · ( 1 7 - 2 z ) )
, f ü r a=z-4, b=4
( e 2 z · ( 9 - 2z) - 9 )
, f ü r a=0, b=z
232
Kap. 12: Lösungen zu den Aufgaben in Kapitel 3
e~ 16f
z
(z)
=
(1
2 z
- e ~
8
( e
8
( e
2 z
2 z
e'
_ 8
- e
. e
2 z
·
( 1 7 - 2 z ) )
für
ze[4,8]
für
ze[0,4]
)
1 6 · (1 - e " 8 )
-
( 9 - 2 z ) - 9 )
sonst
1 16 · (1 - e
16· l
als lich
Es
Dichte eine
der
(1 - e
. ( )
I
f
z
(z)
(
f
z
(z)
- 2 ( z - 4 ) _
- 8 .
e
_
( 1 7
Λ
2
für
ze[4,8]
für
ze[0,4]
/ e~2z") /
5— · ^ 9 - 2 z - 9 · u \ )
sonst
0
Zufallsvariablen
Dichte
e
^
ist,
Ζ ergibt.
kontrolliert
man
Um z u
das
überprüfen,
Erfülltsein
ob
f^(z)
wirk-
von
ist
1 6 · (1 - e ~ ö )
16- (1 - e ~ ö )
I
( 9 - 2 z - 9 ·
(
( e
2 ( z
([
9 z - z
[.
16- (1 - e " 8
-
(36-
1 .
e
+
8
- e -
| . e -
8
e "
+
( 1 - e "
8
)
) )
- 0
= >
dz
2 z
1 7
1
.
e
- 8 .
z
+ 0 - | - ^ ·
68 · e "
8
dz
. ( 1 7 - 2 z ) )
- 2 ( z - 4 ) .
16+ | .
+ 64 · e "
! — ^ τ · ( ΐ 6 · 16 · (1 - e ) ^
2
4 )
-
2 z
e"
8
-
.
16 ·
e"
+
e
e "
8
8
)
- 8 .
-
z
2
D
136 ·
e"
8
Kap. 12: Lösungen zu den Aufgaben in Kapitel 3
AUFAGBE 3.5: Ist X%B(3 , 0.3), so ist ( 3 ) · 0.3k · 0.7 3 " k
, für k=0,1,2,3
P(x = k ) =
, sonst und es gilt für y>0 P({Y ) - 0 . 3 3
= 0.343 · (1 - e " z ) + 0.441 · (1 - e " ( z ~ 1 ' ) + 0.189 · (1 - e " ( z " 2 ) ) + 0.027 - ( 1 - e ~ ( z ~ 3 ) )
.
AUFGABE 3 . 6 : Für k = 0 , 1 , 2 , 3 i s t
P(X = k ) = I 0 T T ^ | - ( k ) · ° - 2 5 k - ° · 5 1 2 · ( k ) · ° · 2 5 " · l = 0.512 · = 0.83 ·
· 0.25 k ·
j t H
j j · e" 1 = 0.512 · ( 3 ) · 0.25 k · 1
· 0.2k · 0.8"k =
· 0.2k · 0.83"k
und P(X = k) = 0
für
k — P(X = k) · P(Y = j ) = l ΠΓ73 k=0 z=k+j k)
21 iJi
E ( g i ( X ) ) = 21 - ( 21
bzw. der erwartete Verlust auf insgesamt 100 · -g- = 350 Pfennige oder 3.5 DM beläuft.
AUFGABE 4.4: Die Informationen in der Aufgabenstellung können Sie auch in der Form P( 190 - X | > 5 ) = P ( | E ( X ) - X | > 5 ) = S% + 7% = 12% = 0.12 zusammenfassen, wenn die Zufallsvariable X die Haltbarkeitsdauer einer H Milch - Packung beschreibt. Nach der Tschebyscheffschen Ungleichung g i l t nun für beliebige Zufallsvariablen X mit existierender Varianz P(|E(X)-X| >c)
5) < bzw. 25 · P(|E(X) - X| > 5) < Var(X)
.
Als untere Abschätzung für die Varianz der Haltbarkeitsdauer ergibt sich somit der Wert
242
Kap. 12: Lösungen zu den Aufgaben in Kapitel 4
25 · 0.12 = 3
,
d.h. die Standardabweichung der Haltbarkeitsdauer der H - M i l c h beträgt mindestens \ ß = 1 .732 Tage.
AUFGABE 4.5: Beschreibt die Zufallsvariable X die Lebensdauer einer Batterie des betrachteten Typs, so i s t μ = E(X) = 45
und
σ 2 = Var(X) = 5 2 = 25
.
Nach dem Fehlerfortpflanzungsgesetz ergibt sich dann für die Z u f a l l s v a r i able Y = f(X) = ln X, die die logarithmierte Lebensdauer beschreibt, E(Y) = E(f(X))
f(p) = In μ = In 45 = 3.807
und mit 3f 3X
Χ=μ
ergibt sich
45
= 0.0123
die Varianz der logarithmierten Lebensdauer i s t also in etwa gleich dem Quadrat des Variationskoeffizienten ν der Lebensdauer.
Kap. 12: Lösungen zu den Aufgaben in Kapitel 5
243
5. Lösungen zu den Aufgaben in Kapitel 5 AUFGABE 5.1: Die Quantile u a der Standardnormal verteil una sind aus Tab. 2 des Anhangs ablesbar, wobei für α < 0 . 5 von der Symmetrie der Verteilung Gebrauch gemacht werden muß: u = -u, α 1-α Auch die t - V e r t e i l u n g i s t symmetrisch, so daß mit
die gesuchten Quantile für η = 10 und η = 17 aus der Tab. 3 des Anhangs abge2 lesen werden können. Die Quantile χΛ sind für η = 10 und η = 15 in der Taη ;α belle 4 des Anhanos zu finden und die Quantile Fm „ sind in Tabelle 5 des m,n;a Anhangs vertafelt. Hier muß man sich für a < 0 . 5 der Regel Fra
»n;a
~c 1 η ,m;1-a
bedienen. In der nachfolgenden Tab. 3 sind a l l e gesuchten Quantile zusammengestellt. ?
Tab. 3: α - Q u a n t i l e der Standardnormal-, der t - , χ - und F-Verteilunq für α = 0.01 , 0.05, 0.95, 0.99
Ί0;α
α = 0.01
α= 0.05
α = 0.95
α = 0.99
-2.3263
-1.6449
1.6449
2.3263
-2.764
-1.812
1.812
2.7b4
-2.567
-1.740
1.740
2.567
2.558
3.940
18.31
23.21
5.229
7.261
25.00
30.58
2 χ
10;α
2
χ
15;α
F 3,7;α
7 Κ.
1
27.67
1
8.451
0.036
0.118
1
8.887
1
4.347
=0.113
4.347
= 0.230
8.887
8.451 27.67
244
Kap. 12: Lösungen zu den Aufgeben in Kapitel 5
AUFGABE 5 . 2 : B e s c h r e i b t X^ d i e Anzahl der Fußgänger während e i n e r Rotphase auf der einen und X 2 d i e Anzahl der Fußgänger auf der anderen S t r a ß e n s e i t e , so X ^ P o U ^
mit
λ^ = 4
und
Χ2^Ρο(λ2)
mit
λ2 = 8
,
ist
da auf den S t r a ß e n s e i t e n pro Minute d u r c h s c h n i t t l i c h 2 bzw. 4 , d . h . während e i n e r Rotphase von 2 Minuten d u r c h s c h n i t t l i c h 4 bzw. 8 Fußgänger ankommen und da der Erwartungswert der Ρο(λ) - V e r t e i l u n g gerade λ i s t . Die Gesamtzahl der wartenden Fußgänger während e i n e r Rotphase wird durch Y = X^ + X 2 beschrieben, so daß s i c h Υ ^ Po(12) e r g i b t , da d i e Summe unabhängiger P o ( X i ) - v e r t e i l t e r rade Po( l X i ) - v e r t e i l t
Zufallsvariablen
ge-
ist.
a) (1) Die W a h r s c h e i n l i c h k e i t , daß auf j e d e r S t r a ß e n s e i t e mindestens
vier
Fußgänger warten, l ä ß t s i c h aufgrund der Unabhängigkeit von X^ und X 2 d a r s t e l l e n a l s Produkt der W a h r s c h e i n l i c h k e i t e n , mit denen auf der einen und der anderen S t r a ß e n s e i t e mindestens v i e r Fußgänger warten: Gesucht i s t
also
P ( { X 1 > 4 } ) · P ( { X 2 > 4 } ) = (1 - P ( { X , < 3 } ) ) · (1 - P ( { X 2 < 3 } ) ) Mit -4
=
- j - · 0.0183
= 0.4335
Kap. 12: Lösungen zu den Aufgaben in Kapitel 5
,"8
82 . 83 ϋ τ Ύ Γ τ π π
G
245
8 . 64 . 512\
-8
0.0003355 0.0424 e r g i b t s i c h die gesuchte Wahrscheinlichkeit zu P(X 1 > 4) · P(X 2 > 4) = (1 - 0.4335) · (1 - 0.0424) = 0.5665 · 0.9576 = 0.5425 = 54.25%
.
(2) Gesucht i s t Ρ ί ί Χ , + X 2 > 4 ) = Ρ ({Y > 4 } ) = 1 - P ( { Y < 3 } ) 3
1-
I P(Y = J ) = 1 " I j=0 j=0 12° Τ Γ
1 -
/I
+
121 122 123 Τ Γ + Τ Γ + ΤΓ
12
144
1728\
12j -12 T T•' e J· .-12
-12
= 1 - 373 · 0.000006144 = 0.9977 d.h. mit e i n e r Wahrscheinlichkeit von 99.77% warten insgesamt mindestens v i e r Fußgänger. b) Beschreiben die unabhängigen Po(12) - v e r t e i l t e n
Zufallsvariablen
Y j , . . . » Y j q q die Zahl der insgesamt wartenden Fußgänger in den Rotphasen 1 , 2 , . . . , 5 0 0 , so l ä ß t sich die gesuchte Wahrscheinlichkeit schreiben a l s / .
500 3UU
i m ' i ,
λ Y
i S
1 1
-
7
r
p
( W
1 1
·
7
)
und mit E ^ ) = V a r ( Y . ) = 12
f ü r i=1
500
e r g i b t s i c h unter Verwendung des Zentralen Grenzwertsatzes und der Tab e l l e 1 des Anhangs
246
Kap. 12: Lösungen zu den Aufgeben in Kapitel 5
P ( ^ n n < 11-7) = Pf V S M - ^ O O - J Ü < 500 " V W ' ^
11
·7' y/π
'
'
VT?
= φ(-0.3· J ^ j
vSTO ·
= Φ(-1.94) = 1 - Φ( 1.94)
= 1 - 0.9738 = 0.0262 = 2.62%
.
AUFGABE 5.3: Die Zufallsvariable X i , die für i=1,...,400 die Lebensdauer des i-ten Kühl aggregates beschreibt, ist exponentialverteilt mit Parameter λ. Laut Experiment ist EfX^ ) = 2 = 1 für i=1 ,...,400 , so daß sich der Parameter X der Exponentialverteilung zu λ = 0.5 ergibt. Somit ist die Varianz der Zufallsvariablen X^ für i=1 ,...,400 gerade Var(X.) « 4 = 1 λ^ 0.5
= 4
und unter Verwendung des Zentralen Grenzwertsatzes sowie der Tabelle 1 im Anhang läßt sich die gesuchte Wahrscheinlichkeit folgendermaßen abschätzen: ,400 '(Ι
\
/400
\
,
X i < 750) = p(.I i Xi 9 7 5
Da gilt 16 i 3.6405 · t ^ 5 . 0
g75
= 3.6405 · 2 . 1 3 1 2 = 16.532
17 > 3.6405 · t ^ 5 . 0
g75
= 3.6405 · 2.120 2 = 16.362
ist die gesucht Zahl gerade n " =17.
und
257
Kap. 12: Lösungen zu den Aufgaben in Kapitel 7
d) Die Breite eines 95% - Konfidenzintervalles für den Erwartungswert μ einer 2 2 Ν(μ,σ ) - V e r t e i l u n g mit unbekannter Varianz σ soll den Wert d = 1 nicht Uberschreiten. Betrachtet man die Daten der Aufgabenstellung als Vor2 Stichprobe mit n^ = η = 9 , χ = 30.056 und s Zahl n
1
= 2.053, so ist die kleinste
gesucht, so daß gilt 2s · t
2 ·V O S S · t 8;0.975
n0-1;1-a/2
1
= 4 · 2.053 · 2.306 = 43.668
.
Voraussichtlich ist also ein Stichprobenumfang n' = 4 4 nötig, um die Breite d = 1 des 95% - Konfidenzinterval les für μ abzusichern.
AUFGABE 7.2:
Aufgrund einer Stichprobe von n = 100 Transistoren, von denen sich π = 89 als intakt erwiesen, sollen Konfidenzintervalle für die
Intaktwahrscheinlichkeit
eines Transistors aus der Produktion bestimmt werden, die eine
Sicherheits-
wahrscheinlichkeit von 98% besitzen. Gesucht sind also ein approximatives und ein exaktes Konfidenzintervall
zum Niveau 1 - a = 0.98 für den Parameter
ρ einer Binomialverteilung, der aufgrund der Stichprobe durch den Punktschätzer
Η
-
w
= °-89
= 89%
geschätzt wird.
Das exakte Konfidenzintervall
berechnet sich basierend auf einer Approxima-
tion der Quantile
F
2m,2(n-m+1);a/2
F
2(m+1),2(n-m);1-a/2
einer F^Q 1 7 8 " ^ Z W "
F
= F
178,24;0.01 = F
24,178;0.99
e
"θ.99*
F
24,178;0.99
180,22;0.99
1 8 0 22 ~
F
=
Approximation des Quantiis
a
~
b
"
e
2.3263a-b
258
Kap. 12: Lösungen zu den Aufgaben in Kapitel 7
ergibt sich mit
wobei
c
J " 0 . 9 / -
d =
?T^T
+
3
2.3263 2 - 3
,
T7FrT
=
73
+
T77
=
= 0 4019
und
°·0491
.
d.h. a = \/2 · 0.0491 + 0.4019 · 0.0491 2 = 0.3149 b
=
und
= 0.0922
+
,
zu ρ
24,178;0.99~
2.3263 · 0.3149 - 0.0922
QQ7i
-l.BS/l
Für das zweite Quantil
f
~oU0-99"a"b 2.3263 · a - b 180,22;0.99~ "e
ergibt sich mit ^
2.326^-3 ,
d =
+
0 4019
=
un()
T79 + 2T
=
°·0532
dann wegen und a = / 2 d + cd 2 = / 2 · 0.0532 + 0.4019 · 0.0532 2 =0.3279
= 2.(^-^).(0.4019 gerade
+
| - ^ 3 2 ) = -0,023
Kap. 12: Lösungen zu den Aufgaben in Kapitel 7
Ρ
2.3263 · 0.3279+ 0.1023
259
,
Bestimmen wir noch 1
1
178,24 ;0.01 '7. 24,178;0.99
TTS57T = 0.5271
so können wir das exakte 98% - Konfidenzinterval 1 für die Intaktwahrscheinlichkeit ρ angeben: m · F2m,2(n-m+1);g/2 [ P r P 2 ] = η - m + 1 + m · F, 2m,2(n-m+1);a/2
n
-m+(m+1,'F2(m+1),2(n-m);1-a/2.
89 · F 178,24;0.01 100- 89+ 1 + 8 9 - F 1 7 8 > 2 4 ; 0 _ 0 1
=
90 ' P 180,22;0.99 » 100-89 + 90 - F 1 8 0 > 2 2 ; 0 _ 9 9
Γ 89 - 0.5271 90 · 2.3752 1 [l2 + 80 · 0.5271 · 11 + $ 0 · 2.3752J [0.796 , 0.951]
Die Intaktwahrscheinlichkeit liegt also mit 98% Sicherheit zwischen 79.6% und 95.1%. Die Grenzen des approximativen 98% - Konfidenzintervalles ergeben sich aus der Approximation der Binomialverteilung durch eine Normal Verteilung zu
· 2 = 2 . in J,. 2 =
1 ' ( 2 n ? + "0 · 99 ; U 0.99 · v/ u 0.99 + 4 n P · * 1 - ^ )
5 - · (z · 100 · 0.89 + 2.3263 2 2 · (100 + 2.3263 ) ^ + 2.3263 · / 2 . 3 2 6 3 2 + 4 · 100· 0.89· 0.11
=
210.8233 ' f'83.4117 + 2.3263 · v/44.6717)
"210.6233 · (183.4117 Ϊ 15.5309) =0.8700ϊ0.0737 d.h. das approximative Konfidenzintervall zum Niveau 0.98 für die Intaktwahrscheinlichkeit eines Transistors aus der Produktion ist
260
Kap. 12: Lösungen zu den Aufgaben in Kapitel 7
[ p ^ p g ] = [0.8700 - 0.0737 , 0.8700 + 0.0737] = [0.7963 , 0.9437] = [79.63% , 94.37%]
.
261
Kap. 12: Lösungen zu den Aufgaben in Kapitel 8
8. Losungen zu den Aufgaben in Kapitel 8 AUFGABE 8.1: 2
In dieser Aufgabe sollen Hypothesen liber die Parameter μ und σ
der Normal-
Verteilung, aus der die Daten in der Tab. 2 des Kapitels 7 entstammen, geprüft werden. In Abschnitt 7 haben wir bereits arithmetisches Mittel und empirische Varianz der n = 9 Proben berechnet: χ = 30.056
s 2 = 2.053
und
.
a) Zum 5% Niveau i s t die Hypothese H q : μ = 28
H1: μ f28
gegen 2
bei unbekanntem Parameter σ
der Normal Verteilung mittels t - Test zu prü-
fen. Wegen | t | . | i ^ 8 . V n | = 130-056 - 28 . ^ 1 1 s 1 1 1 v/OSJ M . 3 0 5 > 2.306 = t 8 ; 0 _ 9 7 5 = t n _ 1 ; 1 _ a / 2 wird die Hypothese HQ verworfen, d.h. die Abweichung der mittleren Zerstörungszugkraft μ von μ 0 =28 kp i s t zum 5% Niveau s i g n i f i k a n t . ρ b) Möchte man prüfen, ob die Varianz σ der Zerstörungskraft s i g n i f i k a n t zum 2 5% Niveau von o Q = 4 verschieden i s t , so testet man die Hypothese H q : σ2 = 4
Η,: σ 2 + 4
gegen
.
Da der Erwartungswert μ unbekannt i s t , verwendet man hierzu die Teststatistik
und vergleicht sie mit den kritischen Werten χ
2
η-1;α/2
= χ
2
8;0.025
= 2
·180
'
x
2
n-1 ;1-α/2
= χ
2
8;0.975
= 17
"53
·
262
Kap. 12: Lötungen zu den Aufgaben in Kapitel 8
Die Hypothese H n kann hier nicht verworfen werden, d.h. die Abweichung 2 2 der Varianz σ
vom Wert O g = 4 ist zum 5% Niveau nicht signifikant, da
gilt 4;0.025 = 2 · 1 8 0 ί Χ 2
= 4
·106ϊ17·53
=
Χ8;0.975
"
AUFGABE 8.2: a) Bezeichnet μ^ den erwarteten Ertrag von Sorte 1, μ2 den erwarteten Ertrag von Sorte 2 und σ 2 die Varianz der Erträge bei Sorte 1 und 2, so ist bei 2 unbekannter Varianz σ die Hypothese H q : μ1 > μ 2
gegen
Η,: μ, < μ 2
zum 5% Niveau zu testen. Aus den Daten der Tab. 11 in Kap. 8 ergeben sich die mittleren Erträge zu
-
χ, = 1
1 2
1
12 ^
Υ
1 12 • *2=T2 J
x, • = 25.258
für Sorte 1
1i
x
2i
= 27
·258
für Sorte
und
2
und die gemeinsame Stichprobenvarianz ist 12 12 „ 2 1 (χι-j - Χι) + I (x?i · χ 2 } .2 _ i=1 i =1 ^ sp 12+12-2
=
58.411 + 34.867 = 22
_2
37g
4
. ,. n ·240 ·
so daß sich die Prüfgröße des Tests zu X
1"X2
Π Γ S P V/ T Τ?+T?
_ 25.258- 27.258
=
V4.240 / 6
ergibt. Da gilt t =-2.379 0
gegen
Hj: Δ < 0
mit Hilfe des Wilcoxon - Rangsummentests, so ist dies gerade das nichtparametrische Analogon zum Test in a). Um diesen Test durchführen zu können, müssen zunächst für beide Stichproben gemeinsame Rangzahlen vergeben werden, vgl. Tab. 5.
Tab. 5: Erträge x^·, Xg^ von je 12 Proben zweier Getreidestämme und zugehörige Rangzahlen R,., R~., vgl. auch Tab. 11 in Kapitel 8
i
x
1 2 3 4 5 6 7 8 9 10 11 12
R
1i
23.4 25.8 27.2 26.0 22.1 26.7 25.5 22.6 27.8 28.1 26.5 21.4
x
1i
4 8 16 10 2 14 7 3 18 19 13 1
R
2i
2i
17 9 21
27.3 25.9 28.4 26.2 29.7 25.0 24.3 29.6 28.2 26.4 27.0 29.1
11
24 6 5 23 20 12 15 22
Die Summe der Rangzahlen in der ersten Stichprobe (bei Sorte 1) ist nun 12
.I, R ii = m
,
so daß sich der Wert der approximativ standardnormal verteil ten Prüfgröße Τ (wegen der geringen Stichprobenumfänge ist die Approximation natürlich nicht besonders gut) zu T
_
115- 12 · (12 + 12 + 1) / 2 vM2 · 12 · (12+ 12+ 1) / 12
=
115 - 150
=
_2
Q21
V W
ergibt. Die Hypothese H Q muß also zum 5% Niveau verworfen werden, d.h. die Erträge von Sorte 2 sind signifikant höher als die von Sorte 1, da gilt
264
Kap. 12: Lösungen zu den Aufgaben in Kapitel 8
Τ =-2.021 < - 1 . 6 4 4 9 = u n n(- = u 0.05 α c) Unter Normal Verteilungsannahme für die Erträge der Sorten 1 und 2 i s t Hq:
gegen 2
H,:
2
zu prüfen, wenn σ 1 , σ 2 die Varianzen der Erträge von Sorte 1 und 2 bezeichnen. Da die Erwartungswerte μ^ und μ 2 unbekannt sind, ergibt sich mit 12 S
1=TT
S
2=TT
(x
1i " * 1 ) 2 = T T '
58-411 =5
·310
und
12 (χ2ί-*2)2=TV'34l867
= 3,170
dann der Wert der T e s t s t a t i s t i k für den F - Test zu s2
p . f l _ 5.310 . . '
2
7 7 m
-
„
1 ,675
·
Die Hypothese HQ identischer Varianzen kann zum S% Niveau somit nicht verworfen werden, da g i l t :
F
n 1 - 1 , n 2 - 1 ; a / 2 = F 11,11 ;0.025 = F,, „ ' . j
g7g
=
3~Ϊ73 =
0,288
< 1 .675 < 3.473= F.. ,, , n Q 7 C = F„ . 11,11;0.975 n^-1,η^-Ι;1-α/2 d) Trotz des geringen Stichprobenumfanges von n = n^ = 12 prüfen wir hier die Hypothese H Q , daß die Erträge der Sorte 1 symmetrisch um den Wert 25 vert e i l t sind, mit Hilfe der Approximation des Vorzeichenrangtests nach Wilcoxon. Um Hg: ζ = 25
gegen
Η,: ς + 25
zum 5% Niveau testen zu können, müssen wir zunächst die transformierten Daten x
1i
= x
1i "
25
f
Ur i=1,...,12
sowie die Rangzahlen R^,...
,
zu den Beträgen |xj.| dieser Daten und
Kap. 12: Lösungen zu den Aufgaben in Kapitel 8
265
die Größen c 1 ( . . . , c 1 7 bestimmen, vgl. Tab. 6.
Tab. 6: Transformierte Daten x ^ 'x^. - 2 5 zu den Erträgen x ^
der Sorte 1
(vgl. z.B. Tab. 4), Rangzahlen R^ und die Größen c i für i=1,...,12
i
x' 1i
R. 1
1 2 3 4 5 6
-1.6 0.8 2.2 1.0 -2.9 1.7
5 2 7 3 10 6
C
i
0 1 1 1 0 1
i 7 8 9 10 11 12
R
0.5 -2.4 2.8 3.1 1.5 -3.6
C
i
1 β 9 11 4 12
i
1 0 1 1 1 0
Somit ergibt sich +
12
Τ = l
c
i R i = 2 + 7 + 3 + 6 + 1 + 9 + 1 1 + 4 = 43
,
und wegen 4 3 - 12 . (12 + 1) / 4
43-39
V12 - (12 + 1)- ( 2 4 + 1 ) / 24
v/162.5
« 0 . 3 1 4 + 1.960 « u 0 _ 9 7 5 - u 1 _ a / 2 kann die Hypothese H n zum 5% Niveau nicht verworfen werden.
AUFGABE 8.3: An den Standorten Α und Β werden jeweils H n (A) = H n (B) = 500 Produkte geprüft, so daß insgesamt η = 1 0 0 0 Produkte kontrolliert werden. 30%
oder 300 Produkte fallen in Güteklasse I, d.h. H n (I) = 300
und
H n (II) = 1000 - Η (I) = 700
266
Kap. 12: Lösungen zu den Aufgaben in Kapitel 8
und von diesen 300 Produkten werden 40% oder 120 Produkte am Standort Α gefertigt, d.h. H n (Af1I) = 120
und
H n ( ß n I) = 300 - Hn(Afl I) = 180
.
Aus diesen Angaben läßt sich eine Vierfeldertafel der Merkmale "Standort" und "Güteklasse" bestimmen , vgl. Tab. 7.
Tab. 7: Vierfeldertafel der absoluten Häufigkeiten für die Merkmale "Standort" mit den Ausprägungen Α bzw. ß und "Güteklasse" mit den Ausprägungen I bzw. II
I
II
I
A
120
380
500
Β
180
320
500
ι
300
700
η = 1000
H
n
a) Faßt man die 500 KontrollProdukte am Standort als Serie von n 1 = 500 Bernoulli - Versuchen mit Realisationen I und II auf, so ist die Zufallsvariable Xggg=Anzahl der Produkte in Güteklasse I binomialverteilt mit Parametern n 1 = 500 und p^. Zu prüfen ist nun zum 5% Niveau die Hypothese H q : p 1 > 30%= 0.3
gegen
H 1 : p.jcO.3
Bezeichnet n 1 = Η η ( Α Π I) = 120 die Anzahl der Produkte aus Güteklasse I am Standort A, so ist n^ gerade die Realisation der Zufallsvariablen X 5 g Q und der Wert der (für p^ =0.3) approximativ standardnormalverteilten Prüfgröße des Tests berechnet sich zu
T =
V i '
0,3
y n , · 0.3· (1 -0.3)
=
120 - 500 · 0.3 \/5ÖÖ · 0.3 · 0.7
=
-30 y/TÖS
=
.
2
g28
Kap. 12: Lösungen zu den Aufgaben in Kapitel S
267
Da nun gilt Τ =-2.928 3.841 = X? ; 0 . 9 5 = X? ;1 _ α
900000000 52500000 .
vgl. auch Tab. 7, daß die Hypothese der Unabhängigkeit zum 5% Niveau verworfen werden muß, d.h. zum 5% Niveau ist die Abhängigkeit zwischen Standort und Güte signifikant. Interpretiert man die Zeilen der Vierfeldertafel aus Tab. 7 als unabhängige Heßreihen vom Umfang n 1 = n 2 =500 an den Standorten Α bzw. B, so sind m 1 = Η η ( Α Π I) = 120
und
m 2 = Η η ( Β Π I) = 180
Realisationen von Zufallsvariablen X n ^ B(500,p 1 ) und X n ^ Β ί δ Ο Ο ^ ) und obiger Unabhängigkeitstest entspricht dem Test von V
Pl = P2
ge9en
H
1 : P, + P 2
·
Da die Hypothese Hg zum 5% Niveau verworfen wird, sind die Wahrscheinlichkeiten ρ^ und p 2 für die Güteklasse I an den Standorten Α und Β signifikant verschieden zum 5% Niveau.
AUFGABE 8.4: Um ausgehend von den Daten der Tab. 12 aus Kapitel 8 und der dortigen Inter2 valleinteilung einen χ - Anpassungstest auf eine Poissonverteilung mit Para-
268
Kap. 12: Lösungen zu den Au/gaben in Kapitel 8
meter λ = 3.9' durchführen zu können, d.h. um H n : die Daten entstammen einer Po(3.9) - Verteilung gegen H.: die Daten entstammen einer anderen Verteilung
prüfen zu können, müssen die beobachteten Intervall häufigkeiten
und die
erwarteten Intervallhäufigkeiten E^ für i=1,...,6 bestimmt werden. Die Gesamtzahl von Daten ist gerade 12 η = l η . = 2608 j=0 J und die Wahrscheinlichkeiten p^ dafür, daß eine Beobachtung unter der Hypothese einer Po(3.9) - Verteilung in das i-te Intervall I. fällt, ist für i=1,...,6 gegeben durch Pl-
= P(X e I-) = F x ( y 1 + 1 ) - F x ( y i )
,
wobei Fy die Verteilungsfunktion der Po(3.9) - Verteilung und y^,
die
untere bzw. obere Grenze des Intervalls L· bezeichnen. Mit
3.9 T T
,-3.9
, für x=0,1 ,2,.
P(X = x): , sonst ergibt sich p^ für i=1,...,6 also durch Summation der Wahrscheinlichkeiten P(X = j) über diejenigen je{0,1,2,...}
ρ
= 1
J jei i
PCX = j) .
, die im Intervall
I 3^.e-3.9 jei. J "
,
In der Tab. S sind die Größen p^, die erwarteten Ε. = η · p^ = 2608 · p. sowie die beobachteten
jei.
J
liegen:
Intervallhäufigkeiten
Intervallhäufigkeiten
Kap. 12: Lösungen zu den Aufgaben in Kapitel S
269
für i=1,...,6 zusammengestellt.
Tab. i: Intervalle I = (y^ , y ^ ^ ] , erwartete
Intervallwahrscheinlichkeiten
p^, erwartete Intervallhäufigkeiten E^ = 2608 · p^ und beobachtete Intervallhäufigkeiten 0 i für i=1
1
(yi,yi+1J
Ji =
6
0.
Ei
Pi
1
1
( -oo ,0.5]
0 .020
52.160
57
2
(0.5,2.5]
0 .233
607.664
586
3
(2.5,4.5]
0 .395
1030.160
1057
4
(4.5,6.5]
0 .251
654.608
681
5
(6.5,9.5]
0 .094
245.152
211
6
(9.5, °o )
0 .007
18.256
16
Da k = 6 die Anzahl der Klassen ist, entstammt die Prüfgröße
x2=
des χ
2
I τ - - (ο- - ε , ) 2 = 8.021 1 1 i=1 b i
2 -Anpassungstestes (unter H Q ) approximativ einer χ - Verteilung mit
k - 1 = 5 Freiheitsgraden, so daß wir die Hypothese Hg wegen
X
2
= 8 . 0 2 U 1 5 . 0 9 =X2.0
g9
= x2.1;1_a
nicht verwerfen können. Die Abweichung der Daten von einer Poissonverteilung mit Parameter λ = 3.9 ist also zum 1% Niveau nicht signifikant.
AUFGABE 8.5: Ausgehend von den Angaben in der Tab. 13 des Kapitels 8 kann zum einen die Hypothese der Unabhängigkeit
"θ :
p
ij = p i . ' p .j
für
1=1,2
und
j=1»2,3
von Geschlecht * und mittlerer Oberfläche der Erythrozyten ö und zum anderen
270
Kap. 12: Lösungen zu den Aufgaben in Kapitel 8
die Homogenitätshypothese
H
0:
p
1j = p 2 j
für
j=1"2·3
»
die gerade besagt, daß die Verteilung der Zufallsvariablen zum Merkmal "mittlere Oberfläche der Erythrozyten" bei Frauen und Männern gleich ist, geprüft werden. Beide Hypothesenprüfungen basieren auf ein und demselben Testverfahren, welches die Prüfgröße 2C 3 / , Ο χ = y — π Λι η,. · η , V 1J i = 1 j = 1 "i. - ".j
ι
150 ,
+
.
+
/,„
150 Λ 7 T ^ T ' V 150
/,.
η
·ΑJ
2
f9a
73 - 60\ 2
73 · 47\ 2 , 150 Λ + " - W j 7TT4I,(v
77 « 4 3 ^
73 » 4 3 ^ ,
6
η. π. · Πη ·\
77·60\2,
150
150
ΤΠΎΤ'
(..
77 · 47\ 2
V
T5Ü-/
= 13.9295+ 0.0014+ 12.4472 + 13.2059 + 0.0013 + 11.8006 = 51.3859 mit dem kritischen Wert (hier zum Niveau α = 0.01 = 1%)
x
2 2 2 (r-1)(s-1);1-cT x 1 • 2 ; 0 . 9 9 = x 2 ; 0 . 9 9 = 9 - 2 1 0
vergleicht. Da gilt X 2 = 51.3859 > 9 . 2 1 0 = X 2 ; 0 > 9 9 müssen die Hypothesen HQ und Hg zum 1% Niveau verworfen werden, d.h. zum Niveau von 1Ϊ ist die Abhängigkeit von Geschlecht und mittlerer Oberfläche der Erythrozyten bzw. die Verschiedenheit der Verteilung der mittleren Oberfläche der Erythrozyten bei Männern und Frauen signifikant.
Kap. 12: Lösungen zu den Aufgaben in Kapitel 9
271
9. Losungen zu den Aufgaben in Kapitel 9 AUFGABE 9.1: In der Tab. 9 sind die Daten der Tab. 5 aus Kapitel 9 nochmals dargestellt und auch die Werte x.2 für i=1,...,8 angegeben.
Tab. 9: Absolute Abweichungen y., relative Luftfeuchtigkeiten x. und deren Quadrate x2i für i=1,...,8
i
xi
A
1
2
3
4
5
6
7
8
3.2
2.1
1.4
0.8
0.7
0.9
1.3
1.9
45
50
55
60
65
70
75
80
2025
2500
3025
3600
4225
4900
5625
6400
Hiermit ergeben sich die arithmetischen Mittel zu 8
y - ί i=1 Vi- 1.5375
,
8
; =1^x^62.5
,
—5" ι 8 9 (* l xf = 4037.5 » 8 i=1 1 und die Produkt- bzw. Quadratsummen sind ® 7 —7~ ® ι - —Τ l («χ -x)(xf- (x ) - l xf-8. χ. (χ ) i-1 1 1 1=1 1 = 2150000 - 8 · 62.5 · 4037.5 = 131250 8
8
l (x,-i)(y5-49o,r2,27;0.99
= F
r
r-1,r(s-1);1-K
"
Zwischen den drei Körnungen bestehen also zum 1% Niveau signifikante Unterschiede bzgl. der Biegezugfestigkeit von Gießharzbeton und mit |y t . - y 2 .1 = 1 2 · 9
·
ΙΫι. - y 3 .1 = 2 6 · 4
·
ly 2 .
= 13 5
·
sowie der 1% - Grenzdifferenz nach Scheffe* FSD K =FSD 0
01
= J 2 · 5.49 ·
70.585 = 12.450
erweisen sich a l l e Körnungen a l s s i g n i f i k a n t verschieden zu diesem Niveau.
AUFGABE 10.2: Die Daten der Tab. 8 in Kapitel 10 entsprechen dem Ausgang eines einfachen Blockexperimentes Y
ijk=,J
+ a
i
+ ß
j + eijk
für
i=1
· - - - » 4 » j = 1 , . . . , 5 und k=1,2,3
und wir erhalten a l s Mittelwerte bzgl. der Standorte (Faktor A) y,
= γ £ · 14226 = 948.400
y3
=TV*
14798
= 986.533
,
y2
= - ^ . 14681 = 978.733
,
,
y4
= - ^ · · 14077 = 938.467
,
als Mittelwerte bzgl. der Laboratorien (Faktor 8) y1
= - ^ ' 11908 = 992.333
,
y
= • ^ • 11462 = 955.167
,
y 3_
11376 = 948.000
,
y_ 4 > = - ^ · 11215 = 934.583
,
y.5. = T T "
11821
sowie a l s Gesamtmittel
=
985
·083
2
283
Kap. 12: Lösungen zu den Aufgaben in Kapitel 10
y
=
57782 = 963.033
.
Die Zerlegung der Gesamtstreuung
S S G =
4 5 3 l l l i=1 j = 1 k=1
1JK
-6 0 * y2
= 55820726 - 60 · y 2
= 174733.940
: SSA + SSB + SSE ist 4 15 · ( l
J = 15 · (3711349.200 - 4 · y 2
)
SSB = 12 ' ( l )/Zi - 5 - y 2 ) = 12 · (4639607.986 - 5 · y 2 \j=1 •··>
)
SSA
y2
-4-y2
24245.910
,
= 29303.760 SSE = S S G - S S A - S S B = 121184.270
,
so daß sich mit den Freiheitsgraden r-1 = 3
,
s-1=4
und
η - r - s + 1 = rst - r - s + 1 = 52
dann die mittleren Quadratsummen MSA = 1 · SSA = 8081.970
,
MSB = | · SSB = 7325.940
,
MSE = 5 ^ · SSE = 2330.467 ergeben. Die Hypothese A HQ: Die Standorte haben keinen Einfluß auf die Analyseergebnisse muß zum Niveau 2.5% dann verworfen werden, da gilt MSA 8081 .970 H 5 T - 2330.467
=
3
, „ - ,Q c · 4 6 8 > 3-39~F3,52;0.975
= F
c
r-1 ,n-r-s+1 ;1-
3.05 ~ F, M S T " 2330.467 4,52 ;0.975 " F s-1 ,n-r-s+1 ;1-κ zum Niveau κ =2.5% nicht aufrecht erhalten werden. Zum 2.5% Niveau sind also sowohl die Standorte als auch die Laboratorien signifikant verschieden. Prüft man mittels multipler Vergleiche nach Schefffe, ob es Standortpaare gibt, die sich zum 2.5% Niveau unterscheiden, so stellt man fest, daß dies nicht der Fall ist: Keine der betraglichen Differenzen |y,..-y 2 ..| = 30.333 |y,..-y4J
=
9,933
1*2.. "*4..Ι
= 40
·266
,
|y
K
_-y
3
J
·
Ι ? 2.."*3..Ι
»
1 * 3 . .
= 38.133 =
=
7
·800
48
·066
ist größer als die Grenzdifferenz
Das gleiche Resultat erhält man für die Laborpaare, wo die Differenz zwischen den Laboratorien 1 und 4 mit 57.750 am größsten, jedoch nicht größer als die ,8 =68.838 ist. Grenzdifferenz FSD°
Geht man nun zum Modell der einfachen Varianzanalyse über, in dem nur noch der Faktor Standorte (A) berücksichtigt wird, so bleiben SSA und die zugehörigen Freiheitsgrade r - 1 = 3 und somit MSA erhalten, und als neue Restquadratsumme ergibt sich SSE' = SSE + SSB = 121 184.270 + 29303.760 = 150488.030 mit den Freiheitsgraden ( n - r - s + 1) + ( s - 1 ) = n - r = 6 0 - 4 = 56
.
Somit ist MSE 1 = -X · SSE" = 2687.286 und die Prüfgröße für den Test von HQ=HQ: Die Standorte haben keinen Einfluß auf die Analyseergebnisse ergibt sich zu
Kap. 12: Lösungen zu den Aufgaben in Kapitel 10
MSA 8081.970 , nn7 MST" " 2687.206 " 3 · 0 0 7
·
A Die Hypothese Hj} kann (wenn man die Unterschiede in den Laboratorien unberücksichtigt läßt) zum 2.5% Niveau nicht mehr verworfen werden, da g i l t 3.007 i 3 . 3 6 - F 3 ( 5 6 ; 0 _ 9 7 5
285
Kapitel 13: Klausuren
Dieses Kapitel enthält Klausuraufgaben mit Lösungen, die noch einmal der Kont r o l l e und Einschätzung des eigenen Stoffverständnisses dienen. Anders a l s bei den Übungsaufgaben, die sich ja jeweils auf ein recht überschaubares Kapitel des Buches beziehen, werden in den Klausuraufgaben teilweise verschiedene Stoffgebiete miteinander kombiniert, so daß die Schwierigkeit auch darin l i e g t , die Aufgabenstellung r i c h t i g einzuordnen bzw. den richtigen Lösungsansatz zu finden. Kann man die Klausuraufgaben lösen, so zeigt dies, daß man den im Buch behandelten Stoff auch beherrscht. Die Klausuren bestehen aus jeweils acht Aufgaben, zu deren Lösung man beliebige H i l f s m i t t e l , natürlich mit Ausnahme der Lösungen zu den Klausuraufgaben, verwenden kann, insbesondere also auch die inhaltlichen Kapitel dieses Buches sowie die Übungsaufgaben nebst Lösungen. Vor den Aufgaben jeder Klausur findet man ein Punkteschema für die Aufgaben bzw. Aufgabenteile, in dem die erreichbaren Punktzahlen angegeben sind. Links neben diesen Punktzahlen i s t Platz, um die erreichten Punktzahlen eintragen zu können; diese ermittelt man anhand der Bewertungshinweise in den Lösungen zu den Klausuraufgaben. Insgesamt sind bei jeder Klausur maximal 80 Punkte zu erreichen. Es wird jedoch nicht erwartet, daß man in der vorgegebenen Zeit von drei Stunden (180 Minuten) a l l e Aufgaben einer Klausur l ö s t . Daraus erklärt sich auch (vgl. das "Vorblatt" jeder Klausur) die angegebene Bewertungsskala: Zum "Bestehen" einer Klausur benötigt man lediglich 25 von 80 möglichen Punkten und mit mehr als 50 Punkten erhält man bereits die Note "sehr gut".
Kap. 13: Klausur A
289
Klausur A
BEARBEITUNGSZEIT:
180 Minuten
ERLAUBTE HILFSMITTEL: beliebig, mit Ausnahme der sich anschließenden Lösungen zu den Klausuraufgaben PUNKTESCHEMA:
Aufgabe
(erreichte / erreichbare Punktzahl)
a
b
c
d
1
1
3
3
/
/
6
2
4
3
/
/
7
3
4
8
/
/
12
4
4
4
4
2
14
5
/
/
/
/
10
6
/
J
/
/
10
7
/
/
/
/
7
8
2
2
4
6
14
Gesamtpunktzahl
80
NOTE: NOTENSKALA:
5 (nicht bestanden) k
(ausreichend)
0-24
Punkte
25 - 34 Punkte
3 (befriedigend)
35 - 42 Punkte
2 (gut)
43 - 50 Punkte
1 (sehr gut)
51 - 80 Punkte
290
Kap. 13: Klausur A
AUFGABE A.l:
(3 + 3 = 6 Punkte)
Belm Samstagslotto 6 aus 49 (ohne Berücksichtigung der Zusatzzahl) betrage der Einsatz pro Spielfeld 1 DM, Die Gewinne seien im 1. Rang (6 Richtige) 1.2 Millionen DM, im 2. Rang (5 Richtige) 8000 DM, im 3. Rang (4 Richtige) 90 DM und im Rang (3 Richtige) 3.5 DM. a) Wie gross sind die Wahrscheinlichkeiten, bei einem Spielfeld im 1., 2., 3. und Rang zu liegen ? b) Sie spielen regelmässig ein Jahr (52 Wochen) lang 6 Spielfelder. Wie gross ist der zu erwartende Gewinn ?
AUFGABE A.2:
(4 + 3 = 7 Punkte)
Zwei konkurrierende Unternehmen produzieren Stromabnehmer für Strassenbahnen. Ein stadtisches Verkehrsunternehmen will einen Grossauftrag erteilen und schickt daher einen Kontrolleur zu Jedem der Betriebe, der 30 bzw. 50 Stromabnehmer auf ihre Funktionsfähigkeit hin prüft. Von den 30 Stromabnehmern im ersten Betrieb waren 25 funktionsfähig, von denen Im zweiten Betrieb waren es 44. a) Ist bei der Auftragsvergabe einem der Unternehmen ein Vorzug zu gewähren, wenn man zum 5% Niveau entscheidet ? b) Berechnen Sie ein approximatives Konfldenzlntervall zum 95% Niveau für die Wahrscheinlichkeit der Funktionsfähigkeit eines Stromabnehmers vom zweiten Betrieb.
AUFGABE A.3:
(4 + 8 = 12 Punkte)
An η = 11 Tantal - Kondensatoren wurde die Lebensdauer a (in 100 Stunden) in Abhängigkeit von der Umgebungstemperatur x., und der Spannung x 2 beobachtet. Dabei ergaben sich folgende Mittelwerte, empirische "Varianzen" und "Kovarianzen": y
= 52.545
,
Sy
=368.073
,
SYXi
= 62.947
,
= 33.091
,
X2
= 45.455
,
sj
= 18.491
,
SJ
= 52.273
,
SYX2
=-71.713
,
δχ
= -7.555
.
χ
Kap. 13: Klausur Λ
291
a) Schätzen Sie die Parameter der multiplen Regresslonsfunktlon B = e0 + ß 1 x 1 + ß 2 x 2 b) Prüfen Sie zum 5% Niveau, ob die Prognose der Lebensdauern von Tantal -Kondensatoren dadurch signifikant besser wird, dass Sie die Spannung berücksichtigen,
AUFGABE A.4:
(4 + 4 + 4 + 2 = 14 Punkte)
Die Zufallsvariablen X und Y besitzen die gemeinsame Dichte f x , Y (x,y) =
Zjg5;(2xy + 3x^) 0
für χ e [0,31 und y e [0,51 sonst
a) Bestimmen Sie die Randdichten der Zufallsvariablen X und Y, b) Berechnen Sie Erwartungswerte sowie Varianzen von X und Y. c) Wie gross sind die Kovarianz und die Korrelation der Zufallsvariablen X und Y ?
d) Bestimmen Sie die a-Quantlle der Verteilung von Y.
AUFGABE A.5:
d o Punkte)
Ein asymmetrisches Gehäuse wird aus Oberteil und Unterteil zusammengesetzt. Das Oberteil kann an einer von drei Maschinen mit Zuverlässigkeiten von 90%, 80% bzw. 95% gefertigt werden. Für die Produktion des Unterteils stehen zwei Maschinen bereit; es ist mit 95% Sicherheit exakt gefertigt, wobei von 100 exakten Unterteilen 70 von Maschine 1 und von 100 defekten Unterteilen 60 von Maschine 1 hergestellt werden. Ober- und Unterteil werden dann von einem der beiden Monteure, die in 20% bzw. 10% der Fälle durch Krankheit etc. nicht zur Verfügung stehen, zusammengeschraubt. Mit welcher Wahrscheinlichkeit entsteht ein Gehäuse mit exakt gefertigtem Unterteil, wenn dieses von Maschine 1 bzw. wenn dieses von Maschine 2 gefertigt wurde ?
292
Kap. 13: Klausur A
AUFGABE Α. 6:
d o Punkte)
Ein Unternehmen soll Stahlplatten vorgeschriebener Dicke produzieren. Durch Ungenaulgkelten in der Maschlnenelnstellung treten jedoch leichte Abweichungen auf. Prüfen Sie anhand der η = 4 8 Abweichungsbestimmungen (in 1/10 mm) -1.75
J
0.51
J
-0.93
J
3.02
*
-0.16 i -0.57
*
1.42
J
-1.93
J
-0.76
j
0.54
J
1.32
J
-0.87
J
-1.31
f
-0.99
i
0.83
J
0.41
J
0.88
J
0.18
J
-0.50
i
-0.87
J
-2.35
J
-0.96
J
1.59
J
0.65
j
-1.34
I
-2.87
;
0.86
J
0.36
J
-1.09
J
-1.43
J
-0.63
*
0.37
t
-0.23
i
0.74
J
-1.27
>
-0.12
J
0.25
j
0.43
i
-0.87
J
0.17
i
1.21
J
-0.25
*
0.55
J
-1.52
J
-0.37
J
2.30
J
1.28
;
-0.01
J
ob zum 5% Niveau signifikante Abweichungen der Abwelchungsvertellung von einer Drelecksvertellung mit Parametern -3 und +3 vorliegen. Verwenden Sie dabei 6 Intervalle derart, dass in den beiden mittleren und in den beiden äusseren Intervallen je 15% und in den übrigen Intervallen Je 20% der Messwerte zu erwarten sind.
AUFGABE A.7:
(7 Punkte)
Geben Sie eine Approximation für die Wahrscheinlichkeit an, dass bei 48 Messungen von Stahlplatten die mittlere Abweichung vom Sollwert betragsmösslg höchstens so gross wie in Aufgabe 6 ist, wenn Sie von einer Drelecksvertellung mit Parametern -3 und +3 für die Abweichungen ausgehen.
AUFGABE A.8:
(2 + 2 + 4 + 6 = 14 Punkte)
Bei der Oberprüfung einer automatischen Flaschenabfüllanlage für 0.5 Liter - Bierflaschen wurde der tatsächliche Inhalt, den Sie als normalvertellt annehmen können, von η = 1 5 Flaschen gemessen. Hierbei ergab sich (Angaben in Milliliter) ein Mittelwert von χ = 507 und eine Standardabweichung von s = 6. a) Berechnen Sie die Grenzen eines 95% Konfldenzlntervalls für
Kap. 13: Klausur A
293
die Varianz des Flaschenlnhalts. b) Wieviele Beobachtungen n' müssen Sie nach dem Varlatlonszahlverfahren voraussichtlich machen, um eine relative Genauigkeit von 0.5% eines 95% Konfldenzljtervalls für den erwarteten Inhalt abzusichern ? c) Benutzen Sie die Ergebnisse für die ersten 15 Flaschen und die noch notwendigen Beobachtungen (der Reihe nach) aus der Reihe 510 , 497 , 493 , 515 , 501 , 515 , 507 , 495 , 506 , 498 , 5Ü8 , 503 , 493 , 509 , 510 , 501 , 492 , 506 , 497 , 503 , um zu prüfen, ob die Anzahl n' ausreichend war, Wenn nicht, bestimmen Sie ein neues n " , benutzen Sie zusätzlich die nächsten n " - n ' Werte obiger Datenreihe usw., bis Sie ein 95% Konfldenzlntervall mit der gewünschten Genauigkeit erhalten. d) Berechnen Sie die Grenzen dieses Konfldenzlntervalls und prüfen Sie zum 2.5% Niveau, ob die Abfüllanlage signifikante Abweichungen von der vorgeschriebenen Norm aufweist, nach der (bei einer Standardabweichung von σ = 6 ) In höchstens 5% der Falle ein Betrug am Kunden stattfinden darf.
Kap. 13: Lösungen zur Klausur A
295
Lösungen zur Klausur A
AUFGABE Λ.1: a) Das Samstagslotto 6 aus 49 entspricht einer Kombination ohne Wiederholung von 6 aus 49 Ziffern, so daß es insgesamt
(k)
=
(δ9) °
13983816
AUFGABE A.4: a) Die Randdichte ί χ ( χ ) der Zufallsvariablen X hat den Wert 0 für x4[0,3] und für x€[0,3] i s t
fx(x)- \
f
x,Y(x.y)
d
0
0 4x
=
2
( 2 x y 3 x 2 ) dy
y = |
-00
25
0 6x
2
ς
10
6
2 · ( 5 x + 3x )
Die Randdichte der Zufallsvariablen Y i s t
2
(2 Punkte)
302
Kap. 13: Lösungen zur Klausur A
J j g j · · (2xy + 3 x 2 ) dx
,
fürye[0,5]
f y ( y ) = | f x > Y ( x , y ) dx = , sonst und e s e r g i b t
sich
3 | ^ . ( 2 x y
+
3x2) d x = ^ . J
χ dx
x 2 dx
0 3
o
+
6 Γ1 * * - l r «
ο
2
3l3 J0
... 6 (2 Punkte)
b ) Es
ist E(X) = j χ · f x ( x ) dx = | ^ -oo
[
2
Γ5
=
· ( 5 x 2 + 3 x 3 ) dx
ο
3
3
4Γ
2
f
AC
. 243 \
423
(1 Punkt)
( =2.136)
E ( X 2 ) = | x 2 · f x ( x ) dx = | ^
2
Γ5
"19 [f
x
4
3
+ΐ χ
"
5Ι 3 Jn
· ( 5 x 3 + 3 x 4 ) dx
=
2 w
/ 405
x
729 \ _
4941 " w
= TTÜ f = 4 . 9 9 1 ) und s o m i t Var(X)=E(X2)-(E(X))2=^-($ = 1033 ( = 0 . 4 2 7 )
.
(1 Punkt)
Für d i e Z u f a l l s v a r i a b l e Y e r h a l t e n w i r 5 E(Y)=J y f Y ( y ) -OO 2 ( 125 =
+
dy = j ^ . ( y 2 + 3y) dy 0 75 \ 475 95 , , 0 7 Q * = T5S = 3 3 ^ = 2 . 8 7 9 )
+
(1 Punkt)
303
Kap. 13: Lösungen zur Klausur λ
und mit 5 E ( Y 2 ) = | y 2 -f Y (y) dy = | -00 =
(y 3 + 3y 2 ) dy =
[
{
W
]
0
2 (625 s r I T +
=^
. - Λ _ 1125 J ΤΠΓ
1 2 5
(= 10.227)
ergibt sich
Var(y) = E ( Y 2 ) - ( E ( y ) ) 2 = ^ - ( | | ) 2 =
(= 1.940)
= «475
.
(1 P u n k t )
c) Die Kovarianz von X und Y ist mit Cov(X.Y) = E(X · Y) - E(X) · E(Y) und 00
E(X · Y) = |
5 3
00
f
0 0
—00 —oo 5
= m '
(2x 2 y 2 + 3x 3 y) dxdy
x - y f x > Y ( x . y ) dxdy = J j 3
\ ' J0 y2
5
χ 2 dxdy +
\'
Tis'
0
0
ί
0
, 0
3
y
υ
5
r
0
0
χ 3
d x d y
0 r,
λί3 υ
υ
υ
36 1 2 5 . 2 4 3 25 1500 , 135 495 ' 3 Μ Ι * Τ ' ~?9Γ =
(= 6.098)
dann gerade < , 805 47 95 Γ C o v iν Xν . Y ) « · ^ - ^ · 33
(2 Punkte)
304
Kap. 13: Lösungen zur Klausur A
=
" M t ( = -0-052)
,
(1 Punkt)
so daß sich die Korrelation zwischen X und Y berechnet zu Corr(x)Y)
.
Cov(X»Y)
,=
VVar(X) · Var(V)
-0-052
. _0.057 _
(1
punkt)
n/0.427 - 1.540
d) Das α-Quantil ζ α der Verteilung von Y berechnet sich aus ζ
W
=
α
J 1 =
5T
ξ
f ( y ) dy = Y r2
α
6 55"
r
α
J sr(y
+3
>= ^-[ry
2 + 3
ξα
yi 0 a
α
ι =α
(1 Punkt)
Damit ist hier ζ2 + 6 · ζ - 5 5 · α = ξ 2 + 6 · ζ + 9 - 9 - 5 5 · α = ( ξ + 3 ) 2 - 9 - 5 5 · · α α α α α α Ιο
,
d.h..es ist ξ + 3 = + V9 + 55 · α α
,
und somit ergibt sich ξ α = + V/9+55 · α - 3
für α€(0,1)
.
(1 Punkt)
AUFGABE Α.5: Die drei Maschinen zur Fertigung des Oberteils und die beiden Monteure bilden je ein Parallelsystem. Diese beiden Parallelsysteme sind zu einem Seriensystem verknüpft, welches neben den beiden "Parallelsystemkomponenten" eine dritte Komponente beinhaltet, deren Zuverlässigkeit gerade die Wahrscheinlichkeit eines exakt gefertigten Unterteils ist, vgl. auch Abb. J. Je nachdem, ob das Unterteil von Maschine 1 oder Maschine 2 gefertigt wurde, ist diese Wahrscheinlichkeit zunächst zu berechnen.
305
Kap. 13: Lösungen zur Klausur A
Abb.
1: System z u r H e r s t e l l u n g e i n e s asymmetrischen Gehäuses
Bezeichnet Α das E r e i g n i s " U n t e r t e i l e x a k t " und Β das E r e i g n i s
(2 Punkte)
"Unterteil
von Maschine 1 " , so e r g i b t s i c h aus der A u f g a b e n s t e l l u n g P(A) = 0 . 9 5
,
P(B | A)
= 0.7
,
P(B | Ä)
= 0.6
.
(1 Punkt)
Die Z u v e r l ä s s i g k e i t der d r i t t e n Komponente des Seriensystems l ä ß t s i c h dann nach der Formel von Bayes bestimmen, und zwar e r g i b t s i e s i c h zu P(B | A) · P(A) P(A I B ) = P(B | A) · P(A) + P(B | A) · P(A) 0.957
0.7 · 0.95 0 . 7 - 0.95 + 0 . 6 - 0.05
,
(1 Punkt)
f a l l s das U n t e r t e i l von Maschine 1 stammt, und zu P(B ] A) · P(A)
P(A| Β);
P(B | A) · P(A) + P(B | Ä) · P(Ä) 0.934
0 . 3 · 0.95 0 . 3 - 0.95 + 0.6 · 0.05
,
f a l l s das U n t e r t e i l von Maschine 2 g e f e r t i g t wurde. Die Z u v e r l ä s s i g k e i t des Maschinen - P a r a l l e l systems i s t nun gerade
Z(MA) = 1 -
|| (1 - Z(MA i ) ) i=1
= 1 - (1 - 0 . 9 ) · (1 - 0 . 8 ) · (1 - 0 . 9 5 ) = 1 - 0.1 · 0.2 · 0.05
(2 Punkte)
306
Kap. 13: Lösungen zur Klausur A
= 0.999
(1 Punkt)
und die Zuverlässigkeit des Monteur - Parallel systems ist
Z(M0) = 1 -
2_ II (1 - Z(M0 i)) i=1
= 1-0.1-0.2 = 0.98
.
(1 Punkt)
Somit beträgt die Zuverlässigkeit des Gesamtsystems dann Z S y s ( 1 ) = Z ( M A ) - Z ( M 0 ) - P ( A | B) = 0.999 · 0.98 · 0.957 « 0 . 9 3 7 = 93.7%
,
(1 Punkt)
wenn das Unterteil von Maschine 1 gefertigt wurde, bzw. Z S y s ( 2 ) = Z(MA) · Z(M0) · P(A | B) = 0.999 · 0.98 · 0.934 « 0 . 9 1 4 = 91.4%
,
(1 Punkt)
wenn das Unterteil von Maschine 2 gefertigt wurde.
AUFGABE A.6: 2 Mittels χ -Anpassungstest soll hier zum 5% Niveau die Hypothese HQ: Die Abweichungsmessungen entstammen einer Dreiecksverteilung mit Parametern -3 und +3
(l Punkt)
geprüft werden. Dazu sollen k = 6 Intervalle
derart bestimmt werden,
daß unter der Hypothese je 20% der Beobachtungen in die Intervalle ^
und Ig
und je 15% der Beobachtungen in die übrigen Intervalle fallen, d.h. die Intervallgrenzen sind Quantile der Dreiecksverteilung mit Parametern -3 und +3. Ist ξ α das α-Quantil dieser Verteilung, so gilt gerade ~ J
4=
[ξ
· ξ 0.15 }
0.5,ζ0.65)
'
1
'
V
2=
[ξ
0.15' ζ 0.35^
'
[ξ
0.65' ξ 0.85 }
und
!
3=
[ξ
0.35' ζ 0.5^
V^O.eS*
"
}
'
(2 Punkte)
Kap. 13: Lösungen zur Klausur Λ
307
Da die Dreiecksverteilung mit Parametern - 3 und +3, welche die Dichte
, für - 3 < χ < 0
W · « V « ) .
, für
i-i-
0
qqqj
Kap. IS: Lösungen zur Klausur A
312
ergibt. Es muß a l s o d i e k l e i n s t e Zahl n " von Beobachtungen b e s t i m m t w e r d e n , so daß m i t
gilt
η >
ν·-1;1-α/2·ν'
2
3. 0.01362 _ Λ η""1 η " - 1 ;0.975 " "QJJQ?
;0
·975 '
,
,0οΛ
Es i s t 30
^ t 2 9 0 975 '
31 > t30-0
7
·3984
=
2.0452 · 7.3984^30.940
975 ' 7 . 3 9 8 4 = 2 . 0 4 2 2 · 7.3984=» 30.850
,
so daß w i r ( 1 Punkt)
n " = 31
e r h a l t e n . Z u s ä t z l i c h zu den b i s h e r i g e n 24 F l a s c h e n werden a l s o j e t z t noch 7 F l a s c h e n aus d e r U r l i s t e i n d i e Rechnung e i n b e z o g e n , so daß s i c h wegen 24 ι X. = 12144 i=1 1
24 ? l * • = 6145958 1 i=1
und
dann d e r neue M i t t e l w e r t und d i e neue e m p i r i s c h e V a r i a n z e r g e b e n z u : 31
,
= TT
x
/ 24
i
31 x
i
+
J
2 5
x
i ) = I T
( 1 2 U 4
+
3522
= - j p 15666 « 505.355 31
,
,
,24
( s - ^ i i ,
, x
l ·
31 , l 2 S - f - 31 . C x " ) 2 )
^ j - · ( 6 1 4 5 9 5 8 + 1772308 - 31 · 5 0 5 . 3 5 5 2 ) ^ j · · (7918266 - 7916893.956)
Kap. 13: Lösungen zur Klausur A
313
1372.044 = 45.735
(1 Punkt)
Die j e t z t erreichte tatsächliche Genauigkeit des 95%- Konfidenzintervalles für μ i s t also £„
. V n
,0.975 . s : , 2 J 4 2 , j g g . •n"
x"
VIT
505
0
.0049
μ 0
gegen
Η ^ μ ί μ μ,0,
getestet werden.
(1 Punkt)
Der Vergleichswert μ 0 i s t dabei so zu wählen, daß bei einer Standardabweichung von σ = 6 in 5% a l l e r Fälle ein Betrug am Kunden s t a t t f i n d e t , d.h. so, daß höchstens 5% a l l e r Flaschen weniger a l s 500 m£ Bier enthalten. Gesucht i s t also μ 0 derart, daß für die N(p Q ,6 2 ) - v e r t e i l t e
Zufallsvariable
Y gilt: P(Y < 500) = P(Y < 500) = 5% = 0.05 Es ergibt s i c h mit P ( Y < 500)= Φ bzw.
f500 - μ 0
0.05
(2 Punkte)
314
Kap. 13: Lösungen zur Klausur A
500 - μ 0
M0 - 500'
6
6
daß μ η - 500 Λ
=u0.95=1·6449
"
i s t und somit daß Pq = 6 · 1 .6449 + 500 = 509.8694
(1 Punkt)
gewählt werden muß. Die Hypothese Hg: μ > 509.8694 kann dann mittels t - Test geprüft werden. Es i s t t
t=
x " - 509.8694 .-τ, 505.355 - 509.8694 r-n · vn = s
--3.717 0.99 zu bestimmen. Diese Ungleichung läßt sich äquivalent umformen zu 0.8 n < 1 - 0.99 = 0.01 d.h. η · l n ( 0 . 8 ) < ln(0.01] oder
n
1n(0.01) . -4.6052 - i H r r a r = qrzz3T=
,n 20 642 ·
;
die gesuchte Zahl nötiger Herstellungsversuche i s t also η = 21.
(2 Punkte)
324
Kap. 13: Lösungen zur Klausur Β
AUFGABE B.3: Die gewinnoptimale E i n k a u f s p o l i t i k des Händlers i s t n a t ü r l i c h diejenige, bei welcher der Gewinn im Mittel möglichst groß i s t . Gesucht i s t a l s o diejenige Zahl k von Kisten derart, daß der erwartete Erlös abzüglich der Unkosten von k · 5 DM maximal
ist.
Kauft die Gärtnerei k Kisten und verkauft s i e davon j < k Kisten, so i s t der Gewinn gerade durch die Gewinnfunktion (1 Punkt)
gk(j) = 20j-5k gegeben.
Für k = 0 , . . . , 5 i s t nun der Erwartungswert der Z u f a l l s v a r i a b l e n 9 k ( X k ) zu bestimmen, wobei X k diejenige Z u f a l l s v a r i a b l e i s t , welche die Anzahl verkaufter Kisten in einer Woche beschreibt. Da der Händler n a t ü r l i c h nicht mehr Kisten verkaufen kann, a l s er eingekauft hat, ergeben s i c h aus den Wahrscheinlichkeiten P(X = j ) der Aufgabenstellung, die n a t ü r l i c h darauf basieren, daß mindestens 5 Kisten zur Verfügung stehen, die Wahrscheinlichkeiten P(X k = j ) für j=0
k < 5 in folgender Art und Weise: , für j < k
P(X = j ) P(X k = j ) =
(4 Punkte)
5
l P(X = i ) i=k
, für j = k
Die f ü r k = 0 , . . . , 5 zu ermittelnden Erwartungswerte sind a l s o gerade k E(g
k(Xk))= \
9
k(j) ·
P (
V
j)
k-1 5 = I g j j ) · P(x = j ) + g k ( k ) · l PCX = i ) K i=k j=0 K i=k und es ergibt s i c h
E(g0(x0)) = o + g 0 ( o ) ·
5 I
P(X = i )
= (20 · 0 - 5 · 0) · 1 = 0 · 1
=0
,
(1 Punkt)
325
Kap. 13: Lösungen zur Klausur Β
5 E(g 1 (X l )) = g 1 ( 0 ) ' P ( X = 0) + g 1 ( 1 ) · j
P(X = i)
= (20 · 0 - 5 · 1) · 0.05 + (20 · 1 - 5 · 1) · 0.95 = -5 · 0 . 0 5 + 1 5 · 0.95 = 14 1 E(g 2 (X 2 )) = ^
, 5 g 2 (j) · P(X = j) + g 2 (2) · ^
P(X = i)
= (20 · 0 - 5 · 2) · 0.05 + (20 · 1 - 5 · 2) · 0.1 + (20 · 2 - 5 · 2) · 0.85 = -10 · 0.05+ 10 · 0.1 + 30 · 0.85 = 26 2 E(g,(X,)) = l *
J
j=0
, 5 g,(j) · P(X = j) + g,(3) · l s
*
P(X = i)
i=3
= (20 · 0 - 5 · 3) · 0.05 + (20 · 1 - 5 · 3) · 0.1 + (20 · 2 - 5 · 3) · 0.2 + (20 · 3 - 5 · 3) · 0.65 = -15 · 0.05 + 5 · 0.1 + 25 · 0.2 + 45 · 0.65 = 34 E(g4(xj)= *
4
3 I j=0
, 5 g 4 (j) · P(x = j) + g 4 (4) · l *
4
P(x = i)
i=4
= (20 · 0 - 5 · 4) · 0.05 + (20 · 1 - 5 · 4) · 0.1 + (20 · 2 - 5 · 4) · 0.2 + (20 · 3 - 5 · 4) · 0.35 + (20 · 4 - 5 · 4) · 0.3 = -20 · 0.05 + 0 · 0.1 + 20 · 0.2 + 40 · 0.35 + 60 · 0.3 = 35
,
4 5 E(gc(Xc))= l gr(j) · P(X = j) + g R (5) · I s s s j=0 ö i=5 =
P(x=i)
5 l g s (j) · P C X - J ) j=0 b
= (20 · 0 - 5 • 5) · 0.05 + (20 · 1 - 5 · 5) · 0.1 + (20 · 2 - 5 · 5) · 0.2 + (20 · 3 - 5 · 5) · 0.35 + (20 · 4 - 5 · 5) · 0.2 + (20 · 5 - 5 · 5) · 0.1 = -25 · 0.05 - 5 · 0.1 + 15 · 0.2 + 35 · 0.35 + 55 · 0.2 + 75 · 0.1 =32
(3 P u n k t e )
Das Maximum 35 dieser Erwartungswerte ergibt sich beim Einkauf von k = 4 Geranienkisten, so daß die Gärtnerei jede Woche 4 Kisten kaufen muß, um auf Dauer gesehen gewinnoptimal zu arbeiten.
(l
Punkt)
326
Kap. 13: Lösungen zur Klausur Β
AUFGABE B.4: In der Abb. 2 i s t das Z u v e r l ä s s i g k e i t s s c h a l t b i l d der Stereoanlage darges t e l l t , die dann funktionsfähig i s t , d.h. in mindestens einem Raum kann Musik gehört werden, wenn der Verstärker (V), mindestens eine der Programmquellen Tuner (T), Plattenspieler ( S ) , Cassettenrecorder (C) sowie mindestens ein Lautsprecherpaar (L^.L,,) intakt i s t .
τ V
s c
Li L2
Abb. 2: Z u v e r l ä s s i g k e i t s s c h a l t b i l d der Stereoanlage
(2 Punkte)
Das Parallelsystem "Programmquelle" (Q) i s t intakt mit der Wahrscheinlichkeit Z(Q)= P(Q intakt) = 1 - [1 - P(T i n t a k t ) ] · [1 - P(S i n t a k t ) ] · [1 - P(C i n t a k t ) ] = 1 - (1 - 0.99) · (1 - 0.98) · (1 - 0.95) = 1 - 0.01 · 0.02 · 0.05 = 0.99999
,
(1 Punkt)
das Parallelsystem "Lautsprecher" (L) i s t intakt mit der Wahrscheinlichkeit Z ( L ) = P(L intakt) = 1 - [1 - P(L, i n t a k t ) ] · [1 - P(L 2 i n t a k t ) ] = 1 - 0.01 · 0.01 = 0.9999
(1 Punkt)
und der Verstärker arbeitet mit der Z u v e r l ä s s i g k e i t Z(V) = P(V i n t a k t ) = 1 - P(V defekt) = 1 - 0.02 = 0.98
.
Kap. 13: Lösungen zur Klausur Β
327
Die Zuverlässigkeit der Stereoanlage ergibt sich dann als Zuverlässigkeit des Seriensystems mit den Komponenten V, Q und L: Z( Stereoanl age ) = P( System intakt) = P(V intakt) · P(Q intakt) · P(L intakt) = Z(V) · Z(Q) · Z(L) = 0.98 · 0.99999 · 0.9999 = 3.85=« F,
Kn, 506
.on 480 ^ r (/y
_v2
u0 . 1 u0 i 2r - r
-\C
i"y)
-'
2
" Y,(X1,X2) I C ( 3 - 2 ) . 0.955 '
ScQn
»
·133 n QC;
= F.
Sowohl der Beitrag der quadratischen plus kubischen Terme a l s auch der des kubischen Terms sind also zum 5% Niveau s i g n i f i k a n t .
Anhang
1. Tabellenanhang Tab. 1: Verteilungsfunktion Φ(χ) der Standardnormal Verteilung N(0,1). 344 Tab. 2: Quantile u^ der Standardnormalverteilung N(0,1)
345
Tab. 3: Quantile t der t-Verteilung η »γ 2 2 Tab. 4: Quantile χ der χ - Verteilung η iY
346
Tab. 5: Quantile F ^ ^
349
der F-Verteilung
347
344
Anhang
Tab. 1:
Verteilungsfunktion Φ(χ) der Standardnormalverteilung N ( 0 , 1 )
χ
0,00
0,01
0,02
0,03
0,04
0,05
0,06
0,0 0,1 0,2 0,3 0,4
0,5000 0,5398 0,5793 0,6179 0,6554
0,5040 0,5438 0,5832 0,6217 0,6591
0,5080 0,5478 0,5871 0,6255 0,6628
0,5120 0,5517 0,5910 0,6293 0,6664
0,5160 0,5557 0,5948 0,6331 0,6700
0,5199 0,5596 0,5987 0,6368 0,6736
0,5239 0,5636 0,6026 0,6406 0,6772
0,5279 0,5675 0,6064 0,6443 0,6808
0,5319 0,5714 0,6103 0,6480 0,6844
0,5359 0,5753 0,6141 0,6517 0,6879
0,5 0,6 0,7 0,8 0,9
0,6915 0,7257 0,7580 0,7881 0,8159
0,6950 0,7291 0,7611 0,7910 0,8186
0,6985 0,7324 0,7642 0,7939 0,8212
0,7019 0,7357 0,7673 0,7967 0,8238
0,7054 0,7389 0,7704 0,7995 0,8264
0,7088 0,7422 0,7734 0,8023 0,8289
0,7123 0,7454 0,7764 0,8051 0,8315
0,7157 0,7486 0,7794 0,8078 0,8340
0,7190 0,7517 0,7823 0,8106 0,8365
0,7224 0,7549 0,7852 0,8133 0,8389
1,0
1,1 1,2 1.3 1.4
0,8413 0,8643 0,8849 0,9032 0,9192
0,8438 0,8665 0,8869 0,9049 0,9207
0,8461 0,8686 0,8888 0,9066 0,9222
0,8485 0,8708 0,8907 0,9082 0,9236
0,8508 0,8729 0,8925 0,9099 0,9251
0,8531 0,8749 0,8944 0,9115 0,9265
0,8554 0,8770 0,8962 0,9131 0,9279
0,8577 0,8790 0,8980 0,9147 0,9292
0,8599 0,8810 0,8997 0,9162 0,9306
0,8621 0,8830 0,9015 0,9177 0,9319
1.5 1.6 1.7 1.8 1,9
0,9332 0,9452 0,9554 0,9641 0,9713
0,9345 0,9463 0,9564 0,9649 0,9719
0,9357 0,9474 0,9573 0,9656 0,9726
0,9370 0,9484 0,9582 0,9664 0,9732
0,9382 0,9495 0,9591 0,9671 0,9738
0,9394 0,9505 0,9599 0,9678 0,9744
0,9406 0,9515 0,9608 0,9686 0,9750
0,9418 0,9525 0,9616 0,9693 0,9756
0,9429 0,9535 0,9625 0,9699 0,9761
0,9441 0,9545 0,9633 0,9706 0,9767
2,0
2,1 2,2 2.3 2.4
0,9772 0,9821 0,9861 0,9893 0,9918
0,9778 0,9826 0,9864 0,9896 0,9920
0,9783 0,9830 0,9868 0,9898 0,9922
0,9788 0,9834 0,9871 0,9901 0,9925
0,9793 0,9838 0,9875 0,9904 0,9927
0,9798 0,9842 0,9878 0,9906 0,9929
0,9803 0,9846 0,9881 0,9909 0,9931
0,9808 0,9850 0,9884 0,9911 0,9932
0,9812 0,9854 0,9887 0,9913 0,9934
0,9817 0,9857 0,9890 0,9916 0,9936
2.5 2.6 2.7 2.8 2,9
0,9938 0,9953 0,9965 0,9974 0,9981
0,9940 0,9955 0,9966 0,9975 0,9982
0,9941 0,9956 0,9967 0,9976 0,9982
0,9943 0,9957 0,9968 0,9977 0,9983
0,9945 0,9959 0,9969 0,9977 0,9984
0,9946 0,9960 0,9970 0,9978 0,9984
0,9948 0,9961 0,9971 0,9979 0,9985
0,9949 0,9962 0,99.72 0,9979 0,9985
0,9951 0,9963 0,9973 0,9980 0,9986
0,9952 0,9964 0,9974 0,9981 0,9986
3,0
0,9987
0,9987
0,9987
0,9988
0,9988
0,9989
0,9989
0,9989
0,9990
0,9990
zu Tab. 1: Ablesebeispiel: Φ(1,56) = 0,9406 Erweiterung der Tafel: Φ( — χ) = 1 — Φ (χ) Approximation nach Hastings für χ > 0: Φ (χ) — 1
^ V2π
• e " " 2 , 2 ( a 1 t + a 2 t 2 + a j t 3 + a 4 t ' t + a5t5)
b = 0,2316419, a , = 0,31938153, a 2 = - 0 , 3 5 6 5 6 3 7 8 2 , a 4 = - 1,821255978, a 5 = 1,330274429.
mit
t = —— !+b>
a 3 = 1,781477937,
345
Anhang
Tab. 2 :
Quantile u, der Standardnormalverteilung N ( 0 , 1 )
"Y
"v 0,9999 0,9998 0,9997 0,9996 0,9995
3,7190 3,5401 3,4316 3,3528 3,2905
0,9975 0,9970 0,9965 0,9960 0,9955
2,8070 2,7478 2,6968 2,6521 2,6121
0,965 0,960 0,955 0,950 0,945
1,8119 1,7507 1,6954 1,6449 1,5982
0,83 0,82 0,81 0,80 0,79
0,9542 0,9154 0,8779 0,8416 0,8064
0,9994 0,9993 0,9992 0,9991 0,9990
3,2389 3,1947 3,1559 3,1214 3,0902
0,9950 0,9945 0,9940 0,9935 0,9930
2,5758 2,5427 2,5121 2,4838 2,4573
0,940 0,935 0,930 0,925 0,920
1,5548 1,5141 1,4758 1,4395 1,4051
0,78 0,76 0,74 0,72 0,70
0,7722 0,7063 0,6433 0,5828 0,5244
0,9989 0,9988 0,9987 0,9986 0,9985
3,0618 3,0357 3,0115 2,9889 2,9677
0,9925 0,9920 0,9915 0,9910 0,9905
2,4324 2,4089 2,3867 2,3656 2,3455
0,915 0,910 0,905 0,900 0,890
1,3722 1,3408 1,3106 1,2816 1,2265
0,68 0,66 0,64 0,62 0,60
0,4677 0,4125 0,3585 0,3055 0,2533
0,9984 0,9983 0,9982 0,9981 0,9980
2,9478 2,9290 2,9112 2,8943 2,8782
0,9900 0,9850 0,9800 0,9750 0,9700
2,3263 2,1701 2,0537 1,9600 1,8808
0,880 0,870 0,860 0,850 0,840
1,1750 1,1264 1,0803 1,0364 0,9945
0,58 0,56 0,54 0,52 0,50
0,2019 0,1510 0,1004 0,0502 0,0000
zu Tab. 2 : Ablesebeispiel: u 0
95
= 1,6449
Erweiterung der Tafel: U[ _ = — uy Approximation nach Hastings für 0,5 < γ < 1: uv — t y
a0+a,t+a2t2 ζ-? T 1 + b, t + b 2 t + b31
mt
, t = V — 2 In (1 — y ) ,
ao = 2,515517,
a ! = 0,802853,
a 2 = 0,010328,
b , = 1,432788,
b 2 = 0,189269,
b 3 = 0,001308.
n
346
Anhang
Tab. 3: \ η
y
Quantile t n : , der t-Verteilung 0,990
0,975
0,950
0,900
\
1 2 3 4 5
31,821 6,965 4,541 3,747 3,365
12,706 4,303 3,182 2,776 2,571
6,314 2,920 2,353 2,132 2,015
3,078 1,886 1,638 1,533 1,476
6 7 8 9 10
3,143 2,998 2,896 2,821 2,764
2,447 2,365 2,306 2,262 2,228
1,943 1,895 1,860 1,833 1,812
1,440 1,415 1,397 1,383 1,372
11 12 13 14 15
2,718 2,681 2,650 2,624 2,602
2,201 2,179 2,160 2,145 2,131
1,796 1,782 1,771 1,761 1,753
1,363 1,356 1,350 1,345 1,341
16 17 18 19 20
2,583 2,567 2,552 2,539 2,528
2,120 2,110 2,101 2,093 2,086
1,746 1,740 1,734 1,729 1,725
1,337 1,333 1,330 1,328 1,325
21 22 23 24 25
2,518 2,508 2,500 2,492 2,485
2,080 2,074 2,069 2,064 2,060
1,721 1,717 1,714 1,711 1,708
1,323 1,321 1,319 1,318 1,316
26 27 28 29 30
2,479 2,473 2,467 2,462 2,457
2,056 2,052 2,048 2,045 2,042
1,706 1,703 1,701 1,699 1,697
1,315 1,314 1,313 1,311 1,310
40 50 60 70 80
2,423 2,403 2,390 2,381 2,374
2,021 2,009 2,000 1,994 1,990
1,684 1,676 1,671 1,667 1,664
1,303 1,299 1,296 1,294 1,292
90 100 150 200 300
2,369 2,364 2,352 2,345 2,339
1,987 1,984 1,976 1,972 1,968
1,662 1,660 1,655 1,653 1,650
1,291 1,290 1,287 1,286 1,284
400 600 800 1000 00
2,336 2,333 2,331 2,330 2,326
1,966 1,964 1,963 1,962 1,960
1,649 1,647 1,647 1,646 1,645
1,284 1,283 1,283 1,282 1,282
zu Tab. 3: Ablesebeispiel: t 1 5 : 0 - 9 S = 1,753 Erweiterung der Tafel: l
n; 1 - ν = — >' und speziell t1;y = t a n ( 7 t { v - i } ) , V2-(2-y-l)
t
Vl-(2-V-D2' too:v = u y Approximation für 0,5 < y < 1: tn; 7
c 9 u 9 + c 7 u 7 + c 5 u 5 + c 3 u 3 + c, u " 92160 n 4
mit u = u y , c 9 = 79, c 7 = 720 η + 776, c 5 = 4800 η 2 + 4560η + 1482, c 3 = 23040η 3 + 15360η 2 + 4080η - 1920, c t = 92160η 4 + 23040η 3 + 2880η 2 - 3600 η - 945 ; für η S 10 kann man auch die Formel von Peizer und Pratt verwenden: t„.y
ne
c u
—η
mit
u = uy
und
5 η —
V
3
10n/
(Anmerkung: Die Peizer-Pratt-Approximation liefert bereits für η = 3 und 0,5 < γ < 0,99 eine passable Anpassung, wobei die absolute Abweichung zum wahren Wert höchstens 0,08 wird.)
Anhang
Tab. 4:
347
Quantile χ*., der x 2 -Verteilung
V
0,995 0,990 0,975 0,950 0,900 0,750 0,500 0,250 0,100 0,050 0,025 0,010 0,005
1 2 3 4 5
7,879 10,60 12,84 14,86 16,75
6,635 9,210 11,34 13,28 15,09
5,024 7,378 9,348 11,14 12,83
3,841 5,991 7,815 9,488 11,07
2,706 4,605 6,251 7,779 9,236
1,323 2,773 4,108 5,385 6,626
0,455 1,386 2,366 3,357 4,351
0,102 0,575 1,213 1,923 2,675
" 2 1,58 0,211 0,584 1,064 1,610
6 7 8 9 10
18,55 20,28 21,96 23,59 25,19
16,81 18,48 20,09 21,67 23,21
14,45 16,01 17,53 19,02 20,48
12,59 14,07 15,51 16,92 18,31
10,64 12,02 13,36 14,68 15,99
7,841 9,037 10,22 11,39 12,55
5,348 6,346 7,344 8,343 9,342
3,455 4,255 5,071 5,899 6,737
2,204 2,833 3,490 4,168 4,865
1,635 2,167 2,733 3,325 3,940
1,237 1,690 2,180 2,700 3,247
0,872 1,239 1,647 2,088 2,558
0,676 0,989 1,344 1,735 2,156
11 12 13 14 15
26,76 28,30 29,82 31,32 32,80
24,73 26,22 27,69 29,14 30,58
21,92 23,34 24,74 26,12 27,49
19,68 21,03 22,36 23,68 25,00
17,28 18,55 19,81 21,06 22,31
13,70 14,85 15,98 17,12 18,25
10,34 11,34 12,34 13,34 14,34
7,584 8,438 9,299 10,17 11,04
5,578 6,304 7,042 7,790 8,547
4,575 5,226 5,892 6,571 7,261
3,816 4,404 5,009 5,629 6,262
3,053 3,571 4,107 4,660 5,229
2,603 3,074 3,565 4,075 4,601
16 17 18 19 20
34,27 35,72 37,16 38,58 40,00
32,00 33,41 34,81 36,19 37,57
28,85 30,19 31,53 32,85 34,17
26,30 27,59 28,87 30,14 31,41
23,54 24,77 25,99 27,20 28,41
19,37 20,49 21,60 22,72 23,83
15,34 16,34 17,34 18,34 19,34
11,91 12,79 13,68 14,56 15,45
9,312 10,09 10,86 11,65 12,44
7,962 8,672 9,390 10,12 10,85
6,908 7,564 8,231 8,907 9,591
5,812 6,408 7,015 7,633 8,260
5,142 5,697 6,265 6,844 7,434
21 22 23 24 25
41,40 42,80 44,18 45,56 46,93
38,93 40,29 41,64 42,98 44,31
35,48 36,78 38,08 39,36 40,65
32,67 33,92 35,17 36,42 37,65
29,62 30,81 32,01 33,20 34,38
24,93 26,04 27,14 28,24 29,34
20,34 21,34 22,34 23,34 24,34
16,34 17,24 18,14 19,04 19,94
13,24 14,04 14,85 15,66 16,47
11,59 12,34 13,09 13,85 14,61
10,28 10,98 11,69 12,40 13,12
8,897 9,542 10,20 10,86 11,52
8,034 8,643 9,260 9,886 10,52
26 27 28 29 30
48,29 49,64 50,99 52,34 53,67
45,64 46,96 48,28 49,59 50,89
41,92 43,19 44,46 45,72 46,98
38,89 40,11 41,34 42,56 43,77
35,56 36,74 37,92 39,09 40,26
30,43 31,53 32,62 33,71 34,80
25,34 26,34 27,34 28,34 29,34
20,84 21,75 22,66 23,57 24,48
17,29 18,11 19,94 19,77 20,60
15,38 16,15 16,93 17,71 18,49
13,84 14,57 15,31 16,05 16,79
12,20 11,16 12,88 11,81 13,56 12,46 14,26 13,12 14,95 13,79
40 50 60 70 80
66,77 79,49 91,95 104,2 116,3
63,69 76,15 88,38 100,4 112,3
59,34 71,42 83,30 95,02 106,6
55,76 67,50 79,08 90,53 101,9
51,81 63,17 74,40 85,53 96,58
45,62 56,33 66,98 77,58 88,13
39,34 49,33 59,33 69,33 79,33
33,66 42,94 52,29 61,70 71,14
29,05 37,69 46,46 55,33 64,28
26,51 34,76 43,19 51,74 60,39
24,43 32,36 40,48 48,76 57,15
22,16 29,71 37,48 45,44 53,54
20,71 27,99 35,53 43,28 51,17
90 100 150 200 250
128,3 140,2 198,4 255,3 311,3
124,1 135,8 193,2 249,4 304,9
118,1 129,6 185,8 241,1 295,7
113,1 124,3 179,6 234,0 287,9
107,6 118,5 172,6 226,0 279,1
98,65 109,1 161,3 213,1 264,7
89,33 99,33 149,3 199,3 249,3
80,62 73,29 69,13 65,65 61,75 90,13 82,36 77,93 74,22 70,06 138,0 128,3 122,7 118,0 112,7 186,2 174,8 168,3 162,7 156,4 234,6 221,8 214,4 208,1 200,9
59,20 67,33 109,1 152,2 196,2
300 400 600 800 1000
366,8 476,6 693,0 906,8 1119,
359,9 468,7 683,5 896,0 1107,
349,9 457,3 669,8 880,3 1090,
341,4 447,6 658,1 866,9 1075,
331,8 436,6 644,8 851,7 1058,
316,1 418,7 623,0 826,6 1030,
299,3 399,3 599,3 799,3 999,3
283,1 380,6 576,3 772,7 969,5
240,7 330,9 514,5 700,7 888,6
269,1 364,2 556,1 749,2 943,1
" 3 3 , 9 3 ~ 4 9,82 _ 4 1 , 5 7 " 5 3,93 0,103 " 2 5 , 0 6 " 2 2,01 " 2 1,00 0,352 0,216 0,115 " 2 7 , 1 7 0,711 0,484 0,297 0,207 1,145 0,831 0,554 0,412
260,9 354,6 544,2 735,4 927,6
253,9 346,5 534,0 723,5 914,3
246,0 337,2 522,4 709,9 898,9
348
Anhang
zu Tab. 4: Ablesebeispiel: jcf. 0 , 05 = 33,93 = 3,93 · KT 3 = 0,00393 Approximation nach Wilson und Hilferty für 0 < γ < 1:
Anhang
Tab.5:
10
349
H b ,
Quantile F n i „ 2 . , der F-Verteilung
S n ?Y 10
11
0,990 0,975 0,950 0,900
4052, 647,8 161,4 39,86
4999, 799,5 199,5 49,50
5403, 864,2 215,7 53,59
5625, 899,6 224,6 55,83
5764, 921,8 230,2 57,24
5859, 937,1 234,0 58.20
5928, 948,2 236,8 58,91
5981, 956,7 238,9 59,44
6022, 963,3 240,5 59,86
6056, 968,6 241,9 60,20
6083, 973,0 243,0 60,47
0,990 0,975 0,950 0,900
98.50 38.51 18,51 8,526
99,00 39,00 19,00 9,000
99,17 39,17 19,16 9,162
99,25 39,25 19,25 9,243
99,30 39,30 19,30 9,293
99,33 39,33 19,33 9,326
99,36 39,36 19,35 9,349
99,37 39,37 19,37 9,367
99,39 39,39 19,38 9,381
99,40 39,40 19,40 9,392
99,41 39,41 19,40 9,401
0,990 0,975 0,950 0,900
34.12 17,44 10.13 5,538
30,82 16,04 9,552 5.462
29,46 15,44 9,277 5,391
28,71 15,10 9,117 5,343
28,24 14,88 9,013 5,309
27,91 14,73 8,941 5,285
27,67 14,62 8,887 5,266
27,49 14,54 8,845 5,252
27,35 14,47 8,812 5,240
27,23 14,42 8,786 5,230
27,13 14,37 8,763 5,222
0,990 0,975 0,950 0,900
21,20 12,22 7,709 4,545
16,69 15,98 15,52 10,65 9,979 9,605 9,364 6,944 6,591 6,388 6,256 4,325 4,191 4,107 4,051
15.21 9,197 6,163 4,010
14,98 9,074 6,094 3,979
14,80 8,980 6,041 3,955
14,66 8,905 5,999 3,936
14,55 8,844 5,964 3,920
14,45 8,793 5,936 3,907
0,990 0,975 0,950 0,900
16,26 13,27 10,01 8,434 6,608 5,786 4,060 3,780
12,06 7,764 5,409 3,619
11,39 7,388 5,192 3,520
10,97 7,146 5,050 3,453
10,67 6,978 4,950 3,405
10,46 6,853 4,876 3,368
10,29 6,757 4,818 3,339
10,16 6,681 4,772 3,316
10,05 6.619 4,735 3,297
9,962 6,568 4,704 3,282
0,990 0,975 0,950 0,900
13,75 8,813 5,987 3,776
10,92 7,260 5,143 3.463
9,780 6,599 4,757 3,289
9,148 6,227 4,534 3,181
8,746 5,988 4,387 3,108
8,466 5,820 4,284 3,055
8,260 5,695 4,207 3,015
8,102 5,600 4,147 2,983
7,976 5,523 4,099 2,958
7,874 5,461 4,060 2,937
7,789 5,409 4,027 2,919
0,990 0,975 0,950 0,900
12.25 8,073 5,591 3,589
9,547 6,542 4,737 3,257
8,451 5,890 4,347 3,074
7,847 5,523 4,120 2,961
7,460 5,285 3,972 2,883
7,191 5,119 3,866 2,827
6,993 4,995 3,787 2,785
6,840 4,899 3,726 2,752
6,719 4,823 3,677 2,725
6.620 4,761 3,637 2,703
6,538 4,709 3,603 2,684
0,990 0,975 0,950 0,900
11.26 7,571 5,318 3,458
8,649 6,059 4,459 3,113
7,591 5,416 4,066 2,924
7,006 5,053 3,838 2,806
6,632 4,817 3,687 2,726
6,371 4,652 3,581 2,668
6,178 4,529 3,500 2,624
6,029 4,433 3,438 2,589
5,911 4,357 3,388 2,561
5,814 4,295 3,347 2,538
5,734 4,243 3,313 2,518
0,990 0,975 0,950 0,900
10,56 7,209 5,117 3,360
8,022 5,715 4,256 3,006
6,992 5,078 3,863 2,813
6,422 4,718 3,633 2,693
2,057 4,484 3,482 2,611
5,802 4,320 3,374 2,551
5,613 4,197 3,293 2,505
5,467 4,102 3,230 2,469
5,351 4,026 3,179 2,440
5,257 3,964 3,137 2,416
5,177 3,912 3,102 2,396
0,990 0,975 0,950 0,900
10,04 6,937 4,965 3,285
7,559 5,456 4,103 2,924
6,552 4,826 3,708 2,728
5,994 4,468 3,478 2,605
5,636 4,236 3,326 2,522
5,386 4,072 3,217 2,461
5,200 3,950 3,135 2,414
5,057 3,855 3,072 2,377
4,942 3,779 3,020 2,347
4,849 3,717 2,978 2,323
4,771 3,665 2,943 2,302
18,00
350
Anhang
Tab. 5:
Fortsetzung 12
13
14
15
20
24
30
40
60
120
oo
1
0,990 0,975 0,950 0,900
6106, 976,7 243,9 60,71
6126, 979,8 244,7 60,90
6143, 982,5 245,4 61,07
6157, 984,9 245,9 61,22
6209, 993,1 248,0 61,74
6235, 997,2 249,1 62,00
6261, 1001, 250,1 62,26
6287, 1006, 251,1 62,53
6313, 1010, 252,2 62,79
6339, 1014, 253,3 63,06
6366, 1018, 254,3 63,33
2
0,990 0,975 0,950 0,900
99,42 39,41 19,41 9,408
99,42 39,42 19,42 9,415
99,43 39,43 19,42 9,420
99,43 39,43 19,43 9,425
99,45 39,45 19,45 9,441
99,46 39,46 19,45 9,450
99,47 39,46 19,46 9,458
99,47 39,47 19,47 9,466
99,48 39,48 19,48 9,475
99,49 39,49 19,49 9,483
99,50 39,50 19,50 9,491
3
0,990 0,975 0,950 0,900
27,05 14,34 8,745 5,216
26,98 14.30 8,729 5,210
26,92 14,28 8,715 5,205
26,87 14,25 8,703 5,200
26,69 14,17 8,660 5,184
26,60 14,12 8,639 5,176
26,50 14,08 8,617 5,168
26,41 14,04 8,594 5,160
26,32 13,99 8,572 5,151
26,22 13,95 8,549 5,143
26,13 13,90 8,526 5,134
4
0,990 0,975 0,950 0,900
14,37 8,751 5.912 3,896
14.31 8,715 5.891 3,885
14,25 8,684 5,873 3,877
14,20 8,657 5,858 3,869
14,02 8,560 5,803 3,844
13,93 8,511 5,774 3,831
13,84 8,461 5,746 3,817
13,75 8,411 5,717 3,804
13,65 8,360 5,688 3,790
13,56 8,309 5,658 3,775
13,46 8,257 5,628 3,761
5
0,990 0,975 0,950 0,900
9,888 6,525 4,678 3,268
9,824 6.487 4,655 3,257
9,770 6,455 4,636 3,247
9,722 6,428 4,619 3,238
9,553 6,329 4,558 3,207
9,466 6.278 4,527 3,191
9,379 6,227 4,496 3,174
9,291 6,175 4,464 3,157
9,202 6,123 4,431 3,140
9,112 6,069 4,398 3,123
9,020 6,015 4,365 3,105
6
0,990 0,975 0,950 0,900
7,718 5,366 4,000 2,905
7,657 5,329 3,976 2.892
7,605 5,297 3,956 2,881
7,559 5,269 3,938 2,871
7,396 5,168 3,874 2,836
7,313 5,117 3,841 2,818
7,229 5,065 3,808 2,800
7,143 5,012 3,774 2,781
7,057 4,959 3,740 2,762
6,969 4,904 3,705 2,742
6,880 4,849 3.669 2,722
7
0,990 0,975 0,950 0,900
6,469 4.666 3,575 2,668
6,410 4,628 3,550 2,654
6,359 4,596 3,529 2,643
6,314 4,568 3,511 2,632
6,155 4,467 3,445 2,595
6,074 4,415 3,410 2,575
5,992 4,362 3,376 2,555
5,908 4,309 3,340 2,535
5,824 4,254 3,304 2,514
5,737 4,199 3,267 2,493
5,650 4,142 3,230 2,471
8
0,990 0,975 0,950 0,900
5.667 4,200 3,284 2,502
5,609 4,162 3,259 2.488
5,558 4,129 3,237 2,475
5,515 4,101 3,218 2,464
5,359 3,999 3,150 2,425
5.279 3,947 3,115 2,404
5,198 3,894 3,079 2,383
5,116 3,840 3,043 2,361
5,032 3,784 3,005 2,339
4,946 3,728 2,967 2,316
4,859 3.670 2,928 2,293
9
0,990 0,975 0,950 0,900
5,111 3,868 3,073 2,379
5,054 3,830 3,047 2,364
5,005 3,798 3,025 2,351
4,962 3,769 3,006 2,340
4,808 3,667 2,936 2,298
4,729 3,614 2,900 2,277
4,649 3,560 2,864 2,255
4,567 3,505 2,826 2,232
4,483 3,449 2,787 2,208
4,398 3,392 2,748 2,184
4,311 3,333 2,707 2,159
10
0,990 0,975 0,950 0,900
4,706 3,621 2.913 2,284
4,649 3,583 2,887 2,269
4,600 3,550 2,864 2,255
4,558 3,522 2,845 2,244
4,405 3,419 2,774 2,201
4,327 3,365 2,737 2,178
4,247 3,311 2,700 2,155
4,165 3,255 2,661 2,132
4,082 3,198 2,621 2,107
3,996 3,140 2,580 2,082
3,909 3,080 2,538 2,055
Anhang
Tab. 5:
351
Fortsetzung 10
11
11
0,990 0,975 0,950 0;900
9,646 6,724 4,844 3,225
7,206 5,256 3,982 2,860
6,217 4,630 3,587 2,660
5.668 4,275 3,357 2,536
5,316 4,044 3,204 2,451
5,069 3,881 3,095 2,389
4,886 3,759 3,012 2,342
4,744 3,664 2,948 2,304
4,632 3,588 2,896 2,273
4,539 3,526 2,854 2,248
4,462 3,473 2,818 2,227
12
0,990 0,975 0,950 0,900
9,330 6,554 4,747 3,177
6,927 5,096 3,885 2,807
5.953 4,474 3,490 2,605
5,412 4,121 3,259 2,480
5,064 3,891 3,106 2,394
4,821 3,728 2,996 2,331
4,640 3,607 2,913 2,283
4,499 3,512 2,849 2,245
4,388 3,436 2,796 2,214
4,296 3,374 2,753 2,188
4,219 3,321 2,717 2,166
13
0,990 0,975 0,950 0,900
9,074 6,414 4,667 3,136
6,701 4,965 3,806 2,763
5,739 4,347 3,411 2,560
5,205 3,996 3,179 2,434
4,862 3,767 3,025 2,347
4,620 3,604 2,915 2,283
4,441 3,483 2,832 2,234
4,302 3,388 2,767 2,195
4,191 3,312 2,714 2,164
4,100 3,250 2,671 2,138
4,024 3,197 2,634 2,115
14
0,990 0,975 0,950 0,900
8,862 6,298 4,600 3,102
6,515 4,857 3,739 2,726
5,564 4,242 3,344 2,522
5,035 3.892 3,112 2,395
4,695 3,663 2,958 2,307
4,456 3,501 2,848 2,243
4,278 3,380 2.764 2,193
4,140 3,285 2,699 2,154
4,030 3,939 3,863 3,209 3,147 3,094 2,646 2,602 2,565 2,122 2,095 2,073
15
0,990 0,975 0,950 0,900
8,683 6,199 4,543 3,073
6,359 4,765 3,682 2,695
5,417 4,153 3,287 2,490
4.893 3,804 3,056 2,361
4,556 3,576 2,901 2,273
4,318 4,142 4.004 3,895 3,415 3,293 3,199 3,123 2,790 2,707 2,641 2,588 2,208 2,158 2,119 2,086
16
0,990 0,975 0,950 0,900
8,531 6,115 4,494 3,048
6,226
5,292 4,773 4.437 4,687 4,077 3,729 3,502 3,634 3,239 3,007 2,852 2,668 2,462 2,333 2,244
17
0,990 0,975 0,950 0,900
8,400 6,042 4,451 3,026
6,112 5,185 4.669 4,336 4,619 4,011 3,665 3.438 3,592 3,197 2,965 2,810 2,645 2,437 2,308 2,218
18
0,990 0,975 0,950 0,900
8,285 5,978 4,414 3,007
6,013 4,560 3,555 2,624
19
0,990 0,975 0,950 0,900
8,185 5,922 4,381 2,990
5,926 5,010 4,500 4,171 4,508 3,903 3,559 3,333 3,522 3,127 2,895 2,740 2,606 2,397 2,266 2,176
20
0,990 0,975 0,950 0,900
8,096 5,871 4,351 2,975
5,849 4,461 3,493 2,589
5,092 3.954 3,160 2,416
4,938 3,859 3,098 2,380
3,805 3,060 2,544 2,059
3,730 3,007 2,506 2,036
4,202 3,341 2,741 2,178
4,026 3,890 3,780 3,691 3,219 3,125 3,049 2,986 2,657 2,591 2,538 2,494 2,128 2,088 2,055 2,028
3,616 2,933 2,456 2,005
4,101 3,277 2,699 2,152
3,927 3,791 3,682 3,593 3,156 3,061 2,985 2,922 2,614 2,548 2,494 2,450 2,102 2,061 2,028 2,001
3,518 2,869 2,412 1,977
4,579 4,248 4,015 3,841 3,608 3,382 3,221 3,100 2,928 2,773 2,661 2,577 2,286 2,196 2,130 2,079
3,705 3.005 2,510 2,038
3,939 3.765 3,631 3,172 3,051 2,956 2,628 2,544 2,477 2,109 2,058 2,017
4,431 4,103 3,871 3,515 3,289 3,128 2,866 2,711 2,599 2,249 2,158 2,091
3,699 3,007 2,514 2,040
3,564 2,913 2,447 1,999
3,597 2,929 2.456 2,005
3,508 3,433 2,866 2,813
2,412 2,374 1,977 1,953
3,523 3,434 2,880 2,817 2,423 2,378 1,984 1,956
3,359 2,764 2,340 1,932
3.457 2,837 2,393 1,965
3,293 2,720 2,310 1,913
3,368 2,774 2,348 1,937
352
Tab. 5:
Anhang
Fortsetzung 12
13
14
15
20
24
4,099 3,226 2,646 2.123
4,021 3,941 3,860 3,173 3,118 3,061 2,609 2,570 2,531 2,100 2,076 2,052
30
40
60
120
oo
11
0,990 0,975 0,950 0,900
4,397 4,341 4,293 4,251 3,430 3,391 3,358 3,330 2,788 2,761 2,738 2,719 2,209 2,193 2,179 2,167
12
0,990 0,975 0,950 0,900
4,155 3.277 2,687 2,147
4,099 4,051 4,010 3,858 3,239 3,206 3,177 3,073 2,660 2,637 2,617 2,544 2,131 2,117 2,105 2,060
13
0,990 0,975 0,950 0,900
3,960 3,153 2,604 2,097
3,905 3,857 3,815 3,665 3,587 3,507 3,425 3,341 3.255 3,165 3,115 3,081 3,053 2,948 2,893 2,837 2.780 2,720 2.659 2,595 2,577 2,553 2,533 2,459 2,420 2,380 2,339 2,297 2,252 2,206 2,080 2,066 2,053 2,007 1,983 1,958 1,931 1,904 1,876 1,846
14
0,990 0,975 0,950 0,900
3,800 3,050 2,534 2,054
3,745 3,697 3,011 2,978 2,507 2,483 2,037 2,022
15
0,990 0,975 0,950 0,900
3,666 2,963 2,475 2,017
3,611 3,563 3,522 3,372 3,294 3,214 3,132 3,047 2,959 2,868 2,924 2,891 2,862 2,756 2,701 2,644 2,585 2,524 2,461 2,395 2,448 2,424 2,403 2,328 2,288 2,247 2,204 2,160 2,114 2,066 2,000 1,985 1,972 1,924 1,899 1,873 1,845 1,817 1,787 1,755
16
0,990 0,975 0,950 0,900
3,553 3,497 3,450 3,409 3,259 3,181 3,101 3,018 2,933 2,845 2,753 2,889 2,850 2,817 2,788 2,681 2,625 2,568 2,509 2,447 2,383 2,316 2,425 2,397 2,373 2,352 2,276 2,235 2,194 2,151 2,106 2,059 2,010 1,985 1,968 1,953 1,940 1,891 1,866 1,839 1,811 1,782 1,751 1,718
17
0,990 0,975 0,950 0,900
3,455 3,400 3,353 3,312 3,162 3,084 3,003 2,920 2,835 2,746 2,825 2,786 2,752 2,723 2,616 2,560 2,502 2,442 2,380 2,315 2,381 2,353 2,329 2,308 2,230 2,190 2,148 2,104 2,058 2,011 1,958 1,940 1,925 1,912 1,862 1,836 1,809 1.781 1,751 1,719
18
0,990 0,975 0,950 0,900
3,371 3,316 3,268 3,227 3,077 2,999 2,919 2,835 2,749 2,769 2,730 2,696 2,667 2,559 2,503 2,444 2,384 2,321 2,342 2,314 2,290 2,269 2,191 2,150 2,107 2,063 2,017 1,933 1,915 1,900 1,887 1,837 1,810 1,783 1,754 1,723
19
0,990 0,975 0,950 0,900
3,297 3,241 3,194 3,153 3,003 2,925 2,844 2,761 2,674 2,584 2,489 2,720 2,680 2,646 2,617 2,509 2,452 2,394 2,333 2,270 2,203 2,133 2,308 2,280 2,255 2,234 2,155 2,114 2,071 2,026 1,980 1,930 1,878 1,912 1,894 1,878 1,865 1,814 1,787 1,759 1,730 1,699 1,666 1,631
20
0,990 0,975 0,950 0,900
3,231 3,176 3,129 3,088 2,938 2,859 2,778 2,695 2,608 2,517 2,421 2,676 2,636 2,602 2,573 2,464 2,408 2.349 2,287 2,223 2,156 2,085 2.278 2,249 2,225 2,203 2.124 2,082 2,039 1,994 1,946 1,896 1,843 1,892 1,874 1,859 1,845 1,794 1,767 1,738 1,708 1,677 1,643 1,607
3,780 3,019 2,505 2,036
3,776 3.690 3,602 3,004 2,944 2,883 2,490 2.448 2,404 2,026 2,000 1,972
3,701 3,619 3,535 3.449 3,361 2,963 2,906 2,848 2,787 2,725 2,466 2,426 2,384 2,341 2,296 2,011 1,986 1,960 1,932 1,904
3,656 3,505 3,427 3.348 3,266 3,181 3,094 3,004 2,949 2,844 2,789 2,732 2,674 2,614 2,552 2,487 2,463 2,388 2,349 2,308 2,266 2,223 2,178 2,131 2,010 1,962 1,938 1,912 1,885 1,857 1,828 1,797
2,653 2,247 1,960 1,686
2.660 2,566
2.256 2,187 1,968 1,917 1.691 1,657
Anhang
Tab. 5:
353
Fortsetzung 10
11
22
0,990 0,975 0,950 0,900
7,945 5,786 4,301 2,949
5,719 4,383 3,443 2,561
4,817 3,783 3,049 2,351
4,313 3,440 2,817 2,219
3,988 3,758 3,587 3,215 3,055 2,934 2,661 2,549 2,464 2,128 2,060 2,008
3,453 2,839 2,397 1,967
3,346 2,763 2,342 1,933
3,258 2,700 2,297 1,904
3,183 2,646 2,258 1,880
24
0,990 0,975 0,950 0,900
7,823 .5,717 4,260 2,927
5,614 4,319 3,403 2,538
4.718 3,721 3,009 2,327
4,218 3,379 2,776 2,195
3.895 3,667 3,496 3,155 2.995 2,874 2,621 2,508 2,423 2,103 2,035 1,983
3,363 2,779 2.355 1,941
3,256 2,703 2,300 1,906
3,168 2,640 2,255 1,877
3,094 2,586 2,216 1,853
26
0,990 0,975 0,950 0,900
7,721 5,659 4,225 2,909
5,526 4,265 3,369 2,519
4,637 3,670 2,975 2,307
4,140 3,329 2,743 2,174
3,818 3,591 3,421 3,288 3,105 2,945 2,824 2,729 2,587 2,474 2,388 2,321 2,082 2,014 1,961 1,919
3,182 2,653 2,565 1,884
3,094 2,590 2,220 1,855
3,020 2,536 2,181 1,830
28
0,990 0,975 0,950 0,900
7,636 5,610 4,196 2,894
5,453 4,221 3,340 2,503
4,568 3,626 2,947 2,291
4,074 3,286 2,714 2,157
3,754 3.063 2,558 2.064
3,528 2,903 2,445 1.996
3.358 2,782 2.359 1,943
3,226 2,687 2,291 1,900
3,120 3,032 2,611 2,547 2,236 2,190 1,865 1,836
2,958 2,493 2,151
30
0,990 0,975 0,950 0,900
7,562 5,390 4,510 4,018 5,568 4,182 3,589 3,250 4,171 3,316 2,922 2,690 2,881 2,489 2,276 2,142
3,699 3,026 2,534 2,049
3,473 2,867 2,421 1,980
3,304 2,746 2,334 1,927
3,173 3,067 2,979 2,651 2,575 2,511 2,266 2,211 2,165 1,884 1,849 1,819
2,905 2,457 2,125 1,794
40
0,990 0,975 0,950 0,900
7,314 5,424 4,085 2,835
5,179 4,051 3,232 2,440
4,313 3,828 3,514 3,291 3,463 3,126 2,904 2,744 2,839 2,606 2,449 2,336 2,226 2,091 1,997 1,927
3,124 2,624 2,249 1,873
2,993 2,529 2,180 1,829
2,888
60
0,990 0,975 0,950 0,900
7,077 5,286 4,001 2,791
4,977 3,925 3,150 2,393
4,126 3,343 2,758 2,177
3,649 3,008 2,525 2,041
2,823 2,412 2,097 1,775
2,718 2,334 2,040 1,738
80
0,990 0,975 0,950 0,900
6,964 5,219 3,961 2,770
4,882 3,865 3,111 2,370
4,036 3,285 2.719 2,154
3,564 2,951 2,486 2,017
2,743 2.356 2,057 1,748
2,639 2,278 1,999 1,711
120
0,990 0,975 0,950 0,900
6,851 5,152 3,920 2,748
oo
0,990 0,975 0,950 0,900
6,635 5,024 3,841 2,706
1,811
2,801 2,727 2,452 2,388 2,334 2,124 2,077 2,037 1,793 1,763 1,737
3,339 2,786 2,368 1,946
3,119 2,627 2,254 1,875
2,953 2,507 2,167 1,819
3,256 2,730 2,329 1,921
3,037 2,571 2,214 1,849
2,872 2,451 2,127 1,793
4,787 3,805 3,072 2,347
3,949 3,480 3,174 3,227 2,894 2,674 2,680 2,447 2,290 2,130 1,992 1.896
2,956 2,515 2,175 1,824
2,792 2,663 2,559 2,472 2,398 2,395 2,299 2,222 2,157 2,101 2,087 2,016 1,959 1,910 1,869 1,767 1,722 1,684 1,652 1,625
4,605 3,689 2,996 2,303
3,782 3,116 2,605 2,084
3,319 2,786 2,372 1,945
2,802 2,408 2,099 1,774
2,639 2,511 2,407 2,321 2,247 2,288 2,192 2,114 2,048 1,992 2,010 1,938 1,880 1,831 1,788 1,717 1,670 1,632 1,599 1,570
3,017 2,567 2,214 1,847
2,632 2,270 1,993 1,707
2,558 2,215 1,952
2,552 2,214 1,952
2,478 2,158 1,910 1,652
1,680
1,680
354
Anhang
Tab. 5: Fortsetzung 12
13
14
15
20
24
30
40
60
120
oo
2,495 2,145 1,889 1,639
2,403 2,076 1,838 1,604
2,305 2,003 1,783 1,567
22
0,990 0,975 0,950 0,900
3,121 3,066 3,019 2,978 2,602 2,562 2,528 2,498 2,226 2,197 2,172 2,151 1,859 1,841 1,825 1,811
2,827 2,749 2,667 2,583 2,389 2,332 2,272 2,210 2,071 2,028 1,984 1,938 1,759 1,731 1,702 1,671
24
0,990 0,975 0,950 0,900
3,032 2,541 2,183 1,832
2,889 2,437 2,108 1,783
2,738 2,327 2,027 1,730
2,659 2,269 1,984 1,702
26
0,990 0,975 0,950 0,900
2,958 2,903 2,856 2,815 2,491 2,451 2,417 2,387 2,148 2,119 2,093 2,072 1,809 1,790 1,774 1,760
2,664 2,276 1,990 1,706
2,585 2,503 2,417 2,327 2,233 2,217 2,157 2,093 2,026 1,954 1,946 1,901 1,853 1,803 1,749 1,677 1,647 1,615 1,581 1,544
28
0,990 0,975 0,950 0,900
2,896 2,448 2,118 1,790
2,841 2,408 2,088 1,770
2,602 2,232 1,959 1,685
2,522 2,174 1,915 1,656
30
0,990 0,975 0,950 0,900
2,843 2,412 2,092 1,773
2,788 2,741 2,700 2,549 2,469 2,386 2,299 2,208 2,111 2,372 2,337 2,307 2,195 2,136 2,074 2,009 1,940 1,866 2,062 2,037 2,015 1,932 1,887 1,841 1,792 1,740 1,684 1,753 1,737 1,722 1,667 1,638 1,606 1,573 1,538 1,499
40
0,990 0,975 0,950 0,900
2,665 2,610 2,563 2,522 2,369 2,288 2,203 2,288 2,247 2,212 2,182 2,068 2,007 1,943 2,003 1,973 1,947 1,924 1,839 1,793 1,744 1,715 1,695 1,677 1,662 1,605 1,574 1,541
60
0,990 0,975 0,950 0,900
2,496 2,169 1,917 1,657
2,441 2,128 1,886 1,637
2,393 2,092 1,860 1,619
2,352 2,061 1,836 1,603
2,198 1,944 1,748 1,543
2,115 1,882 1,700 1,511
2,028 1,936 1,836 1,726 1,601 1,815 1,744 1,667 1,581 1,482 1,649 1,594 1,534 1,467 1,389 1,476 1,437 1,395 1,348 1,291
80
0,990 0,975 0,950 0,900
2,416 2,112 1,876 1,629
2,361 2,070 1,844 1,608
2,313 2,034 1,817 1,590
2,272 2,003 1,793 1,574
2,116 1,885 1,703 1,513
2,033 1,821 1,654 1,479
1,944 1,753 1,602 1,443
1,849 1,679 1,545 1,403
1,746 1,598 1,482 1,358
1,630 1,491 1,507 1,396 1,410 1,322 1,306 1,242
120
0,990 0,975 0,950 0,900
2,336 2,055 1,834 1,601
2,281 2,013 1,802 1,580
2,233 1,976 1,774 1,561
2,192 1,945 1,750 1,545
2,035 1,825 1,659 1,482
1,950 1,860 1,760 1,690 1,608 1,554 1,447 1,409
1,763 1,614 1,495 1,368
1,656 1,530 1,429 1,320
1,533 1,433 1,352 1,265
1,381 1,310 1,254 1,193
oo
0,990 0,975 0,950 0,900
2,185 2,129 1,945 1,902 1,752 1,719 1,546 1,523
2,080 1,865 1,691 1,504
2,039 1,833 1,666 1,487
1,878 1,791 1,696 1,592 1,708 1,640 1,566 1,484 1,571 1,517 1,459 1,394 1,421 1,383 1,342 1,295
1,473 1,388 1,318 1,240
1,325 1,268 1,221 1,169
1,000 1,000 1,000 1,000
2,977 2,501 2,154 1,813
2,930 2,467 2,129 1,797
2,794 2,374 2,063 1,754
2,753 2,344 2,041 1,740
2,577 2,209 1,939 1,672
2,440 2,112 1,869 1,625
2,492 2,403 2,310 2,211 2,146 2,080 2,010 1,935 1,892 1,842 1,790 1,733 1,641 1,607 1,571 1,533
2,353 2,048 1,820 1,592
2,114 1,875 1,693 1,506
2,131 1,878 1,691 1,504
2,263 2,167 2,064 1,980 1,907 1,829 1,769 1,714 1,654 1,558 1,520 1,478 2,006 1,787 1,622 1,456
2,019 1,917 1,805 1,803 1,724 1,637 1,637 1,577 1,509 1,467 1,425 1,377
Anhang
355
zu Tab. S: Ablesebeispiel: F 7
20;0i99
= 3,699
Erweiterung der Tafel: F„ t
.; _ — F n
=
2·π 1 · ( ( 1 + >1/2) U
Fl.„2;·,· = (t„ 2;( l+ y )/ 2 ) > F1 ,co; ϊ 2 1 η 1, ao; y ^ yAnj;y> F* oc, cc; = y1
4F
Λ
'
Interpolation nach Laubscher: Gesucht ist F„ „2. y. Gibt es dann natürliche Zahlen n 3 i n , < n s sowie n 4 g n 2 < n 6 derart, daß die Quantile F n 3 . n 4 . y , F n j n 6 ; y , F„ 5 n 4 ; y und F „ vertafelt sind, so gilt: F
n,.n 2 ; y = 0 ~ C,) ' (1 - C2) · F„3, „4; + (1 - C,) · C2 · F n3-n( .. .. + c , • ( 1 - c 2 ) • F n 5 . „4. j + c, · c 2 · F„ s . „6.,.
.... fur
c, =
n5(ni-n3) ni(n5-n3)
und
c2 =
n6(n2-n4) n2(n6-n4)
.
Läßt sich n 3 = n, wählen, so wird offensichtlich C! = 0, wie für n 4 = n 2 auch c 2 = 0 ist. In diesen Fällen vereinfacht sich die Interpolationsformel entsprechend. ^..f, -e" " a = v^d+cd (uy)2 - 3 c = —
2
,
und
1
b = 2·( \n, — 1 d =
1 1 1- -
1
λ
b
mit u = uy, /
5 d · ( c + - - n2—1/V 6 3
356
Anhang
2. Griechisches Alphabet A
α
Alpha
Β
β
Beta
Γ
Υ
Gamma
Δ
δ
Delta
Ε
ε
Epsilon
Ζ
ζ
Zeta
Η
η
Eta
θ
θ
Theta
I
ι
Jota
Κ
κ , χ
Kappa
Λ
λ
Lambda
Μ
μ
My
Ν
ν
Ny
=
ξ
Xi
0
0
Omikron
Π
π
Pi
Ρ
Ρ
Rho
ζ
σ
Sigma
τ
τ
Tau
Υ
υ
YpsiIon
φ
Φ . Ψ
Phi
χ
Χ
Chi
ψ
Ψ
Psi
Ω
ω
Omega
Anhang
357
3. S y m b o l v e r z e i c h n i s
Symbol
Bedeutung
+
"plus"; Addition "minus"; Subtraktion "mal"; Multiplikation
^
"a dividiert durch b"; Division
a/b
"a dividiert durch b"; Division "gleich"
f
"ungleich"
=«
"ungefähr gleich", "rund"
>
"größer als"
"größer oder gleich"