244 66 9MB
German Pages 474 [476] Year 2004
Statistik-Übungen Induktive Statistik
Von
o. Prof. Dr. Joachim Härtung Fachbereich Statistik der Universität Dortmund und
Dr. Barbara Heine
4., durchgesehene und ergänzte Auflage
R.Oldenbourg Verlag München Wien
Bibliografische Information Der Deutschen Bibliothek Die Deutsche Bibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über abrufbar.
© 2004 Oldenbourg Wissenschaftsverlag GmbH Rosenheimer Straße 145, D-81671 München Telefon: (089) 45051-0 www.oldenbourg-verlag.de Das Werk außerhalb lässig und filmungen
einschließlich aller Abbildungen ist urheberrechtlich geschützt. Jede Verwertung der Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzustrafbar. Das gilt insbesondere fur Vervielfältigungen, Übersetzungen, Mikroverund die Einspeicherung und Bearbeitung in elektronischen Systemen.
Gedruckt auf säure- und chlorfreiem Papier Druck: Huber GmbH & CO. KG, Garching-Hochbrück Bindung: R. Oldenbourg Graphische Betriebe Binderei GmbH ISBN 3-486-27328-0
Kapitelverzeichnis XI
VORWORT UND EINFÜHRUNG
n
TEIL I: ÜBUNGSAUFGABEN, ERLÄUTERUNGEN UND LÖSUNGEN
ι
K A P I T E L 1:
Zufallsereignisse und Wahrscheinlichkeiten
3
KAPITEL
Bedingte Wahrscheinlichkeit, Unabhängigkeit, Bayessche
KAPITEL
2:
3:
KAPITEL KAPITEL
5:
Formel und Zuverlässigkeit von Systemen
21
Zufallsvariablen und Verteilungen
39
Spezielle Verteilungen und Grenzwertsätze
93
Punktschätzer, Konfidenz- und Prognoseintervalle
135
K A P I T E L 6:
Parametrische Tests im Einstichprobenfall
159
KAPITEL
Anpassungstests und graphische Verfahren zur Überprüfung
7:
einer Verteilungsannahme
187
K A P I T E L 8:
Parametrische Vergleiche im Zweistichprobenfall
211
KAPITEL
Nichtparametrische, verteilungsfreie Vergleiche im Ein-
9:
und Zweistichprobenfall
243
KAPITEL
1 0 : Abhängigkeitsanalyse - Korrelation und Assoziation
267
KAPITEL
1 1 : Regressionsanalyse
297
KAPITEL
1 2 : Kontingenztafelanalyse
333
K A P I T E L 1 3 : Stichprobenverfahren
351
ANHANG
441
TEIL II: KLAUSURAUFGABEN UND LÖSUNGEN
373
ENDE
458
Inhaltsverzeichnis
VORWORT UND E I N F Ü H R U N G
TEIL
I:
X M
ÜBUNGSAUFGABEN,
KAPITEL 1:
ERLÄUTERUNGEN
ZUFALLSEREIGNISSE
UND LÖSUNGEN
UND W A H R S C H E I N L I C H K E I T E N
Ι
3
- Zufallsexperiment - Grundraum · Ereignis · Elementarereignis - Komplementärereignis · unmögliches/sicheres Ereignis · disjunkte Ereignisse - Verknüpfung von Ereignissen - Wahrscheinlichkeit · Kolmogoroffsche Axiome - Rechenregeln für Wahrscheinlichkeiten - Laplace-Wahrscheinlichkeit · günstige/mögliche Fälle - Kombinatorik · Kombinationen mit/ohne Wiederholung mit/ohne Berücksichtigung der Reihenfolge · geordnete/ungeordnete Stichprobe mit/ohne Zurücklegen · Permutationen
K A P I T E L 2:
BEDINGTE BAYESSCHE
WAHRSCHEINLICHKEIT,
UNABHÄNGIGKEIT,
FORMEL UND Z U V E R L Ä S S I G K E I T
VON S Y S T E M E N
21
- Bedingte Wahrscheinlichkeit - Multiplikationssatz für bedingte Wahrscheinlichkeiten - Unabhängigkeit von Ereignissen · paarweise/gemeinsame Unabhängigkeit - Satz von der totalen Wahrscheinlichkeit - Bayessche Formel - Parallel-/Seriensysteme - Gemischte Parallel-Serien-Systeme - Zuverlässigkeitsschaltbild - Komponenten-/Systemzuverlässigkeit
K A P I T E L 3:
ZUFALLSVARIABLEN -
UND V E R T E I L U N G E N
Zufallsvariable · Verteilungsfunktion Diskrete Zufallsvariable · Einzelwahrscheinlichkeit Stetige Zufallsvariable · Dichtefunktion Erwartungswert · Varianz · Verschiebungssatz · Variationskoeffizient Standardisierte Zufallsvariable a-ßuantile · Median · Quartile Gewinnfunktion · erwarteter Gewinn Tschebyscheffsche Ungleichung
39
VIII
Inhaltsverzeichnis
- Zufallsvektor · mehrdimensionale Verteilungsfunktion - Diskreter Zufallsvektor · (kx&)-Tafel · Randverteilung - Stetiger Zufallsvektor · gemeinsame Dichtefunktion · Randdichtefunktion - Unabhängigkeit von Zufallsvariablen - Kovarianz · Korrelation - Summe unabhängiger Zufallsvariablen: Verteilung · Faltung · Erwartungswert · Varianz · Gleichung von Bienayme - Summe abhängiger Zufallsvariablen: Erwartungswert · Varianz - Fehlerfortpflanzungsgesetz: Erwartungswert/Varianz von Produkt/Quotient/Funktionen von Zufallsvariablen
KAPITEL 4:
SPEZIELLE VERTEILUNGEN UND GRENZWERTSÄTZE -
KAPITEL 5:
93
Binomialverteilung MultinomialVerteilung Hypergeometrische Verteilung Poissonverteilung Gleichverteilung/Rechteckverteilung Exponentialverteilung Normalverteilung · Standardnormalverteilung t-Verteilung · χ2-Verteilung · F-Verteilung Zentraler Grenzwertsatz Grenzwertsatz von Poisson
PUNKTSCHÄTZER., KONFIDENZ- UND PROGNOSE INTERVALLE. 135 - Unabhängige Stichprobe - Punktschätzung · Schätzfunktion · Schätzwert · Erwartungstreue - Schätzer für Erwartungswert/Varianz/Variationskoeffizient /a-Quantil/Quartilsabstand/Kovarianz/Korrelation - Intervallschätzung · Konfidenzintervall · Niveau · erforderlicher Stichprobenumfang - Schätzer/Konfidenzintervalle für die Parameter der Normalverteilung · Prognoseintervalle für zukünftige Beobachtungen - Schätzer/Konfidenzintervall/approximatives Konfidenzintervall für den Parameter der Binomialverteilung - Schätzer/Konfidenzintervall für den Parameter der Exponentialverteilung - Schätzer/simultane Konfidenzintervalle für die Parameter der Multinomialverteilung
KAPITEL 6:
PARAMETRISCHE TESTS IM EINSTICHPROBENFALL - Statistischer Test · Null-/Alternativhypothese · Ein-/Zweiseitige Tests - Fehler 1. Art · Fehler 2. Art - Teststatistik · Test zum Niveau α - Ablehn-/Annahmebereich eines Tests · kritischer Wert
159
IX
Inhaltsverzeichnis
- Gütefunktion · erforderlicher Stichprobenumfang · abzusichernde Differenz - Tests über die Parameter der Normalverteilung: Einstichproben-Gauß-Test · Einstichproben-t-Test · Einst ichproben- Varianz-Test - Tests über den Parameter der Binomialverteilung - Test über die Parameter der Multinomialverteilung · χ 2 -Test
KAPITEL
7:
ANPASSUNGSTESTS PRÜFUNG -
KAPITEL
8:
EINER
UND
GRAPHISCHE
VERFAHREN
ZUR
ÜBER-
VERTEILUNGSANNAHME
137
2
χ -Anpassungstest Kolmogoroff-Smirnov-Anpassungstest Empirische Verteilungsfunktion Q—Q—Plot Histogramm/empirische Dichte Wurzeldiagramm/Rootogram · aufgehängtes Wurzeldiagramm · Wurzeldiagraimn-Residuen
PARAMETRISCHE
VERGLEICHE
IM Z W E I S T I C H P R O B E N F A L L
. 211
- Vergleich der Parameter zweier unabhängiger Normalverteilungen: Konfidenzintervalle · ZweistichprobenGauß-Test · Zweistichproben-t-Test · Behrens-FisherProblem · F-Test - Vergleich der Parameter zweier abhängiger Normalverteilungen · paarweise Differenzen - Erforderlicher Stichprobenumfang - Vergleich der Parameter zweier unabhängiger Binomialverteilungen - Vergleich der Parameter zweier unabhängiger Multinomialverteilungen · \ 2 -Test
KAPITEL
9:
ΝICHTPARAMETRISCHE, IM
EIN-
UND
VERTEILUNGSFREIE
VERGLEICHE
ZWEISTICHPROBENFALL
- Lokationsvergleiche im Einstichprobenfall: Zeichentest · Vorzeichenrangtest von Wilcoxon - Vergleich zweier abhängiger Verteilungen: Zeichentest · Vorzeichenrangtest von Wilcoxon - Vergleich zweier unabhängiger Verteilungen: WilcoxonRangsummentest · U-Test von Mann-Whitney · Kolmogorof f-Smirnov-Test · χ 2 -Test
KAPITEL
10: A B H Ä N G I G K E I T S A N A L Y S E
-
KORRELATION
UND
ASSO-
ZIATION - Korrelation · Bravais-Pearsonscher Korrelationskoeffizient - Test auf Unabhängigkeit bei gemeinsamer Normalverteilung
267
X
Inhaltsverzeichnis
- Fishersche-Z-Transformation - Tests auf Unabhängigkeit/positive/negative Abhängigkeit · Konfidenzintervall für die Korrelation bei gemeinsamer Normalverteilung - Spearmanscher Rangkorrelationskoeffizient · Test auf Unabhängigkeit · Hotelling-Pabst-Statistik - Kendallscher Rangkorrelationskoeffizient · Test auf Unabhängigkeit · Kendallsche-K-Statistik - Q-Maß · Yulescher Assoziationskoeffizient · Konfidenzintervall für Q · Vierfeldertafel - χ2-Unabhängigkeitstest · (kx£)-Kontingenztafel - Phi-Koeffizient - Pearsonscher Kontingenzkoeffizient · korrigierter Pearsonscher Kontingenzkoeffizient
KAPITEL 11: REGRESSIONSANALYSE
297
- Lineare Einfachregression · Methode der Kleinsten Quadrate - Schätzer/Konfidenzintervalle/Tests für die Parameter der linearen Einfachregression - Bestimmtheitsmaß - Konfidenzstreifen - Prognoseschätzung · Prognoseintervall · Prognosestreifen - Nicht-lineare Regression - Multiple Regression ' Methode der Kleinsten Quadrate · Normalengle ichungs system - Schätzer/Konfidenzintervalle/Tests für die Parameter der multiplen Regression - Multiples Bestimmtheitsmaß - Modellreduktion · Reduktionstest
KAPITEL 12: KONTINGENZTAFELANALYSE -
333 2
Vierfeldertafel · (kxi,)-Tafel · x -Test Test auf Unabhängigkeit Test auf Homogenität Test auf bedingte Gleichverteilung Test auf totale Gleichverteilung
KAPITEL 13: STICHPROBENVERFAHREN - Einfache Zufallsauswahl: Schätzer für Mittelwert/ Varianz der Merkmalswerte in der Grundgesamtheit · Anteilsschätzer · Schätzer für die Varianz des Mittelwert- /Anteilsschätzers · Konfidenzintervalle · erforderlicher Stichprobenumfang - Geschichtete Zufallsauswahl: Inventur auf Stichprobenbasis · Schätzer für Mittelwert/Varianz der Merkmalswerte in der Grundgesamtheit · Anteilsschätzer · Schätzer für die Varianz des Mittelwertschätzers · optimale Aufteilung des Stichprobenumfangs - Einstufige Klumpenauswahl: Schätzer für Mittelwert der Merkmalswerte in der Grundgesamtheit · Intraklass-Korrelationskoeffizient
351
Inhaltsverzeichnis
XI
- Zweistufige Klumpenauswahl: Schätzer für Mittelwert der Merkmalswerte in der Grundgesamtheit · Anteilsschätzer
TEIL
II:
KLAUSURAUFGABEN UND LÖSUNGEN
373
ANHANG
441
1 TABELLENANHANG
441
Tab.1:
Verteilungsfunktion 4>(x) der Standardnormalverteilung Ν(0,1)
442
Tab.2:
Quantile u^ der Standardnormalverteilung Ν(0,1)
443
Tab.3: Tab.4:
Quantile t^ der t - Verteilung 2 2 Quantile Χ η .γ der χ -Verteilung
444 445
Tab.5:
Quantile F
447
2 GRIECHISCHES
der F - Verteilung
ALPHABET
454
3 SYMBOLVERZEICHNIS
455
ENDE
458
Vorwort zur 4. Auflage Aufgrund einer starken Nachfrage liegt nun bereits die vierte, im wesentlichen unveränderte Auflage dieses Übungsbuches der induktiven Statistik vor. Dabei haben wir die Gelegenheit genutzt, die Aufgabenstellungen sowie die zugehörigen Lösungen und Erläuterungen noch einmal kritisch durchzusehen und die an uns herangetragenen Verbesserungswünsche zu berücksichtigen. Joachim Härtung Barbara Heine
Vorwort und Einführung Immer häufiger sehen sich Studenten, Wissenschaftler und Praktiker a l l e r Fachrichtungen mit der Auswertung oftmals sehr umfangreichen Datenmaterials, das durch Experimente oder Erhebungen gewonnen wurde, konfrontiert. Das vorliegende Buch, das nach einem langjährig erprobten Konzept entstanden i s t , ermöglicht es nun, anhand von praktischen Aufgabenstellungen sowohl die zur Verfügung stehenden s t a t i s t i s c h e n Auswertungsverfahren kennenzulernen bzw. zu vertiefen a l s auch eine gewisse Übung im Umgang mit s t a t i stischen Problemstellungen zu erlangen. Die ausführlichen Lösungsteile sind so gehalten, daß kein weiteres Buch zu Hilfe genommen werden muß, denn den konkreten Lösungswegen sind jeweils die zugehörigen allgemeinen b e g r i f f l i c h e n und methodischen Erläuterungen vorang e s t e l l t . Zusätzlich unterstützen zahlreiche graphische Veranschaulichungen die einzelnen Lösungsschritte. Daher kann das Buch sowohl zum Selbststudium a l s auch natürlich vorlesungsbegleitend verwendet werden. Letzteres wird durch eine Vielzahl von Klausuraufgaben noch unterstützt, die es prüfungsvorbereitend ermöglichen, das Erlernte anhand von komplizierteren Fragestellungen zu überprüfen. Desweiteren bietet das Buch Dozenten die Möglichkeit, aus einem breitgefächerten Angebot Aufgaben und B e i s p i e l e für ihre Lehrveranstaltungen
bereitzustellen.
XIV
Vorwort und Einfuhrung
Ausgangspunkt der hier behandelten Verfahren bildet die mit einem festen Untersuchungsziel verknüpfte Beobachtung einer oder mehrerer Variablen (Merkmale), Uber die Informationen und Erkenntnisse gewonnen werden sollen, bei bestimmten Untersuchungsobjekten. Da es oftmals nicht möglich i s t , etwa aus ökonomischen, technischen oder ethischen Gründen, a l l e relevanten Untersuchungsobjekte in eine Erhebung einzubeziehen (Totalerhebung), beschränkt man sich häufig auf eine z u f ä l l i g e Auswahl von Untersuchungsobjekten ( T e i l erhebung), die sogenannte Stichprobe. Die Methoden, die es erlauben, aus Stichprobenwerten der Variablen Rückschlüsse auf das Verhalten der Variablen bzw. auf Kenngrößen der Variablen in ihrer (Grund-) Gesamtheit zu ziehen, sind Gegenstand der lndaktivzn
lickti&ße.nden)
StatLitÄk.
Eine Stichprobe von Variablenwerten kann natürlich keine v ö l l i g exakte Auskunft über das Verhalten der Variablen in der Grundgesamtheit geben, d.h. die Stichprobenwerte bzw. die aus ihr abgeleiteten Ergebnisse können bei einer Übertragung auf die entsprechende Grundgesamtheit nur
Schätzungm
darstellen, die einen wichtigen Teil der induktiven S t a t i s t i k ausmachen. Dazu zählen etwa Punktschätzungen, ßereichsschätzungen, Konfidenz- und Prognoseintervalle. Oftmals bestehen auch Vermutungen, d.h. Hypothum
über das Variablenver-
halten in der Grundgesamtheit, die mit Hilfe von Stichprobenwerten s t a t i s t i s c h geprüft werden sollen. Die induktive S t a t i s t i k s t e l l t sogenannte TeA£veA{,ah&m bereit, die die Möglichkeit bieten, in einem gewissen Rahmen s t a t i s t i s c h ' s i g n i f i k a n t e ' Entscheidungen bezüglich der Variablenwerte in der Grundgesamtheit zu treffen. Weiterhin i s t es oft nicht nur interessant, das Verhalten einer Variablen zu untersuchen, sondern auch Zusammenhänge zwischen mehreren Variablen aufzudecken. Auch für diesen Fall liegen eine Reihe je nach Problemstellung unterschiedlicher Verfahren vor. Als theoretische Grundlage der oben kurz umrissenen, wesentlichen Fragestellungen der induktiven S t a t i s t i k i s t die Wakuchej.ntMililie.
x
3·
x4^>
wobei x ^ e { 1 , 2 , 3 , 4 }
Vierertupel
d i e j e t z i g e P o s i t i o n der Felge a n g i b t ,
d i e im l e t z t e n J a h r d i e i - t e P o s i t i o n i n n e h a t t e , i = 1 , 2 , 3 , 4 . I n s g e s a m t es 4 ! M ö g l i c h k e i t e n , d i e F e l g e n a n z u o r d n e n ( v g l . Aufgabe 1 . 3 ) .
gibt
Betrachtet
man das zu Α ί komplementäre
' m i n d e s t e n s e i n e F e l g e kommt w i e d e r an d i e g l e i c h e S t e l l e w i e im V o r j a h r 1 Ereignis
Ä = ' k e i n e F e l g e kommt w i e d e r an d i e g l e i c h e S t e l l e w i e im V o r jahr' , so e n t h ä l t d i e s s ä m t l i c h e Tupel ( x ^ , x ^ , X j , x ^ ) m i t x ^ i , ( 2 , 1, 4 , 3)
;
( 2 , 3 , 4 , 1)
;
(2, 4 , 1 , 3 )
;
( 3 , 1 , 4 , 2)
;
( 3 , 4 , 1 . 2)
;
( 3 , 4 , 2 , 1)
;
( 4 , 1, 2 , 3)
;
(4, 3 , 1 , 2 )
;
( 4 , 3 , 2 , 1)
.
i=1,2,3,4
:
G ü n s t i g f ü r das E r e i g n i s Ä s i n d h i e r a l s o 9 F ä l l e , d . h . f ü r d i e g e s u c h t e Wahrscheinlichkeit ergibt
sich
P(A) = 1 - P(Ä) = 1 - X
LÖSUNG ZU AUFGABE
= 1- 4
= 0-6250 .
1.9
E i n e h a l b e S t u n d e b e s t e h t aus 1800 S e k u n d e n , so daß i n d i e s e r Z e i t
also
1800 K o m b i n a t i o n e n des Z a h l e n s c h l o s s e s e i n g e s t e l l t werden k ö n n e n . I n s g e s a m t 4 g i b t es b e i e i n e m v i e r s t e l l i g e n Z a h l e n s c h l o ß 10 M ö g l i c h k e i t e n , d i e Z a h l e n 0,1,2
9 zu k o m b i n i e r e n ( K o m b i n a t i o n e n m i t W i e d e r h o l u n g b e i
Berücksich-
Kapitel I: Zufallsereignisse und Wahrscheinlichkeiten
19
tigung der Reihenfolge, v g l . Aufgabe 1 . 3 ) . Demnach l i e g t die Wahrscheinlichkeit für das Ereignis A = 'ein v i e r s t e l l i g e s Zahlenschloß in einer halben Stunde zu öffnen 1 bei P(A) =
= 0.1800 .
10H
LÖSUNG ZU AUFGABE
1.10
Insgesamt gibt es ^ ^
Mögl ichkeiten.aus 16 Mannschaften 8 auszuwählen (Kom-
binationen ohne Wiederholung, wenn die Reihenfolge nicht berücksichtigt wird, v g l . Aufgabe 1 . 3 ) . Die Anzahl der für das Ereignis A £ 'die beiden stärksten Mannschaften spielen in verschiedenen Gruppen1 gUnstigen Fälle beträgt
(iX? 4 )
= 2
'
3432
=
6864
»
denn zunächst muß aus den beiden spiel stärksten Mannschaften eine ausgewählt werden, dies i s t auf ( ? ) = 2 - fache Weise möglich, und anschließend /14\ werden noch aus den restlichen 14 Mannschaften 7 gezogen, was auf ( , ) = 141 \ ' / j r f r = 3432 - fache Weise möglich i s t . Die gesuchte Wahrscheinlichkeit i s t al so PfA) P W
- ( % ? ) - ~7T5T \8/
LÖSUNG ZU AUFGABE
-
6864
TF! 5TST
- 6 8 6 4 - η ς5 3333 - Τ257ΪΓ " ° ' 3 3 ·
1.11
Mit A = 'der Student hat genau 10 Fragen richtig beantwortet' , Β = 'der Student hat genau 11 Fragen richtig beantwortet' , C 3 'der Student hat genau 12 Fragen richtig beantwortet'
20
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
setzt sich die Wahrscheinlichkeit, daß der Student die Klausur bestanden, d.h. mindestens 10 Fragen richtig beantwortet hat, zusammen aus P(AUBUC) = P(A) +P(B) +P(C) , da Α, Β und C paarweise disjunkte Ereignisse ( v g l . Aufgabe 1.1) sind. Betrachten wir zunächst das Ereignis A. Die Wahrscheinlichkeit, daß der Student bei drei Antwortmöglichkeiten eine Frage richtig beantwortetest 1/3, daß er falsch antwortetest 2/3. Von den 12 Fragen beantwortet er also 10 10 mit Wahrscheinlichkeit (1/3) richtig und 2 mit Wahrscheinlichkeit (2/3) 2 f a l s c h . Desweiteren gibt es l 1 n ) Möglichkeiten, 10 richtig beantwortete Fragen aus den 12 Fragen auszuwählen. Insgesamt i s t also die Wahrscheinl i c h k e i t , daß genau 10 Fragen r i c h t i g beantwortet werden,gerade
p(A)
= (!o)G) 1 0 (§) 2 = τ ο ™ - · ψ - 0 0 0 4 9 6 7 6 ·
In analoger Weise erhält man nun
P(B > =
(ll)G)11(§)1
=12· ^
= 0.°°004516
und
P(C)
"(IDG)12
=
(l)12
=
O·00000188 ·
Die Wahrscheinlichkeit, daß der Student unvorbereitet, d.h. durch zufälliges Ankreuzen, die KTausur besteht, beträgt also P ( A u ß u C ) = 0.00049676 + 0.000.04516 + 0.00000188 = 0„0005438 d.h_ sie i s t sehr g e r i n g -
r
Kapitel 2: Bedingte Wahrscheinlichkeit, Unabhängigkeit, Bayessche Formel und Zuverlässigkeit von Systemen AUFGABE 2.1 Die Entwicklungsabteilung eines Produzenten von Haushaltsgeräten ist in 90% der Fälle für die Markteinführung der von ihr entwickelten Geräte. Ein positives Votum der Entwicklungsabteilung führt mit einer Wahrscheinlichkeit von 0.7 bei der Marketlngabteilung ebenfalls zu einem positiven Votum. Sind beide Abteilungen für die Markteinführung des neuen Gerätes, so entscheidet die Geschäftsleitung dennoch mit einer Wahrscheinlichkeit von 0.2 dagegen. Ist die Marketlngabteilung gegen die Markteinführung, die Entwicklungsabteilung aber dafür, so stimmt die Geschäftsleitung nur mit einer Wahrscheinlichkeit von 0.4 zu. (a) Berechnen Sie die Wahrscheinlichkeit dafür, dass die Markteinführung eines neuen Produktes sowohl von der Geschäftsleitung als auch von der Entwicklungs- und der Marketlngabteilung getragen wird. (b) Mit welcher Wahrscheinlichkeit entscheiden sich Geschäftsleitung und Entwicklungsabteilung für die Markteinführung eines neuen Produktes?
AUFGABE 2.2 Mit zwei unterscheidbaren Würfeln wird gleichzeitig geworfen. Es Interessieren die Ereignisse A = 'die beiden Würfel zeigen gleiche Augenzahl an' , Β - 'die Augensumme der beiden Würfel ist durch Drei teilbar' ,
22
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
C = 'der zweite Würfel zeigt eine Vier'. (a) Wie gross 1st die Wahrscheinlichkeit, dass die Augensumme der beiden Würfel durch Drei teilbar 1st, wenn der zweite Würfel eine Vier anzeigt? (b) Sind die Ereignisse A, B, C (I) paarweise unabhängig, (II) unabhängig?
AUFGABE 2.3 Eine Musikkassette werde zu 30% im Auto und sonst in der Wohnung abgespielt. Im Auto habe diese mit 75%- lger und in der Wohnung mit 9 5 % - lger Wahrscheinlichkeit eine Lebensdauer grösser als 500 Betriebsstunden. Mit welcher Wahrscheinlichkeit werden für die Kassette mehr als 500 Betriebsstunden erreicht?
AUFGABE 2.4 Von den Angestellten einer Firma fahren 60% der Frauen und 80% der Männer mit dem eigenen PKW zum Büro. Die Anzahl weiblicher und männlicher Angestellter In diesem Betrieb stehen dabei Im Verhältnis 3 : 2 . (a) wie mit (b) Wie der
gross ist die Wahrscheinlichkeit, dass eine Angestellte dem PKW zur Arbelt kommt? gross ist die Wahrscheinlichkeit, dass eine Bürokraft Firma, die mit dem PKW zur Arbelt kommt, weiblich 1st?
AUFGABE 2.5 Eine Krankenversicherung ermittelte, dass bei Verkehrsunfällen von PKW -Fahrern, die angegurtet waren, nur 8% schwere Kopfverletzungen aufwiesen. Bei nicht angeschnallten Fahrern trugen 62% keine Kopfverletzung davon. Trotz Anschnallpflicht legen
Kapitel 2: Bedingte Wahrscheinlichkeiten etc., und Zuverlässigkeit von Systemen
23
immer noch 15% aller Autofahrer keinen Gurt an. Wie gross ist die Wahrscheinlichkeit, dass ein nach einem Unfall mit Kopfverletzung Ins Krankenhaus eingelieferter Autofahrer keinen Gurt angelegt hatte?
AUFGABE 2.6 Die Herstellung eines Werkstücks erfolgt auf vier Produktionsanlagen. Die Gesamtproduktion verteilt sich dabei zu 30% auf Maschine A, zu 15% auf Maschine B, zu 35% auf Maschine C und zu 20% auf Maschine D. Folgende Wahrscheinlichkelten für die Ausschussproduktion der einzelnen Maschinen sind bekannt: Maschine A Maschine C
0.04 , Maschine Β 0.03 und Maschine D
0.02 0.01
, .
(a) Wie gross 1st die Wahrscheinlichkeit, dass ein der Gesamtproduktion zufällig entnommenes Werkstück Ausschuss 1st? (b) Wie gross 1st die Wahrscheinlichkeit, dass ein zufällig entnommenes Ausschussstück auf Maschine C produziert wurde?
AUFGABE 2.7 Wiegross 1st die Zuverlässigkeit eines Gerätes G, dessen Komponentenstruktur bzgl. der Zuverlässigkeit In Abb. 2.7dargestellt 1st, wenn die Intaktwahrschelnllchkelten der einzelnen Bauteile wie folgt gegeben sind Ρ(Α η ) = 0.92 P(B 3 ) = 0.85 P(E1) = 0.95
, , ,
P(B 1 ) = 0.95 PtC,) = 0.90 P(F 1 ) = 0.90
, , .
P(B 2 ) = 0.90 P(D 1 ) = 0.98
, ,
AUFGABE 2.8 Ein Produkt wird In mehreren Phasen hergestellt. Zunächst sind für die Grobbearbeitung zwei Maschinen notwendig, wobei drei
24
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
A b b . 2.7: Z u v e r l ä s s i g k e i t s s c h a l t b i l d eines Gerätes G
Produktionsstrassen benutzt werden können. Bezeichnet Gij = i - te Maschine in der j - ten Produktionsstrasse, 1=1,2, j=l,2,3 , so sind die Zuverlässigkeiten der einzelnen Maschinen gegeben durch P ( G n ) = 0.9
J
P(G 1 2 ) = 0.8
,
P(G 1 3 ) = 0.7
,
P(G 2 1 ) = 0.8
,
P(G 2 2 ) = 0.8
,
P(G 2 3 ) = 0.9
.
Anschliessend werden die Grobprodukte mit einem Förderband, dessen Ausfallwahrscheinlichkeit bei 0.05 liegt, zur Weiterverarbeitung transportiert. Für die nun erforderlichen Feinarbeiten stehen alternativ zwei Maschinen mit Defektwahrscheinlichkeit 0.1 bzw. 0.2 zur Verfügung. Schliesslich werden die Produkte zur Lagerhalle transportiert; das Transportband ist mit 9 5 % - lger Sicherheit intakt. Berechnen Sie die Zuverlässigkeit des Systems.
Kapitel 2: Bedingte Wahrscheinlichkeiten
LÖSUNG
ZU A U F G A B E
25
etc., und Zuverlässigkeit von Systemen
2.1
Sind Α und Β zwei E r e i g n i s s e aus dem Grundraum Ω, wobei
P(B) > 0
gilt,
so
b e z e i c h n e t man P(A Ι Β) -
Ρ ( Λ Π Β )
Ρ (Β)
a l s b e d i n g t e W a h r s c h e i n l i c h k e i t des E r e i g n i s s e s Α unter der Bedingung B. Für d i e b e d i n g t e W a h r s c h e i n l i c h k e i t P(A | B) g e l t e n b e i f e s t e m Β und b e l i e b i g e n E r e i g n i s s e n Α d i e Axiome der Wahrscheinlichkeitsrechnung, v g l . A u f gabe 1 . 2 , und somit auch d i e entsprechenden Rechenregeln. So i s t etwa P(Ä I B) = 1 - P(A I Β) P = P(A ) · P ( A 2 | A j ) · P ( A 3 | A j η A 2 ) · •••-p(Ak Ι
Folgende
Α
ι
η
···
η
\-ι>
-
Ereignisse A1 = ' E n t w i c k l u n g s a b t e i l u n g A^ = ' M a r k e t i n g a b t e i l u n g Ag = ' G e s c h ä f t s l e i t u n g
i s t für Markteinführung'
i s t für Markteinführung'
i s t für
Markteinführung
,
,
1
mit den W a h r s c h e i n l i c h k e i t e n P(A^)
= 0.9
,
P(A2 I A1)
= 0.7
,
P ( Ä 3 | Α, η A 2 )
= 0.2
und
P ( A 3 I A1 Π a 2 ) = 0.4 liegen
vor.
-»(a) Berechnet werden s o l l A1 η A 2 η A 3
d i e W a h r s c h e i n l i c h k e i t f ü r das
Ereignis
,
daß E n t w i c k l u n g s a b t e i l u n g , M a r k e t i n g a b t e i l u n g
und G e s c h ä f t s l e i t u n g
für
die
26
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
M a r k t e i n f ü h r u n g e i n e s P r o d u k t e s s i n d . M i t H i l f e des
Multiplikationssatzes
f ü r b e d i n g t e W a h r s c h e i n l i c h k e i t e n , den angegebenen W a h r s c h e i n l i c h k e i t e n
sowie
den R e c h e n r e g e l n f ü r W a h r s c h e i n l i c h k e i t e n ( v g l . Aufgabe 1 . 2 ) e r h ä l t man
P ^ n A g f l A j ) = P ^ ) . P(A2 I A1) · P(A3 I Α , η Α ^ = Ρ ί Α ^ · P(A2 I A 1 ) - (1 - P ( Ä 3 I A 1 n A 2 ) ) = 0.9 . 0 . 7 . (1 - 0 . 2 ) = 0.504
.
- • ( b ) B e r e c h n e t w e r d e n s o l l d i e W a h r s c h e i n l i c h k e i t f ü r das E r e i g n i s A j η A3
,
daß E n t w i c k l u n g s a b t e i l u n g u n d G e s c h ä f t s l e i t u n g f ü r d i e M a r k t e i n f ü h r u n g P r o d u k t e s s i n d . A n a l o g zu ( a )
eines
ist
p ( A 1 η Ä2 η A 3 ) = P(A1) · P(Ä2 | A 1 ) · P(A3 | Α , η Ä 2 )
= P(A1) · (1 -P(A 2 I A 1 )) · P(A3| A 1 nÄ 2 ) = 0 . 9 · (1 - 0 . 7 ) · 0.4 = 0.108 .
M i t d e r u n t e r ( a ) b e r e c h n e t e n W a h r s c h e i n l i c h k e i t e r g i b t s i c h nun
P(A1 η A3) = P(A1 η ω η A3) = P(A1 η (A2 U Ä2) η A3) = p( ( Α 1 η A 2 η A 3 ) υ ( Α , η fi2 η A 3 ) ) = P( A 1 η A 2 η A 3 ) + P(A 1 η Ä 2 η A 3 ) = 0.504 + 0.108 = 0.612 . V e r d e u t l i c h e n S i e s i c h d i e d u r c h g e f ü h r t e n M e n g e n o p e r a t i o n e n anhand e i n e s Mengendiagramms.
LÖSUNG ZU AUFGABE 2 . 2 Werden z w e i u n t e r s c h e i d b a r e W ü r f e l g l e i c h z e i t i g g e w o r f e n , so g i b t es 36 mögliche
Elementarereignisse {(1,1) , (1,2) , (2,1) , (1,3) , (3,1) , . . . , (6,6)}
.
F ü r das E r e i g n i s A S ' d i e beiden Würfel zeigen g l e i c h e Augenzahl
an'
Kapitel 2: Bedingte Wahrscheinlichkeiten etc., und Zuverlässigkeit von Systemen
gibt es 6 günstige Fälle, nämlich {(1,1) ,(2,2) ,(3,3) ,(4,4) ,(5,5) ,(6,6)}
,
d.h. die Wahrscheinlichkeit für das Ereignis Α berechnet sich zu (vgl. Aufgabe 1.3)
Analog erhält man für das Ereignis Β = 'die Augensunme der beiden Würfel ist durch Drei teilbar 1 bei 12 günstigen Fällen {(1,2) ,(2,1) ,(1,5) ,(5,1) ,(2,4) ,(4,2) ,(3,3) ,(3,6) , (6,3) ,(4,5) ,(5,4) ,(6,6)} eine Wahrscheinlichkeit von 12 1 35" " 1
P(B)
bzw. für das Ereignis C = 'der zweite Würfel zeigt eine Vier' mit 6 günstigen Fällen {(1,4) ,(2,4) ,(3,4) ,(4,4) ,(5,4) ,(6,4)} eine Wahrscheinlichkeit von p c
< > =π = τ ·
-»(a) Es soll die bedingte Wahrscheinlichkeit (vgl. Aufgabe 2 . 1 ) PfR ι η IC) -
p
(B"0
H t )
berechnet werden. Da sich für das Ereignis B n C die günstigen Fälle {(2,4) , (5,4)} ergeben, ist P ( B n C
>
= ·ΠΓ = Τ ¥ »
d.h. die Wahrscheinlichkeit, daß die Augensumme der beiden Würfel durch Drei teilbar ist, wenn der zweite Würfel eine Vier anzeigt, ist 1 P(B|o
.4»
27
28
Teil I: Übungsaufgaben,
Erläuterungen
und
Lösungen
-•(b) Zwei Ereignisse Α und Β heißen (stochastisch) unabhängig, wenn gilt Ρ ( Α Π Β ) = Ρ (Α) · Ρ (Β) , was bei jeweils positiven Wahrscheinlichkeiten gleichbedeutend ist mit Ρ (Β [ A) = Ρ (Β)
bzw.
Ρ (A I Β) = Ρ (Α) .
In Verallgemeinerung dieser Definition heißen k Ereignisse Α^,.,.,Α^ (stochastisch) unabhängig, wenn für jedes m£{2,...,k} und alle möglichen natürlichen Zahlen
1< i, < i, < . .. < i < k - 1 2 m -
P(A. Π Α . 1
1
gilt:
Ο.,,ΙΙΑ. ) = P(A. ) · Ρ (A. ) · . . . · Ρ (A. ) .
1
2
1
i-m
1
2
m
In der Regel folgt aus der paarweisen Unabhängigkeit von k Ereignissen, d.h. aus P(A. DA.) = P(AJ · P(A_.)
für alle i,j=l,...,k
,
i^j ,
nicht, daß diese insgesamt unabhängig sind.
- » ( b ) Zum Beweis der paarweisen Unabhängigkeit muß also gezeigt werden, daß P(A Π Β) = P(A) · P(B) , P ( A n C ) = P(A) · P(C) , P(BflC) = P(B) · P(C) gilt. Die Wahrscheinlichkeiten P(A), P(B) , P(C) wurden bereits berechnet. Es ergab sich P(A) = l
,
P(B) = 1
,
P(C) = 1
.
Das Ereignis Α η Β setzt sich zusammen aus Α η Β = {(3,3) , (6,6)}
,
bei insgesamt 36 möglichen Elementarereignissen gilt nun
ρ Αηβ
< ) = ^ = A = =ρ(Α)·ρ(Β) ·
d.h. Α und Β sind (stochastisch) unabhängig. Für das Ereignis A n C ergibt sich ein günstiges Elementarereignis Α η C = {(4,4)} und somit gilt P(AnC) = ^
=
= P(A) - P(C) ,
d.h. Α und C sind (stochastisch) unabhängig.
Kapitel 2: Bedingte Wahrscheinlichkeiten
etc.. und Zuverlässigkeit von Systemen
Mit BflC = {(2,4) ,(5,4)} gilt p
(ßnc>
P ( B )
= W
d.h. auch Β und C sind (stochastisch)
'
P ( C )
·
unabhängig.
Insgesamt liegt also paarweise Unabhängigkeit der Ereignisse Α , Β und C vor. ->(b,ii) Neben der paarweisen Unabhängigkeit, die in (i) gezeigt w u r d e , müßte für die Unabhängigkeit der Ereignisse Α , Β und C jetzt noch P(A η Β η C) = P(A) · P(B) · P(C) gelten. Da aber An Β η C = 0 , d.h. P(AnBnC)
= 0t=
T
^
= g - ' j ' 5 " = P(A) · P(B) · P(C) ,
sind folglich die drei Ereignisse nicht (stochastisch)
LÖSUNta ZU AUFGABE
unabhängig.
2.3
Sind Α ^ , , . , , Α ^ paarweise d i s j u n k t e E r e i g n i s s e aus dem Grundraum Ω, d . h . gilt Α..ΠΑ.
= 0
, i , j =l
k
,
ifj
,
und i s t außerdem A, IIA. U . . . UA, 1 2 k
= Ω' ,
mit P ( A . ) ι
> 0
für i = l , .
,
so l ä ß t s i c h d i e W a h r s c h e i n l i c h k e i t f ü r e i n b e l i e b i g e s E r e i g n i s Β aus Ω mit H i l f e der bedingten W a h r s c h e i n l i c h k e i t e n
( v g l . Aufgabe 2 . 1 )
nach dem
Satz von der t o t a l e n W a h r s c h e i n l i c h k e i t berechnen: P(B)
=
k Ι P(B Ι A . ) · P ( A . ) ' ι ι 1=1 . L -,
„
S e t z t man A^ = A und A^ = A , so e r h ä l t man a l s S p e z i a l f a l l d i e s e s gerade
Satzes
29
30
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
P(B)
= Ρ (Β I A ) · Ρ ( A ) + Ρ (Β | Ä) · P ( A )
.
Es s o l l die Wahrscheinlichkeit des Ereignisses ß S 'die Musikkassette b e s i t z t eine Lebensdauer von mehr a l s 500 Stunden 1 berechnet werden. Für das E r e i g n i s A 2 ' d i e Musikkassette wird im Auto benutzt' i s t die Wahrscheinlichkeit P(A) = 0.30 bekannt. Außerdem sind gegeben P(B I A) = 0.75
und
P(B | Ä) = 0.95 .
Die Anwendung des Satzes von der totalen Wahrscheinlichkeit l i e f e r t das Ergebnis: P(B) = P(B I A) · P(A) + P(B | Ä) · P(Ä) = P(B I A) · P(A) + P(B I Ä)(1 - P(A)) = 0.75 · 0.30 + 0.95 · (1 - 0.30) = 0.89 .
LÖSUNG ZU AUFGABE 2 . 4 Mit H i l f e
der D e f i n i t i o n der bedingten Wahrscheinlichkeit
und dem S a t z von d e r t o t a l e n W a h r s c h e i n l i c h k e i t sich
(vgl.
f ü r paarweise disjunkte Ereignisse Α ^ , . , . , Α ^
P(AJ >0
für i = l , . . . , k ,
Bayessche
Formel:
Ρ ( Α ± I Β)
Ρ (Β I Α . ) · Ρ ( Α . ) !
=
V j-1 B e t r a c h t e t man s p e z i e l l
P ( A I B)
Bezeichnen Α^,
und e i n b e l i e b i g e s
(vgl.
Aufgabe
Aufgabe 2.3)
m i t A^U . . . U
Α^=Ω,
E r e i g n i s Β aus β d i e
,
i=l,...,k
sogenannte
.
Ρ ( Β Ι Α . ) · Ρ (Α . ) 3
3
A^ = A , A^ = Ä und e i n E r e i g n i s B , so g i l t
) * P ( A ) P ( B ] A) ·P (PB( AI) A + P ( B Α) · Ρ ( A )
Β die E r e i g n i s s e
2.1)
ergibt
etwa
31
Kapitel 2: Bedingte Wahrscheinlichkeiten etc., und Zuverlässigkeit von Systemen
A^ = ' d i e B ü r o k r a f t i s t w e i b l i c h '
,
Ä£ = ' d i e B ü r o k r a f t i s t m ä n n l i c h '
,
Β
= ' d i e B ü r o k r a f t kommt m i t dem PKW z u r A r b e i t '
,
so s i n d f o l g e n d e I n f o r m a t i o n e n gegeben: P(B I A t ) = 0 . 6 , P(B I A 2 ) = 0 . 8 . Aus dem V e r h ä l t n i s
3 : 2
von w e i b l i c h e n zu m ä n n l i c h e n A n g e s t e l l t e n
ergibt
s i c h außerdem P(A1) = I
= 0.6 ,
P(A2) = I
= 0.4 .
- • ( a ) D i e W a h r s c h e i n l i c h k e i t , daß e i n e A n g e s t e l l t e , d . h . w e i b l i c h e B ü r o k r a f t , m i t dem PKW z u r A r b e i t kommt, l i e g t b e r e i t s v o r . Es i s t d i e b e d i n g t e Wahrscheinlichkeit P(B | A ^
=0.6
.
- • ( b ) Gesucht i s t d i e W a h r s c h e i n l i c h k e i t d a f ü r , daß e i n e B ü r o k r a f t w e i b l i c h i s t , u n t e r d e r B e d i n g u n g , daß s i e m i t dem PKW z u r A r b e i t kommt, d . h . P ( A j | B ) . Nach d e r Bayesschen Formel e r g i b t s i c h g e r a d e P(B | A 1 ) · P ( A , ) P(A1 1 B)
=
-
P(B I A 1 ) . F>(A1) + P(B I A 2 ) · P ( A 2 ) 0.6 · 0.6 _ 0.36 0.6 · 0.6 + 0.8 · 0.4 " 1 O T
= 0.5294 .
LÖSUNG ZU AUFGABE
2.5
Bezeichnen Α und Β d i e
Ereignisse
A = 'der PKW-Fahrer i s t angegurtet'
,
Β £ ' d e r U n f a l l v e r l e t z t e w e i s t schwere K o p f v e r l e t z u n g e n a u f ' , so l a s s e n s i c h d i e gegebenen I n f o r m a t i o n e n d a r s t e l l e n a l s P(Ä) = 0 . 1 5 ,
32
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
P(B I A) = 0.08 , P(B I Ä) = 0.62 . Mit der Formel von Bayes ( v g l . Aufgabe 2.4) berechnet sich die gesuchte Wahrscheinlichkeit zu P(Ä I B) =
p(B
1 *> * p(ä>
P(B I Ä) . P(Ä) + P(B I A) . P(A) (1 - P ( B | Ä)) · P(Ä)
=
(1 - PC Β I Ä)) . P(Ä) + PCB I Α) · (1 - P(Ä)) (1 - 0.62) · 0.15 _ 0.057 " (1 - 0 . 6 2 ) . 0.15 + 0.08· (1 - 0 . 1 5 ) ~ O I F = 0.456 .
Lösung z u "Aufgabe 2 . 6 Es stehe M^, Mg. M^, M^ f ü r die Produktion an Maschine Α, B, C und D und Ν f ü r Ausschußstück, dann sind nachfolgende Wahrscheinlichkeiten gegeben P(Mt) = 0.30
,
P(N | Mj) = 0.04
,
P(M2) = 0.15
,
P(N | M2) = 0.02
,
P(M3) = 0.35
,
P(N | M3) = 0.03
,
P(M4) = 0.2Ό
,
P(N | M4) = 0.01
-»(a) Nach dem Satz von der totalen Wahrscheinlichkeit ( v g l . Aufgabe 2.3) i s t mft Wahrscheinlichkeit P(N) =
4 Ι P(R | Μ.) · P(M_.) 1 1 •Μ
= 0.04 - 0 , 3 0 + 0.02 . 0 j 5 + aj)3 · 0 ^ 5 + 0 Λ 1 · 0.20 = 0.0275 e i n - z u f ä l l i g entnommenes Produktfonsstück Ausschuß^
-*{b) Ein z u f ä l l i g entnommenes Ausschußstück i s t unter Anwendung der Bayesschen Formel ( v g l . Aufgabe 2·4) und des Ergebnisses 3us (a) mit Wahrscheinlichkeit
Kapitel 2: Bedingte Wahrscheinlichkeiten
P(N| Η,)· P(M.) 2 —
P(M3|N)
l i=1
etc., und Zuverlässigkeit
'
0 03 - 0 35 0.0275
=
von Systemen
33
°·3818
P( Ν | Μ -) · Ρ(Μ·) 1
1
auf Maschine C produziert worden.
LÖSUNG
ZU A U F G A B E
2.7
Ein System aus η unabhängigen Komponenten A ,... ,A vgl. Ahb. C2.7A,
heißt Parallelsystem,
falls es genau dann intakt ist, wenn mindestens eine der
η Systemkomponenten intakt ist.
Abb. £2*7.1: Zuverlässigkeitsschaltbild eines Parallelsystems aus η Komponenten
Ist ein System aus η unabhängigen Komponenten A
# ... ,A
nur dann intakt,
wenn alle η Komponenten intakt sind, so spricht man von einem Seriensystem, vgl. Abh. C2.7.2. Als Zuverlässigkeit einer Komponente A^ bezeichnet man die Wahrscheinlichkeit, daß A_. intakt ist (kurz: P(A^ intakt)). Analog spricht man von Systemzuverlässigkeit als der Wahrscheinlichkeit, daß das System intakt ist (kurz : Ρ(System intakt)). Aufgrund der vorausgesetzten Unabhängigkeit (vgl. Aufgabe 2.2) der Komponenten berechnet sich die Zuverlässigkeit eines Parallelsystems zu
34
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
A
A2
1
A b b . £2.7.2: Zuverlässigkeitsschaltbild eines Seriensystems aus η Komponenten
Ρ(Parallelsystem intakt)
= Ρ(mindestens eine Komponente ist intakt) = P[(Aj intakt) U (A 2 intakt) U ... U (A = 1 - P[(Aj defekt) η ... Π (A = 1 - P ( A . defekt) · ... · P(A
1
intakt)]
defekt)]
η
defekt)
= 1- [ (1 - P(A. intakt))· . . . · ( 1 - P ( A
1
η
intakt))]
b z w . für ein Seriensystem erhält m a n Ρ(Seriensystem intakt)
= P(alle Komponenten sind intakt) = P[(A. intakt) η (A„ intakt) Π ... Π (Α
1
= Ρ(Α. intakt) · ... · Ρ(Α
1
η
η
intakt)]
intakt).
In Abb. £2.7.3 ist noch einmal die Komponentenstruktur (bzgl. der Zuverlässigkeit) des Gerätes G graphisch dargestellt. Dabei wurde das System in Teilsysteme G p G2, Gj, G^ und Gg zerlegt. Mit den Komponentenzuverlässigkeiten P(A 1 intakt) = 0.92
,
P(B 1 intakt) = 0.95
,
P(B 2 intakt) = 0.90 ,
P(B 3 intakt) = 0.85
,
P(C1 intakt) = 0.90
,
P(D 1 intakt) = 0.98 ,
P(E 1 intakt) = 0.95
und
P(F 1 intakt) = 0.90
lassen sich nun die Teilsystemzuverlässigkeiten berechnen. Beim System G^ handelt es sich nun um eine Serienschaltung, d.h. es ist P(G 1 intakt) = P(B1 intakt) · P(B 2 intakt) · P(B 3 intakt) = 0.95 · 0.90 · 0.85 = 0.72675 .
Kapitel 2: Bedingte Wahrscheinlichkeiten etc., und Zuverlässigkeit von Systemen
Abb. C2.7.3: Zuverlässigkeitsschaltbild eines Gerätes G
Das Teilsystem G2 i s t ein Parallel system bestehend aus den Komponenten A1 und Gj, d.h. es g i l t P(G2 intakt) = 1 - [ ( 1 - P ( A 1 i n t a k t ) ) ( 1 - P(G1 intakt))] =
1 -
=
1
C(1
=
0 . 9 7 8 1 4
-
0 . 9 2 ) ( 1
-
0 . 7 2 6 7 5 ) 1
- 0 . 0 2 1 8 6 .
Bei Gj handelt es sich dann um ein Seriensystem mit den Komponenten G2 und C^, d.h. dessen Zuverlässigkeit l i e g t bei P(G3 intakt) = P(G2 intakt) · P(C1 intakt) =
0 . 9 7 8 1 4
=
0 . 8 8 0 3 3
·
0 . 9 0 .
Sowohl G4 als auch Gg stellen Parallelsysteme dar, einmal bestehend aus G^ und D,, d.h.
35
36
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
P(G 4 intakt) = 1 - [ ( 1 - P ( G 3 intakt))(1 - P(D1 intakt))] = 1 - [(1 - 0.88033)(1 - 0.98)] = 1 - 0.00239 = 0.99761 , zum anderen bestehend aus den Komponenten E^ und F^, d.h. es ist P(G g intakt) = 1 - [ ( 1 - P ( E 1
intakt))(1 - P(F1
intakt))]
= 1 - [( 1 - 0.95)(1 - 0.90)] = 0.995 . Die Zuverlässigkeit des Gerätes G läßt sich nun berechnen als die Wahrscheinlichkeit, daß das Seriensystem bestehend aus den Komponenten G^ und Gg intakt ist. Man erhält somit P(G intakt) = P(G 4 intakt) · P(G g intakt) = 0.99761 . 0.995 = 0.99262 .
LÖSUNG ZU A U F G A B E
2.8
Aus den gegebenen Informationen läßt sich das in Abb. C2.8.1 dargestellte Zuverlässigkeitsschaltbild aufstellen. Neben den einzelnen Systemkomponenten, d.h. den Maschinen G.j, i=1,2, j=1,2,3, dem Förderband F^, den Maschinen für die Feinarbeit E^ und Eg
sowie dem Transportband D^, wurden dort
auch die die Zuverlässigkeitsberechnung ( v g l . A u f g a b e 2 . 7 )
erleichternden
Teilsysteme T^, T^, Tj, T^ und Tg eingetragen. Desweiteren
können folgende Intaktwahrscheinlichkeiten, d.h. Komponenten-
zuverlässigkeiten, zusammengestellt werden: P(G 11 intakt) = 0.90
,
P(G 1 2 intakt) = 0.80
,
P(G 1 3 intakt) = 0.70
,
P(G 21 intakt) = 0.80
,
P(G 2 2 intakt) = 0.80
,
P(G 2 3 intakt) = 0.90
,
P{F1 intakt) = 1 - P ( F 1 defekt) = 1 - 0.05 = 0.95
,
P(E1 intakt) = 1 - P C E , defekt) = 1 - 0 . 1 0 = 0.90
,
P(E 2 intakt) = 1 - P(E g defekt) = 1 - 0.20 = 0.80
,
P(D. intakt) = 0.95 .
Kapitel 2: Bedingte Wahrscheinlichkeiten etc., und Zuverlässigkeit von Systemen
Ahh. £2.8.1: Zuverlässigkeitsschaltbild des Systems zur Produktherstellung
Bei den Teilsystemen T 1 , T2 und T"3 handelt es sich um Seriensysteme, die jeweils aus zwei Komponenten bestehen. Deren Zuverlässigkeit berechnet sich somit zu P(T1 intakt) = P ( G n
intakt) · P(G21 intakt)
= 0.90 · 0.80 = 0.72 , P(T 2 intakt) = P ( G n intakt) · P(G 22 intakt) = 0.80 · 0.80 = 0.64 , P(T3 intakt) = P(G 13 intakt) · P(G 23 intakt) = 0.70 · 0.90 = 0.63 . Für das P a r a l l e l system T^, bestehend aus den Komponenten T 1 , T2 und T 3 , ergibt sich eine Intaktwahrscheinlichkeit von P(T4 intakt) = 1 - [ ( 1 - P ( T 1 intakt) ) · ( 1 - P(T 2 intakt)) • (1 - P(T 3 intakt))]
37
38
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
= 1 - ( 1 - 0.72) (1 - 0.64) (1 - 0.63) = 1 - 0.03730 = 0.9627 . Analog erhält man für die Zuverlässigkeit des Parallel systems P(T 5 intakt) = 1 - [ ( 1 - P ( E 1 intakt))(1 - P(E 2 intakt))] = 1 - ( 1 - 0.90) (1 - 0.80) = 0.98 . Die Systemzuverlässigkeit ergibt sich nun aus der Wahrscheinlichkeit, daß das Seriensystem mit den Komponenten T^, F^, Tg und D^ intakt i s t : P(System intakt) = P(T4 intakt) · P(F 1 intakt) · P(Tg intakt) • P(D1 intakt) = 0.9627 · 0.95 - 0.98 · 0.95 = 0.8515 .
Kapitel 3: Zufallsvariablen und Verteilungen AUFGABE 3 . 1 Folgendes Zufallsexperiment sei gegeben: Eine f a i r e Münze wird viermal nacheinander geworfen und man i n t e r e s s i e r t s i c h f ü r das E r e i g n i s , wie oft im Ergebnis ' Z a h l ' e r s c h e i n t . (a) Berechnen und zeichnen S i e die V e r t e i l u n g s f u n k t i o n f ü r d i e ses z u f ä l l i g e Ergebnis X. (b) Berechnen S i e folgende Wahrscheinlichkeiten: P(0 < X < 2) , P ( X > 1 ) , P(X < 3) .
AUFGABE 3.2 Bei der Q u a l i t ä t s k o n t r o l l e eines Werkstücks s t e l l t man f e s t , dass die Z u f a l l s v a r l a b l e X = 'Abweichung von der Querschnlttsvorgabe' eine Dichte folgender Art b e s i t z t : Absolute Abweichungen von mehr a l s 3mm treten nicht auf. Für die Abweichungen von - 3 b i s Omm s t e i g t die Dichte l i n e a r b i s zu einem Wert h an und im Bereich von 0 b i s 3mm i s t ein l i n e a r e r Abstieg der Dichte auf den Wert 0 zu verzeichnen. (a) Bestimmen s i e den Maximalwert h der Dichte. (b) Berechnen S i e die Dichte und die V e r t e i l u n g s f u n k t i o n von X und s t e l l e n S i e beide graphisch dar. (c) Berechnen S i e die Wahrscheinlichkeiten P(X 1 - 2 ) , P ( X > - 1 ) , P ( - l < X < 1) .
40
Teil I: Übungsaufgaben,
Erläuterungen
und
Lösungen
AUFGABE 3.5 Ein begeisterter Fussballfan gibt jede Woche Tototips ab, wobei er die Ziffern 0 (Unentschieden), 1 (Heimsieg) und 2 (Auswärtssieg) unter Zuhilfenahme der WahrschelnlIchkeitsfunktion J + a k + bk 2
für k=0,l,2
0
sonst
PCX = k) verteilt. Die Grössen a und b hält er geheim. Es 1st aber bekannt, dass für seine Tips ausserdem P(X = 1 )
_ 1 - Ζ
gilt. Bestimmen Sie a und b sowie die zugehörige Verteilungsfunktion.
AUFGABE 3.4 Folgende Dichtefunktion eil er Zufallsvariablen X sei gegeben |c2x
.falls 0 i x < a
f x (x> = • 0
sonst
(a) Bestimmen Sie a. (b) Berechnen Sie für c = l die Verteilungsfunktion F (x).
AUFGABE 5.5 In einem TANTE - EMMA - Laden liegt der tägliche Umsatz bei maximal 400 DM. Der Kaufmann hat nach langjährigen Beobachtungen festgestellt, dass sich der tägliche Umsatz U näherungsweise verteilt mit der Dichtefunktion f (U) = 7.5 · 10"^ \fü- 0.375 · 10 _it u
, 0 < U < 400 .
(a) Berechnen Sie die Verteilungsfunktion und stellen Sie diese
sowie die Dichtefunktion graphisch dar.
Kapitel 3: Zufallsvariablen und Verteilungen
41
(b) Wie g r o s s i s t die Wahrschelnlichkeit, dass der Kaufmann pro Tag (i) mindestens 200 DM, (ii) zwischen 100 und 300 DM, ( i i i ) genau 150 DM Umsatz hat?
AUFGABE 3.6 Eine Maschine s t e l l t Keilriemen mit einer Sollänge von 9 cm her. Eine Untersuchung der auftretenden Längen X ergab die in t a t . 3 . 6 angegebenen Werte mit der entsprechenden W a h r s c h e i n l i c h k e i t s v e r teilung. t a b . 3.6: Keil riemenlänge x^ sowie Wahrscheinlichkeit P ( X = x . . ) , i=1 i
1
2
3
4
5
χ. 1
8.8
8.9
9.0
9.1
9.2
P(X =x i )
0.050
0.150
0.575
0.200
0.025
5
(a) Berechnen S i e Erwartungswert und Varianz der z u f ä l l i g e n Grösse X. (b) Wie g r o s s s i n d Erwartungswert und Varianz f ü r die t r a n f o r mierten Z u f a l l s v a r i a b l e n (i) Υ = X - 9 ( i i ) Ζ = Y / vO.Ü065 ?
AUFGABE 5.7 Berechnen S i e f ü r die in Aufgabe 3.5 gegebene Umsatzverteilung des Tante - Emma - Ladens den t ä g l i c h zu erwartenden Umsatz s o wie die Varianz.
42
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
AUFGABE 3.8 Bestimmen Sie für die in Aufgabe 3.4 gegebene Zufallsvariable mit der Dichte f x (x) bei c = l (a) Erwartungswert und Varianz, (b) Median, (c) 0.95-Quantll.
AUFGABE 3.9 Bestimmen Sie für die Anzahl des Auftretens von 'Zahl' beim viermaligen Münzwurf, vgl. Aufgabe 3.1, (a) Erwartungswert, (b) Median sowie unteres und oberes Quartl1.
AUFGABE 3.10 Ein Roulettespieler setzt immer auf eine der Zahlen 0,1,...,36. Kommt diese Zahl, so erhalt er den 36 -fachen Einsatz, tritt eine andere Zahl oder die Null auf, so verliert er seinen Einsatz. Wieviel DM gewinnt oder verliert der Spieler durchschnittlich im Monat (=30Tage), wenn er täglich 100 Spiele mit jeweiligem Einsatz von 2 DM macht?
AUFGABE 3.11 Ein Lebensmittelhändler bezieht wöchentlich von einer Molkerei Sahnejoghurt In Paletten zu 10 Bechern zu einem Preis von DM 2.50. Er verkauft diesen Joghurt, dessen Haltbarkeit bei einer Woche liegt, palettenweise für 10 DM. Bestimmen Sie die auf Dauer gewinnoptimale Einkaufspolitik des Händlers, wenn die Wahrscheinlichkeit, pro Woche J Paletten zu verkaufen (P6(X = J)), gemäss tatu 3.11 gegeben ist.
Kapitel 3: Zufallsvariablen und Verteilungen
43
Cab. 3.11: Wahrscheinlichkeiten P f i ( X = j ) pro Woche j Paletten zu verkaufen,
0=0,1,2
b
6
j
0
1
2
3
4
5
6
P6(x=j)
0.02
0.08
0.10
0.18
0.34
0.18
0.10
AUFGABE 3.12 Aus langjähriger Erfahrung i s t dem Hersteller einer bestimmten Schraubensorte bekannt, dass die Schraubenlangen v e r t e i l t sind mit einem Erwartungswert μ =20 mm und einer Varianz σ 2 =0.0225 mm2, Mit wieviel Prozent Ausschuss muss man höchstens rechnen, wenn die Schraubenlänge grösser a l s 19.7 mm und kleiner a l s 20.3 mm sein s o l l ?
AUFGABE 3.13 Bei Brutkästen eines bestimmten Typs wird die durchschnittliche Bruttemperatur mit 25°C angegeben. Eine Untersuchung der Temperaturen ergab weiterhin, dass bei 5% der Brutkästen eine Temperatur von 23°C unterschritten und bei 10% eine Temperatur von 27°C überschritten wurde. Was lässt sich aus diesen Angaben Uber die Varianz der Temperatur sagen?
(*) AUFGABE 3.14 Aus langjähriger Erfahrung 1st der Abteilung für Familie und Soziales einer Stadtverwaltung bekannt, wie sich die gemeinsame Verteilung der Anzahl der Kinder pro Familie X-, und der Anzahl der PKW pro Familie X 2 zusammensetzt, v g l . sab. 3.14.
44
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
=x Cah. 3.14: Verteilung i-j»^2 = x2j^ m i t x i - j = i ~ 1 für i=1>-..>5und x„. = j für j=1,2,3 der Zufallsvariablen X. und X-
(a) Bestimmen S i e (1) die Randverteilungen von X·, und X 2 , ( i i ) die d u r c h s c h n i t t l i c h e Anzahl von Kindern bzw. PKW pro Familie, ( i i i ) die Wahrscheinlichkeit, dass pro Familie genau zwei PKW gefahren und höchstens zwei Kinder zur Familie zählen, (b) Berechnen S i e die Kovarianz und die K o r r e l a t i o n zwischen XT und X 2 . (c) Sind X-, und X 2 s t o c h a s t i s c h unabhängig?
( * ) AUFGABE 3.15 Für zwei Z u f a l l s v a r i a b l e n X 1 und X 2 s e i folgende gemeinsame Dichtefunktion gegeben: 1 f
XrX2
( x
x
i' 2
)
"
x
, falls
2 - X1 l x 2 + 2 ' o 1 x2 1 2
sonst
Berechnen S i e (a) die Randdichtefunktionen von Χ Ί bzw. X 2 , (b) die Kovarianz und die K o r r e l a t i o n zwischen X 1 und X 2 .
Kapitel 3: Zufallsvariablen und Verteilungen
45
(*) AUFGABE 5.16 Bei einer Ampelanlage sind für das Rotlichtslgnal zwei Glühbirnen eingebaut. Fällt die erste Birne wegen Defekts aus, wird automatisch auf die zweite Glühbirne umgeschaltet, Die Lebensdauern X 1 und X 2 (in Tagen) der beiden Glühbirnen seien unabhängig verteilt mit den bekannten Dichtefunktionen
0
sonst
(a) Bestimmen Sie die Verteilung der Lebensdauer des Rotlichtsignals bzw, der Gesamtlebensdauer der beiden Glühbirnen, (b) Wie gross sind Erwartungswert und Varianz der Gesamtlebensdauer?
(*) AUFGABE 5,17 (a) Der Umsatz U, den die ALKO - Brauerei pro Monat mit einer Biersorte erzielt, lässt sich aus der abgesetzten Menge X·, und dem PreisX 2 bestimmen, über die Verteilungen von X, und X 2 weiss man, dass E(X.,) = 3 6 0 hl , E(X 2 ) = 3 0 0 DM/hl und Var(X,) =46.24 hl 2 , Var(X 2 ) =56.25 DM z /hI 2 gilt.Bekannt ist auch die Kovarianz zwischen Menge und Preis; sie liegt bei Cov(X 1 ,X 2 ) =30.60 DM *hl. Berechnen Sie Erwartungswert und Varianz des Umsatzes U = X 1 · Χ 2 . (b) über eine von der HOL -Brauerei vertriebene Biersorte weiss man, dass der Umsatz Y 1 verteilt ist mit Erwartungswert E(Y 1 ) = 224 000DM und vartY,) = 9 M i l l . DM 2 und die abgesetzte Biermenge Y 2 einer Verteilung mit E(Y 2 ) = 5 2 0 hl und Var(Y 2 ) =70.56 hl 2 unterliegt. Ausserdem 1st bekannt, dass zwischen diesen Zufallsvariablen eine Kovarianz von Cov(Y 1 ,Y 2 ) = 20 160 DM -hl besteht. Berechnen Sie Erwartungswert und Varianz des Preises P = Y 1 / Y 2 .
(*)
Die mit (*) gekennzeichneten Aufgaben können wegen ihres Schwierigkeitsgrades von mathematisch weniger Geübten übergangen werden. Es empfiehlt sich jedoch, die Erklärteile in den Lösungen dieser Aufgaben anzuschauen.
Kapitel 3: Zufallsvariablen und Verteilungen
47
LÖSUNG ZU AUFGABE 5.1 Ausgehend von einem (mitunter fiktiven) Zufallsexperiment und dem zugehörigen Grundraum Ω versteht man unter einer Zufallsvariablen X eine Abbildung von Ω in die reellen Zahlen derart, daß für die durch X beschreibbaren Ereignisse Wahrscheinlichkeiten angebbar sind. Den Funktionswert x, den eine Zufallsvariable X annimmt, nennt man auch Realisation oder Ausprägung von X. Mit Hilfe einer Zufallsvariablen X lassen sich Ereignisse des Grundraums beschreiben - wenn nicht direkt durch einzelne reelle Zahlen, dann durch Angabe von Intervallen bzw. allgemeineren Mengen reeller Zahlen, in denen Realisationen von X liegen. Durch die Identifizierung eines Ereignisses mit einer Menge reeller Zahlen sowie mit den Axiomen der Wahrscheinlichkeitsrechnung, vgl. Aufgabe 1.2,läßt sich nun die Wahrscheinlichkeit, daß eine Zufallsvariable Werte aus dieser Menge annimmt, angeben. Betrachtet man die Gesamtheit aller Wahrscheinlichkeiten, so spricht man auch von der Wahrscheinlichkeitsverteilung von X. Eine zentrale Bedeutung erhält dabei die Funktion F x (t) = P(X 1) = P(X>2) = P(X=2) + P(X=3) + P(X=4) = f + = 1-P(X3) = 1 - (P(X=3) + P ( X = 4 ) ) = 1 [=P(X4
57
58
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
LÖSUNG
ZU
-•(a)
AUFGABE
3.5
Durch I n t e g r a t i o n fu(u)
der
Dichtefunktion
= 7.5 · 10"4
\/ü - 0 . 3 7 5 · 1 0 " 4 u
berechnet sich die V e r t e i l u n g s f u n k t i o n satzes
(vgl. Aufgabe 3.2) des t ä g l i c h e n
Um-
U des T a n t e - Emma - L a d e n s f ü r 0 < t < 4 0 0 z u
Fu(t)
=
|
fyU)
άζ
= |
(7.5-
1 0 " 4 ν'ζ - 0 . 3 7 5 · 1 θ " 4 ζ )
,-4 2 „ 7 5· 1 0 " . ς ' - 0.375 ·
= 5 · 10 Insgesamt i s t
-4
1 0 -
4
. 1 . ζ
2
άζ
]
7 -4 2 · r - 0 . 1 8 7 5 · 10 . t
also t< 0
F
U
5· 1 0 " 4 . t
( t )
7
- 0.1875·
10~4·
t2
t > 400
1 In A b b .
£3.5.1
und A b b . £ 3 . 5 . 2 w i r d d e r V e r l a u f d e r D i c h t e f u n k t i o n
Verteilungsfunktion
Abh.
£3.5.1:
f ü r 0 < t < 400
graphisch
veranschaulicht.
D i c h t e f u n k t i o n f . , des t ä g l i c h e n U m s a t z e s U
und
der
Kapitel 3: Zufallsvariablen und Verteilungen
Abb. £3.5.2: Verteilungsfunktion F^ des täglichen Umsatzes U
-•(b) Unter Zuhilfenahme der im Aufgabenteil (a) berechneten Verteilungsfunktion
erhält man für die Wahrscheinlichkeit ( v g l . A u f g a b e 3 . 2 ) , daß der
Umsatz pro Tag (i)
mindestens 200 DM beträgt, P(U > 200) = 1 - P(U < 200) = 1 - F ^ O O ) 3 = 1 - ( 5 · 10" 4 · (200) 7 - 0.1875 · 10~ 4 · (200) 2 ^ = 1 - 0.6642 = 0.3358
(ii)
;
zwischen 100 DM und 300 DM liegt, P( 100 < U < 300) = F u (300) - F(J(100) 3 4
= 5 · 10* . ( 3 0 0 ) 7 - 0.1875 · 10~ 4 · (300) 2 3 4
- ^ 5 · 1 0 " . (100) 7 - 0.1875 · 1 0 ~ 4 · (100) 2 ) = 0.9106 - 0.3125 = 0.5981
;
59
60
(iii)
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
genau 150 DM b e t r ä g t , P(U = 150) = P( 150 < U < 150) = F..(150) - F . . ( 1 5 0 ) = 0
LÖSUNG ZU A U F G A B E
.
5.6
Die Wahrscheinlichkeitsverteilung einer Zufallsvariablen X läßt sich durch bestimmte Kenngrößen wie Lage- und Streuungsparameter charakterisieren. Als wichtigster Lageparameter ist dabei zunächst der Erwartungswert (Mittelwert) einer Verteilung zu nennen. Dieser ist (falls er existiert) gegeben durch l Χ.·Ρ(Χ=χ.) 1 i=l 1
X diskret verteilt
E(X) = μ =
, falls χ · f(x) dx
X stetig verteilt
[Dabei existiert E(X) , wenn obige Reihe absolut konvergiert bzw.. das Integral über |x| · f(x) existiert.] Betrachtet man die Zufallsvariable X mit E(X) = μ sowie eine weitere zufällige Größe Y = a X + b , wobei a und b konstante Zahlen sind, so gilt für den Erwartungswert von Y Ε(Y) = E(aX +b) = a E(X) + b = a· μ + b
.
Unter den Streuungsparametern zählt die Varianz (bzw. die Standardabweichung) 2
zu den wichtigsten. Die Varianz einer Zufallsvariablen X ist (falls E(X ) existiert) gegeben durch Var(X) = α
2
2 = Ε (X - Ε (Χ)) 2
Die Quadratwurzel aus der Varianz σ
nennt man auch Standardabweichung σ.
Die Berechnung der Varianz einer Verteilung vereinfacht sich bei Anwendung des Verschiebungssatzes von Steiner. Dieser besagt Var(X) = E(X2) - (Ε(X))2
Ε (X
bzw.
2 2 y χ . ·Ρ (X = χ .) - μ 1 i=l Var (X) =
Χ diskret verteilt , falls
χ
2
2 · f (χ) dx - μ
X stetig verteilt
Kapitel 3: Zufallsvariablen und Verteilungen
Bei einer linearen Transformation Y = aX + b der Zufallsvariablen X (a, b 2 für die Varianz von Y
Konstante) erhält man mit Var(X) =σ
2 2 2 = a Var(X) = a σ
Var(Y) = V a r ( a X + b )
V = σ/μ, μ > 0 , ist ein relatives Streuungsmaß,
Der Variationskoeffizient
sinnvoll nur für nichtnegative
Zufallsvariablen. 2
Ist X eine Zufallsvariable mit Erwartungswert μ und Varianz σ
> 0 , so gilt
für die sogenannte standardisierte Zufallsvariable γ
=
X -E(X)
=
Χ -μ 0
Vvar(X) gerade Ε(Y) = 0
und
Var(Y) = 1
->(a) Der Erwartungswert bzw. die Varianz der z u f ä l l i g e n Länge X der K e i l riemen
l ä ß t s i c h mit den in t a b . £3.6.1 zusammengestellten Hilfsgrößen
l e i c h t bestimmen. t a b . C3.6.1: A r b e i t s t a b e l l e zur Berechnung von E(X) und Var(X) 1
2
3
4
5
8.8
8.9
9.0
9.1
9.2
P(X = x i )
0.050
0.150
0.575
0.200
0.025
x i · P(X =χ η ·)
0.440
1.335
5.175
1.820
0.230
x? · P(X = x i )
3.8720
11.8815
46.5750
i x
i
16 . 56 2 0
2.1160
Es e r g i b t s i c h E(X) =
l x . · P(X=x.) 1 i=1 1
= 0.440 + 1 .335 + 5.175 + 1 .820 + 0.230
bzw. Var(X) =
l
χ?·Ρ(Χ=χ.) -(E(X))2
i=1
= 3.8720 + 11 .8815 + 46.5750 + 16.5620 + 2.1160 - 9 2 = 81 .0065 - 81 = 0.0065
.
61
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
62
->(b) Unter Verwendung der Ergebnisse aus Aufgabenteil (a) erhält man f ü r die (i)
linear transformierte Zufallsvariable Y = X - 9 E( Y) = E(X - 9 ) = E(X) - 9 = 9 - 9 = 0 Var(Y) = Var(X - 9) = Var(X) = 0.0065
, ;
( i i ) standardisierte Zufallsvariable Υ
Ζ =
X -9
=
\/ 0.0065
X - E(X)
=
V 0.0065
\/Var(X)
gerade E(Z) = 0
,
Var(Z) = 1
.
LÖSUNG ZU AUFGABE 5 . 7 Der Umsatz U, den der Tante - Emma - Laden pro Tag e r z i e l t , i s t stetig vert e i l t mit Dichte f y i u ) = 7.5- 10" 4 νΙΓ - 0.375 · 10~ 4 u
für 0 < u < 400
.
Der Kaufmann e r z i e l t einen mittleren (erwarteten, durchschnittlichen) Tagesumsatz (vgl. Aufgabe 3 . 6 ) in Höhe von DM 400
CO
0
— oo
400
3
l· 0
5
400
0.375 · 10~4 · j u 3
3 · 10
-4
960 - 800 160
.
5 (400)^ - 0.125· 1 0 " 4 · (400)
0 3
Kapitel 3: Zufallsvariablen und Verteilungen
Mit » E(U 2 ) =
400 2
J u
^ )
du = J u 2 ( 7 . 5 · 1 0 " % ü - 0.375 · 10~ 4 u) du
-o°
0
400
5
J (7.5· 10~4u?
=
- 0.375 · 1 0 " 4 u 3 ) du
0 =
Γ
-4 2 7 -4 1 41 7.5 · 1 0 ^ · j · u - 0.375 «10 * · | · u M
400
7 10" 4 · ( 4 0 0 ) 7 - 0.375 · 10" 4 · | · ( 4 0 0 ) 4
=
= 34285.7143 und dem Verschiebungssatz (vgl. Aufgabe 3.6) l i e g t die Varianz der Umsatzverteilung bei Var(U) = E(U 2 ) - ( E ( U ) ) 2 = 34285.7143 - 160 2 = 8685.7143
LÖSUNG ZU AUFGABE
.
3.8
-»(a) Als Erwartungswert (vgl. Aufgabe 3.6) der stetigen Zufallsvariablen X mit Dichtefunktion
fx(x)
1 8 x
, 0(aii) Der Erwartungswert (vgl. Aufgabe 3.6) der diskreten Zufall svariablen X^ s 'Anzahl der Kinder pro Familie' berechnet sich unter Verwendung der Werte aus Tab. L3.14.2 zu E(Xl)
»Ix^Ptvv
=
j / n - P i .
= 0 · 0.40 + 1 · 0.30 + 2 · 0 . 1 5 + 3 · 0.10 + 4 · 0.05 = 1.10
.
Ebenso erhält man, daß in dieser Stadt im Durchschnitt
E(X Z ) = j =i x 2 j - P ( x 2 = x 2 j )
= j =i x e j - p . j
= 1 · 0.35 + 2 · 0.51 + 3 · 0.14 = 1.79 PKW pro Familie unterhalten werden.
-»(aiii) Gesucht ist die Wahrscheinlichkeit für X ^ 2 sich mit den Werten aus Tab. L3.14.2
und X 2 = 2 ; es ergibt
77
Kapitel 3: Zufallsvariablen und Verteilungen
P(X1 < 2 , X 2 = 2)
= P(X1 = 0 , X 2 = 2 ) + P ( X 1 = 1 ,X2 = 2 ) + P ( X , = 2 , X 2 = 2) = P12
P22
+
= 0.47
-»(b)
Die Charakterisierung
tors
(Xj,Χ^)
erfolgt
ist;
X^ d a r .
der V e r t e i l u n g
Es g i l t
+ 0 - 1 4 +
0 - 0 5
eines zweidimensionalen
Zufallsvek-
die
durch
= Ε [ ( X l - E(X ) ) ( X 2 - E ( X 2 ) ) ]
sie existiert,
stellt
0 - 2 8
.
über d i e K o v a r i a n z ,
Cov(X1#X2)
Kovarianz
=
außer ü b e r Kenngrößen w i e E r w a r t u n g s w e r t und V a r i a n z
der Randverteilungen
gegeben
+ p32
wenn d i e e i n z e l n e n V a r i a n z e n
e i n e Maßzahl f ü r den l i n e a r e n
existieren.
Die
Zusammenhang z w i s c h e n X^ und
stets
Cov(XlfX2)
= EtXj · X2) - E i X j ) · E(X2)
H ä u f i g v e r w e n d e t man a l l e r d i n g s Cov(X p =p
statt
.
der Kovarianz d i e normierte
,X )
=
mit
12
Var(X)^0
,
Var(X
) +0
y v a r t X j ) -Var(X2)
a l s l i n e a r e s Zusammenhangsmaß z w i s c h e n X^ und X 2 . Korrelation bezeichnet wird,
läßt eine bessere
Zusammenhangs z w i s c h e n den b e i d e n - 1< p< 1
Kovarianz
D i e s e s Maß, das auch
Interpretation
Zufallsvariablen
als
des Grades
z u , denn e s g i l t
des
stets
.
Ist Cov(X1,X2) so h e i ß e n X^ und X 2
= 0
bzw.
Ρχ x 2
( X j ,X 2 >
'
0
unkorreliert.
B e t r a c h t e n w i r w i e d e r den s p e z i e l l e n größe
=
diskret v e r t e i l t
Fall,
daß d i e
e n d l i c h v i e l e n Ausprägungspaaren d i e Kovarianz
,X2)
=
k
l
I 1=1
l
k =
berechnen.
x
Zufalls-
Bei
nur
j = l , l ä ß t
sich
durch
l i
=
Ο
Μ )
-
I fx (Χ,ϊ· fx (z-x,)
•I
Λ ee " 5 5 Έϋ
1
V
1 25ÖÜ
0 e
1 „ ζ 5T
1 , 25M ζ · e
-ot
1 2
-*^ I[0.-)(z"X1)dX1
Γ/5ϋΧ1 "ά J e
1 i m
dx,
( ζ
"
χ
1
) T
" [ο,ζ]
,w , H v ι dxi
dx
5U
womit d i e V e r t e i l u n g von Ζ bestimmt
ist.
-•(b) Für beliebige Zufallsvariablen X, ,X mit E(X.) = μ., i = l, I n I i sich der Erwartungswert der Summe X^ + ... + x n durch
Ϊ i=l
x. ]
=
,n, läßt
l E(X ) = l μ i=l i=l
bestimmen . Ist weiterhin Var (X .) = Ο . und Cov(X . ,X .) = σ . .,i,j=l,...,n 1 1 ι j 1] Aufgabe 3.14) , so erhält man für die Varianz von X. + ... +X 1 η
Var
I X. U=1 ^
=
l Var (X.) + 2 J Cov(X.,X.) = l 0. + 2 £ 1 1 3 i=l i 3 ) = 1 - P(X < 3 ) = 1 - P ( X < 2 ) - P(X = 3 )
" (?XV) IST
1 - 0.9057 - -
450450
= °·0943
-
M S W
= 0.0118 mehr a l s d r e i
(d) mit
Hauptgewinne,
Wahrscheinlichkeit
P i * - 11 - ( 1 1 5 ) f i 5 ) - 2234925 . P(X
genau e i n e n
-
υ
-
^
- 5461512 "
0
... '4092
Hauptgewinn.
LÖSUNG ZU A U F G A B E
4.5
Eine d i s k r e t e Z u f a l l s v a r i a b l e X h e i ß t p o i s s o n v e r t e i l t m i t Parameter λ Χ^Ρο(λ)),
wenn d i e z u g e h ö r i g e n E i n z e l w a h r s c h e i n l i c h k e i t e n
p(x=k)
=
Ak k!
•—~
e
-λ
(kurz:
durch
f ü r k=0 , 1 , 2 , . . .
gegeben s i n d . Im Gegensatz zu b i n o m i a l - oder h y p e r g e o m e t r i s c h v e r t e i l t e n fallsvariablen
l i e g e n i n diesem F a l l a l s o p r i n z i p i e l l
abzählbar
Zu-
unendlich
109
Kapitel 4: Spezielle Verteilungen und Grenzwertsätze
viele mögliche Ausprägungen vor. Die Verteilungsfunktion einer poissonverteilten zufälligen Größe X erhält man dann natürlich durch F (t) = X
£ P(X = k) k:k 0.2) = 1 - F x ( 0 . 2 ) = 1 - 1 + e " 2 " ° · 2 = e" = 0.6703
0,4
.
->(c) Den Erwartungswert der exponential v e r t e i l ten Reparaturzeit X e r h ä l t man durch p a r t i e l l e s I n t e g r i e r e n , wie nachfolgend angegeben:
114
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
-2x E(X) =
| x · f ( x ) dx = | 2 x e -oo
dx
0 CO
= 2 Γ χ (-0.5) e "
2x
- 2 f ( - 0 . 5 ) e' 2 x d x
] J
L
J
°
o
OO
= 0 + (j e e-
2 x
d dx x = [|- -00..55. · ee- 2 x ] ° °
0 = 0.5
.
Der Techniker b e n ö t i g t a l s o im D u r c h s c h n i t t eine halbe Stunde, um eine Mas c h i n e zu r e p a r i e r e n . Mit OO
2
E(X ) =
J
oo
x
2
· f ( x ) dx = | 2 x 2 e ~ 2 x dx
-oo
0 CO
= 2Γχ
2
(-0.5) e~
2x
- 2 f 2 x ( - 0 . 5 ) e ~ 2 x dx
l J
1
°
J
o
00 = 0 + 1 2 χ e " 2 x dx = 0 + E(X) = 0 . 5 0 l i e g t d i e Varianz der Z e i t , d i e zur Reparatur e i n e r Maschine aufgewendet w i r d , bei V a r ( X ) = E ( X 2 ) - ( E ( X ) ) 2 = 0.5 - 0 . 5 2 = 0.25 Stunden 2
Für e i n e Ex (λ) - v e r t e i l t e Z u f a l l s v a r i a b l e X g i l t E(X) = i Var(X) = - ί λ
LÖSUNG ZU A U F G A B E
.
allgemein
und .
4.8
2 Eine Z u f a l l s v a r i a b l e X h e i ß t n o r m a l v e r t e i l t mit Parametern μ und CT (kurz: 2 Χ ^ Ν ( μ , σ ) ) , wenn s i e e i n e D i c h t e f u n k t i o n
Kapitel 4: Spezielle Verteilungen und Grenzwertsätze
(χ-μ)
1
f (x) = —
e
2
2σ 2
~
115
für alle reellen Zahlen χ
\J2π · σ
besitzt. Die Normalverteilung, die für die induktive Statistik von großer Bedeutung ist, ist durch die beiden Parameter, Erwartungswert und Varianz, Ε (X) = μ
,
Var(X) = σ
2
eindeutig festgelegt. Da sich die Werte der zugehörigen Verteilungsfunktion
- (χ-μ)2
t F i t )
=
2
f e V 2 i σ —>oo
°2
dx
nicht elementar berechnen lassen, geht man über zur standardisierten Zufallsvariablen (vgl. Aufgabe 3.6) „ _ X — Ε(X)
_ Χ-μ
" ~ Vvar(X)
0
1
Ζ
die der sogenannten Standardnormalverteilung N(0,1) unterliegt. Über die Dichte der Ν (0,1) - Verteilung
1
f (z) = Z
e
2 ζ ~ ~~2
= φ(ζ)
\/2 7T
bzw. die zugehörige Verteilungsfunktion ζ F 2 (z) =
I ψ(ς) άζ = φ(ζ) — 00
2
lassen sich die Dichte und die Verteilungsfunktion einer Ν(μ,α ) -verteilten Zufallsvariablen X durch
ausdrücken. Die Funktion Φ(ζ) ist in Tab. 1 des Anhangs für einige positive ζ vertafelt. Für negative Zahlen ζ erhält man die Verteilungsfunktionswerte aus der Symmetrie-
Beziehung:
φ(-ζ) = 1 - φ(ζ) Allgemein gilt auch, daß die Zufallsvariable Y = aX + b a und b konstante Zahlen (a ^0) ,
2 2
σ ) - verteilt ist, wenn X eine
116
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
2
Ν(μ,σ ) - Verteilung besitzt.
Die Niederschlagsmenge X wird als normal verteilt mit Erwartungswert μ = 75 mm und Varianz (bzw. Standardabweichung) σ
2
= 25 mm
2
.
(bzw. a=
\/Z5 = 5 mm)
angenommen, über die standardisierte Zufallsvariable 7 =
x
-M σ
=
X - 75 5
und mit Hilfe der Tab. 1 aus dem Anhang lassen sich die gesuchten Wahrscheinlichkeiten ermitteln. So fallen (a) höchstens 70mm
Niederschlag mit Wahrscheinlichkeit
p(x < 70) = p p-^Z-L
77) = 1 - P(X < 77) = 1 - Ρ
~g75
7 ; 0
99
= 1/8.451 =0.1183
127
Kapitel 4: Spezielle Verteilungen und Grenzwertsätze
->(b,i) Die Quantile ξ α einer diskreten Zufallsvariablen X (vgl. Aufgabe 3.8) ergeben sich mit Hilfe der zugehörigen Verteilungsfunktion durch folgende Beziehung: Ρχ(ξα) > α
und
^(t)
0.95 = a
und
F x ( 2 ) = PCX < 2) = 0.1681 + 0.3602 + 0.3087 = 0 . 8 3 7 0 < 0.95 F x ( t ) < 0.95 = a
, d.h.
für alle t < 3
gerade ξ
0.95
= 3
·
In A b b . C4.12.1 sind die Quantile graphisch
Q5
und
g5
der B(5;0.3) - Verteilung
veranschaulicht.
-.(b,ii) Die Quantile ξ α einer (stetig) Ex(5) - verteilten Zufallsgröße X (vgl. Aufgabe 3.8, Aufgabe 4.7) ergeben sich mittels der inversen tion F x 1 d u r c h F ' ^ a ) = ξ . Mit Fx(t)
= 1 -e"5t
für t > 0
,
Verteilungsfunk-
128
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
Fx(t)
0.5
p
=0
,
,
1
,
,
1
2
3
U
5
f
Abb. C 4 . 1 2 . 1 : Q u a n t i l e ζ β
Q5
und
g5
=3
der B ( 5 ; 0 . 3 ) - V e r t e i l u n g
und wegen y = 1 - e"5t
ist
«
e"5t = 1 - y
»
t = --jhnd -y)
«
-5t = l n ( 1 - y )
also F-1(y)
= -^ln(l-y)
ξa = -b 1 in(1 -α)
bzw.
.
Für α = 0.05 berechnet s i c h das 0 . 0 5 - Q u a n t i l ς0
05
= F^(0.05)
= - ^ 1 n( 1 - 0 . 0 5 )
zu = 0.0103
bzw. f ü r α = 0.95 e r h ä l t man, v g l . Abb. C 4 . 1 2 . 2 , ξ0
95
= F^'(0.95)
= - - j l n d - 0.95) = 0.5991
.
t
Kapitel 4: Spezielle Verteilungen und Grenzwertsätze
|0.6
£
f
=0.0103
129
0.8
=0.5991 0.95
0.05
Abb. C4.12.2: QuantileCQ gg und Cg gg einer Ex(5) - Verteilung
->(b,iii) Die α - Quantile einer Ν(μ,σ ) - verteilten Zufallsvariablen, die allgemein mit w bezeichnet werden, lassen sich aus den Ouantilen u der Stanα α dardnormalverteilung ermitteln, denn es gilt
(vgl. Aufgabe 4.9).
In Aufgabe 4.9 wurden die hier gesuchten Quantile w Q g 5 und Wg
g5
der N(3,4)-
Verteilung bereits explizit berechnet. Es ergibt sich mit σ = \ Λ ~ ϊ = 2 , Ug g^ = -u0-95
= - 1 .6449, u 0 > 9 5 = 1 .6449 w
0.05 =
w
0 95
2
'u0.05+3
= - 2 · 1 - ^ 4 9 . 3 = - 0.2898
und =
2
* U 0 95 +
3
= 2
*1 -6449
+ 3
= 6.2898
130
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
LÖSUNG ZU A U F G A B E
4,15
Der Zentrale Grenzwertsatz, der die große Bedeutung der Noimialverteilung in der induktiven Statistik unterstreicht, liefert eine Aussage über die Verteilung der Summe V) X. = X. + ... +X . , 1 1 η
1=1
= X η
von η unabhängigen, identisch verteilten Zufallsvariablen X^ mit E(X ± ) = μ
,
VariXJ
= σ
2
, i=l,... ,n
,
bei wachsendem n. Mit (vgl. Aufgabe 3.16) n * f n \ E(X ) = Ε ( Υ X. ) = Τ E(X.) = η · μ 1 Vil V i=l
,
* / " \ " 2 Var(Χ ) = Var I y X. = V Var(X.) = η · σ V=1 V i=l und der standardisierten Zufallsvariablen (vgl. Aufgabe 3.6)
X* n η — E(X*)
y n
.SXi-n'
y7 V ar(X n )
3) = 1 - P( Y < 3) = 1 - P(Y = 0 ) - P(Y =1 ) - P ( Y = 2) . ~
3° ~ TJT
-3
31 "TT
-3
32 "7Γ
-3
= 1 - 0.0498 - 0.1494 - 0.2240 = 1 - 0.4232 = 0.5768 mindestens 3 Einwohner am 1.1. ihren Geburtstag feiern. (Die exakte Wahrscheinlichkeit liegt bei 0.5772.)
133
Kapitel 4: Spezielle Verteilungen und Grenz wertsatze
LÖSUNG ZU AUFGABE Die
4.15
Zufallsvariablen , falls
0
i - t e r Knopf keinen Defekt i - t e r Knopf einen Defekt
aufweist
,
sind mit P ( X i =1) = 0.88 = ρ
und
P ( X i = 0) = 0.12 = 1 - p f ü r i = 1 , . . . , n unabhängig B(1,p) - v e r t e i l t (vgl. Aufgabe 4 . 2 ) .
-»(a) Bei η = 4500 g e l i e f e r t e n Knöpfen i s t a l s o die Z u f a l l s v a r i a b l e X =
4500 £ X. = 'Anzahl der Knöpfe, die unter 4500 keinen Defekt i=1 1 aufweisen'
B(4500,0.88) - v e r t e i l t . Aufgrund der Tatsache, daß np( 1 - p) = 4500 · 0.88 · 0.12 = 475.2>9 (vgl. Aufgabe 4.14) g i l t , i s t eine Approximation der Binomialverteilung nach dem Zentralen Grenzwertsatz (vgl. Aufgabe 4.13) durch eine Normal Verteilung g e r e c h t f e r t i g t , über die s t a n d a r d i s i e r t e Z u f a l l s v a r i a b l e (vgl. Aufgabe 4 . 2 ) Ζ = X - E(X) \/ Var(X)
=
X -np Vnp{ 1-pJ
X - 4500 · 0.88
X - 3960
\/4500 · 0.88 · 0.12
4000) = 1 - P(X < 4000) = 1 - P
4000 - 3960\
-•(b) Gesucht wird eine Zahl n, so daß f ü r
gilt P(X* > 4500) = 0.95
,
*
wobei die Z u f a l l s v a r i a b l e Xη n B(n,0.88) - v e r t e i l t i s t . Bei Anwendung des Zent r a l e n Grenzwertsatzes f ü r
134
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
Υ _ η
X*-E(XJ X* - η · 0.88 X * - 0.88n η η _ η _ η ' 7*7 \/η · 0.88 · 0.12 0.3250 · ν^η /varöy
ergibt sich Ρ ( Χ * > 4500) = 1 - Ρ(Χ*< 4500) = 1 - Ρ ( Υ < 4 5 0 0 ' Ο · 8 8 " ) η η " ^ η " 0.3250· \Jn' ~ 1 - φ ί 4 5 0 0 - 0.88η\ ^ 0.3250· V η ' Die Anzahl der zu ordernden Knöpfe η läßt sich demnach durch Auflösen der Gleichung /4500 - 0.88n\
=
^
„
φ /4500
^ 0.3250 ·\/η '
- 0.88n\
=
Q>05
^ 0.3250 · Vn '
nach η annähernd bestimmen. Mit 4500 - 0.88n -1,n ntn „ — — — — = Φ (0.05) = u0
05
_ „ - -u0
. , ΚΔΔ0 - - 1 .6449
95
0.3250· s/w erhält man die Gleichung 4500 - 0.88n = - 1.6449 · 0.3250 \/n
«
0.5346 \/η - 0.88n + 4500 = 0
bzw. mit t = + \Λι 0 . 5 3 4 6 t - 0 . 8 8 t 2 +4500 = 0
«
t2 - " q ^
6
t -^gg- = 0
.
Als Lösung dieser quadratischen Gleichung ergibt sich mit t > 0 . _ 0.5346 1
=
x
/4500 .
2 - 0.88 * J j H B B
+
0.5346 2 {i,
_
71
= 71
0>88Ü
·8141
'
und somit gerade η = t 2 = 71.8141 2 = 5157.2650
.
Um die geforderte Sicherheit einhalten zu können, müssen also mindestens 5158 Knöpfe bestellt werden.
Kapitel 5: Punktschätzer, Konfidenz- und Prognoseintervalle AUFGABE 5.1 Die Verbraucherzentrale einer Stadt untersucht eine Stichprobe von 10 runden Vollkornbrötchen einer Backerei hinsichtlich Breite X und Gewicht Y. Die Messergebnisse sind In tab. 5.1 festgehalten. Cab.
5.1.: Breite x. und Gewicht y., i=1,...,10, von 10 Brötchen 1
2
11.0
12.1
10.9
11.4
11.7
11.2
12.0
11.5
11.6
11.6
52.0
53.4
49.6
51.0
52.6
51.9
53.2
52.4
52.3
52.6
Brötchen i Breite x^
3
4
5
6
7
8
9
10
(in cm) Gewicht y^ (in g)
(a) Schätzen lung der bzw. die Sie, dass delt.
Sie Erwartungswert μ χ bzw. Varianz der VerteiBrötchenbreite X durch das arithmetische Mittel empirische Varianz der Stichprobenwerte und zeigen es sich dabei um erwartungstreue Schätzungen han-
(b) Geben Sie einen Schatzwert für den Median ξ 0 5 sowie für den Quartllsabstand s 0 - 7 5 - ξ 0 - 2 5 der Verteilung der Brötchenbreite X an. (c) Schätzen Sie die Korrelation P x y zwischen Breite X und Gewicht Y der Brötchen.
136
Teil I: Übungsaufgaben.
Erläuterungen
und
Lösungen
AUFGABE 5.2 In einem Betrieb werden u.a. grüne Bohnen in Dosen a b g e f ü l l t . Bei einer z u f ä l l i g e n Stichprobe von 25 Dosen wurden folgende Abfüllgewichte in g e r m i t t e l t : 173 , 176 , 172 , 176 , 175 , 174 , 172 , 173 , 174 , 172 , 178 , 176 , 177 , 175 , 176 , 173 , 172 , 175 , 173 , 174 , 177 , 176 , 174 , 174 . DieAbfüllanlage a r b e i t e t laut Herstellerangabe mit einer S t a n dardabweichung von 4 g . Es wird angenommen, dass es s i c h bei den ermittelten Werten um Realisationen einer normalverteilten Z u f a l l s g r ö s s e handelt. (a) Bestimmen S i e einen Schätzer f ü r das d u r c h s c h n i t t l i c h e Abf ü l l g e w i c h t μ. (b) Geben S i e ein K o n f i d e n z i n t e r v a l l zum Niveau 0.95 f ü r das Durchschnittsgewicht an. (c) An drei weiteren Tagen ergeben Stichproben mit j e w e i l s η = 2 5 Dosen d u r c h s c h n i t t l i c h e Abfüllgewichte von 1 7 5 . 5 g , 1 7 4 . 8 g , 1 7 6 . 7 g . Geben S i e aufgrund dieser Beobachtungswerte jeweils ein K o n f i d e n z i n t e r v a l l zum Niveau 0.95 f ü r den Erwartungswert μ an. Veranschaulichen S i e s i c h diese Ergebnisse zusammen mit dem unter (b) ermittelten I n t e r v a l l g r a p h i s c h , wenn Sie zudem davon ausgehen können, dass der unbekannte Erwartungswert bei μ = 1 7 5 g l i e g t .
AUFGABE 5.5 Die d u r c h s c h n i t t l i c h e Länge von M e t a l l s t i f t e n s o l l geschätzt werden. Eine Stichprobe vom Umfang 36 l i e f e r t eine m i t t l e r e Länge von χ =38.5mm. Aus früheren Untersuchungen sei bekannt, dass die Länge der M e t a l l s t i f t e n o r m a l v e r t e i l t i s t und die p r o duzierende Maschine mit einer Standardabweichung von σ^ = 1 . 6 mm arbeitet. (a) Geben Sie ein K o n f i d e n z i n t e r v a l l zum Niveau 0.96 f ü r die erwartete M e t a l l s t i f t l ä n g e an. (b) Welchen Umfang muss eine Stichprobe haben, damit das K o n f i d e n z i n t e r v a l l zum Niveau 0.96 f ü r die m i t t l e r e S t i f t l ä n g e höchstens halb so b r e i t i s t wie das unter (a) berechnete?
Kapitel 5: Punktschätzer, Konfidenz- und Prognoseintervalle
137
(c) Mit welcher Wahrscheinlichkeit Uberdeckt das I n t e r v a l l [38.1mmj 38.9mm] die erwartete M e t a l l s t i f t l ä n g e ?
AUFGABE 5.4 Bei einer P r ü f s t e l l e des TüV wurde der CO - G e h a l t der Abgase von Kraftwagen, der näherungsweise a l s n o r m a l v e r t e i l t anzusehen i s t , gemessen. Bei einer Stichprobe von η = 3 0 Kraftwagen ergaben s i c h folgende Werte ( i n %): 3.0 , 3 . 1 , 3.0 , 3.4 , 3.3 , 3 . 1 , 3.3 , 3.2 , 3.6 , 3 . 0 , 3 . 1 , 3.5 , 3.0 , 3.0 , 3.4 , 3.0 , 3.6 , 3 . 1 , 3.2 , 3 . 5 , 3.4 , 3.0 , 3.2 , 3.3 , 3.0 , 3.5 , 3.3 , 3.4 , 3.0 , 3 . 1 . (a) Geben S i e Schätzer f ü r den d u r c h s c h n i t t l i c h e n CO - G e h a l t μ und f ü r die Varianz σ 2 an. (b) Berechnen S i e zum 90%, 95% bzw. 98% Niveau ein Konfidenzint e r v a l l f ü r μ bzw. σ 2 . (c) Berechnen Sie ein P r o g n o s e i n t e r v a l l mit Trefferwahrscheinl i c h k e i t 0.95 f ü r den d u r c h s c h n i t t l i c h e n CO - G e h a l t von fünf weiteren Kraftwagen.
AUFGABE 5.5 Bei einer Landtagswahl wurden von 5000 b e r e i t s ausgezählten Stimmzetteln 300 f ü r die OPPORTUNISTENPARTEI (OPD) r e g i s t r i e r t . (a) Schätzen S i e den prozentualen A n t e i l an Stimmen f ü r diese Partei bei der Landtagswahl, (b) Bestimmen S i e ein approximatives K o n f i d e n z i n t e r v a l l zum Niveau 0.99 f ü r den A n t e i l der Stimmen der OPD sowie f ü r den Stimmenanteil der übrigen Partelen bei der Landtagswahl.
138
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
AUFGABE 5.6 Die Produktionsabteilung eines Werkes überprüft die Qualltat eines seiner Produkte, da die Geschäftsleitung aus WerbegrUnden eine Gütegarantie an die Kunden weltergeben möchte. Zu diesem Zweck wurde eine Stichprobe vom Umfang 25 entnommen, bei der 6 Ausschussstücke auftraten. (a) Schätzen Sie die Wahrscheinlichkeit, dass ein Produktionsstück Ausschuss 1st. (b) Bestimmen Sie ein 90% -Konfidenzintervall für den Anteil fehlerhafter Stücke in der Gesamtproduktion.
AUFGABE 5.7 Die Lebensdauer X von Helmcomputern der Marke C0ME0N bis zur ersten Reparatur kann a l s exponentialverteilt mit Parameter λ angesehen werden. Eine Untersuchung von η =100 Computern dieser Marke ergab eine durchschnittliche Lebensdauer von χ = 2 Jahren. Geben Sie eine Schätzung für λ an und bestimmen Sie die Grenzen des Konfidenzintervalls fur λ zum Niveau 0.95.
AUFGABE 5.8 Ein Marktforschungsinstitut startet eine Untersuchung über den Bedarf an dem v ö l l i g neuartigen Toilettenpapier KISS unter den Verbrauchern. Von η =120 z u f ä l l i g ausgewählten Personen, die das neue Produkt kostenlos testen durften, gaben 54 an, dass sie KISS regelmässig kaufen würden. 30 würden sich in unregelmässigen Abständen beim Kauf für KISS entscheiden und a l l e übrigen lehnten KISS ab. Schätzen S i e d l e Wahrscheinlichkeiten p.,, p 2 bzw. p 3 , dass KISS regelmässig, unregelmässig bzw. nicht gekauft wird,und geben Sie ausserdem simultane 0.9 - Konfldenzlntervalle für die Parameter p.,, p 2 und p 3 an.
139
Kapitel 5: Punktschätzer, Konfidenz- und Prognoseintervalle
LÖSUNG
5.1
ZU A U F G A B E
Wird e i n Parameter
(bzw. e i n e Kenngröße)
θ der Verteilung
einer
Zufallsvari-
a b l e n X m i t einem e i n z i g e n W e r t θ aus η Beobachtungen von X , d . h . Stichprobe
xj,...,x
n
,
geschätzt,
s o s p r i c h t man v o n e i n e r
f ü r Θ. Im f o l g e n d e n s o l l e n nun d i e S t i c h p r o b e n w e r t e χ ^ , . , . , χ ^ onen u n a b h ä n g i g e r ,
identisch v e r t e i l t e r
v a r i a b l e n X , • · . ,Χ
aus d e r
Punktschätzung als
Realisati-
(gemäß d e r V e r t e i l u n g von X)
Zufalls-
a u f g e f a ß t w e r d e n . Dann h e i ß t e i n e F u n k t i o n Θ ( Χ . , . · · , Χ
I n S c h ä t z f u n k t i o n und d i e
I
Λ
) n
z u g e h ö r i g e R e a l i s a t i o n θ ( χ , , . . . , χ ) S c h ä t z w e r t f ü r Θ. 1 η S c h ä t z u n g h ä n g t a l s o von den Z u f a l l s v a r i a b l e n X . , . . . , X 1 η ein z u f ä l l i g e s Ergebnis d a r .
Eine s t a t i s t i s c h e ab;
sie
stellt
Eine Forderung, lautet,
daß s i e
meter θ l i e f e r n Ε ( θ (X verlangt.
-»(a)
Die
1
d i e an e i n e
d.h. es
,Χ ) ) η
W e r t f ü r den unbekannten
Para-
= θ E i g e n s c h a f t nennt man
erwartungstreu.
Schätzfunktion
mit der
1 n = I Χ. = Χ η .u, ι ι =1
Realisation
,χ ) η
1 = — η
dem a r i t h m e t i s c h e n
einen Schätzwert teilung
werden k a n n ,
wird
Eine S c h ä t z f u n k t i o n mit d i e s e r
μ„ ( χ , , — X I d.h.
Schätzfunktion g e s t e l l t
im D u r c h s c h n i t t den r i c h t i g e n soll,
μ „ (X, , . . . ,Χ ) X I η liefert
sinnvolle
n
.Τu , ι=1
χ. = χ ι
Mittel
,
der Stichprobenwerte
(Stichprobenmittelwert),
f ü r den E r w a r t u n g s w e r t E ( X ) = ( v g l .
einer Zufallsvariablen
Aufgabe 3.6)
der
Ver-
X. 2
Die Varianz e i n e r Z u f a l l s v a r i a b l e n
X, Var(X) = σ χ
( v g l . Aufgabe 3 . 6 ) ,
wird
mittels S2(X, X I durch d i e
X ) η
empirische Varianz
2, n σ χ(χι
V
geschätzt. Natürlich empirische
= - L n-1
1
1
• s=r
I .'·. 1=1
(Χ. - X ) 2 χ
=
y X2 - n x 2 ) = η-1 V . . ι / Xx=l '
(Stichprobenvarianz)
? , Λ 2 l
ι =1
1
der
/ ν χι=1
x
2 x
Stichprobenwerte
2 i "
-2\ ) '
n x
s i n d dann d i e e m p i r i s c h e S t a n d a r d a b w e i c h u n g
Variationskoeffizient
s
2
und d e r
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
140
2 Ξχ = Js^
χ νχ = — X
bzw.
(für χ > 0)
Schätzwerte für die Standardabweichung σ χ b z w . für den Variationskoeffizienten V = σ χ / μ χ (für μ χ > 0 ) , vgl. Aufgabe 3.6.
Basierend auf η = 10 Stichprobenwerten χ, 2 '
x , n sollen Erwartungswert μ ν und 1U Λ
Varianz σ^ der Breite X der Vollkornbrötchen in der Bäckerei, über deren konkrete Verteilung keine Angaben vorliegen, geschätzt werden. Es ergibt sich 10
1 μχ(χΓ...,χ10)
= χ = jQ
1
J
x.j = y j (11.0 + 12.1 + ... + 11.6)
= YQ - 115 = 11.5
und
2
λ2 α
χ'χΓ"·,χ1θ'
=
s
x
10
τ
ο
, / 10
=
= g- (1323.88 - 10 · 11.5 2 ) = g-· 1 .38 = 0.1533
,
d.h. das arithmetische Mittel der Brötchenbreite liegt bei 1 1 . 5 c m 2 Varianz bei 0.1533 cm bzw. die Standardabweichung bei 0 . 3 9 1 5 c m . Fassen wir nun die gemessenen Werte
und die
wieder als Realisationen von
unabhängig identisch verteilten Zufallsvariablen Χ ^ , . , . , Χ ^ auf, für die gilt = σ χ = Var(X), so ergibt sich zunächst (vgl. A u f -
E(X.j) = μ χ = E(X), V a K X ^ gabe 3.16)
E
^V
X
1
X
10})
=
E(X)
1 =
=
E
(lö
10
TO
μ
II 1
χ = W ·
10μ
X
X
i )= π
χ
= μ
Χ
E(x
i}
»
d.h. X stellt eine erwartungstreue Schätzfunktion für den Erwartungswert der Brötchenbreite dar. Um zu zeigen, daß auch
2 die empirische Varianz s v eine erwartungstreue Schät-
2 zung für die Varianz σ^ der Brötchenbreite liefert, werden vorab zwei in die Berechnungen σ und somit
2
eingehende Erwartungswerte ermittelt. Es gilt (vgl. Aufgabe 3.6)
= Var(X.) = Ε(χξ) - (Ε(Χη.) ) 2 = E(X?) - μ 2
Kapitel 5: Punktschätzer, Konfidenz- und Promoseintervalle
Ε(Χ2)=σ
χ +
μ
2
,
i=1
10
141
.
Da f ü r die Z u f a l l s v a r i a b l e n Χ ^ , . , . , Χ ^ ( s t o c h a s t i s c h e ) Unabhängigkeit
voraus-
g e s e t z t w i r d , i s t bei Anwendung der Gleichung von Bienayme (vgl. Aufgabe 3.16) ιυ 10 \ Ν 14 ^ Χ,-) = ^
/1 Var(X) = V a r ^
l10 u 1 , 1, u0 ^ Var(X.) = ^ .Σ,
σ
? 1 χ = Iff
σ
2 Χ
und wegen Var(X)
= E(X2) - ( E ( X ) ) 2 = E(X2) - μ 2
al so E(X2) = ^ σ
χ
2
+
μχ2
M i t d i e s e n Beziehungen e r h ä l t man a l s Erwartungswert der S c h ä t z f u n k t i o n „2 2 σ χ ( Χ 1 , . . . ,X n ) = S x gerade
Ε
-x~>2] = i E[ X A-10X"
$(c) Die Kovarianz zwischen zwei Z u f a l l s v a r i a b l e n X und Y, C o v ( X , Y ) , Aufgabe 3 . 1 4 , Aufgabe 3 . 1 5 ) wird ausgehend von Beobachtungspaaren ...,(x
n
(vgl.
(Xj.Yj),
,y ) g e s c h ä t z t durch d i e e m p i r i s c h e Kovarianz n 1 "χγ-ΪΓΤ
n
Σ
1=1
^ i - ^ ^ - y )
- ^
1
(
n
I
1=1
V ! - « »
^
·
Als Schätzwert f ü r d i e K o r r e l a t i o n Ρ χ γ < d i e a l s Maß f ü r den ( l i n e a r e n )
Zu-
sammenhang zwischen X und Y d i e n t , wird zumeist der K o r r e l a t i o n s k o e f f i z i e n t von B r a v a i s - Pearson
XY / S X *sv
n l (x 1=1
- x ) (y. - y >
/ I (Χ, - χ ) 2 · ! (yf - y ) 2 \J i = l i =l n l χ±γ± - nxy i=l
Λ^"™) (Α yi"n?2) 2
2
verwendet (s^ und s y bezeichnen dabei d i e zugehörigen empirischen V a r i a n z e n ) , Ebenso wie f ü r
g i l t auch f ü r
r^
- 1 8251
d . h . es besteht ein starker p o s i t i v e r l i n e a r e r Zusammenhang zwischen der B r e i t e und dem Gewicht der Vollkornbrötchen.
LÖSUNG ZU AUFGABE 5 . 2 Dem Abfüll gewicht X von grünen Bohnen in Dosen wird eine Normal Verteilung mit 2
2
unbekanntem Erwartungswert μ und bekannter Varianz σ =4 =16 u n t e r s t e l l t , d.h. es s o l l g e l t e n :
Χ ^ Ν ( μ , 1 6 } ( v g l . Aufgabe 4.8). Es wurden η = 25 Dosen
h i n s i c h t l i c h der Abfüllmenge untersucht; die gemessenen Werte x ^ , . . . ^ , ^
s '* ncl
gegeben. -»(a) Das arithmetische M i t t e l der Beobachtungswerte χ ( v g l . Aufgabe 5.1} l i e f e r t eine erwartungstreue Schätzung f ü r den Erwartungswert einer V e r t e i l u n g . Somit wird das durchschnittliche Abfüllgewicht μ an grünen Bohnen geschätzt durch
V
=
* -K j ,
= 174.4 g
x
i - 7 5 %
x
i -sr
( 1 7 3 + 176 t
··••"*>
= i - « 6 0
.
-*(b) A n s t a t t den unbekannten Parameter θ der Verteilung e i n e r Z u f a l l s v a r i a blen X durch einen e i n z i g e n Wert θ zu schätzen, i s t man o f t auch daran i n t e r e s s i e r t , ein möglichst k l e i n e s I n t e r v a l l anzugeben, in dem das unbekannte θ mit e i n e r vorgegebenen Mindestwahrscheinlichkeit liegt.Man spricht in diesem F a l l von e i n e r Intervallschätzung.> Dabei wird ein I n t e r v a l l , das sogenannte Konfidenz- oder V e r t r a u e n s i n t e r v a l l zum Niveau 1 - α
(kurz; (1 -ex) - K o n f i d e n z -
i n t e r v a l l ) , mit den Grenzen G und G (G < G ) gesucht, so daß u ο u ο P(G
< 9 < 6 1 = 1 -Ct u - ο
[bzw. manchmal auchx > 1 - α } -
e r f ü l l t i s t . Der Wert α , der demnach d i e Wahrscheinlichkeit dafür a n g i b t , daß das I n t e r v a l l
[G ,G ] den Parameter θ n i c h t e i n s c h l i e ß t , wird a l s u ο
tumswahrscheinlichkeit b e z e i c h n e t . Fassen wir d i e e r m i t t e l t e n
Irr-
Stichproben-
werte e i n e r Z u f a l l s v a r i a b l e n X wiederum a l s Realisationen von unabhängigen identisch v e r t e i l t e n Zufallsvariablen X , . . . , X
a u f , so sind d i e
Intervall-
146
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
grenzen G^ und G q Funktionen von Χ^,.,.,Χ^. Durch Übergang zu den beobachteten Werten x.,...,x erhält man dann Realisationen g und σ der Grenzen G I n u ο u und G q . Die Konstruktion eines Konfidenzintervalls erfolgt in der Regel über die Transformation einer bereits vorhandenen Punktschätzfunktion derart, daß die Verteilung für die transformierte Größe bekannt und unabhängig vom Parameter θ ist. 2 Auf diese Weise erhält man für den Parameter μ einer Ν(μ,σ^) - verteilten Zufallsvariablen mit σ 2 bekannt über die Schätzfunktion X (vgl. Aufgabe 5.1) wegen σ * '(-X ^ tfT
u, .„< μ < X+ l ~«2 vir
v
u,
..\
j
= 1 -α mit
Vn
fr
ein Konfidenzintervall zum Niveau 1 - α . Dabei bezeichnet u
l-a/2
das (1-0/2)
Quantil der Standardnormalverteilung (vgl. Aufgabe 4.9).
Ein Konfidenzintervall zum Niveau 1 - α = 0.95 (α = 0.05) für den 2
Erwartungswert
μ des Ν(μ,4 ) - verteilten AbfUllgewichtes ergibt sich mit dem im Aufgabenteil (a) berechneten arithmetischen Mittel der η = 2 5 Stichprobenwerte 2 χ = 174.4, der bekannten Varianz σ* = 16 (σ* = 4), und dem Quantil der Standardnormal Verteilung V c / 2 174.4
=u
1-0.05/2
=u
1-0.025
=u
0.975 = 1 · 9 6 0 0
zu
— · 1 .9600 , 1 7 4 . 4 · 1 . 9 6 0 0 ] = [174.4 - 1.568 , 174.4 + 1.568] = [172.832 , 175.968]
.
-»(c) Bei gleichen Bedingungen wie im Aufgabenteil
(b) erhält man als Konfi-
denzintervall für den Erwartungswert μ bei einem Stichprobenmittelwert von χ = 175.5 : [ 175.5 L
— \/Ίζ
1 .9600 , 175.5 + — ^ — \ΖΊ5
1.9600]
= [175.5 - 1.568 , 175.5 + 1.568] = [173.932 , 177.068]
,
J
Kapitel 5: Punktschätzer, Konfidenz- und Frognoseintervalle
147
χ = 174.8 : [174.8- 1.568 , 174.8 + 1.568] =[173.232 , 176.368] , χ = 176.7 : [176.7 - 1.568 , 176.7 + 1.568] =[175.132 , 178.268] . Aus Abb. C5.2.1, welche die vier berechneten Konfidenzintervalle zum Niveau 0.95 für den Erwartungswert μ veranschaulicht, geht noch einmal hervor, daß diese Konfidenzintervalle abhängig vom jeweils ermittelten Stichprobenmittelwert χ variieren, obwohl der Parameter μ (es wurde angenommen, daß μ = 175 gilt) natürlich fest ist. Außerdem zeigt sich, daß das Intervall, das auf dem Wert χ = 176.7 basiert, den (unbekannten) Parameter nicht enthält.
χ = 176.7 x=174.8 χ = 175.5 x = 174.4 172
173
1%
μ = 175
176
I
177
I
178
Abb. C5.2.1: Konfidenzintervalle zum Niveau 0.95 für den Erwartungswert μ bei unterschiedlichen Stichprobenergebnissen
LÖSUNG ZU AUFGABE 5.5 -»(a) Die Länge X von Metallstiften sei normal verteilt mit Erwartungswert μ 2 2 2 2 bei bekannter Varianz σ* = 1.6 = 2 . 5 6 m m , d.h. Χ ^ Ν ( μ , σ * ) . Als Konfidenzintervall zum Niveau 1 - α = 0.96 für μ ( v g l . Aufgabe 5 . 2 ) erhält man mit dem arithmetischen Mittel der an η =36 Metallstiften gemessenen Länge χ = 38.5 mm und dem Quantil u
1-a/2 " u 1-0.04/2 = u 1 - 0 . 0 2
=u
0.98
= 2,0537
148
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
somit r
σ*
σ*
•a/2
\/n
= [38.5 - - i ^ - "2.0537 , 38.5 I»/"iff V3S
ν* 36
· 2 . 0537
= [37.9523 , 39.0477]
-»(b) Die Breite b eines Intervalls [g ,g J ist allgemein gegeben durch b = g -g ο u Ist die Varianz σ
einer normalverteilten Zufallsvariablen bekannt, so ergibt
sich die Breite des Konfidenzintervalls für den Erwartungswert μ (vgl. Aufgabe 5.2) gerade zu 2 ·σ
χ
b =
1-0/2
Vn
,
d.h. diese hängt wesentlich vom Stichprobenumfang η ab. Soll nun eine vorgegebene Breite b des Intervalls abgesichert werden, so muß die kleinste Zahl η bestimmt werden, für die 2
η >
*
I-0/2
gilt» Eine Stichprobe dieses Umfangs liefert dann ein Konfidenzintervall der gewünschten Breite»
Das im Aufgabenteil
(a)
berechnete
Konfidenzintervall hat eine B r e i t e von
g Q - g u = 39.0477 - 37.9523 = 1.0954 mm . Für ein weiteres Konfidenzintervall zum Niveau 0.96 wird v e r l a n g t , daß es eine B r e i t e b = 1.0954/2 = 0.5477 mm e i n h ä l t . Mit 2 - σ* · u η >
2 0.98
[
^
^
Z
]
=143.975.
wird eine Stichprobe vom Umfang η = 144 b e n ö t i g t , um die g e f o r d e r t e B r e i t e des Konfidenzintervall s abzusichern.
149
Kapitel 5: Punktschätzer, Konfidenz- und Prognoseintervalle
->(c) Da das angegebene Intervall sich schreiben läßt als [38.1 , 38.9] = [38.5 - 0.4 , 38.5 + 0.4] = [ x - 0 . 4 ,x + 0.4]
,
ergibt sich aus der allgemeinen Form des Konfidenzintervalls für μ (vgl. Aufgabe 5.2) folgende Gleichung:
U
1 - c/2
=
1
·
5
·
Somit erhält man (vgl. Aufgabe 4.9) 1 - α/2 = «(1.5)
,
d.h. α = 2(1 -Φ(1.5)) = 2(1 - 0.9332) = 0.1336 Die erwartete Metall stiftlänge μ wird
.
also mit Wahrscheinlichkeit
1 - ot = 1 - 0.1336 = 0.8664 vom angegebenen Intervall überdeckt.
LÖSUNG
ZU A U F G A B E 5 Λ
Der C O - G e h a l t X im Abgas von Kraftwagen ist näherungsweise als normalver2 teilt mit unbekanntem Erwartungswert μ und unbekannter Varianz σ anzusehen. Bei einer Stichprobe von η =30 Kraftwagen wurden die gegebenen Abgaswerte X|,... »Xjg gemessen. 2 -»(a) Das arithmetische Mittel χ bzw. die empirische Varianz s (vgl. Aufgabe 5.1) geben eine erwartungstreue Schätzung für den Erwartungswert μ bzw. für 2 die Varianz σ
einer Verteilung an. Somit erhält man für den durchschnitt-
lichen C O - G e h a l t einen Schätzwert von μ = χ
η
96.6 = 3.22
und eine geschätzte Varianz bzw. Standardabweichung von
=
15
(312.2400 - 30 · 3.22 2 ) = 0.0410
σ = s = \! 'Ö. 04Ί 0 = 0.2025
bzw.
150
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
->(b) I s t e i n e Z u f a l l s v a r i a b l e Χ gabe
, χ + t h-1
n-l;l-
(vgl. A u f g a b e
d a s
mit
für die Standardabweichung
(1-0/2) - Q u a n t i l d e r t (Χ
bzw.
n-l;0/2
Dabei bezeichnet χ das arithmetische Mittel, s
u n d
(vgl. A u f -
5.2)
2
, - Verteilung n-1
< 1 - » ' 2 ' ~ Quantil
σ vor.
die empirische
Varianz,
(vgl. A u f g a b e
((α/2) - Q u a n t i l )
4.12.a) _
der χ ^
-
4.12.a).
Im Aufgabenteil (a) wurden bereits mit η =30 χ = 3.22
,
s 2 = 0.0410
bzw.
s = 0.2025
ermittelt. Zunächst sollen nun zu den unterschiedlichen Niveaus die Konfidenzintervalle für den durchschnittlichen CO-Gehalt μ in Kraftwagen berechnet werden: =t
Für 1 - a = 0.90, d.h.ο = 0.10, ist t n 1
29-0 95 =
1- 6 9 9 u n d s o m i t
er
"
gibt [3.22-I.699 · ° · 2 0 2 5 , 3.22 + 1 .699 · ° - 2 0 2 5 1 = [3.1572 , 3.2828] \/317 \βΰ -1
L
ein Konfidenzintervall zum 90% Niveau für μ; für 1 - a = 0.95, d . h . a = 0.05, ist t
n
1
=
^ g - O 975 = 2 , 0 4 5
und es
er
9lbt
[3.22-2.Ο45· 0 , 2 0 2 5 , 3.22 + 2.045 · °- 2025 ~| = [3.1444 , 3.2956] L y/Ίΰ \/3ΤΓ J ein Konfidenzintervall zum 95% Niveau für μ; für 1 -α = 0.98, d.h. α = 0.02, ist
. · ) . = t 29-0 99 = 2 , 4 6 2
Und eS
er
9ibt
[3.22 - 2.462 · ° · 2 0 2 5 , 3.22 + 2.462 · ° · 2 0 2 5 ] = [3.1290 , 3.3110] L \/3ü \/3ü J ein Konfidenzintervall zum 98% Niveau für μ.
Kapitel 5: Punktschätzer, Konfidenz- undPrognoseintervalle
151
Für die Varianz σ 2 des CO-Gehalts in den Abgasen von Kraftwagen erhält man bei den verschiedenen Niveaus folgende Konfidenzintervalle: Mit 1 - α = 0.90, X n _
1 ; W 2
= X2 9 ; 0 .95 =
42
"56' V l ; « / 2
=
*29;0.05
=
17
·71
*29;0.025
=
16
·05
ist
[ 2 9 42°.5? 1 0 ' 2 9 i70.7°1410] • [0.0279 , 0.0671] 2
ein 90% - Konfidenzintervall für σ ; mit 1 - α = 0.95, χ*.,. w
= 2
*29;0.975
= 45
· 7 2 ' x n-1; 9 in der Regel gerechtfertigt ist (vgl. Aufgabe 4.14) , läßt sich ein Konfidenzintervall für ρ zum Niveau α (vgl. Aufgabe 5.2) bestimmen zu [p t ' P 2 ] mit
2np + U
l - 0/2 ~U l - 0/2 2
2
( η +
J A ' - * / 2 + 4 " P ( 1 - Ρ' ν^2>
"P + Ul-c/2+Ul-q/2
2
2
Dabei bezeichnet u^
/ " l - q / 2 * 4 n P ( 1 "Ρ* 2 (η+ "ΐ-^2>
das (1 - α/2) - Quantil der N(0,1) - Verteilung und
ρ = m/n. Da mit η = 5000 hinreichend viele Beobachtungen vorliegen (mit p = 0.06 gilt auch np(1 - p ) =282 > 9 ) , kann ein Konfidenzintervall zum Niveau 1 - α = 0.99 mit Hilfe der Normal Verteilungsapproximation bestimmt werden. Es ergibt sich mit ρ = 0.06, u - | . ( y 2 = u 0 995 "2.5758 gerade
P,1 =
p
2
2-5000 ' 0.06 + 2.5758 - 2.5758 » ss/l.5758^ +4-282 : 7 2 (5000 + 2.5758 )
=
606.6347 - 86.7641 _ n n , 1 Q = u 0519 10013.2695 ·
=
606.6347 + 86 . 7641 „ ncQ, = 10013.2695 °·0692 ·
·
d.h. der prozentuale Stimmenanteil der OPD bei der Landtagswahl liegt mit 99% - tiger Sicherheit im Intervall [5.19% , 6.92%]
.
Als Schätzwert für die Wahrscheinlichkeit q = 1 - p, daß ein Wähler seine Stimme einer der übrigen Parteien gibt, erhält man natürlich q = 1 - p = 1 - 0.06 = 0.94
ILzJÜ = i Z M ^ 3üüüy
'
d.h. der Stimmenanteil der übrigen Parteien wird auf 94% geschätzt. Das zugehörige Konfidenzintervall
[q^.q^] zum Niveau 0.99 läßt sich direkt aus dem
Intervall, das soeben für ρ berechnet wurde, ablesen, denn es gilt
154
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
[qrq2]
= [1 - p 2 .
- P i ] = [1 - 0.0692 , 1 - 0.0519]
1
= [0.9308 , 0.9481]
.
Der S t i m m e n a n t e i l d e r ü b r i g e n P a r t e i e n l i e g t a l s o zum N i v e a u 0 . 9 9 im I n t e r vall [93.08% , 9 4 . 8 1 « ]
.
LÖSUNG ZU AUFGABE 5.6 -»(a) B e i e i n e r S t i c h p r o b e vom Umfang η = 25 t r a t e n m = 6 A u s s c h u ß s t ü c k e a u f , d . h . e i n e S c h ä t z u n g d e r W a h r s c h e i n l i c h k e i t p , daß e i n p r o d u z i e r t e s
Stück
Ausschuß i s t , i s t gegeben d u r c h (vgl. Aufgabe 5.5)
M i t a n d e r e n W o r t e n , es w i r d d e r p r o z e n t u a l e A n t e i l d e r A u s s c h u ß s t ü c k e i n dem P r o d u k t i o n s l o s a u f 24% g e s c h ä t z t .
-•(b)
Ist eine Approximation der Binomial- durch eine Normalverteilung nicht
mehr gerechtfertigt
(vgl. Aufgabe 5.5), so läßt sich mit Hilfe der
sogenann-
ten Pearson - Clopper - Werte ein Konfidenzintervall für ρ zum Niveau 1 - α angeben. Unter Verwendung der Quantile der F - Verteilung ergibt sich dieses zu [Pl,P2] mit m * F 2m.2(n - m + 1) ,· a/2 n-m+l+m*F2m,2 (n - m + 1) ;a/2
(m+ 1) · F 2 ( m +
t) >2(n
η - m + (m + 1) · F. ,
_m)
'
.j.g/2
, , _,
. .
2 (m + 1) ,2 (n - m) ; 1 - 0 / 2
..
Z u n ä c h s t s o l l e n d i e z u r k o n k r e t e n B e r e c h n u n g e i n e s K o n f i d e n z i n t e r v a l l s zum N i v e a u 0 . 9 0 b e n ö t i g t e n Q u a n t i l e b e s t i m m t w e r d e n . Es e r g i b t s i c h m i t m = 6 , η = 2 5 , α = 0 . 1 0 (vgl. Aufgabe 4.12) e i n m a l F2m,2(n-m
+ 1);o/2
= P12,40;0.05
=
F40 ^ . g
g5
=
T37Z
=
0,4122
·
155
Kapitel 5: Punktschätzer, Konfldenz- und Prognoseintervalle
Der Wert F
2(m + 1),2(n-m);1-cV2
=
F
14,38;0.95
läßt sich aus der im Anhang gegebenen Tafel nicht mehr genau ablesen. Wir verwenden daher die ebenfalls dort angegebene Approximation für 0 . 5 < γ < 1: F
η, ,η 2 ;γ
~ e
(u J - a - b Ύ
mit
a=
,
( y
2
-
3
b.
d
.
1
1
Da n 1 = 14, n^ = 38, uQ gg = 1.6449 und d = 0.10395
,
c = - 0.04905
b = 0.07481
,
a = 0.45538
,
erhält man für das gesuchte Quantil der F ^ jg - Verteilung näherungsweise c
14,38;0.95 ~
_1.6449 · 0.45538 - 0.07481
, 0 ( -, c ·9625
= 1
'
Die Grenzen des 0.90 - Konfidenzintervalls berechnen sich damit zu
P
1
6 ' P 12,40;0.05 2 5 - 6 + 1+6 - Ft2,40;0.05 7
^
* F 14,38;0.95 2b - 6 + / · ,38;0.95
6 · 0.4122 ' °-4122
=
n
= 20 + 6
^
7 - 1.9625 + ^ " ^ ·96ίί5
1in.
. UBd
n
'
d.h. mit Wahrscheinlichkeit 0.90 wird der Anteil der Ausschußstücke überdeckt durch das Intervall [ 1 1 . 0 U ,41.96%]
.
LÖSUNG ZU AUFGABE 5 . 7 Da der Erwartungswert einer Ex (λ) - verteilten Zufallsvariablen X gerade 1/λ ist (vgl. Aufgabe 4.7), liegt es nahe (vgl. Aufgabe 5.1), den Parameter λ durch
156
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
41
1
1 n
X
I x. i-1 x
zu schätzen, wobei xj,...,x
die beobachteten Werte der exponentialverteilten
Zufallsvariablen X bezeichnen. Ein entsprechendes Konfidenzintervall zum Niveau 1 - α (vgl. Aufgabe 5.2) für 2 den Parameter λ einer Exponentialverteilung ist mit Quantilen der -Verteilung gegeben durch 2n ;Ct/2
2n;l- o/2 2nx
2nx
Bei einer Stichprobe von η = 100 Computern wurde eine durchschnittl iche Lebensdauer bis zur ersten Reparatur von χ =2 Jahren f e s t g e s t e l l t . Als Schätzwert für den Parameter λ der als exponential v e r t e i l t angenommenen Lebensdauer ergibt sich somit Λ λ
1 ι = r = 7 = Ο· 5 χ
·
2 Das zugehörige Konfidenzintervall zum Niveau 1 - α = 0.95 i s t mit χ , „ 2 2 2 'α' = χ 200:0.025 = 1 6 2 * 7 ' x 2n;1 -c/2 =x 200;0.975 = 2 4 1 ' 1 b e s t i m m t d u r c h [2 S
2 ' 2
LÖSUNG ZU A U F G A B E
2] =
[0
·40675 ' °-60275]
*
5.8
Der Parameter p^, der im Zusammenhang mit einem Μ ( η , ρ ^ , . . . - v e r t e i l t e n Zufallsvektor (Χ^,.,.,Χ^) (vgl. Aufgabe 4.3; Multinomialverteilung) die Wahrscheinlichkeit dafür angibt, daß bei einem Versuch ein Ereignis A^ eintritt, wird geschätzt durch (vgl. Aufgabe 5.5) m.
h'
ΊΓ
' 1=1
k
-
Dabei gibt m. die absolute beobachtete Häufigkeit des Ereignisses A^, i=l , „..,k , bei η unabhängigen Wiederholungen des Versuchs wieder. Simultane Konfidenzintervalle zum (simultanen) Niveau 1 - a
Kapitel 5: Punktschätzer, Konfidenz- und Prognoseintervalle
f p ii' p 2i^
fÜr
P
i
'
1=1
157
'•••'k '
d.h. mit einer Gesamtwahrscheinlichkeit von 1 - α überdecken die Intervalle [ ρ ^ , ρ ^ ^ ] simultan, gleichzeitig die k Parameter p^, erhält man approximativ für i=l,...,k durch
X
k-1; 1-Ot+
2np
i - / X k - 1 ; 1KX (X k-1 ; 1 ^
" P j ( 1 ' P i>>
V k-1 ,-1-α A k-1 ,-1-g 2
k-1; 1 -Ot P
+ 4
2i -
2 (n +X
*ι
k-l,-l-a)
Von η = 120 Personen würden m^ =54 regelmäßig, h^ = 30 unregelmäßig und mg =η - m^ - m2 = 120 - 54 - 30 =36 niemals KISS kaufen. Die gesuchten Wahrscheinlichkeiten werden also geschätzt mit prrar p
2
0
·
4 5
·
= ^ = 0.25
p3=m=0·
,
3 0
·
Da 1 - a = 0.90,
=
=4·605'
;0.90
i s f
mit p 1 = 0.45
P
4.605 + 2 - 120 - 0 . 4 5 - y/4.605 (4.605 +4 · 120· 0.45- (1 - 0ΤΤ5ΤΓ 2 (120 + 4.605)
11
_ 112.6050 - 23.8386 249.2100" = 0.3562 p
2i
=
,
112.6050 + 23.8386 — zwzm—
=
n „71°-5475
-
mit p 2 = 0.25
_ . 4.605 + 2 - 120 - 0.25 - y/4.605 (4.605 +4 - 120 - 0.25 * 0.75)' p 12 249.2100 _ 64.6050 - 20.8724 249.2100 = 0.1755
,
158
Teil I: Übungsaufgaben,
Erläuterungen
64.6050 + 20.8724 249.2100
P22
und
Lösungen
0.3430
und mit p, =0.30
13 "
4.605 + 2 · 120 » 0.30 - \/4.605 (4.605 + 4 · 120 · 0.3 · 0.7) 249.2100 '
= 76.6050 - 22.0316 249.2100 = 0.2190 23
=
,
76.6050 + 22.0316 249.2100
0.3958
Mit einer Gesamtwahrscheinlichkeit 90% enthalten also simultan die (approximativen)
Intervalle [0.3562 , 0.5475] den Parameter ρ,, [0.1755 , 0.3430] den Parameter p 2 und [0.2190 , 0.3958] den Parameter p 3 ·
Kapitel 6: Parametrische Tests im Einstichprobenfall AUFGABE 6 . 1 Bei e i n e r neu angeschafften F l a s c h e n b l e r a b f ü l l a n l a g e wird der B r a u e r e i eine m i t t l e r e Abfüllmenge von 0 . 3 3 1 bei e i n e r S t a n dardabwelchung von σ = ο.03«. g a r a n t i e r t . Eine S t i c h p r o b e von η = 1 6 Flaschen ergab eine d u r c h s c h n i t t l i c h e Biermenge pro F l a sche von 0 . 3 1 1 . Es s o l l angenommen werden, dass d i e Abfüllmenge n o r m a l v e r t e l l t 1 s t . (a) Kann man mit e i n e r zugelassenen I r r t u m s w a h r s c h e i n l i c h k e i t von 0.05 davon ausgehen, dass die m i t t l e r e Abfüllmenge g e r i n g e r i s t a l s von dem H e r s t e l l e r der Anlage angegeben? (b) Bestimmen S i e den Ablehnbereich sowie den Annahmeberelch des unter (a) durchgeführten T e s t s . (c) Bei welchem Niveau Für welche durchschnittlichen Natriumwerte (bei gleichbleibender Stichprobenvarianz) kann die obige Hypothese zum 5% Niveau verworfen werden? (c) Kann zum Niveau 0,05 die Hypothese, dass die Varianz bei 2mg2/«·2 liegt, verworfen werden?
AUFGABE 6.4 Eine Umweltschutzorganlsation behauptet, dass nach der vom TÜV erhobenen Stichprobe über den CO-Gehalt der Abgase von η = 30 PKW aus Aufgabe 5,4 es sichergestellt ist, dass der durchschnittliche CO -Wert bei über 3.15% liegt. Können Sie diese Behauptung zum 5% Niveau signifikant bestätigen?
Kapitel 6: Parametrische Tests im
Einstichprobenfall
161
AUFGABE 6.5 Der H e r s t e l l e r der Flaschenbierabfüllanlage aus Aufgabe 6 . 1 s t e l l t die Maschine neu e i n . Bei einer Untersuchung des I n h a l t s von 16 Flaschen wurde wieder eine d u r c h s c h n i t t l i c h e Biermenge von 0 . 3 1 1 pro Flasche f e s t g e s t e l l t . A l l e r d i n g s lag die S t l c h probenstandardabwelchung nur bei s = 0 . 0 1 . Wurde eine Verbesserung der Streuung der Abfüllmenge e r z i e l t ? Prüfen S i e , ob die Standardabweichung zum 5% Niveau s i g n i f i k a n t k l e i n e r a l s 0.03 ist.
AUFGABE 6.6 Bei einer Landtagswahl wurden von 5000 b e r e i t s ausgezählten Stimmzetteln 300 f ü r die OPPORTUNISTEN PARTEI (OPD) r e g i s t r i e r t , v g l . Aufgabe 5.5. Wird diese Partei bei einem S i g n i f i k a n z n i v e a u α = 0 . 0 1 die 5% Hürde überwinden?
AUFGABE 6.7 Die Produktionsabteilung eines Werkes überprüft die Qualltat eines seiner Produkte. Unter 25 dem Produktionslos z u f ä l l i g entnommenen Produktionsstücken wurden 4 Ausschussstücke ermitt e l t . überprüfen S i e zum Niveau « = 0.05 die Hypothese, dass der Ausschussanteil in der Gesamtproduktion bei über 20% l i e g t .
AUFGABE 6.8 Eine Stichprobe In verschiedenen Krankenhäusern ergab unter 500 Geburten einen A n t e i l von 48% neugeborenen Mädchen. (a) I s t die Wahrscheinlichkeit für die Geburt eines Mädchens s i g n i f i k a n t k l e i n e r a l s 0 . 5 ? Testen S i e zum 4 % - N i v e a u . (b) Wie g r o s s muss der Stichprobenumfang gewählt werden, damit der in (a) durchgeführte Test zum Niveau 0.04 mit 8 0 % - lger
162
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
Sicherheit die Frage in (a) bejaht, wenn die tatsächliche Wahrscheinlichkeit für die Geburt eines Madchens bei 0.46 liegt?
AUFGABE 6.9 Ein Marktforschungsinstitut stellt aufgrund langjähriger Erfahrung auf dem Tollettenpaplermarkt die Hypothese auf, dass der Anteil der Verbraucher, die das neuartige Toilettenpapier KISS regelmässig kaufen werden, bei 40% liegt, 30% sich In unregelmässigen Abständen beim Kauf für KISS entscheiden und nur 30% das neue Toilettenpapier ablehnen, Oberprüfen Sie anhand der in Aufgabe 5.8 gegebenen Stichprobenergebnisse obige Behauptung zum 1% Niveau.
Kapitel 6: Parametrische Tests im Einstichprobenfall
LÖSUNG ZU AUFGABE
163
6.1
Der Begriff des statistischen Tests ist eng verknüpft mit der sogenannten Nullhypothese Hg (kurz: Hypothese) und der Alternativhypothese H^ (kurz: Alternative) . Dabei wird in der Hypothese eine Annahme (Vermutung) über die Verteilung einer oder mehrerer Zufallsvariablen formuliert, die mit Hilfe eines statistischen Entscheidungsverfahrens (kurz: Test) überprüft werden soll. Hinter der Alternative verbirgt sich dann gerade eine zu H^ komplementäre, weitere Annahme über die Verteilung. Beziehen sich H^ und H^ auf Parameter θ einer bekannten Verteilung, so heißen die zugehörigen Entscheidungsverfahren
parametrische Tests. Eine Zufallsvariable X unterliege nun
einer Verteilung mit unbekanntem Parameter Θ.
Folgende Arten von Hypothesen
können dann unterschieden werden: Man spricht von einer einseitigen Hypothese, wenn H01 : θ < eQ «02
:θ
- ®0
gegen gege
"
H H
12
u
:
: θ > 0Q ®
u - α 0.05 ~ - 1.6449,
"0.95"
d.h. da
,
ζ
Χ "μ°,/τ?Γ 0-31 - 0.33 = _ _ ν Γ T 5 " = QTQ3
. 9 ,,,, 4 = - 2.6667
,
kann die Nullhypothese zum Niveau 0.05 verworfen werden, denn ζ = - 2.6667 < - 1.6449 = u a Anders ausgedrückt bedeutet dies aber gerade, daß bei einer
Irrtumswahr-
scheinlichkeit von 0.05 die durchschnittliche Abfüllmenge kleiner a l s 0 . 3 3 £ ist, d . h . die Entscheidung Durchschnittswert'
'μ ist kleiner als der vom Hersteller angegebene
hat eine Fehlerwahrscheinlichkeit von 0.05.
-»(b) Die im Aufgabenteil für Werte ζ < - 1 .6449
(a) untersuchte Hypothese Hq wird zum Niveau 0.05
abgelehnt, d . h . der Ablehnbereich ist also das offene
Intervall A
0 . 0 5 = C - - . - 1 -6449)
;
für den Annahmebereich erhält man somit Ä
o s
= [ - 1.6449 , » )
,
vgl. A b b . C6.1.1.
-»(c) Bezeichnet c (α) den kritischen Wert eines Niveau - α - Tests, so kann eine Hypothese bei Vorliegen des Wertes T(x.,...,x ) einer Teststatistik für alle 1 η Niveaus α > α , wobei sich α als Lösung der Gleichung c (α) = T(x, ,... ,x ) 1 η ergibt, verworfen werden. Diese Größe α heißt auch ρ - Wert (p - value) eines Tests.
Mit dem im Aufgabenteil
(a) berechneten Wert der Teststatistik ζ = - 2 . 6 6 6 7
läßt sich der ρ - Wert α des durchgeführten Gauß - Tests als Lösung der Gleichung
Kapitel 6: Parametrische Tests im Einstichprobenfall
Ablehnbereich
167
Annahmebereich
Abh. C 6.1.1: Ablehn- und Annahmebereich eines e i n s e i t i g e n Gauß - Tests zum Niveau α = 0.05
u5 = -2.6667 bestimmen. Bezeichnet φ(χ) die Verteilungsfunktion der Standardnormal V e r t e i l u n g , so ergibt sich α = Φ(- 2.6667) = 1 -Φ(2.6667) 1 - 0.9962 = 0.0038
,
d.h. obige Hypothese kann bei Vorliegen des Stichprobenmittelwertes χ = 0.31 f ü r a l l e Niveaus a > 0.0038 verworfen werden. Auf
das konkrete Niveau α eines Tests hat man sich allerdings vor der Durch-
führung des Testverfahrens festzulegen, vgl. Aufgabenteil
(a).
168
Teil / . Übungsaufgaben, Erläuterungen und Lösungen
LÖSUNG ZU AUFGABE
6.2
Dem A b f ü l l g e w i c h t X von grünen Bohnen i n Dosen w i r d e i n e Normal V e r t e i l u n g 2 m i t unbekanntem E r w a r t u n g s w e r t μ und b e k a n n t e r V a r i a n z σ* = 16 u n t e r s t e l l t , v g l . Aufgabe 5 . 2 . F ü r d i e an η = 2 5 Dosen gemessenen Werte x^
Xgg h i n -
s i c h t l i c h d e r A b f ü l l m e n g e wurde e i n D u r c h s c h n i t t s g e w i c h t von χ = 1 7 4 . 4 g
er-
mittelt.
- • ( a ) Zum Niveau a = 0 . 1 0 s o l l d i e z w e i s e i t i g e Hypothese H 0 : μ = 175 gegen d i e A l t e r n a t i v e H 1 : μ % 175 g e t e s t e t werden ( v g l . Aufgabe 6 . 1 . a ) .
x
-μ0 \J η σ*
d e r m i t dem Q u a n t i l
u
II
M i t x = 174.4 e r g i b t s i c h f ü r d i e z u g e h ö r i g e T e s t s t a t i s t i k d e r Wert 174.4 - 175
i _ ( y 2 = u 0 95
| z | = 0 . 7 5 * 1 .6449 = u , . ^
0.75 v e r g l i c h e n werden muß. Da
,
kann Hg zum Niveau 0 . 1 0 n i c h t v e r w o r f e n w e r d e n , d . h . beim 1 0 % - N i v e a u l i e g e n k e i n e s i g n i f i k a n t e n Abweichungen vom Wert μ = 1 7 5 g
vor.
Da d i e o b i g e Hypothese zum 10% Niveau f ü r a l l e ζ m i t | ζ | > 1 .6449 v e r w o r f e n w i r d , i s t d e r A b l e h n b e r e i c h Ag ^
( v g l . Aufgabe 6.1) des soeben
durchgeführten Tests bestimmt durch A0.10
=
("">·
- Ι·6449'
u
(1 -6449 , » )
.
Aus dem Annahmebereich V l O
=
["
1
· 6 4 4 9 » 1.6449]
e r g i b t s i c h , daß Hg n i c h t v e r w o r f e n w i r d , χ -μ
\ f n e [ - 1.6449 , 1 . 6 4 4 9 ]
falls
169
Kapitel 6: Parametrische Tests im Einstichprobenfall
g i l t . M i t χ = 174, σ * = 4 und η = 25 l ä ß t s i c h d i e s e Aussage ä q u i v a l e n t umformen zu μη 6 u
Γ
σ
- 1.6449
L
*
σ
+ χ , 1.6449
ν/η
*
-1 + χ J
Vη
= [ 174.4 - 1.6449
, 174.4 + 1.6449 ·
,
d . h . l i e g t der h y p o t h e t i s c h angenommene Wert μ^ im I n t e r v a l l [173.0841,175.7159] so wird Hg n i c h t verworfen. Konfidenzintervall gewichts X Γ 5 L
, Dieses Intervall
stimmt Liberein mit dem 0 . 9 0 -
f ü r den Erwartungswert μ des Ν(μ,16) - v e r t e i l t e n A b f l i l l -
(vgl. Aufgabe 5.2.b): σ
σ
* u
\J η
o.95 ' *
+
* - = u0.95 \Jr\
[ l 7 4 . 4 - ^ t · 1 .6449 , 174.4 = [173.0841 , 175.7159]
Somit kann a l s o d i e z w e i s e i t i g e Hypothese
1 .6449
.
Hg zum Niveau 0.10 verworfen wer-
den, wenn der h y p o t h e t i s c h e Wert μρ n i c h t im 0.90 - K o n f i d e n z i n t e r v a l 1 f ü r μ liegt.
-»(b) Die Gütefunktion, die einen statistischen
Test vollständig charakteri-
siert, gibt in Abhängigkeit vom wahren Parameter θ die Wahrscheinlichkeit an, die Nullhypothese aufgrund dieses Tests zu verwerfen. Die Funktionswerte der Gütefunktion, die hier mit g(0) bezeichnet wird, sind, falls der wahre Parameter θ in der Nähe des hypothetisch angenommenen Wertes
liegt, sehr
klein, bzw. je weiter der wahre Parameter von θ^ entfernt ist, um so mehr nähern sich diese dem Wert Eins. Liegt nun der wahre Parameter in dem von der Hypothese bestimmten Bereich für θ (kurz: Θ£ΗQ) , so ist ein Niveau - α - Test (vgl. Aufgabe 6.1) gerade bei g(8) < α
für alle θ e H Q
gegeben. Außerdem läßt sich über g(6) auch die Wahrscheinlichkeit für den Fehler 2. Art B, d.h. die Wahrscheinlichkeit sich für H^ zu entscheiden, obwohl Hj richtig ist (vgl. Aufgabe 6.1), bestimmen. Denn ist der wahre Parameter aus dem von der Alternative zugelassenen Bereich für θ (kurz: θ6Η^) , so ist die Wahrscheinlichkeit 3 in Abhängigkeit von θ gerade β(θ) = 1 - g(θ)
für alle θ C H
.
170
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
Es soll die Gütefunktion des im Aufgabenteil
(a) durchgeführten
Einstich-
proben - Gauß - Tests berechnet werden. Die zweiseitige Hypothese Hg : μ = 175 = μ 0 wird dabei zugunsten von Η, : μ + 175 = μ 0 zum Niveau α = 0.10 verworfen, falls
—
—
| ^ Z 5 .
ν η
5
| >
1.6449
=
V
g
5
= u
W
2
gilt. Da die Zufallsvariable X mit (vgl. Aufgabe 5.2) E(X) = μ
und
Var(X) = ^ a \ = ^
•• 16 = 0.64
Ν(μ,0.64) - verteilt ist, unterliegt die zugehörige Testfunktion (vgl. Aufgabe 6.1)
7 1
Χ
"μ0
X - 175 v n
,
X - 175
4
bei Vorliegen des wahren Parameters μ
also einer Ν ^
ö.8^ '
" Verteilung
(vgl. Aufgabe 4.8). Die Gütefunktion g(p) gibt die Wahrscheinlichkeit dafür a n , daß die Nullhypothese verworfen wird. Ober die standardisierte variable Ζ - μ Q ^
Zufalls-
ergibt sich hier somit (vgl. Aufgabe 4.8)
g{μ) = P( I Z| > 1 .6449) = 1 - P( | Z| < 1 .6449) = 1 - P(- 1.6449 < Ζ < 1 .6449)
= ΐ-ρ(.ΐ.6449 - ΰ ^
°
"
erfüllt sein muß. Der Wert d wird auch als mit Sicherheit 1 - 3 abzusichernde
173
Kapitel 6: Parametrische Tests im Einstichprobenfall
A b b . £6.2.2: Verteilung von X unter H Q bzw. H.J: Dichte der N( 175,16/25) - bzw. N( 176 ,16/25) - Verteilung; Veranschaulichung des Fehlers 2. A r t BC176)
Differenz bezeichnet. Testet man die einseitige Hypothese gegen
Hj : μ > μ 0
(bzw. H Q : μ > μ 0
gegen
:μ < μ )
zum Niveau α bei vorgegebener Wahrscheinlichkeit, des Fehlers 2. Art Β an einer Stelle μJ > μ^ (bzw. μ^ < μ^) , so ergibt sich η zu
(u
1-a
,) σ 1-1
In den exakten Formeln ist hier die Varianz σ
2
2 = a l s
bekannt vorausgesetzt. 2 Näherungsweise lassen sich diese allerdings auch anwenden, wenn statt σ eine 2 gute Schätzung s (vgl. Aufgabe 5.4) verwendet wird.
174
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
Es s o l l der nötige Stichprobenumfang η bestimmt werden, um beim Testen zum Niveau α = 0.10 von gegen
H 0 : μ = 175
H^ : μ f 1 7 5
eine Differenz d = 1 g vom Sollwert 175g
bei einer gegebenen Wahrscheinlich-
keit f ü r den Fehler 2. A r t von ß = 1 - 0.975 = 0.025 abzusichern. Da die Varianz 16 angegeben worden war, ergibt sich
des Abfüllgewichts mit a i i(u1-0.05
+ u
1-0.025)
4
(U
0.95+U0.975)4
= (1.6449 + 1.9600) •16 = 207.9249
,
d.h. man benötigt mindestens 208 Dosen, damit der hier verwandte Test zum Niveau α =0.10 ein abweichendes durchschnittliches Füllgewicht vom Sollwert 175g mit einer Wahrscheinlichkeit von mindestens 0.975 entdeckt, d.h. Hg dann mit dieser Sicherheit v e r w i r f t , wenn tatsächlich d > 1 g
vorliegt.
ο -»(e) Bei gegebenem Stichprobenumfang η = 208 und bekannter Varianz σ* = 16 berechnet sich die Wahrscheinlichkeit für den Fehler 2. Art beim Testen der Hypothese H q : μ = 175
gegen
Η 1 : μ =(= 175
zum Niveau α = 0.10 über die im Aufgabenteil funktion für a l l e μ
(b) angegebene, zugehörige Güte-
Mq = 175 zu
β(μ) = 1 - g ( M ) = ® ( u g _ g 5 - i L ^ Z i
/ZUff) - e (
V o 5
-K-Z™.
s/Τθή
Somit i s t für μ =174 3(174) = Φ( 1.6449 -
174
'
175
f z m ) - Φ(- 1.6449 -
174
"
175
= φ(5.25) - Φ(1.96) ~ 1 - 0.975 = 0.025
,
bzw. f ü r μ =176 3(176) = φ(ΐ.6449 -
176
'
VTÜ?) - φ(- 1 .6449 -
1 7 5
176
^
175
/ZDff)
= Φ(- 1.96) - Φ ( - 5.25) = 1 -Φ( 1.96) - 1 +Φ(5.25) 1 - 0.975 = 0.025
,
d.h. f ü r den Stichprobenumfang η =208 i s t a l s o tatsächlich s i c h e r g e s t e l l t , daß der durchgeführte Einstichproben - Gauß - Test zum Niveau α = 0.10 eine
.
175
Kapitel 6: Parametrische Tests im Einstichprobenfall
Abweichung vom S o l l w e r t 175g
bei einer F e h l e r w a h r s c h e i n l i c h k e i t von 0.025
erkennt, wenn die wahre Abweichung 1 g b e t r ä g t , v g l . Aufgabenteil
LÖSUNG ZU AUFGABE
(d).
6.3
Der Natriumgehalt X in einem L i t e r Mineralwasser sei normal v e r t e i l t mit E r 2
wartungswert μ und Varianz σ . Da beide Parameter unbekannt s i n d , werden diese anhand von 20 gemessenen Stichprobenwerten x ^ . - . ^ g Schätzwerte
geschätzt. A l s
(vgl. Aufgabe 5.i) ergaben s i c h
χ = 68mg/£
s 2 = 1 .5 2 = 2.25 mg 2 /£ 2
und
.
2 -•(a) Ist die Varianz einer Ν(μ,σ ) - verteilten Zufallsvariablen X unbekannt, so wird zur Überprüfung von Hypothesen bzgl. des Erwartungswertes μ mittels beobachteter Werte x 4 ,...,x
1
η
der sogenannte Einstichproben - t - Test mit der
Teststatistik
t =
V/n
s
wobei
1 χ = — n
i=l
*
' " * i=l
herangezogen. Da die Testfunktion
T = *—~
μ
°
(vgl. Aufgabe 6.1)
Vrn-
- verteilt ist, sofern μ = μ^ gilt, ergeben sich die in C a h . £ 6 . 3 . 1
zusam-
mengestellten Entscheidungsregeln für ein- und zweiseitige Hypothesen zum Niveau α .
Zum Niveau α = 0.05 s o l l die Hypothese, daß der Erwartungswert μ des normalv e r t e i l t e n Natriumgehaltes X in L i t e r f l a s c h e n höchstens g l e i c h 67mg/£
ist,
getestet werden, d.h. es wird Hg : μ < 67
gegen
H 1 : μ > 67
überprüft. Es e r g i b t sich wegen χ = 6 8 , s = 1.5, η = 20 und = 1.729 gerade
.
=
^^g-o 95
176
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
t a b . C . 6 . 3 . 1 : Tests zum Niveau α für Hypothesen über den Erwartungswert μ 2
einer Ν(μ,σ ) - verteilten Zufallsvariablen X bei unbekannter Varianz Ο 2
H
H
o
μ=μ0
Hg wird zum Niveau α verworfen, f a l l s
1
μ>μ0
t >t
μ1.729 = t 1 9 ; 0 - 9 5
ί
durch Umformung dieser Ungleichung e r g i b t sich -
1 729
1 .5 + 67 = 67.5799
.
VZU
- * ( c ) Neben dem Erwaftungswert μ können natürlich auch Hypothesen über die 2
2
Varianz Ο
einer Ν(μ,σ ) -verteilten Zufallsvariablen X getestet werden. 2 2 Bezeichnet G^ einen hypothetischen Wert für Ο , so verwendet man bei Vorliegen einer Stichprobe χ^,.-.,χ^ als Prüfgröße 2 X
(n - 1) s 2 2 σ
ο 2
deren zugehörige Testfunktion
(vgl. Aufgabe 6.1), wenn σ
2 =σ
richtig ist,
2
eine χ^ ^ - Verteilung besitzt. In
£ 6 * 3 , 2 sind die sich damit ergebenden
Ablehnbereiche der Tests zum Niveau α für die verschiedenen Hypothesen zusammengetragen .
.
Kapitel 6: Parametrische Tests im Einstichprobenfall
Cab* C6-*3*2: Tests zum Niveau α für Hypothesen über die Varianz σ
177
einer
2
Ν(μ,σ ) - verteilten Zufallsvariablen X
Ho
0
σ
σ
Hp wird zum Niveau α verworfen, f a l l s
H1
2 l°o
2 2 σ >σ 0
X
2^2 ϊσο
2 , 2 σ Xn-l;l-cV2
°der
*2 3 . 1 5 bei einer Irrturaswahrscheinlichkeit von 0.05 abgelehnt werden kann. Ober den Einstichproben - t - Test ( v g l . Aufgabe 6 . 3 ) kommt man mit
= tgg.q g j
= 1.699 und
t =
s
—
0.0009 kann zum Niveau α = 0.05 zugunsten der Alternative Η, : σ 2 < 0.0009 verworfen werden, denn es g i l t ( v g l . Aufgabe 6 . 3 )
Χ
2
(n-1)s2
=
15 · 0.0001 0.0009
=
1 f i K C 7 1 6667
·
^7,R1 c, 1-0/2
oder
m 0.20
gegen
H1:p
yp0d-p0) - u ^ ^
* yPjd-Pt)
α
184
Teil l: Übungsaufgaben, Erläuterungen und Lösungen
um an einer Stelle p^
p^
die Wahrscheinlichkeit Β für einen Fehler 2. Art
einzuhalten (vgl. auch Aufgabe 6.2).
Im Aufgabenteil (a) wurde zum Niveau α = 0.04 die Hypothese H q : ρ > 0.5 gegen die Alternative Η, : p < 0.5 getestet. An der S t e l l e p^ = 0.46 < 0.50 = pQ i s t die Wahrscheinlichkeit f ü r den Fehler 2. Art vorgegeben mit β = 1 - 0.80 = 0.20. Um die beiden Fehlerwahrscheinlichkeiten α und 6 nicht zu überschreiten, muß a l s o eine S t i c h probe vom Umfang ' V 0.5(1 - 0.5) · uQ n
Ϊ
+ \/ 0.46( 1 - 0.46) · u Q
g6
' 0.46 - 0 . 5 Ü
g()
2
~
I V 0.250 · 1 .7507 + V 0.2484 · 0.8416 ] { -0.04
2
J
= 1047.8190 erhoben werden. Somit müssen 1048 Neugeborene auf i h r Geschlecht hin untersucht werden, damit der Test zum Niveau α = 0.04 mit 80% - iger Sicherheit HQ v e r w i r f t , wenn der wahre Anteilswert der neugeborenen Mädchen bei 46% 1 iegt.
LÖSUNG ZU AUFGABE
6.9
Der Parameter p. eines M(n;p, ,... ,p, ) - verteilten Zufallsvektors (Χ,,.-.,Χ, ) ι 1 k 1 k (vgl. Aufgabe 4.3) gibt die Wahrscheinlichkeit an, mit der bei einem Versuch bzw. bei einer Befragung ein Ereignis bzw. eine Antwort A^, i=l,...,k, eintritt, wobei die A^ paarweise disjunkte Ereignisse sind mit Pj +
=
η gibt die Anzahl der unabhängigen Wiederholungen des Versuchs bzw. der unabhängig voneinander Befragten an. Zur Überprüfung der in diesem Zusammenhang interessierenden zweiseitigen Hypothese H
o:pi=pio
für
1=1
k
'
die zum Niveau Ot gegen die Alternative Η. : ρ. 1Φ ρ. ~
1
ι
i0
für mindestens ein i€ { 1, .. .k}
185
Kapitel 6: Parametrische Tests im Einstichprobenfall
getestet werden soll, wird die Teststatistik , *
k
(0. - E . ) 2
O2
k
- 1=1 Σ ^ h rι ^ - -
Σ
(vgl. Aufgabe 6.1)
1=1
rι - »
herangezogen. Dabei bezeichnet Ο., abweichend von der in Aufgabe 5.8 gewählten Notation, die beobachtete absolute Häufigkeit des Ereignisses A^ bei insgesamt η vorliegenden Versuchsergebnissen; weiterhin gibt Ε ^ = η · ρ ^
die
unter der Hypothese H^ erwartete absolute Häufigkeit des Ereignisses A^ an. Da die Größe χ 2 bei Gültigkeit von Η 2
die Realisation einer approximativ
X^ j -verteilten Zufallsvariablen darstellt, wird die Hypothese H^ zum Niveau ot verworfen, falls gilt 2 2 X > XXk-l;l-a V ' 2 Nach einer groben Regel ist dabei die Approximation durch die χ^
- Vertei-
lung hinreichend genau, wenn höchstens 20% der unter H^ zu erwartenden Häufigkeiten Ej,...,E^ kleiner als 5 sind und keiner der Werte Ej,... als 1 ist. Natürlich wird für alle i=l,...,k
kleiner
ρ . ^ > 0 vorausgesetzt.
Bezeichnet Y eine diskrete (bzw. diskretisierte) Zufallsvariable mit den möglichen Ausprägungen yj,...,yj_ und P i = P{Y = y^}, so läßt sich obiger Test auch als ein χ 2 - Anpassungstest, vgl. Kapitel 7, auffassen, der überprüft, ob Y einer hypothetischen Verteilung mit Wahrscheinlichkeiten p.^ zugeordnet werden kann; die O^,...,0^ sind dann natürlich die bei η Beobachtungen bzw. Realisationen von Y aufgetretenen absoluten Häufigkeiten von y ^ ' * · · ' ^
unc
*
Ej,...,E k die entsprechenden unter der hypothetischen Verteilung erwarteten Häufigkeiten, E^ = η · P^q·
Das Marktforschungsinstitut stellt die Hypothese auf, daß mit Wahrscheinlichkeit p,|=0.40 ein Verbraucher das Toilettenpapier KISS regelmäßig, mit Wahrscheinlichkeit P2 = 0.30 unregelmäßig und mit Wahrscheinlichkeit
p3=0.30
nie kauft. Zum Niveau α = 0.01 soll also H 0 : p, = 0 . 4 0 = p 1 0
,
p2=0.30 = p20
,
p 3 = 0.30 = p 3 Q
gegen H, : p.j 4 P^q
f
ü r mindestens ein i e {1,2,3}
getestet werden. Als Grundlage dient eine Umfrage unter η = 120 zufällig ausgewählten Personen, von denen
= 5 4 angaben, daß sie KISS regelmäßig
kaufen
würden, 02 = 30, daß sie sich in unregelmäßigen Abständen für KISS entscheiden würden und 0, = 3 6 das neue KISS ablehnten. Zur Vereinfachung der Berech-
186
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
nung sind in tab. C6.9.1 einige Hilfsgrößen vorab ermittelt worden (E 1 = 1 2 0 · 0 . 4 = 4 8 , E 2 = E 3 = 120· 0 . 3 = 3 6 ) .
Cab. C6.9.1: Arbeitstabelle
i
0.
1
54
48
E
1
i
= 120
* pi0
•5
O 2 /E. 1 1
2916
60.75
2
30
36
900
25.00
3
36
36
1296
36.00
I
120
120
121.75
Da die zu verwendende T e s t s t a t i s t i k sich zu 3 0? χ 2 = l J - - 120 = 121 .75 - 120 = 1 .75 i=1 i berechnet und der zugehörige k r i t i s c h e Wert bei x
k-1;1-a
=x
2;0.99
=
9
·210
l i e g t , kann die aufgestellte Hypothese zum Niveau α = 0.01 nicht verworfen werden, denn χ 2 = 1 . 7 5 * 9.210
.
Kapitel 7: Anpassungstests und graphische Verfahren zur Überprüfung einer Verteilungsannahme AUFGABE 7.1 Für den Autotyp MERCADOR wurde die Reichweite (in km) einer Tankfüllung bei 81 PKW gemessen. Folgende Werte wurden ermittelt: 373 , 378 , 395 , 396 , 401 , 401 , 422 , 411 , 408 , 392 , 405 , 401 ,403 ,411 , 389 , 389 , 397 , 397 , 398 , 407 , 413 , 415 , 398 , 398 , 391 , 381 , 392 , 402 , 405 , 415 , 424 , 374 , 396 , 402 , 402 , 398 , 401 , 401 , 381 , 379 , 395 , 381 , 379 , 396 , 396 , 407 , 420 , 424 , 392 , 403 , 402 , 401 , 413 , 407 , 389 , 374 , 396 , 398 , 411 , 421 , 395 , 389 , 405 , 402 , 401 , 398 , 381 , 403 , 427 , 398 , 381 , 405 , 415 , 396 , 392 , 392 , 395 , 407 , 395 ,401 ,411 . Prüfen Sie, ob zum 5% Niveau signifikante Abweichungen der Verteilung der Reichwelte von einer Normal Verteilung mit μ = 4 0 0 km und σ 2 = 1 3 2 . 2 5 km 2 vorliegen. Verwenden Sie dabei folgende Interval lelntellung: (-»,390], (390,400], (400,410], (410,420], (420,°°).
AUFGABE
7.2
In einer Telefonzentrale klagt die Telefonistin über Arbeltsüberlastung. Man ging bislang davon aus, dass die Anzahl der innerhalb von 10 Minuten eingehenden Anrufe polssonvertellt 1st mit Parameter λ = 3 , Eine neuere Untersuchung - e s wurde In einem festen Zeltraum an jedem Tag einer Woche festgestellt,wieviele Telefonate jeweils innerhalb von 10 Minuten eingingen, vgl. cab. 7.2 - soll nun Aufschluss darüber geben, ob die bis
188
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
dato geltende Annahme über die V e r t e i l u n g der eingehenden Anrufe noch G ü l t i g k e i t b e s i t z t . Testen S i e zum Niveau a = o.05. Cab. 7.2: Anrufe in einer Telefonzentrale Anzahl der Anrufe innerhalb von 10 Minuten k
Anzahl der Zeitintervalle mit k Anrufen
0
10
1 - 2
75
3
45
4 - 5
50
6 - 7
10
8 und mehr
0
AUFGABE 7.5 Bevor der Geschäftsführer einer Süsswarenfabrik eine A b f ü l l a n lage f ü r L a k r i t z t e u f e l k a u f t , besteht er auf einen Probelauf der Maschine, um ihre Genauigkeit zu prüfen. Die Anlage s o l l Tüten mit je 1 0 0 g L a k r i t z f ü l l e n , Der Geschäftsführer entnimmt der Halbtagsproduktion eine Stichprobe von 20 Tüten und wiegt deren I n h a l t ab, v g l . tab. 7.3, tab. 7.3: Nettoinhalt ( i n g) x^, i=1,...,20,von η =20 Tüten
i x
i i
x
i
1
2
3
4
5
6
7
8
9
10
93
94
102
99
94
105
91
100
100
94
11
12
13
14
15
16
17
18
19
20
96
99
109
101
100
93
102
104
93
94
Diese Anlage wird nicht gekauft, wenn die a b g e f ü l l t e Menge X zum Niveau 5% s i g n i f i k a n t nicht n o r m a l v e r t e i l t i s t mit Erwartungswert 100 g und Varianz 16 g 2 . Welche Entscheidung t r i f f t der Geschäftsführer, wenn er den Kolmogoroff - Smlrnov - Anpassungstest zu H i l f e nimmt?
Kapitel 7: Anpassungstests und graphische Verfahren
189
AUFGABE 7.4 Dem Buchhalter des Einzelhändlers KLEIN liegen die Einnahmen von η = 1 9 zufällig ausgewählten Tagen vor, vgl. cah. 7.4. i a h - 7.4: Tageseinnahmen (in DM) x^, i = 1 , . . . , 1 9 i x
i i
x
i
1
2
3
4
5
6
7
8
9
1400
1510
1580
1590
1470
1520
1330
1630
1540
10
11
12
13
14
15
16
17
18
19
1380
1720
1530
1610
1350
1480
1530
1700
1640
1430
(a) Der Buchhalter möchte mit Hilfe eines Q - Q - P l o t s überprüfen, ob die Tageseinnahme X als normalverteilt mit Erwartungswert μ = 1 5 0 0 D M und Varianz σ 2 = l O O O O D M 2 anzusehen ist. Wie sieht das Ergebnis aus? (b) Wie verändert sich der unter (a) erstellte Q - Q - P l o t , wenn die Parameter μ und aus der Stichprobe geschätzt werden?
AUFGABE 7.5 Prüfen Sie die in Aufgabe 7.1 bei gegebenen Beobachtungswerten χ Ί ,...,χ 8 1 der Reichweite einer Tankfüllung von η = 8 1 PKW des Typs MERCADOR aufgestellte Behauptung graphisch, (a) indem empirische und hypothetische Dichte miteinander verglichen werden, (b) mit Hilfe eines Wurzeldiagramms (Rootograms). Verwenden Sie dabei die Intervalleinteilung
(370,390],
(390 ,400], (400,410], (410 , 420], (420 , 430].
Kapitel 7: Anpassungstests und graphische Verfahren
LÖSUNG ZU A U F G A B E
191
7.1
Bisher wurden Testverfahren nur bzgl. Hypothesen über die Parameter einer Verteilung behandelt (vgl. Kapitel 6), wobei die Verteilung der zugrundeliegenden Zufallsvariablen als bekannt vorausgesetzt worden war. Mit Hilfe von sogenannten Anpassungstests ist es nun möglich, Hypothesen über den Verteilungstyp einer Zufallsvariablen X zu überprüfen. Die weiteren Ausführungen beschränken sich hier auf das Einstichprobenproblem, d.h. es liegen η unabhängige Beobachtungen χ.,.,.,χ 1
einer Zufallsvariablen X vor. η
2
Mit Hilfe des χ - Anpassungstests kann die Hypothese B„ : χ sind Realisationen einer Zufallsvariablen X, die ver0 1 η 0 teilt ist gemäß der Verteilungsfunktion F^ gegen die Alternative H. :x.,...,x sind Realisationen einer Zufallsvariablen X, die nicht 1 1 η 0 verteilt ist gemäß der Verteilungsfunktion F^ zum Signifikanzniveau α (vgl. Aufgabe 6.1) getestet werden. Folgende Vorgehensweise ist dabei zu empfehlen: 1. Schritt: Unterteilung der reellen Achse in k aneinanderstoßende Intervalle: I ^ K a , ] ,
I., = < βχ , a j
2. Schritt: Bestimmung der Anzahl
^ = ( a ^ , -> .
der Beobachtungswerte, die im i - ten
Intervall I. liegen, i = l,.. . ,k [θ. von 'Observed* = 'Beobachtet'], ι ι 3. Schritt: Berechnung der unter der Hypothese erwarteten Anzahl E^ der Beobachtungswerte im i - ten Intervall durch Ε. = η · ρ. ι ι wobei p ± = P ( x e i .
, I Η ) die Wahrscheinlichkeit angibt, mit der
die Zufallsvariable X unter der Hypothese H^ Werte aus dem Intervalle
annimmt, i=l,...,k [E^ von 'Expected' = 'Erwartet'].
4. Schritt: Berechnung der Prüfgroße
2 x
Da die zu χ
2
=
k (0. -E.) 2 r· 1 1 A Ει— 1=1
02 1 ι Ϊ Γι i=l k Γ
=
n
·
gehörige Zufallsvariable unter H^ asymptotisch
2
-verteilt
ist, muß die Nullhypothese zum Niveau α verworfen werden, falls gilt: 2 X
2 X
k-l;l-a
'
192
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
2 Die verwendete Approximation durch d i e
^ - V e r t e i l u n g i s t dabei h i n r e i c h e n d
genau, f a l l s n i c h t mehr a l s 20% der E^ k l e i n e r a l s 5 und kein Wert E^ k l e i n e r als 1 i s t . B e i der Wahl der k I n t e r v a l l e I „ 1
k
i s t darauf zu a c h t e n , daß e i n e n i c h t
zu grobe E i n t e i l u n g der r e e l l e n Achse vorgenommen w i r d , denn d i e Wahrscheinlichkeit,
einen F e h l e r 2. A r t zu begehen
f a l s c h i s t ) , w i r d um so g e r i n g e r ,
( d . h . H^ anzunehmen, obwohl
d i e I n t e r v a l l e so zu wählen, daß f ü r a l l e unter H^ bedingten keiten p ^ > 0
diese
j e größer k gewählt w i r d . N a t ü r l i c h
sind
Wahrscheinlich-
gilt.
2 Der χ
- A n p a s s u n g s t e s t l ä ß t s i c h sowohl f ü r s t e t i g
a l s auch d i s k r e t
verteil-
t e Z u f a l l s v a r i a b l e n anwenden. B e i s t e t i g v e r t e i l t e n Z u f a l l s v a r i a b l e n X mit einer hypothetisch
angenommenen V e r t e i l u n g s f u n k t i o n F^ l a s s e n s i c h d i e
im S c h r i t t 3 zu berechnenden W a h r s c h e i n l i c h k e i t e n p^, i = l , . . . , k ,
wie
folgt
angeben: Pl=PX(al»
p
j
^ Schritt
= Ε
χ
(
ν
'
"
F
X(aj-l'
=
'
j=2
k
"1
'
·
1 b e d e u t e t f ü r e i n e s t e t i g e Z u f a l l s v a r i a b l e j a gerade d i e
Diskreti-
s i e r u n g , d . h . d i e E i n t e i l u n g d e r Ausprägungen in K l a s s e n . Für e i n e d i s k r e t v e r t e i l t e Z u f a l l s v a r i a b l e X ( v g l . Aufgabe 7.2) werden d i e I n t e r v a l l e s i n n v o l l e r w e i s e so f e s t g e l e g t , daß j e w e i l s nur e i n e mögliche Ausprägung von X in einem I n t e r v a l l l i e g t .
Es s e i denn, es müssen mehrere Aus-
prägungen in ein I n t e r v a l l g e l e g t werden, um d i e an d i e E^
gestellte
derung b z g l . der hinreichenden Bedingung, d i e f ü r d i e Approximation
For-
benötigt
w i r d , e i n h a l t e n zu können; es s e i g e n e r e l l auch auf Aufgabe 6.9 h i n g e w i e s e n .
Für die zufällige Reichweite X einer Tankflillung des Autotyps MERCADOR liegen η = · 8 1 Beobachtungen
vor. Zum Niveau a = 0.05 soll die Hypo
these H q :x1,...,x81
sind Realisationen der N(400,132.25)-verteilten
Reichweite X gegen die Alternative Η, : x , . . ,x 0 . sind Realisationen der nicht 1 1 ο1
N(400,132.25)-verteilten
Reichweite X 2 mit Hilfe des χ
- A n p a s s u n g s t e s t s getestet werden. Mit der bereits in der
Aufgabenstellung angegebenen Intervalleinteilung lassen sich die noch durch-
Kapitel 7: Anpassungs tests und graphische Verfahren
193
zuführenden S c h r i t t e 2 - 4 sehr einfach in Form einer A r b e i t s t a b e l l e , v g l . Cab.C7.1.1, angeben. Dabei wird zunächst die Anzahl CK der Meßwerte bestimmt, die im i - ten I n t e r v a l l liegen. Es g i l t natürlich k 5 l 0.= I 0. = η = 81 i=1 1 i=1 1
.
Die weiterhin benötigten Wahrscheinlichkeiten p . , i = 1 , . . . , k , ergeben sich 0 aus den Verteilungsfunktionswerten FA„ ( a . ) der N(400,132.25) - Verteilung an J den jeweiligen I n t e r v a l l grenzen durch Standardisierung, denn ( v g l . Aufgabe 4.7) Η
I
3.-400 V 132.25·'
a -400
=φ
11.5
' ' J = 1 '···· 5
wobei Φ die Verteilungsfunktion der Standardnormalverteilung bezeichnet. So ergibt sich etwa p 3 ( s . obige Ausführungen) zu p 3 = P ( 4 0 0 < X < 410 =
φ (
4 ^
.
)
φ (
|Hq)
4 0 0
= F°(410) τ
^ 0
-F°(400)
) = φ ( 0 8 7 )
.
φ ( 0 )
= 0.8078 - 0.5000 = 0.3078
.
Der Wert Ei=81-pi
, i=1,...,5
,
gibt dann die Anzahl der bei Vorliegen dieser Normalverteilung zu erwartenden Beobachtungen im i - ten I n t e r v a l l wieder. Zur Oberprüfung der bisher durchgeführten Rechenschritte l i e g t es nahe, die Summe der erwarteten Anzahlen zu betrachten, für die sich k l Ε. = η = 81 i=1 1
2 2 ergeben muß. Neben diesen Größen sind in Tab. L7.1.1 weiterhin CK und 0-/E-, i = 1 , . . . , 5 , die die Berechnung der Prüfgröße vereinfachen, zusammengestellt. Somit ergibt sich
Χ
=
5
0?
I
Τ
1=1
1
ι
- 81
= 8 2 . 3 4 0 9 - 81
= 1 .3409
.
2 2 Da der zugehörige k r i t i s c h e Wert bei x k _ 1.•]_α = X4.q 95 = 9 · 4 8 8 "· i e 91»
kann
diese Normal Verteilungshypothese zum 5% Niveau nicht verworfen werden, denn
194
Teil I: Übungsaufgaben. Erläuterungen und Lösungen
Cab. C7.1.1: A r b e i t s t a b e l l e ; S c h r i t t 1 - 4 des χ
i
I
i
p
°i
i
Ε . 1
2
-Anpassungstests
ΨΕί
Ο2 1
1
( - » 390]
15
0 1922
15 .5682
225
14.4525
2
(390
400 ]
26
0 3078
24 .9318
676
27.1140
3
(400
410]
25
0 3078
24 .9318
625
25.0684
4
(410
420 ]
10
0 1513
12 .2553
100
8.1597
5
(420
-)
5
0 0409
3 .3129
25
7.5463
81
1 0000
81 .0000
Ϊ
χ 2 = 1.3409 + 9.488 - x j . 0 . 9 5 - x j . ,
82.3409
·
Werden Parameter der hypothetischen Verteilung nicht vorgegeben, sondern aus der Stichprobe geschätzt, so bleibt die Entscheidung näherungsweise korrekt, wenn man die Anzahl der Freiheitsgrade zum kritischen Wert um die Anzahl der geschätzten Parameter reduziert, d.h. H^ zum Niveau α verwirft, wenn 2
>
2
wobei a =Anzahl der aus der Stichprobe geschätzten Parameter von F
0 -
ist; 2
vergleicht man in H^ z.B. die vorliegenden Beobachtungen mit der N(x f s ) Verteilung, so ist a = 2 und χ ,.. . ,x sind zum Niveau α signifikant keine I n 2 2 Ausprägungen einer normalverteilten Zufallsvariablen, wenn χ > χ
LÖSUNG ZU AUFGABE
7.2
In einer Telefonzentrale werden η =190 Z e i t i n t e r v a l l e ä 10 Minuten h i n s i c h t l i c h der z u f ä l l i g eingegangenen Anzahl X von Anrufen beobachtet. Bezeichnet man diese Beobachtungen mit x ^ , . . . » x ^ g g . wobei x^ € { 0 , 1 . . } , i = 1 . . ,190, so s o l l mit H i l f e des χ 2 - Anpassungstests (vgl. Aufgabe 7.1) zum Niveau α = 0.05 Hg : x ^ , . . . » X j g g s i n d R e a l i s a t i o n e n der Po(3) - v e r t e i l t e n Anzahl X von Anrufen gegen
Kapitel 7: Anpassungstests und graphische Verfahren
195
H 1 : x 1 , . . . , x l g o sind Realisationen der nicht Po(3) - verteilten Anzahl X von Anrufen überprüft werden. An der in der Aufgabenstellung gegebenen Tab. 7.2 läßt sich die vorzunehmende Intervalleinteilung in natürlicher Weise ablesen. Außerdem ist dort ebenfalls schon die beobachtete Anzahl der Zeitintervalle 0., i=1,...,6, zusammengestellt. Die Berechnung der in der folgenden Arbeits2
2
tabelle, vgl. Cab, C7.2.1, angegebenen Größen p^, E., CK,
/E^ für i=1,...,6
erfolgt analog zu Aufgabe 7.1. Dabei ist allerdings zu beachten, daß die benötigten Wahrscheinlichkeiten p^,...,pg sich in diesem Fall {X ist diskret verteilt) direkt aus den Einzelwahrscheinlichkeiten der unter der Hypothese Po(3) -verteilten Zufallsvariablen X ermitteln lassen. Da (vgl. Aufgabe 4.4) P(X = k) = £
e~3
, k=0,1,2,...
,
ergibt sich etwa für p^ ,0
,
p, = P{X e (-, 0] I H 0 ) = P(X = 0) = jjy e
J
= 0.0498
oder für p^ 4 p 4 = P(X e (3 ,5] I Hq) = P(X = 4) + P(X = 5) = ^ = 0.2689
5 e~ 3 +
e" 3
.
Damit liegt die zugehörige erwartete Anzahl von Beobachtungen wegen al so bei E i = 190 · P i
, i=1,. ..,6
,
E 1 = 190 · p 1 = 190 · 0.0498 = 9.462 bzw. E 4 = 190 · p 4 = 190 · 0.2689 = 51.091
.
Für die Prüfgröße erhält man nun den Wert
χ
?
=
k 0? 6 0? l γ 1 - η = l - 1 - 190 = 193.6764 - 190 = 3.6764 i=1 i 1=1 L i
d.h. da das zugehörige Quantil der
2
2 - Verteilung bei x^.q g 5 = 11.07 liegt,
kann die obige Nullhypothese zum Niveau 5% nicht verworfen werden: χ 2 = 3.6764 4 ΐ 1 . 0 7 = χ | ; 0 > 9 5
,
= χ2.1;1_α
.
196
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
t a b . C7.2.1: A r b e l t s t a b e l l e , S c h r i t t 1 - 4 des χ
1
I
1
P
°i 0]
•5
E. 1
i
ο
-Anpassungstests
°l' E 1
1
( - »>.
10
0 0498
9.462
100
10.5686
2
(0
2]
75
0 3734
70.946
5625
79.2857
3
(2
3]
45
0 2240
42.560
2025
47.5799
4
(3
5]
50
0 2689
51.091
2500
48.9323
5
(5
10
0 0720
13.680
100
6
(7
7] 0=)
0
0 0119
2.261
0
190
1 0000
190.000
I
7.3099 0 193.6764
Wird der Parameter λ der Po(λ) -Verteilung in H^ erst aus der Stichprobe geschätzt, so kann man die Freiheitsgrade des kritischen Wertes um 1 reduzieren, vgl. auch Aufgabe 7.1, d.h. die Hypothese kann dann zum Niveau α verworfen werden, wenn
LÖSUNG ZU AUFGABE
7.5
2 Neben dem χ -Anpassungstest (vgl. Aufgabe 7.1) liegt im Kolmogoroff - Smirnov - Anpassungstest vor allem bei "kleinen" Stichprobenumfängen eine Möglichkeit zu überprüfen, ob die Beobachtungen χ 1 ,...,x η Realisationen einer Zufallsvariablen mit stetiger Verteilungsfunktion F^ sind, d.h. ob die unbekannte Verteilungsfunktion F^ einer stetigen Zufallsvariablen X mit einer hypothetischen [stetigen] Verteilungsfunktion F^ übereinstimmt. Die Hypothese H 0 : Γ χ (χ) =F°(x)
für alle χ
wird dabei gegen die Alternative Hj :F^(x) ^ F^ (x)
für mindestens ein χ
mittels der Teststatistik D = \Jη D η
mit
D = sup 1 I f" (x) - S (χ) I η Χ η ' x
Kapitel 7: Anpassungs tests und graphische Verfahren
197
getestet, wobei S^(x) die empirische Verteilungsfunktion der beobachteten Werte x, ,... ,x angibt, d.h. 1 η 0 S
η
=
(x)
χχ. - 3
1 Der Wert D
n
für alle j=l,...,n für genau k Beobachtungen j a u s xj ».··/X n
x
χ > χ. - 3
für alle j=l,...,n
gibt gerade den größten vertikalen Abstand zwischen h y p o t h e t i -
scher u n d empirischer Verteilungsfunktion wieder. Zum Niveau CL erfolgt eine Ablehnung der Nullhypothese, falls gilt D >d , - η;1-α
,
wobei die Quantile d . für α = 0.10, 0.05, 0.01 zum Beispiel der C a b . * η;1-α C7.3.1 entnommen werden können.
Cab. C7.3.1: Kritische Werte d^
η d
n ,0 90
d
n ,0 95
d
n ,0 99
für den Kolmogoroff - Smirnov - Anpassungs-
5
8
10
20
40
> 40
1 .14
1.16
1.17
1 .19
1.20
1 23
1 .26
1.28
1.29
1.31
1.33
1 .36
1 .50
1.53
1 .55
1.57
1.59
1 63
Für das zufällige Nettogewicht X von Tüten, die mit Lakritzteufeln
gefüllt
sind, liegen η = 2 0 Stichprobenwerte χ^,.,.,χ^ο vor. Bezeichnet F^ die zu X gehörige, unbekannte Verteilungsfunktion, so soll mit Hilfe des Kolmogoroff Smirnov - Anpassungstests zum Niveau α = 0.05 HQ : F x ( x ) = F ° (x)
für alle χ
H.| : F x ( x ) ^ F ® ( x )
für mindestens ein χ
gegen ,
wobei F^ der Verteilungsfunktion der N(100,16) - Verteilung entspricht, g e testet werden. Um die zugehörige Teststatistik berechnen zu können, müssen zunächst die Werte der empirischen Verteilungsfunktion S, n (x.) sowie die der 1 0 hypothetischen Verteilungsfunktion F x ( x . ) für i=1,...,20 ermittelt werden. Zu diesem Zweck wird eine Arbeitstabelle angelegt, vgl. C a b . C 7 . 3 . 2 , in der
198
Teil I: Übungsaufgaben,
Erläuterungen
und
Losungen
die verschiedenen Beobachtungswerte der Größe nach geordnet eingetragen werden. Aus den l i n k s von dieser Zahlenreihe stehenden zugehörigen Indizes i = 1 , . . . , 2 0 lassen sich dann die Werte ^20^ x i^ = lTiJ
x
i -xj
9 e n a u k Beobachtungen x^ aus x,|,...,x,,g
ablesen. So ergibt sich zum Beispiel für χ =94 s
2 o
( 9 4 ) =
! r
0
·
4 0
-
denn genau 8 der 20 Beobachtungswerte sind kleiner oder gleich 94,bzw. für χ = 102 erhält man 5^(102) = ^ = 0 . 8 5 bei 17 beobachteten Werten, die kleiner oder gleich 102 sind. Die entsprechenden Werte der Verteilungsfunktion der N(100,16) - Verteilung sind dann mittels Standardisierung gegeben durch 0
fx,-100"
wobei Φ die Verteilungsfunktion der N(0,1) - Verteilung bezeichnet. Auf diese Weise ergibt sich dann zum Beispiel F°(94) = φ ( Μ - 4 " 0 > φ(- 1 .50) = 0.0668 oder Fg(102) = Φ ( 1 0 2 4 1 °°) =Φ(0.5) - 0.6915
täh£7.3.2:
Arbeitstabelle zum Kolmogoroff - Smirnov - Anpassungstest
i
Vxi>
91 93 94 96 99 100 101 102 104 105 109
0.05 0.20 0.40 0.45 0.55 0.70 0.75 0.85 0.90 0.95 1.00
x
7 1,16,19 2,5,10,20 11 4,12 8,9,15 14 3,17 18 6 13
.
x. - 100 ι -2.25 -1.75 -1.50 -1.00 -0.25 0 0.25 0.50 1.00 1.25 2.25
x. - 1001
ι
w
-
· 0.0122 0.0401 0.0668 0.1587 0.4013 0.5000 0.5987 0.6915 0.8413 0.8944 0.9878
Ά
Kapitel 7: Anpassungstests und graphische Verfahren
199
Aus Abb. C7.3.1, in der Fjj(x) und S 2 Q ( x ) mit Hilfe der Werte aus Tab. L7.3.2 eingezeichnet sind, läßt sich nun der größte vertikale Abstand D^Q zwischen diesen beiden Funktionen ermitteln. Es ergibt sich D 2 q = sup |F°(x) - S 2 0 ( x ) | = | F ° ( 9 4 ) - S 2 0 ( 9 4 ) | = |0.0668 - 0.401 = 0.3332
.
Abb. C7.3.1: Empirische Verteilungsfunktion S 2 g(x) und Verteilungsfunktion F°(x) der N(100,16)-Verteilung
Damit hat die Prüfgröße D einen Wert von D = vTZÜ- D 2 0 = \/TÜ· 0.3332 = 1 .4901
.
Vergleicht raan nun D mit dem zugehörigen kritischen Wert aus Tab. L7.3.1 d
n;1^
= d
20;0.95
=
U 3 1
'
50 e r g i b t
sich
»
da
D = 1 .4901 > 1.31 = d, n n Q , = d , 20 ;0.95 n;1-a daß diese Normal Verteilungshypothese Hg zum Niveau α = 0.05 verworfen werden muß. Der Geschäftsführer wird nach den von ihm aufgestellten Bedingungen
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
200
die Abfüllanlage nicht kaufen.
Werden die Parameter der hypothetischen Verteilung F^ erst aus der Stichprobe geschätzt, so ist obiges Vorgehen konservativ, d.h. grob gesprochen, es wird länger an der Nullhypothese festgehalten als angebracht [auf diesen Fall zugeschnittene kritische Werte sind für Tests auf Normalverteilung und Exponentialverteilung in entsprechender Literatur vertafelt].
LÖSUNG ZU AUFGABE 7 A Als graphisches Verfahren zur Überprüfung einer Verteilungsannahme bzgl. einer Zufallsvariablen X, für die Realisationen χ ,...,x vorliegen, wird häufig der sogenannte Quantile - Quantile - Plot (kurz: Q - Q - Plot) verwandt. Für die der Größe nach (vom kleinsten zum größten) geordneten Beobachtungswerte x,..,...,x, . gilt nun, daß der i - te Wert x,.. dem empirischen r (1) (n) (i) i/(n+l) -Quantil für i=l,... ,n entspricht. Damit ist also x. .. =x... i/(n+l) (i) ein Schätzwert für das theoretische Quantil 5jy(n+jj ' ί=1ι···/η» der vermuteten zugrundeliegenden Verteilung (vgl. Aufgabe 3.8, 5.1). Als Q - Q - Plot wird dann ein Koordinatensystem bezeichnet, in dem die empirischen Quantile gegen die theoretischen, d.h. die unter der Verteilungsannahme zu erwartenden , Quantile abgetragen werden. Trifft die Verteilungsannahme zu, so müssen die Punkte (ξ. , χ,.,), i=l,...,n, annähernd auf einer Ursprungsgeraden 1 / (n+1) (i) mit Steigung 1 liegen. -»(a) Anhand der η = 19 Beobachtungswerte
s o l l mittels eines Q -
Q - Plots überprüft werden, ob die Tageseinnahme
X des Einzelhändlers Ν( 1500,
10000) - v e r t e i l t i s t . Dies entspricht natürlich einer Prüfung auf N(0,1) Verteilung bei standardisierten Beobachtungen (x^ - 1500)/100 , . . . , ( x ^ g - 1500)/100. Geht man von den der Größe nach geordneten Tageseinnahmen x^j,... ( x ^ j - 1500)/100
über zu den entsprechenden standardisierten Werten ^ x (19) " 1 500)/100, so müssen diese empirischen Quan-
t i l e a l s o mit den theoretischen Quantilen u ^ o » . . . >u^g/20
c er
'
Standard-
normalverteilung, die im Tabellenanhang zu finden sind, verglichen werden. Mit den in Cab. £7.4.1 zusammengestellten empirischen und theoretischen Quantilen (für 1=5,7,9,11,13,15 bene
wurde die ebenfalls im Anhang angege-
Approximationsformel von Hastings zur Bestimmung von u ^ g
zogen) l ä ß t sich der in Abb.C7.4.1 dargestellte wurde neben den Punkten ( u i / 2 0 ' ^ x ( i ) "
herange-
Q - Q - P l o t zeichnen. Dabei
/lt>0), i=1
19, auch die Ur-
201
Kapitel 7: Anpassungstests und graphische Verfahren
sprungsgerade mit Steigung 1 eingetragen. tah. C7.4.1: Tageseinnahmen
standardisierte Tageseinnahmen
(x^.j - 1500)/100 sowie Quantile u i / 2 Q der N(0,1) - Verteilung für i = 1 , . . . ,19 i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
X
( x ( i ) - 1500)/100
(i)
1330 1350 1380 1400 1430 1470 1480 1510 1520 1530 1530 1540 1580 1590 1610 1630 1640 1700 1720
U
i/20
-1.6449 -1.2816 -1.0364 -0.8416 -0.6742 -0.5244 -0.3849 -0.2533 -0.1254 0.0000 0.1254 0.2533 0.3849 0.5244 0.6742 0.8416 1.0364 1.2816 1.6449
-1.7 -1.5 -1.2 -1.0 -0.7 -0.3 -0.2 0.1 0.2 0.3 0.3 0.4 0.8 0.9 1.1 1.3 1.4 2.0 2.2
Aus Abb. L7.4.1 wird e r s i c h t l i c h , daß eine Abweichung der Verteilung der Tageseinnahmen von der N(1500,10000) -Verteilung zu verzeichnen i s t .
-(b)
Wird e i n Q - Q - P l o t zur graphischen Überprüfung e i n e r
Verteilungsan-
nahme verwendet, wobei d i e Größe der Parameter d i e s e r V e r t e i l u n g bekannt i s t ,
nicht
so können d i e s e unbekannten Parameter durch s i c h aus der
Stich-
probe ergebende Schätzwerte e r s e t z t werden.
Um mit Hilfe eines Q - Q - P l o t s zu prüfen, ob die beobachteten Tageseinnahmen Realisationen einer normal verteil ten Zufallsvariablen sind mit Mittelwert x
=
1
19
T¥ J
x
i
=
1
W*
28940
=
1523
·16
und Standardabweichung
s = Jjg ^
χ2-19χ2) =
(44307400 -44080311 .33) = 112.32
,
202
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
Abh. C7.4.1: Q - Q - P l o t für die Einnahmen an η = 19 Tagen zum Vergleich mit der N( 1500,10000) - Verteilung
geht man analog zum Aufgabenteil (a) vor. Die in Cab.C7.4.2 zusammengestellten Größen sind nur in soweit gegenüber den Werten aus Tab. L7.4.1 verändert, a l s daß nun die standardisierten , geordneten Beobachtungswerte ( x ^ j - 1523.16)/112.32, i = 1 , . . . , 1 9 , benötigt werden. Abb. C7.4.2 zeigt den zugehörigen Q - Q - P l o t , der sich aus den Punkten (u^ygg.fx^.j-1523.16)/1 12.32) i = 1 , . . . , 1 9 , und der Ursprungsgeraden mit der Steigung 1 zusammensetzt. Die eingezeichneten Punkte zeigen im Vergleich zu Abb. L7.4.1 nur eine geringe Abweichung von der Geraden. Während die dort zu erkennende Punkte - Gerade nahezu parallel zur Ursprungsgeraden verläuft, wurde jetzt durch die Erhöhung des Mittelwertes diese Punkte - Gerade zur Ursprungsgeraden hin verschoben. Damit sind also keine oder nur noch geringe Abweichungen der Daten von einer N(1523.16,112.32^) - Verteilung auszumachen.
Kapitel 7. Anpassungstests und graphische
t a b . C 7 . 4 . 2 : Tageseinnahmen x ^ y
standardisierte
( x ( i ) - 1523.16)/112.32 teilung, vgl.
i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
X
(i)
1330 1350 1380 1400 1430 1470 1480 1510 1520 1530 1530 1540 1580 1590 1610 1630 1640 1700 1720
Tab.
203
Tageseinnahmen
sowie Q u a n t i l e u i / 2 Q
der N ( 0 , 1 ) - V e r -
L7.4.1
( x ( i ) - 1523.16)/112.32 -1.7197 -1.5417 -1.2746 -1.0965 -0.8294 -0.4733 -0.3843 -0.1172 -0.0281 0.0609 0.0609 0.1499 0.5061 0.5951 0.7731 0.9512 1.0402 1.5744 1.7525
Verfahren
U
i/20
-1.6449 -1.2816 -1.0364 -0.8416 -0.6742 -0.5244 -0.3849 -0.2533 -0.1254 0.0000 0.1254 0.2533 0.3849 0.5244 0.6742 0.8416 1.0364 1.2816 1.6449
A b b - C 7 . 4 . 2 : Q - Q - P l o t f ü r d i e Einnahmen an η = 19 Tagen zum V e r g l e i c h d e r N( 1523.16,112.32 2 ) - V e r t e i l u n g
mit
204
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
LÖSUNG ZU AUFGABE
7,5
->(a) Um f e s t z u s t e l l e n , ob Beobachtungen χ
, . . . ,x
"
als Realisationen
0
einer
s t e t i g e n Z u f a l l s v a r i a b l e n X mit V e r t e i l u n g s f u n k t i o n F^ anzusehen s i n d , kann man s i c h anschauen, wie groß d i e Abweichungen der empirischen
Verteilungs-
f u n k t i o n von d i e s e r V e r t e i l u n g s f u n k t i o n F^ s i n d ( v g l . Aufgabe 7 . 3 ) .
Als
w e i t e r e M ö g l i c h k e i t b i e t e t es 0 s i c h aber auch an, d i e empirische D i c h t e mit der entsprechenden D i c h t e f Χ
1"·"
teilt
Χ
η
in
k
zu v e r g l e i c h e n . Werden d i e η Beobachtungen
I n t e r v a l l e K1 = ( a Q , a 1 ] , K2 =
,a2] , . . . ,
= (a
,a f c ]
einge-
mit ajj ^ - » , a^^+oo, so h e i ß t dabei d i e Funktion n(a. - a. f
(x)
ι
=
l-l
)
f ü r a. < χ < a. i-1 - i
,
i=l,...,k
wobei n^ d i e Anzahl der Beobachtungswerte aus der Reihe χ ^ , - . - , χ ^ d i e im I n t e r v a l l
i=l,...,ki
angibt,
l i e g e n , empirische D i c h t e . Bei e i n e r
gra-
phischen D a r s t e l l u n g der empirischen D i c h t e , dem sogenannten Histogramm, w i r d a l s o i n einem Koordinatensystem über jedem I n t e r v a l l K^ e i n Rechteck e i n g e z e i c h n e t , dessen Fläche der r e l a t i v e n H ä u f i g k e i t n . / n , i = l , . . . , k , 1
0
ent-
s p r i c h t . Z e i c h n e t man nun Histogramm und h y p o t h e t i s c h e D i c h t e f ^ gemeinsam i n ein B i l d , so werden grobe Abweichungen schon d e u t l i c h .
Die aus den Beobachtungen
der Reichweite einer Tankfüllung von
η =81 PKW bei gegebener I n t e r v a l l e i n t e i l u n g ^ = ( 3 7 0 , 3 9 0 ] , . . . , K £ = (420,430] zu berechnende empirische Dichte fg^(x) s o l l mit der Dichte (x - 4 0 0 ) 2 f x °(x) -
1
v ^ F -11.5
der N(400,132.25) - Verteilung ( v g l . Aufgabe 4 . 7 ) , die der Reichweite X unters t e l l t wird, graphisch verglichen werden. In Cab. C7.5.1 sind einige H i l f s g r ö ß e n , die die graphische Darstellung von fg^(x) e r l e i c h t e r n , zusammengestellt. Aus den angegebenen enen Intervallen erhäl erhält "i-r
,5. Für i = 3 i s t etwa
a i - a i _ 1 = a 3 - a 2 =410 - 4 0 0 = 10 Anschließend muß die Anzahl n^ der ßeobachtungswerte, die im I n t e r v a l l K^ l i e g e n , f ü r i = 1 , . . . , 5 bestimmt werden. Diese wurden bereits in Aufgabe 7.1 ermittelt (dort a l l e r d i n g s mit
bezeichnet), v g l . Tab. L7.1.1. Damit
205
Kapitel 7: Anpassungs tests und graphische Verfahren
lassen sich dann die Werte der empirischen Dichte an den Endpunkten der Intervalle angeben mit n. f
81
(a
i
}
=
8l{a. - a i _ 1 J
·
So erhält man zum Beispiel für i = 3 f81(a3)
=f81(410)
=
^
= 0.0309
.
E a b . 7*5.1: Arbeitstabelle zur Erstellung eines Histogramms
i
K.=(a._ra.]
a. - a. , ^ 1-1
η. 1
1
(370,390]
20
15
0.0093
2
(390,400]
10
26
0.0321
3
(400,410]
10
25
0.0309
4
(410,420]
10
10
0.0123
5
(420,430]
10
5
0.0062
A b b . £.7*5*1 zeigt nun das Histogramm, d.h. den Graph der Funktion fgj(x) (über jedem Intervall
K. wird ein Rechteck der Höhe f0..(a·) eingezeichnet), 1 ι ο im Vergleich zur theoretisch angenommenen Dichte f^tx), die den Beobachtungen
unterstellt wird.
->(b) A l s graphisches Verfahren zur Überprüfung e i n e r Verteilungsannahme in diesem Zusammenhang das Wurzeldiagramm
(Rootogram) b e s s e r g e e i g n e t ,
sen Ausgangsposition n i c h t das Histogramm s e l b s t i s t ,
ist des-
sondern ein n i c h t -
n o r m i e r t e s Histogramm, b e i dem d i e Größe der R e c h t e c k s f l ä c h e über dem I n t e r v a l l K^ gerade der absoluten H ä u f i g k e i t n . , i = l , . . . , k r
e n t s p r i c h t . Die Höhe
r . d i e s e s Rechtecks i s t dann n a t ü r l i c h ι η.
Das z u g e h ö r i g e Wurzeldiagramm e r g i b t sich nun, wenn d i e Höhen der Rechtecksf l ä c h e n über den I n t e r v a l l e n K^ , . . .
g l e i c h \/ r^
\/ r^ g e s e t z t werden.
Bei e i n e r Anpassung der Beobachtungswerte an d i e s t e t i g e V e r t e i l u n g Z u f a l l s v a r i a b l e n X mit Dichte f ^
einer
(bzw. V e r t e i l u n g s f u n k t i o n F^) wird d i e s e s
Wurzeldiagramm mit dem Graph der Funktion
206
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
g(x) = J n *f°(x) verglichen. Dieser Vergleich läuft über die sogenannten Wurzeldiagramm Residuen
für i=l,... ,k mit
i η ( 0, , 0, Λ r. = = F (a.) - F (a. . ι a.-a. . a . - a . . N\ Χ ι X i-1 / ι l-l ι l-l ' wobei n^ die unter der Verteilungsannahme (Verteilungsfunktion F^) zu erwartende Anzahl von Beobachtungen im Intervall K^, i=l,...,k, bezeichnet. Liegt ein Wurzeldiagramm - Residuum außerhalb des Intervalls
h V ^ i - i
' 1=1
^V^-'i-i]
k
'
so kann man davon ausgehen, daß in diesem Intervall keine "gute" Anpassung an die zugrundegelegte Verteilung vorliegt. Die graphische Repräsentation erfolgt nun in der Art, daß zunächst die Funktion g(x) an der Abszisse gespiegelt in ein Koordinatensystem eingezeichnet wird. Die Rechtecke des Wurzeldiagramms werden ebenfalls an dieser Achse gespiegelt (aufgehängtes Wurzeldiagramm) und zusätzlich noch um den Wert des zugehörigen Residuums nach unten bzw. nach oben verschoben. Dabei führt ein negativer Wert des Wurzeldiagramm - Residuums zu einer Verschiebung nach unten, umgekehrt ein positiver Wert zu einer Verschiebung nach oben. Vielfach werden auch die Residuen in einer weiteren Abbildung noch einmal separat dargestellt. Gleichzeitig wird dort dann über jedem Intervall K, je eine waagerechte Linie auf der Höhe 1 / ^ a ^ - a . ^ und
^ eingetragen,
um extrem große Residuen direkt erkennen zu können. Um mit Hilfe eines Rootograms
zu überprüfen, ob die Beobachtungen χ ,... ,>
2
Realisationen einer Ν(μ,σ ) -verteilten Zufallsvariablen sind, müssen zunächst, wie oben beschrieben, die Höhen ^ r
^ r ^ der Rechtecksflächen
über den vorher festgelegten Intervallen K ^ , . . . b e s t i m m t werden. Die Funktion g(x) erhält man in diesem Fall durch (vgl. Aufgabe 4.7) (χ - μ) 2
- -/HM
2σ 2 \j 2ir
Kapitel 7: Anpassungstests und graphische Verfahren
207
und d e r zur Bestimmung des Wurzeldiagramm - Residuums RR^ f ü r i = l , . . . ,k b e nötigte
Wert r ^ e r g i b t s i c h aus
r
i
=
ai-ai_
1
(
φ
(
σ
L i e g e n k e i n e Angaben über μ. und σ 2
)
2
" ®(
σ
vor,
))
so können d i e s e durch i h r e
w e r t e χ und s , d i e aus den Beobachtungswerten b e r e c h n e t werden gabe 5 . 1 ) ,
ersetzt
Schätz-
(vgl.
Auf-
werden.
Anhand der Beobachtungswerte
soll mit Hilfe eines Rootograms ge-
prüft werden, ob die Reichweite einer Tankflillung N(400,132.25) - v e r t e i l t i s t . In Cab. C7.5.2 sind einige Hilfsgrößen zur Erstellung des Wurzeldiagramms sowie zur Bestimmung der Wurzel diagramm - Residuen zusammengestellt. Aus den gegebenen Intervallen K 1 =(370,390], K 2 = (390,400] erhält man zunächst die benötigten Intervall breiten
K g = (420,430] i = 1 , . . . , 5 . An-
schließend wird die Anzahl n^ der Beobachtungswerte, die im Intervall K^, i = 1 , . . . , 5 , liegen, bestimmt, vgl. auch Aufgabenteil ( a ) , Tab. L7.5.1. Im nächsten Schritt muß dann für i = 1 , . . . , 5 die Rechteckshöhe r^ im n i c h t normierten Histogramn bzw. V~rT im Wurzel diagramm berechnet werden. I s t etwa i = 3 , so ergibt sich r
=
3
ä ^
=
l!l·2·50
bzw
-
1.5811
.
Zum Schluß benötigt man noch die unter Normal Verteilung erwartete Rechteckshöhe r . bzw. \/~rT. Dabei i s t für i =3 ?
81
=
/ /a3 - 4 0 0 \
81 ( (410 - 400\ TT V*\ 11.5 ) -
a/
a
2 -
400
\\
M 0 0 - 400Y\ 11.5 ))
= 8.1 ( Φ(0.87) - φ (0)) = 8.1 (0.8078 - 0.5000) = 2.4932 bzw.
= / 2.4932 = 1 .5790
.
Somit lassen sich dann die Wurzeldiagramm - Residuen RR^,...,RR^ mit RR.. = \[~r7 -
bestimmen und man erhält für i =3
RR3 = f r ^ - J V 3 = 1 .5811 - 1 .5790 = 0.0021
.
208
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
tah. C7.5.2: Arbeitstabelle zur Erstellung des Wurzeldiagramms bzw. zur Bestimmung der Wurzel diagranm - Residuen
i
K
i
a.-a. , ι 1-1
η. 1
r. 1
r. 1
fr
/
1
1
(370,390]
20
15
0.75
0 .8660
0 .7602
0 .8719
-0.0059
2
(390,400]
10
26
2.60
1 .6125
2 .4932
1 .5790
0.0335
3
(400,410]
10
25
2.50
1 5811
2 .4932
1.5790
0.0021
4
(410,420]
10
10
1.00
1 0000
1.2255
1 .1070
-0.1070
5
(420,430]
10
5
0.50
0 7071
0 .2948
0 .5430
0.1641
In Abb. £7.5.2 sind das aufgehängte Wurzeldiagramm (die Rechtecke der Höhe ν Ί " 7 werden jeweils um die Werte RR. = \] r. - \Z~rT, i = 1 , . . . , 5 , verschoben) ι " 1 1 1 und die Vergleichskurve
=
ν
/
η , J x - 400\ T O ("71757
=
/
/
81 1 e 113·^=
(x - 400) 2
graphisch veranschaulicht. Aus den in Äbb. C7.5.3 abgetragenen Residuen, die im Vergleich zu den ebenfalls dort eingezeichneten Linien / y a 1 - a Q = 1 / V ^ J = 0.2236 , -1 / ^
- a Q = -1 /
= -0.2236
bzw. 1 / / a i - a . _ 1 = 1 / νΠΊΓ = 0.3162
,
-1 / y a i - a i _ 1 = -1 / νΠΓΟ" = -0.3162
,
i=2,...,5
,
zu sehen sind, wird e r s i c h t l i c h , daß die Anpassung an die Normal Verteilung r e l a t i v gut i s t .
Kapitel 7: Anpassungstests und graphische Verfahren
209
Abb. C7.5.1: Histogramm der Beobachtungswerte und Dichte f3(x) der A Ν(400,132.25} - Verteilung
370
390
«0
MO
420
430 X
V
/
Ahh_ C7.5.2: Aufgehängtes Wurzeldiagramm und zugehörige Funktion g(x) für die Reichweiten einer Tankfüllung von η = 81 PKW
210
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
370
390
WO
10
U 20
430
Abb. C 7 . 5 . 3 : Wurzeldiagramm - Residuen RR. und G r e n z l i n i e n ± 1 / V a^ i=1 5
a j ,
Kapitel 8: Parametrische Vergleiche im Zweistichprobenfall AUFGABE 8.1 In einer Molkerei wird an zwei Maschinen Vollmilch in Litertüten abgefüllt. An den beiden Abfüllanlagen wurden Stichproben vom Umfang η·, = 7 bzw. n 2 = 9 genommen, um die tatsächlich abgefüllte Ml Ichmenge pro Tüte zu überprüfen, vgl. tab. β.ι. Den Abfüllmengen sollen jeweils normalvertellte Zufallsgrössen zugrundeliegend wobei die Standardabweichungen der Anlagen vom Hersteller mit o ^ o . O l C K und a ^ o . o i S i angegeben werden. Cah. 8.1: Meßergebnisse (in l) bei der Oberprüfung zweier Abfüllanlagen
Tüte i
Anlage 1 x
1i
Anlage 2 x
2i
1
0.98
1.02
2
0.96
1.04
3
1.02
0.98
4
1.01
0.97
5
0.98
1.03
6
0.98
1.00
7
1.00
1.02
8
1.04
9
0.99
(a) Welche Breite besitzt das 0.95 - Konfldenzlntervall für die Differenz der durchschnittlichen Abfüllmengen an den beiden Anlagen ? (b) Liegen zum 5% Niveau signifikante Unterschiede zwischen den durchschnittlichen Abfüllmengen v o r ?
212
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
AUFGABE 8.2 Die in Aufgabe 8.1 vorgestellte Molkerei erhalt einen neuen Direktor, der die Studie über den Vergleich der durchschnittlich abgefüllten Milchmengen an den beiden Anlagen wiederholen möchte, Dabei will er den Stichprobenumfang η (für beide Anlagen) so festlegen, dass das Konfidenzintervall zum 95% Niveau für die Differenz der durchschnittlichen Abfüllmengen nicht breiter als b = 0 . 0 2 wird. Wie gross muss η (bei sonst gleichen Annahmen wie in Aufgabe 8.1) gewählt werden?
AUFGABE 8.5 Bei einer Untersuchung über das monatliche Bruttoeinkommen von Industriearbeltern einer Branche wird vermutet, dass der durchschnittliche Bruttoverdienst in Baden - Württemberg um mehr als 100 DM pro Monat höher ist als in Niedersachsen. Eine Stichprobe von je 41 Arbeitern ergab in Baden - Württemberg ein durchschnittliches Monatseinkommen in Höhe von x 1 = 3 D 2 5 DM bei einer Varianz von s 2 = 41068 DM 2 bzw. in Niedersachsen von x 2 = 2846 DM mit s 2 = 39236 DM 2 . Es soll angenommen werden, dass die Bruttoverdienste der Industriearbeiter normalverteilt sind und Gleichheit der (theoretischen) Varianzen vorliegt. (a) Bestimmen Sie ein 90% - Konfidenzintervall für die Differenz der Durchschnittseinkommen in den beiden Bundeslandern. (b) Lasst sich die in der Aufgabenstellung geäusserte Vermutung mit einer Irrtumswahrscheinlichkeit von 5% absichern? (c) Wie gross hätte der Stichprobenumfang n 1 = n 2 = n sein müssen, um mit dem unter (b) durchgeführten Test zum Niveau α =0,05 die Wahrscheinlichkeit e = 0 . 1 für den Fehler 2, Art, falls die betrachtete Differenz tatsächlich grösser als 150 DM 1st, abzusichern? Gehen Sie hier davon aus, dass die Varianzen der monatlichen Bruttoeinkommen gleich sind und ausserdem σ ι = σ 2 = 40000 DM 2 gilt.
Kapitel 8: Parametrische Vergleiche im Zweistichprobenfall
213
AUFGABE 8.4 Ein Versandhaus will die im Laufe eines Jahres aus zwei verschiedenen Regionen eingegangenen Bestellungen untersuchen. Bei zufälligen Stichproben von n., =12 Kunden in der ersten Region und von n 2 = 16 Kunden in der zweiten Region wurden die in cab. 8.4 angegebenen Jahresbestellsummen festgestellt. Cab. 8-4: Bestellsummen (in DM) von n 1 = 12 Kunden bzw. n £ = 16 Kunden zweier verschiedener
Regionen
Kunde i
Region 1
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
231 250 246 233 257 251 263 260 252 266 248 237
x
1i
Region 2 x
2i
228 256 272 230 243 258 271 280 221 233 274 279 253 251 248 243
Die beobachteten Werte sind als Realisationen zweier unabhängig normalvertellter Zufallsgrössen anzunehmen. (a) Berechnen Sie ein Konfidenzlntervall zum 90% Niveau für die Differenz der durchschnittlichen jahrlichen Bestellsummen in den beiden Regionen. (b) Ist die durchschnittliche Bestell summe In der 1. Region signifikant kleiner als In der 2. Region? Testen Sie zum 5% Niveau.
AUFAGBE 8.5 Für die Varianzen der unabhängigen, normalvertellten Bruttomonatsverdlenste X 1 und X 2 von Industriearbeltern einer Branche
214
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
in Baden - Württemberg und Niedersachsen wurde in Aufgabe 8.3 Gleichheit der Varianzen vorausgesetzt. Prüfen Sie zum 5% Niveau mit Hilfe der dort angegebenen Stichprobenergebnisse diese Hypothese.
AUFGABE 8.6 In einer Betriebsabteilung, in der in Akkordarbelt elektronische Bauteile zusammengesetzt werden, soll untersucht werden, ob durch eine Senkung der Raumtemperatur um 2°C eine Stelgerung der Produktivität erreicht werden kann. Bei 8 ausgewählten Arbeltern wurden vor und nach der Temperaturherabsetzung die gefertigten Stückzahlen an einem Tag festgehalten, vgl. cab. 8.6 . Es soll Normalverteilung vorausgesetzt werden. tab. 8.6: Produzierte Stückzahlen x^- und
» i = U - - - > 8 , vor und nach der
Senkung der Raumtemperatur Arbeiter i x
1i
x
2i
1
2
3
4
5
6
7
8
236
258
225
244
239
256
224
262
230
261
230
251
230
254
228
258
(a) Berechnen Sie die paarweisen Differenzen der Beobachtungswerte. (b) Bestimmen Sie ein 0.95 - Konfidenzintervall für die Differenz der durchschnittlichen Stückzahlen, wenn Sie davon ausgehen können, dass die Varianz der gepaarten Differenzen bekannt ist mit 36. (c) Kann die Hypothese, dass vor und nach der Herabsetzung der Temperatur durchschnittlich gleichviel produziert wurde, zum Niveau 0.10 verworfen werden? Es werde wiederum vorausgesetzt, dass V F 3 6 gilt.
Kapitel 8: Parametrische Vergleiche im Zweistichprobenfall
215
AUFGABE 8.7 Auf einer landwirtschaftlichen Versuchsanlage werden zufallig 10 Felder ausgewählt, um ein neues Düngemittel für den Kartoffelanbau zu testen. Nachdem jedes Versuchsfeld halbiert wurde, wird in der ersten Hälfte das herkömmliche Düngemittel und in der zweiten Hälfte das neue Mittel eingesetzt. Die Jeweiligen Ernteerträge, die in cat. 8.7 zusammengestellt sind, sollen als Realisationen normalverteilter Zufallsvariablen X·, und X 2 angesehen werden. 2
Cab- 8.7: Ernteerträge x ^
und x^^, i=1,...,10
, in kg / m
von 10 Versuchs-
feldern nach Einsatz von zwei verschiedenen Düngemitteln Feld i x
1i
X
2i
1
2
3
4
5
6
7
8
9
10
7.1
6.4
6.8
8.8
7.2
9.1
7.4
5.2
5.1
5.9
7.3
5.1
8.6
9.8
7.9
8.0
9.2
8.5
6.4
7.2
(a) Bestimmen Sie ein Konfidenzintervall zum Niveau 0.90 für die Differenz der durchschnittlichen Ernteerträge nach dem Einsatz der beiden Düngemittel. (b) Wurden die durchschnittlichen Ernteerträge bei einer Irrtumswahrscheinlichkeit von 0.05 durch das zweite, neue Düngemittel signifikant gegenüber dem herkömmlichen Düngemittel gesteigert ?
AUFGABE 8.8 Prüfen Sie mit Hilfe der Daten aus Aufgabe 8.7, ob die Varianz Op der Differenz D = X 1 - X 2 der Ernteerträge zum 1% Niveau signifikant kleiner als 2 ist.
AUFGABE 8.9 Ein Grosshandelsunternehmen für Glas- und Geschenkartikel be-
216
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
zieht seine Kristallglaslieferungen Uber zwei verschiedene Speditionen. Bei einer stichprobenartigen Oberprüfung der Lieferungen stellt das Unternehmen fest, dass bei 200 Kartons, die mit der Spedition ADLER angeliefert worden waren, 18 wegen Glasbruches reklamiert werden mussten, und bei 160 Kartons, die die Spedition ALBATROSS befördert hatte, 12 Glasbruchreklamationen zu verzeichnen waren. Testen Sie zum Niveau α = 0 . 1 0 die Hypothese, dass die beiden Speditionen "mit gleicher Sorgfalt" ihre Lieferungen befördern.
AUFGABE 8.10 Für das Toilettenpapier KISS wurde vom neuen Leiter der Marketingabteilung des Herstellers eine zweite Umfrage in Auftrag gegeben. Von 100 zufallig ausgewählten Personen gaben nach der Benutzung einiger Proberollen 46 zur Kenntnis, dass sie KISS regelmassig kaufen würden, 40 sagten, sie würden sich nur in unregelmassigen Abstanden beim Kauf für KISS entscheiden, und m der Befragten lehnten das neue Toilettenpapier ganz entschieden ab. Ist dieses Umfrageergebnis nun zum Niveau 10% signifikant verschieden von dem in Aufgabe 5.8 geschilderten Ergebnis der ersten Marktuntersuchung oder sind die Unterschiede lediglich durch 'Zufall' zu erklären?
Kapitel 8: Parametrische Vergleiche im Zweistichprobenfall
LÖSUNG
ZU A U F G A B E
217
8.1
Dieses Kapitel beschäftigt sich mit dem Vergleich von einander entsprechenden Verteilungsparametern zweier Zufallsvariablen X^ und X^. Liegen n^ unabhängix
ge Beobachtungen
j['---'xjn
von
^^
n
2 unabhängige Beobachtungen
x„,,...,x„ von X„ vor, so spricht man in diesem Zusammenhang auch von einem 21 2n 2 2 Zweistichprobenproblem. Weiterhin soll zunächst vorausgesetzt werden, daß Xj und X^
(stochastisch)
unabhängige Zufallsvariablen (vgl. Aufgabe 3.14) sind, wobei X einer 2 2 Ν ί μ ^ σ ) - Verteilung bzw. X^ einer - Verteilung unterliegt. Analog zum Einstichprobenfall lassen sich auch hier erwartungstreue Schätzfunktionen 2 , 2 für die unbekannten Parameter μ^, μ^· ^ und ^ σ^ a n 9 e b e n · A u s vorliegenden Beobachtungswerten ergeben sich als Schätzwerte (vgl. Aufgabe 5.1)
1
"ί - χ. = ~~~ yL χ.. 1 n, , . Ii
. "2 μ =χ =— y χ,. 2 2 n. .'·, 2i
,
K
1 1=1
η 1 ν , - 2 ) (χ -χ ) η -1 Ii 1 1 ι=1
-2 2 Ο ,= s 1 1
,
2 1=1
,
η -2 2 1 r , - ,2 σ =s = ) (χ. . - χ . ) 2 2 η -1 , L , 2ι 2 2 ι=1
Von Interesse sind nun vorrangig Konfidenzintervalle und Testverfahren für die Differenz μ - μ
der Erwartungswerte der beiden Zufallsvariablen sowie 2 2 für den Quotienten ö^ / der Varianzen. Im folgenden wird zunächst der Fall behandelt, daß die Varianzen der beiden
Zufallsvariablen aus langjährigen Erfahrungswerten heraus bekannt sind, d.h. 2 2 2 2 es seien σ^ = und σ^ = bekannt.
Für die an zwei Anlagen in Litertüten abgefüllte Milchmenge X. bzw. X 0 wird 2 2 ) - bzw. Ν(μ 2 ,0.015 ) - v e r t e i l t ist. Aus
angenommen, daß diese Ν(μ 1 ,0.010
den vorliegenden n^ = 7 bzw. η^ = 9 Beobachtungswerten an den beiden Maschinen ergeben sich die -
1
x, = 7
X
2
=
1
?
Durchschnittswerte ?
1
.1
= 7 · 6.93 = 0.99
9
.Σ, x 2i
=
1
ί"
9
·09
=
1
- ( a ) Ein (1-a) - Konfidenzintervall Üj -
der
·01
,
*
(vgl. Aufgabe 5.3) für die Differenz 2 2 Erwartungswerte zweier unabhängiger Ν(μ ,σ - bzw. Ν(μ ,σ ) -
218
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
verteilter Zufallsvariablen Xj und X^ ist bestimmt durch
2
X
/< V
1 -x 2 - V a / 2
ij
τ
2 °2* " ~ / χ, - χ„ + u, . η ' 1 2 l-a/2
Für 1 - a = 0.95, d.h. a/2 = 0.025, ist u.,_ a/2 = u Q
g 7 g
2 '
2 °2*
/V
= 1 .9600 und m i t x 1 = 0 . 9 9 ,
x 2 = 1 . 0 1 , aij* = 0.0001 , σ^* = 0.000225 ergibt
[0.99 - 1.01 - 1 .9600 .
^ ψ Π Έ ^ ψ ϊ ί , ).99 - 1.01
+
1.9600 .
/
™
l+ M
i
^
l
J
= [-0.02 - 0.0123 , - 0 . 0 2 + 0.0123] = [-0.0323 , -0.0077] ein 0.95 - Konfidenzintervall
f ü r die Differenz der durchschnittlichen A b -
füllmengen der beiden Anlagen. Es besitzt eine Breite (vgl. Aufgabe 5.3.b) b = -0.0077 - (-0.0323) = 0.0246
.
-»(b) In Cab. C8.1.1 sind die möglichen Hypothesen über die Differenz μ^ bei vorgegebenem (bekanntem) Wert d zusammengestellt. Da die Varianzen 2
2
und
σ 2 bekannt sind, ergeben sich die ebenfalls dort angegebenen Entscheidungsregeln zum Niveau OL (Zweistichproben - Gauß - Test) über die Prüfgröße
/
"1
+ n
2
denn diese ist im Fall μ^ - μ^ = d gerade die Realisation einer Ν(0,1) - verteilten Zufallsvariablen (vgl. Aufgabe 6.1).
Zum Niveau a = 0.05 soll getestet w e r d e n , ob signifikante Unterschiede zwischen den durchschnittlich abgefüllten Milchmengen vorliegen, d.h. ob die Hypothese H q : p1 = μ 2
«
μ1 - μ 2 = 0
zugunsten der Alternative H^
μ1 f μ 2
«
μ1 - μ 2 f 0
Kapitel 8: Parametrische Vergleiche im Zweistichprobenfall
219
£8.1.1: Tests zum Niveau α für Hypothesen über die Differenz μ. - μ der 2 2 Erwartungswerte zweier unabhängiger Ν(μ^,σ^) - bzw. Νίμ^,^*' " verteilter Zufallsvariablen bei vorgegebenem Wert d
H
H
o
HQ wird zum Niveau α verworfen, falls
1
Uj - μ 2 > d
z>u
Uj - μ 2 > d
^ -μ
Ζ< u α
μ
μ
ΐ"μ2
= ά
2
1 " μ2 ^
< d d
lzl>ul-a/2
verworfen werden kann. Mit den bereits im Aufgabenteil schnittsmengen x 1 = 0 . 9 9 und d = 0,
l-a
(a) ermittelten Durch-
= 1.01 erhält man für die Teststatistik bei
0.0001 , 02* = 0.000225 den Wert 0.99-1.01 Γ2
lüL^Jl
/
n
1
+ n
=
.
3 J 9 0 9
/0.0001 , 0.000225 /ÖTPÜl
?
2
Da das zugehörige Quantil der N(0,1)-Verteilung bei
u
i_ α /2 = u 0 9 7 5 =
1,9600
liegt, muß die Hypothese bei einer Irrtumswahrscheinlichkeit von 0.05 verworfen werden , denn |z| = 3.1909 > 1.9600 = V 9 7 5
LÖSUNG ZU AUFGABE
=
Vci/2
'
8.2
Damit das Konfidenzintervall zum Niveau 1-a für die Differenz μ - μ
2
2
1
2
der Er-
wartungswerte der Ν ί μ ^ σ ^ - bzw. Ν(μ 2 ,σ 2 ) - verteilten Zufallsvariablen Xj und X (vgl. Aufgabe 8.1.a) eine vorgegebene Breite b nicht überschreitet, 2 2 2 2 wobei die Varianzen σ = σ und σ_ = bekannte Größen sind, müssen jeweils 1 1 2. Z* Stichproben vom Umfang 2u
l-a/2
(σ,
gezogen werden (vgl. Aufgabe 5.3.b). (Der Einfachheit halber wurde hier nj = n 2 = η gesetzt.)
220
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
Sind öj und σ^ unbekannt, so ist diese Formel zur Bestimmung des Stichprobenumfanges η noch approximativ richtig, wenn aus Vorstichproben gute Schätzungen für die Varianzen vorliegen.
Das 0 . 9 5 - Konfidenzintervall fur die Differenz μ^ - μ^ der Erwartungswerte der abgefüllten Milchmengen X^ und Xg, für die Normalverteilung mit bekannten Va2
rianzen
2
= 0.0001 und Oj* = 0.000225 vorausgesetzt worden war, v g l . Auf-
gabe 8.1, s o l l höchstens eine Breite b = 0.02 besitzen. Damit diese Forderung eingehalten werden kann, müssen an beiden Anlagen wegen η >
2u
0.975]2 " Ο Γ
2
(0.0001 + 0.000225) =
[^57^°]
• 0.000325 = 12.4852
mindestens 13 Milchtüten z u f ä l l i g ausgewählt werden.
LÖSUNG ZU AUFGABE
8.5
Für das monatliche Bruttoeinkommen X^ bzw. X 2 von Industriearbeitern einer Branche in Baden - Württemberg bzw. Niedersachsen liegen aus beiden Bundesländern jeweils n^ = n ^ =41 Beobachtungswerte v o r , aus denen s i c h die S t i c h probenmi ttelwerte x.j = 3025 DM
,
x 2 = 2846 DM
und die Stichprobenvarianzen s 2 = 41068 DM2
,
= 39236 DM2
ρ berechnen. Es wird angenommen, daß X. einer Ν(μ, ,σ.) - Verteilung und X , einer 2 2 2 Ν(μρ,σ ? ) - Verteilung u n t e r l i e g t mit a . - a ? .
-»(a) Sind zwei Zufallsvariablen X
und X
2
unabhängig normalverteilt mit Er-
2
wartungswert μ^ bzw. μ^ und Varianz Oj bzw. bekannt aber gleich, d.h.
wobei diese Varianzen als un-
vorausgesetzt werden, so ist ein (1 —ot) -
Konfidenzintervall für die Differenz μ^ - μ^ gegeben durch (vgl. Aufgabe 8.1)
1 X
1
X
2
+ t
n 1 +n 2 -2;l-a/2 * S p '
1
Kapitel 8: Parametrische Vergleiche im Zweistichprobenfall
221
Dabei bezeichnen χ^ und x^ die jeweiligen Stichprobenmittelwerte und t
„ das Y - Ov u a n t i l der tn + I 2„ - Verteilung. Mit den Stichprobenvan +n -2;γ i V 2 2 2 rianzen s, und s_ ist s gegeben durch 1 2 ρ 2
100
zu verwerfen. Da die monatlichen Einkommen X^ und X2 als unabhängige normal v e r t e i l t e Zufallsgrößen mit unbekannten, aber gleichen Varianzen angenommen werden können, erhält man mit 5^= 3025 , x 2 = 2846 , s p = 200.3796 , nl=n2=41 d= 100 für die zu verwendende Prüfgröße V
t =
s
p
·
J
V
=
X y
n
i
n n
2 2
3025 - 2846 - 100
=
,
7g51
T / fTpr
on.
200.3796
Da der zugehörige k r i t i s c h e Wert bei t läßt sich wegen
+n
_2-1 -α = ^80-0
liegt,
^ ^
t = 1 .7851 > 1.664 = t Q n . n Q , = t , 80;0.95 n^+nn2-2;1-a die geäußerte Vermutung zum 5% Niveau s i g n i f i k a n t absichern.
-»(c) Sind die Varianzen ö
und a o zweier unabhängiger, normalverteilter Zu2 2 2 fallsvariablen bekannt und gilt σ = σ_ = Ο. (oder liegt aus Vorerhebungen eine 2
gute Schätzung für
1
2
*
vor), so kann man den nötigen Stichprobenumfang n^=n =n
bestimmen, um beim Testen der Differenz μ^ - μ^ der Erwartungswerte dieser Zufallsvariablen die Wahrscheinlichkeit α für den Fehler 1. Art und die Wahr-
Kapitel 8: Parametrische Vergleiche im ZweistichprobenfaU
223
scheinlichkeit Β für den Fehler 2. Art (an einer vorgegebenen Stelle im Alternat! vbereich) nicht zu überschreiten
(vgl. Aufgabe 6.1, Aufgabe 6.2).
Will man bei der einseitigen Hypothese H Q : Uj - μ 2 < d
gegen
(bzw. H q : M j - w 2 > d
Hj: gegen
- μ2 > d HjS μ 1 - μ 2 < d)
die Wahrscheinlichkeit α für einen Fehler 1. Art und gleichzeitig an einer fest gewählten Stelle d^ > d
(bzw. d ^ < d ) die Wahrscheinlichkeit für einen
Fehler 2. Art absichern, so muß
η > 2
'(ui-e
+ u d j
i-ß) -d
, σ
*
gewählt werden. Im zweiseitigen Testproblem V
μ^ - μ 2 = d
gegen
H^ : μ 1 - μ 2 + d
muß gelten
η > 2
d
l"
d
um das Niveau α und die vorgegebene Wahrscheinlichkeit β des Fehlers 2.Art an einer Stelle d^ ^ d einhalten zu können.
Es ist der benötigte Stichprobenumfang η zu bestimmen, so daß beim Testen zum Niveau α = 0.05 von Η Q. μ^ - P2 < 100
gegen
H^
μ1-μ2>100
die Wahrscheinlichkeit β = 0.1 des Fehlers 2. Art an der Stelle 2 2 2
d.=150>100=d
abgesichert wird. Da nach Voraussetzung σ^ = a ^ = 4 0 0 0 0 = σ * , ergibt sich mit u
1-a
= u
0.95
= 1
·6449'
u
1-fTu0.90
=
1
·2816
„ ^ , f(1.6449 + 1 .2816) · y T O U D l 2 η > 2 · ^ 150 - 100 J
=
,,, n , n Q ·0609
274
-
d.h. es müssen jeweils mindestens 275 Industriearbeiter aus den beiden Bundesländern zufällig ausgewählt und nach ihren Bruttomonatslöhnen befragt werden, damit der obige Test in (b) sicherstellt, daß, falls Hg vorliegt, man sich höchstens m i t Wahrscheinlichkeit α = 0 . 0 5 für H^ entscheidet, und daß, falls in Wirklichkeit die wahre Differenz μ^ -
größer als oder gleich
d^ = 1 5 0 ist, man sich höchstens mit Wahrscheinlichkeit β = 0.10 für Hg entscheidet.
224
Teil I: Übungsaufgaben, Erläuterungen und Losungen
LÖSUNG ZU AUFGABE
8.4
Den Bestellsummen X^ und X^ von Kunden i n zwei Regionen w i r d j e w e i l s Normalv e r t e i l u n g mit unbekannten Erwartungswerten μ, und μ 9 sowie e b e n f a l l s unbe2 2 kannten Varianzen σ^ und σ^ u n t e r s t e l l t . Außerdem s e i e n X^ und X^ ( s t o c h a s t i s c h ) unabhängig. Aus den angegebenen n^ = 12 bzw. n £ = 1 6
ßeobachtungswerten
l a s s e n s i c h d i e s e Parameter schätzen durch (vgl. Aufgabe 8.1) n
V
V
^
n
-* 2 2 1 =" s ?
=
1
12
J / l i
X
= 1 ? J / l i
2
,
16
2 i =
v T ·
249.5
[ i
1 6 ^ / 2 1 = ^ ·
=
4040
=
252
'
x
5 i " V ? )
x
1 6 i I= Tc °· I( λ| /χ 2 , ί i -- 16x, · 5368 2 i "- n"oXo 2 * 2 ] I== ΤΊΓ 2 ) = i
π ·
$
*?i"
1 2
·5
*?)
= TT-1415
= 128.6364
ΟO 4 = = s,
Iλ
:357.8667
-»(a) Die Bestimmung eines (1—α) - Konfidenzintervalles für die Differenz 2 2 Uj - μ^ der Erwartungswerte zweier unabhängiger Ν(μ^,σ^) - bzw. ~ verteilter Zufallsvariablen X
und X
ist für den Fall, daß die Varianzen σ?,
2
β2 unbekannt und ungleich sind (Behrens - Fisher - Problem), nur noch approximativ möglich. Ein Konfidenzintervall für μ^ - μ^ zum Niveau 1-a ist dann gegeben durch (vgl. Aufgabe 8.1.a)
wobei sich der Freiheitsgrad \> der t - Verteilung aus
berechnet. Ist der Wert von ν keine ganze Zahl, so wählt man die nächstkleinere ganze Zahl.
Kapitel 8: Parametrische Vergleiche im
Mit s 2 = 128.6364
, s 2 = 357.8667
225
Zweistichprobenfall
, n 1 = 12 , n 2 = 16 ergibt sich zunächst der
approximative Freiheitsgrad wegen
(m.
6364
Λ
s2 357.8667V
12
( zu 24. Da ^
1 2 8
jf
6 4
)
/l1
1
+ (
-
L
3 5 7
1
f
6 7
= 24.9946 )
= 249.5 , x 2 = 252.5 , t 2 4 " 1 - a / 2
approximatives 0.90 - Konfidenzintervall
/l5 = t
24O
95 =
1
·711
ist
also
e i n
für die Differenz μ^ - μ 2 der durch-
schnittlichen Bestell summen in den beiden Regionen gegeben durch 6364 ^ 357.8667 f 16
[^249.5 - 252.5 - 1 .71 1 ·
249.5 - 252.5 + 1 .711
/
/T287 6364 T2 Τ
T
357.8667 Ϊ6
[-3.000 - 9.8418 , -3.000 + 9.8418] [-12.8418 , 6.8418]
-»(b) In c a h . C 8 . 4 . 1 s i n d d i e m ö g l i c h e n H y p o t h e s e n ü b e r d i e D i f f e r e n z der Erwartungswerte bei vorgegebenem Wert d zusammengestellt S a c h v e r h a l t , d e r im A u f g a b e n t e i l 2 2
(a) b e s c h r i e b e n w i r d ;
insbesondere
V a r i a n z e n σ^ u n d σ^ a l s o u n b e k a n n t u n d a l s u n g l e i c h z u g e l a s s e n ) . μ^ -
= d ist in d i e s e m F a l l d i e zur P r ü f g r o ß e
μ^ - μ^
(es g e l t e
(vgl. A u f g a b e 8 . 1 ,
der
sind die
Unter Aufgabe
8.3)
gehörige Zufallsvariable approximativ analog zum Aufgabenteil
t
- verteilt, wobei der Freiheitsgrad V
(a) f e s t g e l e g t ist. M i t H i l f e d i e s e r P r ü f g r ö ß e
geben sich dann die in Tab. L8.4.1
ebenfalls angegebenen
er-
Entscheidungsregeln
der entsprechenden Niveau - α - Tests.
Es soll geprüft werden, ob mit einer Irrtumswahrscheinlichkeit von 0.05 die durchschnittliche Bestellsumme der Kunden in der Region 1 signifikant ist als in der Region 2 , d.h. ob die Hypothese H q : M1 > μ 2
«
μ1 - μ 2 > 0
zugunsten der Alternative H 1 : μ1 < μ 2
«
μ1 - μ 2 < 0
kleiner
226
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
Cab. £ 8 . 4 . 1 : Approximative Tests zum Niveau α für Hypothesen über die Diffe2 renz μ^ - U^ der Erwartungswerte zweier unabhängiger Ν(μ^,σ^) 2 bzw. Ν(μ ,σ ) - verteilter Zufallsvariablen mit unbekannten und 2 2 nicht notwendigerweise gleichen Varianzen Oj und σ^ bei vorgegebenem Wert d
H
H
o
H0 wird zum Niveau α verworfen, f a l l s
1
- μ2 < d
- μ2 > d
- μ2 > d
Uj - μ 2 < d
t >t , V; l-a t2 ,n l
, - Verteilung (vgl.
Aufgabe 4.11.a). Von Interesse ist weiterhin die Prüfung von Hypothesen, die einen Vergleich 2 2 der Varianzen σ^ und σ^ möglich machen. Mit der Prüfgröße 2 S
2
2 2 die im Fall der Gültigkeit von σ, = d i e
Realisation einer F
1 2
,
. -ver-
η -Ι,ι^-Ι
teilten Zufallsvariablen darstellt, ergeben sich die in Cab. £6.5.1 zusammengestellten Entscheidungsregeln für Niveau - α - Tests bei verschiedenen einund zweiseitigen Hypothesen. Cab* C8.5.1: Tests zum Niveau α für Hypothesen über den Vergleich der Vari2 . 2 2, . 2 , anzen und α^ zweier unabhängiger Ν(μ^,σ^) - bzw. Νίμ^,σ^^ ~ 3 2 verteilter Zufallsvariablen
H
2
H
o
2 - °2
2
Η 0 wird zum Niveau α verworfen, falls
1 2 °2
F > F
2 2 σ ι2°2
2,2 σ 2
F ...
' n 21 '' ' ' ,n2Ü.'
auch
Ausprägungen der Μ(η^
,p 2 j) - verteilten Zufallsvektoren
(X
,. . .
,. . . .Xj^) bzw.
" A u ^ 9 a b e 4.3, auffassen. Das obige Testverfahren stellt
(X^i''' · 2 9 ) '
somit auch einen Test auf Gleichheit der Parameter zweier
(vergleichbarer)
Multinomialverteilungen dar, vgl. auch Aufgabe 6.8. Es sei auch noch vermerkt, daß dieser Test identisch ist mit dem Test der Homogenitätshypothese in einer (2*Ä) - Kontingenztafel, vgl. Kapitel 12; für 1=2 ergibt sich der 2 2 zweiseitige Test in Aufgabe 8.9 (mit χ = ζ dort).
In zwei Befragungen werden die Ereignisse 'regelmäßig =
'unregelmäßig
KISS kaufen'
'nicht untersucht. Über die Wahrscheinlichkeiten
=
in der ersten und
P(Aj) = p^j für die zweite Umfrage, i = 1,2.3 , soll die Hypothese H0: P
n
= PZ1
. P 1 2 = P 2 2 · P13 =
P
23
gegen die Alternative H
1:
Pij + P 2 j
minti
e s t e n s ein jt{1,2,3 }
-
240
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
zum Niveau a = 0.10 getestet werden, d.h. man möchte überprüfen, ob zwischen e r s t e r und zweiter Umfrage ein s i g n i f i k a n t e r Unterschied in den 'Kaufwahrscheinlichkeiten'
besteht.
Bei der e r s t e n , v g l . auch Aufgabe 5 . 8 , und der zweiten Befragung sprachen s i c h von den n^ = 120 bzw. η£ = 100 z u f ä l l i g ausgewählten Personen n ^ = 54 bzw. n j 1 = 4 6 f ü r regelmäßiges, n ^ = 30 bzw. n ^ = 40 für unregelmäßiges Kaufen und n ^ 2 = 3 6 bzw. n2j = 14 f ü r Nichtkaufen von KISS aus. Diese Ergebnisse s i n d in Cab. C8.10.1 in Form einer Kontingenztafel
( v g l . Kapitel 12) zusammen mit
den Randhäufigkeiten ü b e r s i c h t l i c h angeordnet. t a b . C8.10.1: (2χ3) - Kontingenztafel der beobachteten Häufigkeiten
n^,
i=1,2 , j = 1 , 2 , 3 zu den zwei KISS - Befragungen n^.
E r e i g n i s Aj 1
2
3
I
30 = n 1 2
36 = n 1 3
120 = η
40 = „ 2 2
14 = n 2 3
100 = n 2
Befragung"^^ 1
54 = n
2
46 = n 2 1
l
n
100 = n 1 1 + n 2 1
V0 = n 1 2
+
n22
S O ^
+ n^
220 = η
Die unter der Hypothese geschätzten, erwarteten Häufigkeiten n i · (n. . + n 2 . ) m . . = —Li n +n ij 1 2
'
1=1 2
'
i=1 2 3
'
s i n d in Cab. C8.10.2 zusammengestellt, wobei zu beachten i s t , daß s i c h die gleichen Randsummen ergeben wie in der Tabelle der Ausgangsdaten, was zur Rechensicherheit auch s t e t s überprüft werden s o l l t e . Für die Prüfgroße e r g i b t s i c h damit 3 y
2 X
(n
1j-m1j)2
j=1 =
m
1j
(54 - 5 4 . 5 ) 5473
,
3
(n
2j-m2j)2 m
j=1
2
(30 - 3 8 . 2 ) 3B72 +
2
(46 - 4 5 . 5 ) 2 45.5
2j
^ (36 - 2 7 . 3 ) 2 27.3
+
+
(40 - 3 1 . 8 ) 2 3T78
+ +
(14-22.7)2 ΤΠ1
= 0.0046 + 1 .7602 + 2.7725 + 0.0055 + 2.1145 + 3.3344 = 9.9917
.
241
Kapitel 8: Parametrische Vergleiche im ZweistichprobenfaH
Cab. C8-10.2: Unter der Hypothese Hg geschätzte, erwartete Häufigkeit
m^,
i = 1,2 , j = 1,2,3
m. . ij
120 · 100 220
"11
=
"l2
= 54.5
21
= n
13
= 38.2
100 · 100 220
= n
120 · 70 220
= 45.5
120
= 27.3
100 · 70 220
22
120 · 50 220
100 · 50 220
23
= 31.8
= 22.7
100
70
50
220
100
Beim in der Aufgabenstellung geforderten Signifikanzniveau α = 0.10 ist der zugehörige kritische Wert bei £ = 3 gegeben durch
xl-1 ;1-α = χ 2 ; 0 . 9 0
= 4
·605
»
χ 2 = 9.9917 > 4.605 = χ|_ 1
;1_a
so daß wegen
die Hypothese Hg verworfen werden muß; die zweite Marktuntersuchung ist im Ergebnis, d.h. bzgl. des zum Ausdruck gekommenen KaufVerhaltens, also zum 10% Niveau signifikant verschieden von der ersten, d.h. die Unterschiede in den Befragungsergebnissen sind bei diesem Testniveau nicht nur durch
'Zufall'
zu erklären. Zur Verdeutlichung seien die aus Tab. L8.10.1 berechneten Schätzungen
für
die 'Kaufwahrscheinlichkeiten' der ersten Befragung p
1 l
= ^
= 0.45
,
P12
= 0-25
,
p
1 3
= ^ = 0 . 3 0
denen der zweiten Befragung
p
2
r w
gegenüberstellt.
=
0
·
4 6
·
p22
=
w
=
0
·
4 0
-
p23
=
i w
= 0
·
1 4
Im obigen Test wird also geprüft, ob die hier ersichtlichen
Unterschiede zum geforderten Niveau auch statistisch signifikant sind. Bei Gültigkeit von H Q ergeben sich aus Tab. L8.10.2 die für die beiden gen geschätzten, hypothetischen
'Kaufwahrscheinlichkeiten'
wegen
Befragun-
242
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
Hj
K
-0
-0
n
2j
!
+ n
2
zu pii = P 2 I
100 =
m
-
Ρ°2 = Ρ °
2
Ä0
_ 50 _
_Ä0
= ^ =
„ .r.r ° ·
4 5 4 5
0.3182 n
-
,
,,,,
Mit diesen Werten werden die obigen Schätzungen in der T e s t s t a t i s t i k verglichen, denn da n - j = n^p^. und in.^ = η^p?j, schreibt sich diese auch als
χ
=
2 3 (np -np°) 1 1J V 1J I I 1=1 j=1 niP
2
2 3 η · (ρ - p° ) 2 1J = I I - — 1=1 j=1 ρ
·
Kapitel 9: Nichtprarametrische, verteilungsfreie Vergleiche im Ein- und Zweistichprobenfall AUFGABE 9.1 An η = 1 0 Tagen wurde die Zeit X, die ein Arbeitnehmer benötigt, um mit seinem PKW zur Arbeltsstelle zu gelangen, gemessen, vgl. C ah.
9.1.
Cab. 9 . 1 : i x
i
A n f a h r t z e i t e n ( i n Min.) x ^ , i=1
10
1
2
3
4
5
6
7
8
9
10
24.3
35.2
33.8
46.8
29.6
22.0
34.5
41.2
32.1
29.9
Liegen zum 5% Niveau signifikante Abweichungen des Medians der Anfahrtzelt X von 30 Minuten vor? Testen Sie mit Hilfe des (a) Zeichentests, (b) Vorzeichenrangtests von Wilcoxon.
AUFGABE 9.2 In Aufgabe 8.7 sind die Ernteerträge von 10 Versuchsfeldern nach der parallel durchgeführten Behandlung mit einem herkömmlichen und einem neuen Düngemittel aufgeführt. Testen Sie mit Hilfe des approximativen Vorzeichenrangtests von Wilcoxon, ob zum 1% Niveau das neue Düngemittel zu signifikant besseren Ernteergebnissen führt als das herkömmliche Mittel.
244
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
AUFGABE 9.5 In einem klinischen Versuch soll ein neues,den Bluthochdruck senkendes Medikament auf seine Wirksamkeit hin untersucht werden, Dazu wird einer Gruppe bestehend aus 12 Patienten dieses neue Medikament und einer zweiten Gruppe mit 10 Patienten ein Placebo verabreicht. Beide Gruppen umfassen unter Bluthochdruck leidende Patienten. In cab. 9.3 sind die Differenzen in den Blutdruckwerten, die jeweils vor und drei Stunden nach Einnahme des jeweiligen Mittels gemessen wurden, für jeden Patienten festgehalten. tab. 9 .3: Differenzen x ^ , i = 1 . . ,12 , und x 2 i ' i = 1 ' · * · ' ^ 0 »
der
Blutdruckwerte
vor und drei Stunden nach Verabreichung des Medikamentes bzw. des Placebos Medikament x
1i
Placebo x
2i
1
18.0
6.2
2
5.7
-0.5
3
-0.4
1.6
4
-2.1
15.7
5
20.5
-6.1
6
-5.6
-3.7
7
10.4
8.7
8
-7.1
2.5
9
6.2
-2.8
10
9.7
10.0
11
11.5
12
-8.9
Ist der Einfluss des neuen Medikaments auf die Senkung des Blutdrucks zum 10% Niveau signifikant grösserals der des Placebos? Beantworten Sie diese Frage mit Hilfe des Wilcoxon - Rangsummentests.
Kapitel 9: Nichtparametrische,
verteilungsfreie Vergleiche
245
AUFGABE 9.4 Prüfen Sie mit Hilfe des Kolmogoroff - Smlrnov - Tests, ob zum 10% Niveau signifikante Unterschiede zwischen den in Aufgabe 8.1 gegebenen von zwei Anlagen in Litertuten abgefüllten Milchmengen X 1 und X 2 bestehen. Verwenden Sie dazu die in Tab. 8.1 zusammengestellten Stichprobenergebnisse.
AUFGABE 9.5 Nach Markteinführung des neuartigen Toilettenpapiers KISS wurden in der nördlichen und der südlichen Region unterschiedliche Produktwerbungen gestartet. Um einen schnellen ersten Eindruck zu gewinnen, wurden aus einem Verzeichnis gleichartiger Geschäfte zufällig je 30 Geschäfte ausgewählt und nach dem Absatz, d.h. nach den abgesetzten Mengen von KISS befragt. Im Norden erhielt man von 26 und im Süden von 24 Geschäften relevante Auskünfte. Dabei gaben im Norden 14 Geschäfte an, dass sie Kiss überhaupt nicht führen, da es noch nie nachgefragt wurde, und die übrigen 12 Geschäfte gaben den Absatz (in Tonnen) von KISS wie folgt an (der Grösse nach geordnet): 1.7, 2.3, 5.9, 8.5, 9.6, 10.1, 10.1, 10.1, 12.4, 13.5, 15.7, 21.7. Im Süden führten 10 befragte Geschäfte KISS nicht und die restlichen 14 gaben den KISS - A b s a t z mit 0.9, 2.1, 3.1, 3.1, 3.1, 4.9, 7.5, 8.9, 10.5, 11.3, 11.3, 12.6, 15.3 und 19.5 an. Sind nun die beiden Produktwerbungen im Norden und im Süden zum Niveau von 10% signifikant unterschiedlich im Erfolg?
Kapitel 9: Nichtparametrische, verteilungsfreie Vergleiche
LÖSUNG ZU A U F G A B E
247
9,1
Die im Kapitel 6 und 8 behandelten Testverfahren beruhen stets auf Hypothesen bezüglich der Parameter eines den Beobachtungen zugrundegelegten, bekannten Verteilungstypes. Liegen aber Realisationen einer (oder mehrerer) Zufallsvariablen vor, über die keine konkrete Verteilungsannahme getroffen werden kann, so bedient man sich sogenannter nichtparametrischer bzw. verteilungsfreier Testverfahren, um zum Beispiel Lokationsvergleiche durchführen zu können. Im Einstichprobenfall, d.h. bei Vorliegen von η unabhängigen Beobachtungen x.,...,x einer Zufallsvariablen X, können mit Hilfe nichtparametrischer 1 η Methoden Hypothesen über das Lagemaß,den Median ξ^ ^ (vgl. Aufgabe 3.8) der Verteilung von X überprüft werden. Es muß dabei vorausgesetzt werden, daß die Zufallsvariable X stetig verteilt ist.
->(a) Die Durchführung des Zeichentests zur Überprüfung von Hypothesen bezüglich des Medians ξ^ ^ besteht im ersten Schritt aus der Berechnung der transformierten Beobachtungswerte
x
i=xi_?0*
' i=1
n
'
d.h. der Differenz von Beobachtungswert und hypothetisch angenommenen Wert CQ„· Anschließend wird festgestellt, wieviele der
ein positives,
wieviele ein negatives Vorzeichen besitzen. Liegen genau m positive Werte vor, ist also mit x! > 0 ι , falls )
l
i=l
y
= m 1
, i=l,...,n
,
x! < 0
-
so ist der Wert m, der hier als Prüfgröße verwendet wird, bei Vorliegen von ζ0 ^ =ξ
gerade die Realisation einer B(n,0.5) -verteilten Zufallsvaria-
blen. Die in
£9,1*1 angegebenen Entscheidungsregeln für die verschiede-
nen ein- und zweiseitigen Hypothesen stimmen also mit denen des in Aufgabe 6.7 ausführlich erläuterten Binomialtests zum Niveau α für ρ^ = 0.5 überein. Dort ist auch die Bestimmung der kritischen Werte c^ und Cj
angegeben.
Ist der Stichprobenumfang η hinreichend groß (n > 20), so kann man als Prüfgröße auch
248
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
ζ
=
m - 0.5 η 0 . 5 \fn
verwenden, deren z u g e h ö r i g e Z u f a l l s v a r i a b l e u n t e r d e r Hypothese ξ_ =ξ 0. b U* approximativ N(0,1) - v e r t e i l t
ist
( v g l . A u f g a b e 6 . 6 ) . Die s i c h dann e r g e b e n -
den E n t s c h e i d u n g s r e g e l n zum Niveau Ct s i n d e b e n f a l l s i n Tab. L 9 . 1 . 1
aufge-
führt. Hab* £ 9 * 1 * 1 :
H
[ A p p r o x i m a t i v e ] T e s t s zum N i v e a u α f ü r Hypothesen über den Median ξ _ e i n e r s t e t i g v e r t e i l t e n Z u f a l l s v a r i a b l e n X (ZeichenU· test)
H
o
^ 0 . 5 - ^0*
^0.5
=
^0*
Hq w i r d zum N i v e a u α v e r w o r f e n ,
1
ξ
0.5>ξ0*
ξ
0.5c 1-a m c, l-a/2
]
[z>u, l-aJ
L
[z < u 1 aJ
α
oder
falls
L
m u. 1 l-a/2J
L1
daß, wenn t r a n s f o r m i e r t e Beobachtungen den Wert N u l l
annehmen, s i c h m a l s
m =
η Τ y. 1=1 1
mit
, falls
χ•>0 χ x! = 0 χ x! < 0 χ
berechnet.
Zum N i v e a u α = 0 . 0 5 s o l l X des A r b e i t n e h m e r s
f ü r den Median ξ ^ g d e r V e r t e i l u n g
zu seinem A r b e i t s p l a t z
die zweiseitige
der
Anfahrtzeiten
Hypothese
Η0:ξ0>5=30.0 gegen Η,
:ξ0.5*30.0
g e t e s t e t werden.
I n t a b . C S . 1 . 2 s i n d sowohl
d i e an η = 10 Tagen
Z e i t e n χ ^ , . , . , χ ^ a l s auch d i e t r a n s f o r m i e r t e n
Werte
beobachteten
Kapitel 9: Nichtparametrische,
χ! = Χη· - 3 0
, i =1
10
verteilungsfreie Vergleiche
249
,
zusammengestellt. Außerdem wird dort f e s t g e h a l t e n , welche dieser x.! p o s i t i v e s , welche negatives Vorzeichen b e s i t z e n , d.h. f ü r i = 1 , . . . , 1 0 sind die Werte y.. angegeben. Cab. £9.1.2: A r b e i t s t a b e l l e zur Durchführung des Zeichentests
i
X
i
X! = X - 30 1 1
1
24 .3
-5.7
0
y
i
2
35 .2
5. 2
1
3
33 .8
3. 8
1
4
46 .8
16. 8
1
5
29 .6
-O. 4
0
6
22 .0
-8.0
0
7
34 .5
4. 5
1
8
41 .2
11 2
1
9
32 .1
2. 1
1
10
29 .9
-O. 1
0
Da mit η = 10 die Approximation der Binomial- durch die Normal Verteilung n i c h t g e r e c h t f e r t i g t e r s c h e i n t , s o l l h i e r der exakte Test durchgeführt werden. Für d i e Prüfgröße m e r g i b t s i c h m =
10
Υ y. = 6 i=1 1
Die bei einem Niveau α = 0.05 benötigten k r i t i s c h e n Werte Cq ^
und Cq g^g
s i n d nun so zu bestimmen, daß Cg g 2 5 die größte ganze Zahl e r g i b t mit
C
T " \ i=o
1
0
W
) 0 . ^ 0 . 5 ^ =
C
T "
1
n 0 . S W
l
0
< 0
.025
und Cg gyg die k l e i n s t e ganze Zahl d a r s t e l l t , f ü r die
J J?).,'·,»»^ J ( 0 ι w =
L>
' i=l
c.R. 1
mit
falls
1
R. < 0
ein. Dieser Prüfgrößenwert muß bei der Überprüfung der verschiedenen einund zweiseitigen Hypothesen über den Median mit dem kritischen Wert
Μ
η .γ
verglichen werden, der für einige spezielle η und γ in der Cäb. £9*1.3 vertafelt ist.
Cab. 0 . 1 . 3 : Kritische Werte
11
w
n;0.025
W
Μ
η.γ
n;0.05
des Vorzeichenrangtests von Wilcoxon
W
n;0.95
W
n;0.975
7
3
4
23
24
8
4
6
29
31
9
6
9
35
38
10
9
11
43
45
11
11
14
51
54
12
14
18
59
62
13
18
22
68
72
14
22
26
78
82
15
26
31
88
93
Für hinreichend große Stichprobenumfänge η läßt sich auch die Teststatistik w-n(n+l)/4
w* =
,
Vn(n+1) (2n+l)/24 die für ξ
0. b
=ξ
0*
die Realisation einer approximativ N(0,1) -verteilten Zu-
fallsvariablen darstellt, verwenden; d.h. in solchen Fällen kann ein approximativer Einstichproben - Gauß - Test bezogen auf w* angewendet werden.
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
252
Damit sind nun die in Cab· £ 9 4
angegebenen, verschiedenen Entscheidungsre-
geln des Vorzeichenrangtests zum Niveau α für die ein- und zweiseitigen Hypothesen bzgl. des Medians festgelegt.
Cab* 0·1«4: [Approximative] Tests zum Niveau α für Hypothesen über den Median ξ^
der Verteilung einer stetigen Zufallsvariablen X,
die symmetrisch ist (Vorzeichenrangtest von Wilcoxon)
H
H
o
1
Hg wird zum Niveau α verworfen, f a l l s
ξ
0.5ίξ0*
ξ
0.5>ξ0*
w>w . η;1-α
[w* > u 1 1-α
ξ
0.5Ϊξ0*
ξ
0.5w < w >w < w
, nj,n2,-l-a
[w* > u ] R 1-a
nj,n 2# -a
[w* < u ] R a
ηj
; 1 -a/2
n1,n2;a/2
oder
[ 11w* 1I > u, ,J R l-a/2
258
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
Die Differenzen X^ und
der Blutdruckwerte vor und drei Stunden nach Verga-
be des blutdrucksenkenden Medikamentes bzw. des Placebos wurden an zwei verschiedenen Patientengruppen gemessen. Es kann angenommen werden, daß X^ und X 2 unabhängige, stetige Zufall svariablen sind und daß deren Erwartungswerte μ 1 und μ 2 existieren. Außerdem soll gelten, daß die Verteilungen von X^ und X2
bis auf Lokationsunterschiede gleich sind. Anhand der beobachteten Werte
x ^ , i=l,... ,12, und x,^, i=1,... ,10, soll zum Niveau α =0.10 überprüft werden, ob die Wirkung des Medikamentes auf die Senkung des Blutdrucks signifikant ist, d.h. bezogen auf die Blutdruckdifferenzen, ob die durchschnittliche
Differenz μ^ nach Einnahme des Medikamentes signifikant größer ist als
die durchschnittliche Differenz μ 2 nach Einnahme des Placebos. Folgendes Testproblem liegt also vor: Hg : μ 1 < μ 2
gegen
H1 : μ1 > μ 2
In Cah. £9.3.3 sind sowohl die n^ =12 an der ersten Patientengruppe gemessenen Differenzen als auch die n 2 = 10 der zweiten festgehalten. Gleichzeitig werden dort auch die Rangzahlen der insgesamt n^ + n 2 = 2 2 Beobachtungen angegeben. So erhält etwa die Differenz x^g = -7.1 als zweitkleinster Wert der gesamten Beobachtungsreihe den Rang R(x^g) = 2, der Wert x 2 g = -6.1 als drittkleinster aller Beobachtungen erhält den Rang R(x 2 j) =3. Da in beiden Stichproben der Wert x i g - x 2 i
=6
· 2 beobachtet wurde, werden die zugehörigen Rang-
zahlen gemittelt, d.h. R(x l g ) = R(x 2 1 ) =(13 + 14)/2 = 13.5
.
Cab. C9.3.3: Rangzahlen der insgesamt n 1 + n 2 = 12 + 10 = 22 Beobachtungen χ
i
X
1 1 " · · , χ 1 12'x21 '•••'x2 10 R(Xli)
1i
1
18 0
2
5 7
3
-O 4
4
-2
5
21 12
2i
R(x2i)
6.2
13.5
x
-0.5
8
1.6
10
1
9 7
15.7
20
20
5
22
-6.1
3
6
-5
6
4
-3.7
5
7
10 4
18
8.7
15
8
-7 1
2.5
11
9
6
10
2
2 13.5
-2.8
6
9 7
16
10.0
17
11
11 5
19
12
-8 9
1
Kapitel 9: Nie htpara metrische, verteilungsfreie Vergleiche
259
Für die Prüfgröße w^ des Wilcoxon - Rangsummentests erhält man somit 12
Wn = 1 Rix,-) = 21 + 1 2 + 9 + 11 i=1
+ 19 + 1 =144.5
.
Bei dem geforderten Signifikanzniveau α = 0.10 entniirmt man Tab. L9.3.1 mit n^ = 12, n^ = 10 den kritischen Wert w
ni,n2;1-a
= w
= n
12,10;0.90
1(n1
+n
2+
1)
' w n , ,n 2 ;a
= 12(12 +10 + 1) " W ^2,10;0.10 = 276 - 118 = 158
,
d.h. wegen wD = 144.5 Η 5 8 =w„ „ . R ' n^ ,n 2 ,1 -α kann die Hypothese zum 10% Niveau nicht verworfen werden.
LÖSUNG ZU AUFGABE 9 . 4 Der K o l m o g o r o f f - Smirnov - T e s t f ü r den Z w e i s t i c h p r o b e n f a l l Stelle
w i r d an
dieser
v e r w e n d e t , um, f a l l s k e i n e k o n k r e t e V e r t e i l u n g s a n n a h m e g e t r o f f e n
den k a n n , n i c h t nur e i n e n V e r g l e i c h
der Erwartungswerte
Z u f a l l s v a r i a b l e n X^ und X^ d u r c h z u f ü h r e n , s c h i e d e z w i s c h e n den gesamten V e r t e i l u n g e n gesetzt
w e r d e n , daß X^ und X^ s t e t i g e
funktionen F
und F
1
sondern um a u f s i g n i f i k a n t e zu p r ü f e n .
Zufallsvariablen
Es muß wiederum sind mit
s i c h das g e s c h i l d e r t e
wer-
unabhängiger Untervoraus-
Verteilungs-
Testproblem
als
2
Überprüfung der
Hypothese
H0 : F x
gegen d i e
. Damit l ä ß t
zweier
(x) = Fx
(x)
für alle
χ
(x)
f ü r mindestens ein χ
Alternative Η
1
: F
Xj
(x) ^ F
x2
angeben. Es l i e g t (vgl.
nun n a h e , d i e e m p i r i s c h e n V e r t e i l u n g s f u n k t i o n e n
Aufgabe 6.3)
zur Ermittlung
S . und S n.,1 Ti2> e i n e r P r ü f g r ö ß e h e r a n z u z i e h e n , d . h . m i t den
260
Teil I: Übungsaufgaben,
Erläuterungen
und
Lösungen
unabhängigen Realisationen χ.,,.,.,χ. von X, bzw. 11 ln^ 1 werden die Funktionen
21
2n 2
von
2
0
s
, (X) = n
l
x < x , . für alle 1 = 1....,n. Ii 1 k — , falls χ > x, . für genau k der x, . aus x, ,,...,x, n^ - Ii Ii 11 ln^ 1
x > x , . für alle i=l, ... ,n - Ii 1
0
χ < x„ . für alle i = l....,n_ 2i 2
und
S n
,(x) 2
— , falls χ > . für ygenau k der χ aus x„.,...,x n2 - 2i 2i 21' ' 2n 2 χ > x 2 i für alle i=l,...,n2
betrachtet. Uber den qrößten vertikalen Abstand zwischen S . und S nj,l n 2 ,2 der durch D n
l' n 2
(x) = max |s , (x) - S n n χ l' 2
„(x) I
gegeben ist, wird folgende Prüfgroße des Kolmogoroff-Smirnov-Tests gebildet:
Die zweiseitige Hypothese H^ wird dann zum Niveau α verworfen, falls Κn
l'n2
> k η ,n2;l-a
vorliegt. Einige dieser approximativen, konservativen (d.h. Bevorzugung einer Entscheidung für die Hypothese) kritischen Werte k , sind in * η ,η ;l-a iah* £9.4*1 zusammengestellt; dabei bezeichnet η ^ ^
die kürzere und
längere Beobachtungsreihe.
iah* £9.4.1: Approximative kritische Werte k
.
des Kolmogoroff - Smir-
nov - Tests für α = 0.20, α = 0.10 und α = 0.05
"(Ι)
Π
(2)
k
n(1),n(2);1-a
α = 0.20
von 5 bis 15 sonst
von 5 bis 40 sonst
1.03 1.08
α = 0.10
von 4 bis 8 .von 4 bis 16 sonst
von 5 bis 9 von 10 bis 20 sonst
1.12 1.16 1 .23
a = 0.05
von 5 bis 16 sonst
von 6 bis 20 sonst
1.30 1.36
261
Kapitel 9: Nichtparametrische, verteilungsfreie Vergleiche
Zum Niveau a = 0.10 soll die Hypothese, daß keine Unterschiede zwischen den von den beiden Anlagen in Litertüten abgefüllten Milchmengen X 1 und
beste-
hen, mit Hilfe des Kolmogoroff - Smirnov - Tests geprüft werden. Mit der A n nahme, daß X^ und X^ stetig verteilte Zufallsvariablen darstellen, wird also auf Gleichheit der Verteilungen, d.h. H q : Fjj (x) = F x (x)
für alle χ
H
für mindestens ein χ
gegen :
1
F
x
( x )
*
1
p
x
C x ) 2
getestet. Mit den n^ = 7 beobachteten Abfüllmengen der Anlage 1 bzw. den n ^ = 9
beobach-
teten Werten an der Anlage 2 wird zunächst eine Arbeitstabelle zur Ermittlung der empirischen Verteilungsfunktionen S ^ ^ und S g
angelegt, vgl. t a b .
2
£9.4.2. Die Beobachtungen in jeder Reihe werden dabei der Größe nach geordnet dort eingetragen, d.h. man geht von den abgefüllten Mengen über zu der geordneten Reihe Χ
(21)< . ..t k = 4
Werten aus der zweiten Stichprobe, die
kleiner oder gleich 1.00 sind, also
Weiterhin werden in Tab. L9.4.2 auch die absoluten Abweichungen |S 7 ^ ( x ) - S g
2(x)l
berechnet.
Der größte vertikale Abstand dieser beiden empirischen liegt somit bei, vgl. auch A b b . C9.4.1, D
7,9
=26 63
Der sich ergebende
Κ
Pr'iifgrößenwert
η1,η2 =Κ 7 , 9 = ν / τ 3 ·
°7,9 = / W
' S
=
0
"8189
Verteilungsfunktionen
262
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
l a b . £9.4.2: A r b e i t s t a b e l l e zum Kolmogoroff - Smirnov - Test
X
X
(1i)
(2i)
S7)1(x)
S9>2(x)
1/7
0
0.96
0.98 , 0.98
r
0.98
1.00
9/63
0.97
1/7
1/9
2/63
0.98
4/7
2/9
22/63
0.99
4/7
3/9
15/63
1.00
5/7
4/9
17/63
S/7
4/9
26/63
1.02 , 1.02
1
6/9
21/63
1.03
1
7/9
14/63
1.04 , 1.04
1
1
1.01 1.02
|s7J(x) -s9j2(x)|
0
1.0-
S71(x) ' \
^7,9 *
0.5-
\
s9
0.%
0.97
0.98
0.99
1.00
1.01
2
(χ)
1.02
1.03
1.04 X
Abb. C9.4.1: Empirische Verteilungsfunktionen S_ . ( x ) und S p „ ( x ) der abgef ü l l t e n Milchmengen '»'
Kapitel
9: Nichtparametrische,
verteilungsfreie
Vergleiche
263
muß nun mit dem kritischen Wert, vgl. Tab. L9.4.1, k
nrn2;1-a
= k
7,9;0.90
=
1
·12
verglichen werden. Da also
kann die Hypothese H„ zum 10% Niveau nicht verworfen werden.
LÖSUNG ZU AUFGABE 9.5 Die Zufallsvariablen A^ und A d·* 1 · der t . - V e r t e i l u n g v e r g l i c h e n werden muß. Da ο |t| = 1.2301 + 2.306 = t 8 ; 0 _ 9 7 5 = t n _ 2 . 1 _ a / 2
,
kann d i e Unabhängigkeitshypothese zum 5% Niveau n i c h t verworfen werden.
( c ) Die Unabhängigkeitshypothese Hg aus A u f g a b e n t e i l 5% Niveau f ü r a l l e K o r r e l a t i o n s k o e f f i z i e n t e n
r
XY "
Λ
(b) kann mit η = 1 0 zum
r^y mit
< 2.306 ' XY
d.h. XY
°
< 2.306
2
1 - r! XY n i c h t verworfen werden. Durch ä q u i v a l e n t e Umformungen e r g i b t rr
2
XY Τ ί 1 - r! XY r
2 2.306 — 8 —
2 2.3062 XY 8
2.3062 '
8
'
r
2 XY
sich
Kapitel 10: Abhängigkeitsanalyse - Korrelation und Assoziation
275
2
rv v < 0.3993 d.h. ist Γ χ γ ε [ - 0 . 6 3 1 9 , 0.6319], so kann nicht auf signifikante Abhängigkeit zwischen Eisen- und Bleigehalt geschlossen werden.
LÖSUNG
ZU A U F G A B E
10.2
Der Umsatz X und die Investition für Umweltschutz Y im Bereich der chemischen Industrie seien gemeinsam normalverteilt. Es liegen aufgrund einer zufälligen Stichprobe Beobachtungspaare (x1
) . . ,(Xg,yg) vor, aus denen sich
die Korrelation p y Y zwischen X und Y schätzen läßt (vgl. Aufgabe lo.i). Mit
8 Χ=·5· 1 x,· = - s · (145.2 + . . . + 127.7) = ° -j = 1
1176 = 147.0 °
und y =
1
8
8 ^
1 y
i
=
(0.73 + ... + 0.63) = Jr· 6.32 = 0.79
8
8
berechnet sich der Korrelationskoeffizient von Bravais - Pearson zu
8 l x.-y^ - 8xy i=1 1 1
1026.978 - 929.040 \/( 184680.88 - 172872.00)(5.8472 - 4.9928) = 0.9750
->(a) M i t Hilfe der Fisherschen - Ζ - Transformation
ζ = arctanh
d.h.
Γχγ
= j · In γ
276
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
=2z
- 1
Tz läßt sich ein approximatives Konfidenzintervall
ι
1 +
,
P
für
herleiten.
Denn
für
XY
XY ist approximativ
durch
mit
Z
1 + r 1 X I n 1 - r„ 1= 2 '
XY 2 · (η - 1 )
l-Ot/2 Vn - 3
1 + r ζ
ein
= - · In
1
XY
XY ( η - 1)
XY
(1-a) - K o n f i d e n z i n t e r v a l l
tervallgrenzen Niveau
1-a
gegeben.
erhält man dann ein
für
u
l-g/2 i/n - 3 Durch Rücktransformation
(approximatives)
dieser
In-
Konfidenzintervall
zum
durch
2z,
2z_
2z,
' -1 2z„ +1
+1
Für die Korrelation p^y zwischen Umsatz X und Investition fur den Umweltschutz Y soll ein Konfidenzintervall zum Niveau V - α = 0.95 berechnet werden. Als Schätzer für die Korrelation ergab sich bei n = 8 Beobachtungspaaren r X y = 0.9750. Mit ,
_ 1 1 -?·
u
i_a/2
0 975 =
τ„ 1 + 0.9750 ln
1
-96 werden zunächst die Größen
0.9750
1.96
, =
1 - 0.9750 " 2 · ( 8 -
= 1 .2385 2
= u
2
-
10/l7 t847
n Q
- ·
„,„, 0696
n
„-,,,-
0
" ·8765
,
0.9750 ' 2 ·0.9750 11 ' l,n 11 -+ 0.9750
1 .96
=
, 1 0 Λ 7 - n0.0696 n , Q , ^ n „-,,2.1847 + 0.8765
=2.9916 bestimmt, die entsprechend transformiert die Grenzen des 0.95 - Konfidenzintervalles für Ρχγ liefern:
277
Kapitel 10: Abhängigkeitsanalyse - Korrelation und Assoziation
2Z
e 1 • - -1 ~Tz Ί +1
e ^ - 1 ~Zz e 2+ 1
e
2.4772 2
e '
4772
. - 1 +
.5.9832 , e - 1
1 ' eb-983i;+1.
[10.9079 395.70781 [12.9079 ' 397.7078J [0.8451
, 0.9950]
-»(b) Bei einem Vergleich der Korrelation
zweier normalverteilter
Zufalls-
variablen X und Y mit einem hypothetischen Wert p Q ^ 0 in Form von Tests zum Niveau α über die verschiedenen ein- und zweiseitigen Hypothesen bedient mein sich wiederum der im Aufgabenteil
(a) vorgestellten Fisherschen - Ζ - Trans-
formation. Denn als Prüfgröße wird 1 , 1 + po ζ - — · In 2 l-p„ tfTö
p o 2 · ( n - 1)
j l + rxY ζ = — · In 2 1 - ΓΧΥ
verwendet, deren zugehörige Zufallsvariable bei Vorliegen von
= P ^ appro-
ximativ N(0,1) - verteilt ist. Somit sind die Entscheidungsregeln des
(appro-
ximativen) Tests zum N i v e a u α analog zum gewöhnlichen Einstichproben - Gauß Test
(vgl. Aufgabe 6.1) festgelegt, vgl. Cab. CIO.2.1.
tab* CIO.2.1: Approximative Tests zum Niveau α über die Korrelation zweier normalverteilter Zufallsvariablen X und Y
H
H
o
Ρ K
< XY - po
Ρ μ
P μ
> ΧΥ - po
ρ
P
XY ~ po
P
HQ wird zum Niveau α verworfen, falls
! >
ρ
ο
χγ
Uj
-a
U < U α |u| > U j
-α/2
Zum Niveau α = 0.10 ist in dieser Aufgabe für die Korrelation ρ χ γ der normalverteilten Zufallsvariablen Umsatz (X) und Umweltschutzinvestitionen Hypothese Hg: ρ χ γ < 0.95 gegen die Alternative H,: P y w > 0.95
(Y) die
278
Kapitel 10: Abhängigkeitsanalyse - Korrelation und Assoziation
zu testen. Aufgrund einer Stichprobe vom Umfang n = 8 hat sich als Schätzer für ρ χ γ gerade r^y = 0 . 9 7 5 0 ergeben. Mit
- r ^ T ^ M · · "
2-1847
und pg = 0.95 ergibt sich für die Teststatistik 9 ιολ7 1 _ L· la4/ " 2 * = 0.1275
ln
1 + 0-95 0.95 1 - 0.95 ~ 2 · (8 - 1 ) . 2.1847 - 1.8318 - 0.0679
,
ein Wert, der mit dem Quantil u, = u n Q n = 1.2816 1-α 0.90 als kritischen
Wert verglichen werden muß. Da
u = 0.1275 t 1.2816 = Ii·! ist die Korrelation p^y also zum 10% Niveau nicht signifikant größer als 0.95.
LÖSUNG ZU AUFGABE 10.3 Falls die Voraussetzung der gemeinsamen Normalverteilung für zwei Zufallsvariablen X und Y nicht gerechtfertigt erscheint, so bieten sich nichtparametrische Tests (vgl. Kapitel 9) zur Überprüfung der Unabhängigkeit von X und Υ (vgl. Aufgabe 10.1) an. Dabei muß aber vorausgesetzt werden können, daß X und Y - zumindest im Prinzip - stetig verteilt sind. Die Grundlage dieser Testverfahren bilden auch hier Korrelationsschätzwerte, die allerdings nun aus Ranginformationen abgeleitet werden, d.h. anstatt der η unabhängigen Beobachtungspaare
(Xj,Yj),...,(x »y ) gehen deren Rangzahlen in die
Schätzer ein.
->(a) Eine Möglichkeit,die Korrelation
der Zufallsvariablen X und Y zu
schätzen,liegt im Spearmanschen Rangkorrelationskoeffizienten r^, der sich aus der Formel zur Berechnung des gewöhnlichen Korrelationskoeffizienten (vgl. Aufgabe 10.1) ergibt, indem dort die Realisationen
und v y^ durch die
zugehörigen Rangzahlen R(x.) und R(y.) ersetzt werden. Dabei werden die Rangzahlen in der- Art vergeben, daß in jeder der beiden Beobachtungsreihen χ ,...,x
bzw. y ,...,y
die kleinste Realisation den Rang 1,..., die größte
Kapitel 10: Abhängigkeitsanalyse - Korrelation und Assoziation
279
Realisation den Rang η erhält. (Es ist auch eine umgekehrte Rangzahlenzuordnung möglich.) Treten Bindungen auf, d.h. sind mehrere Beobachtungswerte einer Zufallsvariablen gleich, so wird diesen gleichen Werten jeweils das arithmetische Mittel der zugehörigen Rangzahlen (midranks) zugeordnet. Somit erhält man den Spearmanschen Rangkorrelationskoeffizienten durch
l
J
( r ( x J - R ( x ) ^ R ( y i ) - R(y)^
-RU))2
l
·
l
^Rty.)
-
5Ty))2
η
2
J R(x.)R(y.) - 0.25n(n + 1) 1 1 i-1
J (
I
(R(x ± )) 2 - 0.25n(n+l) 2 ^ · ^
da
2 (R(y. )) - 0.2 5n (n+1)'
l Rix ) = l R(y ) = A ^ 1 i=l i=l
η(n+1) 2
Falls keine Bindungen auftreten, läßt sich die Berechnung dieses Korrelationskoeffizienten noch vereinfachen, denn dann ist
6· rs = 1
Ϊ a2 =i 1
mit
d
=R(x ) - R ( y )
η(η -1)
Auch für den Rangkorrelationskoeffizienten von Spearman gilt
wobei dieser etwa den Wert 1 nicht nur bei strikt positiver Linearitiät der Beobachtunaswerte annimmt, sondern schon dann, wenn für alle Paare (x.,y.) 1 1 und (x.,y.), ifj , mit χ. < χ. auch y. < y. erfüllt ist. 3 3 1 3 33 Bei einem Niveau - α - Test der Unabhängigkeitshypothese für die Zufallsvariablen X und Y verwendet man hier anstelle des Spearmanschen Rangkorrelationskoeffizienten zumeist die Hotelling - Pabst - Statistik n
D=
2 l [R(x ) - R ( y )] i=l 2
als Prüfgröße. Dabei ist D = n(n —1) (1—r^) / 6 , falls keine Bindungen vorliegen. Die Hypothese Η : X und Y sind unabhängig
280
Teil I: Übungsaufgaben,
muß zugunsten der
Erläuterungen
Lösungen
Alternative
H^: X und Y sind nicht z u m N i v e a u OL v e r w o r f e n w e r d e n , D < h
und
oder
η;α/2
unabhängig falls D > h
η;l-d/2
gilt. Einige kritische Werte h^ ^ sind in Cab. C10*3.1 weitere ergeben sich aus der h
η;1-γ
(tab. C I O . 3 . 1 :
η
h
zusammengestellt;
Beziehung
= \ · n(n2-l ) - h 3 η?γ
Kritische Werte h
des Unabhängigkeitstests η; Υ der Hotelling - Pabst - Statistik
h
n;0.025
6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
6 14 24 38 60 86 120 162 212 270 340 420 512 618 738
h
n;0.05
bei
Verwendung
n ;0.10 14 26 42 64 92 128 172 226 290 364 450 550 664 790 934
8 18 32 50 74 104 144 190 246 312 390 480 582 696 826
Bei genügend großem Stichprobenumfang η ist auch die Durchführung approximativen Tests möglich, denn die
eines
Prüfgroße
D-Dj
fr mit
η
1
1 °2
ν Λ 3=1
d
( 3
,3 li ^
1 " 1 122 ?
f Σ
k=l
.3 W
.
d
"2k 3
?
3 \
36 (
i s t u n t e r H^ die R e a l i s a t i o n e i n e r a p p r o x i m a t i v N ( 0 , 1 ) - v e r t e i l t e n
Zufalls-
281
Kapitel 10: Abhängigkeitsanalyse - Korrelation und Assoziation
variablen. Dabei bezeichnet ρ bzw. q die Anzahl der unterschiedlichen Werte x. bzw. y. in der ersten bzw. zweiten Beobachtungsreihe, d ^
bzw. d^^ die
Anzahl der Beobachtungen, die mit dem j-ten dieser unterschiedlichen Werte in der ersten bzw. zweiten Reihe identisch sind. (Liegen in beiden Beobach2 = n ( n -1) / 6 und
tungsreihen keine Bindungen vor, so ist D 3 2 2
D^ = η (η -1) (n+1) / 36.) Die Hypothese H^ ist somit zum Niveau Ol zu verwerfen, falls
Der Spearmansche Rangkorrelationskoeffizient als Schätzer für die Abhängigkeit zwischen Temperatur (X) und Luftfeuchtigkeit paarweisen Meßergebnissen (x^ ,y 1 ),...
(Y) soll anhand von
η=10
bestimmt werden. Dazu wird
zunächst eine Arbeitstabelle, vgl. Iah. CIO.3.2, erstellt, in der neben den Beobachtungswerten und deren Rangzahlen einige weitere, die Berechnung erleichternde Hilfsgrößen aufgeführt sind. Die Korrelation zwischen Temperatur und relativer Luftfeuchtigkeit wird damit geschätzt durch
10
I i=1
V (
I
R ( x . ) R ( y · ) - 0.25 · 10 · 1
1
R(xi ) 2 - 0.25 - 1 0 · "
2
) · ( . Ι
330 - 3 0 2 . 5
27.5
v/(385 - 3 0 2 . 5 ) ( 3 8 4 . 5 - 3 0 2 . 5 )
\/6765
= 0.3343
,
i r
R ( y i ) 2 - 0 . 2 5 · 10 · 1 1 2 )
.
lab. CIO.3.2: Arbeitstabelle zur Berechnung des Spearmanschen
Rangkorrela-
tionskoeffizienten bzw. der Hotel 1ina - Pabst - Statistik
i 1 2 3 4 b 6 7 8 9 10 I
x
i
17 2 19. 9 15. 6 26. 7 14. 5 18. 7 23. 5 19. 7 18. 1 19. 5
y
i
59 56 62 59 42 65 72 68 47 61
Rfx,.)
R(y n -)
R^·)2
RCy n -) 2
R(xi)R(yi)
R(x.j) - R(y.j)
3 8 2 10 1 5 9 7 4 6
4.5 3 7 4.5 1 8 10 9 2 6
9 64 4 100 1 25 81 49 16 36
20.25 9 49 20.25 1 64 100 81 4 36
13.5 24 14 40.5 1 40 90 63 8 36
-1 5 5 -5 5 5 0 -3 -1 -2 2 0
55
55
385
384.5
330
282
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
Auch hier soll nun anstelle des Korrelationskoeffizienten r^ die HotellingPabst - Statistik beim Test zum Niveau α = 0.10 der Hypothese Hg: die Temperatur X ist unabhängig von der relativen Luftfeuchtigkeit Y gegen die Alternative Hj: die Temperatur X ist nicht unabhängig von der relativen Luftfeuchtigkeit Y verwendet werden. Aus Tab. L10.3.2 ergibt sich für die Prüfgröße [R(x.) - R(y·)] 2 = (-1 .5) 2 + 5 2 + (-5) 2 + . . . + 2 2 + 0 2 = 100.5
D= i=1
1
1
Bei einem Signifikanzniveau α = 0 . 1 0 erhält man aus Tab. L10.3.1 die kritischen Werte h
n;a/2
= h
10;0.05 =
74
h
n;1-a/2-h10;0.95 = r
' 10
-(1°2-15-h10;0.05
= 33
°-
74 = 256
'
d.h. da D = 100.5 {Γ 74 = h„. ,, η ;α/2 D = 100.5^-256 = h
.
und ,,
kann die Hypothese der Unabhängigkeit von Temperatur und Luftfeuchtigkeit nicht verworfen werden. Die aufgestellte Theorie kann also bei einem Niveau von 10% nicht signifikant bestätigt werden.
-*(b) Der Kendallsche Rangkorrelationskoeffizient τ stellt eine weitere Basis zur Durchführung eines nichtparametrischen Tests über die Unabhängigkeitshypothese dar. Dieser wird ebenso wie der Spearmansche Rangkorrelationskoeffizient aus den Rangzahlen, die den η Realisationen der Zufallsvariablen X und Y wie im Aufgabenteil (a) angegeben,zugeordnet werden, berechnet. Abweichend ist es in diesem Fall aber angebracht, den jeweils gleichen Beobachtungen (Bindungen) einer Beobachtungsreihe nicht die 'midranks' zuzuordnen, sondern die zugehörigen Rangzahlen zufällig auf diese zu verteilen (Randomisieren). Zur Ermittlung von Kendalls τ werden nach Vergabe der Rangzahlen Rfx^) und R(y^), i=l,...,n , die Beobachtungspaare im ersten Paar der Rang der Realisation
so geordnet, daß
von X gerade 1 ist, im zweiten Paar
der Rang der Realisation von X gerade 2 ist,..., im n-ten Paar der Rang der Realisation von X gerade η ist. Durch diese Anordnung ist dann die Reihenfolge der Rangzahlen der Realisationen y ,...,y
von Y eindeutig festgelegt.
Kapitel 10: Abhängigkeitsanalyse - Korrelation und Assoziation
283
Betrachtet man nun diese Reihenfolge, so wird anschließend für jede Rangzahl R(y^) die Anzahl
der Rangzahlen R(y^) , die kleiner als R(y^) sind
und in der neuen Anordnung der Ränge hinter R(y^) stehen, für i=l,...,n bestimmt. Der Rangkorrelationskoeffizient von Kendall ergibt sich dann zu
4·
1 -
l q. 1=1 η · (η - 1)
Mit Hilfe der auf diese Weise geschätzten Korrelation zwischen X und Y läßt sich auch hier ein Testverfahren auf Unabhängigkeit konstruieren. Ist also die Hypothese Η^: X und Y sind unabhängig gegen die Alternative Hj: X und Y sind nicht unabhängig zum Niveau α zu testen, dann kann dabei die sogenannte Kendallsche Κ - Statistik
K =
η · (η - 1) 2 "
τ
'
verwendet werden, deren zugehörige Verteilung die Quantile
K n-1
_
liefert,
von denen einige in Cab. CIO.3.3 vertafelt sind. Die Hypothese H^ wird zum Niveau α verworfen, falls |K
l>Kn;l-a/2
gilt.
Cab. CIO.3.3: Kritische Werte K^.j
des Unabhängigkeitstests bei Verwendung
der Kendallschen Κ - Statistik
η
Si;0.995
K
n;0.975
K
n;0.950
6
14
11
9
7
17
13
11
8
21
16
14
9
25
19
16
10
29
23
19
15
52
40
34
20
80
59
49
25
110
84
71
30
145
111
93
284
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
Stehen keine kritischen Werte zur Verfügung und ist η hinreichend groß, so kann auch die Prüfgröße K*=
5 V n (n - 1) (2n+ 5) / 18
herangezogen werden. Die zu K* gehörige Zufallsvariable unterliegt unter der Unabhängigkeitshypothese approximativ einer Ν(0,1) -Verteilung. Die Hypothese Hp kann also bei
lKll>ul-a/2 zum Niveau α verworfen werden. Ober die zehn vorliegenden Beobachtungspaare (x1 , y 1 ) . .
,y 1 0 ) von
(X,Y) = (Temperatur, Luftfeuchtigkeit) soll zunächst der Korrelationskoeffizient τ von Kendall als Schätzwert für die Korrelation von Temperatur und Luftfeuchtigkeit ermittelt werden. Ausgehend von Tab. L10.3.2 werden dazu alle Schritte, die zur Bestimmung der q^, i=1
10 , notwendig sind, in
nachfolgender Arbeitstabelle, vgl. Iah. CIO.3.4, durchgeführt. Die Ränge 4 und 5 für die Realisationen y^ = y ^ = 59 wurden dabei zufällig vergeben. So ergibt sich etwa für qg der Wert 3, da unterhalb der Rangzahl R(yg) = 8 in der gegebenen Reihenfolge drei Rangzahlen der Realisationen von Y kleiner als 8 sind (6,3,4).
Cab. CIO.3.4: Arbeitstabelle zur Berechnung des Kendallschen Rangkorrelationskoeffizienten i
R(x.j)
R(y i )
q
i
5
1
(14.5 , 42)
1
0
3
2
(15.6 , 62)
7
5
1
3
(17.2 , 59)
5
3 0
9
4
(18.1 , 47)
2
6
5
(18.7 , 65)
8
3
10
6
(19.5 , 61)
6
2
8
7
(19.7 , 68)
9
2
2
8
(19.9 , 56)
3
0
7
9
(23.5 , 72)
10
1
4
10
(26.7 , 59)
4
0
I
55
55
16
Kapitel 10: Abhängigkeitsanalyse - Korrelation und Assoziation
285
Damit berechnet s i c h der K o r r e l a t i o n s k o e f f i z i e n t von Kendall zu 10
4· τ = 1
Σ
Qi
-Ϊ0ΤΤΓ^ΓΤ=1
-
^
=
0-2889
.
Zum Niveau α = 0 . 1 0 s o l l noch einmal die Hypothese H q : Temperatur X i s t unabhängig von der r e l a t i v e n L u f t f e u c h t i g k e i t Y gegen die A l t e r n a t i v e H ^ Temperatur X i s t nicht unabhängig von der r e l a t i v e n
Luftfeuch-
tigkeit Y getestet werden. Mit dem soeben berechneten Kendallschen
Korrelationskoeffi-
zienten e r g i b t s i c h für die T e s t s t a t i s t i k K r
n- (n-1).T
=
lO^J.o^ggg
g
13-0005
>
so daß wegen ( v g l . Tab. L10.3.3) Κ
η;1-α/2
= K
10;0.95
= 19
auch hier die Unabhängigkeitshypothese zum 10% Niveau n i c h t verworfen werden kann, denn 13.0005 H 9 - K n ; 1 _ a / *
LÖSUNG
ZU
AUFGABE
10.A
Bei einer angestrebten Analyse der Abhängigkeit zwischen zwei (diskreten bzw. diskretisierten) Zufallsvariablen, die jeweils nur 'wenigeverschiedene Ausprägungsmöglichkeiten besitzen, so daß bei η beobachteten Paaren "viele" gleiche Werte, d.h. Bindungen auftreten, können die bisher behandelten Methoden der Korrelationsanalyse nicht mehr zur Anwendung kommen. Als Ausgangspunkt der für diesen Fall bereitstehenden Verfahren betrachte man zunächst die gemeinsame Verteilung des Zufallsvektors (X,Y).Werden die k'i, verschiedenen Ausprägungsraöglichkeiten mit (a^,bj), i = l,...,k, j = 1 b e z e i c h n e t , so ordnet man dabei
der Übersicht wegen (vgl. Aufgabe 3.14) die Einzelwahr-
scheinlichkeiten Ρ (X = a. , Υ = b.) = p. . ι : ιί
für i = l,...,k und j = l,..., I
286
Teil l: Übungsaufgaben, Erläuterungen und Lösungen
welche die gemeinsame Verteilung kennzeichnen, sowie die Randwahrscheinlichkeiten
£ P(X = a.) = 1
P(Y = b.) = 3
y p..=p. j=l 1 3 k l
p. . = p
, 1 = 1,.. . ,k
.
ο
, j=l
welche die Randverteilungen von X und Y eindeutig bestimmen, in einer (kx £) Tafel, vgl. Cab. £10.4.1, an. Dabei gilt k
l
k
i
I I p ( i = ί ρ, 11 i=l j = 1 i=l
=
I ρ , 5 j = l "J
1
Hab. CIO.4.1: (k*£) - Tafel der gemeinsamen Verteilung zweier (diskreter) Zufallsvariablen X und Y
\
Y b
x
\
1
···
1
P
11
· •
a
k
P
kl
· •
P.1
· •
p
p
u
1.
•
a
·
CL ^
l
p
k£
1
P.i
Werden nun η unabhängige Beobachtungen von (X,Y) gemacht und hält man dabei fest, wie oft die Ausprägungskombination
(a^,bj eingetreten ist, so lassen
sich diese beobachteten, absoluten Häufigkeiten, die mit
, i=l,...,k ,
j=l,...,& , bezeichnet werden sollen, ebenfalls in einer (kxH) - Tafel, vgl. Cab. CIO.4.2, der sogenannten
(kxS.) - Kontingenztafel
(vgl. Kapitel 12), fest-
halten. Die Randhäufigkeiten
η. χ
η
= ·
Ζ ) η.. j=l 1 3
k . = Υ i=l
n. . ^
, i=l,...,k
.
bzw.
, j = l,...,{,,
liefern dann gerade die beobachtete Anzahl des Ausprägungswertes a^ von X bzw. b. von Y. Insgesamt ist natürlich
Kapitel 10: Abhängigkeitsanalyse - Korrelation und Assoziation
k l k y y n.. = y π3 i=l j=l i=l
Iah. £10.4.2:
Y
x \
b
1
·
•
a
1
"ll
·
a
k
"kl
· •
n
·
I
.1
l £ j=l
η . = η . J Ί
(k*Z) - Kontingenztafel
σι«
\
n. = ι.
287
l
u
n
n
"1.
n
U
k. ri
Ist k=2 und 1=2, d.h. weisen die Zufallsvariablen X und Y jeweils nur zwei verschiedene Ausprägungen auf, so heißt die (2*2) -Kontingenztafel auch Vierfeldertafel .
-»(a) Eine Möglichkeit,die Abhängigkeitsstruktur von X und Y in einer (2x2) Tafel zu charakterisieren, stellt das Q - Maß von Yule dar, das mit P
11P22 ~P12P21
" 11P22 P
+ P12P21
gegeben ist. Für dieses gilt -1 < Q < 1 wobei allerdings die Werte +1 und -1 nicht nur bei vollständiger Abhängigkeit von X und Y angenommen werden, sondern schon dann, wenn mindestens ein p^j = 0 ist. Bei Unabhängigkeit gilt Q = 0. Dieses zu den sogenannten Assoziationsmaßen
(Zusammenhangsmaßen) zählende
Maß wird aus der Kontingenztafel geschätzt durch den Yuleschen Assoziationskoeffizienten "
n n
iln22-n12n21
~ lln22
+ n
i2 n 21
der häufig auch mit Α
'
bezeichnet wird.
288
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
Ein approximatives Konfidenzintervall zum Niveau 1 - α für Q ist durch [Q!.Q2] mit
η
ϊ
A l
"12
ι 1
0
'-a/2 ä =Q + u
2
,,
1
, " 2— · (1 - 0 ) ·
η
/ A l
+
i n
r~
21
"22
ϊ ϊ + + "12 "21 n 2 2
gegeben. Um den Einfluß der Rauchgewohnheit X mit den Ausprägungen a 1 = 'Raucher 1 , = 'Nichtraucher' auf die Erkrankung an einem Bronchialkatarrh Y mit den Ausprägungen b^ = 'Ja' und b^ £ 'Nein' zu schätzen, werden zunächst die in der Aufgabenstellung gegebenen Beobachtungswerte in einer (2*2) - Kontingenztafel übersichtlich zusammengestellt, vgl. tab. CIO.4-3.
iah. CIO.4.3: Bronchialkatarrherkrankungen bei Rauchern und Nichtrauchern
Ja (b,)
Nein (b 2 )
35
15
50
27
43
70
62
58
120
Raucher (a^)
Nichtraucher
(a^)
Ϊ
I
Damit ergibt sich für den Yuleschen Assoziationskoeffizienten als Schätzer für den Zusammenhang zwischen X und Y ι . 35 - 43 - 27 - 15 _ 1100 " 35 · 4 3 + 27 · 15 1910
y
=
„
575g
-
Zum Niveau 1 - α = 0.90 soll nun noch ein Konfidenzintervall tionsmaß Q bestimmt werden. Mit u^_ a y2 Grenzen dieses
= u
für das Assozia-
o 95 = 1 -6449 erhält man für die
Intervalls
Q, = 0 . 5 7 5 9 - 1 . 6 4 4 9 4 . ( 1 - 0 · 5 7 5 9 2 ) . / ^
+ ί
^
+
= 0.5759 - 1.6449 · 0.3342 · 0.3944 = 0.5759 - 0 . 2 1 6 8 = 0.3591
^
Kapitel 10: Abhängigkeitsanalyse - Korrelation und Assoziation
289
Q 2 = 0.5759 + 0.2168 = 0.7927 d.h. als 0.90 - Konfidenzintervall [0.3591 , 0.7927]
-»(b) Da zwei (diskrete) Zufallsvariablen X und Y als (stochastisch) unabhängig anzusehen sind, wenn die gemeinsame Verteilung als Produkt der Randverteilungen darstellbar ist (vgl. Aufgabe 3.14.C), läßt sich die Hypothese der Unabhängigkeit von X und Y hier durch Η : rρ . = p. 0 i] "ι.
·ρ .
für alle i = l , .. . ,k , j = l ,...,{.
,
zum Ausdruck bringen. Diese ist zum Niveau CL gegen die Alternative H^ : ρ.
ρ.
·ρ
für mindestens ein Paar (i,j)
zu testen. Das Testverfahren beruht auf der Prüfgröße 2 k Z I η. . - m. .) χ = l l m i=i j=i ij 2
Die Größe m _
mit
η.·η. m..=-±= ^
.
gibt dabei, falls Unabhängigkeit zwischen X und Y vorliegt,
eine Schätzung für die erwartete Anzahl der Beobachtungen für die Ausprä2 gungskombinationen (a.,b.), i=l,.. . ,k , j = l,...,£. , an. Da χ unter der Hy1 3 2 pothese H^ die Realisation einer approximativ "Verteilten Zufallsvariablen darstellt, kann die Hypothese der Unabhängigkeit zum Niveau a verworfen werden, wenn 2 X
>X 2
(k-1) M - l ) ,-1-α
erfüllt ist. Die verwendete Approximation ist dabei in der Regel zufriedenstellend, wenn in jedem Feld (Zelle) der (k*£.) - Tafel η
> 5 Beobachtungen
vorliegen bzw. m^j > 5 unter der Hypothese zu erwarten sind (Faustregel). Liegt eine Vierfeldertafel vor, d.h. ist k = 2 , l = 2 , so läßt sich die angegebene Formel für die Prüfgröße weitgehend vereinfachen, denn es gilt
2 x
l
f
(n
1•= 1, 3Α= 1
Aus dem im Aufgabenteil
ij-mi1)2 m
(n
lin22'nl2n21>2
-i·j
(a) bestimmten Assoziationskoeffizienten der Höhe
290
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
Q = 0.5759 sowie dem zugehörigen Konfidenzintervall
ist bereits zu erkennen,
daß mit ziemlicher Sicherheit eine Abhängigkeit zwischen der Rauchgewohnheit X und der Bronchialkatarrherkrankung Y vorliegt. Die Vermutung soll nun noch zum Niveau a = 0 . 1 0 signifikant abgesichert w e r d e n , d.h. es gilt H
0 : Plj = Pi. - P . j
> i = 1 > 2 , j = 1,2
,
gegen H1: ρ
+p.
·ρ ^
für mindestens ein
(i,j)
zu testen. Mit den bereits in Tab. L10.4.3 zusammengestellten
Häufigkeiten
n ^ , i,j == 1,2 , die von dem Arzt beobachtet wurden, ergibt sich für die Prüfn ij' ' große der Wert 2 X
=
120 · (35 · 4 3 - 15 · 2 7 ) 2 50 · 62 . 70 · 58
145200000 . „ „c 12586000 " 1 1 · 5 3 6 6
=
c
·
Dieser ist bei einer mit Irrtumswahrscheinlichkeit von höchstens a = 0.10 zu treffenden Entscheidung wegen k = 2 und 1 = 2 mit
x
(k-1)(£-1);1-a
= x
1;0.90
=
2
·706
zu vergleichen. Da also x 2 = 11 .5366 > 2.706 = x
2
k
.
1 ) ( j l
.
l )
.l.
a
,
muß die Unabhängigkeitshypothese zum 10% Niveau, wie erwartet, verworfen werden.
LOSUNG
ZU A U F G A B E
10.5
->(a) Die gemeinsame Verteilung der zufälligen Größen Arbeitslosigkeit X und Geschlecht Y ist in nachfolgender ( 2 x 2 ) - T a f e l , vgl. Cab. CIO.5.1, dargestellt ( v g l . A u f g a b e 10.4). Dabei wurden die
Ausprägungsmöglichkeiten
a^ = 'Ja' und a g ^ ' N e i n ' von X sowie b^ = 'Weiblich' und b^ = 'Männlich' von Y jeweils mit Τ
und '2' kodiert, so daß in diesem Fall für i,j=1,2
P ( X = i . Y = j) = P i0 · P(X = i) = P i P(Y = j) = P.j gilt.
,
.
Kapitel 10: Abhängigkeitsanalyse
Iah.
\
CIO.5.1:
Y x
Gemeinsame
1
Verteilung
2
P
2
Σ
Für
die
sowie
11
P
12
p
1.
P
21
P
22
p
2.
p
.1
p
.2
Korrelation
stellte
mit
(X,Y) = (Arbeitslosigkeit,
291
Geschlecht)
1
ρ zwischen
(vgl. A u f g a b e
X und Y
3.14) e r h ä l t
(vgl. A u f g a b e
der
3.6)
E(X) = 1 · P(X = 1) + 2 · P(X = 2)
=
+
E(Y) = 1 . P(Y = 1)
=
+ 2 · p>2
den
und Assoziation
I
\
1
von
- Korrelation
2 · P(Y = 2)
+
2 · P2>
=
1 +P
,
2 -
= 1 + p_2
Varianzen Var(X) = E(X2) - (E(X))2
= P
1.
=
2.p1.
p
+ 4
' p2. "
1
= 1 · P(X = 1) + 4 · P(X = 2) - (1 + p 2 _ ) 2
"
2
'p2."
P
=
2.
p
2. " p2.
=
p
2. "
(1
"
p
2.'
·
Var(Y) = E(Y2) - (E(Y))2
= 1 · P(Y = 1 ) + 4 · P(Y = 2) - (1 • p _ 2 ) 2 2
bzw.
der
= P
.1
=
P
+ 4
' p.2 "
1
"
2
' p.2 " p.2
=
p
.2 *
"
p
.25
.2P.1
Kovarianz Cov(X.Y) = E(XY) - E(X) ·
E(Y)
= 1 · 1 · P(X = 1 ,Y = 1 ) + 1 · 2 · P ( X = 1 ,Y = 2 ) + 2 · 1 · PCX = 2 , Y = 1 ) + 2 · 2 · P ( X = 2 , Y = 2 ) - E ( X ) · E ( Y ) = p
n
+ 2·
= 1 + P
gerade
die
Größe
1 2
P
+ P
1 2
2 1
+ 2 ·
+ 3- p
= p
22 " p2.p.2
=
p
=
P
P
1 2
1 1
P
2 2
- P
2 1
p21 + 4 · 2 2
-
1 _
p 2 2 - (1 + p 2 > ) · (1 + p_2) P
2
. " P . 2 "
P
2 .
P
22 " p21p22 " p22p12 " p22 "
. 2 p
21p12
Ange-
292
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
Cov(X,Y)
=
p
11p22 " p21p12 / P 1 ,P.1P2.P.2
V V a r t X ) · Var(Y)
Diese soeben berechnete Korrelation ρ heißt auch Phi - Koeffizient. Für dieses Assoziationsmaß gilt p = 0 bei Unabhängigkeit von X und Y; die Werte +1 bzw. -1 werden bei strikter linearer Abhängigkeit von X und Y angenommen, d.h. wenn p J 2 = P 2 1 = 0 bzw. p
n
= p 2 2 = 0.
->(b) Der Phi - Koeffizient als Zusammenhangsmaß in der ( 2 x 2 ) - T a f e l
(vgl. Auf-
gabe 10.4) wird geschätzt mit den absoluten Häufigkeiten aus der Kontingenztafel
durch n 11 n 22
'
n 12 n 21
/n1.n2.n.1n.2 In Cab. CIO.5.2 sind die von dem Angestellten registrierten
Beobachtungswerte
der Zufallsvariablen Arbeitslosigkeit X und Geschlecht Y bei den insgesamt vier verschiedenen Ausprägungskombinationen
(i,j) , i ,j=1,2 , festgehalten.
Die in der Aufgabenstellung fehlenden Werte wurden entsprechend ergänzt.
Cab. £10.5.2: ( 2 * 2 ) - Kontingenztafel, Arbeitslosigkeit bei Männern und Frauen
Geschlecht Arbei tsl
Weiblich
Männlich
1
2
Ja
1
9
6
15
Nein
2
20
30
50
29
36
65
I
Die im Aufgabenteil
(a) berechnete Korrelation ρ kann aufgrund der Stichpro-
benwerte also mit 9 · 30 - 6 · 20 — \/15 · 50 · 29 · 36 geschätzt werden.
=
150 \/783000
=
Q J 6 g 5
293
Kapitel 10: Abhängigkeitsanalyse - Korrelation und Assoziation
10.6
LÖSUNG ZU A U F G A B E
-»(a) U m d e n Z u s a m m e n h a n g
(die A s s o z i a t i o n )
zwischen zwei
variablen X und Y mit möglichen Ausprägungen
a^ ,.. .
schätzen, verwendet man häufig den Pearsonschen
(diskreten)
Zufalls-
b z w . bj,...,bj£
zu
Kontingenzkoeffizienten
wobei k
l
l
x2 = I gerade der
η. η
(n. . - m. ,) 2 13
^
im U n a b h ä n g i g k e i t s t e s t
entspricht.
Für C
-
-
l]
V
, i=l,...,k
η
, j = l,...,Jl,
(vgl.
gilt
Aufgabe
10.4.b)
verwendeten
Prüfgroße
m i n (k, 5.)
Um einen Assoziationskoeffizienten kann, w i r d der Pearsonsche daß
m.. =
-it
zu erhalten, der auch den W e r t
Kontingenzkoeffizient
oft dahingehend
1 annehmen korrigiert,
man c
=
corr als korrigierten
/ m i n (k, r ν m i n (k , l) - 1
Q
Pearsonschen Kontingenzkoeffizienten
verwendet.
Bezeichnet X die zufällige Größe 'Altersstufe', die mit k = 3 Ausprägungsmöglichkeiten angegeben ist, und Y die Zufallsvariable 'Käsesorte1 mit £. = 4 Ausprägungsmöglichkeiten, so sind in Cab. £10.6.1 die beobachteten Häufigkeiten für die Ausprägungskombinationen (a^,bj), i=1,...,3 , j=1,...,4 als (3x4)Kontingenztafel
(vgl. Aufgabe 10.4) noch einmal aufgeführt. Weiterhin werden
in dieser Tabelle die zur Berechnung des Pearsonschen Kontingenzkoeffizienten benötigten, geschätzten erwarteten Häufigkeiten m-jj=n.j " j / 200 , i=l,...,3, j=1,...,4, (bei Annahme X und Y unabhängig) berechnet. Für m 2 3 erhält man z.B. n
m
2 3
2.n.3 64 · 53 = — — = - 2 ö ö - = 16.96
.
Zur Überprüfung der eigenen Rechenergebnisse bediene man sich der Beziehungen 3 l
4 ι
i=1 j = 1
3 I
m. . = η = 200
bzw.
1J
m.. = η ,
,
4 l
m.
= η.
, i=1,...,3 , j = 1,...,4
.
294
ο ο 2].
-•(a) Die Methode der kleinsten Quadrate (KQ - Methode) stellt ein Verfahren dar, um Punktschätzer b^ und b^ für die Parameter ß^ und ß^ eines linearen Regressionsmodells zu ermitteln. Dabei wird eine Regressionsgerade
*=V
V
als Schätzer für den Erwartungswert E(Y) so bestimmt, daß die Summe der quadratischen vertikalen Abweichungen der beobachteten Werte y. von den durch die Regressionsgerade an den Stellen x^ gelieferten Werten y i = b Q
+ b
X 1
i
minimal wird. Als Lösung dieses Minimierungsproblems
Minimiere
? 2 ) (y. - b . - b . x . ) ^Jj ι 0 1 ι
bzgl. der Unbekannten b. und b, ' O l
304
ergibt
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
s i c h f ü r den S t e i g u n g s p a r a m e t e r
η l b
(x1-x)(yi-y)
b z w . das A b s o l u t g l i e d
Schätzwert
sxy
η : ι (χ.-ί)2 1 1=1
i
ß^ d e r
S
Γ x
'
ß^ w i r d g e s c h ä t z t
durch
b ^ y - b j i
=
1
n
_
y
χ
·
• ι
η . . 1=1
n
1
y = — η
y 1=1
.
y·
ι
Da vermutet werden kann, daß d i e Ersparnisse (Y) annähernd l i n e a r vom v e r fugbaren Einkommen (X) abhängen, s o l l e n d i e Parameter ßg und ß^ d i e s e r Beziehung nach der Methode der k l e i n s t e n Quadrate geschätzt werden. Aus den f ü r η = 10 Jahre vorliegenden Beobachtungswerten ergeben sich m i t -
x
=
ι y TÖ .i,
x
i
1 10 ' = ! . [ ,
ι TT
536
= 53
1 =to-
5 8
=
=
5
·6
'
·8
die Schätzwerte bg und b^ nach der KQ - Methode zu
10
10
I (X, - x ) ( y , - y ) I x,y,-iOxy 1 1 . _ i=1 _ i =1 1 1 _ 3349.64 - 3108.80 D 1 TO ; Π5 : Γ = 30447.30 - 28729.60 y (χ,-χ)^ y χ. - i o x 1 i=1 i=1 1 =
240 84 · = 0 1402 1717.70
und b Q = y - 0.1402 · χ = 5.8 - 0.1402 · 53.6 = - 1.7147
.
Somit kann a l s o das verfügbare Einkommen eines Jahres geschätzt werden durch y = - 1 .7147 + 0.1402 χ
.
Diese Regressionsgerade i s t i n Abb. C H . 1 . 1 gemeinsam m i t den paarweisen Beobachtungswerten (x^
i=1,...,10,
dargestellt.
305
Kapitel 11: Regressionsanalyse
A b h . C H . 1 * 1 : Verfügbares Einkommen und Ersparnisse in η = 10 Jahren sowie die geschätzte Regressionsgerade y = - 1 .7147 + 0.1402 χ
-»(b) Die Varianz σ
der Zufallsvariablen Y^, i=l,...,n, die gleichzeitig
auch die Varianz des zufälligen Fehlers angibt und daher oft auch als Fehlervarianz bezeichnet wird. läßt sich schätzen durch
s2 =
(y
?
1=1
i " V
2
mit
y
i
= b
0
+
V i
Die in diese Formel eingehenden Abweichungen
y
i -
y
i
= y
i -
b
o - V i
'
1=1
'
werden auch Residuen der Regression genannt. Ein (1 - α) - Konfidenzintervall für die Varianz σ (n-2)s2 ^n-2; 1 -α/2
In tab. C H . 1 . 1
ist bestimmt durch
(n-2)s2 n-2 ;a/2
sind die für η = 10 Jahre beobachteten Ersparniswerte y ^ ,
die zugehörigen Werte der Regressorvariablen
'Verfügbares Einkommen 1
x.
306
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
sowie die mittels linearer Regression geschätzten Werte y^ = - 1 .7147 + 0.1402x.j und die Residuen y^ -y.. für i=1,...,10
zusammengestellt.
C a h . £11.1.1: Beobachtungen y ^ , x ^ , geschätzte Werte y^ sowie Residuen
yi
-yiS
i=1
10
X
i
y
1
2 8
34. 2
3 0801
- 0 2801
2
4 1
40 8
4 0055
0 0945
3
4 5
42 5
4 .2438
0 2562
4
4 3
47 3
4 9168
-0 6168
5
4 .9
50 1
5 .3093
- 0 4093
6
5 .8
52 6
5 .6598
0 1402 0 7373
i
y
i
7
7 .0
56 9
6 .2627
8
7 .7
61 4
6 .8936
0 8064
9
8 .1
73 5
8 .5900
- 0 4900
10
8 .8
76 7
9 .0386
- 0 2386
2 Damit ergibt sich als Schätzer für die Varianz σ s- = x n — r 2 " ^ 1
ι (y i - y ^ 10 1=1
2
gerade
= g- [( - 0.2801 ) 2 + 0.0945 2 +...+ ( - 0.2386)'
= i · 2.2116 = 0.2765
.
2 Mit den Quantilen der χ 8 - Verteilung
V2;1-a/2
*n-2;a/2
= x
= X
8;0.95 =
8;0.05
=
2
15
"51
u n d
"733 2
ist das gesuchte Konfidenzintervall [8^2765 gegeben.
_ 8 · 2 0.2765|
zum Niveau 1 - α = 0.90 für σ =
[0
. 1 4 2 6 , 0 .8094]
.
also in
307
Kapitel 11: Regressionsanalyse
-(c) Das Bestimmtheitsmaß d e r Regression . 2 (y
A B
i-yi
1
Y,X =
m i t
y
i
= b
o
+
V i
'
1=1
n
'
(y-y)2
l i =l
d i e n t a l s Maß f ü r d i e Güte der Anpassung der g e s c h ä t z t e n
Regressionsgeraden
an d i e Beobachtungswerte. Dies g i b t den A n t e i l der Varianz von Y an, der durch d i e Regression e r k l ä r t werden kann. Für das Bestimmtheitsmaß g i l t 0 k+l] ,2 =
Γ Γ Γ Τ Τ
ι
x=l
( y
i - y i
( x
i
V
Es wird vermutet, daß in der BONBONREPUBLIK die pro Einwohner konsumierte Gummi bärchenmenge Y vom Preis X^ u n d vom P r o - K o p f - E i n k o m m e n X 2 a b h ä n g t , d.h. es soll eine Nachfragefunktion der Gestalt y = b Q + b1x1 + b 2 x 2 geschätzt werden. In t a b . C H . 3 . 1
sind die in η = 7 Jahren beobachteten A u s -
prägungswerte noch einmal neben einigen im weiteren benötigten
Hilfsgrößen
zusammengestel 11.
tah. C H . 3 . 1 : Beobachtete Werte y ^ Werte x ^ , x 2 i d e r Regressoren, Schätzwerte y i ( x 1 ,x 2 ) u n d Residuen y i - y i ( x 1 ,x 2 ), i=1,...,7
Χ
i
Ii
x
2i
(x1 , χ 2 )
y
i - y i
( x
i '
x
1
2 59
4 34
1826
2 .6240
- 0 0340
2
2 77
4 29
1831
2 .7069
0 0631 - 0 0304
3
2 86
4 16
1834
2 .8904
4
2 88
4 20
1842
2 .8625
0 0175
5
2 93
4 12
1836
2 .9504
- 0 0204
6
3 05
4 03
1847
3 .1060
- 0 0560
7
3 22
3 98
1843
3 .1601
I
20
30
29
12
12859
0
0599
2
}
320
Teil I: Übungsaufgaben, Erläuterungen und
Lösungen
Mit den Durchschnittswerten 1 7 1 y = τ l y,· = ) · 2 0 · 3 0 ' 1=1 1 ' 7
1
•xi
x
=
ii
=
χ
9il · = Τ/ ·
r
7
1
.
1 x
7 ^
9c = τ/
=2·90
I i=1
2 9
1
·
1 2
12859
= 4,16
=
'
1837
berechnet man zunächst SQY X
=
ϊ
2
=
v
v
=
V
SPX
7 y
i 1 7 y
γ
=
7 l
= 23622311 - 23621983
= 328
,
^
x, .x,. - 7x,x 0 = 53488.54 - 53493.44 = - 4 . 9 0 ^1 ^1 ' t-
x . . y . - 7 x , y = 84.2962 - 84.4480 = - C . 1518 11
i =1
,
1
ίΛ
i=1
12
SPV
11
i=1
SQv
SPV
x2.. - 7x? = 121 .2410 - 121 .1392 = 0.1018
= l
1
1
,
,
1
x 2 i y i - 7x 2 y = 37298.70 - 37291 .1 0 = 7.60
.
Die K l e i n s t e - Quadrate - Schätzer b^ und b^ ergeben sich a l s Lösung des somit festgelegten
Normalengleichungssystems
0.1018 b 1 -
4.9000 b 2 = -0.1518
- 4.9000 b 1 - 328.0000 b 2 = 7.6000
b 1 = - 1 .3379 b2 =
0.0032
, .
Weiterhin kann dann a l s o wegen bQ = y - b 1 x 1 - b 2 x 2 = 2.90 + 1 .3379 · 4.16 - 0.0032 · 1837 = 2.5873 mit y = 2.5873 - 1 .3379 x, + 0.0032 x 2 eine geschätzte Nachfragefunktion f ü r Gummibärchen angegeben werden.
Kapitel 11: Regressionsanalyse
321
Die Schätzwerte y . = y i ( x 1 ,x 2 ) = 2.5873 - 1 . 3 3 7 9 χ 1 · + 0.0032 χ 2 ·
, i =1
7
,
die sich aus der multiplen Regressionsgleichung ergeben, sind ebenso wie die Abweichungen y , · - y i = y i - y i ( x 1 ,x 2 )
, i=l,...,7
, 2
bereits in Tab. L11.3.1 angegeben, so daß der Schätzer für die Varianz σ bei k = 2
berechnet werden kann: s2 =
. 2 . 1
7
(yn- " V i ) 2
l
= j · 0.0135 = 0.0034
.
•(b) Das m u l t i p l e B e s t i m m t h e i t s m a ß
( v g l . Aufgabe
I i =l BY,(X
y
i
= y
i
Xk ) "
1
( x
l
= { ( ( - 0.0340) 2 + 0.0631 2 + ... + 0.0599 2
< yi , - ?'
ll.l.c)
2
1
X , Ϊ (y, - y ) i =l
XkJ
=b
o
+ b
i
x
i i
+
- - -
+
V k i
'
i =1
n
g i b t a n , w e l c h e r A n t e i l d e r V a r i a n z d e s R e g r e s s a n d e n Y durch d i e X^ , . . .
e r k l ä r t werden k a n n . Für d a s B e s t i m m t h e i t s m a ß g i l t 0
i BY,(X
1
ν
k
' Regressoren
stets
1
1
und V x . i B Y , ( x D 1
ν
für
k
j=1
k
-
Mit
I i=1
(y--y)2= 1
und der im Aufgabenteil siduen
I i=1
y ? - 7y 2 = 59.1108 - 58.8700 = 0.2408 1
(a) bereits berechneten Summe der quadratischen
Re-
322
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
7 „ I ( y , - y j = 1 1 i=1
0.0135
ergibt sich das Bestimmtheitsmaß der multiplen Regressionsfunktion zu
B
Y,(XrX2)
= 1
- S S
= l
- ° ·
0 5 6 1
=
0
·9439
.
d.h. etwa 94% der Variation in der konsumierten Gummibärchenmenge können durch den multiplen Regressionsansatz in Preis und Einkommen erklärt werden.
- ( c ) Zu g e w i s s e n , vorgegebenen Ausprägungen x ^ , x^ » · · - »x^ der Regressoren e r h ä l t man in
y
0=b0
+ b
lXl+b2X2+
" • • V i c
e i n e Prognoseschätzung f ü r den zugehörigen Wert des Regressanden Y .
Bei einem Preis von x ? = 3 . 9 0 WE/kg und einem P r o - K o p f - E i n k o m m e n von 0 x 2 = 1 8 5 0 WE wird die pro Einwohner konsumierte Gummibärchenmenge wegen
y 0 = b Q + b 1 - 3 . 9 0 + b 2 · 1850 = 2 . 5 8 7 3 - 1 .3379 · 3.90 + 0.0032 · 1850 = 3.2895 auf ca. 3 . 3 k g
jährlich
prognostiziert.
-»(d) Um f e s t z u s t e l l e n , ob es überhaupt notwendig i s t , a l l e X , . . . ,X
Regressoren
zu b e t r a c h t e n , oder ob v i e l l e i c h t q bestimmte Regressoren zur Er-
klärung von Y ü b e r f l ü s s i g s i n d , kann d i e Hypothese H„ : X , . , , . . . ,X,, 0
(1)
zum Niveau α gegen d i e
wobei X
,
reichen a l s Regressoren aus
(k-q) Alternative
Η, : X, Χ„ , reichen a l s Regressoren n i c h t aus , 1 (1) (k-q) ,...,X e i n e bestimmte Auswahl aus X , . . . , X kennzeichnen, il) (k—q) 1 k
t e s t e t werden. Dazu wird zunächst e i n e Regression von Y auf X , . . .
ge-
be-
rechnet und
s s
\
=B
Y,(X1
xk> · X
( y
i"5)2
bestimmt. Anschließend w i r d e i n e R e g r e s s i o n von Y auf d i e Auswahl X
(k —q)
d u r c h g e f ü h r t und aus dem zugehörigen
Bestlmmtheitsmaß
»·--»
323
Kapitel 11 : Regressionsanalyse
SSR
k-c *
= b
q
2
Y (χ Y
χ
' ( (1)
) ' (k-q)'
Σ
(yi-y» 1
i=l
berechnet. Als Prüfgroße verwendet man dann SSRj^ - SSR^ 2 ' s q die unter H„ die Realisation einer F - verteilten Zufallsvariablen 0 q,n-k-l F =
darstellt. Die obige Reduktionshypothese H^ kann dann zum Niveau α verworfen werden, falls F > F q,n-k-l;1-a gilt. Ist es nicht möglich, die Reduktionshypothese abzulehnen, so sei aufgrund der oftmals hohen Abhängigkeit zwischen den Regressoren
(Multikollinearität)
davor gewarnt, direkt zu folgern, daß die hierbei eliminierten Regressoren keinen Einfluß auf Y haben. Vielmehr kann man i.a. nur sagen, daß diese bei gleichzeitiger Berücksichtigung von X
. ,...,X. . keinen wesentlichen (1) l k - q) sätzlichen Beitrag zur Erklärung von Y leisten.
zu-
Zum Niveau α = 0.05 i s t zu prüfen, ob das verfügbare P r o - K o p f - E i n k o m m e n X^ zur Erklärung des Konsums von Gummibärchen Y überhaupt notwendig i s t , d.h. es s o l l HQ : Xj r e i c h t a l s Regressor aus
[d.h. 3 2 = 0]
gegen H 1 : X 1 r e i c h t a l s Regressor n i c h t aus
[d.h.
ß2/0]
g e t e s t e t werden. Unter der Hypothese Hg i s t a l s o eine Regressionsgerade
y(xC 1
= b
0
+ b
1
x
rait
(1)
X
(1)=X1
zu bestimmen. Nach der KQ - Methode (vgl. Aufgabe li.i.a) ergeben s i c h h i e r die Schätzwerte, v g l . Aufgabenteil 7 l h * - i=1 b 1 7
n
-xJty,-y) 1
^ ( « „ - i , )
1
2
(a),
SP« „ X Y 1 1
-0.1518 0.1018
. ._,„ '-1-W12
.
324
Teil I: Übungsaufgaben,
b* = y - b ^
Erläuterungen
und
Lösungen
= 2.90 + 1 .4912 · 4 . 1 6 = 9 . 1 0 3 4
Das B e s t i m m t h e i t s m a ß d e r l i n e a r e n
Regression
.
mit
y ( x ( 1 ) ) = y ( x 1 ) =9.1034 - 1 . 4 9 1 2 x1 b e r e c h n e t s i c h m i t den in C a b . C l l . 3 . 2 a u f g e f ü h r t e n , z u g e h ö r i g e n sowie, vgl Aufgabenteil 2
7
l (y,-y) 1 i=1
,
3
Y,X(1)
_
=
D b
= 0.2408
Y,X1
=
(-0.0416)2 + 0.06382 + . . . + 0.05162 —or^ras
1
- 1 . 0-0144 _ " 1 0.240S "
0 U
"
g 4 0 2 9 W
·
S a b . £ 1 1 . 3 . 2 : B e o b a c h t e t e Werte y ^ , Werte x ^ y.j(χ 1) und d i e R e s i d u e n y . -
1 1
x
2.59
1i
y
4 .34
2 .6316
des R e g r e s s o r e n ,
i" -O 0416
2
2.77
4.29
2 7062
0 0638
2.86
4 .16
2 9000
- 0 0400
4
2.88
4 .20
2 .8404
0 0396
5
2.93
4.12
2 9597
- 0 0297
6
3.05
4.03
3 0939
- 0 0439
7
3.22
3.98
3 1684
0 0516
W e i t e r h i n e r g a b s i c h im A u f g a b e n t e i l v,(xrx2)
= °·9439
Schätzungen
) f ü r i = 1 , . . . ,7
3
B
Residuen
(b),
(b)
'
s o daß nun mit SSR2 = Β
γ,(χ1 ,x2)"
7 s s r ;1 == Β Dv IM \ · l Y . ( X { 1 ) J 1 i=1 " "(1)
( y
i
(y, - y ) ι
2
=
°·9439 " °·2408
=
°·2273
= 0.9402 · 0.2408 = 0.2264
'
und
Kapitel 11: Regressionsanalyse
325
S 2 = 0.0034 für die Prüfgröße der Wert S S R 0 - SSR' £ 1
ρ
s
0.2273 - 0.2264
n
* 1
ermittelt wird. Da F
q,n-k-1;1-a
= F
1,4;0.95
= 7
·709
'
kann die Hypothese, daß der Preis X^ zur Erklärung von Y ausreicht, also nicht verworfen w e r d e n , denn F = 0.2647 } 7.709 = F q,n-k-1;1-a
LÖSUNG ZU AUFGABE 11 Mit H i l f e der M a t r i z e n d a r s t e l l u n g
l a s s e n s i c h d i e in Aufgabe 11.3 behandelten
V e r f a h r e n im Zusammenhang mit der m u l t i p l e n Y
=W
i
+
--- + V k
Regressionsfunktion
+ e
i n v e r e i n f a c h t e r Form angeben.
+ ( a ) S e t z t man d i e Stichprobenwerte wie f o l g t zusammen y,
1
y=
X
1 1 ·-- X k l
X = 1
χ
In
so l a u t e t das Normalengleichungssystem
. . .
X,
kn
( v g l . Aufgabe 1 1 . 3 . a )
des S c h ä t z v e k t o r s
b =
f ü r den Parametervektor
nach der Methode der k l e i n s t e n
xTXb=xTy
Quadrate
β=
zur Bestimmung
326
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
Falls Χ
X invertierbar
ist,
b = (XTX)_1XTy
so e r g i b t
sich
.
Hierbei bezeichnet χ Τ die Transponierte
von X und ( X T X )
1
die Inverse
von
X X. T
2 Der S c h ä t z e r f ü r d i e V a r i a n z σ auch d a r g e s t e l l t s 2
wobei
I
werden a l s
=^rr-f
die
von Y , d . h .
(vgl.
Aufgabe
1 0
0 0 ... 0 1 0 . .. 0
.0
0
kann h i e r
11.3.a)
yT(In-X(XTX)"1XT)y
(η χ η ) - d i m e n s i o r i a l e
für die Fehlervarianz,
.
Einheitsmatrix
In"
bezeichnet
0 ... 1
[n>k+l].
Der Bearbeitungszeit Y von Holzlatten in einer Maschine wird in Abhängigkeit von der Länge X ^ der Breite X 2 und der Dicke X 3 folgende multiple Regressionsfunktion unterstellt Y = ßQ + ß 1 X 1 + ß 2 X 2 + ß 3 X 3 + e Die für η =8 Holzlatten unabhängig voneinander beobachteten Bearbeitungszeiten y i , i=1
8, ergeben zunächst den Beobachtungsvektor 60.1 80.5 38.9 86.7 74.6 90.4 120.3 52.5
und die an der i - ten Holzplatte gemessene Länge x ^ , Breite x 2 i und Dicke x 3 i werden für i=1,...,8 in die sogenannte Designmatrix X eingetragen:
Kapitel 11: Regressionsanalyse
16.5 26.1 15.4 17.6 18.9 21.2 27.5 16.8
170.1 158.3 151.6 186.2 176.4 190.0 178.5 166.9
8.0 7.9 6.2 5.8 6.7 6.0 8.0 7.4
Die K l e i n s t - Quadrate - S c h ä t z e r b Q , b 1 , t>2> t> 3 , d . h . d e r S c h ä t z v e k t o r
b =
b e r e c h n e t sich wegen 8.00 1378.00 160.00 56.00
X X T
604.00 105578.18 12734.35 4253.91
(XTX)_1
c c
-21.83779 0.10842 -0.12563 0.81077
00
C
01
C
02
C
10
C
12
c
22
c
23
c
33
11
c
C
20
C
21
c
C
30
C
31
C
= (XTX)"1XTy
Für vorgegebene
56.00' 9616.19 1133.90 398.14
und
5224.30418 -21.83779 21.66254 -269.07068
1 TM
160.00 27624.67 3345.52 1133.90
1378.00 238580.72 27624.67 9616.19
32
21.66254 -0.12563 1.02235 -2.92437
03
13
•188.5849 1.0589 3.9934 0.2988
Maße x ^ x 2 und x 3 e i n e r H o l z l a t t e kann d i e z u g e h ö r i g e Be-
a r b e i t u n g s z e i t a l s o durch y = - 188.5849 g e s c h ä t z t werden.
-269.07068 0.81077 -2.92437 26.84328
1 .0589 Xj + 3.9934 x^ + 0.2988 x 3
327
328
Teil 1: Übungsaufgaben,
Erläuterungen
und
Lösungen
-»(b) Das Bestimmtheitsmaß (vgl. Aufgabe ii.3.b) a l s Maß f ü r d i e Güte d e r Anpassung der soeben e r m i t t e l t e n Regressionsbeziehungen an d i e b e o b a c h t e t e n Werte berechnet
s i c h m i t den i n Cab, C H - 4 . 1 zusammengestellten Werten und
8 I
i=1
8 (y--y)
2
=
I
y?-8y2
i=1
1
= 50088.02 - 45602.00 =4486.02
1
ö
2
l (yi-yi(xrx2.x3)) ~^
= 1 _ 1
2
2
l y--8y2 i=1 1
3
=
1
- 434869.°022
=
1
- ° · 0 5 2 6 = °-9474
t a b . C H . 4 . 1 : B e a r b e i t u n g s z e i t e n y . , g e s c h ä t z t e Werte y.. = y i ( x 1 , x 2 , x 3 ) und Residuen y^ - y ^ ,
1
y
i=1,...,8
y1- - y' l·
i
J
1
60.1
59 . 8 1 5 5
0 2845
0 0809 26 2 8 8 2
2
80.5
85 .6272
- 5 1272
3
38.9
35 . 2 9 5 3
3 6047
12 9 9 3 9
4
86.7
80 .5992
6 1008
37 2198
5
74.6
75 . 6 8 2 3
- 1 0823
1 1714
6
90.4
99 . 0 5 9 0
-8 6590
74 9783
7
120.3
112 . 6 3 7 7
7 6623
58 7108
8
52.5
57 . 4 4 58
- 4 94 58
24 4 6 0 9
I
604.0
235 9042
- • ( c ) Werden die Elemente der Matrix ( X T X )
(XTX)_1 =c =
'10
11
* wie folgt bezeichnet
lk
so ergibt sich als (1 - α ) - Konfidenzintervall für den Parameter ß^ der multiplen Regressionsbeziehung, j = 0,... ,k ,
329
Kapitel 11: Regressionsanalyse
h
"/
s 2
' C j j · Vk-1;l-a/2 ' bj
+
J
s 2
'Cii 'Vk-l
·
Es sollen Konfidenzintervalle zum Niveau 1 - α = 0 . 9 5 für die Parameter ßg, ß.|, ΐ>2 und ßj der multiplen Regression zwischen der Bearbeitungszeit Y und ur,
den Holzlattenmaßen X^,
d X3 bestimmt werden. Da die Fehlervarianz σ 2
mit den Ergebnissen aus Tab. L11.4.1 bei η = 8 Beobachtungswerten durch (vgl. Aufgabe 11.3.a) g s2 = 8 - 3 - 1
.Σ
- ί ϊ ) 2 = } · 235.9042 = 58.9761
geschätzt wird, das Quantil der t n . k _ 1 - Verteilung sich zu
Vk-1;1-ct/2 = V.O.975 =
2-776
τ
-1
ergibt und die Diagonalelemente c·. der Matrix ( X x X ) zer bj für j=0,1,2,3 bereits im Aufgabenteil
' sowie die KQ - Schät-
(a) vorliegen, erhält man als
0.95 - Konfidenzinterval 1 für ß Q :
[-188.5849 - \/ 58.9751 -52.2430418 · 2.776 , -188.5849 + v/ 58.9761 - 52.2430418 -2.776] = [-188.5849 - 154.0890 , -188.5849 + 154.0890] = [-342.6739 ,-34.4959]
für ß^:
[1 .0589 - J 58.9761 - 0.0010842 - 2.776 , 1 .0589 + / 58.9761 - 0.0010842 - 2.776] = [1.0589 - 0.7020 , 1 .0589 + 0.7020] = [0.3569 , 1 .7609]
für ß 2 :
,
[3.9934 - y 58.9761 · 0.0102235 · 2.776 , 3.9934
58.9761 - 0.0102235 · 2.776]
= [3.9934 - 2.1555 , 3.9934 + 2.1555] = Li-8379 , 6.1489] für ß 3 :
,
[0.2988 - y 58.9761 ·0.2684328 -2.776 , 0.2988 + y 58.9761 - 0.2684328 - 2.776] = [0.2988 - 11.0452 , 0.2988 + 11 .0452] = [-10.7464 , 11 .3440]
.
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
330
-*(c)
Häufig interessieren Hypothesen über die Parameter ß , ß ,...,ß 0
01
der
multiplen Regressionsfunktion. Bei vorgegebenen Konstanten ß^ ergeben sich Entscheidungsregeln zum Niveau a, vgl. Iah. £11.4.2, für j=0,l,
,k über
die Prüfgröße
t =
b.-ß°
3-
2 sc.. 33
/
die bei Vorliegen von H„ die Realisationen einer t , . - verteilten Zufalls0 n-k-1 variablen darstellt.
CH.4*2: Tests zum Niveau OL für Hypothesen über den Parameter ß_. der multiplen Regressionsfunktion, j=0,l,...,k
H
β
o
H
1
Hg wird zum Niveau α verworfen, f a l l s
ß° 3 3
^Vk-l.-l-a
ß.>ß° 3- 3
ß. 15.51
(a), d.h.
,
also auch signifikante Unterschiede zum 5% Niveau bei den Verteilungen der Klausurergebnisse in den drei Fachrichtungen vor.
LÖSUNG ZU AUFGABE 12.2 -»(a) Es werden die Zufallsvariablen X = 'Regierungsparteianhänger' mit den Ausprägungen a^ = 'Ja', a ^ = 'Nein' und Y = 'Zufriedenheit mit Umweltschutzpolitik' mit b^ = 'Ja' und b ^ = 'Nein' auf signifikante Abhängigkeit hin untersucht, d.h. es soll die Unabhängigkeitshypothese H
0
: p
ij
= p
i. ' p.j
für
(vgl. Aufgabe
I2.i.a)
1 , j= 1 , 2
gegen Η ^ : p^ . ^ p.j · ρ j
für mindestens ein Paar (i,j)
zum Niveau cc=0.01 getestet werden. Die in der Aufgabenstellung gegebenen Ergebnisse einer Befragung von η = 400 zufällig ausgewählten Personen
lassen sich übersichtlich in einer
Kontingenztafel, einer Vierfeldertafel
(vgl. Aufgabe io.4.b),
(2*2)-
eintragen,
vgl. Cab. C12.2.1. Somit erhält man als Prüfgrößenwert 2 2 X
n =
(nnn22" V ^ l η, η η 2
der bei k = 2 , 1=2 x
5 =
_ 400(1 10 · 145 - 70 · 75) 2 _ , Q n 7 C , = 180 - 185 - 220 - 215 M-Q'U .
und a = 0 . 0 1 mit dem kritischen Wert
(k-i)(e-i);i-a
=
x?;o.99
verglichen werden muß. Da also
=
6
·635
344
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
Cab. £12.2.1: (2 χ 2) - Kontingenztafel; Zufriedenheit mit der UmweltschutzPolitik und .Anhängerschaft zur Regierungspartei
n ^ ZufriedenRe- \ heit gieγ rungspar- n. teianhänger Jfv
Ja
Ja
Nein
(b 1 )
(b 2 )
n 1 1 = 110
(a 1 )
Nein (a^)
n
I
π
21
1
=
n12=
75
Π
= 185
x 2 = 29.0752 > 6.635
22
=
I
70
145
η,
=180
n2
=220
η = 400
η 2 = 215
=x2k.1)u.l);1.a
gilt, kann die Unabhä'ngigkeitshypothese für X und Y zum 1% Niveau verworfen werden.
->(b) Die Oberprüfung der Homogenitätshypothese H
0:p*j
= p
2j
(vgl. Aufgabe
I2.i.b)
für j=1,2
gegen die Alternative H
1
bei k=2, 1=2, Pn = 1-P12
: p
*j ^ p2j
fÜr
m i n d e s t e n s
ein
J
d.h. mit Hilfe einer Vierfeldertafel, entspricht wegen und
P21
= 1
" p22
e i n e m
T e s t
a u f
Gleichheit der Wahrscheinlich-
keiten (vgl. Aufgabe 8.9) für die Zufriedenheit mit der
Umweltschutzpolitik
Y: p. = p * = P ( Y = b.) 1 Ii '
unter der Bedingung a^ = Regierungsparteianhanger 1
p, = p* = P(Y = b.) 2 21 V
unter der Bedingung a 2 = Oppositionsparteianhanger
Da die im Aufgabenteil
(a) untersuchte Unabhängigkeitshypothese zum Niveau
α = 0.01 verworfen werden konnte, gilt dies bei gleichem Niveau wegen
345
Kapitel 12: Kontingenztafelanalyse
χ 2 = 29.0752 > 6.635 = X ? ; 0 . g 9 = X( k -1)
1); 1-α
auch für die obige Homogenitätshypothese, wenn angenommen wird, daß unabhängig voneinander n^ hänger und n^
= n ^ = 180 zufällig ausgewählte
Regierungsparteian-
= n 2 = 2 2 0 Oppositionsparteianhänger nach ihrer Meinung zur Um-
weltpolitik befragt wurden. Damit ist also der Anteil p^ · 100% der mit der Umweltschutzpolitik Zufriedenen unter den Regierungsparteianhängern als zum 1% Niveau signifikant verschieden vom Anteil \>2 · 100% der mit der Umweltschutzpolitik Zufriedenen unter den Oppositionsparteianhängern
LÖSUNG
ZU A U F G A B E
anzusehen.
12.3
Besitzt die Unabhängigkeitshypothese
(vgl. Aufgabe 12.1.a) Gültigkeit, so
äußert sich darin auch, daß die Werte in der Kontingenztafel sowohl spaltenweise als auch zeilenweise jeweils gleichen Verteilungen unterliegen
(vgl.
Zusammenhang mit der Homogenitätshypothese). Es bietet sich dann an zu untersuchen, ob eventuell dennoch sogenannte Spalteneffekte te ten
bzw. Zeileneffek-
auftreten, d.h. ob Unterschiede in den Randverteilungen bzgl. der Spalbzw. der Zeilen
zu verzeichnen sind. Mit den Bezeichnungen aus Auf-
gabe 12.1.a interessiert also die als bedingte Gleichverteilungshypothese bezeichnete Nullhypothese
H
o:pij=pi.·?
( ~
p
und
. j 4
[bzw.
P
Und
("Pi. 4
für alle i=l,...,k, j=l,...,£
ij=Pi. · P
ij
ρ
=P
ο ) i. · ρ ο ) ]
,
die gegen die Alternative
H
i : p i j + p i . "Z
[bzw.
(~P.jt{
η;
oder
ρ
(»Pi.H
ΐ:+ρχ. · ρ . 3 ) oder
p
ij+pi. · ρ ο ) ]
für mindestens ein Paar (i,j) zum Niveau α getestet werden soll.
Es sei noch darauf hingewiesen, daß bei fest vorgegebenen Werten für die Zeilensummen, d.h. bei einer Untersuchung
einer 'erweiterten' Homogenitätshy-
pothese, es nur sinnvoll ist, auf Spalteneffekte zu testen, d.h.
346
Teil /: Übungsaufgaben, Erläuterungen und Lösungen
H
Ö' : P i j
=
Z
für alle
h
V
i=l,...,k,
Und
l
=
j=l
gegen
H
V1 P i j * Z
(~P!j*f
für mindestens ein Paar zu prüfen, denn p*
= 1 für alle
Bei Vorliegen der Hypothese H^ achtungen
°der
Plj+Pl'j
i=l,...,k. [bzw. H^] w i r d d i e e r w a r t e t e A n z a h l v o n
für die A u s p r ä g u n g s k o m b i n a t i o n
für i=l,...,k,
m
ij
j = l g e s c h ä t z t
= n p
(oder b e i V o r l i e q e n v o n H*'
) von
~ c
L
L
b z w
-
m
unter H^
JC
-
1J
ι]
— ] verteilten
(K 1) JO
ι]
ι.
z u m N i v e a u 06 v e r w o r f e n w e r d e n
bedingte
falls
Γ [bZW·
2
approximativen
zufälligen Größe dar. Die
kann also,
Χ gilt,
ι.
( n .m. - m . . ) 2 ij
Gleichverteilungshypothese
2
· p * 9 = η , /Ζ) .
Prüfgröße
[ b z w . H^] i n d i e s e m F a l l d i e R e a l i s a t i o n e i n e r [bzw. χ 2
Fall
k j
d u r c h d e n s e l b e n W e r t m. . = n .
stellt die
X 2. = i=l Ik j=l Il
X?,»
in d i e s e m
^il
ij
0 Mit diesen Schätzwerten
(X,Y)
Beob-
durch
"i ·
=
ij - —
'
(i,j)
X
2
>X
2 1 (k-l)£;l^J
( e b e n s o HQ' , v g l . A u f g a b e
K15.c).
In Cab. C12.3.1 wird zunächst noch einmal festgehalten, wie sich die innerhalb von 6 Wochen verzeichneten η = 250 Käufer eines bestimmten PKW - Typs nach dem Alter (in Jahren) der Käufer mit a 1 = [18,35], a 2 = [36,70] sowie dem Verkaufsort Y mit b^ = Ά 1 ,
= 'B',... ,b g = Έ ' aufteilen. Als Kontingenz-
tafel enthält diese Tabelle natürlich auch die sich ergebenden Randhäufigkeiten. Es soll hier getestet werden, ob zum 1% Niveau signifikante Unterschiede in den verkauften Stückzahlen dieses PKW-Typs zwischen den Städten bestehen, d.h. ob die Hypothese, daß mit £ = 5 keine Spalteneffekte vorliegen, H
0:pij
= p
i
'i
für alle i = 1 f 2, j=1,...,5
zugunsten der Alternative H 1 : ρη- - φ p i
·
für mindestens ein Paar (i,j)
Kapitel 12: Kontingenztafelanalyse
347
zum Niveau α = 0.01 abgelehnt werden kann. Unter der Hypothese Hg wird die erwartete Anzahl von Käufern aus der i - ten Altersgruppe in der j - ten Stadt geschätzt durch η. in.. =—jU5
,
die für i=1,2 und j=1,...,5 ebenfalls in Tab. L12.3.1 angegeben sind. So ergibt sich etwa
Cab. £12.3.1: (2* 5) - Kontingenztafel; Käufer eines bestimmten PKW - Typs in fünf Städten bei zwei Käuferaltersklassen
\Stadt Y \ Al t e \ X \
A
Β
C
D
Ε
I
15=24
n 1 =100
η,,=26
n12=18
n
9
"14=23
m^ ^ =20
m 1 2 =20
m13=20
"1,4=20
m 1 5 =20
n21=40
n22=25
n23=16
n 2 4 =34
n25=35
[36,70]
m^^ =30
m 2 2 =30
m23=30
m 2 4 =30
m 2 5 =30
I
η , =66
η
".3=25
n
n
[18,35]
2 =43
13=
.4=57
n
.5=59
n 2 =150
η = 250
Damit erhält man als Wert der zu verwendenden Prüfgröße 2 2 X
=
f 5 1*1 ji,
(n
ij ~ m i j ) m ij
= 20.5333
=
(26 - 20)2 20
(18 - 20)2 — W -
,
d.h. mit dem kritischen Wert für k = 2, l = 5, α = 0.01 x
2
k(i-1);1-a
x
2
8;0.99
20.09
, (35 - 30) 2 30
348
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
muß die Hypothese Hg zum 1% Niveau verworfen werden. Es sind also bei einer Irrtumswahrscheinlichkeit von höchstens 0.01 signifikante Unterschiede
zwi-
schen den Städten hinsichtlich der Käuferzahl des PKW - Typs zu erkennen. Es sei noch darauf hingewiesen, daß die Unabhängigkeitshypothese für X und Y zum 1% Niveau nicht verworfen werden kann, d.h. auch, daß zu diesem Niveau keine signifikanten Unterschiede zwischen den fünf Verteilungen für die Käuferzahlen
in den verschiedenen Städten zu erkennen sind. Auf eine
explizite Durchführung des zugehörigen Tests wird an dieser Stelle verzichtet.
LÖSUNG
ZU A U F G A B E
Gleichverteilung der angegebenen
12.4
in der vorliegenden Aufgabenstellung bedeutet hier, daß in (2 χ 3) - Kontingenztafel
sowohl
keine signifikanten
Spalten-
effekte als auch keine signifikanten Zeileneffekte auftreten. Man spricht dann auch im Unterschied zur bedingten Gleichverteilung, vgl. Aufgabe
12.3,
von der totalen Gleichverteilung.
In e i n e r
( k « i ) - Kontingenztafel mit den absoluten
und den zugrundeliegenden Zellenwahrscheinlichkeiten vgl. Aufgabe
ρ
. i = l , . . . , k , j = l,
12.1.a, besagt die totale Gleichverteilung,
die Wahrscheinlichkeit, g l e i c h ist, d . h . ρ
daß für ein
in e i n e d e r k ' t Z e l l e n z u g e l a n g e n ,
Objekt
für alle
= 1/(k · l) , w a s g l e i c h b e d e u t e n d d a m i t i s t , d a ß b e i
g e s a m t η b e o b a c h t e t e n O b j e k t e n in j e d e r Z e l l e m
=n/(kȣ)
warten sind, also weder S p a l t e n - n o c h Zeileneffekte Die t o t a l e
Zellenhäufigkeiten
Zellen ins-
Objekte zu er-
auftreten.
Gleichverteilungshypothese
H
0
: P
i j
=
k ^ T
f ü r
a l l e
i= 1
'---'k'
3=1
ί
wird gegen die Alternative Η
: p. . =j= . ρ 1 -pijTrV£
für mindestens ein Paar
(i,j) 2
getestet mit der bei Gültigkeit von H^ approximativ einer χ k · Ζ. - 1 Freiheitsgraden entstammenden Prüfgröße 2 mit m
η ij " k · ι
•
-Verteilung mit
Kapitel 12: Kontingenztafelanalyse
349
HQ wird zum Niveau α abgelehnt, wenn gilt: 2
2
X
X
k£-l;l-ct
'
Bei der vorliegenden (2 χ 3) - K o n t i n g e n z t a f e l , v g l . Tab. 1 2 . 4 , wird d i e t o tale
Gleichverteilungshypothese H
0
: p
ij
=
F
^r
1 = 1,2, j=1,2,3
g e t e s t e t gegen die A l t e r n a t i v e H, : P - j j f ^
f u r mindestens e i n Paar
(i,j)
In η = 6 0 S p i e l e n (ohne A u f t r e t e n der N u l l ) s i n d bei G ü l t i g k e i t von HQ in j e der der 6 Z e l l e n der Kontingenztafel m^· = 2 ^ 3 = 10
, 1 = 1 , 2 , 0 = 1,2,3,
Zahlen zu erwarten, so daß s i c h d i e Prüfgröße e r g i b t zu (8-10)2
2 x
""
= 4.2
(12-10)2 +
10
10
(8-10)2 +
10
(8-10)2 +
(9-10)2 , (15-10)2
10
10
10
. ο
Da h i e r k · l - 1 = 5 i s t , ersehen wir aus der T a b e l l e der χ
- Q u a n t i l e im An-
hang, daß s e l b s t bei e i n e r I r r t u m s w a h r s c h e i n l i c h k e i t von α = 50% die Hypothese der ( t o t a l e n ) G l e i c h v e r t e i l u n g n i c h t abgelehnt werden kann, da χ2 = 4 . 2 Μ . 3 5 1 = χ 2 . 0 _ 5 0 = χ 2 £ . 1 ; 1 . α
.
Kapitel 13: Stichprobenverfahren AUFGABE 13.1 Zum Zwecke der Umweltgütebeurteilung wird in einer Industrieregion ein Schadstoffmessprogramm durchgeführt. Hierzu wird die zu beurteilende Region in 200 Quadrate von 1*1 km 2 aufgeteilt und hiervon werden 15 mittels einfacher Zufallsauswahl ausgewählt. Mit einer mobilen Messeinhelt werden dann die S0 2 -Gehalte in mg/m 3 in diesen Planquadraten bestimmt. Die Ergebnisse dieser Messungen sind in tab. 13.1 dargestellt. Cab. 13.1: SO« - Messungen in mg/m
Planquadrat
i
S0 2 - Gehalt
Planquadrat S0 2 - Gehalt
i
3
in 15 Planquadraten einer Industrieregion
1
2
3
4
5
6
7
8
2.4
3.7
1.2
1.9
4.8
2.6
2.4
2.9
9
10
11
12
13
14
15
5.2
1.2
1.7
1.9
3.8
2.8
2.1
(a) Schätzen Sie die mittlere Belastung und den Anteil der Planquadrate, die eine Belastung höher als 3.0 mg/m 3 aufweisen. (b) Geben Sie für die Schatzer aus (a) Schätzer für deren Varianzen sowie die Standardabweichungen an. (c) Wie lautet das approximative Konfidenzintervall zum Niveau 0.95 für die mittlere Belastung der Industrieregion? (d) Wie gross müsste man bei einer zukünftigen Untersuchung den Stichprobenumfang wählen, damit das Konfidenzintervall höchstens eine Breite von 0.5 mg/m 3 besitzt?
352
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
AUFGABE 15.2 Die Firma E L E C T R O N I C führt zur Kontrolle ihres 420 Artikel umfassenden Sortiments eine Stichprobenerhebung ihrer Lagerbestände durch (kleine 'Inventur auf Stichprobenbasis'), Dazu werden in den Bereichen "Haushaltskleingeräte", "Haushaltsgrossgeräte" und "Unterhaltungselektronik" jeweils einige Artikelpositionen mittels einfacher Zufallsauswahl entnommen und der Gesamtwert der Artikelposition bestimmt, Zur besseren Planung der Lagerpolitik wurde zusätzlich vermerkt, ob weniger als drei Stück eines Artikels im Lager vorrätig waren. Die cab. 13.2 fasst die Ergebnisse dieser Untersuchung zusammen, in der ausserdem für jeden Lagerbereich die Sortimentsgrösse, der Stichprobenumfang, der durchschnittliche Positionswert und die Standardabweichung der Stichprobenwerte aufgeführt werden. Cab. 13.2: Ergebnisse einer Lagerbestandsaufnahme Anzahl Artikel pos. unter drei Stück
Sortimentbereich
Größe des Sortiments
Umfang der Stichprobe
durchschn. Positionswert (in DM)
Standardabweichung (in DM)
Haushaltskleingeräte
126
15
490
57
2
Haushaitsgroßgeräte
63
8
2996
1050
6
Unterhaitungselektronik
231
27
2094
320
5
(a) Geben Sie für den Wert des Gesamtlagers einen Schätzer an und schätzen Sie den Anteil der Artikelpositionen, bei denen weniger als drei Stück im Lager vorrätig sind. (b) Berechnen Sie die geschätzte Standardabweichung des Schätzers für den Lagerwert, d.h. die Quadratwurzel aus der entsprechenden Varianzschätzung. (c) Da diese Kontrolluntersuchung auch in Zukunft durchgeführt werden soll, soll eine optimale Strategie für die Stichprobenentnahme angegeben werden. Wie muss der Stichprobenumfang dann aufgeteilt werden?
Kapitel 13: Stichprobenverfahren
353
AUFGABE 15.5 Um das Verfahren der laufenden Qualitätsprüfung in einer Brotfabrik zu vereinfachen, schlägt der Produktionsleiter folgendes Verfahren vor. Da jeweils fünf Toastbrote nach dem Backen auf ein Fliessband zur Verpackung weitergeleitet werden, ist die Tagesproduktion von 2100 Broten in 420 Verpackungseinhelten aufgeteilt. Hiervon werden drei zufällig entnommenen und das Gewicht der Toastbrote überprüft, Die Gewichtsmessungen (in g) dieser drei Entnahmen sind in cab. 13.3 dargestellt. Cah. 13.3: Gewicht (in g) von drei mal fünf Toastbroten
Ent^\Brot nähme
1
2
3
4
5
1
498
503
511
515
508
2
518
513
508
499
505
3
521
505
501
503
512
(a) Berechnen Sie einen Schätzer für das durchschnittliche Gewicht eines Toastbrotes. (b) Interpretieren Sie die Ergebnisse der Stichprobenerhebung als Zerlegung einer Grundgesamtheit und berechnen Sie den Intraklass - Korrelationskoeffizienten. Kann man aufgrund des errechneten Ergebnisses die technisch einfacher zu realisierende Klumpenauswahl für die zukünftige Qualitätsprüfung empfehlen?
AUFGABE 15.4 Um zu überprüfen, ob eine Neueröffnung eines Hamburger - "Restaurants" in einem Vorort einer Grossstadt erfolgversprechend ist, wird ein Marktforschungsinstitut beauftragt, eine lokal begrenzte Bevölkerungsumfrage durchzuführen. Dazu werden aus den
354
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
800 Haushalten des betreffenden Stadtteils 20 mittels einfacher Zufallsstichprobe entnommen und hierin jeweils eine Person zufällig ausgewählt und nach Ihren durchschnittlichen Monatsausgaben für F a s t - F o o d und ihrer grundsätzlichen Bereltschaft, Hamburger zu essen, befragt. Die Ergebnisse dieser Umfrage enthält die Cab.
Sah.
13.4 ,
1 3 . 4 : Ergebnisse einer Meinungsumfrage
Person i
1
Haushaltsgröße
2
4
3
durchschn. Ausgaben für Fast-Food in DM
20
0
50
grundsätzl. Bereitschaft Hamburger zu essen
ja
Person i
11
12
Haushaltsgröße
4
4
durchschn. Ausgaben für Fast-Food in DM
50
grundsätzl. Bereitschaft Hamburger zu essen
2
3
4
5
6
7
8
9
2
5
6
2
1
3
10
nein nein nein
0
13
2
30
14
7
150
10
1
70
0
20
0
30
150
ja
nein
ja
nein
ja
ja
15
16
17
18
19
20
1
3
0
nein nein nein nein nein
3
100
ja
1
0
5
90
4
60
20
nein nein nein nein
Geben Sie einen Schätzer für die Gesamtkaufkraft für F a s t - F o o d dieses Wohnorts an und schätzen Sie die Anzahl der potentiellen Hamburger - Esser.
Kapitel 13: Stichprobemerfahren
355
LÖSUNG ZU AUFGABE 15.1 Wählt man aus einer Grundgesamtheit von Ν Objekten durch einen zufälligen Mechanismus η Objekte so aus, daß jede der so entstehenden
möglichen Stich-
proben (vgl. Aufgabe 1.3) die gleiche Wahrscheinlichkeit besitzt, ausgewählt zu werden, so spricht man von einer einfachen Zufallsauswahl. Durch eine eindeutige Zuordnung ist jedem der Ν Objekte der Grundgesamtheit ein vor Untersuchungsbeginn unbekannter Merkmalswert μ^, i=l,...,N, zugeordnet. Aufgrund der endlichen Zusammensetzung der Grundgesamtheit ergeben sich hieraus die unbekannten, die Grundgesamtheit charakterisierenden Größen des Lageparameters, des Mittelwertes
=
1 N
Ν
IΛ i=l
sowie des Streuungsparameters, der Varianz , definiert hier als 2 1 ° μ = Ν-Γ
Ν γ , I Σ i=l
- ( a ) Durch den Zufallsmechanismus der Auswahl sind die bekannten Meßwerte y., i=l,...,n, als Realisationen von Zufallsvariablen Y., i=l,...,n, zu ι ι interpretieren, die ihren Wertebereich jeweils auf der Menge der (Uj, j=l,...,n} besitzen. Da sich die Zusammensetzung der Grundgesamtheit durch die Entnahme eines Objekts (Ziehen ohne Zurücklegen) verändert, sind diese Zufallsvariablen zwar identisch verteilt aber nicht stochastisch unabhängig. Dennoch ist das Stichprobenmittel
ein erwartungstreuer Schätzer für μ (vgl. Aufgabe 5.1) und
Νμ = Ny ein erwartungstreuer Schätzer für
NU=
Ν I H. i=l
der Summe der Merkmalswerte.
Ausgehend von den Ν = 2 0 0
Planquadraten als Objekt der vorliegenden Schad-
stoffmessungen berechnet man somit einen erwartungstreuen Schätzer für die mittlere S0~ - Belastung in der Industrieregion basierend auf den η = 15
356
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
Stichprobenwerten .
Λ
durch 1
15
P =y=Y5
.
J
y ^ j g
= 2.7067
( 2 . 4 + 3 . 7 + . . . + 2.8 + 2.1)
,
d.h. die mittlere SOg - Belastung in der Industrieregion liegt bei 2.7067 m g / m 3 . Interessiert man sich für den Anteil der Objekte der Grundgesamtheit, die eine bestimmte Eigenschaft besitzen, so kodiert man die unbekannten Merkmalswerte iL , i=l,...,N, mittels 1 μ
_
, falls das i-te Objekt der Grundgesamtheit die Eigenschaft besitzt
,
sonst Damit ist der Anteil π der Objekte der Grundgesamtheit, die die Eigenschaft besitzen, wiederum als Mittelwert, d.h. durch
=
1 V Ν Λ
ί
μ
1= 1
festgelegt. Durch den Übergang von den Stichprobenwerten y^ zu 1 =
, falls das i-te Objekt der Stichprobe die Eigenschaft besitzt
'
0
sonst
für i=l,...,n, kann der Anteil TT durch -T = 1— T n
V> ~y. 1=1 1
erwartungstreu geschätzt werden.
Im Falle der Schadstoffmessung
interessiert man sich für eine Schätzung des 3
Anteils π der Planquadrate mit einem S 0 2 - Gehalt größer als 3.0 mg/m . In lab. C13.1.1 sind zunächst neben den η = 1 5 Stichprobenwerten die kodierten Werte 1
Q
, falls die Belastung im Planquadrat i größer als 3.0 m g / m 3 sonst
für i=1,...,15 festgehalten.
Kapitel 13: Stichprobenverfahren
Cab. £13.1.1: Beobachtete Meßwerte y^ und kodierte Werte y^ für i=1,...,15
i
y
i
i
y
i
1
2
3
4
5
6
7
8
2.4
3.7
1.2
1.9
4.8
2.6
2.4
2.9
0
1
0
0
1
0
0
0
9
10
11
12
13
14
15
5.2
1.2
1.7
1.9
3.8
2.8
2.1
1
0
0
0
1
0
0
Damit wird der Anteil der Planquadrate, deren SO, - Belastung größer als 3 3.0 mg/m ist, wegen -
π
1 15 1 a = Τ 5 ,Σ1 y i = T 5 C 0 + 1 + ... + 0) = ^ =
0.2667
auf 26.67% geschätzt.
- ( b ) Um das Streuungsverhalten des Schätzers μ zu beurteilen, ist es notwendig, die Varianz von μ anzugeben. Für diese gilt Var (μ) = - (1 - £) Q2 η Ν μ Der Ausdruck (1 -
heißt Endlichkeitskorrektur und ergibt sich durch das
Auswahlverfahren ohne Zurücklegen (vgl. Aufgabe 4.3). 2 Da die Varianz
der Merkmalswerte in der Grundgesamtheit aber unbekannt
ist, muß auch diese Größe geschätzt werden. Zur erwartungstreuen Schätzung 2 von σ^ verwendet man die Stichprobenvarianz
2 1=1 < * i - >
=
vM
1=1\
'
und deshalb ergibt sich als erwartungstreuer Schätzer für die Var(μ) der Ausdruck
Var (μ) = - (1 -
2 s
357
358
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
M i t η = 15 und y = 2.7067 e r h ä l t man zunächst f ü r d i e S t i c h p r o b e n v a r i a n z der SOg - Messungen 15 s2=TgVr ( = 1.4462
\ y ? - 1 5 y 2 ) = p f (130.1400 - 109.8934)
,
so daß mit Ν = 200 in Var(P)
1.4462 = 0.0892
eine erwartungstreue Schätzung f ü r die V a r i a n z des M i t t e l w e r t s c h ä t z e r s des SO2 - Gehalts angegeben
ist.
Die geschätzte Standardabweichung e r g i b t s i c h a l s Quadratwurzel aus der g e schätzten V a r i a n z :
/
V a r ( i ) = v/0.0892 = 0.2987
.
Für den Fall der Anteilsschätzung bei einfacher Zufallsauswahl vereinfacht sich die Varianzformel zu Var(ii)
(ϊγ^Τ)77
( 1
-π)
·
Diese wird dann durch var(ir) = (1 - £ ) Ν
η-1
τι (1 - π )
erwartungstreu geschätzt. Für die Varianz des A n t e i l s der Planquadrate mit einem S O , - G e h a l t über 3.0 mg/m
e r g i b t s i c h mit Ν = 200, η = 1 5 und π = 0.2667 der Schätzer V a r ( i ) = (1 - 2 ^ ) ' J ^ T J ' 0-2667 · (1 - 0.2667) = 0.0129
,
bzw. J
Var(TT) = V 0 . 0 1 2 9 = 0.1136
— C ) Ein approximatives (1-a) -Konfidenzintervall für den Mittelwert μ in der Grundgesamtheit ist gegeben durch
Kapitel 13: Stichprobenverfahren
[ y - V a / 2
"
Wählt man
+ u
' y
[ - V a / 2
/
l-a/2
F
^
^
R
359
]
- V ^ - a / 2
A
« "ι'
S2
]
*
(1 - α ) = 0 . 9 5 , so i s t (1 - α / 2 ) = 0 . 9 7 5 u n d d a s (1 - α / 2 ) - Q u a n t i l
Standardnormal Verteilung aus den Aufgabenteilen
beträgt u
(a) u n d
025
1 Q
= u
0 9 7 5 = 1 - 9 6 . M i t den
der
Ergebnissen
(b) e r h ä l t m a n als K o n f i d e n z i n t e r v a l l
zum
Ni-
v e a u 0 . 9 5 f ü r d i e m i t t l e r e SO,, - B e l a s t u n g
[ 2 . 7 0 6 7 - 1 .96 ·
0.0892
, 2 . 7 0 6 7 + 1.96 ·\/0.0892 ]
= [2.7067 - 0.5854 , 2.7067 + 0.5854] = [2.1213 , 3.2921]
-•(d) Die Breite b des Konfidenzintervalls (c) errechnet sich zu
b = 2
u
(vgl. Aufgabe
zum Niveau
( 1 - a ) aus Aufgabenteil
5.3)
-i1
l-a/2
Gibt man sich nun diese Breite b vor, so läßt sich hieraus der notwendige Stichprobenumfang η ermitteln, so daß das
(1 - α ) -Konfidenzintervall höch-
stens die Breite b besitzt. Dieser ergibt sich zu
( 2
-
1
U
( 2
W 2 '
u
s / b ) 2
l-a/2-
s / b ) 2
Für die zukünftige Umweltgütebeurteilung fidenzintervall u
Mit α = 0 . 0 5 ,
der Industrieregion
soll
zum Niveau 0.95 höchstens eine Breite b = 0.5 mg/m^ 2
i_a/2
= u
0 975 =1-96
und s
= 1.4462
ergibt sich als
das
Kon-
besitzen.
notwendiger
Stichprobenumfang n
(2 · 1.96 · y/1.4462
=
1 +
/ 0.5) '
(2 - 1.96 · vfl .4462
/ 0.5)
2
88.8910
=
1 +
-88.8910
=61.5395 Will
m a n s o m i t in e i n e m z u k ü n f t i g e n M e ß p r o g r a m m e i n K o n f i d e n z i n t e r v a l l z u m 3 0 . 9 5 m i t e i n e r B r e i t e von h ö c h s t e n s 0 . 5 m g / m für die mittlere S0£ -
Niveau
360
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
Belastung angeben, so muß man mindestens η = 6 2 Planquadrate auswählen.
LÖSUNG ZU AUFGABE 15.2 Zerlegt man eine endliche Grundgesamtheit aus Ν Objekten in disjunkte TeilL mengen vom Umfang N^, h=l,...,L, N =
£
N^, und entnimmt aus jeder so ent-
standenen Teilgesamtheit eine einfache Zufallsauswahl, so bezeichnet man die Teilgesamtheiten als Schichten und das Auswahlverfahren als geschichtete Zufallsauswahl. Ist jedem Objekt ein unbekannter Merkmalswert μ zugeordnet, h=l,...,L, i=l,...,N , so kann der Mittelwert der Merkmalswerte durch h
L
ι
μ
Nh
··= ν Σ I
h=l i=l
beschrieben werden. Will man hierüber Aussagen machen, so betrachtet man zunächst die schichtspezifischen Kenngrößen N
^u h.
=
N
h
if" 1 Ν. hi h 1=1
und
h
1 σ2 = . Τ (μ. . - μ , ) μ, Ν - 1 ,L, hi h. h h 1=1
,
h=l,...,L,
und faßt diese mittels der sogenannten Schichtungsgewichte W^ = N^ / Ν wegen der Beziehung
μ =L
" Λ h=l
zusammen.
-»(a) Werden in jeder Schicht unabhängig voneinander einfache Zufallsstichproben vom Umfang n^ entnommen, so kann für jede Schicht der ermittelte Meßwert ν als Realisation einer Zufallsvariablen interpretiert werden. Dann J hi ist, vgl. Aufgabe 13.1, >v
1 "h = τ τ J , y hi = y h. h 1=1
Realisation einer erwartungstreuen Schätzfunktion für μ^ , h=l,...,L, und somit
Kapitel 13: Stichprobenverfahren
μ
" = h=Λ1
ein erwartungstreuer Schätzer für μ.. Die Summe aller Merkmalswerte L
Νμ
\
=
" Λh=l i=l Λ
^
kann dann natürlich durch Νμ.. - Ν
L L I Whih_ = J Nhyh_ h=l h=l
geschätzt werden. Zur übersichtlicheren Ermittlung eines Schätzers für den Gesamtlagerwert Νμ.. wird für die L = 3 hier vorliegenden Schichten die nachfolgende Cab. C13.2.1 zusammengestellt. Dabei ist, mit Ν = 420, W^ = N^/N = 126/420 = 0.30, W 2 = 63/420 = 0.15 und W 3 = 231/420 = 0.55.
Cab. C13.2.1: Arbeitstabelle zur Berechnung des Gesamtlagerwertschätzers
Sortimentbereich
h
Haushaltskleingeräte
1
Haushaitsgroßgeräte Unterhaitungselektronik
Σ
N
W
V h .
h
"h
126
0.30
15
490
147.00
2
63
0.15
8
2996
449.40
3
231
0.55
27
2094
1151.70
420
1 .00
50
h
Da der durchschnittliche Wert der Artikelpositionen mit μ- =
L l
Whyh
= 1748.10 DM
geschätzt wird, kann für den Gesamtlagerwert ein Schätzer von Νμ„ = 420 · 1748.10 = 734202 DM angegeben werden.
1748.10
361
362
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
Will man den Anteil π der Objekte der Grundgesamtheit, die eine bestimmte Eigenschaft besitzen, mit Hilfe einer geschichteten Stichprobe schätzen, so betrachtet man zunächst den entsprechenden Anteil
in der h - ten Schicht
für h=l,...,L. Dieser wird geschätzt durch
1 ~ 7t, = Ι y h η ,L hl h 1=1
,
h=l , . . . ,L
,
wobei 1
, falls das i - te Objekt der Stichprobe aus der h - ten Schicht die Eigenschaft besitzt
0
sonst
gesetzt wird (vgl. Aufgabe 13.1.a). Damit erhält man als Schätzer für den Anteil π L π
=
I
h=l
π
h
ι. h
In Tab. 13.2 sind für jede Schicht die Anzahl der Artikelpositionen, bei denen weniger als drei Stück vorrätig waren , gegeben: 15
8
27
Die Anteilsschätzer in den Schichten ergeben sich damit zu ^ = ^ • 2
= 0.1333
n 2 =g-· 6 = 0.7500 5 = 0.1852 so daß der Anteil von Artikelpositionen, bei denen im Gesamtlager weniger als drei Stück vorrätig sind, durch 3 π = y W.i, = 0.3 · 0. 1333 + 0.15 · 0.7500 + 0.55 · 0.1852 h=1 h h = 0.2544 geschätzt wird.
Kapitel IS: Stichprobenverfahren
363
- ( b ) Bei der geschichteten Zufallsauswahl geht man davon aus, daß die Stichprobenziehungen in jeder Schicht voneinander unabhängig sind. Aus diesem Grund kann die Schätzung der Varianz der Schätzer aus (a) durch die Summe der Varianzen in jeder Schicht ausgedrückt werden. Für jede Schicht ist
h.
nh[
N j
h
ein Schätzer für die Varianz von μ, , wobei η.
2 h
1 > = ~ τ Σ "h - 1=1
, < y
h i
.2 - y h /
die Stichprobenvarianz in der h - ten Schicht bezeichnet, h = l,...,L. Die Varianz von μ., wird deshalb geschätzt mit
νβΓ(μ·.) =
L l
Var (W^U^ )
Auch h i e r s o l l e n d i e Varianzschätzer durch eine A r b e i t s t a b e l l e werden, v g l . Cah. £13.2.2.
ermittelt
In d i e s e gehen W1 = 0 . 3 , W2 = 0.15 und W3 = 0.55
sowie Angaben aus Tab. 13.2 e i n .
t a b . £13.2.2: A r b e i t s t a b e l l e
h
2 w w h
S
h
zur Berechnung der Varianzschätzer
- l i i - ^ ü l s n N hl hJ
\\4
Λ 1
2 h
h
"h*
1
0 0900
57
190.8143
17 1733
2
0 0225
1050
120312.5000
2707 0313
3
0 3025
320
3349.3025
1013 1640
I
-
-
-
3737 3686
Hieraus e r g i b t s i c h f u r den V a r i a n z s c h ä t z e r Var(Np.. ) zur Schätzung des Lagerwertes mit Ν =420
364
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
V?r(Ni..)=N2v7r(i..)=N2 ^
" ^ ( l - ^ j
s*
= 420 2 · 3737.3686 = 659271821
-»(c) Variiert man unter sonst gleichen Voraussetzungen die Stichprobenumfänge "h "i"n ^ e d e r
Sch:i ch
- t, h=l,...,L, so wird dies die Größe des Varianzschätzers
und damit die Aussagegenauigkeit des Verfahrens verändern. Wählt man nun die Stichprobenumfänge η , h=l,...,L, bei vorgegebenem Gesamtstichprobenumfang L n = J η so, daß die Varianz des Schätzers minimiert wird, so spricht man h=l von einer optimalen Aufteilung des Stichprobenumfangs. Diese optimale Aufteilung wird erreicht, wenn man in jeder Schicht W
hSh
, h = l,... ,L
L Σ k=l
W
S
k * * *
Zur optimalen Aufteilung in der vorliegenden Lagerbewertung wird die nachfolgende Arbeitstabelle tab. C13.2.3 aufgestellt. Cab- £13.2.3: Arbeitstabelle zur Bestimmung der optimalen Aufteilung des Stichprobenumfangs
W
h
w
h
S
h
V h
h
s
h
3 Σ
k=1
w
s
K k Kk
1
0.30
57
17.10
0.0488
2
0.15
1050
157.50
0.4492
3
0.55
320
176.00
0.5020
I
1.00
350.60
1.0000
-
Demnach müssen bei einer zukünftigen Lageruntersuchung 4.88% des Gesamtstichprobenumfangs aus dem Bereich "Haushaltskleingeräte", 44.92% aus dem Bereich "Haushaltsgroßgeräte" und 50.20% aus dem Bereich "Unterhaitungs-
Kapitel 13: Stichprobenverfahren
365
e l e k t r o n i k " entnommen werden, um d i e Varianz der r e s u l t i e r e n d e n Schätzung zu m i n i m i e r e n .
LÖSUNG ZU AUFGABE 15.3 Zerlegt man eine Grundgesamtheit von Ν Objekten in Κ disjunkte Teilmengen vom Umfang M^ , i=l, . . . ,K, mit Κ Ν = y Μ. i=l 1 und wählt man aus diesen Mengen k Mengen mittels einfacher Zufallsauswahl aus, so heißen die Teilmengen Klumpen und das Auswahlverfahren Klumpenauswahl . Weiterhin spricht man von einem einstufigen Klumpenauswahlverfahren, wenn man alle auf diese Weise in die Stichprobe gezogenen Objekte in die Untersuchung eingehen. Bezeichnet nun μ
den Merkmalswert des j - ten Objekts im i - ten Klumpen,
j=l,...,M , i=l,...,K, in der Grundgesamtheit, so gibt M
Κ u
-
=
i
p s iA= l A j = 1 i 1i 3
den Mittelwert und
'μ = d r
A
A
^ij-^·'
i = l j =1
^
die Varianz der Merkmalswerte in der Grundgesamtheit an. Im folgenden werden gleiche Klumpengrößen, d.h. H. =H für i=l,...,K
betrach-
tet.
-»(a) Mit den am j - ten Objekt des i - ten gezogenen Klumpens beobachteten Merkmalswerten y
, i=l,...,k, j=l,...,M, erhält man als Schätzung für den
Mittelwert μ., in der Grundgesamtheit j
k
Μ
• ϊ Γ Π Γ 1=1 A j=l A
y
i Jj
·
366
Teil I: Übungsaufgaben, Erläuterungen und Lösungen
Bei der h i e r betrachteten Q u a l i t ä t s p r ü f u n g l i e g t ein e i n s t u f i g e s verfahren v o r . Die
Klumpen-
Klumpengröße b e t r ä g t M = 5 und die Anzahl der insgesamt
vorliegenden Klumpen i s t Κ = 420. Da eine Stichprobe von k = 3 Klumpen e n t nommen wurde, berechnet s i c h der Schätzer f ü r das d u r c h s c h n i t t l i c h e
Gewicht
der Toastbrote demnach zu ι
3
μ·· = 5-^3 = T5 -
5
l l y^·
76 2 0
= 508 g
.
-»(b) Stellt jeder Klumpen ein repräsentatives Abbild der Grundgesamtheit dar, d.h. sind die Klumpen in sich heterogen und untereinander homogen, so kann man erwarten, daß dieses Auswahlverfahren gleiche oder bessere Güteeigenschaften als die einfache Zufallsauswahl (vgl. Aufgabe 13.1) besitzt. In diesem Fall wird die Varianz des Schätzers für den Mittelwert geringere Werte als die des entsprechenden Schätzers bei der einfachen Zufallsauswahl· annehmen. Der Intraklass - Korrelationskoeffizient η
int
, der für M. = M , i=l,...,K, ι
gegeben ist durch Κ J (Μ - 1) (Ν - 1) σ u
Μ
Μ
Σ I I (U^-μ-Μΐι^,-μ.. > J J i=l j = l j ' = 1 j < j'
ist ein Maß für den Zusammenhang der Merkmalswerte innerhalb der Klumpen. Für diesen gilt ί-τ < ρint -< 1 Μ1 wobei P ^ n t = 0 gerade besagt, daß die Merkmalswerte innerhalb der Klumpen nicht zusammenhängen. Das Klumpenverfahren und die einfache Zufallsstichprobe liefern in diesem Fall gleiche Genauigkeiten für die Schätzungen. Gilt hingegen ρ
< 0, so ist die Varianz der Schätzer, die mit Hilfe des Klumpen-
auswahlverfahrens ermittelt werden, geringer als die der entsprechenden Schätzungen, die man mit einer einfachen Zufallsauswahl aus der Grundgesamtheit gewinnt. Da die
Klumpenauswahl in der Regel technisch einfacher zu rea-
lisieren ist, sollte sie dann der einfachen Zufallsauswahl vorgezogen werden.
Im Gegensatz zum Aufgabenteil
(a) s o l l e n h i e r die Ν = 15 Toastbrote a l s
Grundgesamtheit angesehen werden. Diese i s t i n K = 3 Klumpen der Größe M = 5 a u f g e t e i l t . Die in Tab. 13.3 gegebenen Werte s t e l l e n a l s o nun die Merkmals-
Kapitel 13: Stichprobenverfahren
367
werte μ^., i=1,2,3, j = 1 , . . . , 5 , in der Grundgesamtheit dar. Zur Berechnung des Intraklass - Korrelationskoeffizienten ermittelt man zunächst den Mittelwert in der Grundgesamtheit, d.h. • μ
"
=
K M
. 3 5
.
TT Σ l Μ1ί- = ^1 S I l " i=1 j=1 1 J i=1 j=1
= 1Tb V 7620
1J
= 508 g sowie die Varianz der Grundgesamtheitswerte, d.h. K M
J f (3871626 - 3870960) 47.5714 g 2
. /
0
*
3
5
666
.
Für jeden Klumpen können in einem nächsten Schritt die Produkte der Abweichungen bestimmt werden. Dazu s t e l l t man sich zunächst eine Tabelle der Abweichungen der Merkmalswerte vom Mittelwert μ.. = 508 auf, vgl. tab. £13.3.1. tab. £13.3.1: Abweichungen ( μ . ^ . - μ . . ) , i=1,2,3, j = 1 , . . . , 5 , für jeweils Μ = 5 Merkmalswerte in K = 3 Klumpen
1
2
3
4
5
1
-10
-5
+3
+7
0
2
+ 10
+5
0
-9
-3
3
+ 13
-3
-7
-5
+4
Klumpen\. i
j
Dann g i l t für 1 = 1:
M M l l j=1 J ' = 1 j < j'
(μ · . - μ..) (μ. -, - μ _) 1J
1J
5 5 = [ I j=1 j ' = 1 j (c,i)Es stehen insgesamt η = 40 Einzelzimmer zur Verfügung. Die Zufallsvariablen X. = 1
f 1 j ( o
frei i - tes Zimmer ist belegt
sind für i =1,...,40 unabhängig verteilt mit P(X. = 1) = 0.05
.
Damit ist
X =
40 Υ X. = 'Anzahl der freien Zimmer 1 i=1 1
ß(40,0.05) - verteilt und die Wahrscheinlichkeit, daß mindestens ein Zimmer frei ist, berechnet sich zu P ( X > 1) = 1 - P ( X < 1) = 1 - P(X = 0) = 1 - ( 4 0 ° ) O . 0 5 ° · 0 . 9 5 4 0 = 1 - 0 . 9 5 4 0 = 1 - 0.1285 - 0.8715
.
-»(c,ii) Mit np = 40 · 0.05 = 2 ist die Zufallsvariable X = 'Anzahl der freien Zimmer' approximativ Po(2) - verteilt, d.h. die Wahrscheinlichkeit, daß mindestens ein Zimmer im Hotel frei ist, läßt sich approximativ zu P ( X > 1) = 1 - P ( X < 1) = 1 - P(X = 0) λ°
-λ A
-2 = 1 - e ^ = 1 - 0.1353 = 0.8647
.
berechnen. -»(c,iii) Für große Stichprobenumfänge läßt sich nach dem Zentralen
Grenzwert-
satz die ßinomialverteilung durch eine Normal Verteilung approximieren. Es ergibt sich mit η = 40, ρ = 0.05
392
Teil II: Klausuraufgaben und Lösungen
P ( X > 1) = 1 - P ( X < 1) = ,-?(
x
"nP
1.6449 · 5 + 50
»
m> 58.2245
,
d.h. es müssen m = 5 9 Parkplätze angelegt werden, um die gewünschte S i c h e r h e i t e i n h a l t e n zu können.
LÖSUNG ZU A U F G A B E
K5
-»(a) ( V g l . Aufgabe 2 . 2 ) Betrachtet man f ü r i = 1 , . . . , 5 das E r e i g n i s A.j = ' A r z t s t e l l t beim i - ten Patienten eine r i c h t i g e Diagnose 1
,
so i s t d i e zugehörige W a h r s c h e i n l i c h k e i t mit P(A.)
= 1^7= 0.98
gegeben. Für das Komplementärereignis Ä^, daß eine f a l s c h e Diagnose
gestellt
w i r d , g i l t demnach P ( Ä . ) = 1 - P(A l -) = 1 - 0.98 = 0.02
, i=1,...,5
.
->(a,i) Da der A r z t s e i n e Diagnose unabhängig von P a t i e n t zu Patient a b g i b t , berechnet s i c h d i e W a h r s c h e i n l i c h k e i t , daß der A r z t beim 1. und beim 2. und ...und beim 5. Patienten eine r i c h t i g e Diagnose s t e l l t , zu P(A 1 η A 2 n A 3 n A 4 n A 5 ) = P ( A 1 ) · P ( A 2 ) · P ( A 3 ) · P ( A 4 ) · P ( A 5 ) =0.98® = 0.9039
.
394
Teil II: Klausuraufgaben und Lösungen
-Ka.ii) Die Wahrscheinlichkeit, daß der Arzt erst beim fünften Patienten eine falsche Diagnose stellt, d.h. bei den ersten vier Patienten richtig und dann beim fünften Patienten falsch diagnostiziert, ergibt sich, vgl. Aufgabenteil (a,i), zu P(A, n A 2 n A 3 n A 4 n Ä 5 ) = P ( A 1 ) · P ( A 2 ) · P ( A 3 ) · P ( A 4 ) · P ( Ä 5 ) = 0.98 4 · 0.02 = 0.0184
.
->(b) (Vgl. Aufgabe 2.2) Mit gleichen Bezeichnungen wie im Aufgabenteil
(a), allerdings für i=1
m,
wird die Zahl m gesucht, so daß P(A 1 η A 2 n ... n A m _ 1 n Ä m ) < 0.01 gilt. Durch die äquivalenten
Umformungen
Ρ ( Α η ) · P ( A 2 ) · ... · P ( A m _ 1 ) - P ( Ä J < 0.01 0 . 9 8 m " 1 - 0 . 0 2 < 0.01
«
0.98m"1
« «
< 0.50
( m - 1) In 0.98 < l n 0 . 5 0 m
»
"
1
Ϊ i m l ·
34
·3096
m > 35.3096
zeigt sich, daß der Arzt zuvor bei m - 1 > 35 Patienten eine richtige Diagnose gestellt haben muß, damit die Wahrscheinlichkeit, daß er erst beim letzten Patienten m > 3 6 eine falsche Diagnose aufstellt, höchstens 0.01
beträgt.
-»(c) (Vgl. Aufgabe 6.l) Es liegt ein Fehler 2. Art vor, denn der Arzt entscheidet sich für die Nullhypothese Hg (Blinddarmentzündung), obwohl tatsächlich die Alternative H^ (Blinddarmreizung)
LÖSUNG
vorliegt.
ZU A U F G A B E
K4
Bei den Studierenden der Fachrichtung WiSo werden die Ereignisse Α Ξ 'Weiblich' und
,
Ä Ξ 'Männlich'
,
Teil II: Klausuraufgaben und Lösungen
SO = 'Schwerpunktfach:
395
Soziologie 1
betrachtet. Folgende Wahrscheinlichkeiten sind bekannt P(A) = 0.55 ,
P(Ä) = 0.45 ,
P(S0 I A) = 0.25 , P(S0 I Ä) = 0.30
.
-»(a) (vgl. Aufgabe 2.3) Mit Hilfe des Satzes von der totalen Wahrscheinlichkeit läßt sich zunächst die Wahrscheinlichkeit, daß ein(e) WiSo - Studierende(r) das
Schwerpunktfach
'Soziologie' gewählt hat, bestimmen. Es gilt P(S0) = P(S0 I A) · P(A) + P(S0 | Ä) · P(Ä) = 0.25 · 0.55 + 0.30 · 0.45 = 0.1375 + 0.1350 = 0.2725
.
Damit liegt der Anteil der WiSo - Studierenden, die nicht
schwerpunktmäßig
'Soziologie' studieren, wegen P(SCl) = 1 - P(S0) = 1 - 0.2725 = 0.7275 bei 72.75%. -•(b) (vgl. Aufgabe 2.l) Berechnet werden soll die Wahrscheinlichkeit für das Ereignis Ä n SO = 'Männlich und schwerpunktmäßig
Soziologie'
Nach dem Multiplikationsansatz für bedingte Wahrscheinlichkeiten liegt der gesuchte Anteil
mit
P ( Ä n SO) = P(S0 | Ä) · P(Ä) = 0.30 - 0.45 = 0.1350 bei
13.5%.
-»(c) (vgl. Aufgabe 2.4) Die Bayessche Formel liefert den Anteil der schwerpunktmäßig Studierenden, die weiblich sind, durch, vgl. Aufgabenteil P(A | SO) =
P(S0 | A) · P(A) P(SO I A) · P(A) + P(S0 I Ä) · P(Ä) = 0.5046
als 50.46%.
=
'Soziologie'
(a),
P(S0 | A) · P(A) P(S0)
396
Teil II: Klausuraufgaben und Lösungen
LÖSUNG ZU AUFGABE K5 ( V g l . Aufgabe 2 . 7 ) Das 'Wasser- System' S der Brauerei läßt sich grob in die Teilsysteme W 1 (Produktion), W 2
(Reinigung und Kühlung) und W^ (Abwasser) unterteilen, die
ein Seriensystem bilden, da zur Aufrechterhaitung der Produktion alle drei Teilsysteme intakt sein müssen. Aus den weiterhin gegebenen
Informationen
läßt sich das in Abb- CK 5.1 dargestellte Zuverlässigkeitsschaltbild
auf-
stellen.
Abh. CK 5.1: Zuverlässigkeitsschaltbild des Wasser - Systems S in einer Brauerei
Beim Teilsystem W 1 handelt es sich um ein Parallelsystem, denn mindestens einer der Brunnen Q^ und Q 2 muß intakt sein. Mit P(Q 1
intakt) = 1 - P(Q 1 defekt) = 1 - 0.10 = 0.90
,
P(Q 2 intakt) = 1 - P(Q 2 defekt) = 1 - 0.20 = 0.80 erhält man also P(W 1
intakt) = 1 - [(1 - P(Q 1
intakt))(1 - P(Q 2
= 1 - [(1 - 0 . 9 0 X 1 - 0.80)]
intakt))]
Teil II: Klausuraufgaben und Lösungen
397
= 1 - 0.10 · 0.20 = 0.98
.
Das Teilsystem W^, das die Wasserversorgung für die Reinigung und Kühlung s i c h e r s t e l l t , i s t i n t a k t , wenn mindestens 2 der n = 5 Brunnen funktionieren. Bezeichnet die Z u f a l l s v a r i a b l e X.= 1
( 1 | [ 0
, f a l l s Brunnen R. 1
intakt defekt
, i=1,...,5
,
so e r g i b t s i c h mit P ( X i = 1) = 0.80, i = 1 , . . . , 5 , daß
X =
5 V X. = 'Anzahl der intakten Brunnen 1 i=1 1
B ( 5 , 0 . 8 ) - v e r t e i l t i s t , da die Brunnen unabhängig voneinander intakt s i n d . Die W a h r s c h e i n l i c h k e i t , daß genau k der 5 Brunnen funktionieren, i s t a l s o gegeben durch P ( X = k)
0.8 k · 0 . 2 5 ~ k
f ü r k=0,1 , . . . , 5
und man e r h ä l t a l s I n t a k t w a h r s c h e i n l i c h k e i t des Teilsystems Wg P(W2 i n t a k t ) = P(X > 2) = 1 - P(X < 2) = 1 - P(X < 1) = 1-
£ ( f ) 0.8 k · 0 . 2 5 " k w i=0
= 1 - 0.2 5 - 5 · 0.8 · 0.2 4 = 1 - 0.00672 = 0.99328
.
Das Abwassersystem W^ besteht aus den drei p a r a l l e l kanälen A j , A A j ,
geschalteten Abwasser-
wobei
P(A i i n t a k t ) = 1 - P(A i defekt) = 1 - 0.10 = 0.90
, i = 1,2,3
A l s I n t a k t w a h r s c h e i n l i c h k e i t für W3 e r g i b t s i c h somit P(W3 i n t a k t ) = 1 - [(1 - P(A 1 i n t a k t ) ) ( 1 - P(A 2 (1 - P(A 3 i n t a k t ) ) ] = 1 - (1 - 0.90)(1 - 0 . 9 0 ) 0 - 0.90) = 1 - 0 . 1 0 · 0.10 · 0.10 = 0.99900
.
intakt))
.
398
Teil II: Klausuraufgaben und Lösungen
Die Wasser - Systemzuverlässigkeit berechnet sich nun aus der Wahrscheinlichkeit, daß das Seriensystem S bestehend aus den Komponenten W ^ , W^ und W 3 intakt ist, zu P(S intakt) = P(W 1
intakt) · P(W 2 intakt) • P(W 3
intakt)
= 0.98000 · 0.99328 · 0.99900 = 0.9724
.
LÖSUNG ZU AUFGABE K6 -•(a) (Vgl. Aufgabe 1.3, Aufgabe 2.3) Die Basis des betrachteten
Glücksspiels bilden die Ereignisse
S.j = 'Zug einer schwarzen Kugel aus i - ter Kiste 1 R- = 'Zug einer roten Kugel aus i - ter Kiste
1
,
,
G. = 'Zug einer grünen Kugel aus i - ter Kiste' für i=1,2,3. In der ersten Kiste befinden sich insgesamt 10 Kugeln; günstig für das Ereignis S^ sind 5 Fälle (schwarze Kugeln), d.h. es gilt
p < V 4
·
Analog ist p
(
R
1>=W
und
P
< V = T O
*
Wird nun eine aus der ersten Kiste gezogene Kugel in die zweite gelegt, so enthält diese damit insgesamt 6 Kugeln. Ist außerdem die aus der ersten Kiste gezogene Kugel schwarz, so sind unter dieser Bedingung 4 Fälle (es befinden sich dann 4 schwarze Kugeln in der zweiten Kiste) für das Eintreten von S,, günstig, d.h. P(S2|Sl)=J
.
Mit analogen Überlegungen erhält man P(S2|R,)=|
,
P(S 2 1 6 ^ = 1
.
DieWahrscheinlichkeit, aus der zweiten Kiste eine schwarze Kugel zu ziehen, berechnet
sich nach dem Satz von der totalen Wahrscheinlichkeit also zu
399
Teil II: Klausuraufgaben und Lösungen
P(S2) = P(S2 IS,)· P(S1) + P(S2 I R1) - P(R,) + P(S2 | G,) · P(G1) =
4 5 6'τπ
+
3 3 6'τπ
+
3 6
2 τπ
- 35 Auf g l e i c h e Weise e r g i b t
S,)
p(R 2 I R,)
=
I
6
II σ·>| r\i
P(R2
sich
bzw.
S,) ~ 6
P(G2
R,)
P(G2 IG,)
1
6
>
II
1 p(r2 IG,) = τ
1
p(g2
so daß d i e W a h r s c h e i n l i c h k e i t , aus der zweiten K i s t e e i n e rote Kugel zu ziehen,
P(R2) = P(R2 IS,)· P(S1) + P(R2 I R,) · RCR1) + P(R2 IG,)· P(G,) 1 5 " 6 ' W
2 3 I _2_ 6 " TO 6 ' 10
_ 13 = M b e t r ä g t , bzw. f ü r eine grüne Kugel e r g i b t
sich
P(G2) = P(G2 I S,) · P(S,) + P(G2 I R,) · P(R,) + P(G2 I G,) · P(G,) . 1 5 . 12 SÖ
=
1 3
2
2
·
Hat der S p i e l e r eine schwarze Kugel aus der zweiten K i s t e in d i e d r i t t e
Kiste
g e l e g t , so s i n d d i e d r e i s i c h dann i n der K i s t e b e f i n d l i c h e n Kugeln schwarz, d . h . das E r e i g n i s , unter d i e s e r Bedingung eine schwarze Kugel zu z i e h e n , bes i t z t die
Wahrscheinlichkeit
P(S3|S2)=f=1
.
Weiterhin e r h ä l t man
P(S3 | R2) = § p(s3|g2)=§
, ,
so daß
P(S3) = P(S3 | s 2 ) · p(s2)+ p(s3 I r2) · p(r2)+ p(s3 ι g2) · p(g2)
400
Teil II: Klausuraufgaben und Lösungen
_ . 35 " ' ' 60
2 13 2 12 _ 155 3 " 6Ü" 3 * 60 " T8C
'
Analog e r g i b t s i c h mit P(R3
I s2) = 0
P(G3
P(R 3 I R 2 ) = l
bzw.
P(R 3 I G 2 ) = 0
I s2) = 0
P(G 3 I R 2 ) = 0 P(G 3 I G 2 ) = 1
zunächst P(R 3 ) = P(R 3 I S 2 ) · P ( S 2 ) + P ( R 3 1 R 2 ) · P(R 2 ) + P(R 3 I G 2 ) · P(G 2 ) =
0 +
7 - S
+ 0
_ 13 180
bzw. beträgt die gesuchte Wahrscheinlichkeit.aus der d r i t t e n K i s t e eine grüne Kugel zu ziehen, d.h. bei diesem Spiel 10 Taler zu gewinnen, P(G3) = P(G3
I s2)
I R2)
· P ( S 2 ) + P(G3
· P(R2) + P(G3
I G2)
· P(G2)
=0tl4S _ 12 TM
->(b)
(Vgl.
Aufgabe
'
3.10)
Es bezeichne X die Z u f a l l s v a r i a b l e X = 'Spielergebnis' mit den Ausprägungen x^ = 1 = 'aus der d r i t t e n K i s t e wird eine schwarze Kugel gezogen' x 2 = 2 = 'aus der d r i t t e n Kiste wird eine rote Kugel gezogen'
,
x 3 = 3 = 'aus der d r i t t e n K i s t e wird eine grüne Kugel gezogen'
.
Mit den Ergebnissen aus Aufgabenteil
(a) i s t dann
p(x = x,) = P(X = 1) = ]§jj P(X = x 2 )
= PCX = 2 ) = Y J J
P(X = x 3 ) = PCX = 3) =
,
. ,
.
Hat e i n S p i e l e r eine grüne Kugel aus der K i s t e gezogen, so werden ihm 10 Tal e r ausgezahlt, d.h. er e r z i e l t einen Gewinn von 1 0 - 1 ( E i n s a t z ) = 9 T a l e r .
Teil II: Klausuraufgaben und Lösungen
401
F a l l s der S p i e l e r aber eine schwarze oder eine rote Kugel gezogen hat, dann v e r l i e r t er seinen E i n s a t z , d.h. er "gewinnt" - 1 Taler. Die Gewinnfunktion hat somit die Gestalt -1
χ = x^ = 1
-1
g(x) =
.falls
9
χ = x2 = 2 χ = x3 = 3
Auf lange Sicht macht der S p i e l e r einen durchschnittlichen Gewinn in Höhe von E(g(X)) =
Σ
g t v
· P(x--Xi)
= - ι · τ § "
1
+ 9
· τ έ
- W
ι =1
1
60 180
Tal er
d.h. er v e r l i e r t im Durchschnitt
0.3333 Taler pro S p i e l .
->(c) ( v g l . Aufgabe 3.1θ) Es s o l l der S p i e l e i n s a t z ζ f e s t g e l e g t werden, so daß s i c h f ü r den erwarteten Gewinn E(g(X)) = 0 e r g i b t . In Abhängigkeit von ζ läßt s i c h die Gewinnfunktion des hier betrachteten G l ü c k s s p i e l s angeben a l s , v g l . Aufgabenteil -ζ
χ = x.| = 1
-z
g(x)
(b) ,
.falls
10 - ζ
χ = Xg = 2 x = X3 = 3
Aus der s i c h somit ergebenden Gleichung l
g ( x · ) · P(X = x.) 1
i =1
1
155 180 '
13 'Τ8(Γ
läßt s i c h wegen 180
ein S p i e l e i n s a t z von z
=
120
T8Ö
=
2 ,
3
,
Taler
ermitteln, damit ein f a i r e s Glücksspiel
entsteht.
12 ' TW
402
Teil II: Klausuraufgaben
und
Lösungen
LÖSUNG ZU AUFGABE K7 Die Verteilung der diskreten
Zufallsvariablen
X = 'Anzahl der Blütenknospen bei der CARDOLILAPHYTE' mit den möglichen Ausprägungen k = 0,1,2,3 ist durch die in C a h . CK 7.1 zusammengestellten
Einzelwahrscheinlichkeiten
bestimmt.
Cab. CK 7.1: Verteilung der Anzahl X der Blütenknospen bei der CARDOLILAPHYTE
k
0
1
2
3
P(X = k)
0.08
0.20
0.45
0.27
-»(a) (vgl. Aufgabe 3.6) Die CARDOLILAPHYTE bildet wegen
E(X) =
3 l k - P ( X = k) = 0 - 0 . 0 8 + 1 - 0 . 2 0 + 2 · 0.45 + 3 - 0.27 = 1 .91 k=0
im Durchschnitt 1.91 Blüten aus. ->(c) (vgl. Aufgabe 3.9) Für den Median ξ^ g einer diskreten Zufallsvariablen X gilt
P(X
- ζ0
- 0·5
und
P(X
- ζ0
- °·5
·
Mit den Werten aus Tab. LK 7.1 erhält man als Median der Anzahl X der Blütenknospen, da P ( X < 2) = P(X = 0) + P(X = 1) + P(X = 2) = 0.08 + 0.20 + 0.45 = 0.73 > 0.5 P ( X > 2) = P(X = 2) + P(X = 3) = 0.45 + 0.27 = 0.72 > 0.5 gilt, die Blütenzahl
2.
Teil II: Klausuraufgaben und Lösungen
403
-•(b) (vgl. Aufgabe 3.6) Da 3 E(X 2 ) =
l k 2 · P(X = k) = 0 · 0 . 0 8 + 1 · 0 . 2 0 + 4 · 0.45 + 9 · 0.27 k=0
= 4.43
,
berechnet sich die Varianz der Blütenzahl X mit Hilfe des
Verschiebungssatzes
zu Var(X) = E ( X 2 ) - (E(X)) 2 = 4 . 4 3 - 1.91 2 = 0.7819
.
-»(d) (vgl. Aufgabe 7.1) Für die Anzahl Y von Blütenknospen bei der CARDOROSAPHYTE soll anhand von 2 η = 50 Beobachtungswerten mit Hilfe des χ
- Anpassungstests zum Niveau α = 0.05
geprüft werden, ob diese von der in Tab. LK 7.1 angegebenen Verteilung der Blütenzahl der CARDOLILAPHYTE signifikant verschieden ist, d.h. ob die Hypothese Hq : y^
y^Q
unterliegen der Verteilung von X
zugunsten der Alternative Hj :y^,...,ygg
unterliegen nicht der Verteilung von X
zum 5% Niveau verworfen werden kann. In tab. CK 7.2 sind neben den beobachteten Häufigkeiten 0. für die Ausprägungen i = 0,1,2,3 und den erwarteten Häufigkeiten, die sich m i t η = 50 und den Wahrscheinlichkeiten p 0 = P(X = 0) = 0.08
,
p 1 = P(X = 1) = 0.20
,
p 2 = P(X = 2) = 0.45
,
P 3 = P(X = 3) = 0 . 2 7 durch Ei=npi=50-pi
,1=0,1,2,3
,
ergeben, einige Hilfsgrößen zur Berechnung der Prüfgröße aufgeführt.
404
Teil II: Klausuraufgaben und Lösungen
2 tab. CK 7.2: A r b e i t s t a b e l l e zum χ - Anpassungstest
i
E
°i
o2 1
i
°?/Ei
0
8
4.0
64
16.0000
1
15
10.0
225
22.5000
2
12
22.5
144
6.4000
3
15
13.5
225
16.6667
I
50
50
61.5667
Mit den Ergebnissen aus Tab. LK 7.2 e r g i b t s i c h für die h i e r zu verwendende Prüfgröße der Wert
χ
=
3 0? l p l - η = 61.5667 - 50 = 11.5667 i=0 i
der bei k = 4 mit dem 0 . 9 5 - Q u a n t i l x
2 k-1;1-a "
x
2 3;0.95
=
7-815
a l s kritischem Wert verglichen werden muß. Da a l s o χ 2 = 11.5667 > 7.815 = X^-1;1-α
'
s i n d anhand der beobachteten Werte s i g n i f i k a n t e Unterschiede zum 5% Niveau zwischen den Verteilungen zu erkennen.
->(e)
(Vgl. Aufgabe
3.16)
Mit den Z u f a l l s v a r i a b l e n X.j = 'Anzahl der Blutenknospen an der i - ten P f l a n z e '
,
i=1,2,
die unabhängig voneinander, i d e n t i s c h v e r t e i l t s i n d , wobei die Verteilungen mit der im Aufgabenteil i s t die
(a) gegebenen Ubereinstimmen, v g l . tab. CK 7 . 3 ,
Zufallsvariable V = X 1 + Y 2 = 'Anzahl der Blütenknospen an beiden Pflanzen'
zu betrachten.
Teil II: Klausuraufgaben und Lösungen
405
Cab. CK 7.3: Verteilung von X^, 1=1,2
k
0
1
2
P(Xi = k)
0.08
0.20
3 0.45
0.27
Die Verteilung der Zufallsvariablen Y, deren mögliche Ausprägungen die Werte j=0,1,2,...,6 sind, läßt sich mit Hilfe der Faltungsformel p( Y = j) = I P ( X 1 = k ) - P ( X ? = j - k ) 1 i k
, j=0,1,... ,6 ,
gewinnen. Dabei wird über alle Werte k summiert, für die j - k eine Ausprägung von
darstellt. Mit den in Tab. LK 7.3 angegebenen Werten erhält man
für P(Y = 0) = P(X1 = 0) · P(X 2 = 0) = 0.08 * 0.08 = 0.0064
,
P(Y= 1) = P(X1 = 0 ) · P(X 2 = 1) + P(Xt = 1) · P(X 2 = 0) = 0 . 0 8 · 0 . 2 0 + 0 . 2 0 · 0.08 = 0.0320
,
P(Y = 2) = P(X1 = 0) · P(X 2 = 2) + P(X1 = 1) · P(X 2 = 1) + P(X, =2) · P(X 2 =0) = 0.08· 0.45 + 0.20 · 0.20 + 0.45 · 0.08 = 0.1120
,
P(Y = 3) = P(X1 = 0) · P(X 2 = 3) + P(X1 = 1) · P(X2 = 2) + P(X1 = 2) · P(X 2 = 1) + P(X1 = 3) · P(X2 = 0) = 0.08· 0.27 + 0.20 - 0.45 + 0.45 · 0.20 + 0.27 · 0.08 = 0.2232
,
P(Y = 4) = P(X1 = 1) · P(X 2 = 3) + P(X1 = 2) · P(X 2 = 2) + P(X, = 3) · P(X 2 = 1) = 0.20· 0.27 + 0.45· 0.45 + 0.27 · 0.20 = 0.3105
,
P(Y = 5) = P(X1 = 2) · P(X 2 = 3) + P(X1 = 3) · P(X 2 = 2) = 0.45 · 0.27 + 0.27 · 0.45 = 0.2430
,
P(Y = 6) = P(X1 = 3) · P(X 2 = 3) = 0.27 · 0.27 = 0.0729
.
Durch diese Einzelwahrscheinlichkeiten ist die Verteilung von Y eindeutig bestimmt.
406
Teil II: Klausuraufgaben und Lösungen
-»(f) (vgl. Aufgabe 3.14, Aufgabe 2.2) Frau ROSE hat unabhängig voneinander zwei Pflanzen erstanden; somit besitzt die
Zufallsvariable X = 'Anzahl der Pflanzen, die Blütenknospen entwickeln 1
die Ausprägungen i=0,1,2. Die Zufallsvariable Y = 'Anzahl der Blütenknospen an beiden Pflanzen' mit den Ausprägungen j=0,1,...,6 wurde bereits im Aufgabenteil tet. Die Verteilung des Zufallsvektors
(e) betrach-
(X,Y), d.h. die gemeinsame
Verteilung
von X und Y, ist durch die Wahrscheinlichkeiten P ( X = i , Y = j ) , i=0,1,2, j=0,1,2
6, gekennzeichnet. Um die Berechnung dieser
Einzelwahrschein-
lichkeiten, die in Cab. CK 7-4 zusammengestellt sind, zu erleichtern, sollen zunächst die Ereignisse B k £ = ' k - t e Blume e n t w i c k e l t e
Blutenknospen'
eingeführt werden. Dabei gilt einmal, daß B ^
und B ^ ,
,
k=1,2, £=0,1,2,3 ,
für 1,1 '=0,1,2,3,
V , (stochastisch) unabhängig sind, d.h. P(B
u
nB
2 r
) = P(Bu).p(B2r)
Weiterhin sind sowohl B ^ , B ^ ,
B^»
B
. 13
als
disjunkt, d.h. für 1,1' = 0,1,2,3, l \ V B
u
n B
u
, = 0
B
2 0 ' E21» B22» B23
paarweise
ist
.
B2inB2£, = 0
.
Für diese Ereignisse sind außerdem folgende Wahrscheinlichkeiten bekannt P ( B 1 0 ) = P ( B 2 0 ) = 0.08
,
P(Bn)
= P ( B 2 1 ) = 0.20
,
P ( B 1 2 ) = P ( B 2 2 ) = 0.45
,
P ( B 1 3 ) = P ( B 2 3 ) = 0.27
.
Da es sich
um paarweise disjunkte bzw. unmögliche Ereignisse handelt, er-
gibt sich sofort P(X = 0,Y = 1) = P(X = 0,Y = 2) = ... = P(X = 0,Y = 6) = 0 PCX = 1 ,Y = 0) = P(X = 2,Y = 0 ) = 0
,
,
PCX = 1 ,Y = 4 ) = PCX = 1 ,Y = 5 ) = P i x = 1 ,Y = 6 ) = 0
,
P i X = 2,Y = 1 ) = 0 Die übrigen Wahrscheinlichkeiten lassen sich nun wie folgt angeben: PCX = 0,Y = 0) = P ( B 1 0 n B 2 0 ) = P ( B 1 0 ) · P ( B 2 0 ) = 0.08 · 0.08 = 0.0064
;
Teil II: Klausuraufgaben und Lösungen
tlab. CK 7 . 4 : V e r t e i l u n g des z u f ä l l i g e n Vektors
\
Y
(X,Y)
x \
0
1
2
3
4
5
6
Ϊ
0
0.0064
0
0
0
0
0
0
0 0064
1
0
0 0320
0 0720
0.0432
0
0
0
0 1472
2
0
0
0 0400
0.1800
0 3105
0.2430
0.0729
0 8464
I
0.0064
0 0320
0 1120
0.2232
0 3105
0.2430
0.0729
1
P(X = 1 ,Y = 1) = P ( B n η B 2 0 ) + P ( B 1 0 η B 2 1 ) = P(B11) - P(B20) + P(B10) . P(B21) = 0.20 · 0.08+ 0.08 · 0.20 = 0.0320
;
P(X = 1 ,Y = 2 ) = P ( B 1 2 η B 2 0 ) + P ( B 1 0 η B 2 2 ) = 0.45 · 0.08+ 0.08 · 0.45 = 0.0720
;
P(X = 1,Y = 3) = P ( B 1 3 n B 2 0 ) + P ( B 1 0 n B 2 3 ) = 0.27 · 0 . 0 8 + 0.08 · 0.27 = 0.0432
;
Ρ(Χ = 2 , Υ = 2 ) = Ρ ( Β 1 1 Π Β 2 1 ) = 0.20 · 0.20 = 0.0400
;
P(X = 2,Y = 3 ) = P ( B 1 2 n B 2 1 ) + P ( B l 1 n B 2 2 ) = 0.45 · 0.20 + 0.20 · 0.45 = 0.1800
;
P(X = 2,Y = 4 ) = p ( B 1 3 n B 2 1 ) + P ( B 1 2 η B 2 2 ) + p ( B n η B 2 3 ) = 0.27 · 0.20 + 0.45 · 0.45 + 0.20 · 0.27 = 0.3105
;
P(X = 2,Y = 5) = P ( B 1 3 n B 2 2 ) + P ( B l 2 n B 2 3 ) = 0.27 · 0.45 + 0.45 · 0.27 = 0.2430
;
Ρ(Χ = 2,Υ = 6 ) = Ρ ( Β 1 3 Π Β 2 3 ) = 0.27 · 0.27 = 0.0729
.
407
Teil II: Klausuraufgaben und Lösungen
408
In Cab. CK 7.4 sind auch die sich ergebenden Randverteilungen
6 Ρ (X = i) =
l P(X = i , Y = j ) J=0 2 P ( Y = j ) = l P(X = i ,Y = j) i=0
für 1=0,1,2
,
für 3=0,1,2,3,4,5,6
eingetragen. Dabei stimmen natürlich die ermittelten
Einzelwahrscheinlich-
keiten für die Zufallsvariable Y mit denen im Aufgabenteil
(e) überein, d.h
auf diesem Wege ist auch eine Lösung für (e) gegeben. Die Einzelwahrscheinlichkeiten der zufälligen Größe X lassen sich auch liber die Binomialverteilung berechnen, denn unabhängig voneinander trägt jede Pflanze mit Wahrscheinlichkeit 0.08 keine Blütenknospe und mit Wahrscheinlichkeit 0.92 bildet sie Blütenknospen, d.h. mit n = 2 ist X B(2,0.92) - verteilt.
LÖSUNG -»(a)
ZU A U F G A B E
(Vgl. A u f g a b e
K8
3.2, Aufgabe
3.6, Aufgabe
3.8)
Die Zufallsvariable X ist stetig verteilt mit der Dichte
fx(x)
1/2
für 1 < χ < 2
0
sonst
und
3< x< 4
->(a,i) Die Verteilungsfunktion von X soll zunächst für drei Intervalle getrennt berechnet werden: Es ergibt sich für t 1 < t < 2:
t
F, (t)= J f x (x)dx= X
j
^dx=
1=
^
4
1 mi t F^ (2) = ^ 2 < t < 3:
t Fx(t) = J
,
t f x ( x ) d x = Fx(2) + | 0 d x = Fx(2)=^· 2
mit F x (3) = J;- ,
3 < t < 4:
t Fx(t)=j
t f x (x) dx = F x (3) + | ^ d x = 3
t
^xj
= jt -1 3
409
Teil II: Klausuraufgaben und Lösungen
Insgesamt ist damit die Verteilungsfunktion bestimmt durch t< 1
0 i2 t -
1
1 < t< 2
j
1 1
Fx(t) =
.falls
2< t< 3 3 < t< 4 t> 4
(a,ii) Als Erwartungswert der Zufallsvariablen X erhält man 2
4
χ f y ( x ) dx = I i x dx + I i x dx = [ i x 2 ]
E(X) = I
1 = 1 (4-1 + 16-9)
Als Median ξρ
+ [}XZ] 1
3 2.5
.
für den bei einer stetig verteilten Zufallsvariablen
stets
Fx(?0-5)=0.5 erfüllt ist, ergibt sich, da (vgl. Aufgabenteil F x ( x ) = 0.5
für alle
(a,i))
2 4
ξ
2
0.25~Ι
= 0
1
^0.75"
(a,i),muß
[3,4] sein. Somit ist dann wegen
·25
1
=0·75
al so ς 0 > 2 5 = ( 0 . 2 5 + ^ ) - 2 = 1.5
,
ξ0
.
? 5
= (0.75 + 1 ) · 2 = 3.5
Der Quartilsabstand beträgt dann ξ
0.75-ξ0.25
= 3
·5"1·5
= 2
·0
-»(b) (Vgl. Aufgabe 3.2) Die Zufallsvariable Y ist stetig verteilt mit der Dichte 1/4
für -c < y < -1
0
sonst
und
1 2
1
-»(c.Tii)
Für b e l i e b i g e Werte a,
a-Quantil
0< t < 2
0 0.90 erhält man hier als Mindestwert für η ' V n V 1 > 0.90 '
W 5
. / O l , , 1.90 Φ ·6· ν η ! > —τ, W
5
' '
L
0.01 6· • η > u 0 _ 9 5 V5
η > 61.3018 2 = 3757.9107 d.h. über den Zentralen Grenzwertsatz liegt die Anzahl der mindestens auszuführenden Würfe bei nur 3758, ist also weitaus geringer teil (a).
als im Aufgaben-
Teil II: Klausuraufgaben und Lösungen
LÖSUNG
ZU
AUFGABE
415
K10 2
Die Abweichung X vom Mindestdurchmesser wird als Ν(μ,σ ) - verteilt angenommen. Aus der Stichprobe vom Umfang η = 1 0 -
1 = W
x
10
i=1
1 i = l V ' 4 4 =4·4
x
s 2 = T q ^ T ( .1°
für μ und σ
2
x
i -
10
*2)
lassen sich die Schätzwerte
»
=
l (251.18 - 193.60) = 6.3978
berechnen.
->(a) (Vgl. Aufgabe 5.4) Für 1 - α = 0 . 8 0 , d.h. a = 0 . 2 0
i l ; 1 - a / 2
=
*n-1;a/2
x
=
x
ist
9;0.90
9;0.10
=
=
4
1 4
"
"
6 8
1 6 8
und somit ergibt sich in (n-1)s 2 2 χ η-1;1-α/2
9 · 6.3978 9 · 6.39781 14.68 ' 4.168
(n-1 )s . -j— x n-1;a/2
J
= [3.9224 , 13.8148] ein Konfidenzintervall
zum 80% Niveau für die Varianz σ
->(b) (Vgl. Aufgabe 6.3.c)
des Spiels.
2
Bei einer Unterschreitung der Varianzobergrenze von 12 (μιτι)
um 20%, d.h.
mit dem Vergleichswert O q = 1 2 - 0 . 2 0 · 12 = 9.60
,
soll getestet werden, ob die Hypothese Hq : σ2 > 9 . 6 zugunsten der Alternative, daß der Wert 12 um mehr als 20% unterschritten wird, H1 : σ 2 < 9.6 zum Niveau a = 0.25 verworfen werden kann. Als Prüfgröße
ist
416
Teil II: Klausuraufgaben und Lösungen
Χ
2 _ ( n - 1 ) s 2 _ ( 1 0 - 1) · 6.3978 _ qg7g ζ 9.6 3.3S/3 σ
0
zu verwenden, deren Wert mit dem Quantil =
Xn-1;a
4;0.25 =
5
·899
zu v e r g l e i c h e n i s t . Da χλ 2 = 5.9979 Jfr 5.899 = Αχη2 - 1 ; α kann d i e Hypothese H n a l s o zum 25% Niveau n i c h t abgelehnt werden, d . h . anhand 2 der S t i c h p r o b e i s t d i e V a r i a n z n i c h t a l s s i g n i f i k a n t k l e i n e r a l s 9.6 (pm) anzusehen.
-»(c) ( V g l . A u f g a b e 5 . 6 ) Unter den η = 10 Beobachtungswerten i s t m = 1 Ausschußstück f i n d e n , d . h . der A n t e i l =
p
r i V
= 0
·
( x ^ = 9 . 6 ) zu
der Ausschußstücke wird mit
1 0
auf 10% g e s c h ä t z t . Ein exaktes K o n f i d e n z i n t e r v a l l
f ü r den A u s s c h u ß a n t e i l
zum Niveau α = 0.80 e r h ä l t man über d i e Pearson - Clopper - Werte mit F
2m,2(n-m+1);cx/2
=
F
2,20;0.10
= 0.1059 F
2(m+1),2(n-m);1-a/2
=
P
=
1/F
=
20,2;0.90
1
/9.441
,
4,18;0.90
=
2-286
'
d.h. mF 1
"
n
-
2m,2(n-m+1);a./2
_ 0.1059 _ „ n l n , - 10.1059 - ° · 0 1 0 5
P2
=
P
2m,2(n-m+1);ct/2
m+1+mF
"
2,20;0.10
10 + F
2,20;0.10
'
(m + 1 ) F 2 ( m + 1 ) , 2 ( n - m);l-ct/2 _ 2 ' F4,18;0.90 = η -m 9 + 2 · F4 J 8 . 0 9Q m+ + (m+ 1) F 2 ( m * + 1 K 2 ( n ' _ m ) ; 1 _ a / 2
4 57? j 6 m
-
°·
[1.05% , 33.69%]
3 3 6 9
Teil II: Klausuraufgaben
LÖSUNG
ZU
AUFGABE
->(a) ( V g l . A u f g a b e
und Lösungen
417
K U
6.l)
Für die Lauflänge X von Videokassetten eines Markentyps, die als Ν(μ,14.44) verteilt angenommen wird, liegt eine zufällige Stichprobe vom Umfang n = 10 vor, aus der sich als Schätzer für den Erwartungswert μ von X X =
10
1
1 x
W
i
=
Tff' 1 7 9 2
= 179-2
Minuten
ergibt. Der vom Hersteller angegebene Sollwert für die Aufnahmekapazität dieser Kassetten liegt bei 180 Minuten, d.h. es soll zum Niveau α = 0.05 HQ : μ > 180
gegen
H1 : μ < 180
2 getestet werden. Mit σ * = 14.44, d.h. σ*=3.8,erhält man als Prüfgrößenwert , = ζ
X
" σ
- 180 \τ-π ,,, 7 vrr n = 179.2 / 10 = n-0.6657 Js-s 0
*
·
,
so daß die Hypothese Hg wegen ζ = -0.6657 4 - 1 - 6 4 « = - u 0 _ g 5 = V
0 5
= ua
zum 5% Niveau nicht abgelehnt werden kann. Die aufgestellte Vermutung kann also zu diesem Niveau nicht signifikant bestätigt werden.
-»(b) ( V g l . A u f g a b e
3.6, Aufgabe
6.l)
Der Hersteller gibt den Variationskoeffizienten mit v = J=0.02 2 2 an. Da die Varianz mit σ = σ * = 14.44 bekannt ist, läßt sich in diesem Fall das zu untersuchende zweiseitige Testproblem H q : v>= 0.02
gegen
H 1 : vf 0.02
wegen σ* -=0.02
σ
»
*
3 8 =
äquivalent als Hg : μ = 190
gegen
: μ ^ 190
angeben. Mit den Ergebnissen aus Aufgabenteil (a) erhält man in diesem Fall
418
Teil II: Klausuraufgaben und Lösungen
als Teststatistik ζ so daß bei
=
i l ü o y/n= σ*
^9.2-19 J.ö
0 / t o =
.
8
9875
einem Niveau von α = 0.20 die Hypothese HQ und damit auch HQ ver-
worfen werden muß, denn |z| = 8.9875 > 1.2816 = U 0
9 0
= υ,.α/2
.
Die vom Hersteller gemachte Angabe kann also zum 20% Niveau signifikant widerlegt werden.
->(c) (vgl. Aufgabe 9.l) Mit der Annahme, daß die Lauflänge X der Videokassetten stetig und symmetrisch verteilt ist und außerdem der Erwartungswert μ von X existiert, kann mit Hilfe des Vorzeichenrangtests von Wilcoxon das im Aufgabenteil
(a) for-
mulierte Testproblem Hg : μ > 180
gegen
H 1 : μ < 180
zum Niveau a = 0 . 0 5 geprüft werden. Cah. CK 11.1 hält, als Arbeitstabelle aufgebaut, die Beobachtungswerte x., ,
I
^
die transformierten Werte x ^ x ^ - 1 8 0 , die Beträge |x.|, die zugehörigen Rangzahlen R(|x^|) und die mit dem Vorzeichen von x! versehenen Statistiken R. für i = 1,
»10 fest.
Cab. CK 11.1: Arbeitstabelle zum Vorzeichenrangtest von Wilcoxon
X
1 i
i
χ. 1
1
185 6
5 6
2
182 3
2 3
R(i*;i)
«i
5.6
9
9
2.3
5
5
3
176.4
-3 6
3.6
7
-7
4
178 6
-1 4
1.4
3
-3
5
177 5
-2 5
2.5
6
-6
6
181 9
1 9
1.9
4
4
7
180 2
0 2
0.2
1
1
8
174 2
-5 8
5.8
10
-10
9
175 9
-4 1
4.1
8
-8
10
179 4
-O 6
0.6
2
-2
Teil II: Klausuraufgaben und Lösungen
419
Somit ergibt sich für die Prüfgröße w als Summe der positiven Werte von
w = 9 + 5 + 4 + 1 = 19 Bei einem Niveau a = 0 . 0 5 liegt der kritische Wert des
Vorzeichenrangtests,
vgl. Tab. L9.1.3, hier bei w
n;o
= w
10;0.05
= 11
d.h. wegen w = 19 *Γ 11 = w
η ;α
kann auch hier wie im Aufgabenteil
(a) die Hypothese nicht verworfen werden.
LÖSUNG ZU AUFGABE K12 (vgl. Aufgabe 4.8, Aufgabe 6.l) Die von einer Anlage in Tuben abgefüllte Menge X an Zahnpasta ist nach Voraussetzung Ν(μ,16) - verteilt. Wenn der tatsächliche Inhalt der Tuben nur in 3% der Fälle kleiner als 160 mt ist, so gilt die Anlage als richtig eingestellt, d.h. falls P ( X < 160) = 0.03 erfüllt ist. Wegen P(X 0.5 zugunsten von H 1 : p < 0.5 verworfen werden muß. Da aus Zeitersparnisgründen der approximative Einstichproben - Gauß - Test verwendet werden darf, ist also die Prüfgröße _
m-np0
_
v ' n p g d - Pq)
^.a.o.s
_ _2
V 28 · 0.5 · 0.5
zu berechnen. Mit α = 0.30 und u^ = u Q
3q
= "uq
=
^ ^
\ί 7 7g
=-0.5244
m u ß
we
9en
ζ = -0.7559 < -0.5244 = u n , n = u 0.30 α die Hypothese, daß die Behandlungsmethode erfolgreich ist, zum 30% Niveau verworfen werden.
->(b,ii) Bei gegebenen Ausprägungsmögl ichkeiten a, ϊ 'Weiblich' und a 2 = 'Männlich' des Geschlechts Y
X sowie b, S 'Ja' und b g ^ ' N e i n ' des
Behandlungserfolges
(wobei die Behandlung für einen Patienten als erfolgreich anzusehen ist,
wenn er mehr als fünf Jahre überlebt)
soll anhand von η = 2 8
unabhängigen
Beobachtungen die Hypothese der Unabhängigkeit von X und Y , d.h. H
0
: p
ij
=p
i . *p.j
für alle i,j=1,2
gegen H, : p.jj
p.j
•ρ j
für mindestens ein (i,j)
zum Niveau α = 0.25 getestet werden. Cab. CK 13.2 stellt die sich ergebende (2 χ 2) - Kontingenztafel prägungskombinationen
mit den beobachteten Häufigkeiten ηη.. für die Aus-
(a.j,b·), i,j=1,2,dar.
423
Teil II: Klausuraufgaben und Lösungen
Cab. CK 13.2: (2*2) - Kontingenztafel; Geschlecht und Behandlungserfolg η = 28 Patienten
von
^vfiehandlungsNein
Ja
^^erfolg
l
Geschlecht Weiblich
η
Männlich
n
21
n
.1
I
8
n12 = 8
n
i
=
4
n22 = 8
n
2
=
12
η
η = 28
ι Γ
2
= 16
= 16 = 12
Somit erhält man für die Prüfgröße den Wert 2 2 x
28(8·8-8·4)2
η(η11π22-η12η21) "
η
ι
n
Π
1 2
n
2
16-12-12-16
_ 28672 _ ~ 36864
n u
777H
-///ö
und m i t a = 0.25, k = 2, 1 = 2 sowie x
2 (k-1)(£-1);1-a
= x
2 1;0.75
kann die Unabhängigkeitshypothese
=
1
"323
wegen
χ 2 = 0.7778 * 1.323 = x 2 k . 1 ) ( £ . 1 ) ; 1 . a zum 25% Niveau nicht verworfen werden.
-»(c) (Vgl. Aufgabe 8.1, Aufgabe 8.3, Aufgabe 8.4, Aufgabe 8.5) Die Überlebenszeiten X^ und X 2 männlicher und weiblicher krebskranker Patienten, die einer bestimmten Behandlungsmethode unterzogen wurden, seien 2
2
unabhängig Ν(μ 1 , σ ^ -
und Ν ( μ 2 , σ 2 ) - verteilt. Mit Hilfe der n 1 = 12 bzw.
n 2 = 16 Beobachtungswerten läßt sich die durchschnittliche der Männer auf 1 x^ = j 2
12
1
χ
und die der Frauen auf
1 ιη· = - ^ " 6 2 . 1 = 5 . 1 7 5 Jahre
Überlebenszeit
424
Teil II: Klausuraufgaben und Lösungen
schätzen.
2
->(c,i) Unter der Annahme, daß die Varianzen mit
2
2 2 = 9 und σ 2 = σ 2 * = 7
bekannt sind, soll zum Niveau α = 0.30 die Hypothese H q : μ1 = μ 2
gegen
H 1 : μ,
getestet werden. Mit d = 0 ergibt sich als Wert der zugehörigen Prüfgröße x
. _
i"x2"d _ 5.175 - 3.550 _ 1.625 1 ~Ύ~ /9 J 7 VI .1875 σ 2* V 12 16 TT," + 1 Γ Γ
ß^TZ
=
τ
4912
und da |z| = 1 . 4 9 1 2
> 1.0364 = U 0 _
8 5
= U1_CX/2
gilt, bestehen bei einer Irrtumswahrscheinlichkeit von 0.30 signifikante Unterschiede zwischen den durchschnittlichen Oberlebenszeiten der männlichen und weiblichen Patienten.
-»(c,ii) Unter der Annahme, daß die Varianzen unbekannt aber gleich sind, d.h. 2 2 σ^ = σ 2 gilt, soll zum Niveau ot = 0.10 die Hypothese H 0 : μ1 < μ 2 getestet werden. Mit
gegen
Η, : μ 1 > μ 2
12
5
1
=
T2^T ( j
X
1i " 1 2 * 1 )
=
T T ( 3 9 5 · 5 9 0 0 - 321.3675) = 6.7475 ,
5
2
=
T f W
x
2i " 1 6
=
T 5 (263.2000 - 201.6400) = 4.1040
(.f
erhält man zunächst 2 ρ
=
(n
2 2 1 ' 1 ) s 1 + ( n 2 " 1 ) s 2 = 11 · 6.7475 + 15 · 4.1040 n1 + n 2 - 2 26
und somit für die hier zu verwendende Prüfgröße
=
X
1 ~x2"d
=
5. 175 - 3.550 - 0
=
1
862Q
=
5
„
2 4
Teil II: Klausuraufgaben
und Lösungen
425
Da t = 1.8620 > 1 . 3 1 5 = t , , n Q n = t 26 ;0.90 n,|+n,,-2 ;1-α muß obige Hypothese zum 10% Niveau abgelehnt werden, d.h. die d u r c h s c h n i t t l i che Überlebenszeit der Frauen i s t bei einer Irrtumswahrscheinlichkeit von 0.10 s i g n i f i k a n t k l e i n e r a l s die der Männer.
- » ( c . i i i ) Unter der Annahme, daß die Varianzen unbekannt und ungleich s i n d , s o l l zum Niveau α = 0.05 die Hypothese gegen
Η0:μ1 μ 2
2 2 getestet werden. Da s^ = 6.7475, s 2 = 4.1040, v g l . Aufgabenteil is2 S 1 "1 '»r n
21 2 2
+ +
n
j k n , - 1) +
1
2. [-11 n
n 2 - 1)
2
(6.7475 4.1040 A z u z l z i r i
g i l t , i s t mit dem w
(approximativen) d
=
( c , i i ) , und
20.2366
Prüfgrößenwert
5.175 - 3.550 - 0 /6.7475 ν T2
=
1
7g58
4.1040 16
die Hypothese Hg zum 5% Niveau zu verwerfen, denn t = 1 .7958 > 1 .725 = t 2 0 ; 0
95
,
d.h. bei einer Irrtumswahrscheinlichkeit von 0.05 i s t die d u r c h s c h n i t t l i c h e Überlebenszeit der männlichen Patienten s i g n i f i k a n t größer a l s die der weibl i c h e n Patienten.
2 2 - > ( c , i v ) Für die Varianzen σ^ und σ^ der Überlebenszeiten von männlichen und weiblichen Patienten s o l l folgendes Testproblem behandelt werden:
426
Teil II: Klausuraufgaben und Lösungen
2 2 Hq : σ1 = σ2
2 2 Hj :σ1 ^ σ 2
gegen
ρ (c,ii) ermittelten Stichprobenvarianzen s, = 6 . 7 4 7 5
Mit den im Aufgabenteil
und s 2~ = 4 . 1 0 4 0 berechnet sich für die Prüfgröße der Wert
F =
S 1 ~2 2
=
so daß mit a = 0 . 2 0
6.7475 = = 1.6441 4.1040
wegen
F = 1.6441 + 2.036 = F
F = 1.6441 i
11,15;0.90"Fn1-1,n2-1;1-a/2
0.4615 =
2
·167
F
= F 15,11;0.90
»
11,15;0.10
= FF n.-1,η,-1;a/2 1 2 die Hypothese der Gleichheit der Varianzen zum 20% Niveau nicht verworfen werden kann. Die Varianzen der Überlebenszeiten von weiblichen und männlichen Patienten unterscheiden sich zum Niveau 0.20 also nicht signifikant.
-»(d) ( V g l . Aufgabe 9 . 3 ) Für die Überlebenszeiten X^ und X 2 männlicher und weiblicher
Patienten,die
als unabhängige, stetig verteilte Zufallsvariablen mit existierenden tungswerten μ^ und μ 2 angenommen werden, soll zum Niveau α = 0 . 3 0 werden, ob signifikante Unterschiede zwischen den mittleren
Erwar-
geprüft
Überlebenszei-
ten μ,| und μ 2 bestehen, d.h. es ist HQ : μ 1 = μ 2
gegen
H1 : M1
zu testen. Als nichtparametrisches Prüfverfahren bietet sich in diesem Zweistichprobenfall
der Wilcoxon - Rangsummentest an. Zur Ermittlung der zuge-
hörigen Teststatistik sind in t a b . CK 13-3 die Rangzahlen der insgesamt n^ + n 2 = 1 2 + 1 6 = 2 8
ßeobachtungswerte festgehalten. Dabei wurden gleichen
Werten innerhalb einer Stichprobe die Rangzahlen fortlaufend
zugeordnet,
während bei gleichen Werten in beiden Stichproben die zugehörigen Rangzahlen gemittelt wurden. Über die Summe der Ränge, die für die erste Stichprobe, d.h. für die Überlebenszeiten der männlichen Krebspatienten, vergeben wurden, 12 wR =
l
R i x ^ ) = 6.5 + 14 + 13 + . . . + 27 = 202.5
427
Teil II: Klausuraufgaben und Lösungen
Cab. CK 13.2: Rangzahlen der insgesamt 28 Beobachtungswerte X
i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
X
x
21
Rix
Ii
2 .1 3 .7 3 .4 3 .3 4 .5 7 .8 8 .2 2 .9 4 .9 3 .2 9 .4 8 .7
216
X
1i>
6.5 14 13 12 15 25 26 9 16 11 28 27
R(X21)
2i
5 .5 0 .4 2 .1 0 .7 5 6 1 0 2 .5 1 .9 1 .9 5 1 5 3 5 3 3 .1 5 2 6 1 5 1
22 1 6.5 2 23 3 8 4 5 17 20 21 10 19 24 18
erhält man bei approximativer Durchführung des Tests mit n^ = 12, n ^ = 16 für die Prüfgröße den Wert ^
wR-0.5n1(n1
K
y n 1 n 2 ( n l + n 2 + 1)/12
der mit dem Quantil
υ
·]_α/2 =
1)
u
202.5 - 0.5 · 12 · 29
28.5
ν Ί 2 · 16 · 29/12
v^64
1 -0 15 = u 0 85
zu
9eh°rigem
,
kritischen
Wert verglichen werden muß. Da lwR I = 1 · 3 2 3 1
>
1
-0364
= u
0 . 8 5 = u 1-a/2
·
kann die Hypothese H Q zum 30% Niveau verworfen werden. Somit sind bei einer Irrtumswahrscheinlichkeit von 0.30 signifikante Unterschiede zwischen den Überlebenszeiten der männlichen und weiblichen Krebspatienten zu verzeichnen.
LÖSUNG
ZU A U F G A B E
K14
-»(a) (Vgl. Aufgabe 8.6, Aufgabe 3.14, Aufgabe 4.8) Die Umsatzdifferenzen zum Vormonat X^ und X^ zweier Produkte stellen voneinander abhängige Ν(μ,,4)-
bzw. Ν(μ ? ,36) - verteilte Zufallsvariablen dar.
428
Teil II: Klausuraufgaben
und
Lösungen
-»(a,i) Für die d u r c h s c h n i t t l i c h e n Umsatzdifferenzen μ^ und μ 2 s o l l
folgendes
Testproblem untersucht werden: Hg : μ 1 = μ 2
gegen
Η, : μ 1 ^ μ 2
Aus der angegebenen K o r r e l a t i o n Py y = - 1 - 0 12 2 l ä ß t s i c h die Kovarianz zwischen X^ und X 2 a b l e i t e n , denn mit σ^ = 4 und σ 2 = 3 6 e r g i b t s i c h wegen Cov(XrX2) PX
X
1 2
y Var(X^) · V a r ( X 2 )
J
.
q2
VT^36
12
gerade σ12 = -12
.
Die Varianz der Z u f a l l s v a r i a b l e n D = X^ - X 2 i s t a l s o bekannt und hat den Wert Op* = a \ + σ 2 - 2σ 1 2 = 4 + 36 + 2 · 12 = 64
In Cab. CK 14.1 s i n d neben den beobachteten Umsatzdifferenzen x^. und χ 2 ι · , i = 1 , . . . , 7 , der beiden Produkte die zur Berechnung der Prüfgröße benötigten paarweisen Differenzen d.. = x.| . - Xg.., i=1
7, zusammengestellt.
Cah. CK 14.1: Umsatzdifferenzen ( i n 10000 DM) x^. und x ^ Differenzen d^ = x ^ - x 2 i f ü r i = 1 , . . . ,7
d.-x1.-x2.
i
X
1 2 3 4 5 6 7
1 -1 0 3 -2 -3 2
-2 4 1 -8 7 10 -5
3 -5 -1 11 -9 -13 7
I
0
7
-7
1i
X
2i
sowie paarweise
Teil II: Klausuraufgaben
Mit η = 7, öp* = 8,
429
und Lösungen
= 0 und
7 a
= 7 AI V r ( i=1
7
>
= -1
erhält man nun für die Teststatistik den Wert d
ζ
=
"M0
_ π
D*
-1-n _ = _ l " v ' 7 =-0.3307 8
,
der bei einem vorgegebenen Niveau α = 0.08 mit dem kritischen Wert
u
i-a/2
=
Uq g g = 1.7507 verglichen werden muß. Da |z| = 0.3307 $ 1 .7507 = u , . ^ gilt, kann die
Hypothese
zum 8% Niveau nicht verworfen werden, d.h. es
kann kein signifikanter Unterschied zwischen den jeweiligen Durchschnittswerten bei einer Irrtumswahrscheinlichkeit von 0.08 festgestellt werden.
->(a,ii) Den Umsatzdifferenzen zum Vormonat X^ und X^ wird nun weiterhin unterstellt, daß diese gleiche Erwartungswerte besitzen, d.h. X. sei Ν(μ,4) ο I und X 2 sei Ν(μ,36) - verteilt. M i t a D * = 64, vgl. Aufgabenteil
(a,i), ist
also D = X 1 - X 2 wegen E(D) = E(X 1 ) - E(X 2 ) = μ - μ = 0
,
Var(D) = σ ^ = σ ^ = 64 N(0,64) - verteilt. Die gesuchte Wahrscheinlichkeit, daß sich die jeweiligen Umsatzdifferenzen zum Vormonat um höchstens 5 (in 10000 DM) unterscheiden, ergibt sich damit zu P(|D| < 5) = P(-5< D < 5) =
= Φ
p f < W 6 4
— < - = ) / 5 4 " V 64'
( Ι ) · φ ( " | ) = 2Φ(0.63) - 1
= 2 · 0.7357 - 1 = 0.4714
.
-»(b) (vgl. Aufgabe 10.1, Aufgabe 10.2) -»(b,i) Bezeichnen X und Y die Umsätze, die für zwei Produkte in einem Supermarkt erzielt worden, so soll anhand von η = 18 Beobachtungspaaren, die einen Stichprobenkorrelationskoeffizienten und somit einen Schätzer für
430
Teil II: Klausuraufgaben und Lösungen
die Korrelation
in Höhe von
rXY = - 0 . 2 8 liefern, die Hypothese der positiv
linearen Abhängigkeit zwischen X und
Y, d.h. H
:P
0
XY - 0
9egen
H
1
:P
XY
< 0
zum Niveau a = 0 . 0 1 geprüft werden. Dabei wird den Umsätzen X und Y eine gemeinsame Normal verteilung
unterstellt.
Als Prüfgrößenwert erhält man nun
t
=
r
XY ' ^
n
/
"2
-0.28 · V~T6
=
1 - rJi 'XY
/ l - 0.28
= 2
-1.12 = 0.96
1667
der bei obigem einseitigen Testproblem zum Niveau α = 0.01 mit dem Quantil =
^n-2;a
t
16;0.01
=
_t
16;0.99
=
"2·583
verglichen werden muß. Da t = -1 .1667 4Γ -2.583 = t
, n-2;a
gilt, kann die Hypothese des positiven Zusammenhangs zwischen X und Y zum 1% Niveau nicht verworfen werden, d.h. die bisherige Ansicht kann zum \% Niveau nicht signifikant widerlegt werden.
->(b,ii) Es soll ein (approximatives) Konfidenzintervall für die Korrelation ρ χ γ berechnet werden. Mit η = 18, Va/2
= u
0.95 = 1 · 6 4 4 9
»
r X y =-0.28 ist dieses wegen ,
z
r
_ 1 , 2ln
1+ r
XY
_ 1 , 0.72 " Ι 1 n ΤΓ28
+
r XY Vct/2 - 2(τπτ - 7 = =
0.28 2ΛΪ -
1.6449
= -0.2877 + 0.0082 - 0.4247 = -0.7042
,
zum Niveau 1 - a = 0.90
Teil II: Klausuraufgaben und Lösungen
1
,
in
'XY
1 + Γ χ Υ
431
1-α/2
-0.2877 + 0.0082 + 0 . 4 2 4 7 0.1452 bestimmt durch 2 z.
2z„ -
-1.4084
- 1
1
2 z.
2z„
e
-1.4084
+ 1
e
+ 1
0.2904 0.2904
.1 ^ . + 1
[0.2445 - 1 1 .3370 - 1 0.2445 + 1 ' 1 .3370 + 1 [-0.6071 , 0.1442]
-+(c) (vgl. Aufgabe 11.1, Aufgabe
10.l)
-»(c,i) Der Umsatz Y, der für einen Modeartikel
in Supermärkten erzielt wird,
hänge annähernd linear von dessen Preis X ab. Aus den bei η = 2 3
zufällig
ausgewählten Supermärkten festgehaltenen Preisen x^ und zugehörigen Umsätzen y.j, i = 1
23, ergab sich χ = 52
,
y = 121000
s 2 = 25
,
s 2 = 361000000
.
Weiterhin läßt sich nun aus der ebenfalls bereits ermittelten
Stichproben-
korrelation r^y = -0.7 die empirische Kovarianz zwischen X und Y berechnen. Da
r
S XY / 2
XY
=
g
S XY 5 · 19000
S XY 95ÖÖÖ
=
'
' SY
Λ ergibt sich S
XY
=
0.7 · 9 5 0 0 0 = - 6 6 5 0 0
Nach der Methode der Kleinsten Quadrate erhält man die Schätzwerte bg und bj der linearen Beziehung durch η h
l ix.-ÄXy,-y) i=1 1 = η — l i= 1
(x 1
r
i)
2
=
. XY ~r S
X
=
-66500 " T T " =
"2660
432
Teil II: Klausuraufgaben und Lösungen
und t>0 = y - b,x = 121000 + 2660 · 52 = 259320 Somit kann also der Umsatz eines Supermarktes bei vorgegebenem Preis χ durch y = 259320 - 2660 χ geschätzt werden.
->(c,ii) Aus der soeben berechneten Regressionsbeziehung
läßt sich bei einem
Preis von X g = 4 0 DM der Umsatz wegen
y Q = y ( 4 0 ) = 259320 - 2660 · 40 = 152920 auf 152920 DM prognostizieren.
->(c,iii) Um ein Prognoseintervall
zum Niveau 1 - α = 0.90 für den Umsatz des
Artikels bei Vorliegen eines Preises in Höhe von x n = 4 0 DM bestimmen zu 2 können, muß zunächst die Fehlervarianz σ geschätzt werden. Dieser Schätzwert s 2 ergibt sich aus der Beziehung 2 _ XV
(n-2)s2 ,2 (n - 1η )Sy
Y,X ~
mit η = 2 3 , r X Y = - 0 . 7 , Sy = 361000000 zu
s2
=
= M i t
7^4
(1
~rXY)
S
Y
=
I f
(1
" (-°-7)2)
361000000
192877142.9
tn-2;1-a/2 = t21;0.95 = 1
-721
n - 2 ; 1-α/2
/
e r h ä l t
man
η
( n
f Ü r
_
1 ) 2
X
= 13888.0216 · 1.721 · J ^
+
^ " Λ ^
= 27307.1157 und somit ist das gesuchte 0.90 - Prognoseintervall
bestimmt durch
[b Q + b^Xq - D . b g t b ^ Q + D] = [259320 - 2660 · 40 - 27307.1157 , 259320 - 2660-40 + 27307. 1 157] = [125612.8843 , 180227.1157]
Teil II: Klausuraufgaben und Lösungen
433
LÖSUNG ZU AUFGABE K15 ->(a) (Vgl. Aufgabe 11.3) Es wird vermutet, daß die Wohnfläche Y annähernd linear vom Nettoeinkommen des Haushaltes X 1 und der Haushaltsgröße X,, abhängt, d.h. es soll eine Funktion der Form y = bQ + blx1 + b 2 x 2 geschätzt werden. Aus den gegebenen Werten berechnet man zunächst mit = 9 · 741.1 2 = 4943062.89
SQ„ = (η - 1 )Sy X X 1 1 = (n - 1)s 2
SQX
SP Y
Y
12
= 9 - 1 - 4 2 = 17.64
= (η - 1 )s Y
Y
12
η=10
,
,
= 9 - 740 = 6660.00
,
SPX
Y
= (n-1)sYX
= 9 · 18460 = 166140.00
SP X
γ
= (n - 1 ) s Y X
= 9 - 32.9 = 296.10
,
.
Die Schätzwerte b^ und b 2 ergeben sich dann als Lösung des Normalengleichungssystems 4943062.89 ^
+ 6660.00 b 2 = 166140.00
6660.00 b^ +
17.64 b 2 =
296.10
zu b 1 = 0.0224 b 2 = 8.3368
, .
Da b Q = y - b 1 x 1 - b 2 x 2 = 64.5 - 0.0224 · 2360 - 8.3368 · 2.9 = -12.5407
,
lautet die geschätzte multiple
Regressionsfunktion
y = -12.5407 + 0 . 0 2 2 4 x 1 + 8 . 3 3 6 8 x 2
-•(b) (Vgl. Aufgabe 11.3, Aufgabe ll.l) Es soll geprüft werden, ob das Nettoeinkommen X^ zur Erklärung der Wohnfläche ausreicht, d.h. zum Niveau α = 0.05 ist
434
Teil II: Klausuraufgaben und Lösungen
HQ : Xj reicht als Regressor aus gegen H^ : X,| reicht als Regressor nicht aus zu prüfen. In die hier zu verwendende Prüfgröße geht zunächst einmal das Bestimmtheitsmaß der Regressionsgeraden y(x(1))=b0
+ b
1x(1)
mit
x
iD
=X
1
ein. Dieses läßt sich aus der für die einfache lineare Regression geltenden Beziehung s2
2 Βγ·χ(ΐ)
mit s Y X
=
Β γ
·
χ
Γ
= 18460, Sy = 27.2, s^
YX1
Γ χ
ι
γ =
YΖ ^ XΤ1
=741.1
bestimmen:
By γ = * ρ· = 0.8386 Υ,λ ( 1 ) 27.2 · 741.1
Das Bestimmtheitsmaß der unter (a) durchgeführten multiplen Regression be2 rechnet sich mit s = 59.48 und Sy = 27.2 zu
B„ /„
Für
χ
.= 1 - Ι " - 2 - 1 ' / (n - 1)Sy
= 1 -
= 0.9375
.
9 · 27.2
die Teststatistik erhält man somit wegen SSR 2 = B y
(x
x
j · ( η - 1 )Sy = 0.9375 · 9 · 27.2 2 = 6242.4000
SSR' = B v v · (n - 1 )S 2 = 0.8386 · 9 · 27.2 2 = 5583.8684 1 Y,X(1) Y den Wert SSR 2 SSR 1 —2 s der mit dem 0.95-Quantil
=
6242.4000 - 5583.8684 ,, 59748 = 11.0715
,
,
435
Teil II: Klausuraufgaben und Lösungen
F
q,n-k-1;1-a " F1,7;0.95
5-591
verglichen weden muß. Da F = 11.0715 > 5.591 = F„
, , .
gilt, muß die Hypothese Hg zum 5% Niveau abgelehnt werden,
-»(c) (vgl. Aufgabe 12.3, Aufgabe
12.1.b)
Bezeichnet p*j die Wahrscheinlichkeit, mit der bei der i - ten Stichprobe, i=1,2,3 (=k), ein Haushalt der Einkommensklasse K^, j=1,2 (=£), zugeordnet wird [es gilt dann: P*i
+
P*2
= 1
i=1
> 2 , 3 ] , so interessiert, als erweiter-
te Homogenitätshypothese, hier die [bedingte] H
0
:p
ij=H=r)
fÜr3116 UU2
'3'
Gleichverteilungshypothese j=1 2
' '
die zum Niveau α = 0.25 gegen die Alternative H, : p*
fl
für mindestens ein Paar (i,j)
getestet werden soll. In Cab. CK 15.1 sind neben den Beobachtungsdaten die
η.^,
angeben , wieviele Haushalte aus der i - ten Stichprobe in der j - ten
Einkoimiensklasse liegen, auch die unter Hg erwarteten Anzahlen 1 II . . = — n, II . - yr m,, ij 1 . 2
( = ni
·^
, i=1,2,3, j = 1,2,
eingetragen, so daß sich der Wert der Teststatistik zu ο x
2
3 =
(n. 1 - m ..) Z
2
1J
I Σ 1=1 j«1
. (6-5) 2 5
m
1J
ij
(4-5) 2 5
(8-6)^ 6
(4-6) 2 6
(9-7) 2 7
(5-7) 2 7
= 2/5 + 4/3 + 8/7 = 302/105 = 2.876 ergibt. Da dieser nicht größer als der kritische Wert
x
k(£-1);1-α
=
*3;0.75
=
4
"108
ist, sind die Haushalte zum 2 5 % - N i v e a u nicht signifikant auf die beiden Einkommensklassen
verteilt.
unterschiedlich
436
Teil II: Klausuraufgaben und Lösungen
Jab. CK 15.1: (3χ 2) - Kontingenztafel; Haushaltsstichproben und Einkommensklassen
N^inkommensklasse K. J Haus- \ . 3 haltsStichprobe i
2
1
ν.
1
n
2
3
11
n12=4
= 6
m1t =5
m12 = 5
n21=8
n22 = 4
m21=6
m22 = 6
Π
n32 = 5
31
= 9
->(d) (vgl. Aufgabe
n1
= 10
n2
= 12
n
3. =
14
m32 = 7
m31 = 7
12.4)
Mit den Angaben zum Aufgabenteil n^
I
(c) ergibt sich die tab. CK 15.2, wobei
die Anzahl der Haushalte angibt, die in K^ und in G i liegen; entsprechend
bezeichne p ^
die zugehörige Wahrscheinlichkeit, i=1,2 (=k), j=1,2 (=1). Zum
Niveau 25% ist nun die [totale]
Gleichverteilungshypothese
(= k T r )
V - P i r l
f ü r a l l e
1=1
·2>
j=1·2
zu testen gegen die Alternative H^ : p^j f-g-
für mindestens ein Paar (i,j)
Für η = 3 6 Haushalte sind bei [totaler] Gleichverteilung m
ij = 9 = f
i ' r h )
'
i=1
'2
. und speziell
V2 · (2 • y - 1) Vl-(2-V-l)2
2;r
C 9 U 9 + C 7 u 7 + C s U 5 + C 3 U 3 + Ci u tn; 1
92160 η 4
~
mit u - u r c 9 = 79, c 7 = 720 η + 776, c 5 = 4800η 2 + 4 5 6 0 η + 1482, c 3 = 23040η 3 + 15360η2 + 4080η - 1920, C! =92160η 4 + 23040η 3 + 2880η 2 -3600 η - 9 4 5 ; für η g 10 kann man auch die Formel von Peizer und Pratt verwenden: -Vir e
— η mit
u = uv
und
5 cη
2 3
h
1 10n
(Anmerkung: Die Peizer-Pratt-Approximation liefert bereits für η = 3 und 0,5 < y < 0,99 eine passable Anpassung, wobei die absolute Abweichung zum wahren Wert höchstens 0,08 wird.)
445
Anhang
Tab. 4:
Quantile χ 2 y der ^-Verteilung
nry
0,995 0,990 0,975 0,950 0,900 0,750 0,500 0,250 0,100 0,050 0,025 0,010 0,005 1 2 3 4 5
7,879 10,60 12,84 14,86 16,75
6,635 9,210 11,34 13,28 15,09
5,024 7,378 9,348 11,14 12,83
3,841 5,991 7,815 9,488 11,07
2,706 4,605 6,251 7,779 9,236
1,323 2,773 4,108 5,385 6,626
0,455 1,386 2,366 3,357 4,351
0 , 1 0 2 - 2 1 , 5 8 " 3 3 , 9 3 - * 9 , 8 2 - 4 1 , 5 7 5 3,93 0,575 0,211 0,103 " 2 5,06 " 2 2,01 2 1,00 1,213 0,584 0,352 0,216 0,115 2 7,17 1,923 1,064 0,711 0,484 0,297 0,207 2,675 1,610 1,145 0,831 0,554 0,412
6 7 8 9 10
18,55 20,28 21,96 23,59 25,19
16,81 18,48 20,09 21,67 23,21
14,45 16,01 17,53 19,02 20,48
12,59 14,07 15,51 16,92 18,31
10,64 12,02 13,36 14,68 15,99
7,841 9,037 10,22 11,39 12,55
5,348 6,346 7,344 8,343 9,342
3,455 4,255 5,071 5,899 6,737
2,204 2,833 3,490 4,168 4,865
1,635 2,167 2,733 3,325 3,940
1,237 1,690 2,180 2,700 3,247
0,872 1,239 1,647 2,088 2,558
0,676 0,989 1,344 I,735 2,156
11 12 13 14 15
26,76 28,30 29,82 31,32 32,80
24,73 26,22 27,69 29,14 30,58
21,92 23,34 24,74 26,12 27,49
19,68 21,03 22,36 23,68 25,00
17,28 18,55 19,81 21,06 22,31
13,70 14,85 15,98 17,12 18,25
10,34 11,34 12,34 13,34 14,34
7,584 8,438 9,299 10,17 11,04
5,578 6,304 7,042 7,790 8,547
4,575 5,226 5,892 6,571 7,261
3,816 4,404 5,009 5,629 6,262
3,053 3,571 4,107 4,660 5,229
2,603 3.074 3,565 4.075 4,601
16 17 18 19 20
34,27 35,72 37,16 38,58 40,00
32,00 33,41 34,81 36,19 37,57
28,85 30,19 31,53 32,85 34,17
26,30 27,59 28,87 30,14 31,41
23,54 24,77 25,99 27,20 28,41
19,37 20,49 21,60 22,72 23,83
15,34 16,34 17,34 18,34 19,34
11,91 12,79 13,68 14,56 15,45
9,312 10,09 10,86 11,65 12,44
7,962 8,672 9,390 10,12 10,85
6,908 7,564 8,231 8,907 9,591
5,812 6,408 7,015 7,633 8,260
5,142 5,697 6,265 6,844 7,434
21 22 23 24 25
41,40 42,80 44,18 45,56 46,93
38,93 40,29 41,64 42,98 44,31
35,48 36,78 38,08 39,36 40,65
32,67 33,92 35,17 36,42 37,65
29,62 30,81 32,01 33,20 34,38
24,93 26,04 27,14 28,24 29,34
20,34 21,34 22,34 23,34 24,34
16,34 17,24 18,14 19,04 19,94
13,24 14,04 14,85 15,66 16,47
11,59 12,34 13,09 13,85 14,61
10,28 10,98 11,69 12,40 13,12
8,897 9,542 10,20 10,86 11,52
8,034 8,643 9,260 9,886 10.52
26 27 28 29 30
48,29 49,64 50,99 52,34 53,67
45,64 46,96 48,28 49,59 50,89
41,92 43,19 44,46 45,72 46,98
38,89 40,11 41,34 42,56 43,77
35,56 36,74 37,92 39,09 40,26
30,43 31,53 32,62 33,71 34,80
25,34 26,34 27,34 28,34 29,34
20,84 21,75 22,66 23,57 24,48
17,29 18,11 19,94 19,77 20,60
15,38 16,15 16,93 17,71 18,49
13,84 14,57 15,31 16,05 16,79
12,20 12,88 13,56 14,26 14,95
II,16 12,46 13,12 13,79
40 50 60 70 80
66,77 79,49 91,95 104,2 116,3
63,69 76,15 88,38 100,4 112,3
59,34 71,42 83,30 95,02 106,6
55,76 67,50 79,08 90,53 101,9
51,81 63,17 74,40 85,53 96,58
45,62 56,33 66,98 77,58 88,13
39,34 49,33 59,33 69,33 79,33
33,66 42,94 52,29 61,70 71,14
29,05 37,69 46,46 55,33 64,28
26,51 34,76 43,19 51,74 60,39
24,43 32,36 40,48 48,76 57,15
22,16 29,71 37,48 45,44 53,54
20,71 27,99 35.53 43,28 51,17
90 100 150 200 250
128,3 140,2 198,4 255,3 311,3
124,1 135,8 193,2 249,4 304,9
118,1 129,6 185,8 241,1 295,7
113,1 124,3 179,6 234,0 287,9
107,6 118,5 172,6 226,0 279,1
98,65 109,1 161,3 213,1 264,7
89,33 99,33 149,3 199,3 249,3
80,62 90,13 138,0 186,2 234,6
73,29 82,36 128,3 174,8 221,8
69,13 77,93 122,7 168,3 214,4
65,65 74,22 118,0 162,7 208,1
61,75 70,06 112,7 156,4 200,9
59,20 67,33 109.1 152.2 196,2
300 400 600 800 1000
366,8 476,6 693,0 906,8 1119,
359,9 468,7 683,5 896,0 1107,
349,9 457,3 669,8 880,3 1090,
341,4 447,6 658,1 866,9 1075,
331,8 436,6 644,8 851,7 1058,
316,1 418,7 623,0 826,6 1030,
299,3 399,3 599,3 799,3 999,3
283,1 380,6 576,3 772,7 969,5
269,1 364,2 556,1 749,2 943,1
260,9 354,6 544,2 735,4 927,6
253,9 346,5 534,0 723,5 914,3
246,0 337,2 522,4 709,9 898,9
240,7 330,9 514.5 700,7
11,81
888.6
446
Anhang
zu Tab. 4: Ablesebeispiel: *i ; 0 , 0 , = " 3 3,93 = 3,93 · ΙΟ"3 = 0,00393 Approximation nach Wilson und Hilferty für 0 < γ < 1:
Anhang
Tab. 5:
Quantile F„
, der F-Verteilung
447
n n
v ?Y
10
11
1
0,990 0,975 0,950 0,900
4052, 647,8 161,4 39,86
4999, 799,5 199,5 49,50
5403, 864,2 215,7 53,59
5625, 899,6 224,6 55,83
5764, 921,8 230,2 57,24
5859, 937,1 234,0 58.20
5928, 948,2 236,8 58,91
5981, 956,7 238,9 59,44
6022, 963,3 240,5 59,86
6056, 968,6 241,9 60,20
6083, 973,0 243,0 60,47
2
0,990 0,975 0,950 0,900
98.50 38.51 18,51 8,526
99,00 39,00 19,00 9,000
99,17 39,17 19,16 9,162
99,25 39,25 19,25 9,243
99,30 39,30 19,30 9,293
99,33 39,33 19,33 9,326
99,36 39,36 19,35 9,349
99,37 39,37 19,37 9,367
99,39 39,39 19,38 9,381
99,40 39,40 19,40 9,392
99,41 39,41 19,40 9,401
3
0,990 0,975 0,950 0,900
34.12 17,44 10.13 5,538
30,82 16,04 9,552 5.462
29,46 15,44 9,277 5,391
28,71 15,10 9,117 5,343
28,24 14,88 9,013 5,309
27,91 14,73 8,941 5,285
27,67 14,62 8,887 5,266
27,49 14,54 8,845 5,252
27,35 27,23 27,13 14,47 14,42 14,37 8,812 8,786 8,763 5,240 5,230 5,222
4
0,990 0,975 0,950 0,900
21,20 12,22 7,709 4,545
18,00 10,65 6,944 4,325
16,69 9,979 6,591 4,191
15,98 9,605 6,388 4,107
15,52 9,364 6,256 4,051
15.21 9,197 6,163 4,010
14,98 9,074 6,094 3,979
14,80 8,980 6,041 3,955
14,66 8,905 5,999 3,936
5
0,990 0,975 0,950 0,900
16,26
13,27 12,06 11,39 10,01 8,434 7,764 7,388 6,608 5,786 5,409 5,192 4,060 3,780 3,619 3,520
10,97 7,146 5,050 3,453
10,67 6,978 4,950 3,405
10,46 6,853 4,876 3,368
10,29 6,757 4,818 3,339
6
0,990 0,975 0,950 0,900
13,75 8,813 5,987 3,776
10,92 7,260 5,143 3.463
9,780 6,599 4,757 3,289
9,148 6,227 4,534 3,181
8,746 5,988 4,387 3,108
8,466 5,820 4,284 3,055
8,260 5,695 4,207 3,015
8,102 5,600 4,147 2,983
7,976 5,523 4,099 2,958
7,874 5,461 4,060 2,937
7,789 5,409 4,027 2,919
7
0,990 0,975 0,950 0,900
12.25 8,073 5,591 3,589
9,547 6,542 4,737 3,257
8,451 5,890 4,347 3,074
7,847 5,523 4,120 2,961
7,460 5,285 3,972 2,883
7,191 5,119 3,866 2,827
6,993 4,995 3,787 2,785
6,840 4,899 3,726 2,752
6,719 4,823 3,677 2,725
6.620 4,761 3,637 2,703
6,538 4,709 3,603 2,684
8
0,990 0,975 0,950 0,900
11.26 7,571 5,318 3,458
8,649 6,059 4,459 3,113
7,591 5,416 4,066 2,924
7,006 5,053 3,838 2,806
6,632 4,817 3,687 2,726
6,371 4,652 3,581 2,668
6,178 4,529 3,500 2,624
6,029 4,433 3,438 2,589
5,911 4,357 3,388 2,561
5,814 4,295 3,347 2,538
5,734 4,243 3,313 2,518
9
0,990 0,975 0,950 0,900
10,56 7,209 5,117 3,360
8,022 6,992 6,422 2,057 5,802 5,613 5,467 5,351 5,257 5,177
0,990 0,975 0,950 0,900
10,04 6,937 4,965 3,285
7,559 5,456 4,103 2,924
10
14,55 8,844 5,964 3,920
14,45 8,793 5,936 3,907
10,16 10,05 9,962 6,681 6.619 6,568
4,772 4,735 4,704 3,316 3,297 3,282
5,715 5,078 4,718 4,484 4,320 4,197 4,102 4,026 3,964 3,912 4,256 3,863 3,633 3,482 3,374 3,293 3,230 3,179 3,137 3,102 3,006 2,813 2,693 2,611 2,551 2,505 2,469 2,440 2>16 2,396 6,552 4,826 3,708 2,728
5,994 4,468 3,478 2,605
5,636 4,236 3,326 2,522
5,386 4,072 3,217 2,461
5,200 3,950 3,135 2,414
5,057 3,855 3,072 2,377
4,942 3,779 3,020 2,347
4,849 3,717 2,978 2,323
4,771 3,665 2,943 2,302
448
Tab. 5 :
n
Anhang
Fortsetzung
12
13
14
15
20
24
30
40
0,990 0,975 0,950 0,900
6106, 976,7 243,9 60,71
6126, 979,8 244,7 60,90
6143, 982,5 245,4 61,07
6157, 984,9 245,9 61,22
6209, 993,1 248,0 61,74
6235, 997,2 249,1 62,00
6261, 1001, 250,1 62,26
6287, 6313, 6339, 1006, 1010, 1014, 251,1 252,2 253,3 62,53 62,79 63,06
0,990 0,975 0,950 0,900
99,42 39,41 19,41 9,408
99,42 39,42 19,42 9,415
99,43 39,43 19,42 9,420
99,43 39,43 19,43 9,425
99,45 39,45 19,45 9,441
99,46 39,46 19,45 9,450
99,47 39,46 19,46 9,458
99,47 39,47 19,47 9,466
99,48 39,48 19,48 9,475
99,49 99,50 39,49 39,50 19,49 19,50 9,483 9,491
0,990 0,975 0,950 0,900
27,05 14,34 8,745 5,216
26,98 14.30 8,729 5,210
26,92 14,28 8,715 5,205
26,87 14,25 8,703 5,200
26,69 14,17 8,660 5,184
26,60 14,12 8,639 5,176
26,50 14,08 8,617 5,168
26,41 14,04 8,594 5,160
26,32 13,99 8,572 5,151
26,22 26,13 13,95 13,90 8,549 8,526 5,143 5,134
0,990 0,975 0,950 0,900
14,37 8,751 5.912 3,896
14.31 8,715 5.891 3,885
14,25 8,684 5,873 3,877
14,20 8,657 5,858 3,869
14,02 8,560 5,803 3,844
13,93 8,511 5,774 3,831
13,84 8,461 5,746 3,817
13,75 8,411 5,717 3,804
13,65 8,360 5,688 3,790
13,56 8,309 5,658 3,775
13,46 8,257 5,628 3,761
0,990 0,975 0,950 0,900
9,888 6,525 4,678 3,268
9,824 6.487 4,655 3,257
9,770 6,455 4,636 3,247
9,722 6,428 4,619 3,238
9,553 6,329 4,558 3,207
9,466 6.278 4,527 3,191
9,379 6,227 4,496 3,174
9,291 6,175 4,464 3,157
9,202 6,123 4,431 3,140
9,112 6,069 4,398 3,123
9,020 6,015 4,365 3,105
0,990 0,975 0,950 0,900
7,718 5,366 4,000 2,905
7,657 5,329 3,976 2.892
7,605 7,559 7,396 7,313 5,297 5,269 5,168 5,117 3,956 3,938 3,874 3,841 2,881 2,871 2,836 2,818
7,229 5,065 3,808 2,800
7,143 5,012 3,774 2,781
7,057 4,959 3,740 2,762
6,969 4,904 3,705 2,742
6,880 4,849 3.669 2,722
0,990 0,975 0,950 0,900
6,469 4.666 3,575 2,668
6,410 4,628 3,550 2,654
6,359 4,596 3,529 2,643
6,314 4,568 3,511 2,632
6,155 4,467 3,445 2,595
6,074 4,415 3,410 2,575
5,992 4,362 3,376 2,555
5,908 4,309 3,340 2,535
5,824 4,254 3,304 2,514
5,737 4,199 3,267 2,493
5,650 4,142 3,230 2,471
0,990 0,975 0,950 0,900
5.667 4,200 3,284 2,502
5,609 4,162 3,259 2.488
5,558 4,129 3,237 2,475
5,515 4,101 3,218 2,464
5,359 3,999 3,150 2,425
5.279 3,947 3,115 2,404
5,198 3,894 3,079 2,383
5,116 3,840 3,043 2,361
5,032 3,784 3,005 2,339
4,946 3,728 2,967 2,316
4,859 3.670 2,928 2,293
0,990 0,975 0,950 0,900
5,111 3,868 3,073 2,379
5,054 3,830 3,047 2,364
5,005 3,798 3,025 2,351
4,962 3,769 3,006 2,340
4,808 3,667 2,936 2,298
4,729 3,614 2,900 2,277
4,649 3,560 2,864 2,255
4,567 3,505 2,826 2,232
4,483 3,449 2,787 2,208
4,398 3,392 2,748 2,184
4,311 3,333 2,707 2,159
0,990 0,975 0,950 0,900
4,706 3,621 2.913 2,284
4,649 3,583 2,887 2,269
4,600 3,550 2,864 2,255
4,558 3,522 2,845 2,244
4,405 3,419 2,774 2,201
4,327 3,365 2,737 2,178
4,247 3,311 2,700 2,155
4,165 3,255 2,661 2,132
4,082 3,198 2,621 2,107
3,996 3,140 2,580 2,082
3,909 3,080 2,538 2,055
2
10
60
120
oo 6366, 1018, 254,3 63,33
Anhang
Tab. 5:
449
Fortsetzung 10
11
11
0,990 0,975 0,950 0,900
9,646 6,724 4,844 3,225
7,206 5,256 3,982 2,860
6,217 4,630 3,587 2,660
5.668 4,275 3,357 2,536
5,316 4,044 3,204 2,451
5,069 3,881 3,095 2,389
4,886 3,759 3,012 2,342
4,744 3,664 2,948 2,304
4,632 3,588 2,896 2,273
12
0,990 0,975 0,950 0,900
9,330 6,554 4,747 3,177
6,927 5,096 3,885 2,807
5.953 4,474 3,490 2,605
5,412 4,121 3,259 2,480
5,064 3,891 3,106 2,394
4,821 3,728 2,996 2,331
4,640 3,607 2,913 2,283
4,499 3,512 2,849 2,245
4,388 4,296 4,219 3,436 3,374 3,321 2,796 2,753 2,717 2,214 2,188 2,166
13
0,990 0,975 0,950 0,900
9,074 6,414 4,667 3,136
6,701 4,965 3,806 2,763
5,739 4,347 3,411 2,560
5,205 3,996 3,179 2,434
4,862 3,767 3,025 2,347
4,620 3,604 2,915 2,283
4,441 3,483 2,832 2,234
4,302 3,388 2,767 2,195
4,191 3,312 2,714 2,164
14
0,990 0,975 0,950 0,900
8,862 6,298 4,600 3,102
6,515 4,857 3,739 2,726
5,564 4,242 3,344 2,522
5,035 3.892 3,112 2,395
4,695 3,663 2,958 2,307
4,456 3,501 2,848 2,243
4,278 3,380 2.764 2,193
4,140 3,285 2,699 2,154
4,030 3,939 3,863 3,209 3,147 3,094 2,646 2,602 2,565 2,122 2,095 2,073
15
0,990 0,975 0,950 0,900
8,683 6,199 4,543 3,073
6,359 4,765 3,682 2,695
5,417 4,153 3,287 2,490
4.893 3,804 3,056 2,361
4,556 3,576 2,901 2,273
4,318 4,142 4.004 3.895 3,415 3,293 3,199 3,123 2,790 2,707 2,641 2,588 2,208 2,158 2,119 2,086
16
0,990 0,975 0,950 0,900
8,531 6,115 4,494 3,048
6,226 5,292 4,773 4.437 4,202 4,026 3,890 3,780 3,691 3,616
17
0,990 0,975 0,950 0,900
8,400 6,042 4,451 3,026
6,112 4,619 3,592 2,645
5,185 4,011 3,197 2,437
4.669 3,665 2,965 2,308
4,336 4,101 3,927 3.438 3,277 3,156 2,810 2,699 2,614 2,218 2,152 2,102
3,791 3,061 2,548 2,061
3,682 2,985 2,494 2,028
18
0,990 0,975 0,950 0,900
8,285 5,978 4,414 3,007
6,013 4,560 3,555 2,624
5,092 3.954 3,160 2,416
4,579 3,608 2,928 2,286
4,248 3,382 2,773 2,196
4,015 3,221 2,661 2,130
3,841 3,100 2,577 2,079
3,705 3.005 2,510 2,038
3,597 2,929 2.456 2,005
19
0,990 0,975 0,950 0,900
8,185 5,922 4,381 2,990
5,926 4,508 3,522 2,606
5,010 3,903 3,127 2,397
4,500 3,559 2,895 2,266
4,171 3,333 2,740 2,176
3,939 3,172 2,628 2,109
3.765 3,051 2,544 2,058
3,631 2,956 2,477 2,017
3,523 2,880 2,423 1,984
3,434 2,817 2,378 1,956
3,359 2,764 2,340 1,932
20
0,990 0,975 0,950 0,900
8,096 5,871 4,351 2,975
5,849 4,461 3,493 2,589
4,938 3,859 3,098 2,380
4,431 3,515 2,866 2,249
4,103 3,289 2,711 2,158
3,871 3,128 2,599 2,091
3,699 3,007 2,514 2,040
3,564 2,913 2,447 1,999
3.457 2,837 2,393 1,965
3,368 2,774 2,348 1,937
3,293 2,720 2,310 1,913
4,539 4,462 3,526 3,473 2,854 2,818 2,248 2,227
4,100 3,250 2,671 2,138
3,805 3,060 2,544 2,059
4,024 3,197 2,634 2,115
3,730 3,007 2,506 2,036
4,687 4,077 3,729 3,502 3,341 3,219 3,125 3,049 2,986 2,933 3,634 3,239 3,007 2,852 2,741 2,657 2,591 2,538 2,494 2,456 2,668 2,462 2,333 2,244 2,178 2,128 2,088 2,055 2,028 2,005 3,593 2,922 2,450 2,001
3,518 2,869 2,412 1,977
3,508 3,433 2,866 2,813
2,412 2,374 1,977 1,953
450
Tab. 5 :
Anhang
Fortsetzung
13
14
15
20
24
30
40
60
120
oo
11
0,990 0,975 0,950 0,900
4,397 3,430 2,788 2,209
4,341 3,391 2,761 2,193
4,293 3,358 2,738 2,179
4,251 3,330 2,719 2,167
4,099 3,226 2,646 2.123
4,021 3,173 2,609 2,100
3,941 3,118 2,570 2,076
3,860 3,061 2,531 2,052
3,776 3,004 2,490 2,026
3,690 2,944 2,448 2,000
3,602 2,883 2,404 1,972
12
0,990 0,975 0,950 0,900
4,155 3.277 2,687 2,147
4,099 3,239 2,660 2,131
4,051 3,206 2,637 2,117
4,010 3,177 2,617 2,105
3,858 3,073 2,544 2,060
3,780 3,019 2,505 2,036
3,701 2,963 2,466 2,011
3,619 2,906 2,426 1,986
3,535 2,848 2,384 1,960
3,449 2,787 2,341 1,932
3,361 2,725 2,296 1,904
13
0,990 0,975 0,950 0,900
3,960 3,153 2,604 2,097
3,905 3,115 2,577 2,080
3,857 3,081 2,553 2,066
3,815 3,053 2,533 2,053
3,665 2,948 2,459 2,007
3,587 2,893 2,420 1,983
3,507 2,837 2,380 1,958
3,425 2.780 2,339 1,931
3,341 2,720 2,297 1,904
3.255 2.659 2,252 1,876
3,165 2,595 2,206 1,846
14
0,990 0,975 0,950 0,900
3,800 3,050 2,534 2,054
3,745 3,011 2,507 2,037
3,697 2,978 2,483 2,022
3,656 2,949 2,463 2,010
3,505 2,844 2,388 1,962
3,427 2,789 2,349 1,938
3.348 2,732 2,308 1,912
3,266 2,674 2,266 1,885
3,181 2,614 2,223 1,857
3,094 2,552 2,178 1,828
3,004 2,487 2,131 1,797
15
0,990 0,975 0,950 0,900
3,666 2,963 2,475 2,017
3,611 2,924 2,448 2,000
3,563 2,891 2,424 1,985
3,522 2,862 2,403 1,972
3,372 2,756 2,328 1,924
3,294 2,701 2,288 1,899
3,214 2,644 2,247 1,873
3,132 2,585 2,204 1,845
3,047 2,524 2,160 1,817
2,959 2,461 2,114 1,787
2,868 2,395 2,066 1,755
16
0,990 0,975 0,950 0,900
3,553 2,889 2,425 1,985
3,497 2,850 2,397 1,968
3,450 2,817 2,373 1,953
3,409 2,788 2,352 1,940
3,259 2,681 2,276 1,891
3,181 2,625 2,235 1,866
3,101 2,568 2,194 1,839
3,018 2,509 2,151 1,811
2,933 2,447 2,106 1,782
2,845 2,383 2,059 1,751
2,753 2,316 2,010 1,718
17
0,990 0,975 0,950 0,900
3,455 2,825 2,381 1,958
3,400 2,786 2,353 1,940
3,353 2,752 2,329 1,925
3,312 2,723 2,308 1,912
3,162 2,616 2,230 1,862
3,084 2,560 2,190 1,836
3,003 2,502 2,148 1,809
2,920 2,442 2,104 1.781
2,835 2,380 2,058 1,751
2,746 2,315 2,011 1,719
2,653 2,247 1,960 1,686
18
0,990 0,975 0,950 0,900
3,371 2,769 2,342 1,933
3,316 2,730 2,314 1,915
3,268 2,696 2,290 1,900
3,227 2,667 2,269 1,887
3,077 2,559 2,191 1,837
2,999 2,503 2,150 1,810
2,919 2,444 2,107 1,783
2,835 2,384 2,063 1,754
2,749 2,321 2,017 1,723
2.660 2.256 1,968 1,691
2,566 2,187 1,917 1,657
19
0,990 0,975 0,950 0,900
3,297 2,720 2,308 1,912
3,241 2,680 2,280 1,894
3,194 2,646 2,255 1,878
3,153 2,617 2,234 1,865
3,003 2,509 2,155 1,814
2,925 2,452 2,114 1,787
2,844 2,394 2,071 1,759
2,761 2,333 2,026 1,730
2,674 2,270 1,980 1,699
2,584 2,203 1,930 1,666
2,489 2,133 1,878 1,631
20
0,990 0,975 0,950 0,900
3,231 2,676 2.278 1,892
3,176 2,636 2,249 1,874
3,129 2,602 2,225 1,859
3,088 2,573 2,203 1,845
2,938 2,464 2.124 1,794
2,859 2,408 2,082 1,767
2,778 2.349 2,039 1,738
2,695 2,287 1,994 1,708
2,608 2,223 1,946 1,677
2,517 2,156 1,896 1,643
2,421 2,085 1,843 1,607
Anhang Tab. 5:
451
Fortsetzung 10
11
22
0,990 0,975 0,950 0,900
7,945 5,786 4,301 2,949
5,719 4,383 3,443 2,561
4,817 3,783 3,049 2,351
4,313 3,440 2,817 2,219
3,988 3,758 3,587 3,215 3,055 2,934 2,661 2,549 2,464 2,128 2,060 2,008
3,453 2,839 2,397 1,967
3,346 2,763 2,342 1,933
3,258 2,700 2,297 1,904
3,183 2,646 2,258 1,880
24
0,990 0,975 0,950 0,900
7,823 .5,717 4,260 2,927
5,614 4,319 3,403 2,538
4.718 3,721 3,009 2,327
4,218 3,379 2,776 2,195
3.895 3,667 3,496 3,155 2.995 2,874 2,621 2,508 2,423 2,103 2,035 1,983
3,363 2,779 2.355 1,941
3,256 2,703 2,300 1,906
3,168 2,640 2,255 1,877
3,094 2,586 2,216 1,853
26
0,990 0,975 0,950 0,900
7,721 5,659 4,225 2,909
5,526 4,265 3.369 2,519
4,637 3,670 2,975 2,307
4,140 3,329 2,743 2,174
3,818 3,591 3,421 3,288 3,105 2,945 2,824 2,729 2,587 2,474 2,388 2,321 2,082 2,014 1,961 1,919
3,182 2,653 2,565 1,884
3,094 2,590 2,220 1,855
3,020 2,536 2,181 1,830
28
0,990 0,975 0,950 0,900
7,636 5,610 4,196 2,894
5,453 4,221 3,340 2,503
4,568 3,626 2,947 2,291
4,074 3,286 2,714 2,157
3,754 3.063 2,558 2.064
3,528 2,903 2,445 1.996
3.358 2,782 2.359 1,943
3,226 2,687 2,291 1,900
30
0,990 0,975 0,950 0,900
7,562 5,390 4,510 4,018 5,568 4,182 3,589 3,250 4,171 3,316 2,922 2,690 2,881 2,489 2,276 2,142
3,699 3,026 2,534 2,049
3,473 2,867 2,421 1,980
3,304 2,746 2,334 1,927
3,173 2,651 2,266 1,884
2,979 2,511 2,165 1,819
2,905 2,457 2,125 1,794
40
0,990 0,975 0,950 0,900
7,314 5,424 4,085 2,835
5,179 4,051 3,232 2,440
4,313 3,828 3,514 3,291 3,463 3,126 2,904 2,744 2,839 2,606 2,449 2,336 2,226 2,091 1,997 1,927
3,124 2,624 2,249 1,873
2,993 2,888 2,801 2,529 2,452 2,388 2,180 2,124 2,077 1,829 1,793 1,763
2,727 2,334 2,037 1,737
60
0,990 0,975 0,950 0,900
7,077 5,286 4,001 2,791
4,977 3,925 3,150 2,393
4,126 3,343 2,758 2,177
3,649 3,008 2,525 2,041
3,339 2,786 2,368 1,946
3,119 2,627 2,254 1,875
2,953 2,507 2,167 1,819
2,823 2,412 2,097 1,775
2,718 2,334 2,040 1,738
2,632 2,270 1,993 1,707
2,558 2,215 1,952 .1,680
80
0,990 0,975 0,950 0,900
6,964 5,219 3,961 2,770
4,882 3,865 3,111 2.370
4,036 3,285 2.719 2,154
3,564 2,951 2,486 2,017
3,256 2,730 2,329 1,921
3,037 2,571 2,214 1,849
2,872 2,451 2,127 1,793
2,743 2.356 2,057 1,748
2,639 2,278 1,999 1,711
2,552 2,214 1,952 1,680
2,478 2,158 1,910 1,652
120
0,990 0,975 0,950 0,900
6,851 5,152 3,920 2,748
4,787 3,805 3,072 2,347
3,949 3,227 2,680 2,130
3,480 2,894 2,447 1,992
3,174 2,674 2,290 1.896
2,956 2,515 2,175 1,824
2,792 2,395 2,087 1,767
2,663 2,559 2,472 2,299 2,222 2,157 2,016 1,959 1,910 1,722 1,684 1,652
2,398 2,101 1,869 1,625
0,990 0,975 0,950 0,900
6,635 5,024 3,841 2,706
4,605 3,689 2,996 2,303
3,782 3,116 2,605 2,084
3,319 2,786 2,372 1,945
3,017 2,567 2,214 1,847
2,802 2,639 2,511 2,407 2,321 2,247 2,408 2,288 2,192 2,114 2,048 1,992 2,099 2,010 1,938 1,880 1,831 1,788
3,120 3,032 2,958
2,611 2,547 2,493
2,236 2,190 2,151 1,865 1,836 1,811 3,067 2,575 2,211 1,849
1,774 1,717 1,670 1,632 1,599 1,570
452
Anhang
Tab. 5:
n2
Fortsetzung
\
n,
12
13
14
15
20
24
30
40
60
120
CO
Ί
22
0,990 0,975 0,950 0,900
3,121 2,602 2,226 1,859
3,066 2,562 2,197 1,841
3,019 2,528 2,172 1,825
2,978 2,498 2,151 1,811
2,827 2,389 2,071 1,759
2,749 2,332 2,028 1,731
2,667 2,272 1,984 1,702
2,583 2,210 1,938 1,671
2,495 2,145 1,889 1,639
2,403 2,076 1,838 1,604
2,305 2,003 1,783 1,567
24
0,990 0,975 0,950 0,900
3,032 2,541 2,183 1,832
2,977 2,501 2,154 1,813
2,930 2,467 2,129 1,797
2,889 2,437 2,108 1,783
2,738 2,327 2,027 1,730
2,659 2,269 1,984 1,702
2,577 2,209 1,939 1,672
2,492 2,146 1,892 1,641
2,403 2,080 1,842 1,607
2,310 2,010 1,790 1,571
2,211 1,935 1,733 1,533
26
0,990 0,975 0,950 0,900
2,958 2,491 2,148 1,809
2,903 2,451 2,119 1,790
2,856 2,417 2,093 1,774
2,815 2,387 2,072 1,760
2,664 2,276 1,990 1,706
2,585 2,217 1,946 1,677
2,503 2,157 1,901 1,647
2,417 2,093 1,853 1,615
2,327 2,026 1,803 1,581
2,233 1,954 1,749 1,544
2,131 1,878 1,691 1,504
28
0,990 0,975 0,950 0,900
2,896 2,448 2,118 1,790
2,841 2,408 2,088 1,770
2,794 2,374 2,063 1,754
2,753 2,344 2,041 1,740
2,602 2,232 1,959 1,685
2,522 2,174 1,915 1,656
2,440 2,112 1,869 1,625
2,353 2,048 1,820 1,592
2,263 1,980 1,769 1,558
2,167 1,907 1,714 1,520
2,064 1,829 1,654 1,478
30
0,990 0,975 0,950 0,900
2,843 2,412 2,092 1,773
2,788 2,372 2,062 1,753
2,741 2,337 2,037 1,737
2,700 2,307 2,015 1,722
2,549 2,195 1,932 1,667
2,469 2,136 1,887 1,638
2,386 2,074 1,841 1,606
2,299 2,009 1,792 1,573
2,208 1,940 1,740 1,538
2,111 1,866 1,684 1,499
2,006 1,787 1,622 1,456
40
0,990 0,975 0,950 0,900
2,665 2,288 2,003 1,715
2,610 2,247 1,973 1,695
2,563 2,212 1,947 1,677
2,522 2,182 1,924 1,662
2,369 2,068 1,839 1,605
2,288 2,007 1,793 1,574
2,203 1,943 1,744 1,541
2,114 1,875 1,693 1,506
2,019 1,803 1,637 1,467
1,917 1,724 1,577 1,425
1,805 1,637 1,509 1,377
60
0,990 0,975 0,950 0,900
2,496 2,169 1,917 1,657
2,441 2,128 1,886 1,637
2,393 2,092 1,860 1,619
2,352 2,061 1,836 1,603
2,198 1,944 1,748 1,543
2,115 1,882 1,700 1,511
2,028 1,815 1,649 1,476
1,936 1,744 1,594 1,437
1,836 1,667 1,534 1,395
1,726 1,581 1,467 1,348
1,601 1,482 1,389 1,291
80
0,990 0,975 0,950 0,900
2,416 2,112 1,876 1,629
2,361 2,070 1,844 1,608
2,313 2,034 1,817 1,590
2,272 2,003 1,793 1,574
2,116 1,885 1,703 1,513
2,033 1,821 1,654 1,479
1,944 1,753 1,602 1,443
1,849 1,679 1,545 1,403
1,746 1,598 1,482 1,358
1,630 1,507 1,410 1,306
1,491 1,396 1,322 1,242
120
0,990 0,975 0,950 0,900
2,336 2,055 1,834 1,601
2,281 2,013 1,802 1,580
2,233 1,976 1,774 1,561
2,192 1,945 1,750 1,545
2,035 1,825 1,659 1,482
1,950 1,760 1,608 1,447
1,860 1,690 1,554 1,409
1,763 1,614 1,495 1,368
1,656 1,530 1,429 1,320
1,533 1,433 1,352 1,265
1,381 1,310 1,254 1,193
oo
0,990 0,975 0,950 0,900
2,185 1,945 1,752 1,546
2,129 1,902 1,719 1,523
2,080 1,865 1,691 1,504
2,039 1,833 1,666 1,487
1,878 1,708 1,571 1,421
1,791 1,640 1,517 1,383
1,696 1,566 1,459 1,342
1,592 1,484 1,394 1,295
1,473 1,388 1,318 1,240
1,325 1,268 1,221 1,169
1,000 1,000 1,000 1,000
Anhang
453
zu Tab. 5: Ablesebeispiel: F 7 20.0,99 = 3,699 Erweiterung der Tafel: F n j
„
2
. =
1 F n2" n 1 -
Fl.112;·,' — Cnj;(l+y)/2)2. Fl,*; r ~~ (U(l+v)/2)2 1 F y2 F =1 n i Interpolation nach Laubscher: Gesucht ist F n i i „ 2 . ; . Gibt es dann natürliche Zahlen n 3 g n , < n 5 sowie 04 S n 2 < n 6 derart, daß die Quantile F n 3 „ 4 . ., F„3,„6.... F„ „ 4 . u n d F„ s .„ 6 :, vertafelt sind, so gilt: F„,.„ 2 ; ν = (1 - c,) · (1 - c 2 ) • F n j „4! v + (1 - c,) · c 2 · F„3. „6; + c, · (1 - c 2 ) · F n5 . „4!>. + c, · c 2 · F n j „6... fur
c, =
n 5 ( n t — n3) n
i (ns ~ n i )
und
c2 =
n6(n2-n4) . n2(n6-n4)
Läßt sich n 3 = n! wählen, so wird offensichtlich c, = 0, wie für n 4 = n 2 auch c 2 = 0 ist. In diesen Fällen vereinfacht sich die Interpolationsformel entsprechend. Approximation für 0,5 < γ < 1: F n i i n j ! ) . =:eu a ~ b mit u = u„, a = v^ d + c ("/ - 3 c = —-
d2, und
b= 2•(— \n,-l d =
n
2
— )·( c+ - - -lj V 6 3
1 1 (Π[ — 1 n 2 — 1
454
Anhang
2 GRIECHISCHES ALPHABET
A
α
Alpha
Β
β • β
Beta
Γ
Υ
Gamma
Δ
δ
Delta
Ε
ε
Epsilon
Ζ
ζ
Zeta
Η
η
Eta
0
θ
Theta
I
ι
Jota
Κ
κ , Χ
Kappa
Λ
λ
Lambda
Μ
y
My
Ν
ν
Ny
Ξ
ξ
Xi
0
0
Omi kron
Π
π
Pi
Ρ
Ρ
Rho
Σ
σ
Sigma
Τ
τ
Tau
V
υ
Ypsilon
φ ,φ
Φ . Ψ
Phi
χ
Χ
Chi
ψ
Ψ
Psi
Ω
ω
Omega
Anhang
455
3 SYMBOLVERZEICHNIS
Symbol
Bedeutung
+
'plus'; Addition 'minus1; Subtraktion 'mal '; Multiplikation 'a dividiert durch b 1 ; Division 'gleich'
^ , a/b φ
'ungleich'
~
'ungefähr gleich'
>
< £ j.
'größer oder gleich' 'kleiner oder gleich ' 'nicht größer oder gleich' 'nicht kleiner oder gleich'
e
'Element aus'
$ 0 υ η
'nicht Element aus ' 'leere Menge' 'vereinigt mit' 'geschnitten mit'
°° lnx e x , exp(x) n!
'unendlich' Natürlicher Logarithmus (d.h. zur Basis e = 2.71828...) von x: x = e y , wenn y = lnx 'e hoch x'; Exponentialfunktion: e x = (2.71828.. .)* 'n Fakultät': η! = 1·2·3·...·η und 0! = 1
(n)k
'η unten k': (n)k = η·(η-1 )·(η-2)·.. ..(n-k+1) = -j^^yy
^
' η über k'; Binomialkoeffizient:
lim a
("n-k)!
Limes; Grenzwert
n nT^
|x|
a
'an k o n v e r 9 i e r t gegen a, wenn η nach unendlich läuft' Absolutbetrag der Zahl χ
Π
χ —
'x hoch n'; n-te Potenz von χ: χ η = χ·χ. ....χ (η-mal) ο
Vχ
Wurzel aus χ': y = x , wenn x = y =
Ableitung der Funktion f(x) nach χ
456
Anhang
Symbol
Bedeutung
y
'Summe 1 :
η 1
χ. = χ, + x 0 + ... + χ
-j = 1
l
i
t
η
b
'Integral': j g(x)dx= 'Summe der Flächeninhalte der
I
a Flächen zwischen der x-Achse und der Funktion g(x) im Intervall a < x < b , wobei Flächen oberhalb der x-Achse positiv und Flächen unterhalb der x-Achse negativ gewertet werden' [a,b]
'abgeschlossenes Intervall von a bis b'; Menge aller Werte χ mit a < x < b
(a,b)
'offenes Intervall von a bis b 1 ; Menge aller Werte χ mit a < χ < b
(a,b]
'linkshalboffenes Intervall von a bis b'; Menge aller Werte χ mit a < x < b
[a,b)
'rechtshalboffenes Intervall von a bis b'; Menge aller Werte x m i t a < x < b
Seien Α und ß Ereignisse. Dann ist Au Β
'Vereinigung von Α und B'
ΑΠ Β
'Durchschnitt von Α und Β'
Α-Β
'Differenz von Α und Β'
Ä
'das zu Α komplementäre Ereignis'
ß
'sicheres Ereignis'; 'Grundraum' allermöglichen Ereignissen
0
'unmögliches Ereignis'; 0 = 0,
P(A)
'die Wahrscheinlichkeit des Eintretens des Ereignisses A'
P(AIΒ)
'die Wahrscheinlichkeit des Eintretens des Ereignisses Α unter der Bedingung, daß das Ereignis Β eingetreten ist'
Seien X,Y,X^,...,X
Zufallsvariablen. Dann ist
F^(x)
'die Verteilungsfunktion von X an der Stelle X = x'
f^(x)
'die Dichte von X an der Stelle X = x '
FY
γ (χ. ' η 1
1 "
f„
ν (x, 1
x„) 'die gemeinsame Dichte von X.,...,X„ an der Stelle n 1 n (X,=x, Xn=xn)
1
η
E(X) = μ^ = μ ξ
α
2
Var(X) = σ ^ = σ
χn ) 'die gemeinsame Verteilungsfunktion von 1Χ,,.,.,Χ an der Stelle (X 1 = x 1 , . . . , X n = x n )
'der Erwartungswert von X'
2
'das a - Q u a n t i l (der Verteilung) von X' 'die Varianz von X'
Anhang
Symbol
457
Bedeutung 'die Standardabweichung von X 1
Οχ = σ υ
'der Variationskoeffizient von X'
Οον(Χ,Υ) = σ χ γ
'die Kovarianz zwischen X und Y'
P^Y=ρ
'die Korrelation zwischen X und Y'
S (x)
'die empirische Verteilungsfunktion zur Meßreihe χ. χ bzw. zu einer diskreten Zufallsvariablen X an der Stelle x '
χ
'das arithmetische Mittel einer Meßreihe x ^ , . . . , x n '
xa
'das empirische a - Q u a n t i l von X'
2
2
s^=s
'die empirische Varianz von X
s^=s
'die empirische Standardabweichung von X'
ν
'der empirische Variationskoeffizient von X'
s^y
'die empirische Kovarianz zwischen X und Y1
r^Y U Y,X
'die empirische Korrelation zwischen X und Y' 'das Bestimmtheitsmaß der linearen Einfachregression'
3
Y,(X1
N(0,1) 2
xn)
'das Bestimmtheitsmaß der multiplen Regression' Standardnormalverteilung
Ν(μ,σ )
Normal Verteilung mit Erwartungswert μ und Varianz σ
tn
t - V e r t e i l u n g mit η Freiheitsgraden
2
2
2
χ^
χ - Verteilung mit η Freiheitsgraden n
U(a,b)
F - Verteilung mit m und η Freiheitsgraden Gleichverteilung auf dem Intervall
[a,b]
Εχ(λ)
Exponentialverteilung mit Parameter Λ
B(n,p)
Binomialverteilung mit Parametern η und ρ
Ρο(λ)
Poissonverteilung mit Parmaeter λ
u,^
α - Q u a n t i l der Standardnormal Verteilung
wa
α -Quantil der Normal Verteilung mit Erwartungswert μ und Varianz σ2
t
α - Q u a n t i l der t - V e r t e i l u n g mit η Freiheitsgraden 2 α - Q u a n t i l der χ - Verteilung mit η Freiheitsgraden graden α - Q u a n t i l der F - V e r t e i l u n g mit m und η Freiheitsgraden
2 x'j.g ' F„ „
458
Anhang
Symbol
Bedeutung
φ(χ)
Verteilungsfunktion der Standardnormal Verteilung
ip(x)
Dichte der Standardnormal Verteilung
~
' v e r t e i l t nach'
=
'entspricht'