Statistik-Übungen: Induktive Statistik [4., durchges. und erg. Aufl. Reprint 2014] 9783486710939, 9783486273281

Das erfolgreiche Übungsbuch ermöglicht es, anhand von praktischen Aufgabenstellungen eine Vielzahl von Methoden der indu

247 66 9MB

German Pages 474 [476] Year 2004

Report DMCA / Copyright

DOWNLOAD PDF FILE

Recommend Papers

Statistik-Übungen: Induktive Statistik [4., durchges. und erg. Aufl. Reprint 2014]
 9783486710939, 9783486273281

  • 0 0 0
  • Like this paper and download? You can publish your own PDF file online for free in a few minutes! Sign Up
File loading please wait...
Citation preview

Statistik-Übungen Induktive Statistik

Von

o. Prof. Dr. Joachim Härtung Fachbereich Statistik der Universität Dortmund und

Dr. Barbara Heine

4., durchgesehene und ergänzte Auflage

R.Oldenbourg Verlag München Wien

Bibliografische Information Der Deutschen Bibliothek Die Deutsche Bibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über abrufbar.

© 2004 Oldenbourg Wissenschaftsverlag GmbH Rosenheimer Straße 145, D-81671 München Telefon: (089) 45051-0 www.oldenbourg-verlag.de Das Werk außerhalb lässig und filmungen

einschließlich aller Abbildungen ist urheberrechtlich geschützt. Jede Verwertung der Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzustrafbar. Das gilt insbesondere fur Vervielfältigungen, Übersetzungen, Mikroverund die Einspeicherung und Bearbeitung in elektronischen Systemen.

Gedruckt auf säure- und chlorfreiem Papier Druck: Huber GmbH & CO. KG, Garching-Hochbrück Bindung: R. Oldenbourg Graphische Betriebe Binderei GmbH ISBN 3-486-27328-0

Kapitelverzeichnis XI

VORWORT UND EINFÜHRUNG

n

TEIL I: ÜBUNGSAUFGABEN, ERLÄUTERUNGEN UND LÖSUNGEN

ι

K A P I T E L 1:

Zufallsereignisse und Wahrscheinlichkeiten

3

KAPITEL

Bedingte Wahrscheinlichkeit, Unabhängigkeit, Bayessche

KAPITEL

2:

3:

KAPITEL KAPITEL

5:

Formel und Zuverlässigkeit von Systemen

21

Zufallsvariablen und Verteilungen

39

Spezielle Verteilungen und Grenzwertsätze

93

Punktschätzer, Konfidenz- und Prognoseintervalle

135

K A P I T E L 6:

Parametrische Tests im Einstichprobenfall

159

KAPITEL

Anpassungstests und graphische Verfahren zur Überprüfung

7:

einer Verteilungsannahme

187

K A P I T E L 8:

Parametrische Vergleiche im Zweistichprobenfall

211

KAPITEL

Nichtparametrische, verteilungsfreie Vergleiche im Ein-

9:

und Zweistichprobenfall

243

KAPITEL

1 0 : Abhängigkeitsanalyse - Korrelation und Assoziation

267

KAPITEL

1 1 : Regressionsanalyse

297

KAPITEL

1 2 : Kontingenztafelanalyse

333

K A P I T E L 1 3 : Stichprobenverfahren

351

ANHANG

441

TEIL II: KLAUSURAUFGABEN UND LÖSUNGEN

373

ENDE

458

Inhaltsverzeichnis

VORWORT UND E I N F Ü H R U N G

TEIL

I:

X M

ÜBUNGSAUFGABEN,

KAPITEL 1:

ERLÄUTERUNGEN

ZUFALLSEREIGNISSE

UND LÖSUNGEN

UND W A H R S C H E I N L I C H K E I T E N

Ι

3

- Zufallsexperiment - Grundraum · Ereignis · Elementarereignis - Komplementärereignis · unmögliches/sicheres Ereignis · disjunkte Ereignisse - Verknüpfung von Ereignissen - Wahrscheinlichkeit · Kolmogoroffsche Axiome - Rechenregeln für Wahrscheinlichkeiten - Laplace-Wahrscheinlichkeit · günstige/mögliche Fälle - Kombinatorik · Kombinationen mit/ohne Wiederholung mit/ohne Berücksichtigung der Reihenfolge · geordnete/ungeordnete Stichprobe mit/ohne Zurücklegen · Permutationen

K A P I T E L 2:

BEDINGTE BAYESSCHE

WAHRSCHEINLICHKEIT,

UNABHÄNGIGKEIT,

FORMEL UND Z U V E R L Ä S S I G K E I T

VON S Y S T E M E N

21

- Bedingte Wahrscheinlichkeit - Multiplikationssatz für bedingte Wahrscheinlichkeiten - Unabhängigkeit von Ereignissen · paarweise/gemeinsame Unabhängigkeit - Satz von der totalen Wahrscheinlichkeit - Bayessche Formel - Parallel-/Seriensysteme - Gemischte Parallel-Serien-Systeme - Zuverlässigkeitsschaltbild - Komponenten-/Systemzuverlässigkeit

K A P I T E L 3:

ZUFALLSVARIABLEN -

UND V E R T E I L U N G E N

Zufallsvariable · Verteilungsfunktion Diskrete Zufallsvariable · Einzelwahrscheinlichkeit Stetige Zufallsvariable · Dichtefunktion Erwartungswert · Varianz · Verschiebungssatz · Variationskoeffizient Standardisierte Zufallsvariable a-ßuantile · Median · Quartile Gewinnfunktion · erwarteter Gewinn Tschebyscheffsche Ungleichung

39

VIII

Inhaltsverzeichnis

- Zufallsvektor · mehrdimensionale Verteilungsfunktion - Diskreter Zufallsvektor · (kx&)-Tafel · Randverteilung - Stetiger Zufallsvektor · gemeinsame Dichtefunktion · Randdichtefunktion - Unabhängigkeit von Zufallsvariablen - Kovarianz · Korrelation - Summe unabhängiger Zufallsvariablen: Verteilung · Faltung · Erwartungswert · Varianz · Gleichung von Bienayme - Summe abhängiger Zufallsvariablen: Erwartungswert · Varianz - Fehlerfortpflanzungsgesetz: Erwartungswert/Varianz von Produkt/Quotient/Funktionen von Zufallsvariablen

KAPITEL 4:

SPEZIELLE VERTEILUNGEN UND GRENZWERTSÄTZE -

KAPITEL 5:

93

Binomialverteilung MultinomialVerteilung Hypergeometrische Verteilung Poissonverteilung Gleichverteilung/Rechteckverteilung Exponentialverteilung Normalverteilung · Standardnormalverteilung t-Verteilung · χ2-Verteilung · F-Verteilung Zentraler Grenzwertsatz Grenzwertsatz von Poisson

PUNKTSCHÄTZER., KONFIDENZ- UND PROGNOSE INTERVALLE. 135 - Unabhängige Stichprobe - Punktschätzung · Schätzfunktion · Schätzwert · Erwartungstreue - Schätzer für Erwartungswert/Varianz/Variationskoeffizient /a-Quantil/Quartilsabstand/Kovarianz/Korrelation - Intervallschätzung · Konfidenzintervall · Niveau · erforderlicher Stichprobenumfang - Schätzer/Konfidenzintervalle für die Parameter der Normalverteilung · Prognoseintervalle für zukünftige Beobachtungen - Schätzer/Konfidenzintervall/approximatives Konfidenzintervall für den Parameter der Binomialverteilung - Schätzer/Konfidenzintervall für den Parameter der Exponentialverteilung - Schätzer/simultane Konfidenzintervalle für die Parameter der Multinomialverteilung

KAPITEL 6:

PARAMETRISCHE TESTS IM EINSTICHPROBENFALL - Statistischer Test · Null-/Alternativhypothese · Ein-/Zweiseitige Tests - Fehler 1. Art · Fehler 2. Art - Teststatistik · Test zum Niveau α - Ablehn-/Annahmebereich eines Tests · kritischer Wert

159

IX

Inhaltsverzeichnis

- Gütefunktion · erforderlicher Stichprobenumfang · abzusichernde Differenz - Tests über die Parameter der Normalverteilung: Einstichproben-Gauß-Test · Einstichproben-t-Test · Einst ichproben- Varianz-Test - Tests über den Parameter der Binomialverteilung - Test über die Parameter der Multinomialverteilung · χ 2 -Test

KAPITEL

7:

ANPASSUNGSTESTS PRÜFUNG -

KAPITEL

8:

EINER

UND

GRAPHISCHE

VERFAHREN

ZUR

ÜBER-

VERTEILUNGSANNAHME

137

2

χ -Anpassungstest Kolmogoroff-Smirnov-Anpassungstest Empirische Verteilungsfunktion Q—Q—Plot Histogramm/empirische Dichte Wurzeldiagramm/Rootogram · aufgehängtes Wurzeldiagramm · Wurzeldiagraimn-Residuen

PARAMETRISCHE

VERGLEICHE

IM Z W E I S T I C H P R O B E N F A L L

. 211

- Vergleich der Parameter zweier unabhängiger Normalverteilungen: Konfidenzintervalle · ZweistichprobenGauß-Test · Zweistichproben-t-Test · Behrens-FisherProblem · F-Test - Vergleich der Parameter zweier abhängiger Normalverteilungen · paarweise Differenzen - Erforderlicher Stichprobenumfang - Vergleich der Parameter zweier unabhängiger Binomialverteilungen - Vergleich der Parameter zweier unabhängiger Multinomialverteilungen · \ 2 -Test

KAPITEL

9:

ΝICHTPARAMETRISCHE, IM

EIN-

UND

VERTEILUNGSFREIE

VERGLEICHE

ZWEISTICHPROBENFALL

- Lokationsvergleiche im Einstichprobenfall: Zeichentest · Vorzeichenrangtest von Wilcoxon - Vergleich zweier abhängiger Verteilungen: Zeichentest · Vorzeichenrangtest von Wilcoxon - Vergleich zweier unabhängiger Verteilungen: WilcoxonRangsummentest · U-Test von Mann-Whitney · Kolmogorof f-Smirnov-Test · χ 2 -Test

KAPITEL

10: A B H Ä N G I G K E I T S A N A L Y S E

-

KORRELATION

UND

ASSO-

ZIATION - Korrelation · Bravais-Pearsonscher Korrelationskoeffizient - Test auf Unabhängigkeit bei gemeinsamer Normalverteilung

267

X

Inhaltsverzeichnis

- Fishersche-Z-Transformation - Tests auf Unabhängigkeit/positive/negative Abhängigkeit · Konfidenzintervall für die Korrelation bei gemeinsamer Normalverteilung - Spearmanscher Rangkorrelationskoeffizient · Test auf Unabhängigkeit · Hotelling-Pabst-Statistik - Kendallscher Rangkorrelationskoeffizient · Test auf Unabhängigkeit · Kendallsche-K-Statistik - Q-Maß · Yulescher Assoziationskoeffizient · Konfidenzintervall für Q · Vierfeldertafel - χ2-Unabhängigkeitstest · (kx£)-Kontingenztafel - Phi-Koeffizient - Pearsonscher Kontingenzkoeffizient · korrigierter Pearsonscher Kontingenzkoeffizient

KAPITEL 11: REGRESSIONSANALYSE

297

- Lineare Einfachregression · Methode der Kleinsten Quadrate - Schätzer/Konfidenzintervalle/Tests für die Parameter der linearen Einfachregression - Bestimmtheitsmaß - Konfidenzstreifen - Prognoseschätzung · Prognoseintervall · Prognosestreifen - Nicht-lineare Regression - Multiple Regression ' Methode der Kleinsten Quadrate · Normalengle ichungs system - Schätzer/Konfidenzintervalle/Tests für die Parameter der multiplen Regression - Multiples Bestimmtheitsmaß - Modellreduktion · Reduktionstest

KAPITEL 12: KONTINGENZTAFELANALYSE -

333 2

Vierfeldertafel · (kxi,)-Tafel · x -Test Test auf Unabhängigkeit Test auf Homogenität Test auf bedingte Gleichverteilung Test auf totale Gleichverteilung

KAPITEL 13: STICHPROBENVERFAHREN - Einfache Zufallsauswahl: Schätzer für Mittelwert/ Varianz der Merkmalswerte in der Grundgesamtheit · Anteilsschätzer · Schätzer für die Varianz des Mittelwert- /Anteilsschätzers · Konfidenzintervalle · erforderlicher Stichprobenumfang - Geschichtete Zufallsauswahl: Inventur auf Stichprobenbasis · Schätzer für Mittelwert/Varianz der Merkmalswerte in der Grundgesamtheit · Anteilsschätzer · Schätzer für die Varianz des Mittelwertschätzers · optimale Aufteilung des Stichprobenumfangs - Einstufige Klumpenauswahl: Schätzer für Mittelwert der Merkmalswerte in der Grundgesamtheit · Intraklass-Korrelationskoeffizient

351

Inhaltsverzeichnis

XI

- Zweistufige Klumpenauswahl: Schätzer für Mittelwert der Merkmalswerte in der Grundgesamtheit · Anteilsschätzer

TEIL

II:

KLAUSURAUFGABEN UND LÖSUNGEN

373

ANHANG

441

1 TABELLENANHANG

441

Tab.1:

Verteilungsfunktion 4>(x) der Standardnormalverteilung Ν(0,1)

442

Tab.2:

Quantile u^ der Standardnormalverteilung Ν(0,1)

443

Tab.3: Tab.4:

Quantile t^ der t - Verteilung 2 2 Quantile Χ η .γ der χ -Verteilung

444 445

Tab.5:

Quantile F

447

2 GRIECHISCHES

der F - Verteilung

ALPHABET

454

3 SYMBOLVERZEICHNIS

455

ENDE

458

Vorwort zur 4. Auflage Aufgrund einer starken Nachfrage liegt nun bereits die vierte, im wesentlichen unveränderte Auflage dieses Übungsbuches der induktiven Statistik vor. Dabei haben wir die Gelegenheit genutzt, die Aufgabenstellungen sowie die zugehörigen Lösungen und Erläuterungen noch einmal kritisch durchzusehen und die an uns herangetragenen Verbesserungswünsche zu berücksichtigen. Joachim Härtung Barbara Heine

Vorwort und Einführung Immer häufiger sehen sich Studenten, Wissenschaftler und Praktiker a l l e r Fachrichtungen mit der Auswertung oftmals sehr umfangreichen Datenmaterials, das durch Experimente oder Erhebungen gewonnen wurde, konfrontiert. Das vorliegende Buch, das nach einem langjährig erprobten Konzept entstanden i s t , ermöglicht es nun, anhand von praktischen Aufgabenstellungen sowohl die zur Verfügung stehenden s t a t i s t i s c h e n Auswertungsverfahren kennenzulernen bzw. zu vertiefen a l s auch eine gewisse Übung im Umgang mit s t a t i stischen Problemstellungen zu erlangen. Die ausführlichen Lösungsteile sind so gehalten, daß kein weiteres Buch zu Hilfe genommen werden muß, denn den konkreten Lösungswegen sind jeweils die zugehörigen allgemeinen b e g r i f f l i c h e n und methodischen Erläuterungen vorang e s t e l l t . Zusätzlich unterstützen zahlreiche graphische Veranschaulichungen die einzelnen Lösungsschritte. Daher kann das Buch sowohl zum Selbststudium a l s auch natürlich vorlesungsbegleitend verwendet werden. Letzteres wird durch eine Vielzahl von Klausuraufgaben noch unterstützt, die es prüfungsvorbereitend ermöglichen, das Erlernte anhand von komplizierteren Fragestellungen zu überprüfen. Desweiteren bietet das Buch Dozenten die Möglichkeit, aus einem breitgefächerten Angebot Aufgaben und B e i s p i e l e für ihre Lehrveranstaltungen

bereitzustellen.

XIV

Vorwort und Einfuhrung

Ausgangspunkt der hier behandelten Verfahren bildet die mit einem festen Untersuchungsziel verknüpfte Beobachtung einer oder mehrerer Variablen (Merkmale), Uber die Informationen und Erkenntnisse gewonnen werden sollen, bei bestimmten Untersuchungsobjekten. Da es oftmals nicht möglich i s t , etwa aus ökonomischen, technischen oder ethischen Gründen, a l l e relevanten Untersuchungsobjekte in eine Erhebung einzubeziehen (Totalerhebung), beschränkt man sich häufig auf eine z u f ä l l i g e Auswahl von Untersuchungsobjekten ( T e i l erhebung), die sogenannte Stichprobe. Die Methoden, die es erlauben, aus Stichprobenwerten der Variablen Rückschlüsse auf das Verhalten der Variablen bzw. auf Kenngrößen der Variablen in ihrer (Grund-) Gesamtheit zu ziehen, sind Gegenstand der lndaktivzn

lickti&ße.nden)

StatLitÄk.

Eine Stichprobe von Variablenwerten kann natürlich keine v ö l l i g exakte Auskunft über das Verhalten der Variablen in der Grundgesamtheit geben, d.h. die Stichprobenwerte bzw. die aus ihr abgeleiteten Ergebnisse können bei einer Übertragung auf die entsprechende Grundgesamtheit nur

Schätzungm

darstellen, die einen wichtigen Teil der induktiven S t a t i s t i k ausmachen. Dazu zählen etwa Punktschätzungen, ßereichsschätzungen, Konfidenz- und Prognoseintervalle. Oftmals bestehen auch Vermutungen, d.h. Hypothum

über das Variablenver-

halten in der Grundgesamtheit, die mit Hilfe von Stichprobenwerten s t a t i s t i s c h geprüft werden sollen. Die induktive S t a t i s t i k s t e l l t sogenannte TeA£veA{,ah&m bereit, die die Möglichkeit bieten, in einem gewissen Rahmen s t a t i s t i s c h ' s i g n i f i k a n t e ' Entscheidungen bezüglich der Variablenwerte in der Grundgesamtheit zu treffen. Weiterhin i s t es oft nicht nur interessant, das Verhalten einer Variablen zu untersuchen, sondern auch Zusammenhänge zwischen mehreren Variablen aufzudecken. Auch für diesen Fall liegen eine Reihe je nach Problemstellung unterschiedlicher Verfahren vor. Als theoretische Grundlage der oben kurz umrissenen, wesentlichen Fragestellungen der induktiven S t a t i s t i k i s t die Wakuchej.ntMililie.

x



x4^>

wobei x ^ e { 1 , 2 , 3 , 4 }

Vierertupel

d i e j e t z i g e P o s i t i o n der Felge a n g i b t ,

d i e im l e t z t e n J a h r d i e i - t e P o s i t i o n i n n e h a t t e , i = 1 , 2 , 3 , 4 . I n s g e s a m t es 4 ! M ö g l i c h k e i t e n , d i e F e l g e n a n z u o r d n e n ( v g l . Aufgabe 1 . 3 ) .

gibt

Betrachtet

man das zu Α ί komplementäre

' m i n d e s t e n s e i n e F e l g e kommt w i e d e r an d i e g l e i c h e S t e l l e w i e im V o r j a h r 1 Ereignis

Ä = ' k e i n e F e l g e kommt w i e d e r an d i e g l e i c h e S t e l l e w i e im V o r jahr' , so e n t h ä l t d i e s s ä m t l i c h e Tupel ( x ^ , x ^ , X j , x ^ ) m i t x ^ i , ( 2 , 1, 4 , 3)

;

( 2 , 3 , 4 , 1)

;

(2, 4 , 1 , 3 )

;

( 3 , 1 , 4 , 2)

;

( 3 , 4 , 1 . 2)

;

( 3 , 4 , 2 , 1)

;

( 4 , 1, 2 , 3)

;

(4, 3 , 1 , 2 )

;

( 4 , 3 , 2 , 1)

.

i=1,2,3,4

:

G ü n s t i g f ü r das E r e i g n i s Ä s i n d h i e r a l s o 9 F ä l l e , d . h . f ü r d i e g e s u c h t e Wahrscheinlichkeit ergibt

sich

P(A) = 1 - P(Ä) = 1 - X

LÖSUNG ZU AUFGABE

= 1- 4

= 0-6250 .

1.9

E i n e h a l b e S t u n d e b e s t e h t aus 1800 S e k u n d e n , so daß i n d i e s e r Z e i t

also

1800 K o m b i n a t i o n e n des Z a h l e n s c h l o s s e s e i n g e s t e l l t werden k ö n n e n . I n s g e s a m t 4 g i b t es b e i e i n e m v i e r s t e l l i g e n Z a h l e n s c h l o ß 10 M ö g l i c h k e i t e n , d i e Z a h l e n 0,1,2

9 zu k o m b i n i e r e n ( K o m b i n a t i o n e n m i t W i e d e r h o l u n g b e i

Berücksich-

Kapitel I: Zufallsereignisse und Wahrscheinlichkeiten

19

tigung der Reihenfolge, v g l . Aufgabe 1 . 3 ) . Demnach l i e g t die Wahrscheinlichkeit für das Ereignis A = 'ein v i e r s t e l l i g e s Zahlenschloß in einer halben Stunde zu öffnen 1 bei P(A) =

= 0.1800 .

10H

LÖSUNG ZU AUFGABE

1.10

Insgesamt gibt es ^ ^

Mögl ichkeiten.aus 16 Mannschaften 8 auszuwählen (Kom-

binationen ohne Wiederholung, wenn die Reihenfolge nicht berücksichtigt wird, v g l . Aufgabe 1 . 3 ) . Die Anzahl der für das Ereignis A £ 'die beiden stärksten Mannschaften spielen in verschiedenen Gruppen1 gUnstigen Fälle beträgt

(iX? 4 )

= 2

'

3432

=

6864

»

denn zunächst muß aus den beiden spiel stärksten Mannschaften eine ausgewählt werden, dies i s t auf ( ? ) = 2 - fache Weise möglich, und anschließend /14\ werden noch aus den restlichen 14 Mannschaften 7 gezogen, was auf ( , ) = 141 \ ' / j r f r = 3432 - fache Weise möglich i s t . Die gesuchte Wahrscheinlichkeit i s t al so PfA) P W

- ( % ? ) - ~7T5T \8/

LÖSUNG ZU AUFGABE

-

6864

TF! 5TST

- 6 8 6 4 - η ς5 3333 - Τ257ΪΓ " ° ' 3 3 ·

1.11

Mit A = 'der Student hat genau 10 Fragen richtig beantwortet' , Β = 'der Student hat genau 11 Fragen richtig beantwortet' , C 3 'der Student hat genau 12 Fragen richtig beantwortet'

20

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

setzt sich die Wahrscheinlichkeit, daß der Student die Klausur bestanden, d.h. mindestens 10 Fragen richtig beantwortet hat, zusammen aus P(AUBUC) = P(A) +P(B) +P(C) , da Α, Β und C paarweise disjunkte Ereignisse ( v g l . Aufgabe 1.1) sind. Betrachten wir zunächst das Ereignis A. Die Wahrscheinlichkeit, daß der Student bei drei Antwortmöglichkeiten eine Frage richtig beantwortetest 1/3, daß er falsch antwortetest 2/3. Von den 12 Fragen beantwortet er also 10 10 mit Wahrscheinlichkeit (1/3) richtig und 2 mit Wahrscheinlichkeit (2/3) 2 f a l s c h . Desweiteren gibt es l 1 n ) Möglichkeiten, 10 richtig beantwortete Fragen aus den 12 Fragen auszuwählen. Insgesamt i s t also die Wahrscheinl i c h k e i t , daß genau 10 Fragen r i c h t i g beantwortet werden,gerade

p(A)

= (!o)G) 1 0 (§) 2 = τ ο ™ - · ψ - 0 0 0 4 9 6 7 6 ·

In analoger Weise erhält man nun

P(B > =

(ll)G)11(§)1

=12· ^

= 0.°°004516

und

P(C)

"(IDG)12

=

(l)12

=

O·00000188 ·

Die Wahrscheinlichkeit, daß der Student unvorbereitet, d.h. durch zufälliges Ankreuzen, die KTausur besteht, beträgt also P ( A u ß u C ) = 0.00049676 + 0.000.04516 + 0.00000188 = 0„0005438 d.h_ sie i s t sehr g e r i n g -

r

Kapitel 2: Bedingte Wahrscheinlichkeit, Unabhängigkeit, Bayessche Formel und Zuverlässigkeit von Systemen AUFGABE 2.1 Die Entwicklungsabteilung eines Produzenten von Haushaltsgeräten ist in 90% der Fälle für die Markteinführung der von ihr entwickelten Geräte. Ein positives Votum der Entwicklungsabteilung führt mit einer Wahrscheinlichkeit von 0.7 bei der Marketlngabteilung ebenfalls zu einem positiven Votum. Sind beide Abteilungen für die Markteinführung des neuen Gerätes, so entscheidet die Geschäftsleitung dennoch mit einer Wahrscheinlichkeit von 0.2 dagegen. Ist die Marketlngabteilung gegen die Markteinführung, die Entwicklungsabteilung aber dafür, so stimmt die Geschäftsleitung nur mit einer Wahrscheinlichkeit von 0.4 zu. (a) Berechnen Sie die Wahrscheinlichkeit dafür, dass die Markteinführung eines neuen Produktes sowohl von der Geschäftsleitung als auch von der Entwicklungs- und der Marketlngabteilung getragen wird. (b) Mit welcher Wahrscheinlichkeit entscheiden sich Geschäftsleitung und Entwicklungsabteilung für die Markteinführung eines neuen Produktes?

AUFGABE 2.2 Mit zwei unterscheidbaren Würfeln wird gleichzeitig geworfen. Es Interessieren die Ereignisse A = 'die beiden Würfel zeigen gleiche Augenzahl an' , Β - 'die Augensumme der beiden Würfel ist durch Drei teilbar' ,

22

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

C = 'der zweite Würfel zeigt eine Vier'. (a) Wie gross 1st die Wahrscheinlichkeit, dass die Augensumme der beiden Würfel durch Drei teilbar 1st, wenn der zweite Würfel eine Vier anzeigt? (b) Sind die Ereignisse A, B, C (I) paarweise unabhängig, (II) unabhängig?

AUFGABE 2.3 Eine Musikkassette werde zu 30% im Auto und sonst in der Wohnung abgespielt. Im Auto habe diese mit 75%- lger und in der Wohnung mit 9 5 % - lger Wahrscheinlichkeit eine Lebensdauer grösser als 500 Betriebsstunden. Mit welcher Wahrscheinlichkeit werden für die Kassette mehr als 500 Betriebsstunden erreicht?

AUFGABE 2.4 Von den Angestellten einer Firma fahren 60% der Frauen und 80% der Männer mit dem eigenen PKW zum Büro. Die Anzahl weiblicher und männlicher Angestellter In diesem Betrieb stehen dabei Im Verhältnis 3 : 2 . (a) wie mit (b) Wie der

gross ist die Wahrscheinlichkeit, dass eine Angestellte dem PKW zur Arbelt kommt? gross ist die Wahrscheinlichkeit, dass eine Bürokraft Firma, die mit dem PKW zur Arbelt kommt, weiblich 1st?

AUFGABE 2.5 Eine Krankenversicherung ermittelte, dass bei Verkehrsunfällen von PKW -Fahrern, die angegurtet waren, nur 8% schwere Kopfverletzungen aufwiesen. Bei nicht angeschnallten Fahrern trugen 62% keine Kopfverletzung davon. Trotz Anschnallpflicht legen

Kapitel 2: Bedingte Wahrscheinlichkeiten etc., und Zuverlässigkeit von Systemen

23

immer noch 15% aller Autofahrer keinen Gurt an. Wie gross ist die Wahrscheinlichkeit, dass ein nach einem Unfall mit Kopfverletzung Ins Krankenhaus eingelieferter Autofahrer keinen Gurt angelegt hatte?

AUFGABE 2.6 Die Herstellung eines Werkstücks erfolgt auf vier Produktionsanlagen. Die Gesamtproduktion verteilt sich dabei zu 30% auf Maschine A, zu 15% auf Maschine B, zu 35% auf Maschine C und zu 20% auf Maschine D. Folgende Wahrscheinlichkelten für die Ausschussproduktion der einzelnen Maschinen sind bekannt: Maschine A Maschine C

0.04 , Maschine Β 0.03 und Maschine D

0.02 0.01

, .

(a) Wie gross 1st die Wahrscheinlichkeit, dass ein der Gesamtproduktion zufällig entnommenes Werkstück Ausschuss 1st? (b) Wie gross 1st die Wahrscheinlichkeit, dass ein zufällig entnommenes Ausschussstück auf Maschine C produziert wurde?

AUFGABE 2.7 Wiegross 1st die Zuverlässigkeit eines Gerätes G, dessen Komponentenstruktur bzgl. der Zuverlässigkeit In Abb. 2.7dargestellt 1st, wenn die Intaktwahrschelnllchkelten der einzelnen Bauteile wie folgt gegeben sind Ρ(Α η ) = 0.92 P(B 3 ) = 0.85 P(E1) = 0.95

, , ,

P(B 1 ) = 0.95 PtC,) = 0.90 P(F 1 ) = 0.90

, , .

P(B 2 ) = 0.90 P(D 1 ) = 0.98

, ,

AUFGABE 2.8 Ein Produkt wird In mehreren Phasen hergestellt. Zunächst sind für die Grobbearbeitung zwei Maschinen notwendig, wobei drei

24

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

A b b . 2.7: Z u v e r l ä s s i g k e i t s s c h a l t b i l d eines Gerätes G

Produktionsstrassen benutzt werden können. Bezeichnet Gij = i - te Maschine in der j - ten Produktionsstrasse, 1=1,2, j=l,2,3 , so sind die Zuverlässigkeiten der einzelnen Maschinen gegeben durch P ( G n ) = 0.9

J

P(G 1 2 ) = 0.8

,

P(G 1 3 ) = 0.7

,

P(G 2 1 ) = 0.8

,

P(G 2 2 ) = 0.8

,

P(G 2 3 ) = 0.9

.

Anschliessend werden die Grobprodukte mit einem Förderband, dessen Ausfallwahrscheinlichkeit bei 0.05 liegt, zur Weiterverarbeitung transportiert. Für die nun erforderlichen Feinarbeiten stehen alternativ zwei Maschinen mit Defektwahrscheinlichkeit 0.1 bzw. 0.2 zur Verfügung. Schliesslich werden die Produkte zur Lagerhalle transportiert; das Transportband ist mit 9 5 % - lger Sicherheit intakt. Berechnen Sie die Zuverlässigkeit des Systems.

Kapitel 2: Bedingte Wahrscheinlichkeiten

LÖSUNG

ZU A U F G A B E

25

etc., und Zuverlässigkeit von Systemen

2.1

Sind Α und Β zwei E r e i g n i s s e aus dem Grundraum Ω, wobei

P(B) > 0

gilt,

so

b e z e i c h n e t man P(A Ι Β) -

Ρ ( Λ Π Β )

Ρ (Β)

a l s b e d i n g t e W a h r s c h e i n l i c h k e i t des E r e i g n i s s e s Α unter der Bedingung B. Für d i e b e d i n g t e W a h r s c h e i n l i c h k e i t P(A | B) g e l t e n b e i f e s t e m Β und b e l i e b i g e n E r e i g n i s s e n Α d i e Axiome der Wahrscheinlichkeitsrechnung, v g l . A u f gabe 1 . 2 , und somit auch d i e entsprechenden Rechenregeln. So i s t etwa P(Ä I B) = 1 - P(A I Β) P = P(A ) · P ( A 2 | A j ) · P ( A 3 | A j η A 2 ) · •••-p(Ak Ι

Folgende

Α

ι

η

···

η

\-ι>

-

Ereignisse A1 = ' E n t w i c k l u n g s a b t e i l u n g A^ = ' M a r k e t i n g a b t e i l u n g Ag = ' G e s c h ä f t s l e i t u n g

i s t für Markteinführung'

i s t für Markteinführung'

i s t für

Markteinführung

,

,

1

mit den W a h r s c h e i n l i c h k e i t e n P(A^)

= 0.9

,

P(A2 I A1)

= 0.7

,

P ( Ä 3 | Α, η A 2 )

= 0.2

und

P ( A 3 I A1 Π a 2 ) = 0.4 liegen

vor.

-»(a) Berechnet werden s o l l A1 η A 2 η A 3

d i e W a h r s c h e i n l i c h k e i t f ü r das

Ereignis

,

daß E n t w i c k l u n g s a b t e i l u n g , M a r k e t i n g a b t e i l u n g

und G e s c h ä f t s l e i t u n g

für

die

26

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

M a r k t e i n f ü h r u n g e i n e s P r o d u k t e s s i n d . M i t H i l f e des

Multiplikationssatzes

f ü r b e d i n g t e W a h r s c h e i n l i c h k e i t e n , den angegebenen W a h r s c h e i n l i c h k e i t e n

sowie

den R e c h e n r e g e l n f ü r W a h r s c h e i n l i c h k e i t e n ( v g l . Aufgabe 1 . 2 ) e r h ä l t man

P ^ n A g f l A j ) = P ^ ) . P(A2 I A1) · P(A3 I Α , η Α ^ = Ρ ί Α ^ · P(A2 I A 1 ) - (1 - P ( Ä 3 I A 1 n A 2 ) ) = 0.9 . 0 . 7 . (1 - 0 . 2 ) = 0.504

.

- • ( b ) B e r e c h n e t w e r d e n s o l l d i e W a h r s c h e i n l i c h k e i t f ü r das E r e i g n i s A j η A3

,

daß E n t w i c k l u n g s a b t e i l u n g u n d G e s c h ä f t s l e i t u n g f ü r d i e M a r k t e i n f ü h r u n g P r o d u k t e s s i n d . A n a l o g zu ( a )

eines

ist

p ( A 1 η Ä2 η A 3 ) = P(A1) · P(Ä2 | A 1 ) · P(A3 | Α , η Ä 2 )

= P(A1) · (1 -P(A 2 I A 1 )) · P(A3| A 1 nÄ 2 ) = 0 . 9 · (1 - 0 . 7 ) · 0.4 = 0.108 .

M i t d e r u n t e r ( a ) b e r e c h n e t e n W a h r s c h e i n l i c h k e i t e r g i b t s i c h nun

P(A1 η A3) = P(A1 η ω η A3) = P(A1 η (A2 U Ä2) η A3) = p( ( Α 1 η A 2 η A 3 ) υ ( Α , η fi2 η A 3 ) ) = P( A 1 η A 2 η A 3 ) + P(A 1 η Ä 2 η A 3 ) = 0.504 + 0.108 = 0.612 . V e r d e u t l i c h e n S i e s i c h d i e d u r c h g e f ü h r t e n M e n g e n o p e r a t i o n e n anhand e i n e s Mengendiagramms.

LÖSUNG ZU AUFGABE 2 . 2 Werden z w e i u n t e r s c h e i d b a r e W ü r f e l g l e i c h z e i t i g g e w o r f e n , so g i b t es 36 mögliche

Elementarereignisse {(1,1) , (1,2) , (2,1) , (1,3) , (3,1) , . . . , (6,6)}

.

F ü r das E r e i g n i s A S ' d i e beiden Würfel zeigen g l e i c h e Augenzahl

an'

Kapitel 2: Bedingte Wahrscheinlichkeiten etc., und Zuverlässigkeit von Systemen

gibt es 6 günstige Fälle, nämlich {(1,1) ,(2,2) ,(3,3) ,(4,4) ,(5,5) ,(6,6)}

,

d.h. die Wahrscheinlichkeit für das Ereignis Α berechnet sich zu (vgl. Aufgabe 1.3)

Analog erhält man für das Ereignis Β = 'die Augensunme der beiden Würfel ist durch Drei teilbar 1 bei 12 günstigen Fällen {(1,2) ,(2,1) ,(1,5) ,(5,1) ,(2,4) ,(4,2) ,(3,3) ,(3,6) , (6,3) ,(4,5) ,(5,4) ,(6,6)} eine Wahrscheinlichkeit von 12 1 35" " 1

P(B)

bzw. für das Ereignis C = 'der zweite Würfel zeigt eine Vier' mit 6 günstigen Fällen {(1,4) ,(2,4) ,(3,4) ,(4,4) ,(5,4) ,(6,4)} eine Wahrscheinlichkeit von p c

< > =π = τ ·

-»(a) Es soll die bedingte Wahrscheinlichkeit (vgl. Aufgabe 2 . 1 ) PfR ι η IC) -

p

(B"0

H t )

berechnet werden. Da sich für das Ereignis B n C die günstigen Fälle {(2,4) , (5,4)} ergeben, ist P ( B n C

>

= ·ΠΓ = Τ ¥ »

d.h. die Wahrscheinlichkeit, daß die Augensumme der beiden Würfel durch Drei teilbar ist, wenn der zweite Würfel eine Vier anzeigt, ist 1 P(B|o

.4»

27

28

Teil I: Übungsaufgaben,

Erläuterungen

und

Lösungen

-•(b) Zwei Ereignisse Α und Β heißen (stochastisch) unabhängig, wenn gilt Ρ ( Α Π Β ) = Ρ (Α) · Ρ (Β) , was bei jeweils positiven Wahrscheinlichkeiten gleichbedeutend ist mit Ρ (Β [ A) = Ρ (Β)

bzw.

Ρ (A I Β) = Ρ (Α) .

In Verallgemeinerung dieser Definition heißen k Ereignisse Α^,.,.,Α^ (stochastisch) unabhängig, wenn für jedes m£{2,...,k} und alle möglichen natürlichen Zahlen

1< i, < i, < . .. < i < k - 1 2 m -

P(A. Π Α . 1

1

gilt:

Ο.,,ΙΙΑ. ) = P(A. ) · Ρ (A. ) · . . . · Ρ (A. ) .

1

2

1

i-m

1

2

m

In der Regel folgt aus der paarweisen Unabhängigkeit von k Ereignissen, d.h. aus P(A. DA.) = P(AJ · P(A_.)

für alle i,j=l,...,k

,

i^j ,

nicht, daß diese insgesamt unabhängig sind.

- » ( b ) Zum Beweis der paarweisen Unabhängigkeit muß also gezeigt werden, daß P(A Π Β) = P(A) · P(B) , P ( A n C ) = P(A) · P(C) , P(BflC) = P(B) · P(C) gilt. Die Wahrscheinlichkeiten P(A), P(B) , P(C) wurden bereits berechnet. Es ergab sich P(A) = l

,

P(B) = 1

,

P(C) = 1

.

Das Ereignis Α η Β setzt sich zusammen aus Α η Β = {(3,3) , (6,6)}

,

bei insgesamt 36 möglichen Elementarereignissen gilt nun

ρ Αηβ

< ) = ^ = A = =ρ(Α)·ρ(Β) ·

d.h. Α und Β sind (stochastisch) unabhängig. Für das Ereignis A n C ergibt sich ein günstiges Elementarereignis Α η C = {(4,4)} und somit gilt P(AnC) = ^

=

= P(A) - P(C) ,

d.h. Α und C sind (stochastisch) unabhängig.

Kapitel 2: Bedingte Wahrscheinlichkeiten

etc.. und Zuverlässigkeit von Systemen

Mit BflC = {(2,4) ,(5,4)} gilt p

(ßnc>

P ( B )

= W

d.h. auch Β und C sind (stochastisch)

'

P ( C )

·

unabhängig.

Insgesamt liegt also paarweise Unabhängigkeit der Ereignisse Α , Β und C vor. ->(b,ii) Neben der paarweisen Unabhängigkeit, die in (i) gezeigt w u r d e , müßte für die Unabhängigkeit der Ereignisse Α , Β und C jetzt noch P(A η Β η C) = P(A) · P(B) · P(C) gelten. Da aber An Β η C = 0 , d.h. P(AnBnC)

= 0t=

T

^

= g - ' j ' 5 " = P(A) · P(B) · P(C) ,

sind folglich die drei Ereignisse nicht (stochastisch)

LÖSUNta ZU AUFGABE

unabhängig.

2.3

Sind Α ^ , , . , , Α ^ paarweise d i s j u n k t e E r e i g n i s s e aus dem Grundraum Ω, d . h . gilt Α..ΠΑ.

= 0

, i , j =l

k

,

ifj

,

und i s t außerdem A, IIA. U . . . UA, 1 2 k

= Ω' ,

mit P ( A . ) ι

> 0

für i = l , .

,

so l ä ß t s i c h d i e W a h r s c h e i n l i c h k e i t f ü r e i n b e l i e b i g e s E r e i g n i s Β aus Ω mit H i l f e der bedingten W a h r s c h e i n l i c h k e i t e n

( v g l . Aufgabe 2 . 1 )

nach dem

Satz von der t o t a l e n W a h r s c h e i n l i c h k e i t berechnen: P(B)

=

k Ι P(B Ι A . ) · P ( A . ) ' ι ι 1=1 . L -,



S e t z t man A^ = A und A^ = A , so e r h ä l t man a l s S p e z i a l f a l l d i e s e s gerade

Satzes

29

30

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

P(B)

= Ρ (Β I A ) · Ρ ( A ) + Ρ (Β | Ä) · P ( A )

.

Es s o l l die Wahrscheinlichkeit des Ereignisses ß S 'die Musikkassette b e s i t z t eine Lebensdauer von mehr a l s 500 Stunden 1 berechnet werden. Für das E r e i g n i s A 2 ' d i e Musikkassette wird im Auto benutzt' i s t die Wahrscheinlichkeit P(A) = 0.30 bekannt. Außerdem sind gegeben P(B I A) = 0.75

und

P(B | Ä) = 0.95 .

Die Anwendung des Satzes von der totalen Wahrscheinlichkeit l i e f e r t das Ergebnis: P(B) = P(B I A) · P(A) + P(B | Ä) · P(Ä) = P(B I A) · P(A) + P(B I Ä)(1 - P(A)) = 0.75 · 0.30 + 0.95 · (1 - 0.30) = 0.89 .

LÖSUNG ZU AUFGABE 2 . 4 Mit H i l f e

der D e f i n i t i o n der bedingten Wahrscheinlichkeit

und dem S a t z von d e r t o t a l e n W a h r s c h e i n l i c h k e i t sich

(vgl.

f ü r paarweise disjunkte Ereignisse Α ^ , . , . , Α ^

P(AJ >0

für i = l , . . . , k ,

Bayessche

Formel:

Ρ ( Α ± I Β)

Ρ (Β I Α . ) · Ρ ( Α . ) !

=

V j-1 B e t r a c h t e t man s p e z i e l l

P ( A I B)

Bezeichnen Α^,

und e i n b e l i e b i g e s

(vgl.

Aufgabe

Aufgabe 2.3)

m i t A^U . . . U

Α^=Ω,

E r e i g n i s Β aus β d i e

,

i=l,...,k

sogenannte

.

Ρ ( Β Ι Α . ) · Ρ (Α . ) 3

3

A^ = A , A^ = Ä und e i n E r e i g n i s B , so g i l t

) * P ( A ) P ( B ] A) ·P (PB( AI) A + P ( B Α) · Ρ ( A )

Β die E r e i g n i s s e

2.1)

ergibt

etwa

31

Kapitel 2: Bedingte Wahrscheinlichkeiten etc., und Zuverlässigkeit von Systemen

A^ = ' d i e B ü r o k r a f t i s t w e i b l i c h '

,

Ä£ = ' d i e B ü r o k r a f t i s t m ä n n l i c h '

,

Β

= ' d i e B ü r o k r a f t kommt m i t dem PKW z u r A r b e i t '

,

so s i n d f o l g e n d e I n f o r m a t i o n e n gegeben: P(B I A t ) = 0 . 6 , P(B I A 2 ) = 0 . 8 . Aus dem V e r h ä l t n i s

3 : 2

von w e i b l i c h e n zu m ä n n l i c h e n A n g e s t e l l t e n

ergibt

s i c h außerdem P(A1) = I

= 0.6 ,

P(A2) = I

= 0.4 .

- • ( a ) D i e W a h r s c h e i n l i c h k e i t , daß e i n e A n g e s t e l l t e , d . h . w e i b l i c h e B ü r o k r a f t , m i t dem PKW z u r A r b e i t kommt, l i e g t b e r e i t s v o r . Es i s t d i e b e d i n g t e Wahrscheinlichkeit P(B | A ^

=0.6

.

- • ( b ) Gesucht i s t d i e W a h r s c h e i n l i c h k e i t d a f ü r , daß e i n e B ü r o k r a f t w e i b l i c h i s t , u n t e r d e r B e d i n g u n g , daß s i e m i t dem PKW z u r A r b e i t kommt, d . h . P ( A j | B ) . Nach d e r Bayesschen Formel e r g i b t s i c h g e r a d e P(B | A 1 ) · P ( A , ) P(A1 1 B)

=

-

P(B I A 1 ) . F>(A1) + P(B I A 2 ) · P ( A 2 ) 0.6 · 0.6 _ 0.36 0.6 · 0.6 + 0.8 · 0.4 " 1 O T

= 0.5294 .

LÖSUNG ZU AUFGABE

2.5

Bezeichnen Α und Β d i e

Ereignisse

A = 'der PKW-Fahrer i s t angegurtet'

,

Β £ ' d e r U n f a l l v e r l e t z t e w e i s t schwere K o p f v e r l e t z u n g e n a u f ' , so l a s s e n s i c h d i e gegebenen I n f o r m a t i o n e n d a r s t e l l e n a l s P(Ä) = 0 . 1 5 ,

32

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

P(B I A) = 0.08 , P(B I Ä) = 0.62 . Mit der Formel von Bayes ( v g l . Aufgabe 2.4) berechnet sich die gesuchte Wahrscheinlichkeit zu P(Ä I B) =

p(B

1 *> * p(ä>

P(B I Ä) . P(Ä) + P(B I A) . P(A) (1 - P ( B | Ä)) · P(Ä)

=

(1 - PC Β I Ä)) . P(Ä) + PCB I Α) · (1 - P(Ä)) (1 - 0.62) · 0.15 _ 0.057 " (1 - 0 . 6 2 ) . 0.15 + 0.08· (1 - 0 . 1 5 ) ~ O I F = 0.456 .

Lösung z u "Aufgabe 2 . 6 Es stehe M^, Mg. M^, M^ f ü r die Produktion an Maschine Α, B, C und D und Ν f ü r Ausschußstück, dann sind nachfolgende Wahrscheinlichkeiten gegeben P(Mt) = 0.30

,

P(N | Mj) = 0.04

,

P(M2) = 0.15

,

P(N | M2) = 0.02

,

P(M3) = 0.35

,

P(N | M3) = 0.03

,

P(M4) = 0.2Ό

,

P(N | M4) = 0.01

-»(a) Nach dem Satz von der totalen Wahrscheinlichkeit ( v g l . Aufgabe 2.3) i s t mft Wahrscheinlichkeit P(N) =

4 Ι P(R | Μ.) · P(M_.) 1 1 •Μ

= 0.04 - 0 , 3 0 + 0.02 . 0 j 5 + aj)3 · 0 ^ 5 + 0 Λ 1 · 0.20 = 0.0275 e i n - z u f ä l l i g entnommenes Produktfonsstück Ausschuß^

-*{b) Ein z u f ä l l i g entnommenes Ausschußstück i s t unter Anwendung der Bayesschen Formel ( v g l . Aufgabe 2·4) und des Ergebnisses 3us (a) mit Wahrscheinlichkeit

Kapitel 2: Bedingte Wahrscheinlichkeiten

P(N| Η,)· P(M.) 2 —

P(M3|N)

l i=1

etc., und Zuverlässigkeit

'

0 03 - 0 35 0.0275

=

von Systemen

33

°·3818

P( Ν | Μ -) · Ρ(Μ·) 1

1

auf Maschine C produziert worden.

LÖSUNG

ZU A U F G A B E

2.7

Ein System aus η unabhängigen Komponenten A ,... ,A vgl. Ahb. C2.7A,

heißt Parallelsystem,

falls es genau dann intakt ist, wenn mindestens eine der

η Systemkomponenten intakt ist.

Abb. £2*7.1: Zuverlässigkeitsschaltbild eines Parallelsystems aus η Komponenten

Ist ein System aus η unabhängigen Komponenten A

# ... ,A

nur dann intakt,

wenn alle η Komponenten intakt sind, so spricht man von einem Seriensystem, vgl. Abh. C2.7.2. Als Zuverlässigkeit einer Komponente A^ bezeichnet man die Wahrscheinlichkeit, daß A_. intakt ist (kurz: P(A^ intakt)). Analog spricht man von Systemzuverlässigkeit als der Wahrscheinlichkeit, daß das System intakt ist (kurz : Ρ(System intakt)). Aufgrund der vorausgesetzten Unabhängigkeit (vgl. Aufgabe 2.2) der Komponenten berechnet sich die Zuverlässigkeit eines Parallelsystems zu

34

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

A

A2

1

A b b . £2.7.2: Zuverlässigkeitsschaltbild eines Seriensystems aus η Komponenten

Ρ(Parallelsystem intakt)

= Ρ(mindestens eine Komponente ist intakt) = P[(Aj intakt) U (A 2 intakt) U ... U (A = 1 - P[(Aj defekt) η ... Π (A = 1 - P ( A . defekt) · ... · P(A

1

intakt)]

defekt)]

η

defekt)

= 1- [ (1 - P(A. intakt))· . . . · ( 1 - P ( A

1

η

intakt))]

b z w . für ein Seriensystem erhält m a n Ρ(Seriensystem intakt)

= P(alle Komponenten sind intakt) = P[(A. intakt) η (A„ intakt) Π ... Π (Α

1

= Ρ(Α. intakt) · ... · Ρ(Α

1

η

η

intakt)]

intakt).

In Abb. £2.7.3 ist noch einmal die Komponentenstruktur (bzgl. der Zuverlässigkeit) des Gerätes G graphisch dargestellt. Dabei wurde das System in Teilsysteme G p G2, Gj, G^ und Gg zerlegt. Mit den Komponentenzuverlässigkeiten P(A 1 intakt) = 0.92

,

P(B 1 intakt) = 0.95

,

P(B 2 intakt) = 0.90 ,

P(B 3 intakt) = 0.85

,

P(C1 intakt) = 0.90

,

P(D 1 intakt) = 0.98 ,

P(E 1 intakt) = 0.95

und

P(F 1 intakt) = 0.90

lassen sich nun die Teilsystemzuverlässigkeiten berechnen. Beim System G^ handelt es sich nun um eine Serienschaltung, d.h. es ist P(G 1 intakt) = P(B1 intakt) · P(B 2 intakt) · P(B 3 intakt) = 0.95 · 0.90 · 0.85 = 0.72675 .

Kapitel 2: Bedingte Wahrscheinlichkeiten etc., und Zuverlässigkeit von Systemen

Abb. C2.7.3: Zuverlässigkeitsschaltbild eines Gerätes G

Das Teilsystem G2 i s t ein Parallel system bestehend aus den Komponenten A1 und Gj, d.h. es g i l t P(G2 intakt) = 1 - [ ( 1 - P ( A 1 i n t a k t ) ) ( 1 - P(G1 intakt))] =

1 -

=

1

C(1

=

0 . 9 7 8 1 4

-

0 . 9 2 ) ( 1

-

0 . 7 2 6 7 5 ) 1

- 0 . 0 2 1 8 6 .

Bei Gj handelt es sich dann um ein Seriensystem mit den Komponenten G2 und C^, d.h. dessen Zuverlässigkeit l i e g t bei P(G3 intakt) = P(G2 intakt) · P(C1 intakt) =

0 . 9 7 8 1 4

=

0 . 8 8 0 3 3

·

0 . 9 0 .

Sowohl G4 als auch Gg stellen Parallelsysteme dar, einmal bestehend aus G^ und D,, d.h.

35

36

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

P(G 4 intakt) = 1 - [ ( 1 - P ( G 3 intakt))(1 - P(D1 intakt))] = 1 - [(1 - 0.88033)(1 - 0.98)] = 1 - 0.00239 = 0.99761 , zum anderen bestehend aus den Komponenten E^ und F^, d.h. es ist P(G g intakt) = 1 - [ ( 1 - P ( E 1

intakt))(1 - P(F1

intakt))]

= 1 - [( 1 - 0.95)(1 - 0.90)] = 0.995 . Die Zuverlässigkeit des Gerätes G läßt sich nun berechnen als die Wahrscheinlichkeit, daß das Seriensystem bestehend aus den Komponenten G^ und Gg intakt ist. Man erhält somit P(G intakt) = P(G 4 intakt) · P(G g intakt) = 0.99761 . 0.995 = 0.99262 .

LÖSUNG ZU A U F G A B E

2.8

Aus den gegebenen Informationen läßt sich das in Abb. C2.8.1 dargestellte Zuverlässigkeitsschaltbild aufstellen. Neben den einzelnen Systemkomponenten, d.h. den Maschinen G.j, i=1,2, j=1,2,3, dem Förderband F^, den Maschinen für die Feinarbeit E^ und Eg

sowie dem Transportband D^, wurden dort

auch die die Zuverlässigkeitsberechnung ( v g l . A u f g a b e 2 . 7 )

erleichternden

Teilsysteme T^, T^, Tj, T^ und Tg eingetragen. Desweiteren

können folgende Intaktwahrscheinlichkeiten, d.h. Komponenten-

zuverlässigkeiten, zusammengestellt werden: P(G 11 intakt) = 0.90

,

P(G 1 2 intakt) = 0.80

,

P(G 1 3 intakt) = 0.70

,

P(G 21 intakt) = 0.80

,

P(G 2 2 intakt) = 0.80

,

P(G 2 3 intakt) = 0.90

,

P{F1 intakt) = 1 - P ( F 1 defekt) = 1 - 0.05 = 0.95

,

P(E1 intakt) = 1 - P C E , defekt) = 1 - 0 . 1 0 = 0.90

,

P(E 2 intakt) = 1 - P(E g defekt) = 1 - 0.20 = 0.80

,

P(D. intakt) = 0.95 .

Kapitel 2: Bedingte Wahrscheinlichkeiten etc., und Zuverlässigkeit von Systemen

Ahh. £2.8.1: Zuverlässigkeitsschaltbild des Systems zur Produktherstellung

Bei den Teilsystemen T 1 , T2 und T"3 handelt es sich um Seriensysteme, die jeweils aus zwei Komponenten bestehen. Deren Zuverlässigkeit berechnet sich somit zu P(T1 intakt) = P ( G n

intakt) · P(G21 intakt)

= 0.90 · 0.80 = 0.72 , P(T 2 intakt) = P ( G n intakt) · P(G 22 intakt) = 0.80 · 0.80 = 0.64 , P(T3 intakt) = P(G 13 intakt) · P(G 23 intakt) = 0.70 · 0.90 = 0.63 . Für das P a r a l l e l system T^, bestehend aus den Komponenten T 1 , T2 und T 3 , ergibt sich eine Intaktwahrscheinlichkeit von P(T4 intakt) = 1 - [ ( 1 - P ( T 1 intakt) ) · ( 1 - P(T 2 intakt)) • (1 - P(T 3 intakt))]

37

38

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

= 1 - ( 1 - 0.72) (1 - 0.64) (1 - 0.63) = 1 - 0.03730 = 0.9627 . Analog erhält man für die Zuverlässigkeit des Parallel systems P(T 5 intakt) = 1 - [ ( 1 - P ( E 1 intakt))(1 - P(E 2 intakt))] = 1 - ( 1 - 0.90) (1 - 0.80) = 0.98 . Die Systemzuverlässigkeit ergibt sich nun aus der Wahrscheinlichkeit, daß das Seriensystem mit den Komponenten T^, F^, Tg und D^ intakt i s t : P(System intakt) = P(T4 intakt) · P(F 1 intakt) · P(Tg intakt) • P(D1 intakt) = 0.9627 · 0.95 - 0.98 · 0.95 = 0.8515 .

Kapitel 3: Zufallsvariablen und Verteilungen AUFGABE 3 . 1 Folgendes Zufallsexperiment sei gegeben: Eine f a i r e Münze wird viermal nacheinander geworfen und man i n t e r e s s i e r t s i c h f ü r das E r e i g n i s , wie oft im Ergebnis ' Z a h l ' e r s c h e i n t . (a) Berechnen und zeichnen S i e die V e r t e i l u n g s f u n k t i o n f ü r d i e ses z u f ä l l i g e Ergebnis X. (b) Berechnen S i e folgende Wahrscheinlichkeiten: P(0 < X < 2) , P ( X > 1 ) , P(X < 3) .

AUFGABE 3.2 Bei der Q u a l i t ä t s k o n t r o l l e eines Werkstücks s t e l l t man f e s t , dass die Z u f a l l s v a r l a b l e X = 'Abweichung von der Querschnlttsvorgabe' eine Dichte folgender Art b e s i t z t : Absolute Abweichungen von mehr a l s 3mm treten nicht auf. Für die Abweichungen von - 3 b i s Omm s t e i g t die Dichte l i n e a r b i s zu einem Wert h an und im Bereich von 0 b i s 3mm i s t ein l i n e a r e r Abstieg der Dichte auf den Wert 0 zu verzeichnen. (a) Bestimmen s i e den Maximalwert h der Dichte. (b) Berechnen S i e die Dichte und die V e r t e i l u n g s f u n k t i o n von X und s t e l l e n S i e beide graphisch dar. (c) Berechnen S i e die Wahrscheinlichkeiten P(X 1 - 2 ) , P ( X > - 1 ) , P ( - l < X < 1) .

40

Teil I: Übungsaufgaben,

Erläuterungen

und

Lösungen

AUFGABE 3.5 Ein begeisterter Fussballfan gibt jede Woche Tototips ab, wobei er die Ziffern 0 (Unentschieden), 1 (Heimsieg) und 2 (Auswärtssieg) unter Zuhilfenahme der WahrschelnlIchkeitsfunktion J + a k + bk 2

für k=0,l,2

0

sonst

PCX = k) verteilt. Die Grössen a und b hält er geheim. Es 1st aber bekannt, dass für seine Tips ausserdem P(X = 1 )

_ 1 - Ζ

gilt. Bestimmen Sie a und b sowie die zugehörige Verteilungsfunktion.

AUFGABE 3.4 Folgende Dichtefunktion eil er Zufallsvariablen X sei gegeben |c2x

.falls 0 i x < a

f x (x> = • 0

sonst

(a) Bestimmen Sie a. (b) Berechnen Sie für c = l die Verteilungsfunktion F (x).

AUFGABE 5.5 In einem TANTE - EMMA - Laden liegt der tägliche Umsatz bei maximal 400 DM. Der Kaufmann hat nach langjährigen Beobachtungen festgestellt, dass sich der tägliche Umsatz U näherungsweise verteilt mit der Dichtefunktion f (U) = 7.5 · 10"^ \fü- 0.375 · 10 _it u

, 0 < U < 400 .

(a) Berechnen Sie die Verteilungsfunktion und stellen Sie diese

sowie die Dichtefunktion graphisch dar.

Kapitel 3: Zufallsvariablen und Verteilungen

41

(b) Wie g r o s s i s t die Wahrschelnlichkeit, dass der Kaufmann pro Tag (i) mindestens 200 DM, (ii) zwischen 100 und 300 DM, ( i i i ) genau 150 DM Umsatz hat?

AUFGABE 3.6 Eine Maschine s t e l l t Keilriemen mit einer Sollänge von 9 cm her. Eine Untersuchung der auftretenden Längen X ergab die in t a t . 3 . 6 angegebenen Werte mit der entsprechenden W a h r s c h e i n l i c h k e i t s v e r teilung. t a b . 3.6: Keil riemenlänge x^ sowie Wahrscheinlichkeit P ( X = x . . ) , i=1 i

1

2

3

4

5

χ. 1

8.8

8.9

9.0

9.1

9.2

P(X =x i )

0.050

0.150

0.575

0.200

0.025

5

(a) Berechnen S i e Erwartungswert und Varianz der z u f ä l l i g e n Grösse X. (b) Wie g r o s s s i n d Erwartungswert und Varianz f ü r die t r a n f o r mierten Z u f a l l s v a r i a b l e n (i) Υ = X - 9 ( i i ) Ζ = Y / vO.Ü065 ?

AUFGABE 5.7 Berechnen S i e f ü r die in Aufgabe 3.5 gegebene Umsatzverteilung des Tante - Emma - Ladens den t ä g l i c h zu erwartenden Umsatz s o wie die Varianz.

42

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

AUFGABE 3.8 Bestimmen Sie für die in Aufgabe 3.4 gegebene Zufallsvariable mit der Dichte f x (x) bei c = l (a) Erwartungswert und Varianz, (b) Median, (c) 0.95-Quantll.

AUFGABE 3.9 Bestimmen Sie für die Anzahl des Auftretens von 'Zahl' beim viermaligen Münzwurf, vgl. Aufgabe 3.1, (a) Erwartungswert, (b) Median sowie unteres und oberes Quartl1.

AUFGABE 3.10 Ein Roulettespieler setzt immer auf eine der Zahlen 0,1,...,36. Kommt diese Zahl, so erhalt er den 36 -fachen Einsatz, tritt eine andere Zahl oder die Null auf, so verliert er seinen Einsatz. Wieviel DM gewinnt oder verliert der Spieler durchschnittlich im Monat (=30Tage), wenn er täglich 100 Spiele mit jeweiligem Einsatz von 2 DM macht?

AUFGABE 3.11 Ein Lebensmittelhändler bezieht wöchentlich von einer Molkerei Sahnejoghurt In Paletten zu 10 Bechern zu einem Preis von DM 2.50. Er verkauft diesen Joghurt, dessen Haltbarkeit bei einer Woche liegt, palettenweise für 10 DM. Bestimmen Sie die auf Dauer gewinnoptimale Einkaufspolitik des Händlers, wenn die Wahrscheinlichkeit, pro Woche J Paletten zu verkaufen (P6(X = J)), gemäss tatu 3.11 gegeben ist.

Kapitel 3: Zufallsvariablen und Verteilungen

43

Cab. 3.11: Wahrscheinlichkeiten P f i ( X = j ) pro Woche j Paletten zu verkaufen,

0=0,1,2

b

6

j

0

1

2

3

4

5

6

P6(x=j)

0.02

0.08

0.10

0.18

0.34

0.18

0.10

AUFGABE 3.12 Aus langjähriger Erfahrung i s t dem Hersteller einer bestimmten Schraubensorte bekannt, dass die Schraubenlangen v e r t e i l t sind mit einem Erwartungswert μ =20 mm und einer Varianz σ 2 =0.0225 mm2, Mit wieviel Prozent Ausschuss muss man höchstens rechnen, wenn die Schraubenlänge grösser a l s 19.7 mm und kleiner a l s 20.3 mm sein s o l l ?

AUFGABE 3.13 Bei Brutkästen eines bestimmten Typs wird die durchschnittliche Bruttemperatur mit 25°C angegeben. Eine Untersuchung der Temperaturen ergab weiterhin, dass bei 5% der Brutkästen eine Temperatur von 23°C unterschritten und bei 10% eine Temperatur von 27°C überschritten wurde. Was lässt sich aus diesen Angaben Uber die Varianz der Temperatur sagen?

(*) AUFGABE 3.14 Aus langjähriger Erfahrung 1st der Abteilung für Familie und Soziales einer Stadtverwaltung bekannt, wie sich die gemeinsame Verteilung der Anzahl der Kinder pro Familie X-, und der Anzahl der PKW pro Familie X 2 zusammensetzt, v g l . sab. 3.14.

44

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

=x Cah. 3.14: Verteilung i-j»^2 = x2j^ m i t x i - j = i ~ 1 für i=1>-..>5und x„. = j für j=1,2,3 der Zufallsvariablen X. und X-

(a) Bestimmen S i e (1) die Randverteilungen von X·, und X 2 , ( i i ) die d u r c h s c h n i t t l i c h e Anzahl von Kindern bzw. PKW pro Familie, ( i i i ) die Wahrscheinlichkeit, dass pro Familie genau zwei PKW gefahren und höchstens zwei Kinder zur Familie zählen, (b) Berechnen S i e die Kovarianz und die K o r r e l a t i o n zwischen XT und X 2 . (c) Sind X-, und X 2 s t o c h a s t i s c h unabhängig?

( * ) AUFGABE 3.15 Für zwei Z u f a l l s v a r i a b l e n X 1 und X 2 s e i folgende gemeinsame Dichtefunktion gegeben: 1 f

XrX2

( x

x

i' 2

)

"

x

, falls

2 - X1 l x 2 + 2 ' o 1 x2 1 2

sonst

Berechnen S i e (a) die Randdichtefunktionen von Χ Ί bzw. X 2 , (b) die Kovarianz und die K o r r e l a t i o n zwischen X 1 und X 2 .

Kapitel 3: Zufallsvariablen und Verteilungen

45

(*) AUFGABE 5.16 Bei einer Ampelanlage sind für das Rotlichtslgnal zwei Glühbirnen eingebaut. Fällt die erste Birne wegen Defekts aus, wird automatisch auf die zweite Glühbirne umgeschaltet, Die Lebensdauern X 1 und X 2 (in Tagen) der beiden Glühbirnen seien unabhängig verteilt mit den bekannten Dichtefunktionen

0

sonst

(a) Bestimmen Sie die Verteilung der Lebensdauer des Rotlichtsignals bzw, der Gesamtlebensdauer der beiden Glühbirnen, (b) Wie gross sind Erwartungswert und Varianz der Gesamtlebensdauer?

(*) AUFGABE 5,17 (a) Der Umsatz U, den die ALKO - Brauerei pro Monat mit einer Biersorte erzielt, lässt sich aus der abgesetzten Menge X·, und dem PreisX 2 bestimmen, über die Verteilungen von X, und X 2 weiss man, dass E(X.,) = 3 6 0 hl , E(X 2 ) = 3 0 0 DM/hl und Var(X,) =46.24 hl 2 , Var(X 2 ) =56.25 DM z /hI 2 gilt.Bekannt ist auch die Kovarianz zwischen Menge und Preis; sie liegt bei Cov(X 1 ,X 2 ) =30.60 DM *hl. Berechnen Sie Erwartungswert und Varianz des Umsatzes U = X 1 · Χ 2 . (b) über eine von der HOL -Brauerei vertriebene Biersorte weiss man, dass der Umsatz Y 1 verteilt ist mit Erwartungswert E(Y 1 ) = 224 000DM und vartY,) = 9 M i l l . DM 2 und die abgesetzte Biermenge Y 2 einer Verteilung mit E(Y 2 ) = 5 2 0 hl und Var(Y 2 ) =70.56 hl 2 unterliegt. Ausserdem 1st bekannt, dass zwischen diesen Zufallsvariablen eine Kovarianz von Cov(Y 1 ,Y 2 ) = 20 160 DM -hl besteht. Berechnen Sie Erwartungswert und Varianz des Preises P = Y 1 / Y 2 .

(*)

Die mit (*) gekennzeichneten Aufgaben können wegen ihres Schwierigkeitsgrades von mathematisch weniger Geübten übergangen werden. Es empfiehlt sich jedoch, die Erklärteile in den Lösungen dieser Aufgaben anzuschauen.

Kapitel 3: Zufallsvariablen und Verteilungen

47

LÖSUNG ZU AUFGABE 5.1 Ausgehend von einem (mitunter fiktiven) Zufallsexperiment und dem zugehörigen Grundraum Ω versteht man unter einer Zufallsvariablen X eine Abbildung von Ω in die reellen Zahlen derart, daß für die durch X beschreibbaren Ereignisse Wahrscheinlichkeiten angebbar sind. Den Funktionswert x, den eine Zufallsvariable X annimmt, nennt man auch Realisation oder Ausprägung von X. Mit Hilfe einer Zufallsvariablen X lassen sich Ereignisse des Grundraums beschreiben - wenn nicht direkt durch einzelne reelle Zahlen, dann durch Angabe von Intervallen bzw. allgemeineren Mengen reeller Zahlen, in denen Realisationen von X liegen. Durch die Identifizierung eines Ereignisses mit einer Menge reeller Zahlen sowie mit den Axiomen der Wahrscheinlichkeitsrechnung, vgl. Aufgabe 1.2,läßt sich nun die Wahrscheinlichkeit, daß eine Zufallsvariable Werte aus dieser Menge annimmt, angeben. Betrachtet man die Gesamtheit aller Wahrscheinlichkeiten, so spricht man auch von der Wahrscheinlichkeitsverteilung von X. Eine zentrale Bedeutung erhält dabei die Funktion F x (t) = P(X 1) = P(X>2) = P(X=2) + P(X=3) + P(X=4) = f + = 1-P(X3) = 1 - (P(X=3) + P ( X = 4 ) ) = 1 [=P(X4

57

58

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

LÖSUNG

ZU

-•(a)

AUFGABE

3.5

Durch I n t e g r a t i o n fu(u)

der

Dichtefunktion

= 7.5 · 10"4

\/ü - 0 . 3 7 5 · 1 0 " 4 u

berechnet sich die V e r t e i l u n g s f u n k t i o n satzes

(vgl. Aufgabe 3.2) des t ä g l i c h e n

Um-

U des T a n t e - Emma - L a d e n s f ü r 0 < t < 4 0 0 z u

Fu(t)

=

|

fyU)

άζ

= |

(7.5-

1 0 " 4 ν'ζ - 0 . 3 7 5 · 1 θ " 4 ζ )

,-4 2 „ 7 5· 1 0 " . ς ' - 0.375 ·

= 5 · 10 Insgesamt i s t

-4

1 0 -

4

. 1 . ζ

2

άζ

]

7 -4 2 · r - 0 . 1 8 7 5 · 10 . t

also t< 0

F

U

5· 1 0 " 4 . t

( t )

7

- 0.1875·

10~4·

t2

t > 400

1 In A b b .

£3.5.1

und A b b . £ 3 . 5 . 2 w i r d d e r V e r l a u f d e r D i c h t e f u n k t i o n

Verteilungsfunktion

Abh.

£3.5.1:

f ü r 0 < t < 400

graphisch

veranschaulicht.

D i c h t e f u n k t i o n f . , des t ä g l i c h e n U m s a t z e s U

und

der

Kapitel 3: Zufallsvariablen und Verteilungen

Abb. £3.5.2: Verteilungsfunktion F^ des täglichen Umsatzes U

-•(b) Unter Zuhilfenahme der im Aufgabenteil (a) berechneten Verteilungsfunktion

erhält man für die Wahrscheinlichkeit ( v g l . A u f g a b e 3 . 2 ) , daß der

Umsatz pro Tag (i)

mindestens 200 DM beträgt, P(U > 200) = 1 - P(U < 200) = 1 - F ^ O O ) 3 = 1 - ( 5 · 10" 4 · (200) 7 - 0.1875 · 10~ 4 · (200) 2 ^ = 1 - 0.6642 = 0.3358

(ii)

;

zwischen 100 DM und 300 DM liegt, P( 100 < U < 300) = F u (300) - F(J(100) 3 4

= 5 · 10* . ( 3 0 0 ) 7 - 0.1875 · 10~ 4 · (300) 2 3 4

- ^ 5 · 1 0 " . (100) 7 - 0.1875 · 1 0 ~ 4 · (100) 2 ) = 0.9106 - 0.3125 = 0.5981

;

59

60

(iii)

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

genau 150 DM b e t r ä g t , P(U = 150) = P( 150 < U < 150) = F..(150) - F . . ( 1 5 0 ) = 0

LÖSUNG ZU A U F G A B E

.

5.6

Die Wahrscheinlichkeitsverteilung einer Zufallsvariablen X läßt sich durch bestimmte Kenngrößen wie Lage- und Streuungsparameter charakterisieren. Als wichtigster Lageparameter ist dabei zunächst der Erwartungswert (Mittelwert) einer Verteilung zu nennen. Dieser ist (falls er existiert) gegeben durch l Χ.·Ρ(Χ=χ.) 1 i=l 1

X diskret verteilt

E(X) = μ =

, falls χ · f(x) dx

X stetig verteilt

[Dabei existiert E(X) , wenn obige Reihe absolut konvergiert bzw.. das Integral über |x| · f(x) existiert.] Betrachtet man die Zufallsvariable X mit E(X) = μ sowie eine weitere zufällige Größe Y = a X + b , wobei a und b konstante Zahlen sind, so gilt für den Erwartungswert von Y Ε(Y) = E(aX +b) = a E(X) + b = a· μ + b

.

Unter den Streuungsparametern zählt die Varianz (bzw. die Standardabweichung) 2

zu den wichtigsten. Die Varianz einer Zufallsvariablen X ist (falls E(X ) existiert) gegeben durch Var(X) = α

2

2 = Ε (X - Ε (Χ)) 2

Die Quadratwurzel aus der Varianz σ

nennt man auch Standardabweichung σ.

Die Berechnung der Varianz einer Verteilung vereinfacht sich bei Anwendung des Verschiebungssatzes von Steiner. Dieser besagt Var(X) = E(X2) - (Ε(X))2

Ε (X

bzw.

2 2 y χ . ·Ρ (X = χ .) - μ 1 i=l Var (X) =

Χ diskret verteilt , falls

χ

2

2 · f (χ) dx - μ

X stetig verteilt

Kapitel 3: Zufallsvariablen und Verteilungen

Bei einer linearen Transformation Y = aX + b der Zufallsvariablen X (a, b 2 für die Varianz von Y

Konstante) erhält man mit Var(X) =σ

2 2 2 = a Var(X) = a σ

Var(Y) = V a r ( a X + b )

V = σ/μ, μ > 0 , ist ein relatives Streuungsmaß,

Der Variationskoeffizient

sinnvoll nur für nichtnegative

Zufallsvariablen. 2

Ist X eine Zufallsvariable mit Erwartungswert μ und Varianz σ

> 0 , so gilt

für die sogenannte standardisierte Zufallsvariable γ

=

X -E(X)

=

Χ -μ 0

Vvar(X) gerade Ε(Y) = 0

und

Var(Y) = 1

->(a) Der Erwartungswert bzw. die Varianz der z u f ä l l i g e n Länge X der K e i l riemen

l ä ß t s i c h mit den in t a b . £3.6.1 zusammengestellten Hilfsgrößen

l e i c h t bestimmen. t a b . C3.6.1: A r b e i t s t a b e l l e zur Berechnung von E(X) und Var(X) 1

2

3

4

5

8.8

8.9

9.0

9.1

9.2

P(X = x i )

0.050

0.150

0.575

0.200

0.025

x i · P(X =χ η ·)

0.440

1.335

5.175

1.820

0.230

x? · P(X = x i )

3.8720

11.8815

46.5750

i x

i

16 . 56 2 0

2.1160

Es e r g i b t s i c h E(X) =

l x . · P(X=x.) 1 i=1 1

= 0.440 + 1 .335 + 5.175 + 1 .820 + 0.230

bzw. Var(X) =

l

χ?·Ρ(Χ=χ.) -(E(X))2

i=1

= 3.8720 + 11 .8815 + 46.5750 + 16.5620 + 2.1160 - 9 2 = 81 .0065 - 81 = 0.0065

.

61

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

62

->(b) Unter Verwendung der Ergebnisse aus Aufgabenteil (a) erhält man f ü r die (i)

linear transformierte Zufallsvariable Y = X - 9 E( Y) = E(X - 9 ) = E(X) - 9 = 9 - 9 = 0 Var(Y) = Var(X - 9) = Var(X) = 0.0065

, ;

( i i ) standardisierte Zufallsvariable Υ

Ζ =

X -9

=

\/ 0.0065

X - E(X)

=

V 0.0065

\/Var(X)

gerade E(Z) = 0

,

Var(Z) = 1

.

LÖSUNG ZU AUFGABE 5 . 7 Der Umsatz U, den der Tante - Emma - Laden pro Tag e r z i e l t , i s t stetig vert e i l t mit Dichte f y i u ) = 7.5- 10" 4 νΙΓ - 0.375 · 10~ 4 u

für 0 < u < 400

.

Der Kaufmann e r z i e l t einen mittleren (erwarteten, durchschnittlichen) Tagesumsatz (vgl. Aufgabe 3 . 6 ) in Höhe von DM 400

CO

0

— oo

400

3

l· 0

5

400

0.375 · 10~4 · j u 3

3 · 10

-4

960 - 800 160

.

5 (400)^ - 0.125· 1 0 " 4 · (400)

0 3

Kapitel 3: Zufallsvariablen und Verteilungen

Mit » E(U 2 ) =

400 2

J u

^ )

du = J u 2 ( 7 . 5 · 1 0 " % ü - 0.375 · 10~ 4 u) du

-o°

0

400

5

J (7.5· 10~4u?

=

- 0.375 · 1 0 " 4 u 3 ) du

0 =

Γ

-4 2 7 -4 1 41 7.5 · 1 0 ^ · j · u - 0.375 «10 * · | · u M

400

7 10" 4 · ( 4 0 0 ) 7 - 0.375 · 10" 4 · | · ( 4 0 0 ) 4

=

= 34285.7143 und dem Verschiebungssatz (vgl. Aufgabe 3.6) l i e g t die Varianz der Umsatzverteilung bei Var(U) = E(U 2 ) - ( E ( U ) ) 2 = 34285.7143 - 160 2 = 8685.7143

LÖSUNG ZU AUFGABE

.

3.8

-»(a) Als Erwartungswert (vgl. Aufgabe 3.6) der stetigen Zufallsvariablen X mit Dichtefunktion

fx(x)

1 8 x

, 0(aii) Der Erwartungswert (vgl. Aufgabe 3.6) der diskreten Zufall svariablen X^ s 'Anzahl der Kinder pro Familie' berechnet sich unter Verwendung der Werte aus Tab. L3.14.2 zu E(Xl)

»Ix^Ptvv

=

j / n - P i .

= 0 · 0.40 + 1 · 0.30 + 2 · 0 . 1 5 + 3 · 0.10 + 4 · 0.05 = 1.10

.

Ebenso erhält man, daß in dieser Stadt im Durchschnitt

E(X Z ) = j =i x 2 j - P ( x 2 = x 2 j )

= j =i x e j - p . j

= 1 · 0.35 + 2 · 0.51 + 3 · 0.14 = 1.79 PKW pro Familie unterhalten werden.

-»(aiii) Gesucht ist die Wahrscheinlichkeit für X ^ 2 sich mit den Werten aus Tab. L3.14.2

und X 2 = 2 ; es ergibt

77

Kapitel 3: Zufallsvariablen und Verteilungen

P(X1 < 2 , X 2 = 2)

= P(X1 = 0 , X 2 = 2 ) + P ( X 1 = 1 ,X2 = 2 ) + P ( X , = 2 , X 2 = 2) = P12

P22

+

= 0.47

-»(b)

Die Charakterisierung

tors

(Xj,Χ^)

erfolgt

ist;

X^ d a r .

der V e r t e i l u n g

Es g i l t

+ 0 - 1 4 +

0 - 0 5

eines zweidimensionalen

Zufallsvek-

die

durch

= Ε [ ( X l - E(X ) ) ( X 2 - E ( X 2 ) ) ]

sie existiert,

stellt

0 - 2 8

.

über d i e K o v a r i a n z ,

Cov(X1#X2)

Kovarianz

=

außer ü b e r Kenngrößen w i e E r w a r t u n g s w e r t und V a r i a n z

der Randverteilungen

gegeben

+ p32

wenn d i e e i n z e l n e n V a r i a n z e n

e i n e Maßzahl f ü r den l i n e a r e n

existieren.

Die

Zusammenhang z w i s c h e n X^ und

stets

Cov(XlfX2)

= EtXj · X2) - E i X j ) · E(X2)

H ä u f i g v e r w e n d e t man a l l e r d i n g s Cov(X p =p

statt

.

der Kovarianz d i e normierte

,X )

=

mit

12

Var(X)^0

,

Var(X

) +0

y v a r t X j ) -Var(X2)

a l s l i n e a r e s Zusammenhangsmaß z w i s c h e n X^ und X 2 . Korrelation bezeichnet wird,

läßt eine bessere

Zusammenhangs z w i s c h e n den b e i d e n - 1< p< 1

Kovarianz

D i e s e s Maß, das auch

Interpretation

Zufallsvariablen

als

des Grades

z u , denn e s g i l t

des

stets

.

Ist Cov(X1,X2) so h e i ß e n X^ und X 2

= 0

bzw.

Ρχ x 2

( X j ,X 2 >

'

0

unkorreliert.

B e t r a c h t e n w i r w i e d e r den s p e z i e l l e n größe

=

diskret v e r t e i l t

Fall,

daß d i e

e n d l i c h v i e l e n Ausprägungspaaren d i e Kovarianz

,X2)

=

k

l

I 1=1

l

k =

berechnen.

x

Zufalls-

Bei

nur

j = l , l ä ß t

sich

durch

l i

=
Ο

Μ )

-

I fx (Χ,ϊ· fx (z-x,)

•I

Λ ee " 5 5 Έϋ

1

V

1 25ÖÜ

0 e

1 „ ζ 5T

1 , 25M ζ · e

-ot

1 2

-*^ I[0.-)(z"X1)dX1

Γ/5ϋΧ1 "ά J e

1 i m

dx,

( ζ

"

χ

1

) T

" [ο,ζ]

,w , H v ι dxi

dx

5U

womit d i e V e r t e i l u n g von Ζ bestimmt

ist.

-•(b) Für beliebige Zufallsvariablen X, ,X mit E(X.) = μ., i = l, I n I i sich der Erwartungswert der Summe X^ + ... + x n durch

Ϊ i=l

x. ]

=

,n, läßt

l E(X ) = l μ i=l i=l

bestimmen . Ist weiterhin Var (X .) = Ο . und Cov(X . ,X .) = σ . .,i,j=l,...,n 1 1 ι j 1] Aufgabe 3.14) , so erhält man für die Varianz von X. + ... +X 1 η

Var

I X. U=1 ^

=

l Var (X.) + 2 J Cov(X.,X.) = l 0. + 2 £ 1 1 3 i=l i 3 ) = 1 - P(X < 3 ) = 1 - P ( X < 2 ) - P(X = 3 )

" (?XV) IST

1 - 0.9057 - -

450450

= °·0943

-

M S W

= 0.0118 mehr a l s d r e i

(d) mit

Hauptgewinne,

Wahrscheinlichkeit

P i * - 11 - ( 1 1 5 ) f i 5 ) - 2234925 . P(X

genau e i n e n

-

υ

-

^

- 5461512 "

0

... '4092

Hauptgewinn.

LÖSUNG ZU A U F G A B E

4.5

Eine d i s k r e t e Z u f a l l s v a r i a b l e X h e i ß t p o i s s o n v e r t e i l t m i t Parameter λ Χ^Ρο(λ)),

wenn d i e z u g e h ö r i g e n E i n z e l w a h r s c h e i n l i c h k e i t e n

p(x=k)

=

Ak k!

•—~

e



(kurz:

durch

f ü r k=0 , 1 , 2 , . . .

gegeben s i n d . Im Gegensatz zu b i n o m i a l - oder h y p e r g e o m e t r i s c h v e r t e i l t e n fallsvariablen

l i e g e n i n diesem F a l l a l s o p r i n z i p i e l l

abzählbar

Zu-

unendlich

109

Kapitel 4: Spezielle Verteilungen und Grenzwertsätze

viele mögliche Ausprägungen vor. Die Verteilungsfunktion einer poissonverteilten zufälligen Größe X erhält man dann natürlich durch F (t) = X

£ P(X = k) k:k 0.2) = 1 - F x ( 0 . 2 ) = 1 - 1 + e " 2 " ° · 2 = e" = 0.6703

0,4

.

->(c) Den Erwartungswert der exponential v e r t e i l ten Reparaturzeit X e r h ä l t man durch p a r t i e l l e s I n t e g r i e r e n , wie nachfolgend angegeben:

114

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

-2x E(X) =

| x · f ( x ) dx = | 2 x e -oo

dx

0 CO

= 2 Γ χ (-0.5) e "

2x

- 2 f ( - 0 . 5 ) e' 2 x d x

] J

L

J

°

o

OO

= 0 + (j e e-

2 x

d dx x = [|- -00..55. · ee- 2 x ] ° °

0 = 0.5

.

Der Techniker b e n ö t i g t a l s o im D u r c h s c h n i t t eine halbe Stunde, um eine Mas c h i n e zu r e p a r i e r e n . Mit OO

2

E(X ) =

J

oo

x

2

· f ( x ) dx = | 2 x 2 e ~ 2 x dx

-oo

0 CO

= 2Γχ

2

(-0.5) e~

2x

- 2 f 2 x ( - 0 . 5 ) e ~ 2 x dx

l J

1

°

J

o

00 = 0 + 1 2 χ e " 2 x dx = 0 + E(X) = 0 . 5 0 l i e g t d i e Varianz der Z e i t , d i e zur Reparatur e i n e r Maschine aufgewendet w i r d , bei V a r ( X ) = E ( X 2 ) - ( E ( X ) ) 2 = 0.5 - 0 . 5 2 = 0.25 Stunden 2

Für e i n e Ex (λ) - v e r t e i l t e Z u f a l l s v a r i a b l e X g i l t E(X) = i Var(X) = - ί λ

LÖSUNG ZU A U F G A B E

.

allgemein

und .

4.8

2 Eine Z u f a l l s v a r i a b l e X h e i ß t n o r m a l v e r t e i l t mit Parametern μ und CT (kurz: 2 Χ ^ Ν ( μ , σ ) ) , wenn s i e e i n e D i c h t e f u n k t i o n

Kapitel 4: Spezielle Verteilungen und Grenzwertsätze

(χ-μ)

1

f (x) = —

e

2

2σ 2

~

115

für alle reellen Zahlen χ

\J2π · σ

besitzt. Die Normalverteilung, die für die induktive Statistik von großer Bedeutung ist, ist durch die beiden Parameter, Erwartungswert und Varianz, Ε (X) = μ

,

Var(X) = σ

2

eindeutig festgelegt. Da sich die Werte der zugehörigen Verteilungsfunktion

- (χ-μ)2

t F i t )

=

2

f e V 2 i σ —>oo

°2

dx

nicht elementar berechnen lassen, geht man über zur standardisierten Zufallsvariablen (vgl. Aufgabe 3.6) „ _ X — Ε(X)

_ Χ-μ

" ~ Vvar(X)

0

1

Ζ

die der sogenannten Standardnormalverteilung N(0,1) unterliegt. Über die Dichte der Ν (0,1) - Verteilung

1

f (z) = Z

e

2 ζ ~ ~~2

= φ(ζ)

\/2 7T

bzw. die zugehörige Verteilungsfunktion ζ F 2 (z) =

I ψ(ς) άζ = φ(ζ) — 00

2

lassen sich die Dichte und die Verteilungsfunktion einer Ν(μ,α ) -verteilten Zufallsvariablen X durch

ausdrücken. Die Funktion Φ(ζ) ist in Tab. 1 des Anhangs für einige positive ζ vertafelt. Für negative Zahlen ζ erhält man die Verteilungsfunktionswerte aus der Symmetrie-

Beziehung:

φ(-ζ) = 1 - φ(ζ) Allgemein gilt auch, daß die Zufallsvariable Y = aX + b a und b konstante Zahlen (a ^0) ,

2 2

σ ) - verteilt ist, wenn X eine

116

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

2

Ν(μ,σ ) - Verteilung besitzt.

Die Niederschlagsmenge X wird als normal verteilt mit Erwartungswert μ = 75 mm und Varianz (bzw. Standardabweichung) σ

2

= 25 mm

2

.

(bzw. a=

\/Z5 = 5 mm)

angenommen, über die standardisierte Zufallsvariable 7 =

x

-M σ

=

X - 75 5

und mit Hilfe der Tab. 1 aus dem Anhang lassen sich die gesuchten Wahrscheinlichkeiten ermitteln. So fallen (a) höchstens 70mm

Niederschlag mit Wahrscheinlichkeit

p(x < 70) = p p-^Z-L
77) = 1 - P(X < 77) = 1 - Ρ

~g75
7 ; 0

99

= 1/8.451 =0.1183

127

Kapitel 4: Spezielle Verteilungen und Grenzwertsätze

->(b,i) Die Quantile ξ α einer diskreten Zufallsvariablen X (vgl. Aufgabe 3.8) ergeben sich mit Hilfe der zugehörigen Verteilungsfunktion durch folgende Beziehung: Ρχ(ξα) > α

und

^(t)


0.95 = a

und

F x ( 2 ) = PCX < 2) = 0.1681 + 0.3602 + 0.3087 = 0 . 8 3 7 0 < 0.95 F x ( t ) < 0.95 = a

, d.h.

für alle t < 3

gerade ξ

0.95

= 3

·

In A b b . C4.12.1 sind die Quantile graphisch

Q5

und

g5

der B(5;0.3) - Verteilung

veranschaulicht.

-.(b,ii) Die Quantile ξ α einer (stetig) Ex(5) - verteilten Zufallsgröße X (vgl. Aufgabe 3.8, Aufgabe 4.7) ergeben sich mittels der inversen tion F x 1 d u r c h F ' ^ a ) = ξ . Mit Fx(t)

= 1 -e"5t

für t > 0

,

Verteilungsfunk-

128

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

Fx(t)

0.5

p

=0

,

,

1

,

,

1

2

3

U

5

f

Abb. C 4 . 1 2 . 1 : Q u a n t i l e ζ β

Q5

und

g5

=3

der B ( 5 ; 0 . 3 ) - V e r t e i l u n g

und wegen y = 1 - e"5t

ist

«

e"5t = 1 - y

»

t = --jhnd -y)

«

-5t = l n ( 1 - y )

also F-1(y)

= -^ln(l-y)

ξa = -b 1 in(1 -α)

bzw.

.

Für α = 0.05 berechnet s i c h das 0 . 0 5 - Q u a n t i l ς0

05

= F^(0.05)

= - ^ 1 n( 1 - 0 . 0 5 )

zu = 0.0103

bzw. f ü r α = 0.95 e r h ä l t man, v g l . Abb. C 4 . 1 2 . 2 , ξ0

95

= F^'(0.95)

= - - j l n d - 0.95) = 0.5991

.

t

Kapitel 4: Spezielle Verteilungen und Grenzwertsätze

|0.6

£

f

=0.0103

129

0.8

=0.5991 0.95

0.05

Abb. C4.12.2: QuantileCQ gg und Cg gg einer Ex(5) - Verteilung

->(b,iii) Die α - Quantile einer Ν(μ,σ ) - verteilten Zufallsvariablen, die allgemein mit w bezeichnet werden, lassen sich aus den Ouantilen u der Stanα α dardnormalverteilung ermitteln, denn es gilt

(vgl. Aufgabe 4.9).

In Aufgabe 4.9 wurden die hier gesuchten Quantile w Q g 5 und Wg

g5

der N(3,4)-

Verteilung bereits explizit berechnet. Es ergibt sich mit σ = \ Λ ~ ϊ = 2 , Ug g^ = -u0-95

= - 1 .6449, u 0 > 9 5 = 1 .6449 w

0.05 =

w

0 95

2

'u0.05+3

= - 2 · 1 - ^ 4 9 . 3 = - 0.2898

und =

2

* U 0 95 +

3

= 2

*1 -6449

+ 3

= 6.2898

130

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

LÖSUNG ZU A U F G A B E

4,15

Der Zentrale Grenzwertsatz, der die große Bedeutung der Noimialverteilung in der induktiven Statistik unterstreicht, liefert eine Aussage über die Verteilung der Summe V) X. = X. + ... +X . , 1 1 η

1=1

= X η

von η unabhängigen, identisch verteilten Zufallsvariablen X^ mit E(X ± ) = μ

,

VariXJ

= σ

2

, i=l,... ,n

,

bei wachsendem n. Mit (vgl. Aufgabe 3.16) n * f n \ E(X ) = Ε ( Υ X. ) = Τ E(X.) = η · μ 1 Vil V i=l

,

* / " \ " 2 Var(Χ ) = Var I y X. = V Var(X.) = η · σ V=1 V i=l und der standardisierten Zufallsvariablen (vgl. Aufgabe 3.6)

X* n η — E(X*)

y n

.SXi-n'

y7 V ar(X n )

3) = 1 - P( Y < 3) = 1 - P(Y = 0 ) - P(Y =1 ) - P ( Y = 2) . ~

3° ~ TJT

-3

31 "TT

-3

32 "7Γ

-3

= 1 - 0.0498 - 0.1494 - 0.2240 = 1 - 0.4232 = 0.5768 mindestens 3 Einwohner am 1.1. ihren Geburtstag feiern. (Die exakte Wahrscheinlichkeit liegt bei 0.5772.)

133

Kapitel 4: Spezielle Verteilungen und Grenz wertsatze

LÖSUNG ZU AUFGABE Die

4.15

Zufallsvariablen , falls

0

i - t e r Knopf keinen Defekt i - t e r Knopf einen Defekt

aufweist

,

sind mit P ( X i =1) = 0.88 = ρ

und

P ( X i = 0) = 0.12 = 1 - p f ü r i = 1 , . . . , n unabhängig B(1,p) - v e r t e i l t (vgl. Aufgabe 4 . 2 ) .

-»(a) Bei η = 4500 g e l i e f e r t e n Knöpfen i s t a l s o die Z u f a l l s v a r i a b l e X =

4500 £ X. = 'Anzahl der Knöpfe, die unter 4500 keinen Defekt i=1 1 aufweisen'

B(4500,0.88) - v e r t e i l t . Aufgrund der Tatsache, daß np( 1 - p) = 4500 · 0.88 · 0.12 = 475.2>9 (vgl. Aufgabe 4.14) g i l t , i s t eine Approximation der Binomialverteilung nach dem Zentralen Grenzwertsatz (vgl. Aufgabe 4.13) durch eine Normal Verteilung g e r e c h t f e r t i g t , über die s t a n d a r d i s i e r t e Z u f a l l s v a r i a b l e (vgl. Aufgabe 4 . 2 ) Ζ = X - E(X) \/ Var(X)

=

X -np Vnp{ 1-pJ

X - 4500 · 0.88

X - 3960

\/4500 · 0.88 · 0.12

4000) = 1 - P(X < 4000) = 1 - P

4000 - 3960\

-•(b) Gesucht wird eine Zahl n, so daß f ü r

gilt P(X* > 4500) = 0.95

,

*

wobei die Z u f a l l s v a r i a b l e Xη n B(n,0.88) - v e r t e i l t i s t . Bei Anwendung des Zent r a l e n Grenzwertsatzes f ü r

134

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

Υ _ η

X*-E(XJ X* - η · 0.88 X * - 0.88n η η _ η _ η ' 7*7 \/η · 0.88 · 0.12 0.3250 · ν^η /varöy

ergibt sich Ρ ( Χ * > 4500) = 1 - Ρ(Χ*< 4500) = 1 - Ρ ( Υ < 4 5 0 0 ' Ο · 8 8 " ) η η " ^ η " 0.3250· \Jn' ~ 1 - φ ί 4 5 0 0 - 0.88η\ ^ 0.3250· V η ' Die Anzahl der zu ordernden Knöpfe η läßt sich demnach durch Auflösen der Gleichung /4500 - 0.88n\

=

^



φ /4500

^ 0.3250 ·\/η '

- 0.88n\

=

Q>05

^ 0.3250 · Vn '

nach η annähernd bestimmen. Mit 4500 - 0.88n -1,n ntn „ — — — — = Φ (0.05) = u0

05

_ „ - -u0

. , ΚΔΔ0 - - 1 .6449

95

0.3250· s/w erhält man die Gleichung 4500 - 0.88n = - 1.6449 · 0.3250 \/n

«

0.5346 \/η - 0.88n + 4500 = 0

bzw. mit t = + \Λι 0 . 5 3 4 6 t - 0 . 8 8 t 2 +4500 = 0

«

t2 - " q ^

6

t -^gg- = 0

.

Als Lösung dieser quadratischen Gleichung ergibt sich mit t > 0 . _ 0.5346 1

=

x

/4500 .

2 - 0.88 * J j H B B

+

0.5346 2 {i,

_

71

= 71

0>88Ü

·8141

'

und somit gerade η = t 2 = 71.8141 2 = 5157.2650

.

Um die geforderte Sicherheit einhalten zu können, müssen also mindestens 5158 Knöpfe bestellt werden.

Kapitel 5: Punktschätzer, Konfidenz- und Prognoseintervalle AUFGABE 5.1 Die Verbraucherzentrale einer Stadt untersucht eine Stichprobe von 10 runden Vollkornbrötchen einer Backerei hinsichtlich Breite X und Gewicht Y. Die Messergebnisse sind In tab. 5.1 festgehalten. Cab.

5.1.: Breite x. und Gewicht y., i=1,...,10, von 10 Brötchen 1

2

11.0

12.1

10.9

11.4

11.7

11.2

12.0

11.5

11.6

11.6

52.0

53.4

49.6

51.0

52.6

51.9

53.2

52.4

52.3

52.6

Brötchen i Breite x^

3

4

5

6

7

8

9

10

(in cm) Gewicht y^ (in g)

(a) Schätzen lung der bzw. die Sie, dass delt.

Sie Erwartungswert μ χ bzw. Varianz der VerteiBrötchenbreite X durch das arithmetische Mittel empirische Varianz der Stichprobenwerte und zeigen es sich dabei um erwartungstreue Schätzungen han-

(b) Geben Sie einen Schatzwert für den Median ξ 0 5 sowie für den Quartllsabstand s 0 - 7 5 - ξ 0 - 2 5 der Verteilung der Brötchenbreite X an. (c) Schätzen Sie die Korrelation P x y zwischen Breite X und Gewicht Y der Brötchen.

136

Teil I: Übungsaufgaben.

Erläuterungen

und

Lösungen

AUFGABE 5.2 In einem Betrieb werden u.a. grüne Bohnen in Dosen a b g e f ü l l t . Bei einer z u f ä l l i g e n Stichprobe von 25 Dosen wurden folgende Abfüllgewichte in g e r m i t t e l t : 173 , 176 , 172 , 176 , 175 , 174 , 172 , 173 , 174 , 172 , 178 , 176 , 177 , 175 , 176 , 173 , 172 , 175 , 173 , 174 , 177 , 176 , 174 , 174 . DieAbfüllanlage a r b e i t e t laut Herstellerangabe mit einer S t a n dardabweichung von 4 g . Es wird angenommen, dass es s i c h bei den ermittelten Werten um Realisationen einer normalverteilten Z u f a l l s g r ö s s e handelt. (a) Bestimmen S i e einen Schätzer f ü r das d u r c h s c h n i t t l i c h e Abf ü l l g e w i c h t μ. (b) Geben S i e ein K o n f i d e n z i n t e r v a l l zum Niveau 0.95 f ü r das Durchschnittsgewicht an. (c) An drei weiteren Tagen ergeben Stichproben mit j e w e i l s η = 2 5 Dosen d u r c h s c h n i t t l i c h e Abfüllgewichte von 1 7 5 . 5 g , 1 7 4 . 8 g , 1 7 6 . 7 g . Geben S i e aufgrund dieser Beobachtungswerte jeweils ein K o n f i d e n z i n t e r v a l l zum Niveau 0.95 f ü r den Erwartungswert μ an. Veranschaulichen S i e s i c h diese Ergebnisse zusammen mit dem unter (b) ermittelten I n t e r v a l l g r a p h i s c h , wenn Sie zudem davon ausgehen können, dass der unbekannte Erwartungswert bei μ = 1 7 5 g l i e g t .

AUFGABE 5.5 Die d u r c h s c h n i t t l i c h e Länge von M e t a l l s t i f t e n s o l l geschätzt werden. Eine Stichprobe vom Umfang 36 l i e f e r t eine m i t t l e r e Länge von χ =38.5mm. Aus früheren Untersuchungen sei bekannt, dass die Länge der M e t a l l s t i f t e n o r m a l v e r t e i l t i s t und die p r o duzierende Maschine mit einer Standardabweichung von σ^ = 1 . 6 mm arbeitet. (a) Geben Sie ein K o n f i d e n z i n t e r v a l l zum Niveau 0.96 f ü r die erwartete M e t a l l s t i f t l ä n g e an. (b) Welchen Umfang muss eine Stichprobe haben, damit das K o n f i d e n z i n t e r v a l l zum Niveau 0.96 f ü r die m i t t l e r e S t i f t l ä n g e höchstens halb so b r e i t i s t wie das unter (a) berechnete?

Kapitel 5: Punktschätzer, Konfidenz- und Prognoseintervalle

137

(c) Mit welcher Wahrscheinlichkeit Uberdeckt das I n t e r v a l l [38.1mmj 38.9mm] die erwartete M e t a l l s t i f t l ä n g e ?

AUFGABE 5.4 Bei einer P r ü f s t e l l e des TüV wurde der CO - G e h a l t der Abgase von Kraftwagen, der näherungsweise a l s n o r m a l v e r t e i l t anzusehen i s t , gemessen. Bei einer Stichprobe von η = 3 0 Kraftwagen ergaben s i c h folgende Werte ( i n %): 3.0 , 3 . 1 , 3.0 , 3.4 , 3.3 , 3 . 1 , 3.3 , 3.2 , 3.6 , 3 . 0 , 3 . 1 , 3.5 , 3.0 , 3.0 , 3.4 , 3.0 , 3.6 , 3 . 1 , 3.2 , 3 . 5 , 3.4 , 3.0 , 3.2 , 3.3 , 3.0 , 3.5 , 3.3 , 3.4 , 3.0 , 3 . 1 . (a) Geben S i e Schätzer f ü r den d u r c h s c h n i t t l i c h e n CO - G e h a l t μ und f ü r die Varianz σ 2 an. (b) Berechnen S i e zum 90%, 95% bzw. 98% Niveau ein Konfidenzint e r v a l l f ü r μ bzw. σ 2 . (c) Berechnen Sie ein P r o g n o s e i n t e r v a l l mit Trefferwahrscheinl i c h k e i t 0.95 f ü r den d u r c h s c h n i t t l i c h e n CO - G e h a l t von fünf weiteren Kraftwagen.

AUFGABE 5.5 Bei einer Landtagswahl wurden von 5000 b e r e i t s ausgezählten Stimmzetteln 300 f ü r die OPPORTUNISTENPARTEI (OPD) r e g i s t r i e r t . (a) Schätzen S i e den prozentualen A n t e i l an Stimmen f ü r diese Partei bei der Landtagswahl, (b) Bestimmen S i e ein approximatives K o n f i d e n z i n t e r v a l l zum Niveau 0.99 f ü r den A n t e i l der Stimmen der OPD sowie f ü r den Stimmenanteil der übrigen Partelen bei der Landtagswahl.

138

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

AUFGABE 5.6 Die Produktionsabteilung eines Werkes überprüft die Qualltat eines seiner Produkte, da die Geschäftsleitung aus WerbegrUnden eine Gütegarantie an die Kunden weltergeben möchte. Zu diesem Zweck wurde eine Stichprobe vom Umfang 25 entnommen, bei der 6 Ausschussstücke auftraten. (a) Schätzen Sie die Wahrscheinlichkeit, dass ein Produktionsstück Ausschuss 1st. (b) Bestimmen Sie ein 90% -Konfidenzintervall für den Anteil fehlerhafter Stücke in der Gesamtproduktion.

AUFGABE 5.7 Die Lebensdauer X von Helmcomputern der Marke C0ME0N bis zur ersten Reparatur kann a l s exponentialverteilt mit Parameter λ angesehen werden. Eine Untersuchung von η =100 Computern dieser Marke ergab eine durchschnittliche Lebensdauer von χ = 2 Jahren. Geben Sie eine Schätzung für λ an und bestimmen Sie die Grenzen des Konfidenzintervalls fur λ zum Niveau 0.95.

AUFGABE 5.8 Ein Marktforschungsinstitut startet eine Untersuchung über den Bedarf an dem v ö l l i g neuartigen Toilettenpapier KISS unter den Verbrauchern. Von η =120 z u f ä l l i g ausgewählten Personen, die das neue Produkt kostenlos testen durften, gaben 54 an, dass sie KISS regelmässig kaufen würden. 30 würden sich in unregelmässigen Abständen beim Kauf für KISS entscheiden und a l l e übrigen lehnten KISS ab. Schätzen S i e d l e Wahrscheinlichkeiten p.,, p 2 bzw. p 3 , dass KISS regelmässig, unregelmässig bzw. nicht gekauft wird,und geben Sie ausserdem simultane 0.9 - Konfldenzlntervalle für die Parameter p.,, p 2 und p 3 an.

139

Kapitel 5: Punktschätzer, Konfidenz- und Prognoseintervalle

LÖSUNG

5.1

ZU A U F G A B E

Wird e i n Parameter

(bzw. e i n e Kenngröße)

θ der Verteilung

einer

Zufallsvari-

a b l e n X m i t einem e i n z i g e n W e r t θ aus η Beobachtungen von X , d . h . Stichprobe

xj,...,x

n

,

geschätzt,

s o s p r i c h t man v o n e i n e r

f ü r Θ. Im f o l g e n d e n s o l l e n nun d i e S t i c h p r o b e n w e r t e χ ^ , . , . , χ ^ onen u n a b h ä n g i g e r ,

identisch v e r t e i l t e r

v a r i a b l e n X , • · . ,Χ

aus d e r

Punktschätzung als

Realisati-

(gemäß d e r V e r t e i l u n g von X)

Zufalls-

a u f g e f a ß t w e r d e n . Dann h e i ß t e i n e F u n k t i o n Θ ( Χ . , . · · , Χ

I n S c h ä t z f u n k t i o n und d i e

I

Λ

) n

z u g e h ö r i g e R e a l i s a t i o n θ ( χ , , . . . , χ ) S c h ä t z w e r t f ü r Θ. 1 η S c h ä t z u n g h ä n g t a l s o von den Z u f a l l s v a r i a b l e n X . , . . . , X 1 η ein z u f ä l l i g e s Ergebnis d a r .

Eine s t a t i s t i s c h e ab;

sie

stellt

Eine Forderung, lautet,

daß s i e

meter θ l i e f e r n Ε ( θ (X verlangt.

-»(a)

Die

1

d i e an e i n e

d.h. es

,Χ ) ) η

W e r t f ü r den unbekannten

Para-

= θ E i g e n s c h a f t nennt man

erwartungstreu.

Schätzfunktion

mit der

1 n = I Χ. = Χ η .u, ι ι =1

Realisation

,χ ) η

1 = — η

dem a r i t h m e t i s c h e n

einen Schätzwert teilung

werden k a n n ,

wird

Eine S c h ä t z f u n k t i o n mit d i e s e r

μ„ ( χ , , — X I d.h.

Schätzfunktion g e s t e l l t

im D u r c h s c h n i t t den r i c h t i g e n soll,

μ „ (X, , . . . ,Χ ) X I η liefert

sinnvolle

n

.Τu , ι=1

χ. = χ ι

Mittel

,

der Stichprobenwerte

(Stichprobenmittelwert),

f ü r den E r w a r t u n g s w e r t E ( X ) = ( v g l .

einer Zufallsvariablen

Aufgabe 3.6)

der

Ver-

X. 2

Die Varianz e i n e r Z u f a l l s v a r i a b l e n

X, Var(X) = σ χ

( v g l . Aufgabe 3 . 6 ) ,

wird

mittels S2(X, X I durch d i e

X ) η

empirische Varianz

2, n σ χ(χι

V

geschätzt. Natürlich empirische

= - L n-1

1

1

• s=r

I .'·. 1=1

(Χ. - X ) 2 χ

=

y X2 - n x 2 ) = η-1 V . . ι / Xx=l '

(Stichprobenvarianz)

? , Λ 2 l

ι =1

1

der

/ ν χι=1

x

2 x

Stichprobenwerte

2 i "

-2\ ) '

n x

s i n d dann d i e e m p i r i s c h e S t a n d a r d a b w e i c h u n g

Variationskoeffizient

s

2

und d e r

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

140

2 Ξχ = Js^

χ νχ = — X

bzw.

(für χ > 0)

Schätzwerte für die Standardabweichung σ χ b z w . für den Variationskoeffizienten V = σ χ / μ χ (für μ χ > 0 ) , vgl. Aufgabe 3.6.

Basierend auf η = 10 Stichprobenwerten χ, 2 '

x , n sollen Erwartungswert μ ν und 1U Λ

Varianz σ^ der Breite X der Vollkornbrötchen in der Bäckerei, über deren konkrete Verteilung keine Angaben vorliegen, geschätzt werden. Es ergibt sich 10

1 μχ(χΓ...,χ10)

= χ = jQ

1

J

x.j = y j (11.0 + 12.1 + ... + 11.6)

= YQ - 115 = 11.5

und

2

λ2 α

χ'χΓ"·,χ1θ'

=

s

x

10

τ

ο

, / 10

=

= g- (1323.88 - 10 · 11.5 2 ) = g-· 1 .38 = 0.1533

,

d.h. das arithmetische Mittel der Brötchenbreite liegt bei 1 1 . 5 c m 2 Varianz bei 0.1533 cm bzw. die Standardabweichung bei 0 . 3 9 1 5 c m . Fassen wir nun die gemessenen Werte

und die

wieder als Realisationen von

unabhängig identisch verteilten Zufallsvariablen Χ ^ , . , . , Χ ^ auf, für die gilt = σ χ = Var(X), so ergibt sich zunächst (vgl. A u f -

E(X.j) = μ χ = E(X), V a K X ^ gabe 3.16)

E

^V

X

1

X

10})

=

E(X)

1 =

=

E

(lö

10

TO

μ

II 1

χ = W ·

10μ

X

X

i )= π

χ

= μ

Χ

E(x

i}

»

d.h. X stellt eine erwartungstreue Schätzfunktion für den Erwartungswert der Brötchenbreite dar. Um zu zeigen, daß auch

2 die empirische Varianz s v eine erwartungstreue Schät-

2 zung für die Varianz σ^ der Brötchenbreite liefert, werden vorab zwei in die Berechnungen σ und somit

2

eingehende Erwartungswerte ermittelt. Es gilt (vgl. Aufgabe 3.6)

= Var(X.) = Ε(χξ) - (Ε(Χη.) ) 2 = E(X?) - μ 2

Kapitel 5: Punktschätzer, Konfidenz- und Promoseintervalle

Ε(Χ2)=σ

χ +

μ

2

,

i=1

10

141

.

Da f ü r die Z u f a l l s v a r i a b l e n Χ ^ , . , . , Χ ^ ( s t o c h a s t i s c h e ) Unabhängigkeit

voraus-

g e s e t z t w i r d , i s t bei Anwendung der Gleichung von Bienayme (vgl. Aufgabe 3.16) ιυ 10 \ Ν 14 ^ Χ,-) = ^

/1 Var(X) = V a r ^

l10 u 1 , 1, u0 ^ Var(X.) = ^ .Σ,

σ

? 1 χ = Iff

σ

2 Χ

und wegen Var(X)

= E(X2) - ( E ( X ) ) 2 = E(X2) - μ 2

al so E(X2) = ^ σ

χ

2

+

μχ2

M i t d i e s e n Beziehungen e r h ä l t man a l s Erwartungswert der S c h ä t z f u n k t i o n „2 2 σ χ ( Χ 1 , . . . ,X n ) = S x gerade

Ε

-x~>2] = i E[ X A-10X"

$(c) Die Kovarianz zwischen zwei Z u f a l l s v a r i a b l e n X und Y, C o v ( X , Y ) , Aufgabe 3 . 1 4 , Aufgabe 3 . 1 5 ) wird ausgehend von Beobachtungspaaren ...,(x

n

(vgl.

(Xj.Yj),

,y ) g e s c h ä t z t durch d i e e m p i r i s c h e Kovarianz n 1 "χγ-ΪΓΤ

n

Σ

1=1

^ i - ^ ^ - y )

- ^

1

(

n

I

1=1

V ! - « »

^

·

Als Schätzwert f ü r d i e K o r r e l a t i o n Ρ χ γ < d i e a l s Maß f ü r den ( l i n e a r e n )

Zu-

sammenhang zwischen X und Y d i e n t , wird zumeist der K o r r e l a t i o n s k o e f f i z i e n t von B r a v a i s - Pearson

XY / S X *sv

n l (x 1=1

- x ) (y. - y >

/ I (Χ, - χ ) 2 · ! (yf - y ) 2 \J i = l i =l n l χ±γ± - nxy i=l

Λ^"™) (Α yi"n?2) 2

2

verwendet (s^ und s y bezeichnen dabei d i e zugehörigen empirischen V a r i a n z e n ) , Ebenso wie f ü r

g i l t auch f ü r

r^

- 1 8251

d . h . es besteht ein starker p o s i t i v e r l i n e a r e r Zusammenhang zwischen der B r e i t e und dem Gewicht der Vollkornbrötchen.

LÖSUNG ZU AUFGABE 5 . 2 Dem Abfüll gewicht X von grünen Bohnen in Dosen wird eine Normal Verteilung mit 2

2

unbekanntem Erwartungswert μ und bekannter Varianz σ =4 =16 u n t e r s t e l l t , d.h. es s o l l g e l t e n :

Χ ^ Ν ( μ , 1 6 } ( v g l . Aufgabe 4.8). Es wurden η = 25 Dosen

h i n s i c h t l i c h der Abfüllmenge untersucht; die gemessenen Werte x ^ , . . . ^ , ^

s '* ncl

gegeben. -»(a) Das arithmetische M i t t e l der Beobachtungswerte χ ( v g l . Aufgabe 5.1} l i e f e r t eine erwartungstreue Schätzung f ü r den Erwartungswert einer V e r t e i l u n g . Somit wird das durchschnittliche Abfüllgewicht μ an grünen Bohnen geschätzt durch

V

=

* -K j ,

= 174.4 g

x

i - 7 5 %

x

i -sr

( 1 7 3 + 176 t

··••"*>

= i - « 6 0

.

-*(b) A n s t a t t den unbekannten Parameter θ der Verteilung e i n e r Z u f a l l s v a r i a blen X durch einen e i n z i g e n Wert θ zu schätzen, i s t man o f t auch daran i n t e r e s s i e r t , ein möglichst k l e i n e s I n t e r v a l l anzugeben, in dem das unbekannte θ mit e i n e r vorgegebenen Mindestwahrscheinlichkeit liegt.Man spricht in diesem F a l l von e i n e r Intervallschätzung.> Dabei wird ein I n t e r v a l l , das sogenannte Konfidenz- oder V e r t r a u e n s i n t e r v a l l zum Niveau 1 - α

(kurz; (1 -ex) - K o n f i d e n z -

i n t e r v a l l ) , mit den Grenzen G und G (G < G ) gesucht, so daß u ο u ο P(G

< 9 < 6 1 = 1 -Ct u - ο

[bzw. manchmal auchx > 1 - α } -

e r f ü l l t i s t . Der Wert α , der demnach d i e Wahrscheinlichkeit dafür a n g i b t , daß das I n t e r v a l l

[G ,G ] den Parameter θ n i c h t e i n s c h l i e ß t , wird a l s u ο

tumswahrscheinlichkeit b e z e i c h n e t . Fassen wir d i e e r m i t t e l t e n

Irr-

Stichproben-

werte e i n e r Z u f a l l s v a r i a b l e n X wiederum a l s Realisationen von unabhängigen identisch v e r t e i l t e n Zufallsvariablen X , . . . , X

a u f , so sind d i e

Intervall-

146

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

grenzen G^ und G q Funktionen von Χ^,.,.,Χ^. Durch Übergang zu den beobachteten Werten x.,...,x erhält man dann Realisationen g und σ der Grenzen G I n u ο u und G q . Die Konstruktion eines Konfidenzintervalls erfolgt in der Regel über die Transformation einer bereits vorhandenen Punktschätzfunktion derart, daß die Verteilung für die transformierte Größe bekannt und unabhängig vom Parameter θ ist. 2 Auf diese Weise erhält man für den Parameter μ einer Ν(μ,σ^) - verteilten Zufallsvariablen mit σ 2 bekannt über die Schätzfunktion X (vgl. Aufgabe 5.1) wegen σ * '(-X ^ tfT

u, .„< μ < X+ l ~«2 vir

v

u,

..\

j

= 1 -α mit

Vn

fr

ein Konfidenzintervall zum Niveau 1 - α . Dabei bezeichnet u

l-a/2

das (1-0/2)

Quantil der Standardnormalverteilung (vgl. Aufgabe 4.9).

Ein Konfidenzintervall zum Niveau 1 - α = 0.95 (α = 0.05) für den 2

Erwartungswert

μ des Ν(μ,4 ) - verteilten AbfUllgewichtes ergibt sich mit dem im Aufgabenteil (a) berechneten arithmetischen Mittel der η = 2 5 Stichprobenwerte 2 χ = 174.4, der bekannten Varianz σ* = 16 (σ* = 4), und dem Quantil der Standardnormal Verteilung V c / 2 174.4

=u

1-0.05/2

=u

1-0.025

=u

0.975 = 1 · 9 6 0 0

zu

— · 1 .9600 , 1 7 4 . 4 · 1 . 9 6 0 0 ] = [174.4 - 1.568 , 174.4 + 1.568] = [172.832 , 175.968]

.

-»(c) Bei gleichen Bedingungen wie im Aufgabenteil

(b) erhält man als Konfi-

denzintervall für den Erwartungswert μ bei einem Stichprobenmittelwert von χ = 175.5 : [ 175.5 L

— \/Ίζ

1 .9600 , 175.5 + — ^ — \ΖΊ5

1.9600]

= [175.5 - 1.568 , 175.5 + 1.568] = [173.932 , 177.068]

,

J

Kapitel 5: Punktschätzer, Konfidenz- und Frognoseintervalle

147

χ = 174.8 : [174.8- 1.568 , 174.8 + 1.568] =[173.232 , 176.368] , χ = 176.7 : [176.7 - 1.568 , 176.7 + 1.568] =[175.132 , 178.268] . Aus Abb. C5.2.1, welche die vier berechneten Konfidenzintervalle zum Niveau 0.95 für den Erwartungswert μ veranschaulicht, geht noch einmal hervor, daß diese Konfidenzintervalle abhängig vom jeweils ermittelten Stichprobenmittelwert χ variieren, obwohl der Parameter μ (es wurde angenommen, daß μ = 175 gilt) natürlich fest ist. Außerdem zeigt sich, daß das Intervall, das auf dem Wert χ = 176.7 basiert, den (unbekannten) Parameter nicht enthält.

χ = 176.7 x=174.8 χ = 175.5 x = 174.4 172

173

1%

μ = 175

176

I

177

I

178

Abb. C5.2.1: Konfidenzintervalle zum Niveau 0.95 für den Erwartungswert μ bei unterschiedlichen Stichprobenergebnissen

LÖSUNG ZU AUFGABE 5.5 -»(a) Die Länge X von Metallstiften sei normal verteilt mit Erwartungswert μ 2 2 2 2 bei bekannter Varianz σ* = 1.6 = 2 . 5 6 m m , d.h. Χ ^ Ν ( μ , σ * ) . Als Konfidenzintervall zum Niveau 1 - α = 0.96 für μ ( v g l . Aufgabe 5 . 2 ) erhält man mit dem arithmetischen Mittel der an η =36 Metallstiften gemessenen Länge χ = 38.5 mm und dem Quantil u

1-a/2 " u 1-0.04/2 = u 1 - 0 . 0 2

=u

0.98

= 2,0537

148

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

somit r

σ*

σ*

•a/2

\/n

= [38.5 - - i ^ - "2.0537 , 38.5 I»/"iff V3S

ν* 36

· 2 . 0537

= [37.9523 , 39.0477]

-»(b) Die Breite b eines Intervalls [g ,g J ist allgemein gegeben durch b = g -g ο u Ist die Varianz σ

einer normalverteilten Zufallsvariablen bekannt, so ergibt

sich die Breite des Konfidenzintervalls für den Erwartungswert μ (vgl. Aufgabe 5.2) gerade zu 2 ·σ

χ

b =

1-0/2

Vn

,

d.h. diese hängt wesentlich vom Stichprobenumfang η ab. Soll nun eine vorgegebene Breite b des Intervalls abgesichert werden, so muß die kleinste Zahl η bestimmt werden, für die 2

η >

*

I-0/2

gilt» Eine Stichprobe dieses Umfangs liefert dann ein Konfidenzintervall der gewünschten Breite»

Das im Aufgabenteil

(a)

berechnete

Konfidenzintervall hat eine B r e i t e von

g Q - g u = 39.0477 - 37.9523 = 1.0954 mm . Für ein weiteres Konfidenzintervall zum Niveau 0.96 wird v e r l a n g t , daß es eine B r e i t e b = 1.0954/2 = 0.5477 mm e i n h ä l t . Mit 2 - σ* · u η >

2 0.98

[

^

^

Z

]

=143.975.

wird eine Stichprobe vom Umfang η = 144 b e n ö t i g t , um die g e f o r d e r t e B r e i t e des Konfidenzintervall s abzusichern.

149

Kapitel 5: Punktschätzer, Konfidenz- und Prognoseintervalle

->(c) Da das angegebene Intervall sich schreiben läßt als [38.1 , 38.9] = [38.5 - 0.4 , 38.5 + 0.4] = [ x - 0 . 4 ,x + 0.4]

,

ergibt sich aus der allgemeinen Form des Konfidenzintervalls für μ (vgl. Aufgabe 5.2) folgende Gleichung:

U

1 - c/2

=

1

·

5

·

Somit erhält man (vgl. Aufgabe 4.9) 1 - α/2 = «(1.5)

,

d.h. α = 2(1 -Φ(1.5)) = 2(1 - 0.9332) = 0.1336 Die erwartete Metall stiftlänge μ wird

.

also mit Wahrscheinlichkeit

1 - ot = 1 - 0.1336 = 0.8664 vom angegebenen Intervall überdeckt.

LÖSUNG

ZU A U F G A B E 5 Λ

Der C O - G e h a l t X im Abgas von Kraftwagen ist näherungsweise als normalver2 teilt mit unbekanntem Erwartungswert μ und unbekannter Varianz σ anzusehen. Bei einer Stichprobe von η =30 Kraftwagen wurden die gegebenen Abgaswerte X|,... »Xjg gemessen. 2 -»(a) Das arithmetische Mittel χ bzw. die empirische Varianz s (vgl. Aufgabe 5.1) geben eine erwartungstreue Schätzung für den Erwartungswert μ bzw. für 2 die Varianz σ

einer Verteilung an. Somit erhält man für den durchschnitt-

lichen C O - G e h a l t einen Schätzwert von μ = χ

η

96.6 = 3.22

und eine geschätzte Varianz bzw. Standardabweichung von

=

15

(312.2400 - 30 · 3.22 2 ) = 0.0410

σ = s = \! 'Ö. 04Ί 0 = 0.2025

bzw.

150

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

->(b) I s t e i n e Z u f a l l s v a r i a b l e Χ gabe

, χ + t h-1

n-l;l-

(vgl. A u f g a b e

d a s

mit

für die Standardabweichung

(1-0/2) - Q u a n t i l d e r t (Χ

bzw.

n-l;0/2

Dabei bezeichnet χ das arithmetische Mittel, s

u n d

(vgl. A u f -

5.2)

2

, - Verteilung n-1

< 1 - » ' 2 ' ~ Quantil

σ vor.

die empirische

Varianz,

(vgl. A u f g a b e

((α/2) - Q u a n t i l )

4.12.a) _

der χ ^

-

4.12.a).

Im Aufgabenteil (a) wurden bereits mit η =30 χ = 3.22

,

s 2 = 0.0410

bzw.

s = 0.2025

ermittelt. Zunächst sollen nun zu den unterschiedlichen Niveaus die Konfidenzintervalle für den durchschnittlichen CO-Gehalt μ in Kraftwagen berechnet werden: =t

Für 1 - a = 0.90, d.h.ο = 0.10, ist t n 1

29-0 95 =

1- 6 9 9 u n d s o m i t

er

"

gibt [3.22-I.699 · ° · 2 0 2 5 , 3.22 + 1 .699 · ° - 2 0 2 5 1 = [3.1572 , 3.2828] \/317 \βΰ -1

L

ein Konfidenzintervall zum 90% Niveau für μ; für 1 - a = 0.95, d . h . a = 0.05, ist t

n

1

=

^ g - O 975 = 2 , 0 4 5

und es

er

9lbt

[3.22-2.Ο45· 0 , 2 0 2 5 , 3.22 + 2.045 · °- 2025 ~| = [3.1444 , 3.2956] L y/Ίΰ \/3ΤΓ J ein Konfidenzintervall zum 95% Niveau für μ; für 1 -α = 0.98, d.h. α = 0.02, ist

. · ) . = t 29-0 99 = 2 , 4 6 2

Und eS

er

9ibt

[3.22 - 2.462 · ° · 2 0 2 5 , 3.22 + 2.462 · ° · 2 0 2 5 ] = [3.1290 , 3.3110] L \/3ü \/3ü J ein Konfidenzintervall zum 98% Niveau für μ.

Kapitel 5: Punktschätzer, Konfidenz- undPrognoseintervalle

151

Für die Varianz σ 2 des CO-Gehalts in den Abgasen von Kraftwagen erhält man bei den verschiedenen Niveaus folgende Konfidenzintervalle: Mit 1 - α = 0.90, X n _

1 ; W 2

= X2 9 ; 0 .95 =

42

"56' V l ; « / 2

=

*29;0.05

=

17

·71

*29;0.025

=

16

·05

ist

[ 2 9 42°.5? 1 0 ' 2 9 i70.7°1410] • [0.0279 , 0.0671] 2

ein 90% - Konfidenzintervall für σ ; mit 1 - α = 0.95, χ*.,. w

= 2

*29;0.975

= 45

· 7 2 ' x n-1; 9 in der Regel gerechtfertigt ist (vgl. Aufgabe 4.14) , läßt sich ein Konfidenzintervall für ρ zum Niveau α (vgl. Aufgabe 5.2) bestimmen zu [p t ' P 2 ] mit

2np + U

l - 0/2 ~U l - 0/2 2

2

( η +

J A ' - * / 2 + 4 " P ( 1 - Ρ' ν^2>

"P + Ul-c/2+Ul-q/2

2

2

Dabei bezeichnet u^

/ " l - q / 2 * 4 n P ( 1 "Ρ* 2 (η+ "ΐ-^2>

das (1 - α/2) - Quantil der N(0,1) - Verteilung und

ρ = m/n. Da mit η = 5000 hinreichend viele Beobachtungen vorliegen (mit p = 0.06 gilt auch np(1 - p ) =282 > 9 ) , kann ein Konfidenzintervall zum Niveau 1 - α = 0.99 mit Hilfe der Normal Verteilungsapproximation bestimmt werden. Es ergibt sich mit ρ = 0.06, u - | . ( y 2 = u 0 995 "2.5758 gerade

P,1 =

p

2

2-5000 ' 0.06 + 2.5758 - 2.5758 » ss/l.5758^ +4-282 : 7 2 (5000 + 2.5758 )

=

606.6347 - 86.7641 _ n n , 1 Q = u 0519 10013.2695 ·

=

606.6347 + 86 . 7641 „ ncQ, = 10013.2695 °·0692 ·

·

d.h. der prozentuale Stimmenanteil der OPD bei der Landtagswahl liegt mit 99% - tiger Sicherheit im Intervall [5.19% , 6.92%]

.

Als Schätzwert für die Wahrscheinlichkeit q = 1 - p, daß ein Wähler seine Stimme einer der übrigen Parteien gibt, erhält man natürlich q = 1 - p = 1 - 0.06 = 0.94

ILzJÜ = i Z M ^ 3üüüy

'

d.h. der Stimmenanteil der übrigen Parteien wird auf 94% geschätzt. Das zugehörige Konfidenzintervall

[q^.q^] zum Niveau 0.99 läßt sich direkt aus dem

Intervall, das soeben für ρ berechnet wurde, ablesen, denn es gilt

154

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

[qrq2]

= [1 - p 2 .

- P i ] = [1 - 0.0692 , 1 - 0.0519]

1

= [0.9308 , 0.9481]

.

Der S t i m m e n a n t e i l d e r ü b r i g e n P a r t e i e n l i e g t a l s o zum N i v e a u 0 . 9 9 im I n t e r vall [93.08% , 9 4 . 8 1 « ]

.

LÖSUNG ZU AUFGABE 5.6 -»(a) B e i e i n e r S t i c h p r o b e vom Umfang η = 25 t r a t e n m = 6 A u s s c h u ß s t ü c k e a u f , d . h . e i n e S c h ä t z u n g d e r W a h r s c h e i n l i c h k e i t p , daß e i n p r o d u z i e r t e s

Stück

Ausschuß i s t , i s t gegeben d u r c h (vgl. Aufgabe 5.5)

M i t a n d e r e n W o r t e n , es w i r d d e r p r o z e n t u a l e A n t e i l d e r A u s s c h u ß s t ü c k e i n dem P r o d u k t i o n s l o s a u f 24% g e s c h ä t z t .

-•(b)

Ist eine Approximation der Binomial- durch eine Normalverteilung nicht

mehr gerechtfertigt

(vgl. Aufgabe 5.5), so läßt sich mit Hilfe der

sogenann-

ten Pearson - Clopper - Werte ein Konfidenzintervall für ρ zum Niveau 1 - α angeben. Unter Verwendung der Quantile der F - Verteilung ergibt sich dieses zu [Pl,P2] mit m * F 2m.2(n - m + 1) ,· a/2 n-m+l+m*F2m,2 (n - m + 1) ;a/2

(m+ 1) · F 2 ( m +

t) >2(n

η - m + (m + 1) · F. ,

_m)

'

.j.g/2

, , _,

. .

2 (m + 1) ,2 (n - m) ; 1 - 0 / 2

..

Z u n ä c h s t s o l l e n d i e z u r k o n k r e t e n B e r e c h n u n g e i n e s K o n f i d e n z i n t e r v a l l s zum N i v e a u 0 . 9 0 b e n ö t i g t e n Q u a n t i l e b e s t i m m t w e r d e n . Es e r g i b t s i c h m i t m = 6 , η = 2 5 , α = 0 . 1 0 (vgl. Aufgabe 4.12) e i n m a l F2m,2(n-m

+ 1);o/2

= P12,40;0.05

=

F40 ^ . g

g5

=

T37Z

=

0,4122

·

155

Kapitel 5: Punktschätzer, Konfldenz- und Prognoseintervalle

Der Wert F

2(m + 1),2(n-m);1-cV2

=

F

14,38;0.95

läßt sich aus der im Anhang gegebenen Tafel nicht mehr genau ablesen. Wir verwenden daher die ebenfalls dort angegebene Approximation für 0 . 5 < γ < 1: F

η, ,η 2 ;γ

~ e

(u J - a - b Ύ

mit

a=

,

( y

2

-

3

b.

d

.

1

1

Da n 1 = 14, n^ = 38, uQ gg = 1.6449 und d = 0.10395

,

c = - 0.04905

b = 0.07481

,

a = 0.45538

,

erhält man für das gesuchte Quantil der F ^ jg - Verteilung näherungsweise c

14,38;0.95 ~

_1.6449 · 0.45538 - 0.07481

, 0 ( -, c ·9625

= 1

'

Die Grenzen des 0.90 - Konfidenzintervalls berechnen sich damit zu

P

1

6 ' P 12,40;0.05 2 5 - 6 + 1+6 - Ft2,40;0.05 7

^

* F 14,38;0.95 2b - 6 + / · ,38;0.95

6 · 0.4122 ' °-4122

=

n

= 20 + 6

^

7 - 1.9625 + ^ " ^ ·96ίί5

1in.

. UBd

n

'

d.h. mit Wahrscheinlichkeit 0.90 wird der Anteil der Ausschußstücke überdeckt durch das Intervall [ 1 1 . 0 U ,41.96%]

.

LÖSUNG ZU AUFGABE 5 . 7 Da der Erwartungswert einer Ex (λ) - verteilten Zufallsvariablen X gerade 1/λ ist (vgl. Aufgabe 4.7), liegt es nahe (vgl. Aufgabe 5.1), den Parameter λ durch

156

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

41

1

1 n

X

I x. i-1 x

zu schätzen, wobei xj,...,x

die beobachteten Werte der exponentialverteilten

Zufallsvariablen X bezeichnen. Ein entsprechendes Konfidenzintervall zum Niveau 1 - α (vgl. Aufgabe 5.2) für 2 den Parameter λ einer Exponentialverteilung ist mit Quantilen der -Verteilung gegeben durch 2n ;Ct/2

2n;l- o/2 2nx

2nx

Bei einer Stichprobe von η = 100 Computern wurde eine durchschnittl iche Lebensdauer bis zur ersten Reparatur von χ =2 Jahren f e s t g e s t e l l t . Als Schätzwert für den Parameter λ der als exponential v e r t e i l t angenommenen Lebensdauer ergibt sich somit Λ λ

1 ι = r = 7 = Ο· 5 χ

·

2 Das zugehörige Konfidenzintervall zum Niveau 1 - α = 0.95 i s t mit χ , „ 2 2 2 'α' = χ 200:0.025 = 1 6 2 * 7 ' x 2n;1 -c/2 =x 200;0.975 = 2 4 1 ' 1 b e s t i m m t d u r c h [2 S

2 ' 2

LÖSUNG ZU A U F G A B E

2] =

[0

·40675 ' °-60275]

*

5.8

Der Parameter p^, der im Zusammenhang mit einem Μ ( η , ρ ^ , . . . - v e r t e i l t e n Zufallsvektor (Χ^,.,.,Χ^) (vgl. Aufgabe 4.3; Multinomialverteilung) die Wahrscheinlichkeit dafür angibt, daß bei einem Versuch ein Ereignis A^ eintritt, wird geschätzt durch (vgl. Aufgabe 5.5) m.

h'

ΊΓ

' 1=1

k

-

Dabei gibt m. die absolute beobachtete Häufigkeit des Ereignisses A^, i=l , „..,k , bei η unabhängigen Wiederholungen des Versuchs wieder. Simultane Konfidenzintervalle zum (simultanen) Niveau 1 - a

Kapitel 5: Punktschätzer, Konfidenz- und Prognoseintervalle

f p ii' p 2i^

fÜr

P

i

'

1=1

157

'•••'k '

d.h. mit einer Gesamtwahrscheinlichkeit von 1 - α überdecken die Intervalle [ ρ ^ , ρ ^ ^ ] simultan, gleichzeitig die k Parameter p^, erhält man approximativ für i=l,...,k durch

X

k-1; 1-Ot+

2np

i - / X k - 1 ; 1KX (X k-1 ; 1 ^

" P j ( 1 ' P i>>

V k-1 ,-1-α A k-1 ,-1-g 2

k-1; 1 -Ot P

+ 4

2i -

2 (n +X



k-l,-l-a)

Von η = 120 Personen würden m^ =54 regelmäßig, h^ = 30 unregelmäßig und mg =η - m^ - m2 = 120 - 54 - 30 =36 niemals KISS kaufen. Die gesuchten Wahrscheinlichkeiten werden also geschätzt mit prrar p

2

0

·

4 5

·

= ^ = 0.25

p3=m=0·

,

3 0

·

Da 1 - a = 0.90,

=

=4·605'

;0.90

i s f

mit p 1 = 0.45

P

4.605 + 2 - 120 - 0 . 4 5 - y/4.605 (4.605 +4 · 120· 0.45- (1 - 0ΤΤ5ΤΓ 2 (120 + 4.605)

11

_ 112.6050 - 23.8386 249.2100" = 0.3562 p

2i

=

,

112.6050 + 23.8386 — zwzm—

=

n „71°-5475

-

mit p 2 = 0.25

_ . 4.605 + 2 - 120 - 0.25 - y/4.605 (4.605 +4 - 120 - 0.25 * 0.75)' p 12 249.2100 _ 64.6050 - 20.8724 249.2100 = 0.1755

,

158

Teil I: Übungsaufgaben,

Erläuterungen

64.6050 + 20.8724 249.2100

P22

und

Lösungen

0.3430

und mit p, =0.30

13 "

4.605 + 2 · 120 » 0.30 - \/4.605 (4.605 + 4 · 120 · 0.3 · 0.7) 249.2100 '

= 76.6050 - 22.0316 249.2100 = 0.2190 23

=

,

76.6050 + 22.0316 249.2100

0.3958

Mit einer Gesamtwahrscheinlichkeit 90% enthalten also simultan die (approximativen)

Intervalle [0.3562 , 0.5475] den Parameter ρ,, [0.1755 , 0.3430] den Parameter p 2 und [0.2190 , 0.3958] den Parameter p 3 ·

Kapitel 6: Parametrische Tests im Einstichprobenfall AUFGABE 6 . 1 Bei e i n e r neu angeschafften F l a s c h e n b l e r a b f ü l l a n l a g e wird der B r a u e r e i eine m i t t l e r e Abfüllmenge von 0 . 3 3 1 bei e i n e r S t a n dardabwelchung von σ = ο.03«. g a r a n t i e r t . Eine S t i c h p r o b e von η = 1 6 Flaschen ergab eine d u r c h s c h n i t t l i c h e Biermenge pro F l a sche von 0 . 3 1 1 . Es s o l l angenommen werden, dass d i e Abfüllmenge n o r m a l v e r t e l l t 1 s t . (a) Kann man mit e i n e r zugelassenen I r r t u m s w a h r s c h e i n l i c h k e i t von 0.05 davon ausgehen, dass die m i t t l e r e Abfüllmenge g e r i n g e r i s t a l s von dem H e r s t e l l e r der Anlage angegeben? (b) Bestimmen S i e den Ablehnbereich sowie den Annahmeberelch des unter (a) durchgeführten T e s t s . (c) Bei welchem Niveau Für welche durchschnittlichen Natriumwerte (bei gleichbleibender Stichprobenvarianz) kann die obige Hypothese zum 5% Niveau verworfen werden? (c) Kann zum Niveau 0,05 die Hypothese, dass die Varianz bei 2mg2/«·2 liegt, verworfen werden?

AUFGABE 6.4 Eine Umweltschutzorganlsation behauptet, dass nach der vom TÜV erhobenen Stichprobe über den CO-Gehalt der Abgase von η = 30 PKW aus Aufgabe 5,4 es sichergestellt ist, dass der durchschnittliche CO -Wert bei über 3.15% liegt. Können Sie diese Behauptung zum 5% Niveau signifikant bestätigen?

Kapitel 6: Parametrische Tests im

Einstichprobenfall

161

AUFGABE 6.5 Der H e r s t e l l e r der Flaschenbierabfüllanlage aus Aufgabe 6 . 1 s t e l l t die Maschine neu e i n . Bei einer Untersuchung des I n h a l t s von 16 Flaschen wurde wieder eine d u r c h s c h n i t t l i c h e Biermenge von 0 . 3 1 1 pro Flasche f e s t g e s t e l l t . A l l e r d i n g s lag die S t l c h probenstandardabwelchung nur bei s = 0 . 0 1 . Wurde eine Verbesserung der Streuung der Abfüllmenge e r z i e l t ? Prüfen S i e , ob die Standardabweichung zum 5% Niveau s i g n i f i k a n t k l e i n e r a l s 0.03 ist.

AUFGABE 6.6 Bei einer Landtagswahl wurden von 5000 b e r e i t s ausgezählten Stimmzetteln 300 f ü r die OPPORTUNISTEN PARTEI (OPD) r e g i s t r i e r t , v g l . Aufgabe 5.5. Wird diese Partei bei einem S i g n i f i k a n z n i v e a u α = 0 . 0 1 die 5% Hürde überwinden?

AUFGABE 6.7 Die Produktionsabteilung eines Werkes überprüft die Qualltat eines seiner Produkte. Unter 25 dem Produktionslos z u f ä l l i g entnommenen Produktionsstücken wurden 4 Ausschussstücke ermitt e l t . überprüfen S i e zum Niveau « = 0.05 die Hypothese, dass der Ausschussanteil in der Gesamtproduktion bei über 20% l i e g t .

AUFGABE 6.8 Eine Stichprobe In verschiedenen Krankenhäusern ergab unter 500 Geburten einen A n t e i l von 48% neugeborenen Mädchen. (a) I s t die Wahrscheinlichkeit für die Geburt eines Mädchens s i g n i f i k a n t k l e i n e r a l s 0 . 5 ? Testen S i e zum 4 % - N i v e a u . (b) Wie g r o s s muss der Stichprobenumfang gewählt werden, damit der in (a) durchgeführte Test zum Niveau 0.04 mit 8 0 % - lger

162

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

Sicherheit die Frage in (a) bejaht, wenn die tatsächliche Wahrscheinlichkeit für die Geburt eines Madchens bei 0.46 liegt?

AUFGABE 6.9 Ein Marktforschungsinstitut stellt aufgrund langjähriger Erfahrung auf dem Tollettenpaplermarkt die Hypothese auf, dass der Anteil der Verbraucher, die das neuartige Toilettenpapier KISS regelmässig kaufen werden, bei 40% liegt, 30% sich In unregelmässigen Abständen beim Kauf für KISS entscheiden und nur 30% das neue Toilettenpapier ablehnen, Oberprüfen Sie anhand der in Aufgabe 5.8 gegebenen Stichprobenergebnisse obige Behauptung zum 1% Niveau.

Kapitel 6: Parametrische Tests im Einstichprobenfall

LÖSUNG ZU AUFGABE

163

6.1

Der Begriff des statistischen Tests ist eng verknüpft mit der sogenannten Nullhypothese Hg (kurz: Hypothese) und der Alternativhypothese H^ (kurz: Alternative) . Dabei wird in der Hypothese eine Annahme (Vermutung) über die Verteilung einer oder mehrerer Zufallsvariablen formuliert, die mit Hilfe eines statistischen Entscheidungsverfahrens (kurz: Test) überprüft werden soll. Hinter der Alternative verbirgt sich dann gerade eine zu H^ komplementäre, weitere Annahme über die Verteilung. Beziehen sich H^ und H^ auf Parameter θ einer bekannten Verteilung, so heißen die zugehörigen Entscheidungsverfahren

parametrische Tests. Eine Zufallsvariable X unterliege nun

einer Verteilung mit unbekanntem Parameter Θ.

Folgende Arten von Hypothesen

können dann unterschieden werden: Man spricht von einer einseitigen Hypothese, wenn H01 : θ < eQ «02



- ®0

gegen gege

"

H H

12

u

:

: θ > 0Q ®


u - α 0.05 ~ - 1.6449,

"0.95"

d.h. da

,

ζ

Χ "μ°,/τ?Γ 0-31 - 0.33 = _ _ ν Γ T 5 " = QTQ3

. 9 ,,,, 4 = - 2.6667

,

kann die Nullhypothese zum Niveau 0.05 verworfen werden, denn ζ = - 2.6667 < - 1.6449 = u a Anders ausgedrückt bedeutet dies aber gerade, daß bei einer

Irrtumswahr-

scheinlichkeit von 0.05 die durchschnittliche Abfüllmenge kleiner a l s 0 . 3 3 £ ist, d . h . die Entscheidung Durchschnittswert'

'μ ist kleiner als der vom Hersteller angegebene

hat eine Fehlerwahrscheinlichkeit von 0.05.

-»(b) Die im Aufgabenteil für Werte ζ < - 1 .6449

(a) untersuchte Hypothese Hq wird zum Niveau 0.05

abgelehnt, d . h . der Ablehnbereich ist also das offene

Intervall A

0 . 0 5 = C - - . - 1 -6449)

;

für den Annahmebereich erhält man somit Ä

o s

= [ - 1.6449 , » )

,

vgl. A b b . C6.1.1.

-»(c) Bezeichnet c (α) den kritischen Wert eines Niveau - α - Tests, so kann eine Hypothese bei Vorliegen des Wertes T(x.,...,x ) einer Teststatistik für alle 1 η Niveaus α > α , wobei sich α als Lösung der Gleichung c (α) = T(x, ,... ,x ) 1 η ergibt, verworfen werden. Diese Größe α heißt auch ρ - Wert (p - value) eines Tests.

Mit dem im Aufgabenteil

(a) berechneten Wert der Teststatistik ζ = - 2 . 6 6 6 7

läßt sich der ρ - Wert α des durchgeführten Gauß - Tests als Lösung der Gleichung

Kapitel 6: Parametrische Tests im Einstichprobenfall

Ablehnbereich

167

Annahmebereich

Abh. C 6.1.1: Ablehn- und Annahmebereich eines e i n s e i t i g e n Gauß - Tests zum Niveau α = 0.05

u5 = -2.6667 bestimmen. Bezeichnet φ(χ) die Verteilungsfunktion der Standardnormal V e r t e i l u n g , so ergibt sich α = Φ(- 2.6667) = 1 -Φ(2.6667) 1 - 0.9962 = 0.0038

,

d.h. obige Hypothese kann bei Vorliegen des Stichprobenmittelwertes χ = 0.31 f ü r a l l e Niveaus a > 0.0038 verworfen werden. Auf

das konkrete Niveau α eines Tests hat man sich allerdings vor der Durch-

führung des Testverfahrens festzulegen, vgl. Aufgabenteil

(a).

168

Teil / . Übungsaufgaben, Erläuterungen und Lösungen

LÖSUNG ZU AUFGABE

6.2

Dem A b f ü l l g e w i c h t X von grünen Bohnen i n Dosen w i r d e i n e Normal V e r t e i l u n g 2 m i t unbekanntem E r w a r t u n g s w e r t μ und b e k a n n t e r V a r i a n z σ* = 16 u n t e r s t e l l t , v g l . Aufgabe 5 . 2 . F ü r d i e an η = 2 5 Dosen gemessenen Werte x^

Xgg h i n -

s i c h t l i c h d e r A b f ü l l m e n g e wurde e i n D u r c h s c h n i t t s g e w i c h t von χ = 1 7 4 . 4 g

er-

mittelt.

- • ( a ) Zum Niveau a = 0 . 1 0 s o l l d i e z w e i s e i t i g e Hypothese H 0 : μ = 175 gegen d i e A l t e r n a t i v e H 1 : μ % 175 g e t e s t e t werden ( v g l . Aufgabe 6 . 1 . a ) .

x

-μ0 \J η σ*

d e r m i t dem Q u a n t i l

u

II

M i t x = 174.4 e r g i b t s i c h f ü r d i e z u g e h ö r i g e T e s t s t a t i s t i k d e r Wert 174.4 - 175

i _ ( y 2 = u 0 95

| z | = 0 . 7 5 * 1 .6449 = u , . ^

0.75 v e r g l i c h e n werden muß. Da

,

kann Hg zum Niveau 0 . 1 0 n i c h t v e r w o r f e n w e r d e n , d . h . beim 1 0 % - N i v e a u l i e g e n k e i n e s i g n i f i k a n t e n Abweichungen vom Wert μ = 1 7 5 g

vor.

Da d i e o b i g e Hypothese zum 10% Niveau f ü r a l l e ζ m i t | ζ | > 1 .6449 v e r w o r f e n w i r d , i s t d e r A b l e h n b e r e i c h Ag ^

( v g l . Aufgabe 6.1) des soeben

durchgeführten Tests bestimmt durch A0.10

=

("">·

- Ι·6449'

u

(1 -6449 , » )

.

Aus dem Annahmebereich V l O

=

["

1

· 6 4 4 9 » 1.6449]

e r g i b t s i c h , daß Hg n i c h t v e r w o r f e n w i r d , χ -μ

\ f n e [ - 1.6449 , 1 . 6 4 4 9 ]

falls

169

Kapitel 6: Parametrische Tests im Einstichprobenfall

g i l t . M i t χ = 174, σ * = 4 und η = 25 l ä ß t s i c h d i e s e Aussage ä q u i v a l e n t umformen zu μη 6 u

Γ

σ

- 1.6449

L

*

σ

+ χ , 1.6449

ν/η

*

-1 + χ J



= [ 174.4 - 1.6449

, 174.4 + 1.6449 ·

,

d . h . l i e g t der h y p o t h e t i s c h angenommene Wert μ^ im I n t e r v a l l [173.0841,175.7159] so wird Hg n i c h t verworfen. Konfidenzintervall gewichts X Γ 5 L

, Dieses Intervall

stimmt Liberein mit dem 0 . 9 0 -

f ü r den Erwartungswert μ des Ν(μ,16) - v e r t e i l t e n A b f l i l l -

(vgl. Aufgabe 5.2.b): σ

σ

* u

\J η

o.95 ' *

+

* - = u0.95 \Jr\

[ l 7 4 . 4 - ^ t · 1 .6449 , 174.4 = [173.0841 , 175.7159]

Somit kann a l s o d i e z w e i s e i t i g e Hypothese

1 .6449

.

Hg zum Niveau 0.10 verworfen wer-

den, wenn der h y p o t h e t i s c h e Wert μρ n i c h t im 0.90 - K o n f i d e n z i n t e r v a l 1 f ü r μ liegt.

-»(b) Die Gütefunktion, die einen statistischen

Test vollständig charakteri-

siert, gibt in Abhängigkeit vom wahren Parameter θ die Wahrscheinlichkeit an, die Nullhypothese aufgrund dieses Tests zu verwerfen. Die Funktionswerte der Gütefunktion, die hier mit g(0) bezeichnet wird, sind, falls der wahre Parameter θ in der Nähe des hypothetisch angenommenen Wertes

liegt, sehr

klein, bzw. je weiter der wahre Parameter von θ^ entfernt ist, um so mehr nähern sich diese dem Wert Eins. Liegt nun der wahre Parameter in dem von der Hypothese bestimmten Bereich für θ (kurz: Θ£ΗQ) , so ist ein Niveau - α - Test (vgl. Aufgabe 6.1) gerade bei g(8) < α

für alle θ e H Q

gegeben. Außerdem läßt sich über g(6) auch die Wahrscheinlichkeit für den Fehler 2. Art B, d.h. die Wahrscheinlichkeit sich für H^ zu entscheiden, obwohl Hj richtig ist (vgl. Aufgabe 6.1), bestimmen. Denn ist der wahre Parameter aus dem von der Alternative zugelassenen Bereich für θ (kurz: θ6Η^) , so ist die Wahrscheinlichkeit 3 in Abhängigkeit von θ gerade β(θ) = 1 - g(θ)

für alle θ C H

.

170

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

Es soll die Gütefunktion des im Aufgabenteil

(a) durchgeführten

Einstich-

proben - Gauß - Tests berechnet werden. Die zweiseitige Hypothese Hg : μ = 175 = μ 0 wird dabei zugunsten von Η, : μ + 175 = μ 0 zum Niveau α = 0.10 verworfen, falls





| ^ Z 5 .

ν η

5

| >

1.6449

=

V

g

5

= u

W

2

gilt. Da die Zufallsvariable X mit (vgl. Aufgabe 5.2) E(X) = μ

und

Var(X) = ^ a \ = ^

•• 16 = 0.64

Ν(μ,0.64) - verteilt ist, unterliegt die zugehörige Testfunktion (vgl. Aufgabe 6.1)

7 1

Χ

"μ0

X - 175 v n

,

X - 175

4

bei Vorliegen des wahren Parameters μ

also einer Ν ^

ö.8^ '

" Verteilung

(vgl. Aufgabe 4.8). Die Gütefunktion g(p) gibt die Wahrscheinlichkeit dafür a n , daß die Nullhypothese verworfen wird. Ober die standardisierte variable Ζ - μ Q ^

Zufalls-

ergibt sich hier somit (vgl. Aufgabe 4.8)

g{μ) = P( I Z| > 1 .6449) = 1 - P( | Z| < 1 .6449) = 1 - P(- 1.6449 < Ζ < 1 .6449)

= ΐ-ρ(.ΐ.6449 - ΰ ^
°

"

erfüllt sein muß. Der Wert d wird auch als mit Sicherheit 1 - 3 abzusichernde

173

Kapitel 6: Parametrische Tests im Einstichprobenfall

A b b . £6.2.2: Verteilung von X unter H Q bzw. H.J: Dichte der N( 175,16/25) - bzw. N( 176 ,16/25) - Verteilung; Veranschaulichung des Fehlers 2. A r t BC176)

Differenz bezeichnet. Testet man die einseitige Hypothese gegen

Hj : μ > μ 0

(bzw. H Q : μ > μ 0

gegen

:μ < μ )

zum Niveau α bei vorgegebener Wahrscheinlichkeit, des Fehlers 2. Art Β an einer Stelle μJ > μ^ (bzw. μ^ < μ^) , so ergibt sich η zu

(u

1-a

,) σ 1-1

In den exakten Formeln ist hier die Varianz σ

2

2 = a l s

bekannt vorausgesetzt. 2 Näherungsweise lassen sich diese allerdings auch anwenden, wenn statt σ eine 2 gute Schätzung s (vgl. Aufgabe 5.4) verwendet wird.

174

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

Es s o l l der nötige Stichprobenumfang η bestimmt werden, um beim Testen zum Niveau α = 0.10 von gegen

H 0 : μ = 175

H^ : μ f 1 7 5

eine Differenz d = 1 g vom Sollwert 175g

bei einer gegebenen Wahrscheinlich-

keit f ü r den Fehler 2. A r t von ß = 1 - 0.975 = 0.025 abzusichern. Da die Varianz 16 angegeben worden war, ergibt sich

des Abfüllgewichts mit a i i(u1-0.05

+ u

1-0.025)

4

(U

0.95+U0.975)4

= (1.6449 + 1.9600) •16 = 207.9249

,

d.h. man benötigt mindestens 208 Dosen, damit der hier verwandte Test zum Niveau α =0.10 ein abweichendes durchschnittliches Füllgewicht vom Sollwert 175g mit einer Wahrscheinlichkeit von mindestens 0.975 entdeckt, d.h. Hg dann mit dieser Sicherheit v e r w i r f t , wenn tatsächlich d > 1 g

vorliegt.

ο -»(e) Bei gegebenem Stichprobenumfang η = 208 und bekannter Varianz σ* = 16 berechnet sich die Wahrscheinlichkeit für den Fehler 2. Art beim Testen der Hypothese H q : μ = 175

gegen

Η 1 : μ =(= 175

zum Niveau α = 0.10 über die im Aufgabenteil funktion für a l l e μ

(b) angegebene, zugehörige Güte-

Mq = 175 zu

β(μ) = 1 - g ( M ) = ® ( u g _ g 5 - i L ^ Z i

/ZUff) - e (

V o 5

-K-Z™.

s/Τθή

Somit i s t für μ =174 3(174) = Φ( 1.6449 -

174

'

175

f z m ) - Φ(- 1.6449 -

174

"

175

= φ(5.25) - Φ(1.96) ~ 1 - 0.975 = 0.025

,

bzw. f ü r μ =176 3(176) = φ(ΐ.6449 -

176

'

VTÜ?) - φ(- 1 .6449 -

1 7 5

176

^

175

/ZDff)

= Φ(- 1.96) - Φ ( - 5.25) = 1 -Φ( 1.96) - 1 +Φ(5.25) 1 - 0.975 = 0.025

,

d.h. f ü r den Stichprobenumfang η =208 i s t a l s o tatsächlich s i c h e r g e s t e l l t , daß der durchgeführte Einstichproben - Gauß - Test zum Niveau α = 0.10 eine

.

175

Kapitel 6: Parametrische Tests im Einstichprobenfall

Abweichung vom S o l l w e r t 175g

bei einer F e h l e r w a h r s c h e i n l i c h k e i t von 0.025

erkennt, wenn die wahre Abweichung 1 g b e t r ä g t , v g l . Aufgabenteil

LÖSUNG ZU AUFGABE

(d).

6.3

Der Natriumgehalt X in einem L i t e r Mineralwasser sei normal v e r t e i l t mit E r 2

wartungswert μ und Varianz σ . Da beide Parameter unbekannt s i n d , werden diese anhand von 20 gemessenen Stichprobenwerten x ^ . - . ^ g Schätzwerte

geschätzt. A l s

(vgl. Aufgabe 5.i) ergaben s i c h

χ = 68mg/£

s 2 = 1 .5 2 = 2.25 mg 2 /£ 2

und

.

2 -•(a) Ist die Varianz einer Ν(μ,σ ) - verteilten Zufallsvariablen X unbekannt, so wird zur Überprüfung von Hypothesen bzgl. des Erwartungswertes μ mittels beobachteter Werte x 4 ,...,x

1

η

der sogenannte Einstichproben - t - Test mit der

Teststatistik

t =

V/n

s

wobei

1 χ = — n

i=l

*

' " * i=l

herangezogen. Da die Testfunktion

T = *—~

μ

°

(vgl. Aufgabe 6.1)

Vrn-

- verteilt ist, sofern μ = μ^ gilt, ergeben sich die in C a h . £ 6 . 3 . 1

zusam-

mengestellten Entscheidungsregeln für ein- und zweiseitige Hypothesen zum Niveau α .

Zum Niveau α = 0.05 s o l l die Hypothese, daß der Erwartungswert μ des normalv e r t e i l t e n Natriumgehaltes X in L i t e r f l a s c h e n höchstens g l e i c h 67mg/£

ist,

getestet werden, d.h. es wird Hg : μ < 67

gegen

H 1 : μ > 67

überprüft. Es e r g i b t sich wegen χ = 6 8 , s = 1.5, η = 20 und = 1.729 gerade

.

=

^^g-o 95

176

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

t a b . C . 6 . 3 . 1 : Tests zum Niveau α für Hypothesen über den Erwartungswert μ 2

einer Ν(μ,σ ) - verteilten Zufallsvariablen X bei unbekannter Varianz Ο 2

H

H

o

μ=μ0

Hg wird zum Niveau α verworfen, f a l l s

1

μ>μ0

t >t

μ1.729 = t 1 9 ; 0 - 9 5

ί

durch Umformung dieser Ungleichung e r g i b t sich -

1 729

1 .5 + 67 = 67.5799

.

VZU

- * ( c ) Neben dem Erwaftungswert μ können natürlich auch Hypothesen über die 2

2

Varianz Ο

einer Ν(μ,σ ) -verteilten Zufallsvariablen X getestet werden. 2 2 Bezeichnet G^ einen hypothetischen Wert für Ο , so verwendet man bei Vorliegen einer Stichprobe χ^,.-.,χ^ als Prüfgröße 2 X

(n - 1) s 2 2 σ

ο 2

deren zugehörige Testfunktion

(vgl. Aufgabe 6.1), wenn σ

2 =σ

richtig ist,

2

eine χ^ ^ - Verteilung besitzt. In

£ 6 * 3 , 2 sind die sich damit ergebenden

Ablehnbereiche der Tests zum Niveau α für die verschiedenen Hypothesen zusammengetragen .

.

Kapitel 6: Parametrische Tests im Einstichprobenfall

Cab* C6-*3*2: Tests zum Niveau α für Hypothesen über die Varianz σ

177

einer

2

Ν(μ,σ ) - verteilten Zufallsvariablen X

Ho

0

σ

σ

Hp wird zum Niveau α verworfen, f a l l s

H1

2 l°o

2 2 σ >σ 0

X

2^2 ϊσο

2 , 2 σ Xn-l;l-cV2

°der

*2 3 . 1 5 bei einer Irrturaswahrscheinlichkeit von 0.05 abgelehnt werden kann. Ober den Einstichproben - t - Test ( v g l . Aufgabe 6 . 3 ) kommt man mit

= tgg.q g j

= 1.699 und

t =

s



0.0009 kann zum Niveau α = 0.05 zugunsten der Alternative Η, : σ 2 < 0.0009 verworfen werden, denn es g i l t ( v g l . Aufgabe 6 . 3 )

Χ

2

(n-1)s2

=

15 · 0.0001 0.0009

=

1 f i K C 7 1 6667

·

^7,R1 c, 1-0/2

oder

m 0.20

gegen

H1:p

yp0d-p0) - u ^ ^

* yPjd-Pt)

α

184

Teil l: Übungsaufgaben, Erläuterungen und Lösungen

um an einer Stelle p^

p^

die Wahrscheinlichkeit Β für einen Fehler 2. Art

einzuhalten (vgl. auch Aufgabe 6.2).

Im Aufgabenteil (a) wurde zum Niveau α = 0.04 die Hypothese H q : ρ > 0.5 gegen die Alternative Η, : p < 0.5 getestet. An der S t e l l e p^ = 0.46 < 0.50 = pQ i s t die Wahrscheinlichkeit f ü r den Fehler 2. Art vorgegeben mit β = 1 - 0.80 = 0.20. Um die beiden Fehlerwahrscheinlichkeiten α und 6 nicht zu überschreiten, muß a l s o eine S t i c h probe vom Umfang ' V 0.5(1 - 0.5) · uQ n

Ϊ

+ \/ 0.46( 1 - 0.46) · u Q

g6

' 0.46 - 0 . 5 Ü

g()

2

~

I V 0.250 · 1 .7507 + V 0.2484 · 0.8416 ] { -0.04

2

J

= 1047.8190 erhoben werden. Somit müssen 1048 Neugeborene auf i h r Geschlecht hin untersucht werden, damit der Test zum Niveau α = 0.04 mit 80% - iger Sicherheit HQ v e r w i r f t , wenn der wahre Anteilswert der neugeborenen Mädchen bei 46% 1 iegt.

LÖSUNG ZU AUFGABE

6.9

Der Parameter p. eines M(n;p, ,... ,p, ) - verteilten Zufallsvektors (Χ,,.-.,Χ, ) ι 1 k 1 k (vgl. Aufgabe 4.3) gibt die Wahrscheinlichkeit an, mit der bei einem Versuch bzw. bei einer Befragung ein Ereignis bzw. eine Antwort A^, i=l,...,k, eintritt, wobei die A^ paarweise disjunkte Ereignisse sind mit Pj +

=

η gibt die Anzahl der unabhängigen Wiederholungen des Versuchs bzw. der unabhängig voneinander Befragten an. Zur Überprüfung der in diesem Zusammenhang interessierenden zweiseitigen Hypothese H

o:pi=pio

für

1=1

k

'

die zum Niveau Ot gegen die Alternative Η. : ρ. 1Φ ρ. ~

1

ι

i0

für mindestens ein i€ { 1, .. .k}

185

Kapitel 6: Parametrische Tests im Einstichprobenfall

getestet werden soll, wird die Teststatistik , *

k

(0. - E . ) 2

O2

k

- 1=1 Σ ^ h rι ^ - -

Σ

(vgl. Aufgabe 6.1)

1=1

rι - »

herangezogen. Dabei bezeichnet Ο., abweichend von der in Aufgabe 5.8 gewählten Notation, die beobachtete absolute Häufigkeit des Ereignisses A^ bei insgesamt η vorliegenden Versuchsergebnissen; weiterhin gibt Ε ^ = η · ρ ^

die

unter der Hypothese H^ erwartete absolute Häufigkeit des Ereignisses A^ an. Da die Größe χ 2 bei Gültigkeit von Η 2

die Realisation einer approximativ

X^ j -verteilten Zufallsvariablen darstellt, wird die Hypothese H^ zum Niveau ot verworfen, falls gilt 2 2 X > XXk-l;l-a V ' 2 Nach einer groben Regel ist dabei die Approximation durch die χ^

- Vertei-

lung hinreichend genau, wenn höchstens 20% der unter H^ zu erwartenden Häufigkeiten Ej,...,E^ kleiner als 5 sind und keiner der Werte Ej,... als 1 ist. Natürlich wird für alle i=l,...,k

kleiner

ρ . ^ > 0 vorausgesetzt.

Bezeichnet Y eine diskrete (bzw. diskretisierte) Zufallsvariable mit den möglichen Ausprägungen yj,...,yj_ und P i = P{Y = y^}, so läßt sich obiger Test auch als ein χ 2 - Anpassungstest, vgl. Kapitel 7, auffassen, der überprüft, ob Y einer hypothetischen Verteilung mit Wahrscheinlichkeiten p.^ zugeordnet werden kann; die O^,...,0^ sind dann natürlich die bei η Beobachtungen bzw. Realisationen von Y aufgetretenen absoluten Häufigkeiten von y ^ ' * · · ' ^

unc

*

Ej,...,E k die entsprechenden unter der hypothetischen Verteilung erwarteten Häufigkeiten, E^ = η · P^q·

Das Marktforschungsinstitut stellt die Hypothese auf, daß mit Wahrscheinlichkeit p,|=0.40 ein Verbraucher das Toilettenpapier KISS regelmäßig, mit Wahrscheinlichkeit P2 = 0.30 unregelmäßig und mit Wahrscheinlichkeit

p3=0.30

nie kauft. Zum Niveau α = 0.01 soll also H 0 : p, = 0 . 4 0 = p 1 0

,

p2=0.30 = p20

,

p 3 = 0.30 = p 3 Q

gegen H, : p.j 4 P^q

f

ü r mindestens ein i e {1,2,3}

getestet werden. Als Grundlage dient eine Umfrage unter η = 120 zufällig ausgewählten Personen, von denen

= 5 4 angaben, daß sie KISS regelmäßig

kaufen

würden, 02 = 30, daß sie sich in unregelmäßigen Abständen für KISS entscheiden würden und 0, = 3 6 das neue KISS ablehnten. Zur Vereinfachung der Berech-

186

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

nung sind in tab. C6.9.1 einige Hilfsgrößen vorab ermittelt worden (E 1 = 1 2 0 · 0 . 4 = 4 8 , E 2 = E 3 = 120· 0 . 3 = 3 6 ) .

Cab. C6.9.1: Arbeitstabelle

i

0.

1

54

48

E

1

i

= 120

* pi0

•5

O 2 /E. 1 1

2916

60.75

2

30

36

900

25.00

3

36

36

1296

36.00

I

120

120

121.75

Da die zu verwendende T e s t s t a t i s t i k sich zu 3 0? χ 2 = l J - - 120 = 121 .75 - 120 = 1 .75 i=1 i berechnet und der zugehörige k r i t i s c h e Wert bei x

k-1;1-a

=x

2;0.99

=

9

·210

l i e g t , kann die aufgestellte Hypothese zum Niveau α = 0.01 nicht verworfen werden, denn χ 2 = 1 . 7 5 * 9.210

.

Kapitel 7: Anpassungstests und graphische Verfahren zur Überprüfung einer Verteilungsannahme AUFGABE 7.1 Für den Autotyp MERCADOR wurde die Reichweite (in km) einer Tankfüllung bei 81 PKW gemessen. Folgende Werte wurden ermittelt: 373 , 378 , 395 , 396 , 401 , 401 , 422 , 411 , 408 , 392 , 405 , 401 ,403 ,411 , 389 , 389 , 397 , 397 , 398 , 407 , 413 , 415 , 398 , 398 , 391 , 381 , 392 , 402 , 405 , 415 , 424 , 374 , 396 , 402 , 402 , 398 , 401 , 401 , 381 , 379 , 395 , 381 , 379 , 396 , 396 , 407 , 420 , 424 , 392 , 403 , 402 , 401 , 413 , 407 , 389 , 374 , 396 , 398 , 411 , 421 , 395 , 389 , 405 , 402 , 401 , 398 , 381 , 403 , 427 , 398 , 381 , 405 , 415 , 396 , 392 , 392 , 395 , 407 , 395 ,401 ,411 . Prüfen Sie, ob zum 5% Niveau signifikante Abweichungen der Verteilung der Reichwelte von einer Normal Verteilung mit μ = 4 0 0 km und σ 2 = 1 3 2 . 2 5 km 2 vorliegen. Verwenden Sie dabei folgende Interval lelntellung: (-»,390], (390,400], (400,410], (410,420], (420,°°).

AUFGABE

7.2

In einer Telefonzentrale klagt die Telefonistin über Arbeltsüberlastung. Man ging bislang davon aus, dass die Anzahl der innerhalb von 10 Minuten eingehenden Anrufe polssonvertellt 1st mit Parameter λ = 3 , Eine neuere Untersuchung - e s wurde In einem festen Zeltraum an jedem Tag einer Woche festgestellt,wieviele Telefonate jeweils innerhalb von 10 Minuten eingingen, vgl. cab. 7.2 - soll nun Aufschluss darüber geben, ob die bis

188

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

dato geltende Annahme über die V e r t e i l u n g der eingehenden Anrufe noch G ü l t i g k e i t b e s i t z t . Testen S i e zum Niveau a = o.05. Cab. 7.2: Anrufe in einer Telefonzentrale Anzahl der Anrufe innerhalb von 10 Minuten k

Anzahl der Zeitintervalle mit k Anrufen

0

10

1 - 2

75

3

45

4 - 5

50

6 - 7

10

8 und mehr

0

AUFGABE 7.5 Bevor der Geschäftsführer einer Süsswarenfabrik eine A b f ü l l a n lage f ü r L a k r i t z t e u f e l k a u f t , besteht er auf einen Probelauf der Maschine, um ihre Genauigkeit zu prüfen. Die Anlage s o l l Tüten mit je 1 0 0 g L a k r i t z f ü l l e n , Der Geschäftsführer entnimmt der Halbtagsproduktion eine Stichprobe von 20 Tüten und wiegt deren I n h a l t ab, v g l . tab. 7.3, tab. 7.3: Nettoinhalt ( i n g) x^, i=1,...,20,von η =20 Tüten

i x

i i

x

i

1

2

3

4

5

6

7

8

9

10

93

94

102

99

94

105

91

100

100

94

11

12

13

14

15

16

17

18

19

20

96

99

109

101

100

93

102

104

93

94

Diese Anlage wird nicht gekauft, wenn die a b g e f ü l l t e Menge X zum Niveau 5% s i g n i f i k a n t nicht n o r m a l v e r t e i l t i s t mit Erwartungswert 100 g und Varianz 16 g 2 . Welche Entscheidung t r i f f t der Geschäftsführer, wenn er den Kolmogoroff - Smlrnov - Anpassungstest zu H i l f e nimmt?

Kapitel 7: Anpassungstests und graphische Verfahren

189

AUFGABE 7.4 Dem Buchhalter des Einzelhändlers KLEIN liegen die Einnahmen von η = 1 9 zufällig ausgewählten Tagen vor, vgl. cah. 7.4. i a h - 7.4: Tageseinnahmen (in DM) x^, i = 1 , . . . , 1 9 i x

i i

x

i

1

2

3

4

5

6

7

8

9

1400

1510

1580

1590

1470

1520

1330

1630

1540

10

11

12

13

14

15

16

17

18

19

1380

1720

1530

1610

1350

1480

1530

1700

1640

1430

(a) Der Buchhalter möchte mit Hilfe eines Q - Q - P l o t s überprüfen, ob die Tageseinnahme X als normalverteilt mit Erwartungswert μ = 1 5 0 0 D M und Varianz σ 2 = l O O O O D M 2 anzusehen ist. Wie sieht das Ergebnis aus? (b) Wie verändert sich der unter (a) erstellte Q - Q - P l o t , wenn die Parameter μ und aus der Stichprobe geschätzt werden?

AUFGABE 7.5 Prüfen Sie die in Aufgabe 7.1 bei gegebenen Beobachtungswerten χ Ί ,...,χ 8 1 der Reichweite einer Tankfüllung von η = 8 1 PKW des Typs MERCADOR aufgestellte Behauptung graphisch, (a) indem empirische und hypothetische Dichte miteinander verglichen werden, (b) mit Hilfe eines Wurzeldiagramms (Rootograms). Verwenden Sie dabei die Intervalleinteilung

(370,390],

(390 ,400], (400,410], (410 , 420], (420 , 430].

Kapitel 7: Anpassungstests und graphische Verfahren

LÖSUNG ZU A U F G A B E

191

7.1

Bisher wurden Testverfahren nur bzgl. Hypothesen über die Parameter einer Verteilung behandelt (vgl. Kapitel 6), wobei die Verteilung der zugrundeliegenden Zufallsvariablen als bekannt vorausgesetzt worden war. Mit Hilfe von sogenannten Anpassungstests ist es nun möglich, Hypothesen über den Verteilungstyp einer Zufallsvariablen X zu überprüfen. Die weiteren Ausführungen beschränken sich hier auf das Einstichprobenproblem, d.h. es liegen η unabhängige Beobachtungen χ.,.,.,χ 1

einer Zufallsvariablen X vor. η

2

Mit Hilfe des χ - Anpassungstests kann die Hypothese B„ : χ sind Realisationen einer Zufallsvariablen X, die ver0 1 η 0 teilt ist gemäß der Verteilungsfunktion F^ gegen die Alternative H. :x.,...,x sind Realisationen einer Zufallsvariablen X, die nicht 1 1 η 0 verteilt ist gemäß der Verteilungsfunktion F^ zum Signifikanzniveau α (vgl. Aufgabe 6.1) getestet werden. Folgende Vorgehensweise ist dabei zu empfehlen: 1. Schritt: Unterteilung der reellen Achse in k aneinanderstoßende Intervalle: I ^ K a , ] ,

I., = < βχ , a j

2. Schritt: Bestimmung der Anzahl

^ = ( a ^ , -> .

der Beobachtungswerte, die im i - ten

Intervall I. liegen, i = l,.. . ,k [θ. von 'Observed* = 'Beobachtet'], ι ι 3. Schritt: Berechnung der unter der Hypothese erwarteten Anzahl E^ der Beobachtungswerte im i - ten Intervall durch Ε. = η · ρ. ι ι wobei p ± = P ( x e i .

, I Η ) die Wahrscheinlichkeit angibt, mit der

die Zufallsvariable X unter der Hypothese H^ Werte aus dem Intervalle

annimmt, i=l,...,k [E^ von 'Expected' = 'Erwartet'].

4. Schritt: Berechnung der Prüfgroße

2 x

Da die zu χ

2

=

k (0. -E.) 2 r· 1 1 A Ει— 1=1

02 1 ι Ϊ Γι i=l k Γ

=

n

·

gehörige Zufallsvariable unter H^ asymptotisch

2

-verteilt

ist, muß die Nullhypothese zum Niveau α verworfen werden, falls gilt: 2 X

2 X

k-l;l-a

'

192

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

2 Die verwendete Approximation durch d i e

^ - V e r t e i l u n g i s t dabei h i n r e i c h e n d

genau, f a l l s n i c h t mehr a l s 20% der E^ k l e i n e r a l s 5 und kein Wert E^ k l e i n e r als 1 i s t . B e i der Wahl der k I n t e r v a l l e I „ 1

k

i s t darauf zu a c h t e n , daß e i n e n i c h t

zu grobe E i n t e i l u n g der r e e l l e n Achse vorgenommen w i r d , denn d i e Wahrscheinlichkeit,

einen F e h l e r 2. A r t zu begehen

f a l s c h i s t ) , w i r d um so g e r i n g e r ,

( d . h . H^ anzunehmen, obwohl

d i e I n t e r v a l l e so zu wählen, daß f ü r a l l e unter H^ bedingten keiten p ^ > 0

diese

j e größer k gewählt w i r d . N a t ü r l i c h

sind

Wahrscheinlich-

gilt.

2 Der χ

- A n p a s s u n g s t e s t l ä ß t s i c h sowohl f ü r s t e t i g

a l s auch d i s k r e t

verteil-

t e Z u f a l l s v a r i a b l e n anwenden. B e i s t e t i g v e r t e i l t e n Z u f a l l s v a r i a b l e n X mit einer hypothetisch

angenommenen V e r t e i l u n g s f u n k t i o n F^ l a s s e n s i c h d i e

im S c h r i t t 3 zu berechnenden W a h r s c h e i n l i c h k e i t e n p^, i = l , . . . , k ,

wie

folgt

angeben: Pl=PX(al»

p

j

^ Schritt

= Ε

χ

(

ν

'

"

F

X(aj-l'

=

'

j=2

k

"1

'

·

1 b e d e u t e t f ü r e i n e s t e t i g e Z u f a l l s v a r i a b l e j a gerade d i e

Diskreti-

s i e r u n g , d . h . d i e E i n t e i l u n g d e r Ausprägungen in K l a s s e n . Für e i n e d i s k r e t v e r t e i l t e Z u f a l l s v a r i a b l e X ( v g l . Aufgabe 7.2) werden d i e I n t e r v a l l e s i n n v o l l e r w e i s e so f e s t g e l e g t , daß j e w e i l s nur e i n e mögliche Ausprägung von X in einem I n t e r v a l l l i e g t .

Es s e i denn, es müssen mehrere Aus-

prägungen in ein I n t e r v a l l g e l e g t werden, um d i e an d i e E^

gestellte

derung b z g l . der hinreichenden Bedingung, d i e f ü r d i e Approximation

For-

benötigt

w i r d , e i n h a l t e n zu können; es s e i g e n e r e l l auch auf Aufgabe 6.9 h i n g e w i e s e n .

Für die zufällige Reichweite X einer Tankflillung des Autotyps MERCADOR liegen η = · 8 1 Beobachtungen

vor. Zum Niveau a = 0.05 soll die Hypo

these H q :x1,...,x81

sind Realisationen der N(400,132.25)-verteilten

Reichweite X gegen die Alternative Η, : x , . . ,x 0 . sind Realisationen der nicht 1 1 ο1

N(400,132.25)-verteilten

Reichweite X 2 mit Hilfe des χ

- A n p a s s u n g s t e s t s getestet werden. Mit der bereits in der

Aufgabenstellung angegebenen Intervalleinteilung lassen sich die noch durch-

Kapitel 7: Anpassungs tests und graphische Verfahren

193

zuführenden S c h r i t t e 2 - 4 sehr einfach in Form einer A r b e i t s t a b e l l e , v g l . Cab.C7.1.1, angeben. Dabei wird zunächst die Anzahl CK der Meßwerte bestimmt, die im i - ten I n t e r v a l l liegen. Es g i l t natürlich k 5 l 0.= I 0. = η = 81 i=1 1 i=1 1

.

Die weiterhin benötigten Wahrscheinlichkeiten p . , i = 1 , . . . , k , ergeben sich 0 aus den Verteilungsfunktionswerten FA„ ( a . ) der N(400,132.25) - Verteilung an J den jeweiligen I n t e r v a l l grenzen durch Standardisierung, denn ( v g l . Aufgabe 4.7) Η

I

3.-400 V 132.25·'

a -400



11.5

' ' J = 1 '···· 5

wobei Φ die Verteilungsfunktion der Standardnormalverteilung bezeichnet. So ergibt sich etwa p 3 ( s . obige Ausführungen) zu p 3 = P ( 4 0 0 < X < 410 =

φ (

4 ^

.

)

φ (

|Hq)

4 0 0

= F°(410) τ

^ 0

-F°(400)

) = φ ( 0 8 7 )

.

φ ( 0 )

= 0.8078 - 0.5000 = 0.3078

.

Der Wert Ei=81-pi

, i=1,...,5

,

gibt dann die Anzahl der bei Vorliegen dieser Normalverteilung zu erwartenden Beobachtungen im i - ten I n t e r v a l l wieder. Zur Oberprüfung der bisher durchgeführten Rechenschritte l i e g t es nahe, die Summe der erwarteten Anzahlen zu betrachten, für die sich k l Ε. = η = 81 i=1 1

2 2 ergeben muß. Neben diesen Größen sind in Tab. L7.1.1 weiterhin CK und 0-/E-, i = 1 , . . . , 5 , die die Berechnung der Prüfgröße vereinfachen, zusammengestellt. Somit ergibt sich

Χ

=

5

0?

I

Τ

1=1

1

ι

- 81

= 8 2 . 3 4 0 9 - 81

= 1 .3409

.

2 2 Da der zugehörige k r i t i s c h e Wert bei x k _ 1.•]_α = X4.q 95 = 9 · 4 8 8 "· i e 91»

kann

diese Normal Verteilungshypothese zum 5% Niveau nicht verworfen werden, denn

194

Teil I: Übungsaufgaben. Erläuterungen und Lösungen

Cab. C7.1.1: A r b e i t s t a b e l l e ; S c h r i t t 1 - 4 des χ

i

I

i

p

°i

i

Ε . 1

2

-Anpassungstests

ΨΕί

Ο2 1

1

( - » 390]

15

0 1922

15 .5682

225

14.4525

2

(390

400 ]

26

0 3078

24 .9318

676

27.1140

3

(400

410]

25

0 3078

24 .9318

625

25.0684

4

(410

420 ]

10

0 1513

12 .2553

100

8.1597

5

(420

-)

5

0 0409

3 .3129

25

7.5463

81

1 0000

81 .0000

Ϊ

χ 2 = 1.3409 + 9.488 - x j . 0 . 9 5 - x j . ,

82.3409

·

Werden Parameter der hypothetischen Verteilung nicht vorgegeben, sondern aus der Stichprobe geschätzt, so bleibt die Entscheidung näherungsweise korrekt, wenn man die Anzahl der Freiheitsgrade zum kritischen Wert um die Anzahl der geschätzten Parameter reduziert, d.h. H^ zum Niveau α verwirft, wenn 2

>

2

wobei a =Anzahl der aus der Stichprobe geschätzten Parameter von F

0 -

ist; 2

vergleicht man in H^ z.B. die vorliegenden Beobachtungen mit der N(x f s ) Verteilung, so ist a = 2 und χ ,.. . ,x sind zum Niveau α signifikant keine I n 2 2 Ausprägungen einer normalverteilten Zufallsvariablen, wenn χ > χ

LÖSUNG ZU AUFGABE

7.2

In einer Telefonzentrale werden η =190 Z e i t i n t e r v a l l e ä 10 Minuten h i n s i c h t l i c h der z u f ä l l i g eingegangenen Anzahl X von Anrufen beobachtet. Bezeichnet man diese Beobachtungen mit x ^ , . . . » x ^ g g . wobei x^ € { 0 , 1 . . } , i = 1 . . ,190, so s o l l mit H i l f e des χ 2 - Anpassungstests (vgl. Aufgabe 7.1) zum Niveau α = 0.05 Hg : x ^ , . . . » X j g g s i n d R e a l i s a t i o n e n der Po(3) - v e r t e i l t e n Anzahl X von Anrufen gegen

Kapitel 7: Anpassungstests und graphische Verfahren

195

H 1 : x 1 , . . . , x l g o sind Realisationen der nicht Po(3) - verteilten Anzahl X von Anrufen überprüft werden. An der in der Aufgabenstellung gegebenen Tab. 7.2 läßt sich die vorzunehmende Intervalleinteilung in natürlicher Weise ablesen. Außerdem ist dort ebenfalls schon die beobachtete Anzahl der Zeitintervalle 0., i=1,...,6, zusammengestellt. Die Berechnung der in der folgenden Arbeits2

2

tabelle, vgl. Cab, C7.2.1, angegebenen Größen p^, E., CK,

/E^ für i=1,...,6

erfolgt analog zu Aufgabe 7.1. Dabei ist allerdings zu beachten, daß die benötigten Wahrscheinlichkeiten p^,...,pg sich in diesem Fall {X ist diskret verteilt) direkt aus den Einzelwahrscheinlichkeiten der unter der Hypothese Po(3) -verteilten Zufallsvariablen X ermitteln lassen. Da (vgl. Aufgabe 4.4) P(X = k) = £

e~3

, k=0,1,2,...

,

ergibt sich etwa für p^ ,0

,

p, = P{X e (-, 0] I H 0 ) = P(X = 0) = jjy e

J

= 0.0498

oder für p^ 4 p 4 = P(X e (3 ,5] I Hq) = P(X = 4) + P(X = 5) = ^ = 0.2689

5 e~ 3 +

e" 3

.

Damit liegt die zugehörige erwartete Anzahl von Beobachtungen wegen al so bei E i = 190 · P i

, i=1,. ..,6

,

E 1 = 190 · p 1 = 190 · 0.0498 = 9.462 bzw. E 4 = 190 · p 4 = 190 · 0.2689 = 51.091

.

Für die Prüfgröße erhält man nun den Wert

χ

?

=

k 0? 6 0? l γ 1 - η = l - 1 - 190 = 193.6764 - 190 = 3.6764 i=1 i 1=1 L i

d.h. da das zugehörige Quantil der

2

2 - Verteilung bei x^.q g 5 = 11.07 liegt,

kann die obige Nullhypothese zum Niveau 5% nicht verworfen werden: χ 2 = 3.6764 4 ΐ 1 . 0 7 = χ | ; 0 > 9 5

,

= χ2.1;1_α

.

196

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

t a b . C7.2.1: A r b e l t s t a b e l l e , S c h r i t t 1 - 4 des χ

1

I

1

P

°i 0]

•5

E. 1

i

ο

-Anpassungstests

°l' E 1

1

( - »>.

10

0 0498

9.462

100

10.5686

2

(0

2]

75

0 3734

70.946

5625

79.2857

3

(2

3]

45

0 2240

42.560

2025

47.5799

4

(3

5]

50

0 2689

51.091

2500

48.9323

5

(5

10

0 0720

13.680

100

6

(7

7] 0=)

0

0 0119

2.261

0

190

1 0000

190.000

I

7.3099 0 193.6764

Wird der Parameter λ der Po(λ) -Verteilung in H^ erst aus der Stichprobe geschätzt, so kann man die Freiheitsgrade des kritischen Wertes um 1 reduzieren, vgl. auch Aufgabe 7.1, d.h. die Hypothese kann dann zum Niveau α verworfen werden, wenn

LÖSUNG ZU AUFGABE

7.5

2 Neben dem χ -Anpassungstest (vgl. Aufgabe 7.1) liegt im Kolmogoroff - Smirnov - Anpassungstest vor allem bei "kleinen" Stichprobenumfängen eine Möglichkeit zu überprüfen, ob die Beobachtungen χ 1 ,...,x η Realisationen einer Zufallsvariablen mit stetiger Verteilungsfunktion F^ sind, d.h. ob die unbekannte Verteilungsfunktion F^ einer stetigen Zufallsvariablen X mit einer hypothetischen [stetigen] Verteilungsfunktion F^ übereinstimmt. Die Hypothese H 0 : Γ χ (χ) =F°(x)

für alle χ

wird dabei gegen die Alternative Hj :F^(x) ^ F^ (x)

für mindestens ein χ

mittels der Teststatistik D = \Jη D η

mit

D = sup 1 I f" (x) - S (χ) I η Χ η ' x

Kapitel 7: Anpassungs tests und graphische Verfahren

197

getestet, wobei S^(x) die empirische Verteilungsfunktion der beobachteten Werte x, ,... ,x angibt, d.h. 1 η 0 S

η

=

(x)

χχ. - 3

1 Der Wert D

n

für alle j=l,...,n für genau k Beobachtungen j a u s xj ».··/X n

x

χ > χ. - 3

für alle j=l,...,n

gibt gerade den größten vertikalen Abstand zwischen h y p o t h e t i -

scher u n d empirischer Verteilungsfunktion wieder. Zum Niveau CL erfolgt eine Ablehnung der Nullhypothese, falls gilt D >d , - η;1-α

,

wobei die Quantile d . für α = 0.10, 0.05, 0.01 zum Beispiel der C a b . * η;1-α C7.3.1 entnommen werden können.

Cab. C7.3.1: Kritische Werte d^

η d

n ,0 90

d

n ,0 95

d

n ,0 99

für den Kolmogoroff - Smirnov - Anpassungs-

5

8

10

20

40

> 40

1 .14

1.16

1.17

1 .19

1.20

1 23

1 .26

1.28

1.29

1.31

1.33

1 .36

1 .50

1.53

1 .55

1.57

1.59

1 63

Für das zufällige Nettogewicht X von Tüten, die mit Lakritzteufeln

gefüllt

sind, liegen η = 2 0 Stichprobenwerte χ^,.,.,χ^ο vor. Bezeichnet F^ die zu X gehörige, unbekannte Verteilungsfunktion, so soll mit Hilfe des Kolmogoroff Smirnov - Anpassungstests zum Niveau α = 0.05 HQ : F x ( x ) = F ° (x)

für alle χ

H.| : F x ( x ) ^ F ® ( x )

für mindestens ein χ

gegen ,

wobei F^ der Verteilungsfunktion der N(100,16) - Verteilung entspricht, g e testet werden. Um die zugehörige Teststatistik berechnen zu können, müssen zunächst die Werte der empirischen Verteilungsfunktion S, n (x.) sowie die der 1 0 hypothetischen Verteilungsfunktion F x ( x . ) für i=1,...,20 ermittelt werden. Zu diesem Zweck wird eine Arbeitstabelle angelegt, vgl. C a b . C 7 . 3 . 2 , in der

198

Teil I: Übungsaufgaben,

Erläuterungen

und

Losungen

die verschiedenen Beobachtungswerte der Größe nach geordnet eingetragen werden. Aus den l i n k s von dieser Zahlenreihe stehenden zugehörigen Indizes i = 1 , . . . , 2 0 lassen sich dann die Werte ^20^ x i^ = lTiJ

x

i -xj

9 e n a u k Beobachtungen x^ aus x,|,...,x,,g

ablesen. So ergibt sich zum Beispiel für χ =94 s

2 o

( 9 4 ) =

! r

0

·

4 0

-

denn genau 8 der 20 Beobachtungswerte sind kleiner oder gleich 94,bzw. für χ = 102 erhält man 5^(102) = ^ = 0 . 8 5 bei 17 beobachteten Werten, die kleiner oder gleich 102 sind. Die entsprechenden Werte der Verteilungsfunktion der N(100,16) - Verteilung sind dann mittels Standardisierung gegeben durch 0

fx,-100"

wobei Φ die Verteilungsfunktion der N(0,1) - Verteilung bezeichnet. Auf diese Weise ergibt sich dann zum Beispiel F°(94) = φ ( Μ - 4 " 0 > φ(- 1 .50) = 0.0668 oder Fg(102) = Φ ( 1 0 2 4 1 °°) =Φ(0.5) - 0.6915

täh£7.3.2:

Arbeitstabelle zum Kolmogoroff - Smirnov - Anpassungstest

i

Vxi>

91 93 94 96 99 100 101 102 104 105 109

0.05 0.20 0.40 0.45 0.55 0.70 0.75 0.85 0.90 0.95 1.00

x

7 1,16,19 2,5,10,20 11 4,12 8,9,15 14 3,17 18 6 13

.

x. - 100 ι -2.25 -1.75 -1.50 -1.00 -0.25 0 0.25 0.50 1.00 1.25 2.25

x. - 1001

ι

w

-

· 0.0122 0.0401 0.0668 0.1587 0.4013 0.5000 0.5987 0.6915 0.8413 0.8944 0.9878

Ά

Kapitel 7: Anpassungstests und graphische Verfahren

199

Aus Abb. C7.3.1, in der Fjj(x) und S 2 Q ( x ) mit Hilfe der Werte aus Tab. L7.3.2 eingezeichnet sind, läßt sich nun der größte vertikale Abstand D^Q zwischen diesen beiden Funktionen ermitteln. Es ergibt sich D 2 q = sup |F°(x) - S 2 0 ( x ) | = | F ° ( 9 4 ) - S 2 0 ( 9 4 ) | = |0.0668 - 0.401 = 0.3332

.

Abb. C7.3.1: Empirische Verteilungsfunktion S 2 g(x) und Verteilungsfunktion F°(x) der N(100,16)-Verteilung

Damit hat die Prüfgröße D einen Wert von D = vTZÜ- D 2 0 = \/TÜ· 0.3332 = 1 .4901

.

Vergleicht raan nun D mit dem zugehörigen kritischen Wert aus Tab. L7.3.1 d

n;1^

= d

20;0.95

=

U 3 1

'

50 e r g i b t

sich

»

da

D = 1 .4901 > 1.31 = d, n n Q , = d , 20 ;0.95 n;1-a daß diese Normal Verteilungshypothese Hg zum Niveau α = 0.05 verworfen werden muß. Der Geschäftsführer wird nach den von ihm aufgestellten Bedingungen

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

200

die Abfüllanlage nicht kaufen.

Werden die Parameter der hypothetischen Verteilung F^ erst aus der Stichprobe geschätzt, so ist obiges Vorgehen konservativ, d.h. grob gesprochen, es wird länger an der Nullhypothese festgehalten als angebracht [auf diesen Fall zugeschnittene kritische Werte sind für Tests auf Normalverteilung und Exponentialverteilung in entsprechender Literatur vertafelt].

LÖSUNG ZU AUFGABE 7 A Als graphisches Verfahren zur Überprüfung einer Verteilungsannahme bzgl. einer Zufallsvariablen X, für die Realisationen χ ,...,x vorliegen, wird häufig der sogenannte Quantile - Quantile - Plot (kurz: Q - Q - Plot) verwandt. Für die der Größe nach (vom kleinsten zum größten) geordneten Beobachtungswerte x,..,...,x, . gilt nun, daß der i - te Wert x,.. dem empirischen r (1) (n) (i) i/(n+l) -Quantil für i=l,... ,n entspricht. Damit ist also x. .. =x... i/(n+l) (i) ein Schätzwert für das theoretische Quantil 5jy(n+jj ' ί=1ι···/η» der vermuteten zugrundeliegenden Verteilung (vgl. Aufgabe 3.8, 5.1). Als Q - Q - Plot wird dann ein Koordinatensystem bezeichnet, in dem die empirischen Quantile gegen die theoretischen, d.h. die unter der Verteilungsannahme zu erwartenden , Quantile abgetragen werden. Trifft die Verteilungsannahme zu, so müssen die Punkte (ξ. , χ,.,), i=l,...,n, annähernd auf einer Ursprungsgeraden 1 / (n+1) (i) mit Steigung 1 liegen. -»(a) Anhand der η = 19 Beobachtungswerte

s o l l mittels eines Q -

Q - Plots überprüft werden, ob die Tageseinnahme

X des Einzelhändlers Ν( 1500,

10000) - v e r t e i l t i s t . Dies entspricht natürlich einer Prüfung auf N(0,1) Verteilung bei standardisierten Beobachtungen (x^ - 1500)/100 , . . . , ( x ^ g - 1500)/100. Geht man von den der Größe nach geordneten Tageseinnahmen x^j,... ( x ^ j - 1500)/100

über zu den entsprechenden standardisierten Werten ^ x (19) " 1 500)/100, so müssen diese empirischen Quan-

t i l e a l s o mit den theoretischen Quantilen u ^ o » . . . >u^g/20

c er

'

Standard-

normalverteilung, die im Tabellenanhang zu finden sind, verglichen werden. Mit den in Cab. £7.4.1 zusammengestellten empirischen und theoretischen Quantilen (für 1=5,7,9,11,13,15 bene

wurde die ebenfalls im Anhang angege-

Approximationsformel von Hastings zur Bestimmung von u ^ g

zogen) l ä ß t sich der in Abb.C7.4.1 dargestellte wurde neben den Punkten ( u i / 2 0 ' ^ x ( i ) "

herange-

Q - Q - P l o t zeichnen. Dabei

/lt>0), i=1

19, auch die Ur-

201

Kapitel 7: Anpassungstests und graphische Verfahren

sprungsgerade mit Steigung 1 eingetragen. tah. C7.4.1: Tageseinnahmen

standardisierte Tageseinnahmen

(x^.j - 1500)/100 sowie Quantile u i / 2 Q der N(0,1) - Verteilung für i = 1 , . . . ,19 i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

X

( x ( i ) - 1500)/100

(i)

1330 1350 1380 1400 1430 1470 1480 1510 1520 1530 1530 1540 1580 1590 1610 1630 1640 1700 1720

U

i/20

-1.6449 -1.2816 -1.0364 -0.8416 -0.6742 -0.5244 -0.3849 -0.2533 -0.1254 0.0000 0.1254 0.2533 0.3849 0.5244 0.6742 0.8416 1.0364 1.2816 1.6449

-1.7 -1.5 -1.2 -1.0 -0.7 -0.3 -0.2 0.1 0.2 0.3 0.3 0.4 0.8 0.9 1.1 1.3 1.4 2.0 2.2

Aus Abb. L7.4.1 wird e r s i c h t l i c h , daß eine Abweichung der Verteilung der Tageseinnahmen von der N(1500,10000) -Verteilung zu verzeichnen i s t .

-(b)

Wird e i n Q - Q - P l o t zur graphischen Überprüfung e i n e r

Verteilungsan-

nahme verwendet, wobei d i e Größe der Parameter d i e s e r V e r t e i l u n g bekannt i s t ,

nicht

so können d i e s e unbekannten Parameter durch s i c h aus der

Stich-

probe ergebende Schätzwerte e r s e t z t werden.

Um mit Hilfe eines Q - Q - P l o t s zu prüfen, ob die beobachteten Tageseinnahmen Realisationen einer normal verteil ten Zufallsvariablen sind mit Mittelwert x

=

1

19

T¥ J

x

i

=

1

W*

28940

=

1523

·16

und Standardabweichung

s = Jjg ^

χ2-19χ2) =

(44307400 -44080311 .33) = 112.32

,

202

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

Abh. C7.4.1: Q - Q - P l o t für die Einnahmen an η = 19 Tagen zum Vergleich mit der N( 1500,10000) - Verteilung

geht man analog zum Aufgabenteil (a) vor. Die in Cab.C7.4.2 zusammengestellten Größen sind nur in soweit gegenüber den Werten aus Tab. L7.4.1 verändert, a l s daß nun die standardisierten , geordneten Beobachtungswerte ( x ^ j - 1523.16)/112.32, i = 1 , . . . , 1 9 , benötigt werden. Abb. C7.4.2 zeigt den zugehörigen Q - Q - P l o t , der sich aus den Punkten (u^ygg.fx^.j-1523.16)/1 12.32) i = 1 , . . . , 1 9 , und der Ursprungsgeraden mit der Steigung 1 zusammensetzt. Die eingezeichneten Punkte zeigen im Vergleich zu Abb. L7.4.1 nur eine geringe Abweichung von der Geraden. Während die dort zu erkennende Punkte - Gerade nahezu parallel zur Ursprungsgeraden verläuft, wurde jetzt durch die Erhöhung des Mittelwertes diese Punkte - Gerade zur Ursprungsgeraden hin verschoben. Damit sind also keine oder nur noch geringe Abweichungen der Daten von einer N(1523.16,112.32^) - Verteilung auszumachen.

Kapitel 7. Anpassungstests und graphische

t a b . C 7 . 4 . 2 : Tageseinnahmen x ^ y

standardisierte

( x ( i ) - 1523.16)/112.32 teilung, vgl.

i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

X

(i)

1330 1350 1380 1400 1430 1470 1480 1510 1520 1530 1530 1540 1580 1590 1610 1630 1640 1700 1720

Tab.

203

Tageseinnahmen

sowie Q u a n t i l e u i / 2 Q

der N ( 0 , 1 ) - V e r -

L7.4.1

( x ( i ) - 1523.16)/112.32 -1.7197 -1.5417 -1.2746 -1.0965 -0.8294 -0.4733 -0.3843 -0.1172 -0.0281 0.0609 0.0609 0.1499 0.5061 0.5951 0.7731 0.9512 1.0402 1.5744 1.7525

Verfahren

U

i/20

-1.6449 -1.2816 -1.0364 -0.8416 -0.6742 -0.5244 -0.3849 -0.2533 -0.1254 0.0000 0.1254 0.2533 0.3849 0.5244 0.6742 0.8416 1.0364 1.2816 1.6449

A b b - C 7 . 4 . 2 : Q - Q - P l o t f ü r d i e Einnahmen an η = 19 Tagen zum V e r g l e i c h d e r N( 1523.16,112.32 2 ) - V e r t e i l u n g

mit

204

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

LÖSUNG ZU AUFGABE

7,5

->(a) Um f e s t z u s t e l l e n , ob Beobachtungen χ

, . . . ,x

"

als Realisationen

0

einer

s t e t i g e n Z u f a l l s v a r i a b l e n X mit V e r t e i l u n g s f u n k t i o n F^ anzusehen s i n d , kann man s i c h anschauen, wie groß d i e Abweichungen der empirischen

Verteilungs-

f u n k t i o n von d i e s e r V e r t e i l u n g s f u n k t i o n F^ s i n d ( v g l . Aufgabe 7 . 3 ) .

Als

w e i t e r e M ö g l i c h k e i t b i e t e t es 0 s i c h aber auch an, d i e empirische D i c h t e mit der entsprechenden D i c h t e f Χ

1"·"

teilt

Χ

η

in

k

zu v e r g l e i c h e n . Werden d i e η Beobachtungen

I n t e r v a l l e K1 = ( a Q , a 1 ] , K2 =

,a2] , . . . ,

= (a

,a f c ]

einge-

mit ajj ^ - » , a^^+oo, so h e i ß t dabei d i e Funktion n(a. - a. f

(x)

ι

=

l-l

)

f ü r a. < χ < a. i-1 - i

,

i=l,...,k

wobei n^ d i e Anzahl der Beobachtungswerte aus der Reihe χ ^ , - . - , χ ^ d i e im I n t e r v a l l

i=l,...,ki

angibt,

l i e g e n , empirische D i c h t e . Bei e i n e r

gra-

phischen D a r s t e l l u n g der empirischen D i c h t e , dem sogenannten Histogramm, w i r d a l s o i n einem Koordinatensystem über jedem I n t e r v a l l K^ e i n Rechteck e i n g e z e i c h n e t , dessen Fläche der r e l a t i v e n H ä u f i g k e i t n . / n , i = l , . . . , k , 1

0

ent-

s p r i c h t . Z e i c h n e t man nun Histogramm und h y p o t h e t i s c h e D i c h t e f ^ gemeinsam i n ein B i l d , so werden grobe Abweichungen schon d e u t l i c h .

Die aus den Beobachtungen

der Reichweite einer Tankfüllung von

η =81 PKW bei gegebener I n t e r v a l l e i n t e i l u n g ^ = ( 3 7 0 , 3 9 0 ] , . . . , K £ = (420,430] zu berechnende empirische Dichte fg^(x) s o l l mit der Dichte (x - 4 0 0 ) 2 f x °(x) -

1

v ^ F -11.5

der N(400,132.25) - Verteilung ( v g l . Aufgabe 4 . 7 ) , die der Reichweite X unters t e l l t wird, graphisch verglichen werden. In Cab. C7.5.1 sind einige H i l f s g r ö ß e n , die die graphische Darstellung von fg^(x) e r l e i c h t e r n , zusammengestellt. Aus den angegebenen enen Intervallen erhäl erhält "i-r

,5. Für i = 3 i s t etwa

a i - a i _ 1 = a 3 - a 2 =410 - 4 0 0 = 10 Anschließend muß die Anzahl n^ der ßeobachtungswerte, die im I n t e r v a l l K^ l i e g e n , f ü r i = 1 , . . . , 5 bestimmt werden. Diese wurden bereits in Aufgabe 7.1 ermittelt (dort a l l e r d i n g s mit

bezeichnet), v g l . Tab. L7.1.1. Damit

205

Kapitel 7: Anpassungs tests und graphische Verfahren

lassen sich dann die Werte der empirischen Dichte an den Endpunkten der Intervalle angeben mit n. f

81

(a

i

}

=

8l{a. - a i _ 1 J

·

So erhält man zum Beispiel für i = 3 f81(a3)

=f81(410)

=

^

= 0.0309

.

E a b . 7*5.1: Arbeitstabelle zur Erstellung eines Histogramms

i

K.=(a._ra.]

a. - a. , ^ 1-1

η. 1

1

(370,390]

20

15

0.0093

2

(390,400]

10

26

0.0321

3

(400,410]

10

25

0.0309

4

(410,420]

10

10

0.0123

5

(420,430]

10

5

0.0062

A b b . £.7*5*1 zeigt nun das Histogramm, d.h. den Graph der Funktion fgj(x) (über jedem Intervall

K. wird ein Rechteck der Höhe f0..(a·) eingezeichnet), 1 ι ο im Vergleich zur theoretisch angenommenen Dichte f^tx), die den Beobachtungen

unterstellt wird.

->(b) A l s graphisches Verfahren zur Überprüfung e i n e r Verteilungsannahme in diesem Zusammenhang das Wurzeldiagramm

(Rootogram) b e s s e r g e e i g n e t ,

sen Ausgangsposition n i c h t das Histogramm s e l b s t i s t ,

ist des-

sondern ein n i c h t -

n o r m i e r t e s Histogramm, b e i dem d i e Größe der R e c h t e c k s f l ä c h e über dem I n t e r v a l l K^ gerade der absoluten H ä u f i g k e i t n . , i = l , . . . , k r

e n t s p r i c h t . Die Höhe

r . d i e s e s Rechtecks i s t dann n a t ü r l i c h ι η.

Das z u g e h ö r i g e Wurzeldiagramm e r g i b t sich nun, wenn d i e Höhen der Rechtecksf l ä c h e n über den I n t e r v a l l e n K^ , . . .

g l e i c h \/ r^

\/ r^ g e s e t z t werden.

Bei e i n e r Anpassung der Beobachtungswerte an d i e s t e t i g e V e r t e i l u n g Z u f a l l s v a r i a b l e n X mit Dichte f ^

einer

(bzw. V e r t e i l u n g s f u n k t i o n F^) wird d i e s e s

Wurzeldiagramm mit dem Graph der Funktion

206

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

g(x) = J n *f°(x) verglichen. Dieser Vergleich läuft über die sogenannten Wurzeldiagramm Residuen

für i=l,... ,k mit

i η ( 0, , 0, Λ r. = = F (a.) - F (a. . ι a.-a. . a . - a . . N\ Χ ι X i-1 / ι l-l ι l-l ' wobei n^ die unter der Verteilungsannahme (Verteilungsfunktion F^) zu erwartende Anzahl von Beobachtungen im Intervall K^, i=l,...,k, bezeichnet. Liegt ein Wurzeldiagramm - Residuum außerhalb des Intervalls

h V ^ i - i

' 1=1

^V^-'i-i]

k

'

so kann man davon ausgehen, daß in diesem Intervall keine "gute" Anpassung an die zugrundegelegte Verteilung vorliegt. Die graphische Repräsentation erfolgt nun in der Art, daß zunächst die Funktion g(x) an der Abszisse gespiegelt in ein Koordinatensystem eingezeichnet wird. Die Rechtecke des Wurzeldiagramms werden ebenfalls an dieser Achse gespiegelt (aufgehängtes Wurzeldiagramm) und zusätzlich noch um den Wert des zugehörigen Residuums nach unten bzw. nach oben verschoben. Dabei führt ein negativer Wert des Wurzeldiagramm - Residuums zu einer Verschiebung nach unten, umgekehrt ein positiver Wert zu einer Verschiebung nach oben. Vielfach werden auch die Residuen in einer weiteren Abbildung noch einmal separat dargestellt. Gleichzeitig wird dort dann über jedem Intervall K, je eine waagerechte Linie auf der Höhe 1 / ^ a ^ - a . ^ und

^ eingetragen,

um extrem große Residuen direkt erkennen zu können. Um mit Hilfe eines Rootograms

zu überprüfen, ob die Beobachtungen χ ,... ,>

2

Realisationen einer Ν(μ,σ ) -verteilten Zufallsvariablen sind, müssen zunächst, wie oben beschrieben, die Höhen ^ r

^ r ^ der Rechtecksflächen

über den vorher festgelegten Intervallen K ^ , . . . b e s t i m m t werden. Die Funktion g(x) erhält man in diesem Fall durch (vgl. Aufgabe 4.7) (χ - μ) 2

- -/HM

2σ 2 \j 2ir

Kapitel 7: Anpassungstests und graphische Verfahren

207

und d e r zur Bestimmung des Wurzeldiagramm - Residuums RR^ f ü r i = l , . . . ,k b e nötigte

Wert r ^ e r g i b t s i c h aus

r

i

=

ai-ai_

1

(

φ

(

σ

L i e g e n k e i n e Angaben über μ. und σ 2

)

2

" ®(

σ

vor,

))

so können d i e s e durch i h r e

w e r t e χ und s , d i e aus den Beobachtungswerten b e r e c h n e t werden gabe 5 . 1 ) ,

ersetzt

Schätz-

(vgl.

Auf-

werden.

Anhand der Beobachtungswerte

soll mit Hilfe eines Rootograms ge-

prüft werden, ob die Reichweite einer Tankflillung N(400,132.25) - v e r t e i l t i s t . In Cab. C7.5.2 sind einige Hilfsgrößen zur Erstellung des Wurzeldiagramms sowie zur Bestimmung der Wurzel diagramm - Residuen zusammengestellt. Aus den gegebenen Intervallen K 1 =(370,390], K 2 = (390,400] erhält man zunächst die benötigten Intervall breiten

K g = (420,430] i = 1 , . . . , 5 . An-

schließend wird die Anzahl n^ der Beobachtungswerte, die im Intervall K^, i = 1 , . . . , 5 , liegen, bestimmt, vgl. auch Aufgabenteil ( a ) , Tab. L7.5.1. Im nächsten Schritt muß dann für i = 1 , . . . , 5 die Rechteckshöhe r^ im n i c h t normierten Histogramn bzw. V~rT im Wurzel diagramm berechnet werden. I s t etwa i = 3 , so ergibt sich r

=

3

ä ^

=

l!l·2·50

bzw

-

1.5811

.

Zum Schluß benötigt man noch die unter Normal Verteilung erwartete Rechteckshöhe r . bzw. \/~rT. Dabei i s t für i =3 ?

81

=

/ /a3 - 4 0 0 \

81 ( (410 - 400\ TT V*\ 11.5 ) -

a/

a

2 -

400

\\

M 0 0 - 400Y\ 11.5 ))

= 8.1 ( Φ(0.87) - φ (0)) = 8.1 (0.8078 - 0.5000) = 2.4932 bzw.

= / 2.4932 = 1 .5790

.

Somit lassen sich dann die Wurzeldiagramm - Residuen RR^,...,RR^ mit RR.. = \[~r7 -

bestimmen und man erhält für i =3

RR3 = f r ^ - J V 3 = 1 .5811 - 1 .5790 = 0.0021

.

208

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

tah. C7.5.2: Arbeitstabelle zur Erstellung des Wurzeldiagramms bzw. zur Bestimmung der Wurzel diagranm - Residuen

i

K

i

a.-a. , ι 1-1

η. 1

r. 1

r. 1

fr

/

1

1

(370,390]

20

15

0.75

0 .8660

0 .7602

0 .8719

-0.0059

2

(390,400]

10

26

2.60

1 .6125

2 .4932

1 .5790

0.0335

3

(400,410]

10

25

2.50

1 5811

2 .4932

1.5790

0.0021

4

(410,420]

10

10

1.00

1 0000

1.2255

1 .1070

-0.1070

5

(420,430]

10

5

0.50

0 7071

0 .2948

0 .5430

0.1641

In Abb. £7.5.2 sind das aufgehängte Wurzeldiagramm (die Rechtecke der Höhe ν Ί " 7 werden jeweils um die Werte RR. = \] r. - \Z~rT, i = 1 , . . . , 5 , verschoben) ι " 1 1 1 und die Vergleichskurve

=

ν

/

η , J x - 400\ T O ("71757

=

/

/

81 1 e 113·^=

(x - 400) 2

graphisch veranschaulicht. Aus den in Äbb. C7.5.3 abgetragenen Residuen, die im Vergleich zu den ebenfalls dort eingezeichneten Linien / y a 1 - a Q = 1 / V ^ J = 0.2236 , -1 / ^

- a Q = -1 /

= -0.2236

bzw. 1 / / a i - a . _ 1 = 1 / νΠΊΓ = 0.3162

,

-1 / y a i - a i _ 1 = -1 / νΠΓΟ" = -0.3162

,

i=2,...,5

,

zu sehen sind, wird e r s i c h t l i c h , daß die Anpassung an die Normal Verteilung r e l a t i v gut i s t .

Kapitel 7: Anpassungstests und graphische Verfahren

209

Abb. C7.5.1: Histogramm der Beobachtungswerte und Dichte f3(x) der A Ν(400,132.25} - Verteilung

370

390

«0

MO

420

430 X

V

/

Ahh_ C7.5.2: Aufgehängtes Wurzeldiagramm und zugehörige Funktion g(x) für die Reichweiten einer Tankfüllung von η = 81 PKW

210

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

370

390

WO

10

U 20

430

Abb. C 7 . 5 . 3 : Wurzeldiagramm - Residuen RR. und G r e n z l i n i e n ± 1 / V a^ i=1 5

a j ,

Kapitel 8: Parametrische Vergleiche im Zweistichprobenfall AUFGABE 8.1 In einer Molkerei wird an zwei Maschinen Vollmilch in Litertüten abgefüllt. An den beiden Abfüllanlagen wurden Stichproben vom Umfang η·, = 7 bzw. n 2 = 9 genommen, um die tatsächlich abgefüllte Ml Ichmenge pro Tüte zu überprüfen, vgl. tab. β.ι. Den Abfüllmengen sollen jeweils normalvertellte Zufallsgrössen zugrundeliegend wobei die Standardabweichungen der Anlagen vom Hersteller mit o ^ o . O l C K und a ^ o . o i S i angegeben werden. Cah. 8.1: Meßergebnisse (in l) bei der Oberprüfung zweier Abfüllanlagen

Tüte i

Anlage 1 x

1i

Anlage 2 x

2i

1

0.98

1.02

2

0.96

1.04

3

1.02

0.98

4

1.01

0.97

5

0.98

1.03

6

0.98

1.00

7

1.00

1.02

8

1.04

9

0.99

(a) Welche Breite besitzt das 0.95 - Konfldenzlntervall für die Differenz der durchschnittlichen Abfüllmengen an den beiden Anlagen ? (b) Liegen zum 5% Niveau signifikante Unterschiede zwischen den durchschnittlichen Abfüllmengen v o r ?

212

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

AUFGABE 8.2 Die in Aufgabe 8.1 vorgestellte Molkerei erhalt einen neuen Direktor, der die Studie über den Vergleich der durchschnittlich abgefüllten Milchmengen an den beiden Anlagen wiederholen möchte, Dabei will er den Stichprobenumfang η (für beide Anlagen) so festlegen, dass das Konfidenzintervall zum 95% Niveau für die Differenz der durchschnittlichen Abfüllmengen nicht breiter als b = 0 . 0 2 wird. Wie gross muss η (bei sonst gleichen Annahmen wie in Aufgabe 8.1) gewählt werden?

AUFGABE 8.5 Bei einer Untersuchung über das monatliche Bruttoeinkommen von Industriearbeltern einer Branche wird vermutet, dass der durchschnittliche Bruttoverdienst in Baden - Württemberg um mehr als 100 DM pro Monat höher ist als in Niedersachsen. Eine Stichprobe von je 41 Arbeitern ergab in Baden - Württemberg ein durchschnittliches Monatseinkommen in Höhe von x 1 = 3 D 2 5 DM bei einer Varianz von s 2 = 41068 DM 2 bzw. in Niedersachsen von x 2 = 2846 DM mit s 2 = 39236 DM 2 . Es soll angenommen werden, dass die Bruttoverdienste der Industriearbeiter normalverteilt sind und Gleichheit der (theoretischen) Varianzen vorliegt. (a) Bestimmen Sie ein 90% - Konfidenzintervall für die Differenz der Durchschnittseinkommen in den beiden Bundeslandern. (b) Lasst sich die in der Aufgabenstellung geäusserte Vermutung mit einer Irrtumswahrscheinlichkeit von 5% absichern? (c) Wie gross hätte der Stichprobenumfang n 1 = n 2 = n sein müssen, um mit dem unter (b) durchgeführten Test zum Niveau α =0,05 die Wahrscheinlichkeit e = 0 . 1 für den Fehler 2, Art, falls die betrachtete Differenz tatsächlich grösser als 150 DM 1st, abzusichern? Gehen Sie hier davon aus, dass die Varianzen der monatlichen Bruttoeinkommen gleich sind und ausserdem σ ι = σ 2 = 40000 DM 2 gilt.

Kapitel 8: Parametrische Vergleiche im Zweistichprobenfall

213

AUFGABE 8.4 Ein Versandhaus will die im Laufe eines Jahres aus zwei verschiedenen Regionen eingegangenen Bestellungen untersuchen. Bei zufälligen Stichproben von n., =12 Kunden in der ersten Region und von n 2 = 16 Kunden in der zweiten Region wurden die in cab. 8.4 angegebenen Jahresbestellsummen festgestellt. Cab. 8-4: Bestellsummen (in DM) von n 1 = 12 Kunden bzw. n £ = 16 Kunden zweier verschiedener

Regionen

Kunde i

Region 1

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

231 250 246 233 257 251 263 260 252 266 248 237

x

1i

Region 2 x

2i

228 256 272 230 243 258 271 280 221 233 274 279 253 251 248 243

Die beobachteten Werte sind als Realisationen zweier unabhängig normalvertellter Zufallsgrössen anzunehmen. (a) Berechnen Sie ein Konfidenzlntervall zum 90% Niveau für die Differenz der durchschnittlichen jahrlichen Bestellsummen in den beiden Regionen. (b) Ist die durchschnittliche Bestell summe In der 1. Region signifikant kleiner als In der 2. Region? Testen Sie zum 5% Niveau.

AUFAGBE 8.5 Für die Varianzen der unabhängigen, normalvertellten Bruttomonatsverdlenste X 1 und X 2 von Industriearbeltern einer Branche

214

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

in Baden - Württemberg und Niedersachsen wurde in Aufgabe 8.3 Gleichheit der Varianzen vorausgesetzt. Prüfen Sie zum 5% Niveau mit Hilfe der dort angegebenen Stichprobenergebnisse diese Hypothese.

AUFGABE 8.6 In einer Betriebsabteilung, in der in Akkordarbelt elektronische Bauteile zusammengesetzt werden, soll untersucht werden, ob durch eine Senkung der Raumtemperatur um 2°C eine Stelgerung der Produktivität erreicht werden kann. Bei 8 ausgewählten Arbeltern wurden vor und nach der Temperaturherabsetzung die gefertigten Stückzahlen an einem Tag festgehalten, vgl. cab. 8.6 . Es soll Normalverteilung vorausgesetzt werden. tab. 8.6: Produzierte Stückzahlen x^- und

» i = U - - - > 8 , vor und nach der

Senkung der Raumtemperatur Arbeiter i x

1i

x

2i

1

2

3

4

5

6

7

8

236

258

225

244

239

256

224

262

230

261

230

251

230

254

228

258

(a) Berechnen Sie die paarweisen Differenzen der Beobachtungswerte. (b) Bestimmen Sie ein 0.95 - Konfidenzintervall für die Differenz der durchschnittlichen Stückzahlen, wenn Sie davon ausgehen können, dass die Varianz der gepaarten Differenzen bekannt ist mit 36. (c) Kann die Hypothese, dass vor und nach der Herabsetzung der Temperatur durchschnittlich gleichviel produziert wurde, zum Niveau 0.10 verworfen werden? Es werde wiederum vorausgesetzt, dass V F 3 6 gilt.

Kapitel 8: Parametrische Vergleiche im Zweistichprobenfall

215

AUFGABE 8.7 Auf einer landwirtschaftlichen Versuchsanlage werden zufallig 10 Felder ausgewählt, um ein neues Düngemittel für den Kartoffelanbau zu testen. Nachdem jedes Versuchsfeld halbiert wurde, wird in der ersten Hälfte das herkömmliche Düngemittel und in der zweiten Hälfte das neue Mittel eingesetzt. Die Jeweiligen Ernteerträge, die in cat. 8.7 zusammengestellt sind, sollen als Realisationen normalverteilter Zufallsvariablen X·, und X 2 angesehen werden. 2

Cab- 8.7: Ernteerträge x ^

und x^^, i=1,...,10

, in kg / m

von 10 Versuchs-

feldern nach Einsatz von zwei verschiedenen Düngemitteln Feld i x

1i

X

2i

1

2

3

4

5

6

7

8

9

10

7.1

6.4

6.8

8.8

7.2

9.1

7.4

5.2

5.1

5.9

7.3

5.1

8.6

9.8

7.9

8.0

9.2

8.5

6.4

7.2

(a) Bestimmen Sie ein Konfidenzintervall zum Niveau 0.90 für die Differenz der durchschnittlichen Ernteerträge nach dem Einsatz der beiden Düngemittel. (b) Wurden die durchschnittlichen Ernteerträge bei einer Irrtumswahrscheinlichkeit von 0.05 durch das zweite, neue Düngemittel signifikant gegenüber dem herkömmlichen Düngemittel gesteigert ?

AUFGABE 8.8 Prüfen Sie mit Hilfe der Daten aus Aufgabe 8.7, ob die Varianz Op der Differenz D = X 1 - X 2 der Ernteerträge zum 1% Niveau signifikant kleiner als 2 ist.

AUFGABE 8.9 Ein Grosshandelsunternehmen für Glas- und Geschenkartikel be-

216

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

zieht seine Kristallglaslieferungen Uber zwei verschiedene Speditionen. Bei einer stichprobenartigen Oberprüfung der Lieferungen stellt das Unternehmen fest, dass bei 200 Kartons, die mit der Spedition ADLER angeliefert worden waren, 18 wegen Glasbruches reklamiert werden mussten, und bei 160 Kartons, die die Spedition ALBATROSS befördert hatte, 12 Glasbruchreklamationen zu verzeichnen waren. Testen Sie zum Niveau α = 0 . 1 0 die Hypothese, dass die beiden Speditionen "mit gleicher Sorgfalt" ihre Lieferungen befördern.

AUFGABE 8.10 Für das Toilettenpapier KISS wurde vom neuen Leiter der Marketingabteilung des Herstellers eine zweite Umfrage in Auftrag gegeben. Von 100 zufallig ausgewählten Personen gaben nach der Benutzung einiger Proberollen 46 zur Kenntnis, dass sie KISS regelmassig kaufen würden, 40 sagten, sie würden sich nur in unregelmassigen Abstanden beim Kauf für KISS entscheiden, und m der Befragten lehnten das neue Toilettenpapier ganz entschieden ab. Ist dieses Umfrageergebnis nun zum Niveau 10% signifikant verschieden von dem in Aufgabe 5.8 geschilderten Ergebnis der ersten Marktuntersuchung oder sind die Unterschiede lediglich durch 'Zufall' zu erklären?

Kapitel 8: Parametrische Vergleiche im Zweistichprobenfall

LÖSUNG

ZU A U F G A B E

217

8.1

Dieses Kapitel beschäftigt sich mit dem Vergleich von einander entsprechenden Verteilungsparametern zweier Zufallsvariablen X^ und X^. Liegen n^ unabhängix

ge Beobachtungen

j['---'xjn

von

^^

n

2 unabhängige Beobachtungen

x„,,...,x„ von X„ vor, so spricht man in diesem Zusammenhang auch von einem 21 2n 2 2 Zweistichprobenproblem. Weiterhin soll zunächst vorausgesetzt werden, daß Xj und X^

(stochastisch)

unabhängige Zufallsvariablen (vgl. Aufgabe 3.14) sind, wobei X einer 2 2 Ν ί μ ^ σ ) - Verteilung bzw. X^ einer - Verteilung unterliegt. Analog zum Einstichprobenfall lassen sich auch hier erwartungstreue Schätzfunktionen 2 , 2 für die unbekannten Parameter μ^, μ^· ^ und ^ σ^ a n 9 e b e n · A u s vorliegenden Beobachtungswerten ergeben sich als Schätzwerte (vgl. Aufgabe 5.1)

1

"ί - χ. = ~~~ yL χ.. 1 n, , . Ii

. "2 μ =χ =— y χ,. 2 2 n. .'·, 2i

,

K

1 1=1

η 1 ν , - 2 ) (χ -χ ) η -1 Ii 1 1 ι=1

-2 2 Ο ,= s 1 1

,

2 1=1

,

η -2 2 1 r , - ,2 σ =s = ) (χ. . - χ . ) 2 2 η -1 , L , 2ι 2 2 ι=1

Von Interesse sind nun vorrangig Konfidenzintervalle und Testverfahren für die Differenz μ - μ

der Erwartungswerte der beiden Zufallsvariablen sowie 2 2 für den Quotienten ö^ / der Varianzen. Im folgenden wird zunächst der Fall behandelt, daß die Varianzen der beiden

Zufallsvariablen aus langjährigen Erfahrungswerten heraus bekannt sind, d.h. 2 2 2 2 es seien σ^ = und σ^ = bekannt.

Für die an zwei Anlagen in Litertüten abgefüllte Milchmenge X. bzw. X 0 wird 2 2 ) - bzw. Ν(μ 2 ,0.015 ) - v e r t e i l t ist. Aus

angenommen, daß diese Ν(μ 1 ,0.010

den vorliegenden n^ = 7 bzw. η^ = 9 Beobachtungswerten an den beiden Maschinen ergeben sich die -

1

x, = 7

X

2

=

1

?

Durchschnittswerte ?

1

.1

= 7 · 6.93 = 0.99

9

.Σ, x 2i

=

1

ί"

9

·09

=

1

- ( a ) Ein (1-a) - Konfidenzintervall Üj -

der

·01

,

*

(vgl. Aufgabe 5.3) für die Differenz 2 2 Erwartungswerte zweier unabhängiger Ν(μ ,σ - bzw. Ν(μ ,σ ) -

218

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

verteilter Zufallsvariablen Xj und X^ ist bestimmt durch

2

X

/< V

1 -x 2 - V a / 2

ij

τ

2 °2* " ~ / χ, - χ„ + u, . η ' 1 2 l-a/2

Für 1 - a = 0.95, d.h. a/2 = 0.025, ist u.,_ a/2 = u Q

g 7 g

2 '

2 °2*

/V

= 1 .9600 und m i t x 1 = 0 . 9 9 ,

x 2 = 1 . 0 1 , aij* = 0.0001 , σ^* = 0.000225 ergibt

[0.99 - 1.01 - 1 .9600 .

^ ψ Π Έ ^ ψ ϊ ί , ).99 - 1.01

+

1.9600 .

/



l+ M

i

^

l

J

= [-0.02 - 0.0123 , - 0 . 0 2 + 0.0123] = [-0.0323 , -0.0077] ein 0.95 - Konfidenzintervall

f ü r die Differenz der durchschnittlichen A b -

füllmengen der beiden Anlagen. Es besitzt eine Breite (vgl. Aufgabe 5.3.b) b = -0.0077 - (-0.0323) = 0.0246

.

-»(b) In Cab. C8.1.1 sind die möglichen Hypothesen über die Differenz μ^ bei vorgegebenem (bekanntem) Wert d zusammengestellt. Da die Varianzen 2

2

und

σ 2 bekannt sind, ergeben sich die ebenfalls dort angegebenen Entscheidungsregeln zum Niveau OL (Zweistichproben - Gauß - Test) über die Prüfgröße

/

"1

+ n

2

denn diese ist im Fall μ^ - μ^ = d gerade die Realisation einer Ν(0,1) - verteilten Zufallsvariablen (vgl. Aufgabe 6.1).

Zum Niveau a = 0.05 soll getestet w e r d e n , ob signifikante Unterschiede zwischen den durchschnittlich abgefüllten Milchmengen vorliegen, d.h. ob die Hypothese H q : p1 = μ 2

«

μ1 - μ 2 = 0

zugunsten der Alternative H^

μ1 f μ 2

«

μ1 - μ 2 f 0

Kapitel 8: Parametrische Vergleiche im Zweistichprobenfall

219

£8.1.1: Tests zum Niveau α für Hypothesen über die Differenz μ. - μ der 2 2 Erwartungswerte zweier unabhängiger Ν(μ^,σ^) - bzw. Νίμ^,^*' " verteilter Zufallsvariablen bei vorgegebenem Wert d

H

H

o

HQ wird zum Niveau α verworfen, falls

1

Uj - μ 2 > d

z>u

Uj - μ 2 > d

^ -μ

Ζ< u α

μ

μ

ΐ"μ2

= ά

2

1 " μ2 ^

< d d

lzl>ul-a/2

verworfen werden kann. Mit den bereits im Aufgabenteil schnittsmengen x 1 = 0 . 9 9 und d = 0,

l-a

(a) ermittelten Durch-

= 1.01 erhält man für die Teststatistik bei

0.0001 , 02* = 0.000225 den Wert 0.99-1.01 Γ2

lüL^Jl

/

n

1

+ n

=

.

3 J 9 0 9

/0.0001 , 0.000225 /ÖTPÜl

?

2

Da das zugehörige Quantil der N(0,1)-Verteilung bei

u

i_ α /2 = u 0 9 7 5 =

1,9600

liegt, muß die Hypothese bei einer Irrtumswahrscheinlichkeit von 0.05 verworfen werden , denn |z| = 3.1909 > 1.9600 = V 9 7 5

LÖSUNG ZU AUFGABE

=

Vci/2

'

8.2

Damit das Konfidenzintervall zum Niveau 1-a für die Differenz μ - μ

2

2

1

2

der Er-

wartungswerte der Ν ί μ ^ σ ^ - bzw. Ν(μ 2 ,σ 2 ) - verteilten Zufallsvariablen Xj und X (vgl. Aufgabe 8.1.a) eine vorgegebene Breite b nicht überschreitet, 2 2 2 2 wobei die Varianzen σ = σ und σ_ = bekannte Größen sind, müssen jeweils 1 1 2. Z* Stichproben vom Umfang 2u

l-a/2

(σ,

gezogen werden (vgl. Aufgabe 5.3.b). (Der Einfachheit halber wurde hier nj = n 2 = η gesetzt.)

220

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

Sind öj und σ^ unbekannt, so ist diese Formel zur Bestimmung des Stichprobenumfanges η noch approximativ richtig, wenn aus Vorstichproben gute Schätzungen für die Varianzen vorliegen.

Das 0 . 9 5 - Konfidenzintervall fur die Differenz μ^ - μ^ der Erwartungswerte der abgefüllten Milchmengen X^ und Xg, für die Normalverteilung mit bekannten Va2

rianzen

2

= 0.0001 und Oj* = 0.000225 vorausgesetzt worden war, v g l . Auf-

gabe 8.1, s o l l höchstens eine Breite b = 0.02 besitzen. Damit diese Forderung eingehalten werden kann, müssen an beiden Anlagen wegen η >

2u

0.975]2 " Ο Γ

2

(0.0001 + 0.000225) =

[^57^°]

• 0.000325 = 12.4852

mindestens 13 Milchtüten z u f ä l l i g ausgewählt werden.

LÖSUNG ZU AUFGABE

8.5

Für das monatliche Bruttoeinkommen X^ bzw. X 2 von Industriearbeitern einer Branche in Baden - Württemberg bzw. Niedersachsen liegen aus beiden Bundesländern jeweils n^ = n ^ =41 Beobachtungswerte v o r , aus denen s i c h die S t i c h probenmi ttelwerte x.j = 3025 DM

,

x 2 = 2846 DM

und die Stichprobenvarianzen s 2 = 41068 DM2

,

= 39236 DM2

ρ berechnen. Es wird angenommen, daß X. einer Ν(μ, ,σ.) - Verteilung und X , einer 2 2 2 Ν(μρ,σ ? ) - Verteilung u n t e r l i e g t mit a . - a ? .

-»(a) Sind zwei Zufallsvariablen X

und X

2

unabhängig normalverteilt mit Er-

2

wartungswert μ^ bzw. μ^ und Varianz Oj bzw. bekannt aber gleich, d.h.

wobei diese Varianzen als un-

vorausgesetzt werden, so ist ein (1 —ot) -

Konfidenzintervall für die Differenz μ^ - μ^ gegeben durch (vgl. Aufgabe 8.1)

1 X

1

X

2

+ t

n 1 +n 2 -2;l-a/2 * S p '

1

Kapitel 8: Parametrische Vergleiche im Zweistichprobenfall

221

Dabei bezeichnen χ^ und x^ die jeweiligen Stichprobenmittelwerte und t

„ das Y - Ov u a n t i l der tn + I 2„ - Verteilung. Mit den Stichprobenvan +n -2;γ i V 2 2 2 rianzen s, und s_ ist s gegeben durch 1 2 ρ 2

100

zu verwerfen. Da die monatlichen Einkommen X^ und X2 als unabhängige normal v e r t e i l t e Zufallsgrößen mit unbekannten, aber gleichen Varianzen angenommen werden können, erhält man mit 5^= 3025 , x 2 = 2846 , s p = 200.3796 , nl=n2=41 d= 100 für die zu verwendende Prüfgröße V

t =

s

p

·

J

V

=

X y

n

i

n n

2 2

3025 - 2846 - 100

=

,

7g51

T / fTpr

on.

200.3796

Da der zugehörige k r i t i s c h e Wert bei t läßt sich wegen

+n

_2-1 -α = ^80-0

liegt,

^ ^

t = 1 .7851 > 1.664 = t Q n . n Q , = t , 80;0.95 n^+nn2-2;1-a die geäußerte Vermutung zum 5% Niveau s i g n i f i k a n t absichern.

-»(c) Sind die Varianzen ö

und a o zweier unabhängiger, normalverteilter Zu2 2 2 fallsvariablen bekannt und gilt σ = σ_ = Ο. (oder liegt aus Vorerhebungen eine 2

gute Schätzung für

1

2

*

vor), so kann man den nötigen Stichprobenumfang n^=n =n

bestimmen, um beim Testen der Differenz μ^ - μ^ der Erwartungswerte dieser Zufallsvariablen die Wahrscheinlichkeit α für den Fehler 1. Art und die Wahr-

Kapitel 8: Parametrische Vergleiche im ZweistichprobenfaU

223

scheinlichkeit Β für den Fehler 2. Art (an einer vorgegebenen Stelle im Alternat! vbereich) nicht zu überschreiten

(vgl. Aufgabe 6.1, Aufgabe 6.2).

Will man bei der einseitigen Hypothese H Q : Uj - μ 2 < d

gegen

(bzw. H q : M j - w 2 > d

Hj: gegen

- μ2 > d HjS μ 1 - μ 2 < d)

die Wahrscheinlichkeit α für einen Fehler 1. Art und gleichzeitig an einer fest gewählten Stelle d^ > d

(bzw. d ^ < d ) die Wahrscheinlichkeit für einen

Fehler 2. Art absichern, so muß

η > 2

'(ui-e

+ u d j

i-ß) -d

, σ

*

gewählt werden. Im zweiseitigen Testproblem V

μ^ - μ 2 = d

gegen

H^ : μ 1 - μ 2 + d

muß gelten

η > 2

d

l"

d

um das Niveau α und die vorgegebene Wahrscheinlichkeit β des Fehlers 2.Art an einer Stelle d^ ^ d einhalten zu können.

Es ist der benötigte Stichprobenumfang η zu bestimmen, so daß beim Testen zum Niveau α = 0.05 von Η Q. μ^ - P2 < 100

gegen

H^

μ1-μ2>100

die Wahrscheinlichkeit β = 0.1 des Fehlers 2. Art an der Stelle 2 2 2

d.=150>100=d

abgesichert wird. Da nach Voraussetzung σ^ = a ^ = 4 0 0 0 0 = σ * , ergibt sich mit u

1-a

= u

0.95

= 1

·6449'

u

1-fTu0.90

=

1

·2816

„ ^ , f(1.6449 + 1 .2816) · y T O U D l 2 η > 2 · ^ 150 - 100 J

=

,,, n , n Q ·0609

274

-

d.h. es müssen jeweils mindestens 275 Industriearbeiter aus den beiden Bundesländern zufällig ausgewählt und nach ihren Bruttomonatslöhnen befragt werden, damit der obige Test in (b) sicherstellt, daß, falls Hg vorliegt, man sich höchstens m i t Wahrscheinlichkeit α = 0 . 0 5 für H^ entscheidet, und daß, falls in Wirklichkeit die wahre Differenz μ^ -

größer als oder gleich

d^ = 1 5 0 ist, man sich höchstens mit Wahrscheinlichkeit β = 0.10 für Hg entscheidet.

224

Teil I: Übungsaufgaben, Erläuterungen und Losungen

LÖSUNG ZU AUFGABE

8.4

Den Bestellsummen X^ und X^ von Kunden i n zwei Regionen w i r d j e w e i l s Normalv e r t e i l u n g mit unbekannten Erwartungswerten μ, und μ 9 sowie e b e n f a l l s unbe2 2 kannten Varianzen σ^ und σ^ u n t e r s t e l l t . Außerdem s e i e n X^ und X^ ( s t o c h a s t i s c h ) unabhängig. Aus den angegebenen n^ = 12 bzw. n £ = 1 6

ßeobachtungswerten

l a s s e n s i c h d i e s e Parameter schätzen durch (vgl. Aufgabe 8.1) n

V

V

^

n

-* 2 2 1 =" s ?

=

1

12

J / l i

X

= 1 ? J / l i

2

,

16

2 i =

v T ·

249.5

[ i

1 6 ^ / 2 1 = ^ ·

=

4040

=

252

'

x

5 i " V ? )

x

1 6 i I= Tc °· I( λ| /χ 2 , ί i -- 16x, · 5368 2 i "- n"oXo 2 * 2 ] I== ΤΊΓ 2 ) = i

π ·

$

*?i"

1 2

·5

*?)

= TT-1415

= 128.6364

ΟO 4 = = s,



:357.8667

-»(a) Die Bestimmung eines (1—α) - Konfidenzintervalles für die Differenz 2 2 Uj - μ^ der Erwartungswerte zweier unabhängiger Ν(μ^,σ^) - bzw. ~ verteilter Zufallsvariablen X

und X

ist für den Fall, daß die Varianzen σ?,

2

β2 unbekannt und ungleich sind (Behrens - Fisher - Problem), nur noch approximativ möglich. Ein Konfidenzintervall für μ^ - μ^ zum Niveau 1-a ist dann gegeben durch (vgl. Aufgabe 8.1.a)

wobei sich der Freiheitsgrad \> der t - Verteilung aus

berechnet. Ist der Wert von ν keine ganze Zahl, so wählt man die nächstkleinere ganze Zahl.

Kapitel 8: Parametrische Vergleiche im

Mit s 2 = 128.6364

, s 2 = 357.8667

225

Zweistichprobenfall

, n 1 = 12 , n 2 = 16 ergibt sich zunächst der

approximative Freiheitsgrad wegen

(m.

6364

Λ

s2 357.8667V

12

( zu 24. Da ^

1 2 8

jf

6 4

)

/l1

1

+ (

-

L

3 5 7

1

f

6 7

= 24.9946 )

= 249.5 , x 2 = 252.5 , t 2 4 " 1 - a / 2

approximatives 0.90 - Konfidenzintervall

/l5 = t

24O

95 =

1

·711

ist

also

e i n

für die Differenz μ^ - μ 2 der durch-

schnittlichen Bestell summen in den beiden Regionen gegeben durch 6364 ^ 357.8667 f 16

[^249.5 - 252.5 - 1 .71 1 ·

249.5 - 252.5 + 1 .711

/

/T287 6364 T2 Τ

T

357.8667 Ϊ6

[-3.000 - 9.8418 , -3.000 + 9.8418] [-12.8418 , 6.8418]

-»(b) In c a h . C 8 . 4 . 1 s i n d d i e m ö g l i c h e n H y p o t h e s e n ü b e r d i e D i f f e r e n z der Erwartungswerte bei vorgegebenem Wert d zusammengestellt S a c h v e r h a l t , d e r im A u f g a b e n t e i l 2 2

(a) b e s c h r i e b e n w i r d ;

insbesondere

V a r i a n z e n σ^ u n d σ^ a l s o u n b e k a n n t u n d a l s u n g l e i c h z u g e l a s s e n ) . μ^ -

= d ist in d i e s e m F a l l d i e zur P r ü f g r o ß e

μ^ - μ^

(es g e l t e

(vgl. A u f g a b e 8 . 1 ,

der

sind die

Unter Aufgabe

8.3)

gehörige Zufallsvariable approximativ analog zum Aufgabenteil

t

- verteilt, wobei der Freiheitsgrad V

(a) f e s t g e l e g t ist. M i t H i l f e d i e s e r P r ü f g r ö ß e

geben sich dann die in Tab. L8.4.1

ebenfalls angegebenen

er-

Entscheidungsregeln

der entsprechenden Niveau - α - Tests.

Es soll geprüft werden, ob mit einer Irrtumswahrscheinlichkeit von 0.05 die durchschnittliche Bestellsumme der Kunden in der Region 1 signifikant ist als in der Region 2 , d.h. ob die Hypothese H q : M1 > μ 2

«

μ1 - μ 2 > 0

zugunsten der Alternative H 1 : μ1 < μ 2

«

μ1 - μ 2 < 0

kleiner

226

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

Cab. £ 8 . 4 . 1 : Approximative Tests zum Niveau α für Hypothesen über die Diffe2 renz μ^ - U^ der Erwartungswerte zweier unabhängiger Ν(μ^,σ^) 2 bzw. Ν(μ ,σ ) - verteilter Zufallsvariablen mit unbekannten und 2 2 nicht notwendigerweise gleichen Varianzen Oj und σ^ bei vorgegebenem Wert d

H

H

o

H0 wird zum Niveau α verworfen, f a l l s

1

- μ2 < d

- μ2 > d

- μ2 > d

Uj - μ 2 < d

t >t , V; l-a t2 ,n l

, - Verteilung (vgl.

Aufgabe 4.11.a). Von Interesse ist weiterhin die Prüfung von Hypothesen, die einen Vergleich 2 2 der Varianzen σ^ und σ^ möglich machen. Mit der Prüfgröße 2 S

2

2 2 die im Fall der Gültigkeit von σ, = d i e

Realisation einer F

1 2

,

. -ver-

η -Ι,ι^-Ι

teilten Zufallsvariablen darstellt, ergeben sich die in Cab. £6.5.1 zusammengestellten Entscheidungsregeln für Niveau - α - Tests bei verschiedenen einund zweiseitigen Hypothesen. Cab* C8.5.1: Tests zum Niveau α für Hypothesen über den Vergleich der Vari2 . 2 2, . 2 , anzen und α^ zweier unabhängiger Ν(μ^,σ^) - bzw. Νίμ^,σ^^ ~ 3 2 verteilter Zufallsvariablen

H

2

H

o

2 - °2

2

Η 0 wird zum Niveau α verworfen, falls

1 2 °2

F > F

2 2 σ ι2°2

2,2 σ 2

F ...

' n 21 '' ' ' ,n2Ü.'

auch

Ausprägungen der Μ(η^

,p 2 j) - verteilten Zufallsvektoren

(X

,. . .

,. . . .Xj^) bzw.

" A u ^ 9 a b e 4.3, auffassen. Das obige Testverfahren stellt

(X^i''' · 2 9 ) '

somit auch einen Test auf Gleichheit der Parameter zweier

(vergleichbarer)

Multinomialverteilungen dar, vgl. auch Aufgabe 6.8. Es sei auch noch vermerkt, daß dieser Test identisch ist mit dem Test der Homogenitätshypothese in einer (2*Ä) - Kontingenztafel, vgl. Kapitel 12; für 1=2 ergibt sich der 2 2 zweiseitige Test in Aufgabe 8.9 (mit χ = ζ dort).

In zwei Befragungen werden die Ereignisse 'regelmäßig =

'unregelmäßig

KISS kaufen'

'nicht untersucht. Über die Wahrscheinlichkeiten

=

in der ersten und

P(Aj) = p^j für die zweite Umfrage, i = 1,2.3 , soll die Hypothese H0: P

n

= PZ1

. P 1 2 = P 2 2 · P13 =

P

23

gegen die Alternative H

1:

Pij + P 2 j

minti

e s t e n s ein jt{1,2,3 }

-

240

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

zum Niveau a = 0.10 getestet werden, d.h. man möchte überprüfen, ob zwischen e r s t e r und zweiter Umfrage ein s i g n i f i k a n t e r Unterschied in den 'Kaufwahrscheinlichkeiten'

besteht.

Bei der e r s t e n , v g l . auch Aufgabe 5 . 8 , und der zweiten Befragung sprachen s i c h von den n^ = 120 bzw. η£ = 100 z u f ä l l i g ausgewählten Personen n ^ = 54 bzw. n j 1 = 4 6 f ü r regelmäßiges, n ^ = 30 bzw. n ^ = 40 für unregelmäßiges Kaufen und n ^ 2 = 3 6 bzw. n2j = 14 f ü r Nichtkaufen von KISS aus. Diese Ergebnisse s i n d in Cab. C8.10.1 in Form einer Kontingenztafel

( v g l . Kapitel 12) zusammen mit

den Randhäufigkeiten ü b e r s i c h t l i c h angeordnet. t a b . C8.10.1: (2χ3) - Kontingenztafel der beobachteten Häufigkeiten

n^,

i=1,2 , j = 1 , 2 , 3 zu den zwei KISS - Befragungen n^.

E r e i g n i s Aj 1

2

3

I

30 = n 1 2

36 = n 1 3

120 = η

40 = „ 2 2

14 = n 2 3

100 = n 2

Befragung"^^ 1

54 = n

2

46 = n 2 1

l

n

100 = n 1 1 + n 2 1

V0 = n 1 2

+

n22

S O ^

+ n^

220 = η

Die unter der Hypothese geschätzten, erwarteten Häufigkeiten n i · (n. . + n 2 . ) m . . = —Li n +n ij 1 2

'

1=1 2

'

i=1 2 3

'

s i n d in Cab. C8.10.2 zusammengestellt, wobei zu beachten i s t , daß s i c h die gleichen Randsummen ergeben wie in der Tabelle der Ausgangsdaten, was zur Rechensicherheit auch s t e t s überprüft werden s o l l t e . Für die Prüfgroße e r g i b t s i c h damit 3 y

2 X

(n

1j-m1j)2

j=1 =

m

1j

(54 - 5 4 . 5 ) 5473

,

3

(n

2j-m2j)2 m

j=1

2

(30 - 3 8 . 2 ) 3B72 +

2

(46 - 4 5 . 5 ) 2 45.5

2j

^ (36 - 2 7 . 3 ) 2 27.3

+

+

(40 - 3 1 . 8 ) 2 3T78

+ +

(14-22.7)2 ΤΠ1

= 0.0046 + 1 .7602 + 2.7725 + 0.0055 + 2.1145 + 3.3344 = 9.9917

.

241

Kapitel 8: Parametrische Vergleiche im ZweistichprobenfaH

Cab. C8-10.2: Unter der Hypothese Hg geschätzte, erwartete Häufigkeit

m^,

i = 1,2 , j = 1,2,3

m. . ij

120 · 100 220

"11

=

"l2

= 54.5

21

= n

13

= 38.2

100 · 100 220

= n

120 · 70 220

= 45.5

120

= 27.3

100 · 70 220

22

120 · 50 220

100 · 50 220

23

= 31.8

= 22.7

100

70

50

220

100

Beim in der Aufgabenstellung geforderten Signifikanzniveau α = 0.10 ist der zugehörige kritische Wert bei £ = 3 gegeben durch

xl-1 ;1-α = χ 2 ; 0 . 9 0

= 4

·605

»

χ 2 = 9.9917 > 4.605 = χ|_ 1

;1_a

so daß wegen

die Hypothese Hg verworfen werden muß; die zweite Marktuntersuchung ist im Ergebnis, d.h. bzgl. des zum Ausdruck gekommenen KaufVerhaltens, also zum 10% Niveau signifikant verschieden von der ersten, d.h. die Unterschiede in den Befragungsergebnissen sind bei diesem Testniveau nicht nur durch

'Zufall'

zu erklären. Zur Verdeutlichung seien die aus Tab. L8.10.1 berechneten Schätzungen

für

die 'Kaufwahrscheinlichkeiten' der ersten Befragung p

1 l

= ^

= 0.45

,

P12

= 0-25

,

p

1 3

= ^ = 0 . 3 0

denen der zweiten Befragung

p

2

r w

gegenüberstellt.

=

0

·

4 6

·

p22

=

w

=

0

·

4 0

-

p23

=

i w

= 0

·

1 4

Im obigen Test wird also geprüft, ob die hier ersichtlichen

Unterschiede zum geforderten Niveau auch statistisch signifikant sind. Bei Gültigkeit von H Q ergeben sich aus Tab. L8.10.2 die für die beiden gen geschätzten, hypothetischen

'Kaufwahrscheinlichkeiten'

wegen

Befragun-

242

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

Hj

K

-0

-0

n

2j

!

+ n

2

zu pii = P 2 I

100 =

m

-

Ρ°2 = Ρ °

2

Ä0

_ 50 _

_Ä0

= ^ =

„ .r.r ° ·

4 5 4 5

0.3182 n

-

,

,,,,

Mit diesen Werten werden die obigen Schätzungen in der T e s t s t a t i s t i k verglichen, denn da n - j = n^p^. und in.^ = η^p?j, schreibt sich diese auch als

χ

=

2 3 (np -np°) 1 1J V 1J I I 1=1 j=1 niP

2

2 3 η · (ρ - p° ) 2 1J = I I - — 1=1 j=1 ρ

·

Kapitel 9: Nichtprarametrische, verteilungsfreie Vergleiche im Ein- und Zweistichprobenfall AUFGABE 9.1 An η = 1 0 Tagen wurde die Zeit X, die ein Arbeitnehmer benötigt, um mit seinem PKW zur Arbeltsstelle zu gelangen, gemessen, vgl. C ah.

9.1.

Cab. 9 . 1 : i x

i

A n f a h r t z e i t e n ( i n Min.) x ^ , i=1

10

1

2

3

4

5

6

7

8

9

10

24.3

35.2

33.8

46.8

29.6

22.0

34.5

41.2

32.1

29.9

Liegen zum 5% Niveau signifikante Abweichungen des Medians der Anfahrtzelt X von 30 Minuten vor? Testen Sie mit Hilfe des (a) Zeichentests, (b) Vorzeichenrangtests von Wilcoxon.

AUFGABE 9.2 In Aufgabe 8.7 sind die Ernteerträge von 10 Versuchsfeldern nach der parallel durchgeführten Behandlung mit einem herkömmlichen und einem neuen Düngemittel aufgeführt. Testen Sie mit Hilfe des approximativen Vorzeichenrangtests von Wilcoxon, ob zum 1% Niveau das neue Düngemittel zu signifikant besseren Ernteergebnissen führt als das herkömmliche Mittel.

244

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

AUFGABE 9.5 In einem klinischen Versuch soll ein neues,den Bluthochdruck senkendes Medikament auf seine Wirksamkeit hin untersucht werden, Dazu wird einer Gruppe bestehend aus 12 Patienten dieses neue Medikament und einer zweiten Gruppe mit 10 Patienten ein Placebo verabreicht. Beide Gruppen umfassen unter Bluthochdruck leidende Patienten. In cab. 9.3 sind die Differenzen in den Blutdruckwerten, die jeweils vor und drei Stunden nach Einnahme des jeweiligen Mittels gemessen wurden, für jeden Patienten festgehalten. tab. 9 .3: Differenzen x ^ , i = 1 . . ,12 , und x 2 i ' i = 1 ' · * · ' ^ 0 »

der

Blutdruckwerte

vor und drei Stunden nach Verabreichung des Medikamentes bzw. des Placebos Medikament x

1i

Placebo x

2i

1

18.0

6.2

2

5.7

-0.5

3

-0.4

1.6

4

-2.1

15.7

5

20.5

-6.1

6

-5.6

-3.7

7

10.4

8.7

8

-7.1

2.5

9

6.2

-2.8

10

9.7

10.0

11

11.5

12

-8.9

Ist der Einfluss des neuen Medikaments auf die Senkung des Blutdrucks zum 10% Niveau signifikant grösserals der des Placebos? Beantworten Sie diese Frage mit Hilfe des Wilcoxon - Rangsummentests.

Kapitel 9: Nichtparametrische,

verteilungsfreie Vergleiche

245

AUFGABE 9.4 Prüfen Sie mit Hilfe des Kolmogoroff - Smlrnov - Tests, ob zum 10% Niveau signifikante Unterschiede zwischen den in Aufgabe 8.1 gegebenen von zwei Anlagen in Litertuten abgefüllten Milchmengen X 1 und X 2 bestehen. Verwenden Sie dazu die in Tab. 8.1 zusammengestellten Stichprobenergebnisse.

AUFGABE 9.5 Nach Markteinführung des neuartigen Toilettenpapiers KISS wurden in der nördlichen und der südlichen Region unterschiedliche Produktwerbungen gestartet. Um einen schnellen ersten Eindruck zu gewinnen, wurden aus einem Verzeichnis gleichartiger Geschäfte zufällig je 30 Geschäfte ausgewählt und nach dem Absatz, d.h. nach den abgesetzten Mengen von KISS befragt. Im Norden erhielt man von 26 und im Süden von 24 Geschäften relevante Auskünfte. Dabei gaben im Norden 14 Geschäfte an, dass sie Kiss überhaupt nicht führen, da es noch nie nachgefragt wurde, und die übrigen 12 Geschäfte gaben den Absatz (in Tonnen) von KISS wie folgt an (der Grösse nach geordnet): 1.7, 2.3, 5.9, 8.5, 9.6, 10.1, 10.1, 10.1, 12.4, 13.5, 15.7, 21.7. Im Süden führten 10 befragte Geschäfte KISS nicht und die restlichen 14 gaben den KISS - A b s a t z mit 0.9, 2.1, 3.1, 3.1, 3.1, 4.9, 7.5, 8.9, 10.5, 11.3, 11.3, 12.6, 15.3 und 19.5 an. Sind nun die beiden Produktwerbungen im Norden und im Süden zum Niveau von 10% signifikant unterschiedlich im Erfolg?

Kapitel 9: Nichtparametrische, verteilungsfreie Vergleiche

LÖSUNG ZU A U F G A B E

247

9,1

Die im Kapitel 6 und 8 behandelten Testverfahren beruhen stets auf Hypothesen bezüglich der Parameter eines den Beobachtungen zugrundegelegten, bekannten Verteilungstypes. Liegen aber Realisationen einer (oder mehrerer) Zufallsvariablen vor, über die keine konkrete Verteilungsannahme getroffen werden kann, so bedient man sich sogenannter nichtparametrischer bzw. verteilungsfreier Testverfahren, um zum Beispiel Lokationsvergleiche durchführen zu können. Im Einstichprobenfall, d.h. bei Vorliegen von η unabhängigen Beobachtungen x.,...,x einer Zufallsvariablen X, können mit Hilfe nichtparametrischer 1 η Methoden Hypothesen über das Lagemaß,den Median ξ^ ^ (vgl. Aufgabe 3.8) der Verteilung von X überprüft werden. Es muß dabei vorausgesetzt werden, daß die Zufallsvariable X stetig verteilt ist.

->(a) Die Durchführung des Zeichentests zur Überprüfung von Hypothesen bezüglich des Medians ξ^ ^ besteht im ersten Schritt aus der Berechnung der transformierten Beobachtungswerte

x

i=xi_?0*

' i=1

n

'

d.h. der Differenz von Beobachtungswert und hypothetisch angenommenen Wert CQ„· Anschließend wird festgestellt, wieviele der

ein positives,

wieviele ein negatives Vorzeichen besitzen. Liegen genau m positive Werte vor, ist also mit x! > 0 ι , falls )

l

i=l

y

= m 1

, i=l,...,n

,

x! < 0

-

so ist der Wert m, der hier als Prüfgröße verwendet wird, bei Vorliegen von ζ0 ^ =ξ

gerade die Realisation einer B(n,0.5) -verteilten Zufallsvaria-

blen. Die in

£9,1*1 angegebenen Entscheidungsregeln für die verschiede-

nen ein- und zweiseitigen Hypothesen stimmen also mit denen des in Aufgabe 6.7 ausführlich erläuterten Binomialtests zum Niveau α für ρ^ = 0.5 überein. Dort ist auch die Bestimmung der kritischen Werte c^ und Cj

angegeben.

Ist der Stichprobenumfang η hinreichend groß (n > 20), so kann man als Prüfgröße auch

248

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

ζ

=

m - 0.5 η 0 . 5 \fn

verwenden, deren z u g e h ö r i g e Z u f a l l s v a r i a b l e u n t e r d e r Hypothese ξ_ =ξ 0. b U* approximativ N(0,1) - v e r t e i l t

ist

( v g l . A u f g a b e 6 . 6 ) . Die s i c h dann e r g e b e n -

den E n t s c h e i d u n g s r e g e l n zum Niveau Ct s i n d e b e n f a l l s i n Tab. L 9 . 1 . 1

aufge-

führt. Hab* £ 9 * 1 * 1 :

H

[ A p p r o x i m a t i v e ] T e s t s zum N i v e a u α f ü r Hypothesen über den Median ξ _ e i n e r s t e t i g v e r t e i l t e n Z u f a l l s v a r i a b l e n X (ZeichenU· test)

H

o

^ 0 . 5 - ^0*

^0.5

=

^0*

Hq w i r d zum N i v e a u α v e r w o r f e n ,

1

ξ

0.5>ξ0*

ξ

0.5c 1-a m c, l-a/2

]

[z>u, l-aJ

L

[z < u 1 aJ

α

oder

falls

L

m u. 1 l-a/2J

L1

daß, wenn t r a n s f o r m i e r t e Beobachtungen den Wert N u l l

annehmen, s i c h m a l s

m =

η Τ y. 1=1 1

mit

, falls

χ•>0 χ x! = 0 χ x! < 0 χ

berechnet.

Zum N i v e a u α = 0 . 0 5 s o l l X des A r b e i t n e h m e r s

f ü r den Median ξ ^ g d e r V e r t e i l u n g

zu seinem A r b e i t s p l a t z

die zweiseitige

der

Anfahrtzeiten

Hypothese

Η0:ξ0>5=30.0 gegen Η,

:ξ0.5*30.0

g e t e s t e t werden.

I n t a b . C S . 1 . 2 s i n d sowohl

d i e an η = 10 Tagen

Z e i t e n χ ^ , . , . , χ ^ a l s auch d i e t r a n s f o r m i e r t e n

Werte

beobachteten

Kapitel 9: Nichtparametrische,

χ! = Χη· - 3 0

, i =1

10

verteilungsfreie Vergleiche

249

,

zusammengestellt. Außerdem wird dort f e s t g e h a l t e n , welche dieser x.! p o s i t i v e s , welche negatives Vorzeichen b e s i t z e n , d.h. f ü r i = 1 , . . . , 1 0 sind die Werte y.. angegeben. Cab. £9.1.2: A r b e i t s t a b e l l e zur Durchführung des Zeichentests

i

X

i

X! = X - 30 1 1

1

24 .3

-5.7

0

y

i

2

35 .2

5. 2

1

3

33 .8

3. 8

1

4

46 .8

16. 8

1

5

29 .6

-O. 4

0

6

22 .0

-8.0

0

7

34 .5

4. 5

1

8

41 .2

11 2

1

9

32 .1

2. 1

1

10

29 .9

-O. 1

0

Da mit η = 10 die Approximation der Binomial- durch die Normal Verteilung n i c h t g e r e c h t f e r t i g t e r s c h e i n t , s o l l h i e r der exakte Test durchgeführt werden. Für d i e Prüfgröße m e r g i b t s i c h m =

10

Υ y. = 6 i=1 1

Die bei einem Niveau α = 0.05 benötigten k r i t i s c h e n Werte Cq ^

und Cq g^g

s i n d nun so zu bestimmen, daß Cg g 2 5 die größte ganze Zahl e r g i b t mit

C

T " \ i=o

1

0

W

) 0 . ^ 0 . 5 ^ =

C

T "

1

n 0 . S W

l

0

< 0

.025

und Cg gyg die k l e i n s t e ganze Zahl d a r s t e l l t , f ü r die

J J?).,'·,»»^ J ( 0 ι w =

L>

' i=l

c.R. 1

mit

falls

1

R. < 0

ein. Dieser Prüfgrößenwert muß bei der Überprüfung der verschiedenen einund zweiseitigen Hypothesen über den Median mit dem kritischen Wert

Μ

η .γ

verglichen werden, der für einige spezielle η und γ in der Cäb. £9*1.3 vertafelt ist.

Cab. 0 . 1 . 3 : Kritische Werte

11

w

n;0.025

W

Μ

η.γ

n;0.05

des Vorzeichenrangtests von Wilcoxon

W

n;0.95

W

n;0.975

7

3

4

23

24

8

4

6

29

31

9

6

9

35

38

10

9

11

43

45

11

11

14

51

54

12

14

18

59

62

13

18

22

68

72

14

22

26

78

82

15

26

31

88

93

Für hinreichend große Stichprobenumfänge η läßt sich auch die Teststatistik w-n(n+l)/4

w* =

,

Vn(n+1) (2n+l)/24 die für ξ

0. b



0*

die Realisation einer approximativ N(0,1) -verteilten Zu-

fallsvariablen darstellt, verwenden; d.h. in solchen Fällen kann ein approximativer Einstichproben - Gauß - Test bezogen auf w* angewendet werden.

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

252

Damit sind nun die in Cab· £ 9 4

angegebenen, verschiedenen Entscheidungsre-

geln des Vorzeichenrangtests zum Niveau α für die ein- und zweiseitigen Hypothesen bzgl. des Medians festgelegt.

Cab* 0·1«4: [Approximative] Tests zum Niveau α für Hypothesen über den Median ξ^

der Verteilung einer stetigen Zufallsvariablen X,

die symmetrisch ist (Vorzeichenrangtest von Wilcoxon)

H

H

o

1

Hg wird zum Niveau α verworfen, f a l l s

ξ

0.5ίξ0*

ξ

0.5>ξ0*

w>w . η;1-α

[w* > u 1 1-α

ξ

0.5Ϊξ0*

ξ

0.5w < w >w < w

, nj,n2,-l-a

[w* > u ] R 1-a

nj,n 2# -a

[w* < u ] R a

ηj

; 1 -a/2

n1,n2;a/2

oder

[ 11w* 1I > u, ,J R l-a/2

258

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

Die Differenzen X^ und

der Blutdruckwerte vor und drei Stunden nach Verga-

be des blutdrucksenkenden Medikamentes bzw. des Placebos wurden an zwei verschiedenen Patientengruppen gemessen. Es kann angenommen werden, daß X^ und X 2 unabhängige, stetige Zufall svariablen sind und daß deren Erwartungswerte μ 1 und μ 2 existieren. Außerdem soll gelten, daß die Verteilungen von X^ und X2

bis auf Lokationsunterschiede gleich sind. Anhand der beobachteten Werte

x ^ , i=l,... ,12, und x,^, i=1,... ,10, soll zum Niveau α =0.10 überprüft werden, ob die Wirkung des Medikamentes auf die Senkung des Blutdrucks signifikant ist, d.h. bezogen auf die Blutdruckdifferenzen, ob die durchschnittliche

Differenz μ^ nach Einnahme des Medikamentes signifikant größer ist als

die durchschnittliche Differenz μ 2 nach Einnahme des Placebos. Folgendes Testproblem liegt also vor: Hg : μ 1 < μ 2

gegen

H1 : μ1 > μ 2

In Cah. £9.3.3 sind sowohl die n^ =12 an der ersten Patientengruppe gemessenen Differenzen als auch die n 2 = 10 der zweiten festgehalten. Gleichzeitig werden dort auch die Rangzahlen der insgesamt n^ + n 2 = 2 2 Beobachtungen angegeben. So erhält etwa die Differenz x^g = -7.1 als zweitkleinster Wert der gesamten Beobachtungsreihe den Rang R(x^g) = 2, der Wert x 2 g = -6.1 als drittkleinster aller Beobachtungen erhält den Rang R(x 2 j) =3. Da in beiden Stichproben der Wert x i g - x 2 i

=6

· 2 beobachtet wurde, werden die zugehörigen Rang-

zahlen gemittelt, d.h. R(x l g ) = R(x 2 1 ) =(13 + 14)/2 = 13.5

.

Cab. C9.3.3: Rangzahlen der insgesamt n 1 + n 2 = 12 + 10 = 22 Beobachtungen χ

i

X

1 1 " · · , χ 1 12'x21 '•••'x2 10 R(Xli)

1i

1

18 0

2

5 7

3

-O 4

4

-2

5

21 12

2i

R(x2i)

6.2

13.5

x

-0.5

8

1.6

10

1

9 7

15.7

20

20

5

22

-6.1

3

6

-5

6

4

-3.7

5

7

10 4

18

8.7

15

8

-7 1

2.5

11

9

6

10

2

2 13.5

-2.8

6

9 7

16

10.0

17

11

11 5

19

12

-8 9

1

Kapitel 9: Nie htpara metrische, verteilungsfreie Vergleiche

259

Für die Prüfgröße w^ des Wilcoxon - Rangsummentests erhält man somit 12

Wn = 1 Rix,-) = 21 + 1 2 + 9 + 11 i=1

+ 19 + 1 =144.5

.

Bei dem geforderten Signifikanzniveau α = 0.10 entniirmt man Tab. L9.3.1 mit n^ = 12, n^ = 10 den kritischen Wert w

ni,n2;1-a

= w

= n

12,10;0.90

1(n1

+n

2+

1)

' w n , ,n 2 ;a

= 12(12 +10 + 1) " W ^2,10;0.10 = 276 - 118 = 158

,

d.h. wegen wD = 144.5 Η 5 8 =w„ „ . R ' n^ ,n 2 ,1 -α kann die Hypothese zum 10% Niveau nicht verworfen werden.

LÖSUNG ZU AUFGABE 9 . 4 Der K o l m o g o r o f f - Smirnov - T e s t f ü r den Z w e i s t i c h p r o b e n f a l l Stelle

w i r d an

dieser

v e r w e n d e t , um, f a l l s k e i n e k o n k r e t e V e r t e i l u n g s a n n a h m e g e t r o f f e n

den k a n n , n i c h t nur e i n e n V e r g l e i c h

der Erwartungswerte

Z u f a l l s v a r i a b l e n X^ und X^ d u r c h z u f ü h r e n , s c h i e d e z w i s c h e n den gesamten V e r t e i l u n g e n gesetzt

w e r d e n , daß X^ und X^ s t e t i g e

funktionen F

und F

1

sondern um a u f s i g n i f i k a n t e zu p r ü f e n .

Zufallsvariablen

Es muß wiederum sind mit

s i c h das g e s c h i l d e r t e

wer-

unabhängiger Untervoraus-

Verteilungs-

Testproblem

als

2

Überprüfung der

Hypothese

H0 : F x

gegen d i e

. Damit l ä ß t

zweier

(x) = Fx

(x)

für alle

χ

(x)

f ü r mindestens ein χ

Alternative Η

1

: F

Xj

(x) ^ F

x2

angeben. Es l i e g t (vgl.

nun n a h e , d i e e m p i r i s c h e n V e r t e i l u n g s f u n k t i o n e n

Aufgabe 6.3)

zur Ermittlung

S . und S n.,1 Ti2> e i n e r P r ü f g r ö ß e h e r a n z u z i e h e n , d . h . m i t den

260

Teil I: Übungsaufgaben,

Erläuterungen

und

Lösungen

unabhängigen Realisationen χ.,,.,.,χ. von X, bzw. 11 ln^ 1 werden die Funktionen

21

2n 2

von

2

0

s

, (X) = n

l

x < x , . für alle 1 = 1....,n. Ii 1 k — , falls χ > x, . für genau k der x, . aus x, ,,...,x, n^ - Ii Ii 11 ln^ 1

x > x , . für alle i=l, ... ,n - Ii 1

0

χ < x„ . für alle i = l....,n_ 2i 2

und

S n

,(x) 2

— , falls χ > . für ygenau k der χ aus x„.,...,x n2 - 2i 2i 21' ' 2n 2 χ > x 2 i für alle i=l,...,n2

betrachtet. Uber den qrößten vertikalen Abstand zwischen S . und S nj,l n 2 ,2 der durch D n

l' n 2

(x) = max |s , (x) - S n n χ l' 2

„(x) I

gegeben ist, wird folgende Prüfgroße des Kolmogoroff-Smirnov-Tests gebildet:

Die zweiseitige Hypothese H^ wird dann zum Niveau α verworfen, falls Κn

l'n2

> k η ,n2;l-a

vorliegt. Einige dieser approximativen, konservativen (d.h. Bevorzugung einer Entscheidung für die Hypothese) kritischen Werte k , sind in * η ,η ;l-a iah* £9.4*1 zusammengestellt; dabei bezeichnet η ^ ^

die kürzere und

längere Beobachtungsreihe.

iah* £9.4.1: Approximative kritische Werte k

.

des Kolmogoroff - Smir-

nov - Tests für α = 0.20, α = 0.10 und α = 0.05

"(Ι)

Π

(2)

k

n(1),n(2);1-a

α = 0.20

von 5 bis 15 sonst

von 5 bis 40 sonst

1.03 1.08

α = 0.10

von 4 bis 8 .von 4 bis 16 sonst

von 5 bis 9 von 10 bis 20 sonst

1.12 1.16 1 .23

a = 0.05

von 5 bis 16 sonst

von 6 bis 20 sonst

1.30 1.36

261

Kapitel 9: Nichtparametrische, verteilungsfreie Vergleiche

Zum Niveau a = 0.10 soll die Hypothese, daß keine Unterschiede zwischen den von den beiden Anlagen in Litertüten abgefüllten Milchmengen X 1 und

beste-

hen, mit Hilfe des Kolmogoroff - Smirnov - Tests geprüft werden. Mit der A n nahme, daß X^ und X^ stetig verteilte Zufallsvariablen darstellen, wird also auf Gleichheit der Verteilungen, d.h. H q : Fjj (x) = F x (x)

für alle χ

H

für mindestens ein χ

gegen :

1

F

x

( x )

*

1

p

x

C x ) 2

getestet. Mit den n^ = 7 beobachteten Abfüllmengen der Anlage 1 bzw. den n ^ = 9

beobach-

teten Werten an der Anlage 2 wird zunächst eine Arbeitstabelle zur Ermittlung der empirischen Verteilungsfunktionen S ^ ^ und S g

angelegt, vgl. t a b .

2

£9.4.2. Die Beobachtungen in jeder Reihe werden dabei der Größe nach geordnet dort eingetragen, d.h. man geht von den abgefüllten Mengen über zu der geordneten Reihe Χ

(21)< . ..t k = 4

Werten aus der zweiten Stichprobe, die

kleiner oder gleich 1.00 sind, also

Weiterhin werden in Tab. L9.4.2 auch die absoluten Abweichungen |S 7 ^ ( x ) - S g

2(x)l

berechnet.

Der größte vertikale Abstand dieser beiden empirischen liegt somit bei, vgl. auch A b b . C9.4.1, D

7,9

=26 63

Der sich ergebende

Κ

Pr'iifgrößenwert

η1,η2 =Κ 7 , 9 = ν / τ 3 ·

°7,9 = / W

' S

=

0

"8189

Verteilungsfunktionen

262

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

l a b . £9.4.2: A r b e i t s t a b e l l e zum Kolmogoroff - Smirnov - Test

X

X

(1i)

(2i)

S7)1(x)

S9>2(x)

1/7

0

0.96

0.98 , 0.98

r

0.98

1.00

9/63

0.97

1/7

1/9

2/63

0.98

4/7

2/9

22/63

0.99

4/7

3/9

15/63

1.00

5/7

4/9

17/63

S/7

4/9

26/63

1.02 , 1.02

1

6/9

21/63

1.03

1

7/9

14/63

1.04 , 1.04

1

1

1.01 1.02

|s7J(x) -s9j2(x)|

0

1.0-

S71(x) ' \

^7,9 *

0.5-

\

s9

0.%

0.97

0.98

0.99

1.00

1.01

2

(χ)

1.02

1.03

1.04 X

Abb. C9.4.1: Empirische Verteilungsfunktionen S_ . ( x ) und S p „ ( x ) der abgef ü l l t e n Milchmengen '»'

Kapitel

9: Nichtparametrische,

verteilungsfreie

Vergleiche

263

muß nun mit dem kritischen Wert, vgl. Tab. L9.4.1, k

nrn2;1-a

= k

7,9;0.90

=

1

·12

verglichen werden. Da also

kann die Hypothese H„ zum 10% Niveau nicht verworfen werden.

LÖSUNG ZU AUFGABE 9.5 Die Zufallsvariablen A^ und A d·* 1 · der t . - V e r t e i l u n g v e r g l i c h e n werden muß. Da ο |t| = 1.2301 + 2.306 = t 8 ; 0 _ 9 7 5 = t n _ 2 . 1 _ a / 2

,

kann d i e Unabhängigkeitshypothese zum 5% Niveau n i c h t verworfen werden.

( c ) Die Unabhängigkeitshypothese Hg aus A u f g a b e n t e i l 5% Niveau f ü r a l l e K o r r e l a t i o n s k o e f f i z i e n t e n

r

XY "

Λ

(b) kann mit η = 1 0 zum

r^y mit

< 2.306 ' XY

d.h. XY

°

< 2.306

2

1 - r! XY n i c h t verworfen werden. Durch ä q u i v a l e n t e Umformungen e r g i b t rr

2

XY Τ ί 1 - r! XY r

2 2.306 — 8 —

2 2.3062 XY 8

2.3062 '

8

'

r

2 XY

sich

Kapitel 10: Abhängigkeitsanalyse - Korrelation und Assoziation

275

2

rv v < 0.3993 d.h. ist Γ χ γ ε [ - 0 . 6 3 1 9 , 0.6319], so kann nicht auf signifikante Abhängigkeit zwischen Eisen- und Bleigehalt geschlossen werden.

LÖSUNG

ZU A U F G A B E

10.2

Der Umsatz X und die Investition für Umweltschutz Y im Bereich der chemischen Industrie seien gemeinsam normalverteilt. Es liegen aufgrund einer zufälligen Stichprobe Beobachtungspaare (x1

) . . ,(Xg,yg) vor, aus denen sich

die Korrelation p y Y zwischen X und Y schätzen läßt (vgl. Aufgabe lo.i). Mit

8 Χ=·5· 1 x,· = - s · (145.2 + . . . + 127.7) = ° -j = 1

1176 = 147.0 °

und y =

1

8

8 ^

1 y

i

=

(0.73 + ... + 0.63) = Jr· 6.32 = 0.79

8

8

berechnet sich der Korrelationskoeffizient von Bravais - Pearson zu

8 l x.-y^ - 8xy i=1 1 1

1026.978 - 929.040 \/( 184680.88 - 172872.00)(5.8472 - 4.9928) = 0.9750

->(a) M i t Hilfe der Fisherschen - Ζ - Transformation

ζ = arctanh

d.h.

Γχγ

= j · In γ

276

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

=2z

- 1

Tz läßt sich ein approximatives Konfidenzintervall

ι

1 +

,

P

für

herleiten.

Denn

für

XY

XY ist approximativ

durch

mit

Z

1 + r 1 X I n 1 - r„ 1= 2 '

XY 2 · (η - 1 )

l-Ot/2 Vn - 3

1 + r ζ

ein

= - · In

1

XY

XY ( η - 1)

XY

(1-a) - K o n f i d e n z i n t e r v a l l

tervallgrenzen Niveau

1-a

gegeben.

erhält man dann ein

für

u

l-g/2 i/n - 3 Durch Rücktransformation

(approximatives)

dieser

In-

Konfidenzintervall

zum

durch

2z,

2z_

2z,

' -1 2z„ +1

+1

Für die Korrelation p^y zwischen Umsatz X und Investition fur den Umweltschutz Y soll ein Konfidenzintervall zum Niveau V - α = 0.95 berechnet werden. Als Schätzer für die Korrelation ergab sich bei n = 8 Beobachtungspaaren r X y = 0.9750. Mit ,

_ 1 1 -?·

u

i_a/2

0 975 =

τ„ 1 + 0.9750 ln

1

-96 werden zunächst die Größen

0.9750

1.96

, =

1 - 0.9750 " 2 · ( 8 -

= 1 .2385 2

= u

2

-

10/l7 t847

n Q

- ·

„,„, 0696

n

„-,,,-

0

" ·8765

,

0.9750 ' 2 ·0.9750 11 ' l,n 11 -+ 0.9750

1 .96

=

, 1 0 Λ 7 - n0.0696 n , Q , ^ n „-,,2.1847 + 0.8765

=2.9916 bestimmt, die entsprechend transformiert die Grenzen des 0.95 - Konfidenzintervalles für Ρχγ liefern:

277

Kapitel 10: Abhängigkeitsanalyse - Korrelation und Assoziation

2Z

e 1 • - -1 ~Tz Ί +1

e ^ - 1 ~Zz e 2+ 1

e

2.4772 2

e '

4772

. - 1 +

.5.9832 , e - 1

1 ' eb-983i;+1.

[10.9079 395.70781 [12.9079 ' 397.7078J [0.8451

, 0.9950]

-»(b) Bei einem Vergleich der Korrelation

zweier normalverteilter

Zufalls-

variablen X und Y mit einem hypothetischen Wert p Q ^ 0 in Form von Tests zum Niveau α über die verschiedenen ein- und zweiseitigen Hypothesen bedient mein sich wiederum der im Aufgabenteil

(a) vorgestellten Fisherschen - Ζ - Trans-

formation. Denn als Prüfgröße wird 1 , 1 + po ζ - — · In 2 l-p„ tfTö

p o 2 · ( n - 1)

j l + rxY ζ = — · In 2 1 - ΓΧΥ

verwendet, deren zugehörige Zufallsvariable bei Vorliegen von

= P ^ appro-

ximativ N(0,1) - verteilt ist. Somit sind die Entscheidungsregeln des

(appro-

ximativen) Tests zum N i v e a u α analog zum gewöhnlichen Einstichproben - Gauß Test

(vgl. Aufgabe 6.1) festgelegt, vgl. Cab. CIO.2.1.

tab* CIO.2.1: Approximative Tests zum Niveau α über die Korrelation zweier normalverteilter Zufallsvariablen X und Y

H

H

o

Ρ K

< XY - po

Ρ μ

P μ

> ΧΥ - po

ρ

P

XY ~ po

P

HQ wird zum Niveau α verworfen, falls

! >

ρ

ο

χγ
Uj

-a

U < U α |u| > U j

-α/2

Zum Niveau α = 0.10 ist in dieser Aufgabe für die Korrelation ρ χ γ der normalverteilten Zufallsvariablen Umsatz (X) und Umweltschutzinvestitionen Hypothese Hg: ρ χ γ < 0.95 gegen die Alternative H,: P y w > 0.95

(Y) die

278

Kapitel 10: Abhängigkeitsanalyse - Korrelation und Assoziation

zu testen. Aufgrund einer Stichprobe vom Umfang n = 8 hat sich als Schätzer für ρ χ γ gerade r^y = 0 . 9 7 5 0 ergeben. Mit

- r ^ T ^ M · · "

2-1847

und pg = 0.95 ergibt sich für die Teststatistik 9 ιολ7 1 _ L· la4/ " 2 * = 0.1275

ln

1 + 0-95 0.95 1 - 0.95 ~ 2 · (8 - 1 ) . 2.1847 - 1.8318 - 0.0679

,

ein Wert, der mit dem Quantil u, = u n Q n = 1.2816 1-α 0.90 als kritischen

Wert verglichen werden muß. Da

u = 0.1275 t 1.2816 = Ii·! ist die Korrelation p^y also zum 10% Niveau nicht signifikant größer als 0.95.

LÖSUNG ZU AUFGABE 10.3 Falls die Voraussetzung der gemeinsamen Normalverteilung für zwei Zufallsvariablen X und Y nicht gerechtfertigt erscheint, so bieten sich nichtparametrische Tests (vgl. Kapitel 9) zur Überprüfung der Unabhängigkeit von X und Υ (vgl. Aufgabe 10.1) an. Dabei muß aber vorausgesetzt werden können, daß X und Y - zumindest im Prinzip - stetig verteilt sind. Die Grundlage dieser Testverfahren bilden auch hier Korrelationsschätzwerte, die allerdings nun aus Ranginformationen abgeleitet werden, d.h. anstatt der η unabhängigen Beobachtungspaare

(Xj,Yj),...,(x »y ) gehen deren Rangzahlen in die

Schätzer ein.

->(a) Eine Möglichkeit,die Korrelation

der Zufallsvariablen X und Y zu

schätzen,liegt im Spearmanschen Rangkorrelationskoeffizienten r^, der sich aus der Formel zur Berechnung des gewöhnlichen Korrelationskoeffizienten (vgl. Aufgabe 10.1) ergibt, indem dort die Realisationen

und v y^ durch die

zugehörigen Rangzahlen R(x.) und R(y.) ersetzt werden. Dabei werden die Rangzahlen in der- Art vergeben, daß in jeder der beiden Beobachtungsreihen χ ,...,x

bzw. y ,...,y

die kleinste Realisation den Rang 1,..., die größte

Kapitel 10: Abhängigkeitsanalyse - Korrelation und Assoziation

279

Realisation den Rang η erhält. (Es ist auch eine umgekehrte Rangzahlenzuordnung möglich.) Treten Bindungen auf, d.h. sind mehrere Beobachtungswerte einer Zufallsvariablen gleich, so wird diesen gleichen Werten jeweils das arithmetische Mittel der zugehörigen Rangzahlen (midranks) zugeordnet. Somit erhält man den Spearmanschen Rangkorrelationskoeffizienten durch

l

J

( r ( x J - R ( x ) ^ R ( y i ) - R(y)^

-RU))2

l

·

l

^Rty.)

-

5Ty))2

η

2

J R(x.)R(y.) - 0.25n(n + 1) 1 1 i-1

J (

I

(R(x ± )) 2 - 0.25n(n+l) 2 ^ · ^

da

2 (R(y. )) - 0.2 5n (n+1)'

l Rix ) = l R(y ) = A ^ 1 i=l i=l

η(n+1) 2

Falls keine Bindungen auftreten, läßt sich die Berechnung dieses Korrelationskoeffizienten noch vereinfachen, denn dann ist

6· rs = 1

Ϊ a2 =i 1

mit

d

=R(x ) - R ( y )

η(η -1)

Auch für den Rangkorrelationskoeffizienten von Spearman gilt

wobei dieser etwa den Wert 1 nicht nur bei strikt positiver Linearitiät der Beobachtunaswerte annimmt, sondern schon dann, wenn für alle Paare (x.,y.) 1 1 und (x.,y.), ifj , mit χ. < χ. auch y. < y. erfüllt ist. 3 3 1 3 33 Bei einem Niveau - α - Test der Unabhängigkeitshypothese für die Zufallsvariablen X und Y verwendet man hier anstelle des Spearmanschen Rangkorrelationskoeffizienten zumeist die Hotelling - Pabst - Statistik n

D=

2 l [R(x ) - R ( y )] i=l 2

als Prüfgröße. Dabei ist D = n(n —1) (1—r^) / 6 , falls keine Bindungen vorliegen. Die Hypothese Η : X und Y sind unabhängig

280

Teil I: Übungsaufgaben,

muß zugunsten der

Erläuterungen

Lösungen

Alternative

H^: X und Y sind nicht z u m N i v e a u OL v e r w o r f e n w e r d e n , D < h

und

oder

η;α/2

unabhängig falls D > h

η;l-d/2

gilt. Einige kritische Werte h^ ^ sind in Cab. C10*3.1 weitere ergeben sich aus der h

η;1-γ

(tab. C I O . 3 . 1 :

η

h

zusammengestellt;

Beziehung

= \ · n(n2-l ) - h 3 η?γ

Kritische Werte h

des Unabhängigkeitstests η; Υ der Hotelling - Pabst - Statistik

h

n;0.025

6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

6 14 24 38 60 86 120 162 212 270 340 420 512 618 738

h

n;0.05

bei

Verwendung

n ;0.10 14 26 42 64 92 128 172 226 290 364 450 550 664 790 934

8 18 32 50 74 104 144 190 246 312 390 480 582 696 826

Bei genügend großem Stichprobenumfang η ist auch die Durchführung approximativen Tests möglich, denn die

eines

Prüfgroße

D-Dj

fr mit

η

1

1 °2

ν Λ 3=1

d

( 3

,3 li ^

1 " 1 122 ?

f Σ

k=l

.3 W

.

d

"2k 3

?

3 \

36 (

i s t u n t e r H^ die R e a l i s a t i o n e i n e r a p p r o x i m a t i v N ( 0 , 1 ) - v e r t e i l t e n

Zufalls-

281

Kapitel 10: Abhängigkeitsanalyse - Korrelation und Assoziation

variablen. Dabei bezeichnet ρ bzw. q die Anzahl der unterschiedlichen Werte x. bzw. y. in der ersten bzw. zweiten Beobachtungsreihe, d ^

bzw. d^^ die

Anzahl der Beobachtungen, die mit dem j-ten dieser unterschiedlichen Werte in der ersten bzw. zweiten Reihe identisch sind. (Liegen in beiden Beobach2 = n ( n -1) / 6 und

tungsreihen keine Bindungen vor, so ist D 3 2 2

D^ = η (η -1) (n+1) / 36.) Die Hypothese H^ ist somit zum Niveau Ol zu verwerfen, falls

Der Spearmansche Rangkorrelationskoeffizient als Schätzer für die Abhängigkeit zwischen Temperatur (X) und Luftfeuchtigkeit paarweisen Meßergebnissen (x^ ,y 1 ),...

(Y) soll anhand von

η=10

bestimmt werden. Dazu wird

zunächst eine Arbeitstabelle, vgl. Iah. CIO.3.2, erstellt, in der neben den Beobachtungswerten und deren Rangzahlen einige weitere, die Berechnung erleichternde Hilfsgrößen aufgeführt sind. Die Korrelation zwischen Temperatur und relativer Luftfeuchtigkeit wird damit geschätzt durch

10

I i=1

V (

I

R ( x . ) R ( y · ) - 0.25 · 10 · 1

1

R(xi ) 2 - 0.25 - 1 0 · "

2

) · ( . Ι

330 - 3 0 2 . 5

27.5

v/(385 - 3 0 2 . 5 ) ( 3 8 4 . 5 - 3 0 2 . 5 )

\/6765

= 0.3343

,

i r

R ( y i ) 2 - 0 . 2 5 · 10 · 1 1 2 )

.

lab. CIO.3.2: Arbeitstabelle zur Berechnung des Spearmanschen

Rangkorrela-

tionskoeffizienten bzw. der Hotel 1ina - Pabst - Statistik

i 1 2 3 4 b 6 7 8 9 10 I

x

i

17 2 19. 9 15. 6 26. 7 14. 5 18. 7 23. 5 19. 7 18. 1 19. 5

y

i

59 56 62 59 42 65 72 68 47 61

Rfx,.)

R(y n -)

R^·)2

RCy n -) 2

R(xi)R(yi)

R(x.j) - R(y.j)

3 8 2 10 1 5 9 7 4 6

4.5 3 7 4.5 1 8 10 9 2 6

9 64 4 100 1 25 81 49 16 36

20.25 9 49 20.25 1 64 100 81 4 36

13.5 24 14 40.5 1 40 90 63 8 36

-1 5 5 -5 5 5 0 -3 -1 -2 2 0

55

55

385

384.5

330

282

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

Auch hier soll nun anstelle des Korrelationskoeffizienten r^ die HotellingPabst - Statistik beim Test zum Niveau α = 0.10 der Hypothese Hg: die Temperatur X ist unabhängig von der relativen Luftfeuchtigkeit Y gegen die Alternative Hj: die Temperatur X ist nicht unabhängig von der relativen Luftfeuchtigkeit Y verwendet werden. Aus Tab. L10.3.2 ergibt sich für die Prüfgröße [R(x.) - R(y·)] 2 = (-1 .5) 2 + 5 2 + (-5) 2 + . . . + 2 2 + 0 2 = 100.5

D= i=1

1

1

Bei einem Signifikanzniveau α = 0 . 1 0 erhält man aus Tab. L10.3.1 die kritischen Werte h

n;a/2

= h

10;0.05 =

74

h

n;1-a/2-h10;0.95 = r

' 10

-(1°2-15-h10;0.05

= 33

°-

74 = 256

'

d.h. da D = 100.5 {Γ 74 = h„. ,, η ;α/2 D = 100.5^-256 = h

.

und ,,

kann die Hypothese der Unabhängigkeit von Temperatur und Luftfeuchtigkeit nicht verworfen werden. Die aufgestellte Theorie kann also bei einem Niveau von 10% nicht signifikant bestätigt werden.

-*(b) Der Kendallsche Rangkorrelationskoeffizient τ stellt eine weitere Basis zur Durchführung eines nichtparametrischen Tests über die Unabhängigkeitshypothese dar. Dieser wird ebenso wie der Spearmansche Rangkorrelationskoeffizient aus den Rangzahlen, die den η Realisationen der Zufallsvariablen X und Y wie im Aufgabenteil (a) angegeben,zugeordnet werden, berechnet. Abweichend ist es in diesem Fall aber angebracht, den jeweils gleichen Beobachtungen (Bindungen) einer Beobachtungsreihe nicht die 'midranks' zuzuordnen, sondern die zugehörigen Rangzahlen zufällig auf diese zu verteilen (Randomisieren). Zur Ermittlung von Kendalls τ werden nach Vergabe der Rangzahlen Rfx^) und R(y^), i=l,...,n , die Beobachtungspaare im ersten Paar der Rang der Realisation

so geordnet, daß

von X gerade 1 ist, im zweiten Paar

der Rang der Realisation von X gerade 2 ist,..., im n-ten Paar der Rang der Realisation von X gerade η ist. Durch diese Anordnung ist dann die Reihenfolge der Rangzahlen der Realisationen y ,...,y

von Y eindeutig festgelegt.

Kapitel 10: Abhängigkeitsanalyse - Korrelation und Assoziation

283

Betrachtet man nun diese Reihenfolge, so wird anschließend für jede Rangzahl R(y^) die Anzahl

der Rangzahlen R(y^) , die kleiner als R(y^) sind

und in der neuen Anordnung der Ränge hinter R(y^) stehen, für i=l,...,n bestimmt. Der Rangkorrelationskoeffizient von Kendall ergibt sich dann zu



1 -

l q. 1=1 η · (η - 1)

Mit Hilfe der auf diese Weise geschätzten Korrelation zwischen X und Y läßt sich auch hier ein Testverfahren auf Unabhängigkeit konstruieren. Ist also die Hypothese Η^: X und Y sind unabhängig gegen die Alternative Hj: X und Y sind nicht unabhängig zum Niveau α zu testen, dann kann dabei die sogenannte Kendallsche Κ - Statistik

K =

η · (η - 1) 2 "

τ

'

verwendet werden, deren zugehörige Verteilung die Quantile

K n-1

_

liefert,

von denen einige in Cab. CIO.3.3 vertafelt sind. Die Hypothese H^ wird zum Niveau α verworfen, falls |K

l>Kn;l-a/2

gilt.

Cab. CIO.3.3: Kritische Werte K^.j

des Unabhängigkeitstests bei Verwendung

der Kendallschen Κ - Statistik

η

Si;0.995

K

n;0.975

K

n;0.950

6

14

11

9

7

17

13

11

8

21

16

14

9

25

19

16

10

29

23

19

15

52

40

34

20

80

59

49

25

110

84

71

30

145

111

93

284

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

Stehen keine kritischen Werte zur Verfügung und ist η hinreichend groß, so kann auch die Prüfgröße K*=

5 V n (n - 1) (2n+ 5) / 18

herangezogen werden. Die zu K* gehörige Zufallsvariable unterliegt unter der Unabhängigkeitshypothese approximativ einer Ν(0,1) -Verteilung. Die Hypothese Hp kann also bei

lKll>ul-a/2 zum Niveau α verworfen werden. Ober die zehn vorliegenden Beobachtungspaare (x1 , y 1 ) . .

,y 1 0 ) von

(X,Y) = (Temperatur, Luftfeuchtigkeit) soll zunächst der Korrelationskoeffizient τ von Kendall als Schätzwert für die Korrelation von Temperatur und Luftfeuchtigkeit ermittelt werden. Ausgehend von Tab. L10.3.2 werden dazu alle Schritte, die zur Bestimmung der q^, i=1

10 , notwendig sind, in

nachfolgender Arbeitstabelle, vgl. Iah. CIO.3.4, durchgeführt. Die Ränge 4 und 5 für die Realisationen y^ = y ^ = 59 wurden dabei zufällig vergeben. So ergibt sich etwa für qg der Wert 3, da unterhalb der Rangzahl R(yg) = 8 in der gegebenen Reihenfolge drei Rangzahlen der Realisationen von Y kleiner als 8 sind (6,3,4).

Cab. CIO.3.4: Arbeitstabelle zur Berechnung des Kendallschen Rangkorrelationskoeffizienten i

R(x.j)

R(y i )

q

i

5

1

(14.5 , 42)

1

0

3

2

(15.6 , 62)

7

5

1

3

(17.2 , 59)

5

3 0

9

4

(18.1 , 47)

2

6

5

(18.7 , 65)

8

3

10

6

(19.5 , 61)

6

2

8

7

(19.7 , 68)

9

2

2

8

(19.9 , 56)

3

0

7

9

(23.5 , 72)

10

1

4

10

(26.7 , 59)

4

0

I

55

55

16

Kapitel 10: Abhängigkeitsanalyse - Korrelation und Assoziation

285

Damit berechnet s i c h der K o r r e l a t i o n s k o e f f i z i e n t von Kendall zu 10

4· τ = 1

Σ

Qi

-Ϊ0ΤΤΓ^ΓΤ=1

-

^

=

0-2889

.

Zum Niveau α = 0 . 1 0 s o l l noch einmal die Hypothese H q : Temperatur X i s t unabhängig von der r e l a t i v e n L u f t f e u c h t i g k e i t Y gegen die A l t e r n a t i v e H ^ Temperatur X i s t nicht unabhängig von der r e l a t i v e n

Luftfeuch-

tigkeit Y getestet werden. Mit dem soeben berechneten Kendallschen

Korrelationskoeffi-

zienten e r g i b t s i c h für die T e s t s t a t i s t i k K r

n- (n-1).T

=

lO^J.o^ggg

g

13-0005

>

so daß wegen ( v g l . Tab. L10.3.3) Κ

η;1-α/2

= K

10;0.95

= 19

auch hier die Unabhängigkeitshypothese zum 10% Niveau n i c h t verworfen werden kann, denn 13.0005 H 9 - K n ; 1 _ a / *

LÖSUNG

ZU

AUFGABE

10.A

Bei einer angestrebten Analyse der Abhängigkeit zwischen zwei (diskreten bzw. diskretisierten) Zufallsvariablen, die jeweils nur 'wenigeverschiedene Ausprägungsmöglichkeiten besitzen, so daß bei η beobachteten Paaren "viele" gleiche Werte, d.h. Bindungen auftreten, können die bisher behandelten Methoden der Korrelationsanalyse nicht mehr zur Anwendung kommen. Als Ausgangspunkt der für diesen Fall bereitstehenden Verfahren betrachte man zunächst die gemeinsame Verteilung des Zufallsvektors (X,Y).Werden die k'i, verschiedenen Ausprägungsraöglichkeiten mit (a^,bj), i = l,...,k, j = 1 b e z e i c h n e t , so ordnet man dabei

der Übersicht wegen (vgl. Aufgabe 3.14) die Einzelwahr-

scheinlichkeiten Ρ (X = a. , Υ = b.) = p. . ι : ιί

für i = l,...,k und j = l,..., I

286

Teil l: Übungsaufgaben, Erläuterungen und Lösungen

welche die gemeinsame Verteilung kennzeichnen, sowie die Randwahrscheinlichkeiten

£ P(X = a.) = 1

P(Y = b.) = 3

y p..=p. j=l 1 3 k l

p. . = p

, 1 = 1,.. . ,k

.

ο

, j=l

welche die Randverteilungen von X und Y eindeutig bestimmen, in einer (kx £) Tafel, vgl. Cab. £10.4.1, an. Dabei gilt k

l

k

i

I I p ( i = ί ρ, 11 i=l j = 1 i=l

=

I ρ , 5 j = l "J

1

Hab. CIO.4.1: (k*£) - Tafel der gemeinsamen Verteilung zweier (diskreter) Zufallsvariablen X und Y

\

Y b

x

\

1

···

1

P

11

· •

a

k

P

kl

· •

P.1

· •

p

p

u

1.



a

·

CL ^

l

p



1

P.i

Werden nun η unabhängige Beobachtungen von (X,Y) gemacht und hält man dabei fest, wie oft die Ausprägungskombination

(a^,bj eingetreten ist, so lassen

sich diese beobachteten, absoluten Häufigkeiten, die mit

, i=l,...,k ,

j=l,...,& , bezeichnet werden sollen, ebenfalls in einer (kxH) - Tafel, vgl. Cab. CIO.4.2, der sogenannten

(kxS.) - Kontingenztafel

(vgl. Kapitel 12), fest-

halten. Die Randhäufigkeiten

η. χ

η

= ·

Ζ ) η.. j=l 1 3

k . = Υ i=l

n. . ^

, i=l,...,k

.

bzw.

, j = l,...,{,,

liefern dann gerade die beobachtete Anzahl des Ausprägungswertes a^ von X bzw. b. von Y. Insgesamt ist natürlich

Kapitel 10: Abhängigkeitsanalyse - Korrelation und Assoziation

k l k y y n.. = y π3 i=l j=l i=l

Iah. £10.4.2:

Y

x \

b

1

·



a

1

"ll

·

a

k

"kl

· •

n

·

I

.1

l £ j=l

η . = η . J Ί

(k*Z) - Kontingenztafel

σι«

\

n. = ι.

287

l

u

n

n

"1.

n

U

k. ri

Ist k=2 und 1=2, d.h. weisen die Zufallsvariablen X und Y jeweils nur zwei verschiedene Ausprägungen auf, so heißt die (2*2) -Kontingenztafel auch Vierfeldertafel .

-»(a) Eine Möglichkeit,die Abhängigkeitsstruktur von X und Y in einer (2x2) Tafel zu charakterisieren, stellt das Q - Maß von Yule dar, das mit P

11P22 ~P12P21

" 11P22 P

+ P12P21

gegeben ist. Für dieses gilt -1 < Q < 1 wobei allerdings die Werte +1 und -1 nicht nur bei vollständiger Abhängigkeit von X und Y angenommen werden, sondern schon dann, wenn mindestens ein p^j = 0 ist. Bei Unabhängigkeit gilt Q = 0. Dieses zu den sogenannten Assoziationsmaßen

(Zusammenhangsmaßen) zählende

Maß wird aus der Kontingenztafel geschätzt durch den Yuleschen Assoziationskoeffizienten "

n n

iln22-n12n21

~ lln22

+ n

i2 n 21

der häufig auch mit Α

'

bezeichnet wird.

288

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

Ein approximatives Konfidenzintervall zum Niveau 1 - α für Q ist durch [Q!.Q2] mit

η

ϊ

A l

"12

ι 1

0

'-a/2 ä =Q + u

2

,,

1

, " 2— · (1 - 0 ) ·

η

/ A l

+

i n

r~

21

"22

ϊ ϊ + + "12 "21 n 2 2

gegeben. Um den Einfluß der Rauchgewohnheit X mit den Ausprägungen a 1 = 'Raucher 1 , = 'Nichtraucher' auf die Erkrankung an einem Bronchialkatarrh Y mit den Ausprägungen b^ = 'Ja' und b^ £ 'Nein' zu schätzen, werden zunächst die in der Aufgabenstellung gegebenen Beobachtungswerte in einer (2*2) - Kontingenztafel übersichtlich zusammengestellt, vgl. tab. CIO.4-3.

iah. CIO.4.3: Bronchialkatarrherkrankungen bei Rauchern und Nichtrauchern

Ja (b,)

Nein (b 2 )

35

15

50

27

43

70

62

58

120

Raucher (a^)

Nichtraucher

(a^)

Ϊ

I

Damit ergibt sich für den Yuleschen Assoziationskoeffizienten als Schätzer für den Zusammenhang zwischen X und Y ι . 35 - 43 - 27 - 15 _ 1100 " 35 · 4 3 + 27 · 15 1910

y

=



575g

-

Zum Niveau 1 - α = 0.90 soll nun noch ein Konfidenzintervall tionsmaß Q bestimmt werden. Mit u^_ a y2 Grenzen dieses

= u

für das Assozia-

o 95 = 1 -6449 erhält man für die

Intervalls

Q, = 0 . 5 7 5 9 - 1 . 6 4 4 9 4 . ( 1 - 0 · 5 7 5 9 2 ) . / ^

+ ί

^

+

= 0.5759 - 1.6449 · 0.3342 · 0.3944 = 0.5759 - 0 . 2 1 6 8 = 0.3591

^

Kapitel 10: Abhängigkeitsanalyse - Korrelation und Assoziation

289

Q 2 = 0.5759 + 0.2168 = 0.7927 d.h. als 0.90 - Konfidenzintervall [0.3591 , 0.7927]

-»(b) Da zwei (diskrete) Zufallsvariablen X und Y als (stochastisch) unabhängig anzusehen sind, wenn die gemeinsame Verteilung als Produkt der Randverteilungen darstellbar ist (vgl. Aufgabe 3.14.C), läßt sich die Hypothese der Unabhängigkeit von X und Y hier durch Η : rρ . = p. 0 i] "ι.

·ρ .

für alle i = l , .. . ,k , j = l ,...,{.

,

zum Ausdruck bringen. Diese ist zum Niveau CL gegen die Alternative H^ : ρ.

ρ.

·ρ

für mindestens ein Paar (i,j)

zu testen. Das Testverfahren beruht auf der Prüfgröße 2 k Z I η. . - m. .) χ = l l m i=i j=i ij 2

Die Größe m _

mit

η.·η. m..=-±= ^

.

gibt dabei, falls Unabhängigkeit zwischen X und Y vorliegt,

eine Schätzung für die erwartete Anzahl der Beobachtungen für die Ausprä2 gungskombinationen (a.,b.), i=l,.. . ,k , j = l,...,£. , an. Da χ unter der Hy1 3 2 pothese H^ die Realisation einer approximativ "Verteilten Zufallsvariablen darstellt, kann die Hypothese der Unabhängigkeit zum Niveau a verworfen werden, wenn 2 X

>X 2

(k-1) M - l ) ,-1-α

erfüllt ist. Die verwendete Approximation ist dabei in der Regel zufriedenstellend, wenn in jedem Feld (Zelle) der (k*£.) - Tafel η

> 5 Beobachtungen

vorliegen bzw. m^j > 5 unter der Hypothese zu erwarten sind (Faustregel). Liegt eine Vierfeldertafel vor, d.h. ist k = 2 , l = 2 , so läßt sich die angegebene Formel für die Prüfgröße weitgehend vereinfachen, denn es gilt

2 x

l

f

(n

1•= 1, 3Α= 1

Aus dem im Aufgabenteil

ij-mi1)2 m

(n

lin22'nl2n21>2

-i·j

(a) bestimmten Assoziationskoeffizienten der Höhe

290

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

Q = 0.5759 sowie dem zugehörigen Konfidenzintervall

ist bereits zu erkennen,

daß mit ziemlicher Sicherheit eine Abhängigkeit zwischen der Rauchgewohnheit X und der Bronchialkatarrherkrankung Y vorliegt. Die Vermutung soll nun noch zum Niveau a = 0 . 1 0 signifikant abgesichert w e r d e n , d.h. es gilt H

0 : Plj = Pi. - P . j

> i = 1 > 2 , j = 1,2

,

gegen H1: ρ

+p.

·ρ ^

für mindestens ein

(i,j)

zu testen. Mit den bereits in Tab. L10.4.3 zusammengestellten

Häufigkeiten

n ^ , i,j == 1,2 , die von dem Arzt beobachtet wurden, ergibt sich für die Prüfn ij' ' große der Wert 2 X

=

120 · (35 · 4 3 - 15 · 2 7 ) 2 50 · 62 . 70 · 58

145200000 . „ „c 12586000 " 1 1 · 5 3 6 6

=

c

·

Dieser ist bei einer mit Irrtumswahrscheinlichkeit von höchstens a = 0.10 zu treffenden Entscheidung wegen k = 2 und 1 = 2 mit

x

(k-1)(£-1);1-a

= x

1;0.90

=

2

·706

zu vergleichen. Da also x 2 = 11 .5366 > 2.706 = x

2

k

.

1 ) ( j l

.

l )

.l.

a

,

muß die Unabhängigkeitshypothese zum 10% Niveau, wie erwartet, verworfen werden.

LOSUNG

ZU A U F G A B E

10.5

->(a) Die gemeinsame Verteilung der zufälligen Größen Arbeitslosigkeit X und Geschlecht Y ist in nachfolgender ( 2 x 2 ) - T a f e l , vgl. Cab. CIO.5.1, dargestellt ( v g l . A u f g a b e 10.4). Dabei wurden die

Ausprägungsmöglichkeiten

a^ = 'Ja' und a g ^ ' N e i n ' von X sowie b^ = 'Weiblich' und b^ = 'Männlich' von Y jeweils mit Τ

und '2' kodiert, so daß in diesem Fall für i,j=1,2

P ( X = i . Y = j) = P i0 · P(X = i) = P i P(Y = j) = P.j gilt.

,

.

Kapitel 10: Abhängigkeitsanalyse

Iah.

\

CIO.5.1:

Y x

Gemeinsame

1

Verteilung

2

P

2

Σ

Für

die

sowie

11

P

12

p

1.

P

21

P

22

p

2.

p

.1

p

.2

Korrelation

stellte

mit

(X,Y) = (Arbeitslosigkeit,

291

Geschlecht)

1

ρ zwischen

(vgl. A u f g a b e

X und Y

3.14) e r h ä l t

(vgl. A u f g a b e

der

3.6)

E(X) = 1 · P(X = 1) + 2 · P(X = 2)

=

+

E(Y) = 1 . P(Y = 1)

=

+ 2 · p>2

den

und Assoziation

I

\

1

von

- Korrelation

2 · P(Y = 2)

+

2 · P2>

=

1 +P

,

2 -

= 1 + p_2

Varianzen Var(X) = E(X2) - (E(X))2

= P

1.

=

2.p1.

p

+ 4

' p2. "

1

= 1 · P(X = 1) + 4 · P(X = 2) - (1 + p 2 _ ) 2

"

2

'p2."

P

=

2.

p

2. " p2.

=

p

2. "

(1

"

p

2.'

·

Var(Y) = E(Y2) - (E(Y))2

= 1 · P(Y = 1 ) + 4 · P(Y = 2) - (1 • p _ 2 ) 2 2

bzw.

der

= P

.1

=

P

+ 4

' p.2 "

1

"

2

' p.2 " p.2

=

p

.2 *

"

p

.25

.2P.1

Kovarianz Cov(X.Y) = E(XY) - E(X) ·

E(Y)

= 1 · 1 · P(X = 1 ,Y = 1 ) + 1 · 2 · P ( X = 1 ,Y = 2 ) + 2 · 1 · PCX = 2 , Y = 1 ) + 2 · 2 · P ( X = 2 , Y = 2 ) - E ( X ) · E ( Y ) = p

n

+ 2·

= 1 + P

gerade

die

Größe

1 2

P

+ P

1 2

2 1

+ 2 ·

+ 3- p

= p

22 " p2.p.2

=

p

=

P

P

1 2

1 1

P

2 2

- P

2 1

p21 + 4 · 2 2

-

1 _

p 2 2 - (1 + p 2 > ) · (1 + p_2) P

2

. " P . 2 "

P

2 .

P

22 " p21p22 " p22p12 " p22 "

. 2 p

21p12

Ange-

292

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

Cov(X,Y)

=

p

11p22 " p21p12 / P 1 ,P.1P2.P.2

V V a r t X ) · Var(Y)

Diese soeben berechnete Korrelation ρ heißt auch Phi - Koeffizient. Für dieses Assoziationsmaß gilt p = 0 bei Unabhängigkeit von X und Y; die Werte +1 bzw. -1 werden bei strikter linearer Abhängigkeit von X und Y angenommen, d.h. wenn p J 2 = P 2 1 = 0 bzw. p

n

= p 2 2 = 0.

->(b) Der Phi - Koeffizient als Zusammenhangsmaß in der ( 2 x 2 ) - T a f e l

(vgl. Auf-

gabe 10.4) wird geschätzt mit den absoluten Häufigkeiten aus der Kontingenztafel

durch n 11 n 22

'

n 12 n 21

/n1.n2.n.1n.2 In Cab. CIO.5.2 sind die von dem Angestellten registrierten

Beobachtungswerte

der Zufallsvariablen Arbeitslosigkeit X und Geschlecht Y bei den insgesamt vier verschiedenen Ausprägungskombinationen

(i,j) , i ,j=1,2 , festgehalten.

Die in der Aufgabenstellung fehlenden Werte wurden entsprechend ergänzt.

Cab. £10.5.2: ( 2 * 2 ) - Kontingenztafel, Arbeitslosigkeit bei Männern und Frauen

Geschlecht Arbei tsl

Weiblich

Männlich

1

2

Ja

1

9

6

15

Nein

2

20

30

50

29

36

65

I

Die im Aufgabenteil

(a) berechnete Korrelation ρ kann aufgrund der Stichpro-

benwerte also mit 9 · 30 - 6 · 20 — \/15 · 50 · 29 · 36 geschätzt werden.

=

150 \/783000

=

Q J 6 g 5

293

Kapitel 10: Abhängigkeitsanalyse - Korrelation und Assoziation

10.6

LÖSUNG ZU A U F G A B E

-»(a) U m d e n Z u s a m m e n h a n g

(die A s s o z i a t i o n )

zwischen zwei

variablen X und Y mit möglichen Ausprägungen

a^ ,.. .

schätzen, verwendet man häufig den Pearsonschen

(diskreten)

Zufalls-

b z w . bj,...,bj£

zu

Kontingenzkoeffizienten

wobei k

l

l

x2 = I gerade der

η. η

(n. . - m. ,) 2 13

^

im U n a b h ä n g i g k e i t s t e s t

entspricht.

Für C

-

-

l]

V

, i=l,...,k

η

, j = l,...,Jl,

(vgl.

gilt

Aufgabe

10.4.b)

verwendeten

Prüfgroße

m i n (k, 5.)

Um einen Assoziationskoeffizienten kann, w i r d der Pearsonsche daß

m.. =

-it

zu erhalten, der auch den W e r t

Kontingenzkoeffizient

oft dahingehend

1 annehmen korrigiert,

man c

=

corr als korrigierten

/ m i n (k, r ν m i n (k , l) - 1

Q

Pearsonschen Kontingenzkoeffizienten

verwendet.

Bezeichnet X die zufällige Größe 'Altersstufe', die mit k = 3 Ausprägungsmöglichkeiten angegeben ist, und Y die Zufallsvariable 'Käsesorte1 mit £. = 4 Ausprägungsmöglichkeiten, so sind in Cab. £10.6.1 die beobachteten Häufigkeiten für die Ausprägungskombinationen (a^,bj), i=1,...,3 , j=1,...,4 als (3x4)Kontingenztafel

(vgl. Aufgabe 10.4) noch einmal aufgeführt. Weiterhin werden

in dieser Tabelle die zur Berechnung des Pearsonschen Kontingenzkoeffizienten benötigten, geschätzten erwarteten Häufigkeiten m-jj=n.j " j / 200 , i=l,...,3, j=1,...,4, (bei Annahme X und Y unabhängig) berechnet. Für m 2 3 erhält man z.B. n

m

2 3

2.n.3 64 · 53 = — — = - 2 ö ö - = 16.96

.

Zur Überprüfung der eigenen Rechenergebnisse bediene man sich der Beziehungen 3 l

4 ι

i=1 j = 1

3 I

m. . = η = 200

bzw.

1J

m.. = η ,

,

4 l

m.

= η.

, i=1,...,3 , j = 1,...,4

.

294

ο ο 2].

-•(a) Die Methode der kleinsten Quadrate (KQ - Methode) stellt ein Verfahren dar, um Punktschätzer b^ und b^ für die Parameter ß^ und ß^ eines linearen Regressionsmodells zu ermitteln. Dabei wird eine Regressionsgerade

*=V

V

als Schätzer für den Erwartungswert E(Y) so bestimmt, daß die Summe der quadratischen vertikalen Abweichungen der beobachteten Werte y. von den durch die Regressionsgerade an den Stellen x^ gelieferten Werten y i = b Q

+ b

X 1

i

minimal wird. Als Lösung dieses Minimierungsproblems

Minimiere

? 2 ) (y. - b . - b . x . ) ^Jj ι 0 1 ι

bzgl. der Unbekannten b. und b, ' O l

304

ergibt

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

s i c h f ü r den S t e i g u n g s p a r a m e t e r

η l b

(x1-x)(yi-y)

b z w . das A b s o l u t g l i e d

Schätzwert

sxy

η : ι (χ.-ί)2 1 1=1

i

ß^ d e r

S

Γ x

'

ß^ w i r d g e s c h ä t z t

durch

b ^ y - b j i

=

1

n

_

y

χ

·

• ι

η . . 1=1

n

1

y = — η

y 1=1

.



ι

Da vermutet werden kann, daß d i e Ersparnisse (Y) annähernd l i n e a r vom v e r fugbaren Einkommen (X) abhängen, s o l l e n d i e Parameter ßg und ß^ d i e s e r Beziehung nach der Methode der k l e i n s t e n Quadrate geschätzt werden. Aus den f ü r η = 10 Jahre vorliegenden Beobachtungswerten ergeben sich m i t -

x

=

ι y TÖ .i,

x

i

1 10 ' = ! . [ ,

ι TT

536

= 53

1 =to-

5 8

=

=

5

·6

'

·8

die Schätzwerte bg und b^ nach der KQ - Methode zu

10

10

I (X, - x ) ( y , - y ) I x,y,-iOxy 1 1 . _ i=1 _ i =1 1 1 _ 3349.64 - 3108.80 D 1 TO ; Π5 : Γ = 30447.30 - 28729.60 y (χ,-χ)^ y χ. - i o x 1 i=1 i=1 1 =

240 84 · = 0 1402 1717.70

und b Q = y - 0.1402 · χ = 5.8 - 0.1402 · 53.6 = - 1.7147

.

Somit kann a l s o das verfügbare Einkommen eines Jahres geschätzt werden durch y = - 1 .7147 + 0.1402 χ

.

Diese Regressionsgerade i s t i n Abb. C H . 1 . 1 gemeinsam m i t den paarweisen Beobachtungswerten (x^

i=1,...,10,

dargestellt.

305

Kapitel 11: Regressionsanalyse

A b h . C H . 1 * 1 : Verfügbares Einkommen und Ersparnisse in η = 10 Jahren sowie die geschätzte Regressionsgerade y = - 1 .7147 + 0.1402 χ

-»(b) Die Varianz σ

der Zufallsvariablen Y^, i=l,...,n, die gleichzeitig

auch die Varianz des zufälligen Fehlers angibt und daher oft auch als Fehlervarianz bezeichnet wird. läßt sich schätzen durch

s2 =

(y

?

1=1

i " V

2

mit

y

i

= b

0

+

V i

Die in diese Formel eingehenden Abweichungen

y

i -

y

i

= y

i -

b

o - V i

'

1=1

'

werden auch Residuen der Regression genannt. Ein (1 - α) - Konfidenzintervall für die Varianz σ (n-2)s2 ^n-2; 1 -α/2

In tab. C H . 1 . 1

ist bestimmt durch

(n-2)s2 n-2 ;a/2

sind die für η = 10 Jahre beobachteten Ersparniswerte y ^ ,

die zugehörigen Werte der Regressorvariablen

'Verfügbares Einkommen 1

x.

306

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

sowie die mittels linearer Regression geschätzten Werte y^ = - 1 .7147 + 0.1402x.j und die Residuen y^ -y.. für i=1,...,10

zusammengestellt.

C a h . £11.1.1: Beobachtungen y ^ , x ^ , geschätzte Werte y^ sowie Residuen

yi

-yiS

i=1

10

X

i

y

1

2 8

34. 2

3 0801

- 0 2801

2

4 1

40 8

4 0055

0 0945

3

4 5

42 5

4 .2438

0 2562

4

4 3

47 3

4 9168

-0 6168

5

4 .9

50 1

5 .3093

- 0 4093

6

5 .8

52 6

5 .6598

0 1402 0 7373

i

y

i

7

7 .0

56 9

6 .2627

8

7 .7

61 4

6 .8936

0 8064

9

8 .1

73 5

8 .5900

- 0 4900

10

8 .8

76 7

9 .0386

- 0 2386

2 Damit ergibt sich als Schätzer für die Varianz σ s- = x n — r 2 " ^ 1

ι (y i - y ^ 10 1=1

2

gerade

= g- [( - 0.2801 ) 2 + 0.0945 2 +...+ ( - 0.2386)'

= i · 2.2116 = 0.2765

.

2 Mit den Quantilen der χ 8 - Verteilung

V2;1-a/2

*n-2;a/2

= x

= X

8;0.95 =

8;0.05

=

2

15

"51

u n d

"733 2

ist das gesuchte Konfidenzintervall [8^2765 gegeben.

_ 8 · 2 0.2765|

zum Niveau 1 - α = 0.90 für σ =

[0

. 1 4 2 6 , 0 .8094]

.

also in

307

Kapitel 11: Regressionsanalyse

-(c) Das Bestimmtheitsmaß d e r Regression . 2 (y

A B

i-yi

1

Y,X =

m i t

y

i

= b

o

+

V i

'

1=1

n

'

(y-y)2

l i =l

d i e n t a l s Maß f ü r d i e Güte der Anpassung der g e s c h ä t z t e n

Regressionsgeraden

an d i e Beobachtungswerte. Dies g i b t den A n t e i l der Varianz von Y an, der durch d i e Regression e r k l ä r t werden kann. Für das Bestimmtheitsmaß g i l t 0 k+l] ,2 =

Γ Γ Γ Τ Τ

ι

x=l

( y

i - y i

( x

i

V

Es wird vermutet, daß in der BONBONREPUBLIK die pro Einwohner konsumierte Gummi bärchenmenge Y vom Preis X^ u n d vom P r o - K o p f - E i n k o m m e n X 2 a b h ä n g t , d.h. es soll eine Nachfragefunktion der Gestalt y = b Q + b1x1 + b 2 x 2 geschätzt werden. In t a b . C H . 3 . 1

sind die in η = 7 Jahren beobachteten A u s -

prägungswerte noch einmal neben einigen im weiteren benötigten

Hilfsgrößen

zusammengestel 11.

tah. C H . 3 . 1 : Beobachtete Werte y ^ Werte x ^ , x 2 i d e r Regressoren, Schätzwerte y i ( x 1 ,x 2 ) u n d Residuen y i - y i ( x 1 ,x 2 ), i=1,...,7

Χ

i

Ii

x

2i

(x1 , χ 2 )

y

i - y i

( x

i '

x

1

2 59

4 34

1826

2 .6240

- 0 0340

2

2 77

4 29

1831

2 .7069

0 0631 - 0 0304

3

2 86

4 16

1834

2 .8904

4

2 88

4 20

1842

2 .8625

0 0175

5

2 93

4 12

1836

2 .9504

- 0 0204

6

3 05

4 03

1847

3 .1060

- 0 0560

7

3 22

3 98

1843

3 .1601

I

20

30

29

12

12859

0

0599

2

}

320

Teil I: Übungsaufgaben, Erläuterungen und

Lösungen

Mit den Durchschnittswerten 1 7 1 y = τ l y,· = ) · 2 0 · 3 0 ' 1=1 1 ' 7

1

•xi

x

=

ii

=

χ

9il · = Τ/ ·

r

7

1

.

1 x

7 ^

9c = τ/

=2·90

I i=1

2 9

1

·

1 2

12859

= 4,16

=

'

1837

berechnet man zunächst SQY X

=

ϊ

2

=

v

v

=

V

SPX

7 y

i 1 7 y

γ

=

7 l

= 23622311 - 23621983

= 328

,

^

x, .x,. - 7x,x 0 = 53488.54 - 53493.44 = - 4 . 9 0 ^1 ^1 ' t-

x . . y . - 7 x , y = 84.2962 - 84.4480 = - C . 1518 11

i =1

,

1

ίΛ

i=1

12

SPV

11

i=1

SQv

SPV

x2.. - 7x? = 121 .2410 - 121 .1392 = 0.1018

= l

1

1

,

,

1

x 2 i y i - 7x 2 y = 37298.70 - 37291 .1 0 = 7.60

.

Die K l e i n s t e - Quadrate - Schätzer b^ und b^ ergeben sich a l s Lösung des somit festgelegten

Normalengleichungssystems

0.1018 b 1 -

4.9000 b 2 = -0.1518

- 4.9000 b 1 - 328.0000 b 2 = 7.6000

b 1 = - 1 .3379 b2 =

0.0032

, .

Weiterhin kann dann a l s o wegen bQ = y - b 1 x 1 - b 2 x 2 = 2.90 + 1 .3379 · 4.16 - 0.0032 · 1837 = 2.5873 mit y = 2.5873 - 1 .3379 x, + 0.0032 x 2 eine geschätzte Nachfragefunktion f ü r Gummibärchen angegeben werden.

Kapitel 11: Regressionsanalyse

321

Die Schätzwerte y . = y i ( x 1 ,x 2 ) = 2.5873 - 1 . 3 3 7 9 χ 1 · + 0.0032 χ 2 ·

, i =1

7

,

die sich aus der multiplen Regressionsgleichung ergeben, sind ebenso wie die Abweichungen y , · - y i = y i - y i ( x 1 ,x 2 )

, i=l,...,7

, 2

bereits in Tab. L11.3.1 angegeben, so daß der Schätzer für die Varianz σ bei k = 2

berechnet werden kann: s2 =

. 2 . 1

7

(yn- " V i ) 2

l

= j · 0.0135 = 0.0034

.

•(b) Das m u l t i p l e B e s t i m m t h e i t s m a ß

( v g l . Aufgabe

I i =l BY,(X

y

i

= y

i

Xk ) "

1

( x

l

= { ( ( - 0.0340) 2 + 0.0631 2 + ... + 0.0599 2

< yi , - ?'

ll.l.c)

2

1

X , Ϊ (y, - y ) i =l

XkJ

=b

o

+ b

i

x

i i

+

- - -

+

V k i

'

i =1

n

g i b t a n , w e l c h e r A n t e i l d e r V a r i a n z d e s R e g r e s s a n d e n Y durch d i e X^ , . . .

e r k l ä r t werden k a n n . Für d a s B e s t i m m t h e i t s m a ß g i l t 0

i BY,(X

1

ν

k

' Regressoren

stets

1

1

und V x . i B Y , ( x D 1

ν

für

k

j=1

k

-

Mit

I i=1

(y--y)2= 1

und der im Aufgabenteil siduen

I i=1

y ? - 7y 2 = 59.1108 - 58.8700 = 0.2408 1

(a) bereits berechneten Summe der quadratischen

Re-

322

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

7 „ I ( y , - y j = 1 1 i=1

0.0135

ergibt sich das Bestimmtheitsmaß der multiplen Regressionsfunktion zu

B

Y,(XrX2)

= 1

- S S

= l

- ° ·

0 5 6 1

=

0

·9439

.

d.h. etwa 94% der Variation in der konsumierten Gummibärchenmenge können durch den multiplen Regressionsansatz in Preis und Einkommen erklärt werden.

- ( c ) Zu g e w i s s e n , vorgegebenen Ausprägungen x ^ , x^ » · · - »x^ der Regressoren e r h ä l t man in

y

0=b0

+ b

lXl+b2X2+

" • • V i c

e i n e Prognoseschätzung f ü r den zugehörigen Wert des Regressanden Y .

Bei einem Preis von x ? = 3 . 9 0 WE/kg und einem P r o - K o p f - E i n k o m m e n von 0 x 2 = 1 8 5 0 WE wird die pro Einwohner konsumierte Gummibärchenmenge wegen

y 0 = b Q + b 1 - 3 . 9 0 + b 2 · 1850 = 2 . 5 8 7 3 - 1 .3379 · 3.90 + 0.0032 · 1850 = 3.2895 auf ca. 3 . 3 k g

jährlich

prognostiziert.

-»(d) Um f e s t z u s t e l l e n , ob es überhaupt notwendig i s t , a l l e X , . . . ,X

Regressoren

zu b e t r a c h t e n , oder ob v i e l l e i c h t q bestimmte Regressoren zur Er-

klärung von Y ü b e r f l ü s s i g s i n d , kann d i e Hypothese H„ : X , . , , . . . ,X,, 0

(1)

zum Niveau α gegen d i e

wobei X

,

reichen a l s Regressoren aus

(k-q) Alternative

Η, : X, Χ„ , reichen a l s Regressoren n i c h t aus , 1 (1) (k-q) ,...,X e i n e bestimmte Auswahl aus X , . . . , X kennzeichnen, il) (k—q) 1 k

t e s t e t werden. Dazu wird zunächst e i n e Regression von Y auf X , . . .

ge-

be-

rechnet und

s s

\

=B

Y,(X1

xk> · X

( y

i"5)2

bestimmt. Anschließend w i r d e i n e R e g r e s s i o n von Y auf d i e Auswahl X

(k —q)

d u r c h g e f ü h r t und aus dem zugehörigen

Bestlmmtheitsmaß

»·--»

323

Kapitel 11 : Regressionsanalyse

SSR

k-c *

= b

q

2

Y (χ Y

χ

' ( (1)

) ' (k-q)'

Σ

(yi-y» 1

i=l

berechnet. Als Prüfgroße verwendet man dann SSRj^ - SSR^ 2 ' s q die unter H„ die Realisation einer F - verteilten Zufallsvariablen 0 q,n-k-l F =

darstellt. Die obige Reduktionshypothese H^ kann dann zum Niveau α verworfen werden, falls F > F q,n-k-l;1-a gilt. Ist es nicht möglich, die Reduktionshypothese abzulehnen, so sei aufgrund der oftmals hohen Abhängigkeit zwischen den Regressoren

(Multikollinearität)

davor gewarnt, direkt zu folgern, daß die hierbei eliminierten Regressoren keinen Einfluß auf Y haben. Vielmehr kann man i.a. nur sagen, daß diese bei gleichzeitiger Berücksichtigung von X

. ,...,X. . keinen wesentlichen (1) l k - q) sätzlichen Beitrag zur Erklärung von Y leisten.

zu-

Zum Niveau α = 0.05 i s t zu prüfen, ob das verfügbare P r o - K o p f - E i n k o m m e n X^ zur Erklärung des Konsums von Gummibärchen Y überhaupt notwendig i s t , d.h. es s o l l HQ : Xj r e i c h t a l s Regressor aus

[d.h. 3 2 = 0]

gegen H 1 : X 1 r e i c h t a l s Regressor n i c h t aus

[d.h.

ß2/0]

g e t e s t e t werden. Unter der Hypothese Hg i s t a l s o eine Regressionsgerade

y(xC 1

= b

0

+ b

1

x

rait

(1)

X

(1)=X1

zu bestimmen. Nach der KQ - Methode (vgl. Aufgabe li.i.a) ergeben s i c h h i e r die Schätzwerte, v g l . Aufgabenteil 7 l h * - i=1 b 1 7

n

-xJty,-y) 1

^ ( « „ - i , )

1

2

(a),

SP« „ X Y 1 1

-0.1518 0.1018

. ._,„ '-1-W12

.

324

Teil I: Übungsaufgaben,

b* = y - b ^

Erläuterungen

und

Lösungen

= 2.90 + 1 .4912 · 4 . 1 6 = 9 . 1 0 3 4

Das B e s t i m m t h e i t s m a ß d e r l i n e a r e n

Regression

.

mit

y ( x ( 1 ) ) = y ( x 1 ) =9.1034 - 1 . 4 9 1 2 x1 b e r e c h n e t s i c h m i t den in C a b . C l l . 3 . 2 a u f g e f ü h r t e n , z u g e h ö r i g e n sowie, vgl Aufgabenteil 2

7

l (y,-y) 1 i=1

,

3

Y,X(1)

_

=

D b

= 0.2408

Y,X1

=

(-0.0416)2 + 0.06382 + . . . + 0.05162 —or^ras

1

- 1 . 0-0144 _ " 1 0.240S "

0 U

"

g 4 0 2 9 W

·

S a b . £ 1 1 . 3 . 2 : B e o b a c h t e t e Werte y ^ , Werte x ^ y.j(χ 1) und d i e R e s i d u e n y . -

1 1

x

2.59

1i

y

4 .34

2 .6316

des R e g r e s s o r e n ,

i" -O 0416

2

2.77

4.29

2 7062

0 0638

2.86

4 .16

2 9000

- 0 0400

4

2.88

4 .20

2 .8404

0 0396

5

2.93

4.12

2 9597

- 0 0297

6

3.05

4.03

3 0939

- 0 0439

7

3.22

3.98

3 1684

0 0516

W e i t e r h i n e r g a b s i c h im A u f g a b e n t e i l v,(xrx2)

= °·9439

Schätzungen

) f ü r i = 1 , . . . ,7

3

B

Residuen

(b),

(b)

'

s o daß nun mit SSR2 = Β

γ,(χ1 ,x2)"

7 s s r ;1 == Β Dv IM \ · l Y . ( X { 1 ) J 1 i=1 " "(1)

( y

i

(y, - y ) ι

2

=

°·9439 " °·2408

=

°·2273

= 0.9402 · 0.2408 = 0.2264

'

und

Kapitel 11: Regressionsanalyse

325

S 2 = 0.0034 für die Prüfgröße der Wert S S R 0 - SSR' £ 1

ρ

s

0.2273 - 0.2264

n

* 1

ermittelt wird. Da F

q,n-k-1;1-a

= F

1,4;0.95

= 7

·709

'

kann die Hypothese, daß der Preis X^ zur Erklärung von Y ausreicht, also nicht verworfen w e r d e n , denn F = 0.2647 } 7.709 = F q,n-k-1;1-a

LÖSUNG ZU AUFGABE 11 Mit H i l f e der M a t r i z e n d a r s t e l l u n g

l a s s e n s i c h d i e in Aufgabe 11.3 behandelten

V e r f a h r e n im Zusammenhang mit der m u l t i p l e n Y

=W

i

+

--- + V k

Regressionsfunktion

+ e

i n v e r e i n f a c h t e r Form angeben.

+ ( a ) S e t z t man d i e Stichprobenwerte wie f o l g t zusammen y,

1

y=

X

1 1 ·-- X k l

X = 1

χ

In

so l a u t e t das Normalengleichungssystem

. . .

X,

kn

( v g l . Aufgabe 1 1 . 3 . a )

des S c h ä t z v e k t o r s

b =

f ü r den Parametervektor

nach der Methode der k l e i n s t e n

xTXb=xTy

Quadrate

β=

zur Bestimmung

326

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

Falls Χ

X invertierbar

ist,

b = (XTX)_1XTy

so e r g i b t

sich

.

Hierbei bezeichnet χ Τ die Transponierte

von X und ( X T X )

1

die Inverse

von

X X. T

2 Der S c h ä t z e r f ü r d i e V a r i a n z σ auch d a r g e s t e l l t s 2

wobei

I

werden a l s

=^rr-f

die

von Y , d . h .

(vgl.

Aufgabe

1 0

0 0 ... 0 1 0 . .. 0

.0

0

kann h i e r

11.3.a)

yT(In-X(XTX)"1XT)y

(η χ η ) - d i m e n s i o r i a l e

für die Fehlervarianz,

.

Einheitsmatrix

In"

bezeichnet

0 ... 1

[n>k+l].

Der Bearbeitungszeit Y von Holzlatten in einer Maschine wird in Abhängigkeit von der Länge X ^ der Breite X 2 und der Dicke X 3 folgende multiple Regressionsfunktion unterstellt Y = ßQ + ß 1 X 1 + ß 2 X 2 + ß 3 X 3 + e Die für η =8 Holzlatten unabhängig voneinander beobachteten Bearbeitungszeiten y i , i=1

8, ergeben zunächst den Beobachtungsvektor 60.1 80.5 38.9 86.7 74.6 90.4 120.3 52.5

und die an der i - ten Holzplatte gemessene Länge x ^ , Breite x 2 i und Dicke x 3 i werden für i=1,...,8 in die sogenannte Designmatrix X eingetragen:

Kapitel 11: Regressionsanalyse

16.5 26.1 15.4 17.6 18.9 21.2 27.5 16.8

170.1 158.3 151.6 186.2 176.4 190.0 178.5 166.9

8.0 7.9 6.2 5.8 6.7 6.0 8.0 7.4

Die K l e i n s t - Quadrate - S c h ä t z e r b Q , b 1 , t>2> t> 3 , d . h . d e r S c h ä t z v e k t o r

b =

b e r e c h n e t sich wegen 8.00 1378.00 160.00 56.00

X X T

604.00 105578.18 12734.35 4253.91

(XTX)_1

c c

-21.83779 0.10842 -0.12563 0.81077

00

C

01

C

02

C

10

C

12

c

22

c

23

c

33

11

c

C

20

C

21

c

C

30

C

31

C

= (XTX)"1XTy

Für vorgegebene

56.00' 9616.19 1133.90 398.14

und

5224.30418 -21.83779 21.66254 -269.07068

1 TM

160.00 27624.67 3345.52 1133.90

1378.00 238580.72 27624.67 9616.19

32

21.66254 -0.12563 1.02235 -2.92437

03

13

•188.5849 1.0589 3.9934 0.2988

Maße x ^ x 2 und x 3 e i n e r H o l z l a t t e kann d i e z u g e h ö r i g e Be-

a r b e i t u n g s z e i t a l s o durch y = - 188.5849 g e s c h ä t z t werden.

-269.07068 0.81077 -2.92437 26.84328

1 .0589 Xj + 3.9934 x^ + 0.2988 x 3

327

328

Teil 1: Übungsaufgaben,

Erläuterungen

und

Lösungen

-»(b) Das Bestimmtheitsmaß (vgl. Aufgabe ii.3.b) a l s Maß f ü r d i e Güte d e r Anpassung der soeben e r m i t t e l t e n Regressionsbeziehungen an d i e b e o b a c h t e t e n Werte berechnet

s i c h m i t den i n Cab, C H - 4 . 1 zusammengestellten Werten und

8 I

i=1

8 (y--y)

2

=

I

y?-8y2

i=1

1

= 50088.02 - 45602.00 =4486.02

1

ö

2

l (yi-yi(xrx2.x3)) ~^

= 1 _ 1

2

2

l y--8y2 i=1 1

3

=

1

- 434869.°022

=

1

- ° · 0 5 2 6 = °-9474

t a b . C H . 4 . 1 : B e a r b e i t u n g s z e i t e n y . , g e s c h ä t z t e Werte y.. = y i ( x 1 , x 2 , x 3 ) und Residuen y^ - y ^ ,

1

y

i=1,...,8

y1- - y' l·

i

J

1

60.1

59 . 8 1 5 5

0 2845

0 0809 26 2 8 8 2

2

80.5

85 .6272

- 5 1272

3

38.9

35 . 2 9 5 3

3 6047

12 9 9 3 9

4

86.7

80 .5992

6 1008

37 2198

5

74.6

75 . 6 8 2 3

- 1 0823

1 1714

6

90.4

99 . 0 5 9 0

-8 6590

74 9783

7

120.3

112 . 6 3 7 7

7 6623

58 7108

8

52.5

57 . 4 4 58

- 4 94 58

24 4 6 0 9

I

604.0

235 9042

- • ( c ) Werden die Elemente der Matrix ( X T X )

(XTX)_1 =c =

'10

11

* wie folgt bezeichnet

lk

so ergibt sich als (1 - α ) - Konfidenzintervall für den Parameter ß^ der multiplen Regressionsbeziehung, j = 0,... ,k ,

329

Kapitel 11: Regressionsanalyse

h

"/

s 2

' C j j · Vk-1;l-a/2 ' bj

+

J

s 2

'Cii 'Vk-l

·

Es sollen Konfidenzintervalle zum Niveau 1 - α = 0 . 9 5 für die Parameter ßg, ß.|, ΐ>2 und ßj der multiplen Regression zwischen der Bearbeitungszeit Y und ur,

den Holzlattenmaßen X^,

d X3 bestimmt werden. Da die Fehlervarianz σ 2

mit den Ergebnissen aus Tab. L11.4.1 bei η = 8 Beobachtungswerten durch (vgl. Aufgabe 11.3.a) g s2 = 8 - 3 - 1



- ί ϊ ) 2 = } · 235.9042 = 58.9761

geschätzt wird, das Quantil der t n . k _ 1 - Verteilung sich zu

Vk-1;1-ct/2 = V.O.975 =

2-776

τ

-1

ergibt und die Diagonalelemente c·. der Matrix ( X x X ) zer bj für j=0,1,2,3 bereits im Aufgabenteil

' sowie die KQ - Schät-

(a) vorliegen, erhält man als

0.95 - Konfidenzinterval 1 für ß Q :

[-188.5849 - \/ 58.9751 -52.2430418 · 2.776 , -188.5849 + v/ 58.9761 - 52.2430418 -2.776] = [-188.5849 - 154.0890 , -188.5849 + 154.0890] = [-342.6739 ,-34.4959]

für ß^:

[1 .0589 - J 58.9761 - 0.0010842 - 2.776 , 1 .0589 + / 58.9761 - 0.0010842 - 2.776] = [1.0589 - 0.7020 , 1 .0589 + 0.7020] = [0.3569 , 1 .7609]

für ß 2 :

,

[3.9934 - y 58.9761 · 0.0102235 · 2.776 , 3.9934

58.9761 - 0.0102235 · 2.776]

= [3.9934 - 2.1555 , 3.9934 + 2.1555] = Li-8379 , 6.1489] für ß 3 :

,

[0.2988 - y 58.9761 ·0.2684328 -2.776 , 0.2988 + y 58.9761 - 0.2684328 - 2.776] = [0.2988 - 11.0452 , 0.2988 + 11 .0452] = [-10.7464 , 11 .3440]

.

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

330

-*(c)

Häufig interessieren Hypothesen über die Parameter ß , ß ,...,ß 0

01

der

multiplen Regressionsfunktion. Bei vorgegebenen Konstanten ß^ ergeben sich Entscheidungsregeln zum Niveau a, vgl. Iah. £11.4.2, für j=0,l,

,k über

die Prüfgröße

t =

b.-ß°

3-

2 sc.. 33

/

die bei Vorliegen von H„ die Realisationen einer t , . - verteilten Zufalls0 n-k-1 variablen darstellt.

CH.4*2: Tests zum Niveau OL für Hypothesen über den Parameter ß_. der multiplen Regressionsfunktion, j=0,l,...,k

H

β

o

H

1

Hg wird zum Niveau α verworfen, f a l l s

ß° 3 3

^Vk-l.-l-a

ß.>ß° 3- 3

ß. 15.51

(a), d.h.

,

also auch signifikante Unterschiede zum 5% Niveau bei den Verteilungen der Klausurergebnisse in den drei Fachrichtungen vor.

LÖSUNG ZU AUFGABE 12.2 -»(a) Es werden die Zufallsvariablen X = 'Regierungsparteianhänger' mit den Ausprägungen a^ = 'Ja', a ^ = 'Nein' und Y = 'Zufriedenheit mit Umweltschutzpolitik' mit b^ = 'Ja' und b ^ = 'Nein' auf signifikante Abhängigkeit hin untersucht, d.h. es soll die Unabhängigkeitshypothese H

0

: p

ij

= p

i. ' p.j

für

(vgl. Aufgabe

I2.i.a)

1 , j= 1 , 2

gegen Η ^ : p^ . ^ p.j · ρ j

für mindestens ein Paar (i,j)

zum Niveau cc=0.01 getestet werden. Die in der Aufgabenstellung gegebenen Ergebnisse einer Befragung von η = 400 zufällig ausgewählten Personen

lassen sich übersichtlich in einer

Kontingenztafel, einer Vierfeldertafel

(vgl. Aufgabe io.4.b),

(2*2)-

eintragen,

vgl. Cab. C12.2.1. Somit erhält man als Prüfgrößenwert 2 2 X

n =

(nnn22" V ^ l η, η η 2

der bei k = 2 , 1=2 x

5 =

_ 400(1 10 · 145 - 70 · 75) 2 _ , Q n 7 C , = 180 - 185 - 220 - 215 M-Q'U .

und a = 0 . 0 1 mit dem kritischen Wert

(k-i)(e-i);i-a

=

x?;o.99

verglichen werden muß. Da also

=

6

·635

344

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

Cab. £12.2.1: (2 χ 2) - Kontingenztafel; Zufriedenheit mit der UmweltschutzPolitik und .Anhängerschaft zur Regierungspartei

n ^ ZufriedenRe- \ heit gieγ rungspar- n. teianhänger Jfv

Ja

Ja

Nein

(b 1 )

(b 2 )

n 1 1 = 110

(a 1 )

Nein (a^)

n

I

π

21

1

=

n12=

75

Π

= 185

x 2 = 29.0752 > 6.635

22

=

I

70

145

η,

=180

n2

=220

η = 400

η 2 = 215

=x2k.1)u.l);1.a

gilt, kann die Unabhä'ngigkeitshypothese für X und Y zum 1% Niveau verworfen werden.

->(b) Die Oberprüfung der Homogenitätshypothese H

0:p*j

= p

2j

(vgl. Aufgabe

I2.i.b)

für j=1,2

gegen die Alternative H

1

bei k=2, 1=2, Pn = 1-P12

: p

*j ^ p2j

fÜr

m i n d e s t e n s

ein

J

d.h. mit Hilfe einer Vierfeldertafel, entspricht wegen und

P21

= 1

" p22

e i n e m

T e s t

a u f

Gleichheit der Wahrscheinlich-

keiten (vgl. Aufgabe 8.9) für die Zufriedenheit mit der

Umweltschutzpolitik

Y: p. = p * = P ( Y = b.) 1 Ii '

unter der Bedingung a^ = Regierungsparteianhanger 1

p, = p* = P(Y = b.) 2 21 V

unter der Bedingung a 2 = Oppositionsparteianhanger

Da die im Aufgabenteil

(a) untersuchte Unabhängigkeitshypothese zum Niveau

α = 0.01 verworfen werden konnte, gilt dies bei gleichem Niveau wegen

345

Kapitel 12: Kontingenztafelanalyse

χ 2 = 29.0752 > 6.635 = X ? ; 0 . g 9 = X( k -1)

1); 1-α

auch für die obige Homogenitätshypothese, wenn angenommen wird, daß unabhängig voneinander n^ hänger und n^

= n ^ = 180 zufällig ausgewählte

Regierungsparteian-

= n 2 = 2 2 0 Oppositionsparteianhänger nach ihrer Meinung zur Um-

weltpolitik befragt wurden. Damit ist also der Anteil p^ · 100% der mit der Umweltschutzpolitik Zufriedenen unter den Regierungsparteianhängern als zum 1% Niveau signifikant verschieden vom Anteil \>2 · 100% der mit der Umweltschutzpolitik Zufriedenen unter den Oppositionsparteianhängern

LÖSUNG

ZU A U F G A B E

anzusehen.

12.3

Besitzt die Unabhängigkeitshypothese

(vgl. Aufgabe 12.1.a) Gültigkeit, so

äußert sich darin auch, daß die Werte in der Kontingenztafel sowohl spaltenweise als auch zeilenweise jeweils gleichen Verteilungen unterliegen

(vgl.

Zusammenhang mit der Homogenitätshypothese). Es bietet sich dann an zu untersuchen, ob eventuell dennoch sogenannte Spalteneffekte te ten

bzw. Zeileneffek-

auftreten, d.h. ob Unterschiede in den Randverteilungen bzgl. der Spalbzw. der Zeilen

zu verzeichnen sind. Mit den Bezeichnungen aus Auf-

gabe 12.1.a interessiert also die als bedingte Gleichverteilungshypothese bezeichnete Nullhypothese

H

o:pij=pi.·?

( ~

p

und

. j 4

[bzw.

P

Und

("Pi. 4

für alle i=l,...,k, j=l,...,£

ij=Pi. · P

ij

ρ

=P

ο ) i. · ρ ο ) ]

,

die gegen die Alternative

H

i : p i j + p i . "Z

[bzw.

(~P.jt{

η;

oder

ρ

(»Pi.H

ΐ:+ρχ. · ρ . 3 ) oder

p

ij+pi. · ρ ο ) ]

für mindestens ein Paar (i,j) zum Niveau α getestet werden soll.

Es sei noch darauf hingewiesen, daß bei fest vorgegebenen Werten für die Zeilensummen, d.h. bei einer Untersuchung

einer 'erweiterten' Homogenitätshy-

pothese, es nur sinnvoll ist, auf Spalteneffekte zu testen, d.h.

346

Teil /: Übungsaufgaben, Erläuterungen und Lösungen

H

Ö' : P i j

=

Z

für alle

h

V

i=l,...,k,

Und

l

=

j=l

gegen

H

V1 P i j * Z

(~P!j*f

für mindestens ein Paar zu prüfen, denn p*

= 1 für alle

Bei Vorliegen der Hypothese H^ achtungen

°der

Plj+Pl'j

i=l,...,k. [bzw. H^] w i r d d i e e r w a r t e t e A n z a h l v o n

für die A u s p r ä g u n g s k o m b i n a t i o n

für i=l,...,k,

m

ij

j = l g e s c h ä t z t

= n p

(oder b e i V o r l i e q e n v o n H*'

) von

~ c

L

L

b z w

-

m

unter H^

JC

-

1J

ι]

— ] verteilten

(K 1) JO

ι]

ι.

z u m N i v e a u 06 v e r w o r f e n w e r d e n

bedingte

falls

Γ [bZW·

2

approximativen

zufälligen Größe dar. Die

kann also,

Χ gilt,

ι.

( n .m. - m . . ) 2 ij

Gleichverteilungshypothese

2

· p * 9 = η , /Ζ) .

Prüfgröße

[ b z w . H^] i n d i e s e m F a l l d i e R e a l i s a t i o n e i n e r [bzw. χ 2

Fall

k j

d u r c h d e n s e l b e n W e r t m. . = n .

stellt die

X 2. = i=l Ik j=l Il

X?,»

in d i e s e m

^il

ij

0 Mit diesen Schätzwerten

(X,Y)

Beob-

durch

"i ·

=

ij - —

'

(i,j)

X

2

>X

2 1 (k-l)£;l^J

( e b e n s o HQ' , v g l . A u f g a b e

K15.c).

In Cab. C12.3.1 wird zunächst noch einmal festgehalten, wie sich die innerhalb von 6 Wochen verzeichneten η = 250 Käufer eines bestimmten PKW - Typs nach dem Alter (in Jahren) der Käufer mit a 1 = [18,35], a 2 = [36,70] sowie dem Verkaufsort Y mit b^ = Ά 1 ,

= 'B',... ,b g = Έ ' aufteilen. Als Kontingenz-

tafel enthält diese Tabelle natürlich auch die sich ergebenden Randhäufigkeiten. Es soll hier getestet werden, ob zum 1% Niveau signifikante Unterschiede in den verkauften Stückzahlen dieses PKW-Typs zwischen den Städten bestehen, d.h. ob die Hypothese, daß mit £ = 5 keine Spalteneffekte vorliegen, H

0:pij

= p

i

'i

für alle i = 1 f 2, j=1,...,5

zugunsten der Alternative H 1 : ρη- - φ p i

·

für mindestens ein Paar (i,j)

Kapitel 12: Kontingenztafelanalyse

347

zum Niveau α = 0.01 abgelehnt werden kann. Unter der Hypothese Hg wird die erwartete Anzahl von Käufern aus der i - ten Altersgruppe in der j - ten Stadt geschätzt durch η. in.. =—jU5

,

die für i=1,2 und j=1,...,5 ebenfalls in Tab. L12.3.1 angegeben sind. So ergibt sich etwa

Cab. £12.3.1: (2* 5) - Kontingenztafel; Käufer eines bestimmten PKW - Typs in fünf Städten bei zwei Käuferaltersklassen

\Stadt Y \ Al t e \ X \

A

Β

C

D

Ε

I

15=24

n 1 =100

η,,=26

n12=18

n

9

"14=23

m^ ^ =20

m 1 2 =20

m13=20

"1,4=20

m 1 5 =20

n21=40

n22=25

n23=16

n 2 4 =34

n25=35

[36,70]

m^^ =30

m 2 2 =30

m23=30

m 2 4 =30

m 2 5 =30

I

η , =66

η

".3=25

n

n

[18,35]

2 =43

13=

.4=57

n

.5=59

n 2 =150

η = 250

Damit erhält man als Wert der zu verwendenden Prüfgröße 2 2 X

=

f 5 1*1 ji,

(n

ij ~ m i j ) m ij

= 20.5333

=

(26 - 20)2 20

(18 - 20)2 — W -

,

d.h. mit dem kritischen Wert für k = 2, l = 5, α = 0.01 x

2

k(i-1);1-a

x

2

8;0.99

20.09

, (35 - 30) 2 30

348

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

muß die Hypothese Hg zum 1% Niveau verworfen werden. Es sind also bei einer Irrtumswahrscheinlichkeit von höchstens 0.01 signifikante Unterschiede

zwi-

schen den Städten hinsichtlich der Käuferzahl des PKW - Typs zu erkennen. Es sei noch darauf hingewiesen, daß die Unabhängigkeitshypothese für X und Y zum 1% Niveau nicht verworfen werden kann, d.h. auch, daß zu diesem Niveau keine signifikanten Unterschiede zwischen den fünf Verteilungen für die Käuferzahlen

in den verschiedenen Städten zu erkennen sind. Auf eine

explizite Durchführung des zugehörigen Tests wird an dieser Stelle verzichtet.

LÖSUNG

ZU A U F G A B E

Gleichverteilung der angegebenen

12.4

in der vorliegenden Aufgabenstellung bedeutet hier, daß in (2 χ 3) - Kontingenztafel

sowohl

keine signifikanten

Spalten-

effekte als auch keine signifikanten Zeileneffekte auftreten. Man spricht dann auch im Unterschied zur bedingten Gleichverteilung, vgl. Aufgabe

12.3,

von der totalen Gleichverteilung.

In e i n e r

( k « i ) - Kontingenztafel mit den absoluten

und den zugrundeliegenden Zellenwahrscheinlichkeiten vgl. Aufgabe

ρ

. i = l , . . . , k , j = l,

12.1.a, besagt die totale Gleichverteilung,

die Wahrscheinlichkeit, g l e i c h ist, d . h . ρ

daß für ein

in e i n e d e r k ' t Z e l l e n z u g e l a n g e n ,

Objekt

für alle

= 1/(k · l) , w a s g l e i c h b e d e u t e n d d a m i t i s t , d a ß b e i

g e s a m t η b e o b a c h t e t e n O b j e k t e n in j e d e r Z e l l e m

=n/(kȣ)

warten sind, also weder S p a l t e n - n o c h Zeileneffekte Die t o t a l e

Zellenhäufigkeiten

Zellen ins-

Objekte zu er-

auftreten.

Gleichverteilungshypothese

H

0

: P

i j

=

k ^ T

f ü r

a l l e

i= 1

'---'k'

3=1

ί

wird gegen die Alternative Η

: p. . =j= . ρ 1 -pijTrV£

für mindestens ein Paar

(i,j) 2

getestet mit der bei Gültigkeit von H^ approximativ einer χ k · Ζ. - 1 Freiheitsgraden entstammenden Prüfgröße 2 mit m

η ij " k · ι



-Verteilung mit

Kapitel 12: Kontingenztafelanalyse

349

HQ wird zum Niveau α abgelehnt, wenn gilt: 2

2

X

X

k£-l;l-ct

'

Bei der vorliegenden (2 χ 3) - K o n t i n g e n z t a f e l , v g l . Tab. 1 2 . 4 , wird d i e t o tale

Gleichverteilungshypothese H

0

: p

ij

=

F

^r

1 = 1,2, j=1,2,3

g e t e s t e t gegen die A l t e r n a t i v e H, : P - j j f ^

f u r mindestens e i n Paar

(i,j)

In η = 6 0 S p i e l e n (ohne A u f t r e t e n der N u l l ) s i n d bei G ü l t i g k e i t von HQ in j e der der 6 Z e l l e n der Kontingenztafel m^· = 2 ^ 3 = 10

, 1 = 1 , 2 , 0 = 1,2,3,

Zahlen zu erwarten, so daß s i c h d i e Prüfgröße e r g i b t zu (8-10)2

2 x

""

= 4.2

(12-10)2 +

10

10

(8-10)2 +

10

(8-10)2 +

(9-10)2 , (15-10)2

10

10

10

. ο

Da h i e r k · l - 1 = 5 i s t , ersehen wir aus der T a b e l l e der χ

- Q u a n t i l e im An-

hang, daß s e l b s t bei e i n e r I r r t u m s w a h r s c h e i n l i c h k e i t von α = 50% die Hypothese der ( t o t a l e n ) G l e i c h v e r t e i l u n g n i c h t abgelehnt werden kann, da χ2 = 4 . 2 Μ . 3 5 1 = χ 2 . 0 _ 5 0 = χ 2 £ . 1 ; 1 . α

.

Kapitel 13: Stichprobenverfahren AUFGABE 13.1 Zum Zwecke der Umweltgütebeurteilung wird in einer Industrieregion ein Schadstoffmessprogramm durchgeführt. Hierzu wird die zu beurteilende Region in 200 Quadrate von 1*1 km 2 aufgeteilt und hiervon werden 15 mittels einfacher Zufallsauswahl ausgewählt. Mit einer mobilen Messeinhelt werden dann die S0 2 -Gehalte in mg/m 3 in diesen Planquadraten bestimmt. Die Ergebnisse dieser Messungen sind in tab. 13.1 dargestellt. Cab. 13.1: SO« - Messungen in mg/m

Planquadrat

i

S0 2 - Gehalt

Planquadrat S0 2 - Gehalt

i

3

in 15 Planquadraten einer Industrieregion

1

2

3

4

5

6

7

8

2.4

3.7

1.2

1.9

4.8

2.6

2.4

2.9

9

10

11

12

13

14

15

5.2

1.2

1.7

1.9

3.8

2.8

2.1

(a) Schätzen Sie die mittlere Belastung und den Anteil der Planquadrate, die eine Belastung höher als 3.0 mg/m 3 aufweisen. (b) Geben Sie für die Schatzer aus (a) Schätzer für deren Varianzen sowie die Standardabweichungen an. (c) Wie lautet das approximative Konfidenzintervall zum Niveau 0.95 für die mittlere Belastung der Industrieregion? (d) Wie gross müsste man bei einer zukünftigen Untersuchung den Stichprobenumfang wählen, damit das Konfidenzintervall höchstens eine Breite von 0.5 mg/m 3 besitzt?

352

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

AUFGABE 15.2 Die Firma E L E C T R O N I C führt zur Kontrolle ihres 420 Artikel umfassenden Sortiments eine Stichprobenerhebung ihrer Lagerbestände durch (kleine 'Inventur auf Stichprobenbasis'), Dazu werden in den Bereichen "Haushaltskleingeräte", "Haushaltsgrossgeräte" und "Unterhaltungselektronik" jeweils einige Artikelpositionen mittels einfacher Zufallsauswahl entnommen und der Gesamtwert der Artikelposition bestimmt, Zur besseren Planung der Lagerpolitik wurde zusätzlich vermerkt, ob weniger als drei Stück eines Artikels im Lager vorrätig waren. Die cab. 13.2 fasst die Ergebnisse dieser Untersuchung zusammen, in der ausserdem für jeden Lagerbereich die Sortimentsgrösse, der Stichprobenumfang, der durchschnittliche Positionswert und die Standardabweichung der Stichprobenwerte aufgeführt werden. Cab. 13.2: Ergebnisse einer Lagerbestandsaufnahme Anzahl Artikel pos. unter drei Stück

Sortimentbereich

Größe des Sortiments

Umfang der Stichprobe

durchschn. Positionswert (in DM)

Standardabweichung (in DM)

Haushaltskleingeräte

126

15

490

57

2

Haushaitsgroßgeräte

63

8

2996

1050

6

Unterhaitungselektronik

231

27

2094

320

5

(a) Geben Sie für den Wert des Gesamtlagers einen Schätzer an und schätzen Sie den Anteil der Artikelpositionen, bei denen weniger als drei Stück im Lager vorrätig sind. (b) Berechnen Sie die geschätzte Standardabweichung des Schätzers für den Lagerwert, d.h. die Quadratwurzel aus der entsprechenden Varianzschätzung. (c) Da diese Kontrolluntersuchung auch in Zukunft durchgeführt werden soll, soll eine optimale Strategie für die Stichprobenentnahme angegeben werden. Wie muss der Stichprobenumfang dann aufgeteilt werden?

Kapitel 13: Stichprobenverfahren

353

AUFGABE 15.5 Um das Verfahren der laufenden Qualitätsprüfung in einer Brotfabrik zu vereinfachen, schlägt der Produktionsleiter folgendes Verfahren vor. Da jeweils fünf Toastbrote nach dem Backen auf ein Fliessband zur Verpackung weitergeleitet werden, ist die Tagesproduktion von 2100 Broten in 420 Verpackungseinhelten aufgeteilt. Hiervon werden drei zufällig entnommenen und das Gewicht der Toastbrote überprüft, Die Gewichtsmessungen (in g) dieser drei Entnahmen sind in cab. 13.3 dargestellt. Cah. 13.3: Gewicht (in g) von drei mal fünf Toastbroten

Ent^\Brot nähme

1

2

3

4

5

1

498

503

511

515

508

2

518

513

508

499

505

3

521

505

501

503

512

(a) Berechnen Sie einen Schätzer für das durchschnittliche Gewicht eines Toastbrotes. (b) Interpretieren Sie die Ergebnisse der Stichprobenerhebung als Zerlegung einer Grundgesamtheit und berechnen Sie den Intraklass - Korrelationskoeffizienten. Kann man aufgrund des errechneten Ergebnisses die technisch einfacher zu realisierende Klumpenauswahl für die zukünftige Qualitätsprüfung empfehlen?

AUFGABE 15.4 Um zu überprüfen, ob eine Neueröffnung eines Hamburger - "Restaurants" in einem Vorort einer Grossstadt erfolgversprechend ist, wird ein Marktforschungsinstitut beauftragt, eine lokal begrenzte Bevölkerungsumfrage durchzuführen. Dazu werden aus den

354

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

800 Haushalten des betreffenden Stadtteils 20 mittels einfacher Zufallsstichprobe entnommen und hierin jeweils eine Person zufällig ausgewählt und nach Ihren durchschnittlichen Monatsausgaben für F a s t - F o o d und ihrer grundsätzlichen Bereltschaft, Hamburger zu essen, befragt. Die Ergebnisse dieser Umfrage enthält die Cab.

Sah.

13.4 ,

1 3 . 4 : Ergebnisse einer Meinungsumfrage

Person i

1

Haushaltsgröße

2

4

3

durchschn. Ausgaben für Fast-Food in DM

20

0

50

grundsätzl. Bereitschaft Hamburger zu essen

ja

Person i

11

12

Haushaltsgröße

4

4

durchschn. Ausgaben für Fast-Food in DM

50

grundsätzl. Bereitschaft Hamburger zu essen

2

3

4

5

6

7

8

9

2

5

6

2

1

3

10

nein nein nein

0

13

2

30

14

7

150

10

1

70

0

20

0

30

150

ja

nein

ja

nein

ja

ja

15

16

17

18

19

20

1

3

0

nein nein nein nein nein

3

100

ja

1

0

5

90

4

60

20

nein nein nein nein

Geben Sie einen Schätzer für die Gesamtkaufkraft für F a s t - F o o d dieses Wohnorts an und schätzen Sie die Anzahl der potentiellen Hamburger - Esser.

Kapitel 13: Stichprobemerfahren

355

LÖSUNG ZU AUFGABE 15.1 Wählt man aus einer Grundgesamtheit von Ν Objekten durch einen zufälligen Mechanismus η Objekte so aus, daß jede der so entstehenden

möglichen Stich-

proben (vgl. Aufgabe 1.3) die gleiche Wahrscheinlichkeit besitzt, ausgewählt zu werden, so spricht man von einer einfachen Zufallsauswahl. Durch eine eindeutige Zuordnung ist jedem der Ν Objekte der Grundgesamtheit ein vor Untersuchungsbeginn unbekannter Merkmalswert μ^, i=l,...,N, zugeordnet. Aufgrund der endlichen Zusammensetzung der Grundgesamtheit ergeben sich hieraus die unbekannten, die Grundgesamtheit charakterisierenden Größen des Lageparameters, des Mittelwertes

=

1 N

Ν

IΛ i=l

sowie des Streuungsparameters, der Varianz , definiert hier als 2 1 ° μ = Ν-Γ

Ν γ , I Σ i=l

- ( a ) Durch den Zufallsmechanismus der Auswahl sind die bekannten Meßwerte y., i=l,...,n, als Realisationen von Zufallsvariablen Y., i=l,...,n, zu ι ι interpretieren, die ihren Wertebereich jeweils auf der Menge der (Uj, j=l,...,n} besitzen. Da sich die Zusammensetzung der Grundgesamtheit durch die Entnahme eines Objekts (Ziehen ohne Zurücklegen) verändert, sind diese Zufallsvariablen zwar identisch verteilt aber nicht stochastisch unabhängig. Dennoch ist das Stichprobenmittel

ein erwartungstreuer Schätzer für μ (vgl. Aufgabe 5.1) und

Νμ = Ny ein erwartungstreuer Schätzer für

NU=

Ν I H. i=l

der Summe der Merkmalswerte.

Ausgehend von den Ν = 2 0 0

Planquadraten als Objekt der vorliegenden Schad-

stoffmessungen berechnet man somit einen erwartungstreuen Schätzer für die mittlere S0~ - Belastung in der Industrieregion basierend auf den η = 15

356

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

Stichprobenwerten .

Λ

durch 1

15

P =y=Y5

.

J

y ^ j g

= 2.7067

( 2 . 4 + 3 . 7 + . . . + 2.8 + 2.1)

,

d.h. die mittlere SOg - Belastung in der Industrieregion liegt bei 2.7067 m g / m 3 . Interessiert man sich für den Anteil der Objekte der Grundgesamtheit, die eine bestimmte Eigenschaft besitzen, so kodiert man die unbekannten Merkmalswerte iL , i=l,...,N, mittels 1 μ

_

, falls das i-te Objekt der Grundgesamtheit die Eigenschaft besitzt

,

sonst Damit ist der Anteil π der Objekte der Grundgesamtheit, die die Eigenschaft besitzen, wiederum als Mittelwert, d.h. durch

=

1 V Ν Λ

ί

μ

1= 1

festgelegt. Durch den Übergang von den Stichprobenwerten y^ zu 1 =

, falls das i-te Objekt der Stichprobe die Eigenschaft besitzt

'

0

sonst

für i=l,...,n, kann der Anteil TT durch -T = 1— T n

V> ~y. 1=1 1

erwartungstreu geschätzt werden.

Im Falle der Schadstoffmessung

interessiert man sich für eine Schätzung des 3

Anteils π der Planquadrate mit einem S 0 2 - Gehalt größer als 3.0 mg/m . In lab. C13.1.1 sind zunächst neben den η = 1 5 Stichprobenwerten die kodierten Werte 1

Q

, falls die Belastung im Planquadrat i größer als 3.0 m g / m 3 sonst

für i=1,...,15 festgehalten.

Kapitel 13: Stichprobenverfahren

Cab. £13.1.1: Beobachtete Meßwerte y^ und kodierte Werte y^ für i=1,...,15

i

y

i

i

y

i

1

2

3

4

5

6

7

8

2.4

3.7

1.2

1.9

4.8

2.6

2.4

2.9

0

1

0

0

1

0

0

0

9

10

11

12

13

14

15

5.2

1.2

1.7

1.9

3.8

2.8

2.1

1

0

0

0

1

0

0

Damit wird der Anteil der Planquadrate, deren SO, - Belastung größer als 3 3.0 mg/m ist, wegen -

π

1 15 1 a = Τ 5 ,Σ1 y i = T 5 C 0 + 1 + ... + 0) = ^ =

0.2667

auf 26.67% geschätzt.

- ( b ) Um das Streuungsverhalten des Schätzers μ zu beurteilen, ist es notwendig, die Varianz von μ anzugeben. Für diese gilt Var (μ) = - (1 - £) Q2 η Ν μ Der Ausdruck (1 -

heißt Endlichkeitskorrektur und ergibt sich durch das

Auswahlverfahren ohne Zurücklegen (vgl. Aufgabe 4.3). 2 Da die Varianz

der Merkmalswerte in der Grundgesamtheit aber unbekannt

ist, muß auch diese Größe geschätzt werden. Zur erwartungstreuen Schätzung 2 von σ^ verwendet man die Stichprobenvarianz

2 1=1 < * i - >

=

vM

1=1\

'

und deshalb ergibt sich als erwartungstreuer Schätzer für die Var(μ) der Ausdruck

Var (μ) = - (1 -

2 s

357

358

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

M i t η = 15 und y = 2.7067 e r h ä l t man zunächst f ü r d i e S t i c h p r o b e n v a r i a n z der SOg - Messungen 15 s2=TgVr ( = 1.4462

\ y ? - 1 5 y 2 ) = p f (130.1400 - 109.8934)

,

so daß mit Ν = 200 in Var(P)

1.4462 = 0.0892

eine erwartungstreue Schätzung f ü r die V a r i a n z des M i t t e l w e r t s c h ä t z e r s des SO2 - Gehalts angegeben

ist.

Die geschätzte Standardabweichung e r g i b t s i c h a l s Quadratwurzel aus der g e schätzten V a r i a n z :

/

V a r ( i ) = v/0.0892 = 0.2987

.

Für den Fall der Anteilsschätzung bei einfacher Zufallsauswahl vereinfacht sich die Varianzformel zu Var(ii)

(ϊγ^Τ)77

( 1

-π)

·

Diese wird dann durch var(ir) = (1 - £ ) Ν

η-1

τι (1 - π )

erwartungstreu geschätzt. Für die Varianz des A n t e i l s der Planquadrate mit einem S O , - G e h a l t über 3.0 mg/m

e r g i b t s i c h mit Ν = 200, η = 1 5 und π = 0.2667 der Schätzer V a r ( i ) = (1 - 2 ^ ) ' J ^ T J ' 0-2667 · (1 - 0.2667) = 0.0129

,

bzw. J

Var(TT) = V 0 . 0 1 2 9 = 0.1136

— C ) Ein approximatives (1-a) -Konfidenzintervall für den Mittelwert μ in der Grundgesamtheit ist gegeben durch

Kapitel 13: Stichprobenverfahren

[ y - V a / 2

"

Wählt man

+ u

' y

[ - V a / 2

/

l-a/2

F

^

^

R

359

]

- V ^ - a / 2

A

« "ι'

S2

]

*

(1 - α ) = 0 . 9 5 , so i s t (1 - α / 2 ) = 0 . 9 7 5 u n d d a s (1 - α / 2 ) - Q u a n t i l

Standardnormal Verteilung aus den Aufgabenteilen

beträgt u

(a) u n d

025

1 Q

= u

0 9 7 5 = 1 - 9 6 . M i t den

der

Ergebnissen

(b) e r h ä l t m a n als K o n f i d e n z i n t e r v a l l

zum

Ni-

v e a u 0 . 9 5 f ü r d i e m i t t l e r e SO,, - B e l a s t u n g

[ 2 . 7 0 6 7 - 1 .96 ·

0.0892

, 2 . 7 0 6 7 + 1.96 ·\/0.0892 ]

= [2.7067 - 0.5854 , 2.7067 + 0.5854] = [2.1213 , 3.2921]

-•(d) Die Breite b des Konfidenzintervalls (c) errechnet sich zu

b = 2

u

(vgl. Aufgabe

zum Niveau

( 1 - a ) aus Aufgabenteil

5.3)

-i1

l-a/2

Gibt man sich nun diese Breite b vor, so läßt sich hieraus der notwendige Stichprobenumfang η ermitteln, so daß das

(1 - α ) -Konfidenzintervall höch-

stens die Breite b besitzt. Dieser ergibt sich zu

( 2

-

1

U

( 2

W 2 '

u

s / b ) 2

l-a/2-

s / b ) 2

Für die zukünftige Umweltgütebeurteilung fidenzintervall u

Mit α = 0 . 0 5 ,

der Industrieregion

soll

zum Niveau 0.95 höchstens eine Breite b = 0.5 mg/m^ 2

i_a/2

= u

0 975 =1-96

und s

= 1.4462

ergibt sich als

das

Kon-

besitzen.

notwendiger

Stichprobenumfang n

(2 · 1.96 · y/1.4462

=

1 +

/ 0.5) '

(2 - 1.96 · vfl .4462

/ 0.5)

2

88.8910

=

1 +

-88.8910

=61.5395 Will

m a n s o m i t in e i n e m z u k ü n f t i g e n M e ß p r o g r a m m e i n K o n f i d e n z i n t e r v a l l z u m 3 0 . 9 5 m i t e i n e r B r e i t e von h ö c h s t e n s 0 . 5 m g / m für die mittlere S0£ -

Niveau

360

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

Belastung angeben, so muß man mindestens η = 6 2 Planquadrate auswählen.

LÖSUNG ZU AUFGABE 15.2 Zerlegt man eine endliche Grundgesamtheit aus Ν Objekten in disjunkte TeilL mengen vom Umfang N^, h=l,...,L, N =

£

N^, und entnimmt aus jeder so ent-

standenen Teilgesamtheit eine einfache Zufallsauswahl, so bezeichnet man die Teilgesamtheiten als Schichten und das Auswahlverfahren als geschichtete Zufallsauswahl. Ist jedem Objekt ein unbekannter Merkmalswert μ zugeordnet, h=l,...,L, i=l,...,N , so kann der Mittelwert der Merkmalswerte durch h

L

ι

μ

Nh

··= ν Σ I

h=l i=l

beschrieben werden. Will man hierüber Aussagen machen, so betrachtet man zunächst die schichtspezifischen Kenngrößen N

^u h.

=

N

h

if" 1 Ν. hi h 1=1

und

h

1 σ2 = . Τ (μ. . - μ , ) μ, Ν - 1 ,L, hi h. h h 1=1

,

h=l,...,L,

und faßt diese mittels der sogenannten Schichtungsgewichte W^ = N^ / Ν wegen der Beziehung

μ =L

" Λ h=l

zusammen.

-»(a) Werden in jeder Schicht unabhängig voneinander einfache Zufallsstichproben vom Umfang n^ entnommen, so kann für jede Schicht der ermittelte Meßwert ν als Realisation einer Zufallsvariablen interpretiert werden. Dann J hi ist, vgl. Aufgabe 13.1, >v

1 "h = τ τ J , y hi = y h. h 1=1

Realisation einer erwartungstreuen Schätzfunktion für μ^ , h=l,...,L, und somit

Kapitel 13: Stichprobenverfahren

μ

" = h=Λ1

ein erwartungstreuer Schätzer für μ.. Die Summe aller Merkmalswerte L

Νμ

\

=

" Λh=l i=l Λ

^

kann dann natürlich durch Νμ.. - Ν

L L I Whih_ = J Nhyh_ h=l h=l

geschätzt werden. Zur übersichtlicheren Ermittlung eines Schätzers für den Gesamtlagerwert Νμ.. wird für die L = 3 hier vorliegenden Schichten die nachfolgende Cab. C13.2.1 zusammengestellt. Dabei ist, mit Ν = 420, W^ = N^/N = 126/420 = 0.30, W 2 = 63/420 = 0.15 und W 3 = 231/420 = 0.55.

Cab. C13.2.1: Arbeitstabelle zur Berechnung des Gesamtlagerwertschätzers

Sortimentbereich

h

Haushaltskleingeräte

1

Haushaitsgroßgeräte Unterhaitungselektronik

Σ

N

W

V h .

h

"h

126

0.30

15

490

147.00

2

63

0.15

8

2996

449.40

3

231

0.55

27

2094

1151.70

420

1 .00

50

h

Da der durchschnittliche Wert der Artikelpositionen mit μ- =

L l

Whyh

= 1748.10 DM

geschätzt wird, kann für den Gesamtlagerwert ein Schätzer von Νμ„ = 420 · 1748.10 = 734202 DM angegeben werden.

1748.10

361

362

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

Will man den Anteil π der Objekte der Grundgesamtheit, die eine bestimmte Eigenschaft besitzen, mit Hilfe einer geschichteten Stichprobe schätzen, so betrachtet man zunächst den entsprechenden Anteil

in der h - ten Schicht

für h=l,...,L. Dieser wird geschätzt durch

1 ~ 7t, = Ι y h η ,L hl h 1=1

,

h=l , . . . ,L

,

wobei 1

, falls das i - te Objekt der Stichprobe aus der h - ten Schicht die Eigenschaft besitzt

0

sonst

gesetzt wird (vgl. Aufgabe 13.1.a). Damit erhält man als Schätzer für den Anteil π L π

=

I

h=l

π

h

ι. h

In Tab. 13.2 sind für jede Schicht die Anzahl der Artikelpositionen, bei denen weniger als drei Stück vorrätig waren , gegeben: 15

8

27

Die Anteilsschätzer in den Schichten ergeben sich damit zu ^ = ^ • 2

= 0.1333

n 2 =g-· 6 = 0.7500 5 = 0.1852 so daß der Anteil von Artikelpositionen, bei denen im Gesamtlager weniger als drei Stück vorrätig sind, durch 3 π = y W.i, = 0.3 · 0. 1333 + 0.15 · 0.7500 + 0.55 · 0.1852 h=1 h h = 0.2544 geschätzt wird.

Kapitel IS: Stichprobenverfahren

363

- ( b ) Bei der geschichteten Zufallsauswahl geht man davon aus, daß die Stichprobenziehungen in jeder Schicht voneinander unabhängig sind. Aus diesem Grund kann die Schätzung der Varianz der Schätzer aus (a) durch die Summe der Varianzen in jeder Schicht ausgedrückt werden. Für jede Schicht ist

h.

nh[

N j

h

ein Schätzer für die Varianz von μ, , wobei η.

2 h

1 > = ~ τ Σ "h - 1=1

, < y

h i

.2 - y h /

die Stichprobenvarianz in der h - ten Schicht bezeichnet, h = l,...,L. Die Varianz von μ., wird deshalb geschätzt mit

νβΓ(μ·.) =

L l

Var (W^U^ )

Auch h i e r s o l l e n d i e Varianzschätzer durch eine A r b e i t s t a b e l l e werden, v g l . Cah. £13.2.2.

ermittelt

In d i e s e gehen W1 = 0 . 3 , W2 = 0.15 und W3 = 0.55

sowie Angaben aus Tab. 13.2 e i n .

t a b . £13.2.2: A r b e i t s t a b e l l e

h

2 w w h

S

h

zur Berechnung der Varianzschätzer

- l i i - ^ ü l s n N hl hJ

\\4

Λ 1

2 h

h

"h*

1

0 0900

57

190.8143

17 1733

2

0 0225

1050

120312.5000

2707 0313

3

0 3025

320

3349.3025

1013 1640

I

-

-

-

3737 3686

Hieraus e r g i b t s i c h f u r den V a r i a n z s c h ä t z e r Var(Np.. ) zur Schätzung des Lagerwertes mit Ν =420

364

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

V?r(Ni..)=N2v7r(i..)=N2 ^

" ^ ( l - ^ j

s*

= 420 2 · 3737.3686 = 659271821

-»(c) Variiert man unter sonst gleichen Voraussetzungen die Stichprobenumfänge "h "i"n ^ e d e r

Sch:i ch

- t, h=l,...,L, so wird dies die Größe des Varianzschätzers

und damit die Aussagegenauigkeit des Verfahrens verändern. Wählt man nun die Stichprobenumfänge η , h=l,...,L, bei vorgegebenem Gesamtstichprobenumfang L n = J η so, daß die Varianz des Schätzers minimiert wird, so spricht man h=l von einer optimalen Aufteilung des Stichprobenumfangs. Diese optimale Aufteilung wird erreicht, wenn man in jeder Schicht W

hSh

, h = l,... ,L

L Σ k=l

W

S

k * * *

Zur optimalen Aufteilung in der vorliegenden Lagerbewertung wird die nachfolgende Arbeitstabelle tab. C13.2.3 aufgestellt. Cab- £13.2.3: Arbeitstabelle zur Bestimmung der optimalen Aufteilung des Stichprobenumfangs

W

h

w

h

S

h

V h

h

s

h

3 Σ

k=1

w

s

K k Kk

1

0.30

57

17.10

0.0488

2

0.15

1050

157.50

0.4492

3

0.55

320

176.00

0.5020

I

1.00

350.60

1.0000

-

Demnach müssen bei einer zukünftigen Lageruntersuchung 4.88% des Gesamtstichprobenumfangs aus dem Bereich "Haushaltskleingeräte", 44.92% aus dem Bereich "Haushaltsgroßgeräte" und 50.20% aus dem Bereich "Unterhaitungs-

Kapitel 13: Stichprobenverfahren

365

e l e k t r o n i k " entnommen werden, um d i e Varianz der r e s u l t i e r e n d e n Schätzung zu m i n i m i e r e n .

LÖSUNG ZU AUFGABE 15.3 Zerlegt man eine Grundgesamtheit von Ν Objekten in Κ disjunkte Teilmengen vom Umfang M^ , i=l, . . . ,K, mit Κ Ν = y Μ. i=l 1 und wählt man aus diesen Mengen k Mengen mittels einfacher Zufallsauswahl aus, so heißen die Teilmengen Klumpen und das Auswahlverfahren Klumpenauswahl . Weiterhin spricht man von einem einstufigen Klumpenauswahlverfahren, wenn man alle auf diese Weise in die Stichprobe gezogenen Objekte in die Untersuchung eingehen. Bezeichnet nun μ

den Merkmalswert des j - ten Objekts im i - ten Klumpen,

j=l,...,M , i=l,...,K, in der Grundgesamtheit, so gibt M

Κ u

-

=

i

p s iA= l A j = 1 i 1i 3

den Mittelwert und

'μ = d r

A

A

^ij-^·'

i = l j =1

^

die Varianz der Merkmalswerte in der Grundgesamtheit an. Im folgenden werden gleiche Klumpengrößen, d.h. H. =H für i=l,...,K

betrach-

tet.

-»(a) Mit den am j - ten Objekt des i - ten gezogenen Klumpens beobachteten Merkmalswerten y

, i=l,...,k, j=l,...,M, erhält man als Schätzung für den

Mittelwert μ., in der Grundgesamtheit j

k

Μ

• ϊ Γ Π Γ 1=1 A j=l A

y

i Jj

·

366

Teil I: Übungsaufgaben, Erläuterungen und Lösungen

Bei der h i e r betrachteten Q u a l i t ä t s p r ü f u n g l i e g t ein e i n s t u f i g e s verfahren v o r . Die

Klumpen-

Klumpengröße b e t r ä g t M = 5 und die Anzahl der insgesamt

vorliegenden Klumpen i s t Κ = 420. Da eine Stichprobe von k = 3 Klumpen e n t nommen wurde, berechnet s i c h der Schätzer f ü r das d u r c h s c h n i t t l i c h e

Gewicht

der Toastbrote demnach zu ι

3

μ·· = 5-^3 = T5 -

5

l l y^·

76 2 0

= 508 g

.

-»(b) Stellt jeder Klumpen ein repräsentatives Abbild der Grundgesamtheit dar, d.h. sind die Klumpen in sich heterogen und untereinander homogen, so kann man erwarten, daß dieses Auswahlverfahren gleiche oder bessere Güteeigenschaften als die einfache Zufallsauswahl (vgl. Aufgabe 13.1) besitzt. In diesem Fall wird die Varianz des Schätzers für den Mittelwert geringere Werte als die des entsprechenden Schätzers bei der einfachen Zufallsauswahl· annehmen. Der Intraklass - Korrelationskoeffizient η

int

, der für M. = M , i=l,...,K, ι

gegeben ist durch Κ J (Μ - 1) (Ν - 1) σ u

Μ

Μ

Σ I I (U^-μ-Μΐι^,-μ.. > J J i=l j = l j ' = 1 j < j'

ist ein Maß für den Zusammenhang der Merkmalswerte innerhalb der Klumpen. Für diesen gilt ί-τ < ρint -< 1 Μ1 wobei P ^ n t = 0 gerade besagt, daß die Merkmalswerte innerhalb der Klumpen nicht zusammenhängen. Das Klumpenverfahren und die einfache Zufallsstichprobe liefern in diesem Fall gleiche Genauigkeiten für die Schätzungen. Gilt hingegen ρ

< 0, so ist die Varianz der Schätzer, die mit Hilfe des Klumpen-

auswahlverfahrens ermittelt werden, geringer als die der entsprechenden Schätzungen, die man mit einer einfachen Zufallsauswahl aus der Grundgesamtheit gewinnt. Da die

Klumpenauswahl in der Regel technisch einfacher zu rea-

lisieren ist, sollte sie dann der einfachen Zufallsauswahl vorgezogen werden.

Im Gegensatz zum Aufgabenteil

(a) s o l l e n h i e r die Ν = 15 Toastbrote a l s

Grundgesamtheit angesehen werden. Diese i s t i n K = 3 Klumpen der Größe M = 5 a u f g e t e i l t . Die in Tab. 13.3 gegebenen Werte s t e l l e n a l s o nun die Merkmals-

Kapitel 13: Stichprobenverfahren

367

werte μ^., i=1,2,3, j = 1 , . . . , 5 , in der Grundgesamtheit dar. Zur Berechnung des Intraklass - Korrelationskoeffizienten ermittelt man zunächst den Mittelwert in der Grundgesamtheit, d.h. • μ

"

=

K M

. 3 5

.

TT Σ l Μ1ί- = ^1 S I l " i=1 j=1 1 J i=1 j=1

= 1Tb V 7620

1J

= 508 g sowie die Varianz der Grundgesamtheitswerte, d.h. K M

J f (3871626 - 3870960) 47.5714 g 2

. /

0

*

3

5

666

.

Für jeden Klumpen können in einem nächsten Schritt die Produkte der Abweichungen bestimmt werden. Dazu s t e l l t man sich zunächst eine Tabelle der Abweichungen der Merkmalswerte vom Mittelwert μ.. = 508 auf, vgl. tab. £13.3.1. tab. £13.3.1: Abweichungen ( μ . ^ . - μ . . ) , i=1,2,3, j = 1 , . . . , 5 , für jeweils Μ = 5 Merkmalswerte in K = 3 Klumpen

1

2

3

4

5

1

-10

-5

+3

+7

0

2

+ 10

+5

0

-9

-3

3

+ 13

-3

-7

-5

+4

Klumpen\. i

j

Dann g i l t für 1 = 1:

M M l l j=1 J ' = 1 j < j'

(μ · . - μ..) (μ. -, - μ _) 1J

1J

5 5 = [ I j=1 j ' = 1 j (c,i)Es stehen insgesamt η = 40 Einzelzimmer zur Verfügung. Die Zufallsvariablen X. = 1

f 1 j ( o

frei i - tes Zimmer ist belegt

sind für i =1,...,40 unabhängig verteilt mit P(X. = 1) = 0.05

.

Damit ist

X =

40 Υ X. = 'Anzahl der freien Zimmer 1 i=1 1

ß(40,0.05) - verteilt und die Wahrscheinlichkeit, daß mindestens ein Zimmer frei ist, berechnet sich zu P ( X > 1) = 1 - P ( X < 1) = 1 - P(X = 0) = 1 - ( 4 0 ° ) O . 0 5 ° · 0 . 9 5 4 0 = 1 - 0 . 9 5 4 0 = 1 - 0.1285 - 0.8715

.

-»(c,ii) Mit np = 40 · 0.05 = 2 ist die Zufallsvariable X = 'Anzahl der freien Zimmer' approximativ Po(2) - verteilt, d.h. die Wahrscheinlichkeit, daß mindestens ein Zimmer im Hotel frei ist, läßt sich approximativ zu P ( X > 1) = 1 - P ( X < 1) = 1 - P(X = 0) λ°

-λ A

-2 = 1 - e ^ = 1 - 0.1353 = 0.8647

.

berechnen. -»(c,iii) Für große Stichprobenumfänge läßt sich nach dem Zentralen

Grenzwert-

satz die ßinomialverteilung durch eine Normal Verteilung approximieren. Es ergibt sich mit η = 40, ρ = 0.05

392

Teil II: Klausuraufgaben und Lösungen

P ( X > 1) = 1 - P ( X < 1) = ,-?(

x

"nP


1.6449 · 5 + 50

»

m> 58.2245

,

d.h. es müssen m = 5 9 Parkplätze angelegt werden, um die gewünschte S i c h e r h e i t e i n h a l t e n zu können.

LÖSUNG ZU A U F G A B E

K5

-»(a) ( V g l . Aufgabe 2 . 2 ) Betrachtet man f ü r i = 1 , . . . , 5 das E r e i g n i s A.j = ' A r z t s t e l l t beim i - ten Patienten eine r i c h t i g e Diagnose 1

,

so i s t d i e zugehörige W a h r s c h e i n l i c h k e i t mit P(A.)

= 1^7= 0.98

gegeben. Für das Komplementärereignis Ä^, daß eine f a l s c h e Diagnose

gestellt

w i r d , g i l t demnach P ( Ä . ) = 1 - P(A l -) = 1 - 0.98 = 0.02

, i=1,...,5

.

->(a,i) Da der A r z t s e i n e Diagnose unabhängig von P a t i e n t zu Patient a b g i b t , berechnet s i c h d i e W a h r s c h e i n l i c h k e i t , daß der A r z t beim 1. und beim 2. und ...und beim 5. Patienten eine r i c h t i g e Diagnose s t e l l t , zu P(A 1 η A 2 n A 3 n A 4 n A 5 ) = P ( A 1 ) · P ( A 2 ) · P ( A 3 ) · P ( A 4 ) · P ( A 5 ) =0.98® = 0.9039

.

394

Teil II: Klausuraufgaben und Lösungen

-Ka.ii) Die Wahrscheinlichkeit, daß der Arzt erst beim fünften Patienten eine falsche Diagnose stellt, d.h. bei den ersten vier Patienten richtig und dann beim fünften Patienten falsch diagnostiziert, ergibt sich, vgl. Aufgabenteil (a,i), zu P(A, n A 2 n A 3 n A 4 n Ä 5 ) = P ( A 1 ) · P ( A 2 ) · P ( A 3 ) · P ( A 4 ) · P ( Ä 5 ) = 0.98 4 · 0.02 = 0.0184

.

->(b) (Vgl. Aufgabe 2.2) Mit gleichen Bezeichnungen wie im Aufgabenteil

(a), allerdings für i=1

m,

wird die Zahl m gesucht, so daß P(A 1 η A 2 n ... n A m _ 1 n Ä m ) < 0.01 gilt. Durch die äquivalenten

Umformungen

Ρ ( Α η ) · P ( A 2 ) · ... · P ( A m _ 1 ) - P ( Ä J < 0.01 0 . 9 8 m " 1 - 0 . 0 2 < 0.01

«

0.98m"1

« «

< 0.50

( m - 1) In 0.98 < l n 0 . 5 0 m

»

"

1

Ϊ i m l ·

34

·3096

m > 35.3096

zeigt sich, daß der Arzt zuvor bei m - 1 > 35 Patienten eine richtige Diagnose gestellt haben muß, damit die Wahrscheinlichkeit, daß er erst beim letzten Patienten m > 3 6 eine falsche Diagnose aufstellt, höchstens 0.01

beträgt.

-»(c) (Vgl. Aufgabe 6.l) Es liegt ein Fehler 2. Art vor, denn der Arzt entscheidet sich für die Nullhypothese Hg (Blinddarmentzündung), obwohl tatsächlich die Alternative H^ (Blinddarmreizung)

LÖSUNG

vorliegt.

ZU A U F G A B E

K4

Bei den Studierenden der Fachrichtung WiSo werden die Ereignisse Α Ξ 'Weiblich' und

,

Ä Ξ 'Männlich'

,

Teil II: Klausuraufgaben und Lösungen

SO = 'Schwerpunktfach:

395

Soziologie 1

betrachtet. Folgende Wahrscheinlichkeiten sind bekannt P(A) = 0.55 ,

P(Ä) = 0.45 ,

P(S0 I A) = 0.25 , P(S0 I Ä) = 0.30

.

-»(a) (vgl. Aufgabe 2.3) Mit Hilfe des Satzes von der totalen Wahrscheinlichkeit läßt sich zunächst die Wahrscheinlichkeit, daß ein(e) WiSo - Studierende(r) das

Schwerpunktfach

'Soziologie' gewählt hat, bestimmen. Es gilt P(S0) = P(S0 I A) · P(A) + P(S0 | Ä) · P(Ä) = 0.25 · 0.55 + 0.30 · 0.45 = 0.1375 + 0.1350 = 0.2725

.

Damit liegt der Anteil der WiSo - Studierenden, die nicht

schwerpunktmäßig

'Soziologie' studieren, wegen P(SCl) = 1 - P(S0) = 1 - 0.2725 = 0.7275 bei 72.75%. -•(b) (vgl. Aufgabe 2.l) Berechnet werden soll die Wahrscheinlichkeit für das Ereignis Ä n SO = 'Männlich und schwerpunktmäßig

Soziologie'

Nach dem Multiplikationsansatz für bedingte Wahrscheinlichkeiten liegt der gesuchte Anteil

mit

P ( Ä n SO) = P(S0 | Ä) · P(Ä) = 0.30 - 0.45 = 0.1350 bei

13.5%.

-»(c) (vgl. Aufgabe 2.4) Die Bayessche Formel liefert den Anteil der schwerpunktmäßig Studierenden, die weiblich sind, durch, vgl. Aufgabenteil P(A | SO) =

P(S0 | A) · P(A) P(SO I A) · P(A) + P(S0 I Ä) · P(Ä) = 0.5046

als 50.46%.

=

'Soziologie'

(a),

P(S0 | A) · P(A) P(S0)

396

Teil II: Klausuraufgaben und Lösungen

LÖSUNG ZU AUFGABE K5 ( V g l . Aufgabe 2 . 7 ) Das 'Wasser- System' S der Brauerei läßt sich grob in die Teilsysteme W 1 (Produktion), W 2

(Reinigung und Kühlung) und W^ (Abwasser) unterteilen, die

ein Seriensystem bilden, da zur Aufrechterhaitung der Produktion alle drei Teilsysteme intakt sein müssen. Aus den weiterhin gegebenen

Informationen

läßt sich das in Abb- CK 5.1 dargestellte Zuverlässigkeitsschaltbild

auf-

stellen.

Abh. CK 5.1: Zuverlässigkeitsschaltbild des Wasser - Systems S in einer Brauerei

Beim Teilsystem W 1 handelt es sich um ein Parallelsystem, denn mindestens einer der Brunnen Q^ und Q 2 muß intakt sein. Mit P(Q 1

intakt) = 1 - P(Q 1 defekt) = 1 - 0.10 = 0.90

,

P(Q 2 intakt) = 1 - P(Q 2 defekt) = 1 - 0.20 = 0.80 erhält man also P(W 1

intakt) = 1 - [(1 - P(Q 1

intakt))(1 - P(Q 2

= 1 - [(1 - 0 . 9 0 X 1 - 0.80)]

intakt))]

Teil II: Klausuraufgaben und Lösungen

397

= 1 - 0.10 · 0.20 = 0.98

.

Das Teilsystem W^, das die Wasserversorgung für die Reinigung und Kühlung s i c h e r s t e l l t , i s t i n t a k t , wenn mindestens 2 der n = 5 Brunnen funktionieren. Bezeichnet die Z u f a l l s v a r i a b l e X.= 1

( 1 | [ 0

, f a l l s Brunnen R. 1

intakt defekt

, i=1,...,5

,

so e r g i b t s i c h mit P ( X i = 1) = 0.80, i = 1 , . . . , 5 , daß

X =

5 V X. = 'Anzahl der intakten Brunnen 1 i=1 1

B ( 5 , 0 . 8 ) - v e r t e i l t i s t , da die Brunnen unabhängig voneinander intakt s i n d . Die W a h r s c h e i n l i c h k e i t , daß genau k der 5 Brunnen funktionieren, i s t a l s o gegeben durch P ( X = k)

0.8 k · 0 . 2 5 ~ k

f ü r k=0,1 , . . . , 5

und man e r h ä l t a l s I n t a k t w a h r s c h e i n l i c h k e i t des Teilsystems Wg P(W2 i n t a k t ) = P(X > 2) = 1 - P(X < 2) = 1 - P(X < 1) = 1-

£ ( f ) 0.8 k · 0 . 2 5 " k w i=0

= 1 - 0.2 5 - 5 · 0.8 · 0.2 4 = 1 - 0.00672 = 0.99328

.

Das Abwassersystem W^ besteht aus den drei p a r a l l e l kanälen A j , A A j ,

geschalteten Abwasser-

wobei

P(A i i n t a k t ) = 1 - P(A i defekt) = 1 - 0.10 = 0.90

, i = 1,2,3

A l s I n t a k t w a h r s c h e i n l i c h k e i t für W3 e r g i b t s i c h somit P(W3 i n t a k t ) = 1 - [(1 - P(A 1 i n t a k t ) ) ( 1 - P(A 2 (1 - P(A 3 i n t a k t ) ) ] = 1 - (1 - 0.90)(1 - 0 . 9 0 ) 0 - 0.90) = 1 - 0 . 1 0 · 0.10 · 0.10 = 0.99900

.

intakt))

.

398

Teil II: Klausuraufgaben und Lösungen

Die Wasser - Systemzuverlässigkeit berechnet sich nun aus der Wahrscheinlichkeit, daß das Seriensystem S bestehend aus den Komponenten W ^ , W^ und W 3 intakt ist, zu P(S intakt) = P(W 1

intakt) · P(W 2 intakt) • P(W 3

intakt)

= 0.98000 · 0.99328 · 0.99900 = 0.9724

.

LÖSUNG ZU AUFGABE K6 -•(a) (Vgl. Aufgabe 1.3, Aufgabe 2.3) Die Basis des betrachteten

Glücksspiels bilden die Ereignisse

S.j = 'Zug einer schwarzen Kugel aus i - ter Kiste 1 R- = 'Zug einer roten Kugel aus i - ter Kiste

1

,

,

G. = 'Zug einer grünen Kugel aus i - ter Kiste' für i=1,2,3. In der ersten Kiste befinden sich insgesamt 10 Kugeln; günstig für das Ereignis S^ sind 5 Fälle (schwarze Kugeln), d.h. es gilt

p < V 4

·

Analog ist p

(

R

1>=W

und

P

< V = T O

*

Wird nun eine aus der ersten Kiste gezogene Kugel in die zweite gelegt, so enthält diese damit insgesamt 6 Kugeln. Ist außerdem die aus der ersten Kiste gezogene Kugel schwarz, so sind unter dieser Bedingung 4 Fälle (es befinden sich dann 4 schwarze Kugeln in der zweiten Kiste) für das Eintreten von S,, günstig, d.h. P(S2|Sl)=J

.

Mit analogen Überlegungen erhält man P(S2|R,)=|

,

P(S 2 1 6 ^ = 1

.

DieWahrscheinlichkeit, aus der zweiten Kiste eine schwarze Kugel zu ziehen, berechnet

sich nach dem Satz von der totalen Wahrscheinlichkeit also zu

399

Teil II: Klausuraufgaben und Lösungen

P(S2) = P(S2 IS,)· P(S1) + P(S2 I R1) - P(R,) + P(S2 | G,) · P(G1) =

4 5 6'τπ

+

3 3 6'τπ

+

3 6

2 τπ

- 35 Auf g l e i c h e Weise e r g i b t

S,)

p(R 2 I R,)

=

I

6

II σ·>| r\i

P(R2

sich

bzw.

S,) ~ 6

P(G2

R,)

P(G2 IG,)

1

6

>

II

1 p(r2 IG,) = τ

1

p(g2

so daß d i e W a h r s c h e i n l i c h k e i t , aus der zweiten K i s t e e i n e rote Kugel zu ziehen,

P(R2) = P(R2 IS,)· P(S1) + P(R2 I R,) · RCR1) + P(R2 IG,)· P(G,) 1 5 " 6 ' W

2 3 I _2_ 6 " TO 6 ' 10

_ 13 = M b e t r ä g t , bzw. f ü r eine grüne Kugel e r g i b t

sich

P(G2) = P(G2 I S,) · P(S,) + P(G2 I R,) · P(R,) + P(G2 I G,) · P(G,) . 1 5 . 12 SÖ

=

1 3

2

2

·

Hat der S p i e l e r eine schwarze Kugel aus der zweiten K i s t e in d i e d r i t t e

Kiste

g e l e g t , so s i n d d i e d r e i s i c h dann i n der K i s t e b e f i n d l i c h e n Kugeln schwarz, d . h . das E r e i g n i s , unter d i e s e r Bedingung eine schwarze Kugel zu z i e h e n , bes i t z t die

Wahrscheinlichkeit

P(S3|S2)=f=1

.

Weiterhin e r h ä l t man

P(S3 | R2) = § p(s3|g2)=§

, ,

so daß

P(S3) = P(S3 | s 2 ) · p(s2)+ p(s3 I r2) · p(r2)+ p(s3 ι g2) · p(g2)

400

Teil II: Klausuraufgaben und Lösungen

_ . 35 " ' ' 60

2 13 2 12 _ 155 3 " 6Ü" 3 * 60 " T8C

'

Analog e r g i b t s i c h mit P(R3

I s2) = 0

P(G3

P(R 3 I R 2 ) = l

bzw.

P(R 3 I G 2 ) = 0

I s2) = 0

P(G 3 I R 2 ) = 0 P(G 3 I G 2 ) = 1

zunächst P(R 3 ) = P(R 3 I S 2 ) · P ( S 2 ) + P ( R 3 1 R 2 ) · P(R 2 ) + P(R 3 I G 2 ) · P(G 2 ) =

0 +

7 - S

+ 0

_ 13 180

bzw. beträgt die gesuchte Wahrscheinlichkeit.aus der d r i t t e n K i s t e eine grüne Kugel zu ziehen, d.h. bei diesem Spiel 10 Taler zu gewinnen, P(G3) = P(G3

I s2)

I R2)

· P ( S 2 ) + P(G3

· P(R2) + P(G3

I G2)

· P(G2)

=0tl4S _ 12 TM

->(b)

(Vgl.

Aufgabe

'

3.10)

Es bezeichne X die Z u f a l l s v a r i a b l e X = 'Spielergebnis' mit den Ausprägungen x^ = 1 = 'aus der d r i t t e n K i s t e wird eine schwarze Kugel gezogen' x 2 = 2 = 'aus der d r i t t e n Kiste wird eine rote Kugel gezogen'

,

x 3 = 3 = 'aus der d r i t t e n K i s t e wird eine grüne Kugel gezogen'

.

Mit den Ergebnissen aus Aufgabenteil

(a) i s t dann

p(x = x,) = P(X = 1) = ]§jj P(X = x 2 )

= PCX = 2 ) = Y J J

P(X = x 3 ) = PCX = 3) =

,

. ,

.

Hat e i n S p i e l e r eine grüne Kugel aus der K i s t e gezogen, so werden ihm 10 Tal e r ausgezahlt, d.h. er e r z i e l t einen Gewinn von 1 0 - 1 ( E i n s a t z ) = 9 T a l e r .

Teil II: Klausuraufgaben und Lösungen

401

F a l l s der S p i e l e r aber eine schwarze oder eine rote Kugel gezogen hat, dann v e r l i e r t er seinen E i n s a t z , d.h. er "gewinnt" - 1 Taler. Die Gewinnfunktion hat somit die Gestalt -1

χ = x^ = 1

-1

g(x) =

.falls

9

χ = x2 = 2 χ = x3 = 3

Auf lange Sicht macht der S p i e l e r einen durchschnittlichen Gewinn in Höhe von E(g(X)) =

Σ

g t v

· P(x--Xi)

= - ι · τ § "

1

+ 9

· τ έ

- W

ι =1

1

60 180

Tal er

d.h. er v e r l i e r t im Durchschnitt

0.3333 Taler pro S p i e l .

->(c) ( v g l . Aufgabe 3.1θ) Es s o l l der S p i e l e i n s a t z ζ f e s t g e l e g t werden, so daß s i c h f ü r den erwarteten Gewinn E(g(X)) = 0 e r g i b t . In Abhängigkeit von ζ läßt s i c h die Gewinnfunktion des hier betrachteten G l ü c k s s p i e l s angeben a l s , v g l . Aufgabenteil -ζ

χ = x.| = 1

-z

g(x)

(b) ,

.falls

10 - ζ

χ = Xg = 2 x = X3 = 3

Aus der s i c h somit ergebenden Gleichung l

g ( x · ) · P(X = x.) 1

i =1

1

155 180 '

13 'Τ8(Γ

läßt s i c h wegen 180

ein S p i e l e i n s a t z von z

=

120

T8Ö

=

2 ,

3

,

Taler

ermitteln, damit ein f a i r e s Glücksspiel

entsteht.

12 ' TW

402

Teil II: Klausuraufgaben

und

Lösungen

LÖSUNG ZU AUFGABE K7 Die Verteilung der diskreten

Zufallsvariablen

X = 'Anzahl der Blütenknospen bei der CARDOLILAPHYTE' mit den möglichen Ausprägungen k = 0,1,2,3 ist durch die in C a h . CK 7.1 zusammengestellten

Einzelwahrscheinlichkeiten

bestimmt.

Cab. CK 7.1: Verteilung der Anzahl X der Blütenknospen bei der CARDOLILAPHYTE

k

0

1

2

3

P(X = k)

0.08

0.20

0.45

0.27

-»(a) (vgl. Aufgabe 3.6) Die CARDOLILAPHYTE bildet wegen

E(X) =

3 l k - P ( X = k) = 0 - 0 . 0 8 + 1 - 0 . 2 0 + 2 · 0.45 + 3 - 0.27 = 1 .91 k=0

im Durchschnitt 1.91 Blüten aus. ->(c) (vgl. Aufgabe 3.9) Für den Median ξ^ g einer diskreten Zufallsvariablen X gilt

P(X

- ζ0

- 0·5

und

P(X

- ζ0

- °·5

·

Mit den Werten aus Tab. LK 7.1 erhält man als Median der Anzahl X der Blütenknospen, da P ( X < 2) = P(X = 0) + P(X = 1) + P(X = 2) = 0.08 + 0.20 + 0.45 = 0.73 > 0.5 P ( X > 2) = P(X = 2) + P(X = 3) = 0.45 + 0.27 = 0.72 > 0.5 gilt, die Blütenzahl

2.

Teil II: Klausuraufgaben und Lösungen

403

-•(b) (vgl. Aufgabe 3.6) Da 3 E(X 2 ) =

l k 2 · P(X = k) = 0 · 0 . 0 8 + 1 · 0 . 2 0 + 4 · 0.45 + 9 · 0.27 k=0

= 4.43

,

berechnet sich die Varianz der Blütenzahl X mit Hilfe des

Verschiebungssatzes

zu Var(X) = E ( X 2 ) - (E(X)) 2 = 4 . 4 3 - 1.91 2 = 0.7819

.

-»(d) (vgl. Aufgabe 7.1) Für die Anzahl Y von Blütenknospen bei der CARDOROSAPHYTE soll anhand von 2 η = 50 Beobachtungswerten mit Hilfe des χ

- Anpassungstests zum Niveau α = 0.05

geprüft werden, ob diese von der in Tab. LK 7.1 angegebenen Verteilung der Blütenzahl der CARDOLILAPHYTE signifikant verschieden ist, d.h. ob die Hypothese Hq : y^

y^Q

unterliegen der Verteilung von X

zugunsten der Alternative Hj :y^,...,ygg

unterliegen nicht der Verteilung von X

zum 5% Niveau verworfen werden kann. In tab. CK 7.2 sind neben den beobachteten Häufigkeiten 0. für die Ausprägungen i = 0,1,2,3 und den erwarteten Häufigkeiten, die sich m i t η = 50 und den Wahrscheinlichkeiten p 0 = P(X = 0) = 0.08

,

p 1 = P(X = 1) = 0.20

,

p 2 = P(X = 2) = 0.45

,

P 3 = P(X = 3) = 0 . 2 7 durch Ei=npi=50-pi

,1=0,1,2,3

,

ergeben, einige Hilfsgrößen zur Berechnung der Prüfgröße aufgeführt.

404

Teil II: Klausuraufgaben und Lösungen

2 tab. CK 7.2: A r b e i t s t a b e l l e zum χ - Anpassungstest

i

E

°i

o2 1

i

°?/Ei

0

8

4.0

64

16.0000

1

15

10.0

225

22.5000

2

12

22.5

144

6.4000

3

15

13.5

225

16.6667

I

50

50

61.5667

Mit den Ergebnissen aus Tab. LK 7.2 e r g i b t s i c h für die h i e r zu verwendende Prüfgröße der Wert

χ

=

3 0? l p l - η = 61.5667 - 50 = 11.5667 i=0 i

der bei k = 4 mit dem 0 . 9 5 - Q u a n t i l x

2 k-1;1-a "

x

2 3;0.95

=

7-815

a l s kritischem Wert verglichen werden muß. Da a l s o χ 2 = 11.5667 > 7.815 = X^-1;1-α

'

s i n d anhand der beobachteten Werte s i g n i f i k a n t e Unterschiede zum 5% Niveau zwischen den Verteilungen zu erkennen.

->(e)

(Vgl. Aufgabe

3.16)

Mit den Z u f a l l s v a r i a b l e n X.j = 'Anzahl der Blutenknospen an der i - ten P f l a n z e '

,

i=1,2,

die unabhängig voneinander, i d e n t i s c h v e r t e i l t s i n d , wobei die Verteilungen mit der im Aufgabenteil i s t die

(a) gegebenen Ubereinstimmen, v g l . tab. CK 7 . 3 ,

Zufallsvariable V = X 1 + Y 2 = 'Anzahl der Blütenknospen an beiden Pflanzen'

zu betrachten.

Teil II: Klausuraufgaben und Lösungen

405

Cab. CK 7.3: Verteilung von X^, 1=1,2

k

0

1

2

P(Xi = k)

0.08

0.20

3 0.45

0.27

Die Verteilung der Zufallsvariablen Y, deren mögliche Ausprägungen die Werte j=0,1,2,...,6 sind, läßt sich mit Hilfe der Faltungsformel p( Y = j) = I P ( X 1 = k ) - P ( X ? = j - k ) 1 i k

, j=0,1,... ,6 ,

gewinnen. Dabei wird über alle Werte k summiert, für die j - k eine Ausprägung von

darstellt. Mit den in Tab. LK 7.3 angegebenen Werten erhält man

für P(Y = 0) = P(X1 = 0) · P(X 2 = 0) = 0.08 * 0.08 = 0.0064

,

P(Y= 1) = P(X1 = 0 ) · P(X 2 = 1) + P(Xt = 1) · P(X 2 = 0) = 0 . 0 8 · 0 . 2 0 + 0 . 2 0 · 0.08 = 0.0320

,

P(Y = 2) = P(X1 = 0) · P(X 2 = 2) + P(X1 = 1) · P(X 2 = 1) + P(X, =2) · P(X 2 =0) = 0.08· 0.45 + 0.20 · 0.20 + 0.45 · 0.08 = 0.1120

,

P(Y = 3) = P(X1 = 0) · P(X 2 = 3) + P(X1 = 1) · P(X2 = 2) + P(X1 = 2) · P(X 2 = 1) + P(X1 = 3) · P(X2 = 0) = 0.08· 0.27 + 0.20 - 0.45 + 0.45 · 0.20 + 0.27 · 0.08 = 0.2232

,

P(Y = 4) = P(X1 = 1) · P(X 2 = 3) + P(X1 = 2) · P(X 2 = 2) + P(X, = 3) · P(X 2 = 1) = 0.20· 0.27 + 0.45· 0.45 + 0.27 · 0.20 = 0.3105

,

P(Y = 5) = P(X1 = 2) · P(X 2 = 3) + P(X1 = 3) · P(X 2 = 2) = 0.45 · 0.27 + 0.27 · 0.45 = 0.2430

,

P(Y = 6) = P(X1 = 3) · P(X 2 = 3) = 0.27 · 0.27 = 0.0729

.

Durch diese Einzelwahrscheinlichkeiten ist die Verteilung von Y eindeutig bestimmt.

406

Teil II: Klausuraufgaben und Lösungen

-»(f) (vgl. Aufgabe 3.14, Aufgabe 2.2) Frau ROSE hat unabhängig voneinander zwei Pflanzen erstanden; somit besitzt die

Zufallsvariable X = 'Anzahl der Pflanzen, die Blütenknospen entwickeln 1

die Ausprägungen i=0,1,2. Die Zufallsvariable Y = 'Anzahl der Blütenknospen an beiden Pflanzen' mit den Ausprägungen j=0,1,...,6 wurde bereits im Aufgabenteil tet. Die Verteilung des Zufallsvektors

(e) betrach-

(X,Y), d.h. die gemeinsame

Verteilung

von X und Y, ist durch die Wahrscheinlichkeiten P ( X = i , Y = j ) , i=0,1,2, j=0,1,2

6, gekennzeichnet. Um die Berechnung dieser

Einzelwahrschein-

lichkeiten, die in Cab. CK 7-4 zusammengestellt sind, zu erleichtern, sollen zunächst die Ereignisse B k £ = ' k - t e Blume e n t w i c k e l t e

Blutenknospen'

eingeführt werden. Dabei gilt einmal, daß B ^

und B ^ ,

,

k=1,2, £=0,1,2,3 ,

für 1,1 '=0,1,2,3,

V , (stochastisch) unabhängig sind, d.h. P(B

u

nB

2 r

) = P(Bu).p(B2r)

Weiterhin sind sowohl B ^ , B ^ ,

B^»

B

. 13

als

disjunkt, d.h. für 1,1' = 0,1,2,3, l \ V B

u

n B

u

, = 0

B

2 0 ' E21» B22» B23

paarweise

ist

.

B2inB2£, = 0

.

Für diese Ereignisse sind außerdem folgende Wahrscheinlichkeiten bekannt P ( B 1 0 ) = P ( B 2 0 ) = 0.08

,

P(Bn)

= P ( B 2 1 ) = 0.20

,

P ( B 1 2 ) = P ( B 2 2 ) = 0.45

,

P ( B 1 3 ) = P ( B 2 3 ) = 0.27

.

Da es sich

um paarweise disjunkte bzw. unmögliche Ereignisse handelt, er-

gibt sich sofort P(X = 0,Y = 1) = P(X = 0,Y = 2) = ... = P(X = 0,Y = 6) = 0 PCX = 1 ,Y = 0) = P(X = 2,Y = 0 ) = 0

,

,

PCX = 1 ,Y = 4 ) = PCX = 1 ,Y = 5 ) = P i x = 1 ,Y = 6 ) = 0

,

P i X = 2,Y = 1 ) = 0 Die übrigen Wahrscheinlichkeiten lassen sich nun wie folgt angeben: PCX = 0,Y = 0) = P ( B 1 0 n B 2 0 ) = P ( B 1 0 ) · P ( B 2 0 ) = 0.08 · 0.08 = 0.0064

;

Teil II: Klausuraufgaben und Lösungen

tlab. CK 7 . 4 : V e r t e i l u n g des z u f ä l l i g e n Vektors

\

Y

(X,Y)

x \

0

1

2

3

4

5

6

Ϊ

0

0.0064

0

0

0

0

0

0

0 0064

1

0

0 0320

0 0720

0.0432

0

0

0

0 1472

2

0

0

0 0400

0.1800

0 3105

0.2430

0.0729

0 8464

I

0.0064

0 0320

0 1120

0.2232

0 3105

0.2430

0.0729

1

P(X = 1 ,Y = 1) = P ( B n η B 2 0 ) + P ( B 1 0 η B 2 1 ) = P(B11) - P(B20) + P(B10) . P(B21) = 0.20 · 0.08+ 0.08 · 0.20 = 0.0320

;

P(X = 1 ,Y = 2 ) = P ( B 1 2 η B 2 0 ) + P ( B 1 0 η B 2 2 ) = 0.45 · 0.08+ 0.08 · 0.45 = 0.0720

;

P(X = 1,Y = 3) = P ( B 1 3 n B 2 0 ) + P ( B 1 0 n B 2 3 ) = 0.27 · 0 . 0 8 + 0.08 · 0.27 = 0.0432

;

Ρ(Χ = 2 , Υ = 2 ) = Ρ ( Β 1 1 Π Β 2 1 ) = 0.20 · 0.20 = 0.0400

;

P(X = 2,Y = 3 ) = P ( B 1 2 n B 2 1 ) + P ( B l 1 n B 2 2 ) = 0.45 · 0.20 + 0.20 · 0.45 = 0.1800

;

P(X = 2,Y = 4 ) = p ( B 1 3 n B 2 1 ) + P ( B 1 2 η B 2 2 ) + p ( B n η B 2 3 ) = 0.27 · 0.20 + 0.45 · 0.45 + 0.20 · 0.27 = 0.3105

;

P(X = 2,Y = 5) = P ( B 1 3 n B 2 2 ) + P ( B l 2 n B 2 3 ) = 0.27 · 0.45 + 0.45 · 0.27 = 0.2430

;

Ρ(Χ = 2,Υ = 6 ) = Ρ ( Β 1 3 Π Β 2 3 ) = 0.27 · 0.27 = 0.0729

.

407

Teil II: Klausuraufgaben und Lösungen

408

In Cab. CK 7.4 sind auch die sich ergebenden Randverteilungen

6 Ρ (X = i) =

l P(X = i , Y = j ) J=0 2 P ( Y = j ) = l P(X = i ,Y = j) i=0

für 1=0,1,2

,

für 3=0,1,2,3,4,5,6

eingetragen. Dabei stimmen natürlich die ermittelten

Einzelwahrscheinlich-

keiten für die Zufallsvariable Y mit denen im Aufgabenteil

(e) überein, d.h

auf diesem Wege ist auch eine Lösung für (e) gegeben. Die Einzelwahrscheinlichkeiten der zufälligen Größe X lassen sich auch liber die Binomialverteilung berechnen, denn unabhängig voneinander trägt jede Pflanze mit Wahrscheinlichkeit 0.08 keine Blütenknospe und mit Wahrscheinlichkeit 0.92 bildet sie Blütenknospen, d.h. mit n = 2 ist X B(2,0.92) - verteilt.

LÖSUNG -»(a)

ZU A U F G A B E

(Vgl. A u f g a b e

K8

3.2, Aufgabe

3.6, Aufgabe

3.8)

Die Zufallsvariable X ist stetig verteilt mit der Dichte

fx(x)

1/2

für 1 < χ < 2

0

sonst

und

3< x< 4

->(a,i) Die Verteilungsfunktion von X soll zunächst für drei Intervalle getrennt berechnet werden: Es ergibt sich für t 1 < t < 2:

t

F, (t)= J f x (x)dx= X

j

^dx=

1=

^

4

1 mi t F^ (2) = ^ 2 < t < 3:

t Fx(t) = J

,

t f x ( x ) d x = Fx(2) + | 0 d x = Fx(2)=^· 2

mit F x (3) = J;- ,

3 < t < 4:

t Fx(t)=j

t f x (x) dx = F x (3) + | ^ d x = 3

t

^xj

= jt -1 3

409

Teil II: Klausuraufgaben und Lösungen

Insgesamt ist damit die Verteilungsfunktion bestimmt durch t< 1

0 i2 t -

1

1 < t< 2

j

1 1

Fx(t) =

.falls

2< t< 3 3 < t< 4 t> 4

(a,ii) Als Erwartungswert der Zufallsvariablen X erhält man 2

4

χ f y ( x ) dx = I i x dx + I i x dx = [ i x 2 ]

E(X) = I

1 = 1 (4-1 + 16-9)

Als Median ξρ

+ [}XZ] 1

3 2.5

.

für den bei einer stetig verteilten Zufallsvariablen

stets

Fx(?0-5)=0.5 erfüllt ist, ergibt sich, da (vgl. Aufgabenteil F x ( x ) = 0.5

für alle

(a,i))

2 4

ξ

2

0.25~Ι

= 0

1

^0.75"

(a,i),muß

[3,4] sein. Somit ist dann wegen

·25

1

=0·75

al so ς 0 > 2 5 = ( 0 . 2 5 + ^ ) - 2 = 1.5

,

ξ0

.

? 5

= (0.75 + 1 ) · 2 = 3.5

Der Quartilsabstand beträgt dann ξ

0.75-ξ0.25

= 3

·5"1·5

= 2

·0

-»(b) (Vgl. Aufgabe 3.2) Die Zufallsvariable Y ist stetig verteilt mit der Dichte 1/4

für -c < y < -1

0

sonst

und

1 2

1

-»(c.Tii)

Für b e l i e b i g e Werte a,

a-Quantil

0< t < 2

0 0.90 erhält man hier als Mindestwert für η ' V n V 1 > 0.90 '

W 5

. / O l , , 1.90 Φ ·6· ν η ! > —τ, W

5

' '

L

0.01 6· • η > u 0 _ 9 5 V5

η > 61.3018 2 = 3757.9107 d.h. über den Zentralen Grenzwertsatz liegt die Anzahl der mindestens auszuführenden Würfe bei nur 3758, ist also weitaus geringer teil (a).

als im Aufgaben-

Teil II: Klausuraufgaben und Lösungen

LÖSUNG

ZU

AUFGABE

415

K10 2

Die Abweichung X vom Mindestdurchmesser wird als Ν(μ,σ ) - verteilt angenommen. Aus der Stichprobe vom Umfang η = 1 0 -

1 = W

x

10

i=1

1 i = l V ' 4 4 =4·4

x

s 2 = T q ^ T ( .1°

für μ und σ

2

x

i -

10

*2)

lassen sich die Schätzwerte

»

=

l (251.18 - 193.60) = 6.3978

berechnen.

->(a) (Vgl. Aufgabe 5.4) Für 1 - α = 0 . 8 0 , d.h. a = 0 . 2 0

i l ; 1 - a / 2

=

*n-1;a/2

x

=

x

ist

9;0.90

9;0.10

=

=

4

1 4

"

"

6 8

1 6 8

und somit ergibt sich in (n-1)s 2 2 χ η-1;1-α/2

9 · 6.3978 9 · 6.39781 14.68 ' 4.168

(n-1 )s . -j— x n-1;a/2

J

= [3.9224 , 13.8148] ein Konfidenzintervall

zum 80% Niveau für die Varianz σ

->(b) (Vgl. Aufgabe 6.3.c)

des Spiels.

2

Bei einer Unterschreitung der Varianzobergrenze von 12 (μιτι)

um 20%, d.h.

mit dem Vergleichswert O q = 1 2 - 0 . 2 0 · 12 = 9.60

,

soll getestet werden, ob die Hypothese Hq : σ2 > 9 . 6 zugunsten der Alternative, daß der Wert 12 um mehr als 20% unterschritten wird, H1 : σ 2 < 9.6 zum Niveau a = 0.25 verworfen werden kann. Als Prüfgröße

ist

416

Teil II: Klausuraufgaben und Lösungen

Χ

2 _ ( n - 1 ) s 2 _ ( 1 0 - 1) · 6.3978 _ qg7g ζ 9.6 3.3S/3 σ

0

zu verwenden, deren Wert mit dem Quantil =

Xn-1;a

4;0.25 =

5

·899

zu v e r g l e i c h e n i s t . Da χλ 2 = 5.9979 Jfr 5.899 = Αχη2 - 1 ; α kann d i e Hypothese H n a l s o zum 25% Niveau n i c h t abgelehnt werden, d . h . anhand 2 der S t i c h p r o b e i s t d i e V a r i a n z n i c h t a l s s i g n i f i k a n t k l e i n e r a l s 9.6 (pm) anzusehen.

-»(c) ( V g l . A u f g a b e 5 . 6 ) Unter den η = 10 Beobachtungswerten i s t m = 1 Ausschußstück f i n d e n , d . h . der A n t e i l =

p

r i V

= 0

·

( x ^ = 9 . 6 ) zu

der Ausschußstücke wird mit

1 0

auf 10% g e s c h ä t z t . Ein exaktes K o n f i d e n z i n t e r v a l l

f ü r den A u s s c h u ß a n t e i l

zum Niveau α = 0.80 e r h ä l t man über d i e Pearson - Clopper - Werte mit F

2m,2(n-m+1);cx/2

=

F

2,20;0.10

= 0.1059 F

2(m+1),2(n-m);1-a/2

=

P

=

1/F

=

20,2;0.90

1

/9.441

,

4,18;0.90

=

2-286

'

d.h. mF 1

"

n

-

2m,2(n-m+1);a./2

_ 0.1059 _ „ n l n , - 10.1059 - ° · 0 1 0 5

P2

=

P

2m,2(n-m+1);ct/2

m+1+mF

"

2,20;0.10

10 + F

2,20;0.10

'

(m + 1 ) F 2 ( m + 1 ) , 2 ( n - m);l-ct/2 _ 2 ' F4,18;0.90 = η -m 9 + 2 · F4 J 8 . 0 9Q m+ + (m+ 1) F 2 ( m * + 1 K 2 ( n ' _ m ) ; 1 _ a / 2

4 57? j 6 m

-

°·

[1.05% , 33.69%]

3 3 6 9

Teil II: Klausuraufgaben

LÖSUNG

ZU

AUFGABE

->(a) ( V g l . A u f g a b e

und Lösungen

417

K U

6.l)

Für die Lauflänge X von Videokassetten eines Markentyps, die als Ν(μ,14.44) verteilt angenommen wird, liegt eine zufällige Stichprobe vom Umfang n = 10 vor, aus der sich als Schätzer für den Erwartungswert μ von X X =

10

1

1 x

W

i

=

Tff' 1 7 9 2

= 179-2

Minuten

ergibt. Der vom Hersteller angegebene Sollwert für die Aufnahmekapazität dieser Kassetten liegt bei 180 Minuten, d.h. es soll zum Niveau α = 0.05 HQ : μ > 180

gegen

H1 : μ < 180

2 getestet werden. Mit σ * = 14.44, d.h. σ*=3.8,erhält man als Prüfgrößenwert , = ζ

X

" σ

- 180 \τ-π ,,, 7 vrr n = 179.2 / 10 = n-0.6657 Js-s 0

*

·

,

so daß die Hypothese Hg wegen ζ = -0.6657 4 - 1 - 6 4 « = - u 0 _ g 5 = V

0 5

= ua

zum 5% Niveau nicht abgelehnt werden kann. Die aufgestellte Vermutung kann also zu diesem Niveau nicht signifikant bestätigt werden.

-»(b) ( V g l . A u f g a b e

3.6, Aufgabe

6.l)

Der Hersteller gibt den Variationskoeffizienten mit v = J=0.02 2 2 an. Da die Varianz mit σ = σ * = 14.44 bekannt ist, läßt sich in diesem Fall das zu untersuchende zweiseitige Testproblem H q : v>= 0.02

gegen

H 1 : vf 0.02

wegen σ* -=0.02

σ

»

*

3 8 =

äquivalent als Hg : μ = 190

gegen

: μ ^ 190

angeben. Mit den Ergebnissen aus Aufgabenteil (a) erhält man in diesem Fall

418

Teil II: Klausuraufgaben und Lösungen

als Teststatistik ζ so daß bei

=

i l ü o y/n= σ*

^9.2-19 J.ö

0 / t o =

.

8

9875

einem Niveau von α = 0.20 die Hypothese HQ und damit auch HQ ver-

worfen werden muß, denn |z| = 8.9875 > 1.2816 = U 0

9 0

= υ,.α/2

.

Die vom Hersteller gemachte Angabe kann also zum 20% Niveau signifikant widerlegt werden.

->(c) (vgl. Aufgabe 9.l) Mit der Annahme, daß die Lauflänge X der Videokassetten stetig und symmetrisch verteilt ist und außerdem der Erwartungswert μ von X existiert, kann mit Hilfe des Vorzeichenrangtests von Wilcoxon das im Aufgabenteil

(a) for-

mulierte Testproblem Hg : μ > 180

gegen

H 1 : μ < 180

zum Niveau a = 0 . 0 5 geprüft werden. Cah. CK 11.1 hält, als Arbeitstabelle aufgebaut, die Beobachtungswerte x., ,

I

^

die transformierten Werte x ^ x ^ - 1 8 0 , die Beträge |x.|, die zugehörigen Rangzahlen R(|x^|) und die mit dem Vorzeichen von x! versehenen Statistiken R. für i = 1,

»10 fest.

Cab. CK 11.1: Arbeitstabelle zum Vorzeichenrangtest von Wilcoxon

X

1 i

i

χ. 1

1

185 6

5 6

2

182 3

2 3

R(i*;i)

«i

5.6

9

9

2.3

5

5

3

176.4

-3 6

3.6

7

-7

4

178 6

-1 4

1.4

3

-3

5

177 5

-2 5

2.5

6

-6

6

181 9

1 9

1.9

4

4

7

180 2

0 2

0.2

1

1

8

174 2

-5 8

5.8

10

-10

9

175 9

-4 1

4.1

8

-8

10

179 4

-O 6

0.6

2

-2

Teil II: Klausuraufgaben und Lösungen

419

Somit ergibt sich für die Prüfgröße w als Summe der positiven Werte von

w = 9 + 5 + 4 + 1 = 19 Bei einem Niveau a = 0 . 0 5 liegt der kritische Wert des

Vorzeichenrangtests,

vgl. Tab. L9.1.3, hier bei w

n;o

= w

10;0.05

= 11

d.h. wegen w = 19 *Γ 11 = w

η ;α

kann auch hier wie im Aufgabenteil

(a) die Hypothese nicht verworfen werden.

LÖSUNG ZU AUFGABE K12 (vgl. Aufgabe 4.8, Aufgabe 6.l) Die von einer Anlage in Tuben abgefüllte Menge X an Zahnpasta ist nach Voraussetzung Ν(μ,16) - verteilt. Wenn der tatsächliche Inhalt der Tuben nur in 3% der Fälle kleiner als 160 mt ist, so gilt die Anlage als richtig eingestellt, d.h. falls P ( X < 160) = 0.03 erfüllt ist. Wegen P(X 0.5 zugunsten von H 1 : p < 0.5 verworfen werden muß. Da aus Zeitersparnisgründen der approximative Einstichproben - Gauß - Test verwendet werden darf, ist also die Prüfgröße _

m-np0

_

v ' n p g d - Pq)

^.a.o.s

_ _2

V 28 · 0.5 · 0.5

zu berechnen. Mit α = 0.30 und u^ = u Q

3q

= "uq

=

^ ^

\ί 7 7g

=-0.5244

m u ß

we

9en

ζ = -0.7559 < -0.5244 = u n , n = u 0.30 α die Hypothese, daß die Behandlungsmethode erfolgreich ist, zum 30% Niveau verworfen werden.

->(b,ii) Bei gegebenen Ausprägungsmögl ichkeiten a, ϊ 'Weiblich' und a 2 = 'Männlich' des Geschlechts Y

X sowie b, S 'Ja' und b g ^ ' N e i n ' des

Behandlungserfolges

(wobei die Behandlung für einen Patienten als erfolgreich anzusehen ist,

wenn er mehr als fünf Jahre überlebt)

soll anhand von η = 2 8

unabhängigen

Beobachtungen die Hypothese der Unabhängigkeit von X und Y , d.h. H

0

: p

ij

=p

i . *p.j

für alle i,j=1,2

gegen H, : p.jj

p.j

•ρ j

für mindestens ein (i,j)

zum Niveau α = 0.25 getestet werden. Cab. CK 13.2 stellt die sich ergebende (2 χ 2) - Kontingenztafel prägungskombinationen

mit den beobachteten Häufigkeiten ηη.. für die Aus-

(a.j,b·), i,j=1,2,dar.

423

Teil II: Klausuraufgaben und Lösungen

Cab. CK 13.2: (2*2) - Kontingenztafel; Geschlecht und Behandlungserfolg η = 28 Patienten

von

^vfiehandlungsNein

Ja

^^erfolg

l

Geschlecht Weiblich

η

Männlich

n

21

n

.1

I

8

n12 = 8

n

i

=

4

n22 = 8

n

2

=

12

η

η = 28

ι Γ

2

= 16

= 16 = 12

Somit erhält man für die Prüfgröße den Wert 2 2 x

28(8·8-8·4)2

η(η11π22-η12η21) "

η

ι

n

Π

1 2

n

2

16-12-12-16

_ 28672 _ ~ 36864

n u

777H

-///ö

und m i t a = 0.25, k = 2, 1 = 2 sowie x

2 (k-1)(£-1);1-a

= x

2 1;0.75

kann die Unabhängigkeitshypothese

=

1

"323

wegen

χ 2 = 0.7778 * 1.323 = x 2 k . 1 ) ( £ . 1 ) ; 1 . a zum 25% Niveau nicht verworfen werden.

-»(c) (Vgl. Aufgabe 8.1, Aufgabe 8.3, Aufgabe 8.4, Aufgabe 8.5) Die Überlebenszeiten X^ und X 2 männlicher und weiblicher krebskranker Patienten, die einer bestimmten Behandlungsmethode unterzogen wurden, seien 2

2

unabhängig Ν(μ 1 , σ ^ -

und Ν ( μ 2 , σ 2 ) - verteilt. Mit Hilfe der n 1 = 12 bzw.

n 2 = 16 Beobachtungswerten läßt sich die durchschnittliche der Männer auf 1 x^ = j 2

12

1

χ

und die der Frauen auf

1 ιη· = - ^ " 6 2 . 1 = 5 . 1 7 5 Jahre

Überlebenszeit

424

Teil II: Klausuraufgaben und Lösungen

schätzen.

2

->(c,i) Unter der Annahme, daß die Varianzen mit

2

2 2 = 9 und σ 2 = σ 2 * = 7

bekannt sind, soll zum Niveau α = 0.30 die Hypothese H q : μ1 = μ 2

gegen

H 1 : μ,

getestet werden. Mit d = 0 ergibt sich als Wert der zugehörigen Prüfgröße x

. _

i"x2"d _ 5.175 - 3.550 _ 1.625 1 ~Ύ~ /9 J 7 VI .1875 σ 2* V 12 16 TT," + 1 Γ Γ

ß^TZ

=

τ

4912

und da |z| = 1 . 4 9 1 2

> 1.0364 = U 0 _

8 5

= U1_CX/2

gilt, bestehen bei einer Irrtumswahrscheinlichkeit von 0.30 signifikante Unterschiede zwischen den durchschnittlichen Oberlebenszeiten der männlichen und weiblichen Patienten.

-»(c,ii) Unter der Annahme, daß die Varianzen unbekannt aber gleich sind, d.h. 2 2 σ^ = σ 2 gilt, soll zum Niveau ot = 0.10 die Hypothese H 0 : μ1 < μ 2 getestet werden. Mit

gegen

Η, : μ 1 > μ 2

12

5

1

=

T2^T ( j

X

1i " 1 2 * 1 )

=

T T ( 3 9 5 · 5 9 0 0 - 321.3675) = 6.7475 ,

5

2

=

T f W

x

2i " 1 6

=

T 5 (263.2000 - 201.6400) = 4.1040

(.f

erhält man zunächst 2 ρ

=

(n

2 2 1 ' 1 ) s 1 + ( n 2 " 1 ) s 2 = 11 · 6.7475 + 15 · 4.1040 n1 + n 2 - 2 26

und somit für die hier zu verwendende Prüfgröße

=

X

1 ~x2"d

=

5. 175 - 3.550 - 0

=

1

862Q

=

5



2 4

Teil II: Klausuraufgaben

und Lösungen

425

Da t = 1.8620 > 1 . 3 1 5 = t , , n Q n = t 26 ;0.90 n,|+n,,-2 ;1-α muß obige Hypothese zum 10% Niveau abgelehnt werden, d.h. die d u r c h s c h n i t t l i che Überlebenszeit der Frauen i s t bei einer Irrtumswahrscheinlichkeit von 0.10 s i g n i f i k a n t k l e i n e r a l s die der Männer.

- » ( c . i i i ) Unter der Annahme, daß die Varianzen unbekannt und ungleich s i n d , s o l l zum Niveau α = 0.05 die Hypothese gegen

Η0:μ1 μ 2

2 2 getestet werden. Da s^ = 6.7475, s 2 = 4.1040, v g l . Aufgabenteil is2 S 1 "1 '»r n

21 2 2

+ +

n

j k n , - 1) +

1

2. [-11 n

n 2 - 1)

2

(6.7475 4.1040 A z u z l z i r i

g i l t , i s t mit dem w

(approximativen) d

=

( c , i i ) , und

20.2366

Prüfgrößenwert

5.175 - 3.550 - 0 /6.7475 ν T2

=

1

7g58

4.1040 16

die Hypothese Hg zum 5% Niveau zu verwerfen, denn t = 1 .7958 > 1 .725 = t 2 0 ; 0

95

,

d.h. bei einer Irrtumswahrscheinlichkeit von 0.05 i s t die d u r c h s c h n i t t l i c h e Überlebenszeit der männlichen Patienten s i g n i f i k a n t größer a l s die der weibl i c h e n Patienten.

2 2 - > ( c , i v ) Für die Varianzen σ^ und σ^ der Überlebenszeiten von männlichen und weiblichen Patienten s o l l folgendes Testproblem behandelt werden:

426

Teil II: Klausuraufgaben und Lösungen

2 2 Hq : σ1 = σ2

2 2 Hj :σ1 ^ σ 2

gegen

ρ (c,ii) ermittelten Stichprobenvarianzen s, = 6 . 7 4 7 5

Mit den im Aufgabenteil

und s 2~ = 4 . 1 0 4 0 berechnet sich für die Prüfgröße der Wert

F =

S 1 ~2 2

=

so daß mit a = 0 . 2 0

6.7475 = = 1.6441 4.1040

wegen

F = 1.6441 + 2.036 = F

F = 1.6441 i

11,15;0.90"Fn1-1,n2-1;1-a/2

0.4615 =

2

·167

F

= F 15,11;0.90

»

11,15;0.10

= FF n.-1,η,-1;a/2 1 2 die Hypothese der Gleichheit der Varianzen zum 20% Niveau nicht verworfen werden kann. Die Varianzen der Überlebenszeiten von weiblichen und männlichen Patienten unterscheiden sich zum Niveau 0.20 also nicht signifikant.

-»(d) ( V g l . Aufgabe 9 . 3 ) Für die Überlebenszeiten X^ und X 2 männlicher und weiblicher

Patienten,die

als unabhängige, stetig verteilte Zufallsvariablen mit existierenden tungswerten μ^ und μ 2 angenommen werden, soll zum Niveau α = 0 . 3 0 werden, ob signifikante Unterschiede zwischen den mittleren

Erwar-

geprüft

Überlebenszei-

ten μ,| und μ 2 bestehen, d.h. es ist HQ : μ 1 = μ 2

gegen

H1 : M1

zu testen. Als nichtparametrisches Prüfverfahren bietet sich in diesem Zweistichprobenfall

der Wilcoxon - Rangsummentest an. Zur Ermittlung der zuge-

hörigen Teststatistik sind in t a b . CK 13-3 die Rangzahlen der insgesamt n^ + n 2 = 1 2 + 1 6 = 2 8

ßeobachtungswerte festgehalten. Dabei wurden gleichen

Werten innerhalb einer Stichprobe die Rangzahlen fortlaufend

zugeordnet,

während bei gleichen Werten in beiden Stichproben die zugehörigen Rangzahlen gemittelt wurden. Über die Summe der Ränge, die für die erste Stichprobe, d.h. für die Überlebenszeiten der männlichen Krebspatienten, vergeben wurden, 12 wR =

l

R i x ^ ) = 6.5 + 14 + 13 + . . . + 27 = 202.5

427

Teil II: Klausuraufgaben und Lösungen

Cab. CK 13.2: Rangzahlen der insgesamt 28 Beobachtungswerte X

i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

X

x

21

Rix

Ii

2 .1 3 .7 3 .4 3 .3 4 .5 7 .8 8 .2 2 .9 4 .9 3 .2 9 .4 8 .7

216

X

1i>

6.5 14 13 12 15 25 26 9 16 11 28 27

R(X21)

2i

5 .5 0 .4 2 .1 0 .7 5 6 1 0 2 .5 1 .9 1 .9 5 1 5 3 5 3 3 .1 5 2 6 1 5 1

22 1 6.5 2 23 3 8 4 5 17 20 21 10 19 24 18

erhält man bei approximativer Durchführung des Tests mit n^ = 12, n ^ = 16 für die Prüfgröße den Wert ^

wR-0.5n1(n1

K

y n 1 n 2 ( n l + n 2 + 1)/12

der mit dem Quantil

υ

·]_α/2 =

1)

u

202.5 - 0.5 · 12 · 29

28.5

ν Ί 2 · 16 · 29/12

v^64

1 -0 15 = u 0 85

zu

9eh°rigem

,

kritischen

Wert verglichen werden muß. Da lwR I = 1 · 3 2 3 1

>

1

-0364

= u

0 . 8 5 = u 1-a/2

·

kann die Hypothese H Q zum 30% Niveau verworfen werden. Somit sind bei einer Irrtumswahrscheinlichkeit von 0.30 signifikante Unterschiede zwischen den Überlebenszeiten der männlichen und weiblichen Krebspatienten zu verzeichnen.

LÖSUNG

ZU A U F G A B E

K14

-»(a) (Vgl. Aufgabe 8.6, Aufgabe 3.14, Aufgabe 4.8) Die Umsatzdifferenzen zum Vormonat X^ und X^ zweier Produkte stellen voneinander abhängige Ν(μ,,4)-

bzw. Ν(μ ? ,36) - verteilte Zufallsvariablen dar.

428

Teil II: Klausuraufgaben

und

Lösungen

-»(a,i) Für die d u r c h s c h n i t t l i c h e n Umsatzdifferenzen μ^ und μ 2 s o l l

folgendes

Testproblem untersucht werden: Hg : μ 1 = μ 2

gegen

Η, : μ 1 ^ μ 2

Aus der angegebenen K o r r e l a t i o n Py y = - 1 - 0 12 2 l ä ß t s i c h die Kovarianz zwischen X^ und X 2 a b l e i t e n , denn mit σ^ = 4 und σ 2 = 3 6 e r g i b t s i c h wegen Cov(XrX2) PX

X

1 2

y Var(X^) · V a r ( X 2 )

J

.

q2

VT^36

12

gerade σ12 = -12

.

Die Varianz der Z u f a l l s v a r i a b l e n D = X^ - X 2 i s t a l s o bekannt und hat den Wert Op* = a \ + σ 2 - 2σ 1 2 = 4 + 36 + 2 · 12 = 64

In Cab. CK 14.1 s i n d neben den beobachteten Umsatzdifferenzen x^. und χ 2 ι · , i = 1 , . . . , 7 , der beiden Produkte die zur Berechnung der Prüfgröße benötigten paarweisen Differenzen d.. = x.| . - Xg.., i=1

7, zusammengestellt.

Cah. CK 14.1: Umsatzdifferenzen ( i n 10000 DM) x^. und x ^ Differenzen d^ = x ^ - x 2 i f ü r i = 1 , . . . ,7

d.-x1.-x2.

i

X

1 2 3 4 5 6 7

1 -1 0 3 -2 -3 2

-2 4 1 -8 7 10 -5

3 -5 -1 11 -9 -13 7

I

0

7

-7

1i

X

2i

sowie paarweise

Teil II: Klausuraufgaben

Mit η = 7, öp* = 8,

429

und Lösungen

= 0 und

7 a

= 7 AI V r ( i=1

7

>

= -1

erhält man nun für die Teststatistik den Wert d

ζ

=

"M0

_ π

D*

-1-n _ = _ l " v ' 7 =-0.3307 8

,

der bei einem vorgegebenen Niveau α = 0.08 mit dem kritischen Wert

u

i-a/2

=

Uq g g = 1.7507 verglichen werden muß. Da |z| = 0.3307 $ 1 .7507 = u , . ^ gilt, kann die

Hypothese

zum 8% Niveau nicht verworfen werden, d.h. es

kann kein signifikanter Unterschied zwischen den jeweiligen Durchschnittswerten bei einer Irrtumswahrscheinlichkeit von 0.08 festgestellt werden.

->(a,ii) Den Umsatzdifferenzen zum Vormonat X^ und X^ wird nun weiterhin unterstellt, daß diese gleiche Erwartungswerte besitzen, d.h. X. sei Ν(μ,4) ο I und X 2 sei Ν(μ,36) - verteilt. M i t a D * = 64, vgl. Aufgabenteil

(a,i), ist

also D = X 1 - X 2 wegen E(D) = E(X 1 ) - E(X 2 ) = μ - μ = 0

,

Var(D) = σ ^ = σ ^ = 64 N(0,64) - verteilt. Die gesuchte Wahrscheinlichkeit, daß sich die jeweiligen Umsatzdifferenzen zum Vormonat um höchstens 5 (in 10000 DM) unterscheiden, ergibt sich damit zu P(|D| < 5) = P(-5< D < 5) =

= Φ

p f < W 6 4

— < - = ) / 5 4 " V 64'

( Ι ) · φ ( " | ) = 2Φ(0.63) - 1

= 2 · 0.7357 - 1 = 0.4714

.

-»(b) (vgl. Aufgabe 10.1, Aufgabe 10.2) -»(b,i) Bezeichnen X und Y die Umsätze, die für zwei Produkte in einem Supermarkt erzielt worden, so soll anhand von η = 18 Beobachtungspaaren, die einen Stichprobenkorrelationskoeffizienten und somit einen Schätzer für

430

Teil II: Klausuraufgaben und Lösungen

die Korrelation

in Höhe von

rXY = - 0 . 2 8 liefern, die Hypothese der positiv

linearen Abhängigkeit zwischen X und

Y, d.h. H

:P

0

XY - 0

9egen

H

1

:P

XY

< 0

zum Niveau a = 0 . 0 1 geprüft werden. Dabei wird den Umsätzen X und Y eine gemeinsame Normal verteilung

unterstellt.

Als Prüfgrößenwert erhält man nun

t

=

r

XY ' ^

n

/

"2

-0.28 · V~T6

=

1 - rJi 'XY

/ l - 0.28

= 2

-1.12 = 0.96

1667

der bei obigem einseitigen Testproblem zum Niveau α = 0.01 mit dem Quantil =

^n-2;a

t

16;0.01

=

_t

16;0.99

=

"2·583

verglichen werden muß. Da t = -1 .1667 4Γ -2.583 = t

, n-2;a

gilt, kann die Hypothese des positiven Zusammenhangs zwischen X und Y zum 1% Niveau nicht verworfen werden, d.h. die bisherige Ansicht kann zum \% Niveau nicht signifikant widerlegt werden.

->(b,ii) Es soll ein (approximatives) Konfidenzintervall für die Korrelation ρ χ γ berechnet werden. Mit η = 18, Va/2

= u

0.95 = 1 · 6 4 4 9

»

r X y =-0.28 ist dieses wegen ,

z

r

_ 1 , 2ln

1+ r

XY

_ 1 , 0.72 " Ι 1 n ΤΓ28

+

r XY Vct/2 - 2(τπτ - 7 = =

0.28 2ΛΪ -

1.6449

= -0.2877 + 0.0082 - 0.4247 = -0.7042

,

zum Niveau 1 - a = 0.90

Teil II: Klausuraufgaben und Lösungen

1

,

in

'XY

1 + Γ χ Υ

431

1-α/2

-0.2877 + 0.0082 + 0 . 4 2 4 7 0.1452 bestimmt durch 2 z.

2z„ -

-1.4084

- 1

1

2 z.

2z„

e

-1.4084

+ 1

e

+ 1

0.2904 0.2904

.1 ^ . + 1

[0.2445 - 1 1 .3370 - 1 0.2445 + 1 ' 1 .3370 + 1 [-0.6071 , 0.1442]

-+(c) (vgl. Aufgabe 11.1, Aufgabe

10.l)

-»(c,i) Der Umsatz Y, der für einen Modeartikel

in Supermärkten erzielt wird,

hänge annähernd linear von dessen Preis X ab. Aus den bei η = 2 3

zufällig

ausgewählten Supermärkten festgehaltenen Preisen x^ und zugehörigen Umsätzen y.j, i = 1

23, ergab sich χ = 52

,

y = 121000

s 2 = 25

,

s 2 = 361000000

.

Weiterhin läßt sich nun aus der ebenfalls bereits ermittelten

Stichproben-

korrelation r^y = -0.7 die empirische Kovarianz zwischen X und Y berechnen. Da

r

S XY / 2

XY

=

g

S XY 5 · 19000

S XY 95ÖÖÖ

=

'

' SY

Λ ergibt sich S

XY

=

0.7 · 9 5 0 0 0 = - 6 6 5 0 0

Nach der Methode der Kleinsten Quadrate erhält man die Schätzwerte bg und bj der linearen Beziehung durch η h

l ix.-ÄXy,-y) i=1 1 = η — l i= 1

(x 1

r

i)

2

=

. XY ~r S

X

=

-66500 " T T " =

"2660

432

Teil II: Klausuraufgaben und Lösungen

und t>0 = y - b,x = 121000 + 2660 · 52 = 259320 Somit kann also der Umsatz eines Supermarktes bei vorgegebenem Preis χ durch y = 259320 - 2660 χ geschätzt werden.

->(c,ii) Aus der soeben berechneten Regressionsbeziehung

läßt sich bei einem

Preis von X g = 4 0 DM der Umsatz wegen

y Q = y ( 4 0 ) = 259320 - 2660 · 40 = 152920 auf 152920 DM prognostizieren.

->(c,iii) Um ein Prognoseintervall

zum Niveau 1 - α = 0.90 für den Umsatz des

Artikels bei Vorliegen eines Preises in Höhe von x n = 4 0 DM bestimmen zu 2 können, muß zunächst die Fehlervarianz σ geschätzt werden. Dieser Schätzwert s 2 ergibt sich aus der Beziehung 2 _ XV

(n-2)s2 ,2 (n - 1η )Sy

Y,X ~

mit η = 2 3 , r X Y = - 0 . 7 , Sy = 361000000 zu

s2

=

= M i t

7^4

(1

~rXY)

S

Y

=

I f

(1

" (-°-7)2)

361000000

192877142.9

tn-2;1-a/2 = t21;0.95 = 1

-721

n - 2 ; 1-α/2

/

e r h ä l t

man

η

( n

f Ü r

_

1 ) 2

X

= 13888.0216 · 1.721 · J ^

+

^ " Λ ^

= 27307.1157 und somit ist das gesuchte 0.90 - Prognoseintervall

bestimmt durch

[b Q + b^Xq - D . b g t b ^ Q + D] = [259320 - 2660 · 40 - 27307.1157 , 259320 - 2660-40 + 27307. 1 157] = [125612.8843 , 180227.1157]

Teil II: Klausuraufgaben und Lösungen

433

LÖSUNG ZU AUFGABE K15 ->(a) (Vgl. Aufgabe 11.3) Es wird vermutet, daß die Wohnfläche Y annähernd linear vom Nettoeinkommen des Haushaltes X 1 und der Haushaltsgröße X,, abhängt, d.h. es soll eine Funktion der Form y = bQ + blx1 + b 2 x 2 geschätzt werden. Aus den gegebenen Werten berechnet man zunächst mit = 9 · 741.1 2 = 4943062.89

SQ„ = (η - 1 )Sy X X 1 1 = (n - 1)s 2

SQX

SP Y

Y

12

= 9 - 1 - 4 2 = 17.64

= (η - 1 )s Y

Y

12

η=10

,

,

= 9 - 740 = 6660.00

,

SPX

Y

= (n-1)sYX

= 9 · 18460 = 166140.00

SP X

γ

= (n - 1 ) s Y X

= 9 - 32.9 = 296.10

,

.

Die Schätzwerte b^ und b 2 ergeben sich dann als Lösung des Normalengleichungssystems 4943062.89 ^

+ 6660.00 b 2 = 166140.00

6660.00 b^ +

17.64 b 2 =

296.10

zu b 1 = 0.0224 b 2 = 8.3368

, .

Da b Q = y - b 1 x 1 - b 2 x 2 = 64.5 - 0.0224 · 2360 - 8.3368 · 2.9 = -12.5407

,

lautet die geschätzte multiple

Regressionsfunktion

y = -12.5407 + 0 . 0 2 2 4 x 1 + 8 . 3 3 6 8 x 2

-•(b) (Vgl. Aufgabe 11.3, Aufgabe ll.l) Es soll geprüft werden, ob das Nettoeinkommen X^ zur Erklärung der Wohnfläche ausreicht, d.h. zum Niveau α = 0.05 ist

434

Teil II: Klausuraufgaben und Lösungen

HQ : Xj reicht als Regressor aus gegen H^ : X,| reicht als Regressor nicht aus zu prüfen. In die hier zu verwendende Prüfgröße geht zunächst einmal das Bestimmtheitsmaß der Regressionsgeraden y(x(1))=b0

+ b

1x(1)

mit

x

iD

=X

1

ein. Dieses läßt sich aus der für die einfache lineare Regression geltenden Beziehung s2

2 Βγ·χ(ΐ)

mit s Y X

=

Β γ

·

χ

Γ

= 18460, Sy = 27.2, s^

YX1

Γ χ

ι

γ =

YΖ ^ XΤ1

=741.1

bestimmen:

By γ = * ρ· = 0.8386 Υ,λ ( 1 ) 27.2 · 741.1

Das Bestimmtheitsmaß der unter (a) durchgeführten multiplen Regression be2 rechnet sich mit s = 59.48 und Sy = 27.2 zu

B„ /„

Für

χ

.= 1 - Ι " - 2 - 1 ' / (n - 1)Sy

= 1 -

= 0.9375

.

9 · 27.2

die Teststatistik erhält man somit wegen SSR 2 = B y

(x

x

j · ( η - 1 )Sy = 0.9375 · 9 · 27.2 2 = 6242.4000

SSR' = B v v · (n - 1 )S 2 = 0.8386 · 9 · 27.2 2 = 5583.8684 1 Y,X(1) Y den Wert SSR 2 SSR 1 —2 s der mit dem 0.95-Quantil

=

6242.4000 - 5583.8684 ,, 59748 = 11.0715

,

,

435

Teil II: Klausuraufgaben und Lösungen

F

q,n-k-1;1-a " F1,7;0.95

5-591

verglichen weden muß. Da F = 11.0715 > 5.591 = F„

, , .

gilt, muß die Hypothese Hg zum 5% Niveau abgelehnt werden,

-»(c) (vgl. Aufgabe 12.3, Aufgabe

12.1.b)

Bezeichnet p*j die Wahrscheinlichkeit, mit der bei der i - ten Stichprobe, i=1,2,3 (=k), ein Haushalt der Einkommensklasse K^, j=1,2 (=£), zugeordnet wird [es gilt dann: P*i

+

P*2

= 1

i=1

> 2 , 3 ] , so interessiert, als erweiter-

te Homogenitätshypothese, hier die [bedingte] H

0

:p

ij=H=r)

fÜr3116 UU2

'3'

Gleichverteilungshypothese j=1 2

' '

die zum Niveau α = 0.25 gegen die Alternative H, : p*

fl

für mindestens ein Paar (i,j)

getestet werden soll. In Cab. CK 15.1 sind neben den Beobachtungsdaten die

η.^,

angeben , wieviele Haushalte aus der i - ten Stichprobe in der j - ten

Einkoimiensklasse liegen, auch die unter Hg erwarteten Anzahlen 1 II . . = — n, II . - yr m,, ij 1 . 2

( = ni

·^

, i=1,2,3, j = 1,2,

eingetragen, so daß sich der Wert der Teststatistik zu ο x

2

3 =

(n. 1 - m ..) Z

2

1J

I Σ 1=1 j«1

. (6-5) 2 5

m

1J

ij

(4-5) 2 5

(8-6)^ 6

(4-6) 2 6

(9-7) 2 7

(5-7) 2 7

= 2/5 + 4/3 + 8/7 = 302/105 = 2.876 ergibt. Da dieser nicht größer als der kritische Wert

x

k(£-1);1-α

=

*3;0.75

=

4

"108

ist, sind die Haushalte zum 2 5 % - N i v e a u nicht signifikant auf die beiden Einkommensklassen

verteilt.

unterschiedlich

436

Teil II: Klausuraufgaben und Lösungen

Jab. CK 15.1: (3χ 2) - Kontingenztafel; Haushaltsstichproben und Einkommensklassen

N^inkommensklasse K. J Haus- \ . 3 haltsStichprobe i

2

1

ν.

1

n

2

3

11

n12=4

= 6

m1t =5

m12 = 5

n21=8

n22 = 4

m21=6

m22 = 6

Π

n32 = 5

31

= 9

->(d) (vgl. Aufgabe

n1

= 10

n2

= 12

n

3. =

14

m32 = 7

m31 = 7

12.4)

Mit den Angaben zum Aufgabenteil n^

I

(c) ergibt sich die tab. CK 15.2, wobei

die Anzahl der Haushalte angibt, die in K^ und in G i liegen; entsprechend

bezeichne p ^

die zugehörige Wahrscheinlichkeit, i=1,2 (=k), j=1,2 (=1). Zum

Niveau 25% ist nun die [totale]

Gleichverteilungshypothese

(= k T r )

V - P i r l

f ü r a l l e

1=1

·2>

j=1·2

zu testen gegen die Alternative H^ : p^j f-g-

für mindestens ein Paar (i,j)

Für η = 3 6 Haushalte sind bei [totaler] Gleichverteilung m

ij = 9 = f

i ' r h )

'

i=1

'2
. und speziell

V2 · (2 • y - 1) Vl-(2-V-l)2

2;r

C 9 U 9 + C 7 u 7 + C s U 5 + C 3 U 3 + Ci u tn; 1

92160 η 4

~

mit u - u r c 9 = 79, c 7 = 720 η + 776, c 5 = 4800η 2 + 4 5 6 0 η + 1482, c 3 = 23040η 3 + 15360η2 + 4080η - 1920, C! =92160η 4 + 23040η 3 + 2880η 2 -3600 η - 9 4 5 ; für η g 10 kann man auch die Formel von Peizer und Pratt verwenden: -Vir e

— η mit

u = uv

und

5 cη

2 3

h

1 10n

(Anmerkung: Die Peizer-Pratt-Approximation liefert bereits für η = 3 und 0,5 < y < 0,99 eine passable Anpassung, wobei die absolute Abweichung zum wahren Wert höchstens 0,08 wird.)

445

Anhang

Tab. 4:

Quantile χ 2 y der ^-Verteilung

nry

0,995 0,990 0,975 0,950 0,900 0,750 0,500 0,250 0,100 0,050 0,025 0,010 0,005 1 2 3 4 5

7,879 10,60 12,84 14,86 16,75

6,635 9,210 11,34 13,28 15,09

5,024 7,378 9,348 11,14 12,83

3,841 5,991 7,815 9,488 11,07

2,706 4,605 6,251 7,779 9,236

1,323 2,773 4,108 5,385 6,626

0,455 1,386 2,366 3,357 4,351

0 , 1 0 2 - 2 1 , 5 8 " 3 3 , 9 3 - * 9 , 8 2 - 4 1 , 5 7 5 3,93 0,575 0,211 0,103 " 2 5,06 " 2 2,01 2 1,00 1,213 0,584 0,352 0,216 0,115 2 7,17 1,923 1,064 0,711 0,484 0,297 0,207 2,675 1,610 1,145 0,831 0,554 0,412

6 7 8 9 10

18,55 20,28 21,96 23,59 25,19

16,81 18,48 20,09 21,67 23,21

14,45 16,01 17,53 19,02 20,48

12,59 14,07 15,51 16,92 18,31

10,64 12,02 13,36 14,68 15,99

7,841 9,037 10,22 11,39 12,55

5,348 6,346 7,344 8,343 9,342

3,455 4,255 5,071 5,899 6,737

2,204 2,833 3,490 4,168 4,865

1,635 2,167 2,733 3,325 3,940

1,237 1,690 2,180 2,700 3,247

0,872 1,239 1,647 2,088 2,558

0,676 0,989 1,344 I,735 2,156

11 12 13 14 15

26,76 28,30 29,82 31,32 32,80

24,73 26,22 27,69 29,14 30,58

21,92 23,34 24,74 26,12 27,49

19,68 21,03 22,36 23,68 25,00

17,28 18,55 19,81 21,06 22,31

13,70 14,85 15,98 17,12 18,25

10,34 11,34 12,34 13,34 14,34

7,584 8,438 9,299 10,17 11,04

5,578 6,304 7,042 7,790 8,547

4,575 5,226 5,892 6,571 7,261

3,816 4,404 5,009 5,629 6,262

3,053 3,571 4,107 4,660 5,229

2,603 3.074 3,565 4.075 4,601

16 17 18 19 20

34,27 35,72 37,16 38,58 40,00

32,00 33,41 34,81 36,19 37,57

28,85 30,19 31,53 32,85 34,17

26,30 27,59 28,87 30,14 31,41

23,54 24,77 25,99 27,20 28,41

19,37 20,49 21,60 22,72 23,83

15,34 16,34 17,34 18,34 19,34

11,91 12,79 13,68 14,56 15,45

9,312 10,09 10,86 11,65 12,44

7,962 8,672 9,390 10,12 10,85

6,908 7,564 8,231 8,907 9,591

5,812 6,408 7,015 7,633 8,260

5,142 5,697 6,265 6,844 7,434

21 22 23 24 25

41,40 42,80 44,18 45,56 46,93

38,93 40,29 41,64 42,98 44,31

35,48 36,78 38,08 39,36 40,65

32,67 33,92 35,17 36,42 37,65

29,62 30,81 32,01 33,20 34,38

24,93 26,04 27,14 28,24 29,34

20,34 21,34 22,34 23,34 24,34

16,34 17,24 18,14 19,04 19,94

13,24 14,04 14,85 15,66 16,47

11,59 12,34 13,09 13,85 14,61

10,28 10,98 11,69 12,40 13,12

8,897 9,542 10,20 10,86 11,52

8,034 8,643 9,260 9,886 10.52

26 27 28 29 30

48,29 49,64 50,99 52,34 53,67

45,64 46,96 48,28 49,59 50,89

41,92 43,19 44,46 45,72 46,98

38,89 40,11 41,34 42,56 43,77

35,56 36,74 37,92 39,09 40,26

30,43 31,53 32,62 33,71 34,80

25,34 26,34 27,34 28,34 29,34

20,84 21,75 22,66 23,57 24,48

17,29 18,11 19,94 19,77 20,60

15,38 16,15 16,93 17,71 18,49

13,84 14,57 15,31 16,05 16,79

12,20 12,88 13,56 14,26 14,95

II,16 12,46 13,12 13,79

40 50 60 70 80

66,77 79,49 91,95 104,2 116,3

63,69 76,15 88,38 100,4 112,3

59,34 71,42 83,30 95,02 106,6

55,76 67,50 79,08 90,53 101,9

51,81 63,17 74,40 85,53 96,58

45,62 56,33 66,98 77,58 88,13

39,34 49,33 59,33 69,33 79,33

33,66 42,94 52,29 61,70 71,14

29,05 37,69 46,46 55,33 64,28

26,51 34,76 43,19 51,74 60,39

24,43 32,36 40,48 48,76 57,15

22,16 29,71 37,48 45,44 53,54

20,71 27,99 35.53 43,28 51,17

90 100 150 200 250

128,3 140,2 198,4 255,3 311,3

124,1 135,8 193,2 249,4 304,9

118,1 129,6 185,8 241,1 295,7

113,1 124,3 179,6 234,0 287,9

107,6 118,5 172,6 226,0 279,1

98,65 109,1 161,3 213,1 264,7

89,33 99,33 149,3 199,3 249,3

80,62 90,13 138,0 186,2 234,6

73,29 82,36 128,3 174,8 221,8

69,13 77,93 122,7 168,3 214,4

65,65 74,22 118,0 162,7 208,1

61,75 70,06 112,7 156,4 200,9

59,20 67,33 109.1 152.2 196,2

300 400 600 800 1000

366,8 476,6 693,0 906,8 1119,

359,9 468,7 683,5 896,0 1107,

349,9 457,3 669,8 880,3 1090,

341,4 447,6 658,1 866,9 1075,

331,8 436,6 644,8 851,7 1058,

316,1 418,7 623,0 826,6 1030,

299,3 399,3 599,3 799,3 999,3

283,1 380,6 576,3 772,7 969,5

269,1 364,2 556,1 749,2 943,1

260,9 354,6 544,2 735,4 927,6

253,9 346,5 534,0 723,5 914,3

246,0 337,2 522,4 709,9 898,9

240,7 330,9 514.5 700,7

11,81

888.6

446

Anhang

zu Tab. 4: Ablesebeispiel: *i ; 0 , 0 , = " 3 3,93 = 3,93 · ΙΟ"3 = 0,00393 Approximation nach Wilson und Hilferty für 0 < γ < 1:

Anhang

Tab. 5:

Quantile F„

, der F-Verteilung

447

n n

v ?Y

10

11

1

0,990 0,975 0,950 0,900

4052, 647,8 161,4 39,86

4999, 799,5 199,5 49,50

5403, 864,2 215,7 53,59

5625, 899,6 224,6 55,83

5764, 921,8 230,2 57,24

5859, 937,1 234,0 58.20

5928, 948,2 236,8 58,91

5981, 956,7 238,9 59,44

6022, 963,3 240,5 59,86

6056, 968,6 241,9 60,20

6083, 973,0 243,0 60,47

2

0,990 0,975 0,950 0,900

98.50 38.51 18,51 8,526

99,00 39,00 19,00 9,000

99,17 39,17 19,16 9,162

99,25 39,25 19,25 9,243

99,30 39,30 19,30 9,293

99,33 39,33 19,33 9,326

99,36 39,36 19,35 9,349

99,37 39,37 19,37 9,367

99,39 39,39 19,38 9,381

99,40 39,40 19,40 9,392

99,41 39,41 19,40 9,401

3

0,990 0,975 0,950 0,900

34.12 17,44 10.13 5,538

30,82 16,04 9,552 5.462

29,46 15,44 9,277 5,391

28,71 15,10 9,117 5,343

28,24 14,88 9,013 5,309

27,91 14,73 8,941 5,285

27,67 14,62 8,887 5,266

27,49 14,54 8,845 5,252

27,35 27,23 27,13 14,47 14,42 14,37 8,812 8,786 8,763 5,240 5,230 5,222

4

0,990 0,975 0,950 0,900

21,20 12,22 7,709 4,545

18,00 10,65 6,944 4,325

16,69 9,979 6,591 4,191

15,98 9,605 6,388 4,107

15,52 9,364 6,256 4,051

15.21 9,197 6,163 4,010

14,98 9,074 6,094 3,979

14,80 8,980 6,041 3,955

14,66 8,905 5,999 3,936

5

0,990 0,975 0,950 0,900

16,26

13,27 12,06 11,39 10,01 8,434 7,764 7,388 6,608 5,786 5,409 5,192 4,060 3,780 3,619 3,520

10,97 7,146 5,050 3,453

10,67 6,978 4,950 3,405

10,46 6,853 4,876 3,368

10,29 6,757 4,818 3,339

6

0,990 0,975 0,950 0,900

13,75 8,813 5,987 3,776

10,92 7,260 5,143 3.463

9,780 6,599 4,757 3,289

9,148 6,227 4,534 3,181

8,746 5,988 4,387 3,108

8,466 5,820 4,284 3,055

8,260 5,695 4,207 3,015

8,102 5,600 4,147 2,983

7,976 5,523 4,099 2,958

7,874 5,461 4,060 2,937

7,789 5,409 4,027 2,919

7

0,990 0,975 0,950 0,900

12.25 8,073 5,591 3,589

9,547 6,542 4,737 3,257

8,451 5,890 4,347 3,074

7,847 5,523 4,120 2,961

7,460 5,285 3,972 2,883

7,191 5,119 3,866 2,827

6,993 4,995 3,787 2,785

6,840 4,899 3,726 2,752

6,719 4,823 3,677 2,725

6.620 4,761 3,637 2,703

6,538 4,709 3,603 2,684

8

0,990 0,975 0,950 0,900

11.26 7,571 5,318 3,458

8,649 6,059 4,459 3,113

7,591 5,416 4,066 2,924

7,006 5,053 3,838 2,806

6,632 4,817 3,687 2,726

6,371 4,652 3,581 2,668

6,178 4,529 3,500 2,624

6,029 4,433 3,438 2,589

5,911 4,357 3,388 2,561

5,814 4,295 3,347 2,538

5,734 4,243 3,313 2,518

9

0,990 0,975 0,950 0,900

10,56 7,209 5,117 3,360

8,022 6,992 6,422 2,057 5,802 5,613 5,467 5,351 5,257 5,177

0,990 0,975 0,950 0,900

10,04 6,937 4,965 3,285

7,559 5,456 4,103 2,924

10

14,55 8,844 5,964 3,920

14,45 8,793 5,936 3,907

10,16 10,05 9,962 6,681 6.619 6,568

4,772 4,735 4,704 3,316 3,297 3,282

5,715 5,078 4,718 4,484 4,320 4,197 4,102 4,026 3,964 3,912 4,256 3,863 3,633 3,482 3,374 3,293 3,230 3,179 3,137 3,102 3,006 2,813 2,693 2,611 2,551 2,505 2,469 2,440 2>16 2,396 6,552 4,826 3,708 2,728

5,994 4,468 3,478 2,605

5,636 4,236 3,326 2,522

5,386 4,072 3,217 2,461

5,200 3,950 3,135 2,414

5,057 3,855 3,072 2,377

4,942 3,779 3,020 2,347

4,849 3,717 2,978 2,323

4,771 3,665 2,943 2,302

448

Tab. 5 :

n

Anhang

Fortsetzung

12

13

14

15

20

24

30

40

0,990 0,975 0,950 0,900

6106, 976,7 243,9 60,71

6126, 979,8 244,7 60,90

6143, 982,5 245,4 61,07

6157, 984,9 245,9 61,22

6209, 993,1 248,0 61,74

6235, 997,2 249,1 62,00

6261, 1001, 250,1 62,26

6287, 6313, 6339, 1006, 1010, 1014, 251,1 252,2 253,3 62,53 62,79 63,06

0,990 0,975 0,950 0,900

99,42 39,41 19,41 9,408

99,42 39,42 19,42 9,415

99,43 39,43 19,42 9,420

99,43 39,43 19,43 9,425

99,45 39,45 19,45 9,441

99,46 39,46 19,45 9,450

99,47 39,46 19,46 9,458

99,47 39,47 19,47 9,466

99,48 39,48 19,48 9,475

99,49 99,50 39,49 39,50 19,49 19,50 9,483 9,491

0,990 0,975 0,950 0,900

27,05 14,34 8,745 5,216

26,98 14.30 8,729 5,210

26,92 14,28 8,715 5,205

26,87 14,25 8,703 5,200

26,69 14,17 8,660 5,184

26,60 14,12 8,639 5,176

26,50 14,08 8,617 5,168

26,41 14,04 8,594 5,160

26,32 13,99 8,572 5,151

26,22 26,13 13,95 13,90 8,549 8,526 5,143 5,134

0,990 0,975 0,950 0,900

14,37 8,751 5.912 3,896

14.31 8,715 5.891 3,885

14,25 8,684 5,873 3,877

14,20 8,657 5,858 3,869

14,02 8,560 5,803 3,844

13,93 8,511 5,774 3,831

13,84 8,461 5,746 3,817

13,75 8,411 5,717 3,804

13,65 8,360 5,688 3,790

13,56 8,309 5,658 3,775

13,46 8,257 5,628 3,761

0,990 0,975 0,950 0,900

9,888 6,525 4,678 3,268

9,824 6.487 4,655 3,257

9,770 6,455 4,636 3,247

9,722 6,428 4,619 3,238

9,553 6,329 4,558 3,207

9,466 6.278 4,527 3,191

9,379 6,227 4,496 3,174

9,291 6,175 4,464 3,157

9,202 6,123 4,431 3,140

9,112 6,069 4,398 3,123

9,020 6,015 4,365 3,105

0,990 0,975 0,950 0,900

7,718 5,366 4,000 2,905

7,657 5,329 3,976 2.892

7,605 7,559 7,396 7,313 5,297 5,269 5,168 5,117 3,956 3,938 3,874 3,841 2,881 2,871 2,836 2,818

7,229 5,065 3,808 2,800

7,143 5,012 3,774 2,781

7,057 4,959 3,740 2,762

6,969 4,904 3,705 2,742

6,880 4,849 3.669 2,722

0,990 0,975 0,950 0,900

6,469 4.666 3,575 2,668

6,410 4,628 3,550 2,654

6,359 4,596 3,529 2,643

6,314 4,568 3,511 2,632

6,155 4,467 3,445 2,595

6,074 4,415 3,410 2,575

5,992 4,362 3,376 2,555

5,908 4,309 3,340 2,535

5,824 4,254 3,304 2,514

5,737 4,199 3,267 2,493

5,650 4,142 3,230 2,471

0,990 0,975 0,950 0,900

5.667 4,200 3,284 2,502

5,609 4,162 3,259 2.488

5,558 4,129 3,237 2,475

5,515 4,101 3,218 2,464

5,359 3,999 3,150 2,425

5.279 3,947 3,115 2,404

5,198 3,894 3,079 2,383

5,116 3,840 3,043 2,361

5,032 3,784 3,005 2,339

4,946 3,728 2,967 2,316

4,859 3.670 2,928 2,293

0,990 0,975 0,950 0,900

5,111 3,868 3,073 2,379

5,054 3,830 3,047 2,364

5,005 3,798 3,025 2,351

4,962 3,769 3,006 2,340

4,808 3,667 2,936 2,298

4,729 3,614 2,900 2,277

4,649 3,560 2,864 2,255

4,567 3,505 2,826 2,232

4,483 3,449 2,787 2,208

4,398 3,392 2,748 2,184

4,311 3,333 2,707 2,159

0,990 0,975 0,950 0,900

4,706 3,621 2.913 2,284

4,649 3,583 2,887 2,269

4,600 3,550 2,864 2,255

4,558 3,522 2,845 2,244

4,405 3,419 2,774 2,201

4,327 3,365 2,737 2,178

4,247 3,311 2,700 2,155

4,165 3,255 2,661 2,132

4,082 3,198 2,621 2,107

3,996 3,140 2,580 2,082

3,909 3,080 2,538 2,055

2

10

60

120

oo 6366, 1018, 254,3 63,33

Anhang

Tab. 5:

449

Fortsetzung 10

11

11

0,990 0,975 0,950 0,900

9,646 6,724 4,844 3,225

7,206 5,256 3,982 2,860

6,217 4,630 3,587 2,660

5.668 4,275 3,357 2,536

5,316 4,044 3,204 2,451

5,069 3,881 3,095 2,389

4,886 3,759 3,012 2,342

4,744 3,664 2,948 2,304

4,632 3,588 2,896 2,273

12

0,990 0,975 0,950 0,900

9,330 6,554 4,747 3,177

6,927 5,096 3,885 2,807

5.953 4,474 3,490 2,605

5,412 4,121 3,259 2,480

5,064 3,891 3,106 2,394

4,821 3,728 2,996 2,331

4,640 3,607 2,913 2,283

4,499 3,512 2,849 2,245

4,388 4,296 4,219 3,436 3,374 3,321 2,796 2,753 2,717 2,214 2,188 2,166

13

0,990 0,975 0,950 0,900

9,074 6,414 4,667 3,136

6,701 4,965 3,806 2,763

5,739 4,347 3,411 2,560

5,205 3,996 3,179 2,434

4,862 3,767 3,025 2,347

4,620 3,604 2,915 2,283

4,441 3,483 2,832 2,234

4,302 3,388 2,767 2,195

4,191 3,312 2,714 2,164

14

0,990 0,975 0,950 0,900

8,862 6,298 4,600 3,102

6,515 4,857 3,739 2,726

5,564 4,242 3,344 2,522

5,035 3.892 3,112 2,395

4,695 3,663 2,958 2,307

4,456 3,501 2,848 2,243

4,278 3,380 2.764 2,193

4,140 3,285 2,699 2,154

4,030 3,939 3,863 3,209 3,147 3,094 2,646 2,602 2,565 2,122 2,095 2,073

15

0,990 0,975 0,950 0,900

8,683 6,199 4,543 3,073

6,359 4,765 3,682 2,695

5,417 4,153 3,287 2,490

4.893 3,804 3,056 2,361

4,556 3,576 2,901 2,273

4,318 4,142 4.004 3.895 3,415 3,293 3,199 3,123 2,790 2,707 2,641 2,588 2,208 2,158 2,119 2,086

16

0,990 0,975 0,950 0,900

8,531 6,115 4,494 3,048

6,226 5,292 4,773 4.437 4,202 4,026 3,890 3,780 3,691 3,616

17

0,990 0,975 0,950 0,900

8,400 6,042 4,451 3,026

6,112 4,619 3,592 2,645

5,185 4,011 3,197 2,437

4.669 3,665 2,965 2,308

4,336 4,101 3,927 3.438 3,277 3,156 2,810 2,699 2,614 2,218 2,152 2,102

3,791 3,061 2,548 2,061

3,682 2,985 2,494 2,028

18

0,990 0,975 0,950 0,900

8,285 5,978 4,414 3,007

6,013 4,560 3,555 2,624

5,092 3.954 3,160 2,416

4,579 3,608 2,928 2,286

4,248 3,382 2,773 2,196

4,015 3,221 2,661 2,130

3,841 3,100 2,577 2,079

3,705 3.005 2,510 2,038

3,597 2,929 2.456 2,005

19

0,990 0,975 0,950 0,900

8,185 5,922 4,381 2,990

5,926 4,508 3,522 2,606

5,010 3,903 3,127 2,397

4,500 3,559 2,895 2,266

4,171 3,333 2,740 2,176

3,939 3,172 2,628 2,109

3.765 3,051 2,544 2,058

3,631 2,956 2,477 2,017

3,523 2,880 2,423 1,984

3,434 2,817 2,378 1,956

3,359 2,764 2,340 1,932

20

0,990 0,975 0,950 0,900

8,096 5,871 4,351 2,975

5,849 4,461 3,493 2,589

4,938 3,859 3,098 2,380

4,431 3,515 2,866 2,249

4,103 3,289 2,711 2,158

3,871 3,128 2,599 2,091

3,699 3,007 2,514 2,040

3,564 2,913 2,447 1,999

3.457 2,837 2,393 1,965

3,368 2,774 2,348 1,937

3,293 2,720 2,310 1,913

4,539 4,462 3,526 3,473 2,854 2,818 2,248 2,227

4,100 3,250 2,671 2,138

3,805 3,060 2,544 2,059

4,024 3,197 2,634 2,115

3,730 3,007 2,506 2,036

4,687 4,077 3,729 3,502 3,341 3,219 3,125 3,049 2,986 2,933 3,634 3,239 3,007 2,852 2,741 2,657 2,591 2,538 2,494 2,456 2,668 2,462 2,333 2,244 2,178 2,128 2,088 2,055 2,028 2,005 3,593 2,922 2,450 2,001

3,518 2,869 2,412 1,977

3,508 3,433 2,866 2,813

2,412 2,374 1,977 1,953

450

Tab. 5 :

Anhang

Fortsetzung

13

14

15

20

24

30

40

60

120

oo

11

0,990 0,975 0,950 0,900

4,397 3,430 2,788 2,209

4,341 3,391 2,761 2,193

4,293 3,358 2,738 2,179

4,251 3,330 2,719 2,167

4,099 3,226 2,646 2.123

4,021 3,173 2,609 2,100

3,941 3,118 2,570 2,076

3,860 3,061 2,531 2,052

3,776 3,004 2,490 2,026

3,690 2,944 2,448 2,000

3,602 2,883 2,404 1,972

12

0,990 0,975 0,950 0,900

4,155 3.277 2,687 2,147

4,099 3,239 2,660 2,131

4,051 3,206 2,637 2,117

4,010 3,177 2,617 2,105

3,858 3,073 2,544 2,060

3,780 3,019 2,505 2,036

3,701 2,963 2,466 2,011

3,619 2,906 2,426 1,986

3,535 2,848 2,384 1,960

3,449 2,787 2,341 1,932

3,361 2,725 2,296 1,904

13

0,990 0,975 0,950 0,900

3,960 3,153 2,604 2,097

3,905 3,115 2,577 2,080

3,857 3,081 2,553 2,066

3,815 3,053 2,533 2,053

3,665 2,948 2,459 2,007

3,587 2,893 2,420 1,983

3,507 2,837 2,380 1,958

3,425 2.780 2,339 1,931

3,341 2,720 2,297 1,904

3.255 2.659 2,252 1,876

3,165 2,595 2,206 1,846

14

0,990 0,975 0,950 0,900

3,800 3,050 2,534 2,054

3,745 3,011 2,507 2,037

3,697 2,978 2,483 2,022

3,656 2,949 2,463 2,010

3,505 2,844 2,388 1,962

3,427 2,789 2,349 1,938

3.348 2,732 2,308 1,912

3,266 2,674 2,266 1,885

3,181 2,614 2,223 1,857

3,094 2,552 2,178 1,828

3,004 2,487 2,131 1,797

15

0,990 0,975 0,950 0,900

3,666 2,963 2,475 2,017

3,611 2,924 2,448 2,000

3,563 2,891 2,424 1,985

3,522 2,862 2,403 1,972

3,372 2,756 2,328 1,924

3,294 2,701 2,288 1,899

3,214 2,644 2,247 1,873

3,132 2,585 2,204 1,845

3,047 2,524 2,160 1,817

2,959 2,461 2,114 1,787

2,868 2,395 2,066 1,755

16

0,990 0,975 0,950 0,900

3,553 2,889 2,425 1,985

3,497 2,850 2,397 1,968

3,450 2,817 2,373 1,953

3,409 2,788 2,352 1,940

3,259 2,681 2,276 1,891

3,181 2,625 2,235 1,866

3,101 2,568 2,194 1,839

3,018 2,509 2,151 1,811

2,933 2,447 2,106 1,782

2,845 2,383 2,059 1,751

2,753 2,316 2,010 1,718

17

0,990 0,975 0,950 0,900

3,455 2,825 2,381 1,958

3,400 2,786 2,353 1,940

3,353 2,752 2,329 1,925

3,312 2,723 2,308 1,912

3,162 2,616 2,230 1,862

3,084 2,560 2,190 1,836

3,003 2,502 2,148 1,809

2,920 2,442 2,104 1.781

2,835 2,380 2,058 1,751

2,746 2,315 2,011 1,719

2,653 2,247 1,960 1,686

18

0,990 0,975 0,950 0,900

3,371 2,769 2,342 1,933

3,316 2,730 2,314 1,915

3,268 2,696 2,290 1,900

3,227 2,667 2,269 1,887

3,077 2,559 2,191 1,837

2,999 2,503 2,150 1,810

2,919 2,444 2,107 1,783

2,835 2,384 2,063 1,754

2,749 2,321 2,017 1,723

2.660 2.256 1,968 1,691

2,566 2,187 1,917 1,657

19

0,990 0,975 0,950 0,900

3,297 2,720 2,308 1,912

3,241 2,680 2,280 1,894

3,194 2,646 2,255 1,878

3,153 2,617 2,234 1,865

3,003 2,509 2,155 1,814

2,925 2,452 2,114 1,787

2,844 2,394 2,071 1,759

2,761 2,333 2,026 1,730

2,674 2,270 1,980 1,699

2,584 2,203 1,930 1,666

2,489 2,133 1,878 1,631

20

0,990 0,975 0,950 0,900

3,231 2,676 2.278 1,892

3,176 2,636 2,249 1,874

3,129 2,602 2,225 1,859

3,088 2,573 2,203 1,845

2,938 2,464 2.124 1,794

2,859 2,408 2,082 1,767

2,778 2.349 2,039 1,738

2,695 2,287 1,994 1,708

2,608 2,223 1,946 1,677

2,517 2,156 1,896 1,643

2,421 2,085 1,843 1,607

Anhang Tab. 5:

451

Fortsetzung 10

11

22

0,990 0,975 0,950 0,900

7,945 5,786 4,301 2,949

5,719 4,383 3,443 2,561

4,817 3,783 3,049 2,351

4,313 3,440 2,817 2,219

3,988 3,758 3,587 3,215 3,055 2,934 2,661 2,549 2,464 2,128 2,060 2,008

3,453 2,839 2,397 1,967

3,346 2,763 2,342 1,933

3,258 2,700 2,297 1,904

3,183 2,646 2,258 1,880

24

0,990 0,975 0,950 0,900

7,823 .5,717 4,260 2,927

5,614 4,319 3,403 2,538

4.718 3,721 3,009 2,327

4,218 3,379 2,776 2,195

3.895 3,667 3,496 3,155 2.995 2,874 2,621 2,508 2,423 2,103 2,035 1,983

3,363 2,779 2.355 1,941

3,256 2,703 2,300 1,906

3,168 2,640 2,255 1,877

3,094 2,586 2,216 1,853

26

0,990 0,975 0,950 0,900

7,721 5,659 4,225 2,909

5,526 4,265 3.369 2,519

4,637 3,670 2,975 2,307

4,140 3,329 2,743 2,174

3,818 3,591 3,421 3,288 3,105 2,945 2,824 2,729 2,587 2,474 2,388 2,321 2,082 2,014 1,961 1,919

3,182 2,653 2,565 1,884

3,094 2,590 2,220 1,855

3,020 2,536 2,181 1,830

28

0,990 0,975 0,950 0,900

7,636 5,610 4,196 2,894

5,453 4,221 3,340 2,503

4,568 3,626 2,947 2,291

4,074 3,286 2,714 2,157

3,754 3.063 2,558 2.064

3,528 2,903 2,445 1.996

3.358 2,782 2.359 1,943

3,226 2,687 2,291 1,900

30

0,990 0,975 0,950 0,900

7,562 5,390 4,510 4,018 5,568 4,182 3,589 3,250 4,171 3,316 2,922 2,690 2,881 2,489 2,276 2,142

3,699 3,026 2,534 2,049

3,473 2,867 2,421 1,980

3,304 2,746 2,334 1,927

3,173 2,651 2,266 1,884

2,979 2,511 2,165 1,819

2,905 2,457 2,125 1,794

40

0,990 0,975 0,950 0,900

7,314 5,424 4,085 2,835

5,179 4,051 3,232 2,440

4,313 3,828 3,514 3,291 3,463 3,126 2,904 2,744 2,839 2,606 2,449 2,336 2,226 2,091 1,997 1,927

3,124 2,624 2,249 1,873

2,993 2,888 2,801 2,529 2,452 2,388 2,180 2,124 2,077 1,829 1,793 1,763

2,727 2,334 2,037 1,737

60

0,990 0,975 0,950 0,900

7,077 5,286 4,001 2,791

4,977 3,925 3,150 2,393

4,126 3,343 2,758 2,177

3,649 3,008 2,525 2,041

3,339 2,786 2,368 1,946

3,119 2,627 2,254 1,875

2,953 2,507 2,167 1,819

2,823 2,412 2,097 1,775

2,718 2,334 2,040 1,738

2,632 2,270 1,993 1,707

2,558 2,215 1,952 .1,680

80

0,990 0,975 0,950 0,900

6,964 5,219 3,961 2,770

4,882 3,865 3,111 2.370

4,036 3,285 2.719 2,154

3,564 2,951 2,486 2,017

3,256 2,730 2,329 1,921

3,037 2,571 2,214 1,849

2,872 2,451 2,127 1,793

2,743 2.356 2,057 1,748

2,639 2,278 1,999 1,711

2,552 2,214 1,952 1,680

2,478 2,158 1,910 1,652

120

0,990 0,975 0,950 0,900

6,851 5,152 3,920 2,748

4,787 3,805 3,072 2,347

3,949 3,227 2,680 2,130

3,480 2,894 2,447 1,992

3,174 2,674 2,290 1.896

2,956 2,515 2,175 1,824

2,792 2,395 2,087 1,767

2,663 2,559 2,472 2,299 2,222 2,157 2,016 1,959 1,910 1,722 1,684 1,652

2,398 2,101 1,869 1,625

0,990 0,975 0,950 0,900

6,635 5,024 3,841 2,706

4,605 3,689 2,996 2,303

3,782 3,116 2,605 2,084

3,319 2,786 2,372 1,945

3,017 2,567 2,214 1,847

2,802 2,639 2,511 2,407 2,321 2,247 2,408 2,288 2,192 2,114 2,048 1,992 2,099 2,010 1,938 1,880 1,831 1,788

3,120 3,032 2,958

2,611 2,547 2,493

2,236 2,190 2,151 1,865 1,836 1,811 3,067 2,575 2,211 1,849

1,774 1,717 1,670 1,632 1,599 1,570

452

Anhang

Tab. 5:

n2

Fortsetzung

\

n,

12

13

14

15

20

24

30

40

60

120

CO

Ί

22

0,990 0,975 0,950 0,900

3,121 2,602 2,226 1,859

3,066 2,562 2,197 1,841

3,019 2,528 2,172 1,825

2,978 2,498 2,151 1,811

2,827 2,389 2,071 1,759

2,749 2,332 2,028 1,731

2,667 2,272 1,984 1,702

2,583 2,210 1,938 1,671

2,495 2,145 1,889 1,639

2,403 2,076 1,838 1,604

2,305 2,003 1,783 1,567

24

0,990 0,975 0,950 0,900

3,032 2,541 2,183 1,832

2,977 2,501 2,154 1,813

2,930 2,467 2,129 1,797

2,889 2,437 2,108 1,783

2,738 2,327 2,027 1,730

2,659 2,269 1,984 1,702

2,577 2,209 1,939 1,672

2,492 2,146 1,892 1,641

2,403 2,080 1,842 1,607

2,310 2,010 1,790 1,571

2,211 1,935 1,733 1,533

26

0,990 0,975 0,950 0,900

2,958 2,491 2,148 1,809

2,903 2,451 2,119 1,790

2,856 2,417 2,093 1,774

2,815 2,387 2,072 1,760

2,664 2,276 1,990 1,706

2,585 2,217 1,946 1,677

2,503 2,157 1,901 1,647

2,417 2,093 1,853 1,615

2,327 2,026 1,803 1,581

2,233 1,954 1,749 1,544

2,131 1,878 1,691 1,504

28

0,990 0,975 0,950 0,900

2,896 2,448 2,118 1,790

2,841 2,408 2,088 1,770

2,794 2,374 2,063 1,754

2,753 2,344 2,041 1,740

2,602 2,232 1,959 1,685

2,522 2,174 1,915 1,656

2,440 2,112 1,869 1,625

2,353 2,048 1,820 1,592

2,263 1,980 1,769 1,558

2,167 1,907 1,714 1,520

2,064 1,829 1,654 1,478

30

0,990 0,975 0,950 0,900

2,843 2,412 2,092 1,773

2,788 2,372 2,062 1,753

2,741 2,337 2,037 1,737

2,700 2,307 2,015 1,722

2,549 2,195 1,932 1,667

2,469 2,136 1,887 1,638

2,386 2,074 1,841 1,606

2,299 2,009 1,792 1,573

2,208 1,940 1,740 1,538

2,111 1,866 1,684 1,499

2,006 1,787 1,622 1,456

40

0,990 0,975 0,950 0,900

2,665 2,288 2,003 1,715

2,610 2,247 1,973 1,695

2,563 2,212 1,947 1,677

2,522 2,182 1,924 1,662

2,369 2,068 1,839 1,605

2,288 2,007 1,793 1,574

2,203 1,943 1,744 1,541

2,114 1,875 1,693 1,506

2,019 1,803 1,637 1,467

1,917 1,724 1,577 1,425

1,805 1,637 1,509 1,377

60

0,990 0,975 0,950 0,900

2,496 2,169 1,917 1,657

2,441 2,128 1,886 1,637

2,393 2,092 1,860 1,619

2,352 2,061 1,836 1,603

2,198 1,944 1,748 1,543

2,115 1,882 1,700 1,511

2,028 1,815 1,649 1,476

1,936 1,744 1,594 1,437

1,836 1,667 1,534 1,395

1,726 1,581 1,467 1,348

1,601 1,482 1,389 1,291

80

0,990 0,975 0,950 0,900

2,416 2,112 1,876 1,629

2,361 2,070 1,844 1,608

2,313 2,034 1,817 1,590

2,272 2,003 1,793 1,574

2,116 1,885 1,703 1,513

2,033 1,821 1,654 1,479

1,944 1,753 1,602 1,443

1,849 1,679 1,545 1,403

1,746 1,598 1,482 1,358

1,630 1,507 1,410 1,306

1,491 1,396 1,322 1,242

120

0,990 0,975 0,950 0,900

2,336 2,055 1,834 1,601

2,281 2,013 1,802 1,580

2,233 1,976 1,774 1,561

2,192 1,945 1,750 1,545

2,035 1,825 1,659 1,482

1,950 1,760 1,608 1,447

1,860 1,690 1,554 1,409

1,763 1,614 1,495 1,368

1,656 1,530 1,429 1,320

1,533 1,433 1,352 1,265

1,381 1,310 1,254 1,193

oo

0,990 0,975 0,950 0,900

2,185 1,945 1,752 1,546

2,129 1,902 1,719 1,523

2,080 1,865 1,691 1,504

2,039 1,833 1,666 1,487

1,878 1,708 1,571 1,421

1,791 1,640 1,517 1,383

1,696 1,566 1,459 1,342

1,592 1,484 1,394 1,295

1,473 1,388 1,318 1,240

1,325 1,268 1,221 1,169

1,000 1,000 1,000 1,000

Anhang

453

zu Tab. 5: Ablesebeispiel: F 7 20.0,99 = 3,699 Erweiterung der Tafel: F n j



2

. =

1 F n2" n 1 -

Fl.112;·,' — Cnj;(l+y)/2)2. Fl,*; r ~~ (U(l+v)/2)2 1 F y2 F =1 n i Interpolation nach Laubscher: Gesucht ist F n i i „ 2 . ; . Gibt es dann natürliche Zahlen n 3 g n , < n 5 sowie 04 S n 2 < n 6 derart, daß die Quantile F n 3 „ 4 . ., F„3,„6.... F„ „ 4 . u n d F„ s .„ 6 :, vertafelt sind, so gilt: F„,.„ 2 ; ν = (1 - c,) · (1 - c 2 ) • F n j „4! v + (1 - c,) · c 2 · F„3. „6; + c, · (1 - c 2 ) · F n5 . „4!>. + c, · c 2 · F n j „6... fur

c, =

n 5 ( n t — n3) n

i (ns ~ n i )

und

c2 =

n6(n2-n4) . n2(n6-n4)

Läßt sich n 3 = n! wählen, so wird offensichtlich c, = 0, wie für n 4 = n 2 auch c 2 = 0 ist. In diesen Fällen vereinfacht sich die Interpolationsformel entsprechend. Approximation für 0,5 < γ < 1: F n i i n j ! ) . =:eu a ~ b mit u = u„, a = v^ d + c ("/ - 3 c = —-

d2, und

b= 2•(— \n,-l d =

n

2

— )·( c+ - - -lj V 6 3

1 1 (Π[ — 1 n 2 — 1

454

Anhang

2 GRIECHISCHES ALPHABET

A

α

Alpha

Β

β • β

Beta

Γ

Υ

Gamma

Δ

δ

Delta

Ε

ε

Epsilon

Ζ

ζ

Zeta

Η

η

Eta

0

θ

Theta

I

ι

Jota

Κ

κ , Χ

Kappa

Λ

λ

Lambda

Μ

y

My

Ν

ν

Ny

Ξ

ξ

Xi

0

0

Omi kron

Π

π

Pi

Ρ

Ρ

Rho

Σ

σ

Sigma

Τ

τ

Tau

V

υ

Ypsilon

φ ,φ

Φ . Ψ

Phi

χ

Χ

Chi

ψ

Ψ

Psi

Ω

ω

Omega

Anhang

455

3 SYMBOLVERZEICHNIS

Symbol

Bedeutung

+

'plus'; Addition 'minus1; Subtraktion 'mal '; Multiplikation 'a dividiert durch b 1 ; Division 'gleich'

^ , a/b φ

'ungleich'

~

'ungefähr gleich'

>
< £ j.

'größer oder gleich' 'kleiner oder gleich ' 'nicht größer oder gleich' 'nicht kleiner oder gleich'

e

'Element aus'

$ 0 υ η

'nicht Element aus ' 'leere Menge' 'vereinigt mit' 'geschnitten mit'

°° lnx e x , exp(x) n!

'unendlich' Natürlicher Logarithmus (d.h. zur Basis e = 2.71828...) von x: x = e y , wenn y = lnx 'e hoch x'; Exponentialfunktion: e x = (2.71828.. .)* 'n Fakultät': η! = 1·2·3·...·η und 0! = 1

(n)k

'η unten k': (n)k = η·(η-1 )·(η-2)·.. ..(n-k+1) = -j^^yy

^

' η über k'; Binomialkoeffizient:

lim a

("n-k)!

Limes; Grenzwert

n nT^

|x|

a

'an k o n v e r 9 i e r t gegen a, wenn η nach unendlich läuft' Absolutbetrag der Zahl χ

Π

χ —

'x hoch n'; n-te Potenz von χ: χ η = χ·χ. ....χ (η-mal) ο



Wurzel aus χ': y = x , wenn x = y =

Ableitung der Funktion f(x) nach χ

456

Anhang

Symbol

Bedeutung

y

'Summe 1 :

η 1

χ. = χ, + x 0 + ... + χ

-j = 1

l

i

t

η

b

'Integral': j g(x)dx= 'Summe der Flächeninhalte der

I

a Flächen zwischen der x-Achse und der Funktion g(x) im Intervall a < x < b , wobei Flächen oberhalb der x-Achse positiv und Flächen unterhalb der x-Achse negativ gewertet werden' [a,b]

'abgeschlossenes Intervall von a bis b'; Menge aller Werte χ mit a < x < b

(a,b)

'offenes Intervall von a bis b 1 ; Menge aller Werte χ mit a < χ < b

(a,b]

'linkshalboffenes Intervall von a bis b'; Menge aller Werte χ mit a < x < b

[a,b)

'rechtshalboffenes Intervall von a bis b'; Menge aller Werte x m i t a < x < b

Seien Α und ß Ereignisse. Dann ist Au Β

'Vereinigung von Α und B'

ΑΠ Β

'Durchschnitt von Α und Β'

Α-Β

'Differenz von Α und Β'

Ä

'das zu Α komplementäre Ereignis'

ß

'sicheres Ereignis'; 'Grundraum' allermöglichen Ereignissen

0

'unmögliches Ereignis'; 0 = 0,

P(A)

'die Wahrscheinlichkeit des Eintretens des Ereignisses A'

P(AIΒ)

'die Wahrscheinlichkeit des Eintretens des Ereignisses Α unter der Bedingung, daß das Ereignis Β eingetreten ist'

Seien X,Y,X^,...,X

Zufallsvariablen. Dann ist

F^(x)

'die Verteilungsfunktion von X an der Stelle X = x'

f^(x)

'die Dichte von X an der Stelle X = x '

FY

γ (χ. ' η 1

1 "

f„

ν (x, 1

x„) 'die gemeinsame Dichte von X.,...,X„ an der Stelle n 1 n (X,=x, Xn=xn)

1

η

E(X) = μ^ = μ ξ

α

2

Var(X) = σ ^ = σ

χn ) 'die gemeinsame Verteilungsfunktion von 1Χ,,.,.,Χ an der Stelle (X 1 = x 1 , . . . , X n = x n )

'der Erwartungswert von X'

2

'das a - Q u a n t i l (der Verteilung) von X' 'die Varianz von X'

Anhang

Symbol

457

Bedeutung 'die Standardabweichung von X 1

Οχ = σ υ

'der Variationskoeffizient von X'

Οον(Χ,Υ) = σ χ γ

'die Kovarianz zwischen X und Y'

P^Y=ρ

'die Korrelation zwischen X und Y'

S (x)

'die empirische Verteilungsfunktion zur Meßreihe χ. χ bzw. zu einer diskreten Zufallsvariablen X an der Stelle x '

χ

'das arithmetische Mittel einer Meßreihe x ^ , . . . , x n '

xa

'das empirische a - Q u a n t i l von X'

2

2

s^=s

'die empirische Varianz von X

s^=s

'die empirische Standardabweichung von X'

ν

'der empirische Variationskoeffizient von X'

s^y

'die empirische Kovarianz zwischen X und Y1

r^Y U Y,X

'die empirische Korrelation zwischen X und Y' 'das Bestimmtheitsmaß der linearen Einfachregression'

3

Y,(X1

N(0,1) 2

xn)

'das Bestimmtheitsmaß der multiplen Regression' Standardnormalverteilung

Ν(μ,σ )

Normal Verteilung mit Erwartungswert μ und Varianz σ

tn

t - V e r t e i l u n g mit η Freiheitsgraden

2

2

2

χ^

χ - Verteilung mit η Freiheitsgraden n

U(a,b)

F - Verteilung mit m und η Freiheitsgraden Gleichverteilung auf dem Intervall

[a,b]

Εχ(λ)

Exponentialverteilung mit Parameter Λ

B(n,p)

Binomialverteilung mit Parametern η und ρ

Ρο(λ)

Poissonverteilung mit Parmaeter λ

u,^

α - Q u a n t i l der Standardnormal Verteilung

wa

α -Quantil der Normal Verteilung mit Erwartungswert μ und Varianz σ2

t

α - Q u a n t i l der t - V e r t e i l u n g mit η Freiheitsgraden 2 α - Q u a n t i l der χ - Verteilung mit η Freiheitsgraden graden α - Q u a n t i l der F - V e r t e i l u n g mit m und η Freiheitsgraden

2 x'j.g ' F„ „

458

Anhang

Symbol

Bedeutung

φ(χ)

Verteilungsfunktion der Standardnormal Verteilung

ip(x)

Dichte der Standardnormal Verteilung

~

' v e r t e i l t nach'

=

'entspricht'