Grundkurs Statistik: Lehr- und Übungsbuch der angewandten Statistik 9783486710946, 9783486275926

In diesem Buch werden die wesentlichen Grundlagen der Wahrscheinlichkeitsrechnung und Statistik behandelt und grundlegen

265 123 11MB

German Pages 388 Year 2004

Report DMCA / Copyright

DOWNLOAD PDF FILE

Recommend Papers

Grundkurs Statistik: Lehr- und Übungsbuch der angewandten Statistik
 9783486710946, 9783486275926

  • 0 0 0
  • Like this paper and download? You can publish your own PDF file online for free in a few minutes! Sign Up
File loading please wait...
Citation preview

Grundkurs Statistik Lehr- und Übungsbuch der angewandten Statistik

Von

Dr. Bärbel Elpelt und

o. Prof. Dr. Joachim Härtung Fachbereich Statistik der Universität Dortmund

Mit ausführlichen Übungs- und Klausurteilen

Dritte Auflage

R.Oldenbourg Verlag München Wien

Bibliografische Information Der Deutschen Bibliothek Die Deutsche Bibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über abrufbar.

© 2004 Oldenbourg Wissenschaftsverlag GmbH Rosenheimer Straße 145, D-81671 München Telefon: (089) 45051-0 www.oldenbourg-verlag.de Das Werk einschließlich aller Abbildungen ist urheberrechtlich geschützt. Jede Verwertung außerhalb der Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulässig und strafbar. Das gilt insbesondere fur Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Bearbeitung in elektronischen Systemen. Gedruckt auf säure- und chlorfreiem Papier Druck: R. Oldenbourg Graphische Betriebe Druckerei GmbH ISBN 3-486-27592-5

Kapitelverzeichnis

EINFÜHRUNG

1

KAPITEL

1:

Rechnen mit Wahrscheinlichkeiten

5

KAPITEL

2:

Kombinatorik

29

KAPITEL

3:

Z u f a l l s v a r i a b l e und Verteilungen

39

KAPITEL

4:

Kenngrößen von Z u f a l l s v a r i a b l e n

63

KAPITEL

5:

Einige s p e z i e l l e Verteilungen

83

KAPITEL

6:

Punktschätzungen für die Kenngrößen und Parameter von Verteilungen

KAPITEL

7:

101

Interval 1 Schätzungen für zukünftige Beobachtungen und für Parameter von Verteilungen

115

KAPITEL

8:

S t a t i s t i s c h e Tests

129

KAPITEL

9:

R e g r e s s i o n s - und Korrelationsrechnung

159

KAPITEL 10:

Varianzanalyse

185

KAPITEL 11:

Ausblick auf weitere Verfahren

201

KAPITEL 12:

Lösungen zu den Übungsaufgaben

209

KAPITEL 13:

Klausuren

287

ANHANG

343 Ende

374

Inhaltsverzeichnis

EINFÜHRUNG KAPITEL

1:

1 RECHNEN MIT WAHRSCHEINLICHKEITEN

5

1

Zufällige Ereignisse und Wahrscheinlichkeiten

5

2

Beispiele zum Rechnen mit Wahrscheinlichkeiten

10

2.1

Vereinigung und Durchschnitt von Ereignissen: P a r a l l e l - und Seriensysteme

2.2

10

Bedingte Wahrscheinlichkeiten: Formel von der totalen Wahrscheinlichkeit und Bayessche Formel

3

Axiomatische Definitionen des Wahrscheinlichkeitsbegriffes

ÜBUNGSAUFGABEN ZU KAPITEL KAPITEL

2:

1

KOMBINATORIK

21 24 26 29

1

Permutationen

29

2

Variationen

30

3

Kombinationen

34

ÜBUNGSAUFGABEN ZU KAPITEL KAPITEL

3:

2

ZUFALLSVARIABLE UND VERTEILUNGEN

36 39

1

Der Begriff der Zufallsvariablen

39

2

Diskrete Verteilungen und empirische Verteilungsfunktion

40

3

Stetige Verteilungen

44

3.1

Verteilungsfunktion und Wahrscheinlichkeitsdichte

44

3.2

Empirische Dichten und empirische Verteilungsfunktionen

48

4

Gemeinsame Verteilung und Unabhängigkeit

51

5

Die Faltungsformel

56

ÜBUNGSAUFGABEN ZU KAPITEL

3

59

VIII

Inhaltsverzeichnis

KAPITEL

4:

KENNGRÖSSEN VON Z U F A L L S V A R I A B L E N

63

1

Der Erwartungswert einer Verteilung

63

2

Die Quantile einer Verteilung

65

3

Varianz, Standardabweichung und V a r i a t i o n s k o e f f i z i e n t

67

4

Kovarianz und K o r r e l a t i o n

70

5

S t a n d a r d i s i e r t e Z u f a l l s v a r i a b l e , Tschebyscheffsche Ungleichung, Gesetz der großen Zahlen und Fehlerfortpflanzungsgesetz

ÜBUNGSAUFGABEN ZU KAPITEL KAPITEL 1

5:

EINIGE

75

4

80

S P E Z I E L L E VERTEILUNGEN

83

Die Normalverteilung und daraus abgeleitete Verteilungen

83

1.1

Die Normalverteilung und der Zentrale Grenzwertsatz

83

1.2

Die Lognormal Verteilung

88

1.3

Die Prüfverteilungen

89

2

Die G l e i c h v e r t e i l u n g und die D r e i e c k s v e r t e i l u n g

92

3

Die Exponentialverteilung

94

4

Die Binomialverteilung

96

5

Die P o i s s o n v e r t e i l u n g

98

ÜBUNGSAUFGABEN ZU KAPITEL KAPITEL

6:

5

PUNKTSCHÄTZUNGEN

99 FÜR D I E

KENNGRÖSSEN

UND

PARAMETER VON V E R T E I L U N G E N

101

1

Schätzen der Kenngrößen von Verteilungen

101

2

Der Q - Q - P l o t zur Überprüfung von Verteilungsannahmen

105

3

Das Stem - and - Leaves - Diagramm und der B o x - P l o t

107

4

Schätzen der Parameter einer Verteilung

109

ÜBUNGSAUFGABEN ZU KAPITEL KAPITEL

7:

6

INTERVALLSCHÄTZUNGEN

112 FÜR Z U K Ü N F T I G E

BEOBACH-

TUNGEN UND FÜR PARAMETER VON V E R T E I L U N G E N

115

1

Toleranz- und Prognoseintervalle

115

2

Konfidenzintervalle

116

Inhaltsverzeichnis

2.1

Konfidenzintervalle für den Parameter μ einer Ν ( μ , σ 2 ) - Verteilung

2.2

117

Einhaltung vorgegebener Genauigkeiten bei Konfidenzinter2 Valien für den Parameter μ einer Ν(μ,σ ) - V e r t e i l u n g

2.3

Konfidenzintervalle für den Parameter σ

2

2.4

119

einer

Ν ( μ , σ 2 ) - Verteilung

122

Konfidenzintervalle für den Parameter ρ einer ß(n,p) - Verteilung

ÜBUNGSAUFGABEN ZU KAPITEL

KAPITEL 1

IX

8:

124 7

127

STATISTISCHE TESTS

129

Tests über die Parameter einer Normal Verteilung

130

1.1

130

Tests über den Mittelwert μ 2

1.2 2

Tests über die Varianz σ

132

Tests zum Vergleich der Parameter zweier Normal Verteilungen

134

2.1

Vergleich der Mittelwerte μ^ und μ^ 2 2

134

2.2

Vergleich der Varianzen σ^ und σ^

137

3

Tests über den Parameter ρ einer Binomialverteilung

4

Vergleich der Parameter p^ und P2 zweier

139

Binomialverteilungen

und der χ 2 - Unabhängigkeitstest für zwei Ereignisse

140

5

Der Vorzeichenrangtest nach Wilcoxon

144

6

Der Wilcoxon - Rangsummentest, der U - Test von M a n n - W h i t n e y 2

147

7

Der χ

150

8

Tests in allgemeinen rxs - Kontingenztafeln

- Anpassungstest

ÜBUNGSAUFGABEN ZU KAPITEL

KAPITEL 1

2

9:

8

REGRESSIONS- UND KORRELATIONSRECHNUNG

152 156

159

Einfache Regressions- und Korrelationsrechnung

159

1.1

Lineare Regression und die Methode der kleinsten Quadrate

150

1.2

Einfache Korrelationsrechnung

166

Multiple Regressions- und Korrelationsrechnung

171

2.1

Multiple Regressionsrechnung

171

2.2

Multiple Korrelationsrechnung

181

X

Inhaltsverzeichnis

ÜBUNGSAUFGABEN ZU KAPITEL KAPITEL

10:

9

183

VARIANZANALYSE

185

1

V e r g l e i c h mehrerer Meßreihen - e i n f a c h e V a r i a n z a n a l y s e

186

2

Das Blockexperiment - zweifache V a r i a n z a n a l y s e

192

ÜBUNGSAUFGABEN ZU KAPITEL 10

199

KAPITEL

201

11:

AUSBLICK

AUF W E I T E R E V E R F A H R E N

Versuchsplanung · StLchprobentheorie · Deskriptive Statistik · Explorative Statistik · Robuste Statistik · Graphische Verfahren · Skalierung von Merkmalsausprägungen · Qualitätskontrolle · Zeitreihenanalyse · Zuverlässigkeitstheorie · Mehrdimensionale Kontingenztafeln · Diskrete Regressionsanalyse · Multivariate Statistische Methoden · Multivariate Ein-, Zwei- und Mehrstichprobenprobleme · Diskriminanzanalyse " Multivariates Lineares Modell · Multivariate Regressionsanalyse · Multivariate Varianzanalyse · Multivariate Kovarianzanalyse · Multidimensionale Skalierung · Clusteranalyse · Faktorenanalyse KAPITEL

12:

LÖSUNGEN ZU DEN Ü B U N G S A U F G A B E N

209

1 Lösungen zu den Aufgaben i n K a p i t e l

1

209

2 Lösungen zu den Aufgaben in K a p i t e l

2

219

3 Lösungen zu den Aufgaben in K a p i t e l

3

225

4 Lösungen zu den Aufgaben i n K a p i t e l

4

237

5 Lösungen zu den Aufgaben in K a p i t e l

5

243

6 Lösungen zu den Aufgaben i n K a p i t e l

6

249

7 Lösungen zu den Aufgaben i n K a p i t e l

7

255

8 Lösungen zu den Aufgaben i n K a p i t e l

8

261

9 Lösungen zu den Aufgaben i n K a p i t e l

9

271

10 Lösungen zu den Aufgaben i n K a p i t e l

10

281

KAPITEL KLAUSUR

13:

KLAUSUREN

A

Lösungen zur KLAUSUR KLAUSUR

289 A

Β

Lösungen zur KLAUSUR

287

295 315

Β

321

Inhaltsverzeichnis

XI

ANHANG

343

1

343

Tabellenanhang Tab. 1:

Verteilungsfunktion Φ(χ) der Standardnormal Verteilung N(0,1)

344

Tab. 2:

Quantile

Tab. 3:

Quantile t der t-Verteilung 2 2 Quantile χ der χ - Verteilung η ;γ

Tab. 4: Tab. 5:

Quantile F„

der Standardnormal Verteilung N(0,1)



345 346 347

der F - Verteilung

349

2

Griechisches Alphabet

356

3

Symbolverzeichnis

357

4

Literaturhinweise

361

5

Stichwortverzeichnis

362 Ende

374

Vorwort

In a l l e n Bereichen der Wissenschaft, aber auch der Technik, der W i r t s c h a f t , des Handels, der Administration etc. i s t der E i n s a t z s t a t i s t i s c h e r Methoden und Vorgehensweisen u n e r l ä ß l i c h , zumal mit f o r t s c h r e i t e n d e r

Technisierung

immer komplexeres Datenmaterial gesichtet und ausgewertet werden muß. Dieses Buch b a s i e r t auf Grundvorlesungen und zugehörigen Übungen, die in den letzten Jahren für Studenten quasi a l l e r Fachrichtungen (z.B. Ingenieur- und Naturwissenschaftler, A g r a r w i s s e n s c h a f t l e r , W i r t s c h a f t s - und S o z i a l w i s s e n s c h a f t l e r ) an den U n i v e r s i t ä t e n Bonn und Dortmund gehalten wurden. Aufgrund der langjährigen didaktischen Erfahrung hat s i c h g e z e i g t , daß das Konzept dieses Buches für den s t a t i s t i s c h e n Anfänger überaus geeignet, sowohl vorlesungsbegleitend a l s auch zum Selbststudium, i s t : Methoden der d e s k r i p tiven (beschreibenden) S t a t i s t i k und der induktiven (schließenden)

Statistik

werden derart kombiniert behandelt, daß der Lernende d i r e k t die verhandenen Zusammenhänge zwischen beiden Bereichen erkennt. Zudem werden zu den e i n z e l nen Kapiteln Übungsaufgaben mit v o l l s t ä n d i g e n Lösungen dargeboten, so daß man das eigene Verständnis des Erlernten lückenlos überprüfen kann. Hinzu kommt noch ein K l a u s u r t e i l mit 'echten' Klausuraufgaben nebst Lösungen e i n s c h l i e ß l i c h Punktwertung und Benotung, der zur Überprüfung des generellen Verständnisses

dient.

Insgesamt haben wir uns bemüht, die e r f o r d e r l i c h e n mathematischen Grundkenntn i s s e so gering wie möglich zu halten und die einzelnen Kapitel weitgehend unabhängig voneinander lesbar zu g e s t a l t e n , so daß das Buch sowohl für mathematisch U n t r a i n i e r t e a l s auch für T r a i n i e r t e geeignet i s t und überdies a l s Nachschlagewerk für grundlegende s t a t i s t i s c h e Methoden dienen kann. Natürlich s t e l l t das Buch auch eine nützliche und breitgefächerte B a s i s für das Verständnis weiterführender und s p e z i e l l e r e r s t a t i s t i s c h e r L i t e r a t u r dar, was noch unterstützt wird durch den Ausblick im Kapitel

13, in dem a l l e

rele-

vanten Teilgebiete der S t a t i s t i k in i h r e r Grundthematik und Arbeitsweise vorg e s t e l 1 t werden.

XIV

Vorwort

Wir möchten es nicht versäumen, an dieser S t e l l e den Herren Dr. Karl-Heinz Klösener und Dr. Norbert Kuhlmeyer zu danken, die durch ihre M i t a r b e i t an früheren Vorlesungen bzw. Übungen i n d i r e k t zum Gelingen und Entstehen dieses Buches beigetragen haben. Außerdem danken wir Frau cand. s t a t . Meike Deiters und Frau cand. s t a t .

Bir-

g i t K e l l e r , die uns beim Nachrechnen der B e i s p i e l e , übungs- und Klausuraufgaben bzw. beim E r s t e l l e n des Typoscripts b e h i l f l i c h waren. Nicht z u l e t z t g i l t unser Dank dem R. Oldenbourg-Verlag und insbesondere dem L e k t o r a t s l e i t e r Herrn Martin Weigert für die problemlose Zusammenarbeit und größtmögliche F r e i h e i t bei der Gestaltung des Buches. Bärbel E l p e l t Joachim Härtung

Einführung

Statistische Methoden werden in zunehmendem Maße überall dort eingesetzt, wo empirisch bzw. experimentell gearbeitet wird. d.h. wo Daten aufbereitet und verarbeitet werden müssen. Sie lassen sich im wesentlichen in zwei Teile aufspalten, nämlich in Methoden der deskriptiven und Methoden der induktiven Statistik. Die de.ik>UpCivi Statiitik dient der Aufbereitung und Beschreibung verhandenen Datenmaterials. Ihre Ursprünge finden sich im 16.-18. Jahrhundert im Zusammenhang mit der Zustandsbeschreibung von Staaten (Aufzeichnung von Geburtsund Todesfällen, Beschreibung von Heer und Gewerbe etc.). Hierdurch wird auch der Ursprung des Wortes Statistik deutlich: Gottfried Achenwall (1719 - 1772) bezeichnet seine Staatsbeschreibungen als Statistik und bezieht sich auf das neulateinische Wort "status", was soviel wie "Staat" oder auch "Zustand" bedeutet. Die früheste Erwähnung deskriptiver statistischer Methoden läßt sich jedoch noch weit eher finden. Im vierten Buch Moses, dem Buch Numeri,wird von der "Musterung des Volkes", einer von Gott angeordneten Volkszählung gesprochen. Die -induktive StatiitA.k befaßt sich im Gegensatz zur beschreibenden Statistik damit, aufgrund von Daten Rückschlüsse zu ziehen. Basierend auf Beobachtungen an einer Auswahl, Stichprobe von Objekten, will man diejenige, in den Daten enthaltene Information extrahieren, die auf andere Objekte übertragbar ist. Die induktive Statistik entwickelte sich - abgesehen von einigen Grundlagen und Ansätzen - erst in diesem Jahrhundert und basiert im wesentlichen auf Resultaten der Wahrscheinlichkeitstheorie, die ihren Ursprung in der Berechnung von Chancen beim Glücksspiel hat. Die ersten wirklich mathematisch orientierten Betrachtungen in dieser Richtung wurden durch eine Anfrage des Chevalier de

Mere' im Jahre 1654 an den französischen Mathematiker Blaise Pascal

(1623- 1662) angeregt, vgl. Kapitel 1, der daraufhin mit Pierre der Fermat (1601 - 1665) eine Korrespondenz begann, die zur Bestätigung der Vermutung de Me're's aufgrund häufigen Spielens führte.

2

Einßhrung

Der näher an den historischen Entwicklungen und auch philosophischen Grundlagen der Statistik interessierte Leser sei hier verwiesen auf die ausführliche Einführung in Härtung et al. (1986). Wir werden in diesem Buch die wesentlichen Grundlagen der Wahrscheinlichkeitsrechnung und Statistik behandeln und grundlegende statistische Methoden darstellen. Das Kapitel 1 beschäftigt sich mit der Berechnung, d.h. mit den Rechenregeln für Wahrscheinlichkeiten sowie mit der formalen Definition des Wahrscheinlichkeitsbegriffes. Im Ka.p-U.il ΐ sind kombinatorische Grundlagen zusammengestellt, die bei der konkreten Bestimmung von Wahrscheinlichkeiten sehr nützlich sind. Im Kapitel 3 werden dann Zufallsvariablen und ihre Verteilungen betrachtet; auf diesem Instrumentarium gekoppelt mit zugehörigen Kenngrößen, die im Kapitel 4 behandelt werden, basieren die Methoden der induktiven Statistik. Im Kapitel 5 werden dann Eigenschaften der gebräuchlichsten Verteilungen zusammengestellt. Die induktive Statistik beschäftigt sich im wesentlichen mit der Punktschätzung von Kenngrößen und Parametern von Verteilungen, vgl. Kapitel 6, mit Interval Ischätzungen für zukünftige Beobachtungen und Parameter von Verteilungen, vgl. Kapitel 7, sowie mit statistischen Tests zur Überprüfung von Hypothesen, vgl. Kapitel S. In diesen drei Kapiteln werden konkrete Schätzungen und Tests insbesondere im Ein- bzw. Zweistichprobenfall der Normal- und Binomial Verteilung direkt mitbehandelt. Das Kapitel 8 beinhaltet zudem Tests zur Überprüfung von Verteilungsannahmen, nichtparametrische Lokationstests und Tests in allgemeinen Kontingenztafeln. Im Kapitel 9 werden die Grundlagen der einfachen und multiplen Regressionsund Korrelationsrechnung dargestellt. Die Regressionsrechnung beschäftigt sich mit der Bestimmung und Analyse funktionaler Zusammenhänge zwischen Variablen bzw. Merkmalen und die Korrelationsanalyse dient der Untersuchung der Stärke von Zusammenhängen zwischen Merkmalen. Das Kapitel 10 ist dann der Varianzanalyse gewidmet, die zur Untersuchung des Einflusses von Faktoren auf ein interessierendes Merkmal dient. Speziell erfolgt der Vergleich mehrerer Stichproben oder Meßreihen mit Hilfe der einfaktoriellen Varianzanalyse und des Blockexperimentes, bei dem ein zusätzlicher Störfaktor berücksichtigt wird. Das Kapitel 11 beinhaltet dann noch einen überblick über weiterführende sta-

Einführung

3

tistische Methoden.

Die Methoden der deskriptiven Statistik werden hier nicht gesondert behandelt; sie sind vielmehr an entsprechender Stelle in die einzelnen Kapitel integriert. So werden z.B. das Histogramm und die empirische

Verteilungsfunk-

tion in Zusammenhang mit der entsprechenden theoretischen Dichte bzw. Verteilungsfunktion behandelt. Deskriptive Maßzahlen für Lokation und Streuung von Daten oder für die Stärke des Zusammenhanges zweier Datenreihen sind gerade die Punktschätzungen für die entsprechenden theoretischen

Am Ende der Kapitel

1 bis 10 findet man stets übungiauigabzn

Größen.

zum behandelten

Stoff, die zur Kontrolle und Übung des Gelernten dienen. Die ausführlichen Losungen

zu diesen Übungsaufgaben sind im Kap-ctel 12 zusammengestellt.

Schließlich sind im Kapitel

13 KlauiuAzn

mit

Löiungzn

enthalten. Hier kann

man feststellen, ob man den gesamten Stoff beherrscht und

Problemstellungen

richtig einordnen kann. Zur Einschätzung des eigenen Wissens und Könnens sind Punkte - Bewertungen für die einzelnen Aufgaben, Notenschemata für die einzelnen Klausuren und in den Lösungen auch Angaben zur Bewertung

innerhalb

der Aufgaben gegeben.

Als H-inweii zum ΑΛbeJXzn

mit dem vorliegenden Buch sei hier noch erwähnt,

daß einzelne Teile (insbesondere in den Kapiteln 3 und 4) dem mathematisch weniger Geübten vielleicht zunächst Schwierigkeiten bereiten. Dies ist jedoch kein Grund zum Aufgeben, da spätere Passagen i.d.R. trotzdem noch verstanden werden können. Man sollte solche Problemstellen also zunächst einfach übergehen und erst später wieder auf sie zurückkommen.

Kapitel 1: Rechnen mit Wahrscheinlichkeiten

1. Zufällige Ereignisse und Wahrscheinlichkeiten Ein Ereignis, das zwar a u f g r u n d von zum Beispiel

physikalischen oder ökono-

m i s c h e n Gesetzmäßigkeiten z u s t a n d e k o m m t , aber w e g e n der Komplexität der Gesetzmäßigkeiten trotzdem nicht e r f a ß b a r , erklärbar bzw. vorhersehbar n e n n t man ein zu{ä&tige4

ist,

EitigyvLi.

Zufällige Ereignisse - w i e etwa das Ergebnis eines M ü n z - oder

Würfelwurfes,

der Ausfall einer M a s c h i n e o d e r der Konkurs e i n e r Firma zu einem bestimmten Zeitpunkt - sind Ergebnisse von ΖαίαίΐΛζχρζκ-ύηιηΧζη

oder

Zu^atiivoigängzn.

über das Eintreten eines bestimmten Ergebnisses läßt sich hier einzeln betrachtet nichts a u s s a g e n , wohl a b e r über das

'durchschnittliche'

Ergebnis-

v e r h a l t e n , d.h. A u s s a g e n können sich nur auf das m i t t l e r e Verhalten bei len R e a l i s a t i o n e n eines zufälligen Ereignisses

vie-

beziehen.

8exip-te-d: Es bezeichne Α das E r e i g n i s , daß e i n e Glühbirne in einer Ampel

we-

niger als 90 Tage intakt ist, also A = { Lebensdauer einer A m p e l - G l ü h b i r n e < 90 Tage } Für e i n e e i n z e l n e , bestinrite Glühbirne läßt sich dann nicht im Vorhinein

sa-

gen, o b das Ereignis Α eintritt. Wohl aber kennt m a n in der Umgangssprache Aussagen folgender Art: - Im D u r c h s c h n i t t werden 97% a l l e r Glühbirnen mindestens 90 Tage a l t ; - M i t 97% Sicherheit w i r d e i n e Glühbirne m i n d e s t e n s 90 Tage a l t ; - Die W a h r s c h e i n l i c h k e i t , daß e i n e Glühbirne w e n i g e r als 90 Tage lebt das Ereignis Α tritt e i n ) , liegt bei 3% .

Man s c h r e i b t dann auch P(A) = 3% = 0.03 wobei Ρ für 'Probability'

, (= W a h r s c h e i n l i c h k e i t ) s t e h t , bzw. w e n n

(d.h.

6

Kap. 1: Wahrscheinlichkeiten

Ä = { Lebensdauer einer Ampel-Glühbirne > 90 Tage } das zu Α komplmentäKz

bezeichnet,

Eieignii

P(Ä) = 97% = 0.97

.

Inhaltlich bedeutet die Aussage dieses Beispiels, daß von 'vielen' AmpelGlühbirnen etwa 3% in den ersten 90 Tagen ausfallen.

|

Ist Α ein Ereignis und Ä das zu Α komplementäre Ereignis, so gilt natürlich stets P(A) + P(Ä) = 1 0 0 « = 1

bzw.

P(Ä) = 1 - P(A)

Wie kommt man zur Wahrscheinlichkeit für ein Ereignis, wie etwa zur Wahrscheinlichkeit 3% für das Ereignis Α im obigen Beispiel?

Im konkreten Fall wird man etwa η = 2 0 0 0 0 Glühbirnen, die in Ampeln eingesetzt sind, bzgl. ihrer Lebensdauern beobachten. Wir entnehmen der Produktion von Ampel-Glühbirnen zufällig eine Stichprobe zeichnen mit H n ( A ) die abiolute

Häufigkeit

von η Glühbirnen und be-

des Ereignisses A , d.h die An-

zahl von Glühbirnen, die weniger als 90 Tage intakt waren. Dann bestimmen wir die n.elative

des Ereignisses A

Häufigkeit

hn(A)4Hn(A)

,

die natürlich stets zwischen 0 und 1 liegt, und werden feststellen, daß sich bei Vergrößerung des Stichprobenumfang*

n , falls sich an Produktion und Ex-

periment nichts ändert, die relative Häufigkeit h n ( A ) einer gewissen Zahl ρ nähert, die dann die Wahrscheinlichkeit h (Α)

P(A) des Ereignisses Α definiert:

> ρ = P(A)

Für 'große' η gilt also eine ungefähre hn(A)~P(A)

Gleichheit:

.

(Ober die Güte dieser Anpassung werden wir in den folgenden Kapiteln noch Aussagen machen.)

Von der Funktion Ρ wollen wir die gleichen Eigenschaften die relative Häufigkeit h

verlangen, wie sie

hat, und natürlich ist Ρ definiert auf der Menge

Kap. 1:

der jeweils interessierenden E r e i g n i s s e A^

7

Wahrscheinlichkeiten

f ü r die g i l t

P ( A , ) + P(A-) + . . . = 1 (wenn Α , , Α , , . . . s i c h ausschließen, d i s j u n k t 1 2 1 1 sind), 04Hn=TÄ=0·178

A

( Ä

> 4 V >

=

S

=

A

> = Ä

= 0

0

=1

-850

·

1 5 0

·

-hn0

f a l l s Α und Β (itochaitiich)

unabhängig

sind. Exakt d e f i n i e r t man zwei E r e i g n i s s e Α und Β a l s unabhängig, wenn letztere Gleichung g i l t .

2. Beispiele zum Rechnen mit Wahrscheinlichkeiten 2.1

V E R E I N I G U N G E R E I G N I S S E N :

UND

D U R C H S C H N I T T

P A R A L L E L -

UND

VON S E R I E N -

S Y S T E M E Wir wollen im folgenden anhand einiger Beispiele überlegen, wie groß die Wahrscheinlichkeit der Vereinigung und des Durchschnitts mehrerer Ereignisse i s t . Solche Vereinigungs- bzw. Durchschnittsereignisse lassen sich dann auch graphisch a l s VcuiallilläMigkeAXm

bzw. Suü.qi>twLvt ( S H R ) , v g l . Abb. 4. Z(SHR) d i e s e s

A6b. 4:

bzgl.

s i n d , a u s g e r ü s t e t . Brennen a l l e G l ü h b i r n e n bzw. Fäden Wie groß i s t d i e

mit

Zuverlässigkeit

Systems?

Z u v e r l ä s s i g k e i t s s c h a l t b i l d e i n e r Ampelanlage aus 4 R o t l i c h t s i c j n a l e n mit j e w e i l s h e i ß e r Reserve

Jedes R o t l i c h t s i g n a l

RS^, j = 1

4 , i s t e i n P a r a l l e l s y s t e m mit zwei

unabhängigen Komponenten, so daß g i l t Z ( R S . ) = 1 - [1 - P(GB· , i n t a k t ) ] · [1 - P(GB. , i n t a k t ) ] J J >l J »t = 1 - 0 . 0 3 - 0 . 0 3 = 0.9991

D i e Z u v e r l ä s s i g k e i t des Gesamtsystems b e t r ä g t s o m i t dann

Z(SHR) =

|| Z ( R S . ) = 0 . 9 9 9 1 4 = 0.996 3 j =1

.

D i e Z u v e r l ä s s i g k e i t konnte durch Redundanz a l s o im V e r g l e i c h zu ( i )

be-

Kap.

1: Wahrscheinlichkeiten

17

trächtlich erhöht werden, nämlich von 88.5% auf 99.6% . Je größer die Ampelanlage i s t , desto mehr wirkt sich die Redundanz in den Rotlichtsignalen aus. So ergibt sich z.B. für N = 8 Z(SOR) = 78.4%

,

Z(SHR) = 99.3%

,

Z(SHR) =98.6%

und für Ν = 16 Z(SOR) =61.4%

.

Eine weitere Erhöhung der Zuverlässigkeit i s t durch Verwendung sogenannter S y i t m z

mit

möglich, bei denen die zweite Birne im Rotlicht-

k a l t e A ReieAve.

signal erst anfängt zu brennen, wenn die erste Birne a u s f ä l l t . Eine ausführliche Diskussion solcher Probleme findet man in Härtung et a l . (1986, Kap. X I I I ) . Β ί Λ Λ ρ Ι ί Ι :

(e) Ein Gehäuse bestehe aus Vorder- und H i n t e r t e i l , die mit 10% bzw. 8% Wahrscheinlichkeit fehlerhaft sind, sowie einem Dichtungsring, der mit 95% Sicherheit intakt i s t . Mit welcher Wahrscheinlichkeit i s t das Gehäuse v ö l l i g fehlerfrei gearbeitet, wenn man davon ausgeht, daß die Produktion der drei Teile unabhängig voneinander erfolgt? Sei Α das Ereignis "Vorderteil intakt", Β das Ereignis "Hinterteil

in-

takt" und C das Ereignis "Dichtungsring i n t a k t " ; dann i s t P(A) = 0.90

,

P(B) = 0.92

und

P(C)=0.95

.

Das Gehäuse i s t ein Seriensystem mit drei Komponenten, vgl. Abb. 5, so daß seine Intaktwahrscheinlichkeit gleich dem Produkt der KomponentenIntaktwahrscheinlichkeiten

ist:

P(An Bn C) = P(Gehäuse intakt) = P(A) · P(B) · P(C) = 0.90 · 0.92 · 0.95 = 0.7866 (f) Eine Firma hat drei Monteure M 1 , M 2 , Mj für spezielle Wartungsaufgaben ausgebildet, die mit unterschiedlicher Wahrscheinlichkeit unabhängig voneinander z.B. wegen Krankheit ausfallen:

18

Kap. I: Wahrscheinlichkeiten

Abb.

5: Darstellung des Gehäuses als Seriensystem m i t drei Komponenten

unabhängigen

P(M 1 fällt aus) = 1 0 % = 0.1 P(M 2 fällt aus) = 20% = 0.2 P ( M 3 fällt aus) = 3 0 % = 0.3

.

(i) Wie groß ist die Wahrscheinlichkeit, daß wenigstens ein Monteur zur Verfügung steht?

Da das Wartungssystem intakt ist, solange wenigstens ein Monteur zur Verfügung steht, ist das interessierende Ereignis gerade das

Komplement

des Ereignisses "alle Monteure fallen aus", so daß gilt P(Wartungssystem intakt) = 1 - P(Wartungssystem defekt) = 1 - P(M 1 fällt a u s n M 2 = 1 - P(M 1

fällt aus η M 3 fällt aus)

fällt aus) · P ( M 2 fällt aus) · P ( M 3 fällt aus)

= 1 - 0 . 1 - 0.2 · 0.3 = 0.994

.

Das Wartungssystem ist somit ein Parallelsystem m i t 3 unabhängigen

Kom-

ponenten, den Monteuren, vgl. Abb. 6,und die Zuverlässigkeit Ζ des Systems läßt sich auch schreiben als Ζ = P(Wartungssystem

intakt)

= 1 - [1 - P(M, intakt)] · [1 - P(M 2 intakt)] · [1 - P ( M 3 = 0.994

intakt)]

.

(ii) Wie groß ist die Wahrscheinlichkeit, daß die Produktion wegen Ausfalls der Monteure gestoppt werden m u ß , wenn mit 80% Wahrscheinlichkeit eine der zur Produktion benötigten Maschinen MA (unabhängig

Kap. 1: Wahrscheinlichkeiten

19

Abb. 6: Darstellung des Wartungssystems aus 3 Monteuren m i t t e l s eines P a r a l l e l systems

vom A u s f a l l der Monteure) defekt i s t ? Gesucht i s t die Wahrscheinlichkeit eines Produktionsstops, a l s o P(MA f ä l l t aus und Μ,, M 2 > M 3 f a l l e n aus) = P[(MA f ä l l t aus) η (Wartungssystem defekt)] = P(MA f ä l l t aus) · P(Wartungssystem defekt) = 0.8 · (0.1 · 0.2 · 0.3) = 0.8 · (1 - 0.994) = 0.0048

,

d.h. mit ca. 0.5% Wahrscheinlichkeit muß die Produktion gestoppt werden. Das gesamte System läßt s i c h wiederum a l s P a r a l l e l s y s t e m , v g l . Abb. 7, d a r s t e l l e n und seine Z u v e r l ä s s i g k e i t

ist

Z = 1 - [1 - P(MA i n t a k t ) ] · [1 - P(M 1 i n t a k t ) ] · [1 - P(M 2 i n t a k t ) ] • [1 - P(M 3 i n t a k t ) ] = 1 - 0.8 · 0.1 · 0.2 · 0.3 = 1 - 0.0048 = 0.9952

.

(

Wir wollen nun noch einmal die in den B e i s p i e l e n (a) - ( f ) gewonnenen E/igebruAiz zusammenstellen.

Kap.

20

Abb.

1:

Wahrscheinlichkeiten

7: Darstellung des kombinierten Wartungs-Maschinen-Systems als Parallelsystem mit vier unabhängigen Komponenten

Sind A^

(stochastisch) unabhängige Ereignisse, so gilt P(A1 η A2fl ... n A m ) = P(A1} · P(A 2 ) · ... · P(A m )

und

P(A1 U A 2 U ... u A m ) = 1 - [1 - P(A t )] · [1 - P(A 2 )] ·...· [1 - P(A m )] .

Eine Anwendung dieser beiden Regeln sind Serien- bzw. Parallelsysteme: P(Seriensystem intakt) = P(1. Komponente intakt)· ...· P(m-te Komponente intakt)

,

P(Parallelsystem intakt) = 1 - [1 - P(1. Komponente intakt)]· ...· [1 - P(m-te Komponente intakt)] Zum Abschluß dieses Abschnitts 2.1 wollen wir nun die Frage beantworten, die der Chevalier de Me're im Jahre 1654 an den französischen Mathematiker Blaise Pascal richtete: Stimmt es, daß von den beiden folgenden Wetten die erste größere Gewinnchancen bietet? I.

Ein fairer Würfel wird viermal geworfen und man setzt auf das Ereignis "mindestens eine Sechs";

II. Zwei faire Würfel werden 24-mal geworfen und man setzt auf das Ereignis "mindestens ein Sechserpasch". Bezeichnet A^ bei der ersten Wette das Ereignis, daß im i-ten Wurf,

Kap. 1: Wahrscheinlichkeiten

i=1

21

4 , eine Sechs gewürfelt wird, so i s t P ( V

=

F

für i = 1 , . . . . 4

und es ergibt s i c h P(Wette I gewonnen) = P(A 1 U A z U A 3 υ A 4 ) = 1 - [1 - P(A,)] · [1 - P(A 2 )] · [1 - P(A 3 )] · [1 - P(A 4 )] - ι - (1 - - ) 4 - 1 - 1

U

τ

)

- 1

= 1 - 0.482 = 0.518 I s t für i=1 1ichkeit

11-

625

w

.

24 bei der zweiten Wette B i das Ereignis mit der Wahrschein-

daß im i - t e n Wurf ein Sechserpasch gewürfelt wird, so i s t P(Wette I I gewonnen) = P ( B 1 U B 2 U . . . U B 2 4 ) - 1 - [1 - P(B 1 )] · [1 - P ( B 2 ) ] · . . . · [1 - P ( B 2 4 ) ]

= 1 - 0.509 = 0.491 Die Frage des Chevalier

de Me're' muß also mit " j a " beantwortet werden, denn

bei Wette I beträgt die Gewinnchance 51.8%, wohingegen s i e bei Wette I I l e d i g l i c h bei 49.1% l i e g t .

2.2

B E D I N G T E FORMEL L I C H K E I T

WAHRSCH E I N L I C H K E I T E N : DER Τ O T A L E N W A H R S C H E I N UND BAY ES S C Η Ε F O R M E L

VON

Wichtige Rechenregeln für bedingte Wahrscheinlichkeiten sind die fomrnl von den. totalen

WahAichexntichke-ct

und die Ba.yei6c.he. Vo>mel, die wir im folgen-

den anhand eines B e i p i e l s herleiten wollen.

Kap.

22

I:

Wahrscheinlichkeiten

BbLbpieZ: Die Produktion eines Bauteils e r f o l g t auf einem von zwei unabhängig voneinander arbeitenden Fließbändern F^ und F^. Bei der Qualitätskont r o l l e wird ein Bauteil dann in die Qualitätsklasse Q1 oder Qg eingeordnet. F^ l i e f e r t 900 Bauteile pro Stunde, von denen 80% in Q1 f a l l e n , und von den 1000 Bauteilen pro Stunde, die F 2 f e r t i g t , f a l l e n 70% in die Qualitätsstufe Q^. Das Bauteil wird montiert und in der Endkontrolle i s t nicht mehr f e s t s t e l l b a r , von welchem Band es h e r g e s t e l l t worden i s t . ( i ) Wie groß i s t die Wahrscheinlichkeit, in der Endkontrolle ein Bauteil der Qualitätsstufe Q^ zu finden? Bezeichnet Β das Ereignis "Bauteil in Q^" und Α das E r e i g n i s "Bauteil kommt von F.|", dann wissen wir, daß g i l t

K

'

1900

19

da von insgesamt 1900 Bauteilen, die pro Stunde g e f e r t i g t werden, 900 von F^ kommen. Weiterhin ergeben sich aus der Aufgabenstellung die bedingten Wahrscheinlichkeiten P(B | A) = 80% = 0.8

und

P(B | Ä) = 70% = 0.7

Nun i s t Β = ( A n B ) u (An B) = Cu D und C und D schließen einander aus, d.h. sind

d l i j u n k t ,

da ein Bauteil

g l e i c h z e i t i g von F^ und F^ produziert worden sein kann, d.h. P(C η D) = 0 Damit erhalten wir P(B) = P [ ( A n B) U (Ä η B)] = P(C U D) = P(C) + P(D) - P(C η D) = P(C) + P(D) - 0 = P(Aη Β) + P(Än Β) und mit der Formel P(B|A)=^nO für bedingte Wahrscheinlichkeiten ergibt s i c h

nicht

Kap. 1: Wahrscheinlichkeiten

Ρ(ΑΠΒ) = Ρ(Β I A) . P(A) = 0 . 8 · ^

23

,

P(Ä η Β) = Ρ(Β I Ä) · P(Ä) = Ρ(Β I Ä) · [1 - Ρ ( Α ) ] = 0.7· so daß mit der

fom&l

von

d&t

=

,

totalen

WakucheintichkeiX

gilt

P(B) = P(B | A) · P(A) + P(B | Ä) · P(Ä) = 0.8

0.7 ·

=

°-747



Mit 74.7% Sicherheit gehört ein Bauteil in der Endkontrolle zur Qualitätsstufe Q r ( i i ) Mit welcher Wahrscheinlichkeit P(A | B) kommt ein in der Endkontrolle der Qualitätsstufe Q^ zugeordnetes Bauteil vom Fließband F ^ Mit den Ergebnissen aus Teil ( i ) ergibt sich Pf A I R l - P ( - A . " . B ) - n R . '

I

— P X B - J — °· 8

9

/7·2*7

- " · § ' g-

T5/ ~Τ9

7·2

- 0 507 -u-bu/·

Τ7ΣΤΎ-νΓΪ

Ausführlich aufgeschrieben haben wir hier die Formel ρ/Α , Bηλ . P(A Π Β) . P(B I A) · P(A) I ) ρητ) ^ PCB I A) · P(A) PCB I A) · P(A) + PCB I Ä) · P(Ä) benutzt, die auch

Ba.ytiic.he.

Fonmet

heißt.

Fassen wir die Ergebnisse des Beispiels noch einmal zusammen. Die den.

totalen

UahAicheintLchkiAX

formet

ist

- für zwei Ereignisse Α und Ä mit 0 < P ( A ) < 1 P(B) = P(B | A) · P(A)+ P(B | Ä) · P(Ä)

,

- für m paarweise disjunkte, d.h. einander ausschließende A 1 , . . . , A [ n mit

PCA1) + . . . + P f A j = 1

m PCB) = l PCB | A.) · P(A.) 1 1 i=1

,

und

Ρ(Α^>0

Ereignisse

für i = 1

m

von

24

ΚαΡ· l:

Wahrscheinlichkeiten

und die FonmdL von Ba.yzi i s t - für zwei Ereignisse Α und Ä mit 0 < P(A) < 1 : P(A | Β)

Ρ(Β|Α)·Ρ(Α)

P(B | A) · P(A) + P(B | Ä) · P(Ä)

,

- für m paarweise disjunkte Ereignisse A ^ , . . . ,Am mit P(A 1 ) + . . . + P(A m ) = 1 und P(A.j) > 0

für i = 1 , . . . , m :

P(B i A.) · P(A.) 1 1 P(A. 1I B) =ι m [ P(B | A.) · P(A.) J J j=1

3. Axiomatische Definitionen des Wahrscheinlichkeitsbegnfles Wir wollen an dieser S t e l l e zwei verschiedene Definitionen des Wahrscheinl i c h k e i t s b e g r i f f e s , nämlich die klassische und die allgemeine Definition aufführen. Dazu benötigen wir zunächst noch den Begriff des Grundraums. Der

Giund-

laum Ω, auf dem wir eine Wahrscheinlichkeit definieren, i s t die Vereinigung a l l e r möglichen, interessierenden Ereignisse. Zufällige Ereignisse werden dann auch als Teilmengen von Ω aufgefaßt. Besteht ein Grundraum Ω aus den endlich v i e l e n , paarweise disjunkten mentcumfLiL-ignXAiin

, d.h.

Ω = E1 U E 2 U . . . U E$ E i η Ej = 0

Elt-

,

( " l e e r e Menge")

für i,j=1

s

und i ^ j

,

und sind a l l e Elementarereignisse 'gleichwahrscheinlich', d.h. die Wahrscheinlichkeit von E.j sei d e f i n i e r t als P(Ei)=j so i s t die

ktaatiahe.

für i=l oder

s

,

Lapiacz-UahAichzintichkeUJ:

eines Ereignisses A,

das sich aus r < s Elementarereignissen zusammensetzt, d e f i n i e r t durch

25

Kap. 1: Wahrscheinlichkeiten

p m 1

'

. A n z a h l der f ü r Α g ü n s t i g e n Fäl 1e _ r Anzahl der mog möglichen F ä l l e s

e i n " f ü r Α g ü n s t i g e r F a l l " i s t n a t ü r l i c h d e r , daß e i n s der i n Α enthaltenen Elementarereignisse

eintritt.

BiAApliZ:

(a) I n e i n e r P a r t i e von s Schrauben s i n d r s c h a d h a f t . G r e i f t man eine Schraube h e r a u s , so e r g i b t

sich

--ι.,.ίί.,.Ε^ _ Anzahl schadhafter Schrauben _ r P(Schraube s c h a d h a f t ) Anzahl a l l e r Schrauben s

(b) Beim Würfeln mit einem f a i r e n Würfel s i n d d i e sechs Zahlen

"

1,2,...,6

a l l e gleichwahrscheinlich, d.h. P ( " D = P("2") = ... = P("6")

.

Die W a h r s c h e i n l i c h k e i t des E r e i g n i s s e s A, e i n e gerade Zahl zu w ü r f e l n , i s t dann P(A)=|=0.5

,

da s i c h das E r e i g n i s Α aus den d r e i E l e m e n t a r e r e i g n i s s e n " 2 " , " 4 " und " 6 " zusammensetzt.

|

I s t Ω e i n b e l i e b i g e r Grundraum, so wird die W a h r s c h e i n l i c h k e i t Ρ auf Ω durch d i e d r e i Koimogoio 0

kxlomz

f ü r jedes E r e i g n i s Α aus Ω

(PoiitiviXät)

P(fi) = 1

(

oo

\

u 1

(N o n m i i i t h z U ) °°

) 1

=

l

Λ

ϊ

^

J e d e Folge paarweise d i s j u n k t e r Ereignisse A ^ A ^ , . . .

aus Ω (σ -

Αdd-Ltiv-ität)

d e f i n i e r t , aus denen s i c h a l l e von uns h e r g e l e i t e t e n Rechenregeln f ü r Wahrscheinlichkeiten ableiten

lassen.

Der Grundraum fi, auf dem eine W a h r s c h e i n l i c h k e i t Ρ d e f i n i e r t w i r d , h e i ß t wegen Ρ (Ω) = 1

Kap.

26

auch das

1:

Wahrscheinlichkeiten

i-tcheAi

unmögtichei

E i & i g n i i

E i z l g n ü , ,

und das zu Ω komplementäre Ereignis Ω - 0 heißt

da gilt

p(0) = Ρ(Ω) = 1 - Ρ(Ω) = ο

.

Es sei davor gewarnt, aus P(B) = 1 oder Ρ(C) = 0 zu schließen, daß gilt 8 = Ω oder C = 0 . Zum Beispiel ist die Wahrscheinlichkeit 0, daß ein Würfel beim Würfeln auf der Kante stehen bleibt, aber dieses Ereignis ist prinzipiell nicht unmöglich.

ÜBUNGSAUFGABEN ZU KAPITEL 1

Aufgabe 1.1: Bei der Untersuchung von Produktionsfehlern an einem Stückgut wurde festgestellt, daß die Fehlerhaftigkeit im wesentlichen auf drei Quellen (Material, Maschine, Bediener) zurückzuführen ist. Bezeichnen wir mit Α das Ereignis "Materialfehler", mit Β das Ereignis "Maschinenfehler" und mit C das Ereignis "Bedienungsfehler", so ergab die Untersuchung folgende Fehlerwahrscheinlichkeiten: P(A) =P(B) =0.05

und

P(C)=0.1

Abhängigkeiten treten nur zwischen den Ereignissen Α und Β zutage, und zwar ergab sich P(An B) = 0.01 a) Interpretieren Sie folgende Ereignisse, stellen Sie sie graphisch durch Flächenschraffierung in einem Mengendiagramm wie in Abb. $ dar und berechnen Sie die Wahrscheinlichkeiten dieser Ereignisse: (1)

AuB

(2)

AuBuC

(3)

ΑΠ Β

(4)

, ,

(ÄuB)nc

Kap. 1: Wahrscheinlichkeiten

27

Abb. i: Mengendiagramm für die Ereignisse A , B, C im Raum aller möglichen Ereignisse fi

b) Stellen Sie folgende Ereignisse durch Mengen und Mengendiagranme dar und berechnen Sie ihre Wahrscheinlichkeiten: (1) mindestens zwei Fehler treten auf; (2) höchstens einer der Fehler tritt auf.

Aufgabe 1.2: In einem Produktionslos von n = 1300 Schrauben stellt man fest, daß 120 Schrauben außerhalb der Querschnittstoleranz und 180 Schrauben außerhalb der Längentoleranz liegen. Außerdem weiß m a n , daß 40 Schrauben zu lang und ausserhalb der Querschnittstoleranz sind ufid daß von den zu kurzen Schrauben 90 einen akzeptablen Querschnitt haben. Insgesamt 1050 Schrauben genügen den Qualitätsanforderungen. Stellen Sie eine Kontingenztafel keiten folgender

auf und bestimmen Sie die relativen Häufig-

Ereignisse:

a) mindestens einer der Fehler "zu lang" und "außerhalb der Querschnittstoleranz" tritt auf; b) sowohl in Länge als auch in Querschnitt ist eine Schraube

fehlerhaft;

c) eine Schraube, die den Querschnittsanforderungen genügt, ist zu lang; d) eine Schraube mit akzeptabler Länge liegt außerhalb der Querschnittsanforderungen.

28

Kap. 1: Wahrscheinlichkeiten

Aufgabe 1.3: Die Färberei einer Textilfabrik benötigt, um einen reibungslosen

Färbeablauf

zu gewährleisten, ein Vorfärbebecken, ein Hauptfärbebecken und ein Wasserbad zum Entzug überflüssiger Farbe. Jedes der drei vorhandenen ken V.|, V 2 > V^ ist mit zwei Hauptfärbebecken H.,· j , H^ ^ f ü r Übergangsschleusen ü^ ^ 2 serbäder W ^ , . . . ^

f

ü r

Vorfärbebek-

i = 1,2,3 durch

i =1,2,3 gekoppelt. Außerdem stehen vier Was-

zur Verfügung, zu denen von jedem Hauptfärbebecken

pro-

blemlose Übergangsbahnen zur Verfügung stehen. Die Vorfärbebecken V^ und sind mit 95% Sicherheit gebrauchsbereit, das dritte Vorfärbebecken

funktio-

niert mit einer Wahrscheinlichkeit von 2% nicht. Die Übergangsschleusen

und

Hauptfärbebecken arbeiten alle mit einer Zuverlässigkeit von 90% und die Wasserbäder W ^ , W,,, W j und W^ haben Intaktwahrscheinlichkeiten von 0.9, 0.92, 0.94 bzw. 0.87. Wie groß ist die Wahrscheinlichkeit dafür, daß die Färbung von Stoffen möglich ist?

Aufgabe

1Λ:

Aufgrund langjähriger Erfahrungswerte einer Flughafenverwaltung hat sich gezeigt, daß von 100000 Passagieren nur einer ein Luftpirat ist, so daß bei Abfertigung von durchschnittlich 2000 Passagieren pro Tag alle 50 Tage ein Luftpirat unter den Fluggästen ist. Totzdem werden zum Schutz der Passagiere alle Fluggäste einer unauffälligen Kontrolle unterzogen. Ein Luftpirat wird dabei mit 98% Sicherheit entdeckt, und e i n f r i e d l i c h e r Passagier bleibt in 99% aller Fälle unbehelligt. a) Wieviele Passagiere werden durchschnittlich im Laufe eines Jahres (365 Tage)

"festgenommen"?

b) Lohnt es sich, die "Festgenommenen" zur Vermeidung von Protesten einer nochmaligen, aufwendigeren Kontrolle zu unterziehen?

Kapitel 2: Kombinatorik

Die Komb-inato'u.k oder "die Kunst des Zählens1' ist ein wichtiges Hilfsmittel zur Berechnung von Laplace-Wahrscheinlichkeiten. Wir wollen hier die wichtigsten Regeln der Kombinatorik behandeln, nämlich die für die Bestimmung der Anzahl möglicher Permutationen, Variationen und Kombinationen von Objekten.

1. Permutationen Jede Anordnung von η verschiedenen Objekten in einer Reihe heißt eine Peimutatlon

de'ι η Objekte..

BexApieZ: Die n = 3 Buchstaben a,b,c lassen sich auf sechs Arten anordnen: abc , acb , bac , bca , cab , cba

,

d.h. es gibt 6 Permutationen der drei Objekte. Allgemein ist n! = 1 · 2 · 3 · ... · η die Anzahl möglicher Permutationen von η verschiedenen Objekten, denn es gibt η Möglichkeiten, den ersten Platz in der Reihe zu besetzen, n - 1

Möglichkei-

ten, den zweiten Platz zu besetzen, ... und eine Möglichkeit.den letzten, n-ten Platz zu besetzen.

Die Interpretation einer Permutation in einem sogenannten

Kugel-Zeiten-ModeiZ

ist die folgende: η unterscheidbare, z.B. durchnumerierte Kugeln (Objekte) werden auf η unterscheidbare Zellen (Plätze in der Reihe) derart verteilt, daß keine Zelle mehrfach besetzt ist.

30

Kap. 2: Kombinatorik

BeAAp-ie.1: Herr Schmidt hat vier Briefe und vier zugehörige Umschläge vorbereitet. Seine Sekretärin steckt die Briefe ohne hinzusehen in die Umschläge. Wie groß ist die Wahrscheinlichkeit des Ereignisses A , daß jeder Brief im richtigen Umschlag steckt? Es gibt 4! = 1 · 2 · 3 · 4 = 24 Möglichkeiten der Zuordnung der Briefe zu den Umschlägen, von denen nur eine die richtige ist, so daß gilt oin\ _ Anzahl der für Α günstigen F ä l l e _ P(A) Anzahl der möglichen Fälle

w

1 -

„ ηΔ17 , 17ϊ 0.0417 - 4.17*

.

|

2. Variationen Werden aus η verschiedenen Objekten genau k Objekte ausgewählt und in einer Reihe angeordnet, so heißt jede Anordnung mit Berücksichtigung der Reihenfolge der Objekte eine l ' a j i i a t i o n oder geoidneie P/iobe. von k aus η Objekten.

Kann jedes Objekt mehrfach in der Anordnung vorkommen, dann ist auch möglich, so spricht man von einer VovUation

mit

k>n

UiideAholung.

8«ΛΛρ-ίζΙ: Zwei Buchstaben sollen aus den drei Buchstaben a,b,c ausgewählt werden, wobei Wiederholungen möglich sind. Die mögliche Zahl

verschiedener

Variationen mit Wiederholung ist dann gerade 9, nämlich: aa , ab , ac , ba , bb , bc , ca , cb , cc

.

|

Allgemein ist die mögliche Anzahl der Variationen von k aus η Objekten mit Wiederholung

η

k

=η·η·...·η

,

k-mal denn für die Besetzung von jedem der k Reihenplätze stehen η verschiedene

Ob-

jekte zur Verfügung.

Im Zellen-Kugel-Modell

entspricht einer Variation mit Wiederholung die Be-

setzung von η unterscheidbaren Zellen durch k unterscheidbare Kugeln, wobei jede Zelle auch mehrfach besetzt sein kann.

31

Kap. 2: Kombinatorik

Β i i l & p l z l : Das F u ß b a l l t o t o (11er-Wette) i s t e i n B e i s p i e l f ü r eine V a r i a t i o n mit Wiederholung. Für jedes von e l f ausgewählten F u ß b a l l s p i e l e n

(Kugeln)

kann eine der Zahlen 1, 0 oder 2 ( Z e l l e n ) angekreuzt werden, je nachdem ob man auf S i e g der Heimmannschaft, auf Unentschieden oder auf S i e g der G a s t mannschaft s e t z t . Jemand, der keine Ahnung vom Fußball hat und die Zahlen z u f ä l l i g a n k r e u z t , hat 3 1 1 = 3 · 3 . . . . . 3 = 177147 M ö g l i c h k e i t e n des T i p p e n s , von denen nur eine v ö l l i g r i c h t i g i s t . Die Chance e i n e s r i c h t i g e n T i p s Α b e l ä u f t s i c h somit f ü r ihn auf P(A ) = τ Τ π τ γ = 0.00000565

Kann jedes der η verschiedenen Objekte i n der Auswahl von k Objekten höchstens einmal vorkommen, was n a t ü r l i c h k < n v o r a u s s e t z t , so s p r i c h t man von e i n e r VaAiaXion

ohne

W-Le.d&nholung.

8 i i i p - i i l : Die Anzahl der V a r i a t i o n e n ohne Wiederholung von zwei aus den d r e i Buchstaben a, b, c i s t s e c h s , denn es g i b t nur d i e M ö g l i c h k e i t e n ab, a c , ba, bc, c a , cb Allgemein i s t d i e Anzahl der V a r i a t i o n e n ohne Wiederholungen von k aus η Objekten ( n ) k = n · (n - 1) · . . . ·

("-k+D^-f^^r

da es f ü r d i e Besetzung des e r s t e n R e i h e n p l a t z e s η M ö g l i c h k e i t e n , f ü r die Besetzung des zweiten P l a t z e s η - 1 M ö g l i c h k e i t e n k-ten Platzes n - k + 1 Möglichkeiten

f ü r d i e Besetzung des

gibt.

Eine V a r i a t i o n ohne Wiederholung e n t s p r i c h t im Z e l l e n - K u g e l - M o d e l l

gerade

der Besetzung von η unterscheidbaren Z e l l e n durch k unterscheidbare

Kugeln,

wobei in jeder Z e l l e höchstens eine Kugel l i e g e n d a r f . Siliplit:

Bei der 3 e r - E i n l a u f w e t t e beim Trabrennen mit 10 Pferden

(Zellen),

d i e von 1 b i s 10 durchnumeriert s i n d , gewinnt man ( E r e i g n i s A ) , wenn man d i e e r s t e n d r e i P l a z i e r u n g e n (Kugeln) r i c h t i g g e t i p p t hat. Es g i b t ( 1 0 ) 3 = 10 · 9 · 8 = 720

32

Kap. 2: Kombinatorik

mögliche T i p s , von denen e i n e r r i c h t i g i s t , so daß d i e Gewinnchancen P(A) = 7 ^ = 0.0014 = 0.14% b e t r a g e n , wenn man z u f ä l l i g

setzt.

Betrachten w i r noch e i n w e i t e r e s BeXipizl:

Beispiel.

In einem Raum befinden s i c h k n a t ü r l i c h unterscheidbare

Personen.

Wie groß i s t dann d i e W a h r s c h e i n l i c h k e i t des E r e i g n i s s e s A , daß mindestens 2 Personen am g l e i c h e n Tag Geburtstag haben, wenn man S c h a l t j a h r e v e r n a c h l ä s s i g t , d . h . wenn man von η = 365 Tagen im Jahr a u s g e h t ? Da die Personen (Kugeln) u n t e r s c h e i d b a r s i n d und g l e i c h e Geburtstage mögl i c h s i n d , i s t die Anordnung der Geburtstage der Personen e i n e V a r i a t i o n mit Wiederholung von k aus η = 365 Tagen, so daß g i l t k 365

= A n z a h l möglicher Geburtstagsanordnungen von k Personen = A n z a h l möglicher

Fälle

Das zu Α komplementäre E r e i g n i s Ä b e s a g t , daß a l l e k Personen an u n t e r s c h i e d l i c h e n Tagen Geburtstag haben. Die Zahl der F ä l l e , in denen Ä e i n t r i t t , somit die Anzahl der V a r i a t i o n e n ohne Wiederholung von k aus η = 3 6 5 d.h. (365). = A n z a h l der f ü r Ä g ü n s t i g e n F ä l l e

Somit e r g i b t s i c h d i e gesuchte W a h r s c h e i n l i c h k e i t zu (365) P(A) = 1 - P(Ä) = 1 365

f

k

Benutzt man zum Rechnen die Abschätzung

so e r g i b t s i c h zum B e i s p i e l

für

ist

Objekten,

Kap. 2: Kombinatorik

(365) k = 30 :

P(A) = 1

365

- ^ > 1- e "

/JU

33

^ =1-0.304

= 0.696 = 69.6%

k = 50 :

(365)™ ^ > 1- e 365 "

P(A) = 1

= 0.965 = 96.5%

k = 100 :

< JWb ö\ ^ 'inn

P(A) = 1

365

/JU

=1-0.035

, 100-99 Tin— /JU

1-e

= 0.9999987 = 100%

= 1 - 0.0000013

.

Wieviel Personen müssen nun mindestens im Raum s e i n , so daß man bei einer Wette mit einer S i c h e r h e i t von mindestens 50% gewinnt? Gesucht i s t das k l e i n ste k d e r a r t , daß g i l t . k ( k - 1) P(A) > 1 - e

T3Ü

~

> 0.5

Die Ungleichung k ( k - 1) 1- e i s t i d e n t i s c h mit . k(k - 1) "73ΪΓ

, < 0n . 5

und diese i s t wiederum identisch mit - k ( k - 1 ) / 730 < I n 0.5 - k 2 + k < 730 · In 0.5

bzw. bzw.

k 2 - k > - 730 · In 0.5 Durch quadratische Ergänzung e r g i b t s i c h dann ( k - ^ ) 2 > - 730 · I n

0 . 5 b z w .

k - j - > \ / - /30 · In 0.5 + 0.25

bzw.

34

Kap. 2: Kombinatorik

k > v - 73D · I n 0.5 + 0.2b

+ 0.5 = 22.99

,

d . h . d i e gesuchte Mindestzahl von Personen i s t k = 23 .

_ J

3. Kombinationen Werden k Objekte aus η verschiedenen Objekten ausgewählt, ohne d i e Auswahlr e i h e n f o l g e zu beachten, so s p r i c h t man von e i n e r Kombination neten

Probe

oder

Kann jedes Objekt auch mehrfach ausgewählt werden (dann i s t k > n so h e i ß t d i e Probe eine Kombination

Beispiel:

ungeord-

von k aus η Objekten.

mit

möglich),

Wiederholung.

Aus den d r e i Buchstaben a , b, c werden zwei Buchstaben ohne Be-

r ü c k s i c h t i g u n g i h r e r Reihenfolge a u s g e w ä h l t , wobei d i e G l e i c h h e i t der b e i den Buchstaben möglich i s t . Es g i b t sechs M ö g l i c h k e i t e n aa, ab, ac, bb, bc, cc e i n e r solchen Kombination mit Wiederholung von zwei aus d r e i Generell

Buchstaben

i s t die Zahl der Kombinationen mit Wiederholung von k aus η Objekten

gerade (n + k - 1)

k

k!

(n + k - 1) · ( n + k - 2) · . . . . η 1.2 k

was man s i c h wie f o l g t ü b e r l e g t . E i n r e c h t e c k i g e r Kasten werde durch η - 1 p a r a l l e l e , bewegliche Zwischenwände, d i e u n t e r s c h e i d b a r s i n d , in η Z e l l e n unterteilt.

In d i e s e Z e l l e n werden dann i n b e l i e b i g e r Anordnung k u n t e r -

scheidbare Kugeln g e l e g t . B e t r a c h t e t man d i e n - 1 Zwischenwände und die k Kugeln a l s n + k - 1 unterscheidbare Symbole, d i e a l l e b e l i e b i g i n n e r h a l b des Kastens nebeneinander angeordnet werden können, so g i b t es (n + k - 1)^ mögl i c h e Lagen der k Kugeln i n n e r h a l b d i e s e r Anordnung, was gerade der Anzahl von V a r i a t i o n e n mit Wiederholung von k aus n + k - 1 Objekten e n t s p r i c h t . Da d i e Reihenfolge der Kugeln keine R o l l e s p i e l e n s o l l , f a l l e n j e w e i l s k! der V a r i a t i o n e n zu e i n e r Kombination zusammen, denn k! i s t d i e Anzahl

möglicher

Permutationen der k Kugeln.

Im Z e l l e n - K u g e l - M o d e l l

l ä ß t s i c h eine Kombination mit Wiederholung auch a l s

Zuordnung von k ununterscheidbaren Kugeln zu η unterscheidbaren Z e l l e n

inter-

Kap. 2: Kombinatorik

35

pretieren, wobei Mehrfachbesetzungen der Zellen möglich sind. Be-capi.il: Ein Schiff führt zur Signalgabe jeweils zwei blaue, grüne, schwarze, rote, gelbe und weiße Wimpel mit. Zwei aufgezogene Wimpel bilden jeweils ein Signal, wobei die Reihenfolge der Wimpel keine Rolle spielen darf, wenn die Signale aus jeder Richtung verständlich sein sollen. Wie groß i s t die Anzahl möglicher Signale, die das Schiff geben kann? Da Wimpel in 6 Farben mitgeführt werden, handelt es sich hier um die Bestimmung der Zahl möglicher Kombinationen von 2 aus 6 Objekten mit Wiederholung, d.h. die Anzahl möglicher Signale i s t (6 + 2 - 1 ) 2

7-6 42

21

_ J

Setzt man k0

,

Fx(-oo) = 0

P({X>x}) = 1 -Fx(x)

,

,

Fx(~)=1

P i = P(X = x i ) = F x ( x i ) - F x ( x i . 1 )

und Fw(χ) i s t von rechts s t e t i g , d.h. lim F y (x + 6) = F y ( x )

für 6 > 0 .

B & l i p M : Bei einer Serie von η unabhängigen Versuchen unter konstanten Versuchsbedingungen interessieren die komplementären Ereignisse ß und Β (z.B. Erfolg und Mißerfolg, gut und schlecht). Beschreibt man das Ergebnis des i-ten Versuchs durch die 0-1-wertige Zufallsvariable

Y.

1, f a l l s Β e i n t r i t t 0, f a l l s Β e i n t r i t t

für

i=1..,n

Kap. 3: Zufallsvariable und Verteilungen

43

SO i s t Π X = 7 n

1 =1

Y. 1

gerade diejenige Z u f a l l s v a r i a b l e , die beschreibt, wie o f t das E r e i g n i s Β bei η Versuchen eingetreten i s t . Die möglichen Realisationen von X n sind dann die Werte x^ = 0, x 2 = 1 , . . . , χ η + ^ - η .

I s t nun P(B) = P(Y i = 1) = p > 0

f ü r i = l . . . . ,n

,

so i s t P(B) = P ( Y i = 0) = 1 - p = q > 0

und

ρ+q=1

Wir i n t e r e s s i e r e n uns dann z.B. für die W a h r s c h e i n l i c h k e i t , daß bei den η Versuchen höchstens k-mal das E r e i g n i s Β e i n t r i t t , a l s o f ü r k F x (k) - P ( { X n < k}) = J

P(X n = i )

,

d.h. wir benötigen die Wahrscheinlichkeit P(X

= i ) für i = 1

k .

I s t η = 2, so g i b t es v i e r mögliche Auskommen der V e r s u c h s s e r i e , nämlich BB , BB , BB und BB , so daß s i c h wegen der Unabhängigkeit der Versuche und wegen P(B) = p , P(B) = q e r g i b t : P(X 2 = 0) = q 2

,

P(X 2 = 2) = p 2

.

P(X 2 = 1) = q · ρ + ρ · q = 2pq

und

Bei den acht möglichen Auskommen BBB , BBB , BBB , BBB , BBB , BBB , BOB im F a l l e n = 3 erhalten wir

und

666

44

Kap. 3: Zufallsvariable und Verteilungen

P(X 3 = 0) = q 3

P(X 3 = 1) = pq2 + qpq + q 2 p = 3pq2

,

P(X 3 = 2) = p 2 q + pqp + qp 2 = 3p2q

und

3 P(X 3 = 3) = p'

Allgemein ergibt sich

d.h. die Verteilungsfunktion der diskreten Zufallsvariablen X i s t η

η

i

, x ^


(X1

x

n > = P ( X 1 ί X1 \ X

*n - x n ' ••·

1 i - X1

x

Σ

P(Xi=x,i

X

n

heißt, wenn die möglichen Realisationen von Xj für j=1,...,n gerade Xj2>

x

j 3 » · · · sind. VeAJteAMmgiiunktLon

texXung

des Zufallsvektors (X^

dit

= x

ni ^

ni - xn

gemz-üuamn,

n-cLummionatzn

X n ) . Die Verteilung der

Xjp VeA-

Zufallsvariablen

Xj, die auch R a n d v e A t z - L t u n g von Xj heißt, ergibt sich dann gerade zu

52

Kap. 3: Zufallsvariable und Verteilungen

p ( V

Fx ( X j ) = l l l j J X J. . < X .J k=1 *=1

J

x

j i ' V

*

J

Entsprechend nennt man im F a l l e i t z t i q u i Z u f a l l s v a r i a b l e n [stetige]

die

Funktion F

(x1

χη) = Ρ ( Χ

Xn)(x1

ΐίχ1

X1

xn

• ί - ί —CO

d i e ViitoJXangi(5imktioη Funktion f j y (X^,...,Xn).

(X1,...,Xn)(u1

^ j ( x ^ » . . . . x n ) auch gmelmame Die RandcUchte.

' *

f

l

-

Un}

du

1"-dun

—00

dzn gemeinsamen VeAteXZung

OO

W

W

und d i e n i c h t - n e g a t i v e des Z u f a l l s v e k t o r s

Vichtz

der V e r t e i l u n g von X j i s t dann gerade

00

l

f

-oo

(xr...,xn)

( u

1

Y l ' W l

-oo

un

du1...duj.1duj+1...dun

ß z l i p l i t : Wir b e t r a c h t e n d i e Z u f a l l s v a r i a b l e n X^ und X 2 m i t der gemeinsamen Dichte

,füra 2b

=

2

-—7. f du, 2 (b-a) J x^-b

— y C Z b - x .1) (b-a)

Kap. 3: Zufallsvariable und Verteilungen

55

Schreibt man 1

· (x, - 2a)

, für 2a < x, < a + b •

- — · (2b - χ , ) 1 (b-a)

, für a + b < x, < 2b "

0

, sonst

T

(b-a)2

yv

1

in der äquivalenten Form

,

f T

,

ί f I j · ( 1 - ^ ·

Ixr(a

+

b)|)

x/V "\

, für 2a-3T =

-(λ.+Xj

λ^ 7T

"(λ1 + X 2 )

1

)

, λ1 + λ, X j

'{ —

e

d.h. die Verteilung von +

vj

'(φ

(x, + x 2 ) J

X = X1

/λ.

e

)

-(λ 1 + χ 2 )

Χ = Y^ + Y 2

ist eine Poissonverteilung mit Parameter

X2.

_ J

ÜBUNGSAUFGABEN ZU KAPITEL 3

Aufgabe 5.1: Zwischen einem Produzenten von Transistoren und einem Hersteller von Fernsehgeräten wird vereinbart, daß bei der Eingangskontrolle nicht mehr als 10% der Transistoren defekt sein dürfen. Der Hersteller entnimmt und überprüft zur Kontrolle dieser Vereinbarung 10 Transistoren. a) Wie groß ist die Wahrscheinlichkeit, daß eine Lieferung zurückgewiesen wird, wenn der Lieferant weiß, daß 5% der Transistoren defekt sind? b) Mit welcher Wahrscheinlichkeit wird eine Lieferung angenommen, obwohl 20% der Transistoren defekt sind?

Kap 3: Zufallsvariable und Verteilungen

$0

Aufgabe 5.2: Eine Zufallsvariable X besitzt die Dichte

c · (2x

- 3)

, für

2)

,

P({X < 3})

,

P({3 < X < 5})

.

Aufgabe 3.5: In der Qualitätskontrolle eines Betriebes wurden die Längsschnittabweichungen von η = 3 0 Werkstücken gemessen, vgl. Tab.

Tab. 2: Längsschnittabweichungen x.

i

1 2 3 4 5 6 7 8 9 10

X.

1

2.65 -1.37 -0.24 0.73

1.47 -2.01

2.50 0.07 0.13 -1.46

2.

x , n von η = 3 0

i

X.

i

11 12 13 14 15 16 17 18 19 20

-1.98

21 22 23 24 25 26 27 28 29 30

1

0.31 -0.79 -1.48

1.31 -2.68 0.00

0.36 1.14 -0.87

X

Werkstücken

i

-1.34 -0.12

0.65 -0.73 -1.21

1.54 0.88 -1.41 -0.36 -0.75

Bestimmen Sie Histogramm und empirische Verteilungsfunktion (unter Verwendung von Klassenmitten) als Approximation für Dichte und Verteilungsfunktion der Zufallsvariablen X, welche die Längsschnittabweichungen beschreibt. Verwenden Sie dabei die Klasseneinteilung K^ = (-3 , -1.5] , K^ = (-1.5 , -0.5] , K 3 = (-0.5 , 0.5] , K 4 = (0.5 , 1.5] und K g = (1.5 , 3] .

Kap. 3: Zufallsvariable und Verteilungen

61

Aufgabe 5.4: Bestimmen Sie die Randdichten der Zufallsvariablen X und Y mit der gemeinsamen Dichte

für x,ye[0,4] fx>Y(x,y) = sonst

und berechnen Sie die Dichte der Zufallsvariablen Z = X + Y.

Aufgabe 3.5: Es sei X eine binomialverteilte Zufallsvariable mit Parametern n = 3 und ρ = 0.3 und Y eine von X unabhängige Zufallsvariable mit Dichte

e~y

, für y > 0

fY(y) = [ 0

, sonst

d.h. Y ist exponentialverteilt mit Parameter λ = 1 . Bestimmen Sie die Verteilungsfunktion der Zufallsvariablen Z = X + Y.

Aufgabe 3.6: Berechnen Sie die Randverteilungen der Zufallsvariablen X und Y mit

P(X = k , Y = j) =

0.512 Τ Π Τ '

0

wobei e = e

1

= 2.718—

0.25*

, für k=0,1,2,3 und j=0,1,2,...

, sonst

ist, und bestimmen Sie die Wahrscheinlichkeiten P(Z = z)

für die Zufallsvariable Z = X + Y.

Kapitel 4: Kenngrößen von Zufallsvariablen

Wir wollen in diesem Kapitel einige Kenngrößen von Zufallsvariablen bzw. deren Verteilung betrachten. Solche Kenngrößen beschreiben zum Beispiel die Lage oder die Streuung einer Zufallsvariablen bzw. ihrer Realisationen oder auch den Zusammenhang zwischen abhängigen Zufallsvariablen.

1. Der Erwartungswert einer Verteilung Der EAMvUungiuMX oder HiXteluieAt

beschreibt das durchschnittliche Auskom-

men einer Zufallsvariablen X und entspricht dem Schwerpunkt in der Mechanik. Im Falle seiner Existenz i s t er definiert als

E(X)=

00 I x i ·Ρ(Χ = χ.)

A -1

1

1

f a l l s X eine diskrete Zufallsvariable mit Realisationen X|, x ^ , . . . i s t , bzw. als αο

-oo f a l l s X stetig mit Dichte f x ( x ) i s t . Er e x i s t i e r t , wenn obige Reihe absolut konvergiert bzw.

wenn

oo

e x i s t i e r t . Häufig schreibt man statt E(X) auch μ bzw. μ, X"

BeJ-ipiet: (a) I s t X itmdaAdnomalve.'tf&M ist

(kurz: X ^ N ( 0 , 1 ) ) , d.h. die Dichte von X

64

Kap. 4: Kenngrößen

fY(x)

=Φ(Χ)

x

so e r g i b t

e"x

\/2i

/2

sich

E(X)=

J

χ · —ί- e \/Zi

1

x

dx

IxI · e " x

/2

dx - {

Μ

-x /2 dx · e"x

0

--

(b) I s t X txponmtial\iz>Uiitt

mit Parameter λ > 0 (kurz: Χ ^ Ε χ ( λ ) ) , d . h . be-

s i t z t X d i e Dichte

Xe

λχ

für χ > 0

fx(x) = für χ < 0

so

ist

χ λ ε " λ χ dx

E(X) = | U

e •

[

»



(

-

«

u

0

-λχ

. dx

» • ( - ! )

OD = (0-0)+]·

| f x ( x ) dx = l .

1 = λ

(c) Genügt d i e d i s k r e t e Z u f a l l s v a r i a b l e X e i n e r Po^aonveAtexlung mit Parameter λ (kurz: X ^ P o ( X ) ) , so

P(X = j ) = 4 r e" A und w i r

ist

für j=0,1,2,...

,

erhalten

E(X>=

I j=o

J

-

I j=i

λ

xj"1

. u

„-λ. =

J X -λ λ e A = = λλ ·* 11 ==λλ I ^ e" .. J j=o · I

Kap. 4: Kenngrößen

Für den Erwartungswert gelten die folgenden Rzch.ervie.getn. variable

Y = g(X)

Ist die Zufalls-

definiert als Funktion der Zufallsvariablen X, so gilt

für den Erwartungswert von Y, wenn er existiert, OD

E(Y)= | g(x) · f x (x) dx

,

-a>

falls X stetig mit Dichte ίχ(χ) verteilt ist, und

E{Y) = l

g(x ) · P(x = x i )

i=1

1

,

1

falls X diskret mit Realisationen x^, x 2 > Υ = αΧ + β

x

3»···

speziell für

(α, Β reelle Zahlen)

ergibt sich hieraus E(Y) = α · E(X) + β

(LineivUXiU

Weiterhin gilt für η Zufallsvariablen

dei

BmaAXungiuieitei).

mit existierenden Erwar-

tungswerten E(X1 + X 2 + ... + X n ) = E(X 1 ) + E(X 2 )+ ... + E(X n ) und, falls X^,...,X

stochastisch unabhängig sind,

E(X, · X 2 - . . . · Χ η ) - Ε ( Χ 1 ) · Ε ( Χ ζ ) · ...·Ε(Χ η )

.

2. Die Quantile einer Verteilung Ein weiteres neben dem Erwartungswert gebräuchliches Lagemaß ist der Median ξβ g , für den gilt

P(X

- ζ 0.5 } - °· 5

und

p

(xi£0.5)-0·5

'

wenn X irgendeine Zufallsvariable ist. Allgemein nennt man für a e (0,1) die Größe ξ mit et P(X < ξ ) > α

und

P(X > ξ ) > 1 - α

65

66

Kap. 4: Kenngrößen

das α - QuantiZ oder

(I - o ) - fiaktit der Verteilung der Zufallsvariablen X.

Ist die Zufallsvariable X stetig mit der Dichte fyix) verteilt, so gilt ξ, 'α -co d.h. das oe-Quantil 'Kurve' von

ξ^ ist derjenige Wert, so daß die Fläche unterhalb der

und oberhalb der x - A c h s e gerechnet von

bis zum Wert ζ(

gerade die Größe α besitzt.

Ist hingegen X diskret, so gilt Fx(5a)>a

und

F^(x) 0 und Varianz σ ) den Va/UatLomkoeHizienten ν = σ/μ

.

b I s t X eine Zufallsvariable, so nennt man allgemein E(X ) (also den Erwarte k tungswert von X ) das k-te Moment von X und E ( X - E ( X ) ) das k-te zentAate Moment von X. Der Erwartungswert einer Zufallsvariablen X i s t also gerade ihr erstes Moment und die Varianz von X i s t das zweite zentrale Moment von X. Im folgenden setzen wir stets die Existenz der jeweiligen Momente voraus, wenn wir sie verwenden.

4. Kovarianz und Korrelation Kovarianz und Korrelation sind Maße für den Zusammenhang von zwei Z u f a l l s variablen X und Y. Die KovaJvLanz i s t dabei gerade Cov(X.Y) = σ χ γ = E[(X - E(X))(Y - E(Y))] = E(XY) - Ε(X) · E(Y)

,

Kap. 4: Kenngrößen

wobei sich der Erwartungswert von XY, im Falle seiner Existenz, zu CO CO E(XY)= |

| xy · f ( X > Y ) ( x . y ) dx dy

ergibt, wenn ί χ y(x,y) die gemeinsame Dichte des Zufallsvektors (X,Y) i s t , bzw. zu CO oo E(XY) = l l x,y, •P(x = x i ,Y = y i ) 1 3 i = 1 j=1 1 J ergibt, wenn X und Y diskrete Zufallsvariablen mit Ausprägungen x^, x^,... respektive y^, y ^ . . . . sind.

ßexip-LeZ: Wir wollen die Kovarianz

Cov(X,Y) der Zufallsvariablen X und Y

mit der gemeinsamen Dichte

1

f(x>Y)(x,y) =

(b-a)

2

0

, für a < y < b und

a+y

2b ( x 2 - 2ax) dx +

2a

|

( 2 b x - x 2 ) dx

a+b 2b

1 3 2 3 χ -ax

1

a+b

(b-a)' ( b - 1a ;

(b-a)

τ

7

( ( j (a + b ) 3 - a ( a + b ) f (\

2

- § a

+ ^4b

2

+^

(

f

(a

3

-| b3-b(a + b)

+ b ) - - j (a + b ) "

3

+ 4a3)

(a + b ) 3

dx

73

Kap. 4: Kenngrößen

1 — - · (a 3 + b 3 - a 2 b - a b 2 ) (b - a) : a + b

E(Y)= J

yfy(y)

dy= j

-00

y ·^

l [ a > b ] ( y ) dy

-00

•ΪΜ'^ΊΓΜ}'1]!·*^»'" a

a + b

ergibt sich Cov(X.Y) = E(XY) - E(X) · E(Y) _3(a + b ) 2 ( b - a ) + 4 ( b 3 - a 3 ) 12(b - a)

, a +b (a + b) · —

_ 4 ( b 3 - a 3 ) - 3(a + b ) 2 ( b - a) 12(b-a) . (b-a)3 ~ 12(b - a)

^ • ( b - a )

2

.

Im Gegensatz zur Kovarianz ist die

Corr(X,Y) = p YXY -

J

KovizlcuUon

X Yσ γ σ j j° ·

ρ zweier Zufallsvariablen X und Υ mit Varianzen

ρ > 0 und O y > 0 ein normiertes

Maß für den Zusammenhang zwischen X und Y ; die Korrelation nimmt stets Werte im Intervall

[-1.+ 1] an. Ist Ρ χ γ = 0, so sagt man auch "X und Υ sind iwfeo/iAe-

tie.>U"·, für ρ χ γ = 1 besteht eine positive, strikt lineare Beziehung X und Y, für Ρ χ γ -

ein

zwischen

e negative, strikt lineare Beziehung. Weitere Aus-

führungen hierzu findet man im Kapitel

9.

Für die Berechnung von Kovarianzen gelten die folgenden Rechen*ege£n: Cov(aX + β,γΥ + δ) = cryCov(X,Y)

74

Kap. 4: Kenngrößen

Covix, + X 2 , Y ) = Cov(X,,Y) + Cov(X 2 ,Y) Cov(X,Y 1 +Y 2 ) = COV(X,Y 1 )+COV(X,Y 2 )

,

wobei Χ, Υ, Χ^, X 2> Y^ und Y 2 Z u f a l l s v a r i a b l e n und α, 8, γ , S r e e l l e Zahlen sind. Unter Verwendung der Kovarianzen kann auch die VajUanz gigen Z u f a l l s v a r i a b l e n X 1

dzA Summe von abhän-

X n bestimmt werden:

Var(X. + . . . + X ) = l V a r ( X . ) + 2 \ J 1 i=1 i = 1 j=1 i e ) Var(X

3-1 σ'

)

für alle Zahlen e > 0 ;

man sagt auch, X n konvtLnyivut

gegen μ.

AtochaitUch.

Konkret besagt das Gesetz der großen Zahlen, daß sich das durchschnittliche Ergebnis von η unabhängigen Zufallsexperimenten mit wachsender Zahl η von Versuchen immer besser beim wahren Mittelwert

stabilisiert.

Oft kann eine eigentlich interessierende Zufallsvariable Y nicht direkt beobachtet werden. Vielmehr ergibt sie sich als Funktion anderer, beobachtbarer Zufallsgrößen. Beispielsweise werden Rechtecksflächen durch Multiplikation der Seitenlängen, Geschwindigkeiten durch Division von Weg durch Zeit und spezifische Gewichte durch Division von Masse durch Volumen ermittelt.

Das VihZzi( i onXpilanzuyig6gue.tz erlaubt nun die approximative Bestimmung von Varianz (und Erwartungswert) einer Zufallsvariablen Y, die sich als Funktion anderer Zufallsvariablen Χ.,,.,,Χ

ergibt,

Y = f(X.,...,X ) η falls f(Xj,...,X

η

) nach den X· differenzierbar ist. Und zwar ist

E[f(X1,...,Xn)]=äf(M1,...,yn) η Varmx,,...^)].

^

und

3f

3X7 i 1

Χ=μ

78

wobei

Kap. 4: Kenngrößen

u.j u n d σ^ d e n E r w a r t u n g s w e r t

b z w . d i e V a r i a n z v o n X^ ( i = 1 , . . . , n )

σ · . d i e K o v a r i a n z von X. und X . ( i , j = 1 , . . . , n , i < j ) b e z e i c h n e n ; J J 3f I steht jyf ü r die p a r t i e l l e Ableitung der Funktion f(X. 1 i Χ=μ i X i an d e r S t e l l e ( X , XR) = (μ, μη).

Es e r g i b t

sich,

v g l . auch A b s c h n i t t e

Y = X,|+X2

:

1 und 4 , z . B .

Ε ( Υ ) = μ^ + μ 2

und

weiterhin X ) n

nach

für

und

Var(Y) = 12 · σ 2 + I 2 · σ2 + 2 · 1 · 1 · σ , 2

2 σ1

2 2

+ σ

, falls

2 2 σ^ + 02 + 2 σ ^ 2

Υ = x i - Χ2

:

Ε(Υ) = μ,



σ

2 1

2

+ ( - 1 ) 2 · σ2

2

:

Ε(Υ)~μ

Γ

μ

+

,

2 2 V a r ( Y ) = ^ 2 · o 2 + μ, · ο 2 + 2μ,

μ

Y = x1 / X2

:

2 · 1 · (-1) · σ12

Χ ^ , Χ2

unabhängig

sonst

, mit exakter Gleichheit, X^ u n d Xg u n a b h ä n g i g ,

2

μ

sonst

, falls

σ2

2 2 σ^ + σ 2 - 2 σ ^ 2

Υ = Χ, · Χ2

unabhängig

und

2

Var(Y) = 12 .

,

Xj,

2

2

2, ·ο, +

2 2 '

μ ι

2

2 · 2 02 , f a l l s

2

·σ

1 2

Χ^

Χ2

2 ο σ2 + 2μ1 · μ 2 · σ 1 2

σ1

E ( Y ) Ä μ^ / μ 2

·μ

falls

unabhängig

, sonst

und 2

Var(Y) ä - ^ · · σ2 + μ2

1 2.9 1 · Τ • σ 2, + Ζ · — μ2 μ2 μ

"

V " .

μ

1 ' 2

σ12

79

Kap. 4: Kenngrößen

1

1

1 Τ '

1 "Ζ* μ

μ

2

2 2

σ,1 +—rrΖ · Οο2 μ.

f a l l s Χ^

12

unabhängig

, sonst

2

iexApiit: Die Höchstgeschwindigkeit Υ eines PKW - Typs wird aus dem Weg X^ und der Zeit X~ ermittelt. Sind Erwartungswert bzw. Varianz von X, und X, 2 2 ? ? nun u 1 = 1000 m, u 2 = 2 0 sek, bzw. σ] = 4 m , σ ^ 0.09 sek und i s t die Kovarianz von X 1 und X 2 gerade σ 1 2 = 0.1 m - s e k , so ergibt sich wegen Y = X 1 / X 2 dann 50 m

E(Y) =* ^ / U 2

/sek

=

3600 · 50 m / h

= 3.6 · 50 km / h = 180 km/h sowie

2

Var(Y) ~ U2

1

(4 + 225 - 5)

224 m 400 sek

μ

μ

1

σ,, 12

2

.2 1000 m 4 πϊ2 , 1000000 m' £-•0.09 s e k ' 0 . 1 400 sek

1

400 sek 1

2

J« + —ö Ολ 1 y2 2

2

0.56

m . sek

m2 sek .2

sek

d.h. die Standardabweichung σ γ = v^Var(Y) vom Erwartungswert 180 km/h der Höchstgeschwindigkeit beträgt σγ~

m/ sek^0.748 m/ sek = 3.6 · 0.748 km/h

= 2.6928 km/h

,

also ca. 2.7 Stundenkilometer.

J

Werden Erwartungswerte, Varianzen und Kovarianzen von Zufallsvariablen erst aufgrund von Experimenten "geschätzt", v g l . Kap. 6, so können die Schätzungen a l s Näherung anstelle der theoretischen Größen im Fehlerfortpflanzungs-

80

Kap. 4: Kenngrößen

gesetz eingesetzt werden.

ÜBUNGSAUFGABEN ZU KAPITEL 1

Aufgabe n.l: Bestimmen Sie Erwartungswert und Varianz der Zufallsvariablen X mit der Dichte

c · (2x2 - 3)

, für 2 < x < 7

f x (x) )

, sonst

vgl. auch Aufgabe 3.2.

Aufgabe 4.2: Berechnen Sie für die diskreten Zufallsvariablen X und Y, deren gemeinsame Verteilung aus Tab. 1 ablesbar ist, die Erwartungswerte, Varianzen, Mediane sowie obere und untere Quartile und bestimmen Sie die Kovarianz sowie die Korrelation von X und Y.

Tab. 1: Gemeinsame Verteilung der Zufallsvariablen X und Y



P(X=i , Y=j)

j

1

2

3

1

0.1

0.2

0.1

2

0.3

0.2

0.1

Kap. 4: Kenngrößen

81

Aufgabe 4.5: Bei einem Spiel mit einem fairen Würfel kann man auf die Ereignisse Zahl" bzw. "ungerade Zahl"

"gerade

, "eine der Zahlen 1,2,3" bzw. "eine der Zahlen

4,5,6" sowie auf jede einzelne Zahl von 1 bis 6 setzen. Man gewinnt bei den erstgenannten Zahlen das Doppelte seines Einsatzes und bei richtig gesetzter Zahl den 5 - fachen Einsatz. Sie spielen 21-mal und setzen stets 1 DM auf "gerade Zahl", 1 DM auf "eine der Zahlen 4,5,6" und 1 DM auf die Zahl 4. Welchen Gewinn haben Sie zu erwarten?

Aufgabe H A : Die Haltbarkeit von H - M i l c h beträgt im Mittel 90 Tage; lediglich 5% der Packungen sind höchstens 85 Tage brauchbar und 7% der Packungen sind mindestens 95 Tage haltbar. Was können Sie Uber die Varianz der Haltbarkeitsdauer

aussagen?

Aufgabe 4.5: Die durchschnittliche Lebensdauer eines Batterietyps beträgt 45 Stunden mit einer Standardabweichung von 5 Stunden. Welche Abschätzung für Mittelwert und Varianz der logarithmierten

Lebens-

dauer, deren Verteilung Sie besser im Griff haben, können Sie geben?

Kapitel 5: Einige spezielle Verteilungen

Um ausgehend von Beobachtungen an einer Stichprobe von η Objekten Aussagen über das Verhalten des an ihnen beobachteten Merkmals in der Gesamtheit aller interessierenden Objekte, machen zu können, unterlegt man oftmals ein Verteilungsmodell, d.h. man nimmt an, daß die η Beobachtungen *|

*

Re-

alisationen von unabhängigen, identisch verteilten Zufallsvariablen Xp...,X

sind. Die hier am häufigsten unterlegten Verteilungstypen der Zu-

fallsvariablen Χ.,.,.,Χ

wollen wir im folgenden kurz vorstellen.

1. Die Normalverteilung und daraus abgeleitete Verteilungen 1.1

DIE

N O R M A L V E R T E I L U N G

DER

Z E N T R A L E

UND

G R E N Z W E R T S A T Z

Die in der Statistik wohl wichtigste Verteilung ist die Noima.lvZuteilung. ο Eine Zufallsvariable X heißt normal verteilt mit Parametern μ und σ (kurz: X-V- Ν(μ, σ 2 )), falls ihre Vichtz

. (x^uli f x (x):

- -— · e \/Έϊ·

2

°

ist, vgl. auch Abb. 1. Die Kurve von und besitzt an der Stelle μ - σ

(χ) ist symmetrisch um den Wert μ

sowie μ + σ

Wendepunkte, vgl. auch Abb. 1.

ο Ist Χ%Ν(μ,σ ), so ist weiterhin Υ =αΧ + 0-\,Ν(οψ + β,α 2 σ 2 ) wobei α und β reelle Zahlen bezeichnen, und sind X.

X

unabhängige Zu-

84

K"P S: Spezielle Verteilungen

o.c

Abb.

1: Dichte ί χ (χ) der N(81,0.5) - , N(81,1) - und N(81,2) - Verteilung

2 fallsvariablen derart, daß für i = 1,... ,n gilt X i

l η



»i · η

ιΌ

, σ^), so ist

·

ρ Die VeAteXhingiFunktion

der Ν(μ,σ ) - V e r t e i l u n g

χ F x ( x ) = | f x (u) du

, vgl. Abb.

2 ,

-00

ist nicht analytisch bestimmbar, jedoch ergibt sich wegen Ε (X) = μ

und

Var(X) = o"

d.h. die Normal Verteilung ist vollständig durch ihren EiuxvutungiuieAt ihre VcuuAnz variable γ

und

charakterisiert, daß die zu X gehörige standardisierte Zufalls-

_X-μ σ

einer StandaAdnonmtveAteXZung

N(0,1) mit der tUcfcte

Kap. 5: Spezielle Verteilungen

(y) =

f

ip(u) du = 1 - 4>(-y)

in der Tab. 1 des Anhangs vertafelt ist. Aus der Verteilungsfunktion bzw. Dichte der N(0,1)- Verteilung können dann beliebige Werte der Verteilungsp funktion bzw. der Dichte einer Ν(μ,σ ) - Verteilung bestimmt werden: Ρ

χ

(χ)=φ(^)

und

f

x

(

x

, . i . ^ )

.

Auch die a - QuantUe

u mit ψ(υ ) = α der N(0,1)-Verteilung sind für einiqe α α α > 0 . 5 vertafelt, vgl. Tab. 2 im Anhang; aus ihnen ergeben sich die entsprep chenden Quantile einer Ν(μ,ο ) - V e r t e i l u n g zu 2 w (μ,σ ) = ou + μ α α Die entsprechenden

Quantile für ci Ο , v g l . auch Abb. 3

Ο

, für χ < Ο

Abb. 3: Dichte f y (χ) der Lognormal Verteilung mit Parametern μ = 1 und σ

EiuxvUunU

D I E

=0.5

und VtvUxinz von X s i n d dann gegeben a l s

Ε(Χ)=βμ

1.3

2

+

°

2 / 2

,

Var(X)=e2lJ

+ a 2

. (e°2-1)

.

P R Ü F V E R T E I L U N G E N

2 Die P r ü f v e r t e i l u n g e n , a l s da s i n d t - , χ - u n d F - V e r t e i l u n g , s i n d wesentlich bei der Bestimmung von Konfidenzintervallen und bei der Durchführung s t a t i s t i s c h e r T e s t s , v g l . Kapitel 7 und 8. Sind XQ,X.| , . . . ,X n unabhängige, standardnormal v e r t e i l t e Z u f a l l s v a r i a b l e n , so heißt die Verteilung von

die f ü r n > 2 den E w a A t w q m w t E(t) = 0

90

Kap. 5: Spezielle Verteilungen

und f ü r η > 3 d i e 1hvuRnz

Var(t) b e s i t z t (für n = 1 bzw. für n = 1, 2 e x i s t i e r e n Erwartungswert und Varianz n i c h t ) , eine (zentAali)

t - VeAteltung

In der Abb. 4 sind die Dichten

phisch veranschaulicht. Die Quantitz t der t - V e r t e i l u n g g i l t t

n;α ~ _tn;1-α

mit

η Fn^ihextigiadzn

f ( x ) der t 2 η ;α

(kurz: t ^ t

).

und t^Q - Verteilung gra-

V für die aufgrund der Symmetrie

'

sind in der Tab. 3 des Anhangs v e r t a f e l t .

2 Die zweite wichtige PrUfverteilung i s t die χ - V e r t e i l u n g . Sind X 1 unabhängige, N ( 0 , 1 ) - v e r t e i l t e Z u f a l l s v a r i a b l e n , so genügt 2 X

5

Ι

v2

2

ο

einer (ze.nViale.n) χ - Vvctzilung E>wxvitungmeAt

und Va/Uanz

mix η Fiex.hiiXigiaden

gegeben sind a l s

(kurz: χ

p

^x^),deren

Kap. 5: Spezielle Verteilungen

Ε(χ2) = η d i e QuantiZz

χ

2

V a r ( y 2 ) = 2n

und

;

2

der χ - V e r t e i l u n g s i n d i n der Tab. 4 des Anhangs v e r t a -

n»et

2

In der Abb. 5 s i n d d i e Vlchtzn

feit.

91

2

2

der χ^ - , χ^ - und χ^ - V e r t e i l u n g

gra-

η kann d i e χ 2 - V e r t e i l u n g durch eine Nor-

p h i s c h d a r g e s t e l l t . Für ' g r o ß e s '

mal V e r t e i l u n g mit Erwartungswert η und Varianz 2n, N(n,2n) a p p r o x i m i e r t werden, d . h . f ü r ' g r o ß e s ' F χ

Abb.

?(x)

η gilt

=P(x2 2 e x i s t i e r t der EiwaAtungAwejtf

M ' n h und für n > 4 auch die VtvUanz

Var(y) =

m(n - 2) (n - 4)

der Zufallsvariablen F. Die QuantUe. F der F - V e r t e i l u n q3 sind für m,n;a m,n einige Kombinationen von m und η sowie für einige α in der Tab. 5 des Anhangs vertafelt und es g i l t

2. Die Gleichverteilung und die Dreiecksverteilung Die GlzlchwUtUluna

U(a,b) auf dem Intervall [a,b] haben wir bereits aus-

führlich in den Beispielen der Kap. 3 und 4 behandelt. I s t X ^ U ( a . b ) , so sind bzw. Vichte.

\Je.nXe.iZungiFunktion

0 F x ( x ) = . jj-rf 1

von X g e g e b e n

, für χ < a 1

· ^r

a-

0 Der EfuMAXangimit

, sonst und d i e Va/Uanz

der Z u f a l l s v a r i a b l e n X s i n d 2

E(X)=^p-

bzw.

Var(X) =

( b

^

a )

und das α - Quantlt i s t f ü r a e ( 0 , 1 ) wegen ζ

- a!

W ' T = T ' * gerade £a=a'(b-a) + a=a-b+(1-a)-a Sind X 1 und X,, unabhängige

,^

- v e r t e i l t e Z u f a l l s v a r i a b l e n , so genügt

die Z u f a l l s v a r i a b l e Υ = Χ^ +X,, e i n e r VieJ-tckAvziXexJiung lung

mit Parametern a und b; d i e Vickte.

l y ^ l )

fy(y); 0

oder

Simpt>on\3inX 9 ( F a u s t r e g e l ) die B(n ,p) - Verteilung durch eine N(np , np(1 - p)) - V e r t e i l u n g , a l s o dusich tintL appioximizmn,

NolmalveAtzilung

d.h. für die Verteilungsfunktion einer B(n ,p) - v e r t e i l t e n Zu-

f a l l s v a r i a b l e n X g i l t dann F v ( x ) = P(X < χ) ο; Φ f x ' W — ) X " V n p ( 1 - p) >

.

B z g l . einer Approximation durch die P o i s s o n v e r t e i l u n g sei auf den nächsten Abschnitt verwiesen.

98

Kap. 5: Spezielle Verteilungen

5. Die Poissonverteilung Die ?o-iA6on\ieAteJMmq

heißt auch die \ZeAX.eJMmg

E^eign-cwe. Sie

deA 6elte.ne.ti

fand Ende des 19. Jahrhunderts bei Bortkiewics' Untersuchung von Todesfällen durch Hufschläge bei der preußischen Armee im Laufe von 20 Jahren eine der schönsten Anwendungen; vgl. z.B. Härtung et al. (1986, Kap. IV). Eine Zufallsvariable X heißt poissonverteilt mit Parameter λ (kurz: Χ ^ Ρ ο ( λ ) ) , falls für j=0,1,2,... gilt

P(x=j ) =yj- β"λ d.h. ihre VeAteJZungi

. ist

Funktion

ι F x (x) = P(X < x) =

Enm/tfungweM.

l jr e j 0 ; F x (x) = 0

fürxvt

.

werden kann die Verteilungsfunktion der Poissonverteilung für

großes λ (Faustregel: λ > 9 ) duAch metern μ = λ und σ 2 = λ: F x (x) = P(X < x ) ^ Φ

Die Po-LuonueAtbUung

die der NotonalveAtiutung

selber kann aZi

Ν(λ,λ) mit Para-

·

Αρρ-ΊοxA/nation deA

B^nomlaZve'uteii.ung

verwandt werden. Ist Χ ^ Β ( η , ρ ) und ist ρ klein, η groß (Faustregel: η > 3 0 ,

Kap. 5: Spezielle Verteilungen

ρ < 0.1), so ergibt sich (GimzuKAtAcutz

P(X=3)~^e"

n p

von

99

Poliion)

für j=0,1,... ,n ,

d.h. die Binomialwahrscheinlichkeiten werden durch die entsprechenden Poissonwahrscheinlichkeiten einer Poissonverteilung mit Parameter λ = n p approximiert.

ÜBUNGSAUFGABEN ZU KAPITEL 5

Aufgabe 5.1: Bestimmen Sie mit Hilfe des Tabellenanhangs die folgenden o - Q u a n t i l e für α = 0.01 , α = 0.05 , α = 0.95 und α = 0.99: u

. a '

2 2 10;α ' τ 17;α ' χ 10;α ' χ 15;α ' h 3,7;a ' V ^ c i

'

Aufgabe 5.2: An einer Fußgängerampel kommen innerhalb einer Minute auf der einen Straßenseite durchschnittlich zwei, auf der anderen durchschnittlich 4 Fußgänger an. a) Mit welcher Wahrscheinlichkeit warten während der Rotphase von 2 Minuten (bei Annahme einer Poissonverteilung) (1) auf jeder Straßenseite mindestens vier und (2) zusammen mindestens vier Leute? b) Bestimmen Sie approximativ die Wahrscheinlichkeit dafür, daß in 500 Rotphasen im Mittel höchstens 11.7 Fußgänger (auf beiden Straßenseiten zusammen) gewartet haben.

100

Kap. 5: Spezielle Verteilungen

Aufgabe

5.5:

In einem Experiment mit 100 Kühlaggregaten aus einer Produktion wurde f e s t g e s t e l l t , daß die mittlere Lebensdauer der Aggregate 2 Jahre beträgt. Berechnen Sie bei Annahme exponentialverteilter Lebensdauern die approximative Wahrscheinlichkeit dafür, daß die Gesamtlebensdauer von 400 Kühlaggregaten aus der selben Produktion kleiner als 750 Jahre i s t .

Aufgabe

5.4:

Bestimmen Sie die a - Q u a n t i l e ξ^ der Po(5) - Verteilung für α = 0.25 , α = 0.5 und α = 0.95.

Kapitel 6: Punktschätzungen für die Kenngrößen und Parameter von Verteilungen Hat man an η Objekten aus einer interessierenden Grundgesamtheit von Objekten z.B. ein oder zwei interessierende Merkmale X und ij gemessen bzw. beobachtet, so können diese Beobachtungen

und y^

yn als Reali-

sationen von jeweils unabhängigen, identisch v e r t e i l t e n Z u f a l l s v a r i a b l e n X , , . . . , X n und Υ^,.,.,Υ

aufgefaßt werden, die der gleichen Verteilung genü-

gen wie die Z u f a l l s v a r i a b l e n X und Y, welche den Merkmalen X und μ zugehör i g sind. Die Schätzung

dm

den. Kenngioßcn

PaAameXii der Verteilungen von X und Y bzw. die

Schätzung

zu diesen Verteilungen e r f o l g t dann natürlich auf der Basis

der Daten χ . , . , . , χ

und y . , . . . , y .

1. Schätzen der Kenngrößen von Verteilungen Sind x ^ , . . . , x n und y ^ , . . . , y n Realisationen von unabhängigen, identisch v e r teilten Zufallsvariablen

bzw. Υ ^ , . , . , Υ , die der gleichen Vertei-

lung wie X und Y genügen, derart, daß das Paar (x^

die Beobachtung zum

Merkmalspaar (X,JJ) am i - t e n Objekt ( i = 1 , . . . , n ) aus der interessierenden Grundgesamtheit d a r s t e l l t , so sind d ie aAAXkmcXAAchen IKvtizZ. oder VuA.chichruXtiuieiXe

-

1

n

- W i ^ i

·

y =

1

n ^

n

y

i

Schätzungen für die EnwaflXungiui&nXe. E(X) und E(Y) der Z u f a l l s v a r i a b l e n X und Y, d.h. Schätzungen für die erwarteten, durchschnittlichen Merkmalswerte in der Grundgesamtheit. Die VcuUanzm Stichprobe

Var(X) und Var(Y) werden durch die ejup-i/Uichm

Vasuanzen

102

Kap. 6: Punktschätzungen

Χ

« V ^ - n M j ,

?"ηί2)

bzw.

d.h. durch die Summe der quadratischen Abweichungen vom jeweiligen Durchschnittswert,dividiert durch die um 1 reduzierte Anzahl der Objekte in der Stichprobe, geschätzt. Schätzungen für Sta.ndan.da.bu)elchu.ngzn bzw.

Vajujutlorn-

koe-ülzimtzn (wenn x^, y ^ O , x , y > 0 ) sind dann natürlich

S

X = vAx

·

S

Y

Schließlich wird die Kovarianz

=

/*Y

bzw

·

v

f

·

v

Y

=

y

Cov(X,Y) zwischen den Zufallsvariablen X und

Y durch

s

XY=TTT i ,

und die KoiKitation

c ^ i - x X v i - P ) =H4-T

v r ™ * )

Corr(X,Y) =p^y als normiertes Maß für die Stärke des Zu-

sammenhangs zwischen X und Υ (zumeist) durch

S5

XY

r x y

" V

s

Y "

_

η I (χ, - χ) · (yi - y ) 1 i=1 ] ra :—η / I ( x1 r 5 ) 2 · l V i=1 i=1

r ( 1y ^ y ) 2

geschätzt, wenn s^, S y ^ O . Wie p^y nimmt auch r^y nur Werte zwischen -1 und +1 an; man vgl. hierzu aber auch Kap. 9. Wir haben hier natürlich stillschweigend vorausgesetzt, daß y^

und

y n Zahlen sind und nicht etwa Farben, Berufe oder ähnliches; aber wir

haben Zufallsvariablen und damit ihre Kenngrößen ja auch nur für solche Fälle definiert. Β e l i p l e £ : Bei η =10 PKW's eines Typs und Baujahrs wurden die bisherige Kilometerleistung X und der von Gebrauchtwagenhändlern erzielte Wiederverkaufspreis y beobachtet. Die Daten χ ^ , . , . , χ ^ und y^

y^Q sind in der Tab. 1

Kap. 6: Punktschätzungen

103

zusammengestellt.

Tab.

1: K i l o m e t e r l e i s t u n g X und W i e d e r v e r k a u f s p r e i s Typs und B a u j a h r s

PKW i

2

1

Kilomet e r l . X.j

4

3

5

y bei η = 1 0 PKW's

7

6

8

9

eines

10

35200 6 2 3 5 0 5 4 1 2 0 2 3 4 8 0 7 5 3 6 0 4 1 2 0 0 5 2 3 4 0 4 5 6 8 0 3 4 7 3 0 6 2 9 6 0 5700

P r e i s y^

3200

4800

5600

2800

4000

4200

B a s i e r e n d a u f d i e s e n Daten w o l l e n w i r E r w a r t u n g s w e r t e lometerleistung schätzen.

4800

-

1

y =

10

1

l

x i = y g · 487420 = 4 8 7 4 2

.f,

= Τ Ο ' « 1 0 0 = 4310

und V a r i a n z e n d e r

5

Υ

9 V-j^

=

Ki-

ΐ ( . ^

x 2 - 10 · ; 2 Ν ) 4 ι } 9

y

i~

10

=

'

d . h . das a r i t h m e t i s c h e M i t t e l e i n e r Standardabweichung

sich

und

,

und d i e z u g e h ö r i g e n e m p i r i s c h e n V a r i a n z e n

X

3100

und des P r e i s e s f ü r a l l e PKW's d i e s e s Typs und B a u j a h r s

A l s Schätzungen f ü r d i e Erwartungswerte ergeben

x = yp

4900

sind

2221863760 = 246873751 .1

und

9509000 = 1 0 5 6 5 5 5 . 5 5 6

der K i l o m e t e r l e i s t u n g e n

b e t r ä g t 48742 km mit

von s ^ = 1 5 7 1 2 . 2 2 km und das a r i t h m e t i s c h e

Mittel

der P r e i s e b e t r ä g t 4 3 1 0 DM m i t e i n e r S t a n d a r d a b w e i c h u n g von S y = 1 0 2 7 . 8 9 DM.

Die Kovarianz zwischen K i l o m e t e r l e i s t u n g schätzt

und W i e d e r v e r k a u f s w e r t w i r d

durch

S

X Y

=

1 / 10 i ( . ^

V i

"

10

*

x y

\ j

=

1 i '

(-129103200) = -14344800

so daß s i c h a l s S c h ä t z u n g f ü r d i e K o r r e l a t i o n ρ γ γ d e r Wert

,

ge-

104

Kap. 6: Punktschälzungen

r r

- SxY - .__'1^4489°_ . X Y ' i " T ^ · - 1 5 7 1 2 . 2 2 · 1027.09 _

ergibt. Da r ^

0 ,m8 8 m 8

sehr stark negativ ist, besteht ein starker negativer

(line-

arer) Zusammenhang zwischen Kilometerleistung und Preis, vgl. auch Kap. 9. |

Kommen wir nun zur Schätzung Mzdian

von

a-

Quantil&n

ξ

und insbesondere auch

vom

(0.5 - Quantil) ξρ g einer Verteilung. Sind an η Objekten die Realisa-

tionen von unabhängigen, identisch verteilten Zufallsvariablen X p . . . , X » die wie X verteilt sein mögen, bzw. die Merkmalsausprägungen

zum

Merkmal * beobachtet worden, so müssen diese Werte x,,...,x zunächst der 1 η Größe nach geordnet werden:

x

(1) - x(2) - " · ί χ ( η )

·

Das α - Quantil ζ α der Verteilung von X wird dann für ae(0,1) ausgehend von dieser geordneten Beobachtungsreihe

Χ/.)

x

( i ) · - - - > x ( n ) geschätzt als

, falls η · α keine ganze Zahl ist: k ist dann die auf η · α folgende ganze Zahl

7(x(k)

+ x

(k+1)'

, falls η · α eine ganze Zahl k=η ·α

ist: dann ist

Speziell für den Median ξ^ ^ läßt sich dieser Schätzer auch in der Form

( x

0.5

((n+1)/2)

'

fa11s

n

un

9erade

:

7(x(n/2)

+ x

((n+2)/2)>

·

fa11s

n

9erade

schreiben, d.h. der empirische Median bzw. der Median einer reihe x ^ , . . . , x n ist der mittlere Wert in der geordneten

Beobachtungs-

Beobachtungsreihe,

wenn η ungerade ist, und das arithmetische Mittel der beiden mittleren Werte in der geordneten Beobachtungsreihe, wenn η gerade ist.

Be-ύpint·.

In einem Laborversuch werden die Lebensdauern von η = 1 0

Kühlschrän-

ken einer Produktion unter extremer Belastung untersucht. Die geordnete Beobachtungsreihe ergab sich dabei zu x { 1 J = 0.15

, X ( 2 ) = 0.34 , x { 3 ) = 0.57

, x ( 4 ) = 0.78 , x ( 5 ) = 1 .13 ,

X ( 6 ) = 1.45 , x ( ; ) = 1 .90 , X ( 8 ) = 2.39 , x ( g ) = 3.18 , x ( 1 0 ) = 4 . 2 5

.

105

Kap. 6: Punkischätzungen

Wir wollen nun die D e z i l e , Q u a r t i l e und den Median der Verteilung der Lebensdauer a l l e r Kühlschränke dieses Typs unter den vorliegenden extremen Belastungen schätzen. Für die Dezile

1

und

η - 0.1 = 10 - 0.1 = 1 = k: x ^ , = ^ ( x ( 1 )

g

+

e r g i b t s i c h wegen

x ( 2 ) ) = ^ ( 0 . 15 + 0.34) = 0.245

bzw. wegen η · 0 . 9 = 10 · 0 . 9 = 9 = k: x Q _ g = für die Q u a r t i l e ξ^ ^

und

^

+ x ( , Q ) ) = ^-(3.18 + 4.25) = 3.715 ,

erhalten wir mit

η · 0 . 2 5 = 10 · 0.25 = 2 . 5 , d.h. k = 3: xQ 25

= x

η · 0.75 = 10 · 0.75 = 7.5, d.h. k = 8: xQ

= x ( 8 ) = 2.39

(3)

=

°-57

bzw. mit

?5

und s c h l i e ß l i c h i s t der Schätzer für den Median ζρ j gerade

X

0.5=?(x(10/2)

+x

(12/2)} 4 ( x ( 5 )

+ x

(6)} 4

( 1

·13+

1

·45)

= 1

"29

·

da η = 1 0 eine gerade Zahl i s t .

|

2. Der Q-Q-Plot zur Überprüfung von Verteilungsannahmen Insbesondere i s t für i = 1 , . . . , n der Wert x ^

ein Schätzer f ü r das i / ( n + 1 ) -

Quantil 5 - j / ( n + i ) der Verteilung von X. Diese Tatsache macht man s i c h zunutze, um eine Ve.Kt&iZu.ngiannahm

für X graphisch zu übzipAüiin.

einem Koordinatensystem die empirischen Quantile * i / ( n + l )

= x

Trägt man in ( i ) 9 e 9 e n die

theoretischen Quantile i - j / ( n + i ) d i e s e r angenommenen Verteilung ab, so müssen die Punkte ( ? - j / ( n + i ) > x ( - j ) ) zumindest näherungsweise auf der Ursprungsgeraden mit Steigung 1 l i e g e n , f a l l s die Verteilungsannahme z u t r i f f t . Eine s o l che Graphik nennt man auch einen O-Q-Plot

(Quan£ilz-9ua.ntLit-Plot);

Q-Plot e n t s p r i c h t dem sogenannten MaknAckzintichkzi£ipa.pi.

der QNatürlich

ist

diese graphische Methode der Überprüfung von Verteilungsannnahmen nicht exa k t , so daß wir an dieser S t e l l e b z g l . exakter Aussagen auf Kapitel 8 v e r weisen.

106

Kap. 6:

Punktschätzungen

Βzlipi&t: Anhand der Daten des vorhergehenden Beispiels (Lebensdauer von 10 Kühlschränken) aus Abschnitt 1 wollen wir mittels eines Q-Q-Plots überprüfen, ob die Verteilung der Lebensdauer solcher Kühlschränke eine Ex(0.6) 3 Verteilung, also eine Exponentialverteilung mit Parameter λ = 0.6 = 5- ist. In 1 sind die empirischen Quantile x -j/( n +l) = x ( i)

der Tab.

unc

'

t^eoreti-

sehen Quantile 5-j/( n+ i) der Ex(0.6) - Verteilung, die sich aus

zu

5ΐ/(η+1)"-χ·

1 η ( 1

-

1 /

(

= -!·

η + 1 ) )

1 η ( 1

-ΤΓΪ

ergeben,für i = 1,...,10 = n zusammengestellt. Der zugehörige Q-Q-Plot findet sich dann in der Abb. 1.

Tab. 2: Empirische Quantile

x

i/(n+i)

= x

(-j) der Verteilung der Lebensdauer

von Kühlschränken und theoretische Quantile £-j/( n+ i) der Ex(0.6) Verteilung für i=1,...,10

i

x

i/11

= X

ξ

(i)

ί/11

=

"

l-lnd-TV)

1

0 15

0 .159

2

0 34

0 .334

3

0 57

0 .531

4

0 78

0 .753

5

1 13

1 .010

6

1 45

1 .314

7

1 90

1 .686

8

2 39

2 165

9

3 18

2 .841

10

4 25

3 .996

Da alle Punkte ( ζ , / ^ * x (i)^

se

^r

na

'ie

an

Ursprungsgeraden liegen, sind

zumindest keine extremen Abweichungen von einer Ex(0.6) - Verteilung feststellbar.

Kap. 6: Punktschätzungen

107

4-

3-

2 •

7

1

2

3

4

Afafa. /: Q-Q-Plot zur Überprüfung der Ex(0.6) - Verteilung der Lebensdauer von Kühlschränken

3. Das Stem-and-Leaves-Diagramm und der Box-Plot Das Stem-and-Leaves-Diagramm und der Box-Plot dienen dazu, einen visuellen Überblick über die Verteilung der Daten Xj

χ

schnellen

einer Beobach-

tungsreihe zu gewinnen, und zwar wird die Häufigkeitsverteilung sowie die Lage und Streuung der Daten

repräsentiert.

Zunächst wird der Bereich, in dem sich die Daten χ^,.,.,χ gleichgroße, aneinanderstoßende

bewegen, in

Intervalle zerlegt und die Anzahl der Daten

in jedem Intervall gezählt. Das Stem-and-L&avzi-Viagiamm Diagramm) erhält man dann, indem man die Intervalle

(Stamm-und-Blätteruntereinanderschreibt

und hinter jedes Intervall soviele Kreuze einzeichnet, wie Daten in dem Intervall vorliegen; macht man an Stelle der Kreuze Striche wie auf einem Bierdeckel, so erhält man eine sogenannte

SVvichtUtz.

Neben einem solchen Diagramm kann dann der Box-Plot

gezeichnet werden: Auf

einem senkrechten Strich, dessen Enden den kleinsten bzw. den größten Be-

108

Kap. 6:

Punktschätzungen

obachtungswert x ^ j bzw.

c h a r a k t e r i s i e r e n , werden das arithmetische

Mittel χ und der Median Xg ^ durch e i n Kreuz bzw. durch einen Kreis eingezeichnet. Z u s ä t z l i c h werden waagerechte L i n i e n dort gezogen, wo auf dem senkrechten S t r i c h unteres Quartil Xg 25 und oberes Quartil Xg yg der Beobachtungsreihe liegen. Die Enden dieser waagerechten L i n i e n werden dann noch untereinander verbunden, so daß ein Kasten (Box) e n t s t e h t , der (mindestens) 502! der Daten b e i n h a l t e t ; o b e r - u n d unterhalb der Box liegen dann j e w e i l s (mindestens) 25% a l l e r Daten. S c h l i e ß l i c h werden auf dem senkrechten S t r i c h noch a l l e Werte, die außerhalb des 3s x - Bereiches [x - 3s x , x + 3 s x ] liegen .durch Punkte markiert. Solche Werte kann man dann auch a l s Α υ Λ Ί ί ί β ί Ί ansehen und eventuell aus der Beobachtungsreihe e l i m i n i e r e n .

ΒeXip-tei.: In der Abb. 2 sind Stem-and-Leaves-Diagramm sowie Box-Plot f ü r die Lebensdauern

x ^ von n = 10 Kühlschränken d a r g e s t e l l t , v g l . auch das

l e t z t e B e i s p i e l in Abschnitt 1. Der k l e i n s t e Wert der Beobachtungsreihe x

der Wert x ^ j = 0.15, der größte der Wert

ist

( 10) = 4.25 und a l s gleichgroße

t e r v a l l e für das Stem-and-Leaves-Diagramm wurden die I n t e r v a l l e

In-

[0,1.5),

[1.5,3) , [3,4.5) gewählt, in denen 6, 2 und 2 Beobachtungen l i e g e n . Für den Box-Plot benötigen wir den Median sowie die Quartile der Beobachtungsreihe, die s i c h zu X

0 5

= 1 .29

,

X 0 .25

= 0

·57

bzw

"

*0.75 = 2 · 3 9

ergeben, v g l . auch Abschnitt 1. Weiterhin müssen wir das arithmetische M i t tel -

χ

1

1 0

x

= Τσ h

1

i=Tü

1 0

1

J, «(O-TV-

16-14-1.614

und die empirische Standardabweichung

v/i£2 »yi ex x? -10. 5z) =

y 4 1 . 9 4 7 8 - 10 · 1 . 6 1 4 2 = - j .

\/15.89764

= 1.329 berechnen und s t e l l e n f e s t , daß keiner der Werte χ ^ , . , . , χ ^ außerhalb des 3s y - I n t e r v a l l s

liegt.

Kap. 6: Punktschätzungen

109

Ol

[0,1.5): X X X X X X Q

2-

[1.5,3): XX 3-

,

[3,4.5): XX

4 ·

Abb.

2: Stem-and-Leaves-Diagramm und Box-Plot ( K r e u z = M i t t e l w e r t , K r e i s s Median) für die Lebensdauern x . , . . . , x l n von η = 10 Kühlschränken

Verfeinerte Formen von Stem-and-Leaves-Diagramm und Box-Plot findet man in Härtung et al. (1986, Kap. XIV).

4. Schätzen der Parameter einer Verteilung Unterstellt man für die Zufallsvariablen x^>...>x

, deren

Realisationen

an einer Stichprobe von η Objekten beobachtet w e r d e n , bzw. für

die Zufallsvariable X , welche die gleiche Verteilung besitzt wie die unabhängigen, identisch verteilten Zufallsvariablen X^

Xn

, einen bestimm-

ten Verteilungstyp, so kann man aufgrund der Daten χ^,.,.,χ Parameter dieser Verteilung schätzen. Entstammen χ ρ . , . , χ Ν(μ,σ

2

) - Verteilung, so möchte man die Parameter μ und σ

2

natürlich die z.B. einer

schätzen.

Natürlich möchte man eine "möglichst gute" Schätzung für einen Parameter gewinnen, d.h. man sucht eine Schätz Funktion θ(χρ...,χ

θ(Χ^

X n ) mit Realisation

), die den Daten einen Wert zuordnet, der dem wahren, unbekannten

Parameter θ möglichst nahe kommt.

110

Kap 6: Punktschätzungen

Wünschenswerte Eigeni chatten

von Schätz Funktionen

X n ) sind etwa Er-

wartungstreue, Konsistenz und minimaler Mean Squared Error (MSE, mittlerer quadratischer Fehler). Eine Schätzfunktion heißt eMM/itungitim,

wenn sie

im Mittel den richtigen Wert liefert, d.h. wenn gilt Ε(Θ(Χ 1

Χη)) = θ

sie heißt komlitent,

;

wenn sie mit wachsendem Stichprobenumfang η immer bes-

sere Werte 1iefert : Ρ(|θ(Χ1,...,Χη)-θ| >ε) — > Der Mean Squared

0

für jedes

ΕΛΛΟΊ einer Schätzfunktion § =

ε>0.

.. ,X ) für θ

MSE(§,6) = Ε(θ - θ) 2 = Var(§) + (E(§) - θ) 2 ist gleich der Varianz von § plus dem Quadrat des Slai oder der Ve>izzituna Ε ( § ) - θ von Ü; ist § erwartungstreu, so entspricht der MSE von § gerade der Varianz von §. Eine Schätzfunktion § mit minimalem MSE ist also eine solche, für die gilt MSE(§,θ)< MSE(§,e) für alle betrachteten Schätzfunktionen θ für Θ.

Verfahren zur Bestimmung von Schätzfunktionen sind etwa die Μome.ntenmeX.hode, die Ma.XA.mum- Llk&LLhood. - Methode

oder die Methode

den. kleinsten

QuadKate,

vgl. Kap. III in Härtung et al. (1986) und für einen Spezialfall der Methode der kleinsten Quadrate auch Kap. 9.

Wir wollen hier nicht weiter auf die Punktschätzung von Parametern eingehen und verwenden als Schätzungen im folgenden diejenigen, die sich aus den Schätzungen für die Kenngrößen von Verteilungen im Abschnitt 1 ergeben, d.h. wir stellen die Parameter einer Verteilung durch die Kenngrößen dar und ersetzen diese zur Schätzung der Parameter durch die entsprechenden Schätzungen.

Ist z.B. Χ ^ Ν ( μ , σ

μ = E(X)

2

), so sind wegen

und

o 2 = Var(X)

Kap. 6: Punktschätzungen

111

dann -

-

μ = χ

σ- 2 = s

und

x

2

2 Schätzer für die Parameter μ und σ

der Verteilung. Ist Χ ^ Ε χ ( λ ) , so werden

wir wegen E(X)=1

, d.h.

als Schätzer für λ die Größe

X verwenden. Ist Χ ^ Β ( Ι , ρ ) , so gilt mit Ε(X)= ρ

,

daß ~ - m P-x-„ _ A n z . der Vers., in denen das interessierende Ereignis eintritt Gesamtzahl der Versuche ein Schätzer für ρ ist.

Be-Lspizl:

Geht man davon aus, daß die Lebensdauer von Kühlschränken expo-

nentialverteilt i st, so ergibt sich roit den Daten

^j**·*»*(^qj aus Ab-

schnitt 1, vgl. etwa Tab. 2, als Schätzung für den Parameter λ dieser Exponential Verteilung der Wert

112

Kap. 6: Punktschätzungen

ÜBUNGSAUFGABEN ZU KAPITEL 6

Aufgabe 6.1: Zeigen Sie, daß die Schätzfunktionen

x = l . ( x 1 + ... + x n ) und

s

2 n

^1

2 Σ (Xi-X) 1

i=1

.

(also arithmetisches Mittel und empirische Varianz) erwartungstreu für den ρ Erwartungswert E(X) = μ bzw. die Varianz Var(X) = a

einer Zufallsvariablen X

sind, wobei die unabhängigen, identisch verteilten Zufallsvariablen der gleichen Verteilung wie X genügen.

Aufgabe 6.2: In der Tab. 3 sind die Längen der Kelch- und Blütenblätter x^, y.. von η - 1 2 Pflanzen einer Art angegeben.

Tab. 3: Längen von Kelchblättern x^ und Blütenblättern y^ für i=1,...,12 von η = 12 Pflanzen einer Art

i 1 2 3 4 5 6 7 8 9 10 11 12

x

i

7.8 6.9 5.4 5.8 6.3 7.2 5.1 6.1 5.8 7.4 6.4 6.6

2.4 2.1 1.7 1.9 2.0 2.3 1.5 1.9 1.8 2.3 2.1 2.0

Kap. 6: Punktschätzungen

113

Interpretieren Sie die x. und y^ als Realisationen unabhängiger Zufallsvariablen, die alle die gleiche Verteilung wie X bzw. Y besitzen, und schätzen Sie die Erwartungswerte und Varianzen von X und Y sowie die Kovarianz und die Korrelation zwischen den Zufallsvariablen X und Y.

Aufgabe 6.3: Bestimmen Sie die empirischen a - Q u a n t i l e x^

*o 5

ur,

d Xg g der Länge der

Kelchblätter aus Tab. 3 in Aufgabe 6.2 und prüfen Sie mittels Q-Q-Plot, ob die zugehörige Zufallsvariable X einer Normalverteilung genügt. Ermitteln Sie außerdem ein Stem - and - Leaves - Diagramm sowie einen B o x - P l o t für die Länge der Kelchblätter; verwenden Sie hierbei die Intervalle [5,6) , [6,7) , [7,8).

Kapitel 7: Intervallschätzungen für zukünftige Beobachtungen und für Parameter von Verteilungen Wir haben in Kapitel 6 die Parameter der Verteilung einer Z u f a l l s v a r i a b l e n X aufgrund der Realisationen x 1 ten Z u f a l l s v a r i a b l e n

x n von η unabhängigen, i d e n t i s c h v e r t e i l mit der gleichen Verteilung wie X geschätzt.

Oft möchte man zudem aufgrund von

zukünftige Realisationen oder

Funktionen zukünftiger Realisationen aus der zugrundeliegenden Verteilung p r o g n o s t i z i e r e n ; diesem Zweck dienen sogenannte Toleranz υαΖίζ.

- und

Piognoi&intei-

Außerdem w i l l man häufig n i c h t nur eine Punktschätzung f ü r den Para-

meter einer Verteilung angeben, sondern vielmehr ein I n t e r v a l l , das den festen, aber unbekannten Parameter mit vorgegebener S i c h e r h e i t überdeckt, d.h. man möchte ein Kon^idcnzint&Kuati

oder VMXlau.e.niinXzfivail

für den unbekann-

ten Parameter bestimmen.

1. Toleranz- und Prognoseintervalle Kennt man die Parameter der Verteilung einer Z u f a l l s v a r i a b l e n X , so l i e g t jede zukünftige Beobachtung aus dieser Verteilung mit Wahrscheinlichkeit ρ im I n t e r v a l l [ξ

(1-ρ)/2 · ξ(1+ρ)/2]

'

d.h. zwischen dem (1-p)/2 - und dem (1+p)/2 - Quantil dieser V e r t e i l u n g . Man nennt dieses I n t e r v a l l dann ein ToleAanzintzivcill ich&inlichkeit

mit

minimale.*

TAc^eAuahA-

ρ für eine zukünftige Beobachtung, v g l . z.B. die ko - I n t e r -

v a l l e im Abschnitt 1 von Kapitel 5. In der Regel kennt man die Parameter der Verteilung von X jedoch n i c h t . Man kann dann sehr o f t ein mit

minimaiil

Tldfäe.luia.h'Uich&intichkesit

ρ and

lolM.a.nzintzn.vaJUL

Sichi^hiitiiMhUcheinZichkiAX

1 - a angeben, in dem mit einer s t a t i s t i s c h e n S i c h e r h e i t von (1 - αϊ · 100% mindestens p · 100% der zukünftigen Beobachtungen l i e g e n . Möchte man den Mittelwert χ einer zukünftigen Stichprobe χ . , . , . , χ

progno-

116

Kap. 7: Intervallschätzungen

s t i z i e r e n . s o kann man e i n sogenanntes ?iognoiei.nte.n.vaU icheintickkeAX

mit Τ-Ίε^εΛαιαίΐΛ-

1 - α verwenden. In diesem l i e g t der M i t t e l w e r t von m z u k ü n f -

t i g e n Beobachtungen dann mit der W a h r s c h e i n l i c h k e i t

1 - α . Für m = 1 e r g i b t

s i c h n a t ü r l i c h e i n B e r e i c h , i n dem e i n e i n z e l n e r z u k ü n f t i g e r Wert mit (1 - α) · 100% S i c h e r h e i t

liegt.

Für d i e konkrete Bestimmung von Toleranz - und P r o g n o s e i n t e r v a l l e n s e i verwiesen auf Härtung et a l .

hier

(1986).

2. Konfidenzintervalle Unter einem Konfiide.nzinte.iva.tJL iidenzinteKvatt

zum Nive.au

v e r s t e h t man e i n I n t e r v a l l

1 - α oder kurz einem (1 - α) - Kon[ θ ^ ^ ] , das den wahren, unbe-

kannten, f e s t e n Parameter θ e i n e r V e r t e i l u n g mit W a h r s c h e i n l i c h k e i t überdeckt; es g i l t

1- α

also

Ρ({θ1 < θ < θ 2 } ) = 1 - α

, 0< α< 1

Man s a g t auch k u r z : Der Parameter θ l i e g t mit W a h r s c h e i n l i c h k e i t schen θ^ und 02· Ein s o l c h e s (1 - α) - K o n f i d e n z i n t e r v a l l

1-a

zwi-

kann o f t aus der

Punktschätzung θ f ü r θ, v g l . Kap. 6 , k o n s t r u i e r t werden. Dazu wird θ i n e i n e Größe θ t r a n s f o r m i e r t , deren V e r t e i l u n g F n i c h t vom unbekannten Parameter θ abhängt. Ein K o n f i d e n z i n t e r v a l l [α/2-Quantil

zum Niveau 1 - α f ü r θ i s t dann

von F , (1 - α/2) - Quantil von F]

denn es g i l t P({α/2 - Quantil von F < θ < (1 - α/2) - Quantil von F ) = 1 - α

.

Durch Rücktransformation von θ und entsprechende Transformation der Q u a n t i l e von F e r h ä l t man dann e i n (1 - α) - K o n f i d e n z i n t e r v a l l

f ü r den unbekannten Pa-

rameter θ. Dies i s t a l l e r d i n g s n i c h t immer so e i n f a c h möglich wie i n den nachfolgenden

Fällen.

Wir wollen nun e i n i g e s p e z i e l l e K o n f i d e n z i n t e r v a l l e f ü r d i e Parameter von Normal - und B i n o m i a l v e r t e i l u n g betrachten. Für weitere s e i verwiesen auf Härtung et a l .

(1986).

Konfidenzintervalle

117

Kap. 7: Intervallschätzungen

2.1

K O N F I D E N Z I N T E R V A L L E T E R

μ

E I N E R

Ν ( μ , ο

Sind die Zufallsvariablen X^

2

F Ü R

D E N

P A R A M E -

) - V Ε R Τ Ε I L ö Ν G

X n unabhängig identisch normal verteilt mit

unbekanntem Mittelwert y und b z h u m t v ι Varianz

, so besitzt die Punkt-

schätzfunktion

1

2

eine Ν ( μ , — σ

) - V e r t e i l u n g und für die zugehörige standardisierte

Zufalls-

variable gilt v ^ . >2 2

l

= ( 4 · 1.96)2 = 61.4656

d . h . er muß mindestens d i e Abfüllmenge von η = 6 2

F l a s c h e n messen.

V e r n a c h l ä s s i g t er d i e H e r s t e l l e r a n g a b e und verwendet d i e Daten aus Tab. 1 a l s V o r s t i c h p r o b e z u r Abschätzung von σ , so e r g i b t s i c h mit s = 4.457

und

e i n Stichprobenumfang

n>(2 '

4

'45g '

t

... „ = t 1 K n 0 7 C = 2.131 ηQ-1;1-α/2 15 ;U.975

von

2

·131^=

(4.457 · 2.131 ) 2 = 90.209

.

I s t d i e gewünschte G e n a u i g k e i t des (1 - α) - K o n f i d e n z i n t e r v a l l s

|

f ü r ν i n Ab-

h ä n g i g k e i t vom M i t t e l w e r t χ der Beobachtungen v o r g e g e b e n , d . h . s o l l pfLoz^ntaali 2 rianz σ

GcnaiUgkexX

das VafiXtiJU,oniza.klve.>i{tahrizn

probenumfangs.

eine

ε e i n g e h a l t e n werden, so d i e n t bei unbekannter Vaz u r Bestimmung des notwendigen

Stich-

Kap. 7: Intervallschätzungen

121

Das Konfidenzintervall für μ s o l l hier die Gestalt [μ 1 ,μ 2 ] = [x - εχ , χ + ex] mit ε

=7Τ·νΐ;1-α/2·® Vn χ

(«ΓΪ>0)

b e s i t z e n ; der Name V a r i a t i o n s z a h l v e r f a h r e n rührt daher, daß in den Wert ε der empirische V a r i a t i o n s k o e f f i z i e n t v = s / x eingeht, der auch zahl

VtvUcutiom-

genannt wird.

I s t nun die prozentuale Genauigkeit ε vorgegeben, so schätzt man zunächst aus einer kleinen Vorstichprobe vom Umfang n 1 den V a r i a t i o n s k o e f f i z i e n t e n durch ν ab und bestimmt dann das k l e i n s t e n " mit

ν-1;1-α/2'ν

Sodann wird eine Stichprobe vom Umfang n " gezogen und überprüft, ob die Gen a u i g k e i t e eingehalten wird. I s t dies der F a l l , so i s t n " der gesuchte Stichprobenumfang. Sonst wiederholt man das Verfahren, indem man ν aus den n " Daten bestimmt, dann n ' " nach obiger Formel berechnet usw. Be-Cip-cel:

Der Getränkeproduzent aus dem B e i s p i e l in Abschnitt 2.1 möchte bei

Vernachlässigung der Herstellerangabe σ = 4 mi ein 95% - Konfidenzinterval 1 mit prozentualer Genauigkeit ε = 0.4% = 0.004 bestimmen. A l s Vorstichprobe vom Umfang π'=16 verwendet er die Abfüllmengen aus Tab.1,so daß s i c h a l s Abschätzung für den V a r i a t i o n s k o e f f i z i e n t e n v = I = 4.457 500.5625

0.0089

e r g i b t . Der Stichprobenumfang n " e r g i b t s i c h dann wegen

20 £

^9^0.975 · ° · 0 0 8 9 OÜ3



t

21 i

20;0.975 ' 0 · 0 0 8 9 ' oü3

2

. /2.093 · 0.0089V 1 _ „ 21 - {—ου*—) ·687

'

_ ^2.086 · 0.0089N 2 = O M

{

)

21.542

·

Kap. 7; Intervallschätiungen

122

21 ;0.975 OÜT

22 >

0.0089

^2.080 · 0.0089^

l — o u ? — )

21.418

zu n " = 2 2 . Der Getränkeproduzent müßte nun die Abfüllmenge von 22 z u f ä l l i g ausgewählten Flaschen bestimmen und überprüfen, ob die Genauigkeit von 0.4% eingehalten wird.

|

Ein weiteres, allerdings nur approximatives Verfahren zur Bestimmung notwendiger Stichprobenumfänge zur Einhaltung prozentualer Genauigkeiten von (1 - α) - Konfidenzintervallen für μ i s t das sogenannte StAeazcLhlveA^ah/Len. Für die gia.plu.iche.

Be.iCimmu.ng von Stichprobenumfängen bei Variationszahl -

und Streuzahl verfahren gibt es sogenannte Leiteita^etn.

Wir verweisen an

dieser Stelle auf Härtung et. a l . (1986, Kap. IV, Abschnitt 1), wo auch rein sequentielle Verfahren beschrieben sind.

2.3

K O N F I D E N Z I N T E R V A L L E TER

σ

2

E I N E R

I s t der HUtztmeit

N ( y , a

FÜR 2

DEN

P A R A M E -

) - V E R T E I L U N G

μ einer Normal Verteilung mit Parametern μ und σ

2

be.ka.nnt,

so genügt die Größe

σ

1=1

einer χ - Verteilung mit η Freiheitsgraden, f a l l s X. ο

X

unabhängige,

Ν(μ,σ ) - v e r t e i l t e Zufallsvariablen sind. Damit i s t η l (x-μ)2 i=1

Λ

~2

[-f-f]·

χ

η;1-α/2

η I i=1

9

(χ-μ)2

~ ι χ

η ;α/2

wobei χ. χ Realisationen von Χ 1. , . , . , Χ n sind, ein Konfidenzintervall zum i n 2 9 Niveau 1 - α für die Varianz σ der Normal Verteilung; χ η i s t hierbei das 2 im Anhang vertafelte γ - Q u a n t i l der χ - Verteilung. I s t hingegen der MLtteluieAX μ unbekannt,

so

ist

(n - 1) · S 2 2 "" x n-1 wobei

123

Kap. 7: Intervallschätzungen

η ·

j i=1

(χ, - χ ) 2

die Punktschätzfunktion für σ

i=1

bezeichnet. Mit der empirischen Varianz

2

(xri)

die sich aus den Daten x^,...,x n ergibt, hat das Konfidenzintervall

zum Ni-

veau 1 - α für die Varianz σ 2 die Gestalt

(η - 1) · s 2 7 χ η-1;1-α/2

Γ 2 h • °

·

( η - 1) · s 2 Τ χ η-1;α/2

BeXipleZ: Der Getränkeproduzent aus dem Beispiel

in Abschnitt 2.1 hat seine

Anlage auf eine Abfüllmenge von 500 mi. eingestellt und möchte überprüfen, 2 ob die Herstellerangabe σ = 4 mi., d.h. σ = 1 6 , realistisch ist. Dazu bestimmt er anhand der Daten aus Tab. 1 ein Konfidenzintervall 2 Varianz σ

zum 95% Niveau für die

der Anlage. Arbeitet er mit dem Einstellwert μ = 500 mi,, so er-

gibt sich wegen 16 I i=1

16 (X.--W)

=

l i=1

4 ; 0 . 9 7 5 =2 8 · 8 5 das

(x, - 500)' = 303 1

'

und

Xl6;0.025 = 6 · 9 0 8

Intervall

R

» 4} - [ Ä

» ora]

= [10 503

·

· 43·862]

·

Verwendet man anstelle von μ = 5 0 0 mi den Mittelwert der Daten aus Tab. 1, so erhält man mit

s 2 = 4.457 2 = 19.865

4;0.975

= 27

·49

und

'

X?5;0.025

= 6

·262

gerade

=

= Π 0.839 . 47.5851

.

J

124

Kap. 7: Intervallschätzungen

Koniidinz-intiivatte.

^üi

diz

σ einer Normal Verteilung e r 2

S£andaAda.tM&-ickang

geben sich natürlich aus denen für die Varianz σ , indem die Wurzeln aus den dortigen Grenzen gezogen werden.

2.4

K O N F I D E N Z I N T E R V A L L E T E R

ρ

E I N E R

Β ( η

F O R

D E N

P A R A M E -

, p ) - V E R T E I L U N G

Aufgrund von η unabhängigen Versuchen soll ein Konfidenzintervall

zum Niveau

1 - α für die unbekannte Wahrscheinlichkeit ρ des Eintretens eines Ereignisses Α bestimmt werden.

Ist η groß und ρ und 1 - p nicht klein (etwa n p ( 1 - p ) > 9 ) , so ist nach dem Zentralen Grenzwertsatz, vgl. Kap. 5, die Größe

v'pTFpT approximativ standardnormal verteilt, d.h. P«-"l-a/2SZwcLU,

=

Ein zxakt&i

"· ( 2np •

Konildrnzlntzivalt

[p^,p 2 ]

Τ u,.a/2 · J

ergibt

für ρ mit

• 4np(1 - p) )

zum Niveau 1 - α für die Wahrscheinlichkeit ρ

ergibt sich aus der Beziehung zwischen Binomial - und F - Verteilung, vgl. Kap. 5, zu [pj,p 2 ] mit

m

'F2m,2(n-m+1);a/2

H ~ n - m + 1 + m · ^2m,2(n-m+1) ;a/2 η

(m+1)

n

-

-F2(m+1),2(n-m);1-a/2

m+(m+1)

.

-F2(m+l),2(n-m);1-a/2

Kap. 7. Intervallschätzungen

die Größen p, und p, heißen auch I L.

ΡΖΟΛΑΟΠ-

das im Anhang v e r t a f e l t e γ - Q u a n t i l

CloppeA

der F

- Wtttz,

wobei Γ

125

V ^ , V2 lY

- V e r t e i l u n g bezeichnet.

v

1'v2

Β t i i p i i l : Ein Produzent w i l l ein 95% - Konfidenzinterval1 für die

Intaktwahr-

s c h e i n l i c h k e i t ρ eines elektronischen B a u t e i l s bestimmen. Dazu entnimmt er der Produktion z u f ä l l i g η = 1000 Bauteile und s t e l l t f e s t , daß von diesen 1000 Bauteilen m = 980 Bauteile korrekt h e r g e s t e l l t , d.h. i n t a k t s i n d . Die Anzahl i n t a k t e r Bauteile i s t n a t ü r l i c h die R e a l i s a t i o n einer B(1000,p) - Vert e i l u n g und a l s Punktschätzung für ρ e r g i b t s i c h hier der Wert s . m _ 980 . . q R " TÜÜU " ° · 9 8

·

Das 95% - Konfidenzintervall m i t t e l s Normalverteilungsapproximation

ergibt

s i c h dann mit u

1-a/2

= u

0.975 = 1 · 9 6

u 2 _ a / 2 = 1,96 2 = 3.8416

'

und

P 1 . 2 = 2 . ( I Q O o l 3.8416) - ( 2 -

1000

- 0.98 + 3.8416

* 1.96 · \/3.8416 + 4 · 1000 · 0.98 · O.O2) °200716832 * (1963.8416Ϊ 17.7747) = 0.9782 + 0.0089

[p 1 ,p 2 ] = [0.9782 - 0.0089 , 0.9782 + 0.0089] = [0.9693 , 0.9871] Will man nun das exakte Konfidenzintervall

zum 95% Niveau bestimmen, so be-

n ö t i g t man Quantile der F - V e r t e i l u n g : r

-ρ 2m,2(n-m+1);α/2 ~ 1960,42;0.025 "

|mi t

c =

V 9 7 5 _ ^

=

φ

=

0

.

1

4

F

0

1

4 2 ,1960;0.975

3

~

u

1 0.975 "

a

"

b

126

Kap. 7: Intervallschätzungen

a =v/2d + ccT = νΌ.0499 = 0.2234

und

= 0.0478 - 0.9653 = 0.046l] 1 . 1 ' 1 . 9 6 · 0.2234 - Ö.0461 " 0.3Ö1Ö e e u F

2(m+1),2(n-m);1-a/2

u Γ 0 975 " [mit c = g

d

= im+-k

3

= F

1962,40;0.975 ~

0.975 '

a

"

b

= 0.1403

= 0 · 0262

, = \[τΑcd += νΌ.0525 = 0.2291 b = 2

e

0.6759

' (ΤΜΤ" ή ) ' (c

+

l"l)

=

und

- ° · 0 5 0 3 ' 0-9649 = -0.0485j

_ 0 1.96 · 0.2291 + 0.0485 0.4975 =e = e = 1.6446

,

vgl. auch die Approximation für Quantile der F - V e r t e i l u n g im Anhang. Damit ergibt sich dann Γη η l - Γ 980 - 0.6759 981 · 1.6446 ιρ 1 2 " (.21 + 580 · 0.6759 ' 20 + 981 · 1.6446 f662.3820 1613.3526] [683.3820 * 1633.3526J [0.9693 , 0.9878] als exaktes 95% - Konfidenzintervall für die Intaktwahrscheinlichkeit ρ eines Bauteils aus der Produktion. |

Kap. 7: IntervaUschätzungen

127

ÜBUNGSAUFGABEN ZU KAPITEL 7

Aufgabe 7.1: Um die Belastbarkeit eines Bowdenzug - Typs zu ermitteln, wurde an η =9 Proben die Zugkraft gemessen, die zur Zerstörung des Bowdenzuges notwendig ist. Die ermittelten Werte in kp, von denen angenommen werden kann, daß sie einer Normal Verteilung entstammen, sind in Tab. 2 zusammengestellt.

Tab. 2: Zur Zerstörung des Bowdenzuges notwendige Zugkräfte x.,...,x q in kp

i x

i

1

2

3

4

5

6

7

8

9

30.5

27.4

29.3

32.3

31.0

30.9

28.7

30.6

29.8

a) Bestimmen Sie 95% Konfidenzintervalle für die erwartete Zerstörungszugkraft und deren Varianz. b) Wie groß ist die prozentuale Genauigkeit ε des Konfidenzintervalles für die erwartete Zerstörungszugkraft? c) Wieviele Messungen müssen Sie voraussichtlich machen, um ein 95%-Konfidenzintervall für die durchschnittliche Zerstörungszugkraft mit Genauigkeit ε =2.5% angeben zu können? ο d) Wieviele Messungen müssen Sie voraussichtlich machen, wenn die Breite d = 1 eines 95% - Konfidenzintervalles für die erwartete Zerstörungszugkraft abzusichern ist?

Aufgabe

7.2·.

In der Endkontrolle einer Produkti on wurde festgestellt, daß in einer Stichprobe von 100 Transistoren genau 89 intakt waren. Geben Sie ein exaktes und ein approximatives Konfidenzintervall mit 98% Sicherheitswahrscheinlichkeit für die Intaktwahrscheinlichkeit eines Transistors aus der Produktion an.

Kapitel 8: Statistische Tests

Mittels

statistischer

T e s t s können z . B . H y p o t h e s e n über d i e Parameter

bekannten V e r t e i l u n g s t y p s

(paAam&t>Uiche

TeAti),

H y p o t h e s e n über d i e

t i o n ( L a g e ) o d e r S t r e u u n g b e i unbekanntem V e r t e i l u n g s t y p ichi

Teiti),

H y p o t h e s e n über d i e A r t e i n e r V e r t e i l u n g

eines Loka-

(rUcktpcuuuw.tAi-

(Anpaaungitiiti)

oder

H y p o t h e s e n über d i e A b h ä n g i g k e i t von Merkmalen (UnabhänglgkiititeAti) prüft

ge-

werden.

Ein s t a t i s t i s c h e r

T e s t b e s t e h t a u s einem Paar (Hg

n a n n t e HuJLthijpothtit

o d e r k u r z Hypothz&e.

) , wobei Hg d i e

soge-

und H^ d i e AtteMivUvhifpotheiz

oder

A t t i i n a t i v e . des T e s t s b e z e i c h n e t . A u f g r u n d e i n e r a d ä q u a t e n Ρ ι ϋ ^ Ί ΰ & ζ

oder

T&itltCUttitik

, x

Τ = T(X1

n

) ,

d i e a u f η unabhängiger,, i d e n t i s c h v e r t e i l t e n s i e r t , deren V e r t e i l u n g k a n n t bzw. a b s c h ä t z b a r der Z u f a l l s v a r i a b l e n Η^

X^

Zufallsvariablen

u n t e r d e r Hypothese Hg ( b e i

ba-

V o r l i e g e n von Hg ) b e -

i s t , w i r d dann a u f g r u n d von R e a l i s a t i o n e n

χ^,.,.,χ

X n e i n e E n t s c h e i d u n g z u g u n s t e n von Hg o d e r von

getroffen.

Bei einem Tea-t zum N-tueau ο (0 < et< 1) g e h t man so v o r , daß man den W e r t e b e r e i c h von Τ p r o b l e m a d ä q u a t i n zwei T e i l b e r e i c h e a u f g l i e d e r t . Teilbereiche

fällt

T(x^,...,xn)

k e i t g r ö ß e r oder g l e i c h

u n t e r d e r H y p o t h e s e Hg m i t

o d e r α = 0 . 0 1 = 1%. L i e g t nun T ( x ^ , . . . , x

dieser

Wahrscheinlich-

1 - α , i n den a n d e r e n m i t W a h r s c h e i n l i c h k e i t

o d e r g l e i c h α ; d a b e i w i r d α i n d e r Regel

scheinlichkeit

In einen

kleiner

k l e i n g e w ä h l t , z . B . α = 0 . 0 5 = 5%

) i n demjenigen T e i l b e r e i c h m i t Wahr-

k l e i n e r o d e r g l e i c h a , so w i r d d i e H y p o t h e s e Hg v e r w o r f e n

wie man auch s a g t :

" D i e A l t e r n a t i v e H 1 i s t zum N i v e a u α s i g n i f i k a n t " .

F e h l e r b e i d i e s e r E n t s c h e i d u n g , d . h . HQ f ä l s c h l i c h e r w e i s e

k l e i n e r o d e r g l e i c h dem N i v e a u α des

Man s p r i c h t auch vom α - fehlzn.

o d e r vom FehteA

i u m t w . h u c k i U ) i t M i h k e A X oder S i g n l i l k a n z n A . v i a u .

Der

zu v e r w e r f e n ,

gerade eine W a h r s c h e i n l i c h k e i t

a n d e r e n B e r e i c h , s o b l e i b t man b e i d e r H y p o t h e s e H n .

hat

Tests.

1. AnX und n e n n t α auch Fällt T(x^,...,xn)

oder

i n den

Ιαλ-

130

Kap. 8: Tests

Entscheidet man s i c h f ü r die Hypothese Hg, so begeht man mit Wahrscheinlichk e i t ß einen Fehler (ß - FihlnA, FthleA 2. KnX), d.h. mit Wahrscheinlichkeit β v e r w i r f t man die Hypothese n i c h t , obwohl die A l t e r n a t i v e H^ v o r l i e g t . Diesen Fehler hat man in der Regel bei s t a t i s t i s c h e n Tests n i c h t im G r i f f ; er kann mitunter sehr groß s e i n . Daher s p r i c h t man auch nicht davon, daß Hq v o r l i e g t , sondern sagt vielmehr: "Die Abweichung von der Hypothese Hg (oder die A l t e r n a t i v e H^) i s t zum Niveau α nicht

signififkant."

Mit den Eigenschaften s t a t i s t i s c h e r Tests wollen wir uns h i e r nicht beschäft i g e n ; man v g l . aber Härtung et a l . (1986). Vielmehr wollen wir im folgenden parametrische Tests f ü r die Parameter von Normal - und Binomial V e r t e i lung sowie für den Vergleich der Parameter zweier Normal - und Binomialverteilungen behandeln. Außerdem wollen wir einen nichtparametrischen Test für die Lokation bzw. für den Lokationsvergleich von zwei Verteilungen, einen Test auf Unabhängigkeit zweier E r e i g n i s s e bzw. zweier B e r n o u l 1 i - V a r i a b l e n , 2

den χ

- Anpassungstest sowie Tests in allgemeinen Kontingenztafeln

vorstel-

len. Für weitere Tests vergleiche man Kapitel 9 und 10 sowie Härtung et a l . (1986), wo auch das Problem der Bestimmung notwendiger Stichprobenumfänge zum Absichern vorgegebener Differenzen behandelt wird.

1. Tests über die Parameter einer Normalverteilung Sind χ·|,...,χ π (unabhängige) Realisationen aus einer Ν(μ ,σ^) - Verteil ung, so möchte man zum einen Hypothesen über den Mittelwertparameter μ und zum anderen Hypothesen über die Varianz σ^ testen.

1.1

T E S T S

ÜBER

DEN

M I T T E L W E R T

μ

I s t μρ ein vorgegebener Vergleichswert f ü r den Mittelwert μ einer NormalV e r t e i l u n g , so können s t a t i s t i s c h e Tests für die Paare H0: μ = μ 0

H^: μ t μ ρ J

u1

H 1 : μ > μ«

0

μ

-μ0

H : 0 durchgeführt werden.

ΗΓ

μ U

1-a/2

·

Die einseitigen Hypothesen werden beim Gauß-Test zum Niveau α verworfen, f a l l s im Falle von hJ g i l t Τ > u. 1-a 2 bzw. im Falle von HQ g i l t ΤUtiicheA Ueit des Gauß - Tests. I s t die Vanianz unbekannt,

so wird sie zunächst durch

geschätzt, und die Prüfgröße * " μ0 t = t ( x 1 . . ,x n ) = — i s t unter der Hypothese

HQ:p = y 0

lung. Beim sogenannten t - Teit I^Vljl-a/Z

'

hJ verworfen, f a l l s ^Vlsl-a ?

und HQ verworfen, f a l l s

'

Vn eine Realisation aus einer t

^ - Vertei-

zum Niveau α wird dann Hg verworfen, f a l l s

132

Kap. 8: Tests

t < t n-1;a , wobei t^

'

das im Anhang vertafelte γ - Q u a n t i l der t^ - Verteilung bezeichnet.

BziipieZ: Der Getränkeproduzent aus dem Beispiel in Kapitel 7, Abschnitt 2.1 möchte anhand der Daten aus der dortigen Tab. 1 prüfen, ob signifikante Abweichungen zum 5% Niveau von der Abfüllmenge μ^ = 500 ms. auftreten, d.h. er testet die Hypothese

H q : μ = 500

gegen

Η,: μ $ 500

Legt er die Herstellerangabe σ = 4 zugrunde, so ergibt sich mittels Gauß Tests | T | = | * - a 5 0 ° . y W | = | 500.5625 - 500 , - 0.5625 Η - 9 6 = u 0 - 9 7 5 = U l . a / 2

|

,

daB er die Nullhypothese Hq nicht verwerfen kann. Läßt er die Herstellerangabe außer acht, so führt dies zum t - T e s t . Auch hier kann er die Hypothese Hq zum 5% Niveau nicht verwerfen, da mit dem kritischen Wert t^.Q g ^ g i l t It| = | i = i 2 2 . „ F | . | 500.5625 - 500 . = 0.5048^2.131 = t 1 5 ; 0

975

| __ | 0^625 Μ |

= tn_1;1_a/2

.

Bei beiden Tests können also keine signifikanten Abweichungen von uQ = 500 mJt bei zugelassener Irrtumswahrscheinlichkeit S% konstatiert werden. |

1.2 Sind

TESTS

OBER

DIE

VARIANZ

σ2

ο Realisationen aus einer Ν(μ,σ ) - V e r t e i l u n g , so sind bei GUI -

2 tigkeit von ο2 = a^2 mit einem Vorgabewert Oq die Prüfgrößen

η p I (x-j-y)2 2 i=1 χ =— 5 αά 0 2 (η - 1 )s 2 χ =— σ 0

(für bekanntes μ) .. mit

2 s =

1 ~

.

bzw.

? , -v2 . . ^ ι ( x ^ - x ) (fur unbekanntes μ)

1=1

133

Kap 8: Tests

2 Realisationen aus einer χ - Verteilung mit η bzw. n - 1 F r e i h e i t s g r a d e n . Daher wird im zweiseitigen Test von 2

2

H q : σ =OQ

gegen

2

2

Η,: σ

+σ0

die Hypothese HQ zum Niveau α verworfen, f a l l s χ2>χ

η;1-α/2

oder

χ2χ

η-1;1-α/2

oder

χ2 < x

η;α/2

( f ü r bekanntes μ)

n - 1 ;a/2

bzw.

(für unbekanntes μ)

Bei den e i n s e i t i g e n Testproblemen 1 2 2 HQ: σ < OQ 2

2

2

H q : σ >OQ

gegen

1 2 2 H^: σ >Og

gegen

Η 1 : σ < Og

2

2

und

2

wird die Hypothese Hg zum Niveau α verworfen, f a l l s

x

2



2

.

bzw

η;1-α

x

"

2

>x

2 und Hg wird zum Niveau α verworfen, f a l l s 2

2

.

Χ M2

gegen

H 1 : μ1 < μ 2

und

2

Bezeichnen wir mit

X l

1

X i ? i

X

1 i

1

Und

"2 x

2i

die Mittelwerte der Meßreihen χ ^ , . , . , χ ^ und χ 2 ΐ ' · · · » χ 2 η · 1 2 2 . 2 kannten

VaxMinzzn

σ^ und σ 2 d i e

Prüfgröße

so

ist

bei

fae

"

Kap. 8: Tests

135

~ *2

τ =.

π — ?

σ-,



+ π

2

unter G ü l t i g k e i t von μ^ = μ 2 R e a l i s a t i o n einer standardnormalverteilten Zuf a l l s v a r i a b l e n , so daß wir die Hypothese Hg zum Niveau α verwerfen müssen, falls |τ|>υ,.α/2

.

1 2 Entsprechend werden die e i n s e i t i g e n Hypothesen Hg bzw. Hg zum Niveau α v e r worfen, wenn g i l t T>u,_a

bzw.

Sind d i e Vaiianzen

unbekannt

T t

nl+n2-2;1-a/2

2

und Hg bzw. Hg werden zum Niveau α verworfen, f a l l s t>t

gilt

lf, n,|+n 2"

2

und

X1; 1 - 2 a

m1 (n 2 - m 2 ) > m 2 (n 1 - m 1 )

2 und HQ wird verworfen, f a l l s 2 x

2 >x

und

1;1-2o

m 1 (n 2 - m 2 ) < m 2 (n 1 - m 1 )

2 Der gleiche approximative χ - Test kann zur übiipiü^ung zuizlzn.

dlchotome.>L

MzikmaZz,

d.h.

von Merkmalen mit

dzn.

nur je

2

UnabkänglgkeJX Ausprägungen,

so daß s i e durch eine 2x2 - Tafel beschreibbar s i n d , herangezogen werden. Man würde dann im obigen B e i s p i e l die Unabhängigkeit von Produktqualität und Maschinen prüfen. Bezeichnet etwa Α das E r e i g n i s "Ausschuß" und Β das E r e i g n i s "Maschine 1 " , so können mit η = n1 + n2

,

n1

2

+

n2-mrm

n 1 = H n (B) = H n (Ä)

n 1 - m1 = H n ( Ä n B)

und

,

n 2 = H n (B)

,

,

m^HtAnB),

n^ + m2 = H n (A) ra^H^fAnB)

,

n 2 - m2 = H n ( Ä n B)

die Versuchsergebnisse in einer V i e r f e l d e r t a f e l der absoluten bzw. r e l a t i v e n Häufigkeiten d a r g e s t e l l t werden, v g l . Tab. 2. Die Tafel der r e l a t i v e n Häuf i g k e i t e n kann a l s R e a l i s a t i o n einer entsprechenden E r e i g n i s s ewerden. Α und Β g i l t fDa e l ,fürv g lunabhängige . Tab. 3, angesehen

Wahrscheinlichkeitsta-

142

Kap. 8: Tests

P(Aη Β) = P(A) · P(B)

bzw.

lautet die Unabhäng-igkzitAhypothue H

0:pij

= p

i

'

p

j

ρ,^ρ,

.ρ ,

,

Hg gerade

für a l l e Paare (i ,j)

und die zugehörige Alternative H^ i s t H

1:

p

ij^pi

"p j

"""bestens

e n

i

Paar ( i » j )

Tab. 2: Vierfeldertafeln der absoluten und relativen Häufigkeiten zweier Ereignisse Α, Β und ihrer Komplementärereignisse Ä und Β

Ä

Β

h (ΑΠΒ) η

h (ÄflB) η

h n (B)

Η η (Β)

Β

h (Α Π Β) η

h (Äni) ri

h„(B)

η

I

h n (A)

h n (Ä)

1

Ä

I

Β

Η (Α η Β) η

Η (ΑΠΒ) η

Η η (Β)

Β

Η (Α η Β) η

Η (Ä Π Β) η

Η η (Α)

H n (Ä)

n

ι

ι

Α

A

H

h

n

Tab. 3: Wahrscheinlichkeitstafel für zwei Ereignisse Α, Β und ihre Komplementärereignisse Ä, Β

Ρ

A

Ä

I

Β

Ρ (Α Π Β) = ρ η

P(Ä η Β) = Ρ 2 1

Ρ(Β) = Ρ > 1

Β

Ρ (Α Π Β) = ρ 1 2

Ρ (Α η Β) = Ρ 2 2

Ρ(Β) = ρ

I

Ρ(Α) =

Ρι

P(Ä) = ρ 2 >

2

1

Die Hypothese Hg wird dann zum Niveau α verworfen, f a l l s g i l t

(η π (ΑΠ Β) · H n ( Ä n B ) - H ( Ä n B ) · 2 X =η·^ : : H n (A) · Η (A) · Η (Β) · Η (Β)

> x'

Kap. 8: Tests

143

1 2 Die den Hypothesen Hg und Hg analogen einseitigen Hypothesen beim Unabhängigkeitstest H

s i n d d i e Hypothiii

0:

P

11 - p 1. ' P .1

bzw. d i e Hypothese

H

2 o:

dvi

p

gegen

den. positiven

i i - P1."

p

mgativzn

H

Abhängigkeit

P

11 > P 1. ' P .1

Γ

itochaituch&n

gegen

.i

Η

itochaitlichen

Abhängigkeit

2 r

P

11 < p i . * P .1

Im Abschnitt 1 des Kapitels 1 wurde eine Vierfeldertafel für die

Beiipief.: Ereignisse

A = Länge einer Schraube außerhalb der Toleranz, Β = Querschnitt einer Schraube außerhalb der Toleranz betrachtet, die in Tab.

Tab.

4 nochmals dargestellt

4: Vierfeldertafel der absoluten Häufigkeiten der Ereignisse Α, Β und Ä, Β

ι

A

Ä

Β

60

118

178

Β

90

732

822

ι

150

850

1000

H

ist.

n

Wir haben bereits in Kapitel 1 vermutet, daß die Fehler in Länge und Querschnitt voneinander abhängig sind. Ob diese Abhängigkeit zum 1% Niveau sig2 nifikant i s t , wollen wir mittels χ - Unabhängigkeitstest prüfen. Es ergibt sich

x

2

(60 » 732 - 118 · 90)2 ° · 150 · 850 · 178 · 822 =

,nnn =100

1108890000 ' 18655290000

1flnn 1000

= 59.441 >6.635 = χ ξ . 0 - 9 9 = χ 2 ; 1 _ α

,

so daß sich also tatsächlich die Ereignisse Α und Β bzw. die Merkmale A "Qualität der Länge" mit den Ausprägungen Α und Ä und Β "Qualität des Querschnitts" mit den Ausprägungen Β und Β als signifikant abhängig erweisen^

|

144

Kap. 8: Tests

Es sei noch erwähnt, daß die erste Hypothese

Hq: p^ =

dieses Abschnitts,

die sich mit der Notation der 2x2 - Tafel auch in der Form

H

0:pi1

=

Pi2

für i=1,2

schreiben läßt, auch HomogzniXätAhypothuz

für die Vierfeldertafel

genannt

wird.

5. Der Vorzeichenrangtest nach Wilcoxon Beim VoizeÄ.ck&n>iang£ei£

nach

Wilcoxon

{WLtcoxon

- S-Lgned - Rank - Te.it)

werden

Hypothesen über das Symmetriezentrum einer Verteilung nichtparametrisch getestet. Stamrien die Beobachtungen

aus einer stetigen Verteilung

mit Verteilungsfunktion F, so wird geprüft, ob diese Verteilung

symmetrisch

um einen Wert ζ^ ist, d.h. ob für alle χ gilt F(?0-x) = 1-F(c0

+

x)

.

Dazu bilden wir zunächst die transformierten Größen X· = x i - ? 0

für i = 1

η

und vergeben ohne Berücksichtigung des Vorzeichens von x.· R1,...,Rn:

Ι

RangzahZen

Sind χ

( 1 )

Ι < | χ

( 2 ) Ι




0

145

Kap. 8: Tests

a p p r o x i m a t i v R e a l i s a t i o n a u s e i n e r S t a n d a r d n o r m a l V e r t e i l u n g , wenn d i e t e i l u n g um den Wert ζ ^ s y m m e t r i s c h

Falls

f ü r e i n e n Wert x ! = 0 g i l t ,

so w i r d d i e s e r b e i der Vergabe der

z a h l e n und s o m i t b e i d e r Bestimmung der Größe Τ n i c h t

U n t e r Verwendung d e r Größe Τ a l s

Ver-

ist.

Rang-

berücksichtigt.

P r ü f g r ö ß e w i r d dann d i e

Hypothese

Hg: F i s t s y m m e t r i s c h um ζρ

zum N i v e a u α v e r w o r f e n , |T|>u1.a/2

Die e i n s e i t i g e n

falls .

Hypothesen

h J : F i s t s y m m e t r i s c h um ζ < ζ ^

bzw.

2 HQ: F i s t s y m m e t r i s c h um ζ > ς^

werden e n t s p r e c h e n d zum N i v e a u α v e r w o r f e n , f a l l s

T > u

Be-cipizl:

bzw

1-a/2

I n Tab.

·

T < u

a/2

gilt

· von η = 25 PKW's e i n e s

Typs

und B a u j a h r s nach 5 J a h r e n a n g e g e b e n . A u f g r u n d des V o r z e i c h e n r a n g t e s t s

nach

Wilcoxon s o l l

die

5 sind die Kilometerleistungen

Hypothese

Hg: " D i e V e r t e i l u n g s f u n k t i o n

F der K i l o m e t e r l e i s t u n g

ist

symme-

t r i s c h um ζ 0 = 70000 km" zum 5% N i v e a u g e t e s t e t werden. Dazu s i n d i n d e r Tab. 5 auch b e r e i t s d i e

Grös-

sen = x i - 70000

,

d i e R a n g z a h l e n R^ s o w i e d i e v o r z e i c h e n b e h a f t e t e n R a n g z a h l e n R^ und d i e sen c.j m i t a n g e g e b e n .

Aus den Daten d e r Tab. 5 e r g i b t s i c h wegen

Grös-

146

Kap. S. Tests

Tab. 5: Kilometerleistungen x^ von η = 25 PKW's, transformierte Daten xi, Rangzahlen R^, vorzeichenbehaftete Rangzahlen R.. sowie Größen c^ für i=1

i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25

x

i

*i

52700 63500 48600 97300 71000 62400 83500 79100 42000 105300 87200 38700 57900 53400 79000 87800 24600 53200 73100 86500 47000 29100 102400 112000 68100

+

25

25

-17300 -6500 -21400 27300 1000 -7600 13500 9100 -28000 35300 17200 -31300 -12100 -16600 9000 17800 -45400 -16800 3100 16500 -23000 -40900 32400 42000 -1900

R

i

14 4 16 18 1 5 9 7 19 22 13 20 8 11 6 15 25 12 3 10 17 23 21 24 2

S

C

1

-14 -4 -16 18 1 -5 9 7 -19 22 13 -20 -8 -11 6 15 -25 -12 3 10 -17 -23 21 24 -2

i

0 0 0 1 1 0 1 1 0 1 1 0 0 0 1 1 0 0 1 1 0 0 1 1 0

-

Τ = I ^ Λ - = 18+1 + 9 + 7 + 2 2 + 1 3 + 6 + 1 5 + 3 + 1 0 + 2 1 + 2 4 i=1 1 1 = 149 dann T

_

149 - 25 - 26 / 4

=

V25 - 26 - 51 / 24

-13.50

=

V13Ö1.2S

so daß wir die Hypothese H n nicht verwerfen können, da gilt |T| = 0.363 + 1 .96 = u 0

975

=Ul_a/2

.

Für den exakten Wilcoxon - Vorzeichenrangtest und den Fall, daß Bindungen auftreten (d.h. mehrere Werte xj..-.,χ^ sind betragsmäßig gleich) verweisen wir auf Härtung et al. (1986, Abschnitt 5 in Kap. IV).

147

Kap. 8: Tests

6. Der Wilcoxon-Rangsummentest, der U-Test von Mann-Whitney Sind

und x^^

x2n

unabhängige R e a l i s a t i o n e n aus

V e r t e i l u n g e n mit V e r t e i l u n g s f u n k t i o n F^ bzw. F 2 und s i n d d i e s e

stetigen

Verteilungen

v e r g l e i c h b a r i n dem S i n n e , daß s i c h d i e V e r t e i l u n g s f u n k t i o n e n F^ und F 2 nicht

schneiden,

Tut)

zum V e r g l e i c h der V e r t e i l u n g s f u n k t i o n e n F^ und F 2 >

so

dient

der

Uilaoxon

- Rangiurnmentes-t

(UiM.cox.on

Bei diesem n i c h t p a r a m e t r i s c h e n T e s t w i r d d i e z w e i s e i t i g e HQ: F , = F 2

gegen

- Rank

- Sum

-

Hypothese

H1: F1 \ ? z

zum Niveau α g e t e s t e t ; zudem s i n d e i n s e i t i g e T e s t s zum Niveau α von

π0.

J

tx)> Fgix)

für alle χ

F 1 ( x ) < F^Cx)

für alle χ

und F,|(x)< F ^ i x )

geaen

f ü r mindestens e i n χ

und von

F1(X) F 2 ( x )

für alle χ

und F ^ ( x ) > F g i x )

gegen

f ü r mindestens e i n χ

d u r c h f ü h r b a r . U n t e r s t e l l t man e i n sogenanntes additivu

lokeUlonimodM,

der U n t e r s c h i e d zwischen F 1 und F 2 b e s t e h t nur i n e i n e r

Lokationsverschie-

bung: F 1 ( x ) = F 2 ( x - Δ) so l ä ß t s i c h der T e s t HQ gegen H 1 s c h r e i b e n Hq: δ = 0

gegen

als

H1: Δ f 0

und d i e e i n s e i t i g e n T e s t s s i n d gerade gegeben durch

H

0: Δ < 0

gegen

η] : Δ > 0

2 Ηη: Δ > 0

gegen

2 Η.: Δ < 0

bzw.

d.h.

148

Kap. 8: Tests

Zur Durchführung des Wilcoxon - Rangsummentests werden nun zunächst den Daten

*11

"in,

'

X

x

21

2n 2

R

an?zahlen

R

H'"-'

R

l

n i

'

R

2T"-'R2n2

zu

"

geordnet. Und zwar erhält der kleinste a l l e r Beobachtungswerte den Rang 1, der zweitkleinste den Rang 2 , . . . , der größte den Rang n^ + n 2 · Treten Bindungen auf, d.h. sind mehrere der n^ + n 2 Beobachtungswerte g l e i c h , so werden sogenannte midnankA (nüXtleAe. Rangzahlm)

vergeben. Wir wollen

diesen Fall hier nicht behandeln und auch nur einen approximativen Test vors t e l l e n ; für den exakten Wilcoxon - Rangsummentest und für das Vorliegen von Bindungen sei hier verwiesen auf Härtung et a l . (1986, Abschnitt 1.2 in Kap. V I I I ) , wo auch die Äquivalenz von Wilcoxon - Rangsummentest und U von Mann - Wkütmy

verdeutlicht

Tut

wird.

Als Prüfgröße für den Wilcoxon - Rangsummentest kann bei genügend großen n^ und n 2 (etwa n j , n 2 > 2 0 ) die bei G ü l t i g k e i t von Hg approximativ einer Standardnormalverteilung entstammende Größe n1

l

R

, i - n , · (n 1 + n 2 + 1) / 2

y n 1 · n 2 · (n, + n 2 + 1) / 12 verwendet werden; hier bezeichnet ersten Stichprobe χ ^ , . , . , χ ^ verworfen, f a l l s m

> U

n1

Υ R,· die Summe der Ranqzahlen in der i=1 1 1

. Die Hypothese Hg wird dann zum Niveau α

gilt

1-a/2

. 1

2

und die e i n s e i t i g e n Hypothesen Hg bzw. Hg werden zum Niveau α verworfen, falls

gilt Τ > u.

ßzliplel:

bzw.

Τ< u

Um zu überprüfen, ob s i c h ein angeblich blutdrucksenkendes Medika-

ment s i g n i f i k a n t auf den Blutdruck auswirkt, werden in einer DoppelblindStudie n^ =25 Patienten mit dem Medikament und n 2 = 23 Patienten mit Placebo (Kontrolle) behandelt, wobei a l l e Patienten in der Altersgruppe von 4 0 - 4 5 Jahren unter Bluthochdruck leiden. In der Tab. b sind die Blutdruckdifferenzen vor Behandlung und 2 Stunden nach Medikamentengabe zusammengestellt; außerdem enthält die Tabelle noch die zugehörigen Rangzahlen R ^ bzw. R ^ .

Kap. 8: Tests

Tab. 6: Blutdruckdifferenzen x ^

bei n ^ = 2 5 Medikament - Patienten und n^ - 23

Placebo - Patienten sowie zugehörige Rangzahlen R ^

i

X

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25

für j=1,2 und

25 (23)

R

1i

10 9 25 7 18 21 6 4 0 13 17 14 0 10 -0 13 20 12 18 5 3 10 8 17 17

5 6 3 0 1 2 5 2 8 7 1 5 0 2 7 2 6 4 0 6 2 7 8 6 3

1i

x

28 26 48 21 43 46 20 15 9 36 39 38 7 27 6 35 45 33 42 18 12 30 24 41 40

2 3 -0 4 7 12 0 14 9 -3 -5 12 4 2 19 -8 6 -10 21 12 8 5 10

rv>

i=1

149

2i 4 6 9 8 2 5 7 1 4 6 8 2 0 8 5 2 1 4 6 0 7 2 6

Ist das Medikament dem Placebo überlegen, so muß

10 13 5 16 22 34 8 37 25 4 3 32 14 11 44 2 19 1 47 31 23 17 29

F-(x) < F_(x)

für alle χ 1

und

F1(x) 1.6449 = u n Q C = u, 1 a °·95 '

die Hypothese h J verwerfen können, d.h. zum 5% Niveau ist das Medikament der Kontrolle bzgl. der blutdrucksenkenden Wirkung signifikant überlegen.

J

150

Kap. 8: Tests

7. D e r x 2 - A n p a s s u n g s t e s t Wir haben im Abschnitt 2 des Kapitels 6 den Q-Q-Plot als graphisches Verfahren zur Oberprüfung einer Verteilungsannahme kennengelernt. Diese Methode ο

l i e f e r t natürlich keine exakten Aussagen, wohingegen beim χ

-

Anpaiiung&teAt

zum Niveau α signifikante Abweichungen von einer vorgegebenen Verteilung f e s t g e s t e l l t werden können. Es wird also zum Niveau α die Hypothese Hg: "Die Daten

entstammen einer Grundgesamtheit mit vor-

gegebener Verteilung." gegen die Alternative H^: "Die Daten entstammen einer Grundgesamtheit mit anderer Verteilung." 2 getestet. Zu diesem Zweck wird beim χ - Anpassungstest (i)

die reelle x - A c h s e in k Intervalle

(ii)

die Anzahl 0. (0= "observed") der Realisationen unter den x 1 , . . . , x n gezählt, die in das i - t e Intervall

unterteilt;

fallen (für i = 1 , . . . , k ) ;

( i i i ) die Wahrscheinlichkeit P i = P(X e ^ ) für i = 1,... ,k bestimmt, mit der unter der Hypothese Hg eine Beobachtung in das i - t e Intervall (iv)

die erwartete Intervallhäufigkeit E i = η · p i für i = 1 , . . . , k

fällt;

(E="expec-

ted") berechnet. Dann i s t unter der Hypothese Hg die Prüfgröße

2 Realisation einer approximativ x k 1 - verteilten Zufallsvariablen und die Hypothese Hg wird verworfen, f a l l s g i l t X

2

>

2

*k-1;1-a

;

die Approximation i s t hinreichend genau, wenn höchstens 20% der Werte E 1 . . , E k kleiner als 5 und keiner der Werte E^

E k kleiner a l s 1 i s t

(Faustregel). Generell sind die Intervalle I.. natürlich so zu wählen, daß ρ. > 0 für i = 1 , . . . ,k g i l t .

151

Kap. 8: Tests

2 Der χ - Anpassungstest besitzt mitunter einen sehr großen Fehler 2. Art 8. so daß man bei der Interpretation eines Nichtverwerfens von HQ als Nachweis für das Vorliegen der in der Hypothese H Q spezifizierten Verteilung äußerst vorsichtig sein sollte. Be.-Upi.el: In der Tab. 7 sind die Lebensdauern von η = 20 Transistoren aus einer Produktion zusammengestellt.

Tab. 7: Lebensdauern χ.,.,.,χ,- von η = 2 0 Transistoren

j

χ. J

j

χ. J

j

χ. J

j

χ. J

1

1.37

6

2.17

11

3.76

16

5.76

2

1.42

7

2.85

12

3.97

17

6.13

3

1.68

8

2.93

13

4.51

18

6.18

4

1.92

9

3.24

14

4.86

19

7.29

5

2.13

10

3.46

15

5.32

20

8.30

2 Mittels χ -Anpassungstest soll nun zum 5% Niveau getestet werden, ob die Verteilung der Lebensdauer in der Produktion signifikant von einer Exponentialvertei1ung mit Parameter

abweicht. Dazu bilden wir zunächst drei Intervalle V ' -

0 0

· ^

1

'

l

Z=



0.3 ' ζ 0.7 ]

·

Ι

3=(ξ0.7'")

·

wobei

V

" ÖT4"

1π(1

"

α)

ί 0.892

, für ο = 0 . 3

[ 3.010

, für α = 0.7

=

das α-Quantil der Εχ(0.4) - Verteilung bezeichnet. Im Intervall I^ = (-=>. 0.892] liegen 0 Beobachtungswerte, im Intervall I 2 = (0.892 , 3.010] liegen 8 Beobachtungswerte und im Intervall Ij = (3.010 , obachtungswerte, d.h. es ist

liegen 12 Be-

152

Kap. 8: Tests

0t = 0

,

02 = 8

und

03=12

·

Die erwarteten Anzahlen sind hingegen E 1 = η · p 1 = 20 · 0.3 = 6 E 2 = η · p 2 = 20 · 0.4 = 8 E 3 = η · p 3 = 20 · 0.3 = 6 so daß die Hypothese Hg einer Ex(0.4) - Verteilung der Lebensdauern wegen

X2= j =

ή-· ( 0 . - E . ) 2 =

36 0 36 T +S+T

(0-6)2+^· (8-8)2

+

^ · (12-6)2

2 2 12>5.991 = x 2 ; 0 > 9 5 = x k _ 1 ; 1 _ a

=

zum 5% Niveau verworfen werden muß, d.h. die Abweichungen von einer Ex(0.4) Verteilung sind zum 5% Niveau s i g n i f i k a n t .

|

Gibt man in der Hypothese Hg nur den Verteilungstyp an und schätzt die Parameter dieser Verteilung aus den Daten

, so i s t obiges Testver-

fahren natürlich nicht mehr anwendbar; man v g l . hierzu aber Härtung et a l . (1986, Kap. IV, Abschnitt 1).

8. Tests in allgemeinen r χ s-Kontingenztafeln Werden zwei Merkmale * und ü mit r bzw. s möglichen Ausprägungen A j , . . . , A r bzw. B ^ , . . . , B S jeweils an insgesamt η Objekten beobachtet, so kann man die Versuchsergebnisse übersichtlich in Form einer 1*4 -

der ab-

Kon£inge.nzta(,e.t

soluten Häufigkeiten darstellen, die mit W

= ni.

'

W

= n.j

und

H

n(AinBj)

= n

ij

die in Tab. i angegebene Gestalt hat. Zu dieser Tafel der absoluten Häufigkeiten resp. der Tafel der relativen Häufigkeiten mit hn(Ai) = n

i.

/ n

'

h n ( B j ) = n _ j / n und

hp(Ai η Β.) =

ni

• /η

korrespondiert nun natürlich wie im F a l l der V i e r f e l d e r t a f e l , vgl. Ab-

153

Kap. 8: Tests

Tab.

S:

r * s - Tafel prägungen

B

X N. A

n

1

d e r a b s o l u t e n H ä u f i g k e i t e n f ü r zwei Merkmale X m i t und l i m i t A u s p r ä g u n g e n

B2

1

..

11

n

22

* •

* •

12

A2

n

21

n

A

n

rl

n

r2

*

n

.l

n

.2

* •

r

I

B

• n

s n

l.

2s

n

2.

rs

n

r.

1s

n

η

n

η

.s

s c h n i t t 4, eine Tafel

der t h e o r e t i s c h e n W a h r s c h e i n l i c h k e i t e n

p r ä g u n g e n von X und 8

. v g l . Tab.

Tab.

χ

B

A

B2

1

.

B

-

11

P

12

· •

p

1s

p

l.

A2

P

21

p

22

* •

p

2s

p

2.

A

P

r1

p

r2

* •

p

rs

p

r.

p

.1

P.2

*

p

.s

r

l



für die

Ausprä-

1

Möchte man nun p r ü f e n , ob d i e Merkmale X und y v o n e i n a n d e r u n a b h ä n g i g d.h. will

(UnabhängigkexXihypothe.6e),

H

0:

p

ij

= p

i."

p

.j

Aus-

I

s

P

1

f ü r die

9.

9: r * s - T a f e l d e r t h e o r e t i s c h e n W a h r s c h e i n l i c h k e i t e n gungen z w e i e r Merkmale X und H

X

Aus-

man

(für alle

i,j)

gegen

sind

154

Kap. 8: Tests

Η": P-jj ^ P-j * P j

für mindestens ein Paar ( i , j )

zum Niveau α testen, so kann man die unter der Hypothese HQ der Unabhängigkeit approximativ χ^ - verteilte

(mit ( r - 1 ) ( s - 1 ) Freiheitsgraden) Prüf-

größe mit der Realisation

V'ij

η

j

verwenden. Die Hypothese H^! wird zum Niveau α verworfen, f a l l s g i l t : x

2

x

2

(r-1)(s-1);1-a

Mit dem selben Testverfahren läßt sich auch die H

0:

Η :

ί

p

ij

= p

i'j

P-ii^P-i'i

Homoginltätihypothiiz

9e9en mindestens ein i =}= ϊ ' und ein j

prüfen, die gerade besagt, daß die Zeilen der Kontingenztafel in Tab. 9 gleich sind, d.h. daß die Verteilung der zum Merkmal y gehörigen Z u f a l l s variablen unabhängig von der zugrundegelegten Ausprägung des Merkmals X i s t . Insbesondere läßt sich mittels des hier vorgestellten Testverfahrens natürl i c h die

GLeXiMizit

de*

VeJutzilungtn

gungen des Zeilenmerkmals X") und die

mehrerer Zufallsvariablen ("AuspräUnabhSngigki-üt

zweier Zufallsvariablen

prüfen, vgl. auch Abschnitt 4; im Falle stetiger Zufallsvariablen müssen diese dann natürlich d i s k r e t i s i e r t , d.h. die Ausprägungen in Klassen einget e i l t werden. BeXiplet: Um zu überprüfen, ob sich die Verteilungen der Zufallsvariablen "Bierpreis" in vier Regionen zum 5% Niveau signifikant unterscheiden, wurde der Preis für 0.3 i Bier in jeweils einigen Lokalen jeder Region ermittelt. Insgesamt schwankte der Preis zwischen 1.50 DM und 3.80 DM. In der Preisklasse 1 "bis 2 DM" fanden sich in den Regionen 3, 12, 5 bzw. 3 Lokale, in der Preisklasse 2 "zwischen 2 DM und 3 DM" gerade 8, 6, 14 bzw. 10 Lokale und in der Preisklasse 3 "3 DM und mehr" 15, 2, 7 bzw. 5 Lokale. Diese Ergebnisse sind in Tab. 10 in Form einer 4 * 3 - Kontingenztafel zusammengestellt.

Kap. 8: Tests

155

Tab. 1ΰ: 4»3 - Kontingenztafel der B i e r p r e i s e in v i e r Regionen

^\Preis

1

2

3

l

RegiorN^ 1

3

8

15

26

2

12

6

2

20

3

5

14

7

26

4

3

10

5

18

I

23

38

29

90

Wir prüfen nun zum 5% Niveau die Homogenitätshypothese

H

0:

p

1j

= p

2j

=

P3j

= p

4j

=

·

die gerade besagt, daß die Verteilung der Z u f a l l s v a r i a b l e n " B i e r p r e i s " 2

in

den v i e r Regionen g l e i c h i s t , m i t t e l s χ - T e s t . Es e r g i b t s i c h 4

0

3



90 (. " 26 - 23 ' V *

90

/

η,·

n

,·\2

26 · 23\2 . 90 (a 90 ) 26 · 3δ Λ ft

26 · 38\2 ΨΓ~) +





18 · 29~\2 90 )

=23.989 und die Hyothese der Gleichheit der Verteilungen wird zum 5% Niveau verworfen, d.h. die Verteilung des B i e r p r e i s e s in den Regionen i s t s i g n i f i k a n t zum S% Niveau verschieden, da g i l t χ 2 = 23.989 > 12.59 = Xg.g.gs = X ( r - i ) ( s - 1 ) ; 1 - a

·

B z g l . weiterer Verfahren in r * s - Kontingenztafeln sei verwiesen auf Härtung et a l . (1986, Kap. V I I ) .

J

156

Kap. 8: Tests

ÜBUNGSAUFGABEN ZU KAPITEL 8

Aufgabe 8.1: Prüfen Sie ausgehend von den Daten der Tab. 2 in Kapitel 7 (Aufgabe 7.1), ob zum 5% Niveau signifikante Abweichungen a) der erwarteten Zerstörungszugkraft von 28 kp, ρ b) der Varianz der Zerstörungszugkraft von 4 (kp) feststellbar sind.

Aufgabe 8.2: Zur Untersuchung der Ertragsunterschiede von zwei Getreidestämmen wird der Ertrag beider Stämme auf je 12 gleichgroßen Parzellen ermittelt, vgl. Tab.

11.

Tab.

11:

Erträge x ^

und x,^

für i=1,...,12 von zwei Getreidestämmen in kg

auf je 12 Parzellen

i

X

1 2 3 4 5 6 7 8 9 10 11 12

23 25 27 26 22 26 25 22 27 28 26 21

x

1i 4 8 2

0 1 7 5 6 8

1 5 4

2i

27.3 25.9 28.4 26.2 29.7 25.0 24.3 29.6 28.2 26.4 27.0 29.1

a) Prüfen Sie unter der Annahme normal verteilter Erträge mit gleicher Varianz für beide Stämme, ob Sorte 2 zum 5% Niveau im Mittel signifikant höhere Erträge als Sorte 1 bringt. b) Gehen Sie der Fragestellung aus a) nach, wobei Sie jetzt jedoch keine

Kap. 8: Tests

157

Normalverteilung unterstellen. c) Sind die Abweichungen von der Annahme identischer Varianzen in a) zum 5% Niveau signifikant? d) Prüfen Sie, ob der Ertrag pro Parzelle bei Sorte 1 symmetrisch um den Wert 25 verteilt ist; wählen Sie hierzu das Niveau von 5%, und führen Sie einen nichtparametrischen Test durch.

Aufgabe 8.5: Ein Betrieb fertigt eines seiner Produkte an zwei Standorten Α und ß. In der Endkontrolle werden die Produkte in zwei Güteklassen I und II eingeteilt. Eine Stichprobenerhebung mit 500 Produkten pro Standort ergab bei einem Anteil von 30% in Güteklasse I, daß 40% der Produkte dieser Güteklasse am Standort Α gefertigt wurden. a) Prüfen Sie, ob der Anteil der Produkte in Güteklasse I am Standort Α zum 5% Niveau signifikant kleiner als 30% ist. b) Ist der Zusammenhang zwischen Produktionsgüte und Standort signifikant zum 5% Niveau, und welche Interpretation hat die Schlußfolgerung, wenn Sie die Ergebnisse der Endkontrolle an den Standorten als unabhängige Meßreihen auffassen?

Aufgabe 8.4: Rutherford und Geiger beobachteten in 2608 Zeitintervallen von je 1/8 min insgesamt 10094 Szintillationen eines Poloniumpräparates. Die Anzahl n^· der Zeitintervalle mit genau j Szintillationen (wobei j = 0 bis j = 12 vorkommt) geht aus der Tab. 12 hervor.

Tab. 12: Anzahl n^· der Zeitintervalle mit genau j Szintillationen eines Pol on i umpräparates

j n

j

0

1

2

3

4

5

6

7

8

9

10

57

203

383

525

532

408

273

139

45

27

10

11

12 4

2

158

Kap. 8: Tests

Benutzen Sie die

Intervalleinteilung

Ι,Μ-,0.5]

,

I 2 = (0.5,2.5]

,

I 3 = (2.5,4.5]

I 4 = (4.5,6.5]

,

I 5 = (6.5,9.5]

,

I g = (9.5, - )

,

und testen S i e , ob zum 1% Niveau s i g n i f i k a n t e Abweichungen von einer Poissonverteilung mit Parameter λ = 3 . 9 vorliegen.

Aufgabe

8.5:

In einer Untersuchung wurde bei n = 150 Personen die mittlere Oberfläche der Erythrozyten ermittelt. In der Tab. 13 sind die Ergebnisse in Form einer 2 * 3 - Kontingenztafel zusammengestellt, wobei a l s Zeilenmerkmal X das Geschlecht der Personen und a l s Spaltenmerkmal y die mittlere Oberfläche der Erythrozyten, die natürlich e i g e n t l i c h ein stetiges Merkmal i s t , e i n g e t e i l t in die drei Klassen 1 ( < 9 5 · 10~ 6 mm2), 2 (zwischen 95 und 105· 10~6 mm2) und 3 ( > 105 · 10~6 mm2) sind.

Tab. 13: 2«3 - Kontingenztafel der Merkmale X "Geschlecht" und y "mittlere Oberfläche der Erythrozyten" in 3 Klassen bei n=150 Personen

8

1

2

weibl.

38

männl.

5

1

43

X

3

I

29

6

73

31

41

77

60

47

150

Welche Aussagen können S i e , abgesichert zum \% Niveau, aufgrund dieser Daten treffen?

Kapitel 9: Regressions- und Korrelationsrechnung

Regressions- und Korrelationsrechnung dienen der Untersuchung des Zusammenhangs zwischen Merkmalen. Bei der Regneniomiechnung

wird ein funktiona-

l e r Zusammenhang zwischen den Merkmalen h e r g e s t e l l t und bestimmt, wohingegen bei der KoiAeiatxamiechnung

die Stärke des (linearen) Zusammenhangs unter-

sucht wird.

1. Einfache Regressions- und Konelationsrechnung Untersucht man den (linearen) Zusammenhang zweier Merkmale X und II, so spricht man von einfachem

RegleiAioni-

Sind χ und i) die AuiplägungivaJiiable.n Regressionsrechnung der funktionale.

und

KolAelationiAechnung.

der Merkmale X und U, so wird bei der Zusammenhang

U = ß 0 + ß, · χ untersucht. Die Ausprägungsvariable υ des sogenannten R e g A e a a n d e n y wird l i n e a r , vermittels einer Geradengleichung mit Absolutglied ßg und Steigungsparameter β^ durch die Ausprägunnsvariable χ des R e g i e a o / u , X e r k l ä r t ; man spricht dann auch von einer tineaAzn

Hegie6ilon

von U auf X. Die Parameter

ßjj und ß^ der Geradengleichung sind dabei unbekannt und müssen aufgrund von Beobachtungspaaren (x^

) , . . . , ( x n , y n ) , η^>3 , für die Ausprägungen der

Merkmale χ und y an η Objekten aus einer interessierenden Grundgesamtheit geschätzt werden. In der Korrelationsrechnung wird die Stänke. de& LLneanm schen den Merkmalen X und (1 aufgrund der Daten ( x ^ y ^ ) und untersucht.

ZuAatmenhangi

zwi-

( x n > y n ) geschätzt

160

1.1

Kap. 9: Regression und Korrelation

L I N E A R E DER

R E G R E S S I O N

K L E I N S T E N

Sind

UND

D I E

M E T H O D E

Q U A D R A T E

Realisationen von dem Merkmal J) zugeordneten Z u f a l l s v a r i a b l e n und s i n d

χ

( f e h l e r f r e i ) erhobene bzw. gemessene Werte zum

Merkmal X, so können die Parameter ßg und ß^ der Geradengleichung a = ß0 + ausgehend von der Μ o d e l Z g l z i c h u n g Yi = ßQ+ ß1xi + e i

für

i=1,...,n

wobei e ^ , . . . , e n unabhängige, i d e n t i s c h v e r t e i l t e Z u f a l l s v a r i a b l e n mit E r wartungswert

E(e^) = 0

und Varianz

Var(e.) = a 2

für i = 1 , . . . , n s i n d , ge-

schätzt werden. B e i d e r Methode

duA

kltivuten

werden d i e S c h ä t z u n g e n bg und b^

Ouad/iate

fur

die Parameter ßg und ß^ derart bestimmt, daß die Summe der quadratischen Abweichungen zwischen y^ und y.j = bQ + b 1 x i

für i = 1 , . . . ,n

minimal wird, d.h. man minimiert

S2(bg,b1)= ^

(y.-bg-b^)

2

über a l l e möglichen Zahlen bg, b^ und verwendet diejenigen Werte bg und b^, die den Minimalwert l i e f e r n , a l s KleXrutz Squanzi

- Quadrate. - Schätze*

f ü r d i e P a r a m e t e r ß Q und

EitvnaXoAi)

[Leait-

ß^.

Die Größen e, = y i - y-j =yj - bg - b 1 x i

für

i=1,...,η

die ja gerade Schätzungen f ü r die sogenannten FuhlziteAmz nennt man auch Rzildum

s2=

Ϊ

i=1

{ y 1

und bezeichnet

r

y /

1

sind,

Kap. 9: Regression und Korrelation

als RiildaaJL -

161

QuadfiaXiimw. 2

-

Bei der Minimierung von S ( b ^ )

geht man nun konkret so vor, daß man die

p a r t i e l l e n Ableitungen

as2(bn ,B1) 0

0

--2

3S2(bn,b.) — Σ 3b^

η

_

Σ

1 =1

η 1=1

_

( y j - V W

xi

·

(y

·

_ _ i - b0 " b 1 x i }

b i l d e t , und dann die Schätzungen bg und b^ für ßg und ß^ aus den sogenannten NoimaZingteichange.n

"2 J t

(y

-2 ^

i " b0 "

b

lXi}

=

°

v ' f r V V i »

5

0

e r m i t t e l t ; hierbei ergibt sich mit den arithmetischen Mitteln

-

1 5

- ι 5

dann η

Σ

(xi - x)(yi - y ) —

Σ (x-i i =1 1

und

!>„ = * - l y

x)2

Die geschätzte Geradengleichung, d.h. die Kigiza^omgiiade. in den Ausprägungsvariablen von X und ij i s t dann natürlich M = b0 + b l X und

162

Kap. 9: Regression und Korrelation

i s t eine Schätzung für die Varianz σ

2

der Fehlerterme e^

en-

Will man zu einem vorgegebenen Wert, an einer festen S t e l l e x = x * die Ausprägung von S vorhersagen, so verwendet man nun n a t ü r l i c h die P^ognoie y* = b o

+ b

ix*

·

U n t e r s t e l l t man z u s ä t z l i c h , daß die Fehlerterme s i n d , und damit, daß y j , . . . , y

normal v e r t e i l t

Realisationen normal v e r t e i l t e r

riablen s i n d , so kann man auch ein PiognoiiUnteAvcM

mit

lickkeAJt 1 - a iüA a = y * an einer Stelle x = x * angeben; dieses

.1

y*

+ s

(xri)

· t nn-2 - o .;1-α/2 i..^ ·

Zufallsva-

TAe.üiiwahi6che.lnIntervall

2

( χ * - χ)2

/1+7η Γ+ /

η

,

Σ überdeckt eine zukünftige Realisation a = y * an einer festen S t e l l e x = x* mit der Wahrscheinlichkeit 1 - α. Berechnet man an jeder S t e l l e x = x* ein solches Prognoseintervall, so kann man einen sogenannten PAogno6eitA.e-i^en um die Regressionsgerade legen, der an der S t e l l e χ = χ am schmälsten i s t und immer breiter wird, je mehr man s i c h mit dem Wert χ = χ * von χ entfernt. Die Breite des Prognosestreifens wird durch die Gate deA t i m c u z n Reg-tealon bestimmt. Die lineare Regression i s t n a t ü r l i c h umso besser, je kleiner die 2

Residual - Quadratsumme S

i s t . Als normiertes Maß für diese Güte verwendet

man auch das sogenannte BtitimmtheUXimaß

R-1 D- 1

s

2

η 1 (yry) 1 i=1

0 2

. - 1

der linearen Regression

ϊ ( y i - ? / 1 1 i=1 η , I (yry)2 1 i=1

5 i=1 - — η I i=1

(?i-y)2 1

(yry) 1

η

2

S

s2 Y

—χ s

ί,

,

y

das stets Werte zwischen Null und Eins annimmt und den Anteil der empiri2 sehen Varianz Sy des Merkmals y angibt, der durch die Regression e r k l ä r t wird. Natürlich i s t die Regression umso besser, je größer das Bestimmtheitsmaß Β i s t . Es sei noch erwähnt, daß s i c h das Bestimmtheitsmaß Β auch unter Verwendung des Steigungsparameters bj der Regressionsgeraden bestimmen l ä ß t :

Kap. 9: Regression und Korrelation

I n



-

χ

)

163

?

%HAj>plnl·. Um die Parameter der linearen Regression vom Verkaufspreis ü auf den Einkaufspreis * in einer Branche zu schätzen, wurden die Einkaufspreise x.j und Verkaufspreise y^ von η = 1 5 Produkten erhoben, v g l . Tab.

1. In d i e -

ser Tabelle sind auch bereits die aus der Regressionsrechnung resultierenden Größen y^ und e^ angegeben.

Tab.

1: Einkaufspreise x i , Verkaufspreise y^, Schätzungen y^ und Residuen e^ für i = 1 , . . . ,15

i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

xi

30 25 15 35 17 10 21 28 32 18 23 16 19 32 29

y

5 4 7 6 2 8 0 3 5 7 9 1 5 8 0

i

55 50 30 68 35 19 42 53 63 36 45 35 38 65 57

7 9 0 5 0 6 3 5 0 0 2 0 5 0 5

59 49 31 68 33 21 41 54 62 36 46 31 38 63 56

03695 40254 07827 67136 91192 82168 09050 88093 81515 74557 56889 83391 25685 38188 20330

-3 1 -1 -0 1 -2 1 -1 0 -0 -1 3 0 1 1

33695 49746 07827 17136 08808 22168 20950 38093 18485 74557 36889 16609 24315 61812 29670

Mit 1 * = TT 13

15

l

i=1

x

-j1 = 23.8

und

1 y = IS ^

15

J

i=1

y1. =46.38

ergeben s i c h die Schätzer bp, b^ für die Parameter der linearen Beziehung B = ß 0 + ß,x zwischen Verkaufs- und Einkaufspreis nach der Methode der kleinsten Quadrate zu

164

Kap. 9: Regression und Korrelation

15 I (x.· - x X y . - y) h -1'1.. b 1 Γ5 :

bQ=y-b1x

1474 41 . , ooqi 780.48 " 1 · 8 8 9 1

und und

= 4 6 . 3 8 - 1.8891 - 23.8 - 1.4194

d.h. es ist a = 1.4194+ 1.8891 · X

und

y. = 1.4194 + 1.8891 · für i=1

15

Der Verkaufspreis ist also in dieser Branche etwa das 1 . 9 - f a c h e des Einkaufspreises zuzüglich 1.4. In der Tab. 1 sind die Größen y^ sowie die Residuen e.j = y i - y i

für i=1,...,15

bereits mitangegeben. Aus den Residuen berechnet sich die Residualquadratsumme zu

S

, 1 5 , 15 = I (y,- - y-,-) = Σ 1 1 i=1 i=1

, ef - 40.9062 2

und somit erhält man als Schätzer für die Varianz σ e ^ . . d e n

der Fehlerterme

Wert

s ^ ^ ^ - S

2

= y j · 40.9062 = 3.1466

In der Abb. 7 sind die Beobachtungspaare (x^,y·), die geschätzte Regressionsgerade sowie der Prognosestreifen mit 95% Trefferwahrscheinlichkeit eingezeichnet. Letzterer ergibt sich aus den Prognoseintervallen mit Trefferwahrscheinlichkeit 95%, die an einer Stelle x = x die Grenzen

1.4194+1.8891 · χ ΐ 1.7739 . t 1 3 ; 0 ^

·/

= 1.4194+ 1.8891 · x + 1 .7739 - 2.160 · J

1+^

+

^ m f /

1+

+ &7"8^4g)2

besitzen und die für einige Werte χ = χ in Tab. 1 zusammengestellt sind.

165

Kap. 9: Regression und Korrelation

50-

10

10 Abb.

15

20

1: Streudiagramm der Werte ( x ^ )

25 für i = 1

30

35

χ

15 , Regressionsgerade

8 = 1.4194 + 1.8 91 · χ sowie 95% - Prognosestreifen

Wir wollen nun noch die Güte der linearen Regression prüfen und berechnen zu diesem Zweck ihr Bestimmtheitsmaß:

B - 1 - T Ü -

5

Γ • ' - ^ T T O T

- '-0.0145.0.9855

d.h. 98.55% der Varianz des Verkaufspreises werden durch den Einkaufspreis (linear) erklärt.

166

Tab.

Kap. 9: Regression und Korrelation

2: Grenzen der Prognoseintervalle mit 95% Trefferwahrscheinlichkeit für den Verkaufspreis an einigen S t e l l e n x = x

X

u n t e r e Grenze

10 12 14 16 18 20 22 χ = 23.8 24 26 28 30 32 34 36

1.2

15 19 23 27 31 35 39 42 42 46 50 54 57 61 65

E I N F A C H E

obere Grenze

924 813 687 546 387 210 015 423 800 567 315 045 757 452 131

24 28 32 35 39 43 46 50 50 54 58 62 65 69 73

697 364 046 744 460 193 945 337 715 505 313 140 985 846 723

K O R R E L A T I O N S R E C H N U N G

Die KoineJLaXÄjün Corr(X,Y)=PXY=

^ ( M L y/Var(X) · Var(Y)

beschreibt die Stärke des LinejViw

Ziuanme.nh.Mgi zwischen zwei Merkmalen X

und U bzw. den zugehörigen Z u f a l l s v a r i a b l e n X und Y mit positiven Varianzen; v g l . auch Abschnitt 4 in Kap. 4. Die Korrelation p^y l i e g t stets zwischen - 1 und +1, nimmt bei totalem negativ linearen Zusammenhang den Wert - 1 , bei totalem p o s i t i v linearen Zusammenhang den Wert +1 an. Besteht kein ( l i n e a r e r ) Zusammenhang zwischen X und Y, so i s t ρ χ γ = 0 (man sagt auch, X und Y sind unkoiA&tieAt)

und die Z u f a l l s v a r i a b l e n X und Y sind dann auch (stocha-

s t i s c h ) unabhängig, wenn X und Y normal v e r t e i l t sind. Die Korrelation ρ χ γ kann aufgrund von η Beobachtungstupeln ( x p , y n ) für ( X , Y ) , die an η Objekten aus einer interessierenden Gesamtheit gemessen oder erhoben wurden, durch den KoiAeZaXÄ.omkoe.iii.z^enten

167

Kap. 9: Regression und Korrelation

η l (χ.·-χ) · (y k + 2. Unterstellt man, daß y p . . . , y

Realisationen von unabhängigen Zufallsvari-

ablen Y^,...,Y n zum Merkmal 'J sind und daß die Regressorenwerte χ^,.,.,χ^· für i=1,...,n fehlerfrei gemessen bzw. erhoben sind, so kann man ausgehend von der Model 1 gleichung W wobei

ß

1

x

1 i

+

••• + 6 k x k i + e i

für

1=1

n

·

unabhängige, identisch verteilte Fehlerterme mit Erwartungs2 sind, die Vcuumitvi ßp.ßj,• · · >ßk nach der Methode der

wert 0 und Varianz σ Varia kleinsten Quadrate Die Klzinitz

ichätzen.

- Qua.dh.atz - Schätze.*.

bg,bj,...,b k sind gerade diejenigen, welche

die Summe der quadratischen Abweichungen

S 2 (b 0 ,b 1 ,...,b k ) = j

i

(y1-EI0-b1x11-...-bkxki)Z

bezüglich bg,bj,...,b k minimieren. Wie im Fall der einfachen Regression sind die Lösungen bg,b.|,... ,bk des Minimierungsproblems gerade diejenigen, die das NoA.malzngleA.chungayite.m des Systems

lösen: b^,...,b k ergeben sich als Koeffizienten

173

Kap. 9: Regression und Korrelation

b

1

S

%

b

1

S P

X

b

i

s

V i

t b

2 X l

+ b

+ b

S P

Z

2

2

*

S

S

s

V

1

x +

2

-

+ b

k

s

- - -

+ b

k

S

+

2

' "

+

+ b k S

V k V

k

%

=

S

V

=

S

V

= S P

¥'

und bp a l s S c h ä t z e r f ü r 0g i s t g e r a d e gegeben a l s

b

Hier

o

=

y

_ b

i * i - •·• - V k

·

bezeichnen 1 y =„

? I

y,·

-

.

x

1 ν j = n ,Σ

f ü r j = 1,...,k

d i e M i t t e l w e r t e d e r Beobachtungen zu einem Merkmal, η sQv

*j

=

l

i=1

?

( x - j i - X-:) 31

f ü r j=1

J

k

d i e Summe d e r q u a d r a t i s c h e n A b w e i c h u n g e n d e r B e o b a c h t u n g e n χ ^ , . . . , χ · Mittelwert

η

vom

χ^,

S P

* A

^

r

= S

V j * J l

(XJ1

"*J

) ( X

Ai"*Ä

fUr

)

j,i=1,...,k,jH

und

^

f U r

J=1

k

d i e Summe d e r P r o d u k t e d e r A b w e i c h u n g e n v o n x ^ . und x ^ · b z w . y^ vom j e w e i l i g e n M i t t e l w e r t Uber a l l e

i=1,...,n.

Man n e n n t

S2 = S 2 ( b 0 , b r . . . , b k )

= ^

(yi-b

0

-blx

1 i

-...-b

k

x

k i

)

2

174

Kap. 9: Regression und

Korrelation

η

-

η

• ά auch die

-

Λ *

Ru-idual

hier i s t

- QuacUcutiumm;

= b 0 + b 1 x 1i +

···

+ b k x ki

fUr

1=1

n

eine Schätzung für die Realisationen von Y.. und ^ =y i - y i

für i=1,...,n

eine Schätzung für die Fehler e . , die man auch die.

V p Regressoren be-

r e i t s zur Erklärung von H ausreicht (bzw. ob q = k - p Regressoren überflüssig sind). Unterstellt man, daß die Fehlerterme e j , . . . , e

des Modells v e r t e i l t sind ge-

mäß einer Ν(Ο,σ^) - Verteilung, so kann die Hypothese HQ: X ^ j , . . . , X j p j reichen zur Erklärung von ij aus gegen die Alternative H^:

*(p) reichen nicht zur Erklärung von »J aus

mittels F - Test zum Niveau α geprüft werden. Als T e s t s t a t i s t i k dieses R e d u k t i o n i t e s t i verwendet man eine normierte Differenz der Res idual " Quadratsumroen S ß

W

i

x

i i

+

2

und

••• + ß k x k i + e i

2

^ fUr

Ausgangsmodell i=

i.····"

und im reduzierten Modell V

ß

(0)

+ B

( 1 ) x ( 1 ) i + ••• + ß ( p ) x ( p ) i + e i

für i =1 ,.. ,n

,

Kap. 9: Regression und Korrelation

176

nämlich

(p)

(k - p) · S B

(k-p)-s2

a,(x1,....xk)-By,(x(

χ(ρ))

1 )

( k - p) · s 2

η i=1

2

1

und verwirft die Hypothese Hq zum Niveau α , falls gilt F>F

k-p,n-k-1;1-a

'

Man sagt dann auch: Bei alleiniger Berücksichtigung der Regressoren * ( 1 ) ' ···»*(p) tritt ein zum Niveau α signifikanter Erklärungsverlust gegenüber dem Ausgangsmodell ein. Kann die Hypothese Hq nicht verworfen werden, so besagt dies in der Regel allerdings nicht, daß die im reduzierten Modell vernachlässigten Regressoren keinen Einfluß auf das Regressanden - Merkmal 11 haben, sondern eben nur, daß sie keinen (wesentlichen) zusätzlichen

Beitrag

zur Erklärung von y leisten.

8eAApiel:

Um den Einfluß von Strahlstärke

Spritztemperatur X^ auf die Porosität zu untersuchen, wurde 'X1i'x2i'x3i^

Tab.




FSD


2.083= FSD0t05

und

|y2."

,

? 3 . l = 2 . 3 > 2.083= FSD0-(j5

gilt

d . h . d i e D i ä t 3 u n t e r s c h e i d e t s i c h s i g n i f i k a n t zum 5% N i v e a u von den D i ä t e n 2 und 4 .

2. Das Blockexperiment - zweifache Varianzanalyse Beim e-in^acfren ΒZcckcxpeA 1 O b j e k t e zu j e d e r d e r r · s S t u f e n k o m b i n a t i o n e n d e r F a k t o r e n Α und Β g e hören. Wir u n t e r s t e l l e n w i e d e r u m , daß d i e Daten y ^ ^ f ü r i = 1 , . . . , r k=1,...,t

, j=1

s und

, d i e gerade d i e Beobachtungen am k - t e n O b j e k t a u f d e r i - t e n S t u f e

des F a k t o r s Α und d e r j - t e n S t u f e des F a k t o r s 8 d a r s t e l l e n ,

Realisationen

von η Z u f a l l s v a r i a b l e n Y

ijk^ij

+

= M + ai mit

e

ijk + ßj +

r V α· = 0 i=1 1

eijk und

für i =1 , . . . . r s l

j ==11

ß, = ο J

, j = 1 , . . . ,s , k = 1 , . . . , t

Kap. 10: Varianzamlyse sind,

wobei der Erwartungswert

Ε(Y - - . ) = μ - ιJΚ

z e r l e g t werden kann i n e i n

1J

Gesamtmittel μ, einen A n t e i l α. der i - t e n Stufe des Faktors Α sowie einen A n t e i l ß. der j - t e n Stufe des Faktors ß und wobei e · , , % N(0 ,σ2 ) unabhängige, J

'J κ

normal v e r t e i l t e Reste bezeichnen. Somit sind also die Zufallsvariablen Y..^ unabhängig und normal v e r t e i l t m i t Var(Y, .. ) = σ 2 . Eine 1j κ w-cAfeung zwischen den Stufen der Faktoren Α und Β w i r d also ausgeschlossen.

lntiA.a.ktion, Wuchitt.-

Die Gesamtstreuung der Daten r s t SSG= [ l l (yiik-y )2 1JK i=1 j=1 k=1 '·· w i r d nun z e r l e g t i n den Streuungsanteil

SSA = s t

l (y . 1 i =1

) 2 = st · ( { y ] - r · y2 M=1 1 · ·

-y

\

J '

der auf den Faktor Α zurückzuführen i s t , i n den Streuungsanteil

SSB = r t

f

(y

j =1

i

)2 = r t · ( {

-y

-J.

···

\j

y2.

- s · y2

-J.

=1

)

,

•••)

der auf den S t ö r f a k t o r 8 zurückzuführen i s t , und i n einen Rest r

s

SSE = 1

t

?

ι

ι

( y . ^ - y , 1JK

II ül-

i Ji Kk 1

-J

·

für

II

y

,

i-

r t I Σ i=1 k=l

1-

t-

s t I j =1

II

i = 1 j = 1 k=1 Hier bezeichnen

- y

+y

)

= s s g - s s a - ssb

.

·

.. , r

j = 1 , . . · ,s

d i e S t u f e n m i t t e l zu den Faktoren Α und Β bzw. das Gesamtmittel der Daten und ^i.."^...

f

ür i=1,...,r

bzw.

y . -y

für j = 1

s

können als geschätzte d i f f e r e n t i e l l e E f f e k t e der Stufen des Faktors Α bzw. B, d . h . a l s Schätzer f ü r o^ bzw. ß. i n t e r p r e t i e r t werden; y

ist

natürlich

194

Kap. 10: Varianzanalyse

ein Schätzer für μ. Mit der analogen Zerlegung der η - 1 Gesamtfreiheitsgrade in r - 1 Freiheitsgrade für den Faktor A, s - 1 Freiheitsgrade für den Faktor Β und n - 1 - ( r - 1 ) - ( s - 1 ) = n - r - s + 1 Restfreiheitsgrade ergibt sich die in Tab. 4 angegebene Varianzanalysetafel des einfachen Blockexperimentes. Die Hypothese Hg: Der Faktor Α hat keinen Einfluß auf

(d.h. a 1 = ... = a = 0 )

wird also zum Niveau κ verworfen, f a l l s F

-msa>F

und die Hypothese Η®: Der Blockfaktor Β hat keinen Einfluß auf !1 (d.h. ß1 = ... = ß =0) wird zum Niveau κ verworfen, wenn g i l t F

-MSB>F

Β Α

s-1 ,n-r-s+1 ;1-κ

'

Β

Wird HQ bzw. Hg zum Niveau κ verworfen, so kann man mittels muJUULpliK Vviglelcht

nach Schede noch untersuchen, ob es ein Paar von Stufen des Fak-

tors Α bzw. Β gibt, das zu diesem Niveau signifikant verschieden i s t . Die i - t e und i ' - t e Stufe ( i , i ' = 1 , . . . ,r , i ^ i 1 ) des Faktors A, d.h. a i und cu , sind s i g n i f i k a n t verschieden zum Niveau κ, f a l l s und die j - t e und j ' - t e Stufe ( j ,j ' = 1 , . . . ,s , j ^ j ' ) des Blockfaktors 8, d.h. ßj und ßj, sind signifikant verschieden zum Niveau κ, f a l l s |y.j.-y.j'J>FSDK=

\ A S " ^ " F s - 1 ,n-r-s+1 ;1-κ " 7 t "

2 Auch hier i s t MSE ein Schätzer für die gemeinsame Varianz σ .

MSE

Kap. 10: Varianzamlyse

195

196

Kap. 10: Varianzanalyse

ZzAApidi: Im Beispiel aus Abschnitt 1 sind die Beobachtungen y ^ für j=1,2,3 jeweils an Personen mit weniger a l s 80 kg Körpergewicht und für j=4,5,6 j e weils an Personen mit wenigstens 80 kg Körpergewicht vorgenommen worden. Berücksichtigt man das Körpergewicht als Blockfaktor 8 mit den Stufen 1 = " 80 kg", vgl. Tab. 5, so kommt man zum einfachen Blockexperiment mit Beobachtungen y ^ ^ für i = 1 , . . . , 4 , j=1,2 und k=1,2,3, also insgesamt η = 4 · 2 · 3 = 24 Daten.

Tab. 5: Differenzen y . . ^ der Blutzuckerwerte bei r = 4 Diäten und s = 2 Körpergewichtsklassen für je t = 3 Versuchspersonen

Diät i Gewicht j

Person k

1

2

2

1 y

3 y

1jk

y

1

6.8

10.1

5.3

9.1

2

9.4

9.8

7.5

10.6

3

9.0

7.4

7.8

10.9 8.4

2jk

y

4jk

1

6.2

7.9

5.2

7.1

8.6

5.9

7.9

3

6.5

8.4

6.7

9.5

J, j1 yijk=r45·0 = 7·5 > 2..=8·7

»

y

3..=6·4

'

y

4..

= 9

·4

des Faktors Α bzw. den Stufenmitteln

j, y_2_

3jk

2

Mit den Stufenmitteln

y

4

y

i 1 k = T ? · 103.7^ 8.642

88.3a; 7.358

des Faktors Β und dem Gesamtmittel

,

197

Kap. 10: Varianzanalyse

4

2

3

ergibt sich

SSA = 2 · 3 · f £ y? -4-y2 ) = 6 · (261.26 - 4 · 8.0 2 ) = 31.56 \i=1 i·· ···/

,

2 SSB = 4 · 3 · f f y 2 · - 2 - y 2 % Vj=1 -J. ···; SSG=

4 2 3 l l l i=1 j=1 k=1

?

? 2 - 24 · y c i jk

12 · (128.824 - 2 · 8.0 2 ) = 9.888 , = 1595.56 - 24 · 8.(Γ = 59.56

und somit SSE = S S G - SSA - SSB = 59.56 - 31.56 - 9.888 = 18.112 Die resultierende Varianzanalysetafel mit den Freiheitsgraden

r-1=3,

s - 1 = 1 , η - r - s + 1 = 24 - 4 - 2 + 1 = 19 und η - 1 = 23 ist in Tab. 6 angegeben.

Tab. 6: Varianzanalysetafel des Diätversuches bei Berücksichtigung des Blockfaktors "Körpergewicht"

Streuungsursache

Freiheitsgrade

SS

MS

kritischer Wert

Prüfgröße F

(< =

5%)

Diät

3

31.56

10.52

10 52 · = 11.039 0.953

F

3,19;0.95=3·127

Gewicht

1

9.888

9.888

9.888 0.953=10·376

F

l,19;0.95

Rest

19

18.112

0.953

-

-

Gesamt

23

59.56

-

-

-

= 4

-381

Gemäß der Varianzanalysetafel erweisen sich sowohl die Diäten als auch die Körpergewichtsklassen als signifikant zum 5% Niveau, d.h. die Hypothesen

8

und HQ werden zu diesem Niveau verworfen. Die multiplen Vergleiche nach Scheffe* liefern mit |y,..-y2..M-z

»

Ι * ι . . - y 3 . . l = 1·1

·

1*1..-y 4 ..l = '· 9

.

198

Kap. 10: Varianzanalyse

I y 2 .. -

.1 =2.3

,

| y 2 > > - y 4 J =0.7

,

ΙΫ3.. " V 4 J

= 3.0

und FSD A

0 .05 = / 3 - F 3 , 1 9 ; 0 . 9 5 - 7 f r MSE = /

3

'

3 J 2 7

- r

°·953 ~

1

"726

bzw. mit |y.i.-y.2.i

= 1

·284

und

FSD B

0 .05 = /

1

' F 1,19;0.95 ' Τ ^ Γ

MSE

=/

'4 · 3 8 1 ' Κ ' ° · 9 5 3 ^ ° · 8 3 4 '

daß sich Diät 1 von Diät 4 und Diät 3 von den Diäten 2 und 4 signifikant zum 5% Niveau unterscheidet sowie daß sich die Körpergewichtsklassen zum 5% Niveau unterscheiden. Durch die Berücksichtigung des Blockfaktors B, der für die Varianzanalysetafel lediglich zur Folge hat, daß der Rest der einfachen Varianzanalyse aufgespalten wird in den Rest des einfachen Blockexperimentes und den Einfluß des Blockfaktors, können also zusätzlich signifikante Unterschiede zum 5% Niveau zwischen den Diäten 1 und 4 herausgearbeitet werden. Hinzuweisen ist auch auf den im Vergleich zur einfachen Varianzanalyse wesentlich höheren Wert der Prüfgröße F beim Globaltest auf signifikante Unterschiede in den Diäten sowie auf den wegen der verminderten Restfreiheitsgrade erhöhten zugehörigen kritischen Wert.

|

Für die Auswertung komplexerer und unbalancierter Versuchsanlagen sowie für weitere Methoden der Varianzanalyse, insbesondere nichtparametrische Verfahren, Modell Uberprüfung, andere multiple Vergleiche, Modelle mit zufälligen Effekten, gemischte Modelle (Modelle II und III der Varianzanalyse) Schätzen von Varianzkomponenten etc. sei hier verwiesen auf Härtung et al. (1986, Kap. XI), Härtung / Elpelt (1986, Kap. X).

199

Kap. 10: Varianzanalyse

ÜBUNGSAUFGABEN ZU KAPITEL 10

Aufgabe 10.1: Um zu untersuchen, ob die Biegezugfestigkeit von Gießharzbeton von der Körnigkeit des Zuschlags abhängt, wurde bei jeweils 10 Proben mit grobem, mittlerem und feinem Zuschlag von Rheinkiessand (Körnunaen 0 / 3 0 2 ermittelt, vgl. Tab. 7.

,0/15

,0/7)

die Biegezugfestigkeit in kp / cm

2 Tab.

7: Biegezugfestigkeit y ^

(in kp / cm ) für i = 1,2,3 und j = 1,..., 10 von

je 10 Proben Gießharzbeton mit Zuschlägen der Körnung 0 / 3 0 und

^"~\Körnung i Probe j

, 0/15

0/7

^ ^ ^

1 2 3 4 5 6 7 8 9 10

1(0/30) y

ij

205 227 229 218 212 207 220 215 224 210

2(0/15) y

2j

207 195 199 203 212 197 190 203 215 217

3(0/7) y

3j

201 194 183 205 184 189 193 181 185 188

Prüfen Sie, ob zum \% Niveau signifikante Unterschiede in den Körnungen vorhanden sind und, falls dies der Fall ist, welche der Körnungen zu diesem Niveau signifikant verschieden sind. Gehen Sie davon aus, daß die Biegezugfestigkeiten Realisationen unabhängiger, normal verteilter Zufallsvariablen mit identischer Varianz sind.

Aufgabe 10.2: An vier Standorten wurden Wasserproben von Elbwasser entnommen, deren Gehalt an anorganischen Wasserinhaltsstoffen in einem Ringversuch mit fünf beteiligten Laboratorien analysiert werden soll. Dazu werden jedem Laboratorium je drei gleichgroße Teilproben jedes Standortes zugestellt; die Analyseergeb-

200

Kap. 10: Varianzanalyse

n i s s e s i n d i η der Tab. 8 zusammengefaßt.

Tab. S: Analyseergebnisse y ^ . ^ ( f ü r i=1

4 , j=1,...,5

, k=1,2,3) für je

drei Proben Elbwasser pro Laboratorium j und pro Standort i

1

Standort i Laboratorium j

Probe k

y

2

3

1jk

y

1

1 2 3

937 968 924

1031 1067 1079

1015 965 989

952 988 993

2

1 2 3

952 968 998

954 963 998

924 955 918

1010 927 895

3

1 2 3

897 930 912

986 957 973

986 1005 974

935 891 930

4

1 2 3

875 864 905

971 943 952

932 980 971

920 987 915

5

1 2 3

1045 1087 964

912 957 938

1120 1010 1054

974 835 925

2jk

y

4

3jk

y

4jk

Gehen Sie davon aus, daß die Analyseergebnisse Realisationen unabhängiger, normal v e r t e i l t e r Z u f a l l s v a r i a b l e n mit g l e i c h e r Varianz s i n d , und prüfen Sie zum 2.5% Niveau, ob Unterschiede zwischen den Standorten und ob Unterschiede zwischen den Laboratorien vorhanden s i n d . Untersuchen S i e gegebenenfalls, welche Standorte bzw. Laboratorien s i c h zu diesem Niveau s i g n i f i k a n t

unter-

scheiden. Welche Aussage können Sie über die Standorte t r e f f e n , wenn Sie die v e r s c h i e denen Laboratorien außer acht l a s s e n ?

Kapitel 11: Ausblick auf weitere Verfahren

In diesem Kapitel s o l l e n s t a t i s t i s c h e V e r f a h r e n , d i e im Rahmen d i e s e s Buches b i s h e r n i c h t behandelt wurden, i n i h r e n Grundzügen d a r g e s t e l l t werden. Dabei wird n i c h t d i e konkrete Methodik, b z g l . derer verwiesen s e i auf Härtung et al.

(1986) und Härtung / E l p e l t ( 1 9 8 6 ) , sondern vielmehr d i e Z i e l s e t z u n g der

Verfahren und damit d i e ihnen zugrundeliegende F r a g e s t e l l u n g

vorgestellt.

Eines der Grundprobleme s t a t i s t i s c h e r Analysen i s t d i e VattngtmLnnung analysegerechte V a i m a u i b z A e A X u n g . N ü t z l i c h e H i l f s m i t t e l

und

s t e l l t hier die

VERSUCHSPLANUNG zur Verfügung, welche auch Problematiken s p e z i e l l e r Anwend u n g s b e r e i c h e , z . B . bei der Planung k l i n i s c h e r S t u d i e n , b e r ü c k s i c h t i g e n muß: Welche Daten müssen in welcher Form erhoben bzw. gemessen werden, damit d i e i n t e r e s s i e r e n d e n F r a g e s t e l l u n g e n auch durch eine s t a t i s t i s c h e Analyse beantwortbar s i n d ? Die Anlegung e i n e s konkreten Versuchsplanes i s t d i r e k t mit dem Problem, der Gewinnung " r e p r ä s e n t a t i v e r " S t i c h p r o b e n g e k o p p e l t ; h i e r

leistet

d i e STICHPROBENTHEORIE, d i e s i c h z . B . mit der g e s c h i c k t e n und erhebungstechn i s c h g ü n s t i g e n Planung und Durchführung von Untersuchungen b e s c h ä f t i g t , nen w i c h t i g e n B e i t r a g . So s o l l t e man etwa bei e i n e r InventuA bai-ii

au.6

ei-

Si-ichp/iobin-

das gesamte Lager dem Warenwert entsprechend in S c h i c h t e n a u f t e i l e n und

dann in jeder S c h i c h t z . B . p r o p o r t i o n a l

zur S c h i c h t g r ö ß e e i n e gewisse Anzahl

von Proben entnehmen. Stehen d i e gewünschten Daten e r s t einmal zur Verfügung, so s t e l l t s i c h d i e Frage nach der Größe und A r t von möglichen Meß^eWeAn; man v g l . h i e r z u etwa auch d i e Ausführungen zum F e h l e r f o r t p f l a n z u n g s g e s e t z

in

A b s c h n i t t 5 von Kapitel 4. Zudem muß ü b e r p r ü f t werden, ob eventuell

AuiiziUeA

in den Daten verhanden s i n d ; zu diesem Zwecke b i e t e n s i c h s p e z i e l l e

Ausreis-

s e r t e s t s an. S c h l i e ß l i c h s o l l t e man noch ü b e r l e g e n , ob v i e l l e i c h t eine O a X m thaM^onnatAxin n ü t z l i c h s e i n kann, um z . B . das V e r t e i l u n g s g e s e t z der den Daten zugrundeliegenden Gesamtheit b e s s e r in den G r i f f zu bekommen. H i e r b e i

ist

a l l e r d i n g s zu beachten, daß R e s u l t a t e f ü r t r a n s f o r m i e r t e Daten n i c h t ohne weiteres auf d i e Ursprungsdaten übertragbar

sind.

Im nächsten S c h r i t t s o l l t e man dann versuchen, einen Oberblick über das v o r l i e g e n d e Datenmaterial

zu gewinnen. Hier b i e t e n s i c h d i e Methoden der

202

Kap. 11: Ausblick

DESKRIPTIVEN resp. EXPLORATIVEN und ROBUSTEN STATISTIK a n . die zum Teil bereits in den vorausgegangenen Kapiteln mitbehandelt wurden. Diese Teilgebiete der Statistik stellen grob gesprochen Verfahren bereit, die große Datenmengen zusammenfassen, strukturieren und auch graphisch reprä'sentierbar machen. In diesem Zusammenhang ist auch auf spezielle GRAPHISCHE VERFAHREN hinzuweisen, die etwa Objekte oder Merkmale, die an Objekten erhoben wurden, in vergleichbarer Form darstellen, wobei z.B. bei der Darstellung von Objekten in Einzelgraphiken basierend auf mehreren Merkmalen (mehrdimensionale, multivariate Daten) auch Ähnlichkeiten, Zusammenhänge oder Wichtigkeit der Merkmale berücksichtigt werden können.

Hat man Daten erhoben, die rein qualitativer oder zumindest teilweise qualitativer

Natur sind, und möchte anhand dieser Daten Fragestellungen

beantwor-

ten, die besser oder nur mit einem Verfahren für quantitative,stetige

Daten

angehbar sind, so müssen diese qualitativen Daten mittels Methoden zur SKALIERUNG VON MERKMALSAUSPRÄGUNGEN

in quantitative Daten verwandelt werden.

Eine solche Skalierung erfolgt in der Regel auf der Basis maximal

erreich-

barer Merkmalskorrelationen, so daß die Skalierung direkt auch Anhaltspunkte für die Relevanz einzelner, erhobener Merkmale liefert. Welches konkrete Skalierungsverfahren anzuwenden ist, richtet sich hier nach der statistischen Methode, die man anschließend auf die neu skalierten Daten anwenden möchte.

Im Bereich der Produktion ist die QUALITÄTSKONTROLLE ein notwendiges

Instru-

mentarium zur Sicherung der Güte von Produkten. Sie stellt mehr oder weniger komplexe Systeme für Eingangs- und Ausgangskontrollen, aber auch für die Kontrolle der laufenden Produktion zur Verfügung. Wann muß z.B. eine Maschine wegen eventuell mangelnder Güte der von ihr produzierten Produkte gestoppt werden? Vor allem in diesem Bereich finden auch i&quw£LelZe.

itaiiitii>c.hi

VeA^ahAcn ihre Anwendung, bei denen ausgehend von einer Hypothese die Objekte nacheinander geprüft werden und nach jeder Objektprüfung erneut entschieden w i r d , ob die Hypothese zu verwerfen oder ob weiterzuprüfen

Die ZEITREIHENANALYSE dient zur Untersuchung von zeitlichen

ist.

Entwicklungen.

Hat man ein oder mehrere Merkmale z.B. über eine Reihe von Monaten hinweg beobachtet, so stellt sich die Frage, ob etwa ein Tn.wd Schwankung

oder eine

icUionale.

in den Daten verhanden ist, ob sich Verläufe mehrerer Merkmale ge-

genseitig beeinflussen usw. Außerdem ist es natürlich nicht zuletzt im wirtschaftlichen Bereich von Interesse, aufgrund der Daten aus der Vergangenheit den weiteren Verlauf der Zeitreihe, mithin die zukünftige Entwicklung zu pfiognoAtiz-LeAW.

203

Kap. 11: Ausblick

Im Zusammenhang mit der Berechnung von Wahrscheinlichkeiten in Kapitel 1 haben wir uns mit der Zuverlässigkeit von Systemen beschäftigt. Allgemein stellt die ZUVERLÄSSIGKEITSTHEORIE ein Methodenspektrum zur Verfügung, das es erlaubt, Zuverlässigkeiten und Lebensdauern von Objekten zu untersuchen. So werden z.B. komplexe oder auch mehrphasige Systeme vermittels resp. ?kaatd

- Uiii-Lon

- AnaZyitn

von Objekten analysiert, indem man sie etwa in

LzbmicbiuiLKve.>Uiiltu.ngw Klanen

FehleAbäumen

betrachtet. Auch werden die Strukturen der

solcher Verteilungen einordnet. Bei sehr langlebigen Objekten können

Lebensdaueruntersuchungen oft nur in Form von zeJ£na(l{le.nde.n

Piüiunge.n

im La-

borversuch (unter extremen Bedingungen) durchgeführt werden; hier stellt die Zuverlässigkeitstheorie Methoden bereit, welche die Extrapolation der Resultate auf normale Umgebungsbedingungen ermöglichen. Ein weiterer Problemkreis der Zuverlässigkeitstheorie ist die Festsetzung adäquater WaiXungi-, haltungi-

und

Initand-

EineaeAungntAate.g'Len.

Wir haben uns in den Kapiteln 1 und 8 mit Verfahren für Vierfeldertafeln und rxs - Kontingenztafeln beschäftigt, bei denen etwa Zusammenhänge zwischen zwei diskreten bzw. diskretisierten Merkmalen untersucht wurden. Um die Stärke des Zusammenhangs solcher Merkmale zu messen, verwendet man sogenannte Α a o z l a tLani-

bzw. Kontingznzkoz^izlentzn,

denen die Korrelationskoeffizienten

im

stetigen Fall entsprechen. Ein wichtiges Hilfsmittel bei der gleichzeitigen Analyse mehrerer diskreter Merkmale in MEHRDIMENSIONALEN ist das' Logllnmie

Modelt,

KONTINGENZTAFELN

mit dessen Hilfe z.B. gezielt ganz spezielle Hypo-

thesen über die Abhängigkeiten der Merkmale untereinander geprüft werden können.

Bei der Regressionsanalyse im Kapitel 9 haben wir stets vorausgesetzt, daß das Regressanden - Merkmal stetig bzw. sogar normalverteilt ist. Ist das interessierende Merkmal hingegen diskreter bzw. qualitativer Natur, so kann man sich der sogenannten DISKRETEN REGRESSIONSANALYSE bedienen. Die wohl wichtigsten Modelle in diesem Zusammenhang sind das Lineale. modell,

das

P/iobit

- ModeZl

und das

Log-iX

- Modell.

Uahi&ch&±nlichke>Lti-

Hier werden

insbesondere

Wahrscheinlichkeiten geschätzt, mit denen bei vorgegebener Konstellation der Regressor - Merkmale die einzelnen Ausprägungen des Regressanden eintreten.

Wir wollen uns nun mit Verfahren beschäftigen, die man gemeinhin unter dem Namen MULTIVARIATE STATISTISCHE METHODEN zusammenfaßt. Das sind Analysemethoden, bei denen man sich gleichzeitig für mehrere an einem Objekt erhobene oder gemessene Merkmale interessiert. Zu diesen Verfahren muß man strenggenommen natürlich auch die Analysemethoden für mehrdimensionale Kontingenztafeln, den Vergleich von Zeitreihen, einige graphische Verfahren sowie auch

204

Kap. 11: Ausblick

e i n i g e Verfahren zur Skalierung von Merkmalsausprägungen rechnen, auf die wir hier b e r e i t s Bezug genommen haben. Werden bei EIN-,ZWEI- UND MEHRSTICHPROBENPROBLEMEN g l e i c h z e i t i g mehrere Merkmale an den Objekten der Stichproben beobachtet, und möchte man z.B. aufgrund dieser Daten untersuchen, ob s i c h die den Stichproben zugrundeliegenden Gesamtheiten b z g l . a l l e r Merkmale g l e i c h z e i t i g , gemeinsam unterscheiden, so gelangt man n a t ü r l i c h automatisch zu denjenigen m u l t i v a r i a t e n Verfahren, die den von uns behandelten sogenannten univariaten Verfahren ( f ü r ein Merkmal) analog sind. In den Rahmen von Mehrstichprobenproblemen f ä l l t aber z.B. auch die DISKRIMINANZANALYSE, aufgrund derer man, ausgehend von den Beobachtungen zu den interessierenden Merkmalen, ein Objekt (von dem man n i c h t weiß, zu welcher der in Frage stehenden Grundgesamtheiten es gehört) einer der Grundgesamtheiten zuordnen kann. Für die Güte dieser Zuordnung s i n d die v e r s c h i e denen Merkmale n a t ü r l i c h u n t e r s c h i e d l i c h w i c h t i g ; die wesentlichen Merkmale kann man dann mit H i l f e von Tiennmaßen

bestimmen, die angeben,wie gut man auf-

grund einzelner Merkmale bzw. Gruppen von Merkmalen zwischen den Grundgesamtheiten unterscheiden, d i s k r i m i n i e r e n kann. Hiervon ausgehend kann dann event u e l l auch eine Meikmxlifiedaktion

vorgenommen werden, d.h. bei zukünftigen

Objekten, die man einer der Grundgesamtheiten zuordnen möchte, müssen dann nur noch die für die Zuordnung w i r k l i c h relevanten Merkmale beobachtet werden.

Das Mehrstichprobenproblem e n t s p r i c h t n a t ü r l i c h wie im F a l l e nur eines essierenden Merkmals gerade einer nun multivcuiMiten

einlachen

inter-

VaAianzanalya,

bei welcher der E i n f l u ß eines Faktors auf endlich v i e l e n Stufen (diese entsprechen gerade den verschiedenen Grundgesamtheiten von Objekten) auf die interessierenden Merkmale untersucht wird. Allgemein werden Versuche mit einem oder mehreren Einflußfaktoren im F a l l e mehrerer i n t e r e s s i e r e n d e r Merkmale mit den Methoden des MULTIVARIATEN LINEAREN MODELLS ausgewertet. Sind die Einflußfaktoren wie in der Regressionsanalyse q u a n t i t a t i v e r Natur, so s p r i c h t man von nultivaAMUeA

s i n d s i e q u a l i t a t i v e r Na-

RigtLeJsAion6a.ncd.yie.,

tur (Faktoren mit endlich v i e l e n S t u f e n ) , so s p r i c h t man von nuttivaiMiXeA VafUa.nza.naly&z,

sind s i e s c h l i e ß l i c h gemischt q u a l i t a t i v - q u a n t i t a t i v , so

s p r i c h t man von maltivivUaXeA

KovasUanzanalyie..

Speziell

im Fall der m u l t i -

variaten Varianzanalyse unterscheidet man, wie im F a l l e eines Merkmals in Kapitel

10 angedeutet, zwischen festen und z u f ä l l i g e n Effekten der E i n f l u ß -

faktoren. I n t e r e s s i e r e n nur die im Versuch konkret b e r ü c k s i c h t i g t e n Stufen eines

F a k t o r s , s o g e l a n g t man zum Modell

mit

iuten

ΕRekten

(Modell

I).

Handelt es s i c h bei den Stufen hingegen um eine z u f ä l l i g e Auswahl aus (unendl i c h ) v i e l e n Stufen und möchte man einen generellen Schluß über den E i n f l u ß -

205

Kap. II: Ausblick

faktor ziehen, so spricht man vom McideM

II oder vom Μ o d e M . irüX

zu^äMlgen

E^jJefe-ten. Hier wird dann die Variation zwischen den Stufen eines Einflußfaktors bzgl. des oder der interessierenden Merkmale betrachtet;

insbeson-

dere beschäftigt man sich mit der Schätzung dieser Variation, der von

Schätzung

I / i v U a . n z k o m p o M n X e . n . Treten in einem Varianzanalysemodel 1 Einflußfaktoren

sowohl mit festen als auch mit zufälligen Effekten gleichzeitig auf, so spricht man vom HodM

III oder gemiichtm

der Varianzanalyse.

Moduli

Bei der MULTIDIMENSIONALEN SKALIERUNG (MDS) will man η Objekte durch eine q - dimensionale Datenmatrix darstellen. Aufgrund einer Ausgangsinformation über die η interessierenden Objekte in Form einer Distanzmatrix, welche die paarweisen Verschiedenheiten

(Distanzen) der Objekte beinhaltet, wird also

bei der Multidimensionalen Skalierung eine Skala gesucht, die jedem Objekt einen q - dimensionalen Vektor derart zuordnet, daß die z.B. euklidischen Abstände zwischen den Vektoren die Verschiedenheiten der Objekte möglichst gut widerspiegeln.

Ist die gewählte Dimension des Repräsentationsraums

klein

( q < 3 ) , so können die η Objekte dann auch graphisch dargestellt werden. Je nachdem, in welcher Form die Verschiedenheitsinformationen

über die Objekte

vorliegen, können bei der MDS verschiedene Verfahren gewählt werden. Hat man an den η Objekten etwa p > q Merkmale beobachtet, so kann aufgrund der mensionalen Beobachtungsvektoren eine "zahlenmäßige" Distanzmatrix werden, die dann z.B. mittels Nontin&aA

Mapping

oder

ρ-di-

bestimmt

HaaptkooidinatmmeXhodi

durch eine Distanzmatrix basierend auf einer q - dimensionalen Skala approximiert wird. Kennt man dagegen nur eine Rangfolge aller Objektpaare bzgl. ihrer Verschiedenheiten, so wird durch das VeA. Rahlen

von

KA.LU>KAL eine q - dimen-

sionale Skala derart bestimmt, daß die daraus resultierenden Distanzen möglichst genau diese Reihenfolge einhalten. Hat man schließlich nur für jedes einzelne Objekt individuell gesehen eine Rangfolge der übrigen Objekte bzgl. ihrer Verschiedenheit von diesem einzelnen Objekt (individual kann mittels Unfolding

- Technik

scale), so

eine gemeinsame (q - dimensionale) Skala

(joint scale) für die Objekte gefunden werden.

Die CLUSTERANALYSE stellt ein Instrumentarium bereit, mit dem Objekte zu Klassen zusammengefaßt werden können. Dabei möchte man erreichen, daß die Klassen (cluster) der konstruierten Klassifikation der Objekte in sich möglichst homogen und untereinander möglichst heterogen sind. Die in einer Klasse zusammengefaßten Objekte sollen sich also möglichst ähnlich sein und die verschiedenen Klassen sollen sich bzgl. der in ihnen enthaltenen Objekte möglichst stark unterscheiden. verschiedene Typin

von

In der Clusteranalyse unterscheidet man nun

Ktaaii-Lkatxonin,

nämlich Partitionen, Oberdeckungen,

Hierarchien und Quasihierarchien. Eine PtvUMxon

von η Objekten ist eine

206

Kap. 11: Ausblick

Einteilung der Objekte in disjunkte, sich nicht überschneidende Klassen, wohingegen sich bei einer übeAdeckung

die Klassen überlappen können, jedoch

keine Klasse vollständig in einer anderen enthalten sein darf. Eine chie

HienaA-

wird gebildet durch eine Folge von Partitionen. Geht man etwa von den

η einelementigen Klassen aus, so werden auf der nächsten Stufe der Hierarchie Klassen zusammengefaßt und zwar derart, daß auch diese Stufe eine Partition darstellt; die dritte Stufe der Hierarchie entsteht durch Zusammenfassen von Klassen aus der zweiten Stufe, wobei wiederum beachtet werden m u ß , daß eine Partition entsteht, usw. Vollkommen analog besteht eine QuaiihieAatchie aus einer Folge von Oberdeckungen. Für die verschiedenen typen gibt es nun diverse KonitnuktionAueAiahien,

dann

Klassifikations-

bei denen i.d.R. jeweils

noch ein Maß für die Homogenität der Klassen und für die Heterogenität zwischen den Klassen gewählt werden muß; aufgrund dieser Maße wird dann die Güte.

einet

Klaai{,ikation

beurteilt. An dieser Stelle seien nur noch bei-

spielhaft drei häufig verwandte Heterogenitätsmaße, also Maßzahlen für die Verschiedenheit von je zwei Klassen erwähnt. Complete

linkage

mißt die Ver-

schiedenheit aufgrund des maximalen Abstandes, iingle

linkage,

aufgrund des

minimalen Abstandes und average

linkage,

aufgrund des durchschnittlichen

Ab-

standes zwischen den Objekten aus der einen und den Objekten aus der anderen Klasse.

Bei der FAKTORENANALYSE, die wir hier als abschließendes Verfahren kurz schildern wollen, werden ausgehend von ρ interessierenden Merkmalen, die jeweils an η Objekten aus einer Gesamtheit gemessen bzw. erhoben werden, qUa.blen,

kreten Verfahren der Faktorenanalyse, als da sind die lenVioidmethode, Maximum - Likelihood tofienanalyie

latenten

d.h. einer nicht direkt meßbaren Größe beeinflußt werden. Die kon-

- Methode,

die kanonische

faktoKenanalyie,

die

etc. konstruieren nun eine sogenannte Ladungimat'u.x

die Haupt^akL für q

orthogonale, künstliche Faktoren derart, daß L L T eine um merkmalseigene Varianzen reduzierte Korrelationsmatrix der ρ Merkmale möglichst gut approximiert; die Elemente der Ladungsmatrix L sind dabei gerade die Korrelationen zwischen den ρ Merkmalen und den q latenten Faktoren. In der Regel wird diese Ladungsmatrix dann noch so rotiert, daß sie einer sogenannten itmktuA

Ein^ach-

möglichst nahe kommt; unter einer Einfachstruktur versteht man da-

bei grob gesprochen, daß jeder Faktor mit einer Gruppe von Merkmalen hoch und mit den übrigen Merkmalen möglichst schwach korreliert ist sowie daß die Merkmalsgruppen zu den verschiedenen Faktoren disjunkt sind. Die verschie-

207

Kap. 11: Ausblick

denen Ro£a£ion6veA{ahien

drehen die Faktoren (gesehen als q - dimensionales

Koordinatensystem) entweder so, daß wiederum orthogonale Faktoren entstehen ( z.B. Vajujmx

-

oder QuauUirax

- Methode),

oder so, daß die resultierenden

Faktoren schiefwinklig, d.h. miteinander korreliert sind (z.B. Methode P>UinäAiaktoien);

verschiedene orthogonale bzw. schiefwinklige

den.

Rotationsver-

fahren unterscheiden sich in der Art und Weise, wie sie die Güte der Näherung einer Einfachstruktur messen. Nicht zuletzt dient die auch der VaXejuiedukXxon

Faktorenanalyse

für weitere statistische Analysen. Unter Verwendung

der unrotierten oder rotierten Ladungsmatrix werden sogenannte

VaktoimuieAte

oder PeAiäntcchkeZt6pAoi

-CO

so daß sich mit

J

fx(x)

dx

= J

-o°

c · ( 2 - x 2 - 3) d x

= c · | ( 2 - x 2 - 3) d x

2

2

= c ·

-

c ,



· χ 3 - 3·χ] /686

16

^-r-T"

2 1

= ε · ^ | · 343 - 3 · 7 - | · 8 + 3 · 2 ^

+6

y -

c

r

686 - 16 - 6 3 + 18

J — —

625

ergibt:

=

625

= 0.0048

Weiter ist die Verteilungsfunktion der Zufallsvariablen X gerade χ

χ

Fx(x) = |

f x (u) du = | c · (2-u 2 - 3) du 2

= 0.0048 · ( § · χ 3 - 3 · χ + | ) = und 0

, für χ < 2

1

, für χ > 7

Fx(x) =

b) Mit F x (x) = P ( { X < x } )

(2·χ 3 - 9·χ + 2)

für

2 z ]

dy

(y).l

[ 0 > 4 ]

(y)dy

, für ze[4,8]

z-4

e

-2z

z

J

e2y · ( l - | - y )

dy

, für ze[0,4]

1 - e 0

, sonst

an der S t e l l e ζ = 4 b e s i t z t f z ( z ) eine

Sprungstelle.

Nun i s t f ü r b e l i e b i g e Zahlen a , b mit a < b

f e

2 y

. ( l - { . y )

dy

a

2

y-|.y.e

2

v)

dy

a

=

1

.

=^ ' ( e

1

2 b

·

2a

1 . 2b 1 2a 1 2b 1 2a -Ts·· be + *· · ae +-r-»-· e --Λ-· e TF ΤΪ

(9-2b)-e2a·

^ • ( e

8

^ • ( e

2 z

^

so daß sich

= }(e

·

(9 - 8) -

·

(9-2a))

e 2 ( z _ 4 )

(9-2z)-e

0

· (9-2· (z-4)))

· (9-0))

, f ü r a = z - 4 , b=4

, f ü r a=0, b=z

( e 8 - e ~ 8 · e2z · ( 1 7 - 2 z ) )

, f ü r a=z-4, b=4

( e 2 z · ( 9 - 2z) - 9 )

, f ü r a=0, b=z

232

Kap. 12: Lösungen zu den Aufgaben in Kapitel 3

e~ 16f

z

(z)

=

(1

2 z

- e ~

8

( e

8

( e

2 z

2 z

e'

_ 8

- e

. e

2 z

·

( 1 7 - 2 z ) )

für

ze[4,8]

für

ze[0,4]

)

1 6 · (1 - e " 8 )

-

( 9 - 2 z ) - 9 )

sonst

1 16 · (1 - e

16· l

als lich

Es

Dichte eine

der

(1 - e

. ( )

I

f

z

(z)

(

f

z

(z)

- 2 ( z - 4 ) _

- 8 .

e

_

( 1 7

Λ

2

für

ze[4,8]

für

ze[0,4]

/ e~2z") /

5— · ^ 9 - 2 z - 9 · u \ )

sonst

0

Zufallsvariablen

Dichte

e

^

ist,

Ζ ergibt.

kontrolliert

man

Um z u

das

überprüfen,

Erfülltsein

ob

f^(z)

wirk-

von

ist

1 6 · (1 - e ~ ö )

16- (1 - e ~ ö )

I

( 9 - 2 z - 9 ·

(

( e

2 ( z

([

9 z - z

[.

16- (1 - e " 8

-

(36-

1 .

e

+

8

- e -

| . e -

8

e "

+

( 1 - e "

8

)

) )

- 0

= >

dz

2 z

1 7

1

.

e

- 8 .

z

+ 0 - | - ^ ·

68 · e "

8

dz

. ( 1 7 - 2 z ) )

- 2 ( z - 4 ) .

16+ | .

+ 64 · e "

! — ^ τ · ( ΐ 6 · 16 · (1 - e ) ^

2

4 )

-

2 z

e"

8

-

.

16 ·

e"

+

e

e "

8

8

)

- 8 .

-

z

2

D

136 ·

e"

8

Kap. 12: Lösungen zu den Aufgaben in Kapitel 3

AUFAGBE 3.5: Ist X%B(3 , 0.3), so ist ( 3 ) · 0.3k · 0.7 3 " k

, für k=0,1,2,3

P(x = k ) =

, sonst und es gilt für y>0 P({Y ) - 0 . 3 3

= 0.343 · (1 - e " z ) + 0.441 · (1 - e " ( z ~ 1 ' ) + 0.189 · (1 - e " ( z " 2 ) ) + 0.027 - ( 1 - e ~ ( z ~ 3 ) )

.

AUFGABE 3 . 6 : Für k = 0 , 1 , 2 , 3 i s t

P(X = k ) = I 0 T T ^ | - ( k ) · ° - 2 5 k - ° · 5 1 2 · ( k ) · ° · 2 5 " · l = 0.512 · = 0.83 ·

· 0.25 k ·

j t H

j j · e" 1 = 0.512 · ( 3 ) · 0.25 k · 1

· 0.2k · 0.8"k =

· 0.2k · 0.83"k

und P(X = k) = 0

für

k — P(X = k) · P(Y = j ) = l ΠΓ73 k=0 z=k+j k)

21 iJi

E ( g i ( X ) ) = 21 - ( 21

bzw. der erwartete Verlust auf insgesamt 100 · -g- = 350 Pfennige oder 3.5 DM beläuft.

AUFGABE 4.4: Die Informationen in der Aufgabenstellung können Sie auch in der Form P( 190 - X | > 5 ) = P ( | E ( X ) - X | > 5 ) = S% + 7% = 12% = 0.12 zusammenfassen, wenn die Zufallsvariable X die Haltbarkeitsdauer einer H Milch - Packung beschreibt. Nach der Tschebyscheffschen Ungleichung g i l t nun für beliebige Zufallsvariablen X mit existierender Varianz P(|E(X)-X| >c)
5) < bzw. 25 · P(|E(X) - X| > 5) < Var(X)

.

Als untere Abschätzung für die Varianz der Haltbarkeitsdauer ergibt sich somit der Wert

242

Kap. 12: Lösungen zu den Aufgaben in Kapitel 4

25 · 0.12 = 3

,

d.h. die Standardabweichung der Haltbarkeitsdauer der H - M i l c h beträgt mindestens \ ß = 1 .732 Tage.

AUFGABE 4.5: Beschreibt die Zufallsvariable X die Lebensdauer einer Batterie des betrachteten Typs, so i s t μ = E(X) = 45

und

σ 2 = Var(X) = 5 2 = 25

.

Nach dem Fehlerfortpflanzungsgesetz ergibt sich dann für die Z u f a l l s v a r i able Y = f(X) = ln X, die die logarithmierte Lebensdauer beschreibt, E(Y) = E(f(X))

f(p) = In μ = In 45 = 3.807

und mit 3f 3X

Χ=μ

ergibt sich

45

= 0.0123

die Varianz der logarithmierten Lebensdauer i s t also in etwa gleich dem Quadrat des Variationskoeffizienten ν der Lebensdauer.

Kap. 12: Lösungen zu den Aufgaben in Kapitel 5

243

5. Lösungen zu den Aufgaben in Kapitel 5 AUFGABE 5.1: Die Quantile u a der Standardnormal verteil una sind aus Tab. 2 des Anhangs ablesbar, wobei für α < 0 . 5 von der Symmetrie der Verteilung Gebrauch gemacht werden muß: u = -u, α 1-α Auch die t - V e r t e i l u n g i s t symmetrisch, so daß mit

die gesuchten Quantile für η = 10 und η = 17 aus der Tab. 3 des Anhangs abge2 lesen werden können. Die Quantile χΛ sind für η = 10 und η = 15 in der Taη ;α belle 4 des Anhanos zu finden und die Quantile Fm „ sind in Tabelle 5 des m,n;a Anhangs vertafelt. Hier muß man sich für a < 0 . 5 der Regel Fra

»n;a

~c 1 η ,m;1-a

bedienen. In der nachfolgenden Tab. 3 sind a l l e gesuchten Quantile zusammengestellt. ?

Tab. 3: α - Q u a n t i l e der Standardnormal-, der t - , χ - und F-Verteilunq für α = 0.01 , 0.05, 0.95, 0.99

Ί0;α

α = 0.01

α= 0.05

α = 0.95

α = 0.99

-2.3263

-1.6449

1.6449

2.3263

-2.764

-1.812

1.812

2.7b4

-2.567

-1.740

1.740

2.567

2.558

3.940

18.31

23.21

5.229

7.261

25.00

30.58

2 χ

10;α

2

χ

15;α

F 3,7;α

7 Κ.

1

27.67

1

8.451

0.036

0.118

1

8.887

1

4.347

=0.113

4.347

= 0.230

8.887

8.451 27.67

244

Kap. 12: Lösungen zu den Aufgeben in Kapitel 5

AUFGABE 5 . 2 : B e s c h r e i b t X^ d i e Anzahl der Fußgänger während e i n e r Rotphase auf der einen und X 2 d i e Anzahl der Fußgänger auf der anderen S t r a ß e n s e i t e , so X ^ P o U ^

mit

λ^ = 4

und

Χ2^Ρο(λ2)

mit

λ2 = 8

,

ist

da auf den S t r a ß e n s e i t e n pro Minute d u r c h s c h n i t t l i c h 2 bzw. 4 , d . h . während e i n e r Rotphase von 2 Minuten d u r c h s c h n i t t l i c h 4 bzw. 8 Fußgänger ankommen und da der Erwartungswert der Ρο(λ) - V e r t e i l u n g gerade λ i s t . Die Gesamtzahl der wartenden Fußgänger während e i n e r Rotphase wird durch Y = X^ + X 2 beschrieben, so daß s i c h Υ ^ Po(12) e r g i b t , da d i e Summe unabhängiger P o ( X i ) - v e r t e i l t e r rade Po( l X i ) - v e r t e i l t

Zufallsvariablen

ge-

ist.

a) (1) Die W a h r s c h e i n l i c h k e i t , daß auf j e d e r S t r a ß e n s e i t e mindestens

vier

Fußgänger warten, l ä ß t s i c h aufgrund der Unabhängigkeit von X^ und X 2 d a r s t e l l e n a l s Produkt der W a h r s c h e i n l i c h k e i t e n , mit denen auf der einen und der anderen S t r a ß e n s e i t e mindestens v i e r Fußgänger warten: Gesucht i s t

also

P ( { X 1 > 4 } ) · P ( { X 2 > 4 } ) = (1 - P ( { X , < 3 } ) ) · (1 - P ( { X 2 < 3 } ) ) Mit -4

=

- j - · 0.0183

= 0.4335

Kap. 12: Lösungen zu den Aufgaben in Kapitel 5

,"8

82 . 83 ϋ τ Ύ Γ τ π π

G

245

8 . 64 . 512\

-8

0.0003355 0.0424 e r g i b t s i c h die gesuchte Wahrscheinlichkeit zu P(X 1 > 4) · P(X 2 > 4) = (1 - 0.4335) · (1 - 0.0424) = 0.5665 · 0.9576 = 0.5425 = 54.25%

.

(2) Gesucht i s t Ρ ί ί Χ , + X 2 > 4 ) = Ρ ({Y > 4 } ) = 1 - P ( { Y < 3 } ) 3

1-

I P(Y = J ) = 1 " I j=0 j=0 12° Τ Γ

1 -

/I

+

121 122 123 Τ Γ + Τ Γ + ΤΓ

12

144

1728\

12j -12 T T•' e J· .-12

-12

= 1 - 373 · 0.000006144 = 0.9977 d.h. mit e i n e r Wahrscheinlichkeit von 99.77% warten insgesamt mindestens v i e r Fußgänger. b) Beschreiben die unabhängigen Po(12) - v e r t e i l t e n

Zufallsvariablen

Y j , . . . » Y j q q die Zahl der insgesamt wartenden Fußgänger in den Rotphasen 1 , 2 , . . . , 5 0 0 , so l ä ß t sich die gesuchte Wahrscheinlichkeit schreiben a l s / .

500 3UU

i m ' i ,

λ Y

i S

1 1

-

7

r

p

( W

1 1

·

7

)

und mit E ^ ) = V a r ( Y . ) = 12

f ü r i=1

500

e r g i b t s i c h unter Verwendung des Zentralen Grenzwertsatzes und der Tab e l l e 1 des Anhangs

246

Kap. 12: Lösungen zu den Aufgeben in Kapitel 5

P ( ^ n n < 11-7) = Pf V S M - ^ O O - J Ü < 500 " V W ' ^

11

·7' y/π

'

'

VT?

= φ(-0.3· J ^ j

vSTO ·

= Φ(-1.94) = 1 - Φ( 1.94)

= 1 - 0.9738 = 0.0262 = 2.62%

.

AUFGABE 5.3: Die Zufallsvariable X i , die für i=1,...,400 die Lebensdauer des i-ten Kühl aggregates beschreibt, ist exponentialverteilt mit Parameter λ. Laut Experiment ist EfX^ ) = 2 = 1 für i=1 ,...,400 , so daß sich der Parameter X der Exponentialverteilung zu λ = 0.5 ergibt. Somit ist die Varianz der Zufallsvariablen X^ für i=1 ,...,400 gerade Var(X.) « 4 = 1 λ^ 0.5

= 4

und unter Verwendung des Zentralen Grenzwertsatzes sowie der Tabelle 1 im Anhang läßt sich die gesuchte Wahrscheinlichkeit folgendermaßen abschätzen: ,400 '(Ι

\

/400

\

,

X i < 750) = p(.I i Xi 9 7 5

Da gilt 16 i 3.6405 · t ^ 5 . 0

g75

= 3.6405 · 2 . 1 3 1 2 = 16.532

17 > 3.6405 · t ^ 5 . 0

g75

= 3.6405 · 2.120 2 = 16.362

ist die gesucht Zahl gerade n " =17.

und

257

Kap. 12: Lösungen zu den Aufgaben in Kapitel 7

d) Die Breite eines 95% - Konfidenzintervalles für den Erwartungswert μ einer 2 2 Ν(μ,σ ) - V e r t e i l u n g mit unbekannter Varianz σ soll den Wert d = 1 nicht Uberschreiten. Betrachtet man die Daten der Aufgabenstellung als Vor2 Stichprobe mit n^ = η = 9 , χ = 30.056 und s Zahl n

1

= 2.053, so ist die kleinste

gesucht, so daß gilt 2s · t

2 ·V O S S · t 8;0.975

n0-1;1-a/2

1

= 4 · 2.053 · 2.306 = 43.668

.

Voraussichtlich ist also ein Stichprobenumfang n' = 4 4 nötig, um die Breite d = 1 des 95% - Konfidenzinterval les für μ abzusichern.

AUFGABE 7.2:

Aufgrund einer Stichprobe von n = 100 Transistoren, von denen sich π = 89 als intakt erwiesen, sollen Konfidenzintervalle für die

Intaktwahrscheinlichkeit

eines Transistors aus der Produktion bestimmt werden, die eine

Sicherheits-

wahrscheinlichkeit von 98% besitzen. Gesucht sind also ein approximatives und ein exaktes Konfidenzintervall

zum Niveau 1 - a = 0.98 für den Parameter

ρ einer Binomialverteilung, der aufgrund der Stichprobe durch den Punktschätzer

Η

-

w

= °-89

= 89%

geschätzt wird.

Das exakte Konfidenzintervall

berechnet sich basierend auf einer Approxima-

tion der Quantile

F

2m,2(n-m+1);a/2

F

2(m+1),2(n-m);1-a/2

einer F^Q 1 7 8 " ^ Z W "

F

= F

178,24;0.01 = F

24,178;0.99

e

"θ.99*

F

24,178;0.99

180,22;0.99

1 8 0 22 ~

F

=

Approximation des Quantiis

a

~

b

"

e

2.3263a-b

258

Kap. 12: Lösungen zu den Aufgaben in Kapitel 7

ergibt sich mit

wobei

c

J " 0 . 9 / -

d =

?T^T

+

3

2.3263 2 - 3

,

T7FrT

=

73

+

T77

=

= 0 4019

und

°·0491

.

d.h. a = \/2 · 0.0491 + 0.4019 · 0.0491 2 = 0.3149 b

=

und

= 0.0922

+

,

zu ρ

24,178;0.99~

2.3263 · 0.3149 - 0.0922

QQ7i

-l.BS/l

Für das zweite Quantil

f

~oU0-99"a"b 2.3263 · a - b 180,22;0.99~ "e

ergibt sich mit ^

2.326^-3 ,

d =

+

0 4019

=

un()

T79 + 2T

=

°·0532

dann wegen und a = / 2 d + cd 2 = / 2 · 0.0532 + 0.4019 · 0.0532 2 =0.3279

= 2.(^-^).(0.4019 gerade

+

| - ^ 3 2 ) = -0,023

Kap. 12: Lösungen zu den Aufgaben in Kapitel 7

Ρ

2.3263 · 0.3279+ 0.1023

259

,

Bestimmen wir noch 1

1

178,24 ;0.01 '7. 24,178;0.99

TTS57T = 0.5271

so können wir das exakte 98% - Konfidenzinterval 1 für die Intaktwahrscheinlichkeit ρ angeben: m · F2m,2(n-m+1);g/2 [ P r P 2 ] = η - m + 1 + m · F, 2m,2(n-m+1);a/2

n

-m+(m+1,'F2(m+1),2(n-m);1-a/2.

89 · F 178,24;0.01 100- 89+ 1 + 8 9 - F 1 7 8 > 2 4 ; 0 _ 0 1

=

90 ' P 180,22;0.99 » 100-89 + 90 - F 1 8 0 > 2 2 ; 0 _ 9 9

Γ 89 - 0.5271 90 · 2.3752 1 [l2 + 80 · 0.5271 · 11 + $ 0 · 2.3752J [0.796 , 0.951]

Die Intaktwahrscheinlichkeit liegt also mit 98% Sicherheit zwischen 79.6% und 95.1%. Die Grenzen des approximativen 98% - Konfidenzintervalles ergeben sich aus der Approximation der Binomialverteilung durch eine Normal Verteilung zu

· 2 = 2 . in J,. 2 =

1 ' ( 2 n ? + "0 · 99 ; U 0.99 · v/ u 0.99 + 4 n P · * 1 - ^ )

5 - · (z · 100 · 0.89 + 2.3263 2 2 · (100 + 2.3263 ) ^ + 2.3263 · / 2 . 3 2 6 3 2 + 4 · 100· 0.89· 0.11

=

210.8233 ' f'83.4117 + 2.3263 · v/44.6717)

"210.6233 · (183.4117 Ϊ 15.5309) =0.8700ϊ0.0737 d.h. das approximative Konfidenzintervall zum Niveau 0.98 für die Intaktwahrscheinlichkeit eines Transistors aus der Produktion ist

260

Kap. 12: Lösungen zu den Aufgaben in Kapitel 7

[ p ^ p g ] = [0.8700 - 0.0737 , 0.8700 + 0.0737] = [0.7963 , 0.9437] = [79.63% , 94.37%]

.

261

Kap. 12: Lösungen zu den Aufgaben in Kapitel 8

8. Losungen zu den Aufgaben in Kapitel 8 AUFGABE 8.1: 2

In dieser Aufgabe sollen Hypothesen liber die Parameter μ und σ

der Normal-

Verteilung, aus der die Daten in der Tab. 2 des Kapitels 7 entstammen, geprüft werden. In Abschnitt 7 haben wir bereits arithmetisches Mittel und empirische Varianz der n = 9 Proben berechnet: χ = 30.056

s 2 = 2.053

und

.

a) Zum 5% Niveau i s t die Hypothese H q : μ = 28

H1: μ f28

gegen 2

bei unbekanntem Parameter σ

der Normal Verteilung mittels t - Test zu prü-

fen. Wegen | t | . | i ^ 8 . V n | = 130-056 - 28 . ^ 1 1 s 1 1 1 v/OSJ M . 3 0 5 > 2.306 = t 8 ; 0 _ 9 7 5 = t n _ 1 ; 1 _ a / 2 wird die Hypothese HQ verworfen, d.h. die Abweichung der mittleren Zerstörungszugkraft μ von μ 0 =28 kp i s t zum 5% Niveau s i g n i f i k a n t . ρ b) Möchte man prüfen, ob die Varianz σ der Zerstörungskraft s i g n i f i k a n t zum 2 5% Niveau von o Q = 4 verschieden i s t , so testet man die Hypothese H q : σ2 = 4

Η,: σ 2 + 4

gegen

.

Da der Erwartungswert μ unbekannt i s t , verwendet man hierzu die Teststatistik

und vergleicht sie mit den kritischen Werten χ

2

η-1;α/2

= χ

2

8;0.025

= 2

·180

'

x

2

n-1 ;1-α/2

= χ

2

8;0.975

= 17

"53

·

262

Kap. 12: Lötungen zu den Aufgaben in Kapitel 8

Die Hypothese H n kann hier nicht verworfen werden, d.h. die Abweichung 2 2 der Varianz σ

vom Wert O g = 4 ist zum 5% Niveau nicht signifikant, da

gilt 4;0.025 = 2 · 1 8 0 ί Χ 2

= 4

·106ϊ17·53

=

Χ8;0.975

"

AUFGABE 8.2: a) Bezeichnet μ^ den erwarteten Ertrag von Sorte 1, μ2 den erwarteten Ertrag von Sorte 2 und σ 2 die Varianz der Erträge bei Sorte 1 und 2, so ist bei 2 unbekannter Varianz σ die Hypothese H q : μ1 > μ 2

gegen

Η,: μ, < μ 2

zum 5% Niveau zu testen. Aus den Daten der Tab. 11 in Kap. 8 ergeben sich die mittleren Erträge zu

-

χ, = 1

1 2

1

12 ^

Υ

1 12 • *2=T2 J

x, • = 25.258

für Sorte 1

1i

x

2i

= 27

·258

für Sorte

und

2

und die gemeinsame Stichprobenvarianz ist 12 12 „ 2 1 (χι-j - Χι) + I (x?i · χ 2 } .2 _ i=1 i =1 ^ sp 12+12-2

=

58.411 + 34.867 = 22

_2

37g

4

. ,. n ·240 ·

so daß sich die Prüfgröße des Tests zu X

1"X2

Π Γ S P V/ T Τ?+T?

_ 25.258- 27.258

=

V4.240 / 6

ergibt. Da gilt t =-2.379 0

gegen

Hj: Δ < 0

mit Hilfe des Wilcoxon - Rangsummentests, so ist dies gerade das nichtparametrische Analogon zum Test in a). Um diesen Test durchführen zu können, müssen zunächst für beide Stichproben gemeinsame Rangzahlen vergeben werden, vgl. Tab. 5.

Tab. 5: Erträge x^·, Xg^ von je 12 Proben zweier Getreidestämme und zugehörige Rangzahlen R,., R~., vgl. auch Tab. 11 in Kapitel 8

i

x

1 2 3 4 5 6 7 8 9 10 11 12

R

1i

23.4 25.8 27.2 26.0 22.1 26.7 25.5 22.6 27.8 28.1 26.5 21.4

x

1i

4 8 16 10 2 14 7 3 18 19 13 1

R

2i

2i

17 9 21

27.3 25.9 28.4 26.2 29.7 25.0 24.3 29.6 28.2 26.4 27.0 29.1

11

24 6 5 23 20 12 15 22

Die Summe der Rangzahlen in der ersten Stichprobe (bei Sorte 1) ist nun 12

.I, R ii = m

,

so daß sich der Wert der approximativ standardnormal verteil ten Prüfgröße Τ (wegen der geringen Stichprobenumfänge ist die Approximation natürlich nicht besonders gut) zu T

_

115- 12 · (12 + 12 + 1) / 2 vM2 · 12 · (12+ 12+ 1) / 12

=

115 - 150

=

_2

Q21

V W

ergibt. Die Hypothese H Q muß also zum 5% Niveau verworfen werden, d.h. die Erträge von Sorte 2 sind signifikant höher als die von Sorte 1, da gilt

264

Kap. 12: Lösungen zu den Aufgaben in Kapitel 8

Τ =-2.021 < - 1 . 6 4 4 9 = u n n(- = u 0.05 α c) Unter Normal Verteilungsannahme für die Erträge der Sorten 1 und 2 i s t Hq:

gegen 2

H,:

2

zu prüfen, wenn σ 1 , σ 2 die Varianzen der Erträge von Sorte 1 und 2 bezeichnen. Da die Erwartungswerte μ^ und μ 2 unbekannt sind, ergibt sich mit 12 S

1=TT

S

2=TT

(x

1i " * 1 ) 2 = T T '

58-411 =5

·310

und

12 (χ2ί-*2)2=TV'34l867

= 3,170

dann der Wert der T e s t s t a t i s t i k für den F - Test zu s2

p . f l _ 5.310 . . '

2

7 7 m

-



1 ,675

·

Die Hypothese HQ identischer Varianzen kann zum S% Niveau somit nicht verworfen werden, da g i l t :

F

n 1 - 1 , n 2 - 1 ; a / 2 = F 11,11 ;0.025 = F,, „ ' . j

g7g

=

3~Ϊ73 =

0,288

< 1 .675 < 3.473= F.. ,, , n Q 7 C = F„ . 11,11;0.975 n^-1,η^-Ι;1-α/2 d) Trotz des geringen Stichprobenumfanges von n = n^ = 12 prüfen wir hier die Hypothese H Q , daß die Erträge der Sorte 1 symmetrisch um den Wert 25 vert e i l t sind, mit Hilfe der Approximation des Vorzeichenrangtests nach Wilcoxon. Um Hg: ζ = 25

gegen

Η,: ς + 25

zum 5% Niveau testen zu können, müssen wir zunächst die transformierten Daten x

1i

= x

1i "

25

f

Ur i=1,...,12

sowie die Rangzahlen R^,...

,

zu den Beträgen |xj.| dieser Daten und

Kap. 12: Lösungen zu den Aufgaben in Kapitel 8

265

die Größen c 1 ( . . . , c 1 7 bestimmen, vgl. Tab. 6.

Tab. 6: Transformierte Daten x ^ 'x^. - 2 5 zu den Erträgen x ^

der Sorte 1

(vgl. z.B. Tab. 4), Rangzahlen R^ und die Größen c i für i=1,...,12

i

x' 1i

R. 1

1 2 3 4 5 6

-1.6 0.8 2.2 1.0 -2.9 1.7

5 2 7 3 10 6

C

i

0 1 1 1 0 1

i 7 8 9 10 11 12

R

0.5 -2.4 2.8 3.1 1.5 -3.6

C

i

1 β 9 11 4 12

i

1 0 1 1 1 0

Somit ergibt sich +

12

Τ = l

c

i R i = 2 + 7 + 3 + 6 + 1 + 9 + 1 1 + 4 = 43

,

und wegen 4 3 - 12 . (12 + 1) / 4

43-39

V12 - (12 + 1)- ( 2 4 + 1 ) / 24

v/162.5

« 0 . 3 1 4 + 1.960 « u 0 _ 9 7 5 - u 1 _ a / 2 kann die Hypothese H n zum 5% Niveau nicht verworfen werden.

AUFGABE 8.3: An den Standorten Α und Β werden jeweils H n (A) = H n (B) = 500 Produkte geprüft, so daß insgesamt η = 1 0 0 0 Produkte kontrolliert werden. 30%

oder 300 Produkte fallen in Güteklasse I, d.h. H n (I) = 300

und

H n (II) = 1000 - Η (I) = 700

266

Kap. 12: Lösungen zu den Aufgaben in Kapitel 8

und von diesen 300 Produkten werden 40% oder 120 Produkte am Standort Α gefertigt, d.h. H n (Af1I) = 120

und

H n ( ß n I) = 300 - Hn(Afl I) = 180

.

Aus diesen Angaben läßt sich eine Vierfeldertafel der Merkmale "Standort" und "Güteklasse" bestimmen , vgl. Tab. 7.

Tab. 7: Vierfeldertafel der absoluten Häufigkeiten für die Merkmale "Standort" mit den Ausprägungen Α bzw. ß und "Güteklasse" mit den Ausprägungen I bzw. II

I

II

I

A

120

380

500

Β

180

320

500

ι

300

700

η = 1000

H

n

a) Faßt man die 500 KontrollProdukte am Standort als Serie von n 1 = 500 Bernoulli - Versuchen mit Realisationen I und II auf, so ist die Zufallsvariable Xggg=Anzahl der Produkte in Güteklasse I binomialverteilt mit Parametern n 1 = 500 und p^. Zu prüfen ist nun zum 5% Niveau die Hypothese H q : p 1 > 30%= 0.3

gegen

H 1 : p.jcO.3

Bezeichnet n 1 = Η η ( Α Π I) = 120 die Anzahl der Produkte aus Güteklasse I am Standort A, so ist n^ gerade die Realisation der Zufallsvariablen X 5 g Q und der Wert der (für p^ =0.3) approximativ standardnormalverteilten Prüfgröße des Tests berechnet sich zu

T =

V i '

0,3

y n , · 0.3· (1 -0.3)

=

120 - 500 · 0.3 \/5ÖÖ · 0.3 · 0.7

=

-30 y/TÖS

=

.

2

g28

Kap. 12: Lösungen zu den Aufgaben in Kapitel S

267

Da nun gilt Τ =-2.928 3.841 = X? ; 0 . 9 5 = X? ;1 _ α

900000000 52500000 .

vgl. auch Tab. 7, daß die Hypothese der Unabhängigkeit zum 5% Niveau verworfen werden muß, d.h. zum 5% Niveau ist die Abhängigkeit zwischen Standort und Güte signifikant. Interpretiert man die Zeilen der Vierfeldertafel aus Tab. 7 als unabhängige Heßreihen vom Umfang n 1 = n 2 =500 an den Standorten Α bzw. B, so sind m 1 = Η η ( Α Π I) = 120

und

m 2 = Η η ( Β Π I) = 180

Realisationen von Zufallsvariablen X n ^ B(500,p 1 ) und X n ^ Β ί δ Ο Ο ^ ) und obiger Unabhängigkeitstest entspricht dem Test von V

Pl = P2

ge9en

H

1 : P, + P 2

·

Da die Hypothese Hg zum 5% Niveau verworfen wird, sind die Wahrscheinlichkeiten ρ^ und p 2 für die Güteklasse I an den Standorten Α und Β signifikant verschieden zum 5% Niveau.

AUFGABE 8.4: Um ausgehend von den Daten der Tab. 12 aus Kapitel 8 und der dortigen Inter2 valleinteilung einen χ - Anpassungstest auf eine Poissonverteilung mit Para-

268

Kap. 12: Lösungen zu den Au/gaben in Kapitel 8

meter λ = 3.9' durchführen zu können, d.h. um H n : die Daten entstammen einer Po(3.9) - Verteilung gegen H.: die Daten entstammen einer anderen Verteilung

prüfen zu können, müssen die beobachteten Intervall häufigkeiten

und die

erwarteten Intervallhäufigkeiten E^ für i=1,...,6 bestimmt werden. Die Gesamtzahl von Daten ist gerade 12 η = l η . = 2608 j=0 J und die Wahrscheinlichkeiten p^ dafür, daß eine Beobachtung unter der Hypothese einer Po(3.9) - Verteilung in das i-te Intervall I. fällt, ist für i=1,...,6 gegeben durch Pl-

= P(X e I-) = F x ( y 1 + 1 ) - F x ( y i )

,

wobei Fy die Verteilungsfunktion der Po(3.9) - Verteilung und y^,

die

untere bzw. obere Grenze des Intervalls L· bezeichnen. Mit

3.9 T T

,-3.9

, für x=0,1 ,2,.

P(X = x): , sonst ergibt sich p^ für i=1,...,6 also durch Summation der Wahrscheinlichkeiten P(X = j) über diejenigen je{0,1,2,...}

ρ

= 1

J jei i

PCX = j) .

, die im Intervall

I 3^.e-3.9 jei. J "

,

In der Tab. S sind die Größen p^, die erwarteten Ε. = η · p^ = 2608 · p. sowie die beobachteten

jei.

J

liegen:

Intervallhäufigkeiten

Intervallhäufigkeiten

Kap. 12: Lösungen zu den Aufgaben in Kapitel S

269

für i=1,...,6 zusammengestellt.

Tab. i: Intervalle I = (y^ , y ^ ^ ] , erwartete

Intervallwahrscheinlichkeiten

p^, erwartete Intervallhäufigkeiten E^ = 2608 · p^ und beobachtete Intervallhäufigkeiten 0 i für i=1

1

(yi,yi+1J

Ji =

6

0.

Ei

Pi

1

1

( -oo ,0.5]

0 .020

52.160

57

2

(0.5,2.5]

0 .233

607.664

586

3

(2.5,4.5]

0 .395

1030.160

1057

4

(4.5,6.5]

0 .251

654.608

681

5

(6.5,9.5]

0 .094

245.152

211

6

(9.5, °o )

0 .007

18.256

16

Da k = 6 die Anzahl der Klassen ist, entstammt die Prüfgröße

x2=

des χ

2

I τ - - (ο- - ε , ) 2 = 8.021 1 1 i=1 b i

2 -Anpassungstestes (unter H Q ) approximativ einer χ - Verteilung mit

k - 1 = 5 Freiheitsgraden, so daß wir die Hypothese Hg wegen

X

2

= 8 . 0 2 U 1 5 . 0 9 =X2.0

g9

= x2.1;1_a

nicht verwerfen können. Die Abweichung der Daten von einer Poissonverteilung mit Parameter λ = 3.9 ist also zum 1% Niveau nicht signifikant.

AUFGABE 8.5: Ausgehend von den Angaben in der Tab. 13 des Kapitels 8 kann zum einen die Hypothese der Unabhängigkeit

"θ :

p

ij = p i . ' p .j

für

1=1,2

und

j=1»2,3

von Geschlecht * und mittlerer Oberfläche der Erythrozyten ö und zum anderen

270

Kap. 12: Lösungen zu den Aufgaben in Kapitel 8

die Homogenitätshypothese

H

0:

p

1j = p 2 j

für

j=1"2·3

»

die gerade besagt, daß die Verteilung der Zufallsvariablen zum Merkmal "mittlere Oberfläche der Erythrozyten" bei Frauen und Männern gleich ist, geprüft werden. Beide Hypothesenprüfungen basieren auf ein und demselben Testverfahren, welches die Prüfgröße 2C 3 / , Ο χ = y — π Λι η,. · η , V 1J i = 1 j = 1 "i. - ".j

ι

150 ,

+

.

+

/,„

150 Λ 7 T ^ T ' V 150

/,.

η

·ΑJ

2

f9a

73 - 60\ 2

73 · 47\ 2 , 150 Λ + " - W j 7TT4I,(v

77 « 4 3 ^

73 » 4 3 ^ ,

6

η. π. · Πη ·\

77·60\2,

150

150

ΤΠΎΤ'

(..

77 · 47\ 2

V

T5Ü-/

= 13.9295+ 0.0014+ 12.4472 + 13.2059 + 0.0013 + 11.8006 = 51.3859 mit dem kritischen Wert (hier zum Niveau α = 0.01 = 1%)

x

2 2 2 (r-1)(s-1);1-cT x 1 • 2 ; 0 . 9 9 = x 2 ; 0 . 9 9 = 9 - 2 1 0

vergleicht. Da gilt X 2 = 51.3859 > 9 . 2 1 0 = X 2 ; 0 > 9 9 müssen die Hypothesen HQ und Hg zum 1% Niveau verworfen werden, d.h. zum Niveau von 1Ϊ ist die Abhängigkeit von Geschlecht und mittlerer Oberfläche der Erythrozyten bzw. die Verschiedenheit der Verteilung der mittleren Oberfläche der Erythrozyten bei Männern und Frauen signifikant.

Kap. 12: Lösungen zu den Aufgaben in Kapitel 9

271

9. Losungen zu den Aufgaben in Kapitel 9 AUFGABE 9.1: In der Tab. 9 sind die Daten der Tab. 5 aus Kapitel 9 nochmals dargestellt und auch die Werte x.2 für i=1,...,8 angegeben.

Tab. 9: Absolute Abweichungen y., relative Luftfeuchtigkeiten x. und deren Quadrate x2i für i=1,...,8

i

xi

A

1

2

3

4

5

6

7

8

3.2

2.1

1.4

0.8

0.7

0.9

1.3

1.9

45

50

55

60

65

70

75

80

2025

2500

3025

3600

4225

4900

5625

6400

Hiermit ergeben sich die arithmetischen Mittel zu 8

y - ί i=1 Vi- 1.5375

,

8

; =1^x^62.5

,

—5" ι 8 9 (* l xf = 4037.5 » 8 i=1 1 und die Produkt- bzw. Quadratsummen sind ® 7 —7~ ® ι - —Τ l («χ -x)(xf- (x ) - l xf-8. χ. (χ ) i-1 1 1 1=1 1 = 2150000 - 8 · 62.5 · 4037.5 = 131250 8

8

l (x,-i)(y5-49o,r2,27;0.99

= F

r

r-1,r(s-1);1-K

"

Zwischen den drei Körnungen bestehen also zum 1% Niveau signifikante Unterschiede bzgl. der Biegezugfestigkeit von Gießharzbeton und mit |y t . - y 2 .1 = 1 2 · 9

·

ΙΫι. - y 3 .1 = 2 6 · 4

·

ly 2 .

= 13 5

·

sowie der 1% - Grenzdifferenz nach Scheffe* FSD K =FSD 0

01

= J 2 · 5.49 ·

70.585 = 12.450

erweisen sich a l l e Körnungen a l s s i g n i f i k a n t verschieden zu diesem Niveau.

AUFGABE 10.2: Die Daten der Tab. 8 in Kapitel 10 entsprechen dem Ausgang eines einfachen Blockexperimentes Y

ijk=,J

+ a

i

+ ß

j + eijk

für

i=1

· - - - » 4 » j = 1 , . . . , 5 und k=1,2,3

und wir erhalten a l s Mittelwerte bzgl. der Standorte (Faktor A) y,

= γ £ · 14226 = 948.400

y3

=TV*

14798

= 986.533

,

y2

= - ^ . 14681 = 978.733

,

,

y4

= - ^ · · 14077 = 938.467

,

als Mittelwerte bzgl. der Laboratorien (Faktor 8) y1

= - ^ ' 11908 = 992.333

,

y

= • ^ • 11462 = 955.167

,

y 3_

11376 = 948.000

,

y_ 4 > = - ^ · 11215 = 934.583

,

y.5. = T T "

11821

sowie a l s Gesamtmittel

=

985

·083

2

283

Kap. 12: Lösungen zu den Aufgaben in Kapitel 10

y

=

57782 = 963.033

.

Die Zerlegung der Gesamtstreuung

S S G =

4 5 3 l l l i=1 j = 1 k=1

1JK

-6 0 * y2

= 55820726 - 60 · y 2

= 174733.940

: SSA + SSB + SSE ist 4 15 · ( l

J = 15 · (3711349.200 - 4 · y 2

)

SSB = 12 ' ( l )/Zi - 5 - y 2 ) = 12 · (4639607.986 - 5 · y 2 \j=1 •··>

)

SSA

y2

-4-y2

24245.910

,

= 29303.760 SSE = S S G - S S A - S S B = 121184.270

,

so daß sich mit den Freiheitsgraden r-1 = 3

,

s-1=4

und

η - r - s + 1 = rst - r - s + 1 = 52

dann die mittleren Quadratsummen MSA = 1 · SSA = 8081.970

,

MSB = | · SSB = 7325.940

,

MSE = 5 ^ · SSE = 2330.467 ergeben. Die Hypothese A HQ: Die Standorte haben keinen Einfluß auf die Analyseergebnisse muß zum Niveau 2.5% dann verworfen werden, da gilt MSA 8081 .970 H 5 T - 2330.467

=

3

, „ - ,Q c · 4 6 8 > 3-39~F3,52;0.975

= F

c

r-1 ,n-r-s+1 ;1-
3.05 ~ F, M S T " 2330.467 4,52 ;0.975 " F s-1 ,n-r-s+1 ;1-κ zum Niveau κ =2.5% nicht aufrecht erhalten werden. Zum 2.5% Niveau sind also sowohl die Standorte als auch die Laboratorien signifikant verschieden. Prüft man mittels multipler Vergleiche nach Schefffe, ob es Standortpaare gibt, die sich zum 2.5% Niveau unterscheiden, so stellt man fest, daß dies nicht der Fall ist: Keine der betraglichen Differenzen |y,..-y 2 ..| = 30.333 |y,..-y4J

=

9,933

1*2.. "*4..Ι

= 40

·266

,

|y

K

_-y

3

J

·

Ι ? 2.."*3..Ι

»

1 * 3 . .

= 38.133 =

=

7

·800

48

·066

ist größer als die Grenzdifferenz

Das gleiche Resultat erhält man für die Laborpaare, wo die Differenz zwischen den Laboratorien 1 und 4 mit 57.750 am größsten, jedoch nicht größer als die ,8 =68.838 ist. Grenzdifferenz FSD°

Geht man nun zum Modell der einfachen Varianzanalyse über, in dem nur noch der Faktor Standorte (A) berücksichtigt wird, so bleiben SSA und die zugehörigen Freiheitsgrade r - 1 = 3 und somit MSA erhalten, und als neue Restquadratsumme ergibt sich SSE' = SSE + SSB = 121 184.270 + 29303.760 = 150488.030 mit den Freiheitsgraden ( n - r - s + 1) + ( s - 1 ) = n - r = 6 0 - 4 = 56

.

Somit ist MSE 1 = -X · SSE" = 2687.286 und die Prüfgröße für den Test von HQ=HQ: Die Standorte haben keinen Einfluß auf die Analyseergebnisse ergibt sich zu

Kap. 12: Lösungen zu den Aufgaben in Kapitel 10

MSA 8081.970 , nn7 MST" " 2687.206 " 3 · 0 0 7

·

A Die Hypothese Hj} kann (wenn man die Unterschiede in den Laboratorien unberücksichtigt läßt) zum 2.5% Niveau nicht mehr verworfen werden, da g i l t 3.007 i 3 . 3 6 - F 3 ( 5 6 ; 0 _ 9 7 5

285

Kapitel 13: Klausuren

Dieses Kapitel enthält Klausuraufgaben mit Lösungen, die noch einmal der Kont r o l l e und Einschätzung des eigenen Stoffverständnisses dienen. Anders a l s bei den Übungsaufgaben, die sich ja jeweils auf ein recht überschaubares Kapitel des Buches beziehen, werden in den Klausuraufgaben teilweise verschiedene Stoffgebiete miteinander kombiniert, so daß die Schwierigkeit auch darin l i e g t , die Aufgabenstellung r i c h t i g einzuordnen bzw. den richtigen Lösungsansatz zu finden. Kann man die Klausuraufgaben lösen, so zeigt dies, daß man den im Buch behandelten Stoff auch beherrscht. Die Klausuren bestehen aus jeweils acht Aufgaben, zu deren Lösung man beliebige H i l f s m i t t e l , natürlich mit Ausnahme der Lösungen zu den Klausuraufgaben, verwenden kann, insbesondere also auch die inhaltlichen Kapitel dieses Buches sowie die Übungsaufgaben nebst Lösungen. Vor den Aufgaben jeder Klausur findet man ein Punkteschema für die Aufgaben bzw. Aufgabenteile, in dem die erreichbaren Punktzahlen angegeben sind. Links neben diesen Punktzahlen i s t Platz, um die erreichten Punktzahlen eintragen zu können; diese ermittelt man anhand der Bewertungshinweise in den Lösungen zu den Klausuraufgaben. Insgesamt sind bei jeder Klausur maximal 80 Punkte zu erreichen. Es wird jedoch nicht erwartet, daß man in der vorgegebenen Zeit von drei Stunden (180 Minuten) a l l e Aufgaben einer Klausur l ö s t . Daraus erklärt sich auch (vgl. das "Vorblatt" jeder Klausur) die angegebene Bewertungsskala: Zum "Bestehen" einer Klausur benötigt man lediglich 25 von 80 möglichen Punkten und mit mehr als 50 Punkten erhält man bereits die Note "sehr gut".

Kap. 13: Klausur A

289

Klausur A

BEARBEITUNGSZEIT:

180 Minuten

ERLAUBTE HILFSMITTEL: beliebig, mit Ausnahme der sich anschließenden Lösungen zu den Klausuraufgaben PUNKTESCHEMA:

Aufgabe

(erreichte / erreichbare Punktzahl)

a

b

c

d

1

1

3

3

/

/

6

2

4

3

/

/

7

3

4

8

/

/

12

4

4

4

4

2

14

5

/

/

/

/

10

6

/

J

/

/

10

7

/

/

/

/

7

8

2

2

4

6

14

Gesamtpunktzahl

80

NOTE: NOTENSKALA:

5 (nicht bestanden) k

(ausreichend)

0-24

Punkte

25 - 34 Punkte

3 (befriedigend)

35 - 42 Punkte

2 (gut)

43 - 50 Punkte

1 (sehr gut)

51 - 80 Punkte

290

Kap. 13: Klausur A

AUFGABE A.l:

(3 + 3 = 6 Punkte)

Belm Samstagslotto 6 aus 49 (ohne Berücksichtigung der Zusatzzahl) betrage der Einsatz pro Spielfeld 1 DM, Die Gewinne seien im 1. Rang (6 Richtige) 1.2 Millionen DM, im 2. Rang (5 Richtige) 8000 DM, im 3. Rang (4 Richtige) 90 DM und im Rang (3 Richtige) 3.5 DM. a) Wie gross sind die Wahrscheinlichkeiten, bei einem Spielfeld im 1., 2., 3. und Rang zu liegen ? b) Sie spielen regelmässig ein Jahr (52 Wochen) lang 6 Spielfelder. Wie gross ist der zu erwartende Gewinn ?

AUFGABE A.2:

(4 + 3 = 7 Punkte)

Zwei konkurrierende Unternehmen produzieren Stromabnehmer für Strassenbahnen. Ein stadtisches Verkehrsunternehmen will einen Grossauftrag erteilen und schickt daher einen Kontrolleur zu Jedem der Betriebe, der 30 bzw. 50 Stromabnehmer auf ihre Funktionsfähigkeit hin prüft. Von den 30 Stromabnehmern im ersten Betrieb waren 25 funktionsfähig, von denen Im zweiten Betrieb waren es 44. a) Ist bei der Auftragsvergabe einem der Unternehmen ein Vorzug zu gewähren, wenn man zum 5% Niveau entscheidet ? b) Berechnen Sie ein approximatives Konfldenzlntervall zum 95% Niveau für die Wahrscheinlichkeit der Funktionsfähigkeit eines Stromabnehmers vom zweiten Betrieb.

AUFGABE A.3:

(4 + 8 = 12 Punkte)

An η = 11 Tantal - Kondensatoren wurde die Lebensdauer a (in 100 Stunden) in Abhängigkeit von der Umgebungstemperatur x., und der Spannung x 2 beobachtet. Dabei ergaben sich folgende Mittelwerte, empirische "Varianzen" und "Kovarianzen": y

= 52.545

,

Sy

=368.073

,

SYXi

= 62.947

,

= 33.091

,

X2

= 45.455

,

sj

= 18.491

,

SJ

= 52.273

,

SYX2

=-71.713

,

δχ

= -7.555

.

χ

Kap. 13: Klausur Λ

291

a) Schätzen Sie die Parameter der multiplen Regresslonsfunktlon B = e0 + ß 1 x 1 + ß 2 x 2 b) Prüfen Sie zum 5% Niveau, ob die Prognose der Lebensdauern von Tantal -Kondensatoren dadurch signifikant besser wird, dass Sie die Spannung berücksichtigen,

AUFGABE A.4:

(4 + 4 + 4 + 2 = 14 Punkte)

Die Zufallsvariablen X und Y besitzen die gemeinsame Dichte f x , Y (x,y) =

Zjg5;(2xy + 3x^) 0

für χ e [0,31 und y e [0,51 sonst

a) Bestimmen Sie die Randdichten der Zufallsvariablen X und Y, b) Berechnen Sie Erwartungswerte sowie Varianzen von X und Y. c) Wie gross sind die Kovarianz und die Korrelation der Zufallsvariablen X und Y ?

d) Bestimmen Sie die a-Quantlle der Verteilung von Y.

AUFGABE A.5:

d o Punkte)

Ein asymmetrisches Gehäuse wird aus Oberteil und Unterteil zusammengesetzt. Das Oberteil kann an einer von drei Maschinen mit Zuverlässigkeiten von 90%, 80% bzw. 95% gefertigt werden. Für die Produktion des Unterteils stehen zwei Maschinen bereit; es ist mit 95% Sicherheit exakt gefertigt, wobei von 100 exakten Unterteilen 70 von Maschine 1 und von 100 defekten Unterteilen 60 von Maschine 1 hergestellt werden. Ober- und Unterteil werden dann von einem der beiden Monteure, die in 20% bzw. 10% der Fälle durch Krankheit etc. nicht zur Verfügung stehen, zusammengeschraubt. Mit welcher Wahrscheinlichkeit entsteht ein Gehäuse mit exakt gefertigtem Unterteil, wenn dieses von Maschine 1 bzw. wenn dieses von Maschine 2 gefertigt wurde ?

292

Kap. 13: Klausur A

AUFGABE Α. 6:

d o Punkte)

Ein Unternehmen soll Stahlplatten vorgeschriebener Dicke produzieren. Durch Ungenaulgkelten in der Maschlnenelnstellung treten jedoch leichte Abweichungen auf. Prüfen Sie anhand der η = 4 8 Abweichungsbestimmungen (in 1/10 mm) -1.75

J

0.51

J

-0.93

J

3.02

*

-0.16 i -0.57

*

1.42

J

-1.93

J

-0.76

j

0.54

J

1.32

J

-0.87

J

-1.31

f

-0.99

i

0.83

J

0.41

J

0.88

J

0.18

J

-0.50

i

-0.87

J

-2.35

J

-0.96

J

1.59

J

0.65

j

-1.34

I

-2.87

;

0.86

J

0.36

J

-1.09

J

-1.43

J

-0.63

*

0.37

t

-0.23

i

0.74

J

-1.27

>

-0.12

J

0.25

j

0.43

i

-0.87

J

0.17

i

1.21

J

-0.25

*

0.55

J

-1.52

J

-0.37

J

2.30

J

1.28

;

-0.01

J

ob zum 5% Niveau signifikante Abweichungen der Abwelchungsvertellung von einer Drelecksvertellung mit Parametern -3 und +3 vorliegen. Verwenden Sie dabei 6 Intervalle derart, dass in den beiden mittleren und in den beiden äusseren Intervallen je 15% und in den übrigen Intervallen Je 20% der Messwerte zu erwarten sind.

AUFGABE A.7:

(7 Punkte)

Geben Sie eine Approximation für die Wahrscheinlichkeit an, dass bei 48 Messungen von Stahlplatten die mittlere Abweichung vom Sollwert betragsmösslg höchstens so gross wie in Aufgabe 6 ist, wenn Sie von einer Drelecksvertellung mit Parametern -3 und +3 für die Abweichungen ausgehen.

AUFGABE A.8:

(2 + 2 + 4 + 6 = 14 Punkte)

Bei der Oberprüfung einer automatischen Flaschenabfüllanlage für 0.5 Liter - Bierflaschen wurde der tatsächliche Inhalt, den Sie als normalvertellt annehmen können, von η = 1 5 Flaschen gemessen. Hierbei ergab sich (Angaben in Milliliter) ein Mittelwert von χ = 507 und eine Standardabweichung von s = 6. a) Berechnen Sie die Grenzen eines 95% Konfldenzlntervalls für

Kap. 13: Klausur A

293

die Varianz des Flaschenlnhalts. b) Wieviele Beobachtungen n' müssen Sie nach dem Varlatlonszahlverfahren voraussichtlich machen, um eine relative Genauigkeit von 0.5% eines 95% Konfldenzljtervalls für den erwarteten Inhalt abzusichern ? c) Benutzen Sie die Ergebnisse für die ersten 15 Flaschen und die noch notwendigen Beobachtungen (der Reihe nach) aus der Reihe 510 , 497 , 493 , 515 , 501 , 515 , 507 , 495 , 506 , 498 , 5Ü8 , 503 , 493 , 509 , 510 , 501 , 492 , 506 , 497 , 503 , um zu prüfen, ob die Anzahl n' ausreichend war, Wenn nicht, bestimmen Sie ein neues n " , benutzen Sie zusätzlich die nächsten n " - n ' Werte obiger Datenreihe usw., bis Sie ein 95% Konfldenzlntervall mit der gewünschten Genauigkeit erhalten. d) Berechnen Sie die Grenzen dieses Konfldenzlntervalls und prüfen Sie zum 2.5% Niveau, ob die Abfüllanlage signifikante Abweichungen von der vorgeschriebenen Norm aufweist, nach der (bei einer Standardabweichung von σ = 6 ) In höchstens 5% der Falle ein Betrug am Kunden stattfinden darf.

Kap. 13: Lösungen zur Klausur A

295

Lösungen zur Klausur A

AUFGABE Λ.1: a) Das Samstagslotto 6 aus 49 entspricht einer Kombination ohne Wiederholung von 6 aus 49 Ziffern, so daß es insgesamt

(k)

=

(δ9) °

13983816

AUFGABE A.4: a) Die Randdichte ί χ ( χ ) der Zufallsvariablen X hat den Wert 0 für x4[0,3] und für x€[0,3] i s t

fx(x)- \

f

x,Y(x.y)

d

0

0 4x

=

2

( 2 x y 3 x 2 ) dy

y = |

-00

25

0 6x

2

ς

10

6

2 · ( 5 x + 3x )

Die Randdichte der Zufallsvariablen Y i s t

2

(2 Punkte)

302

Kap. 13: Lösungen zur Klausur A

J j g j · · (2xy + 3 x 2 ) dx

,

fürye[0,5]

f y ( y ) = | f x > Y ( x , y ) dx = , sonst und e s e r g i b t

sich

3 | ^ . ( 2 x y

+

3x2) d x = ^ . J

χ dx

x 2 dx

0 3

o

+

6 Γ1 * * - l r «

ο

2

3l3 J0

... 6 (2 Punkte)

b ) Es

ist E(X) = j χ · f x ( x ) dx = | ^ -oo

[

2

Γ5

=

· ( 5 x 2 + 3 x 3 ) dx

ο

3

3



2

f

AC

. 243 \

423

(1 Punkt)

( =2.136)

E ( X 2 ) = | x 2 · f x ( x ) dx = | ^

2

Γ5

"19 [f

x

4

3

+ΐ χ

"

5Ι 3 Jn

· ( 5 x 3 + 3 x 4 ) dx

=

2 w

/ 405

x

729 \ _

4941 " w

= TTÜ f = 4 . 9 9 1 ) und s o m i t Var(X)=E(X2)-(E(X))2=^-($ = 1033 ( = 0 . 4 2 7 )

.

(1 Punkt)

Für d i e Z u f a l l s v a r i a b l e Y e r h a l t e n w i r 5 E(Y)=J y f Y ( y ) -OO 2 ( 125 =

+

dy = j ^ . ( y 2 + 3y) dy 0 75 \ 475 95 , , 0 7 Q * = T5S = 3 3 ^ = 2 . 8 7 9 )

+

(1 Punkt)

303

Kap. 13: Lösungen zur Klausur λ

und mit 5 E ( Y 2 ) = | y 2 -f Y (y) dy = | -00 =

(y 3 + 3y 2 ) dy =

[

{

W

]

0

2 (625 s r I T +

=^

. - Λ _ 1125 J ΤΠΓ

1 2 5

(= 10.227)

ergibt sich

Var(y) = E ( Y 2 ) - ( E ( y ) ) 2 = ^ - ( | | ) 2 =

(= 1.940)

= «475

.

(1 P u n k t )

c) Die Kovarianz von X und Y ist mit Cov(X.Y) = E(X · Y) - E(X) · E(Y) und 00

E(X · Y) = |

5 3

00

f

0 0

—00 —oo 5

= m '

(2x 2 y 2 + 3x 3 y) dxdy

x - y f x > Y ( x . y ) dxdy = J j 3

\ ' J0 y2

5

χ 2 dxdy +

\'

Tis'

0

0

ί

0

, 0

3

y

υ

5

r

0

0

χ 3

d x d y

0 r,

λί3 υ

υ

υ

36 1 2 5 . 2 4 3 25 1500 , 135 495 ' 3 Μ Ι * Τ ' ~?9Γ =

(= 6.098)

dann gerade < , 805 47 95 Γ C o v iν Xν . Y ) « · ^ - ^ · 33

(2 Punkte)

304

Kap. 13: Lösungen zur Klausur A

=

" M t ( = -0-052)

,

(1 Punkt)

so daß sich die Korrelation zwischen X und Y berechnet zu Corr(x)Y)

.

Cov(X»Y)

,=

VVar(X) · Var(V)

-0-052

. _0.057 _

(1

punkt)

n/0.427 - 1.540

d) Das α-Quantil ζ α der Verteilung von Y berechnet sich aus ζ

W

=

α

J 1 =

5T

ξ

f ( y ) dy = Y r2

α

6 55"

r

α

J sr(y

+3

>= ^-[ry

2 + 3

ξα

yi 0 a

α

ι =α

(1 Punkt)

Damit ist hier ζ2 + 6 · ζ - 5 5 · α = ξ 2 + 6 · ζ + 9 - 9 - 5 5 · α = ( ξ + 3 ) 2 - 9 - 5 5 · · α α α α α α Ιο

,

d.h..es ist ξ + 3 = + V9 + 55 · α α

,

und somit ergibt sich ξ α = + V/9+55 · α - 3

für α€(0,1)

.

(1 Punkt)

AUFGABE Α.5: Die drei Maschinen zur Fertigung des Oberteils und die beiden Monteure bilden je ein Parallelsystem. Diese beiden Parallelsysteme sind zu einem Seriensystem verknüpft, welches neben den beiden "Parallelsystemkomponenten" eine dritte Komponente beinhaltet, deren Zuverlässigkeit gerade die Wahrscheinlichkeit eines exakt gefertigten Unterteils ist, vgl. auch Abb. J. Je nachdem, ob das Unterteil von Maschine 1 oder Maschine 2 gefertigt wurde, ist diese Wahrscheinlichkeit zunächst zu berechnen.

305

Kap. 13: Lösungen zur Klausur A

Abb.

1: System z u r H e r s t e l l u n g e i n e s asymmetrischen Gehäuses

Bezeichnet Α das E r e i g n i s " U n t e r t e i l e x a k t " und Β das E r e i g n i s

(2 Punkte)

"Unterteil

von Maschine 1 " , so e r g i b t s i c h aus der A u f g a b e n s t e l l u n g P(A) = 0 . 9 5

,

P(B | A)

= 0.7

,

P(B | Ä)

= 0.6

.

(1 Punkt)

Die Z u v e r l ä s s i g k e i t der d r i t t e n Komponente des Seriensystems l ä ß t s i c h dann nach der Formel von Bayes bestimmen, und zwar e r g i b t s i e s i c h zu P(B | A) · P(A) P(A I B ) = P(B | A) · P(A) + P(B | A) · P(A) 0.957

0.7 · 0.95 0 . 7 - 0.95 + 0 . 6 - 0.05

,

(1 Punkt)

f a l l s das U n t e r t e i l von Maschine 1 stammt, und zu P(B ] A) · P(A)

P(A| Β);

P(B | A) · P(A) + P(B | Ä) · P(Ä) 0.934

0 . 3 · 0.95 0 . 3 - 0.95 + 0.6 · 0.05

,

f a l l s das U n t e r t e i l von Maschine 2 g e f e r t i g t wurde. Die Z u v e r l ä s s i g k e i t des Maschinen - P a r a l l e l systems i s t nun gerade

Z(MA) = 1 -

|| (1 - Z(MA i ) ) i=1

= 1 - (1 - 0 . 9 ) · (1 - 0 . 8 ) · (1 - 0 . 9 5 ) = 1 - 0.1 · 0.2 · 0.05

(2 Punkte)

306

Kap. 13: Lösungen zur Klausur A

= 0.999

(1 Punkt)

und die Zuverlässigkeit des Monteur - Parallel systems ist

Z(M0) = 1 -

2_ II (1 - Z(M0 i)) i=1

= 1-0.1-0.2 = 0.98

.

(1 Punkt)

Somit beträgt die Zuverlässigkeit des Gesamtsystems dann Z S y s ( 1 ) = Z ( M A ) - Z ( M 0 ) - P ( A | B) = 0.999 · 0.98 · 0.957 « 0 . 9 3 7 = 93.7%

,

(1 Punkt)

wenn das Unterteil von Maschine 1 gefertigt wurde, bzw. Z S y s ( 2 ) = Z(MA) · Z(M0) · P(A | B) = 0.999 · 0.98 · 0.934 « 0 . 9 1 4 = 91.4%

,

(1 Punkt)

wenn das Unterteil von Maschine 2 gefertigt wurde.

AUFGABE A.6: 2 Mittels χ -Anpassungstest soll hier zum 5% Niveau die Hypothese HQ: Die Abweichungsmessungen entstammen einer Dreiecksverteilung mit Parametern -3 und +3

(l Punkt)

geprüft werden. Dazu sollen k = 6 Intervalle

derart bestimmt werden,

daß unter der Hypothese je 20% der Beobachtungen in die Intervalle ^

und Ig

und je 15% der Beobachtungen in die übrigen Intervalle fallen, d.h. die Intervallgrenzen sind Quantile der Dreiecksverteilung mit Parametern -3 und +3. Ist ξ α das α-Quantil dieser Verteilung, so gilt gerade ~ J

4=



· ξ 0.15 }

0.5,ζ0.65)

'

1

'

V

2=



0.15' ζ 0.35^

'



0.65' ξ 0.85 }

und

!

3=



0.35' ζ 0.5^

V^O.eS*

"

}

'

(2 Punkte)

Kap. 13: Lösungen zur Klausur Λ

307

Da die Dreiecksverteilung mit Parametern - 3 und +3, welche die Dichte

, für - 3 < χ < 0

W · « V « ) .

, für

i-i-

0

qqqj

Kap. IS: Lösungen zur Klausur A

312

ergibt. Es muß a l s o d i e k l e i n s t e Zahl n " von Beobachtungen b e s t i m m t w e r d e n , so daß m i t

gilt

η >

ν·-1;1-α/2·ν'

2

3. 0.01362 _ Λ η""1 η " - 1 ;0.975 " "QJJQ?

;0

·975 '

,

,0οΛ

Es i s t 30

^ t 2 9 0 975 '

31 > t30-0

7

·3984

=

2.0452 · 7.3984^30.940

975 ' 7 . 3 9 8 4 = 2 . 0 4 2 2 · 7.3984=» 30.850

,

so daß w i r ( 1 Punkt)

n " = 31

e r h a l t e n . Z u s ä t z l i c h zu den b i s h e r i g e n 24 F l a s c h e n werden a l s o j e t z t noch 7 F l a s c h e n aus d e r U r l i s t e i n d i e Rechnung e i n b e z o g e n , so daß s i c h wegen 24 ι X. = 12144 i=1 1

24 ? l * • = 6145958 1 i=1

und

dann d e r neue M i t t e l w e r t und d i e neue e m p i r i s c h e V a r i a n z e r g e b e n z u : 31

,

= TT

x

/ 24

i

31 x

i

+

J

2 5

x

i ) = I T

( 1 2 U 4

+

3522

= - j p 15666 « 505.355 31

,

,

,24

( s - ^ i i ,

, x

l ·

31 , l 2 S - f - 31 . C x " ) 2 )

^ j - · ( 6 1 4 5 9 5 8 + 1772308 - 31 · 5 0 5 . 3 5 5 2 ) ^ j · · (7918266 - 7916893.956)

Kap. 13: Lösungen zur Klausur A

313

1372.044 = 45.735

(1 Punkt)

Die j e t z t erreichte tatsächliche Genauigkeit des 95%- Konfidenzintervalles für μ i s t also £„

. V n

,0.975 . s : , 2 J 4 2 , j g g . •n"

x"

VIT

505

0

.0049
μ 0

gegen

Η ^ μ ί μ μ,0,

getestet werden.

(1 Punkt)

Der Vergleichswert μ 0 i s t dabei so zu wählen, daß bei einer Standardabweichung von σ = 6 in 5% a l l e r Fälle ein Betrug am Kunden s t a t t f i n d e t , d.h. so, daß höchstens 5% a l l e r Flaschen weniger a l s 500 m£ Bier enthalten. Gesucht i s t also μ 0 derart, daß für die N(p Q ,6 2 ) - v e r t e i l t e

Zufallsvariable

Y gilt: P(Y < 500) = P(Y < 500) = 5% = 0.05 Es ergibt s i c h mit P ( Y < 500)= Φ bzw.

f500 - μ 0

0.05

(2 Punkte)

314

Kap. 13: Lösungen zur Klausur A

500 - μ 0

M0 - 500'

6

6

daß μ η - 500 Λ

=u0.95=1·6449

"

i s t und somit daß Pq = 6 · 1 .6449 + 500 = 509.8694

(1 Punkt)

gewählt werden muß. Die Hypothese Hg: μ > 509.8694 kann dann mittels t - Test geprüft werden. Es i s t t

t=

x " - 509.8694 .-τ, 505.355 - 509.8694 r-n · vn = s

--3.717 0.99 zu bestimmen. Diese Ungleichung läßt sich äquivalent umformen zu 0.8 n < 1 - 0.99 = 0.01 d.h. η · l n ( 0 . 8 ) < ln(0.01] oder

n

1n(0.01) . -4.6052 - i H r r a r = qrzz3T=

,n 20 642 ·

;

die gesuchte Zahl nötiger Herstellungsversuche i s t also η = 21.

(2 Punkte)

324

Kap. 13: Lösungen zur Klausur Β

AUFGABE B.3: Die gewinnoptimale E i n k a u f s p o l i t i k des Händlers i s t n a t ü r l i c h diejenige, bei welcher der Gewinn im Mittel möglichst groß i s t . Gesucht i s t a l s o diejenige Zahl k von Kisten derart, daß der erwartete Erlös abzüglich der Unkosten von k · 5 DM maximal

ist.

Kauft die Gärtnerei k Kisten und verkauft s i e davon j < k Kisten, so i s t der Gewinn gerade durch die Gewinnfunktion (1 Punkt)

gk(j) = 20j-5k gegeben.

Für k = 0 , . . . , 5 i s t nun der Erwartungswert der Z u f a l l s v a r i a b l e n 9 k ( X k ) zu bestimmen, wobei X k diejenige Z u f a l l s v a r i a b l e i s t , welche die Anzahl verkaufter Kisten in einer Woche beschreibt. Da der Händler n a t ü r l i c h nicht mehr Kisten verkaufen kann, a l s er eingekauft hat, ergeben s i c h aus den Wahrscheinlichkeiten P(X = j ) der Aufgabenstellung, die n a t ü r l i c h darauf basieren, daß mindestens 5 Kisten zur Verfügung stehen, die Wahrscheinlichkeiten P(X k = j ) für j=0

k < 5 in folgender Art und Weise: , für j < k

P(X = j ) P(X k = j ) =

(4 Punkte)

5

l P(X = i ) i=k

, für j = k

Die f ü r k = 0 , . . . , 5 zu ermittelnden Erwartungswerte sind a l s o gerade k E(g

k(Xk))= \

9

k(j) ·

P (

V

j)

k-1 5 = I g j j ) · P(x = j ) + g k ( k ) · l PCX = i ) K i=k j=0 K i=k und es ergibt s i c h

E(g0(x0)) = o + g 0 ( o ) ·

5 I

P(X = i )

= (20 · 0 - 5 · 0) · 1 = 0 · 1

=0

,

(1 Punkt)

325

Kap. 13: Lösungen zur Klausur Β

5 E(g 1 (X l )) = g 1 ( 0 ) ' P ( X = 0) + g 1 ( 1 ) · j

P(X = i)

= (20 · 0 - 5 · 1) · 0.05 + (20 · 1 - 5 · 1) · 0.95 = -5 · 0 . 0 5 + 1 5 · 0.95 = 14 1 E(g 2 (X 2 )) = ^

, 5 g 2 (j) · P(X = j) + g 2 (2) · ^

P(X = i)

= (20 · 0 - 5 · 2) · 0.05 + (20 · 1 - 5 · 2) · 0.1 + (20 · 2 - 5 · 2) · 0.85 = -10 · 0.05+ 10 · 0.1 + 30 · 0.85 = 26 2 E(g,(X,)) = l *

J

j=0

, 5 g,(j) · P(X = j) + g,(3) · l s

*

P(X = i)

i=3

= (20 · 0 - 5 · 3) · 0.05 + (20 · 1 - 5 · 3) · 0.1 + (20 · 2 - 5 · 3) · 0.2 + (20 · 3 - 5 · 3) · 0.65 = -15 · 0.05 + 5 · 0.1 + 25 · 0.2 + 45 · 0.65 = 34 E(g4(xj)= *

4

3 I j=0

, 5 g 4 (j) · P(x = j) + g 4 (4) · l *

4

P(x = i)

i=4

= (20 · 0 - 5 · 4) · 0.05 + (20 · 1 - 5 · 4) · 0.1 + (20 · 2 - 5 · 4) · 0.2 + (20 · 3 - 5 · 4) · 0.35 + (20 · 4 - 5 · 4) · 0.3 = -20 · 0.05 + 0 · 0.1 + 20 · 0.2 + 40 · 0.35 + 60 · 0.3 = 35

,

4 5 E(gc(Xc))= l gr(j) · P(X = j) + g R (5) · I s s s j=0 ö i=5 =

P(x=i)

5 l g s (j) · P C X - J ) j=0 b

= (20 · 0 - 5 • 5) · 0.05 + (20 · 1 - 5 · 5) · 0.1 + (20 · 2 - 5 · 5) · 0.2 + (20 · 3 - 5 · 5) · 0.35 + (20 · 4 - 5 · 5) · 0.2 + (20 · 5 - 5 · 5) · 0.1 = -25 · 0.05 - 5 · 0.1 + 15 · 0.2 + 35 · 0.35 + 55 · 0.2 + 75 · 0.1 =32

(3 P u n k t e )

Das Maximum 35 dieser Erwartungswerte ergibt sich beim Einkauf von k = 4 Geranienkisten, so daß die Gärtnerei jede Woche 4 Kisten kaufen muß, um auf Dauer gesehen gewinnoptimal zu arbeiten.

(l

Punkt)

326

Kap. 13: Lösungen zur Klausur Β

AUFGABE B.4: In der Abb. 2 i s t das Z u v e r l ä s s i g k e i t s s c h a l t b i l d der Stereoanlage darges t e l l t , die dann funktionsfähig i s t , d.h. in mindestens einem Raum kann Musik gehört werden, wenn der Verstärker (V), mindestens eine der Programmquellen Tuner (T), Plattenspieler ( S ) , Cassettenrecorder (C) sowie mindestens ein Lautsprecherpaar (L^.L,,) intakt i s t .

τ V

s c

Li L2

Abb. 2: Z u v e r l ä s s i g k e i t s s c h a l t b i l d der Stereoanlage

(2 Punkte)

Das Parallelsystem "Programmquelle" (Q) i s t intakt mit der Wahrscheinlichkeit Z(Q)= P(Q intakt) = 1 - [1 - P(T i n t a k t ) ] · [1 - P(S i n t a k t ) ] · [1 - P(C i n t a k t ) ] = 1 - (1 - 0.99) · (1 - 0.98) · (1 - 0.95) = 1 - 0.01 · 0.02 · 0.05 = 0.99999

,

(1 Punkt)

das Parallelsystem "Lautsprecher" (L) i s t intakt mit der Wahrscheinlichkeit Z ( L ) = P(L intakt) = 1 - [1 - P(L, i n t a k t ) ] · [1 - P(L 2 i n t a k t ) ] = 1 - 0.01 · 0.01 = 0.9999

(1 Punkt)

und der Verstärker arbeitet mit der Z u v e r l ä s s i g k e i t Z(V) = P(V i n t a k t ) = 1 - P(V defekt) = 1 - 0.02 = 0.98

.

Kap. 13: Lösungen zur Klausur Β

327

Die Zuverlässigkeit der Stereoanlage ergibt sich dann als Zuverlässigkeit des Seriensystems mit den Komponenten V, Q und L: Z( Stereoanl age ) = P( System intakt) = P(V intakt) · P(Q intakt) · P(L intakt) = Z(V) · Z(Q) · Z(L) = 0.98 · 0.99999 · 0.9999 = 3.85=« F,

Kn, 506

.on 480 ^ r (/y

_v2

u0 . 1 u0 i 2r - r

-\C

i"y)

-'

2

" Y,(X1,X2) I C ( 3 - 2 ) . 0.955 '

ScQn

»

·133 n QC;

= F.

Sowohl der Beitrag der quadratischen plus kubischen Terme a l s auch der des kubischen Terms sind also zum 5% Niveau s i g n i f i k a n t .

Anhang

1. Tabellenanhang Tab. 1: Verteilungsfunktion Φ(χ) der Standardnormal Verteilung N(0,1). 344 Tab. 2: Quantile u^ der Standardnormalverteilung N(0,1)

345

Tab. 3: Quantile t der t-Verteilung η »γ 2 2 Tab. 4: Quantile χ der χ - Verteilung η iY

346

Tab. 5: Quantile F ^ ^

349

der F-Verteilung

347

344

Anhang

Tab. 1:

Verteilungsfunktion Φ(χ) der Standardnormalverteilung N ( 0 , 1 )

χ

0,00

0,01

0,02

0,03

0,04

0,05

0,06

0,0 0,1 0,2 0,3 0,4

0,5000 0,5398 0,5793 0,6179 0,6554

0,5040 0,5438 0,5832 0,6217 0,6591

0,5080 0,5478 0,5871 0,6255 0,6628

0,5120 0,5517 0,5910 0,6293 0,6664

0,5160 0,5557 0,5948 0,6331 0,6700

0,5199 0,5596 0,5987 0,6368 0,6736

0,5239 0,5636 0,6026 0,6406 0,6772

0,5279 0,5675 0,6064 0,6443 0,6808

0,5319 0,5714 0,6103 0,6480 0,6844

0,5359 0,5753 0,6141 0,6517 0,6879

0,5 0,6 0,7 0,8 0,9

0,6915 0,7257 0,7580 0,7881 0,8159

0,6950 0,7291 0,7611 0,7910 0,8186

0,6985 0,7324 0,7642 0,7939 0,8212

0,7019 0,7357 0,7673 0,7967 0,8238

0,7054 0,7389 0,7704 0,7995 0,8264

0,7088 0,7422 0,7734 0,8023 0,8289

0,7123 0,7454 0,7764 0,8051 0,8315

0,7157 0,7486 0,7794 0,8078 0,8340

0,7190 0,7517 0,7823 0,8106 0,8365

0,7224 0,7549 0,7852 0,8133 0,8389

1,0

1,1 1,2 1.3 1.4

0,8413 0,8643 0,8849 0,9032 0,9192

0,8438 0,8665 0,8869 0,9049 0,9207

0,8461 0,8686 0,8888 0,9066 0,9222

0,8485 0,8708 0,8907 0,9082 0,9236

0,8508 0,8729 0,8925 0,9099 0,9251

0,8531 0,8749 0,8944 0,9115 0,9265

0,8554 0,8770 0,8962 0,9131 0,9279

0,8577 0,8790 0,8980 0,9147 0,9292

0,8599 0,8810 0,8997 0,9162 0,9306

0,8621 0,8830 0,9015 0,9177 0,9319

1.5 1.6 1.7 1.8 1,9

0,9332 0,9452 0,9554 0,9641 0,9713

0,9345 0,9463 0,9564 0,9649 0,9719

0,9357 0,9474 0,9573 0,9656 0,9726

0,9370 0,9484 0,9582 0,9664 0,9732

0,9382 0,9495 0,9591 0,9671 0,9738

0,9394 0,9505 0,9599 0,9678 0,9744

0,9406 0,9515 0,9608 0,9686 0,9750

0,9418 0,9525 0,9616 0,9693 0,9756

0,9429 0,9535 0,9625 0,9699 0,9761

0,9441 0,9545 0,9633 0,9706 0,9767

2,0

2,1 2,2 2.3 2.4

0,9772 0,9821 0,9861 0,9893 0,9918

0,9778 0,9826 0,9864 0,9896 0,9920

0,9783 0,9830 0,9868 0,9898 0,9922

0,9788 0,9834 0,9871 0,9901 0,9925

0,9793 0,9838 0,9875 0,9904 0,9927

0,9798 0,9842 0,9878 0,9906 0,9929

0,9803 0,9846 0,9881 0,9909 0,9931

0,9808 0,9850 0,9884 0,9911 0,9932

0,9812 0,9854 0,9887 0,9913 0,9934

0,9817 0,9857 0,9890 0,9916 0,9936

2.5 2.6 2.7 2.8 2,9

0,9938 0,9953 0,9965 0,9974 0,9981

0,9940 0,9955 0,9966 0,9975 0,9982

0,9941 0,9956 0,9967 0,9976 0,9982

0,9943 0,9957 0,9968 0,9977 0,9983

0,9945 0,9959 0,9969 0,9977 0,9984

0,9946 0,9960 0,9970 0,9978 0,9984

0,9948 0,9961 0,9971 0,9979 0,9985

0,9949 0,9962 0,99.72 0,9979 0,9985

0,9951 0,9963 0,9973 0,9980 0,9986

0,9952 0,9964 0,9974 0,9981 0,9986

3,0

0,9987

0,9987

0,9987

0,9988

0,9988

0,9989

0,9989

0,9989

0,9990

0,9990

zu Tab. 1: Ablesebeispiel: Φ(1,56) = 0,9406 Erweiterung der Tafel: Φ( — χ) = 1 — Φ (χ) Approximation nach Hastings für χ > 0: Φ (χ) — 1

^ V2π

• e " " 2 , 2 ( a 1 t + a 2 t 2 + a j t 3 + a 4 t ' t + a5t5)

b = 0,2316419, a , = 0,31938153, a 2 = - 0 , 3 5 6 5 6 3 7 8 2 , a 4 = - 1,821255978, a 5 = 1,330274429.

mit

t = —— !+b>

a 3 = 1,781477937,

345

Anhang

Tab. 2 :

Quantile u, der Standardnormalverteilung N ( 0 , 1 )

"Y

"v 0,9999 0,9998 0,9997 0,9996 0,9995

3,7190 3,5401 3,4316 3,3528 3,2905

0,9975 0,9970 0,9965 0,9960 0,9955

2,8070 2,7478 2,6968 2,6521 2,6121

0,965 0,960 0,955 0,950 0,945

1,8119 1,7507 1,6954 1,6449 1,5982

0,83 0,82 0,81 0,80 0,79

0,9542 0,9154 0,8779 0,8416 0,8064

0,9994 0,9993 0,9992 0,9991 0,9990

3,2389 3,1947 3,1559 3,1214 3,0902

0,9950 0,9945 0,9940 0,9935 0,9930

2,5758 2,5427 2,5121 2,4838 2,4573

0,940 0,935 0,930 0,925 0,920

1,5548 1,5141 1,4758 1,4395 1,4051

0,78 0,76 0,74 0,72 0,70

0,7722 0,7063 0,6433 0,5828 0,5244

0,9989 0,9988 0,9987 0,9986 0,9985

3,0618 3,0357 3,0115 2,9889 2,9677

0,9925 0,9920 0,9915 0,9910 0,9905

2,4324 2,4089 2,3867 2,3656 2,3455

0,915 0,910 0,905 0,900 0,890

1,3722 1,3408 1,3106 1,2816 1,2265

0,68 0,66 0,64 0,62 0,60

0,4677 0,4125 0,3585 0,3055 0,2533

0,9984 0,9983 0,9982 0,9981 0,9980

2,9478 2,9290 2,9112 2,8943 2,8782

0,9900 0,9850 0,9800 0,9750 0,9700

2,3263 2,1701 2,0537 1,9600 1,8808

0,880 0,870 0,860 0,850 0,840

1,1750 1,1264 1,0803 1,0364 0,9945

0,58 0,56 0,54 0,52 0,50

0,2019 0,1510 0,1004 0,0502 0,0000

zu Tab. 2 : Ablesebeispiel: u 0

95

= 1,6449

Erweiterung der Tafel: U[ _ = — uy Approximation nach Hastings für 0,5 < γ < 1: uv — t y

a0+a,t+a2t2 ζ-? T 1 + b, t + b 2 t + b31

mt

, t = V — 2 In (1 — y ) ,

ao = 2,515517,

a ! = 0,802853,

a 2 = 0,010328,

b , = 1,432788,

b 2 = 0,189269,

b 3 = 0,001308.

n

346

Anhang

Tab. 3: \ η

y

Quantile t n : , der t-Verteilung 0,990

0,975

0,950

0,900

\

1 2 3 4 5

31,821 6,965 4,541 3,747 3,365

12,706 4,303 3,182 2,776 2,571

6,314 2,920 2,353 2,132 2,015

3,078 1,886 1,638 1,533 1,476

6 7 8 9 10

3,143 2,998 2,896 2,821 2,764

2,447 2,365 2,306 2,262 2,228

1,943 1,895 1,860 1,833 1,812

1,440 1,415 1,397 1,383 1,372

11 12 13 14 15

2,718 2,681 2,650 2,624 2,602

2,201 2,179 2,160 2,145 2,131

1,796 1,782 1,771 1,761 1,753

1,363 1,356 1,350 1,345 1,341

16 17 18 19 20

2,583 2,567 2,552 2,539 2,528

2,120 2,110 2,101 2,093 2,086

1,746 1,740 1,734 1,729 1,725

1,337 1,333 1,330 1,328 1,325

21 22 23 24 25

2,518 2,508 2,500 2,492 2,485

2,080 2,074 2,069 2,064 2,060

1,721 1,717 1,714 1,711 1,708

1,323 1,321 1,319 1,318 1,316

26 27 28 29 30

2,479 2,473 2,467 2,462 2,457

2,056 2,052 2,048 2,045 2,042

1,706 1,703 1,701 1,699 1,697

1,315 1,314 1,313 1,311 1,310

40 50 60 70 80

2,423 2,403 2,390 2,381 2,374

2,021 2,009 2,000 1,994 1,990

1,684 1,676 1,671 1,667 1,664

1,303 1,299 1,296 1,294 1,292

90 100 150 200 300

2,369 2,364 2,352 2,345 2,339

1,987 1,984 1,976 1,972 1,968

1,662 1,660 1,655 1,653 1,650

1,291 1,290 1,287 1,286 1,284

400 600 800 1000 00

2,336 2,333 2,331 2,330 2,326

1,966 1,964 1,963 1,962 1,960

1,649 1,647 1,647 1,646 1,645

1,284 1,283 1,283 1,282 1,282

zu Tab. 3: Ablesebeispiel: t 1 5 : 0 - 9 S = 1,753 Erweiterung der Tafel: l

n; 1 - ν = — >' und speziell t1;y = t a n ( 7 t { v - i } ) , V2-(2-y-l)

t

Vl-(2-V-D2' too:v = u y Approximation für 0,5 < y < 1: tn; 7

c 9 u 9 + c 7 u 7 + c 5 u 5 + c 3 u 3 + c, u " 92160 n 4

mit u = u y , c 9 = 79, c 7 = 720 η + 776, c 5 = 4800 η 2 + 4560η + 1482, c 3 = 23040η 3 + 15360η 2 + 4080η - 1920, c t = 92160η 4 + 23040η 3 + 2880η 2 - 3600 η - 945 ; für η S 10 kann man auch die Formel von Peizer und Pratt verwenden: t„.y

ne

c u

—η

mit

u = uy

und

5 η —

V

3

10n/

(Anmerkung: Die Peizer-Pratt-Approximation liefert bereits für η = 3 und 0,5 < γ < 0,99 eine passable Anpassung, wobei die absolute Abweichung zum wahren Wert höchstens 0,08 wird.)

Anhang

Tab. 4:

347

Quantile χ*., der x 2 -Verteilung

V

0,995 0,990 0,975 0,950 0,900 0,750 0,500 0,250 0,100 0,050 0,025 0,010 0,005

1 2 3 4 5

7,879 10,60 12,84 14,86 16,75

6,635 9,210 11,34 13,28 15,09

5,024 7,378 9,348 11,14 12,83

3,841 5,991 7,815 9,488 11,07

2,706 4,605 6,251 7,779 9,236

1,323 2,773 4,108 5,385 6,626

0,455 1,386 2,366 3,357 4,351

0,102 0,575 1,213 1,923 2,675

" 2 1,58 0,211 0,584 1,064 1,610

6 7 8 9 10

18,55 20,28 21,96 23,59 25,19

16,81 18,48 20,09 21,67 23,21

14,45 16,01 17,53 19,02 20,48

12,59 14,07 15,51 16,92 18,31

10,64 12,02 13,36 14,68 15,99

7,841 9,037 10,22 11,39 12,55

5,348 6,346 7,344 8,343 9,342

3,455 4,255 5,071 5,899 6,737

2,204 2,833 3,490 4,168 4,865

1,635 2,167 2,733 3,325 3,940

1,237 1,690 2,180 2,700 3,247

0,872 1,239 1,647 2,088 2,558

0,676 0,989 1,344 1,735 2,156

11 12 13 14 15

26,76 28,30 29,82 31,32 32,80

24,73 26,22 27,69 29,14 30,58

21,92 23,34 24,74 26,12 27,49

19,68 21,03 22,36 23,68 25,00

17,28 18,55 19,81 21,06 22,31

13,70 14,85 15,98 17,12 18,25

10,34 11,34 12,34 13,34 14,34

7,584 8,438 9,299 10,17 11,04

5,578 6,304 7,042 7,790 8,547

4,575 5,226 5,892 6,571 7,261

3,816 4,404 5,009 5,629 6,262

3,053 3,571 4,107 4,660 5,229

2,603 3,074 3,565 4,075 4,601

16 17 18 19 20

34,27 35,72 37,16 38,58 40,00

32,00 33,41 34,81 36,19 37,57

28,85 30,19 31,53 32,85 34,17

26,30 27,59 28,87 30,14 31,41

23,54 24,77 25,99 27,20 28,41

19,37 20,49 21,60 22,72 23,83

15,34 16,34 17,34 18,34 19,34

11,91 12,79 13,68 14,56 15,45

9,312 10,09 10,86 11,65 12,44

7,962 8,672 9,390 10,12 10,85

6,908 7,564 8,231 8,907 9,591

5,812 6,408 7,015 7,633 8,260

5,142 5,697 6,265 6,844 7,434

21 22 23 24 25

41,40 42,80 44,18 45,56 46,93

38,93 40,29 41,64 42,98 44,31

35,48 36,78 38,08 39,36 40,65

32,67 33,92 35,17 36,42 37,65

29,62 30,81 32,01 33,20 34,38

24,93 26,04 27,14 28,24 29,34

20,34 21,34 22,34 23,34 24,34

16,34 17,24 18,14 19,04 19,94

13,24 14,04 14,85 15,66 16,47

11,59 12,34 13,09 13,85 14,61

10,28 10,98 11,69 12,40 13,12

8,897 9,542 10,20 10,86 11,52

8,034 8,643 9,260 9,886 10,52

26 27 28 29 30

48,29 49,64 50,99 52,34 53,67

45,64 46,96 48,28 49,59 50,89

41,92 43,19 44,46 45,72 46,98

38,89 40,11 41,34 42,56 43,77

35,56 36,74 37,92 39,09 40,26

30,43 31,53 32,62 33,71 34,80

25,34 26,34 27,34 28,34 29,34

20,84 21,75 22,66 23,57 24,48

17,29 18,11 19,94 19,77 20,60

15,38 16,15 16,93 17,71 18,49

13,84 14,57 15,31 16,05 16,79

12,20 11,16 12,88 11,81 13,56 12,46 14,26 13,12 14,95 13,79

40 50 60 70 80

66,77 79,49 91,95 104,2 116,3

63,69 76,15 88,38 100,4 112,3

59,34 71,42 83,30 95,02 106,6

55,76 67,50 79,08 90,53 101,9

51,81 63,17 74,40 85,53 96,58

45,62 56,33 66,98 77,58 88,13

39,34 49,33 59,33 69,33 79,33

33,66 42,94 52,29 61,70 71,14

29,05 37,69 46,46 55,33 64,28

26,51 34,76 43,19 51,74 60,39

24,43 32,36 40,48 48,76 57,15

22,16 29,71 37,48 45,44 53,54

20,71 27,99 35,53 43,28 51,17

90 100 150 200 250

128,3 140,2 198,4 255,3 311,3

124,1 135,8 193,2 249,4 304,9

118,1 129,6 185,8 241,1 295,7

113,1 124,3 179,6 234,0 287,9

107,6 118,5 172,6 226,0 279,1

98,65 109,1 161,3 213,1 264,7

89,33 99,33 149,3 199,3 249,3

80,62 73,29 69,13 65,65 61,75 90,13 82,36 77,93 74,22 70,06 138,0 128,3 122,7 118,0 112,7 186,2 174,8 168,3 162,7 156,4 234,6 221,8 214,4 208,1 200,9

59,20 67,33 109,1 152,2 196,2

300 400 600 800 1000

366,8 476,6 693,0 906,8 1119,

359,9 468,7 683,5 896,0 1107,

349,9 457,3 669,8 880,3 1090,

341,4 447,6 658,1 866,9 1075,

331,8 436,6 644,8 851,7 1058,

316,1 418,7 623,0 826,6 1030,

299,3 399,3 599,3 799,3 999,3

283,1 380,6 576,3 772,7 969,5

240,7 330,9 514,5 700,7 888,6

269,1 364,2 556,1 749,2 943,1

" 3 3 , 9 3 ~ 4 9,82 _ 4 1 , 5 7 " 5 3,93 0,103 " 2 5 , 0 6 " 2 2,01 " 2 1,00 0,352 0,216 0,115 " 2 7 , 1 7 0,711 0,484 0,297 0,207 1,145 0,831 0,554 0,412

260,9 354,6 544,2 735,4 927,6

253,9 346,5 534,0 723,5 914,3

246,0 337,2 522,4 709,9 898,9

348

Anhang

zu Tab. 4: Ablesebeispiel: jcf. 0 , 05 = 33,93 = 3,93 · KT 3 = 0,00393 Approximation nach Wilson und Hilferty für 0 < γ < 1:

Anhang

Tab.5:

10

349

H b ,

Quantile F n i „ 2 . , der F-Verteilung

S n ?Y 10

11

0,990 0,975 0,950 0,900

4052, 647,8 161,4 39,86

4999, 799,5 199,5 49,50

5403, 864,2 215,7 53,59

5625, 899,6 224,6 55,83

5764, 921,8 230,2 57,24

5859, 937,1 234,0 58.20

5928, 948,2 236,8 58,91

5981, 956,7 238,9 59,44

6022, 963,3 240,5 59,86

6056, 968,6 241,9 60,20

6083, 973,0 243,0 60,47

0,990 0,975 0,950 0,900

98.50 38.51 18,51 8,526

99,00 39,00 19,00 9,000

99,17 39,17 19,16 9,162

99,25 39,25 19,25 9,243

99,30 39,30 19,30 9,293

99,33 39,33 19,33 9,326

99,36 39,36 19,35 9,349

99,37 39,37 19,37 9,367

99,39 39,39 19,38 9,381

99,40 39,40 19,40 9,392

99,41 39,41 19,40 9,401

0,990 0,975 0,950 0,900

34.12 17,44 10.13 5,538

30,82 16,04 9,552 5.462

29,46 15,44 9,277 5,391

28,71 15,10 9,117 5,343

28,24 14,88 9,013 5,309

27,91 14,73 8,941 5,285

27,67 14,62 8,887 5,266

27,49 14,54 8,845 5,252

27,35 14,47 8,812 5,240

27,23 14,42 8,786 5,230

27,13 14,37 8,763 5,222

0,990 0,975 0,950 0,900

21,20 12,22 7,709 4,545

16,69 15,98 15,52 10,65 9,979 9,605 9,364 6,944 6,591 6,388 6,256 4,325 4,191 4,107 4,051

15.21 9,197 6,163 4,010

14,98 9,074 6,094 3,979

14,80 8,980 6,041 3,955

14,66 8,905 5,999 3,936

14,55 8,844 5,964 3,920

14,45 8,793 5,936 3,907

0,990 0,975 0,950 0,900

16,26 13,27 10,01 8,434 6,608 5,786 4,060 3,780

12,06 7,764 5,409 3,619

11,39 7,388 5,192 3,520

10,97 7,146 5,050 3,453

10,67 6,978 4,950 3,405

10,46 6,853 4,876 3,368

10,29 6,757 4,818 3,339

10,16 6,681 4,772 3,316

10,05 6.619 4,735 3,297

9,962 6,568 4,704 3,282

0,990 0,975 0,950 0,900

13,75 8,813 5,987 3,776

10,92 7,260 5,143 3.463

9,780 6,599 4,757 3,289

9,148 6,227 4,534 3,181

8,746 5,988 4,387 3,108

8,466 5,820 4,284 3,055

8,260 5,695 4,207 3,015

8,102 5,600 4,147 2,983

7,976 5,523 4,099 2,958

7,874 5,461 4,060 2,937

7,789 5,409 4,027 2,919

0,990 0,975 0,950 0,900

12.25 8,073 5,591 3,589

9,547 6,542 4,737 3,257

8,451 5,890 4,347 3,074

7,847 5,523 4,120 2,961

7,460 5,285 3,972 2,883

7,191 5,119 3,866 2,827

6,993 4,995 3,787 2,785

6,840 4,899 3,726 2,752

6,719 4,823 3,677 2,725

6.620 4,761 3,637 2,703

6,538 4,709 3,603 2,684

0,990 0,975 0,950 0,900

11.26 7,571 5,318 3,458

8,649 6,059 4,459 3,113

7,591 5,416 4,066 2,924

7,006 5,053 3,838 2,806

6,632 4,817 3,687 2,726

6,371 4,652 3,581 2,668

6,178 4,529 3,500 2,624

6,029 4,433 3,438 2,589

5,911 4,357 3,388 2,561

5,814 4,295 3,347 2,538

5,734 4,243 3,313 2,518

0,990 0,975 0,950 0,900

10,56 7,209 5,117 3,360

8,022 5,715 4,256 3,006

6,992 5,078 3,863 2,813

6,422 4,718 3,633 2,693

2,057 4,484 3,482 2,611

5,802 4,320 3,374 2,551

5,613 4,197 3,293 2,505

5,467 4,102 3,230 2,469

5,351 4,026 3,179 2,440

5,257 3,964 3,137 2,416

5,177 3,912 3,102 2,396

0,990 0,975 0,950 0,900

10,04 6,937 4,965 3,285

7,559 5,456 4,103 2,924

6,552 4,826 3,708 2,728

5,994 4,468 3,478 2,605

5,636 4,236 3,326 2,522

5,386 4,072 3,217 2,461

5,200 3,950 3,135 2,414

5,057 3,855 3,072 2,377

4,942 3,779 3,020 2,347

4,849 3,717 2,978 2,323

4,771 3,665 2,943 2,302

18,00

350

Anhang

Tab. 5:

Fortsetzung 12

13

14

15

20

24

30

40

60

120

oo

1

0,990 0,975 0,950 0,900

6106, 976,7 243,9 60,71

6126, 979,8 244,7 60,90

6143, 982,5 245,4 61,07

6157, 984,9 245,9 61,22

6209, 993,1 248,0 61,74

6235, 997,2 249,1 62,00

6261, 1001, 250,1 62,26

6287, 1006, 251,1 62,53

6313, 1010, 252,2 62,79

6339, 1014, 253,3 63,06

6366, 1018, 254,3 63,33

2

0,990 0,975 0,950 0,900

99,42 39,41 19,41 9,408

99,42 39,42 19,42 9,415

99,43 39,43 19,42 9,420

99,43 39,43 19,43 9,425

99,45 39,45 19,45 9,441

99,46 39,46 19,45 9,450

99,47 39,46 19,46 9,458

99,47 39,47 19,47 9,466

99,48 39,48 19,48 9,475

99,49 39,49 19,49 9,483

99,50 39,50 19,50 9,491

3

0,990 0,975 0,950 0,900

27,05 14,34 8,745 5,216

26,98 14.30 8,729 5,210

26,92 14,28 8,715 5,205

26,87 14,25 8,703 5,200

26,69 14,17 8,660 5,184

26,60 14,12 8,639 5,176

26,50 14,08 8,617 5,168

26,41 14,04 8,594 5,160

26,32 13,99 8,572 5,151

26,22 13,95 8,549 5,143

26,13 13,90 8,526 5,134

4

0,990 0,975 0,950 0,900

14,37 8,751 5.912 3,896

14.31 8,715 5.891 3,885

14,25 8,684 5,873 3,877

14,20 8,657 5,858 3,869

14,02 8,560 5,803 3,844

13,93 8,511 5,774 3,831

13,84 8,461 5,746 3,817

13,75 8,411 5,717 3,804

13,65 8,360 5,688 3,790

13,56 8,309 5,658 3,775

13,46 8,257 5,628 3,761

5

0,990 0,975 0,950 0,900

9,888 6,525 4,678 3,268

9,824 6.487 4,655 3,257

9,770 6,455 4,636 3,247

9,722 6,428 4,619 3,238

9,553 6,329 4,558 3,207

9,466 6.278 4,527 3,191

9,379 6,227 4,496 3,174

9,291 6,175 4,464 3,157

9,202 6,123 4,431 3,140

9,112 6,069 4,398 3,123

9,020 6,015 4,365 3,105

6

0,990 0,975 0,950 0,900

7,718 5,366 4,000 2,905

7,657 5,329 3,976 2.892

7,605 5,297 3,956 2,881

7,559 5,269 3,938 2,871

7,396 5,168 3,874 2,836

7,313 5,117 3,841 2,818

7,229 5,065 3,808 2,800

7,143 5,012 3,774 2,781

7,057 4,959 3,740 2,762

6,969 4,904 3,705 2,742

6,880 4,849 3.669 2,722

7

0,990 0,975 0,950 0,900

6,469 4.666 3,575 2,668

6,410 4,628 3,550 2,654

6,359 4,596 3,529 2,643

6,314 4,568 3,511 2,632

6,155 4,467 3,445 2,595

6,074 4,415 3,410 2,575

5,992 4,362 3,376 2,555

5,908 4,309 3,340 2,535

5,824 4,254 3,304 2,514

5,737 4,199 3,267 2,493

5,650 4,142 3,230 2,471

8

0,990 0,975 0,950 0,900

5.667 4,200 3,284 2,502

5,609 4,162 3,259 2.488

5,558 4,129 3,237 2,475

5,515 4,101 3,218 2,464

5,359 3,999 3,150 2,425

5.279 3,947 3,115 2,404

5,198 3,894 3,079 2,383

5,116 3,840 3,043 2,361

5,032 3,784 3,005 2,339

4,946 3,728 2,967 2,316

4,859 3.670 2,928 2,293

9

0,990 0,975 0,950 0,900

5,111 3,868 3,073 2,379

5,054 3,830 3,047 2,364

5,005 3,798 3,025 2,351

4,962 3,769 3,006 2,340

4,808 3,667 2,936 2,298

4,729 3,614 2,900 2,277

4,649 3,560 2,864 2,255

4,567 3,505 2,826 2,232

4,483 3,449 2,787 2,208

4,398 3,392 2,748 2,184

4,311 3,333 2,707 2,159

10

0,990 0,975 0,950 0,900

4,706 3,621 2.913 2,284

4,649 3,583 2,887 2,269

4,600 3,550 2,864 2,255

4,558 3,522 2,845 2,244

4,405 3,419 2,774 2,201

4,327 3,365 2,737 2,178

4,247 3,311 2,700 2,155

4,165 3,255 2,661 2,132

4,082 3,198 2,621 2,107

3,996 3,140 2,580 2,082

3,909 3,080 2,538 2,055

Anhang

Tab. 5:

351

Fortsetzung 10

11

11

0,990 0,975 0,950 0;900

9,646 6,724 4,844 3,225

7,206 5,256 3,982 2,860

6,217 4,630 3,587 2,660

5.668 4,275 3,357 2,536

5,316 4,044 3,204 2,451

5,069 3,881 3,095 2,389

4,886 3,759 3,012 2,342

4,744 3,664 2,948 2,304

4,632 3,588 2,896 2,273

4,539 3,526 2,854 2,248

4,462 3,473 2,818 2,227

12

0,990 0,975 0,950 0,900

9,330 6,554 4,747 3,177

6,927 5,096 3,885 2,807

5.953 4,474 3,490 2,605

5,412 4,121 3,259 2,480

5,064 3,891 3,106 2,394

4,821 3,728 2,996 2,331

4,640 3,607 2,913 2,283

4,499 3,512 2,849 2,245

4,388 3,436 2,796 2,214

4,296 3,374 2,753 2,188

4,219 3,321 2,717 2,166

13

0,990 0,975 0,950 0,900

9,074 6,414 4,667 3,136

6,701 4,965 3,806 2,763

5,739 4,347 3,411 2,560

5,205 3,996 3,179 2,434

4,862 3,767 3,025 2,347

4,620 3,604 2,915 2,283

4,441 3,483 2,832 2,234

4,302 3,388 2,767 2,195

4,191 3,312 2,714 2,164

4,100 3,250 2,671 2,138

4,024 3,197 2,634 2,115

14

0,990 0,975 0,950 0,900

8,862 6,298 4,600 3,102

6,515 4,857 3,739 2,726

5,564 4,242 3,344 2,522

5,035 3.892 3,112 2,395

4,695 3,663 2,958 2,307

4,456 3,501 2,848 2,243

4,278 3,380 2.764 2,193

4,140 3,285 2,699 2,154

4,030 3,939 3,863 3,209 3,147 3,094 2,646 2,602 2,565 2,122 2,095 2,073

15

0,990 0,975 0,950 0,900

8,683 6,199 4,543 3,073

6,359 4,765 3,682 2,695

5,417 4,153 3,287 2,490

4.893 3,804 3,056 2,361

4,556 3,576 2,901 2,273

4,318 4,142 4.004 3,895 3,415 3,293 3,199 3,123 2,790 2,707 2,641 2,588 2,208 2,158 2,119 2,086

16

0,990 0,975 0,950 0,900

8,531 6,115 4,494 3,048

6,226

5,292 4,773 4.437 4,687 4,077 3,729 3,502 3,634 3,239 3,007 2,852 2,668 2,462 2,333 2,244

17

0,990 0,975 0,950 0,900

8,400 6,042 4,451 3,026

6,112 5,185 4.669 4,336 4,619 4,011 3,665 3.438 3,592 3,197 2,965 2,810 2,645 2,437 2,308 2,218

18

0,990 0,975 0,950 0,900

8,285 5,978 4,414 3,007

6,013 4,560 3,555 2,624

19

0,990 0,975 0,950 0,900

8,185 5,922 4,381 2,990

5,926 5,010 4,500 4,171 4,508 3,903 3,559 3,333 3,522 3,127 2,895 2,740 2,606 2,397 2,266 2,176

20

0,990 0,975 0,950 0,900

8,096 5,871 4,351 2,975

5,849 4,461 3,493 2,589

5,092 3.954 3,160 2,416

4,938 3,859 3,098 2,380

3,805 3,060 2,544 2,059

3,730 3,007 2,506 2,036

4,202 3,341 2,741 2,178

4,026 3,890 3,780 3,691 3,219 3,125 3,049 2,986 2,657 2,591 2,538 2,494 2,128 2,088 2,055 2,028

3,616 2,933 2,456 2,005

4,101 3,277 2,699 2,152

3,927 3,791 3,682 3,593 3,156 3,061 2,985 2,922 2,614 2,548 2,494 2,450 2,102 2,061 2,028 2,001

3,518 2,869 2,412 1,977

4,579 4,248 4,015 3,841 3,608 3,382 3,221 3,100 2,928 2,773 2,661 2,577 2,286 2,196 2,130 2,079

3,705 3.005 2,510 2,038

3,939 3.765 3,631 3,172 3,051 2,956 2,628 2,544 2,477 2,109 2,058 2,017

4,431 4,103 3,871 3,515 3,289 3,128 2,866 2,711 2,599 2,249 2,158 2,091

3,699 3,007 2,514 2,040

3,564 2,913 2,447 1,999

3,597 2,929 2.456 2,005

3,508 3,433 2,866 2,813

2,412 2,374 1,977 1,953

3,523 3,434 2,880 2,817 2,423 2,378 1,984 1,956

3,359 2,764 2,340 1,932

3.457 2,837 2,393 1,965

3,293 2,720 2,310 1,913

3,368 2,774 2,348 1,937

352

Tab. 5:

Anhang

Fortsetzung 12

13

14

15

20

24

4,099 3,226 2,646 2.123

4,021 3,941 3,860 3,173 3,118 3,061 2,609 2,570 2,531 2,100 2,076 2,052

30

40

60

120

oo

11

0,990 0,975 0,950 0,900

4,397 4,341 4,293 4,251 3,430 3,391 3,358 3,330 2,788 2,761 2,738 2,719 2,209 2,193 2,179 2,167

12

0,990 0,975 0,950 0,900

4,155 3.277 2,687 2,147

4,099 4,051 4,010 3,858 3,239 3,206 3,177 3,073 2,660 2,637 2,617 2,544 2,131 2,117 2,105 2,060

13

0,990 0,975 0,950 0,900

3,960 3,153 2,604 2,097

3,905 3,857 3,815 3,665 3,587 3,507 3,425 3,341 3.255 3,165 3,115 3,081 3,053 2,948 2,893 2,837 2.780 2,720 2.659 2,595 2,577 2,553 2,533 2,459 2,420 2,380 2,339 2,297 2,252 2,206 2,080 2,066 2,053 2,007 1,983 1,958 1,931 1,904 1,876 1,846

14

0,990 0,975 0,950 0,900

3,800 3,050 2,534 2,054

3,745 3,697 3,011 2,978 2,507 2,483 2,037 2,022

15

0,990 0,975 0,950 0,900

3,666 2,963 2,475 2,017

3,611 3,563 3,522 3,372 3,294 3,214 3,132 3,047 2,959 2,868 2,924 2,891 2,862 2,756 2,701 2,644 2,585 2,524 2,461 2,395 2,448 2,424 2,403 2,328 2,288 2,247 2,204 2,160 2,114 2,066 2,000 1,985 1,972 1,924 1,899 1,873 1,845 1,817 1,787 1,755

16

0,990 0,975 0,950 0,900

3,553 3,497 3,450 3,409 3,259 3,181 3,101 3,018 2,933 2,845 2,753 2,889 2,850 2,817 2,788 2,681 2,625 2,568 2,509 2,447 2,383 2,316 2,425 2,397 2,373 2,352 2,276 2,235 2,194 2,151 2,106 2,059 2,010 1,985 1,968 1,953 1,940 1,891 1,866 1,839 1,811 1,782 1,751 1,718

17

0,990 0,975 0,950 0,900

3,455 3,400 3,353 3,312 3,162 3,084 3,003 2,920 2,835 2,746 2,825 2,786 2,752 2,723 2,616 2,560 2,502 2,442 2,380 2,315 2,381 2,353 2,329 2,308 2,230 2,190 2,148 2,104 2,058 2,011 1,958 1,940 1,925 1,912 1,862 1,836 1,809 1.781 1,751 1,719

18

0,990 0,975 0,950 0,900

3,371 3,316 3,268 3,227 3,077 2,999 2,919 2,835 2,749 2,769 2,730 2,696 2,667 2,559 2,503 2,444 2,384 2,321 2,342 2,314 2,290 2,269 2,191 2,150 2,107 2,063 2,017 1,933 1,915 1,900 1,887 1,837 1,810 1,783 1,754 1,723

19

0,990 0,975 0,950 0,900

3,297 3,241 3,194 3,153 3,003 2,925 2,844 2,761 2,674 2,584 2,489 2,720 2,680 2,646 2,617 2,509 2,452 2,394 2,333 2,270 2,203 2,133 2,308 2,280 2,255 2,234 2,155 2,114 2,071 2,026 1,980 1,930 1,878 1,912 1,894 1,878 1,865 1,814 1,787 1,759 1,730 1,699 1,666 1,631

20

0,990 0,975 0,950 0,900

3,231 3,176 3,129 3,088 2,938 2,859 2,778 2,695 2,608 2,517 2,421 2,676 2,636 2,602 2,573 2,464 2,408 2.349 2,287 2,223 2,156 2,085 2.278 2,249 2,225 2,203 2.124 2,082 2,039 1,994 1,946 1,896 1,843 1,892 1,874 1,859 1,845 1,794 1,767 1,738 1,708 1,677 1,643 1,607

3,780 3,019 2,505 2,036

3,776 3.690 3,602 3,004 2,944 2,883 2,490 2.448 2,404 2,026 2,000 1,972

3,701 3,619 3,535 3.449 3,361 2,963 2,906 2,848 2,787 2,725 2,466 2,426 2,384 2,341 2,296 2,011 1,986 1,960 1,932 1,904

3,656 3,505 3,427 3.348 3,266 3,181 3,094 3,004 2,949 2,844 2,789 2,732 2,674 2,614 2,552 2,487 2,463 2,388 2,349 2,308 2,266 2,223 2,178 2,131 2,010 1,962 1,938 1,912 1,885 1,857 1,828 1,797

2,653 2,247 1,960 1,686

2.660 2,566

2.256 2,187 1,968 1,917 1.691 1,657

Anhang

Tab. 5:

353

Fortsetzung 10

11

22

0,990 0,975 0,950 0,900

7,945 5,786 4,301 2,949

5,719 4,383 3,443 2,561

4,817 3,783 3,049 2,351

4,313 3,440 2,817 2,219

3,988 3,758 3,587 3,215 3,055 2,934 2,661 2,549 2,464 2,128 2,060 2,008

3,453 2,839 2,397 1,967

3,346 2,763 2,342 1,933

3,258 2,700 2,297 1,904

3,183 2,646 2,258 1,880

24

0,990 0,975 0,950 0,900

7,823 .5,717 4,260 2,927

5,614 4,319 3,403 2,538

4.718 3,721 3,009 2,327

4,218 3,379 2,776 2,195

3.895 3,667 3,496 3,155 2.995 2,874 2,621 2,508 2,423 2,103 2,035 1,983

3,363 2,779 2.355 1,941

3,256 2,703 2,300 1,906

3,168 2,640 2,255 1,877

3,094 2,586 2,216 1,853

26

0,990 0,975 0,950 0,900

7,721 5,659 4,225 2,909

5,526 4,265 3,369 2,519

4,637 3,670 2,975 2,307

4,140 3,329 2,743 2,174

3,818 3,591 3,421 3,288 3,105 2,945 2,824 2,729 2,587 2,474 2,388 2,321 2,082 2,014 1,961 1,919

3,182 2,653 2,565 1,884

3,094 2,590 2,220 1,855

3,020 2,536 2,181 1,830

28

0,990 0,975 0,950 0,900

7,636 5,610 4,196 2,894

5,453 4,221 3,340 2,503

4,568 3,626 2,947 2,291

4,074 3,286 2,714 2,157

3,754 3.063 2,558 2.064

3,528 2,903 2,445 1.996

3.358 2,782 2.359 1,943

3,226 2,687 2,291 1,900

3,120 3,032 2,611 2,547 2,236 2,190 1,865 1,836

2,958 2,493 2,151

30

0,990 0,975 0,950 0,900

7,562 5,390 4,510 4,018 5,568 4,182 3,589 3,250 4,171 3,316 2,922 2,690 2,881 2,489 2,276 2,142

3,699 3,026 2,534 2,049

3,473 2,867 2,421 1,980

3,304 2,746 2,334 1,927

3,173 3,067 2,979 2,651 2,575 2,511 2,266 2,211 2,165 1,884 1,849 1,819

2,905 2,457 2,125 1,794

40

0,990 0,975 0,950 0,900

7,314 5,424 4,085 2,835

5,179 4,051 3,232 2,440

4,313 3,828 3,514 3,291 3,463 3,126 2,904 2,744 2,839 2,606 2,449 2,336 2,226 2,091 1,997 1,927

3,124 2,624 2,249 1,873

2,993 2,529 2,180 1,829

2,888

60

0,990 0,975 0,950 0,900

7,077 5,286 4,001 2,791

4,977 3,925 3,150 2,393

4,126 3,343 2,758 2,177

3,649 3,008 2,525 2,041

2,823 2,412 2,097 1,775

2,718 2,334 2,040 1,738

80

0,990 0,975 0,950 0,900

6,964 5,219 3,961 2,770

4,882 3,865 3,111 2,370

4,036 3,285 2.719 2,154

3,564 2,951 2,486 2,017

2,743 2.356 2,057 1,748

2,639 2,278 1,999 1,711

120

0,990 0,975 0,950 0,900

6,851 5,152 3,920 2,748

oo

0,990 0,975 0,950 0,900

6,635 5,024 3,841 2,706

1,811

2,801 2,727 2,452 2,388 2,334 2,124 2,077 2,037 1,793 1,763 1,737

3,339 2,786 2,368 1,946

3,119 2,627 2,254 1,875

2,953 2,507 2,167 1,819

3,256 2,730 2,329 1,921

3,037 2,571 2,214 1,849

2,872 2,451 2,127 1,793

4,787 3,805 3,072 2,347

3,949 3,480 3,174 3,227 2,894 2,674 2,680 2,447 2,290 2,130 1,992 1.896

2,956 2,515 2,175 1,824

2,792 2,663 2,559 2,472 2,398 2,395 2,299 2,222 2,157 2,101 2,087 2,016 1,959 1,910 1,869 1,767 1,722 1,684 1,652 1,625

4,605 3,689 2,996 2,303

3,782 3,116 2,605 2,084

3,319 2,786 2,372 1,945

2,802 2,408 2,099 1,774

2,639 2,511 2,407 2,321 2,247 2,288 2,192 2,114 2,048 1,992 2,010 1,938 1,880 1,831 1,788 1,717 1,670 1,632 1,599 1,570

3,017 2,567 2,214 1,847

2,632 2,270 1,993 1,707

2,558 2,215 1,952

2,552 2,214 1,952

2,478 2,158 1,910 1,652

1,680

1,680

354

Anhang

Tab. 5: Fortsetzung 12

13

14

15

20

24

30

40

60

120

oo

2,495 2,145 1,889 1,639

2,403 2,076 1,838 1,604

2,305 2,003 1,783 1,567

22

0,990 0,975 0,950 0,900

3,121 3,066 3,019 2,978 2,602 2,562 2,528 2,498 2,226 2,197 2,172 2,151 1,859 1,841 1,825 1,811

2,827 2,749 2,667 2,583 2,389 2,332 2,272 2,210 2,071 2,028 1,984 1,938 1,759 1,731 1,702 1,671

24

0,990 0,975 0,950 0,900

3,032 2,541 2,183 1,832

2,889 2,437 2,108 1,783

2,738 2,327 2,027 1,730

2,659 2,269 1,984 1,702

26

0,990 0,975 0,950 0,900

2,958 2,903 2,856 2,815 2,491 2,451 2,417 2,387 2,148 2,119 2,093 2,072 1,809 1,790 1,774 1,760

2,664 2,276 1,990 1,706

2,585 2,503 2,417 2,327 2,233 2,217 2,157 2,093 2,026 1,954 1,946 1,901 1,853 1,803 1,749 1,677 1,647 1,615 1,581 1,544

28

0,990 0,975 0,950 0,900

2,896 2,448 2,118 1,790

2,841 2,408 2,088 1,770

2,602 2,232 1,959 1,685

2,522 2,174 1,915 1,656

30

0,990 0,975 0,950 0,900

2,843 2,412 2,092 1,773

2,788 2,741 2,700 2,549 2,469 2,386 2,299 2,208 2,111 2,372 2,337 2,307 2,195 2,136 2,074 2,009 1,940 1,866 2,062 2,037 2,015 1,932 1,887 1,841 1,792 1,740 1,684 1,753 1,737 1,722 1,667 1,638 1,606 1,573 1,538 1,499

40

0,990 0,975 0,950 0,900

2,665 2,610 2,563 2,522 2,369 2,288 2,203 2,288 2,247 2,212 2,182 2,068 2,007 1,943 2,003 1,973 1,947 1,924 1,839 1,793 1,744 1,715 1,695 1,677 1,662 1,605 1,574 1,541

60

0,990 0,975 0,950 0,900

2,496 2,169 1,917 1,657

2,441 2,128 1,886 1,637

2,393 2,092 1,860 1,619

2,352 2,061 1,836 1,603

2,198 1,944 1,748 1,543

2,115 1,882 1,700 1,511

2,028 1,936 1,836 1,726 1,601 1,815 1,744 1,667 1,581 1,482 1,649 1,594 1,534 1,467 1,389 1,476 1,437 1,395 1,348 1,291

80

0,990 0,975 0,950 0,900

2,416 2,112 1,876 1,629

2,361 2,070 1,844 1,608

2,313 2,034 1,817 1,590

2,272 2,003 1,793 1,574

2,116 1,885 1,703 1,513

2,033 1,821 1,654 1,479

1,944 1,753 1,602 1,443

1,849 1,679 1,545 1,403

1,746 1,598 1,482 1,358

1,630 1,491 1,507 1,396 1,410 1,322 1,306 1,242

120

0,990 0,975 0,950 0,900

2,336 2,055 1,834 1,601

2,281 2,013 1,802 1,580

2,233 1,976 1,774 1,561

2,192 1,945 1,750 1,545

2,035 1,825 1,659 1,482

1,950 1,860 1,760 1,690 1,608 1,554 1,447 1,409

1,763 1,614 1,495 1,368

1,656 1,530 1,429 1,320

1,533 1,433 1,352 1,265

1,381 1,310 1,254 1,193

oo

0,990 0,975 0,950 0,900

2,185 2,129 1,945 1,902 1,752 1,719 1,546 1,523

2,080 1,865 1,691 1,504

2,039 1,833 1,666 1,487

1,878 1,791 1,696 1,592 1,708 1,640 1,566 1,484 1,571 1,517 1,459 1,394 1,421 1,383 1,342 1,295

1,473 1,388 1,318 1,240

1,325 1,268 1,221 1,169

1,000 1,000 1,000 1,000

2,977 2,501 2,154 1,813

2,930 2,467 2,129 1,797

2,794 2,374 2,063 1,754

2,753 2,344 2,041 1,740

2,577 2,209 1,939 1,672

2,440 2,112 1,869 1,625

2,492 2,403 2,310 2,211 2,146 2,080 2,010 1,935 1,892 1,842 1,790 1,733 1,641 1,607 1,571 1,533

2,353 2,048 1,820 1,592

2,114 1,875 1,693 1,506

2,131 1,878 1,691 1,504

2,263 2,167 2,064 1,980 1,907 1,829 1,769 1,714 1,654 1,558 1,520 1,478 2,006 1,787 1,622 1,456

2,019 1,917 1,805 1,803 1,724 1,637 1,637 1,577 1,509 1,467 1,425 1,377

Anhang

355

zu Tab. S: Ablesebeispiel: F 7

20;0i99

= 3,699

Erweiterung der Tafel: F„ t

.; _ — F n

=

2·π 1 · ( ( 1 + >1/2) U

Fl.„2;·,· = (t„ 2;( l+ y )/ 2 ) > F1 ,co; ϊ 2 1 η 1, ao; y ^ yAnj;y> F* oc, cc; = y1

4F

Λ

'

Interpolation nach Laubscher: Gesucht ist F„ „2. y. Gibt es dann natürliche Zahlen n 3 i n , < n s sowie n 4 g n 2 < n 6 derart, daß die Quantile F n 3 . n 4 . y , F n j n 6 ; y , F„ 5 n 4 ; y und F „ vertafelt sind, so gilt: F

n,.n 2 ; y = 0 ~ C,) ' (1 - C2) · F„3, „4; + (1 - C,) · C2 · F n3-n( .. .. + c , • ( 1 - c 2 ) • F n 5 . „4. j + c, · c 2 · F„ s . „6.,.

.... fur

c, =

n5(ni-n3) ni(n5-n3)

und

c2 =

n6(n2-n4) n2(n6-n4)

.

Läßt sich n 3 = n, wählen, so wird offensichtlich C! = 0, wie für n 4 = n 2 auch c 2 = 0 ist. In diesen Fällen vereinfacht sich die Interpolationsformel entsprechend. ^..f, -e" " a = v^d+cd (uy)2 - 3 c = —

2

,

und

1

b = 2·( \n, — 1 d =

1 1 1- -

1

λ

b

mit u = uy, /

5 d · ( c + - - n2—1/V 6 3

356

Anhang

2. Griechisches Alphabet A

α

Alpha

Β

β

Beta

Γ

Υ

Gamma

Δ

δ

Delta

Ε

ε

Epsilon

Ζ

ζ

Zeta

Η

η

Eta

θ

θ

Theta

I

ι

Jota

Κ

κ , χ

Kappa

Λ

λ

Lambda

Μ

μ

My

Ν

ν

Ny

=

ξ

Xi

0

0

Omikron

Π

π

Pi

Ρ

Ρ

Rho

ζ

σ

Sigma

τ

τ

Tau

Υ

υ

YpsiIon

φ

Φ . Ψ

Phi

χ

Χ

Chi

ψ

Ψ

Psi

Ω

ω

Omega

Anhang

357

3. S y m b o l v e r z e i c h n i s

Symbol

Bedeutung

+

"plus"; Addition "minus"; Subtraktion "mal"; Multiplikation

^

"a dividiert durch b"; Division

a/b

"a dividiert durch b"; Division "gleich"

f

"ungleich"



"ungefähr gleich", "rund"

>

"größer als"




"größer oder gleich"