229 68 993KB
German Pages 190 Year 2011
StatistikArbeitsbuch Übungsaufgaben, Fallstudien, Lösungen
von
Prof. Dr. Dr. h.c. Günter Bamberg o. Professor für Statistik
PD Dr. Franz Baur und
PD Dr. Michael Krapp Universität Augsburg
8., überarbeitete Auflage 3., vollständig überarbeitete Auflage
OldenbourgVerlag MünchenWien
Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über abrufbar.
© 2008 Oldenbourg Wissenschaftsverlag GmbH Rosenheimer Straße 145, D -81671 München Telefon: (089) 4 50 51- 0 oldenbourg.de Das Werk einschließlich aller Abbildungen ist urheberrechtlich geschützt. Jede Verwertung außerhalb der Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Bearbeitung in elektronischen Systemen. Lektorat: Wirtschafts- und Sozialwissenschaften, [email protected] Herstellung: Anna Grosser Coverentwurf: Kochan & Partner, München Gedruckt auf säure- und chlorfreiem Papier Gesamtherstellung: Druckhaus „Thomas Müntzer“ GmbH, Bad Langensalza ISBN 978-3-486-58619-0
Inhaltsverzeichnis Die Einordnung der Aufgaben erfolgt gemäß dem überwiegend benutzten Begriff. So beinhalten einige der in die induktive Statistik eingeordneten Aufgaben beispielsweise auch Begriffe aus der deskriptiven Statistik. Vorwort . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . VII Liste wichtiger Symbole . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . IX
Teil I: Deskriptive Statistik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 Aufgaben zur deskriptiven Statistik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 Aufgaben 1.1
bis 1.5
Häufigkeitsverteilungen, Kreissektorendiagramm, Histogramm, Lage- und Streuungsparameter
Aufgaben 1.6
bis 1.8
Konzentrationsmaße
Aufgaben 1.9
bis 1.12
Kontingenztabellen, bedingte Häufigkeiten, Korrelationsrechnung
Aufgaben 1.13 bis 1.18
Regressionsrechnung
Aufgaben 1.19 bis 1.24
Indexzahlen
Aufgaben 1.25 bis 1.30
Zeitreihenzerlegung und Saisonbereinigung
Lösungen zur deskriptiven Statistik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
Teil II: Wahrscheinlichkeitsrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 Aufgaben zur Wahrscheinlichkeitsrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 Aufgaben 2.1
bis 2.9
Regeln für Wahrscheinlichkeiten, LaplaceDefinition, bedingte Wahrscheinlichkeiten, Formel von Bayes
Aufgaben 2.10 bis 2.15
Erwartungswert, Varianz, Semivarianz
Aufgaben 2.16 bis 2.23
Diskrete Zufallsvariablen: Binomialverteilung, hypergeometrische Verteilung, Poissonverteilung, geometrische Verteilung, Transformation von diskreten Zufallsvariablen
VI
Inhaltsverzeichnis
Aufgaben 2.24 bis 2.33
Stetige Zufallsvariablen: Gleichverteilung, Exponentialverteilung, Normalverteilung, Betaverteilung, Log-Normalverteilung
Aufgaben 2.34 bis 2.42
Sonstige Aufgaben zur Wahrscheinlichkeitsrechnung: jensensche und tschebyscheffsche Ungleichung, Korrelation, mehrdimensionale Zufallsvariablen
Lösungen zur Wahrscheinlichkeitsrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
Teil III: Induktive Statistik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93 Aufgaben zur induktiven Statistik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93 Aufgaben 3.1 und 3.2
Zufallsauswahl, Testverteilungen
Aufgaben 3.3
Punktschätzung: Erwartungstreue, Wirksamkeit, Konsistenz
Aufgabe
bis 3.9
3.10
Punktschätzung nach dem Prinzip der kleinsten Quadrate
Aufgaben 3.11 bis 3.16
Punktschätzung nach dem MaximumLikelihood-Prinzip und Bayesschätzfunktionen
Aufgaben 3.17 bis 3.21
Schichtschätzfunktion
Aufgaben 3.22 bis 3.35
Konfidenzintervalle und Tests für Erwartungswert und Varianz einer Grundgesamtheit; Gütefunktion
Aufgaben 3.36 bis 3.50
Differenzentest, Zweistichproben-Test, einfache Varianzanalyse, Chi-QuadratAnpassungstest, Kontingenztest, Vorzeichentest
Lösungen zur induktiven Statistik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124 Literaturverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179
Vorwort zur achten Auflage Die beiden Alt-Autoren freuen sich, mit Herrn PD Dr. Michael Krapp einen jungen Kollegen zur verstärkten Mitarbeit gewinnen zu können. Herr Krapp hat bereits bei früheren Auflagen an Korrekturen und Aktualisierungen mitgewirkt. Da seine zahlreichen Publikationen sowohl durch den Anwendungsaspekt als auch durch den intensiven Einsatz des stochastischen und statistischen Instrumentariums geprägt sind, besitzt er ausgezeichnete fachliche Voraussetzungen zur erfolgreichen Fortführung des Werkes. Inhaltlich tritt mit dieser Erweiterung des Autorenteams kein Strukturbruch ein. Wir haben uns für diese achte Auflage auf geringfügige Aktualisierungen beschränkt. Gemäß einem empirisch gut untermauerten Gesetz enthält jedes Buch Druckfehler; unter http://www.wiwi.uni-augsburg.de/bwl/bamberg/Druckfehler.html ist die Liste der nach und nach entdeckten Druckfehler zu finden. Wir hoffen auf eine kurze Liste. Verweise auf Abschnitte, Seiten, Formelnummern, Tabellen und Figuren beziehen sich stets auf das Lehrbuch Bamberg et al., „Statistik“, wobei es unerheblich ist, um welche Auflage es sich handelt. Augsburg, im Oktober 2007
G. Bamberg F. Baur
Vorwort zur ersten Auflage Das vorliegende Arbeitsbuch dient der Einübung grundlegender Begriffe und Verfahren der statistischen Methodenlehre. Es besteht aus 30 Aufgaben zur deskriptiven Statistik 42 Aufgaben zur Wahrscheinlichkeitsrechnung 50 Aufgaben zur induktiven Statistik, die jeweils mit einer ausführlichen Lösung versehen sind. Alle Aufgaben sind eingekleidet, wobei die inhaltlich angesprochenen Probleme überwiegend die Bereiche Betriebswirtschaftslehre, Volkswirtschaftslehre, Ökologie und Verhaltenswissenschaften betreffen.
VIII
Vorwort
Ob eine Aufgabe als schwer oder leicht einzustufen ist, hängt weitgehend von den individuellen (mathematischen) Vorkenntnissen sowie von der Schwerpunktsetzung des jeweiligen Statistik-Kurses ab. Ferner hängt der Schwierigkeitsgrad einer Aufgabe – als Klausuraufgabe betrachtet – entscheidend von dem zur Verfügung stehenden Zeitbudget und von den zugelassenen Hilfsmitteln ab. Infolgedessen wurde auf eine Kennzeichnung des Schwierigkeitsgrades mittels einer Punktzahl verzichtet. Statt dessen wurde eine Reihe von Aufgaben durch ein Sternchensymbol als relativ schwierig eingestuft. Diese Aufgaben können eher als (leicht simplifizierte) Fallstudien angesehen werden, die den Schwierigkeitsgrad von typischen Klausuraufgaben an wirtschaftswissenschaftlichen Fakultäten übersteigen dürften. An den meisten Fakultäten sind vervielfältigte frühere Klausuraufgaben zugänglich, mittels derer ein Maßstab für die aktuell geforderte Leistung ableitbar ist. Bezeichnungen und Tabellenwerte sind dem Lehrbuch Bamberg, G.; Baur, F.: Statistik, Oldenbourg-Verlag, München–Wien entlehnt und entsprechen weitgehend dem üblichen Standard. Die Stoffauswahl deckt sich mit den Teilen I, II und III dieses Lehrbuches mit der geringfügigen Modifikation, daß auch einige Aufgaben zum Thema „geschichtete Stichproben“ (das im Abschnitt 18.2 von Teil IV behandelt wird) in die induktive Statistik aufgenommen wurden. Verweise auf Abschnitte, Seiten, Formelnummern, Tabellen und Figuren beziehen sich stets auf das erwähnte Lehrbuch, wobei es unerheblich ist, um welche Auflage es sich handelt. Sofern im Arbeitsbuch Begriffe, insbesondere Verteilungen, vorkommen, die nicht im Lehrbuch erläutert wurden, werden sie hinreichend ausführlich definiert und in den meisten Fällen im Anschluß an die Musterlösung nochmals allgemeiner kommentiert. Oft wurde auf zwei Nachkommastellen gerundet. Falls in der Lösung gerundete Zwischenergebnisse notiert wurden, beruht auch die weitere Rechnung – der leichteren Nachvollziehbarkeit halber – auf diesen gerundeten Zwischenwerten. Für die kritische Durchsicht des Manuskripts danken wir den Herren Dr. Hermann Locarek, Dipl.-Oec. Carl-Martin Preuß und Dr. Ralf Trost. Unser Dank gilt darüber hinaus Frau Birgit Emmrich, die aufgrund ihrer profunden LATEXKenntnisse die Reinfassung erstellt hat, sowie schließlich Herrn Martin Weigert und dem Oldenbourg-Verlag für die verständnisvolle Zusammenarbeit. Augsburg, im September 1988
G. Bamberg F. Baur
Liste wichtiger Symbole Symbole für Teil I X bzw. Y xi bzw. yi a1 ; : : : ; ak h.aj / f .aj / H .x/ F.x/ xN s2 s r
Merkmale Beobachtungswerte von X bzw. Y realisierte Ausprägungen des Merkmals X absolute Häufigkeit der Ausprägung aj relative Häufigkeit von aj kumulierte absolute Häufigkeitsverteilung kumulierte relative Häufigkeitsverteilung arithmetisches Mittel mittlere quadratische Abweichung Standardabweichung Bravais-Pearson-Korrelationskoeffizient
Symbole für Teil II X bzw. Y P P .A j B/ f .x/ F.x/ B.nI p/ N .I / N .0I 1/ ˆ.x/ E.X / bzw. Var.X / bzw. 2
Zufallsvariablen (gegebenfalls auch zugehörige Merkmale) Ergebnismenge Wahrscheinlichkeitsmaß bedingte Wahrscheinlichkeit Wahrscheinlichkeitsfunktion bzw. Wahrscheinlichkeitsdichte Verteilungsfunktion Binomialverteilung Normalverteilung Standardnormalverteilung Verteilungsfunktion der Standardnormalverteilung Erwartungswert der Zufallsvariablen X Varianz der Zufallsvariablen X
X
Liste wichtiger Symbole
Symbole für Teil III G Xi XN S2 S .x1 ; : : : ; xn / f .x1 ; : : : ; xn j #/ Vu bzw. Vo V bzw. v H0 bzw. H1 ˛ B g.#/
Grundgesamtheit i-te Stichprobenvariable Stichprobenmittel Stichprobenvarianz Stichproben-Standardabweichung Stichprobenergebnis Likelihoodfunktion untere bzw. obere Grenzen eines Konfidenzintervalls Testfunktion bzw. ihre Realisierung Nullhypothese bzw. Alternativhypothese Signifikanzniveau, Irrtumswahrscheinlichkeit Verwerfungsbereich eines Tests Gütefunktion
Teil I: Deskriptive Statistik
Aufgaben zur deskriptiven Statistik Aufgabe 1.1 1988 wurden in einem Land 350 Milliarden Kilowattstunden Strom erzeugt. Bei einer Aufschlüsselung nach den eingesetzten Primärenergieträgern (Kernkraft, Steinkohle, Braunkohle, Erdöl, Gas, Wasserkraft, sonstige) entfällt bei einer Darstellung mittels eines Kreissektorendiagramms auf die Steinkohle ein Winkel von 68 Grad. Wie viele Kilowattstunden wurden mittels Steinkohle erzeugt?
Aufgabe 1.2 Von 9 Millionen Objekten privaten Haus- und Wohnbesitzes entfallen 50 % auf Einfamilienhäuser, 25 % auf Zweifamilienhäuser, 10 % auf Mehrfamilienhäuser und 15 % auf Eigentumswohnungen. Erstellen Sie das entsprechende Kreissektorendiagramm.
Aufgabe 1.3 An der Scanner-Kasse eines Supermarkts wurden für 50 aufeinanderfolgende Kunden folgende Bedienungszeiten [in sec.] registriert:
2
Aufgaben zur deskriptiven Statistik 40 33 19 41 64
20 39 49 40 19
22 49 39 39 50
15 22 36 38 40
18 23 37 27 18
51 62 38 51 68
37 42 22 52 51
42 53 24 54 41
31 43 32 28 48
58 44 29 22 57
a) Erstellen Sie ein Histogramm unter Verwendung der Klassengrenzen 0; 20; 30; 40; 50; 70; wobei die Klassen links abgeschlossen und rechts offen seien. b) Bestimmen Sie den Modalwert, den Median, sowie das arithmetische Mittel der Bedienungszeiten.
Aufgabe 1.4 Flexible Fertigungssysteme werden meist als Warteschlangennetzwerk modelliert, wobei unterstellt wird, dass an jeder Station unbegrenzte lokale Ein- und Ausgangspuffer vorhanden sind. Insbesondere die in der Praxis limitierte Kapazität des Ausgangspuffers kann zur Blockierung der Station führen. Da eine geplante Produktionsausweitung eine weitere Reduktion des Ausgangspuffers erforderlich macht, wird über einen längeren Zeitraum hinweg an einer speziellen Station registriert, wie viele Paletten die Station pro Zeiteinheit verlassen. Die Beobachtungen liefern folgende Daten Anzahl x der Paletten
3
4
5
6
7
8
9
10
Häufigkeit
10
15
30
30
25
20
15
5
a) Bestimmen Sie die Werte F.7/ und F.8/ der empirischen Verteilungsfunktion F des Merkmals X (= Anzahl der Paletten, die die Station pro Zeiteinheit verlassen). b) Geben Sie mittels F und x an, in wieviel Prozent der Fälle eine Blockierung der Station eintritt, wenn man davon ausgehen kann, dass eine Blockierung erfolgt, wenn mehr als x Paletten die Station (pro Zeiteinheit) verlassen. Welcher numerische Wert ergibt sich speziell für x D 7?
Aufgaben zur deskriptiven Statistik
3
Aufgabe 1.5 In Aufgabe 11 aus Bamberg et al. [2008, S. 20] wurde ein Standortproblem geschildert und nach dem optimalen Standort der Kantine gefragt. Optimalitätskriterium war die Minimierung der Summe der Wegstrecken aller 1:000 Beschäftigten. Welches ist der optimale Standort, wenn a) die Summe aller Zeiten, die für den Hin- und Rückweg zur Kantine aufgebracht werden müssen, minimiert werden soll? Dabei gehe man davon aus, dass die Gehgeschwindigkeit 1,3 Meter pro sec. beträgt. b) extrem lange Wege möglichst vermieden werden sollen? Diese Forderung werde dadurch präzisiert, dass jede Wegstrecke w quadratisch (d.h. als w 2 ) gezählt wird, was extrem kurze Strecken begünstigt und längere Strecken mit einem progressiven Malus belegt. c) die „Rüstzeiten“ für den Gang zur Kantine minimiert werden sollen? Dabei sei die Rüstzeit 0, wenn die Wegstrecke 0 ist; sobald die Wegstrecke von null verschieden ist, fallen pro Person Rüstzeiten (Mantel anziehen, Schirm suchen usw.) von 30 sec. an.
Aufgabe 1.6 Die Lagerpositionen (jeweils Produkt aus Preis und Menge) eines Vorratslagers wurden der Größe nach geordnet und daraus die Lorenzkurve ermittelt. Es zeigte sich, dass die (auf das Einheitsquadrat normierte) Lorenzkurve so gut durch L.p/ D p 5 ;
0p1
zu approximieren ist, dass die folgenden Fragen mittels dieser Approximation beantwortet werden können: a) Wieviel Prozent des gesamten Lagerwertes entfällt auf die 80 % geringerwertigen Lagerpositionen? b) Auf wieviel Prozent der höherwertigen Positionen entfällt 80 % des gesamten Lagerwertes?
4
Aufgaben zur deskriptiven Statistik
Aufgabe 1.7 Für drei Aktiengesellschaften sind in nachfolgender Tabelle die prozentualen Anteile der vier größten Aktionäre (die für jede AG differieren können) eingetragen worden: AG
Aktionär 1
Aktionär 2
Aktionär 3
Aktionär 4
1 2 3
40 20 51
20 10 9
12 10 8
1 10 7
a) Berechnen Sie zur Quantifizierung der Konzentration des Aktienkapitals die Konzentrationskoeffizienten CR1 , CR2 , CR3 und CR4 für die drei Aktiengesellschaften. b) Bei welcher Gesellschaft ist das Aktienkapital am stärksten konzentriert, wenn CR3 bzw. CR4 als Konzentrationsmaß verwendet wird? c) Welcher Gini-Koeffizient ergibt sich für Aktiengesellschaft 2, wenn angenommen werden kann, dass sich der Streubesitz gleichmäßig auf weitere 9.996 Aktionäre aufteilt?
Aufgabe 1.8 Auf die 10 Lebensversicherungsgesellschaften eines Landes entfielen 2002 folgende Beitragssummen in 107 [€] Gesellschaft i
1
2
3
4
5
6
7
8
9
10
Beiträge
50
150
200
50
50
50
50
50
50
500
a) Ermitteln und skizzieren Sie die Lorenzkurve. b) Berechnen Sie den Gini-Koeffizienten G. c) Berechnen Sie den Herfindahl-Index H . d) Berechnen Sie den Exponentialindex E.
Aufgaben zur deskriptiven Statistik
5
Aufgabe 1.9 200 männliche Personen wurden nach ihrem Berufsstand und dem ihres Vaters gefragt. Unter den 200 Personen waren 60 die Söhne von Angestellten. Ferner ergaben sich die Daten PP PP Vater Arbeiter PP Sohn PP P
Arbeiter Angestellter Beamter Selbstständiger
40 40 10 0
Angestellter
Beamter
Selbstständiger
10
0 5 25 0
10 0 10
25 0
a) Ergänzen Sie die beiden fehlenden Daten und berechnen Sie die Randhäufigkeiten. b) Ist der Berufsstand des Sohnes von demjenigen des Vaters unabhängig?
Aufgabe 1.10 Ein EDV-Hersteller testet Bewerber auf analytische Fähigkeiten. 2.000 Bewerber wurden im Jahre 1988 getestet. 600 erzielten ein gutes, 900 ein mittleres und 500 ein schlechtes Testergebnis. Routinemäßig wurde auch die Haarfarbe der Bewerber festgehalten: 1.000 hatten braune Haare, 400 waren blond und 600 waren schwarz. Man wird erwarten, dass das Testergebnis weitgehend unabhängig von der Haarfarbe ist (andernfalls könnte man auf den aufwändigen Test verzichten und sich an dem einfacher zu erhebenden Merkmal „Haarfarbe“ orientieren). Bei den 2.000 Bewerbern lag sogar exakte Unabhängikeit vor. a) Stellen Sie die Kontingenztabelle auf. b) Berechnen Sie den Kontingenzkoeffizienten.
Aufgabe 1.11 In Börsenkreisen wird oft von einem Zusammenhang zwischen Rentenrenditen und Aktienkursen gesprochen. Zu 8 Zeitpunkten wurden folgende Werte für den Aktienindex der Frankfurter Allgemeinen Zeitung (FAZ-Index) und die Durchschnittsrendite öffentlicher Anleihen mit 10 Jahren Laufzeit beobachtet:
6
Aufgaben zur deskriptiven Statistik Zeitpunkt FAZ-Index Rendite in %
1
2
3
4
5
6
7
8
221 9,7
251 7,9
346 8,6
376 7,2
401 7,3
421 7,1
471 7,0
481 6,8
a) Berechnen Sie den Bravais-Pearson-Korrelationskoeffizienten. b) Berechnen Sie den Spearman-Korrelationskoeffizienten.
Aufgabe 1.12 Liegen für ein kardinales Merkmal Zeitreihendaten x1 ;x2 ; : : : ;xn vor (man denke beispielsweise an die monatlich erhobene Anzahl der Arbeitslosen eines Landes), so kann man Bravais-Pearson-Korrelationskoeffizienten bilden, indem man die ursprüngliche Zeitreihe als erstes Merkmal und die um k D 1; 2; : : : Zeitperioden verschobene Zeitreihe als zweites Merkmal auffasst. D.h. man berechnet den Bravais-Pearson-Korrelationskoeffizienten für die Beobachtungspaare .x1 ; x1Ck /; .x2 ; x2Ck /; : : : ; .xnk ; xn /: Es ist offensichtlich, dass man hierdurch wertvolle Informationen über die Struktur der Zeitreihendaten erhalten kann. Üblicherweise vereinfacht man die Berechnungen, indem man die (von der strikten Anwendung der Bravais-PearsonDefinition abweichende) Formel nk P
rk D
t D1
.x t x/.x N t Ck x/ N n P t D1
verwendet, wobei
.x t x/ N 2 n
xN D
1X xt n t D1
bedeutet. rk wird als Autokorrelationskoeffizient für den Time-Lag k bezeichnet. Die Gesamtheit der für eine Zeitreihe berechneten rk -Werte bzw. ihre Darstellung als Stabdiagramm bezeichnet man als Korrelogramm der Zeitreihe. Berechnen und skizzieren Sie (für k D 0; 1; : : : ; 7) das Korrelogramm der Zeitreihe Zeit t
1
2
3
4
5
6
7
8
Zeitreihenwert x t
10
12
8
12
8
10
7
13
Aufgaben zur deskriptiven Statistik
7
Aufgabe 1.13 Eine Unternehmensabteilung ist ausschließlich mit der Herstellung eines einzigen Produktes beschäftigt. Für 10 Perioden wurden folgende Produktionsmengen x und Gesamtkosten y der Abteilung registriert: Periode i
1
2
3
4
5
Output xi Kosten yi
9 1.216
12 1.300
14 1.356
12 1.288
12 1.276
Periode i
6
7
8
9
10
Output xi Kosten yi
13 1.292
10 1.260
11 1.244
12 1.288
15 1.360
Die hierdurch definierte Regressionsgerade diene der Ermittlung von variablen Kosten (= Anstieg der Regressionsgeraden) und fixen Kosten (= absolutes Glied der Regressionsgeraden). Wie groß sind die variablen und die fixen Kosten?
Aufgabe 1.14 Eine empirische Untersuchung der Beschäftigtenzahl (= Merkmal X ) und prozentualen Fehlzeit (= Merkmal Y ) ergab für 30 Betriebe mit einer Beschäftigtenzahl zwischen 10 und 10.000 das Ergebnis, dass der Tendenz nach die prozentualen Fehlzeiten mit der Anzahl der Beschäftigten anwachsen. Das Ergebnis kann möglicherweise mit der Verringerung des Zusammengehörigkeitsgefühls bei wachsender Betriebsgröße begründet werden. Im Einzelnen wurden ermittelt: arithmetische Mittel xN D 800 und yN D 6;5 mittlere quadratische Abweichungen sx2 D 106 und sy2 D 1 ein Bravais-Pearson-Korrelationskoeffizient r D 0;6. a) Bestimmen Sie die Regressionsgerade. b) Mit welcher prozentualen Fehlzeit ist bei einem Großbetrieb mit 8.000 Beschäftigten zu rechnen?
8
Aufgaben zur deskriptiven Statistik
Aufgabe 1.15 Für 80 Gemeinden verschiedener Größe werden das monatliche Müllaufkommen (= Merkmal Y ) und die Anzahl der zu Monatsbeginn gemeldeten Einwohner (= Merkmal X ) einer linearen Regressionsanalyse unterzogen. Der Analytiker berechnet eine Regressionsgerade, die durch 79 der beobachteten Wertepaare .xi ; yi / verläuft. Lediglich .x80 ; y80 / liegt nicht auf der berechneten Regressionsgeraden. Muss zwangsläufig ein Rechenfehler vorliegen oder ist ein derartiger Befund bei empirischen Daten möglich?
Aufgabe 1.16 Für ein Unternehmen der Chemie-Branche wurde eine Regressionsanalyse mit dem Jahresumsatz als Regressand und den jeweiligen Vorjahresaufwendungen für Forschung und Entwicklung als Regressor durchgeführt. Es resultierte die Regressionsgerade y D 6 108 C 50x: Ferner betrug der mittlere Jahresumsatz 2;6 109 [€]. Wie hoch waren die mittleren F&E-Aufwendungen?
Aufgabe 1.17 Welche der folgenden Aussagen sind richtig, welche sind falsch? a) Je größer der Anstieg der Regressionsgeraden, desto größer ist der BravaisPearson-Korrelationskoeffizient. b) Ist der Anstieg der Regressionsgeraden positiv, so ist auch der BravaisPearson-Korrelationskoeffizient positiv. c) Scheinkorrelationen erkennt man daran, dass der Bestimmtheitskoeffizient außergewöhnlich hoch ist. d) Der Bestimmtheitskoeffizient ist umso größer, je steiler die Regressionsgerade ist. e) Der Bestimmtheitskoeffizient wird mit wachsender Anzahl der Beobachtungen größer. f) Der Bestimmtheitskoeffizient ist genau dann gleich 1, wenn alle Residuen gleich 0 sind.
Aufgaben zur deskriptiven Statistik
9
Aufgabe 1.18 In einer Großstadt wird (zum Zeitpunkt x D 0) ein flächendeckendes Netz von Wertstofftonnen installiert. Vermutlich wird der prozentuale Anteil (= Merkmal Y ) derjenigen Haushalte, die Batterien, Aluminium usw. zu diesen Tonnen bringen, im Verlaufe der Zeit (= Merkmal X ) monoton anwachsen. Versuchsweise wird das Anwachsen gemäß folgender Funktion y D 100 ae x ;
x0
modelliert, wobei a ein positiver Regressionsparameter ist, und x in Jahren zu messen ist. a) Welcher Wert aO ergibt sich für a nach dem Kleinst-Quadrate-Prinzip? b) Wie groß ist a, O wenn folgende Beobachtungen vorliegen? i xi yi
1
2
3
4
5
1 12
3 12
5 12
8 12
10
12
16
18
1 23
c) Gegeben seien wieder die empirischen Daten von b). Nach welcher Zeitspanne ist zu erwarten, dass 90 % aller Haushalte die Wertstofftonnen benutzen?
Aufgabe 1.19 Ein Aktienindex habe die Form einer gewichteten Summe von AktienkursMesszahlen. Das Gewicht ist jeweils proportional zum Grundkapital. Auf die 300 im Index berücksichtigten Aktiengesellschaften entfällt insgesamt ein Grundkapital von 1011 [€]. Der Aktienindex zeige folgende Reaktion: Bleibt der Kurs der Aktie Nr. 1 gleich und steigen alle restlichen Kurse um 10 %, so steigt der Index von 1 auf 1,099. Wie groß ist das Grundkapital der Aktiengesellschaft Nr. 1?
Aufgabe 1.20 Die Preisindexberechnung beruhe auf einem Warenkorb, der lediglich 7 Güter bzw. Dienstleistungen umfasse. Folgende Preise p0 .i/, p t .i/ bzw. Mengen q0 .i/, q t .i/ wurden registriert:
10
Aufgaben zur deskriptiven Statistik Gut bzw. Dienstleistung i Preis p0 .i/ Menge q0 .i/ Preis p t .i/ Menge q t .i/
1
2
3
4
5
6
7
5 100 6 100
2 120 3 130
1 100 1 112
6 80 7 75
1 100 2 110
1 300 1 280
3 100 2 90
L sowie den Preisindex a) Berechnen Sie den Preisindex von Laspeyres P0t P von Paasche P0t .
b) Fassen Sie die Güter 1; 2; 3 zu einer Gütergruppe 1 und die restlichen GüL ist dann als gewichter zu einer Gütergruppe 2 zusammen. Der Index P0t tete Summe der beiden Laspeyres-Subindizes darstellbar. Bestimmen Sie beide Subindizes, die Gewichte der einzelnen Güter in den Subindizes sowie die Gewichte, mit denen sich die Subindizes zum Gesamtindex zusammensetzen.
Aufgabe 1.21 Berechnen Sie unter Verwendung der Preis- und Mengendaten aus Aufgabe 1.20 a) den fisherschen Idealindex b) den Marshall-Edgeworth-Index.
Aufgabe 1.22 Bezeichnet q t .i/ die von einem bestimmten Land in der Periode t exportierte Menge von Gut i, so ist n X E t` D p t .i/q t .i/ iD1
der Wert des Exports, bewertet zu „laufenden Preisen“. Im Falle von Preissteigerungen ist die Zeitreihe E0` ; E1` ; E2` ; : : : beispielsweise inflationär aufgebläht; d.h. sie wächst schneller als die Zeitreihe E tk D
n X iD1
p0 .i/q t .i/;
t D 0; 1; 2; : : :
Aufgaben zur deskriptiven Statistik
11
der Exporte zu „konstanten Preisen“. Häufig versucht man deshalb, den Preiseffekt dadurch zu eliminieren, dass E t` durch einen geeigneten Deflator D t dividiert wird. Welchen Preisindex muss man als Deflator verwenden, damit die deflationierte Zeitreihe mit der Zeitreihe E tk übereinstimmt?
Aufgabe 1.23 Ein Mengenindex von Laspeyres beruhe auf den 6 wichtigsten Gütern eines Wirtschaftszweiges. Preise und Mengen sind folgender Tabelle zu entnehmen: Gut i
1
2
3
4
5
6
p0 .i/ q0 .i/ p t .i/ q t .i/
10 1.000 11 1.200
3 800 4 800
8 500 8 400
11 1.000 11 2.000
2 100 2 150
4 3.000 3 3.200
Um wieviel Prozent hat sich die Produktion des Wirtschaftszweiges (gemessen am Laspeyres-Mengenindex) gegenüber der Basisperiode verändert?
Aufgabe 1.24 Ein Unternehmen berechnete von 1982 bis 1985 für seine Erzeugnisse einen Preisindex zur Basis 1982. Da das Gewichtungsschema im Lauf der Jahre an Aktualität verloren hatte, wurde ab 1985 ein neuer Index zur Basis 1985 berechnet. Die Werte beider Indizes sind in der Tabelle Jahr
1982
1983
1984
1985
1986
1987
1988
alter Index neuer Index
100 –
108 –
111 –
120 100
– 105
– 109
– 118
zusammengefasst. Um die Preisentwicklung von 1982 bis 1988 in einer einheitlichen Indexreihe zusammenzufassen, soll eine Verknüpfung des alten mit dem neuen Index vorgenommen werden. a) Welche Indexreihe ergibt sich, wenn die zweite Reihe (= neuer Index) an die erste Reihe angeschlossen wird? b) Welche Indexreihe ergibt sich, wenn die erste Reihe an die zweite Reihe angeschlossen wird? c) Basieren Sie die bei a) berechnete Reihe auf die Basisperiode 1983 um.
12
Aufgaben zur deskriptiven Statistik
Aufgabe 1.25 Gleitende Durchschnitte werden unter anderem für Saisonbereinigungsverfahren benötigt. Berechnet man die gleitenden Durchschnitte durch direkte Anwendung der Definitionsgleichung, so werden relativ viele Additionen mehrfach durchgeführt. Rationeller ist es, so genannte Aufdatierungs-Formeln zu verwenden, die den Wert x tC1 des gleitenden Durchschnitts für die Periode t C 1 dadurch berechnen, dass zum Wert x t der Periode t ein geeigneter Korrektursummand hinzuaddiert wird. Für eine ungerade Ordnung 2k C 1 lautet die AufdatierungsFormel 1 .x t CkC1 x t k /; x tC1 D x t C 2k C 1 wie man sich direkt klarmachen kann, da der Zeitreihenwert x t k nicht mehr in die Berechnung von x tC1 eingeht und der Zeitreihenwert x t CkC1 neu berücksichtigt werden muss. Wie lautet die Aufdatierungs-Formel für eine gerade Ordnung 2k?
Aufgabe 1.26 Für die Mineralölimporte eines Industrielandes liege die folgende Zeitreihe y t von Halbjahresdaten vor: Jahr Halbjahr
1984 1. 2.
1985 1. 2.
1986 1. 2.
1987 1. 2.
1988 1. 2.
y t [Mio to]
50
56
58
54
60
40
46
48
48
52
Es werde das additive Zeitreihenmodell mit konstanter Saisonfigur unterstellt. Bilden Sie geeignete gleitende Durchschnitte und berechnen Sie die Saisonveränderungszahlen sowie die saisonbereinigte Zeitreihe.
Aufgaben zur deskriptiven Statistik
13
Aufgabe 1.27 Der stündliche Stromverbrauch (in MWh) einer Region werde als eine Zeitreihe mit konstanter Saisonfigur (und Saisonlänge 24) aufgefasst. In folgender Tabelle wurden die um die glatte Komponente bereinigten Werte eingetragen, die aus den verfügbaren Zeitreihendaten berechnet werden konnten: Stunde j
1
2
3
4
5
6
bereinigte Werte
-3 -5 -4
-2 -3 -1
-1 1 0
-1 0 -2
0 0 0
1 2 0
Stunde j
7
8
9
10
11
12
bereinigte Werte
3 1 2
3 2 1
2 2 2
1 1 1
0 -1 -2
2 2 2
Stunde j
13
14
15
16
17
18
bereinigte Werte
1 3 –
0 0 –
0 2 –
-1 -1 –
1 1 –
2 2 –
Stunde j
19
20
21
22
23
24
bereinigte Werte
1 1 –
1 -1 –
-1 -1 –
0 0 –
0 0 –
-1 -1 –
SQj SOj
SQj SOj
SQj SOj
SQj SOj
Tragen Sie in die freigelassenen Felder die nichtnormierten .SQj / sowie die normierten .SOj / stundentypischen Abweichungen ein.
14
Aufgaben zur deskriptiven Statistik
Aufgabe 1.28 Eine Zeitreihe monatlicher Absatzdaten liege (für die 60 Monate) vom Januar 1984 bis Dezember 1988 vor. Die Analyse zeige, dass die glatte Komponente folgende quadratische Funktion der Zeit ist (t D 1 entspricht Januar 1984 und t D 60 entspricht Dezember 1988): G t D 100 C 8t C 0;1t 2 : Als (konstante) Saisonfigur wurde ermittelt: Jan
Febr
März
Apr
Mai
Juni
40
50
30
30
0
10
Juli
Aug
Sept
Okt
Nov
Dez
50
80
50
10
-20
30
Die Werte der irregulären Komponente waren betragsmäßig stets kleiner als 20. Für 1989 wird nicht mit einem Strukturbruch gerechnet. In welchem Intervall liegt dann a) der Absatz für den Januar 1989 b) der Absatz für das erste Quartal 1989?
Aufgabe 1.29 Für einen typischen Winterartikel besitze die Zeitreihe der monatlichen Nachfrage eine Saisonkomponente, die als sinusförmig mit der Saisonlänge 12 (Monate) angenommen werden kann. Die Saisonfigur sei konstant, so dass man von folgender Formel 2 t Cc ; t D 1; 2; : : : S t D a sin b ausgehen kann. Die monatstypische Abweichung besitzt im Januar (d.h. t D 1; 13; 25; : : : ) eine eindeutige Maximalstelle; der Maximalwert beträgt 450.000 Stück. Berechnen Sie die drei Parameter a; b; c.
Aufgaben zur deskriptiven Statistik
15
Aufgabe 1.30 Bezüglich eines Importgutes liegt eine Zeitreihe y t vor, wobei y t den monatlichen Import, gemessen in 1.000 Tonnen, bedeutet. Die Monatsdaten y t setzen sich additiv aus einer glatten Komponente G t und einer Saisonkomponente S t zusammen. Die glatte Komponente G t wachse in jedem Monat um 2 Einheiten, d.h. um 2.000 Tonnen. Die Saisonkomponente sei in der Form 2 t S t D a sin 12 darstellbar. a) Man prüfe, ob die Saisonfigur konstant ist, die Saisonlänge ein Jahr beträgt, und die monatstypischen Abweichungen sich über das Jahr zu null summieren. b) Man berechne auf Grund der Angaben y1 D 15 die Importe im Monat t D 8.
und
y2 D 18;8
16
Lösungen zur deskriptiven Statistik
Lösungen zur Deskriptiven Statistik Lösung zu Aufgabe 1.1 Einem Winkel von 68 Grad entspricht ein Anteil von
68 360 ,
so dass
68 350 D 66;11 360 Milliarden Kilowattstunden Strom mittels Steinkohle erzeugt wurden.
Lösung zu Aufgabe 1.2 Eine Prozentzahl p entspricht einem Winkel von p 360; 100 so dass sich für obige vier Kategorien die Winkel 50 100
360 D 180;
25 100
360 D 90;
10 100
360 D 36;
15 100
360 D 54
ergeben. Die graphische Darstellung ist:
Einfamilien-Haus
ZweifamilienHaus
MehrfamilienHaus Eigentumswohnung
Kreissektorendiagramm
Lösungen zur deskriptiven Statistik
17
Lösung zu Aufgabe 1.3 a)
Klasse
[0;20)
[20;30)
[30;40)
[40;50)
[50;70)
Klassen5 10 11 12 12 häufigkeit Verfügen wir so über den Proportionalitätsfaktor, dass die Höhe des ersten Rechtecks 1 ist, so muss der Proportionalitätsfaktor gleich 4 sein, da Klassenbreite Höhe D 20 1 D Proportionalitätsfaktor 5: Damit sind die Höhen der restlichen Rechtecke so wie in der Figur festgelegt. 4,8 4,4 4
2,4 2 1 Bedienungszeit 20
30
40 50 Histogramm
70
b) Die geordnete Urliste ist 15 23 37 41 51
18 24 38 42 51
18 27 38 42 52
19 28 39 43 53
19 29 39 44 54
20 31 39 48 57
22 32 40 49 58
22 33 40 49 62
22 36 40 50 64
22 37 41 51 68
Der Modalwert ist 22. Der Median ist – da 50 eine gerade Zahl ist – durch xMed D
1 2
.39 C 39/ D 39
18
Lösungen zur deskriptiven Statistik gegeben. Das arithmetische Mittel ist schließlich xN D
1:917 D 38;34: 50
Bemerkung: Das Ordnen der Urliste macht bereits bei diesem bescheidenen Umfang von n D 50 relativ viel Aufwand. Für größere Urlisten ist ein EDVEinsatz unumgänglich.
Lösung zu Aufgabe 1.4 Die Häufigkeiten addieren sich zu n D 150. a)
F.7/ D F.8/ D
1 150 .10 C 15 110C20 D 130 150 150
C 30 C 30 C 25/ D
110 150
D 0;73
D 0;87
b) 1 F.x/ ist die relative Häufigkeit der Fälle, in denen mehr als x Paletten die Station innerhalb einer Zeiteinheit verlassen. 100 Œ1 F.x/ ist die gesuchte Darstellung. Für x D 7 ergibt sich speziell 110 D 26;67 %: 100 Œ1 F.7/ D 100 1 150
Lösung zu Aufgabe 1.5 Bezeichnet man wie in der Lösung von Aufgabe 11 die Startposition für den Kantinenmarsch mit x1 ; : : : ; x1:000 , sowie den Standort mit , so kann man die Lösung jeweils auf die bekannten Optimalitätseigenschaften der Lageparameter zurückführen. a) Die Wegstrecke des i-ten Beschäftigten beträgt für den Hin- und Rückweg 2 2jxi j, so dass er 1;3 jxi j Sekunden benötigt. Der Standort ist durch die Minimierung von 1:000 X 2 jxi j 1;3 iD1
2 für die Minimalstelle irrelebzgl. definiert. Da der konstante Term 1;3 vant ist, ergibt sich wiederum der Median ( D 600) als optimaler Standort.
Lösungen zur deskriptiven Statistik
19
b) Nun ist der Standort durch die Minimierung von 1:000 X
.xi /2
iD1
definiert. (Je nach Interpretation der Wegstrecke als Summe von Hin- und Rückweg oder als separat gezähltem Hinweg oder Rückweg bekommt man vor das Summenzeichen noch einen irrelevanten Faktor 4 bzw. 1.) Der optimale Standort ist D xN D
1 1:000
.3 0 C 200 100 C 300 600 C 497 900/ D 647;30:
c) Der Standort ist jetzt durch die Minimierung der Gesamtrüstzeit 30
1:000 X
s.xi ; /
iD1
mit
( 0; s.xi ; / D 1;
falls xi D (d.h. w D 0) falls xi ¤ (d.h. w > 0)
definiert und mit dem Modalwert xMod D 900 identisch.
Lösung zu Aufgabe 1.6 a) Die gesuchte Prozentzahl ergibt sich als 100 L.0;8/ D 100 0;85 D 32;77: b) Zuerst ist die Bedingung L.p/ D 0;2 nach p aufzulösen: p p 5 D 0;2 ) p D 5 0;2 D 0;7248; d.h. auf 72,48 % der geringerwertigen Positionen entfällt 20 % des gesamten Lagerwertes. Infolgedessen entfällt auf 27,52 % der höherwertigen Positionen 80 % des gesamten Lagerwertes.
20
Lösungen zur deskriptiven Statistik
Lösung zu Aufgabe 1.7 a)
AG
CR1
CR2
CR3
CR4
1 2 3
0,40 0,20 0,51
0,60 0,30 0,60
0,72 0,40 0,68
0,73 0,50 0,75
b) Gemessen an CR3 ist die Konzentration bei AG 1 am größten, gemessen an CR4 ist die Konzentration bei AG 3 am größten. c) Wir haben n D 10:000 Merkmalsträger mit den relativen Merkmalswerten 1 p1 D D p9:996 D 29:996 1 p9:997 D p9:998 D p9:999 D 10 ;
p10:000 D 15 :
Einsetzung in die Formel (19), GD
2
10:000 P i D1
liefert 2 29:996
9:996 P iD1
iC
2 10
ipi .nC1/ n
;
.9:997 C 9:998 C 9:999/ C
2 5
10:000 10:001
D 10:000 1 2 2 9:997 C 10 29:994 C 4:000 10:001 D 0;50 10:000 für den unnormierten Gini-Koeffizienten und (im Rahmen der Rundung) denselben Wert für den normierten Gini-Koeffizienten.
Lösung zu Aufgabe 1.8 a) Die Summe der Beitragssummen beträgt 1:200 107 [€], so dass sich folgende (aufsteigend geordnete) relative Merkmalswerte ergeben: p1 D D p7 D
5 ; 120
p8 D
15 ; 120
p9 D
20 ; 120
Die Lorenzkurve ist der Polygonzug, der die Punkte 500 700 350 ; 80I ; 90I ; .0I 0/; 70I 12 12 12 verbindet.
p10 D
50 : 120
.100I 100/
Lösungen zur deskriptiven Statistik
21
kumulierter prozentualer Marktanteil
100 80
60
40 20
kumulierter prozentualer 20 40 60 80 100 Anteil der Gesellschaften Lorenzkurve für den Versicherungsmarkt
b) Nach (19) erhalten wir GD
2 11 Œ5 .1 C C 7/ C 8 15 C 9 20 C 10 50 D 0;47 10 120 10
c) H D7 d)
ED
5 120
5 120
2
C
15 120
2
C
20 120
2
C
50 120
2
D 0;23
75 120 15 20 50 15 120 20 120 50 120 D 0;16 120 120 120
Lösung zu Aufgabe 1.9 a) Die angegebene Randhäufigkeit h2 D 60 ist die Summe der zweiten Spalte der Kontingenztabelle. Daraus folgt h22 D 60 10 25 D 25: Die noch fehlende Häufigkeit h14 muss sich mit den restlichen Häufigkeiten zu n D 200 addieren; hieraus ergibt sich h14 D 0. Die Randhäufigkeiten sind h1 D 50; h2 D 80; h3 D 60; h4 D 10 h1 D 90; h2 D 60; h3 D 30; h4 D 20:
22
Lösungen zur deskriptiven Statistik b) Im Fall der Unabhängigkeit müsste gelten hij D
hi hj : n
Prüfen wir dies beispielsweise für i D j D 1 nach, so ergibt sich h11 D 40 ¤
50 90 h1 h1 D D 22;5: n 200
Es liegt demnach keine Unabhängigkeit vor. Man könnte zur Untersuchung dieser Frage auch die Übereinstimmung bzw. NichtÜbereinstimmung von bedingten Verteilungen überprüfen. Die bedingte Verteilung auf die verschiedenen Berufsstände ist für Arbeitersöhne durch 4 4 1 ; ; ;0 9 9 9 gegeben und für Beamtensöhne durch die davon stark abweichende Verteilung 1 5 0; ; ; 0 : 6 6
Lösung zu Aufgabe 1.10 a) Aus den gegebenen Randhäufigkeiten sind die gemeinsamen Häufigkeiten wegen der Unabhängigkeit gemäß hij D
hi hj n
zu berechnen. Dies führt zur Kontingenztabelle ``` ``` ``Testergebnis ``` Haarfarbe ```
gut
mittel
schlecht
hi
blond braun schwarz
120 300 180
180 450 270
100 250 150
400 1.000 600
hj
600
900
500
2.000
b) Der Kontingenzkoeffizient ist natürlich gleich null, da die Chi-QuadratGröße nach Konstruktion der hij verschwindet.
Lösungen zur deskriptiven Statistik
23
Lösung zu Aufgabe 1.11 a) Identifizieren wir den FAZ-Index mit dem Merkmal X , so gilt xN D
2:968 D 371 8
und
61;6 D 7;7: 8 Die Berechnung des Bravais-Pearson-Korrelationskoeffizienten erfolgt in folgender Arbeitstabelle: yN D
i 1 2 3 4 5 6 7 8 P
xi xN .xi x/ N 2 yi yN .yi y/ N 2 .xi x/.y N i y/ N 150 120 25 5 30 50 100 110
22:500 14:400 625 25 900 2:500 10:000 12:100
2;0 0;2 0;9 0;5 0;4 0;6 0;7 0;9
4;0 0;04 0;81 0;25 0;16 0;36 0;49 0;81
300 24 22;5 2;5 12 30 70 99
0
63:050
0
6;92
560
Es ergibt sich 560 D 0;85: r D p 63:050 6;92 b) Die Rangziffern Ri ; R0i sowie ihre quadrierten Differenzen sind: Zeitpunkt i
1
2
3
4
5
6
7
Ri 8 7 6 0 Ri 1 3 2 0 2 .Ri Ri / 49 16 16
5 5 0
4 4 0
3 6 9
2 1 7 8 25 49
Damit erhält man rSP D 1
6 164 D 0;95: 789
8
24
Lösungen zur deskriptiven Statistik
Lösung zu Aufgabe 1.12 Es ist xN D
80 8
D 10, so dass man folgende Differenzen erhält: 1
t
2
x t xN 0 2 .x t x/ N 0
3
2 2 4 4
4
5
6
2 2 4 4
7
0 3 0 9
8
P
3 0 9 34
Daraus entnimmt man r0 r1 r2 r3 r4 r5 r6 r7
D1 (was stets gilt) 1 D 34 .0 4 4 4 C 0 C 0 9/ D 21 34 D 0;62 1 14 D 34 .0 C 4 C 4 C 0 C 6 C 0/ D 34 D 0;41 1 D 34 .0 4 C 0 6 6/ D 16 34 D 0;47 1 12 D 34 .0 C 0 C 6 C 6/ D 34 D 0;35 1 D 34 .0 6 6/ D 12 34 D 0;35 1 6 D 34 .0 C 6/ D 34 D 0;18 0 D 34 D 0:
Das Korrelogramm entspricht dem Stabdiagramm: 1
0;5
1
3
2 0;5
5 4
6
7
Time-Lag k
Korrelogramm
Bemerkung: In der Zeitreihenanalyse begnügt man sich vielfach nicht damit, die zeitlichen Abhängigkeiten der Reihe durch das Korrelogramm graphisch zu veranschaulichen. Es gibt zahlreiche rechnerische Prozeduren zur weiteren Auswertung des Korrelogramms. Exemplarisch sei auf das Lehrbuch Schlittgen/Streitberg [2001] hingewiesen.
Lösungen zur deskriptiven Statistik
25
Lösung zu Aufgabe 1.13 Die Lösung ergibt sich aus folgender Arbeitstabelle: xi xN .xi x/ N 2
yi
yi yN .xi x/.y N i y/ N
i
xi
1 2 3 4 5 6 7 8 9 10 P
9 12 14 12 12 13 10 11 12 15
3 0 2 0 0 1 2 1 0 3
9 0 4 0 0 1 4 1 0 9
1:216 1:300 1:356 1:288 1:276 1:292 1:260 1:244 1:288 1:360
72 12 68 0 12 4 28 44 0 72
216 0 136 0 0 4 56 44 0 216
120
0
28
12:880
0
672
O D 1:2882412 D 1:000. Es ist demnach xN D 12, yN D 1:288, bO D 672 28 D 24, a Die variablen Kosten betragen 24 und die fixen Kosten 1.000.
Lösung zu Aufgabe 1.14 a) Wegen bO D r
sy sx
erhält man bO D 0;6
1 D 0;0006 1:000
als Anstieg der Regressionsgeraden und aO D yN bO xN D 6;5 0;0006 800 D 6;02 als absolutes Glied. Die Regressionsgerade ist demnach y D 6;02 C 0;0006x: b) Für x D 8:000 errechnet man als „durch die Regression erklärten Wert“: yO D 6;02 C 0;0006 8:000 D 10;82 %:
26
Lösungen zur deskriptiven Statistik
Lösung zu Aufgabe 1.15 Die Koinzidenz der ersten 79 Beobachtungspaare mit der Regressionsgeraden bedeutet für die Residuen: uO 1 D uO 2 D D uO 79 D 0. Ferner ist nach Prämisse uO 80 ¤ 0, woraus 80 X
uO i D 0 C C 0 C uO 80 D uO 80 ¤ 0
iD1
folgt. Andererseits muss die Summe aller Residuen nach (37) null ergeben wegen n X
uO i D
iD1
n X
O i/ D .yi aO bx
iD1
n X
yi naO bO
n X
xi D n.yN aO bO x/ N D 0:
iD1
iD1
Folglich muss ein Rechenfehler vorliegen.
Lösung zu Aufgabe 1.16 Da jede Regressionsgerade durch .x; N y/ N verläuft, muss 2;6 109 D 6 108 C 50xN gelten, woraus sich für die mittleren F&E-Aufwendungen der Betrag von xN D 40:000:000 [€] berechnet.
Lösung zu Aufgabe 1.17 a) falsch b) richtig, wie man aus der Beziehung sy bO D r sx direkt ersehen kann c) falsch d) falsch
Lösungen zur deskriptiven Statistik
27
e) falsch. Beispielweise verläuft die Regressionsgerade im Falle von n D 2 Beobachtungspaaren durch beide Beobachtungspaare. R2 ist infolgedessen gleich 1. Bei Hinzunahme weiterer Beobachtungspaare sinkt R2 im Allgemeinen auf einen Wert kleiner als 1 ab. f) richtig, wie man aus der Darstellung n P
R2 D 1
n P
iD1
iD1
uO 2i
.yi y/ N 2
direkt ersehen kann.
Lösung zu Aufgabe 1.18 a) Das Kleinst-Quadrate-Prinzip besagt, dass Q.a/ D
n X Œyi .100 ae xi /2 iD1
bzgl. a minimiert werden muss. Wegen Q0 .a/ D 2
n X Œyi .100 ae xi / e xi iD1
Q00 .a/ D 2
n X
e 2xi > 0
iD1
erhält man durch Nullsetzen von Q0 .a/ die gesuchte Minimalstelle, nämlich n P .100 yi /e xi iD1 aO D : n P e 2xi iD1
b) Die gegebenen Daten führen zu aO D 121;21. c) In der Regressionsfunktion y D 100 121;21 e x
28
Lösungen zur deskriptiven Statistik ist y D 90 zu setzen und nach x aufzulösen. Die Auflösung liefert 10 D 2;49: x D ln 121;21 Eine 90-prozentige Akzeptanz wäre demnach nach 2,49 Jahren, d.h. nach knapp 30 Monaten, erreicht.
Lösung zu Aufgabe 1.19 Bezeichnet K.i/ das Grundkapital der Aktiengesellschaft Nr. i und p0 .i/ bzw. p t .i/ den Kurs der Aktie i in der Basis- bzw. Berichtsperiode, so hat der Aktienindex I die Form I0t D
300 X iD1
g.i/
p t .i/ p0 .i/
mit
g.i/ D
K.i/ 300 P j D1
D 1011 K.i/:
K.j /
Die unterstellte Reaktion bedeutet 1;099 D g.1/ C 1;1 Œ1 g.1/; woraus sich g.1/ D
1;1 1;099 D 0;01 1;1 1;0
und ein Grundkapital von K.1/ D 1011 g.1/ D 109 [€] ergibt.
Lösung zu Aufgabe 1.20 a) Gemäß Aggregatform erhält man: L D P0t
2:320 6 100 C 3 120 C C 1 300 C 2 100 D D 1;15 5 100 C 2 120 C C 1 300 C 3 100 2:020
P D P0t
2:307 6 100 C 3 130 C C 1 280 C 2 90 D D 1;16 5 100 C 2 130 C C 1 280 C 3 90 1:982
Lösungen zur deskriptiven Statistik b) Es gilt L D P0t
7 X
g0 .i/
iD1
D G1
29
p t .i/ p0 .i/
7 3 X X g0 .i/ p t .i/ g0 .i/ p t .i/ C G2 ; G1 p0 .i/ G2 p0 .i/ iD1
wobei G1 D
3 P iD1
iD4
g0 .i/ und G2 D
7 P iD4
g0 .i/ bedeuten.
Hieraus kann man Folgendes ablesen (vgl. (41)): Der zur Gütergruppe 1 gehörende Subindex ist 3 X
gQ 0 .i/
iD1
p t .i/ p0 .i/
mit gQ 0 .i/ D
g0 .i/ g0 .i/ D : 3 G1 P g0 .i/ iD1
Entsprechend ist 7 X iD4
mit
p t .i/ gQQ 0 .i/ p0 .i/
g0 .i/ g0 .i/ gQQ 0 .i/ D D 7 G2 P g0 .i/ iD4
der zur Gütergruppe 2 gehörende Subindex. Der Gesamtindex setzt sich aus diesen Subindizes unter Verwendung der Gewichte G1 D
3 X
g0 .i/
und
G2 D
iD1
7 X
g0 .i/
iD4
zusammen. Für die numerischen Daten ergibt sich speziell gQ 0 .1/ D
500 ; 840
gQ 0 .2/ D
240 ; 840
gQ 0 .3/ D
100 ; 840
480 100 300 300 ; gQQ 0 .5/ D ; gQQ 0 .6/ D ; gQQ 0 .7/ D : gQQ 0 .4/ D 1:180 1:180 1:180 1:180
30
Lösungen zur deskriptiven Statistik Der erste Subindex ist 240 3 100 1 500 6 C C D 1;26; 840 5 840 2 840 1 der zweite Subindex ist 100 2 300 1 300 2 480 7 C C C D 1;07: 1:180 6 1:180 1 1:180 1 1:180 3 Die Subindex-Gewichtung beträgt G1 D 1:180 2:020 für den zweiten Subindex.
840 2:020
für den ersten und G2 D
Lösung zu Aufgabe 1.21 a) Definitionsgemäß ist der fishersche Idealindex das geometrische Mittel aus dem Laspeyres- und dem Paasche-Index. Letztere wurden in Aufgabe 1.20 bereits berechnet, so dass sich (unter Verwendung der noch nicht gerundeten Zahlen) ergibt: r q 2:320 2:307 F L PP D D 1;15622: P0t D P0t 0t 2:020 1:982 b) Das Einsetzen in die Aggregatform 7 P ME P0t
D
iD1 7 P iD1
p t .i/ Œq0 .i/ C q t .i/ p0 .i/ Œq0 .i/ C q t .i/
liefert den Marshall-Edgeworth-Indexwert ME D P0t
4:627 6 200 C 3 250 C C 2 190 D D 1;15617: 5 200 C 2 250 C C 3 190 4:002
Lösungen zur deskriptiven Statistik
31
Lösung zu Aufgabe 1.22 Löst man die geforderte Gleichheit E t` D E tk Dt nach D t auf, so erhält man n P
Dt D
E t` E tk
D
iD1 n P iD1
p t .i/q t .i/ : p0 .i/q t .i/
Hieraus ersieht man, dass der Deflator mit dem Paasche-Index identisch sein muss, wobei der zu verwendende Warenkorb allerdings keine Verbrauchsgewohnheiten, sondern die jeweils exportierten Mengen widerspiegeln muss.
Lösung zu Aufgabe 1.23 Der Mengenindex von Laspeyres ist 6 P
QL 0t
D
iD1 6 P iD1
p0 .i/q t .i/ : p0 .i/q0 .i/
Die gegebenen Daten (die vorletzte Tabellenzeile ist natürlich irrelevant) führen zum numerischen Wert 10 1:200 C 3 800 C 8 400 C 11 2:000 C 2 150 C 4 3:200 10 1:000 C 3 800 C 8 500 C 11 1:000 C 2 100 C 4 3:000 52:700 D 1;3308: D 39:600
QL 0t D
Die Produktion wurde demnach um 33,08 % ausgeweitet.
32
Lösungen zur deskriptiven Statistik
Lösung zu Aufgabe 1.24 a) Alle Zahlen der zweiten Reihe müssen mit dem Faktor 120 D 1;2 100 multipliziert werden. Die resultierende einheitliche Reihe ist demnach 100I
108I
111I
120I
126I
b) Alle Zahlen der ersten Reihe müssen mit zum Ergebnis 83;3I
90I
92;5I
100I
100 120
130;8I
141;6:
multipliziert werden, was
105I
109I
118
führt. c) Alle Reihenglieder sind durch den Faktor 1;08 zu dividieren, so dass die Reihe 92;6I
100I
102;8I
111;1I
116;7I
121;1I
131;1
resultiert, die für das gewünschte neue Basisjahr (1983) den Wert 100 liefert.
Lösung zu Aufgabe 1.25 Die Aufdatierungs-Formel für eine gerade Ordnung 2k lautet x tC1 D x t C
1 .x t CkC1 x t k C x t Ck x t kC1 /: 2 2k
Die beiden ersten Terme in der eckigen Klammer entsprechen den neu hinzutretenden bzw. den wegfallenden Zeitreihenwerten (jeweils mit halbem Gewicht). Die beiden letzten Terme rühren davon her, dass der frühere Randwert x t Ck sein Gewicht verdoppelt (da er bzgl. der Periode t C 1 kein Randwert mehr ist), und dass der Zeitreihenwert x t kC1 Randwert wird und dadurch die Hälfte seines Gewichts verliert.
Lösungen zur deskriptiven Statistik
33
Lösung zu Aufgabe 1.26 Es sind gleitende Durchschnitte der Ordnung 2 zu bilden. Alle Ergebnisse und Zwischenergebnisse sind in folgenden Tabellen zu finden. Jahr Halbjahr
1984 1: 2:
1985 1: 2:
1986 1: 2:
1987 1: 2:
1988 1: 2:
93 99 105 102 110 103 104 105 y t 2 2 2 2 2 2 2 2 saisonber. 44,9 45,1 50,9 51,1 52,9 53,1 48,9 53,1 54,9 57,1 Zeitreihe
um die glatte Komponente bereinigte Werte 1. Halbjahr
2. Halbjahr
13 2
Das Korrekturglied beträgt
13 2 11 2 1 2
11 2 82
.5
6 2 92
41 8 /
SQj
SOj
10 2
5
41 8
81 16 81 16
D
D 5;1
1 D 16 .
Lösung zu Aufgabe 1.27 Stunde j SQj SOj Stunde j SQj SOj Stunde j SQj SOj Stunde j SQj SOj
1
2
3
4
5
4 2 0 1 0 4;25 2;25 0;25 1;25 0;25
6 1 0;75
7
8
9
10
11
12
2 1;75
2 1;75
2 1;75
1 0;75
1 1;25
2 1;75
13
14
15
16
17
18
2 1;75
0 0;25
1 0;75
1 1;25
1 0;75
2 1;75
19
20
21
22
23
24
0 1 0 0 1 0;25 1;25 0;25 0;25 1;25 24 P 1 6 Als Korrekturglied ergibt sich 24 SQj D 24 D 0;25. 1 0;75
j D1
5;1
34
Lösungen zur deskriptiven Statistik
Lösung zu Aufgabe 1.28 a) Für den Januar 1989 wird prognostiziert 100 C 8 61 C 0;1 612 40 ˙ 20 D 920;1 ˙ 20; d.h. eine Absatzzahl im Intervall .900;1I 940;1/. b) Analog ergibt sich durch Addition über die drei ersten Monate 3 100 C 8 .61 C 62 C 63/ C 0;1 .612 C 622 C 633 / .40 C 50 C 30/ ˙ 60; d.h. ein Quartalsabsatz im Intervall .2:761;4I 2:881;4/.
Lösung zu Aufgabe 1.29 Da die Sinusfunktion den Maximalwert 1 besitzt, muss a D 450:000 sein. Die beiden restlichen Parameter b und c sind dagegen noch nicht eindeutig bestimmt. Wegen der 2-Periodizität der Sinusfunktion folgt aus der Bedingung S t C12 D a sin
2 b
! .t C12/Cc D a sin 2 12 C 2 t Cc D a sin 2 t Cc D S t b b b
zunächst nur, dass 12 eine ganze Zahl sein muss. Dieser Forderung genügen zum b Beispiel die ganzen Zahlen b D ˙12;
˙6;
˙4;
˙3;
˙2;
˙1:
Jedes b ¤ ˙12 hat jedoch die Eigenschaft, dass die Saisonlänge kürzer als 12 (nämlich nur jbj) ist. So resultiert beispielsweise für b D 6 eine Saisonlänge 6, so dass sich für die Monate Januar (t D 1) und Juli (t D 7) gleich große monatstypische Abweichungen ergeben, was der gesetzten Prämisse natürlich widerspricht. Wählen wir b D 12, so erhält man wegen der Maximalstelle im Januar einen passenden c-Wert aus der Gleichung 2 12 1 C c D 2 . (Denn sin x wird für 2 maximal; addiert man auf der rechten Seite dieser Gleichung ein beliebiges ganzzahliges Vielfaches von 2, so erhält man ebenfalls passende c-Werte.) Die getroffene Auswahl der b; c-Parameter liefert demnach die folgende numerisch spezifizierte Saisonkomponente 2 S t D 450:000 sin t C : 12 3
Lösungen zur deskriptiven Statistik
35
Lösung zu Aufgabe 1.30 a) Wegen S t C12 D a sin
2 t C 2 12
D a sin
2 t 12
D St
liefern gleichnamige Monate dieselbe monatstypische Abweichung. Die Saisonfigur ist demnach konstant. Die Saisonlänge beträgt höchstens 1 Monate. Eine kürzere Saisonlänge ist jedoch nicht möglich, da die SinusFunktion die Periode 2 besitzt. Wegen sin x C sin.2 x/ D 0 gilt ferner S12t
2 2 t D a sin t D S t ; D a sin 2 12 12
so dass (wegen S6 D S12 D 0) die Normierung 12 X
S t D .S1 C S11 / C .S2 C S10 / C C .S5 C S7 / C S6 C S12 D 0
t D1
erfüllt ist. b) Nach Prämisse lässt sich die glatte Komponente in der Form G t D G0 C 2t darstellen. Wegen y1 D G0 C 2 C a sin 6 y2 D G0 C 4 C a sin 3 gilt
y2 y1 2 D 4;92 sin 3 sin 6 G0 D y1 2 a sin 6 D 10;54 aD
und somit
y8 D G0 C 16 C a sin 4 3 D 22;28:
Im Monat t D 8 werden 22.280 Tonnen importiert.
Teil II: Wahrscheinlichkeitsrechnung
Aufgaben zur Wahrscheinlichkeitsrechnung Aufgabe 2.1 Auf die Frage, wie er seine Aussichten beurteilt, die Statistik-Klausur zu bestehen, antwortet ein Student: „Wenn keine Aufgaben zur Wahrscheinlichkeitsrechnung vorkommen, werde ich die Klausur mit Sicherheit schaffen; andernfalls hängt es von den Aufgaben zur deskriptiven Statistik ab: Werden wenigstens drei Aufgaben zur deskriptiven Statistik gestellt – womit ich dann mit Wahrscheinlichkeit 0;5 rechne – schaffe ich die Klausur mit 90 % Sicherheit, andernfalls nur mit 70 % Sicherheit. Leider zeigt die Erfahrung, dass man mit Aufgaben zur Wahrscheinlichkeitsrechnung mit 95 % Sicherheit rechnen muss.“ Berechnen Sie die (subjektive) Wahrscheinlichkeit, dass der Student die Klausur besteht, a) bevor er die Klausur gesehen hat b) nachdem er sein Klausurexemplar erhalten hat und er als erstes diese Aufgabe aufschlägt.
38
Aufgaben zur Wahrscheinlichkeitsrechnung
Aufgabe 2.2 Ein Gegenstand (Koffer, Rad, Motorrad oder dgl.) werde durch ein Zahlenschloss gesichert. Es sei angenommen, dass ein Dieb höchstens eine Minute lang versucht, das Schloss durch Probieren zu öffnen. a) Das Zahlenschloss sei dreistellig; der Dieb probiere alle 3 Sekunden (rein zufällig) eine neue Kombination. Wie groß ist die Wahrscheinlichkeit, dass der Dieb erfolgreich ist? b) Das Zahlenschloss sei vierstellig; der Dieb benötige 4 Sekunden pro Kombination. Wie groß ist nun seine Erfolgwahrscheinlichkeit? c) Mit der Wahrscheinlichkeit 0,5 versuche (genau) ein Dieb, innerhalb der Nutzungsdauer des Gegenstands das Schloss zu öffnen. Mit der Wahrscheinlichkeit von 0,5 werde kein derartiger Versuch unternommen. Gelingt es dem Dieb, das Schloss zu öffnen, so entstehe ein Schaden von 1.000 [€]. Wie groß ist der Schadenserwartungswert bei Verwendung eines dreistelligen bzw. vierstelligen Zahlenschlosses?
Aufgabe 2.3* In der Natur stets vorkommende Alpha-Teilchen können in binären Speicherzellen Bit-Fehler verursachen. Der Fehlerkorrektur-Code des betrachteten Mikrocomputers habe die Eigenschaft, einen einzigen Bit-Fehler pro Wort mit Sicherheit korrigieren zu können. Sobald aber zwei (oder mehr) Bit-Fehler pro Wort vorliegen, produziert der Fehlerkorrektur-Code weitere Fehler, so dass man davon ausgehen kann, dass dann das betreffende Wort verfälscht wird. (Dass mehrmals die gleiche Speicherzelle getroffen wird, sei vernachlässigbar). Es werde angenommen, dass im relevanten Zeitraum im gesamten Mikrocomputerspeicher, der N Binärzellen umfasse, a Bit-Fehler vorkommen. Die Wortlänge betrage (inkl. der erforderlichen Paritätsbits) k Speicherzellen, wobei Nk ganzzahlig sei. a) Wie groß ist die Wahrscheinlichkeit dafür, dass kein Wort (unkorrigierbar) verfälscht wird? b) Setzen Sie speziell k D 25 und a D 3 und berechnen Sie die Wahrscheinlichkeit dafür, dass jedes Wort eines 128 Kilobyte-Speichers unverfälscht bleibt.
Aufgaben zur Wahrscheinlichkeitsrechnung
39
Aufgabe 2.4 Erfahrungsgemäß variiert für jede Krankheit die Erkrankungshäufigkeit von Region zu Region. Von einem pro Krankheit festgelegten Schwellenwert (für die Erkrankungshäufigkeit) sei bekannt, dass er nur in p % aller Regionen überschritten wird. Im Falle des Überschreitens werde von einer „besorgniserregenden Häufung“ gesprochen. Es gebe k relevante Krankheiten, die bzgl. ihrer Erkrankungshäufigkeit als unabhängig gelten können. Nun werde eine Region zufällig ausgewählt und die Erkrankungshäufigkeit der k Krankheiten dort erhoben. Eine Pressemitteilung über die „besorgniserregende Häufung in dieser Region“ wird dann veranlasst, wenn mindestens einer der k Schwellenwerte überschritten ist. a) Mit welcher Wahrscheinlichkeit wird eine Pressemitteilung veranlasst? b) Wie groß ist diese Wahrscheinlichkeit, wenn pD1
und
k D 120
betragen?
Aufgabe 2.5 Ein Gerät werde aus 35 Einzelteilen montiert und funktioniere genau dann, wenn alle 35 Einzelteile einwandfrei sind. Sobald mindestens ein Einzelteil defekt ist, ist das Gerät ein Ausschussstück. Bei den Einzelteilen handelt es sich teils um fremdbezogene Teile und teils um selbst hergestellte Zwischenprodukte. Die fremdbezogenen Einzelteile haben einen Ausschussanteil von pf D 1 %, während die selbst produzierten Einzelteile nur einen Ausschussanteil von ps D 0;1 % aufweisen. Das Gerät enthalte 10 fremdbezogene und 25 selbst produzierte Einzelteile. Wie groß ist (bei geeigneter Unabhängigkeitsprämisse) die Ausschusswahrscheinlichkeit für die produzierten Geräte?
Aufgabe 2.6 In einer Branche stellen 90 % aller neu konzipierten Produkte Flops dar. Selbst wenn man die Entscheidung über die Massenherstellung vom Ergebnis einer Testmarktuntersuchung abhängig macht, sind Fehlentscheidungen nicht ausgeschlossen.
40
Aufgaben zur Wahrscheinlichkeitsrechnung
Die bisher gemachten Erfahrungen sind dem folgenden Ereignisbaum zu entnehmen: Produkt . . .
Testmarkt-Resultat . . .
0,70 Erfolg
0,10
0,20
0,10
0,20
0,90 Flop
0,30
0,50
gut mittel schlecht gut mittel schlecht
Ereignisbaum Ein Produkt hat ein gutes Testmarktresultat erzielt. Mit welcher Wahrscheinlichkeit handelt es sich dennoch um einen Flop?
Aufgabe 2.7 Ein mittelständisches Maschinenbau-Unternehmen importiert elektronische Bausteine aus Fernost. Die Eingangskontrolle der Lose sei eine Gut-SchlechtPrüfung auf Stichprobenbasis: Es werden n Stück jedes Loses geprüft und ein Los genau dann angenommen, wenn alle geprüften Stücke gut sind. Für die Weiterverwendung der elektronischen Bausteine wäre zwar ein Schlechtanteil von p D 0 % ideal. Er ist jedoch äußerst unrealistisch und im Übrigen durch keinerlei Stichprobenkontrolle zu gewährleisten. In Anbetracht der gegebenen Umstände gelte ein Schlechtanteil von p D 1 % als akzeptabel und ein Schlechtanteil von p D 3 % bereits als inakzeptabel. Versuchen Sie, den Stichprobenumfang n so zu bestimmen, dass die Annahmewahrscheinlichkeit eines akzeptablen Loses (mit p D 1 %) und die Ablehnwahrscheinlichkeit eines inakzeptablen Loses (mit p D 3 %) jeweils mindestens 90 % betragen. Hinweis: Man nehme den Umfang N eines Loses so groß an, dass die Stichprobe wie eine Stichprobe mit Zurücklegen behandelt werden kann.
Aufgaben zur Wahrscheinlichkeitsrechnung
41
Aufgabe 2.8 In einem Fußballturnier sind nur noch die vier Mannschaften A; B; C und D im Wettbewerb. Der weitere Turnierverlauf ist folgendermaßen festgelegt: Zunächst spielen im Halbfinale A gegen B (Spiel 1) und C gegen D (Spiel 2). Die beiden Verlierer der Spiele 1 und 2 spielen anschließend um den 3. bzw. 4. Platz (Spiel 3); die beiden Sieger der Spiele 1 und 2 schließlich ermitteln im Endspiel (Spiel 4) die Plätze 1 und 2. Bei jedem einzelnen Spiel sind nur die Spielausgänge „Sieg“ oder „Niederlage“ zu betrachten (denn gegebenenfalls sind Verlängerung, Elfmeterschießen bzw. Losentscheid vorgesehen). Der Trainer der Mannschaft D setzt folgende (subjektiven) Wahrscheinlichkeiten dafür an, dass seine Mannschaft in einem Spiel gegen A; B bzw. C gewinnt: Spiel gegen
A
B
C
Wahrscheinlichkeit, dass D gewinnt
0;6
0;5
0;7
Ferner rechnet er mit Wahrscheinlichkeit 0;4 damit, dass A gegen B gewinnt. (Jede dieser Wahrscheinlichkeiten gelte unabhängig von eintretenden Ergebnissen anderer Spiele.) Berechnen Sie aus der Sicht des Trainers von D die Wahrscheinlichkeit, dass a) D ins Endspiel kommt b) D und A ins Endspiel kommen c) D und A ins Endspiel kommen, und D dieses gewinnt d) D im Turnier den i-ten Platz belegt, für i D 1; 2; 3 und 4.
Aufgabe 2.9* Eine Unternehmung platziert in 4 von 10 Heften einer Zeitschrift eine Werbebotschaft für ihr neues Produkt. Ein potenzieller Käufer dieses Produkts lese 3 der 10 Hefte. a) Wie groß ist die Wahrscheinlichkeit, dass ein potenzieller Käufer genau j (j D 0; 1; 2; 3) Hefte mit der Werbebotschaft liest? b) Die Wahrscheinlichkeit, dass ein Leser eines Heftes mit platzierter Werbebotschaft die Werbebotschaft bewusst registriert, sei 0,5 (unabhängig davon, ob er bei einem anderen Heft die Werbebotschaft bewusst registriert hat). Eine Kaufentscheidung werde umso wahrscheinlicher, je häu-
42
Aufgaben zur Wahrscheinlichkeitsrechnung figer die Werbebotschaft bewusst registriert wird. Aus empirischen Daten wurde entnommen P .Kaufentscheidung j Ai / D
i ; 10
.i D 0; 1; 2; 3/
wobei Ai das Ereignis bedeutet, dass der potenzielle Käufer die Werbebotschaft genau i-mal bewusst registriert hat. Mit welcher Wahrscheinlichkeit kommt es zur Kaufentscheidung? c) Wird anstelle der ganzseitigen Werbebotschaft jeweils eine (preisgünstigere) halbseitige Werbebotschaft platziert, so sinke die Wahrscheinlichkeit, dass sie beim Lesen des Hefts bewusst registriert wird, um die Hälfte, d.h. auf 0,25. Halbiert sich damit auch die Kaufwahrscheinlichkeit?
Aufgabe 2.10 Eine Versicherungsgesellschaft verlangt als Prämie das 1,3-fache des Erwartungswertes ihrer Zahlungen an den Versicherungsnehmer. Es werden einjährige Lebensversicherungen des Typs betrachtet: Der Betrag von 100.000 [€] ist zu zahlen, wenn der Versicherungsnehmer innerhalb eines Jahres nach Abschluss des Vertrages stirbt. Im Erlebensfall ist keine Zahlung zu leisten. Die (einjährige) Sterbewahrscheinlichkeit betrage 0,006. a) Wie hoch ist die Prämie für einen derartigen Vertrag? b) Welches ist der Drei-Sigma-Bereich des aus einem Vertrag resultierenden Gewinns G? c) Die Versicherungsgesellschaft schließe 50.000 derartige Verträge ab. Bestimmen Sie den Drei-Sigma-Bereich des Gesamtgewinns G1 C G2 C C G50:000 ; der aus diesen Verträgen resultiert. Hinweis: Unabhängigkeit der Gi sei vorausgesetzt.
Aufgaben zur Wahrscheinlichkeitsrechnung
43
Aufgabe 2.11 Sei GK D EK C FK das Gesamtkapital einer Unternehmung, EK das Eigenkapital, FK das aufgenommene Fremdkapital sowie v D FK=EK der entsprechende Verschuldungsgrad. Die Gesamtkapitalrendite X sei eine Zufallsvariable mit E.X / D 0;08 und der Standardabweichung 0,02. Der für das Fremdkapital zu zahlende Zinssatz betrage 0,06. Ferner sei der Verschuldungsgrad v D 2. a) Bestimmen Sie den Erwartungswert und die Standardabweichung der Eigenkapitalrendite Y . b) Die Gesamtkapitalrendite X sei stetig und symmetrisch um 0,08 verteilt. Mit welcher Wahrscheinlichkeit beträgt die Eigenkapitalrendite mindestens 12 %?
Aufgabe 2.12 Eine Kommanditgesellschaft bestehe aus 5 Kommanditisten und einem Komplementär. Die KG macht pro Jahr einen Gewinn X mit einem Erwartungswert und einer Standardabweichung in Höhe von p Var.X / D 100:000: E.X / D 1:200:000 und Der Komplementär erhält den dreifachen Gewinnanteil eines Kommanditisten. Er hat einen (konstanten) Grenzsteuersatz von 56 %, während die Kommanditisten jeweils mit einem (konstanten) Grenzsteuersatz von 45 % besteuert werden. Bestimmen Sie den Erwartungswert und den Zwei-Sigma-Bereich des JahresNettoeinkommens für a) jeden der Kommanditisten b) den Komplementär.
44
Aufgaben zur Wahrscheinlichkeitsrechnung
Aufgabe 2.13 Eine Versicherungsgesellschaft versichert den Sportstar B gegen Tod und Invalidität. Die mit einer Police verbundene (und von der Versicherungsgesellschaft zu leistende) Zahlung X habe folgende Wahrscheinlichkeitsverteilung: P .X D 0/ D 0;970;
P .X D 105 / D 0;025;
P .X D 106 / D 0;005:
Welche Prämie muss die Versicherungsgesellschaft als Preis für den von ihr gewährten Versicherungsschutz kalkulieren, wenn sie sich am a) Erwartungswertprinzip mit einem 20-prozentigen Zuschlag, d.h. an D 1;2 E.X /; b) Standardabweichungsprinzip in der speziellen Variante p 1 Var.X / D E.X / C 20 orientiert?
Aufgabe 2.14 Eine Unternehmung hat 2.000 Beschäftigte mit einem durchschnittlichen Jahreslohn von 40.000 [€]. Der von der Unternehmung erwirtschaftete Jahresüberschuss vor Lohnzahlungen sei mit X bezeichnet. Er wird von zahlreichen risikobehafteten Faktoren (Inputpreisen, Outputpreisen, Wechselkursen, Produktivitäten usw.) beeinflusst und ist – vom Jahresanfang aus beurteilt – als Zufallsvariable anzusehen. Der Gewinn G D X 2:000 40:000 ist demnach ebenfalls risikobehaftet. Es sei E.X / D 112 Mio [€]. a) Ermitteln Sie den Erwartungswert und die Varianz des Gewinns. b) Nun werde folgendes Beteiligungsmodell betrachtet: Jeder Arbeitnehmer bekommt einen um 10 % gekürzten Fixlohn, dafür aber 20 % des Überschusses, der nach Zahlung des Fixlohnbestandteils übrigbleibt. Berechnen Sie nun den Gewinnerwartungswert und die Gewinnvarianz. Vergleichen Sie insbesondere die in a) und b) ermittelten Varianzen.
Aufgaben zur Wahrscheinlichkeitsrechnung
45
Aufgabe 2.15 In der Finanzierungs- und Portfolio-Theorie wird die Verwendung der Varianz als Risikokennziffer einer stochastischen Rendite X deshalb kritisiert, weil Renditeschwankungen nach oben und nach unten einen gleichberechtigten Beitrag zur Varianz leisten. Im Lichte dieser Kritik eignet sich die Semivarianz bzgl. eines Referenzpunkts t besser als Risikokennziffer. Diese ist im stetigen Fall als Z t .x t/2 f .x/ dx 1
bzw. im diskreten Fall als X
.x t/2 f .x/
xW x 5:000
angesehen werden. a) Der Automat werde mit 50.000 [€] gefüllt. Mit welcher Wahrscheinlichkeit deckt dieser Betrag die Nachfrage nicht? b) Wie groß ist die mittlere Nachfrage E.X /?
Aufgabe 2.27 Auf Grund bereits gelieferter und in der Planungsperiode zu produzierender Waren sowie auf Grund der Zahlungsgewohnheiten ihrer Kunden rechnet eine Unternehmung mit Einzahlungsüberschüssen X , die mindestens a D 1 106 [€] und höchstens b D 3 106 [€] betragen werden. Innerhalb dieses Intervalls gelte die Wahrscheinlichkeitsdichte f .x/ D
3 1018 .x a/.b x/: 4
Die Unternehmung sei bei ihrer Hausbank mit 3 Mio [€] verschuldet. Die Hausbank verlangt, dass der Schuldenstand bis zum Ende der Periode halbiert wird. Mit welcher Wahrscheinlichkeit verfehlt die Unternehmung dieses Ziel?
Aufgabe 2.28 Bei (Aktien-)Optionspreismodellen wird der Kurs X der zu Grunde liegenden Aktie am Ende der Optionsfrist meist als logarithmisch normalverteilt angenommen; d.h. man unterstellt (wofür theoretische und empirische Argumente sprechen), dass die Zufallsvariable Y D ln X normalverteilt ist. Die Parameter und dieser Normalverteilung hängen von der Laufzeit der Option und von der aktientypischen Volatilität ab. Erstellen Sie die Dichtefunktion f von X .
Aufgaben zur Wahrscheinlichkeitsrechnung
51
Aufgabe 2.29 Getreu der Just-in-Time-Devise, gemäß der die Zulieferer flexibel und kurzfristig reagieren sollen, hält ein PKW-Produzent nur eine geringe Anzahl von Anlassern auf Lager. Bei Bedarf wird dem Zulieferer eine telefonische Order übermittelt. Spätestens 10 Stunden nach der Bestellung sind die Anlasser dann im PKW-Werk. Innerhalb dieser 10 Stunden schwankt die Lieferfrist X gemäß der Dichtefunktion ( 1 x für 0 x 10 f .x/ D 5 50 0 sonst Berechnen Sie a) den Erwartungswert, b) die Standardabweichung, c) den Median, d) das 90 %-Fraktil der Lieferfrist.
Aufgabe 2.30 Das monatliche Einkommen betrage mindestens x0 Geldeinheiten, wobei x0 durch Tarifverträge, das soziale Netz und dergleichen bestimmt wird. Zur approximativen Beschreibung der Einkommensverteilung wird häufig eine Dichtefunktion der Form ( c für x x0 f .x/ D x˛C1 0 sonst benutzt, wobei ˛ ein positiver vorgegebener Parameter und c eine noch zu bestimmende Normierungskonstante ist. a) Bestimmen Sie c. b) Bestimmen Sie die Verteilungsfunktion F des Einkommens X . c) Setzen Sie speziell ˛ D 1 sowie x0 D 1:000 [€] und berechnen Sie die bedingte Wahrscheinlichkeit P .X > 10:000 j X 5:000/; d.h. den Anteil derjenigen unter den mindestens 5.000 [€] Verdienenden, die sogar über 10.000 [€] verdienen.
52
Aufgaben zur Wahrscheinlichkeitsrechnung
Aufgabe 2.31 Für manche Leistungen (z.B. Entwicklungsprojekte militärischer oder ziviler Art) gibt es keinen vollkommenen Markt und damit keinen Marktpreis. Ersetzt der Auftraggeber dem Auftragnehmer vereinbarungsgemäß alle Kosten, so besteht kein Anreiz zur Kostenkontrolle. Es werden deshalb Anreizverträge verwendet, bei denen der Gewinn g des Auftragnehmers von der Überschreitung bzw. Unterschreitung der (bilateral auszuhandelnden) Zielkosten cO abhängt: g D gO C p.cO c/: Dabei sind gO der Zielgewinn, c die tatsächlichen Kosten, und p ein Anteilswert zwischen 0 und 1 mit der Bedeutung: Überschreiten die tatsächlichen Kosten c die Zielkosten um eine Geldeinheit, so schmälert dies den Gewinn des Auftragnehmers um p Geldeinheiten. Die drei Parameter g, O cO und p sind Bestandteil des Anreizvertrages. a) Die Kosten C seien eine über dem Intervall Œ1 107 I 2 107 gleichverteilte Zufallsvariable. Welche Verteilung besitzt der Gewinn G? b) Setzen Sie zusätzlich gO D 106 ;
cO D 1;6 107 ;
p D 0;30:
Mit welcher Wahrscheinlichkeit wird dann der Gewinn negativ? Mit welcher Wahrscheinlichkeit beträgt er über 2 Millionen?
Aufgabe 2.32 Die monatliche Nachfrage X nach einem bestimmten Artikel sei zufallsabhängig und besitze die Dichtefunktion f .x/ D
2 2 106 x 109 x 2 3 9
mit 0 x 3:000:
Mehr als 3.000 Stück werden sicher nicht nachgefragt. a) Berechnen Sie die erwartete Nachfrage E.X / sowie den Modalwert der Nachfrage. b) Der zu Monatsbeginn festgestellte Lagerbestand betrage 2.000 Stück. Von Lagerzugängen infolge Produktion oder Bestellung sei abgesehen. Mit welcher Wahrscheinlichkeit kann die Nachfrage befriedigt werden?
Aufgaben zur Wahrscheinlichkeitsrechnung
53
Aufgabe 2.33* Eine Firma kauft ein Spezialgerät, das am Ende der Planungsperiode veräußert werden soll, auf Kredit. Der Kreditbetrag von 500.000 [€] ist mit 8 % zu verzinsen (Planungsperiode D Zinsperiode) und am Ende der Periode zu tilgen. Die Einzahlungen Z für die mittels des Spezialgerätes erbrachten Leistungen erfolgen (der Einfachheit halber) ebenfalls am Periodenende. Sowohl Z als auch der Restwert R seien zufallsabhängig und jeweils über dem Intervall Œ250:000I 350:000 gleichverteilt. Schließlich seien Z und R unabhängig. a) Bestimmen Sie die Verteilungsfunktion des aus diesen Aktivitäten resultierenden Gewinns. b) Mit welcher Wahrscheinlichkeit beträgt der Gewinn mehr als 100.000 [€]?
Aufgabe 2.34 Es sei T .x/ die bei einem Jahreseinkommen x zu entrichtende Steuerschuld. T .x/ sei ein Progressionstarif, d.h. T .x/ sei eine konvexe Funktion. Herr Müller stehe vor der Wahl, sich selbstständig zu machen, wobei sein Jahreseinkommen X risikoabhängig wird, oder seinen Angestelltenstatus mit dem festen Jahresgehalt in Höhe von E.X / beizubehalten. Wie wird er sich entscheiden, wenn er sich am erwarteten Nettoeinkommen orientiert? Hinweis: Man verwende die jensensche Ungleichung.
Aufgabe 2.35 Bei der Herstellung von kohlefaserverstärkten Wellen gelten alle Wellen als Ausschuss, die um mehr als 1 mm vom Sollmaß von 90 mm Länge abweichen. Die produktionsbedingt schwankende Länge X hat den Erwartungswert 90 mm und die Standardabweichung 0,15 mm. Schätzen Sie mittels der tschebyscheffschen Ungleichung ab, wie groß die Ausschusswahrscheinlichkeit höchstens sein kann.
54
Aufgaben zur Wahrscheinlichkeitsrechnung
Aufgabe 2.36 Ein Anleger verfügt am Periodenbeginn über 100.000 [€]. Er investiert 60.000 [€] in eine Anlagemöglichkeit, die eine zufallsabhängige Rendite X besitzt; d.h. aus den 60.000 [€] werden am Periodenende 60:000 .1 C X / [€]. Die restlichen 40.000 [€] legt er zur stochastischen Rendite Y an. Es seien E.X / D 0;08; Var.X / D
E.Y / D 0;06;
0;022 ;
Var.Y / D 0;012 :
Berechnen Sie den Erwartungswert und den Drei-Sigma-Bereich des Periodenendvermögens Z unter der Prämisse, dass X und Y a) unabhängige Zufallsvariablen sind b) den Korrelationskoeffizienten 0;3 besitzen.
Aufgabe 2.37 Für ein bestimmtes Produkt bezeichne x die Absatzmenge in der Planungsperiode, p den Preis pro Einheit, c die variablen Kosten pro Einheit und k die Fixkosten. Aus der Gewinnfunktion g.x/ D .p c/x k ergibt sich der Break-Even-Punkt x D
k : pc
Als Preis wird p D 10 als am Markt durchsetzbar erachtet. Die von Expertenteams geschätzten Wahrscheinlichkeitsverteilungen für die variablen und fixen Kosten lassen sich folgendermaßen beschreiben: P .C D 5/ D P .C D 6/ D P .C D 7/ D 13 ; P .K D 100:000/ D 34 ;
P .K D 120:000/ D 14 :
a) Berechnen Sie unter der Voraussetzung, dass diese Zufallsvariablen unabhängig sind, die Verteilung des Deckungsbeitrags pro Produkteinheit sowie die Verteilung des Break-Even-Punktes.
Aufgaben zur Wahrscheinlichkeitsrechnung
55
b) Sowohl die fixen als auch die variablen Kosten werden von einigen gemeinsamen Faktoren, deren Entwicklung schwierig zu prognostizieren ist, bestimmt. Die Planungsabteilung bleibt zwar bei obigen (Rand-)Wahrscheinlichkeiten, ist jedoch der Ansicht, dass die beiden Kostenarten positiv korreliert sind. Es wird versucht, diese positive Korrelation durch die Forderung zu erfassen, dass die beiden Ereignisse .K D 100:000 und C D 5/;
.K D 120:000 und C D 7/
jeweils doppelt so wahrscheinlich wie unter der Unabhängigkeitsprämisse sind. Ist dieser Ansatz mit den Regeln der Wahrscheinlichkeitsrechnung verträglich?
Aufgabe 2.38 Von einem Produktionsprozess ist bekannt, dass der Ausschussanteil 5 %, der Anteil zweiter Wahl 15 % und der Anteil erster Wahl 80 % beträgt. Wie groß ist die Wahrscheinlichkeit dafür, dass unter 10 geprüften Stücken n1 D 7 erster Wahl;
n2 D 2 zweiter Wahl;
n3 D 1 Ausschuss
sind?
Aufgabe 2.39 Die angehenden Diplom-Ökonomen A und B müssen in getrennten Hörsälen dieselbe Statistik-Klausur schreiben. Die Klausur ist vierstündig und beginnt um 1200 Uhr. Auf die Vorbereitung des Stoffs verwenden A und B nur wenig Zeit. Die eingesparte Zeit nutzen sie für fachfremde Recherchen. Es gelingt ihnen zu erkunden, dass nicht genügend Aufsichtspersonen zur Verfügung stehen werden, um auch den (beiden Hörsälen gemeinsamen) Toilettenraum separat zu überwachen. Sie beschließen, sich dort gegen 1500 Uhr zwecks Vergleich von Ergebnissen und Austausch von Inspirationen zu treffen. Genauer vereinbaren sie: Jeder solle innerhalb des 10-Minuten-Intervalls von 1455 bis 1505 versuchen, bei seiner Aufsicht eine Auszeit zu erwirken und im Toilettenraum gegebenenfalls bis zu 3 Minuten (längstens jedoch bis 1505 ) auf den anderen Kommilitonen zu warten. A und B sind der Ansicht, dass sie eine 60 %-Chance haben, sich zu treffen. Liegen sie mit ihrer Vermutung richtig? Zur Beantwortung gehe man davon aus, dass die beiden Ankunftszeiten jeweils über dem betreffenden 10-Minuten-Intervall gleichverteilt und unabhängig sind.
56
Aufgaben zur Wahrscheinlichkeitsrechnung
Aufgabe 2.40* Ein produktionsbedingtes Risiko soll bei einem Industrie-Versicherer versichert werden. Die Schadenshöhe X folgt einer Exponentialverteilung mit dem Erwartungswert E.X / D 2 106 [€]. Die Police sieht einen Selbstbehalt von 10.000 [€] vor. a) Bestimmen Sie die Verteilungsfunktion F der von dem IndustrieVersicherer zu leistenden Schadenszahlung Y . Ist Y stetig oder diskret verteilt? b) Der Industrie-Versicherer fungiere als Erstversicherer und schließe eine Police mit einem Rückversicherer ab. Diese Police sieht vor, dass der Erstversicherer nur Schäden x bis zu einer Höhe von 4 106 [€] allein regulieren muss. Bei allen darüber hinausgehenden Schäden x fällt die Differenz z D x 4 106 zu Lasten des Rückversicherers (sog. Schadenexzedentenvertrag). Bestimmen Sie die bedingte Wahrscheinlichkeit P .Z 107 j Z > 0/ sowie die nun gültige Verteilungsfunktion von Y . Skizzieren Sie die Verteilungsfunktion von Y .
Aufgabe 2.41 Man betrachte die Klausurergebnisse in Mathematik (Zufallsvariable X ) und Statistik (Zufallsvariable Y ). Die gemeinsame Wahrscheinlichkeitsfunktion f der zweidimensionalen Zufallsvariablen .X; Y / wurde durch Auswertung der Klausurergebnisse von Studenten eines WIWI-Fachbereichs geschätzt und in die folgende Tabellenform gebracht: HH y HH x H H
1
2
3
4
5
1 2 3 4 5
0,04 0,04 0,02 0,01 0,0
0,03 0,1 0,08 0,02 0,01
0,02 0,03 0,2 0,04 0,03
0,01 0,02 0,08 0,1 0,03
0,0 0,01 0,02 0,03 0,03
Aufgaben zur Wahrscheinlichkeitsrechnung
57
a) Man bestimme die Wahrscheinlichkeiten in Mathematik zu bestehen (d.h. eine Note 4 zu erreichen) und in Statistik nicht zu bestehen in beiden Klausuren zu bestehen in beiden Klausuren nicht zu bestehen in beiden Klausuren besser als 3 zu erhalten in beiden Klausuren zwischen 2 und 4 (inclusive) zu erreichen. b) Man gebe die Randwahrscheinlichkeits- und Randverteilungsfunktion an. c) Sind die beiden Zufallsvariablen unabhängig? d) In Mathematik erzielen Beate, Peter, Helga und Bernd die Noten 1; 2; 3 und 4. Wie sehen für diese vier Kandidaten die „Notenchancen“ bei der Statistik-Klausur aus? e) Das Bestehen bzw. Nichtbestehen werde vermöge der Indikatorvariablen ( ( 1; falls X 4 1; falls Y 4 XQ D und YQ D 0; falls X D 5 0; falls Y D 5 erfasst. Berechnen Sie die gemeinsame Wahrscheinlichkeitsfunktion der zweidimensionalen Zufallsvariablen .XQ ; YQ /.
Aufgabe 2.42* Auf Grund der technischen Gegebenheiten und der einschlägigen Vorschriften errechnet man für eine projektierte Ski-Seilbahn eine zulässige Zuladung von 12.900 [kg] pro Gondel. Für die Umsetzung in eine zulässige Personenanzahl gehe man davon aus, dass für das Personengewicht X und das Gewicht Y der Skiausrüstung gelte E.X / D 75, Var.X / D 80, E.Y / D 15 und Var.Y / D 4. Die zulässige Personenanzahl n muss die Eigenschaft haben, dass die Wahrscheinlichkeit für eine Überschreitung der zulässigen Zuladung höchstens 1 % beträgt. a) Bestimmen Sie n unter den Prämissen, dass X und Y unabhängig sind und das Gesamtgewicht der Skifahrer als normalverteilt angenommen werden kann. b) Bestimmen Sie n unter der Prämisse, dass X und Y unabhängig sind, auf Grund der tschebyscheffschen Ungleichung. c) Wie ändern sich obige Ergebnisse, wenn man die Erfahrungstatsache, dass schwerere Personen i. A. auch eine schwerere Skiausrüstung benötigen, durch die Prämisse berücksichtigt, dass der Korrelationskoeffizient zwischen X und Y den Wert 0;9 besitzt?
58
Lösungen zur Wahrscheinlichkeitsrechnung
Lösungen zur Wahrscheinlichkeitsrechnung Lösung zu Aufgabe 2.1 Es bezeichne B W Bestehen der Klausur W W Klausur enthält Aufgaben zur Wahrscheinlichkeitsrechnung D W Klausur enthält mindestens drei Aufgaben zur deskriptiven Statistik a) Nach dem Satz von der totalen Wahrscheinlichkeit gilt P .B/ D P .B j W \ D/ P .W \ D/C N P .W \ D/ N C P .B j WN / P .WN / P .B j W \ D/ N C 1 0;05: D 0;9 P .W \ D/ C 0;7 P .W \ D/ N D Wegen P .W \ D/ D P .D j W /P .W / D 0;5 0;95 und P .W \ D/ P .W / P .W \ D/ D 0;95 0;5 0;95 D 0;5 0;95 folgt P .B/ D 0;9 0;5 0;95 C 0;7 0;5 0;95 C 0;05 D 0;81: / 1 N b) P .BjW / D .B\W D P .W ŒP .B \ W \ D/ C P .B \ W \ D/ P .W / / N P .DN j W / D P .B j W \ D/ P .D j W / C P .B j W \ D/ D 0;9 0;5 C 0;7 0;5 D 0;80 : Bemerkung: Spielen bei einer Aufgabe bedingte Wahrscheinlichkeiten eine Rolle, so lassen sich in vielen Fällen die Fragestellung und der Lösungsgang durch einen Ereignisbaum veranschaulichen. Zum Beispiel in Teil a) sieht dies folgendermaßen aus: 0,5 5 0,9 0,0 5
0,9
B
0,1
BN
0,7
B
0,3
BN
D
W
0,5
DN
WN
1
B
Ereignisbaum
Lösungen zur Wahrscheinlichkeitsrechnung
59
An den Pfeilen sind die bedingten (bzw., im Fall der von der Baumwurzel wegführenden Pfeile, die unbedingten) Wahrscheinlichkeiten und in den Knoten die Ereignisse notiert. Multipliziert man alle Wahrscheinlichkeiten auf einem Weg von der Baumwurzel zu einem mit B markierten Baumende und addiert man diese Produkte über alle Wege, die zu einem B-Knoten führen, so erhält man die gesuchte Wahrscheinlichkeit P .B/.
Lösung zu Aufgabe 2.2 a) In einer Minute können 20 Kombinationen durchprobiert werden. Nach 20 Laplace ergibt sich dann die Wahrscheinlichkeit p D 1:000 D 2 %. b) Da nun nur 15 Kombinationen (der 10.000) pro Minute durchprobiert wer15 D 0;15 %. den können, ergibt sich die Wahrscheinlichkeit p D 10:000 c) Die Lösung folgt aus a) und b) sowie der Baumdarstellung: Schaden D 1:000 erfolgreich
p Dieb
0,5
1
p nicht erfolgreich Schaden D 0
0,5 kein Dieb Schaden D 0 Ereignisbaum
Der Schadenserwartungswert ist 0.0;5C0;50;98/C1:0000;50;02 D 10 [€] bei dreistelligem Schloss bzw. 0 .0;5 C 0;5 0;9985/ C 1:000 0;5 0;0015 D 0;75 [€] bei vierstelligem Schloss.
60
Lösungen zur Wahrscheinlichkeitsrechnung
Lösung zu Aufgabe 2.3* a) Der Speicher enthält Nk Wörter. Die Wahrscheinlichkeit dafür, dass alle a Bit-Fehler unterschiedliche Wörter betreffen, ergibt sich nach der laplaceschen Definition der Wahrscheinlichkeit als Quotient N k
.N 1/ . Nk a C 1/ k N k
N k
N k
k k k 12 1 .a 1/ : D 1 N N N
b) Es ist k D 25 , a D 3 und N D 220 . Obige Formel liefert also .1 215 /.1 2 215 / D 0;9999 als Wahrscheinlichkeit dafür, dass (unter den gegebenen Umständen) kein Wort verfälscht wird.
Lösung zu Aufgabe 2.4 a) P .Pressemitteilung/ D D 1 P .keiner der k Schwellenwerte wird überschritten/ p k D 1 1 100 (auf Grund der vorausgesetzten Unabhängigkeit). b) Speziell ergibt sich die Wahrscheinlichkeit 1 0; 99120 D 70 %.
Lösung zu Aufgabe 2.5 Das Gerät ist genau dann kein Ausschussstück, wenn alle 35 Einzelteile einwandfrei sind. Unabhängigkeit des Funktionierens bzw. Nichtfunktionierens der Einzelteile vorausgesetzt, gilt P .Gerät kein Ausschuss/ D .1 pf /10 .1 ps /25 D 0;9910 0;99925 D 0;88: Die Ausschusswahrscheinlichkeit für die Geräte ist demnach 12 %.
Lösungen zur Wahrscheinlichkeitsrechnung
Lösung zu Aufgabe 2.6 Mit den Ereignissen E: Produkt ist erfolgreich F : Produkt ist ein Flop G: Testmarktresultat ist gut M : Testmarktresultat ist mittel S : Testmarktresultat ist schlecht liefert die bayessche Formel die gesuchte Wahrscheinlichkeit P .F j G/ D D
P .G j F / P .F / P .G j F / P .F / C P .G j E/ P .E/ 0;20 0;90 D 0;72: 0;20 0;90 C 0;70 0;10
Lösung zu Aufgabe 2.7 Die Annahmewahrscheinlichkeit und die Ablehnwahrscheinlichkeit sind .1 p/n bzw.
1 .1 p/n :
Die gestellten Forderungen sind .1 0;01/n 0;90 und
1 .1 0;03/n 0;90;
was zunächst zu n log 0;99 log 0;90 und n log 0;97 log 0;10
61
62
Lösungen zur Wahrscheinlichkeitsrechnung
umgeformt werden kann und wegen der Negativität von log 0;99 und log 0;97 zu log 0;90 log 0;10 n log 0;97 log 0;99 äquivalent ist. Die numerische Auswertung der beiden Schranken liefert die unerfüllbare Bedingung: 75;60 n 10;48: Obige Forderungen sind durch keine Stichprobenkontrolle des gegebenen Typs simultan erfüllbar.
Lösung zu Aufgabe 2.8 a) Die gesuchte Wahrscheinlichkeit ist identisch mit derjenigen, dass D gegen C gewinnt. Nach Prämisse ist diese Wahrscheinlichkeit gleich 0;7. b) Das Ereignis „D und A kommen ins Endspiel“ ist äquivalent zu dem Ereignis „D gewinnt gegen C und A gewinnt gegen B“, so dass sich wegen der vorausgesetzten Unabhängigkeit der Ereignisse die Wahrscheinlichkeit 0;7 0;4 D 0;28 ergibt. c) Die unter b) errechnete Wahrscheinlichkeit muss noch mit der Wahrscheinlichkeit, dass D gegen A gewinnt (D 0;6), multipliziert werden: 0;28 0;6 D 0;168: d) Platz 1 wird genau dann erreicht, wenn D und A ins Endspiel kommen und D dann gewinnt oder wenn D und B ins Endspiel kommen und D dann gewinnt. Unter Verwendung der gegebenen und bereits berechneten Wahrscheinlichkeiten erhält man 0;168 C 0;7 0;6 0;5 D 0;378 als Wahrscheinlichkeit dafür, dass D den ersten Platz erreichen wird. Analog ergeben sich die anderen Platzierungswahrscheinlichkeiten: 0;322 für Platz 2,
0;168 für Platz 3
und
0;132 für Platz 4.
Lösung zu Aufgabe 2.9* a) Die Wahrscheinlichkeit pj , dass der potenzielle Käufer genau j Hefte mit der Werbebotschaft liest, ergibt sich aus der hypergeometrischen Verteilung gemäß
Lösungen zur Wahrscheinlichkeitsrechnung
63
4 6 j 3j I pj D 10 3 d.h. es ist p0 D 16 , p1 D 12 , p2 D
3 10
und p3 D
1 30 .
b) Bei gegebener Anzahl j von gelesenen Heften mit der Werbebotschaft ist die Anzahl der bewusst registrierten Werbebotschaften binomialverteilt mit dem Parameter j und 12 . Es ist demnach (für i j ) 1 i 1 j i 1 j j j D ; P .Ai j Bj / D i 2 i 2 2 wobei Bj das Ereignis bedeutet, dass genau j Hefte mit der Werbebotschaft gelesen werden. Nach dem Satz von der totalen Wahrscheinlichkeit gilt 3 3 X X j 1 j P .Ai / D P .Ai j Bj / P .Bj / D pj i 2 j Di
sowie P .Kauf/ D
j Di
3 X
P .Kauf j Ai / P .Ai / D
iD0
3 X i P .Ai /: 10 iD0
Das Einsetzen der unter a) errechneten Wahrscheinlichkeiten pj liefert P .A0 / D sowie
119 ; 240
P .A1 / D
99 ; 240
P .A2 / D
21 ; 240
P .A3 / D
1 240
3 1 X 144 P .Kauf/ D D 0;06: i P .Ai / D 10 2:400 iD0
c) Nun ist P .Ai j Bj / D
1 i 3 j i j ; i 4 4
so dass sich jetzt P .A0 / D
1:391 483 45 1 ; P .A1 / D ; P .A2 / D ; P .A3 / D 30 64 30 64 30 64 30 64
sowie P .Kauf/ D
3 1 X 576 D 0;03 i P .Ai / D 10 10 30 64 iD0
ergibt. Insbesondere halbiert sich die Kaufwahrscheinlichkeit.
64
Lösungen zur Wahrscheinlichkeitsrechnung
Bemerkungen: 1. Die Berechnungen unter b) und c) sowie das Zustandekommen der Kaufentscheidung kann man sich an folgendem (andeutungsweise skizzierten) Ereignisbaum veranschaulichen: jD Auswahl der Hefte
0
iD
j D1
jD
bewusst registrierte Werbebotschaften
2
0
i D1
iD
ja
Kauf
2
ne in
D
iD
j
3
3
Ereignisbaum 2. Ein alternativer Weg zur Berechnung der in b) und c) gesuchten Kaufwahrscheinlichkeiten geht von der Tatsache aus, dass die Kaufwahrscheinlichkeit als Erwartungswert der Indikatorvariablen
KD
1; falls ein Kauf erfolgt 0; sonst
dargestellt werden kann und dass Erwartungswerte die folgende Eigenschaft besitzen: Man kann den Erwartungswert E.X / sukzessive berechnen, indem man die (möglicherweise einfacher zu berechnenden) bedingten Erwartungswerte von X berechnet und danach die Erwartungswertbildung bezüglich der Bedingungen vornimmt. In unserem Fall ist diese Berechnungsweise vorteilhaft. Sie beinhaltet eine dreistufige Erwartungswertbildung, da auf die dichotome Entscheidung (Kauf, Nichtkauf) die Realisation i der Anzahl der bewusst registrierten Werbebotschaften einwirkt und auf diese wiederum die Realisation j der Anzahl der gelesenen Hefte mit platzierter Werbebotschaft. i Bei gegebenem .i; j / ist definitionsgemäß E.K/ D 10 , womit der erste Schritt bereits erledigt ist. Für den zweiten Schritt muss man sich daran erinnern, dass die Realisationen i bei gegebenem j von einer B.j I 12 /- bzw.
Lösungen zur Wahrscheinlichkeitsrechnung
65
B.j I 14 /-Verteilung generiert werden, so dass die nächste Erwartungswertbildung 1 1 1 1 j bzw. j 10 2 10 4 liefert. Berücksichtigt man schließlich, dass j von einer hypergeometrischen Verteilung generiert wird, so ergibt sich im dritten Schritt als gesuchte Kaufwahrscheinlichkeit 1 1 4 3 D 0;06 10 2 10
bzw.
1 1 4 3 D 0;03: 10 4 10
Lösung zu Aufgabe 2.10 a)
0 mit Wahrscheinlichkeit 0;994 Zahlung X D 100:000 1 mit Wahrscheinlichkeit 0;006 E.X / D 100:000 0;006 D 600 [€] Prämie D 1;3E.X / D 780 [€]
b) G E.G/ 2 D Var.X / 3
D D D D
780 X 180 100:0002 0;006 0;994 D 0;005964 1010 p 59:640:000 7:723 23:169
Der 3 -Bereich von G ist 180 ˙ 23:169, d.h. Œ22:989I 23:349. Insbesondere enthält er negative Werte. c) E.G1 C C G500:000 / D 50:000 180 D 9:000:000 Var.G1 C C G500:000 / D 50:000 1010 0;005964 D 2;982 1012 Nun ist der 3 -Bereich Œ3:819:459I 14:180:541. Insbesondere liegt er ganz im positiven Bereich (Ausgleich im Kollektiv!).
66
Lösungen zur Wahrscheinlichkeitsrechnung
Lösung zu Aufgabe 2.11 a) Der Ertrag vor Fremdkapitalzinsen ist .EK C FK/ X; so dass die Eigenkapitalrendite definitionsgemäß beträgt: .EK C FK/ X 0;06 FK EK FK FK X 0;06 D .1 C v/ X 0;06 v: D 1C EK EK
Y D
Mit dem speziellen Verschuldungsgrad v D 2 erhält man demnach Y D 3X 0;12 E.Y / D 3 E.X / 0;12 D 0;24 0;12 D 0;12 Var.Y / D 9 Var.X / D 0;0036: Infolgedessen ist die Standardabweichung von Y gleich 0;06. b) Wegen der Symmetrie und Stetigkeit von X gilt P .X 0;08/ D 0;5 P .Y 0;12/ D P .3X 0;12 0;12/ D P .3X 0;24/ D P .X 0;08/ D 0;5:
Lösung zu Aufgabe 2.12 Ist Z der Gewinnanteil eines Kommanditisten, so gilt die Aufteilungsbedingung 5 Z C 3 Z D X;
d.h.
ZD
1 X: 8
a) Das Nettoeinkommen eines Kommanditisten ist demnach Y D 0;55 Z D
0;55 X; 8
Lösungen zur Wahrscheinlichkeitsrechnung
67
so dass E.Y / D
0;55 0;55 E.X / D 1:200:000 D 82:500 8 8
und p 0;55 p 0;55 Var.X / D 100:000 D 6:875 Var.Y / D 8 8 gilt. Der 2 -Bereich ist Œ68:750I 96:250: b) Das Nettoeinkommen des Komplementärs ist 0;44
3X ; 8
so dass der Erwartungswert 198:000 beträgt und der 2 -Bereich mit dem Intervall Œ165:000I 231:000 identisch ist.
Lösung zu Aufgabe 2.13 Der Schadenserwartungswert ist E.X / D 0 0;970 C 105 0;025 C 106 0;005 D 7:500; die Schadensvarianz beträgt Var.X / D E.X 2 / ŒE.X /2 D 1010 0;025 C 1012 0;005 7:5002 D 5:193:750:000; und die Standardabweichung entsprechend p Var.X / D 72:068: Infolgedessen ergeben sich als kalkulierte Prämien: a) D 1;2 7:500 D 9:000 b) D 7:500 C
72:068 20
D 11:103;40.
68
Lösungen zur Wahrscheinlichkeitsrechnung
Lösung zu Aufgabe 2.14 E.G/ D E.X / 80:000:000 D 32 Mio Var.G/ D Var.X /
a)
b) Der Überschuss nach Zahlung des fixen Lohnbestandteils ist X 2:000 36:000 D X 72:000:000: Davon gehen 20 % an die Arbeitnehmerschaft; 80 % bleiben den Eignern, so dass sich der Gewinn gemäß G D 0;8 .X 72:000:000/ berechnet. Infolgedessen ist nun E.G/ D 0;8 ŒE.X / 72:000:000 D 0;8 40:000:000 D 32 Mio Var.G/ D 0;64 Var.X /: Für die Unternehmung wurde das Risiko (gemessen durch die Varianz) geringer. Der Gewinnerwartungswert wurde dabei nicht beeinflusst.
Lösung zu Aufgabe 2.15 Die Rendite X besitzt die Wahrscheinlichkeitsfunktion x f .x/
0;02 0;01 1 15
und den Erwartungswert
1 15 0;75 15
0;00
0;01
0;02
0;12
1 15
1 15
1 15
1 15
D 5 %.
a) Die Semivarianz bzgl. t D 0;03 ist " # 1 5 2 4 2 3 2 2 2 1 2 D C C C C 15 100 100 100 100 100 55 D 3;67 104 ; 15 104 so dass die Semistandardabweichung 1,92 % beträgt.
Lösungen zur Wahrscheinlichkeitsrechnung
69
b) Wegen E.X / D 0;05 ist 1 .0;072 C 0;062 C C 0;012 / D 9;33 104 15 die Semivarianz und entsprechend 3,05 % die Semistandardabweichung.
Lösung zu Aufgabe 2.16 Schickt er n Bewerbungsschreiben ab, so ist (Unabhängigkeit der Zu- oder Absageprozedur unterstellt) die Zufallsvariable X D Anzahl der positiven Antworten binomialverteilt mit den Parametern n und p D 0;2. a) Gesucht ist n so, dass P .X 1/ D 1 P .X D 0/ 0;95 bzw. P .X D 0/ 0;05: Wegen P .X D 0/ D ist die Gleichung
n 0;20 0;8n D 0;8n 0
0;8n D 0;05
nach n aufzulösen und auf die nächste ganze Zahl aufzurunden. Die Auflösung (durch Logarithmieren) liefert nD
log 0;05 D 13;43: log 0;8
Er muss demnach 14 Bewerbungsschreiben absenden. b) Da die Wahrscheinlichkeit für ausschließlich negative Antworten 0;8n beträgt und dieser Term stets positiv bleibt,gibt es keine Anzahl n, die die Forderung nach sicherer Zusage gewährleisten kann.
70
Lösungen zur Wahrscheinlichkeitsrechnung
Lösung zu Aufgabe 2.17* a) Bei einer Gruppengröße n sind zunächst Nn Tests für die gemischten Blutproben erforderlich. Pro Gruppe ist die zusätzliche Anzahl der Tests eine zweiwertige Zufallsvariable
0; falls negativer Befund Xi D n; falls positiver Befund mit dem Erwartungswert n Œ1 .1 p/n . Damit ergibt sich als erwartete Anzahl erforderlicher Tests N n
C E.X1 / C C E.X N / D n
D
N n N n
C
N n
n Œ1 .1 p/n
C N Œ1 .1 p/n :
b) n D 100 führt zu 104 C 106 .1 0;999100 / D 105:208 erwarteten Tests; n D 50 führt zu 2 104 C 106 .1 0;99950 / D 68:794 erwarteten Tests; n D 25 führt zu 4 104 C 106 .1 0;99925 / D 64:702 erwarteten Tests.
Lösung zu Aufgabe 2.18 a) Eine Zielperson wird X -mal erreicht, wobei X einer hypergeometrischen Verteilung mit den Parametern N D 24, M D 4, n D 5 genügt. Aus 4 20 x 5x f .x/ D P .X D x/ D 24 5 erhält man x
0
1
2
3
4
f .x/ 0;36 0;46 0;16 0;02 0;00 b) Nun ist X binomialverteilt mit den Parametern n D 5 und p D 16 . Mit 1 x 5 5x f .x/ D P .X D x/ D 5 x 6 6 ergibt sich x
0
1
2
3
4
f .x/ 0;40 0;40 0;16 0;03 0;00 Im Gegensatz zur Situation bei a) ist x D 5 (theoretisch) realisierbar.
Lösungen zur Wahrscheinlichkeitsrechnung
71
c) X werde als Poisson-verteilte Zufallsvariable betrachtet, wobei der Poissonparameter als Produkt 5 16 D 0;83N angesetzt wird. Damit gilt f .x/ D P .X D x/ D 0
x
1
5 x
2
6
e 5=6 x! 3
4
f .x/ 0;43 0;36 0;15 0;04 0;01 f0;8 .x/ 0;45 0;36 0;14 0;04 0;01 Die letzte Tabellenzeile wurde aus der Poissonvertafelung mit dem (nächsten berücksichtigten) Parameter D 0;8 gewonnen.
Lösung zu Aufgabe 2.19 Der Kapitalwert ist definitionsgemäß K D A0 C a)
X2 A2 X1 A1 C : 1;1 1;21
E.X1 / E.A1 / E.X2 / E.A2 / C 1;1 1;21 0;8 0;1 0;8 0;1 C D 1 C 1;1 1;21
E.K/ D A0 C
D 0;214876 [106 €] D 214:876 [€] b) Kmin D 1 C
0;6 0;15 0;6 0;15 C 1;1 1;21
D 0;219008 [106 €] D 219:008 [€]: Die Eintrittswahrscheinlichkeit beträgt 1 1 1 1 1 D D 1;56 %: 2 2 4 4 64
72
Lösungen zur Wahrscheinlichkeitsrechnung
Lösung zu Aufgabe 2.20 a) Das fragliche Ereignis tritt genau dann ein, wenn die ersten x 1 Kandidaten ungeeignet sind und der x-te Kandidat tatsächlich geeignet ist. Die Wahrscheinlichkeit ist demnach f .x/ D 0;9x1 0;1 D
0;1 0;9x : 0;9
b) Der erwartete Zeitaufwand beträgt 1 X xD1
1 0;1 X 0;1 0;9 x 0;9x D xf .x/ D D 10 [Stunden]: 0;9 0;9 0;12 xD1
Bemerkung: Die bei a) gefundene Wahrscheinlichkeitsfunktion besitzt die Form einer geometrischen Folge. Bezeichnen wir die zugehörige Zufallsvariable mit X , so nimmt X die Werte 1; 2; : : : an. Da man mindestens ein Vorstellungsgespräch benötigt, kann man den Sachverhalt auch durch die Anzahl Y der zusätzlich erforderlichen Vorstellungsgespräche charakterisieren. Es gilt natürlich Y D X 1, so dass Y die Wahrscheinlichkeitsfunktion g.y/ D P .Y D y/ D P .X 1 D y/ D P .X D y C 1/ 0;1 0;9yC1 D 0;1 0;9y D 0;9 besitzt. Ersetzt man 0,1 durch eine beliebige „Erfolgswahrscheinlichkeit“ p, so erhält man die Wahrscheinlichkeitsfunktion g.y/ D p .1 p/y
für
y D 0; 1; : : :
einer geometrisch verteilten Zufallsvariablen Y (mit der Erfolgswahrscheinlichkeit p).
Lösung zu Aufgabe 2.21 Das Ereignis Y D y tritt genau dann ein, wenn der zweite geeignete Kandidat im .y C 2/-ten Vorstellungsgespräch gefunden wird. Der erste geeignete Kandidat muss infolgedessen in einem der y C1 vorangegangenen Vorstellungsgesprächen entdeckt worden sein. Wird er speziell im ersten Vorstellungsgespräch entdeckt,
Lösungen zur Wahrscheinlichkeitsrechnung
73
so ergibt sich die Wahrscheinlichkeit 0;1 0;9 0;9 0;1 D 0;12 0;9y : „ ƒ‚ … y-mal Da der erste geeignete Kandidat auch im zweiten, dritten, . . . , .y C 1/-ten Vorstellungsgespräch entdeckt werden kann, multipliziert sich obige Wahrscheinlichkeit noch mit dem Faktor y C 1. Die Wahrscheinlichkeitsfunktion ist demnach g.y/ D .y C 1/ 0;12 0;9y :
Lösung zu Aufgabe 2.22 a) Die Zufallsvariable X D Anzahl falscher Alarme pro Jahr ist exakt binomialverteilt mit den Parametern n D 1:000
und
p D 0;0005:
b) In guter Annäherung (vgl. Tabelle 8) ist X Poisson-verteilt mit dem Parameter D 1:000 0;0005 D 0;5. Infolgedessen ist 0
0;5 P .X 1/ D 1 P .X D 0/ 1 0;5 0! e D 1 p1e D 1 0;61 D 0;39:
c) Die erwartete Anzahl beträgt jetzt E.X / D 1:000 0;001 D 1: Sie hat sich gegenüber vorher verdoppelt. (Diese Aussage gilt sowohl bzgl. der exakten Verteilung wie bzgl. der Poisson-Approximation.) Die Wahrscheinlichkeit P .X 1/ verdoppelt sich dagegen nicht. Sie beträgt nun P .X 1/ D 1 P .X D 0/ 1
10 0!
e 1 D 1
1 e
D 0;63
und damit weniger als das Doppelte der in b) errechneten Wahrscheinlichkeit.
74
Lösungen zur Wahrscheinlichkeitsrechnung
Lösung zu Aufgabe 2.23 Es ist P .G D 150:000/ D 0;10 C 0;15 D 0;25 P .G D 350:000/ D 0;10 C 0;05 D 0;15: Für Gehaltszahlungen zwischen diesen Extremwerten gilt vertragsgemäß: G D 150:000 C 200:000 D 150:000 C
x107 100 ;
x107 2107
so dass man weiter erhält: P .G D 200:000/ D P .X D 1;5 107 / D 0;20 P .G D 250:000/ D P .X D 2 107 / D 0;25 P .G D 300:000/ D P .X D 2;5 107 / D 0;15:
Lösung zu Aufgabe 2.24 X hat die Verteilungsfunktion F.x/ D 1 e x . a) E.X / D
1
D 106 [Betriebsstunden]
b) P .X 106 / D 1 e 10
6 106
D 1 e 1 D 0;63
c) Bezeichnet Xi die Zeit bis zum Auftreten des ersten Fehlers der i-ten Speicherstelle, so ist Y >x gleichwertig zu Xi > x
für
i D 1; : : : ; 224 :
Wegen der vorausgesetzten Unabhängigkeit gilt somit P .Y > x/ D P .X1 > x/ P .X2 > x/ P .Xn > x/ D .e x /n D e nx : Also hat Y die Verteilungsfunktion G.x/ D P .Y x/ D 1 e nx ;
Lösungen zur Wahrscheinlichkeitsrechnung
75
so dass Y exponentialverteilt ist mit dem Parameter n D 224 106 : 1 D 106 224 D 0;0596 [Betriebsstunden] Infolgedessen ist E.Y / D n bzw. 3,58 [Betriebsminuten].
Lösung zu Aufgabe 2.25 Der Gewinn X D 9:000:000 .K1 C C K5 / ist normalverteilt mit E.X / D 9:000:000 Var.X / D
5 P iD1
5 P iD1
i D 9:000:000 7:000:000 D 2:000:000
Var.Ki / D 5 100:0002 D 5 1010 :
a) P .X > 2:000:000/ D 1 P .X 2:000:000/ D 1 ˆ.0/ D 0;5 b)
1:500:000 2:000:000 P .X < 1:500:000/ D ˆ p 5 100:000 p p D ˆ. 5/ D 1 ˆ. 5/ D 0;01:
Lösung zu Aufgabe 2.26 a) Gesucht ist P .X > 50:000/. Wegen 25 106 D 0;01 P .X > 50:000/ D 1 F.50:000/ D 1 1 25 108 beträgt die Wahrscheinlichkeit nur 1 %. b) Die Dichtefunktion ist im Bereich x > 5:000 gleich f .x/ D F 0 .x/ D 25 106 .2/x 3 D
5 107 : x3
76
Lösungen zur Wahrscheinlichkeitsrechnung Hieraus folgt Z E.X / D
1
5:000
7
Z
xf .x/ dx D 5 10
D 5 107
1 x
1
1
5:000
x dx x3
D 10:000:
5:000
Lösung zu Aufgabe 2.27 Liquiditätsprobleme treten auf, wenn der Zahlungsüberschuss weniger als 1,5 Mio beträgt. Die Wahrscheinlichkeit hierfür ist Z
1;5106
106
3 f .x/ dx D 1018 4
Z
1;5106
Œx.b C a/ x 2 ab dx #1;5106 " x3 3 x2 18 .b C a/ abx D 10 4 2 3 6 106
10
D 1;56 %:
Bemerkung: Die in der Aufgabe verwendete Dichtefunktion definiert eine spezielle Beta-Verteilung. Die Klasse der Beta-Verteilungen über dem Intervall ŒaI b ist durch eine Dichtefunktion des Typs f .x/ D c .x a/˛1 .b x/ˇ1;
a 0 die beiden Formparameter darstellen. In der Aufgabe war ˛ D ˇ D 2. Setzt man ˛ D ˇ D 1, so bekommt man die Gleichverteilung über ŒaI b. Beta-Verteilungen werden häufig zur Modellierung von Vorgangsdauern im Rahmen der stochastischen Zeitplanung benutzt.
Lösung zu Aufgabe 2.28 Es ist zweckmäßig, zuerst die Verteilungsfunktion F von X zu ermitteln. ln x ; F.x/ D P .X x/ D P .ln X ln x/ D ˆ
Lösungen zur Wahrscheinlichkeitsrechnung
77
wobei ˆ die Verteilungsfunktion der Standardnormalverteilung ist. Unter Berücksichtigung der Kettenregel und der Tatsache, dass die Ableitung ˆ0 gleich der Standardnormalverteilungsdichte ist, folgt weiter f .x/ D F 0 .x/ 1 0 ln x Dˆ x ( ) 1 ln x 2 1 1 exp D p 2 x 2 ( ) .ln x /2 1 p exp für D 2 2 x 2
x > 0:
Lösung zu Aufgabe 2.29 a)
Z E.X / D
b)
0
Z D
x
10
Z Var.X / D
10
0 10
"
0
x
x 1 5 50
10 3
dx D
10 D 3;33 3
2 x 1 dx 5 50
x 2 14 20 x3 C xC 50 3 9 9
# dx D
50 9
p 1 p Var.X / D 50 D 2;36 3 c) Die Verteilungsfunktion der Lieferfrist ist
t x x2 1 dt D : F.x/ D 5 50 5 100 0 p F.x/ D 0;5 liefert x D 10 50 D 2;93 als Median. Z
x
d) Die Bedingung F.x/ D 0;9 liefert x D 6;84; d.h. mit 90-prozentiger Sicherheit treffen die georderten Anlasser spätestens nach 6,84 Stunden im PKW-Werk ein.
78
Lösungen zur Wahrscheinlichkeitsrechnung
Lösung zu Aufgabe 2.30 Z
a) 1D
1
x0
c x ˛C1
dx D c
1 x ˛1C1 ˛ 1 C 1
1 x0
D
c x ˛ ; ˛ 0
woraus sich c D ˛x0˛ ergibt. Z
b) F.x/ D
x
x0
˛x0˛
t ˛C1
dt D 1
c)
x ˛ 0
x
.für x x0 /
P .X > 10:000/ P .X 5:000/ 1 / 1 .1 10 1 D : D 1 2 1 .1 5 /
P .X > 10:000 j X 5:000/ D
Bemerkung: Die in dieser Aufgabe betrachtete Wahrscheinlichkeitsverteilung heißt Pareto-Verteilung mit den Parametern ˛ > 0 und x0 > 0.
Lösung zu Aufgabe 2.31 a) Der Gewinn G ergibt sich gemäß G D gO C p.cO C / als lineare Transformation einer gleichverteilten Zufallsvariablen und ist deshalb selbst wieder gleichverteilt. (Dies kann man natürlich auch mittels der linear verlaufenden Verteilungsfunktion von C begründen.) Das für G relevante Intervall ist ŒgO C p.cO 2 107 /I gO C p.cO 107 /: b) Das Intervall spezialisiert sich auf Œ0;2 106 I 2;8 106 und hat die Länge 3 106 . Infolgedessen ist P .G < 0/ D P .G > 2 106 / D
0;2 3 0;8 3
D 6;67 % D 26;67 %:
Lösungen zur Wahrscheinlichkeitsrechnung
79
Lösung zu Aufgabe 2.32 a)
Z E.X / D
3:000
0
" xf .x/ dx D
x3 2 x4 2 106 109 3 3 9 4
#3:000
D 1:500:
0
Da f .x/ konkav ist und Randmaxima ausscheiden, kann der Modalwert aus f 0 .x/ D 0 berechnet werden. Es ergibt sich ebenfalls der Wert 1.500. 2:000
Z
b) P .X 2:000/ D
0
2 2 106 x 109 x 2 3 9
dx D
20 27
D 0;74: Der Grad der Lieferbereitschaft beträgt demnach 74 %.
Lösung zu Aufgabe 2.33* a) Der Gewinn G D Z C R 500:000 .1 C 0;08/ D Z C R 540:000 ist im Wesentlichen durch die Summe (D Faltung)) der beiden Zufallsvariablen Z und R bestimmt. Die Verteilungsfunktion dieser Summe ergibt sich aus der folgenden Abbildung: r
350 250
z 250
350
x
x 700
Skizze zur Bildung der Faltung r und z sind jeweils in [103 €] gemessen.
80
Lösungen zur Wahrscheinlichkeitsrechnung Die zweidimensionale Zufallsvariable .Z; R/ hat das eingezeichnete Rechteck als Wertebereich. Die Dichtefunktion f .z; r / ist dort konstant, f .z; r / D 105 105 D 1010 : Für 500:000 < x 600:000 gilt: P .Z C R x/ D 1010 Fläche des schwarz markierten Dreiecks .x 500:000/2 : D 1010 2 Für 600:000 < x 700:000 gilt: P .Z C R x/ D 1 1010 Fläche des grau markierten Dreiecks .700:000 x/2 : D 1 1010 2 Damit besitzt Z C R die Verteilungsfunktion 8 ˆ 0 für x 500:000 ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ .x 500:000/2 ˆ ˆ < 1010 für 500:000 < x 600:000 2 F.x/ D ˆ ˆ .700:000 x/2 ˆ ˆ 1010 für 600:000 < x 700:000 1 ˆ ˆ 2 ˆ ˆ ˆ ˆ ˆ : 1 für 700:000 x Die Verteilungsfunktion FQ des Gewinns G ergibt sich wegen P .G g/ D P .Z C R g C 540:000/ als FQ .g/ D F.g C 540:000/. b) Es ist
P .G > 100:000/ D 1 P .G 100:000/ Q D 1F .100:000/ D 1 2F.640:000/ D 1 1 1010 60:000 2 D 1010
36108 2
D 0;18:
Mit einer Wahrscheinlichkeit von 18 % fällt der Gewinn höher als 100.000 [€] aus.
Lösungen zur Wahrscheinlichkeitsrechnung
81
Bemerkung: Die Ableitung der beiden Zweige der Verteilungsfunktion führt zu einer stückweise linearen Dichtefunktion, deren graphische Darstellung (s.u.) ein Dreieck liefert. Die Summenvariable Z CR wird als dreiecksverteilt bezeichnet; diese Verteilungsform ergibt sich stets dann, wenn zwei unabhängige Zufallsvariablen, die über demselben Intervall gleichverteilt sind, addiert werden. Dichtefunktion 105
500.000
600.000
Realisationen 700.000 von Z C R
Dichtefunktion einer Dreiecksverteilung
Lösung zu Aufgabe 2.34 Da T .x/ konvex ist, sind T .x/ und somit auch die Nettoeinkommensfunktion N .x/ D x T .x/ konkav. Die jensensche Ungleichung liefert deshalb EŒN .X / N ŒE.X /: Damit führt das risikobehaftete Einkommen X zu einem erwarteten Nettoeinkommen EŒN .X /, das höchstens so hoch ist wie das mit dem sicheren Gehalt E.X / verbundene Nettoeinkommen N ŒE.X / D E.X / T ŒE.X /: Bis auf Sonderfälle (degenerierte Verteilung von X , geradlinige Teile von T .x/) wird Herr Müller das feste Jahresgehalt präferieren.
82
Lösungen zur Wahrscheinlichkeitsrechnung
Lösung zu Aufgabe 2.35 Gesucht ist P .jX 90j > 1/: Wegen E.X / D 90 und
Var.X / D 0;152
liefert die tschebyscheffsche Ungleichung die Aussage P .jX 90j > 1/
Var.X / D 0;0225: 12
Die Ausschusswahrscheinlichkeit beträgt demnach höchstens 2,25 %.
Lösung zu Aufgabe 2.36 Es ist ZD D E.Z/ D D Var.Z/ D
60:000 .1 C X / C 40:000 .1 C Y / 105 C 104 .6 X C 4 Y / 105 C 104 .6 0;08 C 4 0;06/ 105 C 104 0;72 D 107:200 [€] 108 .36 Var.X / C 16 Var.Y / C 2 6 4 Cov.X; Y //
sowohl bei a) als auch bei b). a) Aus Cov.X; Y / D 0 folgt Var.Z/ D 108 .36 0;0004 C 16 0;0001/ D 08 0;016 D 1;6 106 : Der 3 -Bereich ist Œ103:405I 110:995. b) Nun errechnet man für Var.Z/ Var.Z/ D 108 .36 0;0004 C 16 0;0001 2 0;3 4 6 0;02 0;01/ D 108 0;01312 D 1;312 106 : Der 3 -Bereich ist Œ103:764I 110:636. Infolge des Diversifikationseffektes ist er kleiner als im Falle a).
Lösungen zur Wahrscheinlichkeitsrechnung
83
Lösung zu Aufgabe 2.37 a) Der Deckungsbeitrag besitzt ebenfalls eine Dreipunkt-Verteilung; auf die Realisationen 3, 4, 5 entfällt jeweils die Wahrscheinlichkeit 13 . Die Verteilung von X ergibt sich aus folgender aus der Unabhängigkeitsprämisse resultierenden Tabelle der gemeinsamen Wahrscheinlichkeitsfunktion f .k; c/ H HH c 5 6 7 f1 .k/ H k H H 1 1 1 3 100:000 4 4 4 4 120:000 f2 .c/
1 12 1 3
1 12 1 3
1 12 1 3
1 4
1
Hieraus folgt P .X D 20:000/ D P .X D 25:000/ D P .X D 33:333/ D P .X D 24:000/ D P .X D 30:000/ D P .X D 40:000/ D
1 4 1 12
b) Trägt man in einer entsprechenden Tabelle die gegebenen Randwahrscheinlichkeiten (die ja dieselben wie bei a) sind) sowie die nun unterstellten gemeinsamen Wahrscheinlichkeiten P .K D 100:000 und C D 5/ D P .K D 120:000 und C D 7/ D
1 2 1 6
ein, so erkennt man sofort, dass zum Beispiel P .K D 120:000 und C D 5/ negativ (nämlich patibel.
1 3
12 ) sein müsste. Die Angaben sind somit nicht kom-
Lösung zu Aufgabe 2.38 Die Wahrscheinlichkeit dafür, dass die ersten 7 Stücke erste Wahl, die beiden nächsten Stücke zweite Wahl und das zehnte Stück schließlich Ausschuss sind, beträgt 0;807 0;152 0;051 :
84
Lösungen zur Wahrscheinlichkeitsrechnung
Da es für das vorgegebene Ereignis nur auf die Anzahlen (7,2,1) und nicht auf die Position innerhalb der Stichprobe ankommt, muss diese Wahrscheinlichkeit noch mit dem Faktor 10! ; 7! 2! 1! der sich aus den Grundregeln der Kombinatorik ergibt, multipliziert werden. Damit erhält man als gesuchte Wahrscheinlichkeit 10! 0;807 0;152 0;051 D 360 0;807 0;152 0;05 D 8;49 %: 7! 2! 1! Bemerkung: Dem Leser wird die enge Analogie zur Herleitung der Binomialverteilung sicher nicht entgangen sein. Statt mit einer dichotomen Grundgesamtheit haben wir es hier mit einer trichotomen Grundgesamtheit zu tun. In nahe liegender Verallgemeinerung kann man einen Zufallsvorgang betrachten, bei dem r verschiedene (und sich gegenseitig ausschließende) Ereignisse auftreten können. Wird dieser Zufallsvorgang n-mal unabhängig wiederholt und die Wahrscheinlichkeit berechnet, dass ni -mal das Ereignis Nr. i auftritt (i D 1; : : : ; r ), so ergibt sich entsprechend n! p n1 p2n2 prnr ; n1 ! n2 ! nr ! 1 wobei pi die Eintrittswahrscheinlichkeit für das Ereignis Nr. i bedeutet. Eine r -dimensionale Zufallsvariable .X1 ; : : : ; Xr /, deren gemeinsame Wahrscheinlichkeitsfunktion gegeben ist durch f .n1 ; n2 ; : : : ; nr / D P .X1 D n1 ; : : : ; Xr D nr / D
n! p n1 prnr n1 ! nr ! 1
für jedes r -Tupel n1 ; : : : ; nr mit n1 C n2 C C nr D n;
ni 0;
ni ganzzahlig
heißt multinomialverteilt mit den Parametern .nI p1 ; : : : ; pr /. Wird beispielsweise aus der Gesamtheit der Bundesbürger eine Stichprobe (mit Zurücklegen) vom Umfang n gezogen und bedeutet pi den Bevölkerungsanteil des i-ten Bundeslandes, so ist die Zufallsvariable .X1 ; : : : ; X16 / multinomialverteilt, wenn Xi die Anzahl der aus dem i-ten Bundesland in die Stichprobe gelangten Personen bedeutet.
Lösungen zur Wahrscheinlichkeitsrechnung
85
Lösung zu Aufgabe 2.39 Wegen der Gleichverteilung und Unabhängigkeit der Ankunftszeiten X und Y besitzt die zweidimensionale Zufallsvariable .X; Y / eine konstante Dichtefunk1 1 10 /. A und B treffen sich genau dann, wenn ein .x; y/ aus der grau tion (.D 10 markierten Fläche realisiert wird. y 10
3
3
10
A [Min], x D Ankunftszeit von gemessen ab 1455 Uhr
Wertebereich der zweidimensionalen Zufallsvariablen .X; Y / Da das komplementäre Ereignis zwei Dreiecken entspricht, ergibt sich die gesuchte Wahrscheinlichkeit (elementargeometrisch) als 1 77 77 49 P .Treffen/ D 1 C D1 D 51 %: 100 2 2 100 Insbesondere ist die Vermutung von A und B unzutreffend.
Lösung zu Aufgabe 2.40* a) Es ist
Y D
0; falls X 104 X 104 ; sonst
und E.X / D
1
D 2 106 :
86
Lösungen zur Wahrscheinlichkeitsrechnung Für y 0 gilt deshalb F.y/ D P .Y ( y/ D P .X )104 y/ D P .X 104 C y/ 104 C y 7 D 1 e 0;005 e y510 : D 1 exp 2 106 Für y < 0 gilt natürlich F.y/ D 0. An der Stelle y D 0 hat F.y/ demnach einen Sprung der Höhe 1 e 0;005 D 0;005; bedingt durch das Faktum, dass der Industrie-Versicherer mit dieser positiven Wahrscheinlichkeit infolge des Selbstbehaltes keine Schadenszahlungen zu leisten hat. b) Die Situation ist für den Rückversicherer analog wie in Teil a) für den Erstversicherer.
0; falls X 4 106 ZD X 4 106 ; sonst Je nach Interpretation des Rückversicherungsvertrages könnte man bei der Definition von Z auch X durch die in Teil a) definierte Schadenszahlung Y des Erstversicherers ersetzen. Der Unterschied ist praktisch irrelevant. Wir werden obige Definition von Z verwenden. Die Berechnung der Wahrscheinlichkeit P .Z > 0/ der gesetzten Bedingung erfolgt zweckmäßigerweise über das Komplement. P .Z D 0/ D P .X ( 4 106 / ) 4 106 D 1 e 2 D 0;86: D 1 exp 2 106 Nach Definition der bedingten Wahrscheinlichkeit folgt weiter: P .Z 107 j Z > 0/ D
P .0 < Z 107 / 1 P .Z D 0/
P .4 106 < X 107 / e 2 5 1 e .1 e 2 / D D 0;95: e 2
D
Lösungen zur Wahrscheinlichkeitsrechnung
87
Nun ist 8 ˆ falls X 104 c6 / D 0;05 P 51 16 P .Xi XN /2 = .Yi YN /2 > c7 D 0;99 ˇ) P iD1
iD1
festgelegten Werte c6 ; c7 .
Aufgabe 3.3 Für den Zustand der Fichten eines bestimmten Forstamtsbezirks werden die drei Schadensstufen 0 (b D keine Schäden), 1 (b D leichte bis mittlere Schäden) oder 2 (b D schwere Schäden) als möglich angesetzt. Um die Anteile pj der zur Schadensstufe j , j 2 f0; 1; 2g, gehörenden Fichten zu schätzen, werden n Fichten zufällig ausgewählt (mit Zurücklegen) und ihre Schadensstufen registriert. Xi bezeichne die Schadensstufe der i-ten untersuchten Fichte, i D 1; : : : ; n. a) Zeigen Sie n P
PO1 D
1 n
PO2 D
1 2n
.2Xi Xi2 / ist erwartungstreu für p1
iD1 n P
iD1
.Xi2 Xi / ist erwartungstreu für p2 .
b) Geben Sie eine erwartungstreue Schätzfunktion für p0 an. O j die relative Häufigkeit des Auftretens der Schadensstufe j in der c) Sei ‚ Stichprobe, j D 0; 1; 2. Gibt es Stichprobenrealisationen .x1 ; : : : ; xn /, für O 1 (bzw. ‚ O 2 )? die PO1 (bzw. PO2 ) dasselbe Schätzergebnis liefert wie ‚
Aufgabe 3.4 Die von einer Maschine für einen bestimmten Arbeitsvorgang benötigte Zeit sei eine Zufallsvariable X , für deren Dichtefunktion in Abhängigkeit von einem Parameter # 2 Œ0I 2 die Gestalt ( # C 2.1 #/x für x 2 Œ0I 1 f .x j #/ D 0 sonst unterstellt wird. Zu X liege eine einfache Stichprobe X1 ; : : : ; Xn vor.
96
Aufgaben zur induktiven Statistik a) Berechnen Sie E.Xi / und E.Xi2 /. b) Zeigen Sie, dass die beiden Schätzfunktionen n
n
X O1 D 4 6 ‚ Xi n
und
iD1
X O2 D 3 6 ‚ Xi2 n iD1
erwartungstreu für # sind. c) Wie müssen die Zahlen ˛ und ˇ gewählt werden, damit die Schätzfunktion n
X O D 1 .˛Xi C ˇXi2 / ‚ n iD1
erwartungstreu für # ist?
Aufgabe 3.5 Die (in Tagen gemessene) Füllzeit von Altglascontainern mit vergleichbarer Größe und Standort sei eine Zufallsvariable X , deren Erwartungswert D E.X / geschätzt werden soll. Zur Schätzung werde das Stichprobenmittel XN verwendet, und bzgl. der Schätzgenauigkeit die Anforderung Var.XN / 1 gestellt. Wie groß muss der Stichprobenumfang n sein, wenn man von der Prämisse ausgehen kann, dass die Varianz Var.X / maximal 65 beträgt?
Aufgabe 3.6 Die Lagerbuchführung eines aus N D 10:000 Positionen bestehenden Roh-, Hilfs- und Betriebsstoff-Lagers liefert einen Gesamt(-Buch-)Wert B D 18 Mio [€] und eine Standardabweichung von s D 270. Zur Bestimmung des LagerIst-Wertes erfasst man n Positionen stichprobenmäßig, was die Stichprobenvariablen X1 ; : : : ; Xn definiert. Zur Schätzung (= freien Hochrechnung) des Lager-Ist-Wertes benutzt man die Schätzfunktion N XN . Die Genauigkeitsanforderung wird durch die Bedingung präzisiert, dass die Standardabweichung der Schätzfunktion maximal 0;5 % des Buchwertes betragen darf. Welcher Stichprobenumfang n ist erforderlich, wenn man davon ausgehen kann, dass die Standardabweichung der Ist-Werte durch die Standardabweichung der Buchwerte approximiert werden kann?
Aufgaben zur induktiven Statistik
97
Aufgabe 3.7 Der Anteil p derjenigen Steuerzahler, die dem Finanzamt Zinseinkünfte verheimlichen, soll mittels einer Befragung unter Zuhilfenahme folgender Verschlüsselungsprozedur geschätzt werden: Jeder befragte Steuerzahler zieht aus einem Stapel von 10 Spielkarten, die den Wert 1 bis 10 haben, eine Karte verdeckt heraus. Wenn er eine 1 oder 2 gezogen hat, soll er die Frage „Haben Sie dem Finanzamt Zinseinkünfte verheimlicht?“ wahrheitsgemäß beantworten; andernfalls soll er lügen. Die Antwort des i-ten Befragten werde durch die Indikatorvariable ( 1; falls die Antwort „ja“ lautet ; .i D 1; : : : ; n/ Ai D 0; falls die Antwort „nein“ lautet beschrieben, und aus .A1 ; : : : ; An / die Schätzfunktion n
4 5 1X Ai PO D 3 3 n iD1
gebildet. a) Welcher Schätzwert pO ergibt sich, wenn bei n D 1:000 Befragten 600 Ja-Antworten registriert werden? b) Ist PO erwartungstreu für p? c) Welche Varianz hat PO ?
Aufgabe 3.8* In Aufgabe 3.7 wurde der Anteil p derjenigen Steuerzahler, die dem Finanzamt Zinseinkünfte verheimlichen, mittels einer Befragung unter Verwendung einer Verschlüsselungsprozedur geschätzt. Bei dieser Prozedur wurde die AntwortAnonymisierung dadurch gewährleistet, dass der Befragte mit der Wahrscheinlichkeit q D 0;8 (nämlich beim Ziehen einer der Karten 3 bis 10) vereinbarungsgemäß lügen sollte.
98
Aufgaben zur induktiven Statistik a) Versuchen Sie, für alle mit 10 Karten realisierbaren Fälle (d.h. für q D 0;1I : : : I 0;9) eine erwartungstreue Schätzfunktion PO aufzustellen. Unterziehen Sie den Fall q D 0;5, der eine perfekte Antwort-Anonymisierung gewährleistet, einer gesonderten Diskussion. b) Für welches q ergibt sich das (gemessen an der Schätzvarianz) optimale Design?
Aufgabe 3.9 Zur Erforschung der Erdkruste sollen Bohrungen in mehrere tausend Meter Tiefe durchgeführt werden. Die tägliche Bohrleistung (gemessen in Metern) eines dafür entwickelten Bohrgeräts wird als Zufallsvariable X angesehen, wobei X als gleichverteilt in einem Intervall Œ0I b mit unbekanntem b angenommen wird. Die bei Probebohrungen gemessenen täglichen Bohrleistungen werden als Realisierungen einer einfachen Stichprobe X1 ; : : : ; Xn aufgefasst. Zur Schätzung des Erwartungswerts D E.X / werden die drei Schätzfunktionen n 1X N O Xi ‚ n D Xn D n iD1 O 0n D 1 maxfX1 ; : : : ; Xn g ‚ 2 O n D n C 1 maxfX1 ; : : : ; Xn g ‚ 2n vorgeschlagen. a) Welche der drei Schätzfunktionen ist erwartungstreu bzw. asymptotisch erwartungstreu für ? O0,‚ O bestimme man zur StichprobenHinweis: Zur Untersuchung von ‚ n n funktion Y D maxfX1 ; : : : ; Xn g zunächst die Verteilungsfunktion F.y/ und hieraus die Dichte f .y/, jeweils für y 2 Œ0I b. b) Ermitteln Sie unter den oben als erwartungstreu erkannten Schätzfunktionen die wirksamste. c) Untersuchen Sie die drei Schätzfunktionen auf Konsistenz.
Aufgaben zur induktiven Statistik
99
Aufgabe 3.10* Unter k verschiedenen Düngemethoden wurde Kopfsalat angebaut. Die Stichprobenvariablen Xi1 ; : : : ; Xi ni registrieren den Nitratgehalt (in mg pro kg), der sich bei ni zur Düngemethode i (i D 1; : : : ; k) durchgeführten Messungen ergibt. Es wird Unabhängigkeit aller n D n1 C C nk Stichprobenvariablen vorausgesetzt. Ferner wird für die Erwartungswerte der Xij die Beziehung E.Xij / D C ai
für
j D 1; : : : ; ni I
i D 1; : : : ; k
angenommen, wobei k X
ai D 0
iD1
gefordert wird; d.h. E.Xij / setzt sich additiv zusammen aus dem von der speziellen Düngemethode unabhängigen „durchschnittlichen Effekt“ und der als „Abweichungseffekt bezüglich Methode i“ bezeichnete Größe ai , wobei die ai sich in der Summe aufheben. a) Welche Schätzfunktionen MO und AOi ergeben sich für und die ai nach dem Prinzip der kleinsten Quadrate? Man gehe also nach der Vorschrift vor, dass für die Realisationen xij , O und aO i der Xij , MO und AOi gelten soll: ni ni k X k X X X .xij O aO i /2 .xij ai / iD1 j D1
iD1 j D1
für alle und alle ai mit
k P iD1
ai D 0.
b) Sind die in a) ermittelten Schätzfunktionen MO bzw. AOi erwartungstreu für bzw. ai ? c) Konkret seien bei k D 3 folgende Werte xij ermittelt worden: bei Methode 1: bei Methode 2: bei Methode 3:
1.490 3.710 970
2.010 4.200 1.260
1.650 2.940 1.340
1.580 3.650 1.150
1.320
1.540
1.210
Welche Schätzwerte liefert die Kleinst-Quadrate-Methode für , a1 , a2 und a3 ?
100
Aufgaben zur induktiven Statistik
Aufgabe 3.11 Die Anzahl X der Auftragseingänge pro Tag in einem Handwerksbetrieb sei eine mit dem Parameter Poisson-verteilte Zufallsvariable. Folgende Tabelle hält für 15 Werktage die pro Tag eingegangenen Aufträge fest: i
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
xi
4
6
1
3
3
2
11
5
9
4
5
1
2
7
8
Bei diesen Daten handle es sich um das Ergebnis einer einfachen Stichprobe .X1 ; : : : ; X15 /. a) Geben Sie den zugehörigen Stichprobenraum an. b) Bestimmen Sie (unter Benutzung des obigen Stichprobenergebnisses) die Likelihoodfunktion f .x1 ; : : : ; x15 j /. c) Bestimmen Sie den Maximum-Likelihood-Schätzwert O für die zu erwartende Anzahl D E.X / der Auftragseingänge pro Tag. d) Ist die Maximum-Likelihood-Schätzfunktion für erwartungstreu?
Aufgabe 3.12 Die Lebensdauer X eines Verschleißteils besitze eine Dichte, die von x D 0 ab linear abnimmt und bei x D # eine Nullstelle besitzt. a) Bestimmen Sie den Verlauf der Dichtefunktion f .x/ für 0 x #. b) Es liege eine Stichprobe vom Umfang n D 1 vor mit der Stichprobenrealisation x1 D 47;8. Wie groß ist der Maximum-Likelihood-Schätzwert O #? c) Wie lässt sich aus dem Maximum-Likelihood-Schätzwert #O der
Maximum-Likelihood-Schätzwert O für den Erwartungswert D E.X / berechnen?
Aufgaben zur induktiven Statistik
101
Aufgabe 3.13 Der Auslastungsgrad (pro Tag) eines in einem Bürogebäude stehenden Kopiergerätes sei eine Zufallsvariable X , deren Dichte folgende Gestalt besitze (mit t > 0): ( tx t 1 für 0 < x 1 f .x/ D 0 sonst Die an n Arbeitstagen beobachteten Auslastungsgrade x1 ; : : : ; xn seien als Realisierungen einer einfachen Stichprobe auffassbar. a) Erstellen Sie die Likelihood-Funktion f .x1 ; : : : ; xn j t/. b) Ermitteln Sie die Maximum-Likelihood-Schätzfunktionen für t für den Erwartungswert D E.X / für die Wahrscheinlichkeit p, mit der X
1 2
zutrifft.
c) Beim Stichprobenumfang 6 sei das Ergebnis .0;4I 0;9I 0;6I 0;1I 0;3I 0;5/ eingetreten. Berechnen Sie die Maximum-Likelihood-Schätzwerte tO für t, O für und pO für p.
Aufgabe 3.14* Für die (in Minuten gemessene) Zeitdauer X , die ein erwachsener Bundesbürger für die tägliche Zahnpflege verwendet, werde eine Dichte der Gestalt 8 x ˆ ˆ für 0 x a ˆ 2 ˆ a ˆ < fa .x/ D 2a x für a < x 2a ˆ ˆ a2 ˆ ˆ ˆ : 0 sonst mit dem unbekannten Parameter a > 0 unterstellt. a) Skizzieren Sie die Dichte fa .x/ (für einen festen Wert a). b) Bei einer einfachen Stichprobe vom Umfang 4 seien die Werte 2, 3, 5 und 7 beobachtet worden. Schätzen Sie hiermit den Parameter a nach der Maximum-Likelihood-Methode.
102
Aufgaben zur induktiven Statistik
Aufgabe 3.15 Eine Abfüllanlage kann in drei verschiedenen Geschwindigkeitsstufen laufen. Bei Geschwindigkeitsstufe i ist die (in cm3 gemessene) Abfüllmenge X normalverteilt mit dem Erwartungswert i und der Varianz i2 , (i D 1; 2; 3). Dabei gilt 1 D 5:003; 12 D 9; 2 D 5:004; 22 D 25; 3 D 5:010; 32 D 144: Ein von der Anlage abgefüllter Behälter enthielt die Abfüllmenge x D 4:997 Kubikzentimeter. a) Schätzen Sie die dabei eingestellte Geschwindigkeitsstufe # 2 f1; 2; 3g i) nach der Maximum-Likelihood-Methode, ii) durch den a posteriori Modus, wenn die drei Geschwindigkeitsstufen a priori als gleichwahrscheinlich gelten, die a priori Wahrscheinlichkeiten '.i/ sich wie '.1/ W '.2/ W '.3/ D 3 W 2 W 1 verhalten. b) Warum ist zur Schätzung von # bei gegebenen a priori Wahrscheinlichkeiten der a posteriori Erwartungswert ungeeignet?
Aufgabe 3.16 Eine Firma, die Folien für kleine Gartenteiche herstellt, hat dazu ein neues Material entwickelt. Die Firma ist interessiert am Anteil p derjenigen aus diesem Material bestehenden Teichfolien, die sich – insbesondere auf Grund fehlerhafter Schweißnähte – bereits bei der ersten Wasserfüllung als undicht erweisen. Bei den ersten 120 mit einer derartigen Folie angelegten Teichen trat ein solcher Schaden genau einmal ein. Die Firma interpretiert dieses Resultat als Ergebnis einer einfachen Stichprobe, will sich aber zur Schätzung von p nicht allein auf dieses Stichprobenergebnis stützen, sondern auch gewisse a priori Vermutungen über p mit einbeziehen, die sich auf durchgeführte Materialkontrollen sowie
Aufgaben zur induktiven Statistik
103
auf Erfahrungen mit ähnlichen Materialien gründen. Ein beratender Statistiker schlägt vor, diese a priori Vermutungen durch eine Dichte der Form ( .k C 1/.k C 2/p.1 p/k für 0 p 1 '.p/ D 0 sonst mit k > 0 zu beschreiben und dabei k so festzulegen, dass der Modus der a priori Verteilung gleich 0,025 ist. a) Präzisieren Sie die so entstehende a priori Dichte '.p/. b) Zur Schätzung von p benutzt die Firma den a posteriori Erwartungswert. Welches Schätzergebnis pO erhält sie?
Aufgabe 3.17 Für die N D 105 Positionen umfassende Grundgesamtheit der Roh-, Hilfs- und Betriebsstoffe einer Unternehmung soll der Inventurwert mittels einer geschichteten Stichprobe ermittelt werden, vgl. hierzu die Bemerkung im Anschluss an die Lösung von Aufgabe 3.6. Unter Berücksichtigung von Lagerungsdauer und Buchwert wurden 10 gleich große Schichten gebildet und auf Grund bestimmter Genauigkeitsanforderungen ein Gesamtstichprobenumfang von 5.000 vorgegeben. Die Standardabweichungen pro Schicht seien 1 D D 5 D 10 und 6 D D 10 D 30: Als Inventurwert soll das N -fache des aus der Schichtschätzfunktion resultierenden Schätzwertes genommen werden. a) Das Stichprobenmittel betrage je 50 für die ersten 9 Schichten und 150 für die zehnte Schicht. Welcher Inventurwert ergibt sich? b) Bestimmen Sie die optimale Aufteilung.
104
Aufgaben zur induktiven Statistik
Aufgabe 3.18 Die Gesamtzahl aller 13- bis 15-Jährigen in einem Bundesland gliedert sich in N1 D 0;4N Hauptschüler, N2 D 0;3N Realschüler und N3 D 0;3N Gymnasiasten. Mit seien die mittleren vierteljährlichen Ausgaben für Bücher (pro Person) in der Altersgruppe der 13- bis 15-Jährigen in diesem Bundesland bezeichnet. Auf Grund einer Stichprobe von vorgegebenem Umfang n D 400 soll geschätzt werden. Dabei kann mit folgenden (in €2 gemessenen) mittleren quadratischen Abweichungen 2 bzw. i2 der vierteljährlichen Ausgaben für Bücher gerechnet werden: Alle 13- bis 15-Jährigen
Hauptschüler
Realschüler
Gymnasiasten
2 D 120
12 D 25
22 D 100
32 D 100
Die folgenden Fragen sind jeweils für den Fall mit Zurücklegen zu lösen: a) Berechnen Sie die proportionale Aufteilung von n und die Varianz der Schichtschätzfunktion bei proportionaler Aufteilung. b) Berechnen Sie die optimale Aufteilung von n und die Varianz der Schichtschätzfunktion bei optimaler Aufteilung. c) Die Stichprobe vom Umfang 400 werde durch eine reine Zufallsauswahl aus der Gesamtheit aller 13- bis 15-Jährigen in diesem Bundesland entnommen und das Stichprobenmittel XN der dabei beobachteten vierteljährlichen Bücherausgaben als Schätzfunktion für verwendet. Wie groß ist die Varianz dieser Schätzfunktion? d) Ein Vergleich von a) und c) zeigt, dass bei den gegebenen Daten die Varianz der Schichtschätzfunktion bei proportionaler Aufteilung kleiner als Var.XN / ist. Zeigen Sie, dass generell (d.h. unabhängig von der obigen Situation) bei Zerlegung einer endlichen Grundgesamtheit G in k Schichten die Varianz der Schichtschätzfunktion bei proportionaler Aufteilung höchstens gleich der Varianz des Stichprobenmittels bei reiner Zufallsauswahl aus G ist. Hinweis: Beachten Sie dazu die Formel (13).
Aufgaben zur induktiven Statistik
105
Aufgabe 3.19 Der derzeitige Wähleranteil p einer bestimmten Partei A soll mittels einer geschichteten Stichprobe vom Gesamtstichprobenumfang 2.600 geschätzt werden. Dabei ist die Gesamtheit aller Wahlberechtigten (N D 40 Millionen) auf Grund des Lebensalters folgendermaßen in Schichten zerlegt: Schicht Lebensalter in Jahren
1
2
3
4
18 bis 24
25 bis 36
37 bis 60
über 60
Die Umfänge der einzelnen Schichten verhalten sich zueinander wie folgt: N1 W N2 W N3 W N4 D 1 W 2 W 3 W 2: Die (auf Grund gewisser Wahlanalysen geschätzten) Wähleranteile pQi der Partei A in Schicht i bei der letzten Wahl waren pQ1 D 0;100I
pQ2 D 0;042I
pQ3 D 0;035I
pQ4 D 0;025:
a) Begründen Sie, weshalb zur Berechnung der optimalen Aufteilung die Formel des Falls mit Zurücklegen hinreichend genau ist. b) Geben Sie die mittlere quadratische Abweichung i2 in Schicht i in Abhängigkeit vom (unbekannten) derzeitigen Anteil pi der Wähler der Partei A in Schicht i an. c) Welche Stichprobenumfänge ni (i D 1; : : : ; 4) ergeben sich, wenn man jeweils den – auf zwei in der Formel für die optimale Aufteilung statt i p Nachkommastellen gerundeten – Schätzwert O i D pQi .1 pQi / einsetzt? d) Nun werden die obigen Schichten 3 und 4 zu einer Schicht zusammengefasst. Welche Aufteilung des Gesamtstichprobenumfangs 2.600 auf die verbleibenden drei Schichten erhält man dann nach der in c) beschriebenen Vorgehensweise?
Aufgabe 3.20 Eine Unternehmung stellt Scheiben aus monokristallinem Reinstsilizium her, die ein Vorprodukt zur Herstellung von Mikrochips sind. Unter vielen anderen ist ein Gütekriterium für die Scheiben der Grad der Durchbiegung. Die Zufallsvariable X bezeichne die (durch eine bestimmte Maßzahl ausgedrückte) Durchbiegung einer zufällig herausgegriffenen Scheibe. Zur Abtrennung der Scheiben von ei-
106
Aufgaben zur induktiven Statistik
nem Siliziumstab stehen drei Sägeblätter I, II, III zur Verfügung. Die mithilfe von I, II, III hergestellten Scheiben stehen im Mengenverhältnis 2 W 1 W 1. a) In einer Vorstichprobe wurden folgende Werte gemessen: Sägeblatt I
11
12
14
15
17
19
22
23
25
32
Sägeblatt II
8
9
10
11
13
13
14
16
17
19
Sägeblatt III
9
13
14
14
14
14
15
16
20
21
Berechnen Sie die Stichprobenvarianzen si2 als Schätzwerte für die Varianzen i2 (i D 1; 2; 3). Im Folgenden werde von i D si ausgegangen (auf eine Nachkommastelle gerundet). b) Die Untersuchung einer Scheibe kostet in jedem Fall 1 GE (Geldeinheit), und es steht ein Budget von 30 GE zur Verfügung. Bestimmen Sie die optimale Aufteilung ni (i D 1; 2; 3) einer Stichprobe (für den Fall Ziehen mit Zurücklegen) auf die drei Sägeblätter. c) Eine Stichprobe (mit optimaler Aufteilung; Ziehen mit Zurücklegen) ergab die Merkmalssummen 360; 70 und 70 für Sägeblatt I, II und III. Berechnen Sie daraus einen Schätzwert O für den Erwartungswert der Zufallsvariablen X .
Aufgabe 3.21 Der Verschuldungsgrad X der 10:000 Unternehmungen einer bestimmten Branche soll mittels einer geschichteten Stichprobe (mit Zurücklegen) untersucht werden. Nach der jeweiligen Rechtsform zerfällt die Grundgesamtheit in 5 Schichten, über die folgende Informationen vorliegen: Die Schichtumfänge verhalten sich gemäß der Proportion N1 W N2 W N3 W N4 W N5 D 1 W 2 W 2 W 2 W 3: Die Kostensätze sind c1 D c2 D c3 D c4 D 1I c5 D 4:
Aufgaben zur induktiven Statistik
107
Für die Schicht-Standardabweichungen gilt: 1 D 2 D 3 D 4 D
1 10 5 :
a) Bestimmen Sie die optimale Aufteilung bei einem gegebenen Budget von c D 4:000. b) Die optimal aufgeteilte Stichprobe habe die Daten xN 1 D 1I
xN 2 D xN 3 D 1;5I
xN 4 D 2I
xN 5 D 3
geliefert. Bestimmen Sie den auf Grund der Schichtschätzfunktion resultierenden Schätzwert für den mittleren Verschuldungsgrad E.X /.
Aufgabe 3.22 Das Umweltreferat einer Großstadt will Aufschluss darüber gewinnen, wie viele Asbestfasern pro Kubikmeter Luft im Freien in ca. einem Meter Abstand von asbestzementhaltigen Gebäudeteilen zu erwarten sind. Bei n D 14 diesbezüglichen Messungen traten die Werte 980; 1:340; 1:100; 470;
610; 750; 880; 1:250; 2:410; 1:040; 910; 1:860; 730; 820
auf, die als Ergebnisse unabhängiger normalverteilter Stichprobenvariablen angesehen werden. a) Führen Sie für den Erwartungswert der Anzahl X der unter den obigen Bedingungen vorhandenen Asbestfasern eine Intervall-Schätzung zum Konfidenzniveau 0,95 durch. b) Wie müsste das Konfidenzniveau gewählt sein, damit die Länge des entstehenden Schätzintervalls gleich 500 ist?
108
Aufgaben zur induktiven Statistik
Aufgabe 3.23 Die jährliche Anzahl X der Abwesenheitsstage einer bestimmten Arbeitnehmergruppe werde mittels einer einfachen Stichprobe vom Umfang n erhoben. a) Es sei bekannt, dass die maximale Anzahl der Abwesenheitstage höchstens 30 beträgt. Welcher Stichprobenumfang n garantiert, dass die Länge des (auf der Normalverteilungsapproximation beruhenden) Konfidenzintervalls für E.X / zum Konfidenzniveau 0;95 höchstens 2 ist? b) Eine Stichprobe vom Umfang n D 144 lieferte folgende Werte: xN D 15;
s 2 D 1:600:
Bestimmen Sie ein Schätzintervall für E.X / zum Konfidenzniveau 0,95. c) Zu welchem Konfidenzniveau liefern die im Teil b) angegebenen Daten ein Schätzintervall, das mit Œ15 8;5833I 15 C 8;5833 übereinstimmt?
Aufgabe 3.24 Aus der Produktion eines Chemiewerkes, das nahtlose Kunststoffrohre herstellt, werden 100 Rohre ausgewählt und auf Fehler überprüft (einfache Stichprobe). Bei 10 Rohren werden Mängel festgestellt. Der Anteil der fehlerhaften Rohre in der gesamten Produktion soll durch ein Konfidenzintervall zum Niveau 0,9 geschätzt werden. a) Errechnen Sie das Ergebnis dieser Intervallschätzung. b) Werden zusätzlich zu den bisherigen 100 Rohren m weitere zufällig aus der Produktion entnommen und auf Mängel überprüft, so gelte als sicher, dass in der Gesamtstichprobe höchstens 20 % der 100Cm Rohre fehlerhaft sind. Wie viele Rohre müssen noch überprüft werden, wenn die Länge des resultierenden Schätzintervalls höchstens gleich 0,05 sein darf?
Aufgaben zur induktiven Statistik
109
Aufgabe 3.25 Ein Händler sieht seinen täglichen Gewinn X – der positiv oder negativ ausfallen kann – als zufallsabhängig an, wobei er für die Gewinne verschiedener Tage Unabhängigkeit und stets dieselbe Wahrscheinlichkeitsverteilung mit der Dichte f .x/ voraussetzt. Der Händler ist interessiert an einer Intervallschätzung des als Verlusterwartungswert bezeichneten Parameters Z D
0 1
.x/f .x/ dx:
Im Ablauf von 50 Tagen traten genau sieben negative Gewinnwerte auf, nämlich die Werte 50;
200;
240;
290;
375;
410;
785:
a) Schätzen Sie durch ein (symmetrisches) Konfidenzintervall zum Konfidenzniveau 1 ˛ D 0;9. Hinweis: Stellen Sie dazu als Erwartungswert unabhängiger, identisch verteilter Zufallsvariablen Y1 ; : : : ; Y50 dar. b) Bei Erhöhung des Stichprobenumfangs n werde für den Wert s der aus den Stichprobenvariablen Y1 ; : : : ; Yn (siehe obigen Hinweis) gebildeten Stichprobenstandardabweichung höchstens eine Verdoppelung des aus obigen Daten (bei n D 50) errechneten Wertes als möglich erachtet. Welcher Stichprobenumfang n reicht dann aus, um ein Schätzintervall für der Maximallänge 50 zu gewährleisten (wieder zu 1 ˛ D 0;9)?
Aufgabe 3.26 Die für die Abfertigung eines Kunden an der Kasse eines Supermarktes benötigte Zeit X gelte als exponentialverteilt mit dem Parameter . Nach einer einfachen Stichprobe vom Umfang 50 ergab sich durch Addition aller 50 Abfertigungsdauern ein Wert von einer Stunde, zwölf Minuten und dreißig Sekunden. a) Führen Sie auf Grund dieser Daten zur Irrtumswahrscheinlichkeit 0,02 eine Intervall-Schätzung für den Erwarungswert der Abfertigungsdauer eines Kunden durch. Benutzen Sie dazu als Schätzwert für die Standardabweichung von X den Stichprobenmittelwert xN und begründen Sie diese Vorgehensweise, indem Sie nachweisen, dass die Folge XNn der Stichprobenmittel (für wachsendes n) konsistent für ist.
110
Aufgaben zur induktiven Statistik
b) Bei der in a) benutzten Vorgehensweise sind die Obergrenze Vo bzw. die Untergrenze Vu des Konfidenzintervalls für stets von der Gestalt Vo D XN ko bzw. Vu D XN ku , d.h. beide sind Vielfache von XN . Welcher Stichprobenumfang n garantiert, dass dabei (bei Irrtumswahrscheinlichkeit 0,02) die Differenz ko ku 0;5 wird, bzw. dass der Quotient ko =ku 1;5 wird? Berechnen Sie zum Vergleich auch, welche Werte für ko ku bzw. ko =ku sich aus obiger Stichprobe vom Umfang 50 ergeben.
Aufgabe 3.27* Für die Besitzer von (netzabhängigen und nicht batteriegepufferten) Radioweckern in einem Hochhaus ist die Anzahl X der Nächte pro Jahr, in denen zwischen 2200 Uhr und 700 Uhr mindestens einmal der Strom abgeschaltet wird, von Interesse. Die in den letzten 6 Jahren aufgetretenen Ausprägungen xi des Merkmals X können als Realisierungen einer einfachen Stichprobe aus einer mit dem Parameter Poisson-verteilten Grundgesamtheit angesehen werden. a) Konstruieren Sie nach den in Abschnitt 14.2 beschriebenen Prinzipien einen Signifikanztest zum Niveau ˛ D 0;1, mit dem sich gegebenenfalls die Hypothese, dass der Erwartungswert E.X / höchstens gleich 1 ist, statistisch widerlegen lässt. Hinweis: Die Summe unabhängiger, Poisson-verteilter Zufallsvariablen ist wieder Poisson-verteilt. b) Berechnen Sie zu dem in a) konstruierten Test (falls nötig, unter Benutzung der in Tabelle 8 angegebenen Approximationsmöglichkeit) die Gütefunktion an den Stellen 2 f 12 ; 1; 43 ; 53 ; 2; 3g. c) Ist der in a) konstruierte Test unverfälscht? Beantworten Sie diese Frage nicht für das vorgegebene Signifkanzniveau ˛ D 0;1, sondern für die tatsächlich erreichte maximale Wahrscheinlichkeit ˛ 0 des Fehlers 1. Art. d) Folgende Werte xi (i D 1; : : : ; 6) seien aufgetreten: 1 3 0
1 2 1
Führen Sie den Test mit diesen Daten durch.
Aufgaben zur induktiven Statistik
111
Aufgabe 3.28 Ein Sportartikelhersteller hat sich 1988 eine Maschine zur Produktion von Tischtennisbällen angeschafft. Das (in Gramm gemessene) Gewicht X eines der Produktion zufällig entnommenen Balles wird als normalverteilt angenommen. a) Aus der Produktion der ersten Woche wurden 24 Bälle zufällig entnommen und gewogen. Es ergaben sich folgende Werte xi : 2,47 2,53 2,46
2,50 2,42 2,50
2,52 2,49 2,44
2,44 2,48 2,47
2,49 2,51 2,48
2,43 2,44 2,51
2,44 2,45 2,52
2,44 2,41 2,44
Berechnen Sie hiermit ein Schätzintervall für die Varianz 2 von X zum Konfidenzniveau 0,99. b) Nachdem die Maschine ein halbes Jahr in Betrieb ist und in der Zwischenzeit viele Stichproben entnommen worden sind, gilt für die Stanp dardabweichung D Var.X / der Wert 0,04 als sicher. Ob die Maschine bezüglich des Gewichts der Bälle den hypothetischen Erwartungswert 0 D 2;47 hinreichend genau einhält, wird laufend dadurch kontrolliert, dass nach je zwei Stunden zehn Bälle der Produktion zufällig entnommen werden und das arithmetische Mittel xN des Gewichts dieser 10 Bälle in eine Kontrollkarte des in Beispiel 77 beschriebenen Typs eingetragen wird. Mit welchen Warngrenzen (zu ˛ D 0;05) bzw. Kontrollgrenzen (zu ˛ D 0;01) ist xN zu vergleichen?
Aufgabe 3.29* Wie groß hätte der Stichprobenumfang n im Teil a) von Aufgabe 3.28 sein müssen, um zu garantieren, dass der Quotient vo =vu aus Ober- bzw. Untergrenze des entstehenden Schätzintervalls für 2 (zu 1 ˛ D 0;99) höchstens 3 ist?
Aufgabe 3.30 Um Aufschluss über den – als normalverteilt vorausgesetzten – Wasserverbrauch X im Kochwaschprogramm bei einem neu entwickelten Waschmaschinenmodell
112
Aufgaben zur induktiven Statistik
zu gewinnen, wurden 10 Probeläufe durchgeführt. Dabei wurden insgesamt 10 X
xi D 1:024
iD1
Liter Wasser verbraucht. Ferner erhielt man als Summe der Abstandsquadrate vom Wert 102 (in dessen Nähe man E.X / vermutet) das Ergebnis 10 X .xi 102/2 D 7;85: iD1
Wir unterscheiden zwei Fälle: Fall I: Für die Standardabweichung von X wird (auf Grund der Erfahrungen mit den bisherigen Modellen desselben Herstellers) der Wert D 0;7 als bekannt angenommen. Fall II: Die Standardabweichung von X wird als unbekannt angenommen. a) Führen Sie für jeden der beiden Fälle eine Intervallschätzung für E.X / zum Konfidenzniveau 0,99 durch. b) Testen Sie für jeden der beiden Fälle zum Signifikanzniveau ˛ D 0;01, ob der vermutete Wert 102 für E.X / zutrifft oder nicht.
Aufgabe 3.31 In einer Großstadt stehen 2.400 Parkuhren. 144 dieser Parkuhren wurden zufällig ausgewählt und zu verschiedenen – ebenfalls zufällig ausgewählten – Zeitpunkten (Minuten) innerhalb einer Woche überprüft. Dabei wurden insgesamt 36 „Falschparker“ festgestellt, d.h. in 36 Fällen war die zulässige Höchstparkdauer überschritten. Im Folgenden bezeichne p den Anteil der Parkuhren, die (zu einem zufälligen Zeitpunkt) durch Falschparker besetzt sind, und es werde angenommen, dass p nicht von der speziell gewählten Woche abhängt. a) Bestimmen Sie zum Konfidenzniveau 0,92 ein Schätzintervall für p. b) Testen Sie zum Signifikanzniveau 0,04 die im Stadtrat aufgestellte Behauptung H0 , der Anteil der von Falschparkern besetzten Parkuhren sei höchstens 20 %.
Aufgaben zur induktiven Statistik
113
c) Schätzen Sie aus den obigen Daten die (durch Falschparker an Parkuhren) zu erwartende tägliche Bußgeld-Einnahme in dieser Großstadt, wenn in Zukunft – jeweils auf Grund einer Zufallsauswahl – die Hälfte der 2.400 Parkuhren täglich einmal überprüft werden wird und das Falschparken je 10 € kostet. Verwenden Sie dabei eine erwartungstreue Schätzfunktion.
Aufgabe 3.32 An einer Straße durch ein Wohngebiet werden Schilder aufgestellt mit dem Text: „Freiwillig Tempo 30 der Kinder wegen.“ Nach einer den Autofahrern zugestandenen Anpassungszeit von vier Wochen werden bei 200 PKW die gefahrenen Geschwindigkeiten xi (in km/h) registriert. Die Daten liegen in folgender Form vor: Gruppe j
Geschwindigkeit xi aus dem Intervall
Häufigkeit hj
Gruppenmittelwert xNj
1 2 3 4 5
0 bis unter 30 30 bis unter 40 40 bis unter 50 50 bis unter 60 60 bis unter 80
0 10 20 140 30
– 38 47 54 64
Ferner ist die mittlere quadratische Abweichung 200
1 X .xi x/ N 2 200 iD1
aller gefahrenen Geschwindigkeiten gleich 49,75. a) Errechnen Sie das arithmetische Mittel der Geschwindigkeit aller 200 PKW. b) Skizzieren Sie das zugehörige Histogramm. c) Es sei bekannt, dass in der Straße vor Aufstellung der Schilder durchschnittlich 55 km/h gefahren wurden. Fassen Sie die 200 registrierten Geschwindigkeiten als Realisierung einer einfachen Stichprobe auf und testen Sie zum Signifikanzniveau ˛ D 0;01 die Hypothese H0 , dass der Erwartungswert der gefahrenen Geschwindigkeiten nach Aufstellung der Schilder gleich 55 geblieben ist (gegen H1 W < 55).
114
Aufgaben zur induktiven Statistik
Aufgabe 3.33 Als Grenzwert der radioaktiven Belastung von Lebensmitteln galt im Sommer 1985 ein Wert von 10 [Bq/kg], im Sommer 1987 dagegen ein Wert von 600 [Bq/kg]. Bei 50 im Sommer 1985 in Bayern durchgeführten Messungen der Strahlenbelastung von Maronenröhrlingen seien die Werte x1 ; : : : ; x50 registriert 2 D 7:378. Bei 5 entspreworden mit x1 C C x50 D 375 und x12 C C x50 chenden Messungen im Sommer 1987 in einem bayerischen Landkreis seien die Werte 416, 182, 630, 317 und 410 [Bq/kg] aufgetreten. Es sei gerechtfertigt, jede der beiden Messreihen als Ergebnis einer einfachen Stichprobe zu interpretieren; die 5 Messungen von 1987 seien ferner als Realisierungen normalverteilter Zufallsvariablen anzusehen. Lässt sich dann zum Signifikanzniveau ˛ D 0;025 statistisch bestätigen, dass der Erwartungswert der radioaktiven Belastung von Maronenröhrlingen im Sommer 1985 in Bayern bzw. im Sommer 1987 im betrachteten Landkreis unter dem jeweils gültigen Grenzwert lag?
Aufgabe 3.34 Ein Hersteller von Fahrrädern könnte seine Räder mit Hydraulikbremsen ausrüsten; dies wäre jedoch mit einer Preiserhöhung von 80 [€] pro Fahrrad verbunden. Zuvor soll zur Irrtumswahrscheinlichkeit 0,05 getestet werden, ob der Anteil p der potenziellen Käufer, die sich trotz dieser Mehrkosten für ein Fahrrad mit Hydraulikbremsen entscheiden würden, höchstens 15 % beträgt (b D H0 ) oder nicht (b D H1 ). Im Rahmen einer einfachen Stichprobe erklärten 33 von 120 potenziellen Käufern, sie würden unter den gegebenen Bedingungen ein Fahrrad mit Hydraulikbremsen vorziehen. Zu welcher Aussage führt der Test?
Aufgabe 3.35 Die Temperatur X in einer Kühltruhe, die stets möglichst exakt 18 Grad (Celsius) betragen sollte, unterliegt gewissen Schwankungen. Bei n D 20 Messungen zu zufällig ausgewählten Zeitpunkten (die soweit auseinander lagen, dass Unabhängigkeit unterstellt werden kann) ergab sich das Stichprobenmit2 D 6:806;15. Dabei seien die tel xN D 18;44 und ferner der Wert x12 C C x20 Beobachtungswerte xi als Realisierungen normalverteilter Stichprobenvariablen anzusehen.
Aufgaben zur induktiven Statistik
115
Testen Sie zum Signifikanzniveau 0,05 die Hypothese H0 , dass die Standardabweichung von X höchstens gleich 0,5 ist (gegen H1 W > 0;5) a) unter der Annahme, dass die Temperatur im Mittel den Sollwert von 18 Grad einhält, b) ohne diese Annahme.
Aufgabe 3.36 Nachdem eine Firma für ihr Produkt vier Wochen lang sowohl im Fernsehen als auch durch Plakate geworben hat, werden 250 Personen befragt, ob sie sich an diese Fernseh- bzw. Plakatwerbung erinnern. Die Befragungsergebnisse, die sich als Realisierung einer zweidimensionalen einfachen Stichprobe auffassen lassen, sind in folgender Tabelle zusammengestellt: hhhh hhh an Plakatwerbung erinnern hhhh sich hhh hhhh an Fernsehwerbung h
erinnern sich erinnern sich nicht
42 28
erinnern sich nicht 63 117
Lässt sich hiermit zum Signifikanzniveau ˛ D 0;05 statistisch bestätigen, dass sich von den potenziellen Käufern des Produkts mehr an die Fernsehwerbung als an die Plakatwerbung erinnern?
Aufgabe 3.37 Von einer Firma wird ein neuer, asbestfreier Bremsbelag N entwickelt. Er soll bezüglich der Abriebbeständigkeit mit einem bisher verwendeten asbesthaltigen Bremsbelag A verglichen werden. Dazu werden 40 Scheiben mit dem Belag N unter gewissen vorgegebenen Versuchsbedingungen über einen bestimmten Zeitraum hinweg einer starken Reibung unterzogen, und anschließend wird gemessen (in hundertstel Millimetern), wieviel vom Belag abgerieben ist. Von den resultierenden Werten x1 ; : : : ; x40 sind das arithmetische Mittel xN D 17 und der Wert s12 D 8;4 für die Stichprobenvarianz bekannt. Aus einer früheren Untersuchung, in der 100 Scheiben mit dem Belag A unter den nämlichen Versuchsbedingungen getestet wurden, liegen von den Ergebnissen y1 ; : : : ; y100 die Merkmalssumme y1 C Cy100 D 1:640 und der Wert .y1 y/ N 2 C C.y100 y/ N 2D 891 vor.
116
Aufgaben zur induktiven Statistik
Testen Sie zur Irrtumswahrscheinlichkeit 0,02, ob bezüglich des – unter den vorgegebenen Versuchsbedingungen auftretenden – mittleren Abriebs der Belag N mindestens so gut ist wie der Belag A (b D H0 ) oder nicht (b D H1 ). Ab welcher Grenze ˛ 0 für die Irrtumswahrscheinlichkeit kommt man bei obigen Daten zur Ablehnung von H0 ?
Aufgabe 3.38 Von zwei benachbarten Mineralwasser-Quellen I, II wurden bezüglich des Magnesium-Gehalts zwei unabhängige einfache Stichproben erhoben, wobei die in folgender Tabelle aufgelisteten Werte (in mg pro Liter) aufgetreten sind: Zu I: Zu II:
18,7 24,3
20,4 21,6
19,6 23,5
20,8 24,0
22,5 26,2
19,2 19,8
Die Daten können als Realisierungen normalverteilter Stichprobenvariablen angesehen werden. a) Testen Sie zum Signifikanzniveau ˛ D 0;05, ob die beiden Quellen im Mittel denselben Magnesium-Gehalt liefern oder nicht 1) unter der Annahme, dass die Varianz des Magnesium-Gehalts in beiden Quellen gleich ist 2) ohne diese Annahme. b) Könnte auf Grund der vorliegenden Daten die Annahme 1) statistisch widerlegt werden (zum Signifikanzniveau ˛ D 0;1)?
Aufgabe 3.39 In drei Großstädten wurden bei jeweils 4 Wohnungen vergleichbarer Ausstattung die Brutto-Mieten in € je m2 erhoben. Es ergaben sich im Einzelnen folgende Werte: Stadt I
Stadt II
Stadt III
10,– 9,80 11,– 9,20
14,– 12,– 10,– 12,–
11,– 9,50 13,– 10,50
Aufgaben zur induktiven Statistik
117
Nehmen Sie die Voraussetzungen für die einfache Varianzanalyse als gegeben an und testen Sie mittels dieser Stichprobe zu ˛ D 0;05 die Hypothese, dass die durchschnittliche Brutto-Miete je m2 für Wohnungen der betrachteten Qualitätsstufe in den drei Großstädten gleich ist, gegen die Hypothese, dass hierbei Unterschiede bestehen.
Aufgabe 3.40 a) Um zu überprüfen, inwieweit durch Alkoholgenuss das Reaktionsvermögen beeinträchtigt wird, wurden bei insgesamt 18 Personen unter gewissen Versuchsbedingungen Reaktionszeiten gemessen (in Sekunden). Zum Zeitpunkt des Versuches betrug der Blutalkoholgehalt bei 7 Personen je 0,0 Promille, bei 5 Personen je 0,3 Promille und bei 6 Personen je 0,8 Promille. Es ergaben sich folgende Reaktionszeiten: bei 0,0 Promille: bei 0,3 Promille: bei 0,8 Promille:
0,17 0,26 0,46
0,29 0,18 0,31
0,25 0,34 0,38
0,27 0,26 0,52
0,32 0,21 0,34
0,21
0,24
0,39
Testen Sie unter der Annahme, dass alle 18 Werte Realisierungen unabhängiger normalverteilter Zufallsvariablen mit stets derselben Varianz sind, die Hypothese, dass die Erwartungswerte der Reaktionszeiten bei 0,0 Promille, bei 0,3 Promille bzw. bei 0,8 Promille übereinstimmen (zu ˛ D 0;01). b) Die in a) erhaltenen Daten werden nun zum Anlass genommen zur Aufstellung der Hypothese H0 , dass sich die Reaktionszeiten beim Übergang von 0,0 Promille auf 0,8 Promille im Erwartungswert auf das 1,6-fache erhöhen. Zur Überprüfung von H0 werden jetzt bei 4 (zufällig ausgewählten) Personen je zwei (ebenfalls als normalverteilt angenommene) Reaktionszeiten gemessen, nämlich zunächst die Reaktionszeit Xi bei 0,0 Promille, dann (nach entsprechenden Vorbereitungen) die Reaktionszeit Yi bei 0,8 Promille, wobei sich Folgendes ergibt: Person i
1
2
3
4
xi yi
0,20 0,28
0,15 0,29
0,25 0,44
0,20 0,31
Testen Sie H0 zum Signifikanzniveau ˛ D 0;05, indem Sie die Xi umrechnen in Xi0 D 1;6Xi . Wählen Sie als Alternativhypothese die Beziehung x0 < y , wobei x0 D E.Xi0 / und y D E.Yi / gesetzt sind.
118
Aufgaben zur induktiven Statistik
Aufgabe 3.41 In einer Kleinstadt teilen sich fünf Apotheken den Markt mit folgenden Anteilen Apotheke
1
2
3
4
5
Marktanteil in %
15
10
20
35
20
a) Bestimmen Sie die Knickpunkte der zugehörigen Lorenzkurve. b) Berechnen Sie den Gini-Koeffizienten. c) Innerhalb einer bestimmten Stunde wurden bei jeder der fünf Apotheken die eintretenden Kunden gezählt mit folgenden Ergebnissen: Apotheke
1
2
3
4
5
Kunden
30
25
65
105
75
Nehmen Sie die angegebenen Daten als Realisierungen einer einfachen Stichprobe an und testen Sie damit die Hypothese, dass die Verteilung der Kunden auf die einzelnen Apotheken den oben angegebenen Marktanteilen der Apotheken entspricht (zu ˛ D 0;05).
Aufgabe 3.42 Die von einer Maschine M0 hergestellten Stücke werden nach ihrer Fertigstellung einer Kontrolle unterzogen und anhand des Ergebnisses dieser Kontrolle mit einer der Qualitätsbezeichnungen 1, 2, 3 oder 4 beurteilt. Auf Grund langer Erfahrung sind die Wahrscheinlichkeiten für die einzelnen Qualitätsstufen bekannt: 1
2
3
4
0,18
0,32
0,40
0,10
Qualitätsstufe bei M0 Wahrscheinlichkeit
Die Leitung der Firma steht vor der Frage, ob die Maschine M0 durch eine andere Maschine M1 ersetzt werden soll. Von M1 ist lediglich bekannt, dass nach einem Probelauf von 100 Stück, der als einfache Stichprobe angesehen werden kann, die vier Qualitätsstufen mit folgenden Häufigkeiten auftreten: Qualitätsstufe bei M1
1
2
3
4
Häufigkeit
24
36
30
10
Testen Sie jeweils zum Signifikanzniveau 0,05,
Aufgaben zur induktiven Statistik
119
a) ob M1 bezüglich der Qualitätsstufen dieselbe Verteilung besitzt wie M0 ; b) ob der Erwartungswert 1 der Qualitätsstufe bei Einsatz der Maschine M1 größer oder gleich dem entsprechenden Erwartungswert 0 bei Maschine M0 ist (gegen H1 W 1 < 0 ).
Aufgabe 3.43 In einer Autoreparaturwerkstatt ist der tägliche Verbrauch an einem bestimmten Reinigungsmittel eine (in Litern gemessene) Zufallsvariable X , deren Wahrscheinlichkeitsverteilung sich über einen längeren Zeitraum hinweg nicht ändert. Ferner seien die Mengen, die von dem Mittel an zwei verschiedenen Tagen verbraucht werden, stets voneinander unabhängig. Für X wird eine stetige Dichtefunktion der Form 8 ˆ für x 4:378 auf `iC1 übergegangen wird – die 20 Kunden mit den Nummern 3:808; 1:745; 3:669; 1:502; 3:834; 2:119; 4:026; 3:024; 1:915; 644; 49; 3:667; 302; 162; 555; 3:901; 2:064; 3:409; 4:189; 92: b) Da entsprechend dem Modell „mit Zurücklegen“ ausgewählt wird, handelt es sich um eine (4-dimensionale) einfache Stichprobe. b ; z n // W c) Stichprobenraum D f..x1 ; y1 ; z1b ; z1n /; : : : ; .x20 ; y20 ; z20 20 xi 2 f0; 1gI yi 2 NI zib ; zin 2 f1; : : : ; 5gg (Der Wertebereich der yi lässt sich eventuell durch Angabe einer Obergrenze beschränken.) d) Bezüglich X ist die Grundgesamtheit dichotom bzw. genauer B 1I 2:159 4:378 verteilt (da xi D 1 für weiblich steht).
Lösung zu Aufgabe 3.2 a)
˛)
0;2 D P .Xi > c1 / ” ” ”
0;8 D P .Xi c1 / D ˆ c1 7;2 0;8
D 0;842
c1 D 7;87
c1 7;2 0;8
vgl. (81) siehe Tabelle 3
Lösungen zur induktiven Statistik
125
ˇ) nach 11.2.4, 1a) genügt XN einer N 7;2I p0;8 -Verteilung; hieraus 51
folgen die Äquivalenzen: 0;8 D P .XN > c2 / 7;2 p 0;2 D P .XN c2 / D ˆ c20;8 51 p 2 0;8 D ˆ 7;2c 51 0;8 p 7;2c2 51 D 0;842 0;8
” ” ” ”
vgl. (81)
c2 D 7;11
) nach 11.2.4, 1b) genügt ZD
51 1 X .Xi 7;2/2 0;64 iD1
einer 2 .51/-Verteilung; somit gilt 0;8 D P
51 X
! 2
.Xi 7;2/ > c3
iD1
c3 DP Z> 0;64
c3 ; 0;2 D P Z 0;64
bzw.
c3 ist das 0,2-Fraktil x0;2 der 2 .51/-Verteilung, welches sich d.h. 0;64 mithilfe des 0,2-Fraktils xQ 0;2 D xQ 0;8 D 0;842 der N .0I 1/Verteilung gemäß Seite 141 bestimmen lässt; damit erhalten wir p c3 D 0;64 x0;2 D 0;64 12 .0;842 C 101/2 D 27;13:
Nach Seite 141 gilt ferner E
51 X
! .Xi 7;2/
2
D E.0;64 Z/ D 0;64 E.Z/
iD1
Var
51 X iD1
! .Xi 7;2/2
D 0;64 51 D 32;64 D Var.0;64 Z/ D 0;642 Var.Z/ D 0;4096 102 D 41;78:
126
Lösungen zur induktiven Statistik
b) Nach 11.2.4, 1b) bzw. 1c) genügen T D und
15 22
S22
einer
2 .15/-Verteilung.
p YN 2 16 einer S2
t.15/-Verteilung
Hieraus folgt
˛) auf Grund der Symmetrie der t-Verteilung: P .jT j < c4 / D D D D D 1;8 ” 2 D ” c4 D ˇ)
P .c4 < T < c4 / P .T < c4 / P .T c4 / P .T < c4 / P .T c4 / P .T < c4 / Œ1 P .T < c4 / 2P .T < c4 / 1 D 0;8 0;9 D P .T < c4 / D P .T c4 / 1;341 vgl. Tabelle 4
P .S22 c5 22 / D P
15 22
S22 15c5 D 0;8
” 15 c5 D 19;31 ” c5 D 1;287
vgl. Tabelle 5:
c) Nach 11.2.4, 1b) gilt: 50 S12 =12 ist 2 .50/-verteilt, und 15 S22 =22 ist 2 .15/-verteilt. Wegen 12 D 22 erhalten wir somit für S12 =S22 eine F.50; 15/-Verteilung. Folglich ist ! S12 15 D 1;15 und D E 13 S22 ! S12 2 152 .15 C 50 2/ 28:350 D 0;31: D D Var 2 2 92:950 50 .15 4/.15 2/ S2 Ferner gilt: ˛) P
S12 S22
S12
! D 0;05
> c6 !
c6 D 0;95 S22 ” c6 D 2;18 vgl. Tabelle 6; ” P
Lösungen zur induktiven Statistik ˇ)
0
51 P
B B iD1 PB 16 @ P
.Xi XN /2
iD1
P
S12
” P
S12
S22 S22
127
.Yi YN /2
1 C C > c7 C D P A
50S12
15S22
! > c7
D
! D 0;99
> 0;3 c7 ! 0;3 c7
D 0;01
1 xQ 0;99 1 ” c7 D D 1;38: 0;3 2;42
” 0;3 c7 D
Dabei ist xQ 0;99 gleich dem 0,99-Fraktil der F.15; 50/-Verteilung, vgl. (98).
Lösung zu Aufgabe 3.3 a) Aus E.Xi / D p1 C 2p2 und E.Xi2 / D p1 C 4p2 folgt mit (87), (88): n
1X Œ2E.Xi / E.Xi2 / E.PO1 / D n iD1 n 1X .2p1 C 4p2 p1 4p2 / D p1 D n iD1 n 1 X O E.P2 / D ŒE.Xi2 / E.Xi / 2n iD1 n 1 X .p1 C 4p2 p1 2p2 / D p2 : D 2n iD1
b) Wegen p0 D 1 p1 p2 ist n 3 1X 1 2 O O 1 Xi C X i 1 P1 P2 D n 2 2 iD1
erwartungstreu für p0 .
128
Lösungen zur induktiven Statistik
c) Folgende Tabelle gibt für xi D 0; 1 oder 2 die resultierenden Werte von 2xi xi2 bzw. von 12 .xi2 xi / an: 0 1 2
xi xi2
2xi 1 2 2 .xi
0 1 0 xi / 0 0 1
O 1 und PO2 D ‚ O 2 ; d.h. POj liefert für alle StichprobenHieraus folgt PO1 D ‚ O j , j D 1; 2. realisationen das gleiche Schätzergebnis wie ‚
Lösung zu Aufgabe 3.4 a)
Z E.Xi / D
1
0
"
2x 3 .1 #/ x 2# C 2 3
D E.Xi2 / D D
xŒ# C 2.1 #/x dx
Z
1
"0
!#1 D 0
1 .4 #/ 6
x 2 Œ# C 2.1 #/x dx !#1 x 4 .1 #/ 1 x 3# C D .3 #/ 3 2 6 0
b)
1 6 n .4 #/ D # n 6 6 O 2 / D 3 n 1 .3 #/ D # E.‚ n 6
O 1/ D 4 E.‚
c) Die Gültigkeit von 1 1 1 O E.‚/ D ˛ n .4 #/ C ˇ n .3 #/ n 6 6 1 D Œ4˛ C 3ˇ .˛ C ˇ/# D # 6 für alle # 2 Œ0I 2 ist äquivalent mit 4˛ C 3ˇ D 0;
˛ C ˇ D 6;
d.h. mit ˛ D 18; ˇ D 24:
Lösungen zur induktiven Statistik
129
Lösung zu Aufgabe 3.5 Es ist Var.XN / D Var.X /=n 65=n: Die geforderte Bedingung Var.XN / 1 ist dann erfüllt, wenn 65 1 n gilt, d.h. wenn n 65 ist.
Lösung zu Aufgabe 3.6 Die Standardabweichung der Schätzfunktion N XN ist q s N Var.XN / D N p ; n wobei s nach Prämisse gleich der aus den Buchwerten errechneten Standardabweichung gesetzt werden darf. Die Genauigkeitsanforderung besagt s N p 0;005B n
bzw.
p
n
Ns ; 0;005B
woraus sich durch Quadrieren und Einsetzen von N; B; s schließlich n
10:000 270 0;005 18:000:000
2
D 900
ergibt. Somit müssen mindestens 900 (d.h. 9 %) der Lagerpositionen körperlich erfasst werden. Bemerkung: Nach § 241 (1) HGB ist eine Stichprobeninventur zulässig, wenn es sich „um ein anerkanntes mathematisch-statistisches Verfahren“ handelt. Die freie Hochrechnung ist der einfachste Verfahrenstypus, der hierzu infrage kommt. Verfeinerte Verfahren stellen geschichtete Stichprobenverfahren (vgl. Aufgabe 3.17) oder gebundene Hochrechnungen dar. Obige Genauigkeitsanforderung kann folgendermaßen gedeutet werden: Ein Schätzintervall für den Lager-Ist-Wert zum Konfidenzniveau von etwa 0,95 entsteht durch Addition bzw. Subtraktion der zweifachen Schätz-Standardabweichung (wäre N XN exakt normalverteilt, so müsste man das 1,96-fache nehmen). Bezeichnet man diese doppelte Standardabweichung als Schätzfehler, so wird offensichtlich gefordert, dass der Schätzfehler höchstens 1 % des Buchwertes betragen darf. Die eigentlich anzustrebende Forderung, dass der Schätzfehler höchstens 1 % des Ist-Wertes be-
130
Lösungen zur induktiven Statistik
tragen soll, ist nicht operational, da der Ist-Wert im Zeitpunkt der Disposition über den Stichprobenumfang nicht bekannt ist. Man kann jedoch davon ausgehen, dass die eigentlich anzustrebende Genauigkeitsforderung nicht wesentlich verfehlt wird. Wegen weitergehender Fragen sei verwiesen auf T. Broermann [1987], A. Drexl [1985], Scherrer/Obermeier [1981], L. Sturm [1983].
Lösung zu Aufgabe 3.7 a) Einsetzen liefert den Schätzwert pO D b) Wegen
1 4 5 600 D 3 3 1:000 3 n
1X Ai E n
! D E.Ai /
iD1
gilt 4 5 E.Ai /: 3 3 E.Ai / D P .Ai D 1/ ist die Wahrscheinlichkeit für eine Ja-Antwort. Folgender Ereignisbaum veranschaulicht das Zustandekommen der Anworten: E.PO / D
1 5
1 oder 2 gezogen
: Antwort „nein“
4 5
3 bis 10 gezogen
: Antwort „ja“
1 5
1 oder 2 gezogen
: Antwort „ja“
4 5
3 bis 10 gezogen
: Antwort „nein“
steuerehrlich
1
p
p Schwindler
Ereignisbaum zur Antwortverschlüsselung
Lösungen zur induktiven Statistik
131
Demnach ist E.Ai / D .1 p/
1 4 3 4 Cp D p 5 5 5 5
und 4 5 E.PO / D 3 3
4 4 5 3 4 3 p D C p D p; 5 5 3 3 3 5
so dass PO erwartungstreu für p ist. c) Unter Berücksichtigung des bei b) ermittelten Ergebnisses, dass Ai einer Binomialverteilung B.1I p/ Q
mit pQ D
4 3 p 5 4
genügt, ergibt sich aus den gängigen Regeln für die Varianzbildung: ! n X Q p/ Q 25 p.1 25 1 Var Ai D Var.PO / D 9 n 9 n iD1 25 4 3 4 3 p 1 p D 9n 5 5 5 5 4 1 : D p 2 C p C n 9 Bemerkung: Dem Problem der Antwortverschlüsselung ist eine eigene Monographie gewidmet, nämlich W. Deffaa [1982].
Lösung zu Aufgabe 3.8* a) Analog wie bei der Lösung von Aufgabe 3.7 kann man sich das Problem bzw. die Rechnung mittels eines Ereignisbaumes veranschaulichen. Im Fall eines beliebigen q-Wertes gilt: E.Ai / D Wahrscheinlichkeit für Ja-Antwort D .1 p/q C p.1 q/ D q C p.1 2q/: Ist q D 0;5, so gilt stets (d.h. für jedes p) E.Ai / D 0;5. Ein Rückschluss von der Empirie auf das wahre p ist dann unmöglich. Falls q ¤ 0;5, kann
132
Lösungen zur induktiven Statistik p durch E.Ai / ausgedrückt werden: pD
1 q C E.Ai /: 1 2q 1 2q
Da E.Ai / erwartungstreu durch n
1X Ai AN D n iD1
geschätzt werden kann, und da ferner obiger Zusammenhang linear ist, stellt ! n X 1 q 1 Ai PO D C 1 2q 1 2q n iD1
eine erwartungstreue Schätzfunktion für p dar. b) Analog wie in der Lösung von Aufgabe 3.7 besitzt PO die Varianz Var.PO / D
1 p.1 Q p/ Q 2 n .1 2q/
mit pQ D E.Ai / D q C p.1 2q/: Var.PO / ist für jedes q (q ¤ 0;5) eine in p quadratische Funktion, nämlich q.1 q/ p.1 p/ C : Var.PO / D n n.1 2q/2 Der Design-Parameter q wirkt nur auf das absolute Glied ein. Es liegt eine Schar parallel verschobener konkaver Parabeln vor. Das optimale Design ist durch das kleinste absolute Glied definiert. Aus der Wertetabelle Parameter q
0;1
0;2
0;3
abs. Glied
0;14 n
0;44 n
1;31 n
0;4 0;6 6 n
6 n
0;7
0;8
0;9
1;31 n
0;44 n
0;14 n
erkennt man: Wegen der Symmetrie (des absoluten Glieds um den Wert q D 0;5) ist sowohl die Prozedur für q D 0;1 wie diejenige für q D 0;9 optimal, d.h. das zur Antwort-Anonymisierung vereinbarte Lügen sollte entweder nur bei einer speziellen Karte oder bei neun Karten vorgesehen werden. Insbesondere sieht man, dass ein Zielkonflikt zwischen der Minimierung der Varianz und der Maximierung der Anonymisierung vorliegt.
Lösungen zur induktiven Statistik
133
Lösung zu Aufgabe 3.9 O n / D E.XNn / D D b nach Fig. 38 und Fig. 36. Der Wertebereich a) E.‚ 2 von Y D maxfX1 ; : : : ; Xn g ist (wie der Wertebereich der Xi ) gleich Œ0I b, und für einen Wert y 2 Œ0I b gilt F.y/ D P .Y y/ D P fmax.X1 ; : : : ; Xn g y/ D D P .alle Xi nehmen nur Werte y an/ D D P .X1 y; : : : ; Xn y/ D P .X1 y/ P .Xn y/ y yn y D D n; b b b vgl. hierzu Seite 117 oben, und f .y/ D
n y n1 : bn
Hieraus folgt 1 E.Y / D 2 b n n D D nC1 2 nC1
O 0 / D E. 1 Y / D E.‚ n 2
1 2
Z
b
0
#b " n y nC1 yf .y/dy D n 2b nC1
0
und
nC1 O 0n / D : E.‚ n O erwartungstreu für . ‚ O 0 ist asymptotisch erO n und ‚ Folglich sind ‚ n n wartungstreu für . O n / D E.‚
b) Nach Fig. 38 und Fig. 36 berechnet man 2 O n / D Var.XNn / D Var.X / D b Var.‚ n 12n
O / D E.‚ O 2 / ŒE.‚ O /2 Var.‚ n n n ! DE Mit 2
E.Y / D
2 2 .n C 1/2 2 2 D .n C 1/ E.Y 2 / b : Y 4 4n2 4n2
Z 0
b
" 2
y f .y/ dy D
n y nC2 bn n C 2
#b D 0
nb 2 nC2
134
Lösungen zur induktiven Statistik ergibt sich also O / Var.‚ n
" # .n C 1/2 b2 b2 n D : D 4n nC2 4n.n C 2/
Für jedes n > 1 gilt b2 b2 > 12n 4n.n C 2/
. ” .n C 2/ > 3/;
O n . Für n D 1 stimmen O ist wirksamer als das Stichprobenmittel ‚ d.h. ‚ n O überein. O n und ‚ ‚ n
c) Da alle drei Schätzfunktionen zumindest asymptotisch erwartungstreu für sind, und da für n ! 1 b2 ! 0; 12n b2 O / D ! 0; Var.‚ n 4n.n C 2/ O n/ D Var.‚
und O 0n / D Var Var.‚
n2 n O O n / ! 1 0 D 0 ‚n D Var.‚ nC1 .n C 1/2
O 0 /, .‚ O / nach Seite 151 konsistent O n /, .‚ gelten, sind alle drei Folgen .‚ n n für . Bemerkung: Das Ergebnis dieser Aufgabe zeigt, dass das Stichprobenmittel nicht immer die wirksamste unter allen erwartungstreuen Schätzfunktionen für den Erwartungswert einer Grundgesamtheit ist. Dies ist kein Widerspruch zur Aussage 1a des Beispiels 68; denn nicht für jede Verteilung der GrundgesamtO erwartungstreu für (vgl. auch die Fußnote heit ist obige Schätzfunktion ‚ n auf Seite 149). Bei gegebener Gleichverteilung über Œ0I b ist die VarianzreduO im Vergleich zum Stichprobenmittel beträchtlich, wie aus dem zierung von ‚ n Quotienten nC2 Var.XNn / D O 3 Var.‚n / ablesbar ist. (Bereits für n D 10 z.B. ist dieser Quotient gleich 4).
Lösungen zur induktiven Statistik
135
Lösung zu Aufgabe 3.10* a) Als Extremalwerte der Funktion ni k X X
.xij ai /2
iD1 j D1
unter der linearen Nebenbedingung a1 C C ak D 0 kommen nur Punkte .I O aO 1 ; : : : ; aO k / infrage, in denen sämtliche partiellen Ableitungen der Lagrange-Funktion 1 0 ni k k X X X .xij ai /2 C @ ai A L.I a1 ; : : : ; ak I / D iD1 j D1
iD1
null sind, d.h. die das Gleichungssystem k
n
i XX @L D 2 .xij ai / D 0 @
@L D 2 @ai
iD1 j D1 ni X
.xij ai / C D 0
i D 1; : : : ; k
j D1
k X @L D ai D 0 @ iD1
erfüllen. Dieses Gleichungssystem ist äquivalent mit ni k X X iD1 j D1 ni X
xij D n C
k X
.˛/
ni ai
iD1
xij D ni C ni ai C
j D1 k X
ai D 0
2
.ˇ; i/
i D 1; : : : ; k
. /
iD1
O der dieses Gleichungssystem erfüllt, Für einen Vektor .I O aO 1 ; : : : ; aO k I /, folgt durch Summation über die Gleichungen .ˇ; i/, i D 1; : : : ; k, und einem Vergleich mit .˛/, dass O D 0 gelten muss.
136
Lösungen zur induktiven Statistik Mit der Bezeichnung xN i D
ni 1 X xij ni j D1
für das i-te Teilstichprobenmittel (das arithmetische Mittel der ni Beobachtungen zur Düngemethode i) erhält man dann aus .ˇ; i/ die Gleichung xN i D O C aO i : Hieraus und aus . / folgen schließlich k 1X xN i D O k iD1
und aO i D xN i
k 1X xN i k
i D 1; : : : ; k:
iD1
Umgekehrt erfüllt der aus diesen Komponenten bestehende Vektor .I O aO 1 ; : : : ; aO k / zusammen mit O D 0 die Gleichungen .˛/, .ˇ; i/ und . /, wie man durch Einsetzen verifiziert. Dass es sich bei diesem Vektor .I O aO 1 ; : : : ; aO k / um eine MinimalstelPk Pni 2 le von .x a i / handelt, ist auf Grund der streniD1 j D1 ij gen Konvexität dieser Funktion sowie der Linearität der Nebenbedingung a1 C C ak D 0 klar. (Man kann diesen Nachweis auch mithilfe der Hesse-Matrix führen.) Die nach dem Prinzip der kleinsten Quadrate resultierenden Schätzfunktionen sind demnach k
1X N Xi MO D k iD1 AOi D XNi MO b) Aus
i D 1; : : : ; k:
ni ni 1 X 1 X E.Xij / D . C ai / D C ai E.XNi / D ni ni j D1
j D1
Lösungen zur induktiven Statistik
137
und
k X
ai D 0
iD1
folgt: k 1X O . C ai / D E.M / D k iD1 E.AOi / D . C ai / D ai :
MO und AOi sind somit erwartungstreu (für bzw. ai ). c) Mit xN 1 D xN 2 D xN 3 D
1 6 1 4 1 5
9:590 D 1:598;33; 14:500 D 3:625; 5:930 D 1:186
erhält man die Schätzwerte O D 2:136;44I
aO 1 D 538;11I
aO 2 D 1:488;56I
aO 3 D 950;44:
Bemerkungen: 1. Der Schätzwert O stimmt hier nicht mit dem Gesamtmittel k
xN Ges D
n
i 1 XX xij n
iD1 j D1
aller n Beobachtungswerte überein; O ist vielmehr das arithmetische Mittel der k Teilstichprobenmittel XNi . Eine Übereinstimmung liegt jedoch vor, wenn alle Teilstichprobenumfänge ni , (i D 1; : : : ; k) gleich sind. 2. Bei dem dieser Aufgabe zu Grunde liegenden Ansatz spricht man von einem Modell der einfachen Varianzanalyse. Namensgebend war dabei die Tatsache, dass Tests auf Gleichheit aller Erwartungswerte, d.h. Überprüfungen der Hypothese a1 D D ak , mithilfe gewisser Stichprobenvarianzen durchgeführt werden, siehe dazu den Abschnitt 14.7. Werden in obiger Situation die Auswirkungen nicht nur des einen „Faktors“ Düngemethode, sondern auch noch eines zweiten „Faktors“ (z.B. der Zusammensetzung des Bodens) auf den Nitratgehalt von Kopfsalat untersucht, so hat man es mit einer zweifachen Varianzanalyse zu tun.
138
Lösungen zur induktiven Statistik
Lösung zu Aufgabe 3.11 a) Stichprobenraum D f.x1 ; : : : ; x15 / W xi 2 N [ f0gg: b) Für die gegebenen Werte x1 ; : : : ; x15 erhält man f .x1 ; : : : ; x15 j / D
x1 x15 e e x1 ! x15 !
x1 CCx15 n 71 D e 15 : e 15 2;53 1033 Q xi ! iD1 ! 15 P 1 C xi ln n folgt c) Aus ln f .x1 ; : : : ; xn j / D ln 15 Q D
i D1
xi !
iD1
15
1X @ ln f .x1 ; : : : ; xn j / D xi n und @ iD1
15 1 X @2 ln f .x ; : : : ; x j / D xi < 0I n 1 @2 2 iD1
der ML-Schätzwert O für D E.X / D (vgl. Fig. 36) ist demnach gegeben durch 15
15
iD1
iD1
1X 71 1X D 4;73: xi n D 0 ” O D xi D xN D O n 15 d) Nach der Herleitung in c) ist XN die ML-Schätzfunktion für ; sie ist nach Fig. 38 erwartungstreu für .
Lösung zu Aufgabe 3.12 a) Die Dreieckshöhe h ist definiert durch die Forderung durch h D #2 . Die Dichte ist demnach f .x/ D f .x j #/ D
2 2 2 x # #
für
1 2
h # D 1, d.h.
0 x #I
außerhalb des Intervalls Œ0I # ist sie natürlich gleich null.
Lösungen zur induktiven Statistik
139
b) Der Maximum-Likelihood-Schätzwert #O ist definiert durch ˇ ˇ 4 2 D 0; 2 C 3 x ˇˇ # # #D#O woraus #O D 2x D 95;6 folgt. Wegen ˇ ˇ ˇ 4 3 @2 f .x j #/ ˇˇ ˇ x D 1 ˇ ˇ 2 3 ˇ # @# # #D2x #D2x 1 4 3 x D 3 0 Die Funktionen h1 .t/ D t C1 1 1 1 t 0 (wegen h01 .t/ D .t C1/ 2 > 0 und h2 .t/ D . 2 / ln. 2 / < 0) streng monoton. Nach dem Satz von Seite 155 erhält man daher die ML-Schätzfunktionen
n
für W
n P
n
iD1 n P
für p W
ln Xi
n
2 i D1
ln Xi
:
c) tO D
6 D 1;05I 5;73
O D 0;51I
pO D 0;48:
Lösungen zur induktiven Statistik
141
Lösung zu Aufgabe 3.14* a) Wir erhalten fa .x/
x a 0 2a Dichtefunktion der Dreiecksverteilung b) Gesucht ist derjenige Wert a, O in dem die Funktion g.a/ D f .2; 3; 5; 7 j a/ D fa .2/ fa .3/ fa .5/ fa .7/ ihr Maximum annimmt. Da mit Wahrscheinlichkeit 1 nur Werte aus dem Bereich mit positiver Dichte, also aus .0I 2a/, auftreten können, ist die Funktion g.a/ nur für Werte a mit 2a > 7, d.h. mit a > 3;5, von Interesse. Um die Funktion g.a/ im relevanten Bereich .3;5I 1/ zu erstellen und zu maximieren, ist eine Fallunterscheidung zweckmäßig, wobei für die einzelnen Fälle maßgeblich ist, wie viele der Beobachtungen aus dem Bereich mit aufsteigender Dichte, d.h. aus Œ0I a, bzw. aus dem Bereich mit fallender Dichte, d.h. aus .aI 2a, stammen. Fall 1: Alle vier Beobachtungen stammen aus Œ0I a. Dies ist mit a 7 äquivalent, und es ergibt sich g.a/ D
210 2 3 5 7 2 2 2 D 8 ; 2 a a a a a
a 2 Œ7I 1/;
D 0;000036 > g.a/ für alle a 7, denn g.a/ ist mit g.7/ D 210 78 für a 7 monoton fallend. Fall 2: Die Werte 2, 3 und 5 stammen aus Œ0I a, der Wert 7 aus .aI 2a. Äquivalent hierzu ist 5 a < 7, und man erhält g.a/ D
30 .2a 7/ 2 3 5 2a 7 D ; a2 a2 a2 a2 a8
Hierbei gilt g.5/ D
90 58
a 2 Œ5I 7/:
D 0;000230 > g.a/ für alle a 2 Œ5I 7/, denn
über .5I 7/ ist die Ableitung g0 .a/ D
420.4a/ a9
< 0.
142
Lösungen zur induktiven Statistik Fall 3: Die Werte 2 und 3 stammen aus Œ0I a, die Werte 5 und 7 aus .aI 2a. Dies führt, da wir uns nach obiger Überlegung auf Werte a > 3;5 beschränken können, zum letzten noch zu untersuchenden Bereich 3;5 < a < 5. In ihm gilt g.a/ D
6 .4a2 24a C 35/ 2 3 2a 5 2a 7 D a2 a2 a2 a2 a8
und g0 .a/ D 48 .3a2 C 21a 35/. Eine Nullstelle a von g0 .a/ a9 liegt im Intervall .3;5I 5/ genau dann vor, wenn 3a2 C 21a 35 D 0 bzw.
p 21 C 21 D 4;264 a D 6 p
gilt. (Die zweite Nullstelle 216 21 der quadratischen Gleichung liegt außerhalb .3;5I 5/.) Bei a handelt es sich um eine Maximalstelle von g im Bereich .3;5I 5/ – da g0 .a/ > 0 für a < a und g0 .a/ < 0 für a > a ist – und es gilt g.a / D 0;000296: Aus den Ergebnissen der drei Fälle (g.4; 264/ > g.5/ > g.7/) erhalten wir den Maximum-Likelihood-Schätzwert aO D a D 4;264:
Lösungen zur induktiven Statistik
143
Lösung zu Aufgabe 3.15 a) Nach (80) gilt: 1 f .4:997 j # D 1/ D p 2 1 D p 2 1 f .4:997 j # D 2/ D p 2 1 f .4:997 j # D 3/ D p 2
e
.4:9975:003/2 18
3 1 1 e 2 0;0451 D p 3 2 1 1 49 e 50 D p 0;0751 5 2 169 1 1 0;0463: e 388 D p 12 2
Sowohl die Maximum-Likelihood-Methode als auch die Verwendung des zu '.1/ D '.2/ D '.3/ D 13 gehörenden a posteriori Modus liefert daher den Schätzwert #O D 2. (Der Nenner f .x j # D 1/'.1/ C f .x j # D 2/'.2/ C f .x j # D 3/'.3/ ist zur Bestimmung des a posteriori Modus nicht erforderlich.) Aus '.1/ W '.2/ W '.3/ D 3 W 2 W 1 folgt '.1/ D 21 ;
'.2/ D 13 ;
'.3/ D 16 :
Zu vergleichen sind nun: 1 1 0;0226 f .4:997 j # D 1/ D p 2 2 1 1 0;0250 f .4:997 j # D 2/ D p 3 2 1 1 f .4:997 j # D 3/ D p 0;0077: 6 2 Der a posteriori Modus ist also auch hier #O D 2. b) Der a posteriori Erwartungswert liegt im Allgemeinen nicht in der Menge f1; 2; 3g der möglichen Geschwindigkeitsstufen.
144
Lösungen zur induktiven Statistik
Lösung zu Aufgabe 3.16 a) Für jedes k > 0 gilt '.0/ D '.1/ D 0 < '.p/ für alle
p 2 .0I 1/;
wobei ' stetig ist. Folglich existiert (mindestens) ein Modus pMod der a priori Verteilung mit der Dichte ', es gilt pMod 2 .0I 1/, und die (in .0I 1/ existierende) Ableitung ' 0 .p/ D .k C 1/.k C 2/.1 p/k1 Œ.1 p/ kp hat an der Stelle p D pMod den Wert 0. Da p D .k C 1/1 die einzige Nullstelle von ' 0 .p/ im Bereich .0I 1/ ist, folgt pMod D .k C 1/1 , und dieser Wert ist genau dann gleich 0,025, wenn k D 39 ist. Die resultierende Dichte lautet somit
1:640 p.1 p/39 für 0 p 1 '.p/ D 0 sonst b) Das Ergebnis x1 ; : : : ; x120 der B.1I p/-verteilten Stichprobenvariablen Xi ist durch x1 C Cx120 D 1 gegeben; die zugehörige Likelihood-Funktion lautet demnach f .x1 ; : : : ; x120 j p/ D p.1 p/119 : Analog zur Seite 157 ergibt sich hiermit für 0 < p < 1 die a posteriori Dichte .p j x1 ; : : : ; x120 / D
p.1 p/119 '.p/ R1 0
D
D
p.1 p/119 '.p/ dp
p 2 .1 p/158 161! 2! 158!
159 160 161 2 p .1 p/158 2
sowie der a posteriori Erwartungswert pO D D
159 160 161 2
Z 0
1
p 3 .1 p/158 dp
3 159 160 161 3! 158! D D 0;0185 D 1;85 %: 2 162! 162
Lösungen zur induktiven Statistik
145
Lösung zu Aufgabe 3.17 a) (Geschätzter) Inventurwert D ! 10 1 1 X .9 50 C 150/ D 60N D 6:000:000: Ni xN i D N N N 10 iD1
b) Da alle Ni gleich sind, führen die Formeln (150) bzw. (151) des Falles mit bzw. ohne Zurücklegen zu derselben optimalen Aufteilung. p (Denn bei der Berechnung von ni gemäß (151) tritt der Korrekturfaktor 104 =.104 1/ jeweils sowohl im Zähler als auch im Nenner als Faktor auf. Die Restriktionen ni Ni stellen sich wegen Ni D 104 als irrelevant heraus.) Es ergibt sich der Proportionalitätsfaktor ˛D
n 10 P j D1
D
Nj j
104
1 5:000 D 400 .5 10 C 5 30/
und damit die optimale Aufteilung 8 4 10 10 ˆ ˆ ˆ < 400 D 250 ni D ˛Ni i D ˆ 4 ˆ ˆ : 10 30 D 750 400
für i D 1; : : : ; 5 für i D 6; : : : ; 10:
Lösung zu Aufgabe 3.18 a) Bei proportionaler Aufteilung gilt (vgl. Seite 247): ni D konstant Ni
und
3 X iD1
ni D n;
d.h.
ni Ni D : n N
Hieraus folgt n1 D 0;4 400 D 160I
n2 D n3 D 0;3 400 D 120:
146
Lösungen zur induktiven Statistik Die Varianz der zugehörigen Schichtschätzfunktion ist nach (147) gleich 25 100 1 2 2 2 2 C 0;3 N 2 D 0;4 N 0;4 400 0; 3 400 N2 1 .10 C 60/ D 0;175: 400
b) Mit ˛D
n 3 P j D1
D
Nj j
50 400 D N .0;4 5 C 0;3 10 2/ N
erhalten wir nach (150) die optimale Aufteilung 8 < 50 0;4 N 5 D 100I i D 1 N ni D : 50 0;3 N 10 D 150I i D 2; 3: N Die Varianz der zugehörigen Schichtschätzfunktion ist 1 2 25 2 100 C 0;09 N 2 D 0;16: 0;16 N 100 150 N2 c) Nach Fig. 38 gilt Var.XN / D
2 400
D
120 400
D 0;3.
d) Die Varianz der Schichtschätzfunktion bei proportionaler Aufteilung, also i bei ni D ni D N N n, ist gleich 0 1 k k 2 X X N 1 1 1 D @ Ni i2 A : Ni2 i Ni n n N N2 iD1
iD1
2 Die Varianz von XN ist dagegen gleich n . Dabei setzt sich die mittlere quadratische Abweichung 2 in der Grundgesamtheit nach (13) aus den beiden positiven Termen der internen bzw. externen mittleren quadratischen Abweichung zusammen, ist also größer gleich der internen mittleren quadratischen Abweichung N1 .N1 12 C C Nk k2 /, womit die Behauptung bewiesen ist.
Lösungen zur induktiven Statistik
147
Lösung zu Aufgabe 3.19 a) Es sind N1 D N8 , N2 D N4 D N4 , N3 D 3N 8 . Die im Fall ohne Zurücklegen (vergleiche hierzu (151) mit (150)) auftretenden Korrekturfaktoren p Ni =.Ni 1/ sind (wegen Ni N1 D 5 Millionen) vernachlässigbar; ferner ist n < Ni für alle i. Die im Fall ohne Zurücklegen im Allgemeinen noch zu beachtenden Nebenbedingungen ni Ni sind somit automatisch erfüllt. b) Da das Untersuchungsmerkmal in Schicht i dichotom (genauer: B.1I pi /verteilt) ist, gilt i2 D pi .1 pi /, vgl. Fig. 36. c) Aus O 1 D 0;30I
O 2 D 0;20I
O 3 D 0;18I
O 4 D 0;16
erhält man gemäß (150) mit ˛D
2:600 4 P j D1
Nj Oj
D
2:600 N 8
.0;30 C 2 0;20 C 3 0;18 C 2 0;16/
die Stichprobenumfänge 8 40:000 N ˆ ˆ ˆ ˆ ˆ 3N 8 ˆ ˆ ˆ ˆ 40:000 N ˆ ˆ ˆ < 3N 4 ni D ˆ 40:000 3N ˆ ˆ ˆ ˆ ˆ 3N 8 ˆ ˆ ˆ ˆ ˆ N 40:000 ˆ : 3N 4
0;30 D 500I
i D1
0;20 667I
i D2
0;18 D 900I
i D3
0;16 533I
i D4
D
40:000 3N
d) Der aus dem Wahlergebnis zu schätzende Wähleranteil von Partei A in der neuen dritten Schicht ist gleich (geschätzte) Anzahl Wähler von Partei A in neuer Schicht 3 Gesamtzahl Wähler in neuer Schicht 3 N3 pQ3 C N4 pQ4 3 0;035 C 2 0;025 D 0;031: D D N3 C N4 3C2
pQ3;neu D
148
Lösungen zur induktiven Statistik Dies führt mit O 3;neu D 0;17 und N3;neu D ˛D
5 8
N zu
2:600 N 8
.0;30 C 2 0;20 C 5 0;17/
und somit zu den Stichprobenumfängen 8 2:600 0;30 ˆ ˆ 503I ˆ ˆ 1;55 ˆ ˆ ˆ < 2:600 0;40 ni D 671I ˆ 1;55 ˆ ˆ ˆ ˆ ˆ 2:600 0;85 ˆ : 1:426I 1;55
D
2:600 8 1;55 N
i D1 i D2 i D3
Lösung zu Aufgabe 3.20 a)
xN 1 D 19;
s12 D
1 9
388 D 43;11
xN 2 D 13;
s22 D
1 9
116 D 12;89
xN 3 D 15;
s32 D
1 9
106 D 11;78
b) Da ein Budget c vorgegeben ist, kann die optimale Aufteilung gemäß (152) bestimmt werden; da die Kostensätze ci alle gleich sind, kann man aber auch (150) verwenden. Aus p p p 1 D 13 388 D 6;6; 2 D 13 116 D 3;6; 3 D 13 106 D 3;4 sowie den in Abhängigkeit vom Umfang N der Grundgesamtheit angebbaren Schichtumfängen N1 D N2 ; N2 D N3 D N4 erhält man den Proportionalitätsfaktor ˛D
30 N 2
6;6 C
N 4
3;6 C
N 4
3;4
D
und somit die (allgemeine) optimale Aufteilung 8 5;94 N ˆ 2 6;6 D 19;6 20I ˆ ˆ < N N ni D 5;94 N 4 3;6 D 5;3 5I ˆ ˆ ˆ : 5;94 N N 4 3;4 D 5;0 5I
5;94 N
i D1 i D2 i D3
Lösungen zur induktiven Statistik
149
c) Die Teilstichprobenmittel sind xN 1 D
360 D 18; 20
xN 2 D xN 3 D
70 D 14I 5
die Schichtschätzfunktion (146) liefert somit N 1 N 18 C 2 14 D 16: O D N 2 4
Lösung zu Aufgabe 3.21 a) Da ein Budget c vorgegeben ist, wird die (allgemeine) optimale Aufteilung gemäß (152) bestimmt. Aus der Proportion der Ni und aus N D 10:000 folgt N1 D 1:000;
N2 D N3 D N4 D 2:000;
N5 D 3:000:
Für den Proportionalitätsfaktor ˛ erhält man somit ˛D
4 4:000 D : 1:000 Œ1 .1 1 C 2 1 C 2 1 C 2 1 C 3 10 2/ 67 1
Hieraus folgt 8 4:000 1 ˆ ˆ D 59;7 60 ˆ ˆ 67 1 1 ˆ ˆ ˆ < 8:000 1 D 119;4 119 ni D ˆ 67 1 1 ˆ ˆ ˆ ˆ ˆ 12:000 10 1 ˆ : D 895;5 896 67 1 2
i D1 i D 2; 3; 4 i D5
Die bei den gerundeten Werten ni entstehenden Kosten sind 60 1 C 3 119 1 C 4 896 D 4:001 und somit um 1 höher als c. Um c exakt einzuhalten, kann man beispielsweise bei Schicht 1 auf eine Beobachtung verzichten. b) Als Schätzwert für E.X / erhält man 1:000 C 3:000 C 3:000 C 4:000 C 9:000 D 2: 10:000
150
Lösungen zur induktiven Statistik
Lösung zu Aufgabe 3.22 a) Vorgehensweise nach 13.1.2: Schritt 1: 1 ˛ D 0;95 Schritt 2: c D 2;160 (aus der t.13/-Verteilung) Schritt 3: Man errechnet: 1 15:150 D 1:082;14 14 14 14 X X 2 .xi x/ N D xi2 14 xN 2 (nach (12)) xN D
iD1
iD1
15:1502 D 19:841:100 D 3:446:636 14 v u 14 u1 X .xi x/ N 2 D 514;90 sDt 13 iD1
Schritt 4:
sc p n
D
514;902;16 p 14
D 297;24
Schritt 5: Œ785I 1:379 b) Die gestellte Forderung ist: Länge D c D x1 ˛2 D
2sc p n
D 500. Äquivalent hierzu ist:
p 500 14 D 1;817: 2 514;90
Aus Tabelle 4 liest man für die t.13/-Verteilung ab: x0;95 D 1;771
und
x0;975 D 2;160:
Hieraus und aus 1;817 D x1 ˛2 ergibt sich mithilfe linearer Interpolation 1
1;817 1;771 ˛ D 0;95 C .0;975 0;95/ D 0;9530; 2 2;160 1;771
also 1 ˛ D 0;906.
Lösungen zur induktiven Statistik
151
Lösung zu Aufgabe 3.23 a) Weil xi 2 Œ0I 30 für jedes i gilt, und weil n X
.xi x/ N 2
iD1
n X .xi /2 iD1
für jede beliebige Zahl 2 R richtig ist (vgl. Seite 19, Punkt 6), folgt n n n X X X 2 2 .xi x/ N .xi 15/ 152 D n 152 ; iD1
iD1
iD1
und deshalb v u r n u 1 X n 2 t 15: sD .xi x/ N n1 n1 iD1
p Die Länge 2sc= n des Schätzintervalls für E.X / ist also zumindest dann kleiner gleich 2, wenn q n 2 n1 15 c 30c 2 Dp p n n1 gilt, d.h. wenn n 1 C .15c/2 gewählt wird mit dem 0,975-Fraktil c der N .0I 1/-Verteilung. Wegen 1 C .15 1;96/2 D 865;36 garantiert also jeder Stichprobenumfang n 866, dass die Länge des resultierenden Schätzintervalls höchstens 2 ist. b) Wegen n D 144 > 30 kann man nach 13.1.3 vorgehen: Schritt 1: 1 ˛ D 0;95 Schritt 2: c D 1;96 Schritt 3: xN D 15I O D s D Schritt 4:
c O p n
D
401;96 12
p 1:600 D 40
D 6;53
Schritt 5: Œ8;47I 21;53 c)
40c 12
D 8;5833 ist äquivalent mit c D x1 ˛2 D 2;57499, d.h. mit 1 0;995 bzw. 1 ˛ D 0;99.
˛ 2
D
152
Lösungen zur induktiven Statistik
Lösung zu Aufgabe 3.24 a) Der gesuchte Anteil p lässt sich gemäß 13.1.3 schätzen, da für die Realisierungen der B.1I p/-verteilten Stichprobenvariablen Xi (mit Xi D 1, falls das i-te Rohr fehlerhaft ist) gilt: 5
100 X
xi D 10 n 5 D 95:
iD1
Schritt 1: 1 ˛ D 0;9 Schritt 2: c D 1;645 Schritt 3: xN D 0;1I O D Schritt 4:
O c p n
p 0;1 0;9 D 0;3
D 0;04935
Schritt 5: Œ0;051I 0;149
p b) p Aus xN 100Cm 0;2 folgt O 100Cm 0;2 0;8 D 0;4 (da die Funktion x.1 x/ im Bereich 0 < x 0;2 streng monoton wächst). Deshalb garantiert jedes m mit 100 C m
2 0;4 1;645 0;05
2
D 692;74;
also jedes m 593, dass die vorgegebene Länge 0,05 eingehalten wird.
Lösung zu Aufgabe 3.25 a) Misst Xi den Gewinn des i-ten Tages, und setzt man ) ( Xi ; falls Xi < 0 D maxfXi ; 0g; Yi D 0; falls Xi 0 so sind die Yi unabhängig und identisch verteilt mit dem Erwartungswert Z E.Yi / D
0 1
.x/f .x/ dx C 0 P .Xi 0/ D :
(Die Verteilung der Yi ist weder stetig noch diskret.)
Lösungen zur induktiven Statistik
153
Wegen n > 30 steht also die Vorgehensweise aus 13.1.3 zur Verfügung: Schritt 1: 1 ˛ D 0;9 Schritt 2: c D 1;645 Schritt 3: 43 der yi -Werte sind gleich 0, yN D
2:350 D 47 50
50 X .yi y/ N 2 D .0 47/2 43 C .50 47/2 C C .785 47/2 iD1
Schritt 4:
D 998:700 r 1 998:700 D 142;76 sD 49 sc p n
D
142;761;645 p 50
D 33;21
Schritt 5: Œ13;8I 80;2 b) Weil s d D 2 142;76 D 285;52 für alle n > 50 als sicher gilt, reicht n
2 285;52 1;645 50
2
D 352;96
aus, um die Länge 50 nicht zu überschreiten.
Lösung zu Aufgabe 3.26 a) Wegen n > 30 lässt sich nach 13.1.3 vorgehen. Da bei einer exponentialverteilten Zufallsvariablen X der D E.X / D 1= und p p Erwartungswert die Standardabweichung D Var.X / D 1=2 übereinstimmen (vgl. Fig. 36), ist die behauptete Konsistenz der XNn für aus Seite 151 Mitte ablesbar. Somit ergibt sich: Schritt 1: 1 ˛ D 0;98 Schritt 2: c D 2;326 1 50 .3:600 C 720 872;326 p D 28;62 50
Schritt 3: xN D O D Schritt 4:
c O p n
D
Schritt 5: Œ58;4I 115;6
C 30/ D 87 (Sekunden)
p p b) Wegen O D xN gilt Vo D XN C XN c= n D XN .1 C c= n/ und entsprechend p p p Vu D XN .1 c= n/, also ko D 1 C 2;326= n und ku D 1 2;326= n.
154
Lösungen zur induktiven Statistik Hieraus folgt bzgl. der Forderung für die Differenz: 2 2;326 0;5 , n ko ku 0;5 , p n
2 2;326 0;5
2
D 86;56I
für den Quotienten: p p n C 2;326 ko 1;5 ” 0;5 n 2;5 2;326 D p ku n 2;326 ” n .5 2;326/2 D 135;26: Bei n D 50 gilt ko ku D 0;66 bzw.
ko ku
D 1;98.
Lösung zu Aufgabe 3.27* a) Mit E.X / D (vgl. Fig. 36) sind die Hypothesen gemäß Seite 182 folgendermaßen festzulegen: H0 W 1;
H1 W > 1
Zu ihrer Überprüfung ist die Testfunktion V D X1 C C X6 geeignet; denn V ist Poisson-verteilt mit dem Parameter 6 (wegen E.V / D E.X1 / C C E.X6 / D 6), so dass die Verteilung von V vom Parameter (durch den H0 und H1 charakterisiert sind) abhängt, und für beliebige Werte > 0 berechenbar ist. Weil ein Wert v umso mehr für H1 spricht, je größer er ist, wählen wir den Verwerfungsbereich B von der Form B D fc; c C 1; c C 2; : : : g: Da die Verteilung von V diskret ist, ist dabei c so festzulegen (vgl. Seite 181 oben), dass sup P .V c j / 0;1 1
gilt, wobei dieses Supremum möglichst nahe an 0,1 liegen soll. Letzteres wird, da P .V v j / für jeden festen Wert mit wachsendem v
Lösungen zur induktiven Statistik
155
monoton fällt, durch die zusätzliche Forderung sup P .V c 1 j / > 0;1
1
erreicht. Weil für jeden festen Wert v die Größe P .V v j / mit wachsendem monoton wächst und somit sup P .V v j / D P .V v j D 1/
1
gilt, wird also c bestimmt durch die beiden Forderungen P .V c j D 1/ 0;1 und
P .V c 1 j D 1/ > 0;1:
Mit der Abkürzung F6 .v/ für die Verteilungsfunktion der PoissonVerteilung mit dem Parameter 6 an der Stelle v hat daher zu gelten: 1 F6 .c 1/ 0;1 und
1 F6 .c 2/ > 0;1I
d.h. F6 .c 1/ 0;9 und
F6 .c 2/ < 0;9:
Aus Tabelle 2 erhalten wir so den Verwerfungsbereich B D f10; 11; 12; : : : g: b) Mit obiger Abkürzung gilt für die Gütefunktion g./: g./ D P .V 2 B j / D P .V 10 j / D 1 P .V 9 j / D 1 F6 .9/: Hiermit erhalten wir:
1 2
1
4 3
5 3
2
3
F6 .9/ 0;9989 0;9161 0;7166 0;4579 0;193 0;017 g./ 0;0011 0;0839 0;2834 0;5421 0;807 0;983 Dabei sind die letzen beiden Spalten berechnet gemäß 9 6 9 6 V 6 p ˆ p ; p F6 .9/ D P .V 9 j / D P 6 6 6 vgl. Tabelle 8.
156
Lösungen zur induktiven Statistik Im Einzelnen erhält man so (unter Beachtung der Formel (81)): p p F12 .9/ ˆ p3 D ˆ 23 D 1 ˆ 23 12
1 1 0;807 D 0;193I ˆ.0;866/ 9 3 F18 .9/ ˆ p D ˆ p D 1 ˆ p3 18
2
1 ˆ.2;121/ 1 0;983 D 0;017:
2
c) Auf Grund der Tatsache, dass die Gütefunktion streng monoton wächst, ist der in a) konstruierte Test ein unverfälschter Test zum Niveau ˛ 0 D g.1/ D 0;0839. (Dagegen ist er, da der vorgegebene Wert ˛ D 0;1 für die maximale Wahrscheinlichkeit des Fehlers 1. Art wegen der diskreten Verteilung von V nicht eingehalten werden konnte, streng genommen weder ein Test zum Niveau ˛ noch erfüllt er mit ˛ D 0;1 die Bedingung (124), durch welche die Unverfälschtheit definiert ist. Wegen der Monotonie der Gütefunktion ist jedoch immerhin die Ablehnwahrscheinlichkeit bei Zutreffen von H0 stets kleiner als bei Zutreffen von H1 .) d) Da v D 8 nicht in B liegt, wird H0 nicht abgelehnt.
Lösung zu Aufgabe 3.28 a) Die Vorgehensweise gemäß 13.2 liefert Schritt 1: 1 ˛ D 0;99 Schritt 2: c1 D 9;26I c2 D 44;18, jeweils aus der 2 .23/-Verteilung Schritt 3: xN D 2;47I .x1 x/ N 2 C C .x24 x/ N 2 D 0;0282 Schritt 4: vu D
0;0282 44;18
D 0;00064I vo D
0;0282 9;26
D 0;00305
Schritt 5: Œ0;00064I 0;00305 b) Gemäß Beispiel 77 ergeben sich die Warngrenzen
0;04 2;495 2;47 ˙ 1;96 p D 2;445 10 und die Kontrollgrenzen
0;04 2;503 2;47 ˙ 2;58 p D 2;437 10
Lösungen zur induktiven Statistik
157
Lösung zu Aufgabe 3.29* Der Stichprobenumfang n ist so zu bestimmen, dass c2 vo D 3 vu c1 gilt, wobei die ci der 2 .n 1/-Verteilung entstammen. Dieser Quotient fällt für wachsendes n. Bei n 1 D 30 gilt cc21 D 53;67 13;79 D 3;89, also muss n 1 > 30 sein, so dass die Fraktilswerte gemäß der Approximationsformel aus Seite 141 mithilfe des 0,995-Fraktils 2,576 der N .0I 1/-Verteilung zu bestimmen sind mit c1 D
1 2
c2 D
1 2
2 p 2;576 C 2.n 1/ 1
2;576 C
2 p 2.n 1/ 1 :
Folglich gelten (bei n 1 > 30) folgende Äquivalenzen: p c2 3 ” 2;5762 C 2 2;576 2n 3 C 2n 3 p c1 3 .2;5762 2 2;576 2n 3 C 2n 3/ p ” 8 2;576 2n 3 2 2;5762 C 4n 6 ” 0 16n2 791;21n C 1:326;94: Letztere Ungleichung ist ab n D 48 erfüllt. (Die zweite Nullstelle der aufzulösenden quadratischen Gleichung ist kleiner als 2 und somit wegen n 1 > 30 irrelevant.) Der Stichprobenumfang hätte also, um vvuo 3 zu sichern, mindestens 48 sein müssen.
Lösung zu Aufgabe 3.30 a) Bei Fall I ist nach 13.1.1 vorzugehen: Schritt 1: 1 ˛ D 0;99 Schritt 2: c D 2;576 Schritt 3: xN D 102;4 Schritt 4:
c p n
D
0;72;576 p 10
Schritt 5: Œ101;83I 102;97
D 0;570
158
Lösungen zur induktiven Statistik Bei Fall II ist 13.1.2 durchzuführen: Schritt 1: 1 ˛ D 0;99 Schritt 2: c D 3;250 Schritt 3: xN D 102;4; aus 7;85 D
10 X
.xi 102/2 D
iD1
D
10 X
xi2 204
iD1
10 X
10 X .xi2 204 xi C 1022 / iD1
xi C 10 1022
iD1
folgt (vgl. (12)) 10 X
.xi x/ N 2D
iD1
10 X
xi2 10 xN 2
iD1
D 7;85 C 204 1:024 10 1022 10 102;42 D 6;25 r
und somit sD Schritt 4:
sc p n
D
2;53;25 p 3 10
2;5 6;25 D 9 3
D 0;856
Schritt 5: Œ101;54I 103;26 b) Bei Fall I ist der Einstichproben-Gaußtest 14.1 anzuwenden. Da zur beidseitigen Gegenhypothese zu testen ist, kann gemäß Seite 178 unten das Testergebnis aus obigem Schätzintervall abgelesen werden: Wegen 0 D 102 2 Œvu I vo wird H0 W E.X / D 102 nicht abgelehnt. Bei Fall II ist nach dem Einstichproben-t-Test 14.4 vorzugeben. Auch hier kann jedoch entsprechend das Testergebnis aus dem nach 13.1.2 berechneten Schätzintervall abgelesen werden. (Denn das Konfidenzintervall aus 13.1.2 und der Einstichproben-t-Test sind mithilfe der t-Statistik p .XN /=S n ganz analog konstruiert wie das Konfidenzintervall aus 13.1.1 und der Einstichproben-Gaußtest mit Hilfe der Gauß-Statistik p .XN /= n.) Wegen 102 2 Œvu I vo wird H0 auch hier nicht abgelehnt.
Lösungen zur induktiven Statistik
159
Lösung zu Aufgabe 3.31 Zur Zufallsauswahl stehen 2:400 .7 24 60/ Paare von Parkuhren bzw. Minuten zur Verfügung, und diese Anzahl ist größer als 20 144 (vgl. Tabelle 8). Deshalb können, auch wenn „ohne Zurücklegen“ ausgewählt wurde, die 144 Stichprobenvariablen
1; bei Überprüfung i wird Falschparker entdeckt Xi D 0; sonst als B.1I p/-verteilt und unabhängig angenommen werden. a) Wegen 5
144 X
xi D 36 139
iD1
kann nach 13.1.3 vorgegangen werden. Schritt 1: 1 ˛ D 0;92 Schritt 2: c D x0;96 D 1;751 36 144 D 0;25I c O p D 0;4331;751 12 n
p p x.1 N x/ N D 14 3 D 0;433
Schritt 3: xN D
O D
Schritt 4:
D 0;063
Schritt 5: Œ0;187I 0;313 b) Nach 14.4, Fall (115c) (mit 0 D p0 D 0;2) ergibt sich: Schritt 1: ˛ D 0;04 Schritt 2: v D
p N 0 p xp n p0 .1p0 /
D
0;250;2 0;4
12 D 1;5
Schritt 3: B D .1;751I 1/ Schritt 4: v … BI H0 W p 0;2 wird nicht abgelehnt. c) Die Anzahl Y der Falschparker, die bei 1.200 Überprüfungen entdeckt werden, lässt sich als Summe Y1 C C Y1:200 von B.1I p/-verteilten 1 Zufallsvariablen Yi darstellen. Weil 144 .X1 C C X144 / D XN erwartungstreu für p ist, ist daher 1:200 XN erwartungstreu für E.Y / und O D 10 1:200 XN erwartungstreu für die zu erwartende tägliche Bußgeld‚ Einnahme. Obige Stichprobe liefert so den Schätzwert #O D 10 1:200 0;25 D 3:000:
160
Lösungen zur induktiven Statistik
Lösung zu Aufgabe 3.32 a) Es ist (vgl. (5)) xN Ges D
1 .10 38 C 20 47 C 140 54 C 30 64/ D 54 200
b) Legt man die Höhe des Rechtecks über dem Intervall Œ30I 40/ als 2 fest, so ergeben sich als weitere Rechteckhöhen 4, 28, 3. 28 24 20 16 12 8 4 10 20 30 40 50 60 70 80 Histogramm des Merkmals „Geschwindigkeit“ c) Approximativer Einstichproben-Gaußtest (14.4); Fall (115b); Voraussetzung 2. Schritt 1: ˛ D 0;01 Schritt 2:
54 55 p 200 mit s 200 1 X 1 s2 D .xi x/ N 2D 200 49;75 D 50; 199 199 vD
v D 2
iD1
Schritt 3: B D .1I 2;326/ Schritt 4: v … BI H0 W D 0 wird nicht abgelehnt.
Lösung zu Aufgabe 3.33 Mit D „Erwartungswert der radioaktiven Belastung von Maronenröhrlingen im Jahr 1985 in Bayern bzw. im Jahr 1987 im betrachteten Landkreis“ ist ein Test durchzuführen zwischen H0 W 0 , H1 W < 0 gemäß 14.4, Fall (115b).
Lösungen zur induktiven Statistik
161
Zu 1985: 0 D 10 Schritt 1: ˛ D 0;025 Schritt 2:
xN D 7;5 50 50 X 1 X 1 D .xi x/ N 2D xi2 50xN 2 49 49 iD1 iD1 7;5 10 p 50 D 1;831 vD p 93;17
s2
! D 93;17
Schritt 3: B D .1I 1;96/ (aus der N .0I 1/-Verteilung) Schritt 4: v … B; H0 wird nicht abgelehnt, H1 zu ˛ D 0;025 nicht statistisch bestätigt. Zu 1987: 0 D 600 Schritt 1: ˛ D 0;025 Schritt 2:
xN D 391 1 s 2 D .252 C 2092 C 2392 C 742 C 192 / D 26:816 4 391 600 p 5 D 2;854 vD p 26:816
Schritt 3: B D .1I 2;776/ (aus der t.4/-Verteilung) Schritt 4: v 2 B; H0 wird abgelehnt, H1 zu ˛ D 0;025 statistisch bestätigt.
Lösung zu Aufgabe 3.34 Der Test ist (bei B.1I p/-verteilten Stichprobenvariablen) als approximativer Gaußtest gemäß 14.4, Fall (115c) durchzuführen. Die Approximationsbedingung 5 x1 C C x120 D 33 115 ist erfüllt. Schritt 1: ˛ D 0;05 Schritt 2: v D
0;2750;15 p 0;150;85
p 120 D 3;835
Schritt 3: B D .x0;95 I 1/ D .1;645I 1/ (aus der N .0I 1/-Verteilung) Schritt 4: v 2 BI H0 wird abgelehnt.
162
Lösungen zur induktiven Statistik
Lösung zu Aufgabe 3.35 In beiden Punkten a), b) ist ein 2 -Test für die Varianz gemäß 14.5, Fall (116c) durchzuführen; Unterschiede treten ab Schritt 2 auf: Schritt 1: ˛ D 0;05 Schritt 2: Unter a) erhält man, da E.X / D 18 als bekannt angenommen wird, vD
20 20 X 1 X 2 .x C 18/ D 4 .xi2 C 36xi C 324/ i 0;52 iD1
iD1
D 4 .6:806;15 36 20 18;44 C 20 324/ D 37;4: Unter b) ergibt sich 20 20 X 1 X 2 .x x/ N D 4 xi2 20xN 2 vD i 0;52 iD1
! D 21;912:
iD1
Schritt 3: Unter a) gilt B D .31;41I 1/ (aus der 2 .20/-Verteilung) Unter b) gilt B D .30;14I 1/ (aus der 2 .19/-Verteilung) Schritt 4: Unter a) ist v 2 BI H0 wird abgelehnt. Unter b) ist v … BI H0 wird nicht abgelehnt.
Lösung zu Aufgabe 3.36 Mit den Bezeichnungen
1; 0;
1; Yi D 0;
Xi D
i-te befragte Person erinnert sich an Fernsehwerbung sonst i-te befragte Person erinnert sich an Plakatwerbung sonst
sowie mit p1 D P .Xi D 1/ D E.Xi /, p2 D P .Yi D 1/ D E.Yi / lässt sich die zu bestätigende und deshalb als Gegenhypothese H1 zu wählende Hypothese in der Form H1 W p1 > p2 bzw. p1 p2 > 0 schreiben.
Lösungen zur induktiven Statistik
163
Die Nullhypothese ist dann gemäß H0 W p1 p2 zu wählen. Wegen 5 x1 C C x250 D 105 245 und 5 y1 C C y250 D 70 245 kann der anzuwendende Differenzentest (zwei verbundene Stichproben liegen vor) als approximativer Gaußtest durchgeführt werden (siehe 14.4, Fall (115c), und Seite 190): Schritt 1: ˛ D 0;05 Schritt 2: Für den Testfunktionswert v stehen zwei Formeln zur Verfügung: Gemäß Seite 190 oben sind mit zi D xi yi zu bestimmen: 250 X iD1 250 X iD1
zi D
250 X
xi
iD1
250 X
yi D .42 C 63/ .42 C 28/
iD1
D 63 28 D 35 zi2 D Anzahl der Fälle mit xi ¤ yi D 63 C 28 D 91
wegen zi2 D 1, falls xi ¤ yi (und sonst zi2 D 0). Hieraus folgt v D p35 D 3;67: 91
Nach der Fußnote 2, Seite 190, erhält man denselben Wert gemäß 63 28 h10 h01 : Dp vDp h10 C h01 63 C 28 (Man beachte dabei, dass auf Grund der Festlegung der Werte 0 und 1 bei Xi bzw. Yi die in der Aufgabenstellung angegebene Tabelle die Gestalt H HH y 0 HH 1 x H 1 h11 h10 0 h01 h00 besitzt; im Vergleich zur Darstellung in der Fußnote 2 auf Seite 190 ist also die Reihenfolge der Zeilen und Spalten vertauscht.) Schritt 3: B D .x0;95 I 1/ D .1;645I 1/ Schritt 4: v 2 BI H0 wird abgelehnt; H1 ist statistisch bestätigt.
164
Lösungen zur induktiven Statistik
Lösung zu Aufgabe 3.37 Mit 1 D E.Xi /, 2 D E.Yi / ist H0 W 1 2
gegen
H1 W 1 > 2
(vgl. (117c))
nach 14.6.1 zu testen, wobei in Fig. 51 die Voraussetzung 4 vorliegt. Schritt 1: ˛ D 0;02 Schritt 2: v D
q 1716;4 8;4 891=99 40 C 100
D
p0;6 0;3
D 1;095
Schritt 3: B D .x0;98 I 1/ D .2;054I 1/ Schritt 4: v … BI H0 wird nicht abgelehnt. Mit v D 1;095 kommt man zur Ablehnung von H0 für jedes Signifikanzniveau ˛, das die Eigenschaft x1˛ < 1;095 besitzt. Gleichwertig dazu ist 1 ˛ < ˆ.1; 095/ D 0;8632. Infolgedessen führt jedes ˛ > ˛ 0 D 1 0;8632 D 0;1368 zur Ablehnung von H0 . Bemerkung: Das hier exemplarisch berechnete (Grenz-)Signifikanzniveau ˛ 0 hat die Eigenschaft, dass das Datenmaterial bei Vorgabe eines Signifikanzniveaus ˛ kleiner als ˛ 0 (b D konservativer Test) noch nicht zur Ablehnung von H0 führt, D offensiver Test) jedoch bei Vorgabe eines Signifkanzniveaus ˛ größer als ˛ 0 (b die Ablehnung von H0 zur Folge hat. Ein derartiges ˛ 0 kann man für jedes beliebige Testproblem (bei gegebenem Datenmaterial) berechnen. StatistikSoftwarepakete sehen diese Berechnung in aller Regel vor und verzichten stattdessen darauf, vom Anwender vorab ein Signifikanzniveau als Eingabe zu verlangen. Es liegt auf der Hand, dass diese Praxis in allen Fällen, in denen ein bestimmtes Testresultat gewünscht wird, erhebliche Manipulationsgefahren in sich birgt. Das von den Software-Paketen angegebene ˛ 0 wird als p-Wert (p-value), Wahrscheinlichkeitswert oder auch schlicht als Signifikanzniveau bezeichnet.
Lösung zu Aufgabe 3.38 a) Für beide Annahmen ist nach 14.6.1, (117a) vorzugehen; in Fall 1) ist in Fig. 51 die Voraussetzung 2 erfüllt, in Fall 2) kann die Fußnote 1 von Seite 193 benutzt werden.
Lösungen zur induktiven Statistik
165
Schritt 1: ˛ D 0;05 Schritt 2: Bezeichnen wir mit xi bzw. yi die Ergebnisse zu I bzw. II, so erhalten wir xN D 20;2 6 1X .xi x/ N 2 D 1;860 s12 D 5 iD1
69;7 yN D 3 ! 6 1 X 2 2 2 D 5;011 yi 6yN s2 D 5 iD1
xN yN v D q 2 2 D 2;83 s1 Cs2 6
Schritt 3: B D .1I x0;975 / [ .x0;975 I 1/, wobei der Fraktilswert im Fall 1) aus der t .10/-Verteilung, und im Fall 2) aus der t-Verteilung mit 2 D 8;26; 5 1C 3;065 d.h. mit 8 Freiheitsgraden zu entnehmen ist. Man erhält so im Fall 1) B D .1I 2;228/ [ .2;228I 1/ im Fall 2) B D .1I 2;306/ [ .2;306I 1/ Schritt 4: In beiden Fällen wird H0 wegen v 2 B abgelehnt. b) Der Test ist nach 14.6.2, (118a) auszuführen: Schritt 1: ˛ D 0;05 Schritt 2: v D
1;860 5;011
D 0;37
1 / [ .5;05I 1/ D Œ0I 0;20/ [ .5;05I 1/ Schritt 3: B D Œ0I 5;05
(der Wert 5,05 ist das 0,95-Fraktil der F.5; 5/-Verteilung) Schritt 4: v … BI H0 wird nicht abgelehnt.
166
Lösungen zur induktiven Statistik
Lösung zu Aufgabe 3.39 Test nach 14.7: H0 W 1 D 2 D 3
gegen
H1 W nicht alle j sind gleich.
Schritt 1: ˛ D 0;05 Schritt 2: xN 1 D 10, xN 2 D 12, xN 3 D 11, xN Ges D 11 q1 D 4 .1 C 1 C 0/ D 8 q2 D .0 C 0;04 C 1 C 0;64/ C .4 C 0 C 4 C 0/ C .0 C 2;25 C 4 C 0;25/ D 16;18 .12 3/ 8 vD D 2;23 .3 1/ 16;18 Schritt 3: B D .x0;95 I 1/ D .4;26I 1/ (aus der F.2; 9/-Verteilung) Schritt 4: v … BI H0 wird nicht abgelehnt.
Lösung zu Aufgabe 3.40 a) Die Voraussetzungen zur Varianzanalyse gemäß 14.7 sind erfüllt: Schritt 1: ˛ D 0;01 Schritt 2: Mit der linearen Transformation yj i D 100 xj i gilt: 125 240 540 yN1 D 175 7 D 25; yN2 D 5 D 25; yN3 D 6 D 40; yNGes D 18 D 30 q1 D 7 .25 30/2 C 5 25 C 6 100 D 900 q2 D Œ.17 25/2 C 42 C 0 C 4 C 49 C 16 C 1 C .1 C 49 C 81 C 1 C 16/ C .36 C 81 C 4 C 144 C 36 C 1/ D 600 vD
.183/900 .31/600
D 11;25
Schritt 3: B D .x0;99 I 1/ D .6;36I 1/ (aus der F.2; 15/-Verteilung) Schritt 4: v 2 BI H0 wird abgelehnt. b) Zwei verbundene einfache Stichproben liegen vor, wobei sowohl Xi als auch Yi normalverteilt sind. Wegen der Reproduktionseigenschaft der Normalverteilung sind auch Xi0 und Zi D Xi0 Yi normalverteilt. Auf Grund dieser Voraussetzungen ist der Test zwischen H0 W 1;6 x D y , d.h. x0 y D 0 gegen H1 W 0x y < 0 ein als Einstichproben-t-Test durchzuführender Differenzentest (vgl. Seite 190 oben und (115b)). Schritt 1: ˛ D 0;05
Lösungen zur induktiven Statistik Schritt 2:
167
xi0 D 1;6 xi 0;32
zi D
xi0
yi
0;24
0;40 0;32
0;04 0;05 0;04 0;01
zN D xN 0 yN D 0;01 4 X
.zi zN /2 D 0;052 C 0;042 C 0;032 C 0;022 D 0;0054
iD1
vD q
p 2 4 D p D 0;471 18 0;0054
0;01 1 3
Schritt 3: B D .1I x0;95 / D .1I 2;353/ (aus t.3/-Verteilung) Schritt 4: v … BI H0 wird nicht abgelehnt.
Lösung zu Aufgabe 3.41 a) Aus der Häufigkeitstabelle (mit aufsteigend sortierten Ausprägungen) Marktanteile 10 15 20 35 Häufigkeiten
1
1
2
1
liest man die Knickpunkte . 15 I 0;1/, . 25 I 0;25/, . 45 I 0;65/ ab. b) G D
2.10C215C320C420C535/6100 5100
D
110 500
D 0;22
c) Mit X D „Nummer der von einem zufällig ausgewählten Kunden besuchten Apotheke“ ist die Hypothese H0 W P .X D j / D Marktanteil der Apotheke j für alle j D 1; : : : ; 5 zu testen gegen die aus der Negation von H0 bestehende Gegenhypothese H1 . Wegen npj D 300pj 300 0;1 D 30 5 für alle j D 1; : : : ; 5 ist dazu der 2 -Anpassungstest 14.8, Fall (120a) unmittelbar anwendbar. Schritt 1: ˛ D 0;05 Schritt 2: 2.1 bis 2.3 sind klar; 2.4: vD
.3045/2 45
2
2
2
2
C .2530/ C .6560/ C .105105/ C .7560/ D 10 30 60 105 60
Schritt 3: B D .9;49I 1/ (aus der 2 .4/-Verteilung) Schritt 4: v 2 BI H0 ist abzulehnen.
168
Lösungen zur induktiven Statistik
Lösung zu Aufgabe 3.42 a) Der 2 -Anpassungstest (14.8) ist anzuwenden. Es liegt Fall (120a) vor, wobei F0 bzw. F gleich der Verteilungsfunktion der Qualitätsstufe bei M0 bzw. bei M1 ist. Die Bedingung npj 5 ist für j D 1; 2; 3; 4 erfüllt. Schritt 1: ˛ D 0;05 Schritt 2: 2.1 bis 2.3 sind klar; 2.4: vD
.36 32/2 .30 40/2 .10 10/2 .24 18/2 C C C D5 18 32 40 10
Schritt 3: B D .7;81I 1/ (aus der 2 .3/-Verteilung) Schritt 4: 5 … BI H0 W F D F0 wird nicht abgelehnt. b) Nun kommt der approximative Einstichproben-Gaußtest (14.4) zur Anwendung. Es liegen speziell Fall (115b) (mit 1 statt ) und Voraussetzung 2 vor. Schritt 1: ˛ D 0;05 Schritt 2: xN 0 p n mit s 1 .24 1 C 36 2 C 30 3 C 10 4/ D 2;26 xN D 100 vD
0 D 0;18 1 C 0;32 2 C 0;40 3 C 0;10 4 D 2;42 # ! " 100 100 X X 1 1 2 2 2 2 .xi x/ N xi 100 2;26 D s D 99 99 iD1 iD1 1 .24 1 C 36 4 C 30 9 C 10 16 510;76/ D 0;8812 D 99 v D 1;704 Schritt 3: B D .1I 1;645/ Schritt 4: v 2 BI H0 W 1 0 wird abgelehnt.
Lösungen zur induktiven Statistik
169
Lösung zu Aufgabe 3.43 a) Aus der Stetigkeit von f0 folgt f0 .1/ D a D lim f0 .x/ D b: Für die x!1 x>1 Fläche unter der Dichte ergibt sich somit Z
1
Z 1 a ax dx C dx x2 1 0 1 9 8" # < x 2 1 1 1 = 3 1 C 1 D a: D a C D a : 2 x 1 ; 2 2
Folglich ist f0 nur bei a D b D
2 3
Z
1D
1
f0 .x/ dx D
0
eine stetige Dichte.
b) Berechnet man zunächst die Fläche unter dem ersten „Ast“ der Dichte f0 , d.h. unter der Funktion 23 x über dem Bereich Œ0I 1, so erhält man Z 0
1
" #1 2 1 2 x2 x dx D D : 3 3 2 3 0
Folglich ist z1 D 1 zu setzen. Der Wert z2 ist demnach in .1I 1/ so zu bestimmen, dass Z z2 2 z2 1 2 2 2 dx D D D C 2 3 3x 1 3z2 3 3x 1 gilt, woraus z2 D 2 folgt. Also gilt A1 D .1I 1;
A2 D .1I 2
und
A3 D .2I 1/:
c) Ist F0 die Verteilungsfunktion zu f0 und F die wahre Verteilungsfunktion von X , so ist H0 W F D F0 gegen H1 W F ¤ F0 (vgl. (120a)) gemäß 14.8 zu testen. Schritt 1: ˛ D P .H0 wird abgelehnt, obwohl H0 richtig ist/ D 0;025 Schritt 2: 2.1 und 2.3 sind in Teil b) vorweggenommen; dabei gilt p1 D p2 D p3 D 13 und folglich auch npj D 10 5 für jedes j . 2.2: h1 D 11, h2 D 11, h3 D 8 1 1 4 C 10 C 10 D 0;6 2.4: v D 10 Schritt 3: B D .7;38I 1/ (aus der 2 .2/-Verteilung) Schritt 4: v … BI H0 wird nicht abgelehnt.
170
Lösungen zur induktiven Statistik
Lösung zu Aufgabe 3.44 Der Test ist durchführbar nach 14.8, Fall (120b). Dabei ist r D 1, da die Exponentialverteilungen sich nur durch einen Parameter voneinander unterscheiden (vgl. (78)). Schritt 1: ˛ D 0;05 Schritt 2: Wir wollen uns bei der Festlegung der Klassen Aj an der Regel npj 5 orientieren mit pj D P .X 2 Aj jFO0 /; dabei bedeutet FO0 die Verteilungsfunktion der Exponentialverteilung mit dem (aus den nichtklassierten Daten ermittelten) Maximum-Likelihood-Schätzwert O für O FO0 und die pj : (vgl. Seite 200). Deshalb berechnen wir zunächst , Nach der Lösung der Aufgabe 89 im Statistik-Buch gilt die Beziehung 1 . (xN ist aus den nicht-klassierten Daten berechnet.) Hieraus O D 1=xN D 54 folgt Z x h i O O x O t dt D e t D 1 e x=54 für x 0: e FO0 .x/ D 0
0
Für die vorgegebenen Ij erhält man demnach folgende Wahrscheinlichkeiten P .X 2 Ij j FO0 /: 1
j
2
3
4
P .X 2 Ij j FO0 / 0;2425 0;1837 0;1392 0;1054 j
5 6 7 8 O P .X 2 Ij j F0 / 0;1403 0;0805 0;0727 0;0357 Um 50pj 5 zu sichern, muss pj 0;1 gelten. Wir setzen deshalb Aj D Ij für j D 1; : : : ; 5 und A6 D I6 [ I7 [ I8 (mit p6 D 0;1889 sowie h6 D 12). Hiermit ergibt sich vD
6 2 1 X hj 50 D 17;45 50 pj j D1
Schritt 3: B D .9;49I 1/ (aus der 2 .6 1 1/-Verteilung) Schritt 4: v 2 BI H0 wird abgelehnt.
Lösungen zur induktiven Statistik
171
Bemerkungen: 1. Auch beim Vergleich des Testfunktionswertes v mit dem .1 ˛/-Fraktil der 2 .6 1/-Verteilung (vgl. hierzu Seite 200, Fußnote 2) kommt man zur Ablehnung der Nullhypothese. 2. Orientiert man sich zur Klassenzusammenfassung an hj 5 und wählt man dabei A1 D I1 [ I2 , A2 D I3 , . . . , A5 D I6 , A6 D I7 [ I8 , so erhält man v D 15;93, kommt also zum selben Testergebnis.
Lösung zu Aufgabe 3.45 Da alle hij 5 sind, kann nach 14.9 vorgegangen werden: Schritt 1: ˛ D 0;05 Schritt 2: 2.1 erübrigt sich 2.2 und 2.3: Tabelle der hQij mit Randhäufigkeiten: hQ ij 1 2 3 hj 2.4:
1
2
3
240 252 108 280 294 126 280 294 126
hi 600 700 700
800 840 360 2:000
882 92 452 C C C D 164;84 240 252 126
vD
Schritt 3: B D .x0;99 I 1/ D .13;28I 1/ (aus der 2 .4/-Verteilung) Schritt 4: v 2 BI H0 (b D Unabhängigkeit) wird abgelehnt.
Lösung zu Aufgabe 3.46 a) 60
30 15 1.200
2.400
4.800
Histogramm für das Merkmal „Bruttoeinkommen“
172
Lösungen zur induktiven Statistik
b) Gegeben sind h22 D 0;45I h2
h12 D 0;5I h2
h32 D 0;05I h2
h2 D 40:
Hieraus folgt h12 D 20, h22 D 18 und h32 D 2. Damit ergibt sich folgende Kontingenztabelle mit Randhäufigkeiten: ``` ``` ``Nationalität deutsch ``` Lohngruppe ```
ausländisch
hi
1 2 3
10 42 28
20 18 2
30 60 30
hj
80
40
120
Als Tabelle der hQ ij erhalten wir: hQij
deutsch ausländisch
1 2 3
20 40 20
10 20 10
Folglich gilt 2 D
100 4 4 64 64 100 C C C C C D 24;9 20 10 40 20 20 10 s
und KD
24;9 D 0;41: 144;9
c) Die Durchführung des Kontingenztests 14.9 ist wegen hQ ij 5 gerechtfertigt. Man erhält: Schritt 1: ˛ D 0;01 Schritt 2: v D 2 D 24;9 (vgl. b)) Schritt 3: B D .x0;99 I 1/ D .9;21I 1/ (aus der 2 ..3 1/ .2 1//-Verteilung) Schritt 4: v 2 BI H0 wird abgelehnt.
Lösungen zur induktiven Statistik
173
Lösung zu Aufgabe 3.47 ( 1; X D Geschlecht D 2; 8 ˆ Y und Untergewichtig bedeutet X < Y . Damit sind die Hypothesen H0 W P .X > Y / P .X < Y / gegen H1 W P .X > Y / > P .X < Y / zu testen. Hierfür kommt der Vorzeichentest 14.10, Fall (122c) infrage. Schritt 1: ˛ D 0;05 Schritt 2: v D 9 Schritt 3: 3.1: m D 2 3.2: aus der B.13I 12 /-Verteilung folgt c 0 D 3 und damit B D f10; 11; 12; 13g: Schritt 4: v D 9 … BI H0 wird nicht abgelehnt, H1 nicht bestätigt. b) Zwei verbundene einfache Stichproben liegen vor. Für den approximativen Gaußtest ist n zu klein. Unter der Voraussetzung, dass die Zi D Xi Yi normalverteilt sind, ist daher H0 W x D y (d.h. x y D 0) gegen H1 W x ¤ y durch Differenzentest bzw. Einstichproben-t-Test (14.4) zu testen gemäß Fall (115a). Schritt 1: ˛ D 0;05 Schritt 2:
zN
vDs 1 14
15 P iD1
p 15
.zi zN 2 /
(vgl. S. 190) mit folgenden Werten zi : 1 0 2 2 7 10 9 5 0 1 6 1 2 1 6 Daraus ergibt sich: zN D 15 X
1 ; 15
zi2 D 343;
iD1
15 15 X X .zi zN /2 D zi2 15Nz 2 D 342;933 iD1
iD1
v D 0;052:
Schritt 3: B D .1I 2;145/ [ .2;145I 1/ (aus der t.14/-Verteilung) Schritt 4: v … BI H0 wird nicht abgelehnt.
176
Lösungen zur induktiven Statistik
Lösung zu Aufgabe 3.50 a) Da zwei unabhängige Stichproben gleichen Umfangs n D 36 vorliegen, können die Hypothesen H0 W F1 D F2
gegen
H1 W F1 ¤ F2
(mit F1 D Verteilungsfunktion von X , F2 D Verteilungsfunktion von Y ) durch den Vorzeichentest 14.10, Fall (122a), überprüft werden. Schritt 1: ˛ D 0;05 Schritt 2 und Schritt 3.1: Indem man jeweils die beiden Beobachtungen mit derselben Nummer zum Paar .xi ; yi / zusammenfasst .i D 1; : : : ; 36/, errechnet man für v den Wert 20 und für m den Wert 6. Schritt 3.2: Aus der B.36 6I 12 /-Verteilung liest man c D 9 ab (da F.9/ D 0;0214 0;025 D ˛2 sowie F.10/ D 0;0494 > ˛2 gilt). Damit ist B D f0; : : : ; 9g [ f21; : : : ; 30g. Schritt 4: v … BI H0 wird nicht abgelehnt. b) Der Vergleich zweier Poisson-Verteilungen ist äquivalent mit dem Vergleich ihrer Erwartungswerte; denn jede Poisson-Verteilung ist durch ihren Verteilungsparameter eindeutig festgelegt und stimmt mit dem Erwartungswert überein (vgl. Fig. 36). Die Überprüfung der Hypothesen H0 W 1 D 2
gegen
H1 W 1 ¤ 2
(mit 1 D E.X /, 2 D E.Y /) ist wegen der Unabhängigkeit der beiden Stichproben nach dem approximativen Zweistichproben-Gaußtest 14.6.1, Fall (117a) möglich, wobei in Fig. 51 die Voraussetzung 4 erfüllt ist (mit n1 D n2 D 36). Schritt 1: ˛ D 0;05 Schritt 2: Aus den beiden Häufigkeitstabellen x-Werte
0
1
2
3
4
5
6
7
8
Häufigkeiten
2
4
5
6
5
6
4
3
1
y-Werte Häufigkeiten
0 4
1 2 11 10
3 6
4 3
5 1
6 1
Lösungen zur induktiven Statistik
177
erhält man xN D s12
36 1 663 D 35 35
yN D s22 D und hieraus
135 D 3;75 36
135 36
2
D 4;48
72 D2 36 36 1 214 4D2 35 35
3;75 2 10;5 vDq Dp D 4;12 4;48C2 6;48 36
Schritt 3: B D .1I 1;96/ [ .1;96I 1/ Schritt 4: v 2 BI H0 wird abgelehnt. Bemerkungen: 1. Bei Poisson-verteilten Stichprobenvariablen Xi und Yi könnte man in der benutzten Testfunktion V die Stichprobenvarianzen S12 , S22 auch durch die Stichprobenmittel XN , YN ersetzen. 2. Unter b) wurde in Analogie zu a) auch die beidseitige Gegenhypothese verwendet. Hat man unter der Voraussetzung von b) Grund zur Vermutung, dass die neue Maschine besser als die alte ist, und testet man daher H0 W 1 D 2 gegen H1 W 1 > 2 , so führen die gegebenen Daten auch hier zur Ablehnung von H0 , d.h. zur statistischen Bestätigung (bei ˛ D 0;05), dass die neue Maschine der alten überlegen ist.
Literaturverzeichnis Das Literaturverzeichnis beschränkt sich auf einige deutschsprachige Lehr- und Übungsbücher zur Statistischen Methodenlehre sowie auf die im Anschluss an die Musterlösungen zitierte weiterführende Spezialliteratur. Bamberg, G.; Baur, F.; Krapp, M. [2008]: Statistik, 14. Aufl., München–Wien, Oldenbourg-Verlag Basler, H. [1991]: Aufgabensammlung zur statistischen Methodenlehre und Wahrscheinlichkeitsrechnung, 4. Aufl., Würzburg–Wien, Physica-Verlag Bosch, K. [2002]: Übungs- und Arbeitsbuch Statistik, München–Wien, Oldenbourg-Verlag Böselt, M. [2001]: Statistik-Übungsbuch, 2. Aufl., München–Wien, Oldenbourg-Verlag Bourier, G. [2006]: Statistik-Übungen, 2. Aufl., Herne–Berlin, Verlag Neue Wirtschaftsbriefe Broermann, T. [1987]: Stichprobeninventuren, Frankfurt–Bern–New York, Peter Lang-Verlag Deffaa, W. [1982]: Anonymisierte Befragungen mit zufallsverschlüsselten Antworten, Frankfurt–Bern–New York, Peter Lang-Verlag Degen, H.; Lorscheid, P. [2006]: Statistik-Aufgabensammlung, 5. Aufl., München–Wien, Oldenbourg-Verlag Deutler, T.; Schaffranek, M.; Steinmetz, D. [1988]: Statistik-Übungen im wirtschaftswissenschaftlichen Grundstudium, 2. Aufl., Berlin et al., SpringerVerlag Drexl, A. [1985]: Inventur auf Stichprobenbasis, Die Betriebswirtschaft 45, 278–291 Fahrmeir, L.; Künstler, R.; Pigeot, I.; Tutz, G.; Caputo, A.; Lang, S. [2005]: Arbeitsbuch Statistik, 4. Aufl., Berlin et al., Springer-Verlag Hansen, G. [1985]: Methodenlehre der Statistik, 3. Aufl., München, VahlenVerlag Hartung, J.; Elpelt, B.; Klösener, K.-H. [2005]: Statistik, 14. Aufl., München– Wien, Oldenbourg-Verlag
180
Literaturverzeichnis
Hartung, J.; Heine, B. [1999]: Statistik-Übungen: Deskriptive Statistik, 6. Aufl., München–Wien, Oldenbourg-Verlag Hartung, J.; Heine, B. [2004]: Statistik-Übungen: Induktive Statistik, 4. Aufl., München–Wien, Oldenbourg-Verlag Lehn, J.; Wegmann, H.; Rettig, S. [2001]: Aufgabensammlung zur Einführung in die Statistik, 3. Aufl., Stuttgart, Teubner-Verlag Leiner, B. [2004]: Einführung in die Statistik, 9. Aufl., München–Wien, Oldenbourg-Verlag. von der Lippe, P. [2006]: Deskriptive Statistik. Formeln, Aufgaben, Klausurtraining, 7. Aufl., München–Wien, Oldenbourg-Verlag Missong, M. [2005]: Aufgabensammlung zur deskriptiven Statistik, 7. Aufl., München–Wien, Oldenbourg-Verlag Rönz, B.; Stohe, H. G. [1994]: Lexikon Statistik, Wiesbaden, Gabler-Verlag Schaich, E.; Münnich, R. [2001]: Mathematische Statistik für Ökonomen. Arbeitsbuch, München, Vahlen-Verlag Scherrer, G.; Obermeier, I. [1981]: Stichprobeninventur, München, VahlenVerlag Schlittgen, R.; Streitberg, B. [2001]: Zeitreihenanalyse, 9. Aufl., München– Wien, Oldenbourg-Verlag Schwarze, J. [2005]: Aufgabensammlung zur Statistik, 5. Aufl., Herne–Berlin, Verlag Neue Wirtschaftsbriefe Sturm, L. [1983]: Vorratsinventuren mit Stichprobenverfahren, Thun–Frankfurt, Harri Deutsch-Verlag Vogel, F. [2001]: Beschreibende und Schließende Statistik: Aufgaben und Beispiele, 9. Aufl., München–Wien, Oldenbourg-Verlag