Induktive Statistik: Formeln, Aufgaben, Klausurtraining [6., überarb. Aufl. Reprint 2014] 9783486781601, 9783486200096

Das Statistik-Lehrbuch ist ein Begleiter zu Vorlesungen und Übungen im Grundstudium, eignet sich aber auch als Nachschla

181 99 27MB

German Pages 330 [332] Year 2004

Report DMCA / Copyright

DOWNLOAD PDF FILE

Table of contents :
Teil I: Formelsammlung mit Tabellenanhang
Teil II: Aufgabensammlung Lösungen
Teil III: Klausurtraining Lösungen
Teil IV: Musterklausuren Lösungen
Recommend Papers

Induktive Statistik: Formeln, Aufgaben, Klausurtraining [6., überarb. Aufl. Reprint 2014]
 9783486781601, 9783486200096

  • 0 0 0
  • Like this paper and download? You can publish your own PDF file online for free in a few minutes! Sign Up
File loading please wait...
Citation preview

ULI

Induktive Statistik Von

Dr. Peter v. d. Lippe Professor für Statistik

6., überarbeitete Auflage

R. Oldenbourg Verlag München Wien

In die neukonzipierte „Statistik" in zwei Bänden („Induktive Statistik", „Deskriptive Statistik") ist das Werk „Klausurtraining Statistik, 1 .-4. Auflage" aufgegangen. Deshalb wurde die Auflagenzählung fortgeführt.

Bibliografische Information Der Deutschen Bibliothek Die Deutsche Bibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über abrufbar.

© 2004 Oldenbourg Wissenschaftsverlag GmbH Rosenheimer Straße 145, D-81671 München Telefon: (089) 45051-0 www.oldenbourg-verlag.de Das Werk einschließlich aller Abbildungen ist urheberrechtlich geschützt. Jede Verwertung außerhalb der Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Bearbeitung in elektronischen Systemen. Gedruckt auf säure- und chlorfreiem Papier Gesamtherstellung: Druckhaus „Thomas Müntzer" GmbH, Bad Langensalza ISBN 3-486-20009-7

Vorwort

V

Vorwort zur 6. Auflage Dieses Buch ist gedacht als Begleittext zu Vorlesungen und Übungen im Grundstudium sowie zur Klausurvorbereitung. Es umfaßt den Stoff, der üblicherweise unter dem Titel "Induktive Statistik" oder "Statistik II" an den meisten Hochschulen für Wirtschaftswissenschaftler angeboten wird, geht jedoch im Formelsammlungsteil in einigen Punkten wohl erheblich darüber hinaus, so daß es in diesem Bereich auch zum Nachschlagen für das Hauptstudium benutzt werden kann. Das Buch ist jedoch kein Ersatz für die entsprechenden Lehrveranstaltungen und enthält auch nicht die für ein Lehrbuch üblichen ausführlichen Erklärungen zu den Formeln. Andererseits sind in ihm sehr viel mehr Aufgaben enthalten, die (hoffentlich) geeignet sind zum Üben und zur Demonstration von Zusammenhängen. Die Erfahrung hat gezeigt, daß man Statistik weder durch ein Philosophieren Uber Begriffe (oder ein Auswendiglernen derselben) noch durch Erlernen von Rechengängen lernt. Es kommt hinzu, daß in der Regel ein Unterschied besteht zwischen Übungsaufgaben, die man lösen kann, wenn man in der Lehrveranstaltung an der entsprechenden Stelle angekommen ist, und Klausuraufgaben, bei denen der gesamte Stoff erwartet wird und auch "queibeet" gefragt werden kann. Es ist außerdem wichtig, systematisch Zusammenhänge zu erkennen, weil man sich sonst durch eine evtl. nur geringfügig modifizierte Aufgabe gleich wieder vor ein völlig neues Problem gestellt sieht. Aus diesem Grunde umfaßt das Buch vier Teile: 1. eine reichhaltige (wie gesagt z.T. über das Grundstudium hinausgehende) Formelsammlung, in der auf Übersichten viel Wert gelegt wurde, um einen Überblick Uber Konzepte und deren Zusammenhänge zu gewinnen, 2. Übungsaufgaben, die jeweils die entsprechenden Abschnitte des Formelteils betreffen, 3. einige sehr viel komplexere Klausuraufgaben, die (mitsamt den entsprechenden Zeichnungen) dem ebenfalls im Oldenbourg Verlag erschienenen Buch des Verfassers "Klausurtraining in Statistik" entnommen worden sind (dieses Buch soll somit nicht weiter fortgeführt werden), und 4. effektiv in letzter Zeit an der Universität Duisburg-Essen, Campus Essen von uns gestellte Klausuren, weil wir erfahrungsgemäß von Studenten immer wieder nach solchen Klausuren gefragt werden (es ist ja auch interessant zu sehen, wie mit Klausuren versucht wird, möglichst alle Gebiete abzudecken und wie im Endeffekt die Mischung der Aufgaben aussieht). Die vorliegende sechste Auflage ist inhaltlich identisch mit der fünften Auflage. Allerdings haben wir uns bemüht dort noch vorhandene Tipp- und sonstige Fehler zu korrigieren. Dafür danke ich meinen Mitarbeitern Herrn Dr. Andreas Kladroba und Herrn Dipl.-Volksw. Michael Westermann, die mich dabei sehr unterstützt haben. Mein besonderer Dank gilt Herrn stud. rer. pol. Joachim Koopsingraven, der mit großem Eifer und Engagement die entsprechenden Korrekturen am PC vorgenommen hat. Schließlich danke ich Herrn Martin Weigert vom Oldenbourg Verlag für die gewohnt angenehme und fruchtbare Zusammenarbeit. Ein dem gleichen Konzept entsprechendes Buch "Deskriptive Statistik" ist ebenfalls im Oldenbourg Verlag erschienen. Peter von der Lippe

Gliederung

Gliederung: Teil I:

Formelsammlung mit Tabellenanhang

Teil II: Aufgabensammlung Lösungen

Teil III: Klausurtraining Lösungen

Teil IV: Musterklausuren Lösungen

VII

Teil I

Formelsammlung mit Tabellenanhang

Gliederung

Gliederung von Teil I Kap.l:

Einführung, Stichprobenraum

Kap.2:

Kombinatorik

Kap.3:

Ereignisalgebra, Wahrscheinlichkeit

Kap.4:

Zufallsvariablen, Wahrscheinlichkeitsverteilung

Kap. 5:

Spezielle diskrete Wahrscheinlichkeitsverteilungen

Kap.6:

Spezielle stetige Verteilungen

Kap.7:

Grenzwertsätze, Stichprobenverteilung

Kap.8:

Schätztheorie

Kap.9:

Testtheorie

Kap. 10:

Stichprobentheorie

Tabellenanhang

3

Kap.l: Einführung

5

Kapitel 1: Einführung Wahrscheinlichkeitsaussagen beziehen sich auf Zufallsexperimente (ZE), und zwar (gerade wegen der Zufälligkeit) nicht auf den Ausgang eines einzelnen ZE, sondern auf die (zumindest gedanklich) unendliche Folge von Wiederholungen (Realisationen) des ZE unter einem - unveränderlichen - exakt beschriebenen Bedingungskomplex.

Def. 1.1: Zufallsexperiment (ZE) Ein Zufallsexperiment liegt vor, wenn 1. es wohldefinierte Ereignisse als Ergebnis des ZE gibt 2. das ZE unter denselben Bedingungen unabhängig beliebig oft wiederholbar ist 3. das Ereignis (der Versuchsausgang) im Einzelfall a) nicht voraussagbar ist b) nicht willkürlich (systematisch) zu beeinflussen ist 4. es wohl aber bei einer Vielzahl von Wiederholungen des ZE gewisse Regelmäßigkeiten gibt.

Def. 1.2: Stichprobenraum a) Ein Stichprobenraum Q. ist die Menge aller möglichen, sich gegenseitig ausschließender Elementarereignisse co2 con Q = |(0], co w n } bzw. {co, ö) efi} Im folgenden wird von endlichen Stichprobenräumen mit gleichwahrscheinlichen Elementarereignissen (Laplace-Annahme) ausgegangen. b) Es sind Elementarereignisse und zusammengesetzte Ereignisse (Def. 3.1) zu unterscheiden.

6

Kap. 2: Kombinatorik

Kapitel 2: Kombinatorik 1. Grundaufgaben der Kombinatorik 2. Binomialkoeffizienten und Multinomialkoeffizienten 3. Ergänzungen und Vertiefungen zum Auswahlproblem: Inklusion und Exklusion 4. Die Gamma- und die Beta-Funktion

6 8 13 14

Gegenstand der Kombinatorik sind enumerative Probleme, Fragen im Zusammenhang mit endlichen Mengen. Es geht um die Anzahl der Arten, wie eine wohldefinierte Operation (z.B. Auswahl oder Anordnung von Objekten) ausgeführt werden kann.

1. Grundaufgaben der Kombinatorik Fragestellungen 1. Anordnung von n Elementen (Permutation) oder Auswahl von i < n Elementen (die Elemente seien a, b, c,...) 2. Es ist zu unterscheiden: a) mit Berücksichtigung der Anordnung (Variation): {a,b} und {b,a} sind verschieden b) ohne Berücksichtigung der Anordnung (Kombination): {a,b} und {b,a} sind gleich 3. Wiederholungen. Dabei bedeutet: a) ohne Wiederholung (oW): Elemente a, b und c treten nur einmal auf b) mit Wiederholung (mW): Es kann auch {a,a}, {a,b,b}, {b,b,b},... auftreten Diese Kriterien werden kombiniert zu sechs Grundaufgaben (vgl. Übersicht 2.1).

Anwendungen in der Stichprobentheorie: a) Die Anzahl der Stichproben beim Ziehen ohne Zurücklegen ist K. Dabei sind die K Stichproben gleich wahrscheinlich. b) Die Anzahl verschiedener Stichproben mit Zurücklegen ist K w , davon sind aber nicht alle gleich wahrscheinlich. Durch das Zurücklegen ist die Urne praktisch unendlich, so daß auch i > n (i [sonst n] Umfang der Stichprobe; n [sonst N] Umfang der Grundgesamtheit).

Kap. 2: Kombinatorik

Übersicht 2.1: Die sechs Grundaufgaben der Kombinatorik a) Fallunterscheidungen Aufgabenart

Auswahl von i Elementen ("zur Klasse i")

Anordnung von n Elementen = Permutation

o.W.

m.W.

(1)

(2)

ohne Berücksichtigung der Anordnung = Kombination

mit Berücksichtigung der Anordnung = Variation

o.W.

m.W.

o.W.

m.W.

(3)

(4)

(5)

(6)

b) Formeln für die Anzahl (2.1) Anzahl der Permutationen ohne Wiederholung von n Elementen (2.2) Anzahl der Permutationen mit Wiederholung von n Elementen, wobei das k-te Element nk mal auftritt

P = n! = n • (n-1) •... • 2 • 1 „ n! pw - m nnk! k=l

m mit X n k = n w

(2.3) Anzahl der Variationen ohne v = n! =üinl Wiederholung (V) von n Ele(n-i)! UJ menten zur i-ten Klasse (2.4) Anzahl der Variationen mit V w = ni Wiederholung (V w ) zur i-ten Klasse (2.S) Anzahl der Kombinationen ohne n! K = inl= Wiederholung (K) U J i! ( n - i ) ! (2.6) Anzahl der Kombinationen mit Wiederholung (K w ) M

.

J

=^-J^Ttn

=

Bemerkungen: zu (1): Stirlingsche Formel: Für großes n gilt:

n! * n " I n n

nn+1/2 e"n.

7

8

Kap.2: Kombinatorik

zu (3), (5) u. (6):

0 II

ist der Binomialkoeffizient ("n über i") als Spezialfall des

Multinomialkoeffizienten (Formel für P w ). Ist m = 2, n, = i und n2 = n - i, so ist n! _ n! _ n! _ FIn k ! n,! n 2 ! i!(n-i)! U;' Die Zweiteilung der Elemente kann z.B. bedeuten: n, = i Elemente gelangen in die Auswahl n2 = n - i gelangen nicht in die Auswahl. Weitere Bemerkungen zum Binomialkoeffizienten vgl. Abschnitt 2. zu (4):

Hierbei kann jedes Element bis zu i-mal wiederholt werden (i kann auch größer als n sein).

Zusammenhänge der Formeln untereinander: PW->P

wenn für alle k = 1,..., m gilt n k = 1, folgt P w = P

V->P

wenn i = n gilt (also keine Auswahl), folgt V = P (Permutation ohne Wiederholung als Spezialfall der Variation ohne Wiederholung)

P W -»K

wenn n, = i und n2 = n - i, folgt P w = K (siehe oben; vgl. auch Gl. 2.15)

V->K

da jedes Element auf i! Arten permutiert werden kann, gilt (2.3a): V = i! K

K->KW

Herleitung der Kombinationen ohne Wiederholung aus dem Additionstheorem für Binomialkoeffizienten (Satz 2.1). Im trivialen Fall i=l (keine Wiederholungen möglich) ist

PW-»VW

Variationen mit Wiederholung als Summe aller möglichen Permutationen mit Wiederholung (Satz 2.2)

2. Binomialkoeffizienten und Multinomialkoeffizienten Def. 2.1: Binomialkoeffizient Der Ausdruck

mit n, i elN, 0 2-maligem Ziehen aus der Urne ist zu unterscheiden zwischen • Ziehen mit Zurücklegen (ZmZ, unabhängige Versuche): durch das Zurücklegen wird die Urne praktisch unendlich, so daß N nicht zu beachten ist, • Ziehen ohne Zurücklegen (ZoZ, abhängige Versuche) 2. Eine andere Veranschaulichung wiederholter Zufallsversuche mit polytomem und speziell dichotomem (Bernoulli-Experiment) Ausgang ist ein Banmdiagramm (Wahrscheinlichkeitsbaum). 3. Die Zufallsvariable (ZV) kann im folgenden unterschiedlich definiert sein: • • •

der Anzahl X der Erfolge bei n Versuchen (X ist die ZV, n ist keine ZV) der Anteil p = X/n der Erfolge bei n Versuchen (Relativierte Verteilungen, p ist eine Lineartransformation von X) die Anzahl X der nicht erfolgreichen Versuche bis zum r-ten Mal (oder speziell r = lten Mal) ein Erfolg auftritt

40

Kap.S: Spezielle diskrete Wahrscheinlichkeitsverteilunren

• oder die Anzahl X* der Versuche. Gerade hinsichtlich der letzten Betrachtung gibt es Unterschiede bei der Darstellung einer Verteilung in den Lehrbüchern, weshalb (wenn nötig) "alternative Formulierung" der Zufallsvariable aufgeführt werden. 4. Eine Variante des Umenmodells besteht im Ziehen aus k Urnen mit einem Anteil 7i{ schwarzer Kugeln. Das führt zur verallgemeinerten Binomialverteilung (von Poisson). Ein Modell, das ein Hinzufügen von Kugeln nach Ziehung vorsieht, führt zur Polya-Verteilung, einer Verallgemeinerung von Binomial- und Hypergeometrischer Verteilung. Urnenmodell von

mit Zurücklegen (ZmZ) X = Anzahl der Erfolge3'

ohne Zurücklegen (ZoZ) X = Anzahl der Erfolge

Binomialverteilung

Hypergeometrische Verteilung

\

Grenz vertei lungen (asymptot. Verteil.)

Poissonvert. "

2) 3>

einigenVerteilungen

Normalverteilung (stetig)

wenn nichts anderes vermerkt ist: diskrete Verteilungen Bernoulli-Experiment Andere Fragestellungen: GV, NB GV (geometr. Vert): Wie groß ist bei unabhängigen Bernoulli-Experimenten die Wahrscheinlichkeit, daß nach X = 0, 1, 2, ... Mißerfolgen erstmals ein Erfolg auftritt? Die Zufallsvariable X ist die Anzahl der Mißerfolge in einer Folge von Mißerfolgen bis zum ersten und i. d. R. einzigen Erfolg. Die Anzahl der Versuche ist dann X + 1. NB (negative Binomialvert.): f(x) ist die Wahrscheinlichkeit dafür, daß der r-te Erfolg gerade im (x + r)ten Versuch eintritt. Offenbar ist GV der Spezialfall r = 1.

Eigenschaften der Verteilungen (Die folgenden Bemerkungen gelten auch für stetige Verteilungen), Im Zusammenhang mit Wahrscheinlichkeitsverteilungen interessieren i. d. R. die folgenden Eigenschaften einer Verteilung: 1. Parameter (die die Gestalt der Verteilung bestimmen) und die hierbei zulässigen Wertebereiche

Kap. 5: Spezielle diskrete Wahrscheinlichkeitsverteiluneen

41

2. Interpretation der Zufallsvariable X und deren zulässiger Wertebereich 3. Momente der Verteilung sowie Median, Modus etc. 4. Erzeugende Funktionen, die u. a. auch Aufschluß geben über die Ziffern 5 und 6 5. Reproduktivität (vgl. Def. 5.2) 6. Zusammenhänge mit anderen Verteilungen - eine Verteilung V] kann z.B. ein Spezialfall einer anderen allgemeineren Verteilung V2 sein (etwa bei einer bestimmten Parameterkonstellation von V2) - Approximationsmöglichkeiten (vgl. Def. 5.3).

Def. 5.2: Reproduktivität Sind die Zufallsvariablen Xj , X2 ,..., X„ verteilt nach einer bestimmten Verteilung V und ist die Summe unabhängiger Zufallsvariablen Xj + X2 + ... + X„ ebenfalls nach V verteilt, so ist die Verteilung V reproduktiv.

Def. 5.3: Approximation Eine Folge von Verteilungen des gleichen Typs V b V 2 ,..., Vn, die sich durch die für die Parameter angenommenen Zahlenwerte unterscheiden, kann gegen eine Grenzverteilung G konvergieren, so daß es möglich ist, Wahrscheinlichkeiten nach V in guter Näherung durch meist leichter zu bestimmende Wahrscheinlichkeiten nach G zu approximieren.

2. Zweipunkt-, Binomial- und hypergeometrische Verteilung a) Zweipunktverteilung [ Z(ic)=B(l, n) ] Bei einmaliger Durchführung eines Bemoulli-Experiments kann x = 0 (Mißerfolg) mit der Wahrscheinlichkeit 1 - Jt oder x = 1 (Erfolg) mit der Wahrscheinlichkeit n auftreten. Man spricht von einer Zweipunktverteilung, weil die Zufallsvariable zwei Werte, Xi und x2 annehmen kann, in diesem speziellen Fall xi = 0 und x2 = 1. Es gilt E(X) = 7t und V(X) = n(l-n) Bemerkenswert ist, daß (wie Abb. 5.1 zeigt) die Varianz o 2 = V(X) im Betrag beschränkt ist. Sie beträgt

Abb 5.1:

V(X) = 7 l ( l - 7 t ) ^ | (O^n^l) 4 und nimmt ihren maximalen Wert an der Stelle ji = 1/2 an. Für die Momente der Z(n)-Verteilung erhält man ganz allgemein: E(X) = n = 0-(l-Jt) + l-7i = 7i und e ( x 2 ) = 0 2 (l-7t) + l 2 -7i = 7i .allgemein E ( x k ) = 7i.

42

Kap. 5: Spezielle diskrete Wahrscheinlichkeitsverteilungen

Daß alle Anfangsmomente den Wert it annehmen, ergibt sich auch aus den Ableitungen der momenterzeugenden Funktion Mx(t). Die Verteilung ist linkssteil (y > 0), wenn * < 1/2 und rechtssteil (y < 0), wenn it > 1/2 (also die Wahrscheinlichkeit des Erfolges größer ist als die des Mißerfolges). Übersicht 5.1: Zweipunktverteilung Z(n) = B(l,n) Wahrscheinlichkeitsfunktion

1 - 7t f

z(*) = " 7t 0

Verteilungsfunktion F

x

z( )=

=0

für

X(

für

x2 = 1

sonst

0

für

x iij., und Jij < und n j7i j = n j_] = X = const. Das sich so viele empirische Häufigkeitsverteilungen in guter Näherung durch die P(X)-Verteilung darstellen lassen, ist mit dem Poisson-Prozeß zu erklären. Die Anzahl X der Erfolge ist naturgemäß diskret, die Wartezeit zwischen den "Erfolgen" (z.B. den Ausfällen einer Maschine) kann diskret (Anzahl der Einheitsintervalle) oder stetig gemessen werden. Ist X poissonverteilt, so ist die Wartezeit geometrisch verteilt (GV*, Zeit diskret) bzw. exponentialverteilt (E(X), Zeit stetig). Die Poissonverteilung ist reproduktiv. Femer gilt: Ist X ~ P(A.) dann ist mit der Konstanten c cX ~ P(cX).

30

Kay. 5: Spezielle diskrete Wahrscheinlichkeitsverteilungen

b) Herleitung 1) Als Grenzverteilung der Binomialverteilnng: Bei konstantem X = mt geht die Binomialverteilung für n - x » (und somit rt->0) in die Poissonverteilung über. 2) Poisson-Prozeß (zeitlich): Die Häufigkeit des Eintretens von X Ereignissen in einem vorgegebenen Zeitintervall T ist (angenähert) poissonverteilt mit X als mittlere Ereignishäufigkeit, wenn • T in Intervalle der Länge AtX. zerlegt wird und in jedem Intervall ein Versuch stattfindet, wobei X = 0 oder X = 1 Erfolg möglich ist mit den Wahrscheinlichkeiten P 0 (t) = 1 - Xt und P] (t) = Xt. Die Wahrscheinlichkeit des Auftretens eines Erfolges ist proportional zur Länge t des Intervalls und nur von der Länge, nicht von der Lage des Intervalls abhängig (Stationarität), und • die Versuchsausgänge in den Intervallen unabhängig sind, d.h. die Wahrscheinlichkeit für 0 Erfolge im Intervall t + At ist P 0 (t + At) = P 0 (t) • P0(At) oder bei X = 1 Erfolg erhält man: P,(t + At) = P 0 (t) • P,(At) + P,(t) • P0(At) usw. Mit At->0 erhält man Differentialgleichungen und für den allgemeinen Fall die Gleichung /jAXg-Xt Px(t) + ^Px(t) = XPx-.(t) deren Lösung P x (t) = V ^ ist. Das ist aber beim Einheitsintervall t = 1 die Wahrscheinlichkeitsfunktion der Poissonverteilung. Im Poissonprozeß ist die Wahrscheinlichkeit des Auftretens eines Ereignisses proportional zur Länge des Zeitintervalls und X ist der Proportionalitätsfaktor. 3) Einfache Erklärung für fP(x=0): Für x=0 Erfolge gilt, wenn das Einheitsintervall in n sich nicht überschneidende Teilintervalle gleicher Länge 1/n aufgeteilt wird, wobei in jedem Intervall das Ereignis mit der Wahrscheinlichkeit l - 7 t = l-A./n nicht eintritt, so tritt das Ereignis im ganzen Zeitraum mit der Wahrscheinlichkeit (l - 7t)" nicht auf. Das Zahlenergebnis ist ähnlich f P (0) = e~X, weil lim(l - X,/n)" = n—*oo ist.

. wenn n hinreichend groß

c) Zusammenhang mit der Exponentialverteilung Ist die Wahrscheinlichkeit für das Nichteintreten eines Erfolges in jedem Teilintervall l - n , so ist die Wahrscheinlichkeit des Nichtauftretens in xn Intervallen der Länge 1/n also in einem Gesamtintervall der Länge x, unter den Voraussetzungen des Poissonprozesses: (l - X / n)™ = P(X £ x) nach der GV* Wegen lim(l-X./n) n x =e~Kx ist die Funktion n->oo F(x) = 1 - P(X > x) = 1 - e _ X x , was aber die Verteilungsfunktion der E(X)-Verteilung ist.

Kap.5: Spezielle diskrete Wahrscheinlichkeitsverteilungen

Übersicht 5.6: Poissonverteilung

P(X)

Wahrscheinlichkeitsfunktion

X* fp(x)m^ex , xelN

Verteilungsfunktion

F(x)= £ f ( v ) v=0 X>0 wie B(n,7t) (Grenzverteilung von B(n,7t) bei n-Ko, 7t->0 und X.=n7t=const.) Die Summe unabhängig poissonverteilter ZVn mit X,, X.2 Xk ist

Parameter Urnenmodell Reproduktivität

wieder poissonvert. mit X = X,+X2+...+A.k E*(X,k) = X k , a z = V(X) = X ,

Momente

H = E(X)=X,

erzeugende Funktionen

Wx(t) = exp[X(t-l)], Mx(t) = exp[X(e'-l)], H/X(t) = exp[X(e"-l)]

y=-)L>0 Vx

Übersicht 5.7: Anpassung einer Verteilung an eine andere Verteilung (verschiedene, in der Literatur erwähnte Faustregeln) Stochastische Konvergenz von Verteilungen Verteilung Binomialvert. (B)

kann approximiert werden mit der Poissonvert. (P)

Normalvert. (N) hvpergeom. Veit. (H)

Poissonvert. (P)

wenn n-+oo, 7t->0, nn = X = const.; gute Approximation bereits für n £ 100, n 2000, — < 0,01 oder 7t,(l-7t) < 0,05 N

Poissonvert. (P)

— < 0,1, N groß , 7i = — klein N N nn £ 4

Normalvert. (N) Normalvert. (N)

\Z9

Übersicht 5.8: a) X->X+1

f(x + l|n,7t)=

Rekursionsformeln

Binomialverteilung

x + i

*(«K«)

b) Poissonverteilung X-+X+1

51

52

Kap.5: Spezielle diskrete Wahrscheinlichkeitsverteilungen

noch Übers. 5.8 c) Hypergeometrische Verteilung X f(x + l1l n , M , N ) = n * • , . f(x|n,M,N) V ' x+1 (N-n)-(M-x) +l V 1 '

X->X+1

, , ( N - M - n + xVM + l) . . , x ffv x1n, M +1, N = S rz ^ r - i • ff x n, M, N) ' (N-MXM + l - x )

M -> M+l

N + 1 M ftx|n,M,N - ^ N + A - n ) .fix|n,M,N) + l) = / v 1 ' ( N + l - M - n + xXN + l)

N-+N+1

d) geometrische Verteilung f(x + l|7t) = ( l - n ) f ( x ) = q f ( x )

X-»X+1

e) negative Binomialverteilung X->X+1 Aus den Rekursionsformeln folgt, daß alle Verteilungen eingipflig sind (wenn man davon absieht, daß zwei benachbarte Werte x und x+1 Modalwerte sein können), einige Verteilungen sind stets (die GV), andere unter bestimmten Bedingungen (etwa NB: r E(X)

y > 0 immer linkssteil*'

Poissonverteilung (P)

V(X) = E(X)

y=

Zweipunkt (Z), Binomial (B), u. hypergeometrische Verteilung (H)

V(X) < E(X)

> 0 immer linkssteil

y>0wenn7i(l-7t) *) mit abnehmendem p=rc (zunehmendem q=l-7i) und zunehmendem y. b) Reproduktivität (das Zeichen ~ bedeutet: ist verteilt. Die Zusammenhänge gelten auch bei der Summe von n>2 ZVn). Xi, X2 sind verteilt:

X,+X,

Z

X,~Z(«),X 2 ~Z(7t)

~B(2,n)

B

X, - B (n,, ti), X2 ~ B (n2, tü)

~ B (ni+n2,7t)

H

Xi

GV P

H , X2 ~ H

reproduktiv nein ja nein

Xi-GV(7t),X 2 ~GV(7t)

- NB (r-2,7t)

X,~P(X,),X 2 ~P(X 2 )

~P(X,+>.2)

nein ja

c) Welche Werte kann die Zufallsvariable X annehmen? Alle natürlichen Zahlen X=0, 1, ... bei GV, NB und P natürl. Zahlen bis zu einem Maximalwert bei B und H.

Kao.5: Spezielle diskrete Wahrscheinlichkeitsverteilungen

53

5. Weitere Verteilungen eindimensionaler diskreter Zufallsvariablen Die Polya-Verteilung PL(n,S,N,c) ist eine Verallgemeinerung der B- und H-Verteilung. Urnenmodell: S (oder M) schwarze Kugeln (Erfolg), R rote Kugeln, N = S + R. Nach Ziehung einer Kugel werden c + 1 Kugeln des gleichen Typs (schwarz oder rot) hinzugelegt.

6. Polytome Versuche (mehrdimensionale diskrete Verteilungen) Urnenmodell: N Kugeln, davon M, = schwarze, M2 = weiße, M3 = rote Kugeln ... usw., so daß Ü M j = N , (j = l, 2 , ..., k) und 7ij = M j / N . Wie man sieht, liegt eine k-1dimensionale

Zufallsvariable

vor:

P(X, = x „ X 2 =x 2 , ..., X k = x k )

ist

die

Wahrscheinlichkeit x, schwarze und x2 weiße Kugeln usw. zu ziehen (k-1 Dimensionen, da die k-te Dimension durch

+ ti2 + ... + 7ik = 1 festliegt).

1) Multinomialverteilung (= Polynomialverteilung) Ziehen mit Zurücklegen: Wahrscheinlichkeit, bei n Zügen genau x„ x2 xk Kugeln des Typs 1,2,..., k zu ziehen (n = ÜXj), dargestellt durch den Vektor x - [x,....xk] ^mvW = —:—— ici' ni 1 ... Jti'. Der Klammerausdruck ist der Multinomial^x,!x 2 ! ... xk!y koeffizient. Man erhält f ^ x ) durch Expansion des Multinoms (7it + n 2 + ... 7ik)" . 2) Polyhypergeometrische Verteilung Urnenmodell wie Multinomialverteilung, aber Ziehen ohne Zurücklegen

f(x) =

3) Multiple Poissonverteilung f(x) =

;p[-(X, + X2+....+Xk)]

als Grenzverteilung der Multinomialverteilung.

54

Kap. 6: Spezielle stetige Verteilungen

Kapitel 6: Spezielle stetige Verteilungen 1. 2. 3. 4. 5. 6. 7.

Rechteckverteilung und andere lineare Verteilungen Normalverteilung (univariat) Exponentialverteilung Funktionen von normalverteilten Zufallsvariablen (x2, t, F) Modelle für Einkommensverteilungen Exponentialfamilie, Zusammenhänge zwischen stetigen Vert. Bivariate Normalverteilung

54 55 57 59 63 64 65

1. Rechteckverteilung und andere lineare Verteilungen a) Rechteckverteilung R(a, b) (stetige Gleichverteilung) Eine Zufallsvariable X ist gleichmäßig (gleich-) verteilt über dem Intervall [a,b], wenn f R (x) in diesem Intervall konstant —-— ist. Für die zentralen Momente gilt dann b-a b-a

1

E[(X-^]=

(k + l X b - a )

E[(X-n)k] =

2 )

a-b

\ 2

, so daß

b-a 1 falls k gerade 2 ) k+1 0 falls k ungerade

Spezialfall: Rechteckverteilung im Intervall [0,1] Dieser Spezialfall der Rechteckverteilung R(0,1), also a = 0, b = 1, ist aus folgendem Grande von besonderem Interesse: Bildet man eine Zufallsvariable Z, so daß z = F(x), so besitzt Z eine R(0,1) Verteilung, denn 0 < Z < 1 wegen 0 < F(x) < 1 bei beliebiger stetiger Verteilung von X und nach Gl. (4.26) gilt:

f *( z ) = íJf" 1 (z)] l ^ ' ^ l = fjF" 1 (z)]

b) Abschnittsweise lineare Dichtefunktion; Beispiel: Dreiecksverteilung

f(x) =

2a 2 +—x m m 2b 2 x k k 0

f(x) für

as? n 2 - l ta t — n4 s" Tn i T-1 2 2 2

_

, . i ( m i t s ? > s*>-

2. In einer linearen Regression mit p Regressoren (Absolutglied mitgezählt) wenn der Regressionskoeffizient ß durch b geschätzt wird, ist

Kob.6: Spezielle stettee Verteilungen

t = - — - ~ t„ B (mit a b als Standardabweichung der Stichprobenverteilung von b = ß, in «b Abhängigkeit von a 2 , der wahren Varianz der Störgröße), dann ist t 2 ~ Fp 2

2

, wenn in a b

2

die Varianz a ersetzt ist durch a = £ ü / ( n - p ) (Varianzschätzer). ctX M JJ Ist X~F(nyi) dann ist Z = - r r ~Bj (a, ß) (Beta-Verteilung 1. Art) mit a = — und ß = —. Übersicht 6.5: x2- Verteilung (Xn Wahrscheinlichkeitsdichte x >0

1 -— — — X" 1 "' e 2 2 r(m)

für

x

> 0

ftx) = 0

für

x£ 0

bei m = n/2 und f ( p ) , p > 0 die Gammafunktion (vgl. Kap.2) Parameter

n = Anzahl der Freiheitsgrade, n e IN E(X) = h = .i

Momente

V(X) = CT2 = 2n

K-31 2

Modus:

n - 2 wenn i

andere Verteilungen

Spezialfall: Gamma-Verteilung G(a, ß) = G

, 2^

Grenzübergang: N(n, 2n) erzeugende Funktionen ¥,(t)-(l-2it)~! Bedeutung Reproduktivität

Konfidenzintervall und Test von Varianzen, Regressions- und Korrelationsanalyse, Anpassungs- und Unabhängigkeitstests wenn X,, X 2 , ~ xj, dann I Xj ~ x\ mit n = I nj

gl

62

Kap. 6: Spezielle stetige Verteilungen

Übersicht 6.6: t- Verteilung (tj Wahrscheinlichkeitsdichte - 00 < x< + 00

M) x2V *

f

nj

V

Parameter

n = Anzahl der Freiheitsgrade, n e IN E(X) = 0 (alle ungeraden Momente: 0) wenn n > 2

Momente V(X) = E

wenn n > 3 ; y = 0 (symmetrisch), wenn n > 4

n-2

(xk)_.(2k-l)!(n-2k-2)! 1

'

("-2)!

(gerade Anfangsmomente; 2k < n-1), Modus: n - 2 wenn n > 2 bei n = 1 Cauchy-Verteilung mit n —> co Obergang zu N (0,1) Konfidenzintervalle und Tests bei Mittel- und Anteilswerten sowie bei Regressionskoeffizienten

andere Verteilungen Bedeutung

Übersicht 6.7: F-VerteilungF (m, n) Wahrscheinlichkeitsdichte x> 0

m ff

n W

=

« - ( ^ ( f )

7

^

(m+n]

E(X) = ——- (wenn n > 2) n-2 Momente V(X)=

2 n 2 ( m + n - 2; ) 2

m(n-2) (n-4)

(wenn n > 4)

rf—-kl r f - - k l r

Modus Grenzübergänge Bedeutung

(fMf)

n(m-2) f (wenn m 2 2) m(n + 2) n - > oo dann F -> xL Vergleich von Varianzen, Linearitätstest bei Regressionsanalyse, Varianz- und Kovarianzanalyse

Kap. 6: Spezielle stetige Verteilunsen

63

Übersicht 6.8: Zusammenhänge zwischen x2', t- und FVerteilung und Anwendungen der Verteilungen a) Zusammenhänge wenn

dann ist

F-Fm.n

s

t~t„ '

mit den Parametern

verteilt

m=n= 1 m=1 m = 1, n -> 00

C(1,0)N (0,1 )

00

F

n

t2 t

m=1 n -> 00

Xm F(l,n) N (0,1)

Cauchy-Verteilung

b) Anwendung der Verteilungen bei Konfidenzintervallen und Tests Substitution einer Varianz a 2 durch die Stichprobenvarianz o 2 bedeutet: Anwendung: Test und Konfidenzintervalle für einen Parameter mehrere Parameter

2 wenn die ZV mit er2 dann ist die ZV mit 6

1. 2.

t-verteilt F-verteilt

normalverteilt ist C2-verteilt ist'1

' Ist X ~ dann ist X/n ~ C 2 verteilt (modifizierte x2-Verteilung). '' Anwendung von Nr. 2 auch: Konfidenzellipse bei linearer Regression. Die Verteilungen in Spalte 1 sind Spezialfälle der Verteilungen von Spalte 2: wenn n -> oo dann t„ - » N (0, 1); wenn n -> oo dann F,^,, Cj,

5. Modelle für Einkommensverteilungen In diesem Abschnitt werden zwei Verteilungen für nichtnegative ZVn (also X > 0) dargestellt, die zwar formal kaum in Beziehung zueinanderstehen, aber für Ökonomen (u.a. als Modelle für die Einkommensverteilung) von Interesse sind.

a2)

a) Logarithmische Normalverteilung

Sie spielt filr Ökonomen eine wichtige Rolle als Modell für die Einkommensverteilung. Ist die Summe von Einflußgrößen asymptotisch normalverteilt, so gilt dies bei der L-Verteilung für ein Produkt. Die L-Verteilung ist stets linkssteil und zwar um so mehr, je größer o 2 ist. Ist X (etwa das Einkommen) L(n,a 2 ) verteilt, dann ist Ginis Dispersionsmaß die Fläche unter der o Standardnormalverteilung im Intervall

rv?

< X
0 Parameter H e IR, a > 0 (Zusammenhang wenn In X = Y ~ N|JIY,CY2J dann X ~ L(|IX, CTX2) mit N(|I,CT2)Verteilung

Reproduktivität

wennX, ~ L^CT 2 ) undX 2 ~ L|H2,CT2) dann X,-X 2 ~

+FI2, ER,2 +CT22)und

L(H,-H2;

CT,2+CT22)

H = E(X) = exp[V +

E(x r ) = exp[rn + ± r V )

Momente CT2 = V(X) = exp[2n + ct2(S -1)] mit S = ea' ,y = VSM(S + 2) Median ¡1 = exp((i), Modus exp(|i - ct2) Bedeutung

Einkommensverteilung, Disparitätsmessung, Lebensdauer, Festigkeit

6. Die Exponentialfamilie von Verteilungen und Zusammenhänge zwischen stetigen Verteilungen Eine umfangreiche Klasse von diskreten und stetigen Verteilungen,

(6.5)

f(x|e) = A(E) p(x) exp [B(6) • q(x)]

die bei entsprechender Spezifizierung der Funktionen A, B, p, q wichtige Wahrscheinlichkeitsverteilungen als Spezialfälle enthält, heißt Exponentialfamilie. Spezialfälle (Beispiele)

a) diskret Binomialverteilung

A(0) = (l-7t)° ,

B(e) = ln

p(x) =

q(x) = x (1-4 femer: Zweipunkt-, Poisson-, geometrische-, negative Binomialverteilung

Kap. 6: Spezielle stetiee Verteilungen

£5

b) stetig Exponentialverteilung A(0) = X , p(x) = 1,

B(0) = - X , q(x) = x

femer: N (n,CT2),N (0, 1), Gaimna-[G (a, ß)], B, -, B 2 -, x N Rayleigh- und Maxwell-Verteilung als Spezialfälle zur G-, B, - und Cauchy-Verteilung [C (X, n)].

7. Bivariate Normalverteilung N2(m 2) Der Zufallsvektor x- [X, X2] besitzt eine N2-Verteilung wenn die Dichtefunktion f N i (x) =

(6.6)

.Mit

lautet mit |x' = [n„ vh] und £ als Varianz-Kovarianzmatrix £ = a 1 2 CTJ

X -IL und der Korrelationsmatrix R = 1 P standardisierten Variablen Zi = — P

1

(p = Korrelationskoeffizient) erhält man f Nj (z) = (27t)"1 |R|"I e x p ( - | z' R-'z)

(6.7)

Horizontale (parallel zur x,, x2- Ebene) Schnitte f(x) = const = c durch die Dichte sind Ellipsen im x , , x2- Koordinatensystem zf -2pz,z 2 +z\ = c und im Grenzfall p = 0 Kreise. Für die Regressionslinien E(X21 X,) in Abhängigkeit von X, [und E(X, |X2) von X2] erhält man Geraden (die Regressionsgeraden) E{X2|X, = X[) = n 2 + p — ( x , - n,) und E^XjXj = x 2 ) analog . CT i Die momenterzeugende Funktion von N2 ist M x ( t „ t 2 ) = exp n 1 t 1 + n 2 t 2 + i ( a 1 2 t 1 2 + 2 a 1 2 t 1 t 2 + a 2 2 122) Wie die Gestalt von M(0, tj) und M(t„ 0) zeigt, sind die Randverteilungen von N2 wieder Normalverteilungen. Die Momente der Randverteilungen erhält man durch mehrmaliges Differenzieren nach t, bzw. nach t2. Das Produktmoment E(X,X 2 ) erhält man mit der Ableitung

8

Mfri»^) ^ at,at2

der Stelle t

= t , = 0.

66

Kap. 6: Spezielle stetige Verteilungen

Übersicht 6.10: Zusammenhänge zwischen eindimensionalen stetigen Verteilungen N(n, CT2) bzw. N(0, 1))

0 gilt [man sagt auch: X„ konvergiert "mit (oder: "in der") Wahrscheinlichkeit" gegen c]: (7.1)

lim P ( | X „ - c | < s ) = l n—koo

oder:

v

'

'

M

plim X„ = c (d.h. der Wahrscheinlichkeitslimes ,t von X„ ist c).

Kap. 7: Grenzwerts/Uze. Stichprobenverteilune

Bemerkungen zu Def. 7.1: 1. Gl. 7.1 besagt: die Wahrscheinlichkeit dafür, daß X„ in einer s-Umgebung um c liegt strebt gegen 1, nicht aber: die Größe X„ strebt gegen den festen (nicht von n abhängigen) Wert c. 2. Man kann auch c = 0 setzen und erhält mit (7.2)

lim P (|X | £ e) = 0 O—»ao

V

'

'

die Aussage: X„ konvergiert stochastisch gegen Null. Zwei Folgerungen: 1) Eine Folge {X„} von Zufallsvariablen strebt gegen eine Grenz-Zufallsvariable X oder Konstante c (Gl. 7.1), wenn die Folge {X„ - X} oder {X„ - c} stochastisch gegen Null konvergiert. 2) Gl. 7.2 gilt dann und nur dann, wenn die Folge F n (x) der Verteilungsfunktion von X„ im gewöhnlichen Sinne gegen die Verteilungsfunktion der Einpunktverteilung . . iO fllr x < 0 F W = | i ffc x > 0 in jeder Stetigkeitsstelle von F(x) (alle Werte x * 0) konvergiert. 3. Eine stärkere Forderung als die stochastische Konvergenz (Konvergenz mit Wahrscheinlichkeit) ist die Konvergenz im Mittel (vgl. Def. 7.4).

c) Konvergenz von Verteilungsfunktionen Def. 7.2: Konvergenz von Verteilungsfunktionen Die Folge der Verteilungsfunktionen F n (x) einer Folge von Zufallsvariablen X„ heißt konvergent, wenn eine Verteilungsfunktion F(x), die Grenzverteilungsfunktion, existiert, so daß für jede Stetigkeitsstelle von F(x) gilt: 03)

lim F n (x) = F(x)

Bemerkungen zu Def. 7.2: 1. Es kann vorkommen, daß eine Folge von Verteilungsfunktionen gegen eine Funktion konvergiert, die keine Verteilungsfunktion ist. 2. Man beachte, daß hier Konvergenz im üblichen (nichtstochastischen) Sinne (punktweise Konvergenz einer Folge von Funktionen [s. o.]) gemeint ist, nicht stochastische Konvergenz. 3. Im allgemeinen folgt aus der Konvergenz von Verteilungsfunktionen Fn(x) nicht, daß auch ein lokaler Grenzwertsatz gilt, d.h. die Wahrscheinlichkeits-, bzw. Dichtefunktionen fj,(x) konvergieren. 4. Konvergiert Fn(x) gegen F(x) und sind a, b (a < b) zwei beliebige Stetigkeitspunkte der Grenzverteilung F(x) dann gilt (7.4) lim P (a £ X„ f(x) b) global F n (x)

F(x)

Def. 7.2

(asymptotische) Stichprobenverteilung

Def. 7.4

homograd Grundgesamtheit

Konvergenz von Verteilungen

Def. 7.5

heterograd

Zweipunktverteilung X diskret oder stetig; beliebig verE(X j )*=Jc,V(X i ) = * ( ! - « ) Vi teilt mit E(Xj) = n, V(Xj) = a 2 Vi X l t X 2 ,..., X„ also n unabhängige*' Zufallsvariablen aus identischen Grundgesamtheiten; nach Ziehung der Stichprobe Realisationen x,, x 2 ,.., x n X = 2 Xf Anzahl der Erfolge

Y = S Xj Merkmalssumme

P = - X Anteil der Erfolge n Theorem von Bernoulli plim(P) = n a) die Wahrscheinlichkeitsvert. von X (Binomialverteilung) bzw. P (relat. Binomialvert.) strebt gegen die Normalvert. (de Moivre-Laplace).

X = - X X , Mittelwert n Satz von Ljapunoff plim( X ) = n a) asymptotische Verteilung von Y und X ist jeweils die Normalvert. Y ~ N(nn, na 2 )

b)das gilt auch für die Verteilungsfunktion F(z), F(p)

b)als globaler Grenzwertsatz: Satz von Lindeberg-Lcvy **>

x-NLAV

n;

*) Diese Annahme kann auch gelockert werden (NormalVerteilung auch Grenzverteilung bei abhängigen ZVn, vgl. Satz von Markoff). ••) Verallgemeinerung (nicht identische Verteilungen): Zentraler Grenzwertsatz von Ljapnnoff

2. Stichproben und Schätzproblem, Stichprobenverteilung Im Zusammenhang mit Stichproben (Def. 7.3) tritt das Problem auf, "Parameter" der (unbekannten) Grundgesamtheit (GG) mit Hilfe von beobachteten Werten einer Stichprobe (genauer: einer Funktion dieser Werte, der "Schätzfimktion", Def. 7.4) zu schätzen.

70

Kap. 7: Grenzwertsätze. Stichproben Verteilung

Def. 7.3: Stichprobe 1. Eine durch Zufallsauswahl genommene endliche Menge von Beobachtungswerten x,, x 2 ,.., x„ aus einer endlichen oder unendlichen Grundgesamtheit heißt Stichprobe. Die Zahl n ist der Stichprobenumfang. Die Grundgesamtheit hat, wenn sie endlich ist, N Elemente (den Umfang N). 2. Hat jedes Element einer endlichen Grundgesamtheit die gleiche a priori (vor Ziehung der Stichprobe) bekannte von Null verschiedene Wahrscheinlichkeit in die Stichprobe zu gelangen, so spricht man von uneingeschränkter Zufallsauswahl. 3. Erfolgen die Ziehungen der n Einheiten im Rahmen einer uneingeschränkten (reinen) Zufallsauswahl unabhängig voneinander, so spricht man von einer einfachen Stichprobe. Bei einer einfachen Stichprobe geht man davon aus, daß jeder Stichprobenwert Xj (i = 1,2 ) die Realisation einer Zufallsvariable Xj ist, wobei alle Zufallsvariablen X,, X2, ..., X„ identisch verteilt sind. In diesem Fall sind die ZVn auch unabhängig identisch verteilt (independently, identically distributed [i.i.d.]), so daß die gemeinsame Verteilungsfunktion FG(x,, x2, ..., x„) als Produkt F,(x,) F2(X2) ... Fn(xn) darstellbar ist.

Def. 7.4: Schätzwert, Schätzfunktion, Mean Square Error 1. Bestimmte kennzeichnende Größen, etwa das arithmetische Mittel, die Varianz, der Anteilswert einer Grundgesamtheit werden Parameter (0) genannt. Sie sind i.d.R. Funktionen der Zufallsvariablen X,, X 2 ,..., XN (bei endlicher Grundgesamtheit). 2. Eine Funktion der Stichprobenwerte, wie 9 = g(X„ X2, ..., XJ, die vor Ziehung der Stichprobe eine Zufallsvariable ist, heißt Schätzfunktion (engl, estimator oder statistic) oder Stichprobenfunktion. Ein konkreter Funktionswert 0 = g(x,, x2, ... , x j (nach Ziehung der Stichprobe errechnet) heißt Schätzwert. 0 dient der Schätzung von 0. 3. Die Größe (7.5)

MSE^EP-e)2]

heißt mean Square error oder mittlerer quadratischer Fehler. Bemerkungen zu Def. 7.4: 1. Unter den Parametern und den hierzu korrespondierenden Schätzfunktionen spielen vor allem zwei lineare Funktionen eine besondere Rolle, nämlich: a) bei einer metrisch skalierten Zufallsvariable 0, = |i, der Mittelwert (bei einer endlichen Grundgesamtheit) bzw. der Erwartungswert (bei einer Wahrscheinlichkeitsverteilung) und b) bei dichotomen (zweipunktverteilten) Variablen 0 2 = n, der Anteil der Erfolge (bei endlicher Grundgesamtheit) bzw. die Wahrscheinlichkeit eines Erfolges. Man spricht im ersten Fall von hetero grader. im zweiten von homo grader Theorie (vgl. Übersicht 7.1). 2. Der MSE läßt sich wie folgt zerlegen (Varianzzerlegung): (7.5a)MSE = E[{0 - E(0 )}*] + [ E(0 )-0]* = V(0) + [B(0 )P

Kob.7: Grenzwertsätze. Slickvrobenverteilune 11 3. Daraus folgt: Der MSE ist genau dann Null, wenn Varianz V(0) und Bias B(6) Null sind. Die "Verzerrung" B(0) ist Null, wenn E(0) = 6, also 0 ein erwartungstreuer (unverzerrter, biasfreier) Schätzer für 6 ist. 4. Da 6 als Stichprobenfunktion vom Umfang n der Stichprobe abhängig ist, kann man auch 0 = 0 . schreiben. Mit (7.6)

lim E | 0 n - 0 | 2 = lim {0-E(0 n )} 2 = O

ist die Konvergenz im Mittel (Konvergenz im quadratischen Mittel) der Zufallsvariable 0„ gegen die ZV oder Konstante 0 definiert. Sie impliziert Konvergenz mit Wahrscheinlichkeit (stochastische Konvergenz), aber nicht umgekehrt. Es ist üblich, die Standardabweichung VMSE als Stichprobenfehler zu bezeichnen (vgl. Abschn. 8.2).

Def. 7.5: Stichprobenverteilung Die Verteilung

der Zufallsvariable 0

als Schätzfunktion 0

für 0 heißt

Stichprobenverteilung von 0 . Erklärung zu Def. 7.5: (ift Aus einer endlichen GG des Umfangs N sind I I verschiedene Stichproben des Umfangs n ohne Zurücklegen zu ziehen, die bei uneingeschränkter Zufallsauswahl alle gleich wahrscheinlich sind*). Jede dieser Stichproben liefert eine Häufigkeitsverteilung des Merkmals X und z.B. ein arithmetisches Mittel x. Auch für die endliche, bzw. unendliche Grundgesamtheit gibt es eine Häufigkeits-, bzw. Wahrscheinlichkeitsverteilung von X mit dem Mittelwert bzw. Erwartungswert (i. Die Wahrscheinlichkeitsverteilung aller I

I Stichprobenmittelwerte x, die nicht notwendig

alle verschiedene Werte annehmen müssen, ist die Stichprobenverteilung des arithmetischen Mittels.

3. Abschätzungen von Wahrscheinlichkeiten a) Ungleichung von Markoff Bei nicht negativen Zufallsvariablen X mit einem endlichen Erwartungswert E(X) gilt für jede positive reelle Zahl c (7.7)

P(X£c) 30) ist die asymptotische Verteilung der Schätzfunktion (vgl. Übersicht 7.1,7.2, Abb. 7.1 bis 7.3) •

im homograden Fall (Satz von de Moivre-Laplace) X = XXj P = X/n

*

(Anzahl der Erfolge, i = 1, 2, ,.,n) (Anteil der Erfolge)

im heterograden Fall (Satz von Lindeberg-Levy) Y = I X j (Merkmalssumme) X = Y/n (Stichprobenmittelwert)

jeweils eine Normalverteilung (unter den drei Voraussetzungen des Theorems von Bemoulli und ZmZ) mit den in Übersicht 7.2 genannten Parametern. Mit der z-Transformation erhält man entsprechend jeweils eine N(0,l)-verteilte ZV. Die Normalverteiltheit der Summe Y (auch wenn die Xj nicht normalverteilt sind) läßt sich leicht veranschaulichen am Beispiel der Augenzahl beim Würfeln (vgl. Abb. 7.1 bis 3). Die Grundgesamtheit (Verteilung von Xi, X2, ... usw. allgemein Xj): ist eine (diskrete) Gleichverteilung vgl. Abb. 7.1. An der Verteilung der Augensumme und der durchschnittlichen Augenzahl bei unterschiedlich vielen Würfen ist die asymptotische Normalverteilung schnell zu erkennen (vgl. Abb. 7.2 und 7.3).

Kap. 7: Grerawertsätze. Stichorobenverteilune

Abb. 7.1 bis 7.3: Veranschaulichung des Grenzwertsatzes von Lindeberg-Levy Abb. 7.1: Verteilung der Grundgesamtheit Parameter

0,18 0,16 0,14 0,12

0.1 0,08

0,06

0,04 0,02

IIIIII

n =1 (Grundgesamtheit) H = 3,5 ct2 = 2,9167

Abb. 7.2: Augensumme bei n = 1,2,... mal Würfeln (Darstellung Wahrscheinlichkeitsverteilungen als Polygonzug) X = 2 Xj ~ N(n|i, na 2 )



1

2

3

4

5

t

7

I

»

10

II

12

13

14

IS

1« IT

1
1

mit 6 = ta das folgende Konfidenzintervall (Schwankungsintervall ne und Intervalle für Anteilswerte analog) (8.26)

P(X - to
1 -

nt

92

Kap. 9: Tcsltheorie

Kapitel 9: Statistische Testverfahren 1. 2. 3. 4. 5.

Allgemeine Einführung Ein-Stichproben-Test Zwei-Stichproben-Test Varianten des x 2 -Tests Mehr als zwei Stichproben

92 96 96 101 103

Nach einer allgemein gehaltenen Einführung werden Ein- und Zwei-Stichprobentests für Mittel- (heterograd) und Anteilswerte (homograd) sowie Varianzen behandelt. Die Abschnitte 4 und S behandeln auch bivariate Daten mit zwei und mehr Stichproben.

1. Allgemeine Einführung Def. 9.1: Hypothese, Test a) Eine (statistische) Hypothese ist eine Annahme/Vermutung über die Verteilung der Grundgesamtheit. Als Modell für diese Verteilung dient i.d.R. eine Wahrscheinlichkeitsverteilung f(x 10,,.., 0 p ) mit den Parametern 0,,..., 0 p . b) Ein (statistischer) Test (Hypothesentesf) ist ein Verfahren, mit dem auf der Basis einer Prüfgröße (Testgröße) T, die eine Stichprobenfunktion (vgl. Def. 7.4) ist, mit einer vorgegebenen Irrtumswahrscheinlichkeit a (Signifikanzniveau) über die Verwerfung (Ablehnung) oder Annahme (besser: NichtVerwerfung) einer Hypothese entschieden werden kann. Grundlage der Entscheidung ist die bedingte (bei Geltung der Hypothese Hg) Stichprobenverteilung g(t | Hg) der Prüfgröße T, deren Realisationen t genannt werden. Bemerkungen zu Def. 9.1 1. Nach Art der Hypothese werden verschiedene Testarten unterschieden (Obersicht 9.1) 2. Logik eines Tests: Man tut so, als ob H 0 richtig ist und prüft, ob dann der Stichprobenbefund noch "im Rahmen der Wahrscheinlichkeit" (der mit Stichproben verbundenen Zufälligkeit) ist oder so wenig wahrscheinlich (weniger wahrscheinlich als a ) oder "überzufallig" (oder "signifikant") ist, daß H0 abgelehnt werden sollte. Man beachte, daß wegen der Abhängigkeit der Stichprobenverteilung g(t | Hg) von n die Verwerfung, also ein "signifikantes Ergebnis", auch mit entsprechend vergrößertem Stichprobenumfang zu erzielen ist. 3. Eine Testgröße T ist eine speziell für die Entscheidung geeignete Stichprobenfunktion und damit eine ZV (meist eine standardisierte ZV, die direkt mit den Quantilen einer Wahrscheinlichkeitsverteilung verglichen werden kann). 4. Die möglichst zu verwerfende Hypothese wird Nullhypothese Hg genannt (Begründung vgl. Gl. 9.2), eine ihr entgegenstehende Hypothese Altemativhypothese H,. Die Funktion g(t | Hg) ist die Stichprobenverteilung der Prüfstatistik T bei Geltung von H0. 5. Der Annahme (bzw. Ablehnung) von Hg äquivalent ist die Situation, daß der Wert (die Realisation) der Stichprobenfunktion 0 innerhalb (bzw. außerhalb) eines bei Geltung von Hg (also im Sinne eines hypothetischen direkten Schlusses) konstruierten Schwankungsintervalls liegt. Während jedoch 0 von der Maßeinheit von X abhängt, gilt für dies die spezielle Stichprobenfunktion T nicht.

Kart. 9: Testtheorie

Übersicht 9.1: Arten von statistischen Tests 1. nach der Art der Hypothese''

Parametertests

konkreter ZahlenIntervall wert (z.B. H 0 : n = ^ ) (zB- H 0 :n)

Anpassungstests Annahme Uber die Verteilungsklasse (z.B. H : X ~ N( n , o 2 ))

2. nach der Art und Anzahl der Stichproben

eine Stichprobe (Ein-Stichproben-Test)

k = 2 Stichproben

unabhängige Stichproben (UT)4)

k > 2 Stichproben

abhängige (verbundene) Stichproben (AT)4)

3. nach der Herleitung der Stichprobenverteilung hierbei sind die Annahmen Uber die Verteilung der Grundgesamtheit notwendig: verteilungsgebundene Tests = parametrische5) Tests

weniger notwendig: verteilungsfreie Tests = nicht parametrische5* Tests

4. nach der Skaleneigenschaft der Untersuchungsmerkmale

metrische Skalen: parametrische5) Tests

nicht metrische Skalen: nichtparametrische5) Tests

1) In der Literatur werden auch HomogenitSts- (H) und Unabhängigkeitstests (U) unterschieden. Man kann H (stammen mehrere Verteilungen aus der gleichen GG?) und U (statistische Unabhängigkeit?) auch als spezielle Anpassungstests auffassen (Anpassung an Modelle der GG der folgenden Art: F,(x) = F2(x) =... = F(x) oder fl[x,y) = f,(x) £,(y) [fj = Randverteilung]). 2) Auch goodness of fit Test 3) Der Begriff wird auch im allgemeinen Sinne für alle Arten von Tests gebraucht oder auch im Gegensatz zu "Gegenhypothesentests". 4) Zur Unterscheidung zwischen abhängigen und unabhängigen Stichproben vgl. Def. 9.4. 5) Terminologie ist nicht einheitlich.

93

94

Kao.9: Testtheorie

Def. 9.2: Kritischer Bereich, Entscheidungsregel a) Mit der Vorgabe des Signifikanzniveaus a und der Stichprobenverteilung g(t | Hg) ist eine kritische Region (Ablehnungsbereich, Verwerfungsbereich) K^ gegeben mit (9.1)

P(t e K^ | Ho) < a .

Das Komplement von K^ heißt Annahmebereich (oder Verträglichkeitsbereich, besser: Nicht-Ablehnungsbereich). Das Intervall K^ ist je nach Art von H, einseitig oder zweiseitig eingeschränkt. Die Grenzen c, und/oder c2 von K^ heißen kritische Werte. b) Mit t„ als das dem vorgegebenen a entsprechende Quantil der Stichprobenverteilung und t als dem mit den Stichprobenwerten errechneten Zahlenwert der Prüfgröße gilt als Entscheidungsregel: wenn t 6 K^, dann Hg verwerfen, wenn t g K,, (also im Annahmebereich), dann Hg annehmen. c) Mit der Annahme von Ho ist nicht deren Richtigkeit bewiesen. Bei der Testentscheidung können Fehler auftreten (vgl. Übersicht 9.2). Bemerkungen zu Def. 9.2 1. Der kritische Bereich ist so konstruiert, daß die Realisation t der Prüfgröße T unter Ho mit einer Wahrscheinlichkeit von höchstens a in diesen Bereich fällt. "Höchstens" gilt, weil bei einer diskreten Stichprobenverteilung g ( t | H o ) , etwa der Binomialverteilung als Stichprobenverteilung der Wert von genau a evtl. nicht eingehalten werden kann. 2. Ist die Alternativhypothese zu H„: n = Hq A b b 9 1 : Ein und 2we,seitlger Tests H,: n * Ho (also n > ^ oder n < ^ so ' " liegt ein zweiseitiger Test vor mit zwei kritischen Bereichen t < c, = t ^ und t>c 2 =t,_^(Abb. 9.1) H,: n < jio einseitig "nach unten" (linksseitig) t < c, = t a H,: |i > Ho einseitig "nach oben" einseitig einseitig (rechtsseitig) t > c 2 = t,_ a . 3. Der Wert von ttt hängt von der Gestalt der Stichprobenverteilung g ( t | H o ) ab. Ist diese K a 1 die Standard-NV, so ist t a = za. Sie kann C| ¿2 2 auch die t-,x , F- oder Binomialverteilung sein. Dann ist t a aus der entsprechenden Tabelle zu bestimmen. 4. Fehlerarten (vgl. Übersicht 9.2, nächste Seite) 5. Zwei-Stichproben-Test Bei zwei Stichproben ist i.d.R. zu prüfen, ob die beiden Stichproben x u , x12>...,x, und x21, x22,...,x2llj aus der gleichen GG stammen. Im heterograden Fall ist die Frage, ob x , - x 2 * 0 verträglich ist mit der Hypothese "kein Unterschied", also mit (9.2)

Ho: n, - ^ = A = 0

oder

n, =

oder ob Hq zugunsten einer Altemativhypothese

Kap.9: Testtheorie

(9.3)

95

Hp ji, - Hj = A, zu verwerfen ist.

Annahme (Ablehnung) von Hg ist übrigens äquivalent der Überschneidung (NichtÜberschneidung) von Schwankungsintervallen für X, und X2 bzw. der Oberdeckung (Nichtüberdeckung) des Wertes 0 durch das Schwankungsintervall für X ( - X2. Übersicht 9.2: Fehlerarten beim Hypothesentest wirklicher Zustand (state of nature) Testentscheidung (action)

H0 ist wahr

H0 ist falsch

H 0 ablehnen

Fehler 1. Art P(teKJH0)l-ß

H„ annehmen

kein Fehler P(t*Ko|H0)>l-a

Fehler 2. Art P(teKJH,)M 0 Prüfgröße T ist N(0,1) - verteilt daher z statt t

P(z|H 0 )

/

/

\

ß

/

\ X

Ho Annahmebereich

\

z.

\

P(z|H,)

-a

V

Hi kritische Region

z

2. Ein-Stichproben-Tests (Übersicht 9.3) Übersicht 9.3 (nächste Seite) enthält die relevanten Informationen über die Prüfgrößen (jeweils T genannt) und deren Stichprobenverteilung bei Geltung von Hg zur Durchführung von Tests über a) den Mittelwert |i (heterograd) b) den Anteilswert 7t (homograd) c) die Varianz N - 1 (9.7) 3

tB.1 asymptot. N(0,1) wenn n > 30

CT TZ

(9.8) 4

X

CT

t,,.] asymptot. N(0,1) wenn n > 50

~ ^o N-n N

b) Homograd (Test über Anteilswert/Wahrscheinlichkeit) Hj,: 7i = 7to , Xj ~ Z (ji), Anteilswert P = X/n, X = £Xj mit 7t0 ist auch die Varianz der zweipunktverteilten GG hypothetisch angenommen V(X) = 7^(1 - ti0) Fallunterscheidung: nur Fälle 3 und 4 oben [ct2 hypothetisch angenommen] ••••

Fall ZmZ

Prüfgröße T (9.9)

(3)

V

ZoZ

(4)

P —Jt0 1 „ , (71^(1-Ttg)

(9 10)

'

P~tn *

CTp

n P-xt0

1*o0-*o) V n

N

"n N-l

— • — •

Stichprobenverteilung von T asymptotisch N(0,1) wenn npq > 9; sonst Binomialtcst"' t^, -> N(0,1) sonst hypergeometrisch verteilt

*) Ist die Stichprobenverteilung die Binomialverteilung (diskret), so empfiehlt sich die Kontinuitätskorrektur. Die errechneten Prüfgrößen sind dann t 1/2 = - n® ± '/>n)/ap wobei + gilt für den unteren (linken) und - für den oberen (rechten) kritischen Bereich, also + für den Vergleich mit z ^ und - mit z , ^ .

98

Kav.9: Testtheorie

noch Übersicht 9.3: c) Test über die Varianz H„: o 2 = o j , X j ~ N(h,ct2)

der G G

Prüfgröße T

Verteilung xj., (Normalverteiltheit sehr wichtig)

(9.11)T-(n-f2=nS22 CT a0 o

Zwei-Stichprobenproblem: Stichprobenverteilung Stammen die Zufallsvariablen X n , X 1 2 , . . . , X l n i und X 2 1 , X 2 2 > —, mit |i, tCT,und (ij, a*, so ist die Varianz der Linearkombination Ä = X, - X 2 = -

n

i

£Xli + (-—] i V «V

X2nj

aus Grundgesamtheiten

(i = 1,2,....n, und j = 1,2

n 2 ):

j

(9.12) V(Ä) = V(X,) + V(X 2 ) = - ^ - + ^ n, n2 wenn zwei unabhängige Stichproben vorliegen. Bei zwei abhängigen Stichproben (n, = n2 = n) ist dagegen auch die Kovarianz C(X„X 2 ) zwischen X, und X 2 zu berücksichtigen.1 Es gilt (9.13)

V(Ä) = V(X!) +V(X2)-2C(X1,X2) = — + —

n

n

- il—-1

V

n/

o„

Durchfährung der Tests Übersicht 9.4 enthält alle Informationen zur Durchführung der Tests auf Unterschiedlichkeit • Mittel- bzw. Erwartungswerten, beurteilt aufgrund von Mittelwertdifferenzen (heterograd, Teil a der Übersicht) • Anteilswerten bzw. Wahrscheinlichkeiten, beurteilt aufgrund der Differenz zwischen Anteilswerten der Stichproben (homograd, Teil b der Übersicht), und • der Unterschiedlichkeit der Varianzen zweier unabhängiger Stichproben, beurteilt aufgrund des Quotienten der beiden Varianzen (Teil c der Übersicht 9.4) Übersicht 9.5 stellt die entsprechenden Tests bei zwei abhängigen Stichproben dar.

Das ist die Kovarianz der zweidimensionalen (gemeinsamen) Stichprobenverteilung von X j und X 2 . Sie beträgt i

Q

E(X,Xj) mit E ^ X j ) = o 1 2 .

Kao.9: Testtheorie

99

Übersicht 9.4: Prüfgrößen im Zwei-Stichproben-Fall (zwei unabhängige Stichproben) a) Heterograd (Test über Mittel- bzw. Erwartungswertdifferenz) auch Sigma-DifferenzVerfahren genannt, große Stichproben Hg: (i, - iij = 0, X, ~ N(|x,, o j ) und X 2 ~ N ^ a * ) , Stichprobenwerte: x „ x 2 , n „ n2 Fallunterscheidung o* und o \ der GG bekannt und gleich 1

r | und ol unbekannt und

ungleich

gleich 3

2

ungleich 4

Auf die Fälle ZoZ soll hier verzichtet werden. Ist Hg: (i, - jij = A * 0, so ist in den Formeln A durch A - A zu ersetzen. Fall

Verteilung von T

Prüfgröße T homogene Varianzen a j = A=

| X , - H

=

2

0 ,

= ct2

A = Xt-X2 N(0,1)

1

(9.14)T •>

MZ G n +Ii Vl 2

„ l +± \n, n2 (9.15)T =

N(0,1)

2

VD1 «2 CTJ =CTjaber unbekannt •> zuerst a 3

1

n s

2 2 bestimmen (pooled n-2 variance), dann analog Fall 1 b> (9.16)

= i i

+ n s

(9.17)1=

approximativ N(0,1), wenn n, > 30 und n2 >30

T- \ 1 a \ n, + n 2

af und er^ ungleich und unbekannt

4

^ ( n - a j + n j )

p

i _ = al+al

Vni

n

* J L _ VN VK, + K 2

angenähert t-verteilt mit u Freiheitsgr.c>, bzw. N(0,1) wenn n, > 30 und n2 > 30

2

a) Damit ist durchaus a f * a 2 oder dem F-Test (Gl. 9.19) getestet.

* s 2 verträglich. Die Homogenität der VarianzenCT,= a\ wird mit

b) die Wurzel nimmt ihren maximalen Wert V n / T an, wenn nj = n 2 ist. c) Bestimmung der Anzahl u der Freiheitsgrade N2 Wenn u nicht ganzzahlig, nehme man die nächste ganze Zahl. u

K? , n,-l

n2-l

KOB.9: Testtheorie

100

b) Homograd: zwei gleiche Anteilswerte/Wahrscheinlichkeiten Hg: 7t, " jtj, X, und X2 identisch zweipunktverteilt mit 7t Prüfgröße T

Verteilung

Zuerst bestimmen P = n'p> +n 2 P 2 dann (P, - P , = Ä), dann n,+n 2 P,-P2

(9I8)

T=

n 7t(l - 7t) ^ 9 dann N(0,1) Test ist identisch mit x2-Test einer Vierfeldertafel -> Gl. 9.21

1—ir~N

Ist die Hypothese 7t, - n2 - A * 0 zu testen, dann ist mit A = P, - P2 die Prüfgröße (918b)

T =

(Qi=1 Pi i=1,2) I p n ' t n = ~N(0>1) - > ' MVI , r2V2 \ n, n2 c) Test über die Gleichheit zweier Varianzen

Hq: ctf =CTjoder of/a* = 1, Bedingung X, ~ N(h„ct?) und X 2 ~ N ^ a 2 ) Prüfgröße F

Verteilung

n,S? (9.19)

F « | l = D ' *2l er j n2S2 n2-l

mitäfxi2

F

Statt des Quotienten zweier Varianzen könnte man auch die Differenz zweier Standardabweichungen testen, wobei die Statistik S, - S2 bei großen Stichproben normalverteilt ist mit Erwartungswert 0 und Varianz g,2 /2n, + g 2 /2n 2 . Übersicht 9.5: Tests bei zwei abhängigen (verbundenen) Stichproben Hypothese

Prüfgröße

Ho: n, - HÜ = 0 Ai = X „ - X 2 i o d e r D i = X , - Y i ( i = l,2l n) (t-Test fiir Paar(9.19) T= mitCT^=^£-und differenzen) n ®D n, = n2 * n (heterograd) ¿ 1 = - i 7 I ( D i - D ) 2 » Sp = I l D , 2 - D 2 n-1 n H„: 7t, = 7t2 vgl. McNemar - Test (Gl. 9.22) (homograd) Ho: a ] = a*

(9-20) T

iöf -CT 2 )Vn-2 r Y

V

r12 = Korrelation von x u mit x2j in der Stichprobe

Verteilung

T-Vi

T~V2

Kao.9: Testtheorie

101

Bemerkung zu t-Test für Paardifferenzen im heterograden Fall: Für eine "verkürzte" Version (leichter rechenbar) ist die Verteilung der Prüfgröße A = E D ? / ( £ D j ) 2 tabelliert (A-Test). Da offensichtlich D = X, - X2>> kann der Zähler von T in Gl. 9.19 auch lauten (X, - X2) - (n, - Hj), vorausgesetzt X u ~ NO^.a? und X2i ~ Nin^Cj). Bei unabhängigen Stichproben stellt T eine standardisierte Differenz zweier Mittelwerte dar, bei abhängigen Stichproben ist T ein (mitCTQ) standardisierter Mittelwert von Differenzen.

4. Varianten des x2-Tests Die Prüfgröße f } ist i.d.R. konstruiert aufgrund beobachteter absoluter Häufigkeiten iij (i = 1,2,.../) bzw. bei einer zweidimensionalen Häufigkeitstabelle n^ (j = l,2,...,s) und "theoretischer", d.h. bei Geltung von HQ zu erwartender absoluter Häufigkeiten in der Stichprobe ej bzw. e^. (9.20)

x2

= £i!Lz£i)i e i-i i

=

£ £ L i-i e i

n

bzw. (9.20a)

^ ¿ ¿ l ^ l Ü . e 1-1 j-i d

Die je nach Art des Tests unterschiedliche Hg wird verworfen, wenn der stets nicht-negative nach Gl. 9.20 bzw. 9.20a errechnete Wert der Prüfgröße y} größer ist als der a entsprechende Wert der x2-Verteilung. Die theoretischen Häufigkeiten ej bzw. e,j sollten für alle i = 1,2,...,r und j = l,2,...,s nicht kleiner als 5 sein. Übersicht 9.6: Varianten des %2 Tests a) Fragestellung und Daten

b) Hypothesen und Prüfgrößen Test

AT

Hypothese

ej bzw. ejj in Gl. 9.20/9.20a

Verteilung

Verteilung von X in der GG hat wenn X diskret b> X Xu eine durch Ho spezifizierte Cj = npj = n W u = r-p-l Gestalt mit p Parametern (die diskrete Variable kann auch Freiheitsgrade H«: f(x) = f0(xiei...ep)•> nur nominalskaliert sein) etwa f o (x|9,,0 2 ) = N(mcr2)

102

UT

Kap.9: Testtheorie

n n i i eH = Stichprobenkon' n tingenztafel bei Unabhängigkeit

% f(x,y) = f x (x) f^y) f x (x) und fy(y) sind die Randverteilungen

H 0 :f,(x) = .. = f s (x) = f0(x) s Stichproben aus homogenen HT') Grundgesamtheiten, j «* 1,2,..,s

r

X» mit o = (r-l)(s-l)

s £nu M Pi- s r

Xumit n; = n

;e

«

^

o = (r-lXs-l)

ZZ»i

(n.j = X X Umfang der ji-l ten Stichprobe)

J=1 i —1

a) mit p aus der Stichprobe zu schätzenden Parametern. b) wenn anstelle von Xj die i-te Klasse mit der Untergrenze Xju und der Obergrenze Xj0 tritt (stetiger Fall), gilt: Pj = F o i x ^ - F 0 ( X j u ) . Für diesen Fall stehen jedoch bessere Tests zur Verfügung. c) Wie an der Konstruktion der PrUfgröße erkennbar ist, sind UT und HT formal identische Tests. Die Forderung fj(x) = fj)(x) für alle j = 1,2,...,s kann als Gleichheit der bedingten Verteilungen (und damit Unabhängigkeit) aufgefaßt werden.

Vierfeldertafel (VT/HT mitr = s=2) Häufigkeiten Stichprobe* (Variable Y) 1 2 x = 1 (+)

n„=a

n, 2 = b

x = 0(-)

n2!=c

n22 = d

Summe

"i

n2

*) Zwei unabhängige Stichproben bei HT, bzw. die zweite dichotome Variable Y (mit Y = 1 und Y = 0) bei UT:

P2

a a+c b b+d

a n

i b

n2

T,

a + b

P= PQ =

mit n = ii] + n 2 a+b n

c+d n

Prüfgröße nach Gl. 9.18: T = Vn(ad - bc) / ^(a+bXc + dXa + cXb + d) und beim x2-Test: n(ad-bc) 2 = T2 (9.21) x2 = . (a + b)(c+d)(a + c)(b + d) Wenn T ~ N(0,1), dann ist X2 = T2 ~ X? • Der x2-Test ist also äquivalent dem t-Test (Gl.9.18). Zwei abhängige Stichproben (Mc Nemar-Test) Typische vorher (1) - nachher (2) - Befragung der gleichen Personen n = a + b + c + d , n * = b + c. Für den Test interessiert nur die reduzierte Zahl n der Beobachtungen.

Stichprobe 1

Stichprobe 2

X=1

y=l a

y=0 b

x= 0

c

d

Ho: P(x = 1, y = 0) = P(x = 0, y = 1) = n = 0,5. Die Prüfgröße ist dann

Kan.9: Testtheorie

b-n*-7t T= ' Vn-ii(l-7t)

-(c-n'-Tt)

b-c Vb+c

103

• v . [bzw.N(0,1)]

für den Test bei n* > 20 (bei n* £ 20 Binomialtest) Zusammenhang mit x2-(Ein-Stichproben)-AT: Die zu erwartenden Häufigkeiten sind bei Hq jeweils ej = Vi n* = Vi (b + c) Häufigkeiten empirisch (iij)

b

c

theoretisch (et )

Vm'

Vi n*

(9.22)

x2 = ^ ( Z b 2 + 2c2)-n* = ; = T 2 ~ xfn b+ c Bei kleinem n sind in Gl. 9.21 und 9.22 auch Kontinuitäts (Stetigkeits)-Korrekturen üblich. Es gilt dann im zweiseitigen Test: v2 ad-bc|~: (Ib-c^-l)2 (9.21a) x 2 = (a + b)(c + d)(a + c)(b + d) und (9.22a) x 2 = b+ c

{

5. Mehr als zwei Stichproben

Die Verallgemeinerung des t-Tests für zwei unabhängige Stichproben im heterograden Fall bei Varianzhomogenität (Gl. 9.16) für k > 2 Stichproben heißt auch Varianzanalyse (genauer: einfache univariate Varianzanalyse [ANOVA]; "einfach" weil nach nur einem [evtl. nur nominalskalierten] Merkmal k Klassen [k Stichproben] gebildet werden und "univariat" weil Mittelwerte und Streuungen hinsichtlich nur einer Variable X betrachtet werden). Man kann die Varianzanalyse als Homogenitätstest begreifen (in diesem Sinne: Verallgemeinerung des t-Tests) oder aber auch im Sinne eines Unabhängigkeitstests, wenn die Daten statt k unabhängige Stichproben k Ausprägungen (oder Klassen) eines (nicht notwendig mehr als nur nominalskalierten) Merkmals Y sind. Die Varianzanalyse zeigt, ob eine Abhängigkeit der metrisch skalierten Variable X von der Variable Y besteht. Y(unab-

X (abhängig)

hängig)

nominalskaliert N

metrisch skaliert M

N (nominal)

X J -Test *>

Varianzanalyse

M (metrisch)

-

Regressionsanalyse

"> auf Unabhängigkeit (UT)

104

Kap. 9: Testtheorie

Übersicht 9.7: Tests bei k ¿2 unabhängige Stichproben Prüfgröße T

Test (Hypothese) Test auf Gleichheit von k Mittelwerten Ho: Hi = n2 = •••= Hk = H bei Normalverteiltheit und Streuungsgleichheit') - rr1 a, - c r 2 - . . . - a k F-Test, Varianzanalyse

Verteilung

Xj = Mittelwert der i-ten Stichprobe i = 1,2,.^ X = ( Z X j n,)/n Gesamtmittelwert k , erklärte SAQ b) : SAQ E = I n ^ X j - x ) i=l k n. ~ Residual SAQ: SAQ R = ¿ ¿ ( x , , - x ) 1 i-ij-i Prüfgröße SAQ e

T

T

~ F„„0l u, = k - l u 2 = n-k Freiheitsgraden

=SAQr n-k

auf Gleichheit von k Anteilswerten 11, = n2 = . . . = 7tk = 7t auf Gleichheit von k Varianzen H 0 : af = ... = ctJ = ct2 H t : af * a 2 für bestimmte i (Bartlett-Test)

2

X -Homogenitätstest: gleiche Zweipunktverteilung Z(n) bei k Stichproben Mit CT? = S ( x j j - X i )

Xk-l

/(».-O.j-UJN

und 5 2 = ^ ( n i - l ) ä f

/(n-k),i =

erhält man

(9.24)

T = —!

I N=1

1

N

-



wobei

1

. ü j —1 n - k ' 3(k-l)

1

Varianzhomogenität; Kenntnis der Varianzen ist aber nicht erforderlich. Summe der Abweichungsquadrate SAQ£ ist ein Maß der externen und SAQr der internen Streuung.

mit

Kap. 10: Stichprobentheorie

105

Kapitel 10: Stichprobentheorie 1. Durchführung von Stichprobenerhebungen 2. Geschichtete Stichprobe 3. Klumpenstichprobe und zweistufige Auswahl 4. Weitere Stichprobenpläne

105 108 111 113_

1. Durchführung von Stichprobenerhebungen a) Techniken der Zufallsauswahl und Stichprobenpläne Übersicht 10.1: Techniken der Zufallsauswahl

Verfahren

auf Anordnung und Numerierung des Auswahlrahmens fußende Verfahren

keinen Auswahlrahmen voraussetzende, an Merkmalen der Einheiten orientierte Verfahren

systematische Auswahl *)

Zufallszahlen

Buchstabenverfahren (Namensanfang)

Geburtstagsverfahren

* Jede Ic-te Karteikarte nach der i-ten (Zufallsstart i). Der Abstand k (als Anzahl der Karteikarten oder als Breite des Kartenstapels) wird durch den Auswahlsatz n/N definiert. Oder: Karteikarten deren fortlaufende Nummer auf i lautet (Schlußziifernverfahren).

b) Notwendiger Stichprobenumfang Der für eine Stichprobe von geforderter Genauigkeit und Sicherheit mindestens erforderliche Stichprobenumfang n* ergibt sich aus einer Umformung der Formeln für das Konfidenzintervall. Die Größe n* hängt ab von: • • •

Genauigkeit Sicherheit Homogenität der GG.

1. Genauigkeit ist definiert als absoluter Fehler e, d.h. die halbe Länge des (symmetrischen zweiseitigen) Schwankungsintervalls (direkter Schluß) gem. Übersicht 8.9 also: •

im Fall 1 (heterograd):

e=z

Vn

und

106

Kap. 10: Stichprobentheorie



im Fall 2 (homograd):

e = za J — — ^ .

Auflösung dieser Gleichungen nach n liefert die in Übersicht 10.2 zusammengestellten Formeln für den notwendigen Stichprobenumfang. • e e e Relativer Fehler: e = — , bzw. — , allgemein — , also e in Einheiten von 0. H 7t 8 2. Sicherheit ist die Wahrscheinlichkeit 1 - a, der ein bestimmter Wert za zugeordnet ist. Genauigkeit und Sicherheit sind konkurrierende Forderungen. 3. Homogenität der Grnndgesamtheit a 2 bzw. n (1 - 7t). Der Stichprobenfehler a , bzw. o p ist direkt proportional zuCTbzw. -Jn (l - tc) . Häufig ist die Varianz der GG nicht bekannt. Mit o*2 bzw. 7t*(l - 71*j soll angedeutet werden, daß diese Größen geschätzt sind. Eine konservative Schätzung des notwendigen Stichprobenumfangs erhält man im homograden Fall mit 7t*(l-7t*) = l / 4 . Übersicht 10.2 enthält die Abschätzungen des bei gewünschter Sicherheit erforderlichen Stichprobenumfangs aufgrund der Formeln für die Intervallschätzung (Übersicht 8.9) und damit aufgrund der Grenzwertsätze. Würde man demgegenüber den für die Intervallschätzung von für eine Sicherheit von 1 - a erforderlichen Stichprobenumfang bei einem absoluten Fehler in Höhe von e = e mit der Tschebyscheffschen Ungleichung (Gl. 7.10*) abschätzen, so erhielte man:

(10.1)

.2 ^ n* > — , e a CT

was natürlich erheblich größer ist als n* gem. Übersicht 10.2 weil 1/a > z 2 . 1 l - a

0,9 0,95 0,99

z 1,6449 1,9600 3,2910

z2 2,7057 3,8416 10,8307

a

10 20 100

1 -z 2 a 3,696 5,206 9,233

Bei einer geforderten Sicherheit von 90% (99%) wäre der danach erforderliche Stichprobenumfang 3,7 - mal (9,2 - mal) so groß wie gem. Übersicht 10.2. Es gibt auch Formeln für den erforderlichen Stichprobenumfang um z.B. • eine vorgegebene Genauigkeit in bestimmten Teilgesamtheiten (z.B. Bundesländern) zu garantieren (das ist v.a. in der amtlichen Statistik ein wichtiges Kriterium), • eine Varianz mit vorgegebener Genauigkeit und Sicherheit abschätzen zu können oder • um im Zwei-Stichproben-Fall einen hypothetischen Unterschied (etwa n, - - A) mit einer bestimmten Irrtumswahrscheinlichkeit in den Stichproben zu erkennen.

Kap. 10: Stichprobentheorie

107

Übersicht 10.2: Notwendiger Stichprobenumfang bei einfacher Zufallsauswahl'') (Fallunterscheidung wie in Übersicht 8.9) heterograd

homograd

Fall 1 „2 *2 Ji. \ jl ohne • Z CT Z V Endlichkeits n > —v— = —-r— e e -korrektur (mit V =CT*/HVariationskoeffizient)

Fall 2 e2 z

»v n >

K

1 — mit K = z CT e +— N und mit entsprechender Formel unter Verwendung von e* 2

~

e*2 7t*

J

Fall 5 W mit Endlichkeits -korrektur

Z 2 (l-7t*)

ZV(I-K-)

Fall 6 «=) .

K' 2

K' e +— N mit K = z 2 7t*(l-7t*) [e(x)]2 .

110

Kap.IO: Stichorobeniheorie

Auf die entsprechenden Formeln im Fall ZoZ soll hier verzichtet werden. Eine andere i.d.R. nicht proportionale Aufteilung von n in n£ (n = £ n k ) wäre die Aufteilung mit vorgegebener (gewünschter) Genauigkeit e k in jeder Schicht (Gl. 10.14a).

Schichtungseffekt Bekanntlich gilt bei einfacher Stichprobe (ZmZ) — a ^ e

k

V k gewährleistet ist.

Aap. 10: Stichprobentheorie

111

3. Klumpenstichprobe (cluster sample) und zweistufige Auswahl Notation, Stichprobenpläne Aufteilung der GG in M Klumpen (cluster) mit den Umfingen N{ (i = 1, 2,..., M) in der GG. Von den M Klumpen werden m zufällig ausgewählt und jeweils mit • allen ihren Einheiten (einstufiges Auswahlverfahren*) ) ausgezählt, also mit Nj Einheiten, wenn der j-te Klumpen in die Auswahl gelangt (j = 1,2 m), • einer Zufallsauswahl von r^ Einheiten beim ausgewählten j-ten Klumpen (Auswahlsätze ( n j / N j ) 100 < 100%) untersucht (zweistufige Klumpenauswahl). Ein Klumpen ist eine natürliche (vorgefundene) Ansammlung von Untersuchungseinheiten, die in sich möglichst heterogen sein sollte (eine verkleinerte GG) und die Klumpen sollten untereinander möglichst homogen sein. Hinsichtlich Klumpen und Schichten werden also gegensätzliche Forderungen aufgestellt. Der in der Praxis wichtigste und aus Kostengründen besonders beliebte spezielle Fall einer Klumpenstichprobe ist die FHchenstichprobe (area sample) mit Regionen (z.B. Gemeinden) als Klumpen.

Mittelwertschätzung bei einstufiger Klumpenauswahl und Nj = N a) Punktschätzung x (10.15)

x = A= £Nj (j = 1,2

mN

m

m; Stichprobenumfang n = m N , i = 1

M und k = 1,2,..., Nj = N )

Wegen der Vollerhebung innerhalb eines Klumpens ist das Klumpenmittel |jj ohne Stichprobenfehler zu schätzen (allerdings nur bei den Klumpen, die in die Auswahl gelangen, j = 1, 2 m). Der Schätzwert beruht auf den m ausgewählten Klumpen im Unterschied zum wahren Mittelwert p, der endlichen GG

0=1.2

m, i = l , 2

M und mit N = £ Nf = M • N).

XNi

b) Varianz von X Die Varianz von X bei einer Auswahl von m aus M Klumpen (ZoZ) ist (10.16) V v( x ) = a | = ^ ^ ' m M-l mit

= Varianz zwischen (between) den Klumpen. Nach Definition ist das

*) Klumpenauswahl im engeren Sinne, in der Art, wie in Übersicht 8.5. In Gegenüberstellung zur geschichteten Stichprobe beschrieben; Auswahlsatz auf der zweiten Stufe 100%. Der Stichprobenumfang n liegt dann mit der Anzahl m der ausgewählten Klumpen fest mit n = X N; (j = 1 , 2 , m ) .

112

Kap. 10: Stichprobentheorie

.k Diese Summe der quadrierten Summen läßt sich zerlegen in •

MN = N Größen (xik - n) 2 , die in ihrer Summe die N-fache (MN -fache) Gesamtvarianz (er2) der Variable X in der (endlichen) Grundgesamtheit ergeben und



M N ( N - l ) Glieder der Art ( x i k - n X * i i - ^ ) mit k * l , und k,l = 1,2,...,N( = N.

Das Mittel dieser Produkte

M N N 1 MN(N-1)m k=ll=l

= 0*, =f5CT

(die Doppelsumme in den eckigen Klammem hat n ( n - i ) Summanden) ist die durchschnittliche Kovarianz der Betrachtungen innerhalb der Klumpen und p heißt Intraklasskorrelationskoeffizient. Er ist ein Maß der Homogenität der Klumpen. Offenbar ist MN2 = MN + MN(N - 1 ) , so daß gilt: ,

ct2

MN(N-l)

2 CT r

,

_

,

ct2

Der Faktor in den eckigen Klammem wird auch Varianzaufblähungsfaktor (VBL) genannt. Ist (was die Regel ist) VBL > 1, so ist die Klumpenstichprobe nicht so wirksam wie die einfache Stichprobe, denn Gl. 10.17 eingesetzt in Gl. 10.16 liefert: (,0,8,

v(x),

4

,^[u(N-

1

)p].2i(,-B)v

B l

.

(wegen n = mN) im Vergleich zur Varianz der Stichprobenverteilung (10.19)

er2 N - n n

N-l

=

a2 MN-mN n

MN-1

CT2 =

M-m a 2 f , m") =7«— 1

n M-l/N

nl

M/

bei einfacher Zufallsauswahl*).

Zweistufige (Klumpen-)Auswahl Die Varianz V(x) läßt sich zerlegen in eine von a j und eine von a 2 (Varianz innerhalb [within] der Klumpen) abhängige Komponente. Anders als in Gl. 10.15 sind die Klumpcnmittelwerte jij durch Xj zu schätzen. Man erhält wieder mit Nj = N als Punktschätzer filr (J..: x = £ x j / m.

*) Wird in Gl. 10.18 und 10.19 jeweils CT2 durch CT2 geschätzt, so ist im Nenner der Endlichkeitskorrektur M (bzw. N) statt M-l (bzw. N-l) zu schreiben.

Kap. 10: Stichorobentheorie

113

Der Stichprobenumfang ist jetzt n = £ n j < X N j = mN, weil auf der zweiten Stufe ausgewählt wird üj / Nj S l . Für die Varianz von x erhält man mitCTJund (10.20)

V(X) = ^

M

Im

M/

m

\n{

NjJ

w

4. Weitere Stichprobenpläne a) Ungleiche Auswahlwahrscheinlichkeiten: PPS-Verfahren Prinzip: Berücksichtigung der Größe (des Merkmalsbetrags x ( ) der Einheiten (i = 1,2,...,N) einer endlichen GG bei Auswahl und Hochrechnung (Auswahl mit der Wahrscheinlichkeit w{ proportional zur Größe xf der Einheit i [probability proportional to size PPS] statt mit w f =l/N für alle i bei einfacher Stichprobe). Die Schatzfunktion für n lautet mit w. gem. Gl. 10.22: (10.21)

X=

(10.22)

W i

n j=i Nwj

= 3 - = -iL 2>i Nu

(j = 1,2

n)

(i=l,2...,N)

Sie erlaubt eine exakte "Schätzung" von (sogar mit n=l) wenn w( = Pj, also w, identisch ist mit dem Anteil von x{ am Gesamtmerkmalsbetrag X x j . Meist wird w{ jedoch mit einem anderen Merkmal Y (etwa Y: Fläche bei der Schätzung von X: Ernteertrag) geschätzt: (10.23)

w > f .

Es gilt bei Stichproben ZmZ 1 £ X? _N ¡=1W;

(10.24) ct| = V(X) = V

2

Für Wj = 1/N erhält man die bekannten Ergebnisse für die einfache Stichprobe E^xj = |i und V(x) = a 2 / n . v ( x ) nach Gleichung 10.24 ist erwartungstreu zu schätzen mit:

nj=i vN W j

wjl-in-ljwj

Die Differenz zwischen der Varianz der Stichprobenverteilung von X bei einfacher Stichprobe und bei PPS ist:

Mit Wj = 1 / N gibt es keinen Genauigkeitsgewinn (AV =0) und die Varianz v ( x ) bei PPS ist dann kleiner (AV > 0 ) als bei einfacher Stichprobe, wenn der Ausdruck in den eckigen Klammem positiv ist. Das ist z.B. der Fall, wenn für wf Gl. 10.22 gilt, denn dann ist dieser Ausdruck x 2 - £ |i.2pj = x 2 - |i 2 > 0, wobei x 2 das zweite und (i das erste Anfangsmoment der endlichen GG ist.

b) Mehrphasige Stichproben Eine zweiphasige Stichprobe (auch double sampling genannt) liegt vor, wenn aus einer Stichprobe von n aus N Elementen der GG (z.B. eine einfache Stichprobe) erneut eine Stichprobe von m aus (diesen) n Elementen gezogen wird.*) Das Verfahren ist i.d.R. nur sinnvoll, wenn der Vorteil einer Schichtung (nach dem Merkmal y) oder einer gebundenen Hochrechnung (bei Benutzung der Information über y) den Nachteil der Reduktion des Umfangs von n auf m überkompensiert und z.B. die Variable y (anders als das Untersuchungsmerkmal x) leicht aus einer Kartei zu entnehmen ist. Die erste Stichprobe dient der Beschaffung von Informationen über y, mit der eine zweite, kleinere (m.=0,1 f(x) F(x) 0,9048 0,9048 0,0905 0,9953 0,0045 0,9998 0,0002 1,0000 0,0000 1,0000

>.=0,2 F(x) f(x) 0,8187 0,8187 0,1637 0,9825 0,0164 0,9989 0,0011 0,9999 0,0001 1,0000

>.=0,3 F(x) f(x) 0,7408 0,7408 0,2222 0,9631 0,0333 0,9964 0,0033 0,9997 0,0003 1,0000

>.=0,4 f(x) F(x) 0,6703 0,6703 0,2681 0,9384 0,0536 0,9921 0,0072 0,9992 0,0007 0,9999 0,0001 1,0000

>.=0,5 F(x) «W 0,6065 0,6065 0,3033 0,9098 0,0758 0,9856 0,0126 0,9982 0,0016 0,9998 0,0002 1,0000

>.=0,6 F(x) 0,5488 0,5488 0,3293 0,8781 0,0988 0,9767 0,0198 0,9966 0,0030 0,9996 0,0004 1,0000

>.=0,7 F(x) 0,4966 0,4966 0,3476 0,8442 0,1217 0,9659 0,0284 0,9942 0,0050 0,9992 0,0007 0,9999 0,0001 1,0000

X=0,8 F(x) f(x) 0,4493 0,4493 0,3595 0,8088 0,1438 0,9526 0,0383 0,9909 0,0077 0,9986 0,0012 0,9998 0,0002 1,0000

>.=0,9 F(x) f(x) 0,4066 0,4066 0,3659 0,7725 0,1647 0,9371 0,0494 0,9865 0,0111 0,9977 0,0020 0,9997 0,0003 1,0000

X=1

>.=1,5 F« 0,2231 0,2231 0,3347 0,5578 0,2510 0,8088 0,1255 0,9344 0,0471 0,9814 0,141 0,9955 0,0035 0,9991 0,0008 0,9998 0,0001 1,0000

X=2 F(x) fix) 0,1353 0,1353 0,2707 0,4060 0,2707 0,6767 0,1804 0,8571 0,0902 0,9473 0,0361 0,9834 0,0120 0,9955 0,0034 0,9989 0,0009 0,9998 0,0002 1,0000

X=3 F(x) f(x) 0,0498 0,0498 0,1494 0,1991 0,2240 0,4232 0,2240 0,6472 0,1680 0,8153 0,1008 0,9161 0,0504 0,9665 0,0216 0,9881 0,0081 0,9962 0,0027 0,9989 0,0008 0,9997 0,0002 0,9999 0,0001 1,0000

>.=4 F(x) fW 0,0183 0,0183 0,0733 0,0916 0,1465 0,2381 0,1954 0,4335 0,1954 0,6288 0,1563 0,7851 0,1042 0,8893 0,095 0,9489 0,0298 0,9786 0,0132 0,9919 0,0053 0,9972 0,0019 0,9991 0,0006 0,9997 0,0002 0,9999 0,0001 1,0000

0,3679 0,3679 0,1839 0,0613 0,0153 0,0031 0,0005 0,0001

F(x) 0,3679 0,7358 0,9197 0,9810 0,9963 0,9994 0,9999 1,0000

X=5 F(x) 0,0067 0,0067 0,0337 0,0404 0,0842 0,1247 0,1404 0,2650 0,1755 0,4405 0,1755 0,6160 0,1462 0,7622 0,1044 0,8666 0,0653 0,9319 0,0363 0,9682 0,0181 0,9863 0,0082 0,9945 0,0034 0,9980 0,0013 0,9993 0,0005 0,9998 0,0002 0,9999 0,0000 1,0000

Tabellenanhane

Tabelle 3: Standardnormalverteilung N(0,1) Zur Erklärung der Funktionen F(z) und (z) vgl. Seite 57: Dichtefunktion z

1

Verteilungsfunktion

-il

•V/271

F(z) = - ^ Je ^ du V27i

Symmetrische Intervallwahrscheinlichkeit 1 1 «>(z) = - 7 = Je V271 _z

2

du

0 0,3989 0,5000 0,0000 0,1 0,3970 0,5398 0,0797 0,2 0,3910 0,5793 0,1585 0,3 0,3814 0,6179 0,2358 0,4 0,3683 0,6554 0,3108 0,5 0,3521 0,6915 0,3829 0,6 0,3332 0,7257 0,4515 0,7 0,3122 0,7580 0,5161 0,8 0,2897 0,7881 0,5763 0,9 0,2661 0,8159 0,6319 1,0 0,2420 0,8413 0,6827 0,2178 0,8649 0,7287 1,1 0,1942 0,8849 0,7699 1,2 0,1714 0,9032 0,8064 1,3 0,1497 0,9192 0,8385 1,4 1,5 0,1295 0,9332 0,8664 1,6 0,1109 0,9452 0,8904 0,0940 0,9594 0,9109 1,7 1,8 0,0790 0,9641 0,9281 0,0656 0,9713 0,9426 1,9 2,0 0,0540 0,9772 0,9545 0,0440 0,9821 0,9643 2,1 2,2 0,0355 0,9861 0,9722 2,3 0,0283 0,9893 0,9786 2,4 0,0224 0,9918 0,9836 0,0175 0,9938 0,9876 2,5 2,6 0,0136 0,9953 0,9907 2,7 0,0104 0,9963 0,9931 0,0079 2,8 0,9974 0,9949 2,9 0,0060 0,9981 0,9963 3,0 0,0044 0,9987 0,9973 Wichtige Sieniükanzschranken und Wahrscheinlichkeiten a) z-Werte für gegebene Wkt. 1 - a b) Wkt. für gegebenes z P=l-a 90% 95% 99% 99,9%

einseitig F(z) 1,2816 1,6449 2,3263 3,0902

zweiseitig trp = 2,02.

Tabellenanhane

Tabelle 5:

p

r 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 50 60 70 80 90 100

-Verteilung

0,005

0,01

,025

,05

,95

,975

,99

,995

,00 ,01 ,07 ,21 ,41 ,68 ,99 1,34 1,73 2,16 2,60 3,07 3,57 4,07 4,60 5,14 5,70 6,26 6,84 7,43 8,03 8,64 9,26 9,89 10,52 11,16 11,81 12,46 13,12 16,79 20,71 27,99 35,53 43,28 51,17 59,20 67,33

,00 ,02 ,11 ,30 ,55 ,87 1,24 1,65 2,09 2,56 3,05 3,57 4,11 4,66 5,23 5,81 6,41 7,01 7,63 8,26 8,90 9,54 10,20 10,86 11,52 12,20 12,88 13,56 14,26 14,95 22,16 29,71 37,48 45,44 53,54 61,75 70,06

,00 ,05 ,22 ,48 ,83 1,24 1,69 2,18 2,70 3,25 3,82 4,40 5,01 5,63 6,26 6,91 7,56 8,23 8,91 9,59 10,28 10,98 11,69 12,40 13,12 13,84 14,57 15,31 16,05 16,79 24,43 32,36 40,48 48,76 57,15 65,65 74,22

,00 ,10 ,35 ,71 1,15 1,64 2,17 2,73 3,33 3,94 4,57 5,23 5,89 6,57 7,26 7,96 8,67 9,39 10,12 10,85 11,59 12,34 13,09 13,85 14,61 15,38 16,15 16,93 17,71 18,49 26,51 34,76 43,19 51,74 60,39 69,13 77,93

3,84 5,99 7,81 9,49 11,07 12,59 14,07 15,51 16,92 18,31 19,68 21,03 22,36 23,68 25,00 26,30 27,59 28,87 30,14 31,41 32,67 33,92 35,17 36,42 37,65 38,89 40,11 41,34 42,56 43,77 55,76 67,50 79,08 90,53 101,88 113,15 124,34

5,02 7,38 9,35 11,14 12,83 14,45 16,01 17,53 19,02 20,48 21,92 23,34 24,74 26,12 27,49 28,85 30,19 31,53 32,85 34,17 35,48 36,78 38,08 39,36 40,65 41,92 43,19 44,46 45,72 46,98 59,34 71,42 83,30 95,02 106,63 118,14 129,56

6,63 9,21 11,34 13,28 15,09 16,81 18,48 20,09 21,67 23,21 24,73 26,22 27,69 29,14 30,58 32,00 33,41 34,81 36,19 37,57 38,93 40,29 41,64 42,98 44,31 45,64 46,96 48,28 49,59 50,89 63,69 76,15 88,38 100,43 112,33 124,12 135,81

7,88 10,60 12,84 14,86 16,75 18,55 20,28 21,96 23,59 25,19 26,76 28,30 29,82 31,32 32,80 34,27 35,72 37,16 38,58 40,00 41,40 42,80 44,18 45,56 46,93 48,29 49,64 50,99 52,34 53,67 66,77 79,49 91,95 104,22 116,32 128,30 140,17

121

Teil II

Übungsaufgaben

Übmtsaufeaben

Gliederung von Teil II Kap.l: Kap.2: Kap. 3:

Kap.4:

Kap.5:

Kap.6:

Kap.7:

Kap.8:

Kap.9:

Kap. 10:

Einführung, Stichprobenraum Kombinatorik Ereignisalgebra, Wahrscheinlichkeit 3.1. Mengenoperationen mit Ereignissen 3.2. Wahrscheinlichkeitsbegriff 3.3. Additionssätze 3.4. Multiplikationssätze, bedingte Wahrscheinlichkeiten, Unabhängigkeit 3.5. Totale Wahrscheinlichkeit, Theorem von Bayes Zufallsvariablen, Wahrscheinlichkeitsverteilung 4.1. Eindimensionale Zufallsvariable 4.2. Zweidimensionale Zufallsvariable 4.3. Linearkombination und -transformation 4.4. Erzeugende Funktionen Spezielle diskrete Wahrscheinlichkeitsverteilungen 5.1. Zweipunktverteilung 5.2. Geometrische Verteilung, Binomialverteilung 5.3. Hypergeometrische Verteilung 5.4. Poissonverteilung Spezielle stetige Verteilungen 6.1. lineare Verteilungen, Gleichverteilung (stetig) 6.2. Normalverteilung Grenzwertsätze, Stichprobenverteilung 7.1. Tschebyscheffsche Ungleichung, Grenzwertsätze, stochastische Konvergenz 7.2. Stichprobenverteilungen Schätztheorie 8.1. Maximum-Likelihood-Methode 8.2. Punktschätzung 8.3. Intervallschätzung (Mittel- und Anteilswert) 8.4. Konfidenzintervallschätzung für die Differenz von zwei Mittelbzw. Anteilswerten Testtheorie 9.1. Test für Mittel- und Anteilswerte (Ein-Stichproben-Fall) 9.2. Signifikanztests für Mittel- und Anteilswertdifferenzen (zwei unabhängige Stichproben) Stichprobentheorie 10.1. Notwendiger Stichprobenumfang 10.2. Hochrechnung 10.3. Geschichtete Stichproben

121

Übungsaufgaben

127

Aufgaben zu Kapitel 1 und 2 Aufeabe 1.1 Drei Personen spielen zwei Runden eines Glücksspiels. Wie groß ist die Wahrscheinlichkeit, daß die Person A zweimal gewinnt?

Aufgabe 1.2 In der Mensa X kann man aus drei Beilagen (A,B,C) zwei auswählen (auch dieselbe Beilage zweimal). Wie wahrscheinlich wählt man die Kombination AA (wenn alle Beilagen als gleich gut oder gleich schlecht empfunden werden)?

Aufeabe 2.1 Vier Freunde schreiben sich gegenseitig Weihnachtsgrüße (Postkarten). Wieviel Postkarten muß die Post befördern?

ÄGI&4

Aufeabe 2.2 In wieviel verschiedenen Reihenfolgen kann man 4 Flaschen Pils, 3 Flaschen Alt, 2 Wodka und 1 Doppeltem trinken?

Aufeabe 2.3 a) b)

Wieviel Möglichkeiten gibt es beim Zahlenlotto 6 aus 49? Wieviel dieser Möglichkeiten enthalten die Zahl 17?

Aufeabe 2.4 Im Morsealphabet sind Buchstaben Kombinationen von Punkt und Strich. Wievielstellig müssen die Kombinationen sein, damit hierdurch 26 Buchstaben gebildet werden können?

128

Übungsaufgaben

Aufgabe 2.5 Die Condesa (Gräfin) Alma de Rano aus Amphibien glaubte fest an das Märchen vom Froschkönig aus dem fernen Deutschland. In den 20 Teichen, 8 Seen und 2 Flüssen von Amphibien lebten ... Frösche (F), ... Spitzkrokodile (K) und ... Fische (piscis P). Es war das Lebenswerk des schrulligen Statistikers Pedro de las Tablas, diese Zahlen festzustellen. a)

b)

Eines Tages beschließt die Gräfin, sich einer Stichprobe von 5 Teichen, 3 Seen und einem Fluß küssend zu nähern, um dort eben den Frosch zu finden, der sich beim Kuß in einen Prinzen verwandelt. Wieviel Stichproben aus den entsprechenden Gewässern Amphibiens sind dabei möglich? Ein Untertan belehrte die Gräfin, daß es weniger wahrscheinlich sei, den besagten Frosch in einem Fluß zu finden als in einem Teich oder See. Am ehesten sei der "Froschkönig" in den Teichen T„T2 oder T3 zu erwarten, vielleicht auch in den Seen S, oder S2. Alma entschließt sich, wieder 3 Seen und 5 Teiche aufzusuchen, wobei jedoch T,, T2, T3, S, und S2 in jedem Fall in die Stichprobe fallen sollen. Wieviel Möglichkeiten gibt es jetzt?

l ' L

^

Obunesaufeaben Aufcabe 2.6

. \\

Ii

Diplom-Kaufinann K aus E schickte vor der Wende sieben mit viel Liebe selbstgebastelte Geschenke an fünf Verwandte in der DDR, um ihnen drüben zu Weihnachten eine Freude zu machen. In dem beigefügten Brief war genau beschrieben, wie die 7 Geschenke auf die S Verwandten aufgeteilt werden sollten. Leider ging jedoch der Brief verloren, nachdem er von den Geheimdiensten httben und drüben gelesen worden war. a)

Angenommen, die 7 Geschenke seien durchaus sehr unterschiedlich, gleichwohl ist aber aus der Art des Geschenks noch nicht erkennbar, wem (z.B. Onkel, Tante, Vetter etc.) es gewidmet sein könnte. Wenn die Verwandten in der DDR alle Möglichkeiten, die Geschenke aufzuteilen, ausprobieren wollten, hätten sie viel zu tun! Wieviel Möglichkeiten gibt es?

b)

Diplom-Kaufinann K aus E ist aus ökonomischen Gründen bei seiner Bastelarbeit zur preisgünstigeren Serienproduktion übergegangen und hatte sieben gleiche Geschenke gebastelt. Wieviel Möglichkeiten gibt es jetzt die Geschenke für die 5 Verwandten zu verteilen? Auch hier ist wieder der Fall zu berücksichtigen, daß sich auf eine Person mehrere Geschenke, bis zu 7, kumulieren können.

Aufsähe 2.7 Auf einem Parkplatz stehen n Fahrzeuge in einer Reihe nebeneinander. Auf Platz i (mit i * 1, n) steht die Luxuskarosse von Direktor D. Wie groß ist die Wahrscheinlichkeit, daß nach einigen Stunden bei völlig zufälligem Kommen und Gehen die Plätze unmittelbar neben D beide leer sind, wenn am Schluß noch r Fahrzeuge (r < n) auf dem Parkplatz verbleiben?

Aufsähe 2.8 Wieviel Möglichkeiten gibt es, fünf Personen a)

in einer Reihe

b)

an einem runden Tisch anzuordnen?

129

130

Übunzsaufoaben

Aufgabe 2.9 Fünf Personen wollen ein Taxi nehmen, das jedoch nur zwei Personen aufnehmen kann. Von den 5 Personen sind 2 Engländer und 3 Franzosen. Unter den Engländern spricht einer nur Englisch, der andere auch Französisch. Von den Franzosen spricht einer nur Französisch, die beiden anderen auch Englisch. Wie groß ist die Wahrscheinlichkeit, daß die beiden Passagiere a)

der gleichen Nationalität sind

b)

die gleiche Sprache sprechen

c)

von verschiedener Nationalität sind und trotzdem die gleiche Sprache sprechen?

Aufgabe 2.10 Wie groß ist die Wahrscheinlichkeit, daß von 10 beliebig ausgewählten Personen mindestens zwei am selben Tag Geburtstag haben?

Übungsaufgaben

Aufgaben zu Kapitel 3 Aufgabe 3.1.1 Man untersuche, ob die folgenden Aussagen allgemeingültig sind oder nur unter bestimmten Bedingungen (welchen?) gelten (bitte ankreuzen bzw. Bedingungen angeben).

1 2

gilt stets Aussage wenn AB c AC, dann B c C wenn ABC=AB dann B c C

3

(AuB) - A = B

4

n - (A u C) =• An B (A-B) u (A-C) = A-BC

5 6 7

AB - AC = BC AB - AC = AB-ABC

8

A-B=B-A

gilt nur, wenn...

Aufeabe 3.1.2 In den folgenden Venn-Diagrammen

sind die Ereignisse

a) F \ S

durch Schattierungen hervorzuheben!

b) F u S

c) F n S

d) F \ S

gilt nie

131

132

Übunfsaufcaben

Aufgabe 3.1.3 Nach langjähriger intensiver Forschungstätigkeit gelangte ein namhafter Experte der Allgemeinen Betriebswirtschaftslehre zur fundamentalen Erkenntnis, daß ein Betrieb ein System sei, welches mit seiner Umwelt in einen Leistungsaustausch tritt. Im Falle eines Straßenhändlers der Schreibwarenbranche habe man es aber mit einem Potentialund nicht einem Permanenzbetrieb zu tun, da sich die Umwelt in Gestalt von Kunden nur von Zeit zu Zeit dem Einwirkungsbereich des Systems nähere. Hinzukommt, daß es einige Potentialbetriebe (Ereignis P) gäbe, die ohne Gewerbeschein betrieben werden (sog. Kryptobetriebe [Ereignis K]), während es andererseits auch Kryptobetriebe gäbe, die keine Permanenzbetriebe seien. Symbolisieren Sie im Venn-Diagramm die folgenden Ereignisse und beschreiben Sie diese in Worten: Ereignis PnK

PnK

K

iCuP

KuP

Venn-Diagramm

Übunssaufagben

133

Aufgabe 3.2.1 Die Menge Q werde durch vier Ereignisse A, B, C und D vollständig zerlegt. Fflr die Wahrscheinlichkeiten gelte P(A)=l/3, P(B)=l/4, P(C)=0, P(D)=3/12, P(AuB)=7/12, P(AuD)=l/2. Sind die Axiome von Kolmogoroff erfüllt?

Aufgabe 3.2.2 Karl Meier, statistisch vorgebildeter Angestellter einer Steibekasse, hat folgende Berufskrankheit: beim Anblick eines PKW erkennt er blitzschnell, welche möglichen Todesfälle auftreten können und schreibt eine entsprechende Liste auf, die man als Statistiker nennt. Eines Tages sieht er in einem Auto Vater (V), Mutter (M), Schwiegermutter (S) und Kind (K) sitzen. Wie lautet Meiers Liste? Man zeige an einem Beispiel, daß für beliebige Teilmengen aus dieser Liste gilt, daß Vereinigung, Durchschnitt, Differenz und Komplement selbst wieder Elemente dieser Liste darstellen!

Aufgabe 3.2.3 In einem Straßencaft sitzen drei Männer und ma chen sich Gedanken darüber ob die vorbeiziehende Passantin P eine "Klassefrau" sei (Ereignis K) Kann man die Wahrscheinlichkeit P(K) bestim men nach dem a) b)

klassischen... statistischen ...

c)

subjektiven Wahrscheinlichkeitsbegriff?

Aufgabe Kann man3.2.4 eine Wahrscheinlichkeit P über einen Stichprobenraum O dergestalt definieren, daß für zwei Elemente A und B von C1 gilt: a)

P(A) = 0,9,

P(B) = 0,05

und

P(A n B) = 0,3

b)

P(A) = 0,9,

P(B) = 0,3

und

P ( A n B ) = 0,05

c)

P(A) = - V 2 ,

P(B)=-V2,

P ( A n B ) = 0,5 und P ( A u B ) = V2-1/2 ?

134

Übunesaufeaben

Aufgabe 3.2.5 Bekanntlich treten in Märchen Ereignisse auf, die im Alltagsleben so gut wie nie auftreten, z.B. die Verwandlung eines Frosches in einen Prinzen (Ereignis V). a)

Gleichwohl ist auch im Alltagsleben das Ereignis V nicht im logisch-wissenschaftlichen Sinne unmöglich, wenngleich P(V) praktisch Null sein dürfte. Ein Statistiker habe eine Million Froschküsse von Prinzessinnen beobachtet, aber trotzdem keinen Fall erlebt, in dem sich ein Frosch in einen Prinzen verwandelt hat. Er kann daraus folgern: O

P(V) = 0

O

0 ^ P ( V ) < 1/1.000.000

O

er kann keine derartigen Folgerungen ziehen

Angenommen, es sei P(V) = p = 1/5.000.000. Wie groß ist dann die exakte Wahrscheinlichkeit des obigen Stichprobenbefiindes? b)

c)

Welcher Wahrscheinlichkeitsbegriff liegt hier zugrunde? O klassisch

O statistisch

O geometrisch

O

Die folgenden Ereignisse mögen eine vollständige Zerlegung Ci bilden: G: Verwandlung in einen Grafen K: Verwandlung in (leider nur) einen Diplom-Kaufmann V: keine Verwandlung Wie lautet das sichere Ereignis? Nennen Sie ein Beispiel für ein unmögliches Ereignis! Warum ist { fi, K, K u G } keine o-Algebra?

Übungsaufgaben

135

Aufgabe 3.3.1 Die Kunden eines Kaufhauses kaufen im 1. Stock (nicht: nur im ersten Stock) mit einer Wahrscheinlichkeit von P(A)=0,25, im 2. Stock mit P(B)=0,3 und sowohl im ersten als auch im zweiten Stock mit P(AnB)=0,05. Wie groß ist die Wahrscheinlichkeit P(AuB), daß ein Kunde entweder im ersten oder im zweiten Stock einkauft? Kann man aus den Zahlen erkennen, daß das Kaufhaus noch mehr Stockwerke haben muß, z.B. einen dritten Stock oder einen Keller? Anmerkung: Ein Kunde kauft in jedem Fall irgendetwas im Kaufhaus

Aufgabe 3.3.2 Für die Ereignisse A, B, C aus einem Ereignissystem gilt P(A) = 0,5 P(B) = 0,2 P(C) = 0,3

P(AuB) = 0,6 P(AuC) = 0,6 P(BnC) = 0,1

P(AnBnC) = 0,02

Man berechne die Wahrscheinlichkeiten für: P(BuC) =

P(AnC) =

P(AnB) =

P(AuBuC) =

Aufgabe 3.4.1 Bei einem Kartenspiel mit 32 Karten darfein Spieler zweimal ziehen. Wie groß ist die Wahrscheinlichkeit, daß er entweder im ersten oder im zweiten Zug einen Buben zieht a)

bei Ziehen ohne Zurücklegen?

b)

bei Ziehen mit Zurücklegen?

(Wie lauten die Wahrscheinlichkeiten, wenn es heißt: entweder im ersten oder im zweiten Zug oder in beiden Zügen?)

Aufgabe 3.4.2 Von einem dreimotorigen Fluggerät älterer Bauart ist anzunehmen, daß jeder Motor während eines geplanten Fluges von 10 Stunden mit einer konstanten Wahrscheinlichkeit von 0,9 ungestört laufen wird. a) b) c)

Wie wahrscheinlich ist es, daß x=0, x=l, x=2 bzw. x=3 Motoren während des Fluges ausfallen werden? Es ist zu erwarten, daß im Durchschnitt Motoren ausfallen werden. Geben Sie das zu dieser Aufgabe passende Urnenmodell an.

136

Übun ffsaufaaben

Aufgabe 3.4.3 Graf Sigismund von Rieselkalk sorgt sich um den Fortbestand seines uralten vornehmen Geschlechts, denn erfahrungsgemäß setzt dies in einer Generation mindestens zwei Söhne voraus. Auf wieviel Kinder sollten sich die Rieselkalks einrichten, um mit einer Wahrscheinlichkeit von 11/16 (also 68,75%) mindestens zwei Söhne zu haben?

Aufgabe 3.4.4 Für die Finna X bemühen sich drei Vertreter (AJ3.C) unabhängig voneinander den Großkonzern G von den Vorzügen der Produkte von X zu überzeugen. Die Wahrscheinlichkeit, daß es A gelingt G vom Kauf zu überzeugen sei 1/8. Bei B sei diese Wahrscheinlichkeit 1/6 und bei C sei sie 1/5. Es bestehe stochastische Unabhängigkeit. Wie wahrscheinlich ist es, daß G von keinem der drei Vertreter (sei es A, B oder C) zum Kauf überredet wird? von einem der drei Vertreter (sei es A, B oder C) zum Kauf überredet wird?

Aufgabe 3.4.5 Auf einer einsamen Insel sitzt der schiffbrüchige Diplom-Kaufmann K aus G. Dank seiner vorzüglichen Statistikausbildung ist er in der Lage, die Wahrscheinlichkeit dafür zu berechnen, daß er im Verlaufe des nächsten Jahres gerettet wird (Ereignis R), was jedoch voraussetzt, daß ein Schiff in Sichtweite vorbeifährt (S), was K an jedem Tag des Jahres für gleich wahrscheinlich hält. Für die Ereignisse R und S gilt dann: R ist... [ ] abhängig von S [ ] ein Teilereignis von S [ ] unverträglich mit S [ ] ein sicheres Ereignis [ ] kein Zufallsereignis [ ] P(R) < P(S) [ ] P(RS) = P(R)P(S) [ ] P(R) = P(RS)

Übunestmfeaben

137

Aufgabe 3.4.6 Der Chevalier de M6r6, ein Freund Blaise Pascals, gewann ein Vermögen, indem er darauf setzte, mit 4 Würfeln mindestens eine 6 zu erhalten. M6r6 hat intuitiv darauf vertraut, daß bei 4 Würfeln eine 6 zu erreichen sein müßte. Eine ähnlich hohe Gewinnchance vermutete er daraufhin in folgender Wette: mindestens eine Doppelsechs (Pasch) bei 24 Würfen mit zwei Würfeln. Er machte hiermit jedoch bankrott. Mit welchem Argument hätten Sie dem Chevalier von seinem zweiten Spiel abgeraten?

Aufgabe 3.4.7 Der eifersüchtigen Hausfrau H gelingt es trotz verfeinerter Techniken der Befragung und Beeinflussung ihres Ehemannes E nicht, sich Klarheit über gewisse Vorgänge auf einer Geschäftsreise des E zu verschaffen. Bei den allabendlichen Verhören schläft E mit einer Wahrscheinlichkeit von 0,75 frühzeitig und stumm ein, ohne daß es zu einem klärenden Gespräch kommt. Sofern E nicht einschläft, besteht auch nur eine geringe Wahrscheinlichkeit von 0,2 dafür, daß es zu einem Gespräch kommt. Wie wahrscheinlich ist es, daß E einem Verhör seiner eifersüchtigen Gattin nicht ausweicht?

Aufgabe 3.4.8 Ein Zufallsexperiment besteht aus dem Werfen dreier idealer Würfel. Es wird behauptet, die Augensummen 9 und 10 erscheinen nicht gleich häufig, obwohl beide Summen auf 6 Arten eintreten können (man spricht auch von Partitionen der Summe 9 bzw. 10): "9" "10"

= 1+2+6 = 1+3+5 = 1+4+4 = 2+2+5 = 2+3+4 = 3+3+3 = 1+3+6 = 1+4+5 = 2+2+6 = 2+4+4 = 2+3+5 = 3+3+4

Man erkläre den Sachverhalt!

Aufgabe 3.4.9 Wie groß ist die Wahrscheinlichkeit dafür, daß mindestens einer von zwei Würfeln die Augenzahl 2 zeigt (Ereignis A), wenn zugleich die Summe der Augenzahlen beider Würfel 6 ist (Ereignis B). Man zeige, daß A und B nicht stochastisch unabhängig sind.

138

Übunesaufaaben

Aufgabe 3.4.10 Wie groß ist die Summe der bedingten Wahrscheinlichkeiten

P(A|B) + P(Ä|B)

wenn

a) b)

und

P(A|B) + P(A|B)

beide Ereignisse stochastisch unabhängig sind, beide Ereignisse nicht stochastisch unabhängig sind ?

Aufsähe 3.4.11 Auf einen Regentag (R) folge mit P(S | R) = 0,3 ein Sonnentag (S) und auf einen Sonnentag mit P(R | S) = 0,25 ein Regentag. a)

b)

Wie wahrscheinlich ist es, daß (heute sei ein Regentag und ein Tag ist stets entweder ein Sonnentag oder Regentag) übermorgen wieder ein Regentag ist? nach sieben Regentagen am achten Tag nach heute erstmals wieder die Sonne scheint? ab morgen eine ganze Woche lang, insgesamt sieben Tage das gleiche Wetter herrscht? Sind die Ereignisse R und S stochastisch unabhängig oder nicht? (Begründung erforderlich)

Aufeabe 3.4.12 Diplom-Kaufmann K aus E hatte für die Gasfirma R in E, bei welcher er beschäftigt ist, 20 Erdgaslieferanten im Nahen Osten zu besuchen. Auf dem Weg zum Lieferanten L hat er sich leider in der Wüste verirrt (vgl. Bild). An jeder Verzweigung des Weges von W (Standort) nach L (Ziel) setzt K seinen Weg ganz nach dem Prinzip des Zufalls fort. Er kann an der Stelle C auch über B zurückkehren und sich so evtl. mehrmals im Kreis bewegen. Wie wahrscheinlich ist es, daß K unter diesen Umständen nicht zu L gelangt?

Ühunssaufcaben

Aufeabe

139

3.4.13

In einer entlegenen Ecke in den Karpaten liegen die Höfe der beiden verfeindeten Bauern Andrzej und Boguslaw unmittelbar nebeneinander. Beide müssen von Zeit zu Zeit eine bestimmte Brücke überqueren und weil sie spinnefeind sind, kann es passieren, daß es dabei zu tätlichen Auseinandersetzungen (Ereignis T) kommt. Die Wahrscheinlichkeit dafür beträgt, wenn sie sich treffen, 0,8.

Die Wahrscheinlichkeit, daß A an einem beliebigen Tag die Brücke überquert, betrage P(A) = 0,3. Die entsprechende Wahrscheinlichkeit sei bei Boguslaw P(B) = 0,2. Die Ereignisse A und B seien (schon wegen der durch die Feindschaft bedingte Kontaktarmut zwischen A und B) unabhängig. a)

Man trage ein Symbol für das gefragte zusammengesetzte Ereignis, sowie den Zahlenwert für die Wahrscheinlichkeit in die Tabelle ein:

1 2 3

4 5 6 7 8

9

Wie wahrscheinlich ist es, daß A die Brücke überquert, wenn auch B sie überquert A und B sich beim Überqueren der Brücke begegnen es zu einer tätlichen Auseinandersetzung kommt, wenn sie sich nicht begegnen wenigstens einer von beiden die Brücke überquert einer von beiden, aber nicht beide zusammen die Brücke überqueren weder A noch B die Brücke überqueren zwar Andrzej, aber nicht Boguslaw die Brücke überquert daß die beiden sich begegnen, es aber nicht zu einer tätlichen Auseinandersetzung kommt daß es zu einer tätlichen Auseinandersetzung kommt

Symbol

Wahrsch.

140

b)

Übungsaufgaben

Wegen seiner überlegenen Körpergröße und -stärke besteht eine Wahrscheinlichkeit von P(S)=0,6, daß Boguslaw im Kampf gegen Andrzej siegt. Die Wahrscheinlichkeit, daß der Kampf zwischen beiden unentschieden ausgeht, sei P(U) = 0,1 und die Wahrscheinlichkeit, daß Boguslaw verliert sei P(V) = 0,3. Die drei Wahrscheinlichkeiten seien konstant. Die drei Ereignisse bilden [ [ [ [

] ] ] ]

einen Stichprobenraum ein Ereignisfeld eine a -Algebra eine Zerlegung

Je zwei Ereignisse, etwa U und S sind [ ] unabhängig [ ] unverträglich

Vorgriff auf Kapitel 5 c)

Wie wahrscheinlich ist es, daß Andrzej spätestens nach dem 5-ten Kampf erstmals Boguslaw besiegt?

d)

Wie wahrscheinlich ist es, daß Andrzej von 10 Kämpfen nur höchstens zwei siegreich für sich entscheiden kann?

Aufgabe 3.4.14 Der Haushalt des arbeitslosen Diplom-Kaufmanns K auf E befindet sich wirtschaftlich in einer sehr prekären Lage. Am morgigen Tag könnten sich die Ereignisse im guten wie im schlechten Sinne dramatisch zuspitzen. Es kann nämlich sein, daß morgen der Gerichtsvollzieher erscheint (Ereignis A [Amtsperson]),

Übungsaufgaben

141

es kaiin aber auch sein, daß die reiche Erbtante Beate (B) zu Besuch kommt, deren Gunst K jedoch seinerzeit verspielt hatte, als er in der Statistik-Klausur durchfiel. Es sei P(A) = 0,6, P(B) = 0,2 und P(B | A) = 0,3. Wie groß ist die Wahrscheinlichkeit dafür, daß a) b) c) d)

A und B einer von beiden (A oder B) oder beide einer von beiden, aber nicht beide zusammen keiner von beiden (weder A noch B)

zu Besuch kommt?

Aufgabe 3.4.15 Mit einer gewissen Wahrscheinlichkeit komme es zu einem sogenannten "Streik" von Studenten, d.h. zu einer kollektiven Verweigerung der Leistung (!) "Anhören einer Vorlesung". a)

Wie wahrscheinlich ist es bei der konstanten Streikwahrscheinlichkeit von p = 0,3 jedes Semester, d.h. stochastisch unabhängigen Streiks, daß Sie in den nächsten sechs Semestern noch mindestens einen Streik miterleben werden? (Pro Semester gibt es immer entweder 0 oder 1 Streik)

b)

Wie wahrscheinlich ist es, daß die Studenten in den nächsten drei Semestern noch wenigstens einen (höchstens zwei) Streiks erleben werden, wenn für drei Streiks S,, S2, S3 gilt: P(S,) = 0,3 , P(S2|S,) = 0,4 , P(S2|S,) = 0,7 , P(S,|S, n S 2 ) = 0,8 , und p ( s 3 | s , n s 2 ) = 0,9?

c)

Angenommen, bei dem Ereignis "Streik" (S) käme es mit großer Wahrscheinlichkeit P(A|S) = 0,8 zu heiligen Auseinandersetzungen (A) mit einem als rechtsradikalem Psychopathen bekannten Professor. Es kann aber auch zu solchen Auseinandersetzungen kommen, ohne daß gestreikt wird, denn P(A | S) = 0,4. Es sei weiter P(S) = 0,4. Man berechne die Wahrscheinlichkeit für folgende Ereignisse: P(AnS) = P(A) = P(S|A)= P(AuÄ) = P(A\S) =

d)

Es gelte P(AnS) = 0,3 , P(A) = 0,4 sowie P(S) = 0,6. Welche Ereignisse bilden eine vollständige Zerlegung und welche Wahrscheinlichkeiten müssen für diese Ereignisse gelten, damit die Kolmogoroffschen Axiome erfüllt sind? Gegen welches der Kolmogoroffschen Axiome verstößt man, wenn man folgende Wahrscheinlichkeiten annimmt: P(Ar>S) = 0,4,

P(A) = 0,3

sowie

P(S) = 0,6 ?

142

Übungsaufgaben

Aufgabe 3.4.16 mmmmm

Der im Außendienst (Versicherungen!) beschäftigte Diplom Kaufmann K aus E ist leider sehr eifersüchtig, da seine Gattin Kontakt mit einem Nebenbuhler pflegt. Die zu betrachtenden Ereignisse sind wie folgt definiert: N = Nebenbuhler zu Hause; K = Dipl.-Kfm. K zu Hause Für die Wahrscheinlichkeiten gilt: P(N|K) = 0,01, P(NI K ) = 0,85 und P(K) = 0,6.

w

"f

\ \

j

I j I ,-J { -

Wie wahrscheinlich ist es, daß N im Hause ist und wie wahrscheinlich ist es, daß K in seinem Haus den Nebenbuhler N trifft?

Aufeabe 3.4.17 Man spiele mit zwei Würfeln und es seien drei Ereignisse wie folgt definiert A!: A2: A}:

der erste Würfel zeigt eine ungerade Augenzahl, der zweite Würfel zeigt eine ungerade Augenzahl, die Summe der beiden Augenzahlen ist ungerade.

a)

Welche der drei Ereignisse sind paarweise unabhängig?

b)

Sind alle drei Ereignisse wechselseitig unabhängig?

Aufeabe 3.4.18 Unter den Aktienhändlern der Frankfurter Wertpapierbörse ergab eine Umfrage, daß 70% Abonnenten der FAZ sind (Ereignis F), während 20% das Handelsblatt nicht abonnieren (Ereignis H ). 90% der Abonnenten der FAZ abonnieren darüber hinaus auch das Handelsblatt. a)

b) c)

Wie groß ist die Wahrscheinlichkeit, daß 1) ein zufällig ausgewählter Händler keine der beiden Zeitungen abonniert hat? 2) ein zufällig ausgewählter Händler beide Zeitungen täglich liest? 3) ein zufällig ausgewählter Händler nur eine der beiden Zeitungen abonniert? Sind die Ereignisse F und H unabhängig? 10% der Handelsblatt-Leser und 5% der Nicht-Handelsblatt-Leser kaufen heimlich auch die Bildzeitung. Wie groß ist die Wahrscheinlichkeit, daß ein zufällig ausgewählter Aktienhändler die Bildzeitung liest?

Übunesaufeaben Aufgabe 3.5.1 a)

b)

Bei einer Klausur im Fach X gäbe es zwei Gruppen von Teilnehmern: Könner (Gruppe I, Anteil: 40 vH) und Nichtkönner (Gruppe n, Anteil: 60 vH). Die Wahrscheinlichkeit die Klausur zu bestehen, sei bei der Gruppe 10,9 und bei der Gruppe II 0,1. Wie wahrscheinlich ist es... ... die Klausur zu bestehen? ... unter denjenigen, die sie bestehen, einen Nichtkönner anzutreffen? Führen Sie die gleiche Betrachtung für das Fach Y durch, in dem die entsprechenden Wahrscheinlichkeiten die Klausur zu bestehen bei Gruppe I 0,6 und bei Gruppe II 0,3 sein mögen und für das Fach Z, in dem die Wahrscheinlichkeiten in beiden Gruppen gleich, nämlich 0,42 sind.

Aufgabe 3.5.2 Bei der Tour de Trance, einer berühmten Radrennfahrt über 16 Etappen starten 180 Teilnehmer. Es ist im allgemeinen davon auszugehen, daß ein Zehntel der Rennfahrer gedopt ist (Ereignis D). Die Wahrscheinlichkeit dafür daß ein gedopter Fahrer einen Etappensieg herausfährt betrage P(S I D)=0,3 und ohne Doping 0,1. a) b) c)

Sind die Ereignisse S und D stochastisch voneinander unabhängig (Begründung!)? Wie wahrscheinlich ist es, einen Etappensieg herauszufahren? Teilnehmer T siegte überraschend bei der ersten Etappe. Wie wahrscheinlich ist es, daß er gedopt war?

Aufgabe 3.5.3 Dem Student S steht als letzte Bewährungsprobe auf dem Weg zum Diplomkaufmann noch die mündliche Prüfung im Fache.... bevor, die vor zwei Prüfern abgelegt werden muß. In diesem Fach gibt es fünf Prüfer, wobei drei als milde und zwei als scharf bekannt sind. Die Wahrscheinlichkeit, das Examen zu bestehen (Ereignis B) hängt von der Anzahl X der scharfen, bzw. von Y = 2-X, der Anzahl der milden Prüfer, ab. Es sei P(B | x=0) = 0,9, P(B | x=l) = 0,5 und P(B | x=2) = 0,3. a) b)

c)

Mit welcher Wahrscheinlichkeit wird S seine Prüfung bestehen, wenn er sich die zwei Prüfer frei auswählen kann? Man zeige, daß S die Prüfung nur mit einer Wahrscheinlichkeit von 0,6 besteht, wenn er die Prüfer nicht frei auswählen kann, sondern diese durch Los bestimmt werden (wobei dann P(x=0) = 0,3 und P(x=l) = 0,6). Ein zufällig ausgewählter Student S hat das Examen bestanden. Wie wahrscheinlich ist es, daß er zu den Studenten gehört, die - nur von milden (x=0) - nur von scharfen (x=2)

143

144

Übunssaufaaben Prüfern geprüft worden sind, wenn die Prüfer nach dem Zufallsprinzip (durch Los) bestimmt worden sind?

Aufeabe 3.5.4 Wie groß ist in Aufgabe 3.4.2 die Wahrscheinlichkeit des Absturzes des Fluggeräts, wenn die Wahrscheinlichkeit des Absturzes beim Ausfallen von 0 Motoren 1 Motor 2 Motoren 3 Motoren

INSTRUCTIONS It chute (ails to open within 3 0 day warranty period, i! will be re placed tree of charge

0,01 0,1 0,7 1

beträgt?

Aufgabe 3.S.S Bei einem längeren Flug kann es schon einmal vorkommen, daß eine Crew einen Funkspruch überhört und sich so Ärger mit den Radarlotsen einhandelt oder daß andere Unregelmäßigkeiten eintreten (Ereignis R). Kapitän K fliegt nicht ungern mit dem Copiloten A, dessen Spezialität Irrenwitze im Cockpit sind. Es kommt dann jedoch bei jedem zweiten Flug zu einer Unregelmäßigkeit, so daß P(R | A) = 0,5 ist, während dies beim schweigsamen Copiloten B nur bei jedem achten Flug der Fall ist.

Wenn K bei fünf von neun Flügen mit A und bei vier von neun Flügen mit B zusammen im Cockpit sitzt, wie groß ist dann P(R) und P(A | R)?

Aufgabe 3.5.6 (für Fortgeschrittene) Ein Spieler S versucht beim Werfen einer Münze das richtige Ergebnis (Kopf oder Zahl) vorherzusagen. Gelingt ihm dies, so erhält er 1 €, andernfalls zahlt er 1 €.

Übungsaufgaben

Lüj

Natürlich kann das Spiel endlos sein. S spielt jedoch so lange, bis er entweder sein Anfangskapital K verspielt hat (Ruin) oder einen vorher vereinbarten Betrag B £ K angesammelt hat. Man zeige, daß die Wahrscheinlichkeit des Ruins hier genau 1

B

beträgt.

Aufgaben zu Kapitel 4 Aufgabe 4.1.1 a)

Eine Münze kann auf Kopf K oder Wappen W fallen, so daß Q, = {K,W} der Stichprobenraum beim i-ten Wurf ist. Man bilde das Produkt aus Q 2 und und definiere die Zufallsvariable X = Anzahl der Wappenwürfe. Welche Ausprägungen kann X annehmen? Bestimmen Sie die Wahrscheinlichkeitsfunktion für X!

b)

Eine Münze sei auf einer Seite beschwert, so daß die Wahrscheinlichkeit, daß die Münze Wappen zeigt P(W)=l/3 ist. x = 0,1,2,3 sei die Anzahl der bei drei Würfen mit dieser Münze erzielten "Wappen". Bestimmen Sie die Wahrscheinlichkeitsfunktion für X!

c)

Berechnen Sie den Erwartungswert und die Standardabweichung für die beiden Wahrscheinlichkeitsverteilungen von Teil a) und b).

Aufgabe 4.1.2 Die stetige Zufallsvariable X habe die Dichtefunktion.

a) b)

Bestimmen Sie die Verteilungsfunktion F(x) und den Erwartungswert E(X). Berechnen Sie die Wahrscheinlichkeit P(0,5 < x < 1,5)!

146 Übunesaufsaben Aufgabe 4.1.3 Gegeben sei die stetige Funktion

f(x)=j [

+n 0

für sonstige

a)

Man zeige, daß f(x) eine Dichtefunktion sein kann!

b)

Man bestimme die Wahrscheinlichkeit P(1 < x < 5)!

c)

Man bestimme den Erwartungswert und die Varianz von X!

Aufgabe 4.1.4 Der Geschäftsmann G sucht eine Anlage für einen größeren Geldbetrag. Dabei spielt er mit dem Gedanken, sich an dem Unternehmen des dynamischen aber nicht sehr seriösen Unternehmers U zu beteiligen. Die Wahrscheinlichkeit, daß die Anlage bei U sicher ist, sei P(S)=0,4 und die Wahrscheinlichkeit, daß sie rentabel ist, sei P(R)=0,8. Dabei seien R und S stochastisch unabhängig. Man berechne die Erwartungswerte der Nutzen, wenn die Werte des sich jeweils ergebenden Nutzens wie folgt lauten:

beteiligen nicht beteiligen

RS 10 0

RS 2 6

RS 3 4

RS 0 20

Kann sich G für eine der beiden Strategien (beteiligen oder nicht beteiligen) aufgrund des Erwartungswertes des Nutzens entscheiden?

Aufgabe 4.1.5 (Petersburger Spiel) Bei einer Spielbank wird der Einsatz von Y verlangt. Man erhält eine Auszahlung A in Höhe von 2m, wenn bei m Würfen mit einer (regulären) Münze m mal Wappen erscheint. Wie groß sollte der Einsatz Y sein, damit sich das Spiel lohnt, d.h. damit der Gewinn X=A-Y nicht negativ wird?

Aufgabe 4.1.6 Auch entlegenen Ortes wird meist die warme Küche gegenüber der kalten bevorzugt. Da jedoch die Stückzahl X der landesüblichen Speise zufallsbedingt stark schwankt und auf eine frische Zubereitung viel Wert gelegt wird, ist die richtige Dimensionierung der Kochtöpfe ein Problem. Es gelte:

Übunesaufaaben

m-\i'Y0

fürx=1 2

' -'

sonst

a) Zeigen Sie, daß f(x) eine Wahrscheinlichkeitsfunktion ist und E(X)=3 ist! Hinweis: Für jedes 0 < q < 1 gilt mit x = 0,1,2,... V

x q

*

^

=

_ L

und

(1-q f

y

x V =

l i M (1-q)1

^

b) Wie ist dann Y=l+X verteilt?

Au feabe 4.1.7 Man zeige, daß die Funktion f(x) = x3 - 9x2 + 10,02x

fiir0 1 sein? Man bestimme den Erwartungswert und die Varianz der Zufallsvariablen X.

Aufgabe 4.1.10 Man zeige, daß die Funktion

für x = 1, 2, ... die Wahrscheinlichkeitsfunktion einer diskreten Zufallsvariablen ist und daß E(X) nicht existiert.

Aufgabe 4.1.11 Man zeige, daß af ( x\ ) = c( f ( x\) = j x— 2 fürx>10 0 sonst

Obunesaufeaben

a) b)

149

eine Dichtefunktion ist; keinen Erwartungswert besitzt.

Aufgabe 4.1.12 Die stark Überdimensionierte Hausfrau H wünscht ihre Figur durch ein Schlankheitsmittel zu korrigieren. Für die tägliche Gewichtsabnahme um x Kilogramm existiert die folgende Dichtefunktion: i 7 1 c( \ J * f(x) = 112 6 0

filr0£x wenn ja: Wie lautet sie?

Aufgabe 7.1.11 a)

—•

Man zeige, daß für eine nichtnegative Zufallsvariable X gilt: P(X>c)
rend wir tlelchwltlj der linken Arm locker vi die link« Hüft» kj«n!

Während seiner Ausbildung zum Betriebswirt hat Diplom-Kaufmann K aus E stets die Praxisnähe vermißt. Deshalb wollte er endlich einmal die Dinge selbst in die Hand nehmen und durchschlagende Erfolge erzielen. Er begann deshalb mit der Messerwerferei, bei welcher er immerhin schon eine Trefferquote von konstant 10% erreichte. Die Wahrscheinlichkeit, ein Ziel zu treffen sei deshalb, trotz beständigen Trainings, konstant P(T)=0,1. a)

Definieren Sie für die Problemstellung eine Zufallsvariable X und geben Sie das passende Urnenmodell an. Wie ist X verteilt?

180

ÜbuHBsaufoabtn

b)

Wie lautet die Stichprobenverteilung der Anzahl X der Treffer bei n Versuchen (Stichprobenumfang n)?

c)

Bei einer sehr großen Anzahl n ist die Anzahl X asymptotisch...?... verteilt. Der Anteilswert p= X/n ist...?... verteilt.

d)

Geben Sie eine Begründung für die unter c) dargestellten Zusammenhänge (Hinweise auf Lehrsätze und deren Hintergründe).

Aufgabe 7.2.5 Die Hausfrau H kann sich nicht damit abfinden, ihre Wohnung mit Ameisen (A), Schaben und Kakerlaken (K), Spinnen (S), Mäusen (M), Wanzen (W) und Ratten (R) teilen zu müssen. Sie versuchte deshalb zunächst ihren Mitbewohnern mit Universal - Schädlingsbekämpfern (die n > 1 Ungezieferarten vernichten) zu Leibe zu nicken, ging dann jedoch zu einer Strategie des gezielten (artspezifischen) Overkills über. Angenommen, jede Schädlingsart habe in der Grundgesamtheit der Wohnung einen gleichen Anteil von it = 1/6 an der Gesamtzahl der Schädlinge (Gleichverteilung). Ein morgendlicher Durchgang durch die Wohnung sei als Stichprobe aufzufassen. Die Hausfrau H findet dabei zehn Schädlinge, darunter sechs Spinnen. Geben Sie die Stichprobenverteilung für die Anzahl der Spinnen an! a)

Wie wahrscheinlich ist es, die beschriebene Stichprobe zu ziehen, wenn n = 1/6 ist?

b)

Wie wahrscheinlich ist es, einen Anteil von mehr als 50% Spinnen in der Stichprobe (n= 10) zuhaben?

Aufgabe 7.2.6. Diplom-Kaufmann K aus E ist leider sehr vergeßlich. Nur mit einer geringen Wahrscheinlichkeit 7i > 0 erinnert er sich an seine Telefonnummer. Mit einer Wahrscheinlichkeit 1-n ist sie ihm dagegen beim Aufsuchen einer Telefonzelle gerade entfallen.

Obunfsaufeaben

a)

b)

c)

IM

Man bestimme (ohne Zuhilfenahme der Formelsammlung) die Verteilung der Anzahl X der erinnerten Telefonnummern, wenn K genau n unabhängige Versuche macht (Stichprobe vom Umfang n), zu telefonieren! (Herleitung)! Wie lautet die Stichprobenverteilung des Anteils P=X/n der richtig erinnerten Telefonnummern und des Anteils der nicht erinnerten Telefonnummern?

Aufgabe 7.2.7 Die Grundgesamtheit sei zweipunktverteilt mit P(x=l) = 1/2 und P(x=2) = 1/2. Wie lautet die Stichprobenverteilung ... des arithmetischen Mittels X ... des geometrischen Mittels X 0 bei Stichproben vom Umfang n=2 und n=3 (Ziehen mit Zurücklegen)? Was fällt bei der Betrachtung der Stichprobenverteilung von XG auf?

Aufgabe 7.2.8 In seinem neusten Wirkungskreis ist Diplom Kaufmann K aus E für die Verwaltung eines Betriebes verantwortlich, der zum medizinischen Bereich i.w.S. gehört. Er hofft dabei seine Marketing- und Logistik-Kenntnisse zur Geltung bringen zu können, weil er u.a. auch für die Auslastung der Bettenkapazität von 120 Plätzen zuständig ist, die er durch gezielte PR-Arbeit zu steigern beabsichtigt. Die Anzahl X der täglichen Aufnahmeanträge (die auch größer als 120 sein kann) sei nonnalverteilt mit n und o 2 . Wie lautet die Stichprobenverteilung des mittleren Auslastungsgrades y= /120) bei Stichproben vom Umfang n?

You m u s t b e thfinewguy!

182

Übungsaufgaben

Aufgaben zu Kapitel 8 Aufeabe 8.1.1 Aus einer Urne mit N=4 Kugeln werde eine Stichprobe vom Umfang n=2 mit Zurücklegen gezogen. Die Urne enthält eine unbekannte Anzahl M von schwarzen und N-M von weißen Kugeln. Eine Stichprobe ergab eine schwarze und eine weiße Kugel. Bei welchem Wert für M (also M=l,2,3 oder 4) ist es am wahrscheinlichsten, daß gerade ein solches Stichprobenergebnis (also eine schwarze und eine weiße Kugel) entsteht? Man differenziere die LikelihoodFunktion nach M und ermittle so den unbekannten Wert M!

Aufeabe 8.1.2 Bei einer mündlichen Prüfung in Statistik im SS 1990 gab es bei n = 5 Prüfungen x = 1 Prozeß vor dem Verwaltungsgericht Gelsenkirchen (Ereignis G; die Prüfungen sind eine Stichprobe für die gilt: N sehr groß). Geben Sie die Werte der Likelihood-Funktion für verschiedene Werte von 7t = P(G) an.

0

P(G) Likelihood-

0,1

0,2

0,4

0,3

Funktion

Interpretieren Sie Ihr Ergebnis, indem Sie auch die Likelihood-Funktion angeben!

Aufeabe 8.1.3 Eine Zufallsvariable habe die Ausprägungsmöglichkeiten „Erfolg" mit der Wahrscheinlichkeit 7i und „Mißerfolg" mit der Wahrscheinlichkeit 1 - ti . In einer Versuchsreihe von vier Versuchen wurde die Zahl der Mißerfolge vor dem ersten Erfolg gemessen:

Versuch

1

2

3

4

Mißerfolge

2

0

1

3

a) Geben Sie die Wahrscheinlichkeiten für 0, 1,2 und 3 Mißerfolge in Abhängigkeit von n an.

Mißerfolge

0

1

2

3

Wahrscheinlichkeit

b) Geben Sie auf der Grundlage der oben angegebenen Stichprobe eine Maximum-Likelihood-Schätzung für 7t ab.

Obunesauftaben

183

Aufgabe 8.2.1 Die Zufallsvariablen X, X„ seien unabhängig identisch verteilt mit E(Xj)=n und gleichen Varianzen a 2 (i=l,2,...,n). Bekanntlich liefert dann die Stichprobenfunktion (Schätzfunktion) A, = l / n ( X , + X 2 + . . . + X n ) = X eine erwartungstreue und konsistente Schätzung für n. Welche Eigenschaften haben demgegenüber die Stichprobenfunktionen fi 2 und ß 3, wenn x, der erste und x„ der letzte Wert in einer der Größe nach geordneten Reihe ist: £2=(X,+X2)/2 A3=(2X1+0,5XJ/n ? Zeigen Sie, ob £ 2 und/oder

erwartungstreu, konsistent und genauso oder weniger effizient

sind wie bzw. als A,!

Aufgabe 8.2.2 Diplom-Kaufmann K aus E ist nach einigen beruflichen Mißerfolgen voll auf der esoterischen Welle abgefahren. Seine Vorhersagen von Wasseradern mit der Wünschelrute klappen jedoch nicht so ganz. Nur in X von n Fällen hegt er richtig. Seine potentielle Kundschaft ist durchaus geneigt, manchen Mißgriff hinzunehmen, weil nun mal diese äußerst sensiblen Dinge eine höhere geistige Ebene der Beurteilung verlangen. Der Anteil n der wahren Vorhersagen sollte jedoch bei aller Liebe zu den feinstofflichen Schwingungen aus dem Überraum schon etwa 3/4 betragen, weil die Inanspruchnahme der Esoterik ja auch Geld kostet. Diplom-Kaufmann K aus E ist deshalb bestrebt, seine Trefferquote 7t durch Stichproben laufend zu überprüfen. Als geeigneter Schätzer von n betrachtet er aufgrund übersinnlicher Eingebung die Funktion X+l n+2

und aufgrund seines früheren Studiums

X n

Die beiden Schätzfunktionen für it sind hinsichtlich der Gütekriterien (Erwartungstreue, Effizienz, Konsistenz) möglichst ohne esoterische Hilfsmittel zu beurteilen. Ist t , effizienter als x2?

Aufgabe 8.2.3 Diplom-Kaufmann K aus E buchte eine besonders preisgünstige Mittelmeerkreuzfahrt. Widrige Umstände und erlittene Unbill ließen in ihm jedoch den Entschluß reifen, solche Reisen hinfort nicht mehr zu unternehmen: Nach drei Tagen erreichte er als einer der wenigen Überlebenden eine Staumauer des Hafens von Genua.

IM

Obunesaufeaben

a)

Das Reisebüro legte in dem anschließenden Schadensersatzprozeß seine Unfallstatistik vor, nach welcher bei bisher insgesamt SO Kreuzfahrten nur eine Havarie (Ereignis H) zu beklagen war. Ist der Anteil pH = x/n = 1/50 eine erwartungstreue Schätzung für den Anteil nH in der Grundgesamtheit und ist die Größe p , ^ = pH (l-pH) eine erwartungstreue Schätzung für die Varianz 7iH(l-rtH) der Grundgesamtheit?

b)

Das Reisbüro veranstaltet auch Safaris, bei denen ein Anteil pL von Reiseteilnehmern nach einer Begegnung mit einem Leoparden nicht mehr wiedergesehen wurde. Unter welchen Voraussetzungen liefert die Differenz Ph-Pl eine erwartungstreue Schätzung für 7tH-7iL ?

Aufgabe 8.2.4 Zwei Ökonomen haben zwei verschiedene Schätzer ji, und ji2 für die erwartete Höhe des Einkommens von Mittelschichtfamilien in den USA vorgeschlagen: il1 = ^ x , + i ( x 2 + x 1 1 . 1 ) + i x D 1 »"2

Es wurde dabei angenommen, daß die Höhe der Einkommen unabhängig normalverteilt sind mit E(Xj) = n und V(Xj) = o 2 , für alle i = 1 n. Zeigen Sie, daß beide Schätzer erwartungstreu sind und vergleichen Sie die Schätzer hinsichtlich ihrer Varianzen. Welcher Schätzer ist effizienter?

Übunesaufeaben Aufgabe 8.3.1 Bei einer Stichprobe vom Umfang 100 a) mit Zurücklegen b) ohne Zurücklegen aus einer Grundgesamtheit von N=500 Stück befanden sich 30 Ausschußstücke. Bestimmen Sie die symmetrischen 95%-Konfidenzintervalle fttr den Ausschußanteil in der Grundgesamtheit!

Aufsähe 8.3.2 In einer Gemeinde mit 10.000 Erwerbstätigen wurden durch eine Stichprobe im Umfang n=100 folgende Werte für die Verteilung der Wochenverdienste festgestellt: x = 400

und

CT

= 50.

a)

Bestimmen Sie ein 95% symmetrisches Konfidenzintervall für |i.

b)

Man bestimme das 99%-Konfidenzintervall

c)

Wie würde sich das 95%-Intervall verringern, wenn eine entsprechende Stichprobe in einer Gemeinde mit nur 2.000 Erwerbstätigen gezogen worden wäre?

Aufgabe 8.3.3 (als Testproblem vgl. Aufgabe 9.1.4) In einer Stichprobe von n=50 Geräten (aus einer Produktionsserie von N=500 Stück) befanden sich 2 unbrauchbare Geräte. Im Kaufvertrag wurde verabredet, daß der Kunde berechtigt sei, die Abnahme der gesamten Serie zu verweigern, wenn bei einer Irrtumswahrscheinlichkeit von 5vH der Ausschußanteil der Grundgesamtheit 6vH oder höher sein könne. Darf der Kunde die Serie ablehnen? Welches Stichprobenergebnis wäre zu erwarten, wenn der Ausschußanteil in der Grundgesamtheit nur 2vH wäre?

Aufgabe 8.3.4 In einer Schulklasse mit 25 Schülern unterzogen sich 9 durch Los bestimmte Schüler einem Intelligenztest. Die Varianz des Intelligenzquotienten war dabei a 2 = 81. Wie breit ist das 95% -Konfidenzintervall?

185

186 Übunesaufeaben

Aufgabe 8.3.5 Bei 261 Patienten wurde untersucht, ob Akupunktur bei Dauerschmerzen hilft. Aus einer Untersuchung in den USA ergab sich, daß jeder dritte Patient (also 87) nach vier aufeinanderfolgenden Sitzungen nach eigenen Angaben schmerzfrei ist. Die Wirkung hielt jedoch nicht lange an, denn nach vier Wochen waren nur noch 5% schmerzfrei. Außerdem ist zu bedenken: ein Anteil von ca. 30% Linderung tritt auch schon bei Scheinmedikation ("Plazebos") auf. Bestimmen Sie ein 95%-Konfidenzintervall für n mit p=0,3 und p=l/3. Deuten Sie das Ergebnis.

«Und in zehn Tagen wll zeigen, wie man die Akupunktulnadeln nimmt Wiedel helaua.«

Aufgabe 8.3.6 Eine bestimmte Operation O wurde im Krankenhaus A bereits nA=40 mal und im Krankenhaus B bereits nB=50 mal durchgeführt. Als Erfolg gilt in der Medizin, daß der Patient die Operation lebend übersteht und sich sein Gesundheitszustand verbessert hat. Die Erfolgsquoten seien bei dieser schwierigen Operation leider mit p A =l/8 und p B =l/2 bedauerlich gering. Man bestimme 95,45%-Konfidenzintervalle für p A und p B aufgrund der beiden Stichproben! Was bedeutet es, wenn sich die Konfidenzintervalle überschneiden bzw. nicht überschneiden (so wie es oben der Fall ist)?

Aufgabe 8.3.7 (eine

Zukunftsvision)

Einer Forderung der Gewerkschaften entsprechend wurden ab 2010 nur noch im Personalwesen akademisch vorgebildete Poliere eingestellt, damit das Herumschlagen mit Dachlatten endlich ein Ende hat. Bei den ersten 100 Betrieben mit akademischem Führungsstil beobachtete man zwar eine Abnahme der Arbeitsproduktivität auf x = 450 (statt bisher n = 500), dafür wuchs aber das Verständnis für das Wesen des Personalwesens bei den Bauhilfsarbeitern ganz erheblich gegenüber dem bisherigen Zustand des autoritären nichtakademischen Führungsstils (vgl. Bild). Man bestimme mit x = 450 und o = 50 ein symmetrisches Konfidenzintervall für ^ (1 - a = 0,9545)!

Übunesaufoaben

187

Aufgabe 8.3.8 Bei einem Einstellungstest in der Industrie werde den Neuakademikern jeweils ein Problem vorgelegt, für welches eine bestimmte Arbeitszeit X erforderlich ist, um es sorgfältig zu lösen. Der Personalchef, der stets sehr intensiv mit Statistik befaßt sein muß, möchte erst einmal das Konfidenzintervall für die durchschnittliche Bearbeitungszeit bestimmen, um bei den Bewerbern, die er ablehnt, gerecht verfahren zu können. Gestern mögen sich vier Personen beworben haben und dabei folgende Bearbeitungszeiten (in Minuten) benötigt haben: 105,95,110 und 90 Minuten. Man bestimme ein zweiseitiges 95%-Konfidenzintervall für die durchschnittliche Bearbeitungszeit!

Aufgabe 8.4.1 Ein gemeinnütziger Verein veranstaltete eine außerordentlich spannende Vortragsreihe über Statistik und eine entsprechende, aber an sich weniger ergiebige Fortbildungsveranstaltung über Buchhaltung. An beiden Lehrgängen nahmen 200 (verschiedene) Manager teil, wobei sich jedoch bei der Buchhaltung ein Anteil von 80% besonders interessiert zeigte, während es bei der Statistik nur 20% waren. Könnte es sein, daß der Unterschied nur zufällig 60%, in der Grundgesamtheit dagegen nur 20% beträgt (a=5%)?

Aufgabe 8.4.2 Als es in früheren Zeiten noch nicht üblich war, Rettungsflugzeuge für die Rettung von Schiffsbrüchigen einzusetzen, kam es doch relativ häufig vor, daß ein Schiffbrüchiger auf einer einsamen Insel dahinschmachtete. Einer früheren Untersuchung (n,=35 Monate) zufolge wurde dieses traurige Schicksal im Monatsdurchschnitt x,=8 Menschen zuteil (bei CT=5). In einer neueren Untersuchung (nach Erfindung des Flugzeugs) fand man jedoch nur x2=5,5 und o=5. Der Stichprobenumfang der neueren Untersuchung war erheblich größer: n2=1225.

BUdung»urlaub

188 a) b)

Übunrsaufoaben Man bestimme die 95%-Konfidenzintervalle für |i früher und jetzt (mit n,= 36 statt 35). Es interessiert natürlich die Frage, ob durch den Einsatz von Rettungshubschraubern signifikant weniger SchifFsbrüchige auf einsamen Inseln verkommen müssen. Man bestimme deshalb ein Konfidenzintervall (a=5%) der Differenz der Mittelwerte (Hinweis: Man gehe von homogenen Varianzen und einer Normalverteilung aus!). Was bedeutet es, wenn das Konfidenzintervall auch den Wert 0 umfaßt?

Aufeabe 8.4.3 Man beantworte zur folgenden Meldung aus dem "SPIEGEL" Italienische Erfolge bei der Brustkrebstherapie Mit einer Kombination dreier verschiedener Krebsmedikamente (Cyclophosphamid, Methotrexat und Fluorouracil) hat der italienische Krebsspezialist Dr. Gianni Bonadonna die Überlebenschance von 207 Patienten drastisch verbessert, bei denen trotz Brustkrebsoperation die Tumorzellen zum Teil schon in den Lymphknoten angesiedelt waren. Nur bei zehn der gleich im Anschluß an die Operation behandelten Frauen kam es später wieder zu einem Rückfall - von einer Kontrollgruppe mit 179 Frauen dagegen, bei denen die Chemotherapie nicht eingesetzt wurde, erkrankten 43 abermals. Auch nachdem die Medikamentenkombination abgesetzt worden war, erhöhte sich die Rückfallquote nicht. Bonadonnas Arbeit, bei der ihm zehn Kollegen vom Mailänder Istituto Natzionale Tumori assistierten, sei von "monumentaler Wichtigkeit", heißt es in einem Kommentar des als zurückhaltend bekannten "New England Journal of Medicine", in dessen vorletzter Ausgabe die italienischen Befunde publiziert wurden. Womöglich könnte mit der Dreifach-Therapie das Leben "Hunderttausender von Frauen gerettet" werden. Bisher hatten beispielsweise nur 45 von 100 Amerikanerinnen, bei denen Tumorzellen sich schon in den Lymphknoten eingenistet hatten, die ersten fünf Jahre nach der Operation überlebt. die Fragen: Kann mit einer Wahrscheinlichkeit von l-a=0,95 (zweiseitig) behauptet werden, daß die Wahrscheinlichkeit des Rückfalls a)

bei beiden Heilmethoden gleich ist?

b)

der neuen Methode um ein Viertel gegenüber der alten gesenkt werden kann?

Aufgabe 8.4.4 Die Europa Universität Viadrina in Frankfurt an der Oder fühlt sich u.a. auch der Tradition des berühmten polnischen Malers und Erfinders Leonardo da Winczinski verpflichtet, der sich intensiv mit der Möglichkeit des menschlichen Fluges beschäftigte. Es wurden deshalb auch alternative und umweltfreundliche Formen des Fliegens erforscht. Bei Methode 1 (vgl. Bild) endeten von 200 Flugversuchen leider 80% bereits auf deutscher Seite, während es bei Methode 2, mit der ebenfalls 200 Versuche unternommen wurden, immerhin SO mal gelang, auf polnischem Gebiet zu landen. Ist der Unterschied zwischen den beiden Flugmethoden signifikant (a=5%)?

Aufgaben zu Kapitel 9 Aufgabe 9.1.1 Die Post des Landes x plant eine Gebührenerhöhung für eine ihrer Dienstleistungen, die bisher von 80vH der Bevölkerung in Anspruch genommen wurde. Eine Stichprobe vom Umfang n 2500 ergab, daß bei der höheren Gebühr immerhin noch 78vH der Bevölkerung diese Leistung nachfragen werden. Die Post schließt daraus, daß sich die Nachfrager preisunelastisch verhalten und freut sich auf die Mehreinnahmen durch die Gebührenerhöhung: a)

Formulieren Sie für dieses Beispiel die Nullhypothese HQ und die Alternativhypothese H, ! Was bedeutet in diesem Fall der Fehler a? (Beschreiben Sie in eigenen Worten, worin das Risiko, den Fehler 1. Art zu begehen, besteht!)

190

b)

Übungsaufgaben

Sollte die Post ihren Überlegungen eine möglichst geringe Irrtumswahrscheinlichkeit a zugrunde legen und dadurch ein größeres ß in Kauf nehmen oder umgekehrt ß klein halten und dabei ein größeres a in Kauf nehmen?

Aufeabe 9.1.2 Nachdem Diplom-Kaufmann K aus E einen Schnellimbiß eröffnete, widerfuhr ihm auch das Mißgeschick, einen Juristen (J) zu Gast zu haben, der Tomatensuppe bestellte. Der Vorfall endete damit, daß sich K vor Gericht wegen versuchter Körperverletzung verantworten mußte. Dabei stellte sich heraus, daß unter 25 Tomatensuppen des K sogar 9 wegen einer Fliege für gewisse Gäste ungenießbar waren. Vor Gericht wurden zwei konkurrierende Hypothesen über die Wahrscheinlichkeit dieser Ereignisse verfochten: vonK: vonJ:

H o :n = 0,l ^ 7 1 = 0,5

a)

Entscheiden Sie über HQ mit einer Sicherheitswahrscheinlichkeit von l-a=0,9772!

b)

Bei welchem Wert von p beginnt der kritische Bereich?

c)

Bestimmen Sie ein 95%-zweiseitiges Konfidenzintervall für it.

Aufeabe 9.1.3 In den Wäldern des Fürstentums Sylvanien kam es vor dem Jahre 1649 doch schon hin und wieder zu unangenehmen Begegnungen. Die mittlere Anzahl derartiger Unfälle war |i = 500 pro Monat und die Standardabweichung war 50 Unfälle pro Monat. Prinz Wanfried von Sylvanien befahl deshalb einem Hofnarren, eine Straßenverkehrsordnung mit vielen schönen Paragraphen auszuarbeiten. Sie trat 1649 in Kraft.

Öbunesaufsaben

a)

Nach Inkrafttreten der Straßenverkehrsordnung ermittelten die Statistiker folgende Daten für die Unfallhäufigkeit x = 450 und a = 50. Man bestimme das symmetrische Konfidenzintervall bei einer Fehlerwahrscheinlichkeit von a = 0,0455! Die Angaben beruhen auf einer Untersuchung von n=100 Monaten (mehr als 8 Jahre)

b)

Es interessiert natürlich, ob durch Wanfrieds Straßenverkehrsordnung nunmehr signifikant weniger Unfälle (Monatsdurchschnitte) vorkommen, als früher. Formulieren Sie die Nullund Alternativhypothese und führen Sie den Test durch! (a = 5vH)

c)

Bei welchem Wert beginnt der kritische Bereich?

d)

Erläutern Sie in kurzen Worten den Unterschied zwischen Schätzen und Testen.

191

Aufgabe 9.1.4 (als Schätzproblem vgl. Aufgabe 8.3.3) In einer Stichprobe von n = 50 Geräten (aus einer Produktionsserie von N = 500 Stück) befanden sich zwei unbrauchbare Geräte. Im Kaufvertrag wurde ein Ausschußanteil der Produktionsserie von 1% garantiert. Darf der Kunde die Abnahme der Serie verweigern, weil der Ausschußanteil in der Stichprobe 4% statt 1% beträgt? Die Abnahmekontrolle soll mit einer Sicherheitswahrscheinlichkeit von 95% durchgeführt werden, d.h. mit einer Irrtumswahrscheinlichkeit (einem Signifikanzniveau) von 5% (einseitiger Test), denn: HQ: 7i = 0,01 (Hypothese des Verkäufers) und H,: 7t > 0,01 (Hypothese des Käufers).

192

Übunesaufeaben

Aufgabe 9.1.5 Durch das Geschick der Feuerwehrmänner darf man darauf vertrauen, daß man mit einer konstanten Wahrscheinlichkeit von 1-ti = 24/25 = 0,96 bei einem Sprung vom Sprungtuch auch sicher landet. a)

Angenommen, die etwas füllige Frau F springe als dritte Person und sei die zweite Person, die beim Sprung verun-glUckt. Vor ihr sei bereits der betuchte Dipl.-Kfm. K aus E gesprungen und neben dem Sprungtuch gelandet, während Dipl.Vw. V aus M glücklich gelandet sei. Die Reihenfolge, in der K und V gesprungen sind, sei nachträglich nicht mehr feststellbar. Wie wahrscheinlich ist das beschriebene Ereignis? (Bestimmen Sie die Wahrscheinlichkeit auf zwei Arten: durch Aufzeichnen des Wahrscheinlichkeitsbaums bzw. durch Benutzung der passenden Wahrscheinlichkeitsverteilung).

b)

Bei einem Einsatz galt es 20 Personen zu retten. Schreiben Sie die Wahrscheinlichkeitsverteilung f(x) und die Verteilungsfunktion F(x) für die Anzahl der mißglückten Sprünge auf!

c)

Die von Ihnen gewählte Verteilung hat... Parameter und ist O stetig O diskret O eine Grenzverteilung O symmetrisch 0 asymmetrisch O monoton fallend 0 linear 0 normal O zweigipflig

a)

Bei der dienstlichen Beurteilung des Nachwuchsfeuerwehrmannes N entstanden dadurch gewisse Schwierigkeiten, daß der Vorgesetzte den Eindruck gewann, N habe sich bei der geforderten "raschen Güterabwägung" signifikant häufiger zugunsten von Frauen als von Männern entschieden.

Übungsaufgaben

Geht man bei einem Test von der Aibeitshypothese des Vorgesetzten aus, daß N Frauen bei der Rettung bevorzugt, bedeuten a - und ß-Fehler: O O O O 0 O

ß-Fehler: N gerät in den Verdacht, Frauen zu bevorzugen, obgleich er es nicht tut; a-Fehler: N gerät in den Verdacht, Frauen zu bevorzugen, obgleich er Männer und Frauen gleich behandelt; ß-Fehler: die Bevorzugung der Frauen von N wird nicht erkannt; ß-Fehler: der Stichprobenbefund legt den Schluß nahe, N behandele Männer und Frauen gleich, obgleich man von der Hypothese ausging, N bevorzuge Frauen. die Ablehnung der Gleichbehandlungshypothese (a-Fehler) bedeutet, daß N die Frauen bevorzugt; a ist die Wahrscheinlichkeit, die Gleichbehandlungshypothese abzulehnen, während ß die Wahrscheinlichkeit ist, diese Hypothese anzunehmen, so daß a+ß=l gilt.

Aufeabe 9.1.6

Im Jahr 2118 fand Albert Zweistein heraus, daß die Menge Aminohydronucleindiformaldehydtriproteinascorbinsäure (kurz A) im Zellkern (gemessen in Nanogramm [ng]) ein Maß zur Unterscheidung von Subhominiden (weniger als 8 ng), Hominiden (8 bis 10 ng; (iH = 9 und a H = 4) Superhominiden (über 10 ng) sei. Eine Expedition zum Sonnensystem Tau-Ceti kam mit einer Stichprobe von zufällig ausgewählten Extraterrestriern zurück. Es interessiert die Frage, ob diese entlegenen Ortes vorgefundene Populationen von der Art der hienieden existierenden Hominiden sein können. Messungen ergaben: n 16

x 11

"X'

a

4

a)

Man teste die Hypothese, daß der Tau-Ceti ein Hominid ist gegen die Altemativhypothese, daß er ein Supeihominid ist (5%, einseitig, H,: |ic=l2,6449, ac=4.).

b)

Bei welcher Menge beginnt der kritische Bereich?

c)

Wie groß ist die Wahrscheinlichkeit für ß?

a)

ß ist die Wahrscheinlichkeit,... O O O O

anzunehmen, der Tau-Ceti sei ein Supeihominid, obwohl er es nicht ist. anzunehmen, der Tau-Ceti sei kein Superhominid, obwohl er es doch ist. einen Unterschied zwischen Hominiden und Superhominiden auch tatsächlich zu erkennen. einen tatsächlich bestehenden Unterschied zwischen Hominiden und Superhominiden nicht zu erkennen.

191

194

Übungsaufgaben

Aufgabe 9.1.7 Die Versuchsserie für den neuen Fliegentöter "der totale Spray" (TS) mußte wegen einer unerwarteten und gravierenden Wirkung nach n=4 (n=25) Versuchen abgebrochen werden. a)

Es ist zu entscheiden, ob bei TS tatsächlich mit dieser nicht tolerablen Wirkung zu rechnen ist (a=0,01, einseitig), wenn hierfür aufgrund theoretischer Erwägungen von Chemikern nur eine Wahrscheinlichkeit von 0,01 sprechen würde!

b)

Aufgrund welchen Grenzwertsatzes darf man (zumindest asymptotisch) mit der Normalverteilung rechnen? Wie ist X tatsächlich verteilt?

c)

Man diskutiere für dieses Beispiel die inhaltliche Bedeutung des Fehlers erster bzw. zweiter Art.

...

xj 6 •••• • "Ahl Tie. f

Aufgabe 9.1.8 Ein pharmazeutisches Unternehmen überprüft die Wirksamkeit eines neuen Medikaments anhand des Anteils der "Geheilten". Das Medikament gilt als wirksam, wenn der Anteil 7t„>n„ ist (n=neu, a=alt). a)

Warum prüft man die Nullhypothese H,: 7t„ = n t = n 0 und nicht die Alternativhypothese H,: 7tn > 7it? Warum ist ein nichtsignifikantes Ergebnis keine Verifizierung der Nullhypothese? Demonstrieren Sie Ihre Überlegungen an folgendem Beispiel: n=100, pn=0,15 und n 0 =0,l bzw. 7t0=0,2.

b)

Welche Interessen werden der Hersteller und der Patient hinsichtlich a und ß vertreten?

Übungsaufgaben

IM

Aufgabe 9.1.9 Die medizinischen Lehrmeinungen des Chirurgen Prof. Dr. C sind mit zunehmender Berufserfahrung immer radikaler geworden. Zu seiner Grundüberzeugung gehört mittlerweile die Lehre, daß jedes Organ, das unbrauchbar ist, ersatzlos entfernt werden müsse. Dabei sind jedoch leider im letzten Monat bei 25 Operationen nicht weniger als neun Patienten gestorben. Bei einer Untersuchung durch die Ärztekammer (A) wurden über die Wahrscheinlichkeit n solcher Vorfälle zwei konkurrierende Hypothesen verfochten vonC: vonA: a)

b)

c)

Ho: n = 0,1 H,: 7t = 0,5.

Entscheiden Sie über Ho mit einer Sicherheitswahrscheinlichkeit von 1-a = 0,9772. Bei welchem Wert von p beginnt der kritische Bereich (1 a = 0,9772)? Bestimmen Sie die Wahrscheinlichkeit ß für den Fehler zweiter Art!

Aufeabe 9.1.10 "Statistische Testverfahren sollen ein Urteil ermöglichen, mit welcher Sicherheit oder Signifikanz die über die Ausgangsverteilung der erhobenen Merkmale und ihre Parameter aufgestellten Hypothesen bestätigt oder verworfen werden können". (aus einem Lehrbuch zum Marketing) Beantworten Sie ausgehend von diesen Erklärungen folgende Fragen: a)

Sind die Begriffe "Sicherheit" und "Signifikanz" synonym?

b)

Was heißt "Ausgangsverteilung"? Worauf bezieht sich der Begriff "Parameter"?

c)

Wird bei einem Test eine Sicherheit berechnet, mit der eine Hypothese verworfen werden kann? Stellt die Größe 1-a eine solche Größe dar? Kann es überhaupt eine

196

Obunssaufeaben "Sicherheit" im Sinne der Wahrscheinlichkeit eines Ereignisses geben, mit der man eine Hypothese bestätigen oder verwerfen kann?

d)

Muß sich ein Test immer auf die Parameter einer Verteilung beziehen?

Aufgabe 9.1.11 In einem betriebswirtschaftlichen Lehrbuch stellt der Autor die Prüfbarkeit einer Hypothese Uber die Wahrscheinlichkeit, nach einer Vorstrafe rückfällig zu werden, wie folgt dar: Unserer Aussage über die Vorbestraften würden wir etwa die folgende Form geben: "95% aller Vorbestraften werden rückfällig, 5% dagegen nicht." Die Prüfbarkeit dieser Aussage wird dadurch hergestellt, daß wir eine bestimmte Hypothese über das für die jeweiligen Fälle geltende Verteilungsgesetz aufstellen. Diese Hypothese könnte etwa das folgende Aussehen haben: In x% der Fälle gilt folgendes Verhältnis von rüchfälligen zu nicht rückfälligen Vorbestraften: 3% 91:9 7% 92:8 80% 95:5 7% 98:2 3% 99:1 Stellen wir durch empirische Untersuchungen fest, daß beispielsweise in 90% der Fälle das Verhältnis von Rüctfalligen zu Nichtrückfalligen 92:8 lautet, so müssen wir sowohl unsere Hypothese über das geltende Verteilungsgesetz, als auch unsere empirische Hypothese als falsifiziert ansehen. Offenbar will der Autor zeigen, ob und wie man eine Hypothese über eine Wahrscheinlichkeit (7t=0,95) falsifizieren kann. Beantworten Sie folgende Fragen zu seiner Betrachtung: a)

b) c)

d)

e) f)

Was könnte "in 90% der Fälle" bedeuten? Könnte gemeint sein: bei 90% aller Stichproben (von welchem Umfang?) wurde eine relative Häufigkeit von (genau?) 0,92 beobachtet? Woher kommt die Hypothese "über das für die jeweiligen Fälle geltende Verteilungsgesetz"? Warum folgt sie nicht aus der Hypothese 7t=0,95? In welcher Weise kann eine (oder mehrere [in 90% der Fälle], wobei sich fragt, wieviel) relative Häufigkeit(en) eine Hypothese über eine Wahrscheinlichkeit (0,95) "falsifizieren"? Inwiefern kann eine solche Beobachtung (aus wieviel Stichproben welchen Umfangs?) zugleich zwei Hypothesen (wenn es denn zwei sind) "falsifizieren"? Was bedeutet hier "empirische Hypothese"? Gibt es bei Signifikanztests eine Hypothese über ein "Verteilungsgesetz"? Was wird hier eigentlich verteilt? Warum wird nicht gesagt, wieviel Stichproben welchen Umfangs gezogen werden? Warum erscheint in der Betrachtung kein Signifikanzniveau?

Übungsaufgaben

197

Aufgabe 9.1.12 In einer empirischen Studie über Schulreife und Schulerfolg untersuchten K. Ltthning und R. Schmid (1978) Einflußgroßen von Schulreife, Schulnoten und Intelligenz. Eine Stichprobe von n=18 Schülern ("Einheimische") einer niedersächsischen Gemeinde mit dem Einschulungsjahr 1970 ergab einen Mittelwert x=109 der IQ-Punkte mit einer Standardabweichung o=13,5. Psychologen mögen herausgefunden haben, daß der IQ normalverteilt ist mit ji=100 und =300. Welche Varianz hat sie im Falle a)

einer ungeschichteten Stichprobe (uneingeschränkte Zufallsauswahl)

b)

einer geschichteten Stichprobe und zwar - bei proportionaler Aufteilung - bei optimaler Aufteilung Man interpretiere das Ergebnis!

Übungsaufgaben

205

Aufgabe 10.3.3 Seit Dipl.-Kfin. K aus E auf Busfahrer umgesattelt hat, interessiert er sich nur noch für das Konfidenzintervall seiner durchschnittlichen Trinkgeldeinnahmen bei Sonderfahrten. Das Unternehmen, bei dem er arbeitet, veranstaltete N=1.000 Sonderfahrten: 80% Fahrten zu Fußballspielen (F) und 20% Wochenendausflüge von Kleingärtnern (G). Die 20 Fahrten des K seien als geschichtete Stichprobe aufzufassen: nF=16

xF=50

o2F=400

1^=4

Xq=70

a 2 o =900

Von besonderem Interesse ist es für K zu wissen, ob er signifikant mehr Trinkgeld von den Kleingärtnern als von den Fußballfans zu erwarten hat (a=0,05). Wie ist bei den obigen Zahlenangaben eine geschichtete Stichprobe vom Umfang n=20 in nF und üq aufzuteilen, wenn die Aufteilung proportional (optimal) sein soll?

Aufgabe 10.3.4 Gegeben sei eine Grundgesamtheit mit den Schichten-Anteilen f,=N,/N und f2=N2/N. Zeigen Sie, daß die Varianz der Stichprobenverteilung von X im Falle der ungeschichteten Stichprobe a^=-i[fIf2(M1-n2)2+V11+VI2] lautet und im Falle der geschichteten Stichprobe „2_f,V„ TL ~~ n,

f2V12 "*" n2

bei V„ = f,af und V12 = f 2 a 2 . Erklären Sie anhand dieser Herleitung den Schichtungseffekt. Kann kein Schichtungseffekt eintreten, wenn n,=|i2 ist?

Lösungen zu den Übungsaufgaben

Losungen zu den Übungsaufgaben

Kapitel 1 1.1,1.2

Die Stichprobenräume sind formal identisch mit 9 Elementen Q={AA, AB CC}. Dann ist AA eines von 9 Elementen, Wahrscheinlichkeit: 1/9.

Kapitel 2 2.1

V = 12 (n = 4; i = 2)

2.2

P w = 12.600

2.3

a)

2.4

vierstellig

K = lf f i )1 = 13.983.816 49

2 5

-

a)

UMib736-448

2.6

a)

V w = 57 = 78.125

2.8

a)

P = 120

2.9

a)

0,4

2.10

1 -0,88305=0,11695

tm

»

b)

b)

K = li 5 J) = 1.712.304

b)

(

b)

K W = ^ ? J = 330

48

^

= 816

i11!

P = (n-1)! = 24 b)

1-1/10 = 0,9

c)

Kapitel 3 3.1.1 Aussage

gilt stets

gilt nur, wenn...

1

wenn AB c AC, dannBcC

zugleich gilt: BC = B

2

wenn ABC=AB dann B c C

zugleich gilt: BC = B

3

(AuB) - A = B

AnB = 0

4

Q-(AuC) = ÄnB

zugleich gilt: B = C

5

(A-B) vj (A-C) = A-BC

X

gilt nie

0,5

209

210

Lösungen zu den Übunesaufeaben

6

AB-AC = BC

7

AB - AC = AB-ABC

8

A-B=B-A

3.1.2,3.1.3

X X A=B

Lösung hier zu platzaufwendig

3.2.1

nein, denn P(AuBuCuD) = P(£2) = 10/12 < 1 und P(AuD) = 7/12 > 1/2

3.2.2

Ereignisfeld (Potenzmenge), (0, V, M, S

VM, VK, MK

fi)

diese Menge

hat insgesamt 24=16 Elemente 3.2.3

subjektiv

3.2.4 3.2.5

a), b) nein c) ja a) keine Folgerung, (1 - 1/5000000)!000000 b) statistisch c) C2=GvjKu V; unmöglich ist G n V; weil 0 nicht enthalten

3.3.1

P(AuB) = 0,25 + 0,3 - 0,05 = 0,5 < 1, daher muß es noch mehr Stockwerke geben

3.3.2

P(BuC)=0,4

3.4.1

a) 0,2258 b) [Zusatzfrage: a) 0,2379, b) 0,2344]

3.4.2

a) b)

P(AnC)=0,2

P(AnB)=0,l

P(AuBuC)=0,62

0,21875

P(x=0)=0,729, P(x=l)=0,243, P(x=2)=0,027, P(x=3)=0,001 siehe auch Binomialverteilung; E(X) = 0,3 c) 10 Kugeln, davon 9 weiße u. 1 schwarze (Erfolg, Motor fällt aus), dreimal ZmZ.

3.4.3

4

3.4.4

P ( Ä n B n C ) = 0,5833

3.4.5 3.4.6

Teilereignis R c S , deshalb P(R) < P(S) und P(R) = P(RS) (5\* T35Y4 erstes Spiel: 1 - ^ - J =0,5177 zweites Spiel: 1 - ^ — J =0,4914

3.4.7

0,05

3.4.8

die einzelnen Partitionen kommen bei 63=216 Versuchsausgängen unterschiedlich häufig vor, nämlich 3! = 6, 3!/2!l! = 3 und 1 mal, so daß P(x=9)=25/216 und P(x=10)=27/216 gilt.

von einem ... = 0,3458

Lösungen zu den Obunesaufeaben 211

3.4.9

P(A)=11/36, P(B)=5/36, P(AnB)=2/36 => P(A|B)=2/5 stochastisch abhängig wegen P(A|B)#P(A).

3.4.10

erste Summe immer 1, zweite Summe bei Unabhängigkeit 2 P(A).

3.4.11

aa) 0,565 ab) 0,0247 ac) 0,1357 b) stoch. abhängig, weil P(S IR) * P(S | S)

3.4.12

14/15

3.4.13

a)

b) c)

P(A|B)=0,3, P(AB)=0,06, P(T|ÄB)=0, P(AuB)=0,44 P(AB) + P(AB)=0,38, P(AuB)=0,56, P(AB)=0,24, P(T|AB)=0,2, P(T)=0,048 Stichprobenraum, Zerlegung, unverträglich 0,8824 d) 0,3828

3.4.14

a)

0,18

3.4.15

a) c) d)

0,8824 b) 0,979; 0,904_ P(AnS)=0,32, P(A)=0,56, P(S|A)=0,571, P(AuA)=l, P(A-S)=0,24 A-S, S, A u S mit Wahrsch. 0,1,0,6 und 0,3

3.4.16

P(N) = 0,346, P(NK) = 0,006

3.4.17

Demonstrationsbeispiel: paarweise wechselseitige Unabhängigkeit.

3.4.18

a)

b)

0,62

c)

0,44

d)

Unabhängigkeit

0,38

impliziert

P(F) = 0,7, P( H ) = 0,2, P(H IF) = 0,9

F

F

S

H

0,63

0,17

0,8

H

0,07

0,13

0,2

Z

0,7

0,3

1

1) P ( H n F ) = 0,13 2) P(H n F) = 0,63 3) P(H u F) - P(H n F) = P(H) + P(F) - P(H n F) = 0,8 + 0 , 7 - 2 0,63 = 0,24

b) c)

oder P(H n F) + P(F n H) = 0,07 + 0,17 = 0,24 Nein, da z.B. P(H) • P(F) = 0,7 0,8 = 0,56 * P(HnF) = 0,63 P(B|H) = 0,1, P ( B | H ) = 0,05 P(B) = P(B|H) • P(H) + P(B| H) • P(H) =0,1 • 0,8+0,05 • 0,2 = 0,08-H),01 = 0,09

nicht

a)

0,42; 0,1429

b)

für y: 0,42,0,4286, für Z: 0,42,0,6

a)

nein, P(S|D) > P(S|D)

a) b)

0,9 P(B)=0,6, wobei P(x=0)=0,3, P(x=l)=0,6 u. P(x=2)=0,l mit hypergeometrischen Verteilung zu bestimmen wären; totale Wahrsch.

c)

P(x=0|B)=0,45

b)

0,12

c)

0,25

der

P(x=2|B)=0,05

0,0515 1/3, 5/6 P(X) ist die Wahrsch. dafür, daß ein Spieler mit einem Restkapital von X ruiniert wird. Aus P(0)=1 und P(B)=1 sowie P(X) = [P(X+1)+P(X-1>] folgt:

4 a) 8 Möglichkeiten; P(x=0)=l/8, P(x=l)=3/8, P(x=2)=3/8, P(x=3)=l/8 b) P(x=0)=8/27, P(x=l)=4/9, P(x=2)=2/9, P(x=3)=l/27 c) für Teil a): E(X)=1,5, V(X)=0,75 für Teil b ) : E ( X ) = l , V(X)=2/3, a=0,8165 a) F(x) = - x 2 4

E(X) = 3

a) Jf(x)dx = 1 und f(x) > 0

b) P(0,5 < x < 1,5) = 0,5 b) P(1 < x < 5) = 41/54

c) E(X)=3, V(X)=2,4 Erwartungswert jeweils 4,8 (keine Entscheidung nach max. Erwartungswert [Bernoulli-Kriterium] möglich). unendlicher Erwartungswert => unendlich hoher Einsatz wird trotzdem nicht gewagt; Paradoxon des Petersburger Spiels: Nutzen * Geldeinsatz. Beweise einfach mit q=l/2. f(y) = (y-l)(l/2)y wenn y>2 . zwar gilt F(10) = 1, nicht jedoch f(x) > 0 für alle Werte von x. E(X)=0,58, bedingte Wahrscheinlichkeit, Likelihood, P(D)=0,8 .

Lösungen zu den Übungsaufgaben 213

4.1.9

a) Fläche unter f(x) ist 1, f(x)>0, f(x)>l für xX),63 b) E(X)=0,8, V(X)=0,0267

4.1.10

mit lim[n/(n+l)] = l . n-*» " 1 1 1 1 unendlicher Erwartungswert: E(X) = V = —+—+...= 5 ] — 1 , wobei die ^ x+1 2 3 x harmonische Reihe E(l/x) nicht konvergiert.

4.1.11 4.1.12

a)F(10)=l b) E(X) = |10 l n x | ; a) übliches Verfahren f(x)>0, F(3)=l b) nur letzte Antwort richtig c) E(X)=27/24=1,125, V(X)=0,6094 d) E(Y)=4,5; V(Y)=2,4375 .

4.1.13

a) eindim., stetig, asymmetr., stückweise linear (Dreiecksvert.) b) P(x>10)=l/6

" x ( x + l)

=

n+1

c) Normalveiteilung mit n = 7 und a = 2; P(x > 10) = 0,0668. 4.1.14

Lösung hier zu aufwendig

4.2.1 x=o

X=1

£

Y=0

4/9

2/9

6/9

Y=1

2/9

1/9

3/9

I

6/9

3/9

1

P(X = 0|Y = 0) = P(X = 0|Y = l) = 2/3 P(X = l|Y = 0) = P(X = l|Y = l) = 1/3 P(Y = 0|X = 0) = P(Y = 0|X = l) = 2/3 P(Y = l|X = 0) = P( Y = l|X = l) = 1/3 E(X) = E(Y) = 1/3, E(XY) = 1/9, C(XY) = 0 b) X=0

X=1

I

¥»=0

2/3' 3/5=2/5

t/3' 4/5=4/15

2/3

Y=1

2/3 2/5=4/15

1/3 1/5=1/15

1/3

E

2/3

1/3

1

P(X = 0|Y = 0) = 3/5 P(X = 0|Y = l) = 4/5 P(X = l|Y = 0) = 2/5 P(X = l|Y = l) = 1/5 P( Y = 0|X = 0) = 3/5 P(Y = 0|X = l) = 4/5 P( Y = l|X = 0) = 2/5 P(Y = l|X = l) = l/5 E(X) = E(Y) = 1/3; C(XY) = -0,0444

214

4.2.2

Lösungen zu den Übungsaufgaben

a)

Y=0

Y=1

I

x=o

0,11

0,02

0,13

X=1

0,72

0,15

0,87

E

0,83

0,17

1

E(X)=0,87, E(Y)=0,17 P(X = 0|Y = 0) = 0,1325

P(X = 0|Y = l) = 0,1176

P(Y = 0|X = 0) = 0,8462

P( Y = 0|X = l) = 0,8276

E(X|Y = 0) = 0,8675 E(Y|X = 0) = 0,1538

E(X|Y = l) = 0,8824 E(Y|X = 1) = 0,1724

b) C(XY) = 0,15-0,87-0,17 = 0,0021 V(X)=0,1131; V(Y)=0,1411; p ^ = 0,0166 4.2.3 4.2.4

f,(x) = i x + 4 8

f 2 (y) = — y 2 + 8 8

P(0co

c) Pn = e~k (man würde vermuten, daß P auch von n abhängt) 5.4.7

ja, da nur geringe Abweichungen; Häufigkeiten: 108,8,66,2,20,2,4,2,0,6

217

218

Lösungen zu den Obunesaufeaben

5.4.8 empirische theoretische absolute Häufigkeiten relative relative Häufigkeiten Häufigkeiten

h

Poisson X,=0,7

«i

0,5162

0,4966

215

0,3287

0,3476

150

0,1111

0,1217

53

0,0347

0,0284

12

0,0093

0,0050

2

0

0,0008

0

5.4.9

5.4.10

%

b

m

0

100

0,595

0,575

96,6

1

50

0,298

0,318

53,4

2

14

0,083

0,088

14,8 2,7

3

3

0,018

0,016

4 5 6

0 0 1

0 0 0,006

0,002 0,0002 0,000

7

0

0

-

} 0,5 -

X = 0,2 , fi(3) = 0,0011 .

Kapitel 6 6.1.1

J x/c2 a) f(x) = i , [2/c-x/c

für0 1 was zu (*) führt.

1. Auswahl von m (wobei m < n - 3 ) a u s n - l Elementen (n minus Kunstspringer K) ohne / n - l-i\ Berücksichtigung der Anordnung: l m J Jetzt Auswahl aus n - 3 (n minus K und zwei weiteren Personen):

( n - i

Aufgabe 2 Es gibt insgesamt 1000 dreistellige Nummern (wobei auch die Nummer 000 mitgezählt ist). 90 Nummern beginnen mit 0 (Ol l bis 099) und 10 Nummern beginnen mit 00 (000 bis 009). Insgesamt gibt es also 900 Möglichkeiten, die somit ausreichen. Andere Betrachtungsmöglichkeit: Verwendung der Ziffern l, 2 9 (allgemein Z) ergibt 9 3 = 729 Möglichkeiten. Hinzu 2 kommen 2 • 9 = 162 Möglichkeiten für Nummern des Typs Z0Z oder ZZ0 sowie 9 Möglichkeiten für die Nummern ZOO, also insgesamt 900 Möglichkeiten. b) günstige Ereignisse

: 10

mögliche Ereignisse : 800, somit ^ ^ = 0,0125 Es ist auch möglich, den Ansatz mit Hilfe der hypergeometrischen Verteilung zu wählen, wenn man davon ausgeht, daß er genau einmal seine Tante am Apparat hat und 9 mal jemand anderen.

256

Lösuneen zum Klausurtraininf f799 10 800

vi l 9 '8(XA

. 10 J cl) Ansatz über die Binomialverteilung: f OQO x 99 ^ f j — l\ 0® f f 9 999 )3 -f 9991 ^ VioooJ lioooJ vioooJ

0,997

c2) Ansatz wie unter cl vi =0,00299

VKMXV V1000)

d) Die Auswahl von 10 aus 800 Elementen ohne Berücksichtigung der Anordnung (da es auf die Reihenfolge des Gezogenwerdens bei den 10 Nummern nicht ankommt) stellt Kombinationen mit Wiederholung dar:

l

'800 + 1 0 - f | ff 809^1 = J l io n 10 J = 3,1295 10

fn + i - A

22

i e) Hier das gleiche Auswahlproblem wie unter d), nur ohne Wiederholung: f800^1

= 2,7965 -1022

f) Die Zufallsauswahl könnte nur repräsentativ für die Fernsprechteilnehmer sein und würde als Stichprobe für die gesamte Gemeinde dem Prinzip der reinen (uneingeschränkten) Zufallsauswahl nicht entsprechen, da keine Chancengleichheit gegeben ist (nur Fernsprechteilnehmer haben eine Auswahlchance). Zum anderen wird gegen das Prinzip der Unabhängigkeit verstoßen, da man durch Auswahl eines Fernsprechteilnehmers stets auch zugleich andere Nutzer (dessen Apparates) mit auswählt. Hinzu kommt, daß „blindes Greifen" in der Regel keine Zufälligkeit der Auswahl garantiert, insbesondere nicht bei einer so großen Urne wie einem Telefonbuch. Die Zufälligkeit wird dagegen z.B. dann hergestellt, wenn mit Zufallszahlen ausgewählt wird. Aufgabe 3 a) Kombinationen ohne Wiederholung. Es gibt folgende Möglichkeiten für die untere Ebene (10,5) = 252, mit den verbleibenden Personen für die mittlere Ebene i5l = 10 und v3, (2 schließlich für die obere Ebene nur eine verbleibende Möglichkeit = 1. Das Produkt und damit die Anzahl der Möglichkeiten ist 2520.

b)

00

3G i

0

= 0,025

untere Ebene mittlere Ebene obere Ebene Das Modell ist „Ziehen ohne Zurücklegen", weil für die sieben „Normal Befähigten" und

Lösungen zum Klausurtrainine

257

die drei „Spitzenkräfte" jeweils ein und nur ein Platz vergeben werden kann, c) 1. Null, da in der oberen Führungsebene nur Spitzenkräfte zu finden sind. 2. j , hierfür gibt es drei Lösungswege: Weg 1: zwei Positionen, 10 Bewerber, jede Besetzungsmöglichkeit gleichwahrscheinlich, 2 1 also — = 75 = 0,2 10 Weg 2: Für K bieten bloß folgende Besetzungsmöglichkeiten eine Chance: Besetzungsmöglichkeit

Wahrscheinlichkeit j 3 7_ 7 10 9 ~ 15

Bl: » O o d e r O *

7 6_ 7 10 9 ~ 15

B2: O O

Bedingte Wahrscheinlichkeit dafür, daß eine Führungskraft die Person K ist: P ( K | B l ) = )j undP(K|B2) = Totale Wahrscheinlichkeit: P(K) = ¿ P ( K | B i ) P ( B i ) = \ = 0,2 i-i

5

Weg 3: über die polyhypergeometrische Verteilung bei Unterscheidung von drei Qualitäten: •

Führungsperson, Anzahl 3

O

normal Befähigter außer K, Anzahl 6

llj uJ u

10

f10l ,2,

f3> oj U l l j 6

)

/

]

V2J Besetzung • ®

Besetzung O ®

d) Binomialverteilung mit imbekanntem n und x = 1, p = 0,05. Es gilt: 0,95 = P(x ^ l) = 1 - P(x = 0) = 1 - ^jjj • 0,05" • 0,95° In 0,05 also 0,95 n = 0,05 und n = . ' = 58,404 also mindestens 59.

258

Lösungen zum Klausurtraining

Aufgabe 4 a) Ereignis

Wahrscheinlichkeit

(AnB) = (AB)

P(AB) = P(A|B) • P(B) = 0,24

(AuB)

P(AuB) = P(A) + P(B) - P(AB) = 0,96

entweder (AB) oder ( A B )

P(AB) + P(AB) = P(A) - P(AB) + P(B) - P(AB) = 0,16 + 0,56 = 0,72

00

1- P(AuB) = 1 - 0,96 = 0,04

AB b) Zweipunktverteilung mit 7t = 0,4 0,4 wenn

x = 1 also

A

0,6 wenn

x = 0 also

A

0 c)

sonst a \ = 0,4 0,6 = 0,24

E(X) = 0,4

d) x=1

x=2

I

y=l y=2

P(AB) =0,24 P(AB) = 0,16

P(ÄB) = 0,56 P( AB) = 0,04

P(B) =0,8 P( B) = 0,2

I

P(A)

P ( Ä ) =0,6

1

= 0,4

Vgl. hierzu auch die im Teil a) bestimmten Wahrscheinlichkeiten. Die Kovarianz beträgt E(XY) - E(X)" E(Y) = 0,24 - 0,8 • 0,4 = -0,08 Für die Korrelation erhält man entsprechend -0,08 = - 0,40825 V0,4-0,6-0,8-0,2

0 f(z) 0,04

1 0,72

0,24

Hieraus errechnet sich leicht E(Z) = 0,72 + 0,48 =1,2 = E(X) + E(Y) = P ( A ) + P ( B ) = 0,4 + 0,8

Für die Varianz von Z erhält man o \ = E(Z2) - [E(Z)]2 = 1,68 - 1,44 = 0,24 und weil für die Varianz gilt a2x= P(A)' P(A) = 0,4 • 0,6 = 0,24 und G2y = P(B) • P(B) = 0,8 • 0,2 = 0,16 und die Kovarianz - 0,08 beträgt, ist auch a 2 z = CT2x+ay+2axy =0,24 + 0,16-0,16 = 0,24 erfüllt.

Lösungen zum Klausurtrainin% 259 Aufgabe 5 a) Nein, da P(U|P) * P(U|P) folglich auch P(U|P) * P(U) und P(UP) * P(U) P(P) b) P(UnP) = P(UP) = P(U|P) P(P) = 0,5 0,4 = 0,2 P(UuP) = P(U) + P(P) - P(UP) = 0,26 + 0,4 - 0,2 = 0,46

c)

d)

(X) 0

= 9 10'

I ^X )

0

= 0,207

59!(60 —12)! _ 1 (59-11)160! 60 Es gibt 60 - 1 = 59 auswählende Personen außer K. Aus ihnen werden 11 genommen. Es 59^ gibt dann Möglichkeiten der Auswahl und 11! Möglichkeiten sie anzuordnen, rnsge-

(

59! samt also ——j-jyy günstige Ereignisse (Variationen ohne Wiederholung), in denen K unter den ersten 11 nicht erscheint. Entsprechend ist die Anzahl der möglichen Ereignisse: 60! (60-12)! Andere Lösungswege:

00 „ 0

1) Die Wahrscheinlichkeit, K und 11 andere auszuwählen ist:

=

60

Wenn K mit der Wahrscheinlichkeit P(K) ausgewählt wurde, dann ist die Wahrscheinlichkeit dafür, daß er an 12. Stelle steht (Ereignis S): P(S|K)=f4, da ja auch jede Stelle gleichwahrscheinlich ist. Wie man sieht, ist P(K) P(S|K) = P(SK) = 60 2) Wahrscheinlichkeit der Auswahl 11 anderer Personen außer K mal Wahrscheinlichkeit K als 12. auszuwählen:

2£0

LOswtfen zum Klausurtrainine 59 58 57

49"; J _ _ J _

60 59 58

50^ 49 ~ 60

f) Fehler zweiter Art g) Nein, da keine Unabhängigkeit der Auffassungen der Richter angenommen werden darf. Aufgabe 6 a) Gleiche Wahrscheinlichkeit wie die, daß es höchstens zwei Giftpilze sind, also mit der Verteilungsfunktion der Poissonverteilung F(2) = 0,9526. Der hohe Wert von 95% besagt natürlich nicht, daß es sehr wahrscheinlich ist, sich zu vergiften. Bekanntlich ist ja F(2) = f(0) + f(l) + f(2) und es ist f(0) = 0,4493, so daß ein hohe (« 45%) Wahrscheinlichkeit besteht, keinen Giftpilz zu finden. b) Gegenwahrscheinlichkeit zur totalen Wahrscheinlichkeit filr A P(A) = P(A|x = 0)P(x = 0) + P(A|x = 1) P(x = 1)+ P(A|x = 2) P(x = 2) + P(A|x > 3)P(x > 3) = 0 0,4493 + 0,7 0,3595 + 0,9 0,1438 + 1 0,0474 = 0,42847 also die Überlebenswahrscheinlichkeit 1 - 0,42847 = 0,57153. Es ist klar, daß P(A|x = 0) = Oist. c) Ho : n = 0,8,CT= x ~ n _ 0-0,8 z

~

— Vñ

~

-0,8

IM

~

V 40

= -5,6569

IM v 40

also hochsignifikant!

CT JÖß d) x ± za -t= = 0± 1,6469 . - V ^ = 0± 0,2326 -v/n V40 (negativer Wert unsinnig) Hochrechnung: 0 bis 9,3 Giftpilze unter den vierzig gesammelten Pilzen e)

1,962 0,8 W = 1 2

2 9

'

3 1 2

Aufgabe 7 a) Vgl. Abb. für die Gestalt Dichtefunktion. Es muß gelten:

der

1. f ( x ) > 0 f l l r 0 ^ x < 8 2. F(8)= | 0 , 2 d x + j ( ^ x - ^ x ) d x = l

8 x

Lösungen zum Klausurtrainine 261

b) E(X) = ¡ 0 2 x d x . J ^ x - ^ d x = [0,lx2]* + [0,133x2 -0,011x 3 ]* = 2,8

F(x) =

0

x 0,8 ist, was ja bedeutet, daß einige Spaghetti unter 80 cm lang sein können, wenn andere über 80cm lang sind, daß aber keinesfalls alle Spaghetti über 80 cm lang sein können. c) Fragestellung von Teil b): nach X , relevant für Stichprobentheorie Fragestellung von Teil a): nach X, betrifft den einleitenden Text („alle länger als 80cm").

Aufgabe 17

oder: A = erster Zug keine vergiftete Praline B = zweiter Zug keine vergiftete Praline P(AB) = P(A)P(B|A) = | ~ = | 6

5

3

= 0,222 c) Grundgesamtheit ist zweipunktverteilt n=— f(x)

für x = 1 (Vergiftung) % l - 7 i = — für x = 0 (keine Vergiftung). 6

Die (Ober)- Grenze des 90%-einseitigen Schwankungsintervalls für den Stichprobenanteil p bei Stichproben vom Umfang n = 2 aus dieser Grundgesamtheit sollte > 0,5 sein, da nur dann der Tod eintritt. Sie beträgt bei Za = 1,2816 JC + Z, 'a

I: I

I6'2

I I I

2 6 6

V

6 - 1

— +1,2816 • 0,2357 = 0,4687. 6

Lösungen zum Klausurtramm?

271

Die Annäherung an die Normalverteihmg ist jedoch bei n = 2 sehr schlecht. Die exakten Wahrscheinlichkeiten nach der hypergeometrischen Verteilung sind (vgl. Teil a) für x = 1

vergiftete Praline, also

p = 0,5 genau 1/3

fllrx = 0

p=0

2/3.

Rechnet man mit zwei vergifteten Pralinen bei 6 Pralinen so ist für x = 2 also vp = 1

Wahrsch. — 15 o für x = 1 also p = 0,5 Wahrsch. 15

Summe: 0,6 < 0,9.

Erst bei M=3 vergifteten Pralinen ist die Wahrscheinlichkeit für p ^ — nach der hypergeometrischen Verteilung 0,8. Rechnet man mit einem 90% Schwankungsintervall wie oben, so ist die Obergrenze 0,9053! Der Statistiker wird ihm sagen, daß mindestens drei, besser aber vier Pralinen vergiftet werden sollten. Mit der Approximation der Normalverteilung an die hypergeometrische Verteilung werden jedoch die Wahrscheinlichkeiten für p > 0,5 stark überschätzt, wie die folgende Tabelle zeigt: Wahrscheinlichkeit für einen Anteil p £ ^ von vergifteten Pralinen bei n = 2 in der Stichprobe bei unterschiedlicher Anzahl M der vergifteten Pralinen

M

Hypergeometrische Normalverteilung (ohne Kontinuitätskorrektur) Verteilung (i a Wahrscheinlichkeit

1

1 3

2

0,6

3 4

1

0,2357

1 - F (-0,707) = 0,7611

2 6

0,2981

1 - F (-1,118) = 0,8686

0,8

0,5

0,3162

1 - F(-l,581) = 0,9441

14 — =0,9333

0,6667

0,2981

1 - F (-2,236) = 0,9875

5

1

0,8333

0,2357

1 - F (-3,535) = 0,9998

6

1

1

0

1

6

d) Ist die Grundgesamtheit zweipunktverteilt, so ist die Stichprobenverteilung bei Stichproben ohne Zurücklegen für X bzw. p die hypergeometrische Verteilung mit den Parametern E(X) = mt E ( p ) = n

F

, N-n = mi(l - n) N-l

ct|

*(l-*)N-n

2

p

n

N-l

272

Lösungen zum Klausurtrainini

Bei großem n (meist n > 30) ist diese Verteilung mit der Normalverteilung zu approximieren (bei entsprechendem n und o). Diese Approximationsbedingungen sind hier nicht erfüllt, wie obige Berechnungen zeigen (n ist ja nur 2 !). Im Fall „mit Zurücklegen" ist die Stichprobenverteilung für p die Binomialverteilung mit der Varianz ———, was größer ist als im Falle der hypergeometrischen Verteilung, da n N-n der Korrekturfaktor 0 < ——- < 1 ist.

Aufgabe 18 a) Konfidenzintervall für A = 7ii - 7t2 bei pi - P2 = 0,1 - 0,05 - 0,05, ni = 30 und n2 = 100. Die Intervallgrenzen sind dann (bei Za = 1,96; mit t-Verteilung « 1,98). 0,05 ±1,96^/0,003475 also -0,066 < A < 0,166 b) X = 80 0,05 = 4, 1 - F(8) = 1 - 0,9786 = 0,0214 c) Die erste Antwortmöglichkeit ist nicht notwendig richtig (sie kann richtig sein). Denn man kann auch (wie oben geschehen) mit der Annahme 711 = 0,1 und 712 = 0,05 also explizit 711 * 712 ein Konfidenzintervall bestimmen, das A = 0 umschließt. Aus obigem Ergebnis folgt also nicht, daß A = 0 sein muß, wohl aber, daß A = 0 sein kann. Mit A = 0 ist nicht verbunden 7ii = 7t2 = 0 und auch nicht 711 = «2 = 0,1 sonder nur 711 = 712, so daß auch die Antworten 4 und 6 falsch sind. Es gilt also F, F, R, F, R, F. d) 1. Proportionale Aufteilung n, = 2

18000 Q s m

190000 • 104 = 9 und n2 = 2 0 8 0 0 Q • 104 = 95.

2. Optimale Aufteilung (n = ni + n2) Ni = 190000 und N2 = 18000 nk Nkok , — = N CT mit est = 7i k (l-7i k ) und k = 1,2; also n 2. k i k

ni = 11,89 » 12 Christen und n2 = 92,1 « 92 Moslems. 1,962 • 0,25 1,962 0,25 e) n - 1 ^ , „ beiK = ' liefert n £ 2120. ' (0,02) + K 18000 Aufgabe 19 a) Subskript 1 : Indien, 2 : Deutschland, einseitiger Test, da Hi: (ii < H2Zwei - Stichproben - Test der Hypothese Ho : A = ni - |i2 = 0 b) Testgröße z (alles nach Umrechnung in €) Ä = 3C,-3C2=4-5 = - 1 €

Lösungen

n, =100,i12 =

4

49 = 12,25

n2 = 400, Sj = 4 €

€2

CT2

2825 498

=

=

zum Klausurtraininf

273

5,67, 1,2816 Ho verworfen würde, begeht man einen Fehler 1. Art (da ja Ho gilt) höchstens mit einer Wahrscheinlichkeit von a = 0,1 10: da ja die für z = -3,755 entsprechende Wahrscheinlichkeit viel kleiner ist als 10% Ob die Nullhypothese richtig oder falsch ist und mit welcher (subjektiven) Wahrscheinlichkeit man sie annimmt oder verwirft, berührt den Test nicht. Folglich sind die Antworten 1 bis 4, 7 und 8 definitiv falsch. Gelten lassen könnte man auch Antwort 6 mit dem Zusatz, daß die Irrtumswahrscheinlichkeit eine Obergrenze für diese exakte (sog. Probit) Wahrscheinlichkeit darstellt. Entsprechendes gilt für Antwort 9. Aufgabe 20 a) Da x = 0,4 und s2 = 0,4 wird eine Poissonverteilung mit X = E(X) = a 2 =0,4 und eine Normalverteilung mit n = o 2 = 0,4 angenommen. Man erhält für n = 100 danach folgende (theoretische, d.h. bei Geltung der betreffenden Verteilung) zu erwartenden Häufigkeiten X

Poissonverteilung

Normalverteilung

empirisch

0

67,03 * 67

F(0,16) 100

=56,36

67

1

26,81 »27

[F(l,74)-F(0,16)] 100 = 39,55

27

2

5,36 » 5

[ F(3,32) - F(l,74) ] 100 = 4,04

5

3

0,72

4 und mehr

«1

1

0,08 » 0

0

Da die Normalverteilung stetig ist, empfiehlt es sich als Klassengrenze —,— ,... (Kontinuitätskorrektur) einzuführen. Dann entspricht z = 0,158; z = 1,739; usw. b) Die empirische Häufigkeitsverteilung entspricht augenscheinlich gut einer Poissonverteilung (mit X = 0,4) d.h. die x2 - Testgröße ist Null. Sie entspricht offensichtlich weniger der entsprechenden Normalverteilung. Gleichwohl ist ein %2 - Anpassungstest wenig sinnvoll, da theoretische Häufigkeiten auftreten, die weit kleiner als 5 sind. Durch Zusammenfassung von Klassen (etwa „2 und mehr") würden jedoch Freiheitsgrade verlorengehen. c) 1. Geometrische Verteilung mit x = 2, also y = 3, also 0,4' 0,62 = 0,144 2. l - 0 , 6 3 = 0,784

274

Lösungen zum Klausurtrainins

3. Negative Binomialverteilung mit r = 2 und p = 0,4; man erhält für m = 3 die Wahrscheinlichkeit Q t t •(! - n) = 0,192 1 - n

_ = -2,5 - und- er* - = —— = 3,75 d) E(Y) = i—_ =J — 7i " 0,4 : . 300

(

0 4 V°° e)1 1 - -l1-20ö) =°'45152 2. 1 - e0,41,5

=0,45119.

Die Ähnlichkeit der beiden Ergebnisse war zu erwarten, da die EV das stetige Analogon zur GV ist. f) Da in einem Intervall von einem Jahr die Anzahl X der Teufel poissonverteilt ist mit X = 0,4 ist für das Intervall von t = 4 Jahren X poissonverteilt mit X" t = 1,6. Dann gilt E(X) = 1,6 Teufel «2) = ^ ' = 0 , 2 5 8 4

g) p ( o , 4 ± l , 6 4 4 9 ^ = 0,9; Grenzen des Intervalls 0,296 < p. = X 7 - 7> = ° ' 0 3 8 1 5 1

ist

-

d) 21 mal Ziehen mit Zurücklegen aus einer Urne mit jeweils gleich vielen schwarzen (B), weißen (C ) und roten (D) Kugeln. e) Die Likelihood-Funktion lautet

Folglich ist InL = -12X + 4 lnX - In 2

Lösungen zum Klausurtraining

275

und aus ——— = -12 + — = 0 folgt X = — = — = x für den Maximum-Likelihood-Schätzer dA X 12 3 von X. f) Gemäß Poissonverteilung mit X = - j ist die Wahrscheinlichkeit 1 - F(2) = 0,00482. Aufgabe 22 Die Aufgabe behandelt verschiedene Varianten des x 2 - Tests, nämlich den Anpassungs-, Unabhängigkeits- und Homogenitätstest.2) a) Randverteilung {n.j} der Reaktionsstufen ri j = X n i j wobei n^ die vorgegebenen empirii sehen Häufigkeiten sind. 1

2

3

4

50

40

50

60

Stufe Häufigkeit

Randverteilungen {n.j} der Musikarten nL = X n > j ' j

n =

>

Musik

klass.

alpen.

orient.

Protest

Punk

Häufigkeit

40

50

50

20

40

gemeinsame Verteilung {Uij} bei Unabhängigkeit UB = *

1

2

3

4

I

10

8

10

12

40

alpen.

12,5

10

12,5

15

50

orient.

12,5

10

12,5

15

50

Protest

5

4

5

6

20

Punk

10

8

10

12

40

50

40

50

60

200

i\j klassisch

Z

Uj U: fl

Man beachte, daß die theoretischen Häufigkeiten z.T. kleiner als 10 sind, in einem Fall nämlich U42 sogar kleiner als 5, was die Anwendbarkeit des x2-Tests beeinträchtigt. b) Bei Gleichverteilung wären folgende Häufigkeiten zu erwarten 50, 50, 50 und 50. Man berechnet dann die „ „ 02 PrüfgrößeP:P = -

2

+

102 0 2 102 - + - + = 4,

) Vgl. hierzu F. Vogel, Beschreibende und schließende Statistik: Formeln, Definitionen, Erläuterungen, Stichwörter und Tabellen, München, Wien 1979, S. .146 ff.

2ZÊ

Lösungen zum Kiausurtrainimf

die x2 verteilt ist mit 4 - 1 = 3 Freiheitsgraden. Für 5% zweiseitig (nur die zweiseitige Fragestellung ist angesichts der Konstruktion von P sinnvoll) zeigt die Tabelle der Verteilung die Werte 0,22 und 9,35, mithin ist, da 0,22 < P < 9,35 die empirische Verteilung der Reaktion nicht signifikant verschieden von einer Gleichverteilung. Für alle 20 Felder muß die quadrierte Differenz der empirischen Häufigkeiten Njj von den theoretischen Häufigkeiten Uy durch Uy dividiert werden und die Summe gebildet werden. Das Prüfinaß P ist also

Bei 3 ' 4 = 12 Freiheitsgraden erhält man folgende %2-Werte der Tabelle: 4,40 und 23,34. Die Hypothese der Unabhängigkeit ist also zu verwerfen. d) Bei Geltung der Nullhypothese (Gleichheit aller fünf Verteilungen) müßten die relativen Häufigkeiten für jede der fünf Zeilen sein Reaktion relative Häufigkeit

1

2

3

4

11 + 3 ——— = 0,155 90

21 ™ = 0,233 90

25 x : = 0.277 90

30 ™ = 0,333 90

Man erhielte dann folgende Tafel der absoluten Häufigkeiten: 1

2

3

4

X

alpenl.

7,7

11,6

13,8

16,6

50

Punk-Rock

6,2

9,3

11J

13,3

40

14

21

25

30

90

1

Die Prüfgröße P wird wieder entsprechend Teil c) der Aufgabe gebildet P=

(7,7 - l l ) 2 (13.3-22) 2 ' ' +...+ V ' „ ' =24,06, 7,8 13,3

was bei 4 - 1 = 3 Freiheitsgraden signifikant ist (vgl. Teil b) der Aufgabe). Die Schlange reagiert auf Punk-Rock offenbar anders als auf alpenländische Musik. e) Wie leicht zu sehen ist, führt eine Verdoppelung aller empirischen Häufigkeiten ny zu einer Verdoppelung der Prüfgröße. Für Teil a) erhielte man also P = 8, was auf dem 10%-, nicht aber auf dem 5%-Niveau Signifikanz bedeuten würde. f) Wir fassen, (wie schon in den vorangegangenen Teilen) die beobachteten Reaktionen auf k = 2 bzw. k = 5 Musikarten als k unabhängige Stichproben auf (die Präferenzen der Schlange werden nicht von der vorangegangenen Darbietung beeinflußt). Die Reaktionsstufen sind als Nominal- oder Ordinalskalenwerte zu interpretieren, weshalb ein parametri-

Losungen zum Klausurtrainine

277

scher Test wenig aussagefähig wäre3). Die für die Daten und Fragestellung relevanten Tests (z.B. der Mann Whitney U-Test) setzen voraus, daß man für die beiden samples (insgesamt 90 Beobachtungen) durchgängig Rangzahlen vergeben kann, d.h. eine lineare Rangstatistik4) konstruiert, was hier schwer durchführbar ist, weil Bindungen (gleiche Skalenwerte) nicht nur innerhalb einer Stichprobe, sondern auch zwischen den beiden Stichproben auftreten. Ein einfacher nichtparametrischer Test für die gestellte Frage wäre der Mediantest, der jedoch bei diesen Daten, wenn man auf eine Interpolation des Zentralwertes verzichtet, Unterschiede kaum aufdecken kann. Wie man sieht, gibt es nicht für jede Art von Fragestellung und Daten einen befriedigenden statistischen Test.

Aufgabe 23 a) P(0,99 1 X-LI 1,003-1 T— L_ _ = 18 c/Vn 0,001/6 ' Za = 1,6449 => Ho ablehnen

p(l,003 - 1 , 9 6 ^ - < n ^ 1,003 + 1 , 9 6 ^ i j = 0,95 0.99973.i n ^ 1,0062 d) P ( 2 5 ^ x ^ 3 5 ) = P ( 3 0 - 5 ^ x ^ 3 0 + 5 ) > l - ^ = 0,52 oder 1

P(25^x^35) = l -

= 1 - ^ = 0,52

im) e) f(x) = — 1.E(x) = % 2.V(x) = ^

a•?)• 915,25 Man erhält: F = ^ | y = 6,14 Der F-Wert der Tabelle ist jedoch 1,96. Folglich wird die Hypothese (Ho) der Homogenität der Varianzen ( o j = a 2 ) verworfen. c) Test des Unterschieds von Korrelation bei zwei unabhängigen Stichproben. Die standardnormalverteilte Prüfgröße ist r," - r,* . 1 1+r z = — — wobei r = — In y y (Fisher'sehe Transformation) und

mind. 43 Netze

f) Y = X + X + X~ N(3000, 7500) P (y < 2974) z =

2974 - 3000 V75ÖÖ

=P (Z < -0,3) = 1 - P (Z < 0,3) = 1 - 0,6179 = 0,3821 Falsch wäre: y = 3X~ N(3000; 22500); 3X ist eine andere ZV als X + X + X

Aufgabe 29 a) Normalgleichungen " 200

5500'

a

"4000

5500 195000

b

140000

also

a = 1,142857 b = 0,685714

b) Ein erwartungstreuer Schätzer fllr die gesuchte Varianz o 2 ist a 2 = 1 * 1 n-2 aus r 2 = 1 -

Man erhält

und r = 0,8213 also ist £ ü 2 = 9926,7 und S(y-y)

2

o 2 =50,13. Mit den Prozentpunkten a (für 0,975) und b (für 0,025) der x -Verteilung bei n - 2 = 198 Freiheitsgraden erhält man das Konfidenzintervall iE*

2

,

= 0,95.

Die Grenzen a und b werden in den meisten Lehrbüchern nur bis zu r = 100 Freiheitsgraden mitgeteilt. Für r > 100 erhält man mit der Umrechnungsformel

Lösungen zum Klauiurtramine 282

z 0 ) 2 bei za = 1,96

(»)

die Grenzen a = 238,38 und b = 160,47. Das führt zum Konfidenzintervall 41,6 i o 2 i 61,9. Die Grenzen a und b erhält man auch indem man davon ausgeht, daß die Xa2 X -verteilte Variable z = — — asymptopisch N(198,2 • 198) verteilt ist, einer Überlegung, o auf der die Formel (*) beruht. z-198 Dann führt ± 1,96 = ^ ^

zu z\ = b = 159 und zi = a = 237 und damit zum Konfidenz-

intervall 41,9 5CT25 62,4. c) Zu diesem Zweck ist zu bilden 6 2 (X'X) _ I =

" 1,145942 -0315134

-0,315134 0,011459

Man erhält dann bei t = 1,97 (t-Verteilung mit ca. 200 Freiheitsgraden) folgende Konfidenzintervalle fflra:

a±tVU45942 -> - 0 , 9 6 6 0 5 a 5 3 , 2 5 1 7

für ß: b±tV0,011459 ->

0,4748 £ ß 5 0,8966

Man beachte, daß insbesondere b gegen ß = 0 gesichert ist. Folglich wird auch r signifikant von Null verschieden sein. Da der Stichprobenumfang hinreichend groß ist, kann man davon ausgehen, daß die Prüfgröße z = r V n - 1 = 0,82lWl99 = 11,586 standardnormalverteilt ist. Das Ergebnis besagt, daß r hochsignifikant ist (z« = 1,96). F-Test: rl ^—iy^—^

1 ~ fi,.-2 = 410,358 (Tabellenwert F , . = 5,02 bei - a = 2,5%)

d) In diesem Fall ist die Fisher'sche Transformation durchzuführen: . 1. 1 + r 1, 1,8213 r* = - I n - — = - l n - 7 7 — = 1,1608. 2 1 - r 2 0,1787 Entsprechend erhalt man für p2 = 0,6 den Wert p = 0,7746 und p* = 1,0317. Dann ist die standardnormalverteilte Prüfgröße (r* - p * ) V n - 3 = 1,8117 > 1,6449.

Teil IV

Musterklausuren

Muslerklausuren 287

Hauptklausur WS 01/02 Aufgabe 1 a) Das größte Ziel von Radprofi U besteht in einem Sieg bei der Tour de France. Zur Erreichung dieses Ziels nimmt er sich jedes Jahr vor lange und hart zu trainieren. Allerdings besteht für ihn immer die Gefahr, dass sein Training entweder durch eine Grippe (Ereignis G) oder ein zu üppiges Weihnachtsessen und somit eine ungeplanten Gewichtszunahme (Ereignis Z) gestört wird. Er selber gibt die Wahrscheinlichkeiten für diese Ereignisse wie folgt an: P(g) = 0,4, P(z) = 0,7 und P(G n Z) = 0,2 i)

Welcher Wahrscheinlichkeitsbegriff wird hier zugrunde gelegt?

(1 Punkt)

ii) Wie groß ist die Wahrscheinlichkeit, dass 1) keines 2) mindestens eines 3) genau eines 4) höchstens eines der beiden Ereignisse G und Z eintritt?

( 4 x 2 Punkte)

iii) Stellen Sie die folgenden Ereignisse in je einem Venn-Diagramm graphisch dar 1) U schafft es ohne Grippe und Gewichtszunahme sein Training zu absolvieren. 2) U wird entweder von einer Grippe oder einer Gewichtszunahme befallen, schafft es aber zu vermeiden, dass beides eintritt. ( 2 x 2 Punkte) iv) Zeigen Sie, dass die Ereignisse G und Z abhängig sind.

(1 Punkt)

b) U ist der Meinung, dass er die Tour mit einer Wahrscheinlichkeit von 0,9 gewinnt (Ereignis T), wenn er die 12. Etappe gewinnt (Ereignis E). Gewinnt er diese Etappe nicht, beziffert er die Wahrscheinlichkeit auf einen Gesamtsieg nur mit 0,3. Die Wahrscheinlichkeit, dass er die 12. Etappe gewinnt, liegt für U bei 0,6. Wie groß ist die Wahrscheinlichkeit, dass i)

U die Tour gewinnt

(3 Punkte)

ii) U die 12. Etappe gewonnen hat, wenn es mit dem Gesamtsieg (mal wieder) nicht geklappt hat? (3 Punkte) Aufgabe 2 a) In einem Becher sind zwei 1 Cent-, drei 2 Cent und ein 5 Cent-Stück. Geben Sie die Stichprobenverteilung für die Geldsumme bei einer Stichprobe im Umfang n = 2 an ( 2 x 3 Punkte) i)

beim Ziehen mit Zurücklegen

ii)

beim Ziehen ohne Zurücklegen

b) Das folgende Diagramm gibt die relativen Häufigkeiten der Zahl „sechs" beim Würfeln mit einem Würfel bei n = 50,..., 1000 Versuchen wieder. Es ist zu erkennen, dass •

die relative Häufigkeit um die Wahrscheinlichkeit von 7t = 1/6 schwankt

288

Musterklausuren



die relative Häufigkeit bei n = 150 in eine vorher definierte Epsilon-Umgebung um Jt eintritt



die relative Häufigkeit diese Epsilon-Umgebung bei n = 600, wieder verlässt und bei n = 750 erneut eintritt.

Kreuzen Sie bitte an: Dieser Verlauf widerspricht dem schwachen Gesetz der großen Zahl und ist daher unmöglich. Dieser Verlauf widerspricht dem schwachen Gesetz der großen Zahl nicht und ist daher durchaus denkbar. (1 Punkt) Begründen Sie Ihre Antwort.

(3 Punkte)

c) Ein Paketdienst möchte seinen Fuhrpark erneuern. Um die notwendige Größe der zu bestellenden Fahrzeuge zu ermitteln, möchte das Unternehmen das durchschnittliche Gewicht der von ihnen gelieferten Pakete ermitteln. Der Paketdienst unterscheidet vier Paketgrößen: Mini, Normal, Maxi und Jumbo. Es ist bekannt, dass der Dienst zu je einem Drittel Normal und Maxi-Pakete ausliefert und sich der Rest gleichmäßig auf Mini- und Jumbo-Pakete aufteilt. Außerdem sind die folgenden Varianzen des Gewichts der Pakete bekannt: ° L i = ctL™i = 16; a j ^ = a ^ = 25 Insgesamt soll eine Stichprobe im Umfang n = 60 gezogen werden. Wie muss diese Stichprobe auf die verschiedenen Paketgrößen aufgeteilt werden, wenn die Aufteilung i)

proportional

ii)

optimal

erfolgen soll. iii)

Warum heißt die optimale Aufteilung „optimal"? Optimierungsvorschrift einschließlich Nebenbedingung.

(3 + 3 Punkte) Nennen

Sie

die

(4 Punkte)

Musterklausuren 289

Aufgabe 3 a) Ein Getränkehersteller bekommt eine Lieferung Flaschen auf zehn verschiedenen Paletten. Mit dem Lieferanten ist vereinbart, dass eine Lieferung zurückgeschickt wird, wenn mehr als 5% der Flaschen Ausschuss sind. Der Qualitätskontrolleur entschließt sich eine Stichprobe im Umfang n = 50 zu ziehen und zwar die Stichprobenelemente ni = 1,..., 20 von der ersten Palette und den Rest (n2 = 21,...,50) von der zweiten Palette. Zur Schätzung des Ausschussanteils in der Gesamtlieferung überlegt er sich folgende Funktionen: . 1 7t,1 = — 2 Vni

n

2J

... « X. + Xj 11) * J = - 1 — 2 n,'i +n,

mit Xj = Auschussstücke auf Palette i nj = Umfang der Stichprobe von Palette i Beurteilen Sie die beiden Schätzfunktionen bezüglich Erwartungstreue und Konsistenz. ( 2 x 4 Punkte) b) Eine diskrete Zufallsvariable sei gleichverteilt mit — filrx = l,2,...,N f(x) = N 0 sonst Eine Stichprobe vom Umfang n = 2 ergibt das Ergebnis x, = 3 und x2 = 4. Geben Sie eine Maximum-Likelihood-Schätzung filr N ab. (5 Punkte) c)

Ein Dominostein ist in zwei Hälften unterteilt, die jeweils eine Augenzahl von 0 bis 6 enthalten. Ein Dominospiel besteht aus allen möglichen Paaren dieser Augenzahlen. Wie viele Dominosteine gibt es? Wie groß ist die Wahrscheinlichkeit bei zufälligem Ziehen einen Dominostein zu erwischen, dessen Augensumme größer als acht ist? (4 + 3 Punkte)

Aufgabe 4 Der Gebrauchtwagenverkäufer G aus H ist der Ansicht, dass es ihm gelingt, jedes Auto an den Mann bzw. an die Frau zu bringen. Es stellt sich heraus, dass ihm das tatsächlich mit einer Wahrscheinlichkeit von 70% gelingt. Am heutigen Tag rechnet G damit, dass 10 potenzielle Käufer seinen Laden besuchen. Es sei X die Anzahl verkaufter Gebrauchtwagen an diesem Tag. a) Wie ist X verteilt?

(2 Punkte)

b) Mit welcher Wahrscheinlichkeit verkauft G i)

mehr als drei Fahrzeuge?

ii) genau fünf Fahrzeuge?

(2+2 Punkte)

290

c)

Musterklausuren

Wie wahrscheinlich ist es, daß er im Verlauf des Tages i)

4 Fahrzeuge nicht verkauft bekommt, bevor er im 5. Versuch dann erstmals einem Kunden ein Fahrzeug verkauft? (2 Punkte)

ii) mindestens 3 Fahrzeuge nicht verkauft, bevor das erste Auto verkaufen kann? (2 Punkte) d)

Mit wievielen nichtverkauften Fahrzeugen vor dem ersten Vertragsabschluss kann G im Mittel rechen? (2 Punkte)

e)

Vor ca. 12 Jahren -zu Zeiten der Wiedervereinigung- kamen im Schnitt 100 Personen pro Tag um einen gebrauchten Wagen zu erwerben. i)

Wie war die Anzahl der verkauften Fahrzeuge damals verteilt?

(2 Punkte)

ii) Mit welcher Wahrscheinlichkeit verkaufte er damals mindestens 60 aber höchstens 80 Fahrzeuge? (2 Punkte) f)

Aufgrund der im Jahr 2002 geänderten GewährleistungsansprUche ist für G die Wahrscheinlichkeit ein Fahrzeug zu verkaufen deutlich gesunken. Gleichzeit hat er seinen Werbeaufwand stark erhöht, so dass eine große Zahl potenzieller Käufer zu erwarten ist. Er rechnet damit, dass er pro Tag nun lediglich 2 Fahrzeuge verkaufen wird. i)

Wie ist X nun verteilt?

(2 Punkte)

ii) Wie wahrscheinlich ist es, daß G an einem Tag so viele Autos verkauft, wie er vor der Gesetzesänderung im Durchschnitt verkauft hat? (2 Punkte)

Aufgabe 5: a)

Der Bildungsminister eines Landes möchte gerne nähere Kenntnis Uber die durchschnittliche Studiendauer der BWL-Studenten haben. Er beauftragt drei unabhängige Wissenschaftler, welche ihm darüber Auskunft geben sollen. Diese drei Wissenschaftler gehen mit sehr unterschiedlichen Vorstellungen an ihre Aufgabe heran: i)

Wissenschaftler 1 befragt die 10 ehemaligen Studenten in seinem Institut. Er geht dabei davon aus, daß die Studiendauer in der Grundgesamtheit den Erwartungswert E(X) = 13 und die Varianz V(X) = 4 besitzt.

ii) Der zweite Wissenschaftler liess ebenfalls 10 Studenten befragen. Er geht von einem Erwartungswert von E(X) = 12 und einer Varianz von V(X) = 16 aus. Er vermutet weiter, dass die Studiendauer normalverteilt sei. iii) Der Dritte im Bunde vermutet einen Erwartungswert E(X) = 13. Er liess 50 Studenten befragen und erhielt eine geschätzte Standardabweichung von 5 Semestern. Wie groß ist bei diesen drei Vorgehensweisen jeweils die Wahrscheinlichkeit, dass die durchschnittliche Studiendauer zwischen 11 und 15 Semestern liegt? (3 + 3 + 3 Punkte) b)

Der Minister beauftragt seinen Mitarbeiter, die Ergebnisse des zweiten und dritten Wissenschaftlers nochmals genauer zu "durchleuchten", da er nämlich nicht glaubt, dass sich die beiden Ergebnisse tatsächlich unterscheiden. Der zweite Wissenschaftler erzielte bei seiner Umfrage einen Mittelwert von x 2 =12 Semestern (CT2= 1 6 ) und der dritte

Musterklausuren

291

Wissenschaftler ermittelte eine durchschnittliche Studiendauer von x 3 =13 Semestern in der Stichprobe. Testen Sie zum Niveau a = 0,05 ob der Unterschied in den beiden Stichprobenergebnissen signifikant ist. (4 Punkte) c)

Die Automobilmarke XYZ fuhrt Crashtests durch um die als normalverteilt angenommenen Reparaturkosten bei einem Frontalaufprall mit 15km/h zu schätzen. Bei 10 Crashtests erhiel man die folgenden Reparaturkosten: 300, 800,1440,1000,1860,150,400, 720, 500, 930 i)

Ermitteln Sie ein 95%-Konfidenzintervall für den Wert in der Grundgesamtheit. Benutzen Sie für die Berechnung der Stichprobenvarianz folgende Formel: a2=-L-£(Xj-x)2

(5 Punkte)

ii) Wie lautet das Ergebnis, wenn bekannt ist, daß die Schadenssumme normalverteilt ist mit einer Standardabweichung von a = 500 ? (2 Punkte)

Aufgabe 6: a)

Gegeben sei die zweidimensionale Funktion f(xy) = j f x 2 y

[ 0 i)

fiir0 x5511111(1

-

° - y -

2

sonst

Man zeige, dass f(xy) tatsächlich eine Dichte ist.

(2 Punkte)

ii) Wie wahrscheinlich ist es, dass X größer als 0,5 ist?

(2 Punkte)

iii) Sind die Zufallsvariablen X und Y stochastisch unabhängig?

(2 Punkte)

b) In einer Stichprobe von n=125 Colatrinkem gaben 68 an, dass sie Coca Cola gegenüber Pepsi Cola bevorzugen. i)

Weist dieses Ergebnis darauf hin, dass eine Mehrheit in der Bevölkerung Coca Cola bevorzugt? Das Signifikanzniveau soll dabei auf 5% festgelegt werden. (4 Punkte)

ii) Wie groß müsste der Stichprobenumfang gewählt werden, damit das obige Ergebnis signifikant zum Niveau 5% wäre? (2 Punkte) iii) Wie groß ist die Wahrscheinlichkeit ß für den Fehler 2. Art für Hi: 7t=0,544? (3 Punkte) c)

Die Zufallsvariablen Xi und X2 sind identisch verteilt mit E(X) = n = E(Xi) = E(X2) = 20 und V(X) =CT2= V(Xi) = V(X2) = 30. Ermitteln Sie die Varianz der Zufallsvariablen -

Z, = X, + x 2

-

Z2 = 2X

Was fällt Ihnen auf? Was ist der Unterschied zwischen Z\ und Z2?

(5 Punkte)

292 Muslerklausvren

Nachklausur WS 02/03 Aufgabe 1: a)

Der kleptoman veranlagte K aus E verlässt ein Kaufhaus mit einer Wahrscheinlichkeit von 60%, ohne seine Waren zu bezahlen (Ereignis D). Das elektronische Sicherheitssystem des Kaufhauses reagiert auf diese Aktion allerdings in 90% der Fälle mit einem Alarm (Ereignis A). In fünf Prozent der Fälle kann es allerdings vorkommen, daß das Alarmsystem fälschlicherweise Alarm schlägt. i)

Sind die Ereignisse A und D unabhängig?

(1 Punkt)

ii) Wie groß ist P(A)?

(2 Punkte)

iii) Bestimmen Sie P( A n D) und P( A u D)!

(2 Punkte)

iv) Beim Verlassen des Kaufhauses ertönt ein Alarm. Wie wahrscheinlich ist es, daß K die Waren trotzdem (ausnahmsweise) bezahlt hat? (2 Punkte) b) Für eine Reisegesellschaft aus sieben Personen sind in einem Hotel zwei Doppelzimmer und ein Dreibettzimmer reserviert worden. i)

Wieviele Möglichkeiten existieren, um die 7 Personen auf die drei Zimmer aufzuteilen? (2 Punkte)

ii) Auf wieviele Arten können die Zimmer belegt werden, wenn in der Reisegesellschaft zwei Personen sind, die auf keinen Fall im gleichen Zimmer untergebracht sein wollen? (3 Punkte) c) Die Zufallsvariable X habe den Erwartungswert n = 80 und eine unbekannte Standardabweichung o. Welchen Wert hat die Standardabweichung, wenn bekannt ist, dass gilt: P(75 < X < 85) > 0,9 (3 Punkte) d) Zwei faire Würfel werden geworfen. Die Zufallsvariable X ist das Minimum der beiden geworfenen Augenzahlen. Bestimmen Sie die Wahrscheinlichkeitsfunktion, sowie Erwartungswert und Varianz von X! (5 Punkte) Aufgabe 2: a)

Eine wissenschaftliche Studie wollte klären, ob der Konsum von Marihuana in jungen Jahren ein Indikator für spätere Drogen- bzw. Alkoholprobleme ist. Zu diesem Zweck wurden 311 australische Zwillingspaare betrachtet (n=622), welche sich dadurch unterschieden, dass jeweils einer der beiden im Alter von 17 Jahren schon Marihuana konsumiert hat und der andere nicht. Von den Personen, welche schon im Alter von 17 Jahren Marihuana geraucht hatten gaben 42,8% an, dass sie heute alkoholabhängig sind (pi). In der anderen Gruppe betrug dieser Anteil 29,6% (P2). Die beiden Stichproben sind als unabhängig zu betrachten. (Quelle: Lynskey, M. et.al (2003): Escalation of Drug Use in Early-Onset Cannabis Users vs Co-twin Controls, Journal of the American Medical Association, vol. 289/4) Deuten diese Unterschiede darauf hin, dass Marihuana-Konsumenten später häufiger alkoholkrank werden? (a = 0,05) (4 Punkte)

Musterklausuren

293

b) Zur Schätzung des Kontostands der Haushalte einer Großstadt soll eine Stichprobe vom Umfang n=1000 gezogen werden. Die Haushalte lassen sich in zwei Schichten einteilen: • •

Schicht 1 = Haushalte mit hohem Kontostand (Ni = 4000) und Schicht 2 = Haushalte mit niedrigerem Kontostand (N2 = 20000).

Es ist bekannt, dass der durchschnittliche Kontostand der ersten Schicht neunmal so groß wie der durchschnittliche Kontostand in der zweiten Schicht ist. Weiterhin gilt: a, = . i) Wie muss die Stichprobe auf die einzelnen Schichten aufgeteilt werden, wenn die Aufteilung aa) proportional bb) optimal vorgenommen werden soll?

(6 Punkte)

ii)Um wieviel ist die Varianz bei optimaler Schichtung geringer als diejenige bei proportionaler Schichtung? (5 Punkte) c) Der Besitzer eines kleinen Kinos möchte genauere Informationen über den Auslastungsgrad seines Kinos bekommen. Das Kino fasst 250 Besucher. Zu diesem Zweck ermittelt er die Anzahl der täglichen Kartenverkäufe. Diese besitzen den Erwartungswert n und die Varianz a 2 . Die täglichen Beobachtungen sind dabei als unabhängig zu betrachten. i) Bestimmen

Sie

Erwartungswert

und

Varianz

des

mittleren

grades F ^ E ^ s o )

Auslastungs(4 Punkte)

ii) Was können Sie über die Stichprobenverteilung des mittleren Auslastungsgrades sagen, wenn der Stichprobenumfang größer als 30 ist (Begründung)? (1 Punkt) Aufgabe 3: a)

Eine faire Münze wird drei Mal geworfen. • • i)

Die Zufallsvariable X nimmt den Wert 1 an, wenn im ersten Wurf Zahl geworfen wurde, ansonsten den Wert 0. Die Zufallsvariable Y ist gleich der Anzahl der Würfe. Bestimmen Sie den Stichprobenraum Q!

(1 Punkt)

ii) Geben Sie die Wahrscheinlichkeitsfunktion für X und Y an!

(4 Punkte)

iii) Wie lautet die gemeinsame Wahrscheinlichkeitsfunktion f(xy)?

(2 Punkte)

iv) Sind X und Y stochastisch unabhängig? v) Bestimmen Sie die Kovarianz zwischen X und Y!

(1 Punkt) (4 Punkte)

b) i) In einem Kartenspiel befinden sich 16 rote und 16 schwarze Karten. Wie groß ist die Wahrscheinlichkeit, im zweiten Zug eine schwarze Karte zu ziehen aa) bei Ziehen mit Zurücklegen? bb) bei Ziehen ohne Zurücklegen?

(2 Punkte)

ii) Wie wahrscheinlich ist es beim Zahlenlotto '6 aus 49' die Zahlenfolge 1,2,3,4,5,6 zu ziehen im Vergleich zur Zahlenfolge 13,25,26,31,47,49? (2 Punkte)

294

Musterklausuren

c) Beim Roulette existieren 18 schwarze (S) und 18 rote (R) Felder und die Null (grün): i) Wie groß ist die bedingte Wahrscheinlichkeit P(R2i|R2oRi9-Ri). d.h. dass die Kugel in der 21sten Runde auf 'Rot' fällt, wenn sie bereits in den vorherigen 20 Runden auf Rot gefallen ist? (2 Punkte) ii) Welches Folge besitzt die größere Wahrscheinlichkeit: 'RSRSRSRSRS'?

'RRRRRSSSSS' oder (2 Punkte)

Aufgabe 4 Student S möchte anlässlich des Bestehens der Statistik II Klausur eine kleine Party im engsten Freundeskreis geben. Beim dafür unerlässlichen Bierkauf steht er vor der Wahl zwischen „Castroper Urquell" und „Wattenscheider Pilsener". Er beschließt das in der Vorlesung Gelernte anzuwenden und das Problem statistisch zu lösen. Aufgrund eines Anrufes bei den Brauereien weiß er, dass die Abfüllanlage von „Castroper" normalverteilt mit |ix =0,5 (Litern) und a* =0,01 arbeitet, während der Abfüllmenge des „Wattenscheiders" eine Normalverteilung mit ny = 0,5 und a2y = 0,0064 zugrundeliegt. a) Wie groß ist die Wahrscheinlichkeit, dass i)

eine Flasche „Castroper" mehr als 0,52 Liter Bier enthält?

ii) ein Kasten (20 Flaschen) „Wattenscheider" höchstens 10,36 Liter enthält?

(2 Punkte) (3 Punkte)

iii) Wenn S von jeder Biersorte einen Kasten (also je 20 Flaschen) kauft, wie groß ist dann die Wahrscheinlichkeit im Schnitt mehr als 0,51 Liter pro Flasche zu erhalten? • (3 Punkte) b) S weiß, dass auf jeder Party schon einmal eine oder mehrere Flaschen zu Bruch gehen können (und so das Pfandgeld verloren geht). Wenn die Wahrscheinlichkeit dafür pro Flasche bei 0,01 liegt, wie groß ist dann die Wahrscheinlichkeit, dass von 40 Flaschen höchstens eine zu Bruch geht? (2 Punkte) c) Die Partys von S gelten in der Nachbarschaft als sehr „gesittet". Das Ereignis, dass die Polizei auftaucht und um Ruhe bittet, kann daher als poissonverteilt mit X = 0,2 angesehen werden. Wie groß ist die Wahrscheinlichkeit, dass bei der nächsten Party die Polizei höchstens einmal anschellt? (2 Punkte) d) Mediziner M, der ebenfalls auf der Party ist, schreibt seine Doktorarbeit über Blutalkohol. Er bittet neun der anwesenden Gäste am Ende der Feier zur Blutprobe und stellt fest, dass sechs von ihnen einen Blutalkoholpegel von über 0,5 Promille (relative Fahruntüchtigkeit gem. § 24a StVG in der Fassung des StVRÄndG vom 19.03.01) haben. Berechnen Sie ein 95%-Konfidenzintervall für den Anteil der Gäste, die fahruntüchtig sind. (4 Punkte) e) Als Faustregel gilt, dass ein Mann von 180 cm Körpergröße und 80 kg Gewicht innerhalb einer Stunde 2 Liter Bier trinken muss um einen Blutalkoholgehalt von 1 Promille zu erreichen. In einer Versuchsreihe von 25 Testpersonen wurde ein durchschnittlicher Blutalkoholgehalt von 0,98 Promille bei einer Standardabweichung von 0,1 Promille gemessen. Widerspricht dieses Ergebnis der Faustregel? Führen Sie zur Beantwortung dieser Frage einen Test zum Niveau a = 0,05 durch. (4 Punkte)

Musterklausuren 295

Aufgabe 5 a) Aufgrund einer Stichprobenuntersuchung mit n = 100 wurde für den Erwartungsweit |i einer Zufallsvariable X das 95%-Konfidenzintervall (Ziehen mit Zurücklegen, bekannte Varianz) 480,4 < n < 519,6 ermittelt. i) Bestimmen Sie x undCT2.

(4 Punkte)

ii) Welcher Stichprobenumfang n ist mindestens zu wählen, damit der absolute Fehler des Intervalls höchstens e = 5 beträgt? (2 Punkte) b) Es seien X 1( X 2 ,...,X n unabhängige Zufallsvariablen mit E(X|)=n und V(X i ) = a 2 . Für die Schätzung des Erwartungswertes (i werden folgende Stichprobenfunktionen vorgeschlagen A,=i(XI+X4+2X6) 4

A2=X,-X2+X3

i) Sind die beiden Schätzer erwartungstreu und/oder konsistent?

(8 Punkte)

ii) Welche der Schätzfunktionen ist effizienter?

(2 Punkte)

c) Bei einer Maschine gibt es einen Schalter, der die Einstellungen „A" und „B" haben kann. Dummerweise ist dieser Schalter abgebrochen, so dass die aktuelle Einstellung nicht zu erkennen ist. Es ist allerdings bekannt, dass folgende Wahrscheinlichkeiten für die Variable X = Anzahl der Ausschussstücke pro Stunde gelten: Bei Schalterstellung A: Xj

0

1

2

P(X = Xj)

1/3

1/3

1/3

Xi

0

1

2

P(X = Xi)

0,6

0,3

0,1

Bei Schalterstellung B:

Ein Ingenieur beobachtet die Maschine vier Stunden lang und stellt folgende Anzahl an Ausschussstücken pro Stunde fest: Stunde

1

2

3

4

Stücke

0

2

0

1

Ermitteln Sie die Stellung des Schalters mit Hilfe der Maximum-Likelihood-Methode. (4 Punkte)

296

Musterklausuren

Aufgabe 6 a) Kreuzen Sie bitte an, welche der folgenden Aussagen richtig oder falsch sind (10 Punkte) Hinweis: Für richtig gesetzte Kreuze gibt es einen Punkt, für falsch gesetzte Kreuze wird ein Punkt abgezogen. Ergibt die Summe aus richtig undfalsch gesetzten Kreuzen einen negativen Wert, wird die Aufgabe mit „ null Punkten " bewertet. richtig 1 2

Eine Dichtefunktion kann größer als eins werden. Die Varianz einer relativen Häufigkeit p beträgt a* = ——— n

3

Der Mittlere quadratische Fehler (MSE) lässt sich gem. Formel 7.5a in die Varianz des Schätzers 9 und den quadrierten Bias zerlegen. Gemäß dieser Zerlegung teilt man nicht-erwartungstreue Schätzer in „varianzverzerrt" und „biasverzerrt" ein.

4

Es seien die Zufallsvariablen X|,...,X n binomialverteilt, X n+ |,...,X m hypergeometrisch verteilt und Xm+1,...,X|00 geometrisch verteilt. 100 Außerdem seien alle Zufallsvariablen unabhängig. Dann ist i-i approximativ normalverteilt.

5

Eine Potenzmenge kann eine Sigma-Algebra sein. Umgekehrt kann eine Sigma-Algebra aber niemals eine Potenzmenge sein.

6

Unabhängige Ereignisse sind niemals disjunkt.

7

Das KolmogorofFsche Axiom der Volladditivität gilt nicht, wenn für den Stichprobenraum Q eine vollständige Zerlegung vorliegt.

8

Die Wahrscheinlichkeit ß einen Fehler 2. Art zu begehen ist umso größer, je näher Ho und H| beisammen liegen.

9

Sind zwei Zufallsvariablen normalverteilt, dann ist auch ihr Produkt normalverteilt.

10

Gilt für die k Schichten einer Grundgesamtheit n, = n 2 =... = n k , dann tritt beim Ziehen einer geschichteten Stichprobe kein Schichtungseffekt ein.

falsch

Musterklausuren

297

b) Eine stetige Zufallsvariable X habe die folgende Dichtefunktion — 10 f(x)= . ± . ( l 0 - x ) 0 i)

für0 1)?

ii) Bestimmen Sie den Erwartungswert und die Varianz von X!

um eine (2 Punkte) (2 Punkte)

Lösungen zu den Musterklausuren

Lösuneen zu den Musterklausuren

Hauptklausur WS 01/02 Aufgabe 1 a) i) subjektiver Wahrscheinlichkeitsbegriff ü) Z

1) 2) 3) 4)

Z

I

G

0,2

0,2

0,4

G

0,5

0,1

0,6

S

0,7

0,3

1

P(GNZ)=0,l P(G U Z) = P(G)+ P(Z)- Più N Z) = 0,4 + 0,7 -0,2 = 0,9 Più U Z) - P(G N Z) = 0,9 - 0,2 = 0,7 1 - P(G N Z) = 1 - 0,2 = 0,8

iii) 1)

2)

G

z

iv) P(G n Z ) = 0,2 * P(G)P(Z) = 0,4 • 0,7 = 0,28 b)

P(T|E)= 0,9, P(T|Ë)= 0,3, P(E)= 0,6 i) P(T) = P(T|E)>(E)+ P(T|E)>(E) = 0,9 • 0,6 + 0,3 • 0,4 = 0,66 i 'i V ) pI( /E | T ) p(T) = l £ ! ! Ä 0,34 M^

=

o,,8

305

306

Lösungen zu den Muslerklausuren

Aufgabe 2 a) Y = X , + X 2 i) Stichprobe (i;i)

Geldsumme 2

(1;2);(2;1)

3

(1;5);(5;1)

6

(2;2)

4

(2;5); (5;2)

7

(5;5)

10

1

Wkt. 1 1

3 3~ 9 2- — - — = —

3 2

3

2 - - - —= — 3 6 9 1 1 _1 2 2 4 2.11 = 1 2 6 6 1 1 _ 1 6 6 ~ 36

\ 9 _1 3 l

4 f(y)

1

9 l

6 — 36 0

y=2 y=3 y=4 y=6 y=7 y = 10 ' sonst

ii) Stichprobe (1;1)

Geldsumme 2

(i;2)

3

(2;D

3

d;5)

6

(5;i)

6

(2;2)

4

Wkt. 1 1 1 3 5 15 1 3 3 3 3 6 1 3 1 6 1 2

5 15 2 6 5 30 1 1 5 15 2 2 5 30 2 2 5 10

Lösuneen zu den Musterklausuren

(2;5)

7

1 1 _ 1

(5;2)

7

2 5 ~ 10 1 3_ 3

302

6 5 "30

f(y)=

15 2 5 1_ 5 2_

15 l

5 0

y=2 y=3 y=4 y=6 y=7

sonst

b) Verlauf ist möglich, da das schwache Gesetz nur sagt, dass die Annäherung zwischen relativen Häufigkeiten und Wahrscheinlichkeiten mit Wahrscheinlichkeit erfolgt (also nicht sicher ist). c) 0 nMini =10 nM , = 20 n Maxi = 20 .=10

" ) nMini

4 »•4 _6_ 6 - = 60 • — = 8,9 « 9 = 60- N N N N 4,5 —-4 + —-4 + —--5 + —--5 6 3 3 6

n

Nonml = 60--^- = 17,8 «18 4,5

n ^ = 6 0 - ^ = 22,2 « 2 2

^ = 6 0 - ^ = 11,Uli iii) Minimierung der Varianz des Schätzers V(x) min u.d.R. =n

Lösungen

308

zu den

Musterklausuren

Aufgabe 3 a) i)

Erwartungstreue

\

2 _1 n 2J ~ 2 X

E(Ä,)=E

i2 f i In, L

+E

-E(x,)+—E(x a )

\

1 : 27t s —n,7t +—n,7t 27t n n 2 Vi Konsistenz 1. Schätzer muss mind. asymp. e-treu sein —> erfüllt 2. Varianz /

V(Ä,) = V

"l iL + i l 2

-

\

_1 ~4

_ 1_ ~4

/

\

/

+ v h.

V

-^-n,7t(l - ti)+ -^-n27c(l - 7t) i7t(1-n)HL±Ih

=

4

n,n 2

Wenn n,,n 2 >1 strebt der Nenner des Bruchs schneller gegen unendlich als der Zähler, also ist lim V(ü,) = 0 - » ft, ist konsistent ii)

Erwartungstreue E(Ä 2 )=E

n,+n2j

t

= !(E(X,)+E(X2))

n

= — (n,7t + n2 n) = — (n. + n2 = — nrc = 7t —> 7t, ist erwartungstreu n n n Konsistenz 1. Schätzer muss mind. asymp. e-treu sein -> erfüllt 2. Varianz v ( f t j ) = v i ^ i ^ l = - VV(x, + x 2 )= - L M l - 7t) + n27t(l - 7t)] = ^(n1 + n2>t(l-) = ^ n n lim V(Ä2) = 0 -> Ä, ist konsistent b)

LW( N ) = I . I N N N

1

2

3

4

5

6

7

L(N)

0

0

0

1/16

1/25

1/36

1/49

Lösunsen zu den Muslerklausuren

309

Die Likelihoodfunktion ist für N > 4 streng monoton fallend. Daher lautet der MLSchätzer N = 4. c) Kombination mit Wiederholung n+ i-r '7+2-r

,> >

, 2 , 3-J Folgende Dominosteine haben eine Augensumme größer acht: (3;6), (4;5), (4;6), (5;5), (5;6), (6;6) Die Wahrscheinlichkeit ist also — = 0,214 28 Aufgabe 4: a) X: Anzahl der verkauften Automobile X~B(n=10; n = 0,7) b) i) P(x>3) = 1 - P(x < 3) = 1 - [f(0)+f( 1 )+f(2)+f(3)] = 1 - 0,0106 = 0,9894 ii) P(x=5) = f(5) = 0,1029 c)

Y: Anzahl der nicht verkauften Automobile vor dem ersten Erfolg Y~G(*=0,7) i) P(y=4) = f(4) = 0,34 0,7 = 0,0057 ii) P(y£3) = 1 - P(y9 ist ii) P(60 < x < 80) = 4.(2,18) = (2,2) = 0,9722 f) i) X~P(2) ii) E(X) aus Aufgabe a) = 10 • 0,7 = 7 P(x=7) = 0,0034 lt. Tabelle! Aufgabe 5: a)

_2 Gesucht: P( 11 < x £ 15), mit E(x) = n und V(x) — n i) n=10, E(X) = 13, V(X) = 4 ^ E 0 0 = 13,V(x) = 1 = 0,4 P(11 1 - ^ j - > 1 - — > 0,9 e ii) n=10, E(X) = 12, V(X) = 16, X~N(12;16)

310

Lösungen zu den Musterklausuren

P(11 < x < 15) = P(- 0,8 < z < 2,4) = F(2,4) - F(-0,8) = F(2,4)-[1-F(0,8)] = 0,7799 iii) n=50, E(X) =13, a = 5 =>x~N[I3;—' 50 P(11 < x < 15) = P(- 2,8 < z < 2,8) = 0,52)= 1 - P ( X < 0,52) Z=^

M = 0,2 0,1 = 1 - P(z < 0,2) = 1 -0,5793=0,4207 ii)

YK = Y, + Yj +... + Y20 ~ N(10;0,128) P(Yk erwartungstreu E(ii 2 ) = E[X, - X 2 + X 3 ] = E(X,) - E(X 2 )+E(X 3 ) = n - n + n = ^ => erwartungstreu Konsistenz Beide Schätzer sind erwartungstreu

v(A1)=v[i(x1+x4+2x6) l[V(Xl)+V(X4)+4V(X6)] = l ( a 2 + a 2 + 4 a 2 ) = A < T 2 = 2 a 2 lim V(|lj) = - a 2 * 0 => nicht konsistent

4u 4

^

Lösungen zu den Musterklausuren

3¿7

V(A2)=V(X1-X2+X3)=V(Xl)+V(X2)+V(X3)=3-a2 lim V(ji 2 ) = 3 • ct2 * 0 => nicht konsistent n-f®

ii) c)

hat die kleinere Varianz und ist somit effizienter

Wert der Likelihood-Funktion für Schalterstellung A: _ 1 1 1 1 1 L= = — = 0,0123 3 3 3 3 34 Wert der Likelihood-Funktion für Schalterstellung B: L = 0,6 0,1 0,6 0,3 = 0,0108 Also: Wert der Likelihood-Funktion für Schalterstellung A ist größer. Schätzer für Schalterstellung ist also „A"

Aufgabe 6 a)

Richtig sind die Aussagen 1 , 2 , 4 , 6 , 8 und 10 Hinweis zu 5.: Potenzmenge und Sigma-Algebra können identisch sein.

b) 1. Dichte ist immer positiv: Für den ersten Abschnitt sowieso gegeben. Für den zweiten Abschnitt auch, weil von dem Wert

immer ein Wert abgezogen wird, der kleiner ist.

2. Integral muss gleich eins sein 1 fJ — d x + f — - — x d x = — X 10 ¡25 25 0 10 _5_

100 _ 100 _ 50

25

"10

25

50

50

25

10 —x 25

1

x

2

50

= 0,5 + 4 - 2 - 2 + 0,5 = 1 ii)

5 1 10 1 E (v x ) = Jf x fv( x ) d x = IJ — x d x + f — x - — x 2 d x = ' ^ „ 10 *25 25 20

25 000 =— + 20 50 iii)

1000

250

75

50

125 , „ c „ „ + — = 1,25 + 20 75 10 —x 25

1 f—dx+ f— - — x d x = —x 25 25 10 =

10

10

25

50

25

50

=

40 3 1

x

10 —x 50

2

5 , 5 + - = 4,583 3

c

2

50

5 - 0 , 3 + 2 , 4 - 0 , 7 2 - 2 + 0,5 = 0,38

1 75

3

x

318

Lösungen zu den Muslerklausuren

Hauptklausur WS 03/04 Aufgabe 1 a) 1 1 f 49 j 10

1 • — = 0,000000007151 13.983.816 10

ii) Für drei Richtige: x ~ H(6,6,49) 2012341 = 0,0177 13.983.816

P(x = 3) =

Für Zusatzzahl: x ~ H(l;3;43)

i3li40l P ( x = l ) = u l ° J = — = 0,0698 '43^

43

v1 Insgesamt: 0,0177 0,0698 = 0,00124 b) i)

Kombination ohne Wiederholung mit n = 10 und i = 6: K=

rio^i

10! = 210 Möglichkeiten, also Kosten in Höhe von 210 0,75 = 157,50€ 6!-4!

v*, ii) Beispiel: getippt wurden die Zahlen 1,2, 3,4, 5, 6, 7, 8, 9,10 gezogen wurden 1,2, 3,4, 11,12 1. Wenn in einem Tipp drei Zahlen richtig sind (z.B. 1, 2, 3), wie viele Tipps gibt es davon, also (1,2, 3, 5, 6, 7), (1,2, 3, 5, 6, 8) usw.? D.h. aus den Zahlen 5 - 1 0 müssen noch drei weitere getippt worden sein, also Auswahl 3 aus 6 ohne Berücksichtigung der Anordnung und ohne Wiederholung: K=

lv

=20

2. Wie viele Möglichkeiten gibt es für die Auswahl 3 aus 4 (ohne Berücksichtigung der Anordnung und ohne Wdh.)? K =

c)

= 4

v3, Macht also insgesamt 4 • 20 = 80 Tipps mit drei Richtigen, x = Zahl der ausgefallenen Triebwerke i)

p ( ^ a ) = p(x < 1 | a ) = 1 - p(x = 2 | a ) = 1 - j j ^ j

ii)

p(s|b)=p(X = o|b)=

= 0,999999

0,01° 0,994 = 0,9606

iii) P(S) = P(S|A)P(A) + P(S|B)P(B) = 0,999999 • 0,7 + 0,9606 • 0,3 = 0,988

Lösungen zu den Musterklausuren

Aufgabe 2 a)

p ( n | e ) = 0,8; P(e) = p ( e ) = 0 , 5 ; p ( E u N ) = 0 , 6 aus P(N|E)=0,8 folgt P ( N n E ) = 0 , 4 aus p ( E u N ) = 0 , 7 folgt p ( n ) = 0 , 3

i)

N

N

Z

E

0,4

0,1

0,5

E

0,3

0,2

0,5

2

0,7

0,3

1

p ( n n E ) = 0,2 (vgl. Tabelle)

ii)

P ( N | E j = ^ - ^ p = ^ = 0,6 p(E) 0,5 iii) subjektiver Wahrscheinlichkeitsbegriff b) i)

O ü)

m \

c)

3

)

iii) leere Menge, da ja bereits B n C nicht existiert, n = rat = 0,4-50 = 2 0 ; a 2 = n j i ( l - j t ) = 5 0 0,4 0,6 = 12 i)

P(15,x,25) = p ( 2 0 - ^ - < x , 2 0 = 1 - 0 , 4 8 = 0,52

ii)

x~N(20;12) P(15^X0)=l-f(0)=36/37=0,9730 iii) P(x