219 16 14MB
German Pages 296 [293] Year 2002
Induktive Statistik Lehr- und Arbeitsbuch
Von Professor
Dr. Georg Bol
3., bearbeitete Auflage
R. Oldenbourg Verlag München Wien
Die Deutsche Bibliothek CIP-Einheitsaufnahme -
Bol, Georg:
Induktive Statistik : Lehr- und Arbeitsbuch / von Georg Bol. Aufl.. München ; Wien ISBN 3-486-27276-4
:
Oldenbourg, 2003
3., bearb. -
-
© 2003 Oldenbourg Wissenschaftsverlag GmbH Rosenheimer Straße 145, D-81671 München Telefon: (089) 45051-0
www.oldenbourg-verlag.de
Das Werk einschließlich aller Abbildungen ist urheberrechtlich geschützt. Jede Verwertung außerhalb der Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Bearbeitung in elektronischen Systemen. Gedruckt auf säure- und chlorfreiem Papier Gesamtherstellung: Huber KG, Dießen ISBN 3-486-27276-4
Vorwort Mit der
„Induktiven Statistik" liegt jetzt auch der dritte Abschnitt einer zwei-
in schriftlicher Form vor, wie wir sie mehrfach an der Fakultät für Wirtschaftswissenschaften in Karlsruhe gehalten haben. Naturnämlich der gemäß baut damit dieser Band auf den beiden vorangegangenen, 1 Statistik" auf. und der Unter die„Deskriptiven „Wahrscheinlichkeitstheorie" sen Bezeichnungen werden sie auch im Text zitiert. Gerade bei der induktiven Statistik ist die Festlegung einer Konzeption und die Stoffauswahl besonders schwierig. Für Studenten der Wirtschaftswissenschaften ist es sicherüch durchaus sinnvoll, nicht so sehr die theoretischen Grundlagen kennenzulernen, als vielmehr einen Einbück in die wesentlichen Punkte statistischer Denkweise und einen Überbück über die diversen Anwendungsgebiete zu erhalten. Interessenten daran seien z.B. an das bewährte Lehrbuch von G. Bamberg und F. Baur verwiesen. Statistische Methoden werden unseres Erachtens in den kommenden Jahren mehr und mehr Einzug in die industrielle Praxis und dort vor allem in den Bereichen der Materialdisposition und Logistik sowie der Quaütätssicherung nehmen. Da diese Gebiete neben anderen wie beispielsweise der Banken- und Versicherungsbereich, in dem statistische Methoden ohnehin unverzichtbar sind, wichtige Einsatzgebiete Karlsruher Absolventen sind, scheint es mir wichtig, ein soüdes Fundament zu legen, von dem aus dann weitere Bereiche der Statistik erarbeitet werden können. Aus diesem Grund konzentriert sich das Buch auf die
semestrigen Vorlesung
-
-
Kerngebiete der induktiven Statistik, nämlich Parameterpunkt-, Parameterbereichsschätzung und Hypothesentests. Vorbereitet wird darauf durch zwei Paragraphen über entscheidungstheoretische Grundlagen, einen Abschnitt über die Grundannahmen der Statistik und einen Paragraphen über Stichprobenfunktionen. Daran schließen sich dann die genannten Gebiete an. Der letzte Paragraph weist auf auf die Beziehungen zwischen Tests und Konfidenzintervallen hin. Zur Überprüfung des erarbeiteten Wissens sind die einzelnen Paragraphen durch Übungsaufgaben ergänzt. Die benötigten Wahrscheinlichkeitsverteüungen, die Lösungen der Übungsaufgaben und einige Tabellen bilden den Anhang. Das Buch ist so konzipiert, daß es als begleitende Lektüre zu einer Vorlesung, aber auch zum Selbststudium geeignet ist. In hohem Maße profitiert bei dem Aufbau der Vorlesung und beim Schreiben dieses Buches hat der Autor von einem vorzüglichen, leider bislang nicht veröffentüchten Manuskript der (ehemaligen
Karlsruher) Kollegen Bernd Goldstein und Volker Steinmetz über Schätztheorie. Zur Ergänzung des Stoffes kann neben dem oben erwähnten Buch vom G. Bamberg und F. Baur als Nachschlagewerk das „Statistik-Taschenbuch" von K. Bosch und für konkrete Anwendungsmöglichkeiten der „Klassiker" von J. Härtung („Statistik") empfohlen werden. Daneben gibt es im Oldenbourg-Verlag, aber auch in anderen Verlagen eine Vielzahl von Büchern zur Statistik, so daß Beide sind in demselben
Verlag inzwischen
in
2.Auflage erschienen.
VI
es
Induktive Statistik
jedem möglich
sein
sollte, „seine" Auswahl
an
Büchern
zu
treffen.
Auch diesmal habe ich zahlreichen Helfern für das Zustandekommen des Buches zu danken: Den Hörern meiner Vorlesungen für zahlreiche Hinweise, wo Ergänzungen hilfreich und Verbesserungen möglich sind, Frau cand. Wi-Ing. Monika Kansy und Herrn Dipl. Ing. Jörn Basaczek für die mühevolle Schreibarbeit, Herrn cand. Wi-Ing. Edgar Hotz für das Erstellen der Abbildungen. Besonders danke ich aber Herrn Dr. Johannes Wallacher, der mit nie versiegender Geduld bei allen Problemen geholfen hat. Außerdem hat er den Großteil der Übungsaufgaben mit ihren Lösungen erstellt. Herrn Weigert und seinen Mitarbeitern im Oldenbourg-Verlag danke ich für die gewohnt gute und freundschaftliche
Zusammenarbeit.
Georg Bol
Vorwort
zur
2.
Auflage
Gegenüber
der 1. Auflage wurden „nur" die bekanntgewordenen Fehler beseitigt. Dies betrifft insbesondere die Achsenbeschriftungen in den Abbildungen A.3 und B.l B.6, aber auch eine Reihe von Schreibfehlern. Die Änderungen
wurden in zuverlässiger Weise von Frau cand. Wi.-Ing. Petra Weth vorgenommen, wofür ich Ihr herzlich danke. Herr Dipl. Wi.-Ing. Wolfganz Weitz danken wir für wertvolle Hinweise bei der Formatierung in I£T£jX. Herrn Weigert und dem Oldenbourg Verlag gilt wie immer mein Dank für die gute Zusammenarbeit. -
Georg Bol
Vorwort
zur
3.
Auflage
Auch die dritte Auflage unterscheidet sich bis auf eine ergänzende Bemerkung in Kapitel 4 nur durch die beseitigten Fehler von den vorangegangenen Auflagen. Hier bin ich meinem Freund und Kollegen Hartmut Kogelschatz aus Heidelberg für Hinweise sehr zu Dank verpflichtet. Auch dem Verlag und insbesondere Herrn Weigert danke ich für die Untersttzung.
Georg Bol
Inhaltsverzeichnis
Vorwort
V
Einführung
1
3
Entscheidungsmodell
1
Das klassische
2
Entscheidungen bei Information über
den
wahren Zustand
22
3
Grundannahmen der Statistik
33
4
Stichprobenfunktionen (Statistiken)
44
5
Erwartungstreue
6
Maximum-Likelihood-Schätzfunktionen
86
7
Intervallschätzungen
08
8
Tests
9
Neyman-Pearson-Tests
zum
61
Schätzfunktionen
Niveau
123
a
134
10
Gleichmäig beste
11
Operationscharakteristik
Tests
zum
Niveau
a
und Gütefunktion
151
171
VIII
Induktive Statistik
beste unverfälschte Tests
12
Gleichmäig
13
Der
14
Beziehungen
p-Wert
183
201
zwischen Tests und Konfldenzintervallen
210
A
Verteilung
B
Weitere
C
Lösungen
D
Tabellen
271
Literaturverzeichnis
274
von
Stichprobenfunktionen
Verteilungen der
Namen- und
Übungsaufgaben
Sachregister
216
226
233
277
Einführung der schließenden Statistik ist es, Schlußfolgerungen aus dem mit statistischen Erhebungen (meist Stichproben) gewonnenen Datenmaterial zu ziehen. Ein typisches Beispiel einer solchen Aufgabenstellung haben wir im Rahmen der Wahrscheinlichkeitstheorie (s. Wahrscheinlichkeitstheorie S. 1) schon erwähnt, nämlich die Beurteilung einer Warenpartie, genauer ihres Ausschußanteils, aufgrund von Stichprobenergebnissen. Dabei kann die Fragestellung sein, einen Wert für den unbekannten Ausschußanteil anzugeben. Da dieser höchstens zufällig ganz genau mit dem wahren Wert überemstirnmt, sprechen wir von einem „Schätzwert" des Ausschußanteils. Will man die Genauigkeit der Schätzung deutlich machen, wird man nicht einen „Punktwert", also eine reelle Zahl als Schätzwert, sondern einen Wert mit der möglichen Abweichung nach oben und unten angeben, also ein Schätzintervaü, in dem der wahre Wert nach dieser
Aufgabe
Schätzung liegt.
Eine andere AufgabensteUung ist es, anhand des Stichprobenergebnisses eine Entscheidung darüber zu treffen, ob die Warenpartie akzeptiert werden soü oder nicht. Man hat also zwei Möglichkeiten, zwischen denen man sich entscheiden muß. Da dies implizit von der Beurteüung des wahren Ausschußanteüs p abhängt, kann man zwei Hypothesen aufstellen:
(z.B. p < po zu vorgegebenem po),
Hypothese
1:
p ist
Hypothese
2:
p ist schlecht
gut
(p > po).
Stichprobe testet man damit, welche der Hypothesen vermutlich richwobei wir das Entscheidungskriterium so festlegen, daß mit möglichst tig ist, Wahrscheinlichkeit niedriger Fehlentscheidungen getroffen werden. Mit der
Mit den drei erwähnten Aufgabenstellungen in diesem Anwendungsbeispiel haben wir die drei wichtigsten Gebiete der schließenden Statistik angesprochen: • • •
Parameterpunktschätzungen, Parameterbereichsschätzungen, Testverfahren.
Bei den Parameterpunktschätzungen geht es wie in dem Beispiel darum, für einen unbekannten Parameter, meist eine der Kennzahlen der Verteilung wie Erwartungswert oder Varianz, eine reelle Zahl als Schätzwert anzugeben.
Entsprechend soü bei Parameterbereichsschätzungen ein Bereich, also eine Teilmenge, in den reellen Zahlen für den gesuchten Parameter benannt werden, wobei hier meist an ein möglichst kleines Intervall1 gedacht ist, derart daß die -
1
Daher auch die
-
Bezeichnung Parameterintervallschätzungen.
Induktive Statistik
2
Wahrscheinlichkeit, daß der wahre Wert nicht getroffen ist, einen vorgegebenen Wert nicht überschreitet.
Bei den Testverfahren ist zwischen zwei sich gegenseitig ausschließenden Hypothesen eine Entscheidung zu treffen. Die beiden Hypothesen müssen dabei aber auch alle FäUe abdecken. Es muß sich also um echte Alternativen handeln.
FragesteUungen aus diesen drei Aufgabengebieten treten in vielen Bereichen der Wirtschaftswissenschaften auf. Vor aüem auch im Bereich der Betriebswirtschaftslehre sind die AnwendungsmögUchkeiten vielfältig. Hier nur einige Beispiele: •
•
•
Bei Einführung eines neuen Produkts werden die Absatzchancen auf einem Teilmarkt geprüft, in der Erwartung, daß man die Ergebnisse auf den gesamten Markt übertragen kann. In der Materialwirtschaft schätzt man die Bedarfsstruktur eines Produkts, um die zukünftige Bedarfsentwicklung beurteilen zu können. Dies dient dann als Grundlage für die Disposition und Lagerhaltung.
Quaütätssicherung liegt das Problem vor, auf der Grundlage von Stichprobenergebnissen zu erkennen, ob sich die Produktquaütät gegenüber bisher so verschlechtert hat, daß Maßnahmen erforderüch sind. In der
Die Zahl dieser
Beispiele
läßt sich
beliebig fortsetzen.
Gemeinsam ist bei aüen drei genannten Aufgabengebieten, daß aus Stichprobenergebnissen Schlußfolgerungen auf eine Grundgesamtheit durchgeführt werden2. Aufgrund dieser Schlußfolgerungen wird dann letztlich eine Entscheidung getroffen. Daher werden wir zunächst einige elementare entscheidungstheoretische Grundlagen behandeln.
2
Man spricht auch
von
statistischer Inferenz.
Das klassische
1
Entscheidungsmodell
entscheidungstheoretischen Betrachtung ist zum einen, eine formale Beschreibung einer Entscheidungssituation zu geben. Es geht also darum, das Wesentliche und allen Entscheidungssituationen Gemeinsame herauszufiltern. Zum anderen besteht die Aufgabe darin, allgemeine Prinzipien einer rationalen Entscheidungsfindung herauszuarbeiten. Man spricht daher auch von normaZiel einer
tiver
Entscheidungstheorie1. Einige der Grundlagen dieser Theorie werden im
folgenden behandelt, da es bei der schließenden Statistik letztlich darum geht, eine Entscheidung zu treffen2.
Betrachtet man das in der Einführung erwähnte Beispiel aus der Quaütätskonso läßt sich jede der Entscheidungssituationen im Rahmen des folgenden abstrakten Modells formulieren.
troüe,
Zunächst noch einmal die
vorgegebene Situation:
Eine Warenpartie mit einem unbekannten Ausschußanteil liegt vor. Sie kann entweder angenommen oder abgelehnt werden3. Die Entscheidung trifft eine Person oder Gruppe mit den entsprechenden Befugnissen. Je nachdem welche Entscheidung mit dem tatsächüchen nicht also dem vermuteten Ausschußanteü zusammentrifft, ist das Ergebnis oder die Konsequenz der Entscheidung unterschiedlich. -
-
Gegeben ist also: •
Menge von Zuständen Z (im Beispiel: die Menge der möglichen oder denkbaren Ausschußanteile: Z Mn | k = 0,1,..., N} bzw. Z
eine
—
[0,1]),
•
eine
-
Menge
ablehnen}), •
von
mögÜchen Aktionen
—
A
(im Beispiel:
A
=
{annehmen,
Menge von mögüchen Ergebnissen E, die bei den mögÜchen Kombinationen von Zuständen und Aktionen eintreten können (im Beispiel kann man etwa davon ausgehen, daß sich das Ergebnis in Geld messen läßt: E = R),
eine
'im Unterschied dazu versucht die beschreibende Entscheidungstheorie, den Entschei-
zu analysieren, wie er tatsachlich abläuft. Die Maxime der Rationalität wird dabei nicht immer eingehalten. 2Eine ausführliche Darstellung der Entscheidungstheorie findet man z.B. in Bamberg/Coenenburg (1992) und Pfohl/Braun (1981). Eine strukturtheoretische Darstellung gibt
dungsprozefl Egle (1975). 3bzw.
es
Entscheidung getroffen werden.
soll eine
AusschuSanteil
in Form eines Schätzwertes oder Schätzbereichs über den
4
Induktive Statistik
•
eine Funktion / : A x Z -4 E, die zu jeder Kombination aus einem Zustand z 6 Z und einer Aktion a € A das resultierende Ergebnis e £ E angibt: e
=
f(a,z).
(1)
Bezeichnungen
1.1
(A, E) heißt Zusfandsraum (Afctionenraum, Ergebnisraum), f heißt i?rgeônisfunktion. Z
Entscheidende, also die Person oder Gruppe mit den entsprechenden Befugnissen, hat nun die Aufgabe, eine „optimale" Aktion zu wählen. Die Beurteilung, ob eine Aktion optimal ist oder nicht, ist nur anhand eines Vergleichskriteriums Der
möglich, das bei zwei vorliegenden Aktionen erkennen läßt, ob eine dieser Aktionen der anderen vorzuziehen ist. Ein solches Vergleichskriterium wird abstrakt durch eine Präferenzrelation beschrieben.
1.2
Definition
Sei M eine Menge. Eine Teilmenge R C M x M heißt wenn R transitiv und reflexiv ist: •
•
(x,y)
Präferenzrelation auf M,
(x,y) £ R und (y,z) £ R=> (x,z) £ R (Transitivität), {x, x) £ R für alle x £ M (Refiexivität). g R wird dabei wie
x
folgt interpretiert:
„ist besser oder (zumindest) gleich gut wie"
y.
Die Transitivität entspricht also der Forderung nach Konsistenz, d.h. wenn x besser oder zumindest gleich gut ist wie y und y besser oder zumindest gleich gut ist wie z, dann ist auch x besser oder zumindest gleich gut wie z. Man schreibt für (x, y) € R auch x > y oder y < x. Gilt weiter {y, x) 0 R oder anders geschrieben y £ x, so sagt man -
„x wird y strikt
vorgezogen"
neben -
x y
y
Das klaasische
Entscheidungsmodell
und schreibt
y y.
Gilt neben
x
auch y y x, äquivalent und schreibt x y. y y
x
so
sagt
5
man, x und y sind
gleich gut oder
~
Bei einer Präferenzrelation R fordert man nicht, daß je zwei Elemente vergleichbar sind. Dennoch kann man Optimalität bzgl. einer Präferenzrelation in sinnvoller Weise charakterisieren. Es bieten sich zwei Möglichkeiten an: 1. Es
gibt kein besseres Element in M,
2. Das Element wird allen anderen vorgezogen.
Mit Hilfe der Präferenzrelation R läßt sich dies wie folgt formulieren:
Eigenschaft 1: gibt kein x € Eigenschaft 2:
Es
m* y
1.3
x
für alle
M mit x
x
y
einem Element m* € M
m*.
€ M.
Definition
m* G M mit Eigenschaft 1 bzgl. R (bzw. schaft 2 heißt bestes oder größtes Element.
1.4
bzgl.
X)
heißt maximal, m* mit
Eigen-
Beispiel
Es sei M die
Menge der Bundesligamannschaften der laufenden Saison, es gelte
in der laufenden Saison nicht gegen y verloren hat. (Handelt es sich hierbei um eine Präferenzrelation?) Ein Verein ist in diesem Sinn der beste, wenn er gegen jeden anderen nicht verloren hat, er ist maximal, wenn es keine Mannschaft gibt, gegen die er beide Spiele, bzw. das Spiel, falls nur ein Spiel x
y y,
wenn x
ausgetragen ist, verloren hat.
Übungsaufgabe
1.1:
Zu Ende der Saison wird zum Vergleich zweier Mannschaften die Europapokalregelung herangezogen (Zwei Mannschaften gelten als gleich gut („äquivalent"), wenn nach der Europapokalregelung eine Verlängerung notwendig geworden
6
Induktive Statistik
wäre) 4. Gibt es einen Unterschied zwischen maximaler und bester Mannschaft? Gibt es auf jeden Fall eine maximale (beste) Mannschaft?
Übungsaufgabe 1.2: Sei < Präferenzrelation auf M. Man zeige: Jedes beste Element auf M
Übungsaufgabe Man definiere
1.5
bzgl.
< ist aucù maximal
bzgl.
0.01
(3)
p < 0.01 p > 0.01
(4)
Im konkreten Einzelfall ist natürlich eine clifferenziertere Überlegung erforderlich, wobei die „Trennquaütät" (hier 0.01) einen anderen Wert haben kann und der Schaden in den vier Bereichen auch noch von p abhängen wird. Es geht hier nur um eine „grobe Betrachtung" der Entscheidungssituation.
Ausgehend von der Prämisse, daß die Aktionen nach den aus ihnen resultierenden Ergebnissen beurteilt werden sollen, erhält man nun eine unmittelbar einleuchtende Forderung an die Präferenzrelation < auf A: Eine Aktion a\, bei der der Schaden bei allen eintretenden Zuständen niedriger ist als bei einer
Aktion 02, sollte bei der Relation < vorgezogen werden. Eine Präferenzrelation, die diese Forderung nicht erfüUt, ist mit der Schadensfunktion offensichtlich nicht
verträgüch. Formal läßt sich diese Forderung durch folgende Definitionen
präzisieren. 1.8
Definition
Sei (A, Z, S) eine Entscheidungssituation. Man sagt, eine Aktion ai dominiert eine Aktion 02, falls
5(oi,z) < S(a7,z)
fürallezeZ
(5)
gilt. GUt darüber hinaus
5(oi, z°) < S(a2, z°) so
sagt man,
1.9
für ein
z° € Z,
(6)
a\ dominiert a2 strikt.
Definition
(Dominanzprinzip)
Sei (A, Z, S) eine Entscheidungssituation. Eine Präferenzrelation < auf A genügt dem
Dominanzprinzip, falls gilt:
Induktive Statistik
10
Dominiert oi € A die Aktion 02 €
A, so gilt 01 ^02.
Genügt die Präferenzrelation -< auf A dem Dominanzprinzip, so kann man für die Bestimmung einer maximalen oder einer besten Aktion die dominierten Aktionen demnach aufler acht lassen.7 Dies ist insbesondere deswegen von Vorteü, weü zur Eliminierung der dominierten Aktionen die genaue Kenntnis der Präferenzrelation nicht erforderüch ist, bzw. diese noch nicht spezifiziert sein muß, es muß nur feststehen, daß sie dem Dominanzprinzip genügt. Der folgende Satz gibt die formale Rechtfertigung: Satz
1.10
Sei (A, Z, S) eine Entscheidungssituation, < eine Präferenzrelation auf A, die dem Dorninanzprinzip genügt. Sei An C A eine Teilmenge von Aktionen mit
folgender Eigenschaft: Zu
jeder Aktion a # Aq existiert
eine Aktion o' €
An, die
o
domi-
niert. Dann
gilt:
1. Gibt
es
eine maximale Aktion in
A,
so
auch in Aq.
2. Eine Aktion a* € A ist genau dann beste in Aq vorgezogen wird:
a*
a
für alle
a
€
(7)
Aq.
Bemerkung
1.11
(a)
y
Aktion, falls sie aUen Aktionen
Bei der Behauptung 1 hat man folgenden Unterschied zu beachten: Betrachtet man die Präferenzrelation < eingeschränkt auf Aq, so bedeutet „a* ist maximal in An", daß es keine Aktion a in Aq gibt, die besser ist als a*, also mit o* -< a; a* ist also zunächst nicht notwendig maximal in A. Behauptung 1 besagt aber, daß es in Aq eine bzgl. A maximale Aktion
gibt. (b) Behauptung 1.(2.) besagt nicht, daß jede maximale (beste) Aktion in Aq hegt. Man überlege sich, welche Eigenschaft die Menge Aq haben müßte, damit dies der Fall wäre.
7 Sollen
alle maximalen oder besten Aktionen bestimmt Man mache sich dies an einem Beispiel klar.
werden,
so
ist dies nicht
zulässig.
Das klassische
Entscheidungsmodell
11
Beweis:
1. Sei oo maximal in A, d.h. es gibt kein a G A mit gibt ai € Ao mit: ai ist maximal in A.
oq. Zu
zeigen ist: Es
Angenommen an £ Ao. Dann existiert ai G Ao, das a0 dominiert. Nach Dominanzprinzip gilt damit ao zi °i Behauptung: ai ist maximal in A. Angenommen es gibt ein o 6 A mit a>~ a\. Dann ist a >- oo wegen der Transitivität von zi im Widerspruch zu „Oo maximal". • Sei o* beste Aktion in A, so gilt a* V a für aüe a G A und damit für dem
2.
a >
•
•
alle a € Aq. Gut a* ^ a für alle a G Ao. Sei o £ Ao, so gibt es ein a\ G Ao, das a dominiert. Nach dem Dominanzprinzip güt dann a\ y o. Da o* y Oi gilt, folgt o* > a. Somit gilt
a*
y a
für aüe
a
(8)
€ A.
Aus diesem Satz ergibt sich, daß die Optimierungsaufgabe gelöst ist, faüs sich die Menge Aq auf ein Element reduzieren läßt, unabhängig davon, welche Präferenzrelation zugrundeliegt, falls sie nur dem Dominanzprinzip genügt. Diese Aktion dominiert dann alle anderen Aktionen und ist damit wegen des Dominanzprinzips beste Aktion.
1.12
Folgerung
Sei Ao
=
{oo} im obigen Satz einelementig, so ist oq
beste Aktion.
Definiton
1.13
Sei (A, Z, S) eine Entscheidungssituation. Eine Aktion a* € A, welche aüe Aktionen aus A dominiert, heißt gleichmäßig beste Aktion. Damit güt dann für alle o € A S (a*, z) < S (a, z) Wie das
für alle
z
G Z.
(9)
Beispiel aus der Qualitätskontrolle zeigt, existiert nicht immer eine gleichmäßig beste Aktion. Offensichtüch dominiert die Annahme der Partie die Ablehnung der Partie nicht und umgekehrt. Dies ist in einer Vielzahl praktischer
Induktive Statistik
12
Entscheidungsprobleme analog: wenigen Fällen.
Eine
gleichmäßig beste
Aktion existiert
nur
in
Der oben bewiesene Satz legt nun für den Fall, daß keine gleichmäßig beste Aktiexistiert, nahe, alle nicht dominierten Aktionen zu betrachten und aus diesen im Einzelfall eine Aktion auszuwählen. Dies wäre insbesondere dann praktikabel, wenn es sich dabei um kleine und überschaubare Mengen von Aktionen handelt. Auch dies ist jedoch in vielen in der Praxis auftretenden Fällen nicht erfüllt. Es erscheint daher sinnvoll, einige Prinzipien zu betrachten, die Präferenzrelationen auf dem Aktionenraum üefern, die dem Dominanzprinzip genügen. Es soUen also allgemeingültige Verfahren angegeben werden, die jede Entscheidungssituation in sinnvoller Weise durch Angabe einer Präferenzrelation auf dem Aktionenraum vervollständigen. Eine Entscheidungssituation (A, Z,S) zusammen mit einer Präferenzordnung auf A, die dem Dominanzprinzip genügt, sei im folgenden Entscheidungsmodell genannt.
on
1.14
Definition
Ein Quadrupel (A, Z, S, X) bestehend aus einer Entscheidungssituation (A, Z, S) und einer Präferenzordnung < auf A, die dem Dominanzprinzip genügt, heißt
Entscheidungsmodell.
Zur Verdeutlichung, was unter einem allgemeingültigen Verfahren zur Konstruktion von Präferenzordnungen auf A verstanden wird, sei zunächst ein Beispiel
betrachtet.
1.15
Beispiel
Gegeben sei eine Entscheidungssituation mit folgender Schadensmatrix
A\Z
Z\
Z max S(a',z) v -
(11)
z£Z
ist. Im
Beispiel gilt dann
max5(oi,z)
5,
maxS(a2,z)
=
3,
max5(a3,z)
4,
max5(a4, z)
=
5.
z
Damit
gilt
02 >- 03 >- Ol
~
04.
Der Vollständigkeit halber sei die Präferenzordnung noch in Form der Teilmenge R C A x A angegeben:
R
=
{(02,02), (02,03), (o3,a3), (o3,Ol), (Ol,Oi), (01,04), (o4, Ol), (04,04), (02,00,(02,04), (03,04)}.
Optimal bei dieser vorsichtigen Verhaltensweise ist in diesem Beispiel die Aktion gilt:
02, für die
max5(o2,z) z&Z
=
min max S (a, z). a€A z£Z
Das so beschriebene Präferenzprinzip heißt daher Minimax-Regel oder nach dem Statistiker Wald8 auch Wald-Regel. Man spricht auch von einer Entscheidungsregel, da ja die Präferenzrelation mit einer optimalen Aktion falls eine solche existiert auch die Entscheidung für eine Aktion üefert. -
-
8Abraham Wald, 1902-1960, jüdischer Mathematiker und Statistiker, vgl. Wald (1945).
Induktive Statistik
14
Definition
1.16 Sei
(A, Z, S)
eine
niert durch a
^o'
Entscheidungssituation.
supS{a,z) zçz
falls
heißt Minimax- oder
>
Die
supS{a',z) zez
Präferenzordnung
; {; k
Mit der Schadensfunktion
c^n \ 5(0'p)
=
5(1,P)
~
=
(8)'
0
v
(9)
(vgl. Beispiel 1.6)
f
(
0 200
p>0.01 p (l-p)
n—
X,-
(5)
««»
1=1
und daraus folgt
P{X
=
x\
E*< *k =
=
n
«=i
(6) E x« ^ k
>=i r»
Exi
=
*
i=l
Damit sieht man, daß die bedingte Wahrscheinlichkeit für ein Stichprobenergebnis unter der Bedingung, daß die Anzahl der schlechten Teile festgelegt ist, unabhängig von p ist. Genauer bedeutet das Ergebnis, daß alle Stichprobenergebnisse mit übereinstimmender Anzahl schlechter Teile gleichwahrscheinlich sind.
Analog wie im Beispiel kann man die bedingten Wahrscheinüchkeiten heranziehen, um zu überprüfen, ob eine Stichprobenfunktion die relevante Information erhält. Bei einer parametrischen Verteilungsannahme (wie im Beispiel) bezieht sich diese Information dann auf den Parameter. Stichprobenfunktionen n
4Für
Xi P(£ «=i
=
k) # 0, d.h.
k
=
0, falls p
=
0 und k
=
n, falls
p-1.
48
Induktive Statistik
mit dieser
Eigenschaft heißen suffizient (erschöpfend)5 für den Parameter. Da t) 0 für die bedingten Wahrscheinlichkeiten benötigt wird, beschränken wir uns in der folgenden Definition auf diskrete Situationen.
P(T(X)
=
Definition
4.5
Sei T der Parameterraum zur Verteilungsannahme W {Py | 7 £ T} einer diskreten Zufallsvariable Y, X (X\,... ,Xn) eine einfache Stichprobe zu Y mit Stichprobenraum X. Eine Stichprobenfunktion T : X —> R* heißt sufficient =
—
bzgl.
7€
T,
wenn
Py(X x\T(X) t) für alle x E X und t € R* mit allein von x und t abhängt8. Der
4.6
(7)
=
=
Py(T(X)
=
t)
0
von
7
unabhängig ist,
also
folgende Satz erlaubt eine leichte Überprüfung auf Suffizienz.
Faktorisierungstheorem von Neyman7 für diskrete Zufallsvariablen
Sei Y eine diskrete Zufallsvariable mit parametrischer Verteilungsannahme W = {F7 I 7 G T}, X der Stichprobenraum einer einfachen Stichprobe X = (Xu...,Xn) zu Y. Eine Statistik T : X -> Rfc mit XT T(X) 8 ist genau dann suffizient bzgl. 7, wenn es eine Funktion =
g
:
XT
x
T
—
R
(8)
und eine Funktion h:X
->
R
=
x)=g{T{x),1)h(x)
(9)
gibt mit
Py{X
(10)
5Der Begriff der Suffizienz geht auf R.A. Fisher (1920) und (1922) zurück. Fisher, R. A., 1890-1962, englischer Statistiker. 6Also Py(X = x I T(X) = t) = Py {X = x I T{X) = t) für 7,-/ € T.
7Neyman, Jerzy, 1894-1981,
amerikanischer Mathematiker und Statistiker.
SXT ist also die Menge der Funktionswerte
von
T.
Stichprobenfuriktionen (Statistiken) für alle
49
£ X.
x
Beweis: 1. Sei T
sufficient,
also
Py(X x\T(X) t)
(11)
=
=
unabhängig von 7, also eine Funktion Dann ist für
h(x)
jedes x
{:
P7(X x\T(X)
{
:=
von x
und t.
£ X mit =
=
T{x))
Py{T(X) T(x)) / 0
für
=
fürP7(T(X)=T(x))=0
(12)
und
g(tn)=Py(T(X) t)
(13)
=
die
gesuchte Darstellung gefunden:
Py{X x) =
= =
2.
Py{X x\T{X) T(x))-Py(T{X) T(x)) (14) h(x) p(T(x),7) =
=
=
•
Umgekehrt sei
P7(X x) =
Dann
gilt für to
£
=
g(T(x), j)h{x)
A"T und
(15)
für alle x£X.
7 € T mit
P7(T(X) t0)?0
(16)
=
für jedes
x
£ X mit
T(x)
=
t0:
Py(X x,T(X) t0) P7(T(X) r0) P7(JT x) P7(T(X) *0) =
P7(X x|T(X) t0) =
=
=
=
=
=
=
Induktive Statistik
50
i£X
E :
T(i)=t0
Py{X i) =
(17) x€X
i€X
x€X
Dieser Ausdruck ist aber wie
g(T(x)n)h{x) E g{T(x)n)h{x) :
T(x)=t0
g{t0,j)h(x) 9(*o,7)h(x) E :
T(2)=f0
h(x) M*) E :
T(ä)=t0
gefordert unabhängig von 7.
Für stetige Verteilungen von Y läßt sich die benutzte Vorgehensweise nicht direkt verallgemeinern, da in der Regel Py(T(X) = t) = 0 ist. Man kann dann mit bedingten Dichten arbeiten und erhält einen analogen Satz für die Dichtefunktion von X.
4.7
Faktorisierungstheorem fallsvariablen
von
Neyman9
für
stetige
Zu-
Sei Y eine stetige Zufallsvariable mit Dichte /y,7,7 € T, T Parameterraum der Verteilungsannahme. Sei X der Stichprobenraum einer einfachen Stichprobe X T
:
X
(X\,...,Xn) zu Y mit der Dichte /xl7. Eine Stichprobenfunktion -* R* mit XT T(X) ist genau dann sufficient bzgl. 7, wenn es eine
=
=
Funktion g
:
XT
x
T
R
(18)
und eine Funktion h :X
-+
R
(19)
gibt mit
fXtJ(x) 9(T(x),j)h(x) =
9s. Neyman (1935).
(20)
Stichprobenfunktionen (Statistiken) für alle
4.8
x
51
€ X.
Beispiel A-exponentialverteilt, dann ist Jy,\{v) Xe~Xy für y > 0 und für die Dichtefunktion fx,y einer einfachen Stichprobe X (Xi,..., Xn) zu Y gilt mit Xi > 0, i 1,..., n:
1. Sei y
—
=
—
n
fx,\(xu...,xn)
=
Y[\e~Xxi
i=\
=
Ane
-*E
0,i
=
n
Xj suffizient
=
«=i
bzgl.
l,...,n und h{x)
=
0
A.
N(/i, er2 )-verteilt, also
/"*-(s)=-vibe"'^
(22)
Dann ist
i
V^ttct2)»
e
1
y/{2na2)n Mit n
der zweidimensionalen n
e
-sVE^-^E^+E"2) «-»
~âsÈ*î *±*> i=1
i=1
e
»
Stichprobenfunktion T(xi,...,x„)
xi> E xi) hängt dieser Ausdruck nur von (E t=l i=l
den Werten der beiden Komponenten der setzt
e
(23)
den Parametern
Stichprobenfunktion
u,er2
=
und
ab. Also
man
h{x)
=
1
(24)
Induktive Statistik
52
und
^>^2)=-jèwe~^e*tle~^ Daraus
a2
ergibt
sich
dann, daß T(x)
n
=
n
I«' E z?) (E «=1 i=l
(25)
suffizient für
u
und
ist.
Hat man eine suffiziente Stichprobenfunktion gefunden, so wird man nur noch solche Entscheidungsfunktionen in die engere Wahl ziehen, die von dem Auswertungsergebnis der Stichprobenfunktion ausgehen. In einem Diagramm hat dies folgende Darstellung:
x,x'-- S(x)
=
6'{T(x))
=
6'{T(x'))
Eine sinnvolle Entscheidungsfunktion muß also bei zwei Stichprobenergebnissen und x' zu Übereinstimmung in den Entscheidungen führen, wenn die Auswertungsergebnisse T(x) und T(x') bei einer suffizienten Statistik T sich nicht unterscheiden. x
Anstelle der Entscheidungsfunktionen 6 : X -¥ A betrachten wir jetzt die Funktionen 6' : XT -> A, d.h. XT ist der neue Informationenraum10 , AT = {5' I 6' : XT -> A} neue Menge der Entscheidungsfunktionen. Durch T wird die Menge A = {S \ ö : X -* A) in sinnvoller Weise auf AT reduziert. Voraussetzung dabei ist, daß T suffizient ist. Die Frage ist jetzt noch, wie man eine suffiziente Stichprobenfunktion findet. Die beiden Beispiele zeigen, daß dabei die Exponentialfunktion in der Dichtefunktion hilfreich ist. Für eine große Klasse von Verteilungen kann man mit Hilfe der Exponentialfunktion eine Gestalt der Wahrscheinlichkeitsverteilung Py(Y = y) bzw. der Dichtefunktion fy^iv) erreichen, bei der das Argument y und der Parameter 7 in Faktoren separiert sind und nur bei einer Exponentialfunktion gemeinsam als Argument erscheinen. Der Einfachheit halber bezeichnen wir auch XT als
Stichprobenraum (bzgl. T).
Stichprobenfunktionen (Statistiken) 4.9 1.
53
Beispiel Poisson-Verteilung
PX{Y y)
=
P\{Y y)
=
=
Xj -e-x
für y = 0,1,2,...
2/*
(26)
Es ist =
e*'nX--e-x
(27)
y-
und mit
a(A)=e-\ h(y)
=
V-
-
6(A)
=
In A,
r(y)=y
(28)
ist
Px(Y y) =
Für eine einfache man daraus
=
a(X)h(y)eb^yl
Stichprobe
Px(X x)
=
=
mit
(29)
Zurücklegen
X
=
(X\,...,Xn)
erhält
n(a(A)M*(*).£*•
so
folgt
und
6a(T(X))
stimmen
E^TiX)) 62(T(X))} Bx[«i(T(X))]-£?x[«a(rW)] -
=
oo =
e-"*
(49)
t
-*(*)) t=o
TT-A* r"
für aüe A > 0. Diese Reihe kann aber nur dann identisch 0 sein für alle13 A > 0, wenn die Koeffizienten Si(t) S2(t) = 0 sind für alle t. Damit ist —
«i
=
«a,
(50)
die Schätzfunktionen stimmen also überein.
4.14
Definition14
Sei X eine Stichprobe zu Y, X sei der Stichprobenraum. Y habe eine parametrische Verteilungsannahme W mit Parameterraum I\ Eine Statistik T : X -> XT
12vgl. Wahrscheinlichkeitstheorie, § 13, Übungsaufgabe 1. 13Wichtig ist, dafi Gleichung (49) für alle A > 0 (genauer
ein offenes Intervall in
erfüllt ist.
^Vollständigkeit von Statistiken wurde eingeführt von Lehmann/Scheffé (1950).
R++)
Induktive Statistik
58
vollständig bzgl. T, wenn für je zwei
heißt
Ey[6l(T(X))] Py[6[(T(X))
=
=
Funktionen
8^,6% : XT —> R aus
Ey[6l(T(X))] für alle 7 6 T Sl(T{X))] l
(51) (52)
=
folgt. Bei einer vollständigen Statistik T sind also die Variationsmöglichkeiten bzgl. einer weiteren Verwendung des ausgewerteten Stichprobenergebnisses T(x) insoweit beschränkt, als durch den Erwartungswert einer Funktion ST : XT -> R auch die Funktion 6T fast sicher festgelegt ist. Damit genügt es dann auch, bei der Beurteüung von Funktionen 6T den Erwartungswert zu betrachten.
Satz
4.15
Stichprobe zur Zufallsvariable Y, parametrige Exponentialfamilie darstellen läßt: Es sei X eine
deren
P-r(Y v) frAv) =
Verteilung
sich als
r-
(53)
Dann ist
(54) eine
vollständige Statistik bzgl. B
=
r
Quader im R
enthält.
Bemerkung
Bedeutung Gleichung (49) Die
(55)
{(M7),---A(7))l7er}cRr
einen offenen
4.16
7, falls
Forderung, daß B einen offenen Quader enthält, wird in Beispiel 4.13 deutlich. Um 5\ 62 folgern zu können, ist
der in
=
Stichprobenfunktionen (Statistiken)
59
erforderlich, daß Gleichung (49) für hinreichend viele A erfüllt
ist. Dies ist finden Parameterraum {A G R | A > 0} erfüllt. Da bei der Poisson-Verteilung 6(A) = In A ist, entspricht dies auch der Forderung an B = {In A | A > 0}.
4.17
Beispiele
1. Im Beispiel der also B
=
Poisson-Verteilung ist 6(A)
=
In A, T
=
{A € R |
{lnA| A>0}=R
A >
0}, (56)
und enthält damit ein offenes Intervall.
2. Für die
Normalverteüung haben wir in Beispiel 4.9 2. eine DarsteUung als 2-parametrige ExponentialfamUie mit
bxili^) Mit T
=
R
ß
=
=
R++
X
,62(/x,o-2)
~
=
^.
=
{(/i, 0} ist
{("2^'^{(0i,A) )l/ieR'\ßi0}
=
0: Ergebnis einer einzelnen Stichprobenziehung ist hier eine positive reelle Zahl, z.B. die Lebensdauer einer Maschine. Sei R++ die Menge der positiven reeüen Zahlen, so ist der Stichprobenraum demnach R"+, die Menge aller Vektoren (x\,..., x„) mit positiven Komponenten. Bildet man analog zur Binomialverteilung den „Stichprobenmittelwert", d.h. das arithmetische Mittel der Stichprobenwerte, so entspricht diese mittlere Lebensdauer der Maschinen dem Erwartungswert \ der Exponentialverteilung. Als Schätzfunktion ergibt sich aus dieser Betrachtung: *(*!,...,*„) (9) =
—I—
=
Erwartungstreue
Schätzfunktionen
63
Entsprechend den drei angeführten Fällen ist es häufig naheliegend, Schätzfunktionen anzugeben, die auch intuitiv sinnvoll und akzeptabel erscheinen. Die Frage, die sich ergibt, ist einmal, ob sie optimal sind im Sinne einer Präferenzrelation im Rahmen der durchgeführten entscheidungstheoretischen Betrachtungen, zum anderen, was für Eigenschaften diese Schätzfunktionen besitzen. Dazu ist dann zunächst zu untersuchen, welche Eigenschaften für Schätzfunktionen wesentüch sind. 5.2
Bemerkung
Eine etwas
aügemeinere Situation liegt in folgenden Beispielen vor:
1. Man schätze den Parameter H und er2. Dann ist
T
=
u
einer NormalVerteilung mit unbekanntem
{(H,cr2) |p.€R, Cr2 >0},
(10)
der Aktionenraum ist
{/* I u € R}. Damit ist
nur
ein Schätzwert für eine
(fi,cr2) gesucht.
(11) Komponente des Parametervektors
2. Man schätze die durchschnittliche Lebensdauer eines Produkts, dessen Lebensdauer exponentialverteüt mit Parameter A ist. Da der Erwartungswert einer Exponentialverteilung j ist, ist also der Funktionswert i?(A) = einer Funktion des Parameters zu schätzen. Dies ist auch bei 1. der Fall, wenn wir t?(u, er2) = u setzen.
^
3. Man schätze die Varianz einer Exponentialverteilung. Die Varianz der Exponentialverteilung mit Parameter A ist p-, d.h. auch hier ist ein Funktionswert /(A) = ji zu schätzen.
Zu schätzen ist in allen drei Beispielen der Funktionswert i?(7) einer Funktion t? : r Ta an der Stelle 7, wobei 7 der wahre Parameter sei. Damit ist dann
T# der Aktionenraum
(12)
und jede Schätzfunktion eine Funktion
6
:
tf-rT*.
(13)
Induktive Statistik
64
Andererseits sind die drei Beispiele auch auf die Eingangssituation zurückman bei 1. a2 als fest, aber unbekannt betrachtet (dann ist r = {u I n € R}) und bei 2. 7 = j als neuen Parameter der Exponentialverteilung einführt, ebenso bei 3. mit 7 = jp. Aus diesem Grund wollen wir uns auf die eingangs beschriebene Situation beschränken.
zuführen, indem
Zur
Beurteüung von Schätzfunktionen benötigen S
wir eine Schadensfunktion
:
A
x
Z
-¥
R,
(14)
:
r
x
T ->
R,
(15)
also hier
S wobei
(16)
5(7,7) den Schaden beim wahren Parameter 7 und der
Entscheidung 7 angibt.
Eine exakte Quantifizierung dürfte in vielen Fällen nicht möglich sein, allerdings wird man sicherüch in allen Fällen von der Abweichung des wahren Wertes 7 von dem Wert 7 ausgehen, für den man sich entschieden hat:
(17)
7-7-
Liegt keine Möglichkeit vor, dies weiter zu spezifizieren, so ist das Quadrat dieser Abweichung deswegen ein vertretbarer Ansatz, weü durch die Quadrierung kleine Abweichungen in ihrer Bedeutung reduziert, große Abweichungen entsprechend verstärkt werden. Durch das Quadrat geht ferner nur noch die absolute Abweichung ein. Dies bedeutet aüerdings auch, daß Über- und Unterschätzun-
bewertet werden. In vielen praktischen Anwendungsfallen ist dies sicherüch nicht den tatsächlichen Konsequenzen entsprechend. Für eine allgemeine Betrachtung des Schätzproblems ist die „quadratische Schadensfunktion" sicher ein sinnvoller Ansatz. gen
5.3
gleich
Bezeichnung
Für T C R wird S
5(7,7)
=
:
T
x
(7-7)3
T
-
R mit
(18)
Erwartungstreue
Schätzfunktionen
65
quadratische Schadensfunktion genannt. Für T C
R*
lautet die
entsprechende Verallgemeinerung k
5((7i,• .7»),(71,.• ,7*)) •
•
•
=
5>< "7i)2-
(19)
Im folgenden woüen wir uns der Einfachheit halber auf den Fall T c R beschränken (Sind mehrere Parameter zu schätzen, so kann man dies auch in einzelne
Schätzprobleme zerlegen).
Sei also S zu T C R die quadratische Schadensfunktion. Zur Beurteilung einer Schätzfunktion 5 : X - T ist also die Zufallsvariable
S(6(X),j) für alle 7 G T Eine
zu
=
(7-S(X))2
(20)
betrachten.
Kenngröße dieser Zufallsvariable ist der Erwartungswert1:
Ey[S(6(X),i)} Ey[(7-ô(X))*}
(21)
=
Bezeichnung
5.4
Sei A = {6 : X T}, T c R, die Menge der Schätzfunktionen2. S eine Schadensfunktion: R
:
T
x
A
:
TxT
-+
R
R mit
R(6,1)=Ey[S(6(X),y)] heißt Risikofunktion zu 5.1st S die quadratische Schadensfunktion, auch einfach Risikofunktion oder mittlerer quadratischer Fehler.
(22) so
heißt R
l7 geht dabei nicht nur in die erste Komponente der Schadensfunktion ein, sondern auch in die Wahrscheinlichkeitsverteilung von X, daher das Subskript 7 bei E. Die eckigen Klammern machen deutlich, dafl zunächst quadriert und dann der Erwartungswert gebildet wird. 'genauer: der £n-£-mefibaren Funktionen, für die der Erwartungswert (22) existiert.
66
Induktive Statistik
5.5
Lemma
Für den mittleren quadratischen Fehler
R{6,7)
=
güt
Är[(7 6(X))*} Vary(6(X)) + (7 Ey[S(X)})2 =
"
-
(23)
Beweis:
E7[(7 S(X))2] -
=
£7[(7 E7*(X) (S(X) EyS{X)))2] -
-
(24)
-
=
S7[(7-B7J(X))a- 2(7-ßT*(X))(J(X)-Ä1tf(jr))+ (*(*)-£7*(X))2]
=
£7[(7
=
-
-E7J(X))3]-2iM(7 Ey6(X))(6(X) EyS(X))]+Ey[{6(X) EyS(X))2] "
-
-
^-E,S(X))2 + Var,(S(X)),
da 7
—
Ejä(X)
eine deterministische Gröfie ist und damit
E7[(7-£7W)(J(X)-£7«5(X))]
. = =
{y-Er5(X))-EJ(5(X)-Br6(X)) (7-W)'W)-W)) 0
(25)
gilt. Das Lemma zeigt, daß sich der mittlere quadratische Fehler zerlegen läßt in zwei Summanden (beide nichtnegativ), wobei der eine das Quadrat der Abweichung des mittleren Schätzwertes vom wahren Parameter angibt, während der andere durch die Varianz mißt, wie sehr die Schätzwerte streuen, d.h. wie „stark" der Schätzwert durch die Zufälligkeit der Stichprobe variiert.
Ziel ist es damit, eine Schätzfunktion 6 zu finden, so daß beide Summanden in ihrem Gesamteffekt (hier also der Summe) mögüchst klein werden.
5.6
Beispiel
Zu schätzen sei der Mittelwert einer normalverteilten ZufaUsvariable Y mit Varianz er2 (fest, aber nicht bekannt) mit einer Stichprobe vom Umfang n. Damit ist T = R. Verwendet werden soll eine lineare Schätzfunktion «J: T»
Sa(xi,---,xn)
=
ao +
J£iaiXi,
a
=
(oo,... ,o„).
(26)
Erwartungstreue
Schätzfunktionen
Als Schadensfunktion wird die
67
quadratische zugrundegelegt.
Dann ist
Ä(M.)
=
Var^Wl + iß-E^iX)})2 n
=
n
^Var^Xil + ^-ao-^aiEMf i=l
Betrachtet
man
das
Optimierungsproblem
n
n
i=l
i=l
Problem,
„optimale" Schätzfunktion
eine
min R{p,6a), erhält man, daß die Minimalstelle u
=
ao und ai
zu
finden, als
(28)
a
so
(27)
i=l
=
...
=
on
=
von u
abhängt, nämlich3
0.
(29)
Da u unbekannt ist und gerade geschätzt werden soll, hilft diese Lösung nicht weiter. Andererseits zeigt dies aber, daß wir keine lineare Schätzfunktion finden können, die für alle u das kleinste Risiko, d.h. hier die kleinsten mittleren quadratischen Fehler, liefert. Denn setzen wir
o*(x) so
=
oo,
(30)
gilt ß(2 + (U-0-u.l)2 a2£a2, =
i=i
d.h. das Risiko ist
i=i
unbekannten Parameter u unabhängig. 3Für diese Werte gilt gerade R(Sa,ß) 0. vom
=
(31)
Induktive Statistik
68
n
Diese linearen Schätzfunktionen
(mit
an
=
0 und
VJ a< t=i
=
1)
haben also die
schöne Eigenschaft, daß das Risiko, also der durchschnittliche Schaden bei häufiger Anwendung, bei quadratischer Schadensfunktion nicht vom unbekannten Parameter abhängt, also für alle relevanten Umweltzustände übereinstimmt. Beschränken wir uns also auf die linearen Sdiätzfunktionen mit dieser Eigenschaft, so werden wir als nächstes versuchen, das Risiko unter all diesen zu minimieren, d.h. die Optimierungsaufgabe 7»
Minimiere
o-^a2
(32)
«=i
unter der
Nebenbedingung
n
J>
=
1
(33)
i=i
lösen. Lösung dieser zu
0l=...
die
Aufgabe ist =
On
=
i,
(34)
n
zugehörige Schätzfunktion lautet Stein,...,xn)
=
-Y]x,-.
(35)
Dann wird also der Stichprobenmittelwert als Schätzwert verwendet. Dies entspricht auch der Vorgehensweise beim Minimaxprinzip. Es gilt nämüch f
n
00
max
R{Sa,n)
=
{
^fX + o2, i=l
£ R durch ihren Erwartungswert fast sicher festgelegt ist, folgt, daß es „im wesentlichen"
7 G T mit T C R
eine erwartungstreue Schätzfunktion für einen Parameter gibt, die die Statistik T benutzt. nur
Erwart ungat reue Schätzfunktionen
75
Satz
5.11
eine Zufallavariable mit parametrischer Verteilungsannahme {P7 I 7 € T}, T C R, X Stichprobenraum zu einer einfachen StichX probe mit Zurücklegen zu Y, T : X -t XT eine vollständige Statistik. Dann T zu T fast stimmen zwei erwartungstreue Schätzfunktionen ôf,5j : XT d.h. aus sicher überein,
Sei 1^
Y
=
Ey[t[(T'X))]
=
7
=
Ey[6?(T(X))] für aüe 7 6 T
(63)
folgt
Py[S1(T(X)) S2(T(X))] =
=
l.
(64)
Satz, dessen Beweis sich unmittelbar aus der Definition der Voüständigkeit ergibt, wird nur die Vollständigkeit der Stichprobenfunktion vorausgesetzt. Ist diese darüberhinaus noch suffizient, so heißt dies, daß die Stichprobenfunktion für die Schätzung auch benutzt werden soüte, denn sie wertet Bei diesem
das Stichprobenergebnis so aus, daß die Information erhalten bleibt und damit das Stichprobenergebnis auf den wesentlichen Kern für den Parameter reduziert wird. Zusammen bedeutet dies, daß es bei einèr voüständigen und sumzienten Statistik im wesentlichen nur eine sinnvolle erwartungstreue Schätzfunktion gibt. Dies wird auch durch den folgenden Satz bestätigt. Bei Vorliegen von suffizienten und voüständigen Sti&probenfunktionen gibt es keine wesentlich verschiedenen erwartungstreuen Schätzfunktionen, die über die Stichprobenfunktion faktorisieren, d.h. bei der der Schätzwert aus dem Wert der Stichprobenfunktion berechnet wird. Dennoch wäre es noch denkbar, daß es eine erwartungstreue Schätzfunktion gibt mit günstigerem Risiko, die nicht über T faktorisiert8. Der Satz von Rao/Blackweü zeigt, daß dies nicht der Fall ist.
5.12
Satz
von
Rao/Blackwell 9
parametrischer Verteilungsannahme W mit Parameterraum r C R, X eine Stichprobe zu Y mit Stichprobenraum X, T : X XT eine suffiziente Statistik. Zu jeder für 7 erwartungstreuen S(hätzfunktion «5 R mit existiert eine Funktion u : XT Sei Y eine Zufallsvariable mit
8Dies wäre ein Widerspruch dazu, daß es sinnvoll ist, die Stichprobenfunktion zu benutzen. 9Rao, Calyampodi Radhakrishna, geb. 1920, indischer Statistiker, vgl. Rao (1945); Blackwell, David, geb. 1919, amerikanischer Statistiker, vgl. Blackwell (1947).
Induktive Statistik
76
ö(x) u(T(x)) ist erwartungstreu für 7, Var-,[5(X)] Vor7[u(T(X))] < Vary(S(X)) und das gilt nur, falls S und S fast sicher übereinstimmen.
1.
=
2.
Gleichheitszeichen
=
Beweis für den diskreten Fall: Sei t 6 XT mit
Py(T{X) t) / 0. =
Da T eine suffiziente Statistik ist, ist die
P(X von
7
=
x
I T(X)
bedingte Verteilung
(65)
t)
=
unabhängig.
Da T suffizient ist, sollte eine sinnvoüe Schätzfunktion bei übereinstimmendem Wert von T auch denselben Schätzwert üefern. Ist dies bei 5 nicht der FaU, so hat 6 noch unnötige Variation, es soüte also möglich sein, die Streuung von S eventuell zu verringern, wenn wir diese Variation beseitigen, indem wir die Schätzwerte in den Bereichen glätten, in denen T konstant ist. Da die Erwartungstreue erhalten bleiben soll, glätten wir in der Art, daß wir in diesen Bereichen den Erwartungswert bilden, also den Erwartungswert von S(X) unter der Bedingung T{X) = t. Sei also
E(6(X) I T{X)
=
t)
=
x:
so
hängt
t€*T:
wegen der Suffizienz
«(*) Dann 1.
=
f
\[
^ à(x)P(X T(x)=t von
=
x\T(X)
T dieser Wert
nur von
E[5(X) I T{x) t]
P-,(T(X) t)jtO
0
sonst
=
=
(66)
t),
t ab. Also sei
=
(67)
güt
6(x)
=
u(T(x))
E,[u(T(X)))
ist erwartungstreu: =
£u(t)P7[r(X) t] £ E[S(X)\T(X) P,(T(a)=t)#0 =
t
t:
für
=
t]Py(T(X) t) =
77
Erwartungstreue Schätzfunktionen
=
=
£P7(TPO
=
*)
£ S(x)P{X T(x)=t
t
x:
t
«:T(x)=t
E *(*)*r(* E x:T(x)=t £o(x)P7(X x) x£X
=
n
=
x\T{X) t) =
'
1
'
(68)
*)
t
=
=
=
Ey[S(X)]
r
=
2.
Varj[6{X)]
=
=
=
>
E7[5(X)-7]2
Ey[6(X)-u(T(X)) + u(T(X))-i]* Ey[S{X) u{T(X)]2 + Vary[S{X)] Vary[6{X)],
(69)
-
da
E7[(6(X) u(T(X)){U{T(X)) 7)] Ey[S{X){u(T(X)) 7)] Ey[u(T(X))(U(T(X)) 7)] -
-
=
-
(70)
-
-
und
Ey[u(T(X))(u(T(X))-y)] =
J2u(t)(u(t)-7)Py[T(X)
=
t]
t
=
=
£(«(*)-7)*rP-(*) *] E W.mn'Jfl £(«(*>E T(x)=t E T(x)=t E («(r(x))-7)o(x)P7(X x) =
=
t
=
=
t
=
x:
z:
e7[o(X)(u(T(a:))-7)]
gilt. Probieren wir das Verfahren
von
Rao/Blackwell an einem Beispiel aus:
(7i)
78
Induktive Statistik
5.13
Beispiel: Poisson-Verteilung n
T(ii,...,x„)
=
VJ Xi «=i
vollständig für den Parameter A. Da Zurücklegen, X\,...,Xn zu Y, Xi identisch
ist suffizient und
für eine einfache Stichprobe mit verteüt ist wie Y, ist
*(*!,...,*„)
(72)
H
=
eine erwartungstreue Schätzfunktion10:
E(Xi) E(Y) =
Wie lautet
=
X.
(73)
u(r)?
Nach Definition ist
u(t)
=
=
E(S(X)\T(X) t) =
£ 6(x)P(X x\T(X) t) T(x)=t £ XlP(X x\T(X) t) T(x)=t £*i £ P(Xi=*i,Xa=*a...X„ =
=
x: =
=
(74)
=
x: =
=
*n
|r(X) *)
x
€ X zusam> 0 für
=
za...x„:2_, Xj=t-xi .=.2
=
53 XlP{Xx X! 0
Der Erwartungswert der Gammaverteilung ist E(Y) = a^. Es sei bekannt, daß 1 ist. Sei X eine einfache Stichprobe mit Zurücklegen zum Schätzen des A Parameters a der Zufallsvariable Y. Ist =
*=
1 -
n
"
V ^—' ti i=i
gleichmäßig beste erwartungstreue Schätzfunktion für a
?
Übungsaufgabe 5.4: In einem Unternehmen soü durch eine Befragung untersucht werden, wie die Arbeitnehmer in der Regel zu ihrem Arbeitsplatz gelangen. Es werden vier verschiedene Möglichkeiten betrachtet: Zu Fuß (0), mit dem Auto (1), mit Nahverkehrsmitteln (2) und Sonstiges (3). Die Wahrscheinüchkeiten für die vier
Möglichkeiten seien ji ist für i
(a)
=
mit i
3
=
0,1,2,3 und £ 7i
=
i=0
0,1,2,3.
1. Bekannt sei, daß 7i > 0
Bestimmen Sie eine
gleichmäßig beste erwartungstreue Schätzfunktion für (7o,7i.72,73)(b) Eine Stichprobe vom Umfang n 15 brachte folgendes Ergebnis: 7=
=
3,1,2,1,1,0,3,2,1,0,2,1,1,0,2, Man berechne den Schätzwert für 7 nach der Schätzfunktion
aus
(a).
6
Maxiraum-Likelihood-Schätzfunktionen1
Einen eher intuitiv begründeten Ansatz büdet ein anderes Verfahren, einen oder mehrere Parameter einer WahrscheinÜchkeitsverteilung zu schätzen. Grundlage der Schätzung ist wieder das Ergebnis einer Stichprobe, es hegen also Meß- oder Beobachtungswerte Xi,...,x„ vor. Die Gesetzmäßigkeit des Zufaus, die dieser Beobachtung zugrunde liegt, kann durch die Wahrscheinlichkeit des Stichprobenvektors X angegeben werden, die wegen der Grundannahmen der schüeßenden Statistik in bekannter Weise vom (unbekannten) Parameter 7 abhängt. Die Maximum-Likeühood-Methode geht letztlich von dem Prinzip aus, den Parameter als Schätzwert festzulegen, bei dem das Stichprobenergebnis x die größte „PlausibiÜtät" hat.
Sei zunächst ein diskretes Problem diskrete Zufallsvariable. Dann ist:
gegeben, der Stichprobenvektor X also eine
die Wahrscheinlichkeit für das Auftreten des
P~f(X x) =
Stichprobenergebnisses Das
(1)
x.
Maximiim-Likelihood-Prinzip besagt jetzt:
Py{X x)
Maximiere
=
(2)
über 7 G V
und
wähle die Maximalstelle
6.1
7*
als Schätzwert.
(3)
Beispiel
Gesucht sei die WahrscheinÜchkeitsverteilung einer B(m,p)-verteüten Zufallsvariable, also der Parameter p einer Binomialverteilung:
p(Y Dann ist für das
=
k)
=
(^jpk(i-Pr-h.
Stichprobenergebnis x
pP(x=x)
=
n
=
(xi,..., x„)
(4) :
-p)
'Eine systematische Theorie von Punktschatzverfahren nach dem Maximum-LikelihoodPrinzip (Fisher (1922)) wurde wohl zuerst von R.A. Fisher (1925) entwickelt.
Maximum-L ikelihood- Schât z funkt ionen
nQ-
(i-p)->
=
Dieser Wert ist für p € n stelle ist der Faktor T[
87
[0,1]
(5)
maximieren. Zur
Bestimmung der Maximal(1") ohne Belang, außerdem wird die Aufgabe dadurch »=i erleichtert, daß man den Wert logarithmiert2 (0 < p < 1): zu
'
]
ln[pi-i (l-p)i-i
=
J3*i lap+ (»"»-£**) ln(l-P)-(6) i=l
i=l
Die
Ableitung davon nach p ist: "
"
1
1
53*4--(nm-53*j)—. y
i=l
Setzt
man
dies
(7)
*
«=1
gleich Null, erhält man die Gleichung: Ii
Xi
nm-
fBr53*l74 0.
£ *i Daraus
n
(8)
«
folgt n
-
p
=
~n— Ä 2-, *»
oder
p=
=
nm
——
—x. m
(9)
i=l n
£
Für
n
*«
i=l
• •
«=i
PP(X x) 0 PP(X *)>0
JWegen
nicht.
^ 0 und £ *< # nm ist dies tatsächlich eine Maximalstelle, denn =
=
=
fürp 0 oderp für0 «-1
Xi > 0
für
(34) t
=
l,...,n
Logarithmieren erhält man n
lnfXiX(x)
=
n-hi\ +
(-\y£xi).
(35)
Damit ist
^(ta/xla(*)) £-5>
(36)
^(ln/XiA(x)) -^
bzw.
die Dichte
von
X
R heißt LiJke/i/»ood-F«n*rion zuxEX.
2. Die Maximalstelle 7 der Likelihood-Funktion in
II(7)
=
3. Die Funktion
T, d.h.
maxLI(7), 7€r
heißt Maximum-Likelihood-Schätzwert
probenergebnis
x
€ X.
SMl
MÄML(i)) heißt
(40) (kurz: ML-Schätzwert)
zum
Stich-
X -*T mit =
maxLx(7) 7er
Maximum-Likelihood-Schätzfunktion für funktion). 6.5
(,_Q.;
(41) 7 € T
(kurz: ML-Schätz-
Bemerkung
Im Rahmen dieses Buches betrachten wir nur einfache Stichproben mit Zurücklegen. Das Maximum-Likelihood-Prinzip ist aber natürlich für jede Art von Stichproben anwendbar, wenngleich die Optimierungsaufgabe unter Umständen schwierig zu lösen sein wird. Vorausgesetzt werden muß zunächst nur, daß bekannt ist, wie die Wahrscheinüchkeitsverteilung der Stichprobe vom Parameter abhängt. Dies wird aber schon in der dritten Grundannahme gefordert. Bei einer
Induktive Statistik
94
einfachen Stichprobe mit ders einfach.
Zurücklegen ist
aber die Likeühood-Funktion beson-
Sei nämlich , qY"iy)
/ P7(Y y) *M
{
.
dann
=
Y diskret Y stetig,
=
.
w
güt n
Lx(l)
=
Y[qY,-y(Xi).
(43)
für aüe 7 € T güt, ist wegen der strengen Monotonie der Logarithmusfunktion 7* genau dann MaximalsteUe von Lx(j), wenn 7* Maximalstelle von ln(Lz(7)) ist. Falls
Es
ii(7)
> 0
güt aber
lni,(7)
=
ln[n«K.7(*0]=Eln«»r.'r(af aüEyfaiX)) EyftPO)] + ( v)i7(7)) + a0Fs, (x)i7(j)} =
-
=
-
~
100
Induktive Statistik
Danach wäre dann zu prüfen, ob es eine mtervailschätzfunktion (61,62) gibt, die gleichmäßig beste ist, d.h. für alle 7 G T ein minimales Risiko garantiert. Das Problem bei der Beantwortung dieser Frage besteht sicherlich darin, daß der unbekannte Parameter 7 sowohl als Parameter als auch als Argument der Verteilungsfunktion auftritt. Versucht man aber eine Risikominimierung bei festem 7 in der Hoffnung, daß die Minimalstellen bei allen 7 dieselben Funktionen 5\ und 62 liefern, so erhält man ein Minimierungsproblem, bei dem über Funktionen minimiert wird.
Wegen dieser Schwierigkeiten soü dieser Ansatz hier nicht weiter verfolgt werden. Statt dessen betrachten wir die Möglichkeit für Fehlentscheidungen. Korrekt ist die Intervallschätzung, wenn der wahre Parameterwert im geschätzten Intervall [Si(x),&2(x)] liegt. Demnach haben wir eine Fehlentscheidung, wenn einer der beiden Fäüe
/:7 W) =
7.2
=
!
(12)
Bemerkung
1. Diese Definition fordert implizit, daß P7(7 G [ 1
Beziehung -
a
für alle 7,
Lösung [6i(X),6-t(X)]
(13) =
T
auszuschließen,
(impüzit) verlangt, daß das Gleichheitszeichen für mindestens ein 7 G T güt (siehe z.B. Härtung (1993), S. 130). Die verbale Formuüerung „die Wahrscheinlichkeit, daß 7 im Intervaü liegt, betrage mindestens 1 a" könnte zu der Fehlinterpretation führen, daß 7 die Zufallsvariable ist. Zufäüig (nämüch berechnet aus dem zufälligen —
Stichprobenergebnis)
ist aber das Intervall
[öi(X),02(X)].
Es ist daher
besser, von der Einschlußwahrscheinlichkeit für den wahren Parameter zu sprechen, bzw. von der Wahrscheinüchkeit, daß das Schätzintervaü den wahren Parameterwert überdeckt3. Das Problem bei der Wahrscheinüchkeit
Bestimmung von Konfidenzintervaüen hegt darin, daß die
p7(7e[*i(X)AP0]) svgl. Bamberg/Baur (1993),
S. 161.
(14)
3Obwohl Intervallschätzungen bis auf Laplace zurückgehen, scheint dieser Sachverhalt erstvon Wilson (1927) klar dargestellt worden zu sein (vgl. Lehmann (1993), S. 126). Eine allgemeine Theorie der Konfidenzintervalle und ihre Beziehungen zur Testtheorie wurde von Neyman (1937), (1938) und (1941) entwickelt. mals
103
Intervallschätzungen ohne Kenntnis von 7 berechnet bzw.
7.3
abgeschätzt werden muß.
Beispiel
Eine Maschine stellt Bolzen mit einem vorgegebenem (Soll-) Durchmesser von 10 mm her. Durch Produktionsschwankungen variiert der Durchmesser der einzelnen Bolzen nach den Gesetzen einer Normalverteilung, deren Standardabweichung mit 0.02 bekannt sei. Mit einer Stichprobe vom Umfang 10 soll ein 95%-Konfidenzintervall für den mittleren Durchmesser bestimmt werden, die Meßwerte betragen:
10.00,10.01,10.07,10.05,10.02,9.99,9.96,10.02,10.04,10.08. Als Schätzwert für den Mittelwert verwenden wir
(15)
f) X{ N([i, £)-verteilt ist, ist
i=l
ߧtand(X)
1=1
=
standardnormalverteilt und
normalverteilung
es
(16) gilt für das (1
P(-Ul_j < firtandiX) < tii_j)
=
1
-
-
f )-Quantil ui_ 9 der Standard-
Ct.
(17)
Damit ist
P(i£x nff %=i
*
Jn
und
(19)
104
Induktive Statistik
das gesuchte also
[10.024
-
(1 a)-Konfidenzintervall. -
^=l-96,10.024 ^J1-96] +
Für 1
a
=
-
=
0.95 ist mit ui_^
1.96 —
[10.024 0.012,10.024 + 0.012] (20) [10.012,10.036] -
=
gesuchte 95%-Korifidenzintervall. Da der Sollwert nicht in diesem Intervall liegt, liegt der Schluß nahe, daß die Maschine dejustiert, also nicht korrekt eingestellt ist. das
Verteilt man die Nichtüberdeckungswahrscheinlichkeit nicht gleichmäßig auf beide Seiten des Intervalls (s. Abb.7.1), also beispielsweise auf folgende Weise:
P(p S2(X))
=
^a,
(21)
hat mit 1
n
1
er
"
a
(22)
und
(23)
(24) »=i
das Intervall 1
1
die
n t—>
er
1
1
n
V*
°~
Überdeckungswahrscheinlichkeit a.
Für a = 0.05 ist u1_3a. = «0.9925 = 1-78 und Tabelle Anhang D). Die Intervallbreite ist damit bei
(25)
symmetrischer Aufteilung.
=
u0.9875
=
2.24
(vgl.
4.02-")ai=l
Die
(63)
zugehörige Zufallsvariable dividiert durch a2
£(Xi-V)' (64) ist dann
x2(n)-verteilt (vgl. Anhang A.5.).
114
Induktive Statistik
Mit den
Quantilen x2(n)f
X2(n)i-} gilt dann
£(*-")2
X2(n)?^J^j
>
9Tschebyscheff, Pafnutij, 1821-1894, russ. Mathematiker.
l->
=
l-a
(97)
121
Intervallschätzungen
Ein Problem dabei ist, daß die Varianz er2 meist nicht bekannt sein dürfte und geschätzt werden muß. Ersetzt man in (97) a2 durch einen Schätzwert, so ist die Tschebyscheffsche Ungleichung nicht mehr anwendbar, die Abschätzung ist also in diesem Fall nicht nachgewiesen.
Übungsaufgaben zu §
7
Übungsaufgabe 7.1: Aus früheren Experimenten ist bekannt, daß bei weichung von er 2 auftritt.
Messungen eine Standardab-
—
(a)
Welchen Stichprobenumfang muß man wählen, um den unbekannten Mittelwert mit mindestens 95% Sicherheit auf 0.5 genau durch das arithmetische Mittel zu schätzen (Hinweis: Verwenden Sie die Ungleichung von
Tschebyscheff. ) (b) Welchen Stichprobenumfang muß man in (a) wählen, tungsmaterial normalverteilt ist ?
Übungsaufgabe In einer
händer.
(a)
das Beobach-
7.2:
Stichprobe
von
250 Studenten einer Universität
waren
22 Links-
In welchem Bereich liegt der Anteü p der Linkshänder unter den Studenten dieser Universität mit mindestens 95% WahrscheinÜchkeit? (Hinweis: Verwenden Sie die Ungleichung von Tschebyscheff; ersetzen Sie darin die unbekannte Varianz des Anteils der Linkshänder durch einen
geeigneten Schätzwert.)
(b)
wenn
Bestimmen Sie ein exaktes Konfidenzintervall für p.
Induktive Statistik
122
Übungsaufgabe 7.3: Herstellung eines Spezialteils werden mittels eines Schneidegeräts Rohre zugeschnitten, die eine bestimmt Länge ßo haben sollen. Auch bei fest gewählter Einstellung treten zufällige Schwankungen in der Länge der abgeschnittenen Rohre auf. Aus langjähriger Erfahrung sieht man die Länge der Rohre als normalverteilt an mit dem Erwartungswert ß und der Varianz er2. Aus einem Produktionslos werden n 10 Stücke zufällig entnommen und ihre Länge nachgemessen. Als Werte ergaben sich: Bei der
=
185.5,184.8,183.6,186.7,183.2,184.9,183.6,186.5,187.3,187.5
(a)
Nehmen Sie an, daß die Varianz der Rohrstücke bekannt sei mit er2 = 3.4. Berechnen Sie das 95%- und das 99%-Konfidenzintervall für den Erwar-
tungswert ß.
(b)
Berechnen Sie die 95%- und 99%-Konfidenzintervalle für den wert u, falls die Varianz er2 unbekannt ist.
(c) (d)
Berechnen Sie 95%- und 99%-Konfidenzintervalle für die Varianz er2.
Erwartungs-
Berechnen Sie 95%- und 99%-Konfidenzintervalle für die Varianz der Erwartungswert ß mit ß 185 bekannt ist.
ff2, falls
=
Übungsaufgabe 7.4: Für die Planung der Produktion benötigt ein Unternehmen Angaben über die mittlere Bestellmenge eines bestimmten Ersatzteils. Von 25 zufällig ausgewählten Kunden werden im Durchschnitt 27 Ersatzteile pro Vierteljahr bestellt. Die Standardabweichung der vierteljährlichen Bestellmenge eines Kunden ist aus früheren Untersuchungen mit er = 8.1 bekannt. Bestimmen Sie ein 95%-Konfindenzintervall für die mittlere Vierteljahr dieses Ersatzteils
(a) (b) (c)
ohne Annahmen über die
Bestellmenge
pro
Verteilung der Bestellmenge zu treffen,
unter Annahme normalverteilter
Bestellmengen,
wie bei (b), aber ohne Kenntnis der Standardabweichung der Bestellmenge. In der Stichprobe ergibt sich eine korrigierte Bestellmengenstandardabweichung von 8.1.
Tests
8
zum
Niveau
a
Im folgenden wollen wir uns dem dritten Hauptbereich der univariaten induktiven Statistik zuwenden, den Tests (vgl. § 3 und die Einführung). Es geht also darum, eine Entscheidung bezüglich des (unbekannten) Parameters der Verteilung einer Zufallsvariable zu treffen. Dabei bestehen nur zwei Entscheidungsalternativen, d.h. wir wollen nicht einen (ungefähren) Wert für den Parameter ermitteln, sondern nur feststellen, in welchem von zwei Teilbereichen des Parameterraums sich der „wahre" Parameter befindet. Typisches Beispiel ist die Frage, ob der Ausschußanteil einer Warenpartie einen „tolerierbaren" Ausschußanteil überschreitet oder nicht, ob eine Maschine ausgedrückt durch die Pa-
Verteilung der Meßwerte bei den gefertigten Produktionseinheiten ordentlich arbeitet oder nicht, ob eine Werbekampagne erfolgreich war oder nicht (d.h. ob der mittlere Umsatz nach der Kampagne größer ist als der alte
rameter der
-
-
bekannte
Wert), usw.
Betrachten wir nochmals die Ausgangssituation bei einem Test über den Parameter einer Zufallsvariable Y (vgl. § 3 und die Beispiele aus § 2). Der Parameterraum F ist in einer Testsituation zerlegt in zwei disjunkte Teilmengen r0 und
Tu
T
T0 U Ti
=
mit
r0 ^ 0 ^ Ti und TQ n Ti
=
0.
„wahren" Parameter 7 von Y muß also H0 : 7 € To (NuUhypothese)
Für den
° er
Hi
:
7e
Ti
(1) (2)
(Gegenhypothese)
richtig sein1. Aufgrund einer Stichprobe soll jetzt entschieden werden, welche der Hypothesen als richtig angesehen wird. Die Entscheidungsmöglichkeiten sind also do : Ho wird als richtig betrachtet und
(Ho
wird
angenommen)
^ Alternativtest
di : H0 wird als falsch angesehen,
(Hq
1
wird
abgelehnt)
Grundlegende Arbeiten zur Theorie dee Testens von Hypothesen sind die Arbeiten von J. Neyman und E.S. Pearson (1928), (1933), (1936a), (1936b). In diesen Arbeiten wird auch erstmals die Unterscheidung in Fehler 1. und 2. Art (siehe unten) gemacht.
Induktive Statistik
124
do und di können natürlich auch bzgl. der Hypothese Hi formuliert werden.
Gelegentlich wird man aufgrund der Aufgabenstellung die Entscheidungen auch
in anderer Weise
do
:
und
formulieren, etwa
Entscheidung über die Ï Gültigkeit von Ho oder Hi
keine
>
di : Ho wird abgelehnt.
Signifikanztest
J
Bei der ersten Wahl der Entscheidungsmöglichkeiten spricht man auch nem Alternativtest, bei der zweiten von einem Signifikanztest.
8.1
von
ei-
Beispiel für die Situation eines Signifikanztests:
Signifikanztests treten häufig bei medizinischen Fragestellungen auf, beispielsweise ob Produkte gesundheitsschädlich sind, Medikamente wirksam sind, etc.. Wegen der Fehlermöglichkeiten, die bei jeder Entscheidung auf der Grundlage von Stichproben nicht ausgeschlossen werden können, möchte man sich nur für eine der beiden Alternativen festlegen, wenn dazu eine ausreichende Grundlage, also hinreichender „Tatverdacht", besteht. Beispielsweise bei den Hypothesen Ho : Medikament ist unwirksam und
Hi : Medikament ist wirksam lautet dann
do: Das Medikament ist möglicherweise unwirksam, könnte aber auch wirksam sein. Eine
Entscheidung darüber wird nicht getroffen,
dx: Das Medikament ist wirksam. Vor allem bei gravierenden Nebenerscheinungen des Medikaments ist eine solche Entscheidungssituation plausibel. Je nach Krankheit und der Art der Nebenef-
Tests
zum
Niveau
125
a
fekte (oder auch dem Preis des Medikaments) kann eine Vertauschung der Hypothesen Ho und Hi sinnvoll sein. Dabei geht es dann darum, die Unwirksamkeit des Medikaments abzusichern. Auf die Unterscheidung zwischen Alternativtest und Signifikanztest werden wir noch zurückkommen. Betrachten wir im folgenden die „klarere" Situation des
Alternativtests.
Offensichtlich sind hier 1.
2.
folgende Fehler möglich:
H0 wird verworfen (Entscheidung di), obwohl Ho richtig ist, oder m.a.W. Ho wird fälschlicherweise abgelehnt. Man nennt dies den Fehler 1. Art. Ho wird angenommen (Entscheidung do), obwohl Ho falsch ist, oder m.a.W. H0 wird fälschlicherweise angenommen. Man spricht hier vom Fehler 2. AH.
Der entstehende Schaden hängt sicherlich davon ab, ob ein Fehler gemacht wird und, wenn ja, welcher Art dieser Fehler ist. Die Schadensfunktion
5:
{do,di} xT->R
wird sich dann in ihrer Gestalt in folgenden Bereichen wesentlich unterscheiden:
a) Entscheidung db bei 7 € r0, d.h. b) Entscheidung do bei 7 6 Ti, d.h. c) Entscheidung d\ bei 7 € r0, d.h. d) Entscheidung d\ bei 7 € T\, d.h.
korrekte
Entscheidung, Fehler 2. Art,
Fehler 1. Art,
korrekte
Entscheidung.
7
Entscheidung
aus
Ti
Fehler 2. Art
do
korrekt
di
Fehler 1. Art
korrekt
Obwohl die Höhe des Schadens in diesen vier Bereichen sicherlich noch von dem wahren Wert 7 abhängen wird, betrachten wir die folgende „undifferenzierte" Schadensfunktion:
(
5(d, 7)
=
I
[
ci a
0
7€ 7€
r0,d Ti, d
=
=
sonst
di do
„Fehler 1. Art"
„Fehler korrekte
2. Art"
Entscheidung
Induktive Statistik
126
Der Schaden wird hier in den vier Bereichen als konstant angesehen, wobei bei einer korrekten Entscheidung kein Schaden entsteht. Sei nun ö : X {do,di} eine Entscheidungsfunktion, d.h. nis x.
8.2 Eine
S(x) die Entscheidung beim Stichprobenergeb-
Bezeichnung: Entscheidungsfunktion S : X
-+
{dn,di} wird
Test genannt.
Man erhält dann als Risikofunktion
Ä(*,7)
=
=
Ey[S(S(X),y)} S(ch,j)Py(S(X) do) + S{duj)Py{6(X) =
OPT(o(X) do) + c1P7(o(X) d1)
für
oaBr(S(X) do) + 0PJ{6(X)=d1)
für 7 € IV
=
=
=
(3) =
76r0
Bei dieser Schadensfunktion sind damit für das Risiko bei einer funktion (eines Tests) S die Wahrscheinlichkeiten
di) für 7 € T0 : Wahrscheinlichkeit „Fehlerwahrscheinlichkeit 1. Art"):
P7(6(X)
=
P/(*,7)
Entscheidungs-
für den Fehler 1. Art
(kurz: (4)
P7(S{X) db) für 7 6 Ti : Wahrscheinüchkeit für den Fehler 2. Art (kurz: „Fehlerwahrscheinlichkeit 2. Art"): und
=
Pjj(*,7)
(5)
ausschlaggebend. Ein gleichmäßig bester Test zu dieser Schadens- bzw. Risikofunktion hätte damit für jede Wahl von 7 e T ein minimales Risiko, d.h. also eine mimmale Fehlerwahrscheinüchkeit. Bis auf pathologische Ausnahmefälle gibt es damit keine gleichmäßig besten Tests, wie folgende Überlegung zeigt. Ein Test 5 : X -¥ {do, di} ist durch die Teilbereiche, in denen die Entscheidung do bzw. di getroffen wird, eindeutig festgelegt:
Teats
zum
As
Niveau
127
a
{x € X I 5(x)
:=
=
{x G X I (J(x) nungsbereich
Ks
:=
bei ck i=l
do
l
di
(52)
n
E Xt € {0,1, ...,}= N U {0} ist, kann man sich bei cH ebenfalls auf Werte «=i aus NU{0} beschränken. Für den Fehler 1. Art erhält man Da
Pi(ök, Ao)
=
Pao E Xi > cfc),
(53)
i=l
für den Fehler 2. Art n
P//(**, Ai) Da
=
PAl
A-4
(56)
gilt. Im ersten Fall sagen wir, der fällt monoton in T(x).
Wabxscheinlichkeitsquotient steigt, im zweiten er
Ney man-Pearson Tests
Übungsaufgaben zu §
149
9
Übungsaufgabe 9.1: Sei Y eine Poisson-verteilte Zufallsvariable mit unbekanntem Parameter A. Mit einer Stichprobe vom Umfang n 6 sollen die Hypothesen Ho : A Ao 1 = 3 : A werden. Ai H\ gegen getestet =
=
=
=
(a) (b)
Wie lautet der beste Test mit einem Niveau
a
< 0.06 ?
Bestimmen Sie das Niveau a für den besten Test, wenn k den Wert 0.363 hat, wobei k als kritischer Wert für den Wahrscheinlichkeitsquotienten verwendet wird.
Übungsaufgabe 9.2: Y sei eine normalverteilte Zufallsvariable mit bekannter Varianz er2 und unbekanntem Erwartungswert u. Mit Hilfe einer Stichprobe vom Umfang n soll die Alternative H0 : u = gegen die Alternative Hi : u = Ui mit ui > uo getestet werden.
(a) (b)
Bestimmen Sie einen besten Test Nehmen Sie
Hi
:
fi
=
Ui
zum
Niveau a.
3 gegen an, Sie wollen die Hypothese H0 : u = A*o 5 bei einer Varianz von a2 3 zum Niveau a = 0.05 testen.
nun =
Wie entscheiden Sie sich bei einem
=
—
10
Stichprobenergebnis von YJ x< i=l
=
40 ?
Übungsaufgabe 9.3: Ein Unternehmen erhalt einen Anruf von einem Lieferanten, daß eine gelieferte Warenpartie mit 10000 Teilen möglicherweise nicht wie „normal" einen Ausschußanteil von 5%, sondern wegen eines Fehlers in der Produktionsanlage von 15% habe. Daraufhin wird eine Stichprobe vom Umfang n = 30 entnommen. Mit einem gleichmaßig besten Test mit einem Niveau von höchstens 0.1 soll „statistisch" gesichert werden, daß die Partie wie normal einen Ausschußanteil von 5% hat. Gewährleistet das Testergebnis dies nicht, wird die Partie zurückgeschickt.
150
Induktive Statistik
Übungsaufgabe 9.4: Y sei eine Zufallsvariable mit parametrischer Verteilung, T sei der Parameterraum. Mit einer Stichprobe vom Umfang n mit Zurücklegen soll
Ho
:
7
=
7o
gegen
Hi
:
7
=
(57)
71
getestet werden. Ô sei der Neyman-Pearson-Test zum Niveau a für dieses Testproblem, T sei eine suffiziente und vollständige Statistik. Man zeige: Gilt für zwei so
folgt cKx1)
Stichprobenergebnisse x1 =
Six2).
und x3
T(xx) T(x2), =
Gleichmäßig
10
beste Tests
Betrachten wir nun die allgemeine Situation r = rour1,ro/0^r1,ronr1
zum
=
Niveau
a
(i)
0.
Gesucht wird ein gleichmäßig bester Test ö für Ho : 7 G To gegen Hi : 7 vom Niveau a, d.h. Pi{o~,lo) < a für alle 70 G T0 und für jeden anderen Test S1
Pii(Sm)
Niveau a gilt < PidS'm) für alle 71 e IV
€
Ti
(2)
vom
(3)
(2) ergibt sich sofort, daß jeder Test 6 zum Niveau a für Ho : 7 G To gegen
Aus
7 € Ti auch einen Test zum Niveau a liefert für die einfachere Situation 7 = 70 gegen ffi 17 = 7!, wie auch immer man 70 € ji G Vi auswählt. Wählen wir aber 70 G To und 71 G Ti beliebig aus, so liefert uns der Neyman/Pearson-Test 6k zu k G R++ einen gleichmäßig besten Test zum
ffi Ho
:
r0*und
:
Niveau
P/( P und pi P
(12)
sonst
oder mit c :=
min{cP0,p1 | Po > P.Pi < p} di
:
£ Xi
P c
=
5, ist, ist
auszurechnen, sondern man prüft für c Eigenschaften von S*, nämlich: Zahlen cP0)Pl
=
1. Welches Niveau hat 5*1
2. Ist Ä*
erforderlich, die 0,1,2,3,..., nm 1 die
es
gleichmäßig bester Test zu diesem Niveau?
nicht
—
154
Induktive Statistik
Pi(r,p)
pP(ö'(x) dl)
=
=
=
pp(£xi p
(16)
ist.
S* ist also
vom
Niveau ae.
6* ist aber auch
gleichmäßig bester Test zum Niveau ac:
Sei nämlich 6' ein Test
Sc(x) ein
=
l
di
:
zum
Niveau ac und Pi < p. Zunächst ist
T,Xic i=l
p
Neyman/Pearson-Test zum Niveau n
Pd6c,p)
=
Pp(%2xi^c)
=
(18)
a°>
i=i
also gleichmäßig bester Test
zum
Niveau ac für p = p gegen p = Pi und
es
gilt:
n
Pii(Sc,Pi)
=
PPl(6c(X)=d0)=PPdYlXi>c)
(19)
i=i
=
Da aber auch 6' Test
P//(**,Pi) was zu
=
zeigen war.
PPdS'(X)=do) Pu(6\px). =
zum
Niveau ac ist für Jfu : P
P,/(d%,Pi) < P//(«î',Pi),
=
P gegen
ifi
:
p
=
pi, ist
(20)
Gleichmäßig
beste Tests
zum
Niveau
155
a
Entscheidender Punkt in diesem Beispiel ist, daß für jedes Po > P und pi < p der n Koeffizient von £ xt- in der Funktion lnQ(x) dasselbe Vorzeichen hat, so daß t=i
für jede Wahl ist. Es
von
n
po > p und Pi < p
Q(x)
monoton fallend in
liegt also ein einheitliches Monotonieverhalten vor.
10.2
T(x)
=
VJ x< •=i
Definition:
Sei X Stichprobe zu Y, Y habe eine parametrische Verteilungsannahme mit Parameterraum T = T0 U ri,r0 n Ti = 0. T : X - R sei eine Statistik [X Stichprobenraum). Wir sagen: Die
Wahrscheinlichkeitsquotienten (x\
Q
-
PTl(* =*)
b_w
fx,yi(x)
.
.
falls P70(X x) ^ 0 bzw. /x,7o(x) Ï 0 und Q70l7l(x) = oo, falls P7o(X x) 0 bzw. /x,70 (x) 0 sind einheitlich monoton steigend (fallend) in T, wenn für alle 7o € To und 71 G Ti und x,x' G X =
=
=
=
T(x)
0.
Satz:6
10.7
Gegeben sei das Testproblem Hq : 7 € T0 gegen H\ : 7 G T\. T : x R sei eine Stichprobenfunktion derart, daß der Wahrscheinlichkeitsquotient Qy0,yi ein für jede Wahl von 70 G To und 71 € Ti einheitliches (o.B.d.A. monoton wachsendes) Monotonieverhalten in T hat. Zu K {x G x \ T{x) > c} € x gebe es ein 7* G Tq mit =
a*
=
Py. (T(X) >c)
=
max
P7 [T(X)
>
c)
(53)
> 0.
Dann ist
«*>-{*
für für
T(x) < c T{x) > c
^
gleichmäßig bester Test zum Niveau a*. Sei Ô' ein weiterer gleichmäßig bester Test zum Niveau a*, ö(X) fast sicher für 7* und alle 7 G Ti überein.
so
stimmt
Ô'(X) mit
Beweis:
Offensichtlich ist 6 ein Test 71 G
zum
Niveau a*. Sei S' ein Test
zum
Niveau
a
und
Ti. Zu zeigen ist
P11(T(X) 70
Entscheidungsfunktion
T{x) c zu c
6 R ein
a
=
(57)
gleichmäßig bester Test zum Niveau
Pyo (T{X) > c),
falls
a >
(58)
0 ist.
Sei 6' ein
(weiterer) gleichmäßig bester Test zum Niveau a P70 (T(X) > c) > 0, so stimmen 6(X) und 6'{X) für alle 7 > 70 fast sicher Uberein. =
Beweis: Nach Satz 10.7 ist
nur
noch
zu
zeigen, daß 70 die MaximalsteUe von
Py(T{X) € K) Pj(T(X) > c) =
(59)
ist.
Es
güt aber, daß
Py{T{X)>c)
(60)
Induktive Statistik
164
monoton wachsend in 7 ist: > 72; 71,72 € T.
Sei nämlich 71
Voraussetzung gibt es zu c ein k mit
(«)fcP7a(X x) =
=
/x,7a (x) / 0
bzw.
*/x,72(x)-
(63)
Pm(T(X)>c)>kPya(T(X)>c)
(64)
/xl7l(aO Daraus
>
folgt, daß
ist. Ebenso
gilt
(65)
p^rw^c^fcp^nx^c). Sei
«
=
0
P^ (T(X)
c), dann ist
(l-«)((P7l(T(A')>c)-fcP7a(T(A')>C)) -«(P71 (T(X) < c) kPy, (T{X) < c)) {l-K)(Pyi{T{X)>c)-kP7,(T(X)>c)) -
=
(66)
-«(1 Py, (T(X) >c)-k + kPy, (T(X) > c)) P71 (T(X) > c) ifcP7a (T(X) >c)-K + Kk P^TiX) > c) k -
=
=
-
-
und damit
P^ (T(X) > c) Daraus
>
k
=
P7a(T(X) > c).
(67)
P7o (T( X)
(68)
folgt
max
7
c)
=
>
c)
Gleichmäßig
beste Tests
und damit die
zum
Niveau
165
a
Behauptung.
Bemerkung:
10.9
1. Betrachtet
#o so
:
man
das
umgekehrte Testproblem
7 > 7o gegen
:
(69)
7 < 70,
sind Annahmebereich und kritischer Bereich
do ist
Ht
gleichmäßig
mum
vertauschen:
T(x) > c T(x) < c
bester Test
bei, daß die Schranke
zu
70
(70)
Niveau Pyo(T(X) < c). Wichtig ist daNullhypothese gehört, da sonst das Maxi-
zum
zur
für die Fehlerwahrscheinlichkeit 1. Art nicht existiert, genauer das
Supremum nicht angenommen wird. Bei monoton fallendem Wahrscheinlichkeitsquotienten in T sind entsprechend die Entscheidungsfunktionen auszutauschen:
(70)
für das Testproblem
(56); (57)
für das
Testproblem (69)
sind dann jeweils gleichmäßig beste Tests zu dem entsprechenden Niveau. Soll das Testniveau nach Vertauschung der Hypothesen gleichbleiben, ist also die Testschranke c neu zu bestimmen. 2. Satz und
Folgerung beinhalten implizit, daß das Niveau nicht beliebig gewählt werden kann, sondern sich aus der Festlegung des kritischen Bereiches K, also aus der Testschranke c, ergibt. Ist T(X) eine stetige Zufaüsvariable, so sieht man aus (58), daß zumindest bei einseitigen Tests jedes Niveau eingesteüt werden kann. Nicht so bei diskretem T(X), wie auch Beispiel 9.1 (siehe auch Beispiel 10.1) schon gezeigt hat.7
3. Um das Niveau eines so formulierten Tests tatsächlich berechnen zu können, benötigen wir die Wahrscheinüchkeitsverteilung von T(X), also einer Funktion der mehrdimensionalen Zufallsvariable Xi,..., Xn. In den meisten praktischen Anwendungsfäüen wurde diese Arbeit schon von Statistikern früherer Generationen durchgeführt. Die wichtigsten Verteilungen sind im
Anhang aufgeführt.
7Ein Ausweg besteht darin, die Entscheidung für den Fall, dafl die Testgröfie mit der Testschranke übereinstimmt, von einem Zufallsprozeß abhängig zu machen („Randomisierte Tests", vgl. etwa Henn/Kischka(1981)
Induktive Statistik
166
Anwendungen
10.10
Nach den bisherigen Vorbereitungen macht es beste Tests zum Niveau a für einparametrige der geläufigen Verteilungen zu ermitteln:
keine Probleme,
gleichmäßig (r c R) einseitige Testprobleme
nun
a) Bernoulli-Verteilung: n
£ X, ist suffizient und vollständig mit monoton wachsendem T{x) Wahrscheinlichkeitsquotienten8. Damit ist für das einseitige Testproblem —
H0 die
:
p < Po gegen
(71)
Hl:p>po
Ents C «=1 gleichmäßig bester Test zum Niveau
Pi(6c)
=
PP0(itlXi>c).
(73)
T»
£ Xi i=l
ist
binomialvertailt,
so
daß
PP0(£xi>c)= *=c+l £ f?)po(l-Po)n-* W
(74)
i=l
gilt. Ist ein Niveau a vorgegeben, so wählt man c so, daß das Niveau von öc möglichst nahe bei a liegt und a nicht überschreitet:
Pi(Se) c2,a.
gleichmäßig bester Test
zum
Niveau
gangssituation, dann wäre S* auch gleichmäßig bester Test die beiden einseitigen Tests (24) und (25).
a
zum
für die AusNiveau a für
Die Gütefunktion von 6* müßte nun einen Verlauf nehmen, der für a2 > 0.2 mit der Gütefunktion von 0.2 für Si und alle er2 < 0.2 für 02 übereinstimmen, folgt, daß S* bei Parameterwerten a2 < 0.2 mit 61 und bei Parameterwerten 0.2 fast sicher mit 62 übereinstimmt. Für a > 0 ist aber 0 < Ci,a, C2,a < 00 und die Tests 61 und 62 sind damit offensichtlich verschieden. -
-
Abbildung
11.4: Gütefunktion
zu
Si und Si
aus
Beispiel 11.7.
die Gütefunktionen der beiden einseitigen Tests (24) und (25) wieder (der Vollständigkeit halber auch für den Parameterbereich er2 < 0.2 bei (24) und er2 > 0.2 bei (25)). Man sieht, daß 0.2 einen guten Verlauf der Gütefunktion hat (die Funktionswerte steigen rasch gegen 1 an), aber für a2 < 0.2 unbefriedigend ist, da die Wahrscheinlichkeit die Nullhypothese abzulehnen klein ist und schnell gegen Null geht. Umgekehrt ist £2 als Test für (23) gut im Bereich er2 < 0.2, aber schlecht im Bereich a2 > 0.2.
Abbildung
11.4
gibt
Induktive Statistik
182
Übungsaufgabe zu §
11
Übungsaufgabe 11.1: Der
Hauptgesellschafter der „Elektroblitz Mobile GmbH & Co. KG"
ist der An-
sicht, daß mehr als 40% der Autofahrer bereit sind, ein Elektromobil wie den von
ihm entwickelten „Elektroblitz" zu kaufen, wenn der Preis zwischen DM 20.000.und DM 30.000.- liegt. Da er diese Aussage gegenüber den etwas skeptischeren Mitgesellschaftern untermauern will, entschließt er sich zur Durchführung einer stichprobenhaften Befragung unter Autofahrern aus dem gesamten Bundesgebiet.
(a) (b)
Formulieren Sie Null- und Gegenhypothese dieses Testproblems. Geben Sie die Teilbereiche r0 und T\ des Parameterraums an. Geben Sie eine sinnvolle Entscheidungsfunktion dazu an. Wie lautet die OC- und die Gütefunktion dieser Entscheidungsfunktion.
Sie den Verlauf der OC- und der Gütefunktion und zeichnen Sie die Fehlerwahrscheinlichkeiten 1. und 2. Art ein.
(c) Skizzieren (d)
Wie ändert sich die Fehlerwahrscheinlichkeit l.Art dieses Tests, nur den Stichprobenumfang n vergrößern?
(e)
Wie können Sie eine höhere
Übungsaufgabe
wenn
Sie
„Trennschärfe" des Tests erreichen?
11.2:
Eine Abfüllanlage, die Zuckertüten mit 1 kg Sollinhalt abfüllt, soll mit statistischen Methoden überwacht werden. Dazu wird angenommen, daß die tatsächliche Füllmenge normalverteilt ist mit Mittelwert u und einer bekannten Varianz von
er2
=
9
g2.
Wie ist der Mittelwert
einzustellen, daß mit einer Wahrscheinlichkeit
von
90%
der SoUinhalt mindestens erreicht wird?
Anlage auf diesen Wert justiert ist, wird alle Stunde eine StichTüten aus der laufenden Produktion entnommen und ihr Inhalt 5 probe Mit Test wird überprüft, ob der SoUinhalt weiterhin mit 90% einem gewogen. Wahrscheinlichkeit erreicht wird. Ist dies nicht der Fall, wird die Anlage neu justiert. Dabei soll ein Fehlalarm, d.h. eine unnötige Neujustierung mit höchstens 1% Wahrscheinlichkeit eintreten. Nachdem die von
Wie lautet das Testproblem, welchen Test wird man sinnvollerweise verwenden? Geben Sie zu diesem Test die OC-Funktion und die Gütefunktion an und zeichnen Sie diese. Wie groß ist die Wahrscheinlichkeit höchstens, eine erforderliche Neujustierung aufgrund des Testergebnisses zu unterlassen?
12 In
Gleichmäßig
Beispiel H0
beste unverfälschte Tests
11.7 haben wir bei einem
:7
=
7o
zweiseitigen Test
der Form
(r
=
R)
Hx:j^ 70,
gegen
(1)
also
r0
{70},r1={7er|7^7o},
=
(2)
den Teilbereich Ti zerlegt in die Bereiche 7 < 70 und 7 > 70 und die beiden gleichmäßig besten Tests 61, 62 zum Niveau a für die einseitigen Testprobleme
Hü1):7
=
7o
gegen
H1(1):7>7o
(3)
H02)
=
7o
gegen
H[2)
(4)
und :
7
:
7 < 7o
betrachtet. Verwendet man diese Tests als Tests für das Ausgangsproblem, so ist (vgl. Abbildung 11.4) 6\ optimal im Bereich 7 > 70, aber „extrem" schlecht im Bereich 7 < 70 und umgekehrt bei oV Diese Tests kommen daher sinnvollerweise nicht in Betracht. Andererseits haben wir festgestellt, daß auch bei gleichmäßig besten Tests zum Niveau a als Supremum für die Fehlerwahrscheinlichkeit 2. Art meist 1 a akzeptiert werden muß. In Abbildung 11.4 sieht man, daß die Tests 6\ und 62 als Supremum der Fehlerwahrscheinlichkeit 2. Art sogar 1 haben. Eine sinnvolle Forderung scheint demnach zu verlangen, daß wir nur solche Tests zulassen, deren Fehlerwahrscheinlichkeit 2. Art nirgendwo größer als 1 a ist. —
—
12.1
Definition1
Ein Test S : X -r heißt unverfälscht,
{do.di}
zum
Niveau
a
für H0 : 7
€
T0 gegen Hi
:
7 6
Ti
wenn
PidS,^) < 1-a
für alle 7 e Ti
Unverfllschtbeit wurde in Neyman, J., Pearson, E.S.
(5) (1936a), (1938) eingeführt.
184
Induktive Statistik
gilt.
Py(S(X) = di) ist (5) gleichbedeutend mit R,(6(X) = für alle 7 6 Ti, d.h. die Wahrscheinlichkeit, die Nullhypothese abzulehnen, wenn sie nicht zutrifft, ist mindestens a und damit mindestens so groß, wie die Wahrscheinlichkeit, die Nullhypothese abzulehnen, obwohl sie zutrifft. Auch in dieser Form ist die Forderung sicherlich sinnvoll. Wegen P//(o\7)
di)
=
1
-
> a
Definition
12.2
Ein unverfälschter Test «Î zum Niveau a heißt gleichmäßig bester unverfälschter Test zum Niveau a, wenn für jeden unverfälschten Test 6' zum Niveau a
Pn(5,f)
Verteilung mit f
{Xi~P]* (£ *i