266 32 18MB
German Pages 505 [508] Year 2001
Beschreibende und schließende
Statistik Aufgaben und Beispiele Von
Dr. Friedrich Vogel o. Professor fur Statistik
9., korrigierte und erweiterte Auflage
R. Oldenbourg Verlag München Wien
Die Deutsche Bibliothek - CIP-Einheitsaufnahme Vogel, Friedrich: Beschreibende und schließende Statistik / von Friedrich Vogel. München ; Wien : Oldenbourg Aufgaben und Beispiele. - 9., korrigierte und erw. Aufl.. - 2001 ISBN 3-486-25793-5
© 2001 Oldenbourg Wissenschaftsverlag GmbH Rosenheimer Straße 145, D-81671 München Telefon: (089) 45051-0 www.oldenbourg-verlag.de Das Werk einschließlich aller Abbildungen ist urheberrechtlich geschützt. Jede Verwertung außerhalb der Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulässig und strafbar. Das gilt insbesondere fur Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Bearbeitung in elektronischen Systemen. Gedruckt auf säure- und chlorfreiem Papier Druck: Grafik + Druck, München Bindung: R. Oldenbourg Graphische Betriebe Binderei GmbH ISBN 3-486-25793-5
Inhaltsverzeichnis Vorworte
Seite VII
1
Seite
1
Beschreibende Statistik
1.1
Aufgaben
Seite
1
1.2
Lösungen
Seite
50
2
Schließende Statistik
Seite 169
2.1
Aufgaben
Seite 169
2.2
Lösungen
Seite 221
3
Überprüfen Sie Ihre Statistik-Kenntnisse! Seite 365
3.1
Vorbemerkung
3.2
Aussagen zur beschreibenden Statistik Seite 365
3.3
Lösungen
Seite 380
3.4
Aussagen zur schließenden Statistik
Seite 381
3.5
Lösungen
Seite 395
Ergänzungen
Seite 397
4
Seite 3 65
4.1
Beschreibende Statistik
Seite 397
4.2
Schließende Statistik
Seite 446
Vorwort zur neunten Auflage Auch für die neunte Auflage wurden einige wenige Aufgaben geringfügig korrigiert, so daß ich nunmehr die begründete Hoffnung habe, daß der Text keine Schreibfehler, aber auch keine Ungenauigkeiten und Unklarheiten mehr enthält. Natürlich habe ich außerdem die "Ergänzungen" verbessert und um einige Aufgaben aus früheren Diplomvorprüfungsklausuren erweitert. Wiederum haben einige Hörer Korrekturvorschläge gemacht. Ihnen danke ich dafür herzlich. Ausdrücklich danke ich meinen Mitarbeitern, Herrn Dipl.-Kfm. Sanyel Arikan MBA, Herrn Dipl.-Kfm. Stefan Goller und Herrn Dipl.-Math. Hans Kiesl, für die äußerst tatkräftige Unterstützung bei der Auswahl und Konstruktion von Aufgaben und Lösungen. Frau Sieglinde Wächter danke ich für die rasche Erstellung der Druckvorlage und Herrn Dipl.-Vw. Martin Weigert für die stets gute Zusammenarbeit. Friedrich Vogel
Vorwort zur siebten Auflage Für die siebte Auflage wurden einige wenige Aufgaben geringfügig korrigiert, vor allem aber wurde das 4. Kapitel "Ergänzungen" überarbeitet und erweitert. Diese Ergänzungen enthalten Aufgaben und Lösungen zur beschreibenden und zur schließenden Statistik. Ein Teil der Aufgaben stammt aus Diplomvorprüfungsklausuren der letzten Jahre. Die Aufgaben und Lösungen in diesem Teil der "Aufgabensammlung" folgen dem Aufbau meiner "Formelsammlung" (Beschreibende und schließende Statistik, Formeln, Definitionen, Erläuterungen, Stichwörter und Tabellen). Zu fast jedem der insgesamt 16 Kapitel der Formelsammlung wurde mindestens eine Aufgabe mit Lösung in die Ergänzungen aufgenommen . Einige Hörer haben Verbesserungsvorschläge gemacht. Ihnen sei herzlich gedankt. Mein besonderer Dank gilt meinen Mitarbeitern, Herrn Dipl.-Kfm. Sanyel Arikan MBA und Herrn Dipl.-Math. Hans Kiesl, für die überaus tatkräftige Unterstützung bei der Auswahl und Konstruktion von Aufgaben und Lösungen. Frau Sieglinde Wächter danke ich für die zügige Erstellung der Druckvorlage und Herrn Dipl.-Vw. Martin Weigert für die seit vielen Jahren gute Zusammenarbeit. Friedrich Vogel
VIII
Vorworte
Vorwort zur fünften Auflage Für die fünfte Auflage wurden bei Aufgaben und Lösungen einige - noch immer vorhandene - Ungenauigkeiten und Druckfehler beseitigt und einige wenige Präzisierungen vorgenommen. Vor allem aber habe ich die Gelegenheit genutzt, ein Kapitel "Ergänzungen", mit weiteren Aufgaben zur beschreibenden und zur schließenden Statistik, anzufügen. Meine Mitarbeiter, Herr Dipl.-Kfm. Martin Eiglsperger, Herr Dipl.-Kfm. Rainer Knirsch und Herr Dipl.-Kfm. Torben Wiede, haben sich durch das "Erfinden" von Aufgaben und Erstellen von Musterlösungen sowie durch zahlreiche Korrekturhinweise große Verdienste erworben. Ihnen sei dafür herzlich gedankt. Auch den Studierenden, die es gewagt haben, mich auf Fehler hinzuweisen, danke ich sehr. Schließlich danke ich Frau Sieglinde Wächter für die mühsamen Korrekturen und Herrn Dipl.-Vw. Martin Weigert für die stets gute Zusammenarbeit.
Friedrich Vogel
Vorwort zur vierten Auflage Die vierte Auflage unterscheidet sich von ihrer Vorgängerin durch noch weniger Druck- und Rechenfehler und Unklarheiten in Aufgaben und Lösungen, vor allem aber durch eine ganze Reihe neuer Aufgaben und Lösungen zur beschreibenden und schließenden Statistik. Einige Aufgaben und Lösungen dienen der Vertiefung und Abrundung bestimmter Gebiete, die bei Klausuren häufig wenig ergiebig waren, einige ergänzende Aufgaben und Lösungen, wie z.B. die zu den "Kaufkraftparitäten" und die zu den "Tests und Konfidenzintervallen für die Differenz zweier Anteilswerte" sind bedingt durch Anpassungen an die neue Auflage meiner "Formelsammlung" (Beschreibende und schließende Statistik, Formeln, Definitionen, Erläuterungen, Stichwörter und Tabellen, 6.- Auflage, R. Oldenbourg Verlag, München -. Wien 1991). Die Aussagen und Lösungen zur beschreibenden und schließenden Statistik wurden überarbeitet und ergänzt und zu einem Kapitel "Überprüfen Sie Ihre Statistik-Kenntnisse" zusammengefaßt. Auch wegen abschreckender Beispiele von Fehlanwendungen statistischer Methoden und/oder Fehlinterpretationen von erzielten Ergebnissen in der sozial- und wirtschaftswissenschaftlichen Literatur wurde bei der Überarbeitung wiederum besonderer Wert darauf gelegt, die Voraussetzungen und Grenzen der eingesetzten Methoden zu erläutern und zu erklären, wie statistische Ergebnisse zu interpretieren sind. Meinen Mitarbeitern, Herrn Dr. Werner Grünewald und Herrn Dipl.-Kfm. Torben Wiede, danke ich für Ihre stets tatkräftige
Vorworte
IX
Unterstützung beim Entwurf und der Korrektur von Aufgaben und Lösungen, Frau Sieglinde Wächter für die zügige Erstellung der Druckvorlage und den Lesern für Ihre konstruktive Kritik. Für die langjährige Zusammenarbeit danke ich Herrn Dipl.-Vw. Martin Weigert, Lektoratsleiter beim Oldenbourg Verlag.
Friedrich Vogel
Vorwort zur dritten Auflage Für die dritte Auflage wurden alle Aufgaben und Lösungen überarbeitet, Druck- und Rechenfehler korrigiert sowie Unklarheiten in Aufgabenstellungen und Lösungen beseitigt. Einige Aufgaben und Lösungen wurden entfernt, um Platz für notwendige Erweiterungen zu schaffen. Aufgaben, die sich als Klausuraufgaben weniger eignen sowie vertiefende und ergänzende Aufgaben und Beispiele wurden mit einem * versehen. Die "Klausuraufgaben und Ergänzungen" des dritten Kapitels der zweiten Auflage wurden meiner "Formelsammlung" (Beschreibende und schließende Statistik - Formeln, Definitionen, Erläuterungen, Stichwörter und Tabellen, R. Oldenbourg Verlag, München - Wien) entsprechend eingegliedert. Schließlich wurden die Lösungen der etwas geänderten Symbolik der Formelsammlung (4. Auflage) angepaßt. Die dritte Auflage wurde mit dem Textverarbeitungsprogramm ChiWriter geschrieben und mit einem KYOCERA LASER-Drucker gedruckt, daher konnte der Umfang dieser Sammlung - trotz einiger Erweiterungen - in den gesetzten Grenzen gehalten werden. Für die zur zweiten Auflage eingegangenen Hinweise und Anregungen danke ich sehr; sie wurden, soweit möglich, bei der Überarbeitung berücksichtigt. Für ausdauernde Hilfe und konstruktive Kritik danke ich meinen Mitarbeitern, Herrn Dipl.-Kfm. Ch. Braun, Herrn Dr. W. Grünewald und Frau Dipl.-Kfm. S. Kohaut sehr herzlich. Mein besonderer Dank gilt Frau S. Wächter, die wiederum großem Einsatz für eine termingerechte Fertigstellung schwierigen Typoskripts sorgte.
mit des
Herrn Dipl.-Vw. Martin Weigert, Lektoratsleiter beim Oldenbourg Verlag, danke ich für die stets gute Zusammenarbeit. Friedrich Vogel
Vorwort zur zweiten Auflage Gegenüber der ersten Auflage, die bereits nach drei Semestern vergriffen war, wurden einige Aufgaben und Lösungen exakter formuliert, Druck- und Rechenfehler korrigiert sowie kleinere
χ
Vorworte
Ungenauigkeiten beseitigt. Außerdem wurde die Sammlung um ein drittes Kapitel "Klausuraufgaben und Ergänzungen" erweitert. Viele Studierende haben Verbesserungsvorschläge gemacht. Ihnen sei dafür herzlich gedankt. Mein besonderer Dank gilt meinen Mitarbeitern, Herrn Dr. Werner Grünewald und Herrn Dipl.-Kfm. Christoph Braun, für viele wertvolle Anregungen und Frau Sieglinde Wächter für einige meisterhafte Collagen.
Friedrich Vogel
Vorwort zur ersten Auflage Diese Sammlung von Aufgaben und Beispielen zur beschreibenden und schließenden Statistik ist aus Vorlesungen und Übungen zur statistischen Grundausbildung, vor allem für Wirtschafts- und Sozialwissenschaftler, hervorgegangen. Sie ergänzt meine "Formelsammlung" (Beschreibende und schließende Statistik Formeln, Definitionen, Erläuterungen, Stichwörter und Tabellen, R. Oldenbourg Verlag, München - Wien) und ist daher im Aufbau, in der Symbolik und in der Darstellungsweise eng an diese angelehnt. Aufgaben oder zumindest Beispiele finden sich zu jedem Kapitel der Formelsammlung. Die Aufgabensammlung soll es dem Studierenden und dem Praktiker ermöglichen, sich häufig verwendete statistische Methoden zu erarbeiten und eine gewisse Vertrautheit bei ihrem Einsatz zu gewinnen und ihre Voraussetzungen, Grenzen und Interpretationsmöglichkeiten verstehen zu lernen. Sie soll dazu beitragen, typische Fehler, aber auch Mißverständnisse sowie Fehlinterpretationen bei der Anwendung statistischer Verfahren in der Praxis und in der empirischen Forschung zu vermeiden und statistische Methoden sachgerecht anzuwenden. Die Aufgaben und Beispiele stammen überwiegend aus dem Bereich der Wirtschafts- und Sozialwissenschaften und sind von unterschiedlichem Schwierigkeitsgrad. Ein Teil der Aufgaben entspricht etwa denen, die üblicherweise in DiplomvorprüfungsKlausuren gestellt werden. Ergänzend zu den Aufgaben und Beispielen wurden noch je 140 Aussagen zur beschreibenden und schließenden Statistik in die Sammlung aufgenommen. Sie sind mit "richtig" oder "falsch" zu kennzeichnen und ermöglichen eine Überprüfung der erworbenen Kenntnisse. Erfahrungsgemäß ist bei realitätsnahen Aufgaben der Rechenaufwand erheblich. Um diesen und den Umfang der Sammlung in Grenzen zu halten, wurden sowohl einige weniger realitätsnahe als auch theoretisch-formale Aufgaben beziehungsweise Beispiele eingefügt. Besonderer Wert wurde gen gelegt, die daher umfangreich sind. Die und die Lösungen durch
auf die gute Verständlichkeit der Lösunausführlich und gelegentlich auch recht einzelnen Lösungsschritte werden erklärt zahlreiche Abbildungen ergänzt. Speziel-
XI
Vorworte
le mathematische Kenntnisse werden nicht vorausgesetzt; die zur Lösung der Aufgaben benötigten Tabellen finden sich in der Formelsammlung . Aufgabensammlung und Formelsammlung können als Begleittexte für ein zweisemestriges Grundstudium in Statistik verwendet werden und ein zeitraubendes Mitschreiben von Aufgaben, Lösungen und Formeln ersparen. Wegen der Ausführlichkeit der Lösungen sind die Sammlungen, wenn sie auch ein Lehrbuch nicht ersetzen sollen, auch für ein Selbststudium geeignet. Meinen Mitarbeitern, Herrn Dr. Reinhard Dobbener und Herrn Dr. Werner Grünewald, gilt mein besonderer Dank für ihre überaus tatkräftige Unterstützung, vor allem bei der Ausarbeitung der Lösungen. Herzlich danke ich auch Frau Sieglinde Wächter, die mit großer Sorgfalt, Geduld und Ausdauer für eine fristgerechte Fertigstellung des schwierigen Typoskripts sorgte, Herrn Bernd Knorr, der mit großer Sachkenntnis die Plots erstellte und nicht zuletzt Herrn Dipl.-Vw. Martin Weigert, R. Oldenbourg Verlag, für die gute Zusammenarbeit. Für Anregungen und kritische Hinweise bin ich stets dankbar. Friedrich Vogel
1. Beschreibende Statistik 1.1 Aufgaben Aufgabe 1 In der amtlichen Statistik der Bundesrepublik Deutschland gibt es zwei Erhebungsverfahren, um Aufschluß über die Bevölkerung der Bundesrepublik zu gewinnen: die Volkszählung und den Mikrozensus. Allerdings bestehen zwischen beiden Verfahren erhebliche Unterschiede. Bei der Volkszählung werden die Mitglieder aller Haushalte der Bundesrepublik Deutschland erfaßt. Da diese Erhebung großen organisatorischen und finanziellen Aufwand erfordert, können Volkszählungen nur im Abstand mehrerer Jahre durchgeführt werden. Um auch zwischen zwei Volkszählungen Informationen über die Bevölkerung zu erhalten, werden zusätzlich Mikrozensuserhebungen durchgeführt. Im Gegensatz zur Volkszählung werden beim Mikrozensus nur 1% der Wohnbevölkerung, d.h. ca. 280.000 Haushalte, befragt. Der Fragenkatalog des Mikrozensus ist sehr umfangreich: er reicht von Fragen nach der Haushaltsgröße und dem Haushaltseinkommen bis zu Fragen nach Alter, Geschlecht, Beruf, Art der Krankenkasse und Familienstand einzelner Haushaltsmitglieder. Es fehlen hingegen (wie übrigens auch bei der Volkszählung) Fragen nach Geburten und Sterbefällen. a) Erläutern Sie am Beispiel der Volkszählung (VZ) und des Mikrozensus (MZ) die Begriffe: Merkmalsträger (statistische Einheit), Gesamtheit, Umfang der Gesamtheit, Merkmal, Merkmalsausprägung, Erhebungsmerkmal, Vollerhebung, Teilerhebung, Primär-/Sekundärstatistik! b) Ordnen Sie die erwähnten Merkmale nach ihrem Merkmalstyp! Kennzeichnen Sie binäre, häufbare, diskrete, stetige Merkmale! c) Warum fehlen sowohl bei der Volkszählung als auch beim Mikrozensus Fragen zu Geburten und Sterbefällen? Aufgabe 2 Anzahl der landwirtschaftlichen Betriebe (eines bestimmten Landes zu einem bestimmten Zeitpunkt) nach der landwirtschaftlich genutzten Fläche. Fläche von ... bis unter . . ha
Anzahl der Betriebe
1 - 2 2 - 5 5 - 10 10 - 20 20 - 50 50 - 100 100 und mehr
100.620 150.300 144.400 176.370 176.450 27.790 4.560
2
1. Beschreibende Statistik
a) Bestimmen Sie aus diesen Angaben die approximierende funktion, den Median und das arithmetische Mittel! b) Wieviel Prozent der landwirtschaftliehen wirtschaftlich genutzte Fläche
Verteilungs-
Betriebe haben eine
land-
- von höchstens 20 ha, - von mehr als 50 ha, - zwischen 20 h a und 75 ha? Aufgabe 3 In einem Betrieb wurden der laufenden Produktion 25 fertiggestellte Wellen entnommen. Die Messung ihrer Länge (in mm) brachte folgendes Ergebnis.
X
V 1 2 3 4 5
ν
29,9 29,7 30,2 29,8 30,3
V 6 7 8 9 10
X
V
30,2 30,0 30, 1 30,2 30,0
V 11 12 13 14 15
X
V
V
X
30,0 30, 1 29,9 29,6 30,3
16 17 18 19 20
30,4 29,7 30,5 29,8 29,9
V
V 21 22 23 24 25
X
V
30,0 29,9 29,8 30, 1 30,0
a) Stellen Sie die Häufigkeitsverteilung und die empirische Verteilungsfunktion graphisch dar! b) Teilen Sie die Beobachtungswerte in linksoffene Klassen mit Δ(χ^) = = const.
=0,1
mm ein und stellen Sie das Ergebnis
in Form
eines
Histogramms und einer approximierenden Verteilungsfunktion graphisch dar! Begründen Sie die Wahl von X q ! c) Ermitteln Sie mit Hilfe der approximierenden Verteilungsfunktion (vgl. b)) einen Bereich, in dem sich 80% der Beobachtungswerte befinden! d) Teilen Sie die ein: χ
Beobachtungswerte
wie
folgt
in
linksoffene
Klassen
= 29,55, Δ(χ,) = Δ(χ ) = 0,1 mm, Δ(χ„) = A ( x J = Δ(χ.) = Δ(χ„) = 1 6 2 3 4 5 = 0,2 mm! ο
Zeichnen Sie das zugehörige Histogramm! Aufgabe 4 Anzahl der Privathaushalte eines Landes in einem bestimmten Monat mit einem monatlichen Haushaltselnkoimnen von ... bis unter ... DM (in 1000).
I. Beschreibende Statistik
Einkommensklasse unter 1200 1800 2500 3000 4000 5000
3
Anzahl der Haushalte
1200 - 1800 - 2500 - 3000 - 4000 - 5000 und mehr
a) Bestimmen Sie die approximierende
4479 5194 5605 2752 3429 1356 1079
Verteilungsfunktion!
b) Stellen Sie die Häufigkeitsverteilung in Form eines Histogramms einer approximierenden Verteilungsfunktion graphisch dar!
und
c) Bestimmen Sie rechnerisch und graphisch, wie groß der Haushalte ist, der über ein monatliches Nettoeinkommen
der
Anteil
- von weniger als 1 5 0 0 , — DM, - mehr als 3 8 0 0 , — DM, - mehr als 1 7 0 0 , — DM, aber weniger als 2 9 0 0 , —
DM
verfügt! Welche Annahme müssen Sie treffen?
Aufgabe 5 Der Import v o n Unsitten aus dem Ausland läßt nicht nach. Mit der Liberalisierung d e s Sargangebotes begann für das deutsche Bestattungsgewerbe der Kampf ums Überleben. Nicht nur bei der Nachfrage nach Särgen und Urnen befürchtet man "ausländische Zustände". Um tiefere Einblicke in das Nachfrageverhalten beim Kauf v o n Särgen und Urnen zu bekommen, stellt ein Marktforschungsinstitut die folgende Tabelle zusammen. Nachfrage n a c h Särgen und Urnen in einem bestimmten Zeitraum (in % der Gesamtnachfrage)
Nachfrage Särge im Selbstbausatz Leihsärge Cash- und carry Särge Tischlersärge Urnen
Inland 1 0 5 75 19
Ausland 10 6 25 20 39
a) Bestimmen Sie Merkmalsträger, Merkmal und Merkmalstyp!
4
1. Beschreibende Statistik
b) Charakterisieren und vergleichen Sie die beiden Häufigkeitsverteilungen hinsichtlich der zentralen Tendenz und der Streuung! Welche inhaltlichen Aussagen können aus dem Vergleich abgeleitet werden? Aufgabe 6 Bei Straßenverkehrsunfällen mit Personenschaden werden die folgenden Unfalltypen unterschieden: Fahrunfall (A^), Abbiege-Unfall (Α,,), Einbiegen-/Kreuzen-Unfal1 (A^), Überschreiten-Unfall
(A^), Unfall durch ruhen-
den Verkehr (Ag), Unfall im Längsverkehr (Α β ) und Sonstiger Unfall (A^). In einem westeuropäischen Land ereigneten sich in einem bestimmten Jahr insgesamt 374107 Unfälle mit Personenschaden; sie verteilten sich wie folgt auf die genannten Unfalltypen. Unfalltyp A
1
A
2
A
3
A
4
A
5
A
6
Anzahl der Unfälle 75769 54584 83569 39168 12561 65961 42495
a) Stellen Sie die Häufigkeitsverteilung graphisch dar! b) Bestimmen Sie den Modus der Verteilung! c) Berechnen Sie geeignete Streuungs-/Konzentrationsmaße! Aufgabe 7 Bei den Bundestagswahlen 1980 und 1983 erzielten die Parteien die folgenden Ergebnisse:
SPD CDU/CSU FDP Grüne Sonstige
1980
1983
42,9% 44,5% 10,6% 1,5% 0,5%
38,2% 48,8% 7,0% 5,6% 0,4%
a) Läßt sich aus diesen Daten schließen, daß die von 1980 auf 1983 zu-/abgenommen hat?
(Stimmen-)Konzentration
1. Beschreibende Statistik
5
b) Wie ändert sich das Ergebnis, wenn die Stimmenanteile der "Grünen" und der "Sonstigen" zusammengefaßt werden? Hat sich durch diese Zusammenfassung die Konzentration im Vergleich zu Teilaufgabe a) verändert?
Aufgabe 8 A n einer Diplom-Vorprüfung im Fach Statistik nahmen 80 Studierende teil. V o n d e n Teilnehmern haben 8 nicht bestanden (Note 5), 22 haben die Note 4, 28 die Note 3, 20 die Note 2 und zwei die Note 1 erzielt. a) S t e l l e n sie die Häufigkeitsverteilung Häufigkeiten graphisch dar!
und
die
kumulierten
b) Bestimmen Sie für diese Notenverteilung ein Maß der zentralen Tendenz sowie ein geeignetes Streuungsmaß und interpretieren Sie die Ergebnisse.
Aufgabe 9
Holzaufwurf (Kiefer) zweier Forstämter beste, Η schlechteste Qualität) Güteklasse SS TS В с Η
Forstamt А
in
m
3
nach
Güteklassen
(SS
Forstamt В
30 0 10 50 10
160 20 20 0 0
a) Bestimmen Sie Merkmalsträger, Merkmal und Merkmalstyp! b) Charakterisieren und lungen, indem Sie
vergleichen
Sie
die
beiden
Häufigkeitsvertei-
- geeignete Maße der zentralen Tendenz und der Streuung berechnen - u n d die kumulierten Häufigkeitsverteilungen bestimmen!
Aufgabe 10 Zwei Gruppen von Studierenden der Studiengänge "Betriebswirtschaftslehre" und "Germanistik" (kein Doppelstudium!) wurden über ihre Einstellung zur "modernen Lyrik" befragt. Sie konnten ihre Einstellung mit den Skalenwerten 1 (sehr positiv) bis 5 (sehr ablehnend) bewerten. Die Befragung lieferte die beiden folgenden Verteilungen.
6
1. Beschreibende Statistik
Skalenwert 1 2 3 4 5 Vergleichen Verfahren!
Sie
diese
Anzahl der Studierenden der Germanistik der BWL 28 19 20 5 2
1 2 10 10 18
beiden Verteilungen mit
Hilfe
geeigneter
Maße/
Aufgabe 11 Nach einem Bericht des Bayerischen Innenministeriums wird auf den bayerischen Autobahnen immer schneller gefahren. Aufgrund einer umfangreichen Erhebung (bei der nur PKW erfaßt wurden) wurde festgestellt, daß in einem bestimmten Jahr nur 25,3% der Autofahrer bis zu 100 km/h fuhren, zwischen 100 und 130 km/h fuhren 49,27., zwischen 130 und 150 km/h fuhren 19,3% und über 150 km/h fuhren 6,2%. Nach d e n Vorstellungen bestimmter Gruppen soll die Höchstgeschwindigkeit auf Autobahnen auf 110 km/h begrenzt werden. Wieviel Prozent der Autofahrer wären von einer solchen Regelung betroffen?
* Aufgabe 12 Im Bereich der OR-unterstützten Unternehmensplanung sind in vielen Fällen nicht von vornherein alle Kostenaspekte der möglichen Alternativen exakt oder vollständig zu berücksichtigen, da häufig schon recht grobe, dafür aber einfach zu handhabende Modelle hinreichend genaue Hinweise auf einige wenige Planungsalternativen liefern, die ernsthafte Realisierungschancen besitzen. So 1st es beispielsweise üblich, bei der Standortplanung von zentralen Lägern, von denen aus eine gewisse Anzahl von Verkaufsstellen beliefert werden sollen, anzunehmen, daß die Transportkosten zwischen Zentrallager und Verkaufsstelle je Gütereinheit dem quadrierten euklidischen Abstand der beiden Standorte proportional ist. Die folgende Tabelle enthält die Standortangaben (rechtwinklige Rasterkoordinaten) von 5 Verkaufsstellen. Nr. der Verkaufsstelle
X. 1
y
1 2 3 4 5
2 13 5 12 10
2 5 10 17 15
i
1. Beschreibende Statistik
7
a) Geben Sie die Koordinaten des optimalen Standortes des Zentrallagers an, wenn die nachgefragte Menge an allen Verkaufsstellen gleich groß ist und unterstellt wird, daß die Transportkosten dem quadrierten euklidischen Abstsind proportional sind! b) Wie ändert sich das Ergebnis zu a), wenn sich die an den Verkaufsstellen 1, 2, 3, 4 und 5 nachgefragten Mengen wie 2 : 3 : 1 : 6 : 15 verhalten? * Aufgabe 13 Bei der Festlegung des Standortes für eine Feuerwehrwache in einem neu angelegten Stadtteil einer deutschen Kleinstadt erscheint es dem zuständigen Planungsamt wesentlich, daß die folgenden Einrichtungen im Mittel möglichst schnell zu erreichen sind: (1) (2) (3) (4) (5)
Krankenhaus Möbelfabrik Altersheim Hochhaus Schule
Die nachfolgende Skizze zeigt einen Ausschnitt aus dem örtlichen Stadtplan mit den Standorten der fünf besonders schutzwürdigen Einrichtungen (die der Einfachheit halber jeweils an Kreuzungen liegen).
10.0 8.06.0
3.
4.0 2.
2.01. -1
0.0 0.0
1.0
I 2.0
I I I 3.0 4.0
I
. 5.0
6.0
г 7.0
a) Geben Sie die Lage (Koordinaten) der fünf Schutzobjekte in einem geeigneten Koordinatensystem an! b) Die "Straßen-Entfernung" zwischen zwei Kreuzungen ist mit Hilfe ihrer Koordinaten auszudrücken! Beachten Sie dabei die Besonderheiten des angegebenen Straßennetzes! c) Geben Sie die Koordinaten des Standorts für die Feuerwehrwache an! Gehen Sie davon aus, daß die Fahrzeit zwischen zwei Punkten der zurückgelegten Entfernung proportional ist!
8
l. Beschreibende Statistik
d) Wie groß ist die mittlere Entfernung von der Feuerwehrwache zu den fünf Schutzobjekten? e) Wie ändert sich das Ergebnis von Teilaufgabe c), wenn bekannt ist, daß man in west-östlicher Richtung schneller fahren kann als in nord-südlicher Richtung?
Aufgabe 14 Aus der Personalkartei eines Unternehmens wurde von 20 Arbeitnehmern die Betriebszugehörigkeit in (vollendeten) Jahren festgestellt.
Betr1ebszugehör i gke i t in Jahren
Anzahl der Arbeitnehmer
1 2 3 7 9 11 15 18 21 25 29 30 33 47
2 3 1 3 1 1 1 1 1 1 1 1 1
Berechnen Sie aus diesen Angaben a) das arithmetische Mittel und den Median, b) die Standardabweichung Median
und
die
durchschnittliche
Abweichung
vom
und interpretieren Sie die Ergebnisse!
Aufgabe 15 Bei einem Zehnkampf-Wettbewerb der Herren werden im Hochsprung und im lOOm-Lauf von fünf Teilnehmern folgende Leistungen erzielt:
1. Beschreibende Statistik
Teilnehmer
Hochsprung in m
1 2 3 4 5
9
100m in sec.
2,06 1,97 1,91 2,00 2,16
10,83 11,01 11,18 10,65 10,78
Welcher Teilnehmer erzielte in Bezug auf diese beiden Disziplinen die beste Gesamtleistung?
Aufgabe 16 Aus den fünf Abteilungen eines Η.+H.-Marktes werden der Betriebsleitung die folgenden monatlichen Umsätze gemeldet.
Abtei lung
A В С D Ε
2 Umsatz je m Verkaufsfläche
Umsatz
285600,— 273700,— 345100,— 154700,— 130900,—
DM DM DM DM DM
700,— 1100,— 4200,— 1500,— 900,—
DM/nu DM/nu DM/nu DM/nu DM/m
2 Berechnen Sie den durchschnittlichen Umsatz je m Verkaufsfläche!
Aufgabe 17 Im Juni 1991 trafen sich 1500 Manta-Fahrer beim "Internationalen MantaTreffen" im Spessart. Bei den Gesprächen rund ums Auto ging es nicht nur um das Tieferlegen, die Stoßdämpfer und Spoiler, sondern auch um den Benzinverbrauch der Fahrzeuge. Manni I bis V machten dazu folgende Angaben:
Manta von Manni
I II III IV V
Verbrauch je 100 km 12,8 13,4 15,6 14,0 20,2
1 1 1 1 1
Jahresverbrauch je Manta 23040 16080 12480 21000 22220
1 1 1 1 1
10
1. Beschreibende Statistik
Aus diesen Angaben berechnete Manni III den Durchschnittsverbrauch der fünf Mantas wie folgt: χ = =(12,8 + 13,4 + 15,6 + 14,0 + 20,2) = 15,2 (1/100 km). D a) Wieviel 1/100 km haben die fünf Mantas tatsächlich im Durchschnitt verbraucht? b) Unter welcher Bedingung wäre die Berechnung von Manni III richtig? Aufgabe 18 Berechnen Sie aus den folgenden Angaben die durchschnittliche Bevölkerungsdichte der ABC-Länder zu einem bestimmten Zeitpunkt und zwar a) als Beziehungszahl, b) als arithmetisches Mittel, c) als harmonisches Mittel! Land
Fläche in 1000 km
A В С
31 3 41
2
Bevölkerung
Einwohner
in 1000
je km^
9860 363 14140
318 121 345
* Aufgabe 19 a) Für welche reelle Zahl a ist
η Σ (χ -a) = 0 ? y=l 17
1 b) Für welche reelle Zahl b nimmt f(b) = η
П
2 Σ (χ -b) das Minimum an? „ ν
Aufgabe 20 Ein Autofahrer fährt von В nach N. Auf dem Hinweg (rush-hour!) fährt er 7,2 km je Liter Benzin, auf dem Rückweg fährt er 12,0 km je Liter Benzin. Wieviel km fährt er im Durchschnitt je Liter Benzin? Aufgabe 21 Ein Handelsunternehmen hat die Bundesrepublik in vier Vertreterbezirke (Nord, Süd, Ost, West) eingeteilt. Von den Bezirksleitern werden die
1. Beschreibende Statistik
Anzahl der e i n g e s e t z t e n Vertreter und die d u r c h s c h n i t t l i c h e n lichen) V e r t r e t e r p r o v i s i o n e n wie folgt eingegeben.
Bezirk
Anzahl der Vertreter
durchschnittliche Vert r e t e r p r o v i s i o n in D M
Nord Süd Ost West
15 38 22 45
68300,— 70900,— 61500,— 86100,—
11
(Jähr-
DM DM DM DM
B e r e c h n e n S i e die durchschnittliche V e r t r e t e r p r o v i s i o n f ü r d a s u n t e r n e h m e n u n d d i e Summe der Vertreterprovisionen!
Handels-
Angenommen, e s w ü r d e (aus d i e s e n Daten) die Varianz der d u r c h s c h n i t t lichen V e r t r e t e r p r o v i s i o n e n berechnet; w i e wäre d i e s e z u e r k l ä r e n ?
A u f g a b e 22 V e r a n s c h a u l i c h e n Sie mit Hilfe der e m p i r i s c h e n Verteilungsfunktion, daВ der M e d i a n - wie a u c h die Quantile - nicht immer e i n d e u t i g bestimmbar ist!
Aufgabe 23 A n e i n e r W i e d e r h o l u n g s k l a u s u r in S t a t i s t i k h a b e n 24 S t u d i e r e n d e teilgenommen. Die e r z i e l t e n Punkte - maximal 100 - enthält die f o l g e n d e Tabelle.
V
u
1 2 3 4 5 6
45 63 67 24 38 51
V
V 7 8 9 10 11 12
u
у
V
57 94 85 5 66 75
13 14 15 16 17 18
u
V
12 33 84 59 17 81
V 19 20 21 22 23 24
u
V
79 9 84 29 90 83
W e r t e n Sie d i e s e Informationen s t a t i s t i s c h aus, indem Sie -
die H ä u f i g k e i t s v e r t e i l u n g u n d die k u m u l i e r t e n H ä u f i g k e i t e n bestimmen, die Quartile, e i n Lagemaß u n d - falls e r f o r d e r l i c h - e i n S t r e u u n g s m a ß berechnen!
Welche d i e s e r E r g e b n i s s e lassen s i c h sinnvoll
interpretieren?
geeignetes
12
1. Beschreibende Statistik
Aufgabe 24 Von einer Häufigkeitsverteilung seien nur χ = 81 und s 2 = 16 bekannt. Lassen sich aus diesen Angaben weitere Informationen über die Häufigkeitsverteilung ableiten? Wenn ja, welche?
Aufgabe 25 Ein Unternehmen der Investitionsgüterindustrie hat in einem bestimmten Jahr für die (männlichen) Arbeiter und Angestellten ein durchschnittliches Bruttojahresgehalt in Höhe von 38502,40 DM bezahlt. Das durchschnittliche Bruttojahresgehalt der (männlichen) Arbeiter betrug 32720,— DM und das der (männlichen) Angestellten 50790,— DM. Wieviel Prozent der (männlichen) Arbeitnehmer waren Angestellte?
Aufgabe 26 In einem Entwicklungsland wird an einem bestimmten Stichtag eine Volkszählung durchgeführt. Die folgende Tabelle enthält die Altersverteilung der Bevölkerung an diesem Tag. Alter von . . . bis Anteil der Bevölkerung im Alter unter Jahren von ... bis unter ... Jahren 0 - 15
44,6%
15 - 30
25,7%
30 - 45
14,2%
45 - 65
10,8%
65 und älter
4,7%
a)Bestimmen Sie - approximativ - das Durchschnittsalter der Personen dieser Bevölkerung am Erhebungsstichtag durch Berechnung des arithmetischen Mittels und des Medians. Welche der beiden Maßzahlen ist besser geeignet, das mittlere Alter der Bevölkerung anzugeben? b)Die Regierung dieses Landes will aufgrund der Volkszählungsergebnisse das Rentenalter neu festlegen. Nach den vorliegenden Plänen sollen die 10% ältesten Personen der Bevölkerung in den sofortigen Genuß der Rente kommen. Wie ist (approximativ) die Altersgrenze für den Bezug einer Rente festzulegen?
* Aufgabe 27 Gegeben seien zwei Häufigkeitsverteilungen 1 und 2 eines Merkmals X mit nx = 60 bzw. n 2 = 40 Merkmalsträgern. Es sei xx = x 2 = 70, s^ = 188 und s 2 = 160. Beide Häufigkeitsverteilungen werden zusammengefaßt.
1. Beschreibende Statistik
a) Es ist die Standardabweichung teilung zu bestimmen! b) Was ergäbe sich, wenn χ
der
= 70 und χ
zusammengefaßten
13
Häufigkeitsver-
= 50 wäre?
Aufgabe 28 Bei der Prüfung der Tragkraft von Plastik-Tragetaschen der Sorten Α und В ergaben sich folgende Häufigkeitsverteilungen.
Tragkraft von . . . bis unter ... kg
Anzahl der Tragetaschen Sorte Α Sorte В
unter 6,4 6,4 - 7,4 7,4 - 8,4 8,4 - 9,4 9,4 - 10,4 10,4 - 11,4 11,4 - 12,4 12,4 - 13,4 13,4 - 14,4 14,4 und mehr
16 16 30 84 136 98 50 36 24 10
6 4 14 35 67 48 22 20 0 4
Charakterisieren und vergleichen Sie die beiden Verteilungen mit geeigneter Maße/Verfahren!
Hilfe
Aufgabe 29 Versorgungsempfänger im Öffentlichen Dienst nach Laufbahngruppen
Laufbahngruppe
Einfacher Dienst(E) Mittlerer Dienst (M) Gehobener Dienst (G) Höherer Dienst (H)
Anzahl der Versorgungsempfänger 1.2.1983 1.2. 1977 181168 391083 275277 149988
Beurteilen Sie die zeitliche Entwicklung,
207095 382420 263540 138060
indem Sie
- die relativen und kumulierten relativen Häufigkeiten bestimmen, - zeitliche Meßzahlen für die einzelnen Laufbahngruppen und für den öffentlichen Dienst insgesamt berechnen und die Ergebnisse interpretieren!
14
I• Beschreibende Statistik
* Aufgabe 30 Die folgenden Häufigkeitsverteilungen eines klassierten Merkmals sind durch geeignete Maßzahlen zu charakterisieren!
Klassen 130 150 170 190 210 230 250
b.u. b.u. b.u. b.u. b.u. b.u. b.u.
n
150 170 190 210 230 250 270
Ji2 )
(1) i
n
n „
(3)
i
0 12 52 72 52 12 0
2 10 42 92 42 10 2
metrischen
2 12 50 58 76 2 0
Kommentieren Sie die Ergebnisse! Stellen Sie die Verteilungen graphisch dar!
Aufgabe 31 In der folgenden Tabelle sind die Längen der fünf Etappen einer Fahrradrundfahrt in Spanien und die jeweilige Durchschnittsgeschwindigkeit des Siegers des gesamten Rennens aufgeführt.
Etappe i
1 2 3 4 5
Länge der i-ten Etappe in km
Durchschnittsgeschwindigkeit des Siegers in km/h auf der 1-ten Etappe
135 325 70 175 295
a) Stellen Sie die graphisch dar!
23 38 27 26 34
empirische
Verteilungsfunktion
b) Berechnen Sie für die Etappenlänge St reuungsmaß!
der
Etappenlänge
Jeweils ein geeignetes Lage- und
c) Mit welcher Durchschnittsgeschwindigkeit gesamten Rennens?
fuhr der Sieger während des
1. Beschreibende Statistik
15
Aufgabe 32 Gegeben sind die durchschnittlichen Heizölpreise und die Varianzen (bei Abnahme von 8000 bis 10000 1) ohne Mehrwertsteuer in einer bestimmten Woche für den Raum Köln, Paris und London. Raum
Durchschni ttspre i s
Köln
65,45 (DM/100 1)
0.30 (DM/100 l) 2
Paris
228,95 (FF/100 1)
7,53 (FF/100 l) 2
London
15,6
(£/100 1)
Varianz
0,012 (Г/100 l) 2
Wie kann man etwas über die Streuung der Preise aussagen, ohne den Wechselkurs in die Überlegungen einzubeziehen? Aufgabe 33 Bei einem Zehnkampf-Wettbewerb der Herren werden in den Disziplinen Hochsprung, lOOm-Lauf und Kugelstoßen von fünf Teilnehmern folgende Leistungen erzielt: Teilnehmer 1 2 3 4 5
Hochsprung in cm 206 197 191 200 216
100m in sec 10,83 11,01 11,18 10,65 10,78
Kugelstoßen in m 17,58 16,76 15,60 16,82 17,24
In welcher Disziplin waren die durchschnittlichen Leistungsunterschiede am größten? Beantworten Sie diese Frage durch Berechnungen einer geeigneten Maßzahl! * Aufgabe 34 Zwei Dreher stellen eine größere Anzahl von zwei verschiedenen Wellen her. Um die Qualität der Arbeit dieser Dreher zu beurteilen, wurden der Produktion je zehn Wellen entnommen, und es wurde ein für die Präzision (Qualität) maßgebliches Merkmal (zum Beispiel der Durchmesser der Wellen a n einer bestimmten Stelle) gemessen. Die Messungen lieferten folgende Ergebnisse (in mm).
16
1. Beschreibende Statistik
Dreher 1 50,89 51,01 50,36 50,69 50,66 50,09 50,70 51,07 50,94 50,80
Dreher 2 20,09 20,84 20,57 20,50 20,47 20,06 20,48 20,27 20,94 20,51
Begründen Sie, warum es nicht möglich ist, mit den gegebenen Informationen und d e n Ihnen bekannten statistischen Verfahren die Qualität der Arbeit dieser beiden Dreher zu beurteilen! Analysieren Sie inhaltlich, welche Probleme beim Vergleich der Qualität der Arbeit dieser Dreher auftreten können!
Aufgabe 35 Zeitungsverlage und Beschäftigte eines bestimmten Landes zu einem stimmten Zeitpunkt nach Beschäftigtengrößenklassen Verlage mit ... bis ...Beschäftigten bis 9 10 - 19 20 - 49 50 - 99 100 - 199 200 - 499 500 - 999 1000 und mehr
Anzahl der Verlage 14 19 38 51 57 62 36 34
be-
Anzahl der Beschäftigten 86 294 1265 3629 7799 20298 25270 65656
a) Berechnen Sie die Anzahl der Verlage mit mehr als 150 Beschäftigten! b) Wieviel Beschäftigte haben die Verlage im Mittel? c) Warum kann χ hier exakt bestimmt werden? d) Die Hälfte der Beschäftigten arbeitet in Verlagen mit höchstens d Beschäftigten. Berechnen Sie d!
1. Beschreibende Statistik
17
Aufgabe 36 Auf einer Geflügelfarm werden täglich rd. 2500 Eier produziert, die find e n Verkauf sieben Güteklassen (Gewichtsklasse 1 = beste Qualität: 70 g und mehr) zugeordnet werden. Mit Hilfe einer neuen Kraftfuttermischung hofft man, die Qualität der Eier wesentlich verbessern z u können. Ein halbes Jahr nach der Einführung der neuen Kraftfuttermischung liegen die folgenden Daten vor.
Güteklasse
Durchschnittliche Anzahl mit Standardkraftfutter in %
1 2 3 4 5 6 7
50 200 449 873 524 249 150
2 8 18 35 21 10 6
Σ
2495
100
[er täglich produzierten Eier mit neuer Kraftfuttermischung in '/. 127 357 637 892 382 127 25 2547
5 14 25 35 15 5 1 100
Werten Sie diese Daten mit Hilfe geeigneter statistischer Verfahren/Maße aus!
Aufgabe 37 Berechnen Sie aus den Daten der Aufgabe 3 das arithmetische Mittel, Varianz und die Standardabweichung
die
a) aus den Einzelwerten, b) aus den gemäß 3 d) klassierten Werten!
Aufgabe 38 Grundlage ist die Aufgabe 3! a) Bestimmen Sie d e n Median aus den Einzelwerten, mit Hilfe der approximierenden Verteilungsfunktion gemäß 3 b) und aus den gemäß 3 d) klassierten Werten! b) Bestimmen Sie die durchschnittliche (absolute) Abweichung vom Median aus den Einzelwerten und aus den gemäß 3 d) klassierten Werten!
18
1. Beschreibende Statistik
Aufgabe 39 Die folgenden Daten für ein westeuropäisches Land sind durch die Berechnung geeigneter Verhältniszahlen (Beziehungszahlen, Meßzahlen mit fester und wechselnder Basis) auszuwerten!
Jahr
Chemische Industrie Bruttoprodukt ionswert Personalkosten in Mio. DM in Mio. D M
1981 1982 1983 1984 1985
113090 115019 134994 133103 143041
25682 26920 29245 30247 31877
* Aufgabe 40 Vergleichen Sie anhand der folgenden Daten das Sterblichkeitsniveau der Bundesrepublik Deutschland mit dem Griechenlands, indem Sie a) die rohe Sterberate: gS _ Anzahl der im Kalenderjahr Gestorbenen ^ Ю С Ю durchschnittlicher Bevölkerungsbestand ' im Kalenderjahr b) altersspezifische Sterberaten: Anzahl der im Kalenderjahr Gestorbenen der i-ten ^ S _ Altersklasse i durchschnittlicher Bevölkerungsbestand der i-ten Altersklasse im Kalenderjahr
>
1000
für beide Bevölkerungen berechnen! c) Weisen Sie nach, daß die rohe Sterberate das arithmetische Mittel der mit den Bevölkerungsanteilen in den jeweiligen Altersklassen gewichteten altersspezifischen Sterberaten ist! d) Berechnen Sie sogenannte standardisierte rohe Sterberaten, indem Sie die altersspezifischen Sterberaten der Bundesrepublik Deutschland mit der Altersstruktur Griechenlands gewichten und umgekehrt. Wie sind diese Werte insbesondere im Hinblick auf die Ergebnisse von Tellaufgäbe a) zu interpretieren? Altersstruktur der Bevölkerung und der Gestorbenen in der Bundesrepublik Deutschland und in Griechenland 1978
1. Beschreibende Statistik
i
Altersklassen
mittlerer Bevölkerungsbestand BRD Griechenland in 1000 in 1000
1 2 3 4
u. 15 30 45
15 b. u.30 b.u.45 b. u.65
5
65 u.älter Σ
-
19
Gestorbene BRD Griechenland
12009 13558 13086 13300
2189 1996 1840 2131
13134 13750 25300 113408
3676 1426 2199 13415
9373
1205
557617 J)
60872^
61326
9361
723209
81588
1) Einschließlich Alter unbekannt. Quelle: United Nations (Hrsg.), Demographie Yearbook, New York 1979.
Aufgabe 41 Anzahl der Studierenden in einem Wintersemester an einer kleinen Universität
Studienabschnitt Fakultät Katholische Theologie
Erstes Fachsemester
Höhere Fachsemester
45
199
Pädagogik, Philosophie, Psychologie
160
962
Sozialwesen
140
545
Sprach- und Literaturwissenschaften
162
466
Geschichts- und Geowi ssenschaft en
144
371
Sozial- und Wirtschaftswissenschaften
354
520
Bestimmen Sie a) die gemeinsame Häufigkeitsverteilung und die Randverteilungen, b) die bedingten Verteilungen und interpretieren Sie ausgewählte Werte dieser Verteilungen!
20
1 Beschreibende Statistik
Aufgabe 42 Zur Wohnbevölkerung eines Landes zählten Personen, darunter 32189900 weibliche. differenzierte Wohnbevölkerung verteilte Fami1ienstand.
Familienstand (A)
ledig verheiratet verwitwet geschieden
an einem Stichteig 61712800 Die nach dem Geschlecht s i c h wie folgt auf den
Geschlecht (B) männlich weiblich 0,442 0,508 0,026 0,024
0,354 0,470 0,144 0,032
Interpretieren Sie ausgewählte Werte dieser Tabelle und ermitteln die gemeinsame Häufigkeitsverteilung der beiden Merkmale sowie Randverteilungen!
Sie die
Aufgabe 43 Eheschließungen in einem bestimmten Religionszugehörigkeit der Ehepartner
Religionszugehörigkeit des Mannes
evangelisch röm. -kath. anders christl. jüdisch jj sonstige
Land
und
Jahr
nach
evangelisch
Religionszugehörigkeit der Frau röm.anders jüdisch sonstige kath. christl.
93349 42282 923 36 20122
43503 111515 915 45 12094
920 833 2983 1 444
29 19 61 25
der
6311 3799 207 34 19208
1) Sonstige Religion, freireligiös, gerneinschaftlos und ohne Angabe. Bestimmen Sie a) die gemeinsame Häufigkeitsverteilung der Merkmale Α (Religionszugehörigkeit des Mannes) und В (Religionszugehörigkeit der Frau) sowie die Randverteilungen, b) die bedingten Häufigkeitsverteilungen
f ( A . u n d
terpretieren Sie die Werte f(A 2 |B 2 ) und f ( B 2 | A 2 ) !
f С В^|A 2 ) und in-
1. Beschreibende Statistik
21
Aufgabe 44 Die folgende Vierfeldertafel enthält relative Häufigkeiten. Sie ist unter der Annahme, daß die Merkmale Α und В statistisch unabhängig sind, zu vervollständigen!
\ А
В \ 0
0
1
Σ
J 0, 144
1 Σ i
0,520
Aufgabe 45 Ein Dozent pflegt aus pädagogischen Gründen seinen (meist weiblichen) Hörern tief in die Augen zu blicken. Ihm deucht, daß es zwischen Augenund Haarfarbe einen Zusammenhang gibt. In Denkpausen fertigt er die folgende Übersicht an.
Augenfarbe grau
grün
blau
4 10 12
18 6 4
Haarfarbe blond brünett schwarz
1 15 10
a) Sind die beiden Merkmale statistisch unabhängig? b) Berechnen diese!
Sie
geeignete
Zusammenhangsmaße
und
interpretieren
Sie
2 c) Wie ändert sich der Wert von χ (bzw. V), wenn in der Tabelle alle Häufigkeiten mit с > 0 multipliziert werden? d) Welche Auswirkungen auf die Werte der Zusammenhangsmaße Vertauschen von Zeilen und Spalten der Tabelle?
hat
ein
* Aufgabe 46 Den Rauchgewohnheiten wird ein erheblicher Einfluß auf verschiedene Krankheitsrisiken zugeschrieben. Die folgende Tabelle enthält Angaben über Rauchgewohnheiten und Gesundheitszustand der Bürger (über 15
22
1. Beschreibende Statistik
Jahren) eines westeuropäischen Landes in einem bestimmten Monat in 1000 Einwohnern).
(Angaben
Rauchgewohnheiten Gesundheitszustand
zur Zeit regelmäßig
zur Zeit gelegentlich
zur Zeit nicht, aber früher regelmäßig oder gelegentlich
niemals
insgesamt
Kreislaufkrankheiten
360
90
310
1280
2040
Krankheiten der Atmungsorgane
450
100
190
720
1460
40
100
370
750
12300
2480
3380
23620
41780
13350
2710
3980
25990
46030
Krankheiten der Verdauungsorgane keine oder sonstige Krankheiten insgesamt
240
Ein Statistiker möchte ein beiden Merkmalen berechnen.
geeignetes
Zusammenhangsmaß
zwischen
den
a) Welches Problem bei einem der beiden Merkmale macht die Berechnung des Zusammenhangsmaßes eigentlich unmöglich? Wodurch hätte dieses Problem gelöst werden können? b) Berechnen Sie trotzdem auf der Basis der vorliegenden Informationen den Wert des Zusammenhangsmaßes. Berücksichtigen Sie bei der Ergebnisinterpretation die Überlegungen von Teilaufgabe а)!
Aufgabe 47 In einem Sanatorium für Manager wird versucht, den Gedächtnisschwund mit Hilfe von Frischzellen und Tiefschlaf zu heilen. Von der Gruppe 1 (n^=100) der mit Frischzellen und Tiefschlaf behandelten werden 80, von der
Kontrollgruppe
2
(n 2 =100)
der
nicht
(mit
Frischzellen
und
Tief-
schlaf) behandelten werden 55 geheilt. a) Wie stark ist der Zusammenhang zwischen Behandlungsmethode und -ergebnis? Kann auch die Richtung des Zusammenhangs gemessen werden? b) Ändert s i c h das Ergebnis, wenn aufgrund einer differenzierteren (weiteren) Untersuchung die folgenden Daten zur Verfügung stehen?
1. Beschreibende Statistik
\Behandlungsergebnis Behändlungsmetho de\
geheilt
unverändert
23
verschlechtert
Frischzellen und Tiefschlaf
40
35
25
nur Tiefschlaf
30
40
30
keine Behandlung
25
25
50
Hinweis: Die Behandlungsmethode sei ein komparatives Merkmal mit den Ausprägungen 1 (keine Behandlung), 2 (nur Tiefschlaf) und 3 (Frischzellen und Tiefschlaf). Aufgabe 48 Nach Abschluß des Grundstudiums werden 20 Studierende nach ihren Leistungen in Statistik und Jura in eine Rangordnung gebracht. Das Ergebnis enthält die folgende Tabelle.
Lfd. Nr. 1 2 3 4 5 6 7 δ 9 10
Rang Statistik Jura 3 4 7 19 17 12 9 2 10 18
16 11 7 9 13 20 1 3 4 14
Lfd. Nr. 11 12 13 14 15 16 17 18 19 20
Rang Statistik
Jura
15 13 1 16 5 6 8 20 11 14
8 6 5 15 2 12 10 18 17 19
Berechnen Sie den Rangkorrelationskoeffizienten nach KENDALL und interpretieren Sie das Ergebnis!
Aufgabe 49 Entscheidend für die Leistungsfähigkeit eines Teams ist neben anderen Faktoren auch die Führungsqualität des Teamleiters. Eine Forschungsgemeinschaft aus Personalwissenschaftlern und Organisationspsycho logen hat im Rahmen einer empirischen Untersuchung zunächst eine Methode zur Messung der Führungsqualität von Teamleitern entwickelt, um dann bei 100 Arbeitsgruppen mit untereinander vergleichbaren Aufgaben die FUhrungsqualität des Gruppenleiters und die Leistung der Arbeitsgruppe (gemessen durch die Wertschöpfung je Gruppenmitglied in einem bestimmten Zeitraum) zu erheben. Die Ergebnisse dieser Umfrage
24
l- Beschreibende Statistik
sind in der Tabelle dargestellt. \
Führungsqualität Wert-\ schöp— fung ( i n ^ y TDM) \ 4
gering
mittel
hoch
30 10 5
10 5 5
5 20 10
0 - 100 100 - 200 über 200
a) Geben Sie Merkmalsträger, Merkmale und Merkmalstypen an! b) Bestimmen Sie durch Berechnung einer geeigneten Maßzahl die und die Richtung des monotonen Zusammenhangs zwischen den Merkmalen! c) Können Sie aus dem Ergebnis von Teilaufgabe b) Abhängigkeit der Merkmale schließen? Begründung!
auf
Stärke beiden
statistische
Aufgabe 50 An einem größeren Lehrstuhl soll eine (Halbtags-) Sekretärin eingestellt werden. Angesichts der Arbeitsmarktlage finden sich nur sieben Bewerberinnen ein, die zum einen von der Frauenbeauftragten (F) und dem Lehrstuhlinhaber (L), zum anderen von den beiden Assistenten (Al und A2) nach ihren Fähigkeiten eingestuft werden. Die
Ergebnisse
der
Einstufung
finden
sich
in
der
folgenden
Tabelle
(A = hohe Qualifikation,..., L = geringe Qualifikation).
Bewerberin Nr. 1 2 3 4 5 6 7
Einstufung F
L
Al
A2
Ε В А С G F J
D A С В Ε F G
В A A С D С L
С A A С Ε A G
a) Stellen Sie fest, inwieweit ein Zusammenhang besteht zwischen den Einstufungen der Bewerberinnen von der Frauenbeauftragten und dem Lehrstuhlinhaber einerseits sowie von den beiden Assistenten andererseits! Interpretieren Sie die Ergebnisse! b) Welche Bewerberin würden Sie einstellen?
1. Beschreibende Statistik
25
A u f g a b e 51 Z u B e g i n n eines jeden F O R T R A N - K u r s e s pflegt der D o z e n t die S t u d i e r e n d e n auf d e n e n g e n Z u s a m m e n h a n g z w i s c h e n d e n p r a k t i s c h e n Ü b u n g e n (gemessen d u r c h die Anzahl d e r Läufe) und der Note, die d e r e i n z e l n e Student erzielt, hinzuweisen. Bei B r a u s e v e r f e h l e n solche "einfältigen, p s y c h o l o g i s c h e n T r i c k s " ihre Wirkung. D a er j e d o c h d u r c h s e i n schlechtes A b s c h n e i d e n in S t a t i s t i k verunsichert ist, beschließt er, d e n D i n g e n auf d e n G r u n d z u gehen. Er besorgt s i c h die n ö t i g e n D a t e n (siehe unten) und wertet s i e s t a t i s t i s c h aus. Die f o l g e n d e T a b e l l e enthält die Anzahl der Punkte der K l a u s u r t e i l n e h m e r des F O R T R A N - K u r s e s eines Wintersemesters und die Anzahl ihrer Läufe.
Punkte Lauf e 0 10 20 40 80
bis 9 bis 19 bis 39 bis 79 bis 170
0 bis 39 10 3 4 0 0
40 bis 49
50 bis 69
70 bis 89
9 0 b i s 100
4 3 1 2 0
2 0 4 3 2
0 0 1 2 0
0 0 0 0 1
Brause versucht, d i e f o l g e n d e n F r a g e n z u beantworten: a) W i e g r o ß ist die mittlere Anzahl der Läufe - v o n Studierenden, die die Prüfung nicht bestanden, weil s i e weniger als 40 Punkte erzielt haben, - v o n S t u d i e r e n d e n mit 70 und mehr P u n k t e n ? b) Ist der (statistische) Zusammenhang z w i s c h e n d e r Anzahl der Läufe und der e r z i e l t e n Note in der Tat so e n g (und p o s i t i v ) w i e d e r Dozent behauptet?
Aufgabe 52 Die f o l g e n d e n T a b e l l e n e n t h a l t e n die N o t e n der W i r t s c h a f t s s t u d e n t e n in d e n P r ü f u n g s f ä c h e r n Betriebswirtschaftslehre u n d V o l k s w i r t s c h a f t s l e h r e bzw. S t a t i s t i k u n d Recht in einer Diplom-Vorprüfung.
26
1. Beschreibende Statistik
\
Note in \ VWL Note \ in BWL \ 1 2 3 4 5 insges.
1
2
3
4
5
insges.
0 0 0 0 0
0 1 3 0 0
0 0 11 15 4
0 0 0 5 4
0 0 1 2 3
0 1 15 22 11
0
4
30
9
6
49
a) Bestimmen Sie jeweils den Mittelwert der Noten in BWL, VWL, Statistik und Recht! Welche Note wurde insgesamt zun häufigsten vergeben? b) Wieviel Prozent der Studierenden haben in den einzelnen Fächern nicht bestanden (Note 5)? c) In jedes Vordiplomzeugnis wird eine Gesamtnote, und zwar das arithmetische Mittel der Einzelnoten in BWL, VWL, Statistik und Recht, eingetragen. Nehmen Sie dazu aus statistischer Sicht Stellung! d) Überprüfen Sie an Hand einer geeigneten Maßzahl, wie stark der (statistische) Zusammenhang zwischen den Merkmalen "Note in BWL" und "Note in VWL" einerseits und "Note in Statistik" und "Note in Recht" andererseits ist! Interpretieren Sie die Ergebnisse! Aufgabe 53 Ein Testinstitut untersucht die Abhängigkeit der Geschwindigkeit bestimmter PKW-Typen. Zu verschiedenen PKW eines Typs 120 Testfahrten Testfahrten wird mit besonderen Meßgeräten die
des Benzinverbrauchs von diesem Zweck werden mit durchgeführt. Bei diesen Geschwindigkeit (in km/h)
1. Beschreibende Statistik
27
und der Benzinverbrauch (in 1/100 km) gemessen. Die Ergebnisse Testfahrten sind in der folgenden Übersicht zusammengefaßt.
Geschwindikeit (X) von . . bis unter . . km/h 20 40 60 80 100 120 140 160
-
Benzinverbrauch (Y) von . . . bis unter . . 1/100 km 4-6 6-8 8-10 14-16 10-12 12-14
40 60 80 100 120 140 160 180
-
-
Σ
5 2
7
12
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
6 1
6 6
4 12
25 12 9 18 11 8 18 19
14
19
28
120
-
-
6 2
-
-
-
4 12 6
22
21
Σ
1 7
3 5 6 5 2
-
16
a) Bestimmen Sie die gemeinsame Häufigkeitsverteilung Merkmale sowie die Randverteilungen! b) Bestimmen Sie die bedingten Verteilungen der interpretieren Sie je eine!
der
der
beiden
beiden Merkmale
und
c) Bei welchem Anteil von Testfahrten war der Verbrauch höher als 11 1/100 km? 2 2 d) Berechnen Sie χ und y, s^ und s^ sowie die bedingten Mittelwerte und -
2
2
Varianzen x(y,), y(x. ), sx (y ) und s v (x ) für alle i und j! 1 J J I i e) Interpretieren Sie je einen bedingten Mittelwert und je eine bedingte Varianz! f) Berechnen
Sie
die
uncl
Korrelationsverhältnisse
^γ|χ
unt
*
interpretieren Sie diese! g) Stellen Sie die Regressionslinien x(Y) und y(X) graphisch dar! h) Sind die beiden Merkmale statistisch unabhängig? i) Berechnen Sie den Korrelationskoeffizienten das Ergebnis!
und
interpretieren Sie
Aufgabe 54 Bei einer Einkommens- und Verbrauchsstichprobe wurde unter anderem das monatliche Haushalts(netto-)einkommen und der Wertpapierbesitz (Tageswerte) privater Haushalte zu einem bestimmten Zeitpunkt erfaßt.
28
1. Beschreibende Statistik
Für die 5,8 Mio. privaten Haushalte dieser Stichprobe ergab folgende Verteilung (Angaben in DM bzw. in Millionen Haushalte). \Wert der Wert\ p a p i e r e (Y) Haushaltsein-\ kommen (X) unter 1200 1200 b.u. 2200 2200 b.u. 4000 4000 b.u. 20000 insgesamt
unter 2000
2000 bis unter 5000
5000 bis unter 15000
15000 bis unter 60000
sich
insges.
0,1 0,5 0,4 0,0
0,1 0,5 0,5 0, 1
0,3 0,7 0,7 0 , 1
0,2 0,5 0,8 0.3
0,7 2,2 2,4 0,5
1,0
1.2
1,8
1,8
5,8
a) Bestimmen Sie die empirische Regressionsbeziehung des Wertes der Wertpapiere in Abhängigkeit vom Haushaltseinkommen und interpretieren Sie diese! b) Stellen Sie die zu a) gehörende Regressionslinie graphisch dar! c) Kann der Graphik entnommen werden, daß der Wert des Wertpapierbesitzes im Mittel von der Höhe des monatlichen Nettoeinkommens abhängt? Überprüfen Sie Ihre Feststellung durch Berechnung einer geeigneten Maßzahl!
» Aufgabe 55 Zeigen Sie, daß sich das Bestimmtheitsmaß und der Korrelations— koeffizient nicht ändern, wenn an Stelle der ursprünglichen Merkmale X und Y die (mit a,c€lR und b,d>0) transformierten Merkmale X* = (X-a)/b und Y* = (Y-c)/d verwendet werden! Inwiefern ist diese Tatsache für praktische Anwendungen von Bedeutung?
Aufgabe 56 Eine wichtige Aufgabe der Bevölkerungsstatistik ist die Bereitstellung von Verfahren zur Messung demographischer Phänomene wie zum Beispiel der Fruchtbarkeit. Im Regelfall existieren mehrere, im Prinzip gleichwertige Verfahren zur Messung eines Phänomens. Im folgenden werden zwei Verfahren zur Messung der Fruchtbarkeit einer Bevölkerung vorgestellt: die rohe Geburtenrate, definiert als Verhältnis zwischen der Anzahl der Lebendgeborenen eines Jahres und dem mittleren Bevölkerungsbestand, und die allgemeine Geburtenrate, definiert als Verhältnis zwischen der Anzahl der Lebendgeborenen eines Jahres und dem mittleren Bestand an Frauen im Alter zwischen 15 und 44 Jahren. Die folgende Tabelle enthält die Werte beider Maßzahlen (jeweils multipliziert mit 1000) für die Bevölkerung einiger Länder.
1. Beschreibende Statistik
Land
rohe Geburtenrate (Y)
1 2 3 4 5 6
9,5 9,4 9,5 10, 1 10, 1 10, 1
29
allgemeine G e b u r t e n r a t e (X) 45,4 44,4 44,3 46,7 46,6 46,2
a) B e r e c h n e n Sie die ausgleichende R e g r e s s i o n s g e r a d e
X(Y)!
b) B e r e c h n e n Sie d e n K o r r e l a t i o n s k o e f f i z i e n t e n n a c h BRAVAIS/PEARSON! c) Interpretieren Sie das Ergebnis v o n Teilaufgabe b)
inhaltlich!
A u f g a b e 57 Zur Ü b e r p r ü f u n g der Wirkung eines Düngemittels für G e t r e i d e w u r d e n sechs benachbarte Versuchsfelder von jeweils einem Hektar Größe in v e r s c h i e d e n e m Maße gedüngt. Die D ü n g e m i t t e l m e n g e n u n d die E r t r ä g e s i n d i n der f o l g e n d e n Tabelle dargestellt (Angaben jeweils in kg):
Feld А В С D Ε F
Menge des Düngemittels (X) 80 200 240 140 400 320
Ertrag (Y) 2700 3250 3500 3100 4000 3800
a) S t e l l e n Sie die Werte der T a b e l l e g r a p h i s c h d a r und ü b e r p r ü f e n Sie a n h a n d d i e s e r Zeichnung, o b es gerechtfertigt ist, e i n e n a n n ä h e r n d l i n e a r e n Zusammenhang z w i s c h e n d e n b e i d e n M e r k m a l e n anzunehmen! b) B e r e c h n e n Sie die Parameter der a u s g l e i c h e n d e n R e g r e s s i o n s g e r a d e n Y(X), interpretieren Sie diese Werte und z e i c h n e n Sie die G e r a d e in d a s S t r e u u n g s d i a g r a m m ein! c) Lohnt s i c h der Einsatz des Düngemittels, w e n n 1 k g 0,80 D M k o s t e t und f ü r e i n e n Doppelzentner G e t r e i d e e i n Preis v o n D M 3 0 , — erzielt werden kann? d) W e l c h e n Hektar-Ertrag könnte m a n bei g l o b a l e r Gültigkeit d e r in Те11aufgäbe b) berechneten Regressionsgeraden bei einem D ü n g e m i t t e l e i n s a t z v o n 1500 k g pro Hektar e r w a r t e n ? Ist dieses E r g e b n i s realistisch?
30
l. Beschreibende Statistik
Aufgabe 58 In einem Fami1ienunternehmen herrscht Uneinigkeit über die zukünftige Unternehmenspolitik. Während der mittlerweile hochbetagte Unternehmensgründer weiterhin an personal intensiven Produktionsverfahren festhalten will, spricht sich sein als Geschäftsführer tätiger Enkel für ein kapitalintensiveres Verfahren bei gleichzeitigem Personalabbau aus. Um seinem Großvater zu zeigen, daß der von diesem unterstellte Zusammenhang zwischen Personaleinsatz und Produktionsergebnis keineswegs so eng ist wie dieser zu glauben scheint, stellt er in einer Tabelle die durchschnittliche Anzahl der Beschäftigten und die Umsätze verschiedener Betriebe seines Gewerbezweiges im letzten Jahr zusammen. Betrieb
Anzahl der Beschäftigten (in Tsd. )
A В С D
1,5 3,6 2,4 0,5
Umsatz (in Mio.) 400 500 200 100
Berechnen und interpretieren Sie den Wert eines Zusammenhangsmaßes für die beiden betrachteten Merkmale!
geeigneten
Aufgabe 59 Zu den unabdingbaren Pflichten eines Besuchers des "Yellowstone National Park" in d e n Vereinigten Staaten gehört auch die Beobachtung einer Eruption von "Old Faithful", dem größten Geysir des Landes. Der "Old Faithful Staff" weist in einem speziellen Merkblatt darauf hin, daß zwischen der Dauer einer Eruption und der Zeit zwischen zwei Eruptionen ein sehr enger (wechselseitiger) linearer Zusammenhang besteht, so daß jeder Besucher anhand einer Tabelle den Zeitpunkt der Jeweils nächsten Eruption bestimmen und sich rechtzeitig mit Filmen und dergleichen versorgen kann. Ein Europäer glaubt das nicht. Aufgrund einer längeren Beobachtungsserie ordnet er acht Eruptionen deren Dauer und die Zeit, die zwischen dem Beginn einer Eruption und dem Beginn der darauf folgenden Eruption verstrichen ist (= "Zwischenzeit"), zu. Dauer einer Eruption in min 2,8 3, 1 3,9 4,9 1,4 2,2 4, 1 4,5
Zwischenzeit in min 65 65 76 98 50 56 88 89
1. Beschreibende Statistik
31
a) Bestimmen Sie die Parameter der ausgleichenden Regressionsgeraden, aus der abgelesen werden kann, wie groß - im Mittel - die Zwischenzeit bei vorgegebener Eruptionsdauer ist! b) Wann ist mit der nächsten Eruption zu rechnen, w e n n die letzte Eruption um 10.15 Uhr begann und 4,2 min dauerte? c) Lassen die verfügbaren Daten d e n Schluß zu, daß der lineare Zusammenhang zwischen der Dauer einer Eruption und der Zwischenzeit tatsächlich "sehr eng" ist?
Aufgabe 60 E i n Soziologe interessiert sich für den Zusammenhang zwischen dem Alter v o n Straffälligen bei ihrer ersten einschlägigen Fühlungnahme mit der Polizei (X) und deren Alter beim Antritt der ersten Freiheitsstrafe (Y). Aufgrund besonderer Beziehungen zur Verwaltung einer nahegelegenen Justizvollzugsanstalt (Gefängnis) verfügt er über die folgende Datenmenge: X.: 10; 18; 11; 12; 17; 17; 20; ι y ^ 23; 27; 30; 19; 25; 30; 21. In der Fachliteratur publizierten und daher wohl ernst gemeinten Ansichten zufolge soll es zwischen den Merkmalen X und Y eine lineare Beziehung geben. a) Berechnen Sie den Korrelationskoeffizienten nach BRAVAIS/PEARSON interpretieren Sie das Ergebnis!
und
b) Berechnen Sie die Parameter der ausgleichenden Regressionsgeraden Y(X)! Bestimmen Sie den Wert dieser Geraden an der Stelle X = 4 und kommentieren Sie das Ergebnis!
* Aufgabe 61 Eine
(lineare)
schrieben.
Regressionsbezlehung werde durch
Es sei ferner χ = 12 und r = 0,9.
Y(X) = 6 + 1,5 X
Man bestimme die
be-
Regres-
s i onsgerade X(Y)!
Aufgabe 62 Aus
den
folgenden
Angaben
sind
die
Parameter der beiden Regres2 2 sionsgeraden Y(X) und X(Y) abzuleiten: r = 0,7, s = 4,0, s v = 16,0, χ = Λ Υ = 20 und у = 40!
32
1. Beschreibende Statistik
Aufgabe 63 In der folgenden Tabelle 1st der Bestand an Gütermotorschiffen der Binnenschiffahrt eines westeuropäischen Landes a n einem bestimmten Stichtag nach dem Alter (Y) und der Tragfähigkeit (X) aufgegliedert.
\ Alter (in _ \ Jahren) Trag\ fähigkeiK (t) \ unter 400 400 b.u. 1000 1000 b.u. 3000 insgesamt
unter 20
20 bis unter 40
40 bis unter 60
60 80 370
60 280 280
170 370 130
510
620
670
60 bis unter 80
80 und mehr
insges.
200 380 50
40 170 20
530 1280 850
630
230
2660
a) Bestimmen Sie die ausgleichende Regressionsgerade X(Y) = b Berechnen und interpretieren Sie den Wert X(36)! Gehen Sie bei Ihren Berechnungen davon aus, daß älter als 100 Jahre ist!
kein
+ b.Y!
Güterschiff
b) Geben Sie, ohne die Parameter der ausgleichenden Regressionsgeraden Y(X) = a + a.X zu berechnen, das Vorzeichen des Parameters a, an! O l 1 c) Berechnen Sie die Parameter a
о
und a,! 1
d) Berechnen Sie den Korrelationskoeffizienten nach BRAVAIS/PEARSON interpretieren Sie diesen! e) W o r i n unterscheiden sich der Korrelationskoeffizient BRAVAIS/PEARSON und das Bestimmtheitsmaß inhaltlich und formal? Welchen Wert nimmt das Bestimmtheitsmaß in diesem Falle an?
und
nach
Aufgabe 64 Ein Student der Volkswirtschaftslehre hat in einer Vorlesung den Hinweis eines Professors aufgeschnappt, daß viele makroökonomische Größen wechselseitig voneinander abhängen. Nun will er seine frisch erworbenen Statistikkenntnisse an einem volkswirtschaftlichen Beispiel erproben. Er wählt willkürlich zwei gesamtwirtschaftliche Variable (Saldo des Warenverkehrs und Saldo der Kapitalbilanz) aus und ermittelt deren Werte für je ein Land aus verschiedenen Kontinenten.
1. Beschreibende Statistik
Land
Saldo des Warenverkehrs 1986 (X) in Mio SZR
Niederlande Kenia Guatemala China Papua-Neuguinea
J)
33
Saldo der Kapitalbilanz 1986 (Y) in Mio SZR 1 *
6150 -248 148 -7791
2053 -14 48 -6207
61
-113
1) Die SZR sind Werteinhelten, die dem Wert eines gewogenen Mittels der Währungen der wichtigsten am Welthandel beteiligten Länder entsprechen. Quelle: Statistisches Bundesamt (Hrsg.), Statistisches Jahrbuch 1988 Mit diesen Werten berechnet er: a) die beiden ausgleichenden dieser Geraden,
Regressionsgeraden
und
den
Schnittpunkt
b) eine geeignete Maßzahl, mit der die Modellannahme der ausgleichenden Regressionsgeraden überprüft werden kann. Zu welchen Ergebnissen hätte er kommen müssen? 2 c) Es wird behauptet, daß das Bestimmtheitsmaß г "jenen Varianzanteil kennzeichnet, der durch die Regressionsgerade erklärt wird". Der Student versteht das nicht, weil es ja zwei Regressionsgerade gibt; und überhaupt, Anteil von welcher Varianz? Erklären Sie es anhand dieses Beispiels!
Aufgabe 65 Im Rahmen einer Wirtschaftlichkeitsuntersuchung soll die durchschnittliche Verweildauer an einem Arbeitsplatz und die durchschnittliche Reparaturzeit von Kraftfahrzeugen in einer Reparaturwerkstätte grob abgeschätzt werden. Zu diesem Zwecke wurden für 20 Kraftfahrzeuge die folgenden Zeiten aufgeschrieben.
34
1. Beschreibende Statistik
Kfz. Nr. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Verweildauer in min. 85 40 130 90 95 55 25 40 110 150 10 205 80 150 240 115 95 465 160 190
Reparaturzeit in min. 65 30 110 70 85 35 15 20 90 140 5 190 50 125 230 105 90 450 150 170
Berechnen Sie die' durchschnittliche Verweildauer und die durchschnittliche Reparaturzeit der Kraftfahrzeuge! Aufgabe 66 In einem Unternehmen sind im Bereich "Kurzstrecken" zwölf LKW eingesetzt, die jeden Morgen beladen werden. Bestimmen Sie aus den folgenden Angaben die mittlere Dauer der Beladung eines LKW! Nr. des LKW 1 2 3 4 5 6 7 8 9 10 11 12
Ankunftszeit Uhr 7 7 7 7 7 7 7 7 7 7 8 8
00 00 10 15 30 40 40 45 45 50 00 15
Abfahrtszeit ... Uhr 7 8 10 8 8 8 8 8 9 9 10 9
30 50 20 45 30 00 15 00 05 30 10 50
I. Beschreibende Statistik
35
Aufgabe 67 Ein 600-Betten-Krankenhaus (Klinikum) beginnt zum Jahresanfang seinen Betrieb mit 200 Patienten. Am Ende des jeweiligen Quartals werden 400, 470, 500 und 540 Patienten gezählt. a) Wurde die geplante Belegungsquote von durchschnittlich 70% erreicht? b) Am Jahresende wird die mittlere Verweildauer der Patienten mit sieben Tagen angegeben. Bestimmen Sie den Zugang und Abgang während des Jahres!
Aufgabe 68 Die Lehrstühle einer Universität haben das Recht, außerhalb der Universitätsbibliothek einen eigenen Präsenzbestand an wichtigen Fachbüchern zu halten (Handapparat). Dieser Handapparat darf im Jahresmittel nicht mehr als 200 Bücher umfassen, anderenfalls tritt ein Bestellstop für diesen Handapparat in Kraft. Die Lehrstühle können aber veraltete oder aus anderen Gründen nicht mehr benötigte Bücher zurückgeben und gegebenenfalls durch neue Bücher ersetzen. Ein Lehrstuhl dieser Universität hat am Anfang eines Jahres 190 Bücher im Handapparat. Im Laufe dieses Jahres werden folgende Anzahlen von Büchern zurückgegeben bzw. angeschafft.
Quartal I II III IV
Anzahl der Rückgaben
Anzahl der Neuanschaffungen
3 10 15 2
15 20 45 10
a) Erhält dieser Lehrstuhl ein Buch, das er am Anfang des nächsten Jahres für seinen Handapparat bestellt, sofort, ohne daß er Bücher zurückgibt? b) Wie lange befindet sich im Mittel ein Buch in diesem Handapparat?
Aufgabe 69 Detlev Brause, 29, Luxusstudent, besitzt eine Hausbar, die regelmäßig sieben Tage vor einem Klausurtermin (um 7.00 Uhr) mit 300 Flaschen Bier bestückt wird. Damit glaubt er, über einen hinreichenden Vorrat an Beruhigungsmitteln zu verfügen. Allmorgentlich um 7.00 Uhr registriert er den aktuellen Bestand und kommt zu folgendem Ergebnis:
36
1. Beschreibende Statistik
Bestand am ... Morgen (7.00 Uhr)
Flaschen
2. 3. 4. 5. 6. 7. 8.
280 260 220 180 120 50 0
Bei d e m Versuch, kurz vor Klausurbeginn (übungshalber) d e n Durchschnittsbestand u n d die mittlere Verweildauer des Bieres zu bestimmen, wird es dunkel um ihn, so daß er den Versuch erfolglos abbrechen muß. Z u welchem Ergebnis hätte er kommen müssen? (Annahme: Brause trinkt gleichmäßig über die 24 Stunden eines Tages hinweg. )
Aufgabe 70 In einem Laborversuch werden 1000 neugeborene weiße Mäuse mit einem neuen Serum geimpft. In den folgenden Wochen wird jeweils am Wochenende (Samstag, 10.00 Uhr) festgestellt, wieviel Mäuse zu diesem Zeitpunkt n o c h leben. Das Ergebnis enthält folgende Tabelle.
Alter χ in vollendeten Wochen 1 2 3 4 5 6 7
Anzahl der Mäuse, die das Alter χ vollendet haben 980 860 430 210 90 20 0
Bestimmen Sie den Durchschnittsbestand und die mittlere Verweildauer der Mäuse! Wie kann die mittlere Verweildauer interpretiert werden?
Aufgabe 71 Der Forderungsbestand eines Unternehmens entwickelte sich wie folgt.
1. Beschreibende Statistik
Zeitpunkt^
Bestand in DM
t 0
Zugang in DM im Zeitraum t^
400000
4
s 4
1) t i - t
37
bis t^
-
500000
1080000
320000
1200000
380000
1500000
440000
1320000
520000
900000
= 0,5 Jahre
Bestimmen Sie a) den Durchschnittsbestand, b) die mittlere Laufzeit (λ=0,5) und c) die Umschlaghäufigkeit der Forderungen!
Aufgabe 72 Eine westdeutsche Galerie hat sich auf sozialistische Kunst spezialisiert. Während die Ausstellungen dieser Galerie vor der Änderung der gesellschaftlichen Verhältnisse in Osteuropa im allgemeinen sehr gut besucht waren, nahm insbesondere seit der Wiedervereinigung Deutschlands das Interesse an dieser Kunstform deutlich ab. Zur Eröffnung einer Ausstellung mit Skulpturen des stalinistischen Bildhauers Antonow Glasnost kamen gerade noch sieben Interessenten. Ihre individuellen Aufenthaltsdauern sind in folgender Tabelle zusammengestellt.
Besucher Nr. 1 2 3 4 5 6 7
Aufenthaltsdauer von
18 18 18 19 18 18 18
00 00 20 30 30 00 00
-
21 19 18 22 20 19 18
bis ... Uhr
35 10 50 und 19 30 - 22 00 00 45 00 und 19 30 - 21 20 10
a) Bestimmen Sie den Bestand zum Zeitpunkt 20.00 Uhr!
38
/. Beschreibende Statistik
b) Berechnen Sie bi) die durchschnittliche Verweildauer je Besucher und b 2 ) die durchschnittliche Aufenthaltsdauer je Zugang! c) Berechnen und interpretieren Sie die Zeitmengenfläche! Aufgabe 73 Die Anzahl der Bakterien vermehrte sich in einer bestimmten Nährlösung innerhalb von fünf Tagen von 100 auf 895. Bestimmen Sie den durchschnittlichen prozentualen Zuwachs je Tag! Aufgabe 74 Eine Maschine, die zu Beginn eines Jahres für 50000,- DM angeschafft wurde, soll in fünf Jahren degressiv (in gleichen Prozentsätzen vom Restbuchwert) abgeschrieben werden bis auf einen Erinnerungsposten von 1,- DM. Es sind die Abschreibungsbeträge und Restbuchwerte zu berechnen! Aufgabe 75 Bestimmen Sie anhand der folgenden Meßzahlenreihen die mittlere Wachstumsrate der (durchschnittlichen) Bruttomonatsverdienste im betrachteten Zeitraum in der Mineralölverarbeitung und im Versicherungsgewerbe sowie das Jahr mit dem jeweils größten Verdienstzuwachs! Meßzahlen der Bruttomonatsverdienste Jahr t
in der MineralölVerarbeitung Bezugszeit t 0 = 2
(in %)
Ve r s i che rungs gewe rbe Bezugszeit t 0 = 5
93,22
78,46
100,00
83,28
109,74
89,74
116,94
94,80
124,18
100,00
Um wieviel Prozent haben die Bruttomonatsverdienste auf t = 4 zugenommen?
von t = 3
Aufgabe 7 6 Ein Portefeuille fikaten:
besteht
aus
den
folgenden
Investment-Zerti-
1. Beschreibende Statistik
Zertifikat
Anzahl
Interstat Uniba Erzetbe Eurofonds
120 80 150 30
39
Rücknahmepreis (in DM)
154,24 51,41 35,11 81,25
163,17 47,10 40,40 70,18
a) Bestimmen Sie die durchschnittliche jährliche Wertsteigerungsrate des Portefeuilles! ( t 2 - t l = 2 J a h r e ) · b) Welche Wertsteigerungsrate ergäbe sich, wenn der Rücknahmepreis für Interstat-Zertifikate zum Zeitpunkt t auf DM 1 5 1 , — gesunken wäre?
Aufgabe 77 In d e n Jahren t=l bis t=5 hat die Anzahl der in der Bundesrepublik tätigen Ärzte, Apotheker und Zahnärzte zugenommen. Bestimmen Sie anhand der folgenden Meßzahlenreihen a) die Berufsgruppe, nommen hat,
die von t=l bis t=5 prozentual a m stärksten zuge-
b) die durchschnittliche gruppen!
jährliche
Ärzte Jahr t
Wachstumsrate
Apotheker
В e ζ u g s ζ e i t jeweils t-1 1,026 1,038 1,044 1,027 1,025
1,000
1,025 1,040 1,069 1,099
für
die
drei
Berufs-
Zahnärzte
t =3 о 0,975 0,986
1,000
1,009
1,016
Aufgabe 78
In der folgenden Tabelle sind die Entwicklungen der Ausgaben in der Bundesrepublik Deutschland für drei EDV-Bereiche im Zeitraum von 1986 bis 1990 aufgeführt.
1 Beschreibende Statistik
40
Hardware in Mio.DM
Jahr
1,087 1,099 1,079
0,694 0,839 1,000
1989*
19307
1,067
1, 187
1
20700
1,069
1,410
1990 )
Software und Services Meßzahlen; Bezugsjahr ist 1988
16182 16647 17796
1986 1987 1988
ι
HardwareWartung Meßzahlen; Bezugszeit ist Jeweils das Vorjahr
S c h ä t z u n g e n der
Ausgaben
Quelle: UNIT 2/89, S. 1.
a) Bestimmen Sie d e n EDV-Bereich, für d e n die Ausgaben Zeitraum prozentual am stärksten zugenommen haben!
im
angegebenen
b) Berechnen Sie die durchschnittliche jährliche Wachstumsrate Ausgaben in den drei Bereichen v o n 1986 bis 1990!
für
die
Aufgabe 79 Von einem Unternehmen sind in zwei Perioden t=l und t=2 die folgenden Mengen qj ^ von fünf Grundstoffen (j=l,2 5) zu den Preisen Pj ^ (j=l,2,...,5) bezogen worden.
J
p
J.i 12 27 4 40 16
1 2 3 4 5
P
q
J,2 17 26 3 58 18
j,i 85 40 18 8 22
q
j,2 95 45 20 10 22
a) Berechnen Sie die Indizes: a
l3
LP1,2'
a
3> Λ . 2 ·
a
5>
U
l,2·
LP2,1:
U
a
25 PP1,2'
PP2,1:
V
Ρ°2, Г
Ρ°1,2·
2,l!
b) Welche inhaltliche Bedeutung haben diese Indizes?
1. Beschreibende Statistik
41
Aufgabe 80 Ein Student der Wirtschaftswissenschaften im 1. Semester hat sich vorgenommen, während seines Studiums exakt über seine Ausgaben Buch zu führen. Er interessiert sich besonders für die Preisentwicklung von Grundnahrungsmitteln, da ihm seine Großmutter hierfür monatlich einen festen Betrag zukommen läßt. Nach den ersten Monaten möchte er sich einen Überblick über die bisherige Entwicklung seiner Ausgaben für Grundnahrungsmittel verschaffen. Seinen Aufzeichnungen entnimmt er folgende Informationen:
Gut
1 2 3 4
durchschni 111i eher Preis des Gutes J im ersten Monat 2,50 1,00 2,00 2,40
DM DM DM DM
durchschnitt 1 icher Preis des Gutes J im zweiten Monat 2,75 1.13 2,40 2,52
DM DM DM DM
a) Um wieviel Prozent ist der Preis eines jeden Gutes gestiegen? Geben Sie für jedes Gut die entsprechende Preismeßzahl an! b) Um seiner Großmutter in einfacher Weise die besorgniserregende Preisentwicklung zu schildern, faßt der Student die vier Preismeßzahlen zusammen, indem er die Summe der Prelsmeßzahlen durch die Anzahl der Güter teilt. Stimmen Sie seiner so gewonnenen Aussage zu, damit seien auch seine Ausgaben für die vier Güter insgesamt um 124 gestiegen? c) Während des ersten Monats seines Studiums verbrauchte der Student folgende Gütermengen:
Gut j 1 2 3 4
verbrauchte Menge des Gutes j 2 1 3 5
Berechnen Sie das arithmetische Mittel der in Teilaufgabe a) ermittelten Prelsmeßzahlen! Verwenden Sie dabei die Ausgabensummen des ersten Monats als Gewichte! Um wieviel Prozent sind die Preise der vier Güter dann im Durchschnitt gestiegen? d) Das in Teilaufgabe c) berechnete (gewogene) arithmetische Mittel ist ein Preisindex. Um was für einen Preisindex handelt es sich?
42
1. Beschreibende Statistik
Aufgabe 81 Theobald, ein Student der Wirtschaftswissenschaften mit einer sehr fortgeschrittenen Semesterzahl, meint, daß ihn sein Vater ungerecht behandelt, weil er den monatlichen Scheck während der letzten 17 Semester nie erhöht hat. Auf der Suche nach Argumentationshilfen verfällt er auf die Idee, einerseits einen Preisvergleich und andererseits einen Mengenvergleich der wichtigsten Waren seines täglichen Bedarfs über die letzten 8 Jahre hinweg anzustellen. Er stellt folgende Liste mit ausgewählten Gütern des täglichen Bedarfs samt Preisen zusammen.
Gut i
verbrauchte
verbrauchte
Preis des i-ten Preis des i-ten
Menge des
Menge des
Gutes im Juli
i-ten Gutes
i-ten Gutes
1982 in DM je
im Juli 1982 im Juli 1990 Mengeneinheit Miete (warm) Benzin in 1
1
1
Gutes im Juli 1990 in DM je Mengene i nhe i t
560,—
580,—
120
200
1,40
1,10
Bier in 1
32
46
1,30
1,60
Wein/Sekt/ Spirituosen in 1
10
16
18,—
16,—
Brot in kg
8
4
1,80
3,20
Fleisch und Wurstwaren in kg
7
5
13,80
15,80
14
9
1,70
2,40
Obst und Gemüse in kg
Führen Sie einen Preis- und einen Mengenvergleich durch! Verwenden Sie für Ihre Berechnungen die Strukturen von 1990 und kommentieren Sie die Ergebnisse!
Aufgabe 82 Der Preisindex für die Lebenshaltung (LASPEYRES-Index) ist in einem Entwicklungsland E^ im Laufe von acht Jahren von 340 auf 560 und in einem anderen Entwicklungsland Ε^ im gleichen Zeitraum von 172 auf 289 gestiegen. a) In welchem Land ist der Preisindex für die gestiegen und wie groß ist der Unterschied?
Lebenshaltung
stärker
I. Beschreibende Statistik
43
b) Wie groß ist die durchschnittliche Jährliche Zunahme des Preisindex in diesen Ländern? Aufgabe 83 In einer bayerischen Stadt bieten 3 Tankstellen (unter anderem) Normalund Superkraftstoff an. Beunruhigt über die Preispolitik der Mineralölkonzerne und die nach ihrer Ansicht drohenden Umsatzeinbußen setzen sich die drei Pächter zusammen, um ihre Lage zu analysieren. Ausgangspunkt ihrer Überlegungen ist das folgende Datenmaterial.
Tankstelle
о Preis je 1 in DM
1 2 3
Tankstelle
15
Abgabemenge in 1000 1
1,41 1,40 1,43
90 80 50
о Preis je 1 in DM ^ 1,46 1,44 1,46
4 Preis je 1 1
in DM ^ 1,29 1,32 1,34
Abgabemenge in 1000 1 110 80 60
SuperKraftstoff
t
1
1 2 3
Normsilkraftstoff
t
Abgabemenge
Preis je 1
Abgabemenge
in 1000 1
in DM 1 }
in 1000 1
90 80 90
1,33 1,35 1,38
100 80 70
1) Die Preise sind Durchschnittspreise des jeweiligen Zeitraums. a) Welche prozentuale Veränderung ergibt sich bei einem Vergleich der Umsätze aus dem Verkauf von Normal- und Superkraftstoff in t und t^ bei jeder Tankstelle? b) Um wieviel Prozent erhöhte oder verringerte sich der Gesamtumsatz der drei Tankstellen zusammen in diesem Zeltraum? c) Zerlegen Sie die Umsatzänderung der Tankstelle 1 in die Mengen- und Preiskomponente und interpretieren Sie das Ergebnis! Aufgabe 84 Der Index der Grundstoffpreise (nach LASPEYRES) wird in Veröffentlichungen der amtlichen Statistik unter anderem auch "nach dem produktionswirtschaftlichen Zusammenhang" ausgewiesen.
44
1. Beschreibende Statistik
Berechnen Sie aus den folgenden Angaben a) den Preisindex der Grundstoffe aus der Land- und Fischerei,
Forstwirtschaft,
b) den Preisindex der Grundstoffe aus dem Produzierenden Gewerbe, c) den Preisindex der Grundstoffe insgesamt (Gesamtindex) zum Zeitpunkt
Wägungsanteil TeilIndex am Gesamtindex zum Zeitpunkt in % 4 1. Grundstoffe aus der Land- und Forstwirtschaft, Fischerei a) inländisch b) importiert 2. Grundstoffe aus dem Produzierenden Gewerbe a) inländisch b) importiert d) Der Gesamtindex
13,410 7,598 5,812
112,6 121,6
86,590 57,261 29,329
135,2 158,4
ist von t bis t^ um 1,1% gestiegen.
Welchen Wert
hatte der Gesamt index im Zeitpunkt t? Aufgabe 85 Der Preisindex für die Lebenshaltung aller privaten Haushalte wird insgesamt und für 9 Hauptgruppen ausgewiesen. Die Hauptgruppen (in Klammern jeweils der Anteil der Hauptgruppe am Warenkorb in t in '/.) sind: 1. Nahrungs- und Genußmittel (26,672), 2. Kleidung, Schuhe (8,746), 3. Wohnungsmiete (13,327), 4. Elektrizität, Gas, Brennstoffe (4,913), 5. übrige Waren und Dienstleistungen für die Haushaltsführung (10,010), Waren und Dienstleistungen für 6. Verkehrszwecke, Nachrichtenübermittlung (14,753), 7. Körper- und Gesundheitspflege (4,316), 8. Bildungs- und Unterhaltungszwecke (7,873), 9. Persönliche Ausstattung, sonstige Waren und Dienstleistungen (9,390). Berechnen Sie aus den folgenden Angaben a) die durchschnittliche Preisänderung für die Güter der Hauptgruppen 2 und 4 von t bis t. bzw. von t bis t_, o l о 2 b) den Preisindex für die Lebenshaltung aller privaten Haushalte für t_!
1. Beschreibende Statistik
Hauptgruppe
45
Teil Indizes 4
1 2 3 4 5 6 7 8 9
с) Um
wieviel
Prozent
106,4 109,4 106,4 103,3 106,8 105,1 108,0 103,4 109,4
haben
sich
die
leistungen für die Lebenshaltung
125,5 132,5 126,4 171,0 129,3 130,9 131,7 118,2 137,5
Preise
der
Güter
in der Zeit v o n t^
und
bis t^
Dienstdurch-
schnittlich verändert?
Aufgabe 86 In der Bundesrepublik Deutschland waren kurz nach der Wiedervereinigung enorme Kaufkraftunterschiede zwischen dem östlichen und dem westlichen Landesteil festzustellen. a) Beschreiben Sie die Kaufkraftunterschiede im Bereich der Grundnahrungsmittel am Beispiel zweier in etwa gleichgroßer Städte in Ost(L) und Westdeutschland (H) durch die Berechnung von Kaufkraftparitäten auf der Basis von fünf repräsentativen Gütern! Ihre durchschnittlichen Preise (in DM) und ihre von einem durchschnittlichen Privaten Haushalt der jeweiligen Stadt gekauften Mengen (in jeweiligen Mengeneinheiten) sind für einen Monat kurz n a c h der Wiedervereinigung in der folgenden Tabelle zusammengestellt.
Η
L Gut Kaffee (500 g) Reis (500 g) Schokolade (100 g) Fruchtsaft (0,7 1) Margarine (500 g)
P
J
7,88 3,24 1,18 2,19 1,88
4
J
1,5 3 20 3 5
P
J
7,15 3,09 1,08 1,94 1,72
q
j
4 2 5 10 3
b) Z u Vergleichszwecken liegen zusätzlich die von einem durchschnittlichen Privaten Haushalt einer Kleinstadt (B) in der Nähe der früher e n innerdeutschen Grenze gekauften Mengen vor:
46
l. Beschreibende Statistik
Gut
q
Kaffee (500 g) Reis (500 g) Schokolade (100 g) Fruchtsaft (0,7 1) Margarine (500 g)
j,B
2 2 10 6 4
Inwieweit verändert sich die Kaufkraftparität zwischen L und H, wenn die Berechnung auf der Basis des Warenkorbs von В durchgeführt wird?
* Aufgabe 87 Preisvergleiche von Urlaubsgebieten (verschiedener Länder) werden anhand von Reisegeldparitäten, eine besondere Form von Kaufkraftparitäten durchgeführt. Familie Weckermann hört kurz vor ihrer diesjährigen Urlaubsentscheidung erstmals von diesem statistischen Begriff und beschließt, die endgültige Entscheidung über ihr Urlaubsgebiet anhand von Reisegeldparitäten zu treffen. Nach eingehendem Literaturstudium in der Stadtbücherei seiner Wohngemeinde stellt Vater Weckermann den Urlaubswarenkorb (für sechs Tage) seiner 4-köpfigen Familie mit fünf repräsentativen Gütern und Dienstleistungen zusammen. Anschließend stellt er durch intensive Befragungen bei allen ortsansässigen Reisebüros die Preise dieser Güter und Dienstleistungen für die beiden Urlaubsgebiete fest, die Familie Weckermann von Anfang an ins Auge gefaßt hatte. Die folgende Tabelle enthält neben diesen Informationen außerdem die Preise der Güter und Dienstleistungen des Warenkorbs in der Heimatregion der Familie Weckermann.
Gut
Menge Preis je Mengeneinheit in jeBusitanien Brulandie Heimatweiligen region Einheiten (in B«) (in BF) (in DM)
Wiener Schnitzel (Stück)
24
32000
55,—
10,—
Deutsches Bier (0,33 1)
42
2000
3,—
0,70
Postkarte incl. Porto (weniger als 5 Worte) (Stück)
10
800
3,50
1,10
Besuch einer landesüblichen Folkloreveranstaltung (Anzahl)
1
85000
480,—
120,—
Unterkunft in Mittelklassehotel (Anzahl)
1
1950000
8550,—
2800,—
1. Beschreibende Statistik
47
a) Berechnen Sie die Kosten des Urlaubswarenkorbs von Familie Weckermann in ihrer Heimatregion sowie in den beiden Urlaubsregionen. Welche Informationen erhält man, wenn mein die Kosten für jeweils zwei Regionen zueinander in Beziehung setzt? b) Für welche Urlaubsregion wird sich Familie Weckermann entscheiden, wenn zum Zeitpunkt der Entscheidung 1000 Busltanlen-Dollar 1,40 DM und 100 Brulandie-Francs 33,— DM kosten? Aufgabe 88 Brause hat auf einem Rosenmontagsball kräftig harten Alkoholika zugesprochen. Als verantwortungsbewußter Verkehrsteilnehmer möchte er jedoch erst damn wieder seinen Wagen besteigen, wenn sein Blutalkoholgehalt den Wert 0,8 Promille erreicht hat. Um 5 Uhr morgens ergibt ein Blutalkoholtest bei ihm einen Promillegehalt von 3, 15. Daraufhin stellt er unverzüglich den Alkoholgenuß ein und läßt seinen Blutalkoholgehalt in den nächsten fünf Stunden regelmäßig messen. Das Ergebnis ist in folgender Tabelle enthalten:
Zeitpunkt 5.00 6.00 7.00 8.00 9.00 10.00
Blutalkoholgehalt in Promille 3,15 2,98 2,87 2,69 2,53 2,36
a) Bestimmen Sie den (linearen) Trend nach der Methode der kleinsten Quadrate! b) Wie gut läßt sich das dargestellte Phänomen durch ein lineares Modell approximieren? c) Ist aufgrund des Ergebnisses von Teilaufgabe a) damit zu rechnen, daß Brause rechtzeitig um 19.00 Uhr beim Faschings-Kehraus im Nachbarort mit seinem Wagen erscheint? Von welcher Annahme ist bei der Beantwortung dieser Frage auszugehen?
Aufgabe 89 In einem Industriebetrieb wurde die Anzahl der täglichen Arbeitsunfälle registriert (der erste Tag ist ein Montag).
48
l- Beschreibende Statistik
Tag 1 2 3 4 5 6 7
Anzahl der Unfälle 24 18 14 10 25 9 8
Tag
Anzahl der Unfälle
8 9 10 11 12 13 14
26 16 14 9 25 9 7
Tag
Anzahl der Unfälle
15 16 17 18 19 20 21
27 19 15 10 24 10 7
a) Bestimmen Sie den Trend nach der Methode der kleinsten Quadrate und stellen Sie die Ursprungswerte und die Werte der geschätzten glatten Komponente graphisch dar! b) Ermitteln Sie die Restkomponente! Tragen Graphik ein und interpretieren Sie diese!
Sie
ihre
Werte
in
die
c) Berechnen Sie den Trend und die Restkomponente nach der Methode der gleitenden Durchschnitte! Die Anzahl der Glieder dieses Durchschnitts ist geeignet festzulegen! Aufgabe 90 Für das Überleben, das Wachstum und die Innovationskraft von Unternehmen und damit einer VolksWirtschaft ist eine ausreichende Eigenkapitalbasis von entscheidender Bedeutung. In der Bundesrepublik Deutschland hat die (durchschnittliche) Eigenkapitalquote über einen längeren Zeitraum hinweg ständig abgenommen. Jahr 1967 1968 1969 1970 1971 1972 1973 1974 1975 1976 1977 1978 1979 1980 1981
Eigenkapitalquote in % 31,4 30,6 28,4 26,7 25,9 24,6 24,0 23,7 23,7 23, 1 22,9 22,4 21,7 19,8 18,7
1. Beschreibende Statistik
49
a) Stellen Sie die Zeltreihe graphisch dar! b) Berechnen Sie den (linearen) Trend nach der Methode der kleinsten Quadrate und zeichnen Sie die Trendgerade in die Abbildung zu a) ein! c) Wie gut läßt sich die zeitliche Entwicklung der Eigenkapitalquote durch einen linearen Trend beschreiben?
Aufgabe 91 Der Bestand an Personenkraftwagen eines westeuropäischen Landes entwickelte sich wie folgt: Jahr
1977: 1 7. 1978: 1 1. 1 7. 1979: 1 1. 1 7. 1980: 1 1. 1 7. 1981: 1 1. 1 7. 1982: 1 1. 1 7. 1983: 1 1.
Bestand an Personenkraftwagen in Mio. 18,5 18,9 19,6 20,0 20,8 20,9 21,4 21,5 21,9 21,8 22,2 22,1
a) Stellen Sie die Zeitreihe graphisch dar! b) Berechnen Sie den linearen Trend nach der Methode der kleinsten Quadrate und zeichnen sie die Trendgerade ein! c) In welchem Umfang erklärt der lineare Trend die (Varianz der) Bestandsentwicklung? Berechnen Sie eine geeignete MaBzahl! d) Bestimmen Sie den Trend nach der Methode der gleitenden Durchschnitte und tragen Sie diesen in die Zeichnung ein! e) Welchen Bestand an Personenkraftwagen könnte man aufgrund des linearen Trends für den 1.1.1984 erwarten? Ist dieser Wert realistisch?
1. Beschreibende Statistik
50
1.2
Lösungen
Lösung 1 a) - Merkmalsträger: Personen bzw. Haushalte bei VZ und MZ; - Gesamtheit: Wohnbevölkerung der Bundesrepublik Deutschland zu einem bestimmten Zeitpunkt; - Umfang der Gesamtheit: 1996 etwa 82 Mio. Personen; - Merkmale: erfaßbare (meßbare) Eigenschaften (Tatbestände) der Merkmalsträger, zum Beispiel das Haushaltseinkommen; - Merkmalsausprägung: beim Merkmal Beruf rer, Schlosser, Zahnarzt, Bäcker, ...;
zum Beispiel
Leh-
- Erhebungsmerkmal: im Rahmen einer Erhebung erfaßte Eigenschaft, beim MZ zum Beispiel die Haushaltsgröße; - Vollerhebung oder Totalerhebung: alle statistischen Einheiten einer Gesamtheit werden erfaßt (z.B. bei der VZ); - Teilerhebung oder Stichprobenerhebung: aus der Menge aller Merkmalsträger einer Gesamtheit wird mit Hilfe eines geeigneten statistischen Verfahrens eine Teilmenge entnommen und erfaßt (z.B. beim MZ) ; - Primärstatistik: VZ und MZ; im Gegensatz zur Sekundärstatistik, wie z.B. der Lohnsteuerstatistik, die auf Daten zurückgreift, die zu Steuerzwecken erhoben wurden. b) Nominal (klassifikatorisch): Geschlecht (binär), Beruf (häufbar), Art der Krankenkasse (häufbar), Familienstand. Metrisch: Haushaltsgröße (diskret), Haushaltseinkommen (diskret), Alter (stetig, aber diskret erfaßt). c) Geburten und Sterbefälle können als Bewegungsmassen nur zeitraumbezogen erfaßt werden; VZ und MZ sind aber Erhebungen von Bestandsmassen zu einem bestimmten Zeitpunkt. Lösung 2 Merkmal: landwirtschaftlich genutzte Fläche eines Betriebes; Merkmalstyp: stetiges metrisches Merkmal, klassiert; Merkmalsträger: landwirtschaftliche Betriebe jenes Landes. a) Arbeitstabelle i 1 2 3 4 5 6 7
x
2 5 10 20 50 100 3001'
i
1,5 3,5 7,5 15, 0 35, 0 75,0 200,0
i = ni/n
№)
0, 129 0, 193 0, 185 0, 226 0,226 0, 036 0, 006
0,129 0, 322 0, 507 0,733 0, 959 0, 995 1
f
Xi
·4
0,1935 0,6755 1,3875 3,3900 7,9100 2,7000 1,2000
Als Obergrenze der Klasse über 100 ha wird 300 ha angenommen.
1. Beschreibende
Approximierende Verteilungsfunktion
F^xJ
siehe
Statistik
51
Arbeitstabel-
le. In d i e s e m B e i s p i e l ist F'x(xi) = f ( x < x i ) l Median, Medianklasse:
i = 3,
x0,5 = *ι-ι + (θ,5 - F x (x i _ 1 ))A(x 1 )/f i = 5 + (θ,5 - 0,322) · 5/0,185 = 9,81 (ha) . Arithmetisches к χ = Σ x A
Mittel:
= 1 Λ 4 6 (ha) b e i
x 7 = 300 (ha).
i=l
Der M e d i a n b e t r ä g t 9,81 ha, d.h. m i n d e s t e n s 50% der B e t r i e b e u n t e r s c h r e i t e n die l a n d w i r t s c h a f t l i c h e Fläche v o n 9,81 ha n i c h t u n d m i n d e s t e n s 50% ü b e r s c h r e i t e n d i e s e n W e r t nicht, und d a s a r i t h m e t i s c h e M i t t e l b e t r ä g t 17,46 h a l a n d w i r t s c h a f t l i c h g e n u t z t e Fläche. Der W e r t des a r i t h m e t i s c h e n M i t t e l s hängt von der gewählten Obergrenze der siebten Größenklasse ab ( x 7 = 300 (ha)) . b ) F* (ξ) =
Fx(*i-i)
+
-
S
i-l)fi/
A
(
x
i)'
f a l l s
X
i-i
< ξ *
X
i·
f x (X < 20) = F*(20) = F x (20) = 0,733 f x (X > 50) = 1 - f x (X < 50) = 1 - F*(50) = 0,041 (*0,036+0,006=0,042 w e g e n
Rundungsfehlern).
F*(75) = 0,959 + (75 - 50)0,036/50 = 0,977. f x (20 < X < 75) = f x (x < 75) - f x (X < 20) = F*(75) - F*(20) = 0,977 - 0,733 = 0,244. 73,3% d e r B e t r i e b e h a b e n e i n e l a n d w i r t s c h a f t l i c h genutzte F l ä c h e v o n h ö c h s t e n s 20 ha, 4,1% von m e h r als 50 ha u n d 24,4% d e r B e t r i e b e h a b e n e i n e Fläche z w i s c h e n 20 u n d 75 h a . W e g e n d e r V e r w e n d u n g der a p p r o x i m i e r e n d e n V e r t e i l u n g s f u n k t i o n gelt e n d i e s e A u s s a g e n nur a p p r o x i m a t i v . Lösung 3 Merkmal: Wellenlänge in mm; Merkmalstyp: stetig, metrisch; M e r k m a l s t r ä g e r : W e l l e n , d i e in d e m b e t r a c h t e t e n B e t r i e b gefertigt werden.
52
1. Beschreibende Statistik
a) Arbeitstabelle 1 J
X '[j]
1 2 3 4 5 6 7 8 9 10
f(x
29,6 29,7 29,8 29,9 30,0 30,1 30,2 30,3 30,4 30,5
ij])
= f
W j ] )
j
0,04 0,12 0,24 0,40 0,60 0,72 0,84 0,92 0,96 1,00
0,04 0,08 0,12 0,16 0,20 0,12 0,12 0,08 0,04 0,04
Stabdiagramm f
i
0.20 0.16 0.12 0.08 0.04 0.00 29.6
29.8
30.0
30.2
30.4
Empir ische/approximierende Verte i1ungsfunkt ion
1. Beschreibende Statistik
53
b) x q = 29,55; technische Begründung: MeBgenauigkelt; s t a t i s t i s c h e Begründung: Klassenmitten = Klassenmittelwerte (=Meßwerte) = x^ = 29,6; Klassenbrelte = 0,1; x q = x 1 - Δ(χ 1 >/2 = 29,6 - 0,05 = 29,55 (mm). Arbeltstabelle 2
i
über . . einschl
1 2 3 4 5 6 7 8 9 10
29,55 29,65 29,75 29,85 29,95 30,05 30,15 30,25 30,35 30,45
-
bis mm 29 29 29 29 30 30 30 30 30 30
65 75 85 95 05 15 25 35 45 55
fj/AiXj) 0,04 0,08 0, 12 0, 16 0,20 0, 12 0, 12 0,08 0,04 0,04
29,6 29,7 29,8 29,9 30,0 30, 1 30,2 30,3 30,4 30,5
0,04 0, 12 0,24 0,40 0,60 0,72 0,84 0,92 0,96 1,00
0,4 0,8 1.2 1,6 2,0 1,2 1,2 0,8 0,4 0,4
1) Vgl. Arbeitstabelle 1 Histogramm
f
1
= X
A(*i) 2.0
-
1.6
-
1.2 0.8 -
0.4 0.0 -
00 O) (O 0 ) 0 0)0) ΓΜ ГМ ГМ CM
о
to
τ°
(Μ «Ο 4|· ° я °
in °
Approximierende Verteilungsfunktion siehe Teilaufgabe a). c) Wegen x
0,8 = V i
+
(0,8-Fx(51_1))A(x1)/fi =
= 30,15 + ( 0 , 8 - 0 , 7 2 ) 0 , 1 / 0 , 1 2 = 30,22 (mm)
54
1. Beschreibende
Statistik
1st (-»;30,22] = [0;30,22] = [29,55;30,22] ein Bereich, in dem sich 80'/. der Beobachtungswerte befinden, allerdings nur approximativ! Vergleiche die approximierende Verteilungsfunktion! Bei hinreichend großem η und gleichmäßig verteilten Beobachtungswerten innerhalb der Klassen ist der Genauigkeitsverlust vernachlässigbar. N.B.: Es gibt (unendlich) viele derartiger Bereiche! d) Arbeltstabelle 3
1 1 2 3 4 5 6
i
f i /A(x 1 )
0,04 0,20 0,36 0,24 0,12 0,04
0,4 1,0 1,8 1,2 0,6 0,4
f
*i 29,65 29,85 30,05 30,25 30,45 30,55
Histogramm
f
X
=
A(Xj) 2.0 -ι 1.6
-
1.2
-
0.8
-
0.4 0.0
m in cri (N
m σ> a> о (N oo
1 m τΟ CO
I ir in CN со η о с со
in in •4- m о ö со со
Lösung 4 Merkmal: Haushaltselnkommen in DM; Merkmalstyp: metrisch, klassiert; Merkmalsträger: Privathaushalte jenes Landes.
1. Beschreibende Statistik
a) Arbeitstabelle i
f
i
i y v
fj/ACXj)
1 2 3 4 5 6
12001J 1800 2500 3000 4000 5000
0,187 0,217 0,235 0,115 0,144 0,057
0,187 0,404 0,639 0,754 0,898 0,955
0,00031 0,00036 0,00034 0,00023 0,00014 0,00006
7
10000 2)
0,045
1,000
0,00001
1) χ
о
= 600 (=Existenzminimum),
2) x^ = 10000 (Ausreißer werden vernachlässigt) b) Histogramm
Δ(χ,)
•10"
0 4 -j 0.3 0.2
-
0.1
-
0.0
-
2000
4000
6000
τ 8000
Approximierende Verteilungsfunktion Fx
2000
1 4000
1
1 6000
1
1 ' Γξ 8000 10000
=l ξ 10000
55
56
1. Beschreibende Statistik
с) F x ( ? ) = Ρ χ ί ^ ! . ^ + (ξ"*!-!) '
f / ^ V
F*(1500) = 0,187 + (1500-1200)0,217/600 = 0,187 + 0,1085 = 0,2955 = 0,3, 30% der Haushalte. F*(3800) = 0,754 + (3800-3000)0,144/1000 = 0,754 + 0,1152 = = 0,8692 = 0,87, 1 - F*(3800) = 1 - 0,87 = 0,13, 13% der Haushalte. F*(2900) = 0,639 + (2900-2500)0,115/500 = 0,639 + 0,092 = = 0,731 = 0,73, F x (1700) = 0,187 + (1700-1200)0,217/600 = 0,187 + 0,181 = = 0,368 = 0,37, F*(2900) - F*(1700) = 0 , 7 3 - 0,37 = 0,36, 36% der Haushalte. Es haben zum Beispiel 13% der Haushalte ein monatliches Nettoeinkommen über 3 8 0 0 , — DM. Annahme: Gleichmäßige Einkommensklassen.
Verteilung
der
Beobachtungswerte
Innerhalb
der
Lösung 5 a) Merkmalsträger: Sargkäufe; Merkmale: Sargtyp Ausland (B); Merkmalstyp: klassifikatorisch.
im
Inland
(A)
und
b) Für klassifikatorlsche Merkmale ist der Modus ein geeignetes Maß der zentralen Tendenz und die Entropie oder das Maß vom Typ HERFINDAHL ist ein Maß zur Charakterisierung der Streuung. Modus: n(A ) =
max. 1=1,2
к
n(B ) =
max. i=l,2
к
ö
n(A ) = 75 , 1
n(B ) = 39 . 1
Der Modus des Merkmals Α (Sargtyp im Inland) ist die vierte Merkmalsausprägung, Tischlersärge, der des Merkmals В (Sargtyp im Ausland) Urnen. Die weitaus häufigste Beerdigungsart im Inland ist die Beerdigung in Tischlersärgen, im Ausland werden Urnen präferiert.
1. Beschreibende Statistik Entropie: к H(Α) = - Σ
f
Id f, =
1=1
= -(0,01 Id 0,01+0,00 Id 0,00+0,05 Id 0,05+0,75 Id 0,75+ + 0,19 Id 0,19) = = 0,0664 + 0,0000 + 0,2161 + 0,3113 + 0,4552 = 1,0490 H(B) = 0,3322 + 0,2435 + 0,500 + 0,4644 + 0,5298 = 2,0699 0 £ H(A),H(B) i l d k ;
Id к = Id 5 = 2,3219 .
Die Streuung der Nachfrage nach Särgen und Urnen im Ausland ist wesentlich größer. Sie tendiert zur Gleichverteilung (H(B) = 2,07 ist nahe a n ld к = 2,32, der Gleichverteilung), die Streuung der Nachfrage im Inland ist deutlich niedriger, aber dennoch nicht nahe an der Ein-Punkt-Verteilung. Maß vom Typ HERFINDAHL Arbeitstabelie A Nachfrage
Särge im Selbstbausatz Leihsärge Cash- und carry Särge Tischlersärge Urnen Σ
KjjCA) =
f
i
В f2 i
f
i
f2 i
0,01 0 0,05 0,75 0,19
0,0001 0 0,0025 0,5625 0,0361
0,10 0,06 0,25 0,20 0,39
0,0100 0,0036 0,0625 0,0400 0,1521
1,0
0,6012
1,0
0,2682
Σ f 2 = 0,6012 , S H ( A ) = 1 - 0,6012 = 0,3988 , i=l
Kj^(B) = 0,2682 , S H (B) = 1 - 0,2682 = 0,7318 , 0 s S H ( A ) , S H ( B ) s 1 - i = 1 - 0,2 = 0,8 . Die Streuung des Merkmals В liegt nahe ein der Grenze des Wertebereichs des Maßes vom Typ HERFINDAHL zur empirischen Gleichverteilung. Die Streuung des Merkmals Α ist niedriger, läßt aber keine präzise Interpretation zu, da der Wert in der Mitte des Wertebereichs liegt. Auf jeden Fall ist die Streuung von Α (Inland) wesentlich als die Streuung von В (Ausland).
geringer
57
58
1- Beschreibende Statistik
Lösung 6 Merkmal: Unfalltyp von Verkehrsunfällen; Merkmalstyp: klassifikatorlsch; Merkmalsträger: Straßenverkehrsunfälle mit Personenschaden. a) Geeignete Darstellungsform Häufigkeiten (in Prozent)
\ 100-f 1
A
A
1
^
20,3
14,6
ist das Stabdiagramm.
A
3
22,3
A
4
10,5
3,4
6
Mit den
relativen
*Ί
17,6
11,4
ergibt sich das folgende Stabdiagramm:
Ί
0.25
-
0.20
-
0.15
-
0.10
-
0.05
-
0.00
-I
I
1 A
1
A
2
A
3
A
b) Wegen n(A 3 ) = 83569 = maxintAj)}
4
A
5
ist A 3
A
6
A
7
(Einbiegen-/Kreuzen-Unfall)
der Modus. c) Geeignete Streuungs-/Konzentrationsmaße sind die Entropie und das Maß vom Typ HERFINDAHL. A
f
A
0 203
0,4670
0 041209
0 146
0,4053
0 021316
0 223
0,4828
0 049729
0 105
0,3414
0 011025
0 034
0,1659
0 001156
0 176
0,4411
0 030976
\
0 114
0,3571
0 012996
Σ
1 001
2,6606
0 168407
1
A
?
Ν A
4
\ a
R
i
"fi
ld
f
i
4
1. Beschreibende Statistik
7 H(A) = - Σ f i=l K^A)
=
7
Σ f i=l
Id f
= 2,6606 < Id 7 = 2,8074
59
(Gleichverteilung);
2 = 0,168, S CA) = 1 - 0,168 = 0,832 < 0,857
(Gleichverteilung).
Die Abweichung der empirischen Verteilung v o n der Gleichverteilung ist - gemessen mit d i e s e n M a ß e n - nicht sehr ausgeprägt, d e n n die Werte der b e i d e n Streuungsmaße weichen nicht stark v o n d e n ents p r e c h e n d e n W e r t e n für eine empirische Gleichverteilung ab.
Lösung 7 Merkmal A: Partei Merkmalsträger: Wähler Merkmalstyp: klassifikatorisch Ein geeignetes Maß zur Beschreibung der Konzentration der Stimmen die fünf unterschiedenen Parteien ist d a s Maß von HERFINDAHL.
a) Es ist:
K^A) =
к Σ
f^
mit
i = i *
A) s 1 ;
dabei ergibt s i c h
KJJ(A) = 1 im Fall der vollständigen Konzentration auf eine Partei KJJ(A) = ^
auf
und
im Fall minimaler Konzentration, d.h. Gleichverteilung der
S t i m m e n auf die Parteien. Arbeitstabelle
i
-f. ld f, 1 i 1983
1980
1980
«Ϊ
1983
1 2 3 4 5
0,5238 0,5198 0,3432 0,0909 0,0382
0,5304 0,5051 0,2686 0,2329 0,0319
0,184041 0,198025 0,011236 0,000225 0,000025
0,145924 0,238144 0,004900 0,003136 0,000016
Σ
1,5159
1,5689
0,393552
0,392120
Damit erhält mein КцШдд
= 0,394
und
KjjCAJgg = 0,392 .
D a der Wert des Maßes v o n HERFINDAHL von 1980 bis 1983 geringfügig zurückgegangen ist, hat die Konzentration der S t i m m e n auf d i e Part e i e n minimal abgenommen.
1. Beschreibende Statistik
60
Da Verteilungen mit gleicher Anzahl von Ausprägungen (k=5) miteinander verglichen werden, muß das Maß von HERFINDAHL nicht normiert werden. Anmerkung: Da zwischen Streuung und Konzentration ein enger Zusammenhang besteht, kann die Fragestellung auch mit der Entropie und dem Streuungsmaß vom Typ HERFINDAHL beantwortet werden. Es gilt (vgl. Arbeitstabelle): H(A) 80 = 1,52, H(A)83 i 1,57, S H (A) 80 = 1 - K ^ A ) ^ = 0,606, S
H(A)83 =
1
- *ПШ83
= °'608
*
Die Werte der Streuungsmaße haben von 1980 bis 1983 geringfügig zugenommen, d.h. sie haben sich ihren Grenzwerten für den Fall der empirischen Gleichverteilung angenähert, was bedeutet, daß die Konzentration abgenommen hat. b) Werden die Stimmenanteile der "Grünen" und der "Sonstigen" zusammengefaßt, ergibt sich für k' = 4:
"fi 1980 i=k' = 4
0,1129
.2 i
d f. 1 1983 0,2435
1980
1983
0,0004
0,0036
Damit ist: K^(A)80= 0,394
und
K^(A)83 = 0,393
H'(A)80 = 1,50
und
H'(A)83 = 1,55,
S
H ( A ) 80 °
0,606 Und S
bzw.
H ( A ) 83 ° °· 611 ·
Alle Ergebnisse belegen, daß auch im Fall der Zusammenfassung der beiden Merkmalsausprägungen "Grüne" und "Sonstige" die Konzentration von 1980 bis 1983 geringfügig abgenommen hat. Für einen Vergleich der Konzentrationen mit und ohne Zusammenfassung der Stimmenanteile der "Grünen" und der "Sonstigen" sind die verwendeten Maße (wegen k=5 und k'=4) zu normieren. Die Ergebnisse der Normierung mit 0 s R(А) =
ΗΓΑ) к-КЛАЫ а 1 und 0 s К Д А ) = s 1 Id k Ή norm. k-1
S (Α) = H norm.
bzw.
k«S„(A) Ξ-τk-1
sind für die Fälle a (k=5) und b (k'=4) der folgenden Übersicht zu entnehmen:
1. Beschreibende Statistik
VA)norm. 1980 1983 а b
0,2400 0,1907
0,2425 0,1920
S„( А) Η norm. 1983 1980
R(A) 1980
1983
0,655 0,750
0,676 0,775
61
0,758 0,808
0,760 0,810
Aus dieser Übersicht geht hervor, daß die Stimmenkonzentration in beiden Fällen geringfügig abgenommen hat. Die Übersicht zeigt aber auch, daß die "relative Konzentration" im Falle b nicht unwesentlich geringer als im Falle a ist (weil sich die Stimmenanteile gleichmäßiger auf weniger Parteien/Ausprägungen verteilen).
Lösung 8 a) Merkmalsträger sind die Studierenden, die an der Diplomvorprüfung im Fach Statistik teiInahmen. Komparatives Merkmal "Note", mit der Verteilung Note
Anzahl
Anteil
n(Ut)
fiUj)
1 2 3 4 5
2 20 28 22 8
0,025 0,250 0,350 0,275 0,100
Σ
80
1
U
i
w
0,025 0,275 0,625 0,900 1,000
Stabdiagramm (Häufigkeitsverteilung)
0.4
η
0.3 0.2 0.1
-
Λ—
0.0 -Ι Η 1
2
3
4
5
U
62
1. Beschreibende Statistik
Kumulierte relative Häufigkeiten
и
1.0 0.8
0.6
0.4 0.2 0.0
U
b) Der Median 1st ein geeignetes LagemaB für komparative Merkmale. Median IL _ = 3, d.h. mindestens 507. der Teilnehmer haben die Note 3 U, о und besser und mindestens 50% die Note 3 oder eine schlechtere Note erzielt. Da 28 Teilnehmer die Note 3 erzielt haben, ist der Median wie so oft - nicht besonders aussagefähig. Ein Streuungsmaß für komparative Merkmale ist k-1 S(U) = Σ H(A ), mit H(A ) = -[f.
A
J
A
1
f
J.i
f
J.2
Id f
+ f
0,975
0,025
0,1686
0,275
0,8486
A
?
A
1
0,375
0,625
0,9544
0,100
0,900
0,4690
4
Damit ist S(U) =
].
H( Aj )
0,725
A
Id f
4 Σ H(A.) = 2,4406 und S(U) = 2,4406/4 = 0,6. J norm.
Wegen 0 s S(U) s 1 ist die Streuung dieser Verteilung also nicht norm. sehr stark. Die Verwendung der normierten Streuung hat den Vorteil, daß Verteilungen mit unterschiedlicher Anzahl von Ausprägungen (zum Beispiel Zwischennoten) hinsichtlich der Streuung miteinander verglichen werden können.
1. Beschreibende Statistik
63
Lösung 9 a) Merkmalsträger sind die gefällten Kiefern der beiden Forstämter. Die Güteklassen der Kiefern sind Ausprägungen des komparativen Merkmals "Güte". b) Für komparative Merkmale ist der Median ein geeignetes Maß der zentralen Tendenz, und der Quartilsabstand oder das Maß auf der Basis der Entropie sind geeignete Streuungsmaße. Arbeitstabelle 1
Güteklasse 1 2 3 4 5
Forstarnt А nCU^ w
SS TS В С Η
Forstamt В niVj) w
30 30 40 90 100
30 0 10 50 10
160 20 20 0 0
160 180 200 200 200
Median: Der Median U^ ^ = 4 ist - für das Forstamt A - die Merkmalsausprägung vierte Güteklasse (Güteklasse C). 90% des Holzaufwurfes ist von gleicher oder besserer und 60% von gleicher oder schlechterer Holzqualität. Für das Forstamt В ergibt sich analog V„ „ = 1, die 0, b beste Güteklasse (SS). 80% sind von der gleichen Güteklasse und 100% von der gleichen oder einer schlechteren Güteklasse. Der Median ist hier - wie so oft - von nur geringer Aussagekraft. Quart ilsabstand: q
A = U 0,75 " U 0.25 =
4
*
1
=
3
(Forstamt Α) ,
q
B = V 0,75 - V 0,25 =
1
*
1
=
0
(Forstamt B) .
Der Quart iisabstand für das Forstamt Α beträgt 3 Güteklassen (Merkmalsausprägungen), der für das Forstamt В 0 Güteklassen. Die Aussagekraft des Quartilsabstands ist grundsätzlich (fast immer) gering. Am Beispiel des Forstamtes Α besagt der Quart 1lsabstand, daß mindestens 50% der gefällten Kiefern (Merkmalsträger) Ausprägungen zwischen den Güteklassen SS und С aufweisen. Die Betrachtung der absoluten Häufigkeiten ist hier aufschlußreicher. Maß auf der Basis der Entropie:
I. Beschreibende Statistik
64
Arbeitstabelle 2: Forstamt A
A
J
A
1
A
?
s A
4
f
J.i
f
- f J.l
J.2
ldf
j.i
- f J,2
ld
f
j,2
H(Aj)
0,7
0,3
0,3602
0,5211
0,8813
0,7
0,3
0,3602
0,5211
0,8813
0,6
0,4
0,4422
0,5288
0,9710
0, 1
0,9
0,3322
0,1368
0,4690
Σ
-
-
-
4 Σ Η(Α,) = 3,2026, J j=l
S(U) =
3,2026
-
0 s S(U) ί к-1 = 4 .
Arbeitstabelle 3: Forstamt В
В. J
f
B
0,2
0,8
0,4644
0,2575
0,7219
0, 1
0,9
0,3322
0,1368
0,4690
0
1,0
0
0
0
0
1,0
0
0
0
1
B
J.i
f
j,2
- f j,i
ld f
ü.l
" f J,2
ld
f
J,2
H(Bj)
? B
1
B
4
Σ
-
-
S(V) = 1,1909 ,
-
-
1,1909
0 s S(V) s k-1 = 4 .
Für das Forstamt Α weist dieses Streuungsmaß eine relativ starke Streuung aus. Die Verteilung des Merkmals Güte des Forstamts В ähnelt eher einer Ein-Punkt-Verteilung als die entsprechende Verteilung des Forstamts A, da das Streuungsmaß wesentlich näher an der Untergrenze (S(U)=0), der empirischen Ein-Punkt-Verteilung, liegt. Kumulierte Häufigkeitsverteilungen: Siehe Arbeitstabelle 1!
Lösung 10 Komparatives Merkmal: Einstellung zur modernen Lyrik; Merkmalsträger sind die Studierenden der Studiengänge Betriebswirtschaftslehre und Germanistik. Es werden zwei Gesamtheiten betrachtet. Der Median ist ein geeignetes Lage maß und das Maß auf der Basis der Entropie ein Streuungsmaß zur Charakterisierung von Häufigkeitsverteilungen komparativer Merkmale. Die Spannweite wird hier nicht als Streuungsmaß verwendet, da sie in der Regel wenig aussagefähig ist. Im
1. Beschreibende Statistik
65
folgenden wird das oben definierte Merkmal mit U bezeichnet, wenn es sich auf die Betriebswirte bezieht und mit V, wenn die Germanisten gemeint sind. Arbeitstabelle 1
U
l'vi
fCUj)
1 2 3 4 5
0,024 0,049 0,244 0,244 0,439
fCVj)
w 0,024 0,073 0,317 0,561 1
W 0,378 0,635 0,905 0,973 1
0,378 0,257 0,270 0,068 0,027
Der Median U_ _ = 4 ist der Skalenwert 4 und V. _ = 2 ist der Skalenwert и,э u,o 2. Die Betriebswirte haben also im Mittel eine ablehnendere Einstellung zur modernen Lyrik als die Germanisten. Mindestens 5054 der Betriebswirte geben ihre Einstellung mit dem Skalenwert 4 oder schlechter und mindestens 50% mit 4 oder besser ал. Die Interpretation von V^ ^ erfolgt analog. Maß auf der Basis der Entropie Arbeitstabelle 2 V
U A
J
A
1
A
4
f
J.i
f
J.2
H( Aj )
f
J.i
f
J.2
H( Aj )
0,976
0,024
0,1633
0,622
0,378
0,9566
0,927
0,073
0,3770
0,365
0,635
0,9467
0,683
0,317
0,9011
0,095
0,905
0,4529
0,439
0,561
0,9892
0,027
0,973
0,1791
Σ
2,4306
-
-
2,5353
S(U) = Σ H(A.) = 2,4306 wobei J J=1 H( Aj ) = - tf J(1 id f J > 1 + f J > 2 l d f J > 2 ]; S(V) = 2,5353 , 0 a S(U),S(V) s k-1 = 4 . Die Streuung von V ist etwas stärker als die von U, beide Verteilungen weisen eine mittlere Streuung auf. D.h. es liegt weder eine empirische Einpunktverteilung (S(U),S(V)=0) noch die Konstellation ^ = f g = 0,5 (S(U), S(V)=4) vor.
66
l. Beschreibende Statistik
Lösung 11 Gegeben
ist
die
Verteilung
der
relativen
Häufigkeiten
von
hungszahlen (X=km/h). Merkmalsträger sind die in der Erhebung
Bezieerfaßten
PKW.
i 1 2 3 4
*i
f
100 130 150 über 150
0,253 0,492 0,193 0,062
i 0,253 0,745 0,938 1,000
+
Es ist approximativ Γ χ ( ξ ) =
)f
i/A(xi*·
Bei der Approximation des Anteils wird eine Gleichverteilung der Geschwindigkeiten der PKW in den Geschwindigkeitsklassen angenommen. Mit ξ = 110 (km/h) ergibt sich i=2 und F*(110) = F x (100) + (110-100)0,492/30 = 0,253 + 0,164 = 0,417 , so daß 1-0,417 = 0,583 = 58,3% der Autofahrer von einer solchen Regelung betroffen wären.
Lösung 12 a) Der quadrierte euklidische Abstand des Zentrallagers Verkaufsstelle Vj(i=l 5) ist definiert durch d 2 (z,v.) = ( x ^ x j ) 2 + ( y ^ )
2
Ζ
zur
i-ten
·
Die Summe (und damit auch die gesamten Transportkosten) 5 5 5 Σ d 2 (Z,V.) = Σ (x_-x.) 2 + Σ (y„-y,) 2 = 5-s 2 (x_) + 5-s 2 (y„) 1 X Z Y Z i=l 1=1 Z 1 i=l ist (sind) minimal, wenn x_ = χ = C
Σ χ.'g, i=l 1
und y_ = Υ = Z
Σ у,*g., i=l 1 1
η Σ g. = 1 (Minimaleigenschaft der Varianz bezüglich i=l des arithmetischen Mittels). mit
g. £ 0 1
und
Mithin sind χ = 8,4 und у = 9,8 (mit gleichen Gewichten g^ = 0,2 für i=l
5) die Koordinaten des optimalen Standorts von Z.
1. Beschreibende Statistik
b) In diesem Falle sind χ und у mit den Gewichten gj = 2/27, ^
67
= 3/27,
g 3 = 1/27, g 4 = 6/27 und gg = 15/27 zu berechnen. Damit sind χ = 10,0 Standorts von Z.
und
у
=
13,2
die
Koordinaten
des
optimalen
Lösung 13 a) Rechtwinkliges Koordinaten:
Koordinatensystem
Objekt
X
1 2 3 4 5
i
1,0 6,5 2,5 6,0 5,0
y
parallel
zu
den
Straßen;
i
1,5 3,0 6,5 10,0 9,0
b) Die Straßenentfernung zwischen zwei Kreuzungen i und j ist durch d(i,j) = |xi - Xj| + |y. - yjI definiert. Zum Beispiel ist d(l,2) = = Ii - 6,5| + |1,5 - 3,01 = 7 Entfernungs-/Koordinateneinheiten. Wenn zum Beispiel 1 Koordinateneinheit = 200 m, dann sind 7 Einheiten gleich 1,4 km. c) Die mittlere Entfernung der Feuerwehrwache (F) zu den Objekten 1 bis 5 soll minimal sein. d = I Σ|χ. - x p | + I Σ | Υ ι - Ур.| = d(Xp.) + d(y F )
min.
Die durchschnittliche Abweichung d^ib) bzw. dy(b) ist minimal für b = = x 0 > 5 bzw. b = y 0
5;
d.h. für x F = x 0
5
= 5 und у р = y ^
= 6,5.
Somit sind Xp. = 5 und Ур = 6,5 die Koordinaten der Feuerwehrwache. 5 5 d) d = d(x =5) + d(y =6,5) = | Σ |x -5| + g Σ |y,-6,5| = 1,8 + 2,9 = 4,7 h h i=l 1 i=l 1 Ent fernungse i nhe i ten. e) Das Ergebnis ändert sich nicht, weil der Median gegenüber Transformationen invariant ist.
monotonen
Lösung 14 Merkmal: Betriebszugehörigkeit in Jahren Merkmalsträger: Arbeitnehmer des Betriebs.
(X);
Merkmalstyp:
metrisch;
68
I- Beschreibende
a) χ =
Σ
Statistik
χ,·η, = 15 Jahre Betriebszugehörigkeit.
Wegen n(x=s9) = 10 = n/2 und п ( х Ы 1 ) = 10 = n/2 kann Jeder Wert zwischen 9 und 11 Median sein. Es ist vielfach Üblich, х л „ in der 0,5 Mitte eines solchen Intervalls, hier also mit x„ _ = 10 (Jahre BeU, о tri ebszugehör1gke11) festzulegen. b) s 2 = - Σ(χ,-χ)2η, = 0,05-3426 = 171,3 (Jahre)2 , η j 1 1 s = i/171,3 = 13,1 (Jahre) d(x. _) = - Σ|χ, - χ. _|·η, = 0,05*218 = 10,9 (Jahre). 0, Ь η ^ 1 0, ο 1 Bei asymmetrischen Verteilungen - wie dieser - sind häufig Median und durchschnittliche Abweichung vom Median geeignete Maße. Der Median ist von Extremwerten unabhängig, das arithmetische Mittel hingegen nicht, daher ist letzteres hier auch nicht unwesentlich größer. Die durchschnittliche Abweichung ist minimal bezüglich des Medians. Sie hat die gleiche Dimension wie der Median und ist leichter zu interpretieren als die Standardabweichung (Varianz).
Lösung 15 Hochsprungergebnisse und lOOm-Zeiten lassen sich schon aufgrund der unterschiedlichen Dimensionen (m, sec.) nicht einfach addieren. Bei Wettbewerben werden die Leistungen daher nach einem vorgegebenen Punkteschema bewertet und die in den einzelnen Disziplinen erzielten Punkte zum Gesamtergebnis zusammengezählt (statistisch problematisch!). Eine andere Möglichkeit besteht in der Standardisierung der Merkmale. Standardisierte Merkmale sind dimensionslos und somit addierbar. Sei
die erzielte Höhe im Hochsprung in m und Xg die lOOm-Zeit in
sec.; dann sind X X _X 1~ X 1 2 2 X* = — — - und X* = - = — 1 S 2 S 1 2
die beiden standardisierten Merkmale. Ein sinnvolles Maß für die Gesamtleistung
ist
(X*-X*). X· wird von X* abgezogen, weil eine geringere
lOOm-Zeit (X* negativ) besser zu bewerten ist als eine höhere. Die Gesamtleistung ist umso besser, je größer (X*-X*) ist.
χ
1
1 = η
n
1 Σ x,. = i (2,06+1,97+1,91+2,00+2,16) = 2,02 , Ii 5
i=1
1. Beschreibende Statistik
69
s2 = Σ (χ,.-χ,) 2 = ^Г(2,06-2,02) 2 + ... + (2,16-2,02) 2 1J = 0,00724, l n . . l l l b L 1=1
= + J s ^ = 4 0,00724' = 0,0851 ; 1 n 1 x„ = Σ x„. = ^(10,83+11,01+11,18+10,65+10,78) = 10,89 , Ζ η . , b 1=1 s 2 = - Σ (x^.-x-) 2 = if(10,83-10,89) 2 + ... + (10,78-10,89) 2 1 = 0,03436,
s 2 = +-ls| = -10,03436' = 0, 1854 .
Arbeitstabelle
Теi1nehmer i 1 2 3 4 5
X
li
2,06 1,97 1,91 2,00 2,16
X
2i
• _ Ii
10,83 11,01 11, 18 10,65 10,78
X
X
ü Sl
0,4700 -0,5875 -1,2926 -0,2350 1,6451
1
, *2i
X
2i X 2 s2
-0,3236 0,6472 1,5642 -1,2945 -0,5933
li
-
0 -1 -2 1 2
7936 2347 8568 0595 2384
X X *
X*
2i
Die beste Gesamtleistung erzielte somit der Teilnehmer Nr. 5.
Lösung 16
2
Merkmale: Umsatz in DM (Y) und Verkaufsfläche in m (X); metrisch, Beziehungszahlen; Merkmalsträger: Abteilungen.
Merkmalstyp:
Bei Beziehungszahlen ist das harmonische Mittel das geeignete Maß zur Berechnung von Durchschnittswerten, wenn die Gewichte (hier die Umsätze) und das Merkmal im Zähler der Beziehungszahlen (hier: Umsätze/Verkaufsfläche) übereinstimmen.
2 Mit b^ = Yj/Xj (Umsatz/m ) und hj = Yj/Σ y .
(Umsatzanteile) gilt
70
l. Beschreibende Statistik
Σ у. = 1190000,— DM (Gesamtumsatz), i Σ (yj/b^ = Σ x i = 987,5 m 2 (Gesamtfläche), 1 i so daß b„ = 1190000/987,5 = 1205,— DM/m2 der durchschnittliche Umsatz η 2 je m Verkaufsfläche ist.
Lösung 17 Merkmalsträger: η Strecke; metrisch;
=
5
Mantas;
Merkmale:
Benzinverbrauch,
gefahrene
Der Verbrauch je 100 km ist eine Beziehungszahl der Art b
= y = - L χ 100 km '
a) Ein spezieller Mittelwert für solche Beziehungszahlen ist das harmonische Mittel b = Η
η
mit den (gegebenen) Gewichten
.
ι=ι b i y
h. =
1
n i - — ь 0 , Σ h, = 1 ;
1=1
' ϊ j=l
dabei
J
ist h^ der Anteil des Jahresverbrauchs des 1-ten Mantas sun
Jahresverbrauch aller fünf Mantas. Arbeitstabelle
i
1 b
h
i
1 2 3 4 5
12,8 13,4 15,6 14,0 20,2
Σ
-
b
i
0,0781 0,0746 0,0641 0,0714 0,0495 -
i
k-s
0,2430 0,1696 0,1316 0,2215 0,2343
0,0190 0,0127 0,0084 0,0158 0,0116
1,0000
0,0675
/. Beschreibende Statistik
71
Somit ist 1 bHH = — = 14,8 α/100 km) . 0,0675 Die fünf Mantas haben verbraucht.
also
im Durchschnitt
14,8
1/100
km
b) Die Berechnung von Manni III wäre nur dann richtig, wenn die fünf Mantas in dem betreffenden Jahr alle die gleiche Fahrtstrecke zurückgelegt hätten, denn dann wäre Σ''
!
_ = bH .
V- ι Σ TT -hl i bi
Für die Gewichte h i galt: У1
h.| =
^
=
Σ УЗ : ten Mantas.
• fi
; dabei ist £
die Fahrtstrecke des i-
Σ bj · f, j
Unter der Bedingung gleicher Fahrtstrecken für alle Mantas, d.h. = f für i = 2, ... , n, ist h, 1
Z b j - f - Z b j j j Daraus folgt 1 V — fbi
1 h" 1
v i i bi
1 b
i Σ bj j
1
v i Zbj 5
1
j η Zb, 3
η
Lösung 18 Merkmale:
Fläche in km2
(X) und Bevölkerung
in 1000
Personen
(Y) ;
Merkmalstyp: der .
metrisch,
Beziehungszahlen;
Merkmalsträger:
In dieser Aufgabe werden drei Methoden zur Berechnung Mittelwertes von Beziehungszahlen vorgestellt.
Läneines
a) b = y/x = £ y i / £ x ± mit у = Bevölkerung und χ = Fläche. i i b = 24363/75 = 325 Einwohner/km2 . b) b = J] b ^ , arithmetisches Mittel mit den Gewichten, den i Flächenanteilen, gi = X i / Σ x j ·
:
72
I. Beschreibende Statistik b = ( 318 · 31 + 1 2 1 · 3 + 345 · 4 1 ) / 75 = 325 E i n w o h n e r / k m 2 . 1 ^
'hi
1
Gewichten
h±
^
= yi /
Yj , h a r m o n i s c h e s
Mittel
(Bevölkerungsanteile).
Der M i t t e l w e r t b e t r ä g t in jedem Falle 325 Einwohner kilometer.
Lösung Σ
b)
den
= 2 4 3 6 3 / 7 5 i 325 E i n w o h n e r / k m 2 .
bH
a)
mit
Quadrat-
19 (xv - a) = Σ
1 xv - na = 0
=> n a = Σ ν
x
f(b) = - Σ
( x v - b)2 = - Σ ( x v - 2 x v b + b 2 ) .
5f(b) 5b
v
=> a = —n X x v V
= χ .
2 ! = - - Σ x v + 2b = 2(-x + b) = 0 η ^
=> b = χ
Lösung
je
.
20
Merkmale: (X) ;
gefahrene
Kilometer
(Y)
und Benzinverbrauch
Merkmalstyp: metrisch, Beziehungszahlen; Fahrt von В nach N u n d zurück.
in
Liter
Merkmalsträger:
eine
b = у / χ, bx
= 7,2 k m / 1 , b 2 = 12,0 k m / 1 ,
b =
j
Hier
ist
gleich!), bu
=
m i t hi = yi / Σ
hx = h2 = 1 / 2 so
: _L 1 7,2 ' 2
1 +
Vj
(die
·
zurückgelegten
Strecken
sind
daß 1 1 , : Γ = = = 9 km / 1 . jL I 0,0694 + 0,0417 0,1111 . 12 ' 2
Der A u t o f a h r e r fährt auf dem H i n - u n d Rückweg im Durchschnitt km m i t e i n e m Liter Benzin.
9
1. Beschreibende Statistik
73
Lösung 21 Merkmal: Vertreterprovisionen In DM; Merkmalstyp: metrisch; Merkmalstr&ger: Vertreter In den vier Bezirken. Die durchschnittliche Vertreterprovision 1st ein arithmetisches Mittel von Vertreterprovisionen (x^, 1=1,2,3,4), so daß 1
χ = П
-
k
Σ 1=1
χ,· η. 1
8946200/120 = 74552 (DM)
1
die durchschnittliche Vertreterprovision für das Handelsunternehmen und die Summe der Vertreterprovisionen gleich 8946200,— DM ist. Die Varianz der durchschnittlichen Vertreterprovisionen 2 1 Ϊ s = - Σ η 1=1
",2 2 (χ.-χ) ·η, = s . 1 1 ext.
wäre die externe Varianz der Vertreterprovisionen, d. h. die Varianz zwischen den Teilgesamtheiten (Bezirken).
Lösung 22
1.0P
0.80.6-
0.4 0.2Η
0.0
~r a
Τ
ζ
Jeder Wert zwischen a und b kann ein Quanti1 zur Ordnung ρ sein: a s χ л b; das gilt (natürlich) auch für ρ = 0,5 (Median).
74
1- Beschreibende
Statistik
Lösung 23 Komparatives Merkmal Punkte mit u^ e U., i=0,1
100.
Merkmalsträger sind die Studierenden, die ал der Wiederholungsklausur Statistik teilgenommen haben.
In
Zur Charakterisierung der Häufigkeitsverteilung (siehe Tabelle) komparativer Merkmale sind (unter anderem) die Quartile und der Median geeignete LagemaBe. Häufigkeitsverteilung/kumulierte
Punkte u
nCu
[j] 5 9 12 17 24 29
s
u(u[j]J 1
2 3 4 5
6
33 38 45 51 57 59
1. Quart i1
7
8 9 10 11 12
63
Median
13 14 15 16 17 18
66
75 76 79 81 83 84 85 90 94 η = 24;
[J]3
(absolute) Häufigkeiten
3. Quart 11
19 21
22 23 24 U
[j]'
J=1
·2'
,23 (eine Bindung der Länge 2).
n(57) = 1 besagt, daß ein Student in der Klausur 57 Punkte erzielt hat. 5^(57) = 1 1
bedeutet, daß 11 Studenten 57 Punkte oder weniger haben.
Der Median ist In diesem Beispiel eindeutig definiert (entweder
=
wie die Quartile auch nicht 59 Punkte oder u [ j 3 j = 63 Punkte
oder 60, 61 oder 62 Punkte). Daher ist es wohl besser, keitsverteilung zum Beispiel wie folgt zu charakterisieren: 25% (6) haben 29 Punkte oder weniger, 50% (12) haben 59 Punkte oder weniger, 75% (18) haben 81 Punkte oder weniger.
die
Häufig-
75
1. Beschreibende Statistik
W e n n bekannt wäre, daß die Klausur bestanden ist, w e n n zum Beispiel 50 Punkte oder mehr erzielt wurden, ließe sich die Durchfallquote (hier 9/24 =0,375=37,5% für diese Klausur bestimmen. Aus d e n oben genannten Gründen Quart iisabstand (q) zu bestimmen.
ist
es
auch
wenig
sinnvoll,
den
Das Streuungsmaß S(U) liefert hier auch keine zusätzlichen Informationen. Der oben angegebenen Verteilung der absoluten Häufigkeiten - die Merkmalsausprägungen verteilen sich relativ gleichmäßig auf den Wertebereich - läßt sich entnehmen, daß weder eine Ein-Punkt-Verteilung oder eine Tendenz zur Ein-Punkt-Verteilung (S(U)=0) noch die Konstellation f = f = 1/2 (S(U)=100) vorliegt. S(U) wird einen Wert zwischen 0 und 100 annehmen. Dieser Sachverhalt läßt sich auch aus der Tatsache ableiten, daß 101 Merkmalsausprägungen, 24 Merkmalsträger aber nur eine Bindung existiert.
Lösung 24 Mit
Hilfe
der Ungleichung
v o n TSCHEBYSCHEFF
läßt
s i c h der
Merkmalswerte, die das Intervall (x-cs, x+cs) enthält,
Anteil
der
(grob) abschätzen.
Beispielsweise ist f(73
s y = +-10,03436' = 0, 1854 ,
s2 = - Σ Ζ η ν ν
2
- ζ 2 = i · 1413,444 - 1 6 , 8 2 = 0,4488 5
s z = +-10,4488' = 0,6699 . D i e V a r i a t i o n s k o e f f i z i e n t e n n e h m e n folgende W e r t e an: ν χ = s x / - = 8,5088/202 = 0 , 0 4 2 1 , v γv = s„/γ у = 0,1854/10,89 = 0,0170 , v „ = s _ / - = 0,6699/16,8 = 0 , 0 3 9 9 . Ζ Ζ ζ Mit
den
von
der
Streuungsmaßen
ist
jeweiligen v.^ < v ^
Leistungsunterschiede (2)
Maßeinheit < νχ
unabhängigen
, so d a ß d i e
(relativen)
durchschnittlichen
im Hochsprung a m g r ö ß t e n sind.
Relative d u r c h s c h n i t t l i c h e
(absolute) Abweichung v , = d(x„ α и,о
,, и,о
W i r d die d u r c h s c h n i t t l i c h e Leistung mit Hilfe d e s M e d i a n s gemessen, ist v_j das geeignete relative Streuungsmaß. E s ist x_ _ = 200 , U, D y. „ = 10,83 U, о Z
0,5 =
16
und
'82 *
Arbeitstabelle
V
|x y -200|
|y v -io.83|
|z v -16,82|
1 2 3 4 5
6 3 9 0 16
0 0, 18 0,35 0, 18 0,05
0,76 0,06 1,22 0 0,42
Σ
34
0,76
2,46
90
1. Beschreibende Statistik Daraus ergibt sich: i · 34 = 6,8 э i · 0,76 = 0,152 ü z, 0,5
ν
i · 2,46 = 0,492 э
sowie ν . v = d ( x n „)/x n „ = 6,8/200 = 0,034 , α, X 0,5 0,5 V
d Υ
=
d(y
0 5)/y0 5
=
°·152/1°.83 = °·014 .
ν. = d(z. _)/z n „ = 0,492/16,82 = 0,029 , α, ί О, Ь 0,5 so daß
- wegen v . „ < v. „ < v . „ - wie zuvor die durchschnitt11d, Υ Λ,ί α, л chen Leistungsunterschiede im Hochsprung am größten sind. * Lösung 34 Merkmale: Durchmesser einer Welle, gefertigt von Dreher 1 CX), Durchmesser einer Welle, gefertigt von Dreher 2 CY); Merkmalstyp: Jeweils metrisch; Merkmalsträger: Jeweilige Wellen. Gegeben ist für Jedes Merkmal eine Häufigkeitsverteilung. Es ist zu überprüfen, inwieweit allein aufgrund dieser Informationen Aussagen über die Qualität der Arbeit der beiden Dreher getroffen werden können. Bevor man Aussagen über die Qualität der Arbeit machen kann, muß man vorab den Qualitätsstandard kennen und Qualitätskriterien festlegen. Bezogen auf das vorliegende Beispiel bedeutet dies, daß man zunächst wissen muß, wie groß der jeweilige Wellendurchmesser im Idealfall ist bzw. sein sollte (Sollwert) und - gegebenenfalls - wie groß die zulässige Toleranz ist. Es liegt aufgrund der gegebenen Werte nahe, auf die Sollwerte 50 mm bei Dreher 1 und 20 mm bei Dreher 2 zu schließen, doch ist dies keineswegs zwingend. Wenn diese Information vorliegen würde, wäre als nächstes ein geeignetes Qualitätskriterium festzulegen. Als Qualitätskriterien verwendet werden könnten beispielsweise: - Streuungsmaße (durchschnittliche Abweichung, Varianz, StandardabweΙο hung), - relative Streuungsmaße, - die größte absolute oder relative Abweichung in einer Richtung oder in beiden Richtungen.
1. Beschreibende Statistik
Allerdings müßten dabei die jeweiligen Differenzen nicht von einem Mittelwert) bestimmt werden.
vom
Sollwert
91
(und
Es müßte auch gewährleistet sein, daß die beiden Dreher a n gleichartigen Maschinen gleicher Präzision arbeiten und gleichartige Rohlinge (Material, Härte) verarbeiten. Schließlich müßte a u c h der Zeitfaktor und die Produktion v o n Ausschuß angemessen berücksichtigt werden. Da jedoch all diese Informationen fehlen, ist keine Qualität der Arbeit der beiden Dreher möglich.
Aussage
über
die
Lösung 35 Merkmal: Verlagsgröße, gemessen durch die Anzahl der Beschäftigten Verlag; Merkmalstyp: metrisch; Merkmalsträger: Verlage.
je
Vorbemerkung: Das Merkmal "Verlagsgroße" ist metrisch-diskret; trotzdem liegen die Werte in diesem Fall klassiert vor. Dies hat Auswirkungen auf die Bildung der Klassengrenzen und dies wiederum auf die Werte der Klassenmitten. Im folgenden werden die in der Aufgabe angegebenen Klassen insofern modifiziert, als die Klassenobergrenzen beibehalten werden und die Klassenuntergrenzen den Jeweiligen Obergrenzen der Vorklasse angepaßt werden (zum Beispiel wird die Klasse Nr. 2 "10 bis 19 Beschäftigte" transformiert in "über 9 bis 19 Beschäftigte"). Dies ist eine, aber keineswegs die einzige mögliche Anpassung der Klassengrenzen. Eine Alternative wäre zum Beispiel, die Klassenuntergrenzen beizubehalten und die Obergrenzen entsprechend zu modifizieren. a) Die Anzahl der Verlage mit mehr als 150 Beschäftigten k a n n nur approximativ mit Hilfe der approximierenden Verteilungsfunktion bestimmt werden. Arbeitstabelle i
X. 1
1 2 3 4 5 6 7
9 19 49 99 199 499 999
0,045 0, 106 0,228 0,392 0,576 0,775 0,891
8
5999
1,000
1) Festsetzung!
F'cs>
= i y V i >
+
(€-Va
}
F*( 150) = F x ( 9 9 ) + (150-99)
Й7Дπςγ -
3 1
^
1 0 0
f a l l s
< € * ^
:
= 0,392 + 51·0,001833 = 0,4855.
92
1. Beschreibende Statistik
Die Anzahl der Verlage mit mehr als 150 Beschäftigten beträgt also approximativ (1-ί·χ( 150)) ·η = (1-0,4855) ·311 = 160 (Verlage). 1
1
n
k
b) χ = ±
Σ χ = ± Σ χ.η. = 124297/311 = 399,67 = 400 (Beschäftigte n v=l " 1=1 1 1 Im Mittel).
c) Well
In der dritten Spalte der gegebenen Tabelle die
n
klassenspe-
zifischen Totalwerte x^n^ aufgeführt sind. d) Merkmal ist nun die Größe des Verlags, in dem die Beschäftigten tätig sind, gemessen durch die Anzahl der beschäftigten Personen (Χ'). X' ist metrisch. Merkmalsträger sind die im Verlagsgewerbe beschäftigten Personen. Die
Anzahl
der Beschäftigten
je Größenklasse,
also
die
absoluten
Häufigkeiten, sind durch x J n i = n^ gegeben (vgl. Teilaufgabe c). Es ist d, der Median des Merkmals X', also xl _ zu berechnen. u, ö Xg g kann hier nur grob abgeschätzt werden, weil dieser Wert in diesem
Beispiel
(Rand-)Klasse
(auch)
von
abhängt.
der
Festlegung
der
Wird diese Obergrenze
Obergrenze
mit 5999
der
(=x g )
8.
fest-
gelegt, ergibt sich, mit F^,(x^), der approximierenden Verteilungsfunktion für die beschäftigten Personen und 1=8, der Median x'Q g wie folgt. Arbeitstabelle i
X. 1
?X,(X.)
1 2 3 4 5 6 7
9 19 49 99 199 499 999
0,00069 0,00306 0,01323 0,04243 0,10518 0,26848 0,47178
8
5999 1 1
1,00000
1) Festsetzung! Δ(χ.)·η' X
0,5 = V i
+
I. Beschreibende Statistik
Ό, 5 = « » - (О, 5-0, 47178)
93
.
= 999 + 0,02822*9465,776 = 1266, so daß (approximativ) die Hälfte der Beschäftigten in Verlagen mit höchstens 1266 Beschäftigten arbeitet.
Lösung 36 Merkmale: Güteklasse des Eies einer Henne, die Standardkraftfutter erhalten hat (U), Güteklasse des Eies einer Henne, die neues Kraftfutter erhalten hat (V); Merkmalstyp: jeweils komparativ; Merkmalsträger: jeweilige Eier. Anmerkung: Da die Güteklassen aufgrund des Gewichts der Eier festgelegt werden, handelt es sich ursprünglich um metrische Merkmale, die jedoch in komparative Merkmale transformiert wurden. Man spricht in diesem Zusammenhang davon, daß die Merkmale "komparatisiert" wurden. Insgesamt hat die Produktion (im Mittel) um täglich 52 Eier = 2,08% zugenommen. Wesentlicher als diese geringfügige Zunahme sind jedoch die Qualitätsverbesserungen, die sich durch den Median (Güteklasse 4) und die Quartile (Güteklasse 3 und 5 bzw. 3 und 4) nicht angemessen beschreiben lassen. Informativer sind die kumulierten relativen Häufigkeiten F ^ U . ) bzw. F y (V ), j=l,2 7.
F^UjMOO j 1 2 3 4 5 6 7
Standardkraftfut ter 2 10 28 63 84 94 100
Fy(Vj)·100 neues Kraftfutter 5 19 44 79 94 99 100
Danach konnte zum Beispiel der Anteil der mittleren Tagesproduktion in der Güteklasse 1 um 150%, in den Güteklassen 1 und 2 zusammen um 90% und in den Güteklassen 1 bis 4 um rd. 25% gesteigert werden, während dieser Anteil in den Güteklassen 5 bis 7 um rd. 43% abnahm. Angesichts der gegebenen Daten ist die Berechnung des Streuungsmaßes S(U) bzw. S(V) entbehrlich; es sind keine wesentlichen zusätzlichen Informationen zu erwarten. Anmerkung: Die Frage, ob die Einführung der neuen Kraftfuttermischung ökonomisch sinnvoll ist, kann ohne Einbeziehung der Einkaufs- und Absatzpreise nicht beantwortet werden.
1. Beschreibende Statistik
94
Lösung 37 Hinsichtlich Merkmal, Merkmalstyp und Merkmalsträger vgl. Aufgabe 3 1 χ = η
*
Σ
1=1
2 " 2 - 2 . . ~ 2 1 ^ 2 χ, η,, s„ = χ - χ , mit χ = - Σ χ,η. . i i' Χ η 1=1 i i
a) Arbeitstabelle
i 1 2 3 4 5 6 7 8 9 10
X
i
n
2 i
X
V i
1 2 3 4 5 3 3 2 1 1
29,6 59,4 89,4 119,6 150,0 90,3 90,6 60,6 30,4 30,5
876,16 882,09 888,04 894,01 900,00 906,01 912,04 918,09 924,16 930,25
25
750,4
-
29,6 29,7 29,8 29,9 30,0 30,1 30,2 30,3 30,4 30,5
-
X
i
2 ini
876,16 1764,18 2664,12 3576,04 4500,00 2718,03 2736,12 1836, 18 924,16 930,25 22525,24
Damit ist χ = 750,4/25 = 30,016 (mm), s 2 = 901,0096 - (30.016) 2 = = 0,049344 (mm 2 ) und β χ = V s | = 0,222 (mm). b) Arbeitstabelle
i
1 2 3 4 5 6
-
x
i
n
i
29,60 29,75 29,95 30,15 30,35 30,50
X
ini
2 x.n. ι i
1 5 9 6 3 1
29,60 148,75 269,55 180,90 91,05 30,50
876,1600 4425,3125 8073,0225 5454,1350 2763,3675 930,2500
25
750,35
22522,2475
Damit ist approximativ χ = 750,35/25 = 30,014 (mm), s 2 = 900,8899 - (30.014) 2 = = 0,049704 (mm 2 ) und s
= V^f = 0,223 (mm).
95
1. Beschreibende Statistik
Durch die vorgenommene Klassierung ändern s i c h die Werte arithmetischen Mittels, der Varianz und der Standardabweichung geringfügig.
des nur
Lösung 38 Hinsichtlich Merkmal, Merkmalstyp und Merkmalsträger vgl. Aufgabe 3. a) Berechnung des exakten Wertes: Der
Median
(x^
ist der Wert,
Reihe der Merkmalswerte X
0,5
=
X
[ 13]
=
30
'°
der
in der Mitte
in der aufsteigend
geordneten
steht
(bei
und das
ist
n=25)
( m m b
Berechnung mit Hilfe der approximierenden Verteilungsfunktion: Der Median liegt in der fünften Klasse zwischen x. = 29,95 und x_ = 4 о = 30,05. Somit ist X
0,5 = V i
+
(O.S-FjjCX^JUCx^
=
= 29,95 + (0,5-0,4)0,1/0,2 = 30,00 (mm). Berechnung mit Hilfe der gemäß 3 d) klassierten Werte: Der Median liegt in der dritten Klasse zwischen x^ = 29,85 und x^ = = 30,05. Somit ist approximativ x n „ = 29,85 + (0,5-0,24)0,2/0,36 = 29,994 (mm). U, э Dieses Beispiel zeigt, daß im allgemeinen bei Klassierungen mit zunehmenden Klassenbreiten die Linearitätsannahme immer weniger erfüllt ist und in der Folge daraus abgeleitete Maßzahlen immer stärker von den exakten Werten abweichen. b) Berechnung des exakten Wertes: d(x
1 0,5) = η
k
-
X
0.5lnl '
Mit χ . _ = 30,0 (mm) und k=10 ist d(30,0) = i=· (4,4) = 0,176 (mm). U, ö Zb Berechnung mit Hilfe der gemäß 3 d) klassierten Werte: Mit x_ _ = 29,994 (mm) und k=6 U, о ist d(29,994) = i=· (4,52) = 0,1808 (mm). Zur Interpretation vgl. Teilaufgabe a).
96
l Beschreibende Statistik
Lösung 39 Merkmale: Bruttoproduktionswert der Chemischen Industrie in einem westeuropäischen Land (X), Personalkosten der Chemischen Industrie in einem westeuropäischen Land (Y); Merkmalstyp: jeweils metrisch; Merkmalsträger: jeweilige Jahre. a) Beziehungszahlen b
= yVx.., t=1981,1982
Jahr t
1985.
b t (in %) 22,71 23,40 21,66 22,72 22,29
1981 1982 1983 1984 1985
1981 betrugen die Personalkosten der Chemischen Industrie in diesem Land 22,71% des Bruttoprodukt ionswertes, 1985 nur noch 22,29%. Allerdings ist keine einheitliche Entwicklung der Werte dieser Beziehungszahl von 1981 bis 1985 erkennbar-. b) Zeitliche Meßzahlen mit fester Basis t = 1981: о < 9 8 1 , t = X t / X 1981
bZW
· O
Arbeitstabelle
X
2 V
V
X
1 2 3 4 5 6
80 200 240 140 400 320
2700 3250 3500 3100 4000 3800
6400 40000 57600 19600 160000 102400
216000 650000 840000 434000 1600000 1216000
Σ
1380
20350
386000
4956000
V
x у
Daraus ergibt sich: у = 3391,667; χ = 230 , s ^ = 826000 - 780083,41 = 45916,59 , s^ = 64333,333 - 52900 = 11433,333 . Damit ist а
= 45916,59/11433,333 = 4,016
und
а
= 3391,667 - 4,016·230 = 2467,987 = 2468 .
Die Gleichung der ausgleichenden Regressionsgeraden ist somit Ϋ(Χ) = 2468 + 4,02 X . Der Wert a^ = 2468 (kg/ha) gibt den mittleren Hektar-Ertrag an, der bei den ausgewählten Feldern - auch ohne Zugabe von Düngemittel erzielbar ist (wenn die lineare Beziehung auch im Bereich 0 s χ < 80 gültig ist!). Der Regressionskoeffizient а = 4,02
bedeutet, daß 1 kg
Düngemittel im Durchschnitt (dieser linearen Beziehung) eine Ertragssteigerung von 4,02 (kg/ha) bewirkt. c) Aus b) folgt, daß zusätzliche Kosten in Höhe von 0,80 DM/ha (für 1 kg Düngemittel Je ha) im Mittel einen zusätzlichen Ertrag von a^ kg/ha, d.h. von 4,02-0,30 = 1,21 DM/ha bewirken. Somit ist - im Wertebereich des Merkmals X - der Düngemitteleinsatz ökonomisch sinnvoll.
1. Beschreibende
Statistik
125
d) Bei "globaler Gültigkeit" der oben bestimmten Regressionsgeraden könnte man bei einem Düngemitteleinsatz von 1500 kg/ha einen Hektar-Ertrag von Y( 1500) = 2468 + 4,02·1500 = 8498 (kg/ha) erwarten. Dieses Ergebnis ist jedoch völlig unrealistisch, weil der Zusammenhang zwischen der Menge des Düngemittels und dem Ertrag für höhere DüngernIttelgaben sicherlich nicht linear ist. Dieser Zusammenhang wird wohl dem klassischen Ertragsgesetz unterliegen, wonach - ab einer bestimmten Düngemittelmenge - der Grenzertrag abnimmt und bei extrem hohen Gaben negativ ist. Mit Ϋ(1500) = 8498 (kg/ha) wird also der zu erwartende Ertrag erheblich überschätzt.
Lösung 58 Merkmale: Anzahl der Beschäftigten (X), metrisch; Umsatz (Y), metrisch; Merkmalsträger: Betriebe (des Gewerbezweiges). a) Als (lineares) Zusammenhangsmaß für zwei metrische Merkmale ist sowohl der Korrelationskoeffizient als auch das Bestimmtheitsmaß geeignet. 2 2 S XY Bestimmtheitsmaß: г = 2 2 '
S
XSY
Korrelationskoeffizient:
S
XY
S
XSY
r =
Arbeitstabelle
ν
χ
1 2 3 4
1,5 3,6 2,4 0,5
400 500 200 100
Σ
8
1200
X = i η У = 1 η
ν
Σ
ν
ν
2 χ
2
600 1800 480 50
2,25 12,96 5,76 0,25
160000 250000 40000 10000
2930
21,22
460000
χ у ν
ν
ν
χ = 7 = 2, , ι/ 4
Σ у = ψ . = 300 . . ι> 4 ι>=1
s 2 = χ 2 - χ 2 = 5,305 - 4 = 1,305 , Sy = У 2 - У 2 = 115000 - 90000 = 25000 ,
ι Beschreibende Statistik
126
s„„ = - Σ x у XY η v'v ν
- xy = *
= I 2930 - 2-300 = 732,5 - 600 = 132,5 , = 17556,25 , 2 Γ
=
17556,25 1,305.25000 • ° - 5 3 8 132,5
und
= 0,734 .
•1,305-25000' 2 Das Bestimmtheltsmaß г = 0,538 gibt an, daß 53,8% der GesamtVarianz durch die Regressionsgerade erklärt wird, d.h., daß ein (relativ starker) linearer Zusammenhang zwischen der Anzahl der Beschäftigten und dem Umsatz besteht. Der Korrelationskoeffizlent gibt neben der Stärke auch die Richtung der linearen Beziehung an. In diesem Beispiel bedeutet das, daß zwischen der Anzahl der Beschäftigten und dem Umsatz ein positiver linearer Zusammenhang besteht. Der Umsatz steigt also mit zunehmender Anzahl der Beschäftigten. Dem Enkel gelingt es mit dieser Untersuchung sicherlich nicht, seinen Großvater zu überzeugen, da der Zusammenhang zwischen der Beschäftigtenzahl und dem Umsatz doch relativ stark ist.
Lösung 59 Merkmalsträger: Eruptionen des Geysirs (n=8); Merkmale: Dauer einer Eruption In min (X), Zwischenzelt in min (Y); Merkmalstyp: jeweils metrisch. Gegeben sind zwei metrische Merkmale, die Dauer einer Eruption in min (X) und die Zwischenzeit in min (Y). Zwischen beiden Merkmalen soll ein sehr enger (wechselseitiger) linearer Zusammenhang bestehen. Das bedeutet, daß sowohl X von Y als auch Y von X linear abhängen. Es gibt also (grundsätzlich) zwei sinnvolle Regressionsgeraden. a) Die gesuchte Regressionsgerade, aus der abgelesen werden kann, wie lang im Mittel die Zwischenzeit (Y) bei vorgegebener Eruptionsdauer (X) ist, ist Y(X) = а
+ а. Χ .
Ihre Parameter a Q und a^, die Regressionskoeffizienten, ergeben sich aus aQ = у - ax χ
und
aj = s ^ s *
.
1. Beschreibende Statistik
127
Arbeitstabelle
y
v
1 2 3 4 5 6 7 8
2,8 3, 1 3,9 4,9 1.4 2,2 4, 1 4,5
Σ
26,9
1 χ = η
у =
s
1
w ΧΥ
y
i>
2 V
2 i>
y
65 65 76 98 50 56 88 89
182 201,5 296,4 480,2 70 123,2 360,8 400,5
7,84 9,61 15,21 24,01 1,96 4,84 16,81 20,25
4225 4225 5776 9604 2500 3136 7744 7921
587
2114,6
100,53
45131
1 Σ χ =έ·26,9= , ν 8 ι>=1 Σ
,
y
ι = i η
η
3,3625 ,
χ 2 - χ 2 = i · 100,53 - 3.3625 2 = 1,2598 , ν 8
η
Σ
Ε
f
n
s2 = i Χ η -
X
1
i>= § ' ι>=1
5 8 7 = 73
- 375 ·
1 Σ xy - xy = 5· · 2114,6 - 3,3625 · 73,375 = 17,6016 , ν'ι> ' 8 ν=1
Somit ergeben sich a
i
a
о
=
1
ί τ 5 ϋ =
1 3
·9717
= 73,375 - 13,9717 · 3,3625 = 26,3952
als Parameter der ausgleichenden Regressionsgeraden und es ist Y(X) = = 26,3952 + 13,9717 X . Steigt die Eruptionsdauer (X) um eine Minute an, damn verlängert sich die Zwischenzeit im Durchschnitt um ca. vierzehn Minuten. Der Achsenabschnitt a Q läßt sich nicht sinnvoll interpretieren, da eine Eruption ohne Dauer keine Eruption darstellt. b) Durch Einsetzen von χ = 4,2 in die ausgleichende Regressionsgerade aus Teilaufgabe a) erhält man die (mittlere) Zeitdauer bis zum Beginn der nächsten Eruption: Ϋ(4,2) = 26,3952 + 13,9717 · 4,2 = 85,0763 (min). Die nächste Eruption ist zu erwarten um 10.15 Uhr + 85,1 min = 11.40 Uhr.
128
1. Beschreibende Statistik
с ) Das Bestimmtheitsmaß 2 г
2
S XY
ist
2
2
SX
SY
g e e i g n e t , d i e Stärke eines linearen g
Mit s 2 = Υ η 2
Σ
,
У 2 - У 2 = i · 45131 - 7 3 . 3 7 5 2 = 257,4844 ν 8
Γ
17,6016 2 1,2598·257,4844
d.h.
95,5% d e r V a r i a n z
=
sehr
starker
zu messen,
ist
=
'aoal
u
•
von Y bzw.
Regress ions geraden Y ( X ) ein
Zusammenhangs
X werden durch d i e
bzw. X ( Y ) e r k l ä r t .
wechselseitiger
linearer
Es l i e g t
ausgleichenden i n der
Tat
Zusammenhang zwischen
somit
den
b e t r a c h t e t e n Merkmalen v o r .
Lösung 60 Merkmale: A l t e r d e r S t r a f f ä l l i g e n zu zwei v e r s c h i e d e n e n Merkmalstyp: m e t r i s c h ; Merkmalsträger: S t r a f f ä l l i g e . Zur Lösung d e r T e i l a u f g a b e n a ) und b ) werden b e n ö t i g t : χ = - Σ χ , у = - Σ у η ν • η ν ν ρ s
2 Χ
1 _
2
-2
2
1
2
-2
= - Σ χ - χ , Ξ = - Σ у - у η ν Υ η ν ν ν
,
s ν „ = - Σ χ у - ху . ΧΥ η ι> ι> ν Arbeitstabelle
ν
χ
1 2 3 4 5 6 7
10 18 11 12 17 17 20
Σ
105
2 ι>
2
23 27 30 19 25 30 21
100 324 121 144 289 289 400
529 729 900 361 625 900 441
230 486 330 228 425 510 420
175
1667
4485
2629
χ
ν
χ у
Zeitpunkten;
1. Beschreibende Statistik
129
Damit ist χ
= |·105 =15, у = i-175 = 25 ,
s 2 = |·1667-152 = 13,1429 , s 2 = |·4485-252 = 15,7143 und s =
|·2629-15·25 = 0,5714 .
a) Korrelationskoeffizient nach BRAVAIS/PEARSON: S
r —
XY 0,5714 · . „_ = — о 04 s x -s y 3,6253·3,9641 '
Der Wert des Korrelationskoeffizienten ist positiv, aber derart klein, daß von einem wechselseitigen linearen Zusammenhang zwischen den Merkmalen X und Y keine Rede sein kann. Dies zeigt sich noch 2 2 etwas deutlicher beim Bestimmtheitsmaß. Aus r
= 0,04
= 0,0016 geht
hervor, daß der Varianzanteil, der durch die Regressionsgerade Y(X) bzw. X(Y) erklärt wird, nahezu Null ist. b) Parameter der Regressionsgeraden Y(X) = aQ+a^X: Es gilt a
l
= S
XY / S X
=
° > 5 7 1 4 / 1 3 · 1 4 2 9 = 0.0435 und
a Q = y-a^x = 25-0,0435· 15 = 24,3475 , so daß Ϋ(Χ) = 24,3475+0,0435 X ist. Für die Stelle X = 4 ergibt sich: Y(4) = 24,5 (Jahre). Die Berechnungen zu Teilaufgäbe b) sind aus verschiedenen Gründen unsinnig. Die Ergebnisse von Teilaufgabe a) zeigen nämlich, daß zwischen den Merkmalen X und Y keine lineare Beziehung existiert. Es ist somit nicht möglich, die (Werte der) Regressionsgerade(n) sinnvoll zu interpretieren: Y(X) = у. D m gilt natürlich auch für die Stelle X = 4, zu der anzumerken ist, daß eine erste einschlägige Fühlungsnahme mit der Polizei im Alter von X = 4 Jahren sehr unwahrscheinlich ist; zumindest sollte man daraus keinen Zusammenhang mit der ersten Freiheitsstrafe ableiten. Es kommt hinzu, daß der Wert X = 4 außerhalb des Stützbereichs der Regressionsgeraden liegt. Bereits aus diesem Grunde ist der Wert Y(X=4) = 24,5 Jahre nicht sinnvoll interpretierbar. Eine derartige Extrapolation ist angesichts der Sachlage nicht zulässig (vgl. Y(X) an der Stelle X=0).
130
1. Beschreibende Statistik
Lösung 61
Y(X) = a
о
+ a . X = 6 + 1 , 5 X ; χ = 12 , 1
Aus г 2 = a ^ l ^
folgt 0,92 = l,5»b
г = 0,9 .
und b j = 0 , 5 4 .
Aus Ϋ ( χ ) = у f o l g t Ϋ ( χ ) = 6 + 1 , 5 · 1 2 = 2 4 = у , b o = χ - Ь Х У = 12 - 0 , 5 4 · 2 4 = - 0 , 9 6 , s o d a ß X(Y) = b
0
+ b.Y = - 0 , 9 6 + 0.54Y 1
.
0
+ а , X u n d Χ ( Υ ) = b + b , Y . Da г = 0 , 7 , 1 o l
Lösung 62 Es 1 s t Y(X) = а 2
-
Ξγ = 16,0,
χ = 2 0 u n d у = 40 g e g e b e n
sind,
fehlt
zur
s 2 = 4,0, X Bestimmung
P a r a m e t e r v o n Y ( X ) und X ( Y ) n u r n o c h d e r Wert d e r K o v a r i a n z s ^ . läßt s i c h aus der Beziehung r =
S XY
der
Dieser
ableiten:
SXSY
Ξ χ γ = Γ · Ξ χ · Ξ γ = 0 , 7 · 2 , 0 * 4 , 0 = +5,6 ( p o s i t i v e r
Korrelationskoeffizient).
2 = s ^ s ^ = 5,6/4,0 = 1,4 ,
Damit i s t
Ьг = δχγ/Ξγ = 5 , 6 / 1 6 , 0 = 0 , 3 5 а
o
,
= y - a , x = 4 0 - 1 , 4 · 2 0 = 12 u n d l
bQ = x - b j y = 2 0 - 0 , 3 5 - 4 0 = 6 .
Lösung 63 Merkmale: A l t e r , termotorschiffe.
metrisch;
Tragfähigkeit,
metrisch;
Merkmalsträger:
Vorbemerkung: Da d i e beiden metrischen Merkmale Alter T r a g f ä h i g k e i t (X) k l a s s i e r t s i n d , können d i e zu b e r e c h n e n d e n nur a p p r o x i m a t i v bestimmt werden. a ) Zu b e r e c h n e n X(Y) = b
О
(Y) und Maßzahlen
ist:
+ b Y m i t b = χ - b y und b = s / s j . J. О X 1 AI Υ
Durchschnittliche
Tragfähigkeit:
1 k χ = - Σ χ. η. , η . , ι ii=l * = ^bbU ösö^ (200-530+700·1280+2000·850)
Gü-
= 1015,7895 = 1015,8 ( t )
.
1. Beschreibende
Statistik
131
*-*Α Durchschnittliches
Alter:
у = ^ggQ(10·510+30·620+50·670+70·630+90·230) Kovarianz: Es g i l t : 3
1 k = - ^
χ γ
1
Д ( х
г
х ) ( у
г
у ) п
= 45,86 = 45,9
η
и
к Σ
i=1
1 Σ
(Jahre).
χ. у η 1 j ij
J=1
-
xy
.
1 (200·10·60+200·30·60+200·50·170+200·70·200 + 2660 + 2 0 0 · 9 0 · 4 0 + 7 0 0 · 1 0 · 8 0 + 7 0 0 · 3 0 · 2 8 0 + 7 0 0 · 5 0 · 3 7 0 + 7 0 0 · 7 0 * 380 + + 700·90·170+2000·10·370+2000·30·280+2000·50·130 + + 2000·70·50+2000·90·20) - 1015,7895-45,8647 = 1 (102220000) - 46588,88068 = - 8 1 6 0 , 3 0 9 3 ( t · J a h r e ) . 2660
XY
V a r i a n z von Y: 2 SV
1 =
Ι
2
η
J-У
n
1 * .J = η Д
2 -
-2 У ·
Sw = ö F F n C 1 0 0 * 5 1 0 + 9 0 0 · 6 2 0 + 2 5 0 0 · 6 7 0 + 4 9 0 0 · 6 3 0 + 8 1 0 0 · 2 3 0 ) Y ^bbU =
7234000) -
Damit Ь1
=
2103,5707 = 615,9782
(Jahre2)
-
45,86472 =
.
ist S
XY/SY
bQ = χ -
=
~ 1 3 · 2 4 7 7 = -13,2
,
b ^ y = 1623,3913 = 1 6 2 3 , 4 u n d X ( Y )
= 1623,4 -
13,2Y .
D i e a u s g l e i c h e n d e R e g r e s s i o n s g e r a d e nimmt a n d e r S t e l l e Y=36 d e n W e r t X(36)
= 1623,4 -
Schiffe
13,2*36 = 1 1 4 8 , 2 ( t )
im M i t t e l
(approximativ)
an;
das b e d e u t e t ,
eine Tragfähigkeit
daß
36-jährige
v o n 1148,2
t
haben. b)
Das
Vorzeichen
der
beiden
Regressionskoeffizienten
g l e i c h und w i r d d u r c h d i e K o v a r i a n z kleiner als c)
-
2
1
s„ = Χ η
a^x
Folglich
und ist
a^
b^ wie
0.
Um d i e b e i d e n aQ = у -
bestimmt.
a^
Regressionskoeffizienten 2
und
к 2 Σ χ.η. i i·
a^ = s ^ y / s ^
-2
χ
berechnet
bestimmen z u können,
werden.
muß n u r
noch
ist bj
1. Beschreibende Statistik
132
Es ist X
= ^ t t (40000·530+490000· 1280+4000000·850) - 1015,78922 = 0) und es sich um äquidistante o n Beobachtungszeitpunkte (Quartale) handelt, kann der Durchschnittsbestand mit В В
ο,η
=
В η
geschätzt
werden.
Zugangs- und Abgangsfunktion zwischen zwei Zeitpunkten werden linear approximiert. 5
Bq ^ =
100+400+470+500+270 ^
„.... . , = 1740/4 = 435 (Patienten)
136
ι Beschreibende Statistik
Bei 600 B e t t e n ergibt s i c h eine mittlere Belegungsquote v o n 435/600 = = 72,5%, so cLelB die geplante Belegungsquote geringfügig überschritten wurde. В t κι Η ο.η ο.η b) d - λΖ—+( I-a)A— ο,η ο,η W e g e n B 4 - B q = 540 - 200 = 340 muß der Zugang um 340 höher s e i n a l s der Abgang. Mit λ = В / ( В +B.) = 200/740 = 0,27 ergibt s i c h aus о о 4 л - η 435»365 " " 7 " °,27.Z0i4+0,73.A0i4 0,27-ZQ
4
+ 0,73·AQ
4
'
^
= 22682 ist. Weil ZQ
4
= AQ
+ 340 ist,
folgt
daraus A - . = 22590 sowie Z„ „ = 22930. 0,4 0,4
Lösung 68 a) Zur Beantwortung dieser Frage ist festzustellen, wieviel Bücher Handapparat des Lehrstuhls im Jahresmittel angehörten. Durchschnittsbestand ergibt sich aus во
dem Der
вп
= _ 2~+Bl+B2+"'+Bn-l+2~ ti — ; ο, η η
95+202+212+242+125 _,„ ti — -„ = А1У , о, 4 4
d a keine Fehlmengen auftreten ( B Q , B n > 0 ) u n d es s i c h u m äquidistante Zeitpunkte (Quartale) handelt. Der Lehrstuhl erhält das Buch nicht sofort, da der Durchschnittsbestand v o n 219 Büchern über dem zulässigen Jahresmittel v o n 200 B ü c h e r n liegt. b) Die Schätzung der m i t t l e r e n Verweildauer hängt a u c h d a v o n ab, wie der Parameter λ festgesetzt wird. E s gibt keinen G r u n d anzunehmen, daß d
= d = d/2 u n d somit λ = 0,5 ist, zumal В = 190 kleiner als B„ = o n о 4 = 190+90-30 = 250 ist. Mithin ist der Parameter λ auf λ = В / ( В +B )= о o n = 190/440 = 0,4318 festzusetzen. В
D a m i t
ist
d
=
so d a ß s i c h befindet.
t о 4 о 4 219·4 ΛΖ .+(1-Ä)Α , = 0,4318-90+0,5682.30 o,4 o,4 ein Buch
im Mittel
etwa
15,7
=
15
Quartale
'67 ' im
Handapparat
1. Beschreibende Statistik
137
Lösung 69 Da die Mode 11 annahmen (Β , В sO; äquidistante Zeitpunkte, hier: Tage; lineare
Abgangsfunktion,
s.
Aufgabe) erfüllt
sind,
läßt
sich
der
Durchschnittsbestand wie folgt schätzen. 'ΕΙ В " в = 1 ο, η η^ • • • • • V r В _ = ο, ι ι
mit η = 7 Zeiträumen = Tage ,
150+280+. . . +50+0) =
I
= 180 [Flaschen],
Der Durchschnittsbestand in den 7 Tagen vor dem Klausurtermin beträgt 180 Flaschen Bier. Mittlere Verweildauer: Es ist А „ = N = 300, o,7 o,7
Б = 180 und o,7
t = 7 . o,n
N Aus Β = τ—'-— · d ergibt sich ο, η t ο, η τ d
Β ο,η 4 ο,η = "Ν ο, η
180·7 löö
1260 . _ r_ . 3ÖÖ = ' [Tage],
d.h. die mittlere Verweildauer (des Inhalts) einer Bierflasche beträgt 4,2 Tage.
Lösung 70 Überprüfung der Modellannahmen: -
Zwischen zwei Beobachtungszeitpunkten liegt Jeweils eine Woche, d.h. es handelt sich um äquidistante Zeitpunkte. В = 1000; В = B_ = 0, das bedeutet, daß keine Fehlmengen auftreten. ο η 7
Unter diesen Model1annahmen läßt sich der Durchschnittsbestand wie folgt schätzen:
В = i|4+B+...+B , Λ ο,η η 2 1 η-1 2
Βο
7
= |р^+980+860+. . .+20+0] =
= 441,43 = 441 [Mäuse] .
Der Durchschnittsbestand der weißen Mäuse beträgt in den sieben Wochen 441 Mäuse.
138
l- Beschreibende Statistik
Mittlere Verweildauer: Α
„ = Ν = 1000; В _ = 441; t = 7 [Wochen] . o, 7 o,7 ο, I 0,1
Aus В
N = j ^ · t ο, η
o.n
d
ergibt s i c h d = 4f\'JL = 3,09 [Wochen] . 1UUU
Die mittlere Verweildauer einer weißen Maus beträgt 3,09 Wochen. Die mittlere Verweildauer k a n n als Zeitraum, d e n die Mäuse im Mittel überlebt haben, interpretiert werden. Die Mäuse leben n a c h der Impfung also im Durchschnitt n o c h 3,09 Wochen.
Lösung 71 Die
Modellannahmen
"keine
Fehlmengen"
(BQ,Bn>0)und
"äquidistante
Beobachtungszeitpunkte" (Erfassung jeweils halbjährlich) sind erfüllt, Zuund Abgangsfunktion zwischen zwei Zeitpunkten werden linear approximiert, so daß der Durchschnittsbestand und die mittlere Laufzeit mit Hilfe des Fortschreibungsmodells geschätzt werden können. a) Durchschnittsbestand В
ο, b
= (0,5·Β +B.+Β„+Β_+Β.+0,5·Β_)/5 ο 1 £ J 4 b = 1000(200+500+320+380+440+260)/5 = 420000 D M (im betrachteten Zeitraum von 2 1/2 Jahren).
Der durchschnittliche Zeitraum 420000 DM.
Forderungsbestand
beträgt
im
betrachteten
b) Mittlere Laufzeit (für beidseitig offene Massen und λ=0,5) J
В
_
В t 2 В t o , n o,n _ o,n o,n = 0,5 Ζ +0,5 Α Ζ +X ' ο,η ο,η о,η о,η
_ = 420000 DM , о, 5
t „ = 5 Halbjahre (=2,5 Jahre = 2 Jahre 6 Monate), о, b Ζ Α -
d
_ = 6000000 DM, o, b 0,5
=B
о
+Z
„ - B c = о, 5 5
?·4?0000·5 = 6000000+5880000 =
400000 + 6000000 - 520000 = 5880000 DM. ° ' 3 5 3 5 Halbjahre = 2,121 Monate = 63,63 Tage (1 Jahr=360 Tage).
Die mittlere Laufzeit der Forderungen beträgt 2,121 Monate oder 63,63 Tage.
I. Beschreibende Statistik
139
с) Umschlaghäufigkeit U T = 1/d = 1/0,3535 = 2,8 (mal im Halbjahr) = 1/2,121 = 0,47 (mal im Monat). Im Mittel wird der Bestand an Forderungen 2,8 mal im Halbjahr bzw. 0,47 mal im Monat erneuert. Lösung 72 Sei d. die individuelle Verweildauer des j-ten Besuchers, J=l,2
1
2
3
4
5
6
7
Σ j
215
70
180
150
135
170
10
930
j
d . (in min): J
7 =
Die sieben Besucher bilden eine geschlossene Masse. Zwei Besucher (Nr. 3 und Nr. 6) gehen allerdings zweimal zu und ab. a) Gesucht ist
, die Anzahl der Besucher, die um 20.00 Uhr in der
Galerie anwesend waren. Um 20.00 Uhr anwesend waren die Besucher Nr. 1, 3, 4, 5 und 6. Somit iSt B
20.00 = 5 *
bj)
Die durchschnittliche Verweildauer je Besucher ergibt sich aus 7 1 d = rj-!— Σ d und beträgt ο,η j=l J
d = i · 930 = 132,9
min.
Das bedeutet, jeder Besucher hat min in der Galerie aufgehalten. b2)
sich im Durchschnitt rd. 2 h 13
Die durchschnittliche Aufenthaltsdauer je Zugang ergibt sich - bei neun Zugängen - aus
d = i a
7 Σ d. j=l J
und beträgt
d = i · 930 = 103,3 min.
140
l. Beschreibende
Statistik
Das bedeutet, Jeder Besucher hat Im Durchschnitt rd. 1 h 43 min nach seinem Eintritt die Galerie wieder verlassen. c) Die Zeitmengenfläche 1st wie folgt definiert: F
= t В = t ji— ο,η ο,η ο,η ο, η t Q n
N o,n Σ d, = j
N
=
o.n 7 Σ d. = Σ d J J=1 j=l J
= 930 Besucherminuten.
Sie ist also die gesamte Verweildauer aller sieben Besucher, d.h. die sieben Besucher der Eröffnungsveranstaltung haben sich insgesamt 930 min in der Galerie aufgehalten. Lösung 73 Der durchschnittliche Wachstumsfaktor beträgt
ι ^ 4* = 1 +
n-1ν
η
в5
*гл1
H I
= ^ 8 7 9 5 · = 1,55, so daß sich die Bakterien
um rd. 55% Je Tag (durchschnittliche prozentuale Wachstumsrate) mehrten.
ver-
Lösung 74 Mit t=l,2,... ,6 (Zeitpunkte), n-1 = 5 (Zeiträume), Xj = 5 0 0 0 0 , — DM und x6 = l , - D M i s t
- A5 g ö I 5 Ϊ" 1 ^ 4* = ö ö = 0,1149. ++ 71 - "Msööc
Damit ergibt sich: t
(Rest)Buchwert (DM) zu Beginn des Jahres t
1 2 3 4 5 6
50000,~ 50000, — · 0 , 1 1 4 9 = 5 7 4 5 , — 5 7 4 5 , - 0 , 1 1 4 9 = 660,10 660,10·0,1149 = 75,85 75,85-0,1149= 8,72 8,72-0,1149 = 1,—
Abschreibung (DM) im Jahre t-1 44255,— 5084,90 584,25 67,13 7,72
Abgeschrieben werden Jährlich 88,51% vom (Rest)Buchwert.
1. Beschreibende Statistik
141
Lösung 75 Zur Berechnung der mittleren Wachstumsrate Meßzahl M, _ durch Umbasieren zu bestimmen; 1,5 Mi neral ö 1verarbe 1 tung: Ma
5
ist
zunächst
Jeweils
die
= Mg s / » 2 j = 124,18/93,22 = 1,3321.
Vers i cherungsgewerbe: Μχ
5
= Mg g/Mg
χ
= НЮ/78,46 = 1,2745.
Daraus kann der durchschnittliche Wachstumsfaktor mittlere Wachstumsrate (η*) berechnet werden.
(1+η·)
und
die
Mineralölverarbei tung:
• 1 + И
4 . =
, 1,3321 = 1,0743, mittlere Wachstumsrate: 7,437. Je Jahr.
Vers1cherungsgewerbe: 1 + 1) = 1,2745 = 1,0625, mittlere Wachstumsrate: 6,25% je Jahr. Die mittlere Wachstumsrate der Bruttomonatsverdienste betrug im betrachteten Zeitraum in der Mineralöl verarbe i t ung 7,43% Je Jahr und im Versicherungsgewerbe 6,25% Je Jahr. Zur Bestimmung des Jahres mit dem größten Verdienstzuwachs Meßzahlen mit variabler Bezugszeit berechnet werden. t 1 2 3 4 5
Mi neralö1verarbe i tung 1,0727 1,0974 1,0656 1,0619
müssen
Vers i cherungsgewerbe 1,0614 1,0776 1,0564 1,0549
Das Jahr des größten Verdienstzuwachses gegenüber dem Vorjahr ist jeweils das Jahr t=3. Die Zunahme der Bruttomonatsverdienste von t=3 auf t=4 betrug 6,56% bzw. 5,64% . Lösung 76 a) Wert des Portefeuilles zum Zeitpunkt t^: 30325,6 DM, zum Zeitpunkt t : 31513,8 DM.
1. Beschreibende Statistik
142
315137? „ 1 0 1 g 4 1 0la4 30325,6 ' ·
" " ' • Μ
Die durchschnittliche Jährliche Wertsteigerungsrate des Portefeuilles beträgt 1,94%. b) Neuer Wert des Portefeuilles zum Zeitpunkt t ^ 30053,4 DM,
•
1 + η
2
=
3005374 д 30325,6 irnic с
=
и,ааэо .
Die durchschnittliche Jährliche Hertsteigerungsrate des Portefeuilles würde in diesen Fall -0,45% betragen.
Lösung 77
a) Gesucht ist M, _ . 1,9
Apotheker: M, „ = 1,099 ; 1, о Zahnärzte: ί^
5
= Mg g/Mg
χ
= 1,042 .
Die größte Zunahme ist also In diesem Zeitraum bei den Ärzten mit 14, 1% zu beobachten. b) Durchschnittliche Jährliche Wachstumsrate:
4
4 =
γ
Ärzte = +3,35'/., Apotheker = +2,39'/., Zahnärzte = +1,03'/. . Die Anzahl der Ärzte (Apotheker, Zahnärzte) stieg in diesem Zeitraum durchschnittlich um 3,35% (2,39%, 1,03%) pro Jahr.
Lösung 78 a) Um den EDV-Bereich zu bestimmen, für den die Ausgaben von 1986 bis 1990 prozentual am stärksten zugenommen haben, sind (zeitliche) MeBzahlen "86:90
= X
90
7 x
zu bestimmen.
86
143
1. Beschreibende Statistik
- Hardware (1); gegeben sind x^.-Werte. M ^ o n = 20700/16182 = 1,279 . Ob! aU Die Ausgaben für Hardware sind also um 27,95! gestlegen. - Hardwarewartung (2); gegeben zeit:
sind Meßzahlen mit
variabler Bezugs-
Μ = ν //ν "t-l,t t xt-l ' Es gilt: M(2)
86; 90
(2) . 86; 87
=
(2) . ^ 7 ; 88
(2) , ^ 8 ; 89
(2) = ^ 9 ; 90
= 1,099 · 1,079 · 1,067 · 1,069 = 1,353 so daß die Ausgaben für Hardwarewartung 35,3% gestiegen sind. - Software und Services Bezugszeit (1988): M(3)
X
88;t
t
X
(3);
,
im gleichen
Zeitraum
gegeben sind Meßzahlen mit
um
konstanter
88
(3) Die Meßzahl M„_ n n muß umbasiert werden: oo; oU м(3) = м(3) /Mi3) 86; 90 88; 90 ^ 8 ; 86 = 1,410/0,694 = 2,032 . D a sich die Ausgaben für diesen Bereich mehr als verdoppelt haben (+ 103,2%), sind die Ausgaben für diesen Bereich am stärksten gestiegen (Hardware: + 27,9%; Software und Services: + 35,3%). b) Die durchschnittliche niert: G =
^ Μ, =1 l,n
Jährliche
Wachstumsrate
ist
wie
folgt
defi-
+ η·
ist der durchschnittliche Wachstumsfaktor und rj* = G - 1 die durchschnittliche Wachstumsrate. Mit η = 5 ist
und M a
= Mg6
90
/· Beschreibende Statistik
144
Λ 4
1,279 = 1,063
, η·
1,353 = 1,079
, τι*2 = 0,079 ,
2,032 = 1,194
, η» 3 = 0,194
Λ ΛΙ 4
= 0,063 ,
Die durchschnittliche jährliche Wachstumsrate betrug also im Zeitraum von 1986 bis 1990 im Bereich Hardware 0,063 (= + 6,3%), Hardwarewartung 0,079 (= + 7,9%) und im Bereich Software und Services 0,194 (= + 19,4·/.).
Lösung 79 Es genügt, nur die vier Indizes zu a^) und a^) aus den in der Tabelle gegebenen Daten zu berechnen; die übrigen Indizes ergeben sich aus ( 1
1)P ' L t ,t о
(2)
(3)
Л
о
Ρ Ρ t,t
,t · P Q t,t
=1 о =
о
1
'
L p t ,t ' P Q t ,t = u t ,t = Л о о о
(4) u
t ,t · u t,t = о о
1
,t · P p t ,t о о
und
·
Die zu berechnenden Indizes sind zunächst:
а
a
1 ] I р1 9 = ^ 1 L 1,2 2
3 } L Q 1,2
P
^ j jlqj(1
und
I Po
1 = ^ ^
~ J, 2 j, 2
J
J
;qj.2pj.i
;qj.ipj.2 und
Л,:
=
sowie
5 q j.2 p j,2
Betrachtet man die Summen im Zähler bzw. Nenner dieser Indizes, so kann man feststellen, daß nur die vier in der folgenden Arbeitstabelle aufgeführten Summen berechnet werden müssen:
1. Beschreibende Statistik
J
P
J.2*J,1
P
P
J,l4J.l
P
J.14J.2
145
J,2qJ,2
1 2 3 4 5
1445 1040 54 464 396
1020 1080 72 320 352
1140 1215 80 400 352
1615 1170 60 580 396
Σ
3399
2844
3187
3821
Damit ist aj)
LPj
= 3399/2844 =
119,51·/.; das bedeutet,
daß der Warenkorb
Periode 1 (d.h. die in der Periode 1 bezogenen Grundstoffe) Periode 2 19,51·/. mehr kostet als in der Periode 1. L
P 2 ^ = 3187/3821
= 83,41%;
das bedeutet,
daß der
a
2} PP1 2
=
L2
1
1/ P
=
1/0
·8341
=
119,89·/.;
das
in der
Warenkorb
Periode 2 (d.h. die in der Periode 2 bezogenen Grundstoffe) Periode 1 16,59% weniger gekostet hat als in der Periode 2. bedeutet,
der
der
in der
daß
der
Warenkorb der Periode 2 in der Periode 2 19,89% mehr kostet als in der Periode 1. pP2
= 1/JPJ
г
2
= 1/1,1951 = 83,68%; das bedeutet, daß der Warenkorb
der Periode 1 in der Periode 1 Periode 2. a3) ^
=
3187/2844
=
112,06%;
16,32% weniger kostete als in der das
bedeutet,
daß
-
bewertet
mit
Preisen der Periode 1 - der Warenkorb der Periode 2 um 12,06% größer war als in der Periode 1. j^Qg j = 3399/3821 = 88,96%; das bedeutet, daß - bewertet mit Preisen der Periode 2 - der Warenkorb in der Periode 1 um 11,4% kleiner war als In der Perlode 2. =
a^) pQ^ 2
1
=
112,41%; das bedeutet, daß - bewertet mit Preisen
der Periode 2 - der Warenkorb der Periode 2 um 12,41% größer war als In der Periode 1. pQg j = 1 / ] ^ 2
=
89,24%; das bedeutet, daß - bewertet mit Preisen
der Periode 1 - der Warenkorb in der Periode 1 um 10,76% kleiner war als in der Periode 2. a
5)
U
t*P Q t t = 1,1951· 1,1241 = 134,34% o* o' bedeutet, daß das Unternehmen in der Periode 34,34% mehr ausgegeben hat als in der Periode 1. 1 2
=
LPt
(=3821/2844); 2
für
das
Grundstoffe
146
I- Beschreibende Statistik
ι
=
1/υι
1 für ode 2.
2
bedeutet, daß das Unternehmen in der Periode
=
Grundstoffe
25,56% weniger ausgegeben hat a l s in der P e r i -
Lösung 80 a) Der P r e i s von Gut 1 s t i e g um 0 , 2 5 DM oder um 1054, der P r e i s des Gutes 2 s t i e g um 13%, der von Gut 3 um 20% und der von Gut 4 um 5%. Preismeßzahlen sind wie f o l g t d e f i n i e r t : =
О
J=1,2
k
·
0,to
Somit i s t Mj = 2,75/2,50 = 1, 10 , M2 = 1,13/1,00 = 1,13 , M3 = 2,40/2,00 = 1,20 , M4„ = 2,52/2,40 = 1,05 . !
b) Natürlich i s t -
4
Σ M. = J J=1 diese Güter sind nur nachgefragten Mengen ( q j , Anmerkung: Seine Ausgaben
1,12,
aber die Ausgaben des Studenten für
unter bestimmten Bedingungen über j = l , 2 , 3 , 4 ) um 12% gestiegen. sind genau dann um 12% gestlegen, wenn
Еъл]-'·"^..."]
die
ist.
Da die P r e i s e p . . und p , . ( J = l , 2 , 3 , 4 ) bekannt sind, J,to J' Bedingung auch wie f o l g t formuliert werden:
kann diese
[2,75'qj+l,13-q2+2,40-q3+2,52'q4] = = 1, 1 2 [ 2 , S ' q ^ l . O - q ^ , 0 - q 3 + 2 , 4 - q 4 ]
.
Wenn die Mengen (q^) umgekehrt proportional den Preisen in t Q , also g l e i c h 1/p, . sind, i s t der Term l i n k s vom Gleichheitszeichen g l e i c h J' о dem Term r e c h t s vom Gleichheitszeichen (=4,48) und die Ausgaben sind um genau 12% gestiegen. Das Gleiche g i l t , wenn f ü r die Mengen q^ j e w e i l s das c - f a c h e (celR+) von 1/p, . e i n g e s e t z t wird. Die Ausgaben J' о des Studenten sind aber auch dann um genau 12% gestiegen, wenn ( c e t e r i s paribus) - zum Beispiel - q^ = 1 und q^ = 4 gesetzt wird.
1. Beschreibende Statistik
147
Das bedeutet, es gibt noch viele andere Kombinationen von q^-Werten (j=l,2,3,4), die zu einer Ausgabensteigerung von genau 12% führen. Da es aber ebenso (unendlich) viele Kombinationen von qj-Werten gibt, die zu einer geringeren oder stärkeren Ausgabensteigerung führen man braucht sich nur vorzustellen, daß das Gut mit der geringsten oder höchsten Preissteigerung besonders stark nachgefragt wird - kann ohne Informationen über die nachgefragten (bzw. verbrauchten) Mengen über die Höhe der Ausgabensteigerung nur spekuliert werden. c) Arithmetisches Mittel der Preismeßzahlen M.
.
J :
mit
den
Gewichten
ρ
V
. q, . o J* о
J,t
j 1 2 3 4
M 4
·^ο
2,50 1,00 2,00 2,40
Σ
-
2 1 3 5
5,0 1,0 6,0 12,0
-
24,0
J;to,t'pj,toqj,to 5,50 1, 13 7,20 12,60 26,43
Somit ist
=
5 pj,o.t0 j
=
= i^'26,43 = 1,10125 = 110,1% . Die mit den Mengen des ersten Monats gewichteten Preise sind im Durchschnitt um rd. 10,1% gestiegen. d) In c) wurden die Gewichte der Bezugszeit (tQ). nämlich
= ^PJ.tqJ.t
= g. . J'fco
Somit ist Μ
fc
J
* o'
verwendet.
= LPt
ein Preisindex nach LASPEYRES. o'
Lösung 81 Es sollen ein Preis- und ein Mengenverglelch (1982-1990) ausgewählter Güter auf der Grundlage der Mengen- bzw. Preisstrukturen von 1990 durchgeführt werden.
1. Beschreibende Statistik
148
Dafür geeignete Maßzahlen sind der Preis- bzw. Mengenindex nach ΡAASCHE, weil die Strukturen von 1990 verwendet werden sollen. a) Preisindex
„Po82,90 Ρ
*
P J.90
'
q J,90
*
P J.82
'
4J,90
=
7 J p,J >on Jч, IQn = 580,0 · 1 + 1,10 · 200 + 1,60 • 46 + Σ
+ 16,0 · 16 + 3,20 · 4 + 15,80 · 5 + 2,40 • 9 = 1243,0, 7 Σ Pj
82
q^
go
= 560,0 • 1 + 1,40 · 200 + 1,30 · 46 + + 18,0 · 16 + 1,80 · 4 + 13,80 · 5 + 1,70 · 9 = 1279,3.
Somit 1st PP82,90
=
1279! 3
= 0,972
= 97,2
54
'
Theobald kann keine Erhöhung seiner Bezüge fordern, weil die Preise für seinen aktuellen Warenkorb Im Zeitraum von 1982 bis 1990 um durchschnittlich 2,8% gesunken sind. b) Mengenindex 7 J 4j.90'Pj,90 р^г.эо
=
7 J 4 J,82' P j,90
7 ^ J , 9 0 Pj,90 •
1243'°
( S
'
0 )
'
7 Σ 4
J
j 82 P J 90
=
1
'
580>° +
120
' 1.10 + 32 • 1,60 + 10 · 16,0 +
+ 8 · 3,20 + 7 · 15,80 + 14 · 2,40 = 1093,0 .
Mithin i s t Ρ°82,90 =
*·137 =
113·7
*
1. Beschreibende Statistik
149
Theobalds Verbrauch an (bestimmten) GUtern des täglichen Bedarfs hat also - gemessen mit dem Mengenindex nach ΡAASCHE - um durchschnittlich 13,7 7, zugenommen.
Lösung 82 a) Für das Land Ε χ ist: 5 P j.t 4 J.t 0 l
V о
=
^ T V T j
=
5PJ.f8«J.to 3
4
°
^
J.tQ J,tQ
L P t o ,t+8 = j о
j
=
5 6 0 :
P j t q j t
j.tQ j,tQ
entsprechendes gilt für Eg· Somit ist die Zunahme des Preisindex von t auf t+8 durch P L — ρt ,t+8 gegeben. Der Preisindex für die Lebenshaltung ist folglich L t ,t о im Laufe von 8 Jahren im Land E 1 von 100 im Jahre t auf 560/340 =
= 1,647 = 164,754 im Jahre t+8 und im Land Eg etwas stärker, nämlich von 100 auf 289/172 = 1,68 = 168'/. gestiegen. Der Unterschied beträgt etwa 3,3/i-Punkte oder - bezogen auf E^ - rd.
b) Die durchschnittliche Jährliche Zunahme des Preisindex ergibt sich aus
8
L t ,t+8 -p-5 L t ,t о
ΛΙ
und beträgt für das Land Ε
^1,647 = 1,0644, also rd. 6,44*/., und für das Land E 2 :
^JTref = 1,067, also rd. 6,7% .
Lösung 83 Vorbemerkung: Aus Vereinfachungsgründen wird t
= 0 und t. = 1 gesetzt.
150
1. Beschreibende Statistik
Σ P 1 1Ч1 1 U (i) 1=1 J ' J ' 1 a) Ц1 ' = = rri u, l г u0
, i=l,2,3
(Tankstelle).
j=iPj-°4j·0 U^11 = 126900 + 131400 = 258300 (DM), = 141900 + 133000 = 274900 (DM), Uq1^ = 1,064 = 106,4%; (2)
Ug
(2)
= 227200 (DM),
Uj ' = 213600 (DM),
= 0,940 = 94,0%; Ug
f 41 1
U0
= 202900
(DM),
=
87>2%
0,872
=
Uj
= 177000
(DM),
·
Die Umsatzveränderung beträgt also bei Tankestelle 2 -6,0% und bei Tankstelle 3
1
6,4%,
bei
и(1)+и(2)
Ь1 Ub ) U 0, 1 -
(3) 1 1 . 1 - 665500 _ и ( 1 ) + и ( 2 ) + и ( 3 ) - 6884ÖÖ -
Tankstelle -12,8% .
0,967
_ - 96,7/· '
also Verringerung des Gesamtumsatzes um 3,3%. c ) Es g i l t : „(1) „(1) _(1) u 0, 1 = L 0, 1 P O, 1 ·
u m 0 u0,l daß Т Ш .
so
=
n(l) P O, 1
·
L 0,1 = 235800/258300 = 0,9129; somit 1st pQg 1 ] = 1,064/0,9129 = 1,166 = 116,6% . Die Umsatzsteigerung von 100% auf 106,4% (um 6,4%) i s t zurückzuführen auf eine (durchschnittliche) Preissenkung um rd. 8,7% (gemessen mit und eine Zunahme der Abgabemenge - in Preisen von t^ - um 16,6% (gemessen
mit p Q ^ j ) ·
I. Beschreibende
Statistik
151
Ebenso gilt: „(1) _ .(1) . p (1) 0, 1 - L 0, 1 Ρ 0.1*
„_» u o,1 _ -(1) ~ J I T - L 0, 1 · Ρ 0,1
so daß
pPg 1 ^ = 274900/301100 = 0,913; somit 1st l^c/l
=
1
· 0 6 4 / 0 · 9 1 3 = 1.165 = 116,5% .
In diesem Beispiel unterscheiden sich die beiden Ergebnisse nur sehr geringfügig. Es 1st nämlich j P ^ J = 0,9129 = pQp 1 ] = 1,166 =
= 0,913
und
= 1,165, so daß
die Zerlegung der Umsatzänderung in die Mengen- und Preiskomponente fast eindeutig ist. Das ist im allgemeinen jedoch nicht der Fall. Lösung 84 Gegeben sind Subpreisindizes vom Typ LASPEYRES. 1 L p t ,t = * A ; t ,t'«h;t о h=l о о .
aJ
mit
* «h;t = h о
1 :
^ ^ i t :
(1) _ 0, 07598» 1, 126+0,05812Ί, 216 _ L t , t, 0,13410 o l = 0,15622/0,1341 = 1,165 = 116,5% . Der Preisindex der Grundstoffe aus der Land- und Fischerei hat Im Zeitpunkt ^ den Wert 116,5%.
. J
tQ
(2) L t ,t, о 1
=
Forstwirtschaft,
0,57261 · 1,352+0,29329· 1,584 _ 0,86590
= 1,23874/0,8659 = 1,431 = 143,1 %.
Der Preisindex der Grundstoffe aus dem Produzierenden Gewerbe hat im Zeitpunkt tj den Wert 143,1%. c) L P t
t
= 0.1341-1,165+0,8659.1,431
о' 1
=
^
_
1 3 g 5 %
'
Der Gesamtindex hat im Zeitpunkt tj den Wert 139,5%. d) Zum Zeitpunkt t hatte der Gesamtindex den Wert 1,395/1,011 = 1,3798 = = 138,0% .
152
l. Beschreibende
Statistik
Lösung 85 Gegeben sind SubpreisIndizes vom Typ LASPEYRES. 1 9 L P t ,t = Λ L P h;t ,t'«h;t : h = 1 ' 2 ^auptgruppen). о h=l о о h
a)
®h.t о
1 2 3 4 5 6 7 8 9
0,26672 0,08746 0,13327 0,04913 0,10010 0,14753 0,04316 0,07873 0,09390
Σ
1,00000
L p (2u.4);t , t, o l
=
LPh;t ,t, о 1 1,064 1,094 1,064 1,033 1,068 1,051 1,080 1,034 1,094
L P 2;t , t, ,8 2;t o l о
Ρ
L h; t ,t_ 0 2 1,255 1,325 1,264 1,710 1,293 1,309 1,317 1,182 1,375
+
L P 4;t ,t.*g4;t . O l о
Mit g* = g2/(g 2 +g 4 ) = 0,64031 und g* = i 4 /(g 2 +g 4 ) = 0,35969 ist „i ^ = 1,094-0,64031 + 1,033-0,35969 = L (2u.4):t ,t. о 1 = 0,7005 + 0,3716 = 1,0721 . Entsprechend ist für t^ i. .. = 1,325-0,64031 + 1,710-0,35969 = L (2u. 4);t , ίο 2 = 0,8484 + 0,6151 = 1,4635 . Die durchschnittliche Preissteigerung für die Güter der Hauptgruppen 2 und 4 betrug also von t bis t. rd. 7,2% und von t o l 46,4%.
bis t_ rd. o
d
9 b)
P
L t ,t0 о 2
=
Σ
. . L P h;t ,t *gh;t h=l о 2 о
= 1,255-0,26672 + 1,325-0,08746 +...+ 1,375-0,0939 =
1,305 =
= 130,5%. Der Preisindex für die Lebenshaltung aller privaten Haushalte stieg also von t auf t_ um rd. 30,5% . о 2
1. Beschreibende Statistik
153
с ) Entsprechend 1st f ü r t^:
LPt . t , = Д L?h;t . t ' K - . t = 1'°647 о 1 h=l o l о so
daß
die
Preise
Lebenshaltung
von
der
^
bis
Güter t2
^
106 5
und
'*
'
Dienstleistungen
für
um (1,305/1,0647=1,226=122,6'/.)
die 22,6%
g e s t i e g e n sind.
Lösung 86 a ) Gesucht
ist
Festlegung
die Kaufkraftparität des
Warenkorbs
zwischen L und H, KP. „ . Je nach L, rl e r h ä l t man f ü r KP. unterschiedliche Lt Η
Werte: Fall
I:
Wahl des LASPEYRES
Warenkorbs von L,
d.h.
Kaufkraft pari t a t
vom Typ
5 Σ
L
_ J=1 L,Η 5
P1 J'
Η 4i Τ J'
=
7,15»1,5+3,09-3+1,08»20+1,94-3+1,72-5 _ 7,88-1,5+3,24-3+1,18-20+2,19-3+1,88·5
A • Sffi • ·.·» · Der Warenkorb von L hat in dem betrachteten Monat in L 61,11 DM g e k o s t e t , in Η dagegen nur 56,02 DM. Er hat damit in Η 5,09 DM weniger oder nur 91,66% des Betrages gekostet, den e i n d u r c h s c h n i t t l i c h e r P r i v a t e r Haushalt f ü r diesen Warenkorb in L zahlen mußte. Damit war - gemessen anhand des Warenkorbs von L - d i e K a u f k r a f t i n Η um 8,34% höher a l s in L. Fall
II:
Wahl des Warenkorbs von H, PAASCHE
d.h.
Kaufkraftparität
vom Typ
5 Σ
=
PL,Η
j=l 5
P
1
Η
J'
j i , "J.b
Der Warenkorb g e k o s t e t , in L 9,38% b i l l i g e r a l s in L, wenn
q
1
Η
J'
5
_ 7,15-4+3,09-2+1,08-5+1,94-10+1,72-3 _ " 7,88-4+3,24-2+1,18-5+2,19-10+1,88-3
J."
von Η hat In dem betrachteten Monat i n Η 64,74 DM dagegen 71,44 DM. Er war damit in Η um 6,70 DM oder a l s in L. Somit war d i e Kaufkraft in Η um 9,38% höher man den Warenkorb von Η zugrunde l e g t .
1 Beschreibende Statistik
154
Fall III: Wahl des durchschnittlichen Warenkorbs von L und H, d.h. Kaufkraftparität vom Typ LOWE Durchschnittlicher Warenkorb 1
2
3
4
5
2,75
2,5
12,5
6,5
4
J
5 p
KP
LOWE
L,Η
j.H 4 J,H
5
7,15·2,75+3,09·2,5+1,08·12,5+1,94·6,5+1,72·4 7,88*2,75+3,24-2,5+1, 18Ί2,5+2, 19·6, 5+1, 88·4
=
60
• 3 7 7 5 = ио 9110 66,275 -а11и ·
Der durchschnittliche Warenkorb hat in dem betrachteten Monat in Η 60,38 DM und in L 66,28 DM gekostet. Er war damit in Η um 5,90 DM oder 8,9% billiger als in L, d.h. die Kaufkraft war in Η auf der Basis des durchschnittlichen Warenkorbs um 8,9% höher als in L. b) Teilaufgabe a) hat gezeigt, daß das Ausmaß der Kaufkraftunterschiede zwischen L und Η von der Wahl des Warenkorbs abhängt. Um die Abhängigkeit von den Warenkörben der durchschnittlichen Privaten Haushalte der beiden Städte auszuschalten, kann die Kaufkraftparität auf der Basis eines "Standardwarenkorbs" berechnet werden. Man erhält dabei eine Kaufkraftparitat vom Typ LOWE, allerdings mit dem Unterschied, daß der durchschnittliche Warenkorb durch den Standardwarenkorb ersetzt wird. Wählt man als Standardwarenkorb den Warenkorb von B, erhält man
5 KP LOWE L,H|B
=
L j 1 5 Д
P
J.H 4 J.B
P
J.L 4 j,B
_ 7. 15·2+3,09·2+1,08·10+1,94·6+1,72·4 _ 49,80 7,88·2+3,24>2+1,18·10+2,19·6+1,88·4 54,7
= ü
>al04·
1. Beschreibende Statistik
155
Der Standardwarenkorb hat in dem betrachteten Monat in Η 49,80 DM und in L 54,70 Μ gekostet. Er war damit in Η um 4,90 DM oder 8,96% billiger als in L; auf der Basis dieses Standardwarenkorbs war damit die Kaufkraft in Η um 8,96"/. höher als in L.
Lösung 87 a) Zunächst sind die Kosten des Urlaubswarenkorbs der Familie Weckermann in allen drei Regionen zu bestimmen: 5 Σ
WD = Bu
Kρ, D
*q. = 32000*24+2000*42+800·10+85000·1+1950000-1 = j,Bu \j = 2895000(13$) ,
WD = Br
W„ H =
Σ
p. _ *q , = 55*24+3*42+3,5·10+480·1+8550*1 = 10511 (BF) J. Br 4 j
Σ p. *q = 10*24+0,7·42+1,1·10+120·1+2800*1 = 3200,40 (DM) . j = 1 J·" J
Setzt man diese Kaufkraftparitäten durchschnittliche Weckermann ersetzt
Wertgrößen paarweise in Beziehung, erhält man vom Typ LOWE für jeweils 2 Regionen, bei der der Warenkorb durch den UrlaubsWarenkorb der Familie wurde:
L O v A u . B r = 2 Ш Ш 0 = °'°036 =
LOWE
Br.Bu
KP LOWE
=
3200
=
2895000
Bu,Η
KP LOWE
Η,Bu
KP LOWE
Br,Η
LOWE^H.Br
2895000 10511
• 4 = оU >0011 UU11 2895000
3200,4
. 3200,4 10511
=
•«ffl
105114 3200,4
= 904 574 aü4 b 4 - '
=
=
°,JÜ4b
3
P)
·2843
Von besonderer Bedeutung für Familie Weckermann sind
die
Kaufkraft-
paritäten, bei denen ein Vergleich zwischen den Kosten in der Heimatregion und
in einer der beiden Urlaubsregionen angestellt wird.
Beispielsweise gibt
low;*^ Br
= 3,2843
(бй)
an
'
daß der Warenkorb
in
/. Beschreibende Statistik
156
Brulandie in BF das gion
kostet,
3,2843-fache des Betrags In DM in der
d.h. Urlaubskosten
in Höhe von
Heimatre-
100,— DM entsprechen
einem Betrag von 328,43 BF in Brulandie. b) Für die Entscheidung der Familie Weckermann ist der Vergleich zwischen Kaufkraftparitäten und Wechselkurs entscheidend. Wenn
1000 Busitanien-Dollar
Weckermann für 100,— DM
1,40 DM kosten,
dann erhält
Familie
. ю о = 71428,6 BS. Für Urlaubsgüter und
-dienstleistungen in einem Wert von 100,— DM müßte sie Jedoch 90457,4 B$ zahlen, d.h. die Kaufkraft beträgt in Busltanien für güter
und
-dienstleistungen
der
Familie
die Urlaubs71428 6 Weckermann nur g 0 4 g 7 ' ^ =
= 0,7896 der Kaufkraft in ihrer Heimatregion. Für
100,—
DM
erhält
Familie
Weckermann
·
100
=
303,03
Brulandie-Francs. Für Urlaubsgüter und -dienstleistungen im Wert von 1 0 0 , — DM müßte sie 328,43 BF zahlen. Mithin beträgt die Kaufkraft in Brulandie Weckermann
für nur
die Urlaubsgüter und 303 03 -„ ' .„ = 0,9227, O/LO , 4J
Wechselkursunterschiede
besteht
für
-dienstleistungen d.h.
nach
Familie
Urlaub in Brulandie ein Kaufkraftverlust
der
Familie
Ausschaltung
Weckermnn
bei
der
einem
von 7,73%, der allerdings
deutlich geringer ist als in Busitanien. Familie Weckermann wird daher in Brulandie Urlaub machen.
Lösung 88 Merkmal: Blutalkoholgehalt von Brause in Promille (Y), metrisch; Merkmalsträger: Zeitpunkte. a) Die Bestimmung des (linearen) Trends nach der Methode der kleinsten Quadrate ist wegen x^ = t^ gleichbedeutend mit der Bestimmung einer ausg1e i chenden Regress i onsgeraden. y. = m. + u. , ι ι ι m. = а + a.t. , i=l,2 ι о Ii
η .
1. Beschreibende Statistik
i
ο а
- τγ = — =
i
y
V i
2 i
1 2 3 4 5 6
5 6 7 8 9 10
3,15 2,98 2,87 2,69 2,53 2,36
15,75 17,88 20,09 21,52 22,77 23,60
25 36 49 64 81 100
9,9225 8,8804 8,2369 7,2361 6,4009 5,5696
Σ
45
16,58
121,61
355
46,2464
6-121,61-45-16,58 _ η = = -О,1566 ,
sT а
y
157
6-355-45
= у - a t = 2,7633 + 0,1566-7,5 = 3,9378 .
Damit
ist
пи
=
3,9378
-
0,1566·^
(1=1,2
6)
die
geschätzte
(ausgleichende) Trendgerade. b) Bestimmtheitsmaß 2 2 • • S TY 2 -0,4566 г = = 0,997 , 1,7078-0,2681 Τ Y d.h. durch die Trendgerade werden - in diesem Modellbeispiel - 99,7/i der Varianz von Y erklärt. c) Für t.,, = 19.00 Uhr ist m,„ = 3,9378 - 0,1566-19 = 0,96 (Promille), lo 1э so daß Brause sicherlich nicht rechtzeitig im Nachbarort erscheint, zumal noch die Fahrtzeit zu berücksichtigen ist. Dabei wurde davon ausgegangen, daß der Blutalkoholgehalt von 10.00 Uhr bis 19.00 Uhr linear, gemäß m^, abnimmt, eine Annahme, die nicht in jedem Falle gerechtfertigt ist.
Lösung 89 Merkmal: Anzahl der täglichen Arbeitsunfälle in einem Industriebetrieb (Y), metrisch; Merkmalsträger: Tage. а) y. m. ι
mj + u^ , i=l,2,. a + a.t, о Ii
i=l,2
η .
158
1. Beschreibende Statistik
Es ist (vgl. Arbeitstabelle): S
TY
21'3430-231-326
=
-3276 · =
21.3311 W
^
a Q = Ρ - a t t = 326+0,2026*231 · Damit
ist nij =
17,75
=
.
- ° '
2 0 2 6
·
1?>75
- 0,2026't^
die
geschätzte
(ausgleichende)
Trendgerade. m 1 = 17,55 und m 2 1 = 13,50 (vgl. Abbildung 1) sind die Schätzwerte der Anzahl der täglichen Arbeltsunfälle am ersten und 21. Tag. Arbeitstabelle .2
4
y
y
i
2 i
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21
1 4 9 16 25 36 49 64 81 100 121 144 169 196 225 256 289 324 361 400 441
24 18 14 10 25 9 8 26 16 14 9 25 9 7 27 19 15 10 24 10 7
24 36 42 40 125 54 56 208 144 140 99 300 117 98 405 304 255 180 456 200 147
576 324 196 100 625 81 64 676 256 196 81 625 81 49 729 361 225 100 576 100 49
231
3311
326
3430
6070
A
y
17 55 17 35 17 14 16 94 16 74 16 54 16 33 16 13 15 93 15 73 15 52 15 32 15 12 14 92 14 71 14 51 14 31 14 11 13 90 13,70 13 50
rmi=ui 6,45 0,65 -3, 14 -6,94 8,26 -7,54 -8,33 9,87 0,07 -1,73 -6,52 9,68 -6, 12 -7,92 12,29 4,49 0,69 -4, 11 10, 10 -3,70 -6,50 -
b) Restkomponente Aus
= m^ + Uj und m^ = a Q + a ^
u^ = y^ - т^ , i=l,2,...,n ; u^
(1=1,2
n) folgt
ist die (geschätzte) Restkomponente
(vgl. Arbeitstabelle und Abbildung 1).
1. Beschreibende Statistik
159
Anmerkung: Offensichtlich folgt diese Zeitreihe - wegen 2 2 7,4286 г = = 0,0313 - keinem linearen Trend. Entscheidend 6,0553*6,9325 ist hier die Saison-(Tages-)Komponente, die noch in der Restkomponente enthalten ist. Ein Modell der Art y t = m1 + s 1 + Uj , i=l,2,
.n ,
mit s^ als Saisonkomponente wäre hier angebracht! c) Wie aus b) hervorgeht, folgen die Arbeitsunfälle einem Wochenrythmus, so daß ein 7-gliedriger gleitender Durchschnitt (k=3) den Daten angemessen ist: y
i
= (у
1-3 +У 1-2 +У 1-1 +У 1 +У 1 + 1 +У 1+2 +У 1 + 3 )/7 *
Arbeitstabelle
y
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21
i
24 18 14 10 25 9 8 26 16 14 9 25 9 7 27 19 15 10 24 10 7
У
y
i" y i -
15 15 15 15 15 15 15 15 15 15 15 16 15 16 16
4 7 4 4 3 3 3 1 3 7 9 0 9 0 0
-5,4 9,3 -6,4 -7,4 10,7 0,7 -1,3 -6,1 9,7 -6,7 -8,9 11,0 3,1 -1,0 -6,0 -
Am Anfang und Ende der Reihe gehen Je drei Werte verloren. Restkomponente: u^ = y^ - y^ (siehe Arbeitstabelle). Anmerkung: Auch hier zeigt sich - wie nicht anders zu erwarten war der überragende EinfluB der Saison-(Teiges-)Komponente, der nur durch ein Modell der Art
160
1. Beschreibende Statistik
= irij + s i + Uj , 1=1,2
η
erfaßt werden kann. Hinwels:
Die
Saison-(Tages-)Komponente
s ^
sT
, T=l,2
7,
läßt
sich zum Beispiel wie folgt schätzen. Zunächst
wird
aus den Werten u^
= y^
- y^
Tageskomponente" Je Wochentag Τ (T=l,2
die
7) bestimmt.
d
4 =
d
Do
=
[(-5,4) + (-6,1) + (-6,0)]/3 = -5,83
5
s "
5
Fr
=
(9,3 + 9,7) /2
= +9,50
=
ä
Sa
=
[(-6,4) + (-6,7)1/2
= -6,55
5
7 =
5
So
=
[(-7,4) + (-8,9)]/2
= -8,15
ä
l
=
5
Mo
=
[10,7 + 11,01/2
= +10,85
5
2 =
5
Di
=
[0,7 + 3, 11/2
= +1.9 ,
5
Mi
=
[(-1,3) + (-1,0)1/2
= -1,15
S
=
"durchschnittliche
Dann wird der Durchschnitt d = (d
Die
+d
+ . ..+d
geschätzte
sT = dT - d Zeitreihe geschätzte
)/7 = 0,08
berechnet.
Saison-(Tages-)Komponente
s^.
ergibt
sich d a n n aus
(derart justiert ist Σ s T = 0 ) , so daß mit y^, - s T
(der y^)
wie
folgt
Restkomponente
"saisonbereinigt"
werden kann.
ergibt sich aus u_ = y_ - s_ - y_ .
die Die
1. Beschreibende Statistik
161
Arbeitstabelle
Aus
Τ
Wochentag
y*j·
S
1 2 3 4 5 6 7
Mo Di Mi Do Fr Sa So
24 18 14 10 25 S 8
10 1 -1 -5 9 -6 -8
77 82 23 91 42 63 23
13 23 16, 18 15, 23 15, 91 15 58 15, 63 16 23
0 -0 0 0
51 12 23 83
1 2 3 4 5 6 7
Mo Di Mi Do Fr Sa So
26 16 14 9 25 9 7
10 1 -1 -5 9 -6 -8
77 82 23 91 42 63 23
15 23 14, 18 15 23 14, 91 15 58 15 63 15 23
-0 -1 -0 -0 0 -0 -0
07 12 07 19 28 07 67
1 2 3 4 5 6 7
Mo Di Mi Do Fr Sa So
27 19 15 10 24 10 7
10 1 -1 -5 9 -6 -8
77 82 23 91 42 63 23
16 17 16 15 14 16 15
0 1 0 -0
23 28 23 09
der
Arbeitstabelle
geht
yT
T
Ут
23 18 23 91 58 63 23
hervor, . daß
-
wie
erwartet
-
die
Zeitreihe durch eine starke Saison-(Tages-)Komponente gekennzeichnet ist (zum Beispiel s 1 = +10,77, Montag; s ? = -8,23, Sonntag). Die saisonbereinigte
Reihe
variiert
nur
noch
im
Intervall
[13,23;17,18], die Restkomponente u^ enthält nur noch "irreguläre" Schwankungen (vgl. auch Abbildung 2).
162
1. Beschreibende Statistik
1. Beschreibende Statistik
Abbildung 2
>-
163
164
1. Beschreibende Statistik
Lösung 90 Merkmal: (durchschnittliche) Eigenkapitalquote der Unternehmen Bundesrepublik Deutschland (Y), metrisch; Merkmalsträger: Jahre.
In der
b) Linearer Trend nach der Methode der kleinsten Quadrate: y i = mi + u i > mi = a Q + a j t j , 1=1,2
n,
t 1 = 1967; t 2 = 1968;... Anmerkung: Aus Vereinfachungsgründen 1st eine 1 ine are Transformation der äquidistanten Zeitpunkte sinnvoll: t^ = h C ^ - t ) , 1 t = η 4
n
Σ
i=1
t
1
1=1,2
η, η = 15, h = 1,
1 = ·== 29610 = 1974, 15
= t . - 1974, d.h. t l = -7, t 2 = -6
Es g i l t :
t 1 5 = +7 .
I. Beschreibende Statistik
165
Arbeitstabeile
Vi
ti -7 -6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6 7 Σ
ti
31, 4 30, 6 28, 4 26,7 25, 9 24, 6 24,0 23,7 23, 7 23, 1 22, 9 22, 4 21,7 19, 8 18,7
0
367,68
У1
-219,8 -183,6 -142,0 -106,8 -77,7 -49,2 -24,0 0 23,7 46,2 68, 7 89, 6 108,5 118, 8 130,9 -216,7
tf
yf
49 36 25 16 9 4 1 0 1 4 9 16 25 36 49
985,96 936,36 806,56 712,89 670,81 605,16 576,00 561,69 561,69 533,61 524,41 501,76 470,89 392,04 349,69
280
9189,52
Somit ist ai = - 216,7/280 = -0,77393, αό = 367,6/15 = 24,51, so daß mi = 24,51 - 0,77393 t- . Rücktransformation: %
= 24,51 - 0,77393 (ti - t) = = 24,51 - 0,77393 (ti - 1974) = = 1552,2 - 0,77393 ti
(linearer Trend),
iri! = 29,9, m 1 5 ^ 19,0 (siehe Abbildung) . c) Eine geeignete Maßzahl ist das Bestimmtheitsmaß r 2 . Es ist n - Z t i
г 1 η 1L =
У±
-
9 erfüllt ist? b) Stellen Sie die zu a) gefundene Beziehung graphisch dar und kommentieren Sie die Graphik! Aufgabe 50 Für ein neu entwickeltes Mittel gegen Fußpilz wird vom Hersteller angegeben, daß es mit einer Wahrscheinlichkeit von π = 0,85 zum Behandlungserfolg führt. In einem klinischen Großversuch werden 800 zufällig ausgewählte Personen damit behandelt. Wie groß ist die Wahrscheinlichkeit dafür, daß höchstens 82% der Behandelten vom Fußpilz befreit werden, wenn die Behauptung des Herstellers richtig ist? Aufgabe 51 Man nimmt an, daß die Anzahl der zwischen 13.55 Uhr und 14.00 Uhr an der Kasse eines Supermarkts ankommenden Kunden POISSONverteilt ist. Es wurde festgestellt, daß in diesem Zeitabschnitt im Mittel 3,5 Kunden eintreffen. Wie groß ist die Wahrscheinlichkeit dafür, daß in diesem Zeitabschnitt a) keine Kunden, b) mehr als drei Kunden, c) mehr als einer, aber weniger als fünf Kunden an der Kasse ankommen? Betrachtet werden nun 30 zufällig und mit Zurücklegen ausgewählte Arbeitstage. Welcher Verteilung folgt die Anzahl der Zeitabschnitte (zu je 5 min.), in denen keine Kunden an der Kasse eintreffen? Aufgabe 52 In einer Mensa wird regelmäßig Suppe mit Einlage angeboten. Bei der Zubereitung werden der Grundsubstanz 500 Fleischstückchen zu je etwa 5 g zugegeben und gut umgerührt, so daß sich 125 1 Suppe ergeben. Dann
187
2. Schließende Statistik
werden - tinter ständigem Umrühren - P o r t i o n e n zu j e einem v i e r t e l ausgegeben.
Liter
Bestimmen S i e d i e Wahrscheinlichkeit d a f ü r , daß s i c h i n e i n e r P o r t i o n a ) k e i n und b) mehr a l s d r e i Fleischstückchen b e f i n d e n . Was ergäbe s i c h Fleischstückchen
zu a ) , wenn an einem enthielten?
Tage
die
125
1 Suppe
nur
400
Aufgabe 53 Luxus-Student Brause, 29, kauft s i c h von seinem durch Z e i t a b l a u f s e l b s t v e r d i e n t e n Taschengeld einen vornehmen D i p l o m a t e n - K o f f e r mit Kombinat i o n s s c h l o ß zum Transport s e i n e r S k r i p t e n . Nach wenigen Tagen hat e r d i e Nummer des Kombinationsschlosses vergessen; e r weiß nur, daß d i e Nummer 4 - s t e l 1 i g i s t , d i e Z i f f e r n 1, 8 und 2 vorkommen und e i n e Z i f f e r 2 mal vorkommt. W i e v i e l Z i f f e r n f o l g e n muß er höchstens durchprobieren, b i s e r seinen K o f f e r ö f f n e n kann?
Aufgabe 54 Bestimmen S i e d i e Wahrscheinlichkeit d a f ü r , daß beim g l e i c h z e i t i g e n Werfen von z w ö l f i d e a l e n Würfeln j e d e Augenzahl genau zweimal vorkommt!
Aufgabe 55 Herta, 29, Studentin der T r o p h o l o g i e im 16. Fachsemester,sorgt f ü r den Winter vor und k o n s e r v i e r t Obst und Gemüse in Kilo-Dosen. An einem s t a r k e n Wochenende s c h a f f t s i e 60 Dosen: 25 Obstkonserven (10 Kirschen, 10 Pflaumen, 5 Birnen) und 35 Gemüsekonserven (15 Bohnen, 10 Erbsen, 5 Rote B e e t e , 5 Tomaten) und s t a p e l t s i e z u f ä l l i g und l i e b e v o l l im K e l l e r . A l s s i e im Winter ans Eingemachte geht, muß s i e f e s t s t e l l e n , daß s i e vergaß, d i e Dosen zu e t i k e t t i e r e n . Wie groß i s t d i e Wahrscheinlichkeit dafür, daß s i e z u f ä l l i g genau d i e b e n ö t i g t e n Dosen ihrem Bestand entnimmt, wenn s i e f ü r e i n S p e z i a l g e r i c h t a ) genau 3 Dosen Rote Beete, b ) 2 Dosen Kirschen, 2 Dosen Bohnen und 1 Dose Tomaten braucht?
Aufgabe 56 Bei der Ausarbeitung eines Vortrages bedient sich nachfolgenden "halbautomatischen S c h n e i l f o r m u l i e r s y s t e m s Broughton".
Brause des nach P h i l i p
"Wer e i n e F l o s k e l sucht, mit der er s e i n e Zuhörer oder Leser b e e i n drucken oder einschüchtern kann, der denke sich eine beliebige
188
2. Schließende
Statistik
dreistellige Zahl und suche sich nach ihr aus der Tabelle die Elemente seiner Imponiervokabel zusammen; zum Beispiel 759: "synchrone Flukt uat i onskont i ngenz". 0. 1. 2: 3. 4. 5. 6. 7. 8. 9.
konzentrierte integrierte permanente systematisierte progressive funktionelle orientierte synchrone qualifizierte ambivalente
0. 1. 2. 3. 4. 5. 6. 7. 8. 9.
0. 1. 2. 3. 4. 5. 6. 7. 8. 9.
FührungsOrganisat ionsIdentifikationsDr i ttgenerat i onsKoalitionsFluktuationsÜbergangsWachstumsAktionsInterpretations-
-struktur -flexibilität -ebene -tendenz -Programm i erung -konzeption -phase -potenz -Problematik -коntlngenz
Quelle: Wolf Schneider, Deutsch für Profis, Hamburg 1984, S.27 a) Wieviel (unterschiedliche) System ableiten?
Imponiervokabeln kann Brause aus
diesem
b) Wie groß ist die Wahrscheinlichkeit dafür, daß er zufällig die Imponiervokabel "permanente Interpretationsproblematik" konstruiert? Aufgabe 57 Welche der folgenden vier Tabellen können als Tabellen bedingter Wahrscheinlichkeitsfunktionen interpretiert werden? a)
\X2 X
11
X
12
X
c)
13
\X2 l\ X
11
X
12
X
13
b) X
21
x
22
\ x„ xx V i \
0,8
0,2
X
0,5
0,6
11
X
0,3
0,2
12
X
X
x
13
X
21
X
22
0,3
0,7
0,9
0,1
0,5
0,5
d) 21
22
\
X
2
0,2
0,1
0,2
0,2
X
12
0,1
0,2
X
13
x
n
X
21
X
22
0,3
0,3
0,2
0,2
0,5
0,5
2. Schließende Statistik
189
Aufgabe 58 Zu welcher der vier in Aufgabe 57 genannten Tabellen gehören stochastisch unabhängige Zufallsvariable Xj und X^? Geben Sie die Werte von zwei zugehörigen gemeinsamen Wahrscheinlichkeitsfunktionen an!
Aufgabe 59 Welche der vier in Aufgabe 57 genannten Tabellen können als Tabellen gemeinsamer Wahrscheinlichkeitsfunktionen interpretiert werden?
Aufgabe 60 Ein Unternehmen hat 689 Mitarbeiter, die sich wie folgt auf die einzelnen Unternehmensbereiche verteilen:
Unternehmens- X^Geschlecht bereich
männlich
weiblich
Verwaltung Produktion Absatz
24 314 27
12 261 51
a) Zur Organisation des jährlichen Betriebsausflugs wird ein Mitarbeiter zufällig ausgewählt. Wie groß ist die Wahrscheinlichkeit dafür, daß a^) der Mitarbeiter in der Produktion arbeitet? a^) der Mitarbeiter weiblich ist? a^) der Mitarbeiter in der Produktion arbeitet und weiblich ist? b) Bestimmen Sie die Wahrscheinlichkeit dafür, daß ein zufällig ausgewählter Verwaltungsmitarbeiter männlich ist! c) Bestimmen Sie die Wahrscheinlichkeit dafür, daß eine ausgewählte Mitarbeiterin im Bereich Absatz tätig ist!
zufällige
d) Hängt die Aufteilung der Mitarbeiter auf die einzelnen Unternehmensbereiche vom Geschlecht ab oder nicht?
Aufgabe 61 Nach dem dritten (vergeblichen) Versuch, das Vordiplom in Statistik zu erwerben, macht sich Brause selbständig. Er versucht, sich als Glücksspieler eine sichere Existenz aufzubauen. Wohlgerüstet mit dem Instrumentarium der Wahrscheinlichkeitstheorie bietet er gegen einen Einsatz von Jeweils 1 , — DM die beiden folgenden Spiele an:
190
2. Schließende Statistik
a) Würfeln mit 4 (idealen) Pfennigen ausbezahlt.
Würfeln.
Das
Produkt
der
Augen
wird
in
b) Würfeln mit 4 (idealen) Würfeln. Die 8-fache Summe der Augen wird in Pfennigen ausbezahlt. Müßte sich Brause um seine Zukunft sorgen? Aufgabe 62 Die
zweidimensionale
Verteilung
Zufallsvariable
(X^,)^)
besitze
die
folgende
(Wahrscheinlichkeitsfunktion): \X2 1 2
1
2
3
0,1 0,1
0,3 0,1
0,2 0,2
Bestimmen Sie a) den Erwartungswert und die Varianz von Xj und X^, b) den Erwartungswert und die Varianz sowie die Verteilung der Summe X
1
+
X
2·
c) den Erwartungswert und die Varianz sowie die Verteilung des Produkts V
V
Aufgabe 63 Geben Sie zu Aufgabe 17 a) scheinlichkeitsfunktion an!
und
b)
die
Jeweils
zugehörige
Wahr-
* Aufgabe 64 Die stetige zweidimensionale Zufal1svariable gerneinsame Wahrscheinlichkei tsdichtef unkt ion: Г x+y , f
X,Y
(x,y)
=
Ι (_ 0
(X,Y) habe die
folgende
falls 0 s x, у s 1 sonst .
Sind X und Y stochastisch unabhängig? Aufgabe 65 Eine Kaffeerösterei bietet eine bestimmte Kaffeemischung in 250 g- und 500 g-Paketen an. Vor der Auslieferung einer Wochenproduktion an den
2. Schließende Statistik
Einzelhandel vorgesehenen
2
σ^=12 g
2
wird anhand Soll-Gewichte
2
von Zufallsstichproben (μ^=251 g, μ^=501 g bei
191
geprüft, ob einer Varianz
die von
2
bzw. 0 und τ) < 1 ist der Stichprobenumfang η so zu bestimmen, p(
Ι^η-μχΙ-ε) *
1_η
daß
gilt!
Aufgabe 69 Mit einer Maschine werden 0,7 1-Flaschen abgefüllt. Aus der Gesamtheit 3 aller in einem Monat abgefüllten Flaschen - mit Mittelwert μ χ = 710 cm und Varianz 2 = 6400 (cm 3 )2 - soll eine einfache Stichprobe vom Umfang n=256 gezogen werden. In welchem zentralen Schwankungsintervall ist mit einer Wahrscheinlichkeit von (approximativ) 0,95 der Stichprobenmittelwert zu erwarten?
Aufgabe 70 Der Betreiber einer Mensa überlegt sich, die Warteschlangen an den Kassen dadurch zu verkürzen, daß alle Rechnungsbeträge auf jeweils ganze DM gerundet werden, so daß die Zeit für das Herausgeben des "Kleingelds" entfällt. Diese Rundung führt zu Fehlern. Allerdings gleichen sich Auf- und Abrundungsfehler mit zunehmender Anzahl von Rechnungen aus, so daß die Summe der Rundungsfehler einer hinreichend großen Anzahl von Rechnungen im allgemeinen in einem relativ kleinen Intervall liegt. a) Bestimmen Sie - approximativ - ein symmetrisches Intervall für die Summe der Rundungsfehler von 200 Rechnungen, dessen Grenzen in nur 5% aller Fälle über- oder unterschritten werden! Nehmen Sie dabei an, daß die Rundungsfehler der einzelnen Rechnungen voneinander unabhängig und im Intervall [0,5 DM; +0,5 DM] rechteckverteilt sind!. b) Teilaufgabe a) enthält zwei wesentliche Annahmen. Nehmen Sie zu beiden kritisch Stellung!
Aufgabe 71 Ein
Vertreter
besucht
täglich
seine
Kunden.
Dabei
legt er im 2 Durchschnitt 140 km zurück mit einer Varianz von 2304 (km ). Wie groß ist die Wahrscheinlichkeit dafür, daß der Wert des arithmetischen Mittels einer einfachen Stichprobe vom Umfang n=16 um höchstens 36 (km) vom Tagesdurchschnitt abweicht?
2. Schließende Statistik
193
Aufgabe 72 Der durchschnittliche Rechnungsbetrag eines Handwerksbetriebes (ohne Bauleistungen) ist μ^ = 150,— DM. Aus den Rechnungen des vergangenen Geschäftsjahres werden zufällig - und mit Zurücklegen - 16 Rechnungen ausgewählt. a) Wie groß ist mindestens die Wahrscheinlichkeit, daß der durchschnittliche Rechnungsbetrag dieser 16 Rechnungen um nicht mehr als 40,— DM vom durchschnittlichen Rechnungsbetrag aller Rechnungen 2 2 abweicht, wenn als Varianz der Rechnungsbeträge σ^ = 25600,— (DM) angenommen wird? b) Wie wäre Frage a) zu beantworten, wenn der Stichprobenumfang um 34 Rechnungen erhöht würde?
Aufgabe 73 Die Dauer eines Herreneinzels (ein Match, drei Gewinnsätze) bei den Internationalen Französischen Tennismeisterschaften in Paris (French Open) beträgt - wie man aus langjähriger Erfahrung weiß - durchschnittlich 2 Stunden und 45 Minuten bei einer Standardabweichung von 58 Minuten. Für die Planung eines Turniers müssen die folgenden Fragen beantwortet werden. a) Mit welcher Wahrscheinlichkeit wird das arithmetische Mittel der Spieldauern von 25 zufällig ausgewählten Herreneinzeln der letzten Jahre um höchstens eine halbe Stunde von der durchschnittlichen Spieldauer abweichen? b) Wie breit muß das zentrale Schwankungsintervall zu Teilaufgabe a) wenigsten sein, damit das Ergebnis sinnvoll ist?
* Aufgabe 74 2 Aus einer Grundgesamtheit mit Mittelwert μ^ und Varianz σ χ wird eine einfache Stichprobe vom Umfang η gezogen. Gesucht ist die Wahrscheinlichkeit, daß der Wert des arithmetIschen Mittels der Stichprobe nicht mehr als das Zweifache des Standardfehlers (2σ^) vom Mittelwert der Gesamtheit abweicht! Nehmen Sie an, daß a) die Gesamtheit normalverteilt ist, b) die Verteilung der Gesamtheit beliebig und η < 40 ist, c) die Verteilung der Gesamtheit beliebig und η = 400 ist!
* Aufgabe 75 Aus Realisationen von stochastlsch unabhängigen, im Intervall [0;1] rechteckverteilten Zufallsvariablen sind Realisationen von approximativ standardnormalverteilten Zufallsvariablen abzuleiten! Veranschaulichen Sie Ihre Überlegungen anhand der Realisationen von n=24 rechteckverteilten Zufallsvariablen!
194
2. Schließende Statistik
Aufgabe 76 Wie o f t muß e i n e i d e a l e Münze mindestens geworfen werden, damit mit e i n e r Wahrscheinlichkeit von 0,9 d i e D i f f e r e n z zwischen der r e l a t i v e n Häufigkeit (X*/n) der Kopfwürfe und π = 0,5 k l e i n e r oder höchstens g l e i c h 0,01 i s t ?
Aufgabe 77 η Zufallsvariable
X^,
1=1,2
n,
seien
stochastisch
unabhängig
und
2
identisch v e r t e i l t sein,
mit Mittelwert μ und Varianz er
= 36. Wie groß muß η
damit d i e Wahrscheinlichkeit dafür, daß X von μ um nicht mehr a l s
0,5 abweicht,
g l e i c h 0,99 i s t ?
* Aufgabe 78 Aus
einer
Gesamtheit entnommen.
mit
2 σ^
=
900
und unbekanntem
Mittelwert
normalvertei1ten
werden Stichproben (mit Zurücklegen) vom Umfang Für e i n e Punktschätzung des M i t t e l w e r t s μ^ werden
n=3 die
Schät zfunkt i onen (St i chprobenmi t t e 1 w e r t e ) -(1) х з -
X +X
l
2+X3
vorgeschlagen.
und
-(2) 1 1 з = ίχι + К
х
+
1 5X3
Welche d i e s e r Schätzfunktionen würden S i e vorziehen?
Aufgabe 79 Die Wareneingangskontrolle eines A u t o m o b i l h e r s t e l l e r s hat u.a. d i e Aufgabe, g e l i e f e r t e Glühlampen auf ihre Funktionsfähigkeit und Verwendbarkeit zu überprüfen. Hierzu werden Merkmale wie L i c h t l e i s t u n g , Brenndauer und auch Abmessungen e r f a ß t . Eine Überprüfung a l l e r g e l i e f e r t e n Glühlampen kommt schon wegen der zerstörenden Brenndauerprüfung nicht in Betracht. Den Lieferungen werden dalier Z u f a l l s s t i c h p r o b e n entnommen, und aufgrund der Stichprobenergebnisse wird entschieden, ob d i e L i e f e r u n g angenommen werden s o l l oder nicht. Eine solche L i e f e r u n g bestehe aus 1000 Glühlampen, d i e auf zehn P a l e t t e n in zehn Reihen zu j e w e i l s zehn Stück angeordnet sind. Beschreiben S i e e i n g e e i g n e t e s Verfahren, wie man aus d i e s e r L i e f e r u n g eine e i n f a c h e und uneingeschränkte Z u f a l l s s t i c h p r o b e vom Umfang η ziehen kann!
2. Schließende Statistik
195
Aufgabe 80 Herkömmliche Batterien haben eine m i t t l e r e Leistung von Wattstunden j e kg. Neuartige Aluminiumbatterien brachten Leistungen: Leistungen von . . . bis unter . . . Wattstunden j e kg 275 285 295 305 315
- 285 295 - 305 - 315 - 325
etwa 50 folgende
Anzahl 20 80 200 80 20
a) Unter welchen Bedingungen lassen sich aus diesen Daten eine Punktund eine Intervallschätzung für d i e unbekannte m i t t l e r e Leistung dieses Typs von Batterien ableiten? b) Nehmen Sie an, die unter a) zu nennenden Bedingungen seien e r f ü l l t und führen Sie eine Punkt- und eine Intervallschätzung durch! Aufgabe 81 a) In einem Vorort mit N^ = 10000 Haushalten s o l l der Anteil der Haushalte mit mehr als einem PKW geschätzt werden. In einer Stichprobe von n^ = 400 Haushalten (Auswahl mit Zurücklegen) befinden sich 140 Haushalte mit mehr a l s einem PKW. Bestimmen Sie ein 95/4-Konfidenzintervall f ü r den wahren Anteil iij der Haushalte in diesem Vorort mit mehr a l s einem PKW! b) Die g l e i c h e Aufgabe s o l l f ü r das gesamte Wohngebiet mit N,, = 1 Mio. Haushalten gelöst Stichprobenumfang
werden. Berechnen Sie daher den n^ (Auswahl mit Zurücklegen)
95%-Konfidenzintervall
notwendigen für ein
der Länge 0,04 f ü r den wahren Anteil
πder
Haushalte im gesamten Wohngebiet mit mehr a l s einem PKW f ü r den F a l l , Ы ) daß das Stichprobenergebnis aus a) Vorstichprobe betrachtet werden kann,
als
Anteilswert
einer
b2) daß d i e Bevölkerungsstruktur des gesamten Wohngebietes sich so von der des Vorortes unterscheidet, daß d i e Stichprobe aus a) nicht a l s Vorstichprobe dienen kann! Erklären Sie den Unterschied der Ergebnisse aus Ы ) und Ь2)!
196
2. Schließende Statistik
Aufgabe 82 Wie groß ist der größte erforderliche (Mindest-) Stichprobenumfang für die Schätzung des Parameters π einer zweipunktverteilten Gesamtheit mit einem maximalen (absoluten) Zufallsfehler von с = 0,02?
Aufgabe 83 Stichprobenerhebungen sind in der amtlichen Statistik von großer Bedeutung. Ein Beispiel aus der Wirtschaftsstatistik ist die Kostenstrukturerhebung im Bergbau und im Verarbeitenden Gewerbe (Industrie und Verarbeitendes Handwerk). Ziel dieser Erhebung 1st unter anderem die Erfassung der Vorleistungsstruktur der Unternehmen in diesem Bereich. Zu diesem Zweck wird eine Zufallsstichprobe (Auswahl ohne Zurücklegen) von rd. 39% aus allen rd. 37000 Unternehmen mit wenigstens 20 Beschäftigten dieses Bereichs gezogen. a) Nehmen Sie an, der Wert des durchschnittlichen Verbrauchs aller Unternehmen in der Stichprobe an Roh-, Hilfs- und Betriebsstoffen hätte in einem Jahr 15 Mio. DM betragen ( =
n
—
zu
vollenden,
wenn
man
46400 = 100000 = о 464
ist die Wahrscheinlichkeit, das (45. und) 75. Lebensjahr zu vollenden, wenn man das 10. Lebensjahr vollendet hat. Schließlich ist P(E 2 |E 1 ) = P(E 2 nE 1 )/P(E 1 ) = P(E2)/P(E1) =
0 464
= 0,490
die Wahrscheinlichkeit, das 75. Lebensjahr zu vollenden, Bedingung, daß das 45. Lebensjahr vollendet wurde.
unter
der
Lösung 13 Die Stromversorgung ist unterbrochen, wenn Teil Nr. 1 defekt ist (Ereignis Ej mit Ρ(Ε χ ) = 0,005) oder alle Teile Nr. 2 bis 5 defekt sind
(Ereignis E 2 = E ^ n E ^ n E ^ n E ^ mit P(E^) =
=
Ρ(Ε
21)·Ρ(Ε22)·Ρ(Ε23,·Ρ(Ε24) =
Ρ(Ε
2.)4)·
Somit ist das Ereignis G (Unterbrechung der Stromversorgung): G = E^uEg. P(G) soll £ 0,01 sein. Es ist P(G) = P(E^) + P(E 2 ) - P(E лЕ2), mit PtEjnE^ > 0 .
Wegen der Unabhängigkeit von E^ und E^ gilt: 0,01 £ 0,005 + P(E„ ) 4 - (0,005·Ρ(E_ ) 4 ) . 2·
0,005 г P(E ) 4 (1-0,005) 2* 0,005 0,995
4
>
P(E 2 .)
2·
° · 0 0 5 - 0,2662 . 0,995
2·
232
2. Schließende Statistik
Die A u s f a l l w a h r s c h e i n l i c h k e i t Wert 0,2662 n i c h t
Jedes d e r T e i l e Nr.
2 b i s 5 darf
also
den
übersteigen.
Lösung 14 Sei
E i das E r e i g n i s ,
Dann i s t P t E ^
daß das i - t e Kühlsystem ( i = l , 2 , 3 )
= 0 , 1 für
ausfällt.
1=1,2,3.
Sowohl b e i ' T e i l a u f g a b e a ) a l s auch b e i T e i l a u f g a b e b )
i s t Р(Е1лЕ2пЕ3)
zu
bestimmen. a)
Bei
Annahme d e r s t o c h a s t i s c h e n Unabhängigkeit
der d r e i
E r e i g n i s s e E^
gilt: PCEj^nEg) = Ρ(Ε1)·Ρ(Ε2)·Ρ(Ε3) Die
Ausfallwahrscheinlichkeit
= 0 , 1 · 0 , 1 · 0 , 1 = 0,001 . des
gesamten Kühlsystems
beträgt
also
0,001.
b ) Unter den g e ä n d e r t e n Annahmen i s t P(E^) = 0,1 f ü r 1=1,2,3 . P ( E ^ I Ε . ) = 0 , 3 f ü r i * j und P ( E . lE.nE ) = 0 , 7 f ü r i , j , k paarweise ι j к Damit
verschieden,
ist
рсе^ле^ае^)
=
ρ(ε
1
)·ρ(ε
2
ιε
1
)·ρ(ε
3
ιε
2
λε
1
)
= 0 , 1 · 0 , 3 · 0 , 7 = 0,021 . Die A u s f a l l w a h r s c h e i n l i c h k e i t b e t r ä g t 0,021 und i s t a l s o aufgrund d e r g e ä n d e r t e n Annahmen d e u t l i c h g e s t i e g e n .
Lösung 15 Eine Betrachtung T u t o r r e c h t hat.
der
Elementarereignisse
zeigt
unmittelbar,
daß
der
2. Schließende Statistik
Elementarereignis (mit Berücksichtigung der Reihenfolge)
Ρ(ω)
Elementarereignis (ohne Berücksichtigung der Reihenfolge)
233
Ρ(ω' )
ω' (W,W, W) (W,W, Z) (W,Z,W) (Z,W,W) (W,Z,Z) (Z,W,Z) (Z,Z,W) (Ζ,Ζ,Ζ)
1/8 1/8·. 1/8 1/8-1 1/8-j 1/8 1/8-1 1/8
{W,W,W>
1/8
{W,W,Z>
3/8
{W,Z,Z>
3/8
{Z,Z,Z>
1/8
Also ist P({W,W,W} υ {Ζ,Ζ,Ζ}) = 2/8 = 1/4 . Brauses Überlegungen sind diffiziler. Richtig ist, daß P({Anzahl Wappen ϊ 2} и {Anzahl Zahl г 2}) = P({Anzahl Wappen £2}) + + P({Anzahl Zahl ί 2})
= i + i
1 ist (s.o. ).
Falsch ist hingegen die Annahme, daß die Wahrscheinlichkeit für einen "Wappen-(Zahl-)Wurf" bei der dritten Münze, wenn (unter der Bedingung, daß) die beiden anderen Münzen Wappen (Zahl) zeigen, gleich 1/2 ist. Begründung: Wie der obigen Tabelle zu entnehmen ist, zeigen nur in einem von 4 Fällen alle Münzen Wappen (Zahl), wenn man die Betrachtung auf jene Elementarereignisse (ω) beschränkt, in denen wenigstens 2 Münzen Wappen (Zahl) zeigen, d.h. die Wahrscheinlichkeit beträgt nicht, wie Brause vermutet, jeweils 1/2, sondern nur jeweils 1/4. Damit erhält man P({W,W,W,}u{Z,Z,Z>) = P({W,W,W})+P({Z,Z,Z})
1 1 2*4
1 1 2*4
=
1 4
Lösung 16 Sei E., i=l,2
10, das zufällige Ereignis, daß der i-te Mann aus der
Gruppe innerhalb eines Jahres stirbt. Die
Ej
sind stochastisch unabhängig,
und es ist
P(Ej) = 0,00475
alle i. Dann ist a) P(A) = Ρ ί Ε ^ η . . ·πΕ 10 ) = Ρ(Ε χ )-Р(Ё 2 ) ·. . . ·Ρ(Ε 10 ) = = (1-0,00475)
10 ·
= 0,9535
für
234
2. Schließende
Statistik
die Wahrscheinlichkeit dafür, daß keiner der 10 Männer im Alter von 45 bis 46 Jahren stirbt; b) P(B) = P[ (EjnEgnE^. . .nE 10 ) и ^лЕ^лЁдП. . .
. .
. . .и(Ё 1 пЁ 2 пЁ 3 п..·ηΕ 10 1 = 10·(1-0,00475)9·0,00475 = 0,0455 die Wahrscheinlichkeit dafür, daß genau (irgend-)einer der 10 Männer im Alter von 45 bis 46 Jahren stirbt; c) P(C) = P(AuB) = P(A) + P(B) = 0,9535 + 0,0455 = 0,999 die Wahrscheinlichkeit dafür, daß nicht mehr als einer, d.h. keiner oder genau einer der 10 Männer im Alter von 45 bis 46 Jahren stirbt; d) P(D) = 1 - P(C) = 1 - 0,999 = 0,001 die Wahrscheinlichkeit dafür, daß mehr als einer der 10 Männer im Alter von 45 bis 46 Jahren stirbt; e) P(E) = 1 - P(A) = 1 - 0,9535 = 0,0465 die Wahrscheinlichkeit dafür, daß mindestens einer der 10 Männer im Alter von 45 bis 46 Jahren stirbt.
Lösung 17 a) Sei G das Ereignis "Kfz-Kennzeichen hat gerade Endziffer" und U das Ereignis "Kfz-Kennzeichen hat ungerade Endziffer". Die Familie kann jeden Tag Auto fahren, wenn der Alfa eine gerade und der Fiat eine ungerade Endziffer hat oder umgekehrt. Man kann (wohl) davon ausgehen, daß die Zuteilung von Kfz-Kennzeichen mit gerader bzw. ungerader Endziffer zufällig und unabhängig erfolgt mit P(G) = = P(U) = 0,5. Dann ist die Wahrscheinlichkeit für die Kombination (G, U) oder (U,G), d.h. dafür, daß die Familie an Jedem Tag im Stadtgebiet fahren kann, gleich P(G)-P(U) + P(U)-P(G) = 2·0,25 = 0,5. b) Wenn die Familie noch ein drittes Auto besäße, ist die Wahrscheinlichkeit dafür, daß sie ал jedem Tag im Stadtgebiet fahren kann, gleich 1 - [P(G)-P(G)-P(G)] - [P(U)-P(U)*P(U)] = 1 - (1/2)3 3 - (1/2) = 0,75, so daß die unter a) berechnete Wahrscheinlichkeit um 50% steigen würde.
2. Schließende Statistik
235
Lösung 18 a) Anzahl der Elementarereignisse, Stichprobenraum al) Sei
=
J=l,2
j,
wenn
der
i-te
Würfel
j
Augen
zeigt
(i=l,2,3;
6).
Dann läßt sich jedes Ergebnis eines Wurfes mit 3 unterscheidbaren Würfeln als Elementarereignis ω = (.ω^,ω^,ω^) beschreiben. Da jedes ьл die Werte j=l,2
6 annehmen kann, gibt es 6·6·6 = 216
solche Elementarereignisse. Der Stichprobenraum Ω besteht also unter Berücksichtigung der Reihenfolge - aus 216 Elementarereignissen. a2) Jetzt wird nicht mehr zwischen den 3 Würfeln unterschieden, so daß beispielsweise die Elementarereignisse (1,1,2), (1,2,1) und (2,1,1) aus al) - also mit Berücksichtigung der Reihenfolge - zu einem neuen Elementarereignis ω' = (2-1-1) - ohne Berücksichtigung der Reihenfolge - zusammengefaßt werden. Es gibt nun - 6 Elementarereignisse ω' der Form ω' = (ω^-ω^-ω^), zum Beispiel (1-1-1),
(2-2-2)
- 30 Elementarereignisse ω' der Form ω' = (ω^-ω^-α^), zum Beispiel (2-2-1),(2-2-3), .. .
und
- 20 Elementarereignisse ω' der Form ω'= (ω^-ω^-ω^), zum Beispiel (3-2-1), (4-2-1),... (mit ω ^ ω ^ ω ^ , ω.=1,2,... oder 6), so daß der Stichprobenraum Ω' - ohne Berücksichtigung der Reihenfolge - aus 6+30+20=56 Elementarereignissen ω' besteht. b) Wahrscheinlichkeiten der Elementarereignisse Ы ) Sei E^ das Ereignis, daß der i-te Würfel j Augen zeigt. Dann gilt P(E^) = 1/6 (1 = 1,2,3; j=l,2
6), da es sich um ideale Würfel
handelt. 1 Γ Die Ereignisse E^ und E'r, sind stochastisch unabhängig, Augenzahl eines Würfels (l£i2) = {(ь^.ь^.ь^), (ω^,ω^,ω^),
(ü^.WJ.i^)}, zum Beispiel
(2-2-1) = {(2,2,1),
ist. Somit
(2,1,2),
(1,2,2)},
ist für
diese
30 Elementarereignisse ω' jeweils Ρ(ω') = 3/216. Ist ω'νοη der Form ω' = (ω^,ω^,ω^), zum Beispiel ω' = (3-2-1), so gibt es genau sechs Elementarereignisse ωεΩ, so daß u>' = = (ωΓω2-ω3) = { « ^ , ω ^ ) , (ω^,ω.,). (ω,,,ω^). (»^,«^), (ω3,ω1,ω2), (3,1,2),
(ь^.ь^.о^)},
(2,3,1),
zum
Beispiel
(2,1,3), (1,3,2),
(3-2-1)
(1,2,3)},
=
{(3,2,1),
ist. Somit ist für
diese 20 Elementarereignisse ω' jeweils Ρ(ω') = 6/216. N.B.: Die Elementarereignisse ω'εΩ' werden dabei als Ereignisse in Ω aufgefaßt, die dort aber nicht notwendig auch elementar sein müssen. cl) Bestimmung der Wahrscheinlichkeit für die Augensumme 11 (vgl. b)
ω'
Ρ(ω' )
6-4-1 6-3-2 5-5-1 5-4-2 5-3-3 4-4-3
6/216 6/216 3/216 6/216 3/216 3/216
Σ
27/216
2. Schließende Statistik
237
c2) Bestimmung der Wahrscheinlichkeit für die Augensumme 12 (vgl. b)
ω' 6-5-1 6-4-2 6-3-3 5-5-2 5-4-3 4-4-4 Σ
Ρ(ω' ) 6/216 6/216 3/216 3/216 6/216 1/216 25/216
Der Grund für die Beobachtung des Spielers, daß die Augensumme 11 häufiger auftritt als die Augensumme 12, liegt also darin, daß die Wahrscheinlichkeit, mit 3 Würfeln 11 Augen zu werfen, größer ist als die Wahrscheinlichkeit, 12 Augen zu werfen. d) Sei X die Augensumme beim Werfen von 3 Würfeln. Dann kann X die Werte χ = 3,4,...,18 annehmen. Mit Ρ(X=x) := Ρ({ω·|Χ(ω" ) = x, ω'εΩ'}), zum Beispiel P(X=11) : = := Ρ({ω'|Χ(ω') = 11, ω' εΩ'}), vgl. cl), ergibt sich die folgende Wahrscheinlichkeitsfunktion.
χ 3 4 5 6 7 δ 9 10 11 12 13 14 15 16 17 18 Σ
Ρ(Χ=χ) = ί χ (χ) 1/216 3/216 6/216 10/216 15/216 21/216 25/216 27/216 27/216 25/216 21/216 15/216 10/216 6/216 3/216 1/216 1
238
2. Schließende Statistik
Lösung 19 Eine W a h r s c h e i n l i c h k e i t s f u n k t i o n f ^ ( x ) hat d i e а ) 0 £ f x ( x ) s 1 und
Eigenschaften:
b ) Σ f " x ( X j ) = 1.
Daher können f
( x ) wegen Σ j i \ ( x J, )
f4(x)
> 1
und
wegen f 4 ( 3 ) = - 0 , 2 5
keine Wahrscheinlichkeitsfunktionen
sein.
f „ ( x ) , f _ ( x ) und f _ ( x ) können W a h r s c h e i n l i c h k e i t s f u n k t i o n e n tL J b s i e d i e oben angegebenen E i g e n s c h a f t e n b e s i t z e n .
sein,
weil
f_(x) kann e i n e W a h r s c h e i n l i c h k e i t s f u n k t i o n s e i n , ö 0 s с £ 0 , 5 . A n d e r e n f a l l s s i n d zwei F u n k t i o n s w e r t e n e g a t i v .
wenn
Die Funktion gilt:
N. B. : f g ' O tritt
ist
e i n e sogenannte E i n - P u n k t - V e r t e i l u n g .
mit W a h r s c h e i n l i c h k e i t
1 ein;
f
3
(l)
Das E r e i g n i s X = 1
= P ( X = 1 ) = 1.
Lösung 20 Χ-μ Es i s t
Χ* =
σχ
ν_ = ί-Ε
,
so das Ε ( Χ * ) = ε ί ^ Ι = - Ε ( Χ - μ ) = - = £ ( μ - μ ) = 0 L σ J σ
j=l,2
6 .
b ) Χ = Augenzahl beim e i n m a l i g e n Wurf mit dem v e r f ä l s c h t e n
Würfel.
2. Schließende Statistik
239
Die Wahrscheinlichkeitsfunktion lautet: 0,065 0,050 0, 100 0,074 0,620 0,091 0
f x (x) =
für x=l für x=2 für x=3 für x=4 für x=5 für x=6 sonst
Die Verte i1 ungsfunkt ion lautet:
Γ
χ
(ξ)
=
0 o, 065 0, 115 0, 215 0, 289 0, 909 1. 0
für für für für für für für
1 2 3 4 5 6
з s s 3 S s
ξ ζ ξ ξ ξ ξ ξ
< 1
< 2
2
ist die Konstante c^ gemäß der Normierungsbedingung zu
bestimmen. C
1= S (2+c x)dx = 0 ^
2x +
2X
12 + 18c. 2 '
daraus folgt с 2 = -11/18. Mit c 2 = -11/18 ist aber f 2 (x) nicht im gesamten Intervall [0;B] positiv, so daß es keine Zufallsvariable X gibt, die f 2 als Dichte hat. b2) Somit erübrigt sich die Verteilungsfunktion F^.
Frage
nach
E(X),
Var(X)
und
Lösung 23 a) P(0,5 2
ist Fx(l,5) = 0,65625 und Εχ(0,5) = 0,15625, so daß P(0,5105) ^ 0,025 . A n a l o g T e i l a u f g a b e a ) e r g i b t s i c h dann
105-μγ λ
1,96
105 - μ χ μ ί Χ
3,92 101,08 .
Der M i t t e l w e r t ( g ) betragen.
darf
u n t e r den genannten Bedingungen höchstens
101,08
2. Schließende Statistik
247
с) Zu bestimmen ist с unter der Voraussetzung, daß P(100-ciXil00+c) = = 0,95, μ χ = 100 (g) und σ χ = 2 (g). '100-c-iЦу A
P(100-c£Xil00+c) = Ρ
m
ppOO-c-lOO
s и
s
100+c-100j
ЮО+с-μ^' < U s
=
=
Daraus folgt F ^ ) = 0,975, | = 1,96
ar^l).!
= 0>95
.
und с = 3,92 (g).
Damit ist P(96,08sXsl03,92) = 0,95, d.h. unter den genannten Bedingungen wird eine zufällig ausgewählte 100 g Tafel mit Wahrscheinlichkeit 0,95 ein Gewicht zwischen 96,08 g und 103,92 g aufweisen und daher nicht als Ausschuß angesehen werden.
Lösung 31 a) Die Zufallsvariable X (Preis eines Medikaments in der Apotheke) folgt einer (zunächst) unbekannten Verteilung mit Mittelwert μ χ = 10 und 2 Varianz σ = 12,25 . X Zu bestimmen ist P(4,75sXsl5,25). Da die Verteilung der Gesamtheit unbekannt ist, kann diese Wahrscheinlichkeit nur mit Hilfe der Ungleichung von TSCHEBYSCHEFF abgeschätzt werden. Es gilt
Ρ(μχ-οσ·χ:£Χ2) = P(X'=3) + + P(X'=4) zu bestimmen. Dabei ist zu berücksichtigen, welche der Motoren ausfallen können. Werden die η = 4 Motoren in beliebiger Reihenfolge durchnumeriert (1,2,3,4), dann können entweder die Motoren (1-2-3), (1-2-4), (1-3-4), (2-3-4) oder (1-2-3-4) ausfallen. Die zugehörigen 3 4 Wahrscheinlichkeiten sind jeweils π (l-тг) bzw. π (stochastische Unabhängigkeit). Somit ist P(X'>2) = 4·π 3 (1-π) + π 4 = 4·0,1 3 ·0,9 + 4 + 0,1 = 0,0037, so daß ein Flug mit einem viermotorigen Flugzeug vorzuziehen ist. Die vorangegangen Überlegungen machen deutlich, daß Χ'~Β(η,π)verteilt ist. Für das viermotorige Flugzeug hätte P(X'>2) also auch wie folgt bestimmt werden können: P(X'>2) =
n-x'
Σ χ' >2
3
11
[з]0, 1 ·0,9
+
ю
,0 0,1 4 ·0,9° = 0,0037.
b) Mit π = 0,4 ergibt sich für das zweimotorige Flugzeug: P(X'=2) =
2 0 0,4 ·0,6 = 0,16 und für das viermotorige Flugzeug
251
2. Schließende Statistik
P(X' >2)
[з]О . ^ - О . б
1
+
ffl
0 , 4 4 · 0 , 6 ° = 0,1336 + 0,0256 = 0,1792 ,
so daß nun das zweimotorige Flugzeug vorzuziehen i s t . Lösung 35 a) Sei X1 (1=1,2
6) die Z u f a l l s v a r i a b l e mit
1, f a l l s der Student d i e i - t e Aufgabe lösen kann, 0
sonst.
Es i s t P(X.=1) = 9/15 und es werden η = 6 Aufgaben, die verschiedenen Themenbereichen entstammen ( a l s o ohne Zurücklegen), Themenbereichen ausgewählt.
Der Student kann N^ = 9
aus den
N = 15
Themenbereiche
e r f o l g r e i c h und N-N^ = 6 Themenbereiche ohne E r f o l g bearbeiten. 6
Somit i s t X' = η = 6 ,
Σ X, hypergeometrisch v e r t e i l t mit Parametern: i=l N = 15 und Nj = 9 .
Zu bestimmen i s t d i e Wahrscheinlichkeit - P(X'=1) - P(X'=2) = 1 - F x , ( 2 | 6 ; 1 5 ; 9 ) .
P(X'£3) = 1 - P(X'=0) -
Damit i s t Р ( Х ' г З ) = 1 - 0,1189 = 0,8811 die Wahrscheinlichkeit dafür, daß der Student die Diplom-Vorprüfung bestehen wird. b) Wenn der Student mit Sicherheit d i e Diplom-Vorprüfung bestehen w i l l , muß er sich auf 12 Themenbereiche vorbereiten, da er dann noch im ungünstigsten Fa,ll - wenn nämlich Aufgaben aus den drei nicht vorbereiteten Themenbereichen gestellt werden mit drei v o r b e r e i t e t e n Themenbereichen die Vorprüfung besteht.
252
2. Schließende Statistik
Lösung 36 Sei 1, falls die i-te Frau IMOL kennt, X. = ι
0, falls die i-te Frau IMOL nicht kennt.
Dann ist P i X ^ l ) = 0,8 = π und Ρ ί Χ ^ Ο ) = 0,2 = l-π . a) D a e s s i c h hier um eine zweipunktverteilte Gesamtheit handelt, kann die Zufallsvariable X'= Σ X , die zufällige Anzahl der Frauen, die i IMOL kennen, sowohl der Binomialverteilung (bei einer Auswahl mit Zurücklegen) als auch der hypergeometrischen Verteilung (bei einer Auswahl ohne Zurücklegen) folgen. E(X') ist für beide Verteilungen als E(X') = μ^, = ηπ definiert. Die zu erwartende Anzahl a n Frauen in der Stichprobe, die IMOL kennen, beträgt 400*0,8 = 320. Somit ist die zu erwartende Anzahl an Frauen in der Stichprobe, die IMOL nicht kennen gleich 400 - 320 = 80. b) Bei
einer
einfachen
Zufallsstichprobe
sind
die
X^
(1=1,2
n)
stochastisch unabhängig, so daß PtX^lrvX^OnX^ln. . . ) = P t X ^ U - P t X ^ O b P U ^ l ) · . . . = = π( l-π) ·π· (l-π). . . = π 5 0 ( 1 - π ) 5 ° = 0 , 8 5 0 · 0 , 2 5 ° = (N.B.: Es gibt 50
Nullen
=
vorkommen;
^ g^j Stichproben, jede
dieser -40
Wahrscheinlichkeit von 1,607·10
1.607Ί0-40.
in denen genau 50 Einsen und
Stichproben
wird
mit
einer
realisiert),
c) Ja, natürlich! Nur ist die Wahrscheinlichkeit für ein solches Ereigκ klein, ιι · - П К gleich ι i к (l-π) ri ,1000 = 0,2 - „1000 =· 0n . m s sehr nämlich Lösung 37 Sei
X^
eine
repräsentiert.
Zufallsvariable, Dann
ist
die
(weil
interessiert) die Realisation
den
die
i-ten Anzahl
Mikrochip der
(i=l,2,...,10)
defekten
Mikrochips
(Ausprägung)
1, falls der i-te Mikrochip nicht voll funktionsfähig ist, x. = ι 0, falls der i-te Mikrochip voll funktionsfähig ist, oder kurz:
2. Schließende Statistik
253
sei 1, falls der 1-te Microchip nicht voll funktionsfähig 1st, X
i = 0, falls der i-te Mikrochip voll funktionsfähig ist.
Die zugrundeliegende Gesamtheit besteht aus allen Mlkrochips einer Lieferung. Sie ist zweipunktverteilt mit Parameter
π=0,05. Da eine Auswahl
mit Zurücklegen vorliegt, sind die Stichprobenvariablen X , i=l,2,...,10, stochastlsch unabhängig und identisch zwelpunktverteilt mit π=0,05. 10
Mithin ist die Zufallsvariable X* =
Σ 1=1
X
, die Anzahl der defekten
1
Mlkrochips in der Stichprobe vom Umfang n=10, binomialverteilt mit Parametern n=10 und π=0,05, d.h. X'- B(10;0,05). a) Die Wahrscheinlichkeit dafür, da£ eine Lieferung angenommen wird, P(Annahme), kann wie folgt bestimmt werden. Sei Xj (X^) die Anzahl der defekten Mlkrochips in der ersten (zweiten) Stichprobe. Dann ist Ρ(Annahme) = P(X^=0) + P(X^=1) • P(X^=0), weil die Lieferung genau dann angenommen wird, wenn Xj = 0 oder wenn Xj = 1 und Xj, = 0 ist. X^ und X^ sind B(10;0,05)-verteilt. Folglich ist P(Annahme) = f ,(0110;0,05) + f , (1110;0,05) · f . (0110;0,05) = Ä Λ 1 1 2 = 0,5987 + 0,3151 · 0,5987 = 0,7874 . Eine Lieferung mit einem Anteil von 5% defekten Mlkrochips wird also mit einer Wahrscheinlichkeit von 0,7874 angenommen. b) Durchschnittliche Anzahl der zu überprüfenden Mlkrochips Die erste Stichprobe (n=10) muß in Jedem Fall gezogen werden. Die zweite Stichprobe wird nur dann gezogen, wenn sich in der ersten Stichprobe genau ein defekter Mikrochip befand. Die Wahrscheinlichkeit für dieses Ereignis ist gleich P(X^=1) = 0,3151. Mit einer Wahrscheinlichkeit von 0,3151 werden also der Lieferung weitere n=10 Mlkrochips entnommen.
254
2. Schließende Statistik
Im Durchschnitt (Erwartungswert) werden von den zu Lieferungen (mit и=0,05) jeweils
kontrollierenden
10 + 0,3151 · 10 = 13.151 Mikrochips überprüft. Z u dem selben Ergebnis kommt man aufgrund der folgenden Überlegungen. Die Anzahl der zu überprüfenden Mikrochips ist eine Zufallsvariable Y, welche die Werte y^ = 10 und у^ = 20 annehmen kann. Mit einer Wahrscheinlichkeit von 0,3151 wird eine zweite Stichprobe gezogen und mit einer Wahrscheinlichkeit von 0,6849 nicht. Somit hat Y die Wahrscheinlichkeitsfunktion:
f Y (y) =
' 0,6849
für у = 10 ,
0,3151
für у = 20 ,
0
sonst.
Der Mittelwert (Erwartungswert) von Y, d.h. die durchschnittliche Anzahl der zu überprüfenden Mikrochips ist der Erwartungswert E(Y) = 0,6849 · 10 + 0,3151 · 20 = 13,151 . Lösung 38 Sei 1, falls die i-te Frage richtig beantwortet wird, X
i = '
0
sonst.
a) Die X^ sind unabhängig und identisch zweipunktverteilt mit P(X,=1)
= it = 0,25.
Dann
ist X' =
η Π i=l
, die Anzahl
der
richtig
beantworteten Fragen, B(n,it)-vertellt mit η = 20 und π = 0,25. Ρ ( | ^ 0 , 4 5 ] = P(X't9) = 0,0271 + 0,0099 + 0,0030 + 0,0008 + 0,0002 + + 0,0000 + ... = 0 , 0 4 1 . Die Wahrscheinlichkeit, daß der Kandidat ohne Vorbereitung Zufall - die Klausur besteht, 1st 0,041.
- durch
b) Die Χ^ sind unabhängig und identisch zweipunktverteilt mit P(X^=1) = η Σ X., die Anzahl der richtig i=l Fragen, B(20;0,5)-verteilt und P(X*9) = 0,7483 ist. = я = 0,5, so daß X' =
beantworteten
2. Schließende
Statistik
255
с) D a π = 0 , 5 u n d nir(l-ir) = n/4 v e r m u t l i c h größer als 9 s e i n w i r d (d.h. η n>36), k a n n d a v o n a u s g e g a n g e n werden, daß X' = Σ X. approximativ i=l Ν(ηπ; ηπ( 1-тг))-, also N(0, 5n; 0, 25n)-verteiIt
ist. Also gilt a p p r o x i m a -
tiv P C X ' ^ 0 , 4 5 n ) = l-P(X'£0,45n-l) =
1 - F,
1 - F,
0,45n-l+0,5-0,5n •η·0,5·0,5' -0,05n-0,5
= 0,9 .
•η·0,25'
D a r a u s folgt mit λ -0,05n-0,5
=
_
0, 1
-1,28:
1 2 8
0, 5ι/η 0,0025η
+2-0.05·0,5·η+0,25 0,25η
1,6384
0,0025η
+ 0,05η + 0,25 = 0,4096η
0,0025η
- 0,3596η + 0,25 = 0
_ 0,3596 ±
νΌ^ 3596 - 4 · 0 , 0 0 2 5 · 0 , 2 5 2·0,0025
1,2
1,2 η
_ 0 , 3 5 9 6 + 0,3561 0,005
= 143,14 = 144
η 2 = 0,7 = 1 Es m ü ß t e n also (etwa) 144 F r a g e n gestellt werden.
L ö s u n g 39 Sei X^ (i=l,2
n) eine Z u f a l 1 s v a r i a b l e
(i-ter Münzwurf), die die W e r -
te 0 (falsche Kennzeichnung) u n d 1 (richtige K e n n z e i c h n u n g ) annimmt, für d i e Р ( Х А = 0 )
= PiX^l)
= 0,5
ist. Es
ist gerechtfertigt
und
anzunehmen,
d a ß d i e X^, 1=1,2,...,η (die Miinzwürfe), s t o c h a s t i s c h u n a b h ä n g i g sind.
256
2. Schließende Statistik
Daraus folgt, daß X" =
π Σ X, , die Anzahl der richtigen Kennzeichnungen, 1=1
einer Β(η,π) = B(n;0,5) folgt. Die Wahrscheinlichkeit für genau x' richtige Kennzeichnungen ist somit fx.(x'|n;O.S) = £ , ] ο . 5 χ ' ο , 5 ( η - χ , )
= (χ·]°·5η · a) Die Wahrscheinlichkeit, diesen Prüfungsteil zu bestehen, wenn mehr als 75% der Aussagen richtig gekennzeichnet sein müssen, ergibt sich aus - XЬ>1—*· п И 0 1· 4
5
" *
Für η = 10 ist P(X' >7,5) = P(X'£8) = 0,0547 (Tabelle),
und
für η = 30 ist PCX'>22,5) = PCX'£23) = 0,0026 (Tabelle) die gesuchte Wahrscheinlichkeit, diesen Prüfungsteil zu bestehen. Diese Ergebnisse zeigen unmittelbar, daß diese Wahrscheinlichkeit abnimmt, wenn die Anzahl der Aussagen vergrößert wird. D.h. mit zunehmender Schwierigkeit (75% von einer größeren Anzahl an Aussagen) nimmt die Wahrscheinlichkeit (zufällig) zu bestehen ab. b) Die B(n;0,5) ist eine symmetrische Verteilung. Wegen der zusätzlichen Voraussetzung, daß η ungerade ist, gibt es keinen mittleren Wert x' = = n/2. Somit ist (mehr als die Hälfte) P(X'>|n) = i = P(X' 0, so daß - wenn das Ereignis "16 Treffer" eingetreten ist - die Leistungsfähigkeit nicht streng "bewiesen" ist. c) Gesucht ist x' aus 20 1 X ' 0 , 9 ( 2 0 _ X ' } = 0,0025 .
Ρ(Χ'£χ· |20;0,1) = Σ Es ist P(X'=7I20;0,1) = 0,0020 , P(X'=8|20;0,1) = 0,0004 , P(X'=9|20;0, 1) = 0,0001 , P(X'£10|20;0,1) = 0
und somit
P(X'£7|20;0, 1) = 0,0025 = 0,25·/., so daß die Anzahl der Treffer auf mindestens 7 und die Trefferquote mindestens (7/20) · 100 = 35% hätte festgesetzt werden müssen.
auf
d) Das ist nicht möglich, weil es mit zunehmendem η (und gleichem π=0,1) immer schwieriger (unwahrscheinlicher) wird, eine Trefferquote von mindestens 80% zu erzielen. Das liegt daran, daß in
P(X'i0,8.n|n;0,l)
=
η der Faktor 0 , 1 ^ ' 8 Faktor
[θ,8·η]
gr
Σ ^ n
jj.Jo, 1 ( 0 '8 ' n ) 0 , 9 ( n " 0 , 8 ' n )
^0,9^n
mit
zunehmendem
schneller sehr klein wird als der
°ß-
Für η = 20 und x' = 16 ist ζ. B. 4845 P
und
O . l 1 6 · 0 , 9 4 = 6,561
17
;
-
für η '= 30 und x' = 24 ist 593775
und
0 , l 2 4 · 0,96 = 5,314_25
Lösung 45 Sei Y
_ i ~ '
1, falls der i-te Haushalt, der einen Katalog erhält, Waren im Werte von mindestens 7 0 , — DM bestellt, 0, sonst
und
η X* = ,Σ , X.ι .
2. Schließende Statistik
262
Dann ist P(Xi = l) = 0,18 = π. Die X±, i = 1,2, ...,n, sind approximativ stochastisch unabhängig (kleiner Auswahlsatz), so daß X 1 , die Anzahl der Bestellungen im Wert von mindestens 7 0 , — DM, binomial verteilt ist mit e(x') = ηπ = 18000 und Var(x') = = ηπ(ΐ - π) = 14760 . A)
Zu erwartende Mindestbestellsumme: E(X') · 70,0 DM = 1260000,0 DM .
b)
Die в(ю0000;0,18)
kann durch die N(I8000;14760)
approximiert
werden, da 0,1 < π = 0,18 < 0,9 und ηπ(ΐ - π) = 14760 > 9. Einer Mindestbestellsumme von 1274980,— DM entsprechen (: 70) 18214 Bestellungen, so daß / ч / \ f 18214 + 0,5 - 18000"! P(X' >18214) = 1 - P(X' < 18214) = 1 - F 0 [ -щщ J = = 1 - F0(l,77) = 1 - 0,9616 = 0,0384 die Wahrscheinlichkeit über 1274980,— DM ist.
für
eine
Mindestbestellsumme
von
Lösung 46 Sei f 1, falls die i - te geborene Maus weiblich ist, X- = \ 1 I 0, falls die i - te geborene Maus männlich ist η und X' = Σ Xi . i=l Es ist π = 0,47, 1 - π = 0,53 und η = 800 . Die X ± sind identisch zweipunktverteilt mit Parameter π und stochastisch unabhängig, weil die Geburt einer weiblichen oder männlichen Maus nicht davon abhängt, daß eine andere weibliche oder männliche Maus geboren wird. Somit ist X', die Anzahl der weiblichen Mäuse, ß(n, π) = в(800;0,47) - verteilt . a) Mithin ist ρ ( χ ' > 3 5 θ ) = 1 - ρ ( χ ' < 3 5 θ ) = 1 - F x ,(35o|n, π) . Wegen
0,1 < π = 0,47 9
Hilfe der
Ν(ηπ; ηπ(ΐ - π)), also
kann der
N(37 6;199,28) (Stetigkeitskorrektur) : F„ Ч
(350 + 0,5 - 37 6"| , = F„(—1,81) = 0,0351 и л/199,28 )
approximiert werden. Damit ist ρ ( χ ' > 3 5 θ ) = 1 - 0,0351 = 0,9649 die Wahrscheinlichkeit dafür, daß unter 800 neugeborenen Mäusen mehr als 350 weibliche Mäuse sind.
2. Schließende Statistik
263
b) Aus Teilaufgabe a) folgt, daß π aus der Beziehung 400+0,5-0,47n
= Fyi-1,64) = 0,05
•n-0,47-0,53' ι. τ .i .i. ... abzuleiten ist. Wird so ergibt
sich
400+0,5-0,47n , „. . „ ... . — - — - j — — ' — — = -1,64 nach η aufgelost, •n-0,47-0,53 '
als Lösung (der quadratischen Gleichung) n^ = 802,8
und Og = 904,5 . Es mUssen also rd. 905 №Luse geboren werden.
Lösung 47 Sei 1, falls der i-te befragte Teilnehmer der Veranstaltung EDV-Kenntnisse hat, X
i =
0
sonst.
Aus der zweipunktverteilten Gesamtheit wird eine Stichprobe - Auswahl η ohne Zurücklegen - vom Umfang η gezogen. Die Zufallsvariable X' = Σ X, i=l folgt somit einer H(n,N,N ). a) η = 10;
N = 15;
ί^ = Ν·π = 15-0,6 = 9; Χ'~H(10;15;9).
al) P(X'S6) = 1 - P(X't7) = 1 - [P(X'=7) + P(X'=8) + P(X'=9) + + P(X*=10)] = 1 - [f x ,(7110,15,9) + f ,(8|10,15,9) + + f x ,(9110,15,9) + f x ,(10110, 15,9)] =
= 1 -
= 1 -
M.M.ffiäj 36,20
+
3003
+
165) = 1 - P(X's65) = 1 - F x ,(65) = 1 - Fy
65+0,5-42 •14,592'
= 1 - Fjj(6,15) = 1 - 1 = 0 , so daß die Wahrscheinlichkeit, daß mehr als 65 der 70 befragten Studenten über EDV-Kenntnisse verfügen (fast) Null ist.
Lösung 48 Die der Untersuchung zugrunde1iegende Gesamtheit mit Parameter π = 0,125.
ist zweipunktverteilt
Sei Χ^ eine Zufallsvariable (Stichprobenvariable), die die Werte x^ = 1 (falls das i-te Kind Linkshänder ist) und Xj = 0 (falls das i-te Kind nicht Linkshänder ist) annehmen kann. Dann ist η X' = Σ X. die zufällige Anzahl der Linkshänder in der Stichprobe vom i=l 1 Umfang n. a) Der Gesamtheit vom Umfang N = 16 wird eine Stichprobe vom Umfang η = = 6 entnommen. Es ist anzunehmen, daß "ohne Zurücklegen" gezogen wurde. Somit ist X' hypergeometrisch verteilt mit Parametern η = 6, N = 16 und Nj = Ν · π = 16 · 0,125 = 2 , d.h. X'~ H(6;16;2) . Damit ist
Fl P41 6 J
a x ) P(X = 1) = f v , (1 |6; 16; 2) = ^ { [ g ^ = 0,!
die Wahrscheinlichkeit dafür, daß sich unter den 6 auszuwählenden Kindern genau ein Linkshänder befindet und a 2 ) P(X'>2) = P(X'£3) = 0 die Wahrscheinlichkeit dafür, daß sich in der Stichprobe vom Umfang η = 6 mehr als zwei Linkshänder befinden. Da in der zugehörigen Gesamtheit nur zwei Kinder Linkshänder sind, können in der Stichprobe nicht mehr als zwei Linkshänder sein (unmögliches Ereignis). b) Für die "größere Untersuchung" gelten die gleichen Bedingungen wie oben, d.h. zweipunktverteilte Gesamtheit mit π = 0,125 und Auswahl ohne Zurücklegen.
2. Schließende Statistik F o l g l i c h 1st - mit
N^ = Ν · jt = 1000 · 0,125 = 125 - d i e
265
zufällige
Anzahl X'der linkshändigen Kinder H ( 9 1 j 1 0 0 0 ; 1 2 5 ) - v e r t e i l t . Die Wahrscheinlichkeit P ( X ' s l l ) = P(X'=0) + P(X'=1) + . . .
+ P(X*=11)
i s t aber schwer zu berechnen, so da6 es zweckmäßig e r s c h e i n t , diese Wahrscheinlichkeit zu approximieren. Eine Approximation der H(91;1000;125) durch d i e B(91;0,125) i s t nicht z u l ä s s i g , weil n/N = = 91/1000 = 0,091 > 0,05, der Auswahlsatz also zu groß i s t . Eine Approximation der H(91; 1000; 125) durch d i e NormalVerteilung Jedoch möglich, denn d i e Approximationsbedingungen
ist
0,1 s π = 0,125 s 0,9 und ηπ(1-π)^ργ = 91
0,125 · 0,875
sind e r f ü l l t . Somit g i l t
1000-91
9,056 > 9
1000-1
approximativ
Χ' - Ν^ηπ;ηπ(1-π)ίργ| = N( 11,375; 9,056),
P ( X ' s l l ) = F x , ( 1 1 ) = Fy
11+0,5-11,375
und
= Fy(0,042) = Fy(0,04) = 0,516
-19,056 i s t - approximativ - d i e Wahrscheinlichkeit dafür, daß unter den 91 Kindern höchstens 11 Linkshänder sind.
Lösung 49 a ) η ь 9/[it( 1 - π ) ]. b) Abbildung 200
180 160 -
140 120 П 100 -
80 -
60 40 20 0
I ' I 1 I ' I ' I ' I ' I 1 I ' I •I 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
2. Schließende Statistik
266
Der schraffierte Bereich enthält alle zulässigen n. Das Minimum liegt bei π = 1-π = 0 , 5 (Symmetrie). N.B. : Bei sehr kleinem (großem) τι (π0,9) liefert diese Bedingung keine hinreichenden Stichprobenumfänge!
Lösung 50 Sei 1, falls das Fußpilzmittel beim i-ten Behandelten zum Behandlungserfolg führt, X. = ι
X' =
0
sonst.
η Σ X. i=l 1
und π = P(X =1) = 0,85. 1
Stichprobe (ohne Zurücklegen) vom Umfang η = 800 aus einer Gesamtheit, deren Umfang N unbekannt ist, von dem aber angenommen werden kann, daß er größer als 16000 ist, so daß der Auswahlsatz n/N s 0,05 ist. Die Zufallsvariable X', die Anzahl der geheilten Personen, ist H(800; Ν;Ν·0,85)-verteilt. Die hypergeometrische Verteilung kann durch die Binomial Verteilung approximiert werden, da der Auswahlsatz klein ist. Die B(800;0,85) kann durch die Normalverteilung approximiert werden, da 0,1 ί π = 0,85 s 0,9 und ηπ(Ι-π) = 800-0,85·0,15 = 102 > 9 . D.h.: Χ' ~ Ν(ηπ;ηπ(1-π)) und ist somit approximativ N(680;102)-verteilt. Damit ist p j g ^ * 0,82] = P(X's656) = F u [ 6 5 6 ^ " 6 8 0 ] = Fy(-2,33) = 0,0099 die Wahrscheinlichkeit, daß höchstens 82% geheilt werden, wenn die Behauptung des Herstellers richtig ist.
Lösung 51 Zufallsvariable X: Anzahl der Zeitraum von 13.55-14.00 Uhr.
ankommenden
Kunden
an
der
Kasse
im
X folgt einer POISSON-Verteilung mit Parameter μ = 3,5 . χ a) Ρ(X=0) = ί χ (0|3,5) = ^ e
μ
=
e Die Wahrscheinlichkeit, daß kein Kunde in diesem Zeitabschnitt an die Kasse kommt, beträgt etwa 3%.
267
2. Schließende Statistik
b) P(X>3) = 1 - P(Xs3) = 1 - f x (0|3,5) + f x (l|3,5) + ί χ (2|3,5) + + f x (3|3,5) = = 1 - (0,0302+0,1057+0,1850+0,2158) = = 1 - 0,5367 = 0,4633 . c) P(1 9 und
, n=300 und N=4000 e r f ü l l t .
298
2. Schließende Statistik
b) Stichprobenumfang Anteil der Befürworter: p 1 = ρ = 0,6, ε = 0,03. n
.
λ
Ια/2Ρ(1-*»
. 1,96 2 .0,6.Q,4 ·
1024
0,03 Z
с
D a eine Auswahl ohne Zurücklegen gezogen wird, (Mindest-)Stichprobenumfang auf n
. _ η - ^
_ -
N
1024 1
· -8
1 5
reduziert
sich der
·
4000
Lösung 90 Zufallsstichprobe vom Umfang η = 49 aus einer Gesamtheit vom Umfang N = = 258. Die Zufallsvariable X ist der tägliche Milchbedarf eines Kleinkindes. Es ist anzunehmen, daß die Stichprobe nach dem Prinzip einer Auswahl ohne Zurücklegen gezogen wurde. Der Auswahlsatz n/N = 49/258 = = 0,19 > 0,05 kann bei den weiteren Überlegungen nicht werden.
vernachlässigt
Die Verteilving der Gesamtheit ist nicht bekannt. Stichprobenmittel: χ = 0,5 1/Tag bzw. 75 g/Tag. a) Konfidenzintervall für den Mittelwert, Konfidenzniveau:
1-a = 0,9545 -»
= 2; 1 5 · 0 · 85 2 J Щ -
82944
= 0,973[0,1639-0,0611] = 0 , 1 0 , t
144
=
° ' 9 7 3 [ 0 · 1 6 3 9 + 0 , 0 6 1 1 ] = 0,22 .
Somit ist [0,10;0,22] das empirische Konfidenzintervall denzniveau 1-a = 0,9545 für den Antellswert. Die Approximationsbedingungen sind erfüllt, Interval1grenze
zum
Konfi-
da schon für die
untere
n t U ( l - t U ) = 1 4 4 Ό , 1·0,9 = 12,96 > 9 und 0, 1 з t U £ 0,9 gilt. Das Konfidenzintervall für die Anzahl der (erwachsenen) Teilnehmer der geplanten Demo ergibt sich durch Multiplikation der Interval 1 grenzen für den Anteilswert mit der Anzahl der erwachsenen Einwohner der Stadt und dem Anteil der Grünen (bzw. Sympathisanten), die a n einer Demo teilnehmen. Somit sind 0,1·50000·0,8 = 4000 Teilnehmer und 0,22-50000«0,8 = 8800 Teilnehmer die Intervallgrenzen denzniveau 0,9545.
des
gesuchten
Konfidenzintervalls
zum
Konfi-
b) Die Einnahmen der grünen Kasse liegen mit einem Konfidenzniveau von 95,45% im Intervall [0,8 DM ·4000;0,8 DM ·8800] = [3200 DM;7040 DM],
Lösung 92 Gegeben ist eine zweipunktverteilte Gesamtheit erwachsener Personen, die einen bestimmten privaten Fernsehsender empfangen können (Frühstücksfernseher - keine Frühstücksfernseher) mit unbekanntem Parameter π. Dieser Gesamtheit wird eine Stichprobe vom Umfang η = 420 - wohl nach dem Prinzip einer Auswahl ohne Zurücklegen - entnommen. Es kann davon ausgegangen werden, daß der Umfang der Gesamtheit größer als 8400 ist, so daß der Auswahlsatz n/N = 420/N < 0,05 ist und die Stichprobe wie eine einfache Stichprobe (Auswahl mit Zurücklegen) interpretiert werden kann. Sei X
die Stichproben-(Zufalls-)variable,
die die Werte
(Realisationen)
301
2. Schließende Statistik
1, falls die 1-te Person die Weltmeisterschaft im Frühstücksfernsehen ansieht, X
i =
0
sonst,
annimmt. Kurz: falls die i-te Person die Weltmeisterschaft im Frühstücksfernsehen ansieht, sonst. Dann ist 420 Σ X die zufällige Anzahl der "Frühstücksfernseher" i=l probe und x'= 60 die zugehörige Realisation. X' =
a) Eine ist
Punktschätzfunktion
Ρ =
420 60 420
Ρ = 420
für den wahren,
aber
in der Stich-
unbekannten Anteil
und
0,143 ist der gesuchte Schätzwert.
b) Da der Stichprobenumfang η > 400 ist, gilt näherungsweise λ
0,98 =
ρ[ρ _
2
·°
2,Ο5
π
(λ
1-α/2
5):
J H E E I < π < Ρ + 2,05 j m ^ Z
] = 0, 96 .
Mit ρ = 0,143 (s.o.) ergibt sich: 0,143 - 2,05
Ρ
4 3
' 0 · 420
8 5 7
ί π ϊ 0,143 + 2,05 " 4
,143·0,857 420
Γ-
0,143 - 2,05 · 0,017 ί ι ί 0,143 + 2,05 · 0,017 0,143 - 0,035 ί и s 0,143 + 0,035 0,108 i n s
0,178 .
Das (approximative) empirische Konfidenzinterval1 zum Konfidenzniveau 1-a = 0,96 ist also [0,108; 0,178]. Ob der wahre Parameter π tatsächlich innerhalb der Grenzen 0,108 und 0,178 liegt, ist unbekannt. Der Parameter π ist e i n fester Wert. Entweder liegt er innerhalb dieser Grenzen oder nicht. Weil aber 96% aller Stichproben vom Umfang η = 420 aus dieser Gesamtheit Konfidenzintervalle liefern, deren Grenzen den wahren Parameter einschließen, kann m a n "zu 96%" davon überzeugt sein, daß die oben berechneten Intervallgrenzen den wahren Parameter π einschließen.
2. Schließende Statistik
302
Lösung 93 Die Länge des Konfldenzlntervalls ist - ceteris paribus - proportional zu 1/Vn. Mithin muß, soll die Länge des Intervalls halbiert werden, der Stichprobenumfang vervierfacht werden: с = λ·σ · — ; Λ /—" vn
daraus folgt | = λ · σ ν · | · — 1 = λ·σ ν — . ώ Λ £ ί— A /. < vn v4n
Lösung 94
Sei
1, falls i-ter Studierender in psychiatrischer Behandlung ist,
=
0
sonst.
Somit folgt die Gesamtheit einer Zwei-Punkt-Verteilung. N = 4100, η = 200, η/Ν < 0,05; ρ = 30/200 = 0,15; 1-α = 0,9545 . Es fehlt zwar eine Angabe über die Art der Zufallsauswahl der Studierenden, da jedoch der Auswahlsatz klein ist, kann zumindest annähernd von einer Auswahl mit Zurücklegen ausgegangen werden. Da η < 400 ist, ergeben sich mit = 2 die folgenden Intervallgrenzen für den wahren, aber unbekannten Anteilswert in der Gesamtheit der Studierenden, die sich in psychiatrischer Behandlung befinden.
l
200 - - V
»
* ά
-
· -rsfeöö ] - ·•
200
= - V
[°· 15
+
ш
+
V
0
-
^
* -Пmro }
-
200
Somit ist [0,1064;0,2073] das empirische Konfidenzintervall für den Anteilswert der behandelten Studierenden, [436; 850] das empirische Konfidenzintervall für die Anzahl Bamberger Studierender, die in psychiatrischer Behandlung sind, und [5232h;10200h] das empirische Konfidenzintervall für den Bedarf an psychiatrischen Behandlungsstunden (jeweils bei einem Konfidenzniveau von 1-α = 0,9545). Die Approximationsbedingungen sind erfüllt.
Lösung 95 Zufallsvariable:
^
_ 1
1, falls der Mechaniker sich zum i-ten Zeitpunkt mit der Beschaffung von Ersatzteilen beschäftigt, 0
sonst.
2. Schließende Statistik
d.h. d i e Gesamtheit folgt einer
303
Zwei-Punkt-Vertellung.
Z u f a l l s s t i c h p r o b e v o m U m f a n g η = 144 (Auswahl o h n e Zurücklegen) aus einer k o n t i n u i e r l i c h e n Gesamtheit der Länge 50 S t u n d e n (5 Arbeitstage z u je 10 Stunden). Die S t i c h p r o b e n v a r i a b l e n k ö n n e n als s t o c h a s t i s c h u n a b h ä n g i g a n g e s e h e n werden, w e n n m a n s i c h vorstellt, daß Brause d i e B e o b a c h t u n g s z e i t p u n k t e im v o r g e g e b e n e n B e o b a c h t u n g s z e i t r a u m zufällig auswählt, d.h. eine e i n fache S t i c h p r o b e v o m U m f a n g η = 144 zieht. Ρ . = N ,/n, j=l,2,3,4 ist eine S c h ä t z f u n k t i o n für it., d e n w a h r e n J J J der j - t e n Tätigkeit a n der Gesamtzeit (den 50 Stunden). a) Für die T ä t i g k e i t "Ersatzteile beschaffen"
Anteil
(j=2) ist f o l g l i c h
P 2 = n 2 / n = 36/144 = 0 , 2 5 = 25% e i n PunktSchätzwert für d e n Anteil
und
P 2 ' 5 0 = 0 , 2 5 - 5 0 = 12,5 (h) e i n P u n k t S c h ä t z w e r t für die Wochenstunden, die auf d i e T ä t i g k e i t "Ersatzteile beschaffen"
entfällt.
b) Für die B e s t i m m u n g eines Konfidenzintervalls für π ist z u beachten, daß der U m f a n g N der Gesamtheit u n e n d l i c h ist. Damit ist n/N 400),
so
daß
die
Binomialverteilung durch die Normalverteilung approximiert werden kann. Da λ 2 / η , λ 2 / 4 η 2 und λ 2 / 2 η "klein" sind, gilt: рГр-л j m ^ (_ Ι-α/2 -I η
a
j
t
a
P
x
+
Ш ] : , . , . l-a/2 - I n J
Es ist ρ = 258/578 = 0,4464, und λ, = λ„ „ „ = 1,96 . l-a/2 0,975 Damit ist 1
578 =
t°
[°·4464 -
= 0,48693
1,96 j ° ' 4 4 6 g 7 3 ' 5 — j = 0,4464 - 0,0405277 = 0,40587,
und 0,406 £ π £ 0,487
das (approximative) Parameter π.
empirische
Konfidenzintervall
für
den
unbekannten
Mit einem Konfidenzniveau von 95% liegt die Wahrscheinlichkeit, daß ein neugeborenes Bamberger Kind ein Mädchen ist, im Intervall [0,406;0,487]. Bei der Interpretation ist zu beachten, daß das empirische Konfidenzintervall auf dem Geburtenverhältnis des Jahres 1983 beruht und sich dieses Verhältnis im Zeitablauf ändert.
Lösung 99 Sei X i die ideale Rocklänge bei der i-ten Stadtbewohnerin
mit Konfektions-
größe 42; Yj die Ideale Rocklänge
bei der j-ten Landbewohnerin
mit Konfektions-
größe 42. X^ und Y j folgen jeweils einer unbekannten Verteilung. Aus beiden Gesamtheiten werden jeweils einfache, voneinander unabhängige Stichproben vom Umfang η = 40 (Stadtbewohnerinnen) bzw. m = 52 (Landbewohnerinnen) gezogen. In beiden Stichproben geht es um den Mittelwert der idealen Rocklängen. Beide Stichprobenmittelwerte sind vor der Ziehung der Stichproben Zufallsvariable. D a beide Stichprobenumfänge mit η = 40 und m = 52 hinreichend groß (größer gleich 40) sind, folgen die Stichprobenfunktionen
1 X = -
n
1 Σ X, und Υ = -
m
Σ Y.
jeweils approximativ
306
2. Schließende Statistik
2
e i n e r Normal v e r t e i lung mit μ^ und Gesucht μχ -
ist
μγ.
ein Konfidenzintervall
Grundlage
für
Zufallsvariable X -
Y,
die
(Τ2 Χ 2 = — bzw. μ^ und 32000 ist, so daß, wegen n/N < 1600/32000 < 0,05, die Endlichkeitskorrektur bei einer Auswahl ohne Zurücklegen vernachlässigt werden kann: η = n' . b) Konfidenzintervall für den Anteilswert. Sei X. = ι
1, falls der i-te erwachsene Bundesbürger Kreditkarten verwendet, 0
sonst.
Dann ist X' =
Σ X i=l
bei einer Auswahl mit Zurücklegen B(n, ir)-vertei lt
und bei einer Auswahl ohne Zurücklegen, wegen des kleinen Auswahlsatzes, approximativ B(n,n)-verteilt. Weil der Stichprobenumfang hinreichend groß ist und die Approximationsbedingungen erfüllt sind, kann die Β(η,π) durch die Ν(ηπ, nir( l-π)) approximiert werden, so daß ein approximatives Konfidenzintervall für it mit Hilfe der Normal Verteilung bestimmt werden kann. 2 2 2 2 Wegen n/N < 0,05 und weil λ /η, λ /4п , vor allem aber λ /2п (=0,00125) wegen η > 400 klein sind, gilt (auch bei einer Auswahl ohne Zurücklegen) näherungsweise:
J
3
?
1
« · • ' • » „ / , F F
1
]
Daraus ergibt sich mit λ^ ^ ^ = 2 und ρ = 0,17:
^1600 =
0
.
—
P
S
F
—
s
316
2. Schließende Statistik
t u - " · ™ · 1 4 3 ^
= °·1888 -
so daß [0,1512,0,1888] das empirische Konfidenzintervall i s t , welches mit einem Konfidenzniveau von 0,9545 den unbekannten Parameter π (den Anteil von Kreditkartennutzern) einschließt. Lösung 110 Sei X. = ι
1, f a l l s i - t e r Einwohner der Änderung zustimmt, 0
=» X i s t
sonst. zweipunktverteilt.
a) Auswahl ohne Zurücklegen, aber n/N = 400/50000 = 0,008 < 0 , 0 5 . Annahme: 0,1 s π ^ 0,9 . Aus
η =
λ?-α/2Ρ(1-Ρ)
^
folgt
с C =
IP(l-P)' , l-a/2 J - й — = I " -
Es i s t XQ
D, pl
= 1,96, so daß sich mit ρ = 0,1 und η = 400
g75
und mit ρ = 0,5 und η = 400
с = 0,049 e r g i b t .
с = 0,0294
O f f e n s i c h t l i c h i s t es
nicht möglich, π auf ± 2%-Punkte (=0,02) genau zu schätzen. b) π ί 0,2; ητι(Ι-π) = 64; Approximation durch die Normalverteilung, U =
P-ir
d.h.
· ~ N(0; 1) .
I ii(l-Jt)'
Daraus f o l g t mit λ = λ^
Ρ(-λ * U *
+λ)
= 1-α,
α /2 :
ρ[π - λ
£ Ρ < π + λ
Mit λ = 2 (1-α=0,9545) i s t λ | π ( 1 ~ π ) = 2 •J η Ί der Anteil
400
] 1 χ-«.
= 0,04, so daß
der zustimmenden Einwohner mit Wahrscheinlichkeit
in den Grenzen 0,16 ί Ρ ί 0,24 zu erwarten i s t . c ) Es i s t πл £ 0,2 ' und гρ = 0,3. '
0,9545
2. Schließende Statistik Mit
diesem
position,
Stichprobenergebnis
(p=0,3)
höchstens 20% der Einwohner
ist
die
Annahme
(71^0,2) würden der
der
317 Op-
geplanten
Änderung zustimmen, nicht widerlegt. Auch wenn π^ ί 0,2 richtig ist, kann
ρ
=
0,3
(oder
größer)
sein,
obwohl
jedoch
P(P£0,3|π=0,2)
9 ist, ist die Prüffunktion о о Χ'-ηπ Τ =
/ π г νηπ (1-π ) о о
unter Η0 approximativ standardnormalverteiIt.
Η ist zu verwerfen, falls t £ λ, = λ„ __ = 1,64 ist. ο 1-α 0,95 Mit η = 1000, χ' =
1000 Σ χ
= 300 und π
1=1
t = 300 125 _ jg y ) •109,375'
so
= 0,125 ergibt sich °
jjgß jj z u verwerfen ist. Es gibt also °
einen Grund anzunehmen, daß Hq nicht richtig ist. Das Stichprobenergebnis steht im Widerspruch zur Nullhypothese. Die Behauptung des Abgeordneten wird wohl richtig sein.
Lösung 114 Unter
Hq
ist
Τ
standardnormalvertei It,
so
daß
die
aufgrund
einer
Stichprobe berechnete Realisation t für eine Entscheidung lediglich mit einem Quantil der Standardnormalverteilung (kritischer Wert) verglichen werden muß. Dabei wird das Quantil (zum Beispiel λ^) der jeweiligen Nullhypothese festgelegt.
und dem
gewünschten Signifikanzniveau
(α) entsprechend
320
2. Schließende Statistik
Wird X a l s
P r ü f f u n k t i o n verwendet,
zum B e i s p i e l
c^,
mit
dem dann d i e
so muß zunächst d e r k r i t i s c h e Realisation
χ
zu
Wert,
vergleichen
ist,
b e r e c h n e t werden. Mit λ ^ i s t zum B e i s p i e l с
α
0,8 Promille
( R 2 ) und
(2) die
( v o r l ä u f i g e ) Entscheidung d e r K o n t r o l l e
(E),
a) Blutalkoholanteil
gemäß A l k o h o l - T e s t s 0 , 8 P r o m i l l e
(Ej),
b) Blutalkoholanteil
gemäß A l k o h o l - T e s t > 0 , 8 P r o m i l l e
(E2).
Nach d e r f o l g e n d e n Ü b e r s i c h t sind zwei F e h l e n t s c h e i d u n g e n
E1
R1
R2
-
le,
E2
r#
f12
г
f21
der Fehler e r s t e r Art
möglich.
Kontrolle entscheidet > 0,8
obwohl ϊ 0 , 8 P r o m i l l e r i c h t i g i s t
Promil-
( f a l s c h e Entscheidung zu U n g u n -
s t e n des F a h r e r s ) , -
der
Fehler
Promille,
zweiter
obwohl
zugunsten des
>
Art 0,8
d i e
Promille
K o n t r o l
richtig
ist
l
e
entscheidet (falsche
ί
0,8
Entscheidung
Fahrers).
Hinweis: Aus diesem B e i s p i e l wird d i e Forderung v e r s t ä n d l i c h , daß d i e W a h r s c h e i n l i c h k e i t f ü r e i n e n F e h l e r 1. A r t g l e i c h d e r W a h r s c h e i n l i c h k e i t f ü r e i n e n F e h l e r 2. A r t s e i n s o l l t e !
2. Schließende Statistik
321
Lösimg 116 Es kann angenommen werden, daß die Füllgewichte X^ der 500 g Packungen approximativ
N(500;225)-verteilt
sind
und
daß
die
Prüffunktion
X
approximativ N(500;2,25)-verteilt ist. a) Es handelt sich hier um einen Test für den Mittelwert bei bekannter 2 Varianz der Gesamtheit. Es liegt eine große Stichprobe (n=100>40) aus
einer beliebigen
Gesamtheit vor.
ohne Zurücklegen gezogen.
Vermutlich wurde eine Auswahl
Man kann Jedoch von einem kleinen Auswahl-
satz ^2000j ausgehen. Für den einseitigen Test H Q : μ г 500 g gegen Hj.- μ < 500 g ergibt Slch w
0,05
aus
P(T 6K |H ) = α = 0,05, P(Xsw. ηκ |μ=500) = 0,05, F 5 (w n „ ) = 0,05, η ос о 0,05 Χ 0, Ob f w o OR" 5 0 0 ! fJ
ι5
-1,64 = (wQ
= 0,05 und daraus folgt mit A Q 05-500)/l,5
und w Q
Q5
Q5
= -1,64
= 500 - 1,64-1,5 = 497,54 (g).
H q ist folglich (auf dem Niveau α = 0,05) zu verwerfen, wenn für eine konkrete Stichprobe χ s 497,54 g ist. Der kritische Bereich K Q
Q5
umfaßt das Intervall (-»; 497,54]. Weil die x i s 0 sind, ist hier [0;497,54] der kritische Bereich. b) Die Gütefunktion gl μ) bestimmt werden. Ρ ( Χ ^ 0 5 ,μ) = β ( μ ,
kann mit
und
Hilfe
Г„( Щ * )
von P C T ^ K J m )
-
=
αίμ)
= «(μ) ,
so daß - für eine Skizze - in diesen Ausdruck lediglich ganzzahlige Werte von μ für μ < 500 einzusetzen und die Werte von Γ^ίζ) für die entsprechenden ξ aus der Tabelle abzulesen sind. Beispielsweise ist für μ = 499:
F
u[497'i?54"]
= F
u ( "°' 9 7 )
=
8(499)
=
^M
4
" ) = °· 17 ·
322
2. Schließende Statistik
Somit ergeben sich die folgenden Werte der GtltefunktIon:
μ
β(μ)
500 499 498 497 496 495 494
0,05 0,17 0,38 0,64 0,85 0,95 0,99
c) Aus b) folgt, daß die Wahrscheinlichkeit dafür, daß Hq verworfen wird, wenn H ^
μ = 495 g richtig 1st, gleich Ρ(Χ*497,54|μ=495) =
= g(495) = 0,95 ist. Mithin ist l-g(495) = ß(495) = 0,05 die Wahrscheinlichkeit dafür, daß Hn nicht verworfen wird, wenn H1: μ = 495 g richtig ist. d) 1.0
0.8
0.6 9(μ)
0.4
0.2 0.0
494
495
496
497
498
499
500
Die GUtefunktlon g ^ ) gibt in Abhängigkeit von μ die Wahrscheinlichkeit dafür an, daß Hq: μ г 500 g verworfen wird.
Lösung 117 a) Wenn α = β sein soll, muß der kritische Wert w. In der Mitte 1-α zwischen μ = 0 und μ. = 1, also bei 0,5, liegen.
323
2. Schließende Statistik
Aus w„ = μ + λ, · — f o l g t mit μ = 0, η = 16, σ = 2 und 1-α 'о l - α y^j о w. = 0,5: 1-α 0,5 = 0 + λ , ·2/4 und daraus λ , = 1. 1-α 1-α Aus d e r T a b e l l e
i s t abzulesen,
α = 0,159
Somit
ist.
auch β = 0,159
ist
daß λ_ = 1, so daß l - α = 0,841 und 0,841
α auf 0,159 f e s t z u l e g e n
(daraus f o l g t ,
daß
ist).
b ) Aus a ) f o l g t mit λ
=
95
λο
=
1 , 6 4 :
0 , 5 = 0 + 1 , 6 4 · — und daraus η = ( 1 , 6 4 · 4 ) 2 = 43,03 = 44, Vn probenumfang, f ü r den α = β = 0,05 .
der
Stich-
Lösung 118 a ) Ob e i n e D i f f e r e n z d e r A r t bedingten
Differenz
die
bedingte
Wahrscheinlichkeit
Wahrscheinlichkeit
entscheidenden
n,
Ungleichung (zumindest
-
bei
sich
TSCHEBYSCHEFF einer
Daraus f o l g t daß
|*ε|Η ) = α, О1 'О
ε 0,4 zu testen, mit dem Ziel, Η zu verwerfen, & о 1 о η Prüffunktion ist Τ = Σ X,, die - unter Η - B(20;0,4)-verteiIt ist. i=l 1 Η ist zu verwerfen, falls t £ w. ist; dabei wird zunächst (diskrete ο 1-α Prüfverteilung) α auf etwa 0,05 gesetzt. Es ist t = 9 und (vgl. Tabelle der P(T£13|H
Q
)
=
P(Tiw0
9 7 8 G
)
=
0,0211
B ( 2 0 ; 0 , 4 ) ) :
sowie
P(Til2|HQ) = P(Tiw 0>9434 ) = 0,0566, so daß H q
noch nicht einmal auf dem Signifikanzniveau α = 0,0566
verworfen werden kann.
2. Schließende Statistik
327
Für die konkrete Stichprobe ist P(Tat|Hq) = P(T£9|π=0,4) = 0,4044, d.h. die Wahrschelnlichkeit dafür, daß in einer Stichprobe vom Umfang η = 20 9 oder mehr Erwachsene mit Plattfüßen vorgefunden werden, wenn die Nullhypothese richtig ist (daß höchstens 40% aller Erwachsenen Plattfüße haben), ist mit rd. 0,4 recht hoch. Es gibt folglich keinen Grund, sin der Nullhypothese (ns0,4) zu zweifeln.
Lösung 122 a) Sei
X
1, 2, 3, 4,
i
falls falls falls falls
das das das das
1-te 1-te i-te i-te
Gummibärchen Gummibärchen Gummibärchen Gummibärchen
Dann ist die Zufallsvariable
rot ist, weiß ist, gelb ist, grün ist.
X i 4-Punkt-verteilt mit Hj = P(X.=1) =
0,4, ir2 = Р С Х ^ г ) = 0 , 3 und π 3 = Р С Х ^ З ) = 0,1 . Der Gesamtheit vom Umfang N = 20 werden η = 10 Gummibärchen zufällig und nach dem Prinzip einer Auswahl ohne Zurücklegen ("auf einmal") entnommen. Sei Yj die Anzahl der Gummibärchen in der Stichprobe mit der Eigenschaft
(1=1,2,3,4).
Dann
folgt
die
(3-dimensionale)
Zufalls-
variable (Υ^,Υ^,Υ^) einer multihypergeometrischen Verteilung mit den Parametern η = 10, N = 20, ^
= 8, N 2 = 6 und N 3 = 2 .
Somit gilt:
mmί 1ί 1 2 4
4
P(Y
r4;Y2=3:Y3=1) =
3 [l1 [2J 2 20T 10
=
70·20·2'6 70-20-2-6 184756
=
16800 = 0,0909 184756
Mit einer Wahrscheinlichkeit von rd. 9,1% entsprechen die Farbanteile in der Stichprobe den Farbanteilen in der Gesamtheit. b) In dieser Teilaufgabe schränkt roten Gummibärchen ein.
Ernst
E.
die
Betrachtung
auf
die
Daher ist 1, falls das i-te Gummibärchen rot ist, Z
i = 0, sonst.
Die Zufallsvariable Z^ folgt einer Zwel-Punkt-Verteilung mit Parameter π = P(Xj=l), dessen Wert allerdings unbekannt ist.
328
2. Schließende Statistik
Aus der Gesamtheit aller Gummibärchen werden zufällig und nach dem Prinzip einer Auswahl ohne Zurücklegen ("eine Riesenpackung") η = 400 ausgewählt. Da davon ausgegangen werden kann, d a ß die Gesamtheit aller Gummibärchen größer als N = 8000 ist, d.h. n/N s 0,05, k a n n approximativ eine Auswahl mit Zurücklegen angenommen werden. Somit ist die Zufallsvariable Ζ' = Σ Ζ, , die Anzahl der Gummibärchen i in der Stichprobe, approximativ binomialverteilt mit den Parametern η = 400 und π . Aufgrund des großen Stichprobenumfangs (n=400) ist eine (weitere) Approximation durch die NormalVerteilung möglich; d.h. es gilt approximativ Z'~ Ν(ηπ; ηπ( 1-π)) = Ν(400ιτ; 400π( 1-π)). Die Approximation gilt als gut, da η a 400 ist. Es ist z u überprüfen, ob es einen hinreichenden Grund gibt anzunehmen, daß der Anteil der roten Gummibärchen in der Gesamtheit mehr als 40% beträgt. Somit ist Η : π £ 0,4 gegen Η.: π > 0,4 zu testen mit dem Ziel, Η zu verwero А о fen. Prüfmaß für d e n Test von Η Ρ-π Τ =
о
ist
Ζ'-ηπ
2 = π (1-π )' о о
; Ιηπ (1-π )' "I ο ο
unter H q ist Τ approximativ standardnormalverteilt. Stichprobenergebnis: z'= 166, ρ = 166/400 = 0,415 . Mit η = 400 u n d π ο = 0,4 ergibt sich
t —
0,415 - 0,4
Ρ
—
4(0,6)' 400
166-400·0,4
— ü.blei
.
Ί400·0,4·0, 6'
Entscheidung: Ho
ist z u verwerfen, falls t г
=
λ
ο 95
=
1,64
lst
"
D a s
ist
a b e r
nicht der Fall. H q kann nicht verworfen werden. Somit gibt es keinen Grund anzunehmen,
daß der Anteil der roten Gummibärchen
in der
Ge-
2. Schließende Statistik
samtheit größer a l s 40% i s t . Ernst E. wird wohl In Zukunft auf g e l i e b t e n Gummibärchen verzichten müssen.
329
seine
Lösung 123 Sei Xj (1=1,2
3729) eine Stichprobenvariable,
die die Werte
= 1,
f a l l s der i - t e Befragte d i e d e r z e i t i g e Sendehäufigkeit mit "gerade r i c h t i g " b e u r t e i l t , und x^ = 0 in a l l e n anderen Fällen annimmt. Es i s t x^ = = 0 also genau dann, wenn der 1 - t e Befragte die d e r z e i t i g e Sendehäufigk e i t mit "zu v i e l " oder mit "weiß nicht"
beurteilt.
X. i s t zwe1punktverteilt mit P(X^=1) = π ; dabei i s t π unbekannt. Es wurde eine Stichprobe vom Umfang η = 3729 aus der Gesamtheit a l l e r (erwachsenen) Bundesbürger (vermutlich) nach dem Modell einer Auswahl ohne Zurücklegen gezogen. Weil aber der Auswahlsatz klein ist (n/N 1,64 = A Q
74,5
I
2
44
30,533 g5
ist, wird H q verworfen.
Es gibt also
einen
Grund zur Annahme, daß H q : π S 0,5 wohl nicht richtig ist. Das Ergebnis stützt die Vermutung der Tochter, daß mehr als 50% der Bundesbürger mit der Sendezeit zufrieden sind.
Lösung 124 Es ist anhand des gegebenen Stichprobenergebnisses z u untersuchen, ob wohl zwischen der Antriebsart eines PKW und dem Risiko, in einen "Schneeunfall" verwickelt zu werden, e i n Zusammenhang besteht. Somit ist die Hypothese zu testen, daß der Anteil π der hinterradangetriebenen PKW in der Gesamtheit aller an Schneeunfällen beteiligten PKW genauso groß ist wie in der Gesamtheit aller PKW. Setzt man
χ
1, falls der i-te an einem Schneeunfall beteiligte PKW Hinterradantrieb hat,
_ 1
0
sonst, X zweipunktverteilt mit P(X^=1) = π .
so ist
Da der Anteil der 42 (beobachteten) PKW an der Gesamtheit aller PKW, die in Schneeunfälle verwickelt waren, sehr gering ( 9 und 0,1 s π s 0,9 gilt, kann die Verteilung о о о von X' (unter Η ) durch die NormalVerteilung approximiert werden:
331
2. Schließende Statistik
P(X'£38|H ) = 1 - PCX's37,5|H ) = 1 о о Χ'-ηπ = 1 - Ρ Vxm (1-π )' о о
37,5-21 3,24
1 - 1 = 0
= 1 - Fu(5,09)
Damit ist H q auf jedem sinnvollen Signifikanzniveau zu verwerfen. Die in der Aufgabe beschriebene Beobachtung
ist wohl kaum durch d e n Zufall
zu
erklären.
Lösung 125 1, falls die i-te geimpfte Person erkrankt, a) Sei X i = 0, falls die i-te geimpfte Person nicht erkrankt. Dann ist P(X.=1) = π und zu testen ist Η : π £ 0,2 ι о zu
verwerfen,
Wirkung wie
d.h.
(тг^О,2),
ohne
H^:
Grippeschutzimpfung
es erkranken mit
Impfung.
Stichprobe.
die
Informationen
π
9) Ρ - Ν(π ;π (1-π )/η) = ο ο ο = N(0,2;0,0001), so daß sich mit α = 0,025 der Annahmebereich seitiger Test):
к Κ
(ein-
f I« (1-π ) Ι = Jp η - λ, J— < Ρ , d.h. α 1 ο 1-α Ί η
0 025
ergibt.
=
{Ρ
Ι 0 · 2 " 1.96·0,01 < Ρ} = {Ρ 10,1804 < Ρ>
Hq
wird
also
nicht
verworfen
für
alle
P,
die
0,1804 sind. Wegen ρ = 0,16 < 0,1804 (p€K„ „ „ ) U,Όέо
ist Η z u verwerfen. О
größer
als
332
2. Schließende Statistik
Es gibt bei dem gegebenen Signifikanzniveau (0,025) Grund zur Annaihme, daß d i e Impfung einen positiven E f f e k t hat. d) Wegen t = - ^ s — = —π г w (1-я ) о о
0.01
= -4 < -1,96
i s t - wie zu erwarten war - Η zu verwerfen. о e ) Man begeht einen Fehler 2.Art, Η о
falsch
ist.
Die
wenn Η
nicht verworfen wird, obwohl
Wahrscheinlichkeit
für
einen
Fehler
2. Art
PCI^eKJH ) = β kann nur bei einfachen Alternativhypothesen bestimmt werden und nimmt - c e t e r i s paribus - zu, wenn α abnimmt.
In diesem
F a l l e bedeutet e i n Fehler 2.Art, daß eine Grippeschutzwirkung besteht (H falsch), jedoch z u f ä l l i g PeK a о ° а Nullhypothese nicht verworfen wird.
ist,
so
daß
die
falsche
f ) P(T «K 1|HJ = Ρ(PeK 1In =0,17) = β . η α 1 α 1 Mithin i s t 0,1804-π P(0,18042 = ш -
falls t £ F „ VyVpl-aSZ
l-a/2 = 0,975 i s t F ^ .
ist
mit
1 = 160 F r e i h e i t s g r a d e n .
1 6 Q . Q> g ? 5
oder
= 1,38 und F ^
7 г F t i>2>
, . l-a/2
1 4 Q ; Q> g ? 5
A l s Wert des Prüfmaßes e r g i b t s i c h t = 5 , 8 / 4 , 5 = 1,29 (und ί daß H q n i c h t
v e r w o r f e n werden kann.
d i e - unbekannten - V a r i a n z e n g l e i c h
= 1,38.
= 0,78),
Es d a r f a l s o angenommen werden,
so daß
sind.
Damit i s t e i n e w e i t e r e Voraussetzung des T e s t s f ü r d i e D i f f e r e n z d e r M i t t e l w e r t e b e i unbekannten V a r i a n z e n ( w o h l ) e r f ü l l t und e s kann nun ( a u f d e r Grundlage d e r b e i d e n ( H a u p t - ) S t i c h p r o b e n ) H q : μ^ = μ^ g e g e n H^: μ^ * ßy g e t e s t e t Prüffunktion ist
werden. Χ-Ϋ
Τ =
,
d i e unter
Η
t-verteilt
ist
mit
ν = η +
" ΓΓΤ σ -+Ίη m + m - 2 = 300 F r e i h e i t s g r a d e n . Η ist о
zu v e r w e r f e n , f a l l s I t l ' I i
at,
1-α/2,ν
ist.
Weil ν = 300 > 120 i s t , kann das Quanti 1 d e r t - V e r t e i l u n g durch das e n t s p r e c h e n d e Quanti1 d e r S t a n d a r d n o r m a l v e r t e i l u n g a p p r o x i m i e r t werden: 'S-α/2 =
λ0,975
= ^
'
Mit χ = 11, у = 13, η = 121, m = 181 und
; 2
=
ergibt
+
sich
t
Ы
'1)а^\ -2
35Ö(624+720)
=
= g 1 1 7 Ό 1174
=
s o
=
4 , 4 8
(mg2)
v e r w o r
f
e n
wird.
Mittelwertdifferenz ist (statistisch) hoch signifikant. Es anzunehmen, daß s i c h d i e beiden Zigarettenmarken hinsichtlich Kondensatgehalts unterscheiden. Hinweis:
Die ist des
In d i e s e r Aufgabe wurden d i e E r g e b n i s s e von zwei s e p a r a t e n Voi—
S t i c h p r o b e n verwendet, um d i e G l e i c h h e i t der V a r i a n z e n zu ü b e r p r ü f e n . Weil e s g e r e c h t f e r t i g t i s t anzunehmen, daß d i e unbekannten V a r i a n z e n g l e i c h s i n d , konnte - mit den E r g e b n i s s e n der b e i d e n ( H a u p t - ) S t i c h proben - ü b e r p r ü f t werden, ob d i e M i t t e l w e r t d i f f e r e n z s t a t i s t i s c h s i g n i fikant ist.
2. Schließende Statistik
346
Wenn angenommen werden kann, daß die beiden Gesamtheiten (aus denen die beiden Vor- und Hauptstichproben stammen) normalverteilt sind, ist die Ziehung von zwei Vorstichproben (für den Varianzentest) nicht unbedingt erforderlich. Es können nämlich Varianzen- und Mittelwerttest nur mit den Ergebnissen der beiden Hauptstichproben, d.h. nur mit einem Datensatz, durchgeführt werden. Der wesentliche Unterschied zwischen den beiden Vorgehensweisen liegt darin, daß im einen Falle zwei Nullhypothesen mit zwei Datensätzen getrennt getestet werden und im anderen Falle ein "kombinierter Test" zweier Teil-Hypothesen mit nur einem Datensatz durchgeführt wird, und das hat Konsequenzen für des Signifikanzniveau. Wird
(bei nur einem Datensatz, d.h. nur aufgrund der beiden Haupt-
stichproben) die Gleichheit der Varianzen auf dem Niveau a^ und die Mittelwerte auf dem Niveau α
getestet, dann kann man zeigen, daß die
Wahrscheinlichkeit dafür, beide Nullhypothesen nicht zu verwerfen, wenn s o cia
sie richtig sind, gleich (1-α^) (l-otg) α
des
"kombinierten
Tests",
also
®
die
das
Signifikanzniveau
Wahrscheinlichkeit
dafür,
mindestens eine Nullhypothese zu verwerfen, wenn beide richtig sind, gleich α ι
+ a
2 ~ α1α2
Es ist allerdings zu beachten, daß der Einsatz von zwei Tests bei nur einem Datensatz im allgemeinen nicht zulässig ist. Daß dies hier möglich ist, läßt sich darauf zurückführen, daß bei normalverteilten Gesamtheiten die Prüffunktionen des Varianzentests und des Mittelwertdifferenzentests stochastlsch unabhängig sind.
Lösung 137 Sei X^ (i=l,2, . . . ,n) das i-te Teil in der Stichprobe aus der Produktion der ersten Maschine und Yj (J=l,2
m) das J-te Teil in der Stichprobe
aus der Produktion der zweiten Maschine mit den Realisationen 1, falls i-tes Teil von Maschine 1 Ausschuß ist, X
i
=
' 0
falls nicht
und 1, falls J-tes Teil von Maschine 2 Ausschuß ist, 0
falls nicht
oder kurz: 1, falls i-tes (j-tes ) Teil von Maschine 1 (2) Ausschuß ist,
X. (Y.) = ι J 0
falls nicht (sonst).
2. Schließende Statistik
347
Die beiden Grundgesamthelten der von beiden Maschinen produzierten Teile sind jeweils zweipunktverteilt
mit den unbekannten
Scharparametern
und jig . Es ist davon auszugehen, daß die beiden Auswahlsätze klein sind 0,05
und
(^ s
S s 0,05), so daß die beiden Stichproben, auch wenn "ohne ZuN
rücklegen" gezogen wurde, zumindest approximativ als einfache ben betrachtet
Stichpro-
werden können. Die Stichproben sind voneinander unabhän-
gig, weil die zugrundeliegenden Gesamtheiten disjunkt sind. Ρ. = - Σ X. ist der zufällige Ausschußanteil in der ersten, Ρ = - Σ Y. 1 η j i 2 m j j der zufällige Ausschußanteil in der zweiten Stichprobe. Zu testen ist die zweiseitige Hypothese ("unterschiedliche" anteile) π
V
ΐ = π2
mit
dem
gegen
Ziel,
Hq
H
Ausschußan-
l : "l * π 2 · ZU
verwerfen.
Gelingt
dies,
gibt
es
einen
Grund
anzunehmen, daß die Vermutung des Produktionsleiters wohl richtig ist. Prüffunkt ion ist Ρ Τ =
1
- Ρ
2
; dabei ist
Ρ eine Schätzfunktion für den
unbekann-
' " - » I M ten Parameter π unter H q : ir^ = π^ = π , deren Wert ρ mit p
Ρ κ =
ln + p2m η + m
zu bestimmen ist. Wegen η = m = 500 sind die Approximationsbedingungen erfüllt, so daß die Prüffunktion approximativ standardnormalverteilt ist. H q ist zu verwerfen, falls |t| ь ^χ-χ/Σ
= λ
0 975
=
1,96
ist
Mit Pj = 0,10 und p 2 = 0,13 sowie η = m = 500 ergibt sich:
P
=
0,10·500 + 0,13*500 . = 500 + 500 °'115 '
so daß
·
2. Schließende Statistik
348
t _
0,10 - 0.13 _ 0,03 _ I ~ ~ F T " " 070202 f l Jo, 115.0,885 [ g j ö + g B o J
·
Well t = I — 1,4851 < 1,96 i s t , kann d i e Nullhypothese auf dem S i g n i f i kanzniveau α = 0,05 nicht verworfen werden. Aus s t a t i s t i s c h e r Sicht g i b t es keinen Grund anzunehmen, daß d i e Ausschußanteile der beiden Maschinen verschieden sind. Lösung 138 Sei X i
(1=1,2,...,n)
d i e Meinung des i - t e n Befragten der Stichprobe
in
Deutschland mit den Realisationen 1, f a l l s die i - t e Person d i e Tötung a l l e r Kampfhunde befürwortet, Xi
=
0, f a l l s nicht
und Yj
(J=l,2, . . . , m )
die
Meinung des
J-ten
Befragten
der
Stichprobe
In
Großbritannien mit den Realisationen 1, f a l l s die j - t e Person die Tötung a l l e r Kampfhunde befürwortet, yJ
=
0, f a l l s nicht.
Die beiden Grundgesamtheiten der deutschen bzw. britischen
Bevölkerung
sind zweipunktvertei l t mit den (unbekannten) Scharparametern it^ und π^ . Es liegen zwei einfache Stichproben vor ( v g l . Aufgabentext), die voneinander unabhängig sind, weil die zugrundeliegenden Gesamtheiten disjunkt sind. Die Z u f a l l s v a r i a b l e (Stichprobenfunktion) Personen an, d i e sich bei der Kampfhunde
ausgesprochen
= j Σ X j g i b t den Anteil der
Umfrage Deutschland
f ü r die Tötung a l l e r
haben. Das b r i t i s c h e Pendant hierzu i s t
Ρ^ =
= m i z v ,J . j Zu testen i s t d i e Hypothese V
*1 * " 2
mit dem Z i e l ,
gegen
HA:
"l
5,99,
5 ) 2
+
l10).
ist.
=
0
077
+ 5>0
+
18>0
Es kann also
= 23
davon
077
>
ausgegangen
werden (es gibt einen Grund zur Annahme), daß sich die Marktanteile geändert haben. Lösung 141 Xj = bevorzugte Kaffeemarke des j - t e n Kunden. a) Es wird vermutet, daß sich die Nachfrage gleichmäßig auf d i e v i e r Marken v e r t e i l t , daß der Anteil der Kunden, die eine bestimmte Marke bevorzugen, f ü r a l l e Marken g l e i c h , f ü r d i e v i e r Marken also j e w e i l s g l e i c h 0,25 i s t . 2 Ein geeigneter Test i s t f o l g l i c h der χ -Anpassungstest, der Test der Anpassungshypothese Η : f „ ( x ) = f (χ|θ) f ü r a l l e χ e IR о Χ о 1 gegen Η.: f „ ( x ) * f (χ|θ) f ü r mindestens e i n χ e IR; I X о 1 dabei
ist
f
( x l e ) die Wahrscheinlichkeitsfunktion der o 1 lung mit dem Parametervektor e = (тг^, π^, n^).
Gleichvertei-
b) Entscheidende Voraussetzung f ü r die Durchführung dieses Tests i s t , daß es sich bei den gegebenen Daten um eine konkrete einfache Zufallsstichprobe handelt. Die Zufallsvariablen X^, j = l , 2 η = = 1000, dürfen nur die Werte А, В, С und D annehmen. Anmerkung: Unter diesen Voraussetzungen i s t n^, d i e Anzahl der Kunden, die d i e i - t e Marke bevorzugen (1=1,2,3,4), f a l l s v a r i a b l e n N..
R e a l i s a t i o n der Zu-
352
2. Schließende Statistik
с ) Die
durch
die
i=l,2,3,4,
Nullhypothese
s i n d bekannt:
spezifizierten
π° = 0 , 2 5 f ü r
Wahrscheinlichkeiten
ji°,
1=1,2,3,4.
Die P r ü f f u n k t i o n
Τ =
4 Σ i=l
(Nj-nir®)2
2
i s t unter Η
approximativ χ - v e r t e i l t
ν = k-1 = 4-1 = 3 Freiheitsgraden. erfüllt,
da ηπ? > 10 f ü r a l l e ι
Es e r s c h e i n t zweckmäßig, fen,
falls t * *2 ^
Mit ηπ°
mit
niij
+
α = 0 , 0 5 zu s e t z e n .
(230-250)2 250
zu v e r w e r f e n
(Gleichverteilung)
Somit i s t Η
zu verwei—
= 7,81 .
i ergibt
(210-250)2 250
+
= 1,6 + 1 , 6 + 6 , 4 + 6 , 4 = 16 > 7 , 8 1 = χ 2 so daß Η о
sind
i.
= 1000·0,25 = 250 f ü r a l l e
_ (270-250)2 250
D i e Approximationsbedingungen
ist.
nicht
Es g i b t
richtig
sich (290-250)2 _ 250
+
g 5
3
,
e i n e n Grund anzunehmen,
ist,
daß
also
einzelne
daß Η
о
Marken
s t ä r k e r a l s andere n a c h g e f r a g t werden. Lösung 142 Х^ = Anzahl d e r A u s f ä l l e d e r EDV-Anlage am j - t e n
Tag.
2
Ein g e e i g n e t e r T e s t i s t der χ - A n p a s s u n g s t e s t . S e i n e Voraussetzungen s i n d e r f ü l l t : Laut Text handelt e s s i c h um e i n e Z u f a l l s s t i c h p r o b e nach dem P r i n z i p einer Auswahl mit Zurücklegen (einfache Stichprobe). Außerdem werden sechs d i s j u n k t e " A u s f a l l k l a s s e n " u n t e r s c h i e d e n . Zu t e s t e n i s t
d i e Anpassungshypothese H q :
gegen H^: Dabei
= Εο(ξ|μ) für a l l e
ξεΚ,
* F q ( ξ | μ ) f ü r mindestens e i n ξ 6 IR .
ist
Parameter μ,
Fq
die
Verteilungsfunktion
der
POISSON-Vertei lung
der n i c h t bekannt und daher aus der S t i c h p r o b e
zu
mit
schätzen
ist. Ein g e e i g n e t e r S c h ä t z w e r t = 2, der
so
daß d i e
folgenden
für μ ist
x = ^ щ ( 0 · 17+1 · 2 0 + 2 · 2 7 + 3 · 18+4· 18) =
Überlegungen
Wahrscheinlichkeitsfunktion
für
die
POISSON-Vertei lung
mit
2. Schließende Srarisrik
,
f^(x|2) =
2
e
-2
, χ = 0,1,2,..., durchgeführt werden.
Die Prüffunktion Τ =
к (Nj-nP®)2 Σ 1=1
mit i> = k -
353
2
ist unter Η
approximativ χ -verteilt
nP°
l - r = 5 - l - l = 3 Freiheitsgraden, r = 1 ist die Anzahl
der aus der Stichprobe geschätzten Parameter; die Klassen
"4 Ausfälle"
und "5 und mehr Ausfälle" werden wegen np° < 10 zu einer neuen Klasse "4 und mehr Ausfälle" zusammengefaßt, so daß sich die Anzahl der Klassen von 6 auf 5 verringert. Die Approximationsbedingungen sind dann erfüllt. 2 2 Η ist zu verwerfen, falls t а у = у = 7 81 . ο 1-α, ι> 0,95;3 Die geschätzten hypothetischen Wahrscheinlichkeiten P° werden gemäß P° = P(X=x.|Fx(?) = F q (?|m)) = f x (x i |2) bestimmt. Sie können der Tabelle der PV(2) entnommen werden.
2 о, (ηΓηΡι) t
χ
0 1 2 3 4 u. m. Σ
Weil
η. 1 17 20 27 18 18 100
2 t = 3,706 < χ g 5
3
0 0 0 0 0
о P i
о nPj
1353 2707 2707 1804 1428
13,53 27,07 27,07 18,04 14,28
1
100
о пр. 0,890 1,847 0,000 0,000 0,969 t=3,706
= 7,81 ist, kann die Nullhypothese nicht ver-
worfen werden. Es kann wohl davon ausgegangen werden, daß die Anzahl der täglichen Ausfälle der EDV-Anlage approximativ einer POISSON-Verteilung (mit μ=2) folgt.
2. Schließende Statistik
354
Lösung 143 Xj = Anzahl der nachgefragten Produkte am j-ten Tag. Zu prüfen 1st, ob die angegebene Verteilung zur Familie der POISSON2 Verteilungen gehören kann. Hierfür eignet sich der χ -Anpassungstest. Seine Voraussetzungen sind erfüllt: Laut Text handelt es sich um eine einfache Stichprobe. Außerdem werden sieben disjunkte (Nachfrage-) Klassen von Anzahlen unterschieden. Folglich ist H q : Γ χ (ξ) = F q (?|μ) für alle ξ € R gegen H ^
Ρ χ (ξ) * Κο(ξ|μ) für mindestens ein ξ e F zu te-
sten; dabei ist Fq(C||i) die Verteilungsfunktion der POISSON-Verteilung mit
unbekanntem
(und
daher aus der Stichprobe zu schätzendem) Parame-
ter μ . -
7
!
Als Schätzwert für μ ergibt sich χ = -
Σ χ. η. = 1,8, so daß ein n i=l Anpassungstest auf PV(1,8) durchzuführen ist. Die Prüffunkt ion
Τ =
к (Nj-nPj)2 2 Σ ist unter Η approximativ χ -verteilt mit υ = k-l-r 1=1 nP° °
Freiheitsgraden. Zur Erfüllung der Approximationsbedingung, np° £ 10, müssen die drei letzten Klassen zusammengefaßt werden (siehe Tabelle). Die Verteilung
der Prüffunktion hat
somit
ν = k-l-r = 5-1-1 = 3
Fre1he i tsgrade. 2 Η ist zu verwerfen, falls t a χ. Λ ; setzt man α = 0,05, o „ 1-α,ν hält man ^ д д . з = 7,81.
so er-
Die geschätzten hypothetischen Wahrscheinlichkeiten P° können der Tabelle der PV(1,8) entnommen werden. Arbeitstabelle
i
χ
n
i
о p i
0 np i
, o.2 (n^npj)
. o,2 (nrnPl) np
1 2 3 4 5 6 7
0 1 2 3 4 5 6+
Σ
-
17 31 25 15 6 • 6 0 100
0,1653 0,2975 0,2678 0,1607 0,0723 ' 0,0260 0,0104 1
о i
16,53 29,75 26,78 16,07
0,2209 1,5625 3,1684 1,1449
0,0134 0,0525 0,1183 0,0712
10,87
1,2769
0,1175
100
-
0,3729
2. Schließende Statistik
Weil t = 0,3729 < 7,81 =
3
355
ist, kann die Nullhypothese nicht
verworfen werden. Es gibt keinen Grund anzunehmen, daß die POISSON-Verteilung (mit μ=1,8) kein angemessenes Nachfrage-Modell ist.
Lösung 144 ' 0,
falls der i-te Patient keine Schmerzen hat,
a) Es sei X ^ = . 1. falls der i-te Patient Schmerzen hat, • 0,
und
*2i =
falls der i-te Patient vom Arzt gespritzt wird,
. 1. falls der i-te Patient von einer Arzthelferin gespritzt wird
Zu testen ist die Vermutung, daß das Auftreten von Schmerzen davon abhängt, wer die Spritzen gibt, also die Unabhängigkeitshypothese = f
Ho:
^(Xj.^)
H1: ί χ
χ^ί*!»3^) *
fUr
X
f x
^ x i^* f x 2 ( x 2 )
für
alle
€ R
»indestens
ein
(x
2 Segen i« x 2 5
e
,2
2 Ein geeigneter Test 1st der χ -Unabhängigkeitstest. Die Voraussetzungen für diesen Test sind erfüllt: Laut Text liegt eine einfache Stichprobe aus einer zweidimensionalen Verteilung mit zwei zweipunktverteilten Randverteilungen vor. Die Voraussetzung disjunkter, nicht-leerer Klassen A^, A^ und B^, B,, ist ebenfalls erfüllt. 2
Ν, N Prüffunkt ion ist
Τ =
к 1 (Ν 1J Σ Σ 1=1 J=1
J
* ) n
,
1· »J
weil die hypothetischen Wahrscheinlichkeiten ir°j durch о P^j =
Ν, Ν , i· · ι
aus der Stichprobe geschätzt werden müssen.
Unter H q ist Τ approximativ *2-verteilt mit ν = (k-l)(l-l) = 1 Freiheitsgrad. (Es werden
r=k+l-2 = 4-2 = 2 Parameter aus der Stichprobe
gescl geschätzt.) Die Approximation gilt als gut, weil i.J. 2 H o 1st abzulehnen, falls t fc ^ ggg.j = 10,83.
n
P°j
10
für alle
2. Schließende Statistik
356
Arbeitstabelle
Damit ist (63-36) 2 36
+
(37-64)2 64
+
(117-144)2 144
+
(283-256)2 256
= 20,25 + 11,39 + 5,06 + 2,85 = 39,55, so daß Η auf dem Niveau о α = 0,001 zu verwerfen ist. Es ist anzunehmen, daß die Schmerzen nicht unabhängig vom Ausführenden sind. Das bedeutet jedoch nicht zwingend, daß die Arzthelferinnen eher schmerzfrei spritzen können als der Arzt. 0, falls die Venen leicht zugänglich sind, b) x
n
= 1, falls die Venen schwer zugänglich sind;
zu X2_ vgl. a). Zu testen ist die Vermutung, daß ein Zusammenhang zwischen der Venenlage und dem Ausführenden besteht. Zu testen ist also erneut eine Unabhängigkeitshypothese. Hinsichtlich Voraussetzungen, Prüfmaß, Prüfverteilung und Approximationsbedingungen gilt das zu a) Gesagte analog. 2 Η ist zu verwerfen, falls t £ χ = 6,63 . Arbeitstabelle
2. Schließende
Damit
Statistik
357
ist
(12 - 36,5)2
(38 - 13,5)2 +
36,5
13,5
q34 - 109,5)2 +
(16 - 40,5)2 +
109,5
40,5
= 16,445 + 44,463 + 5,482 + 14,821 = 81,211 , so daß H 0 zu v e r w e r f e n ist. E s ist w o h l a n z u n e h m e n , daß s i c h die A r z t h e l f e r i n n e n P a t i e n t e n m i t g u t e r V e n e n l a g e aussuchen. Lösung
145
E i n g e e i g n e t e r Test ist der x 2 - U n a b h ä n g i g k e i t s t e s t , w e i l d i e V e r m u t u n g ü b e r p r ü f t w e r d e n soll, daß d a s P r ü f u n g s e r g e b n i s v o n d e r F a c h r i c h t u n g a b h ä n g t . Die S t i c h p r o b e v o m U m f a n g η = 691 ist e i n e e i n f a c h e S t i c h p r o b e . Die V o r a u s s e t z u n g d i s j u n k t e r , n i c h t l e e r e r K l a s s e n Αι, A , bzw. Bxf B2f B3 ist erfüllt. Zu t e s t e n ist die H
o:
f
xi ,x 2
12) = 0,0176 ist. Somit ist,
wegen
=
w
Q gg24 =
=
^o
5 ist, ist nicht
2. Ist r2 = +1, so ist dies ein Beweis dafür, daß zwischen den betrachteten metrischen Merkmalen eine kausale Beziehung besteht. 3. Zwei nominale/klassifikatorische (ordinale/komparative) Merkmale Α und В heißen statistisch unabhängig, wenn f^j = fi.4j für alle i und j gilt. 4. Bei nominalen Merkmalen ist die Berechnung relativer Häufigkeiten aus methodischen Gründen unzulässig. 5. Die Eigenschaft der Varianz, große Abweichungen vom arithmetischen Mittel stärker als kleine zu gewichten, wird bei der Standardabweichung durch die Berechnung der Wurzel nicht ausgeschaltet. 6. Beim Preisindex nach PAASCHE muß für jede Berichtsperiode ein neuer Warenkorb bestimmt werden. 7. Das Kontingenzmaß von GOODMAN/KRUSKAL mißt nur lineare Beziehungen zwischen komparativen Merkmalen. 8. Korrelationskoeffizient und Kovarianz stimmen stets überein. 9. Regressionslinie und Regressionsgerade sind immer identisch.
366
3. Überprüfen Sie Ihre Statistik-Kenntnisse
10. Der KorrelationskoeffIzient mißt die kausale (und lineare) Beziehung zwischen zwei metrischen Merkmalen. 11. Bei klassierten metrischen Merkmalen ist das arithmetische Mittel von der Festsetzung der Klassengrenzen offener Randklassen abhängig. 12. Bei klassierten metrischen Merkmalen können Mittelwert und Varianz nur approximativ bestimmt werden. 13. Auch wenn der Umfang der Teilgesamtheiten bekannt ist, kann der Gesamt-Median nicht aus den Medianen der Teilgesamtheiten abgeleitet werden. 14. Klassierte metrische Merkmale werden als klassifikatorische Merkmale bezeichnet. 15. Der Median kann niemals Werte kleiner als Null annehmen, da er durch F„(x„ _) г 0,5 definiert ist, und die Werte der Verteiл U, о lungsfunktion stets positiv sind. 16. Bewegungsmassen werden im Gegensatz zu Bestandsmassen für einen bestimmten Zeitraum erfaßt. Deshalb ist die Dimension stets "Einheiten je Periode". 17. Die approximierende Verteilungsfunktion stimmt mit der empirischen Verteilungsfunktion nur an den Klassenmitten überein. 18. Wegen seiner Konstruktion gibt ein Preisindex nach LASPEYRES nicht nur Preis-, sondern auch Mengenänderungen wieder. 19. Bedingte Verteilungen lassen sich immer als Quotienten aus den entsprechenden Randverteilungen bestimmen. 20. Die statistische Unabhängigkeit zweier komparativer Merkmale läßt sich auch mit Hilfe ihrer bedingten Verteilungen feststellen. 21. Ist das Maß у von GOODMAN/KRUSKAL gleich Null, so folgt nicht zwingend, daß U und V statistisch unabhängig sind.
daraus
22. Der Median einer Verteilung ändert sich nicht bei linearen Transformationen (b*l und/oder a*0) des zugrunde liegenden Merkmals. 23. Das Maß vom Typ HERFINDAHL basiert auf der Entropie und kann daher sowohl mit Hilfe absoluter als auch mit Hilfe relativer Häufigkeiten bestimmt werden. 24. Aus der statistischen Unabhängigkeit metrischer Merkmale folgt ihre Unkorre1ierthe i t. 25. Die Varianz linear transformierter Merkmalswerte unterscheidet sich stets von der Varianz der ursprünglichen Werte. 26. Wenn r = +1 ist, dann besteht ein vollständiger kausaler Zusammenhang zwischen den betrachteten Merkmalen.
3. Überprüfen Sie Ihre
Statistik-Kenntnisse
367
27. Bel klassifikatorlsehen Merkmalen spielt die Reihenfolge der Merkmalsausprägungen keine Rolle. 28. Die Varianz wird stets größer, wenn der Umfang der zu beschreibenden Gesamtheit erhöht wird. 29. Der Median ist kleiner, größer oder genau so groß wie das entsprechende arithmetische Mittel. 30. Der Median 1st ein Maß der zentralen Tendenz nicht nur für stetige metrische Merkmale, sondern auch für diskrete metrische und komparative Merkmale. 31. Das Verhältnis der Zeitmengenfläche zur Länge der Periode gibt den Wert des durchschnittlichen Bestands an. 32. Die Kovarianz ist das gewichtete arithmetische Mittel von interner und externer Varianz. 33. Der Umfang einer Bestandsmasse wird nur für Zeitpunkte erfaßt. 34. KlassifIkatorische Merkmale können durch geeignete tionen in komparative Merkmale umgewandelt werden.
Transforma-
35. Der Wert des arithmetischen Mittels aus klassierten Werten hängt entscheidend von der Einteilung der Werte in Klassen ab. 36. Die TransInformation zweier klassifikatorischer Merkmale Α und В gibt an, wieviel Information von Merkmal Α in Merkmal В enthalten ist und umgekehrt. 37. Statistische Unabhängigkeit ist für alle Merkmalstypen definiert. 38. In
der Regel sind die 2 sionsbeziehung Γγ|χ und
Maße für die Stärke 2 verschieden.
der linearen
Regres-
39. Die Preisindizes nach LASPEYRES und PAASCHE unterscheiden sich unter anderem durch das zugrunde liegende Gewichtsschema. 40. Veränderungen der Häufigkeitsverteilung eines metrischen Merkmals wirken sich nur dann auf den Wert des arithmetischen Mittels aus, wenn sich diese Veränderungen auf Merkmalsausprägungen beziehen, die kleiner als der Wert des arithmetischen Mittels sind. 41. Für die Häufigkeitsdichte f χ (ξ) gilt, wie auch für die relative Häufigkeit f,, 0 * f v (?) s 1. J л 42. Wenn zwei Merkmale U und V statistisch unabhängig sind, dann sind die bedingten Verteilungen gleich den Randverteilungen.
368
3. Überprüfen Sie Ihre
Statistik-Kenntnisse
43. Das Produkt aus dem Preisindex nach LASPEYRES
(LPt ) und dem o' Preisindex nach PAASCHE ( Ρ ) ergibt den Umsatzindex U t to' o*
44. Statistische Unabhängigkeit bzw. vollständige statistische Abhängigkeit ist nur bei metrischen Merkmalen definiert. 45. Daus arithmetische Mittel wird im Gegensatz zum Median von Extremwerten (Ausreißern) beeinflußt. 46. Die Entropie ist aufgrund ihrer Eigenschaften geeignet, die Streuung/Variabilität klassifikatorischer Merkmale zu messen. 47. Merkmale mit nur einer Ausprägung sind für empirische Untersuchungen von besonderer Bedeutung. 48. Häufigkeitsverteilungen metrischer Merkmale lassen sich stets durch das arithmetische Mittel und die Varianz eindeutig beschreiben. 49. Die Standardabweichung läßt sich nicht in eine interne und eine externe Komponente zerlegen. 50. Wenn die individuellen Verweildauern nicht bekannt sind, läßt sich der Durchschnittsbestand nur approximativ bestimmen. 51. Die arithmetischen Mittel aus klassierten und Werten stimmen stets exakt überein.
nicht-klassierten
52. Bei zweidimensionalen Häufigkeitsverteilungen werden jeweils Paare von Merkmalsträgern betrachtet, im Gegensatz zu eindimensionalen Häufigkeitsverteilungen, bei denen nur Ausprägungen an einzelnen Merkmalsträgern betrachtet werden. 53. Für Korrelationstabellen gilt stets: ftx^y^) = f i x ^
für alle i
und j. 54. Ausgleichende Regressionsgeraden können nur bei metrischen Merkmalen sinnvoll angegeben werden. 55. Umsatzindizes können als Produkt geeigneter Preis- und Mengenindizes berechnet werden. 56. Bei einer vollständigen linearen Beziehung zwischen zwei metrischen Merkmalen gilt für den Korrelationskoeffizienten r = -1 oder г = +1. 57. Bei einem Mengenindex wird mit Mengen, bei einem Preisindex mit Preisen und bei einem Umsatzindex mit Umsätzen gewichtet. 58. Umsatzindizes und -meßzahlen sind sachlich identisch. 59. Ein Umsatzindex läßt sich (wenn geeignete zusätzliche Informationen gegeben sind) in einen Preisindex und einen Mengenindex zerlegen. 60. Bei komparativen Merkmalen ist das Verhältnis zweier Ausprägungen nicht sinnvoll interpretierbar.
3. Überprüfen Sie Ihre Statistik-Kenntnisse
369
61. Assoziationskoeffizienten für klassifikatorische Merkmale ändern ihren Wert, wenn in der zugehörigen Kontingenztabelle Zeilen und Spalten vertauscht werden. 62. Relative Streuungsmaße - wie zum Beispiel der Variationskoeffizient - ermöglichen den Vergleich unterschiedlicher Verteilungen von Merkmalen verschiedenen Typs. 63. Die Standardabweichung mißt den durchschnittlichen Merkmalswerte vom zugehörigen arithmetischen Mittel.
Abstand
der
64. Sind zwei Merkmale statistisch unabhängig, so kann ihre gemeinsame relative (zweidimensionale) Häufigkeitsverteilung als Produkt der beiden Randverteilungen bestimmt werden. 65. Nimmt γ, das Kontingenzmaß von GOODMAN/KRUSKAL, den Wert Null an, so folgt daraus, daß die betrachteten (komparativen) Merkmale statistisch unabhängig sind. 66. Die Indizes nach PAASCHE, LASPEYRES und LOWE unterscheiden sich unter anderem durch das Gewichtungsschema. 67. Mit Hilfe der approximierenden Verteilungsfunktion lassen sich exakte Aussagen über die kumulierten relativen Häufigkeiten nur an den Klassengrenzen treffen. 68. Empirische Verteilungsfunktionen sind im Gegensatz zu den Summenfunktionen immer stetig. 69. Die
Berechnung der
relativen
durchschnittlichen
Abweichung v^ =
= d(x. „)/x„ _ ist auch für ordinal skalierte Merkmale sinnvoll, и, ь u,ö weil der Median für dieses Skalenniveau sinnvoll definiert ist. 70. Die Varianz der Verteilung eines metrischen Merkmals X ist stets positiv, es sei denn, es gilt: x^ < 0 für alle ν . 71. Jede Standardisierung kehrt .
ist eine
lineare Transformation
und
umge-
72. Die ausgleichenden Regressionsgeraden Y(X) und X(Y) schneiden sich immer im Punkt (x,y). 73. Die Summe der Häufigkeitsdichten über alle Klassen eines klassierten metrischen Merkmals ist gleich 1. 74. Die Frage nach der statistischen Unabhängigkeit zweier komparativer Merkmale kann durch den Vergleich der Mediane ihrer Randvei— teilungen beantwortet werden: Stimmen die beiden Mediane überein, sind die beiden Merkmale statistisch unabhängig. 75. Aus dem Bestimmtheitsmaß läßt sich ohne weitere Information Korrelationskoeffizient nach BRAVAIS/PEARSON ableiten.
der
370
3. Überprüfen Sie Ihre Statistik-Kenntnisse
76. Häufigkeitsdichte und r e l a t i v e Häufigkeit haben den gleichen Wertebereich. 77. Die Werte der Häufigkeitsdichte sind s t e t s kleiner g l e i c h 1. 78. Die Richtung eines Zusammenhangs zwischen metrischen Merkmalen wird durch d i e Kovarianz determiniert. 79. Aus r = О kann nicht geschlossen werden, daß d i e beiden Merkmale s t a t i s t i s c h unabhängig sind. 80. Für eine um Null symmetrische Verteilung i s t s t e t s
= ^χ^"^·
81. Komparative Merkmale können nur linear transformiert werden, da nur hierdurch die Ordnungsrelationen zwischen den Merkmalsausprägungen erhalten bleiben. 82. Bei v o l l s t ä n d i g e r Assoziation zwischen zwei k l a s s i f i k a t o r i s c h e n Merkmalen mit k=l Ausprägungen läßt sich d i e zugehörige Kontingenztabelle s t e t s so gestalten, daß nur d i e T a b e l l e n f e l d e r der Hauptdiagonalen besetzt sind. 83. Adäquate Darstellungsformen f ü r Häufigkeitsverteilungen Stabdiagramm bzw. das Histogramm.
sind
das
84. Der geeignete Mittelwert für Meßzahlen 1st das harmonische M i t t e l . 85. Die Indizes nach LASPEYRES und PAASCHE sind s t e t s darstellbar arithmetisches Mittel von Meßzahlen.
als
86. Gegen eine Berechnung des Modus f ü r metrische Merkmale sprechen keine methodischen Gründe, sondern l e d i g l i c h der mögliche Informationsverlust. 87. Der lineare Zusammenhang zweier metrischer Merkmale i s t s t e t s p o s i t i v , wenn der Regressionskoeffizient p o s i t i v 1st. 88. Die Bestimmung empirischer RegressIonsbeziehungen i s t vor allem dann von V o r t e i l , wenn für d i e Art der Beziehung kein s p e z i e l l e s Modell (zum Beispiel e i n lineares Modell) angegeben werden kann. 89. Mit dem Korrelationsverhältnis kann auch die Stärke n i c h t - l i n e a r e r Beziehungen zwischen metrischen Merkmalen gemessen werden. 90. Der P r e i s eines Gutes s t e i g t innerhalb von 10 Jahren von 1,— DM auf 4 , — DM, d.h. um 300%. Damit beträgt die durchschnittliche j ä h r l i c h e Wachstumsrate 300%/10=30%. 91. Wenn zwei Merkmale s t a t i s t i s c h unabhängig sind, dann g i l t n x j y j ) = n y j x j ) f ü r a l l e i und j . 92. Die durchschnittliche lineare (absolute) Abweichung 1st f ü r den Modus minimal.
3. Überprüfen Sie Ihre Statistik-Kenntnisse
371
93. Zwei Merkmale sind nicht statistisch unabhängig, wenn für die zugehörige zweidimensionale Verteilung f^j * f ^ f ^ j für irgendein Paar i,j gilt. 94. Die Berechnung des Medians einer Verteilung setzt voraus, daß die Differenzen zwischen den Merkmalswerten sinnvoll definiert sind. 95. Im Gegensatz zu klassifikatorischen Merkmalen ist bei komparativen Merkmalen die Berechnung kumulierter Häufigkeiten sinnvoll. 96. Im Gegensatz zum Korrelationskoeffizienten mißt das Kontingenzmaß у von GOODMAN/KRUSKAL Stärke und Richtung auch nicht-linearer Beziehungen zweier Merkmale. 97. Eine exakte zeitliche Verkettung von Indizes nach LASPEYRES oder PAASCHE ist nicht möglich. 98. Zeitvergleiche von PAASCHE-Indizes sind aufgrund der ständig wechselnden Gewichtung wenig sinnvoll. 99. Eine Einteilung in Klassen ist nur bei stetigen metrischen Merkmalen von praktischer Bedeutung. 100. Die statistische Unabhängigkeit zweier Merkmale ist eine Eigenschaft zweidimensionaler Verteilungen, die für Merkmale aller Merkmalstypen definiert ist. 101. Ausgleichende Regressionsgeraden schneiden sich wie auch die Regressionslinien stets im Punkt (0;0). 102. Korrelationsverhältnis und Bestimmtheitsmaß messen den durch die Regression bzw. Regressionsgerade erklärten Teil der Varianz. 103. Häufigkeitsverteilungen, die hinsichtlich des arithmetischen Mittels und der Varianz identisch sind, sind auch hinsichtlich aller weiteren Momente identisch. 104. Bei einer Teilerhebung interessiert nur ein Teil Merkmalsausprägungen des untersuchten Merkmals. 105. Summenfunktion und empirische sich nur durch einen Faktor.
Verteilungsfunktion
der
möglichen
unterscheiden
106. Der Modus ist nicht für jede Verteilung eindeutig bestimmbar. 107. Der Durchschnittsbestand ist ein arithmetischer Mittelwert. 108. Bei der Berechnung gleitender Durchschnitte muß die Anzahl der Glieder stets ungerade sein, weil anderenfalls eine eindeutige Zuordnung zu den Zeltpunkten nicht möglich ist. 109. Die Berechnung gleitender Durchschnitte hat den Nachteil, daß den Zeitpunkten am Anfang und Ende der Zeitreihe keine Durchschnittswerte zugeordnet werden können. 110. Gleitende Durchschnitte können nur für metrische Merkmale berechnet werden.
372
3. Überprüfen Sie Ihre
Statistik-Kenntnisse
111. Bedingte Verteilungen können nur bei zwei- und mehrdimensionalen Verteilungen berechnet werden. 112. Ein negativer Wert des Korrelationsverhältnisses deutet auf die Existenz eines negativen Zusammenhangs zwischen zwei metrischen Merkmalen hin. 113. Durch die Berechnung der relativen Entropie wird unter anderem erreicht, daß ein Streuungsvergleich von Verteilungen von Merkmalen mit unterschiedlich vielen Ausprägungen sinnvoll wird. 114. Für empirische RegressIonsbeziehungen gilt stets 0 5 Н
Х | У = 4 | Х * !·
115. Die mit Hilfe der Momente definierten Maße für die Schiefe und Wölbung einer Verteilung lassen sich auch für klasslfikatorische Merkmale berechnen. 116. Wenn ein Merkmal X ursächlich von einem Merkmal Y abhängt, dann hängt auch Y ursächlich von X ab. 117. Wachstumsraten sind spezielle Indizes. 118. Die Summe aus der Anzahl der konkordanten Paare und der diskordanten Paare ergibt den Umfang der Gesamtheit. 119. Maße wie zum Beispiel die TransInformation, mit denen man Beziehungen zwischen klassifikatorischen Merkmalen beschreibt, werden auch als Beziehungszahlen bezeichnet. 120. Die relativen Häufigkeiten einer zweidimensionalen empirischen Häufigkeitsverteilung werden durch f^j = n ^ n ^ / n berechnet. 121. Es gibt Verteilungen von Merkmalen mit einer Standardabweichung von -4 und einer Varianz von +16. 122. Wenn X und Y statistisch unabhängig sind, dann ist г = 0. 123. Verteilungen komparativer Merkmale können auch durch Quantile beschrieben werden, weil es zulässig ist, Häufigkeiten komparativer Merkmale zu kumulieren. 124. Eine Gesamtheit sei
In zwei Tellgesamtheiten
Dann ist stets χ = [x^+x
)/2
(1 und 2) zerlegt.
das arithmetische Mittel der
Gesamt-
heit. 125. Randverteilungen können nur bei zwei- und mehrdimensionalen Verteilungen berechnet werden. 126. Das Kennzeichen relativer Streuungsmaße wie zum Beispiel der relativen Entropie oder des Variationskoeffizienten ist ihr Wertebereich, das Intervall [0;1].
3. Überprüfen Sie Ihre
Statistik-Kenntnisse
373
127. Die Summenfunktion an der Stelle ξ ο gibt die Anzahl der Merkmalswerte an, die kleiner oder höchstens gleich ξ^ sind. 128. Die charakteristische Eigenschaft komparativer Merkmale läßt sich an folgender Aussage zeigen: Die Note 4 ist doppelt so schlecht wie die Note 2. 129. Alle nicht binären Merkmale sind häufbare Merkmale. 130. Beispiele für Bewegungsmassen sind die Gesamtheit lebendgeborener Kinder in einem KalenderJahr und die Gesamtheit von eintreffenden Museumsbesuchern im Laufe eines Tages. 131. Der Preis eines Gutes steigt in drei Jahren von DM 8 0 , — auf DM 106,48. Dann beträgt die durchschnittliche jährliche Preissteigerungsrate genau 10%. 132. Eine Partei hat bei einer Landtagswahl 12% der Stimmen auf sich vereinigt; vier Jahre später sind es - bei gleicher Wahlbeteiligung - nur noch 9,6%. Die Partei hat also insgesamt 2,4% ihrer Stimmen verloren. 133. Der Preisindex für die Lebenshaltung aller privaten Haushalte kann nicht auf der Basis von Subindizes berechnet werden. 134. Beim sogenannten "Nullwachstum" ist der Wachstumsfaktor gleich 0. 135. Die Parameter der ausgleichenden Regressionsgeraden werden nach der Methode der kleinsten Quadrate bestimmt. 136. Bei dreidimensionalen Verteilungen metrischer Merkmale ist jeder Merkmalsträger durch ein Tripel von Merkmalswerten, zum Beispiel durch gekennzeichnet. 137. In der amtlichen Statistik der Bundesrepublik Indizes nach LOWE von untergeordneter Bedeutung.
Deutschland
sind
138. Der Durchschnittsbestand eines Lagers in einem bestimmten Beobachtungszeitraum läßt sich stets exakt berechnen. 139. Standardisierte Merkmale sind Merkmale, für die gilt: 2 χ = 1 und s = 0 . 140. Metrische werden.
Merkmale können
in komparative
Merkmale
transformiert
141. Beim Wertindex nach LASPEYRES stammen die Gewichte aus der Basisperiode, beim Wertindex nach PAASCHE aus der Berichtsperiode. Daher unterscheiden sich die Werte der Wert Indizes nach LASPEYRES und nach PAASCHE in aller Regel. 142. Die empirische Verteilungsfunktion eines diskreten metrischen Merkmals kann durch eine Treppenfunktion graphisch dargestellt werden.
374
3. Überprüfen Sie Ihre
Statistik-Kenntnisse
143. Gegeben sei die ausgleichende Regressionsgerade Y(X) = 1 + 9,5 X. Da die Steigung a^ = 9,5 deutlich größer als 1 ist, besteht ein starker funktionaler Zusammenhang zuIschen den Merkmalen X und Y . 144. Der Modus kann nur bei Häufigkeitsverteilungen klassifikatorischer Merkmale unbestimmt sein. 145. Die gerne Ins Eime Verteilungsfunktion zweier komparativer Merkmale ei— gibt sich stets als Produkt der entsprechenden Werte der Randverteilungsfunktionen. 146. Der Vergleich von zwei Werten der Entropie ist nur sinnvoll, wenn die Anzahlen der Ausprägungen der betrachteten Merkmale gleich sind oder die Werte der Entropie relativiert werden. 147. Die Transinformation gibt die Richtung des Zusammenhangs zwischen den klassifikatorischen Merkmalen Α und В an. 148. Auch aufgrund des Wertebereichs der Varianz bereitet ihre Interpretation häufig Schwierigkeiten. 149. Zu den Maßen der zentralen Tendenz gehören neben Modus und Median auch die durchschnittliche Abweichung und die Varianz. 150. Folgende Merkmale gehören zum Typ der komparativen Merkmale: Klausurnoten, Punktzahl im Turnwettkampf, Rückennummer der Fußballspieler, Temperatur gemessen in Grad Fahrenheit. 151. Der Index nach LASPEYRES ist ein gewogenes arithmetisches Mittel von Meßzahlen mit einem Gewichtungsschema aus der Berichtsperiode. 152. Zu jeder Häufigkeitsverteilung existiert ein arithmetisches Mittel. 153. Die durchschnittliche lineare Abweichung unterscheidet sich von der Varianz vor allem durch die fehlende Quadrierung der Abstände vom jeweiligen Mittelwert. 154. In einer Korrelationstabelle sind Korrelationskoeffizienten tabel1iert. 155. Ein Zusammenhangs maß Ζ (OsZsl) nehme den Wert 1 ал. Daraus ist zu schließen, daß zwischen den betrachteten Merkmalen ein vollständiger kausaler Zusammenhang besteht. 156. Ein Preisindex nach PAASCHE der Art
Ρ
läßt sich weder berech' о
nen noch sinnvoll interpretieren. 157. Die mittlere Verweildauer ist definiert als das arithmetische Mittel der beobachteten individuellen Verweildauern. 158. Mittlere Aufbauzeit stets gleich.
und mittlere
Abbauzeit
eines
Bestands
sind
159. Durch Bewegungsmassen ändert sich der Umfang des Bestands im Verlauf der Zeit.
375
3. Überprüfen Sie Ihre Statistik-Kenmnisse
160. Von Ausnahmen abgesehen, stimmen d i e Werte der bedingten V e r t e i lungen z w e i e r metrischer Merkmale X und Y nicht überein. Es g i l t also: f ( χ I y Q ) * f(y|xQ). 161. Unter einem Quart i i s a b s t a n d v e r s t e h t man in der S t a t i s t i k Abstand zwischen der 4. Merkmalsausprägung und dem M i t t e l w e r t .
den
162. Die Entropie läßt s i c h sowohl mit r e l a t i v e n H ä u f i g k e i t e n a l s mit absoluten H ä u f i g k e i t e n berechnen.
auch
163. Die r e l a t i v e n H ä u f i g k e i t e n e i n e r bedingten V e r t e i l u n g s i c h (abgesehen von Rundungsfehlern) s t e t s zu 1 a u f : к Σ f ( А , |B.) = 1. J 1=1
summieren
164. Die Wertbereiche der Entropie und der Maßzahl von H e r f i n d a h l men überein.
stim-
165. Der V a r i a t i o n s k o e f f i z i e n t V = s/x h ä l t n i s s k a l i e r t e Merkmale, welches der Merkmale unabhängig i s t .
i s t e i n Streuungsmaß f ü r v e r von der j e w e i l i g e n Meißeinheit
166. Sei
i - t e n Ausprägung e i n e s
n^ d i e absolute H ä u f i g k e i t
fikatorischen Dann g i l t
der
Merkmals und f ^ d i e zugehörige
relative
klassi-
Häufigkeit.
s t e t s f . £ n. . 1 1
167. Die Wertebereiche tisch.
absoluter
und r e l a t i v e r
Häufigkeiten sind
iden-
168. Der Anfangsbestand B q und der Endbestand B^ stimmen i n einem F o r t schreibungsmodell
in jedem F a l l e
überein.
169. Voraussetzung f ü r d i e Berechnung e i n e s Durchschnittsbestands d i e Übereinstimmung von Anfangs- und Endbestand.
ist
170. I s t d i e Bestimmung der ausgleichenden Regressionsgeraden Y ( X ) zwei metrische Merkmale X und Y s i n n v o l l , so i s t s t e t s auch
für die
Berechnung sinnvol1.
der
anderen
171. Für den M i t t e l w e r t g i l t
ausgleichenden
stets:
x.
Regressionsgeraden
. s χ s χ
172. Die H ä u f i g k e i t s d i c h t e i s t wie f o l g t d e f i n i e r t :
X(Y)
..
ίχ(ξ)
= ί^'Δίχ^.
173. Die Ausprägungen komparativer Merkmale werden s t e t s mit O r d i n a l zahlen b e z e i c h n e t , w e i l man mit Symbolen bzw. Buchstaben nicht rechnen kann. 174. Die K a l e n d e r z e i t und d i e geographische Höhe sind Merkmale.
intervallskalierte
376
3. Überprüfen Sie Ihre
Statistik-Kenntnisse
175. Die Berechnung konkordanter und diskordanter Paare s i f i k a t o r i s c h e n Merkmalen unzulässig.
ist
bei
klas-
176. Die Volkszählung i s t ein Beispiel f ü r eine Primärstatistik. 177. Die
Regressionskonstante
aQ
läßt
sich
stets
sinnvoll
interpre-
tieren. 178. Für χ
V
= a + bz
V
i s t d ( x „ „ ) = |b|d(z n _). 1 1 и, э u,o
179. Im additiven Modell lyse
kann d i e
y^ = m^ + u^ (1=1,2,. . . , n )
glatte
Komponente
m^ mit
Hilfe
der Zeitreihenanagleitender
Durch-
schnitte geschätzt werden. 180. Für eine eindeutige Zuordnung von Häufigkeiten zu Klassen von d i s kreten metrischen Merkmalen muß s t e t s d i e Obergrenze der Klasse i - 1 g l e i c h der Untergrenze der Klasse i sein. 181. Die Häufigkeitsdichte i s t wie f o l g t d e f i n i e r t : ί χ ( ξ ) = f i / n i 182. Bei k l a s s i f i k a t o r i s c h e n Merkmalen i s t Häufigkeiten unzulässig.
die
Berechnung
·
kumulierter
183. Das geometrische M i t t e l ist ein geeigneter Mittelwert f ü r Meßzahlen mit v a r i a b l e r Bezugszeit. 184. Die Parameter a Q und bQ der beiden ausgleichenden
Regressionsge-
raden Y(X) und X(Y) haben s t e t s das g l e i c h e Vorzeichen. 185. Bei k l a s s i f i k a t o r i s c h e n Merkmalen s p i e l t d i e Reihenfolge der Merkmalsausprägungen keine Ro 11e. 186. Der Stimmanteil der Partei XYZ f i e l bei den l e t z t e n Landtagswahlen um 1,3 Prozent punkte von 18,7 auf 17,4 Prozent der abgegebenen Stimmen. 187. Der Median i s t e i n geeignetes Lagemaß f ü r komparative und metrische Merkmale. 188. Eine ausgleichende Regressionsgerade beschreibt die durchschnittl i c h e monotone Abhängigkeit eines metrischen Merkmals von einem anderen metrischen Merkmal. 189. Eine geeignete graphische Darstellungsform f ü r die empirische Verteilungsfunktion eines stetigen Merkmals i s t das Histogramm. 190. Bei
zweidimensionalen
Häufigkeitsverteilungen k l a s s i f i k a t o r i s c h e r к Merkmale i s t die Summe der Randhäufigkeiten Σ η, immer g l e i c h der i=l
377
3. Überprüfen Sie Ihre Statistik-Kenntnisse
S u m m e der R a n d h ä u f i g k e i t e n
1 Σ η , , J=1
'
wobei
к d i e Anzahl
der
Zeilen
J
u n d 1 die Anzahl der S p a l t e n der K o n t i n g e n z t a b e l l e
sind.
191. D i e Festlegung der Klassenobergrenze d e r o b e r s t e n K l a s s e eines k l a s s i e r t e n m e t r i s c h e n Merkmals wirkt s i c h im a l l g e m e i n e n nicht a u f d a s Quantil zur O r d n u n g ρ = 0 , 2 5 aus. 192. D e r M e d i a n eines k o m p a r a t i v e n M e r k m a l s U ist d e f i n i e r t
durch
wobei к - die Anzahl der M e r k m a l s a u s p r ä g u n g e n - u n g e r a d e ist. 193. D a s M a ß v o n C R A M E R ist e i n Z u s a m m e n h a n g s m a ß f ü r Merkmale.
klassifikatorische
194. Bestimmt m a n Indizes n a c h LASPEYRES, d a n n lassen s i c h - im G e g e n s a t z z u d e n Indizes n a c h P A A S C H E - n e b e n d e n P r e i s i n d i z e s a u c h M e n g e n i n d i z e s bestimmen. 195. D i e Spannweite k l a s s i f i k a t o r i s c h e r Merkmale ist definiert a l s f e r e n z z w i s c h e n d e m g r ö ß t e n und k l e i n s t e n Merkmalswert. 196. D e r F a m i l i e n s t a n d einer P e r s o n deutscher Nationalität b a r e s Merkmal.
Dif-
ist e i n h ä u f -
197. Die Entropie u n d d a s S t r e u u n g s m a ß v o m T y p H E R F I N D A H L s i n d s i n n v o l l e M a ß e der Variabilität k l a s s i f i k a t o r i s c h e r Merkmale. 198. D i e K o v a r i a n z S ^ y mißt die gemeinsame lineare S t r e u u n g der M e r k m a l e X u n d Y. 199. D i e Merkmale Höhe des Haushaitseinkommens, H a u s h a l t s g r ö ß e d e s Einkommens (Einkunftsart) h a b e n zumindest ordinales niveau.
u n d Art Skalen-
200. Die Güte einer linearen B e z i e h u n g ist a l l e i n a n h a n d des K o r r e l a t i o n s k o e f f i z i e n t e n n a c h B R A V A I S / Ρ Ε A R S O N sinnvoll interpretierbar. 201. D i e a b s o l u t e n H ä u f i g k e i t e n n^ eines M e r k m a l s u n t e r s c h e i d e n s i c h v o n d e n r e l a t i v e n H ä u f i g k e i t e n fj n u r d u r c h e i n e n Faktor. 202. D i e S t a n d a r d a b w e i c h u n g e i n e s s t e t i g e n m e t r i s c h e n M e r k m a l s k a n n s o wohl für E i n z e l w e r t e als a u c h für klassierte W e r t e b e r e c h n e t w e r den. 203. Eine Beziehungszahl ist e i n Quotient aus zwei s a c h l i c h vers c h i e d e n e n Größen, die in s i n n v o l l e r B e z i e h u n g stehen, wobei d i e s e G r ö ß e n zumindest o r d i n a l e s S k a l e n n i v e a u a u f w e i s e n müssen. 204. K l a s s i f i k a t o r i s c h e Merkmale s i n d invariant g e g e n ü b e r u m k e h r b a r e i n d e u t i g e n T r a n s f o r m a t i o n e n (Umbenennungen, Vertauschungen).
378
3. Überprüfen Sie Ihre
Statistik-Kenntnisse
205. Das Kontingenzmaß ц von GOODMAN/KRUSKAL mißt die Stärke und Richtung einer monotonen Beziehung zwischen zwei komparativen Merkmalen in einer Kontingenztabelle. 206. Die ausgleichende Regressionsgerade kann sowohl auf der Grundlage von Einzelwerten als auch (approximativ) auf der Basis von klassierten Werten berechnet werden. 207. Bei Kenntnis des Anfangsbestands sowie der Zugänge und Abgänge im Beobachtungszeitraum kann eine Bestandsmasse fortgeschrieben werden. 208. Das Stabdiagramm ist eine geeignete Darstellungsform für die Häufigkeitsverteilung eines diskreten metrischen Merkmals. 2 2 209. Das Bestimmtheitsmaß г hat den Wertebereich - 1 s г s + 1 . 210. In der beschreibenden Statistik versteht man unter der Standardabweichung eine Varianz von eins. 211. Die Körpergröße X ist ein verhältnisskaliertes Merkmal. 212. Die Gewichte eines Preisindex nach LASPEYRES bestehen aus Preisund Mengenangaben der Berichtszeit. 213. Der Median x^ ^ eines komparativen oder metrischen Merkmals X wird auch als das Quantil zur Ordnung 0,5 bezeichnet. 214. Die л
graphische
Darstellung
der
eines klassif ikatorischen
empirischen Merkmals
Verteilungsfunktion
ist üblicherweise
eine
Treppenfunkt ion. 215. Die Breite der Medianklasse eines (klassierten) metrischen Merkmals ist für die Berechnung des Medians irrelevant. 216. Das Merkmal Beruf ist ein häufbares Merkmal. 217. Die Kovarianz mißt die gemeinsame Merkmale.
lineare Streuung
komparativer
218. Das Streuungsmaß auf der Basis der Entropie für komparative Merkmale nimmt seinen maximalen Wert an für f. = f, = 1/2 und nicht für 1 к den Fall der Gleichverteilung. 219. Voraussetzung für die graphische Darstellung der empirischen Verteilungsfunktion eines stetigen metrischen Merkmals ist die Berechnung der Häufigkeitsdichte. 220. Zwei Merkmale Α und В heißen statistisch unabhängig,wenn η. η . η = 1 ' ' J für alle 1=1,2 к und j=l,2 1 .
3. Überprüfen Sie Ihre
Statistik-Kenntnisse
379
2 221. Das Maß von CRAMER ist ein Zusammenhangsmaß auf der Basis von χ für klassifikatorische Merkmale. 222. Die Varianz eines metrischen Merkmals X wird auch schnittliche Abweichung des Merkmals X bezeichnet.
als
durch-
223. Ein Merkmal X heißt stetig, wenn X abzählbar unendlich viele Ausprägungen hat. 224. Bei komparativen Merkmalen mationen zulässig.
sind
alle
rangerhaltenden
Transfor-
225. Der Wert des BestimmtheitsmaBes zweier standardisierter Merkmale stimmt mit dem Wert des Bestimmtheitsmaßes der zugehörigen nichtstandardisierten Merkmale überein.
380 3 . 3
3. Überprüfen
Sie Ihre
Statistik-Kenntnisse
L ö s u n g e n
1. 2. 3. 4. 5.
R F R F R
46. 47. 48. 49. 50.
R F F R R
91. 92. 93. 94. 95.
F F R F R
136. 137. 138. 139. 140.
R R F F R
181. 182. 183. 184. 185.
F R R F R
6. 7. 8. 9. 10.
R F F F F
51. 52. 53. 54. 55.
F F F R R
96. 97. 98. 99. 100.
R R R F R
141. 142. 143. 144. 145.
F R F F F
186. 187. 188. 189. 190.
R R F F R
11. 12. 13. 14 . 15.
R R R F F
56. 57. 58. 59. 60.
R F R R R
101. 102. 103. 104 . 105.
F R F F R
146. 147. 148. 149. 150.
R F R F F
191. 192. 193. 194. 195.
R F R F F
16. 17. 18. 19. 20.
R F F F R
61. 62. 63. 64. 65.
F F F R F
106. 107. 108. 109. 110.
R R F R R
151. 152. 153. 154. 155.
F F R F F
196. 197. 198. 199. 200.
F R R F F
21. 22. 23. 24 . 25.
R F F R F
66. 67. 68. 69. 70.
R R F F F
111. 112 . 113. 114 . 115.
R F R F F
156. 157. 158. 159. 160.
F R F R R
201. 202. 203. 204. 205.
R R F R R
26. 27. 28 . 29. 30.
F R F R R
71. 72. 73. 74. 75.
F R F F F
116. 117 . 118. 119. 120.
F F F F F
161. 162. 163. 164. 165.
F R R F R
206. 207. 208. 209. 210.
R R R F F
31. 32. 33. 34 . 35.
R F R F R
76. 77. 78. 79. 80.
F F R R F
121. 122. 123. 124 . 125.
F R R F R
166. 167. 168. 169. 170.
R F F F F
211. 212. 213. 214. 215.
R F R F F
36. 37. 38. 39. 40.
R R F R F
81. 82. 83. 84. 85.
F R R F F
126. 127 . 128 . 129. 130.
F R F F R
171. 172. 173. 174. 175.
R F F R R
216. 217. 218. 219. 220.
R F R F R
41. 42. 43. 44 . 45.
F R F F R
86. 87 . 88. 89. 90.
R R R R F
131. 132 . 133. 134 . 135.
R F F F R
176. 177. 178. 179. 180.
R F R R F
221. 222. 223. 224 . 225.
R F F R R
381
3. Überprüfen Sie Ihre Statistik-Kenntnisse
3.4 Aussagen zur schließenden Statistik 1. Wenn eine Gesamtheit zweipunktverteilt ist (zum Beispiel männlich/weiblich) , dann folgt - unter der Voraussetzung einer Auswahl mit Zurücklegen - der Anteil X'/n = Ρ der Stichprobeneinheiten mit der Eigenschaft Α (zum Beispiel männlich) einer Binomialverteilung. 2. Man begeht keinen Fehler zweiter Art, wenn die Prüffunktion einen Wert des Annahmebereichs annimmt. 3. Ist die Zufallsvariable X stetig und symmetrisch verteilt, so ist die Wahrscheinlichkeit Ρ (χ = μ) gerade gleich 0,5. 4. Der Begriff "Wahrscheinlichkeitsdichtefunktion" ist eigentlich irreführend, weil die Werte dieser Funktion keine Wahrscheinlichkeiten sind. 5. Der Wert der Stichprobenvarianz der Umfang der Stichprobe ist.
ist um so
kleiner,
je
größer
6. Stetigkeitskorrekturen sind nur bei der Approximation diskreter Verteilungen durch stetige Verteilungen vorzunehmen. 7. Disjunkte kehrt.
Ereignisse
sind
stochastisch
unabhängig
und
umge-
8. Ein aufgrund einer konkreten Stichprobe berechnetes Konfidenzintervall enthält mit einer vorgegebenen Wahrscheinlichkeit von (1 - α ) den wahren - zu schätzenden - Parameter. 9. In der schließenden Statistik versucht man stets von den bekannten Parametern einer Gesamtheit auf die unbekannten Parameter einer einzelnen Stichprobe zu schließen. 10.Intervallschätzungen können nicht nur für unbekannte Parameter der Gesamtheit, sondern auch für unbekannte Parameter von Stichproben durchgeführt werden. 11.Der Begriff einer "einfachen" Stichprobe beinhaltet unter anderem die stochastische Unabhängigkeit der betrachteten Zufallsvariablen. 12. Kann bei einem Test H0 nicht verworfen werden, so ist H0 richtig. 13.Die Anzahl der Freiheitsgrade bei x 2 -Tests hängt ab von der Anzahl der aus der Stichprobe geschätzten Parameter. 14.Mit Hilfe statistischer Tests können Hypothesen in aller Regel weder verifiziert noch falsifiziert werden. 15.Kann bei einem Test H 0 verworfen werden, so ist Hx richtig. 16.Systematische Fehler haben auch bei zunehmendem fang keine Ausgleichstendenz.
Stichprobenum-
382
3. Überprüfen Sie Ihre Statistik-Kenntnisse
17. Bedingte und unbedingte Wahrscheinlichkeiten nehmen nur Werte des Intervalls [0,1] an. 18. Identisch verteilte Zufallsvariable sind stochastisch unabhängig. 19. Wahrscheinlichkeitsdichtefunktionen können Werte größer als 1 annehmen. 20. Bei einer einfachen Zufallsstichprobe strebt die Wahrscheinlichkeit dafür, wenigstens einmal den Wert χ der stetigen Zufallsvariablen X zu erhalten, mit zunehmendem Stichprobenumfang η gegen 1. 21. Eine Nullhypothese werde auf dem Signifikanzniveau α verworfen. Dann wird diese Hypothese auch auf jedem Signifikanzniveau α' > α verworfen. 22. Eine Zufallsvariable X heißt standardnormalverteilt, falls E(X) = 0 und Var(X) = 1. 23. Die Wahrscheinlichkeit, daß eine symmetrisch verteilte diskrete Zufallsvariable einen Wert χ s μ^ annimmt, ist stets gleich 0,5.
2 24. Aus Var(aX) = a Var(X) für alle а с IR folgt, daß die Verteilungen von X und -X die gleiche Varianz haben. 25. Durch eine lineare Transformation der Art Y = aX + b läßt sich die Zufallsvariable X in eine standardnormalverteilte Zufal1svariable Y überführen. 26. Bei normal- und t-verteilten (v £ 2) Zufallsvariablen X stimmen Median und E(X) überein. 27. Führt der Test einer Hypothese zu ihrer Ablehnung, so ist damit bewiesen, daß diese Hypothese falsch ist. 28. Die Genauigkeit einer PunktSchätzung wächst im allgemeinen mit zunehmendem Umfang der einfachen Stichprobe. 29. Aus der Tatsache, daß der Korrelationskoeffizient r zweier Zufallsvariablen X und Y den Wert 0 Einnimmt, kann nicht geschlossen werden, daß X und Y stochastisch unabhängig sind. 30. Der Fehler erster Art kann durch Vorgabe eines Signifikanzuniveaus auf α begrenzt werden. 31. Bei einer Voll- oder Totalerhebung werden alle Merkmale der Merkmalsträger erhoben. 32. Wahrscheinlichkeiten zufälliger Ereignisse sind stets (echt) größer als 0 und (echt) kleiner als 1. 33. Der Begriff der "einfachen" Zufallsstichprobe beinhaltet auch die identische Verteilung der betrachteten Zufallsvariablen. 34. Die absoluten Häufigkeiten in Stichproben aus zweipunktverteilten Gesamtheiten sind stets binomialverteilt.
3. Überprüfen Sie Ihre Statistik-Kenntnisse
383
35. Der kritische Bereich eines Tests kann unter anderem auch durch das Signifikanzniveau variiert werden. 36. Mit der Ungleichung von TSCHEBYSCHEFF können auch dann Aussagen über den Parameter μ einer Gesamtheit getroffen werden, wenn ihre Verteilung dem Typ nach unbekannt ist. 37. Bei der Approximation der Binomialverteilung durch die POISSONVerteilung ist keine Stetigkeitskorrektur durchzuführen, da beide Verteilungen diskret sind. 38. Eine Zufallsvariable wird als stetig bezeichnet, wenn sie abzählbar unendlich viele Werte annehmen kann. 39. Der statistische Test einer wahren Hypothese führt immer zu ihrer Annahme. 40. Jede normalverteilte Zufallsvariable kann durch Transformation in eine standardnormalverteilte überführt werden.
eine geeignete Zufallsvariable
41. Die Vereinigung disjunkter (unvereinbarer) Ereignisse ist stets das unmögliche Ereignis. 42. Bei hinreichend großem Umfang η einer einfachen Stichprobe ist das arithmetische Mittel X^ einer beliebig verteilten Zufallsvariablen X approximativ normalverteilt. 43. Jede Punktschätzung ist erwartungstreu. 44. Um die Standardabweichung des Schätzers X bei einfachen Stichproben zu halbieren, muß (bei bekanntem
der Stichprobenumfang verdop-
pelt werden. "2
45. Die Stichprobenvarianz σ ν kann mit zunehmendem Λ abnehmen.
Stichprobenumfang
2 46. Beim χ -Unabhängigkeitstest können die Zeilen und/oder Spalten der gegebenen Kontingenztabelle permutiert werden, ohne daß sich der Wert des Prüfmaßes dadurch ändert. 47. Eine Stichprobenerhebung hat gegenüber einer Totalerhebung bei gleichem Fragenprogramm den Vorteil geringerer Kosten und größerer Aktualität. 48. Eine Zufallsstichprobe hat gegenüber jenen Stichproben, die nicht auf dem Zufallsprinzip beruhen, den Vorteil, daß allenfalls Zufallsfehler vorkommen können. 49. Das Konfidenzintervall für den unbekannten Mittelwert einer Gesamtheit wird bei bekanntem σ γ und unter sonst gleichen Bedingungen mit
384
3. Überprüfen Sie Ihre Statistik-Kenntnisse
zunehmendem Stichprobenumfang kleiner. 50. Unkorrelierte unabhängig.
normalverteilte
Zufallsvariablen
sind
stochastisch
51. Ein Beispiel für eine Zufallsauswahl ist die willkürliche Auswahl. 52. Je öfter man einen unverfälschten Würfel wirft, desto lassen sich die Ergebnisse im Einzelfall vorhersagen.
sicherer
53. Der statistische Test einer falschen Hypothese führt immer zu ihrer Ablehnung. 54. Die Approximation einer B(n, ir)-verteilten Zufallsvariablen durch die Normal verte i lung ist dann besonders gut, wenn π nahe bei 1 liegt. 55. Nimmt eine Zufallsvariable nur einen Wert an, so ist ihre Varianz gleich Null. 56. Ist die Zufallsvariable X stetig und symmetrisch, so gilt Ρ(Χ=μ χ ) * * 0,5. 57. Die Werte f^ix) einer Wahrscheinlichkeitsdichtefunktion
sind
nur
dann Wahrscheinlichkeiten, wenn 0 s f^(x) - 1 für alle χ ε К ist. 58. Bei der Bemessung von Wahrscheinlichkeiten ist es nicht erfordei— lieh vorauszusetzen, daß die Menge der Elementarereignisse endlich und die Elementarereignisse selbst gleichmöglich sind. 59. Die Axiome von K0LM0G0R0FF 1i chke i t en anwendbar.
sind
auch
auf
bedingte
Wahrschein-
60. Ist ein Testergebnis statistisch signifikant, so ist es damit auch realwissenschaftlich relevant (bedeutsam). 61. Durch eine hinreichende Vergrößerung der Stichprobenumfänge läßt sich bei einem Mittelwert-Differenzen-Test stets erreichen, daß auch beliebig kleine (praktisch bedeutungslose) Unterschiede zwischen den Mittelwerten statistisch signifikant sind. 62. Für eine empirische Untersuchung kann die Behauptung, daß 90% aller Beamten schwarze Schuhe tragen, eine (statistische) Hypothese sein. 63. Für eine Punktschätzung des Mittelwerts
μ^ einer Gesamtheit
ist
Ρ(Χ=μ χ ) = 1. 64. Wenn für zwei Zufallsvariablen X und Y die Cov(X.Y) = 0 ist, so sind X und Y stochastisch unabhängig. 65. Für eine Dichtefunktion gilt stets: 00
0 £ f x (x) — 1
und
J· f x (x)dx = 1.
3. Überprüfen Sie Ihre Statistik-Kenntnisse
385
66. Die Verteilungsfunktion F^ einer Z u f a l l s v a r i a b l e n X g i b t f ü r jede r e e l l e Zahl b die Wahrscheinlichkeit P(Xsb) an. 67. Bei Zufallsstichproben treten nur Z u f a l l s f e h l e r auf. 68. Mit Tests s t a t i s t i s c h e r ( N u l l - ) Hypothese r i c h t i g
Hypothesen ist.
wird
festgestellt,
ob
69. Der Erwartungswert einer s t e t i g e n Z u f a l l s v a r i a b l e n i s t s t e t s tiv.
eine posi-
70. Das Integral einer Wahrscheinlichkeitsdichtefunktion über das I n t e r v a l l [a,+m] kann a l s Wahrscheinlichkeit i n t e r p r e t i e r t werden. 71. Sind zwei Zufallsvariablen stochastisch unabhängig, so i s t ihre Kovarianz g l e i c h Null. 72. Wegen der Symmetrieeigenschaft stets F ( - λ ) = 1 - F (λ).
der
Standardnormalverteilung
gilt
73. Für zwei stochastisch unabhängige Z u f a l l s v a r i a b l e n X und Y Var(X-Y) = Var(X) + Var(Y) .
gilt:
74. Für eine Z u f a l l s v a r i a b l e X und eine b e l i e b i g e r e e l l e Zahl a g i l t : Var(aX) = a · Var(X). 75. Für
stochastisch
unabhängige
Ereignisse
E^und
E^
stimmen
die
bedingten Wahrscheinlichkeiten Ρ(Ε^|Ε£) und PiE^IE^) immer überein. 76. Ein Fehler zweiter Art wird begangen, verworfen wird, obwohl s i e r i c h t i g i s t .
wenn eine
77. Die Verteilung einer Prüffunktion Τ kann Eingegeben werden, daß Hq r i c h t i g i s t .
unter
Nullhypothese der
Bedingung
78. A l l e s t e t i g e n eindimensionalen Verteilungen sind durch den Mittelwert μ und die Standardabweichung x° . Der Anteil der Bolzen mit einer Länge von höchstens 50,00 mm ist der Wert der approximierenden Verteilungsfunktion an der Stelle 50,00. Da es sich hierbei um eine Klassengrenze handelt, ist der Wert gleich dem der empirischen Verteilungsfunktion an der Stelle 50 und somit ein exakter Wert. Fx(50,00) = Fx(50,00) = 0,523 . Der Anteil der Bolzen mit einer Länge von höchstens 50,00 mm beträgt exakt 52,3%. Der Anteil der Bolzen mit einer Länge über 50,15 mm ist 1 minus dem Wert der approximierenden Verteilungsfunktion an der Stelle 50,15. Da 50,15 zwischen den Klassengrenzen liegt, ist der berechnete Anteil ein approximativer Wert.
4. Ergänzungen
406
129 1 - Fx (δ 0,1 δ) = 1 -0,851 + (50,15 - 50,ΙΟ) · — —
ид *1000
= 1 - 0,9155 = 0,0845 . Der Anteil der Bolzen mit einer Länge von über 50,15 mm beträgt approximativ 8,45%. Der Anteil der Bolzen mit einer Länge zwischen 49,742 mm und 50,258 mm ist die Differenz der entsprechenden Werte der approximierenden Verteilungsfunktion. F*(50,258) - F*(49,742) =
0,980 + (50,258 - 50,2θ) ·
19
0,1 · 1000
0,002 + (49,742 - 4 9,70)
26
0,1 · 1000
= 0,99102 - 0,01292 = 0,9781. Der Anteil der Bolzen mit einer Länge zwischen 49,742 mm und 50,258 mm beträgt approximativ 97,81%. Die Werte wären dann exakt, wenn eine Gleichverteilung der Bolzen innerhalb der Klassen vorläge. Es muß also die Annahme der Gleichverteilung der Bolzen innerhalb der Klassen getroffen werden. b) Aus den Klassenmittelwerten wird das arithmetische Mittel gebildet: 1 k χ = - Σ " i-1
·ηι
=
(50,05 · 500 + 49,97 · 1500 + 49,99 · 1000 + 50,04 · 2000) 5000 v ' = 50,01. Standardabweichung: 2 2 2 s _- s int + с ext s2
11
ν
k
2
int = Γ L· s i ' n i = ηi =1 1 (o,ll2 · 500 + 0,082 · 1500 + 0Д02 • 1000 + 0Д22 · 2000) 5000 = 0,01089 ,
1 k 2 Sext = - Σ (*i - *) ' "i " i=l = ^ ^ |(50,05 - 50,Ol)2 · 500 + (49,97 - 50,Ol)2 · 1500 + + (49,99 - 50,Ol)2 · 1000 + (50,04 - 50,Ol)2 · 2000| = 0,00108 ,
4. Ergänzungen
407
s2 = 0,01089 + 0,00108 = 0,01197 , s =
= 0,1094075 .
Für alle mit den vier Maschinen an dem betrachteten Tag produzierten Bolzen ergibt sich ein Mittelwert von χ = 50,01 mm und eine Standardabweichung von s = 0,1094 mm. Die Ergebnisse sind exakt, weil die Klassenmittelwerte und die Klassenstandardabweichungen exakt vorgegeben sind bzw. aus den Einzelwerten berechnet wurden.
Aufgab« 3.3 Um herauszufinden, wie sich die Präsentation statistischer Ergebnisse auf die Bereitschaft von Unternehmen auswirkt, einen Zulieferer mit der Lieferung eines bestimmten Produkts zu beauftragen, wurden 200 Unternehmen die folgenden beiden Texte vorgelegt: 1. "Die Ausfallrate eines Bauteils konnte durch die Verwendung des Produkts ZI von 1,5% auf 1,2% verringert werden. Die Reduktion von 0,3 Prozent war statistisch signifikant." 2. "Die Verwendung des Produkts Z2 führte zu einer Abnahme der Ausfallrate eines Bauteils um 20%. Die Reduktion war statistisch signifikant." 190 der befragten Unternehmer würden das Produkt Z2 einsetzen. Wie würden Sie entscheiden? Warum? Löaqng 3.3 Die beiden Produkte sind gleichwertig! Die Formulierung in Text 1 bezüglich der Reduktion ist falsch. Eine Veränderung in Prozentpunkten (0,3 Prozentpunkte) wird fälschlicherweise mit einer prozentualen Veränderung gleichgesetzt . Durch die Verwendung von Produkt ZI konnte die Ausfallrate um 1
12%
0 012
— = 1 = 1 - 0,8 = 0,2 = 20% verringert werden. Die 1,5% 0,015 Reduktion der Ausfallrate ist demnach bei beiden Produkten gleich groß.
408
4. Ergänzungen
Zu FS, Kapitel 5: Mafia und Verfahren zur Charakterisierung zweidimensionaler Häufigkeitsverteilungen Aufgabe 5.1 Der Korrekturaufwand für eine Diplomvorprüfungsklausur hängt im wesentlichen von der Anzahl der Klausurteilnehmer ab. Die Assistenten des Lehrstuhls für Statistik versuchen, diesen Aufwand mit Hilfe eines geeigneten Modells abzuschätzen. Es ist bekannt, daß die angehenden Wirtschaftswissenschaftler und Wirtschaftsinformatiker i.d.R. in ihrem ersten Fachsemester einen Leistungsnachweis im Fach "Mathematik für Wirtschaftswissenschaftler I" zu erwerben versuchen, bevor sie nach dem dritten Fachsemester zur Diplomvorprüfung im Fach "Statistik" antreten. An dieser Diplomvorprüfung nehmen auch die angehenden Soziologen teil, die den Leistungsnachweis in "Mathematik I" nicht erbringen müssen. Die Vermutung liegt nahe, daß zwischen der Anzahl der Klausurteilnehmer in "Mathematik I" und der Anzahl der Teilnehmer an der Diplomvorprüfungsklausur im Fach "Statistik" ein Jahr später ein Zusammenhang besteht. Dieser Zusammenhang soll durch ein lineares Modell beschrieben werden. Für die vergangenen Jahre liegen die folgenden Daten vor. Scheinklausur Mathematik I
Diplomvorprüfung im Fach Statistik
Semester
Anzahl der Teilnehmer
Semester
Anzahl der Teilnehmer
WS 85/86
304
WS 86/87
257
WS 86/87
461
WS 87/88
403
WS 87/88
608
WS 88/89
484
WS 88/89
664
WS 89/90
523
WS 89/90
399
WS 90/91
386
WS 90/91
515
WS 91/92
449
a) Bestimmen Sie zunächst die Merkmalsträger, die Merkmale und Merkmalstypen! Geben Sie ein Beispiel für einen Merkmalsträger ! b) Berechnen und interpretieren Sie für das oben beschriebene Modell die Parameter einer sinnvollen ausgleichenden Regressionsgeraden! Welche inhaltliche Bedeutung könnte die Regressionskonstante haben, wenn zu Recht unterstellt werden kann, daß die ausgleichende Regressionsgerade für alle Werte des unabhängigen Merkmals, die > 0 sind, gültig ist? c) Berechnen Sie ein geeignetes Zusammenhangsmaß und interpretieren Sie die Stärke des Zusammenhangs!
409
4. Ergänzungen d)
Mit Hilfe des aufgestellten linearen Modells soll der Korr e k t u r a u f w a n d für d i e S t a t i s t i k - D i p l o m v o r p r ü f u n g n a c h d e m W S 9 2 / 9 3 a b g e s c h ä t z t w e r d e n . A n d e r K l a u s u r in " M a t h e m a t i k I" n a c h d e m W S 9 1 / 9 2 h a b e n 435 K a n d i d a t e n t e i l g e n o m m e n . Für die Korrektur einer Diplomvorprüfungsklausur im Fach " S t a t i s t i k " w i r d e i n e K o r r e k t u r z e i t z w i s c h e n 50 u n d 70 M i n u t e n b e n ö t i g t . In w e l c h e m I n t e r v a l l l i e g t d i e g e s a m t e K o r rekturzeit? W e l c h e A n n a h m e m ü s s e n Sie treffen, um die Ber e c h n u n g d u r c h f ü h r e n zu k ö n n e n ?
Lösung
5.1
a) M e r k m a l s t r ä g e r : P a a r e v o n P r ü f u n g e n " M a t h e m a t i k d i p l o m Statistik zwei Semester später";
I und
Vor-
M e r k m a l e : A n z a h l d e r T e i l n e h m e r a n e i n e r M a t h e - K l a u s u r (X), Anzahl der Teilnehmer an der Statistik-Klausur zwei Semester s p ä t e r (Y); M e r k m a l s t y p : j e w e i l s m e t r i s c h . B e i s p i e l für e i n e n M e r k m a l s t r ä g e r : D a s P a a r " K l a u s u r in M a the I im WS 85/86 und Klausur in Statistik im WS 86/87". b)
Sinnvolle Regressionsgerade Y(X) = a 0 + a ^ a0
= у - a ^
ax = — j Sx
ist
(nur):
mit (der R e g r e s s i o n s k o n s t a n t e n )
(dem
und
Regressionskoeffizienten).
Arbeitstabelle: i-tes Paar von Klausuren
x
i
У±
1 2 3 4 5 6
304 461 608 664 399 515
257 403 484 523 386 449
92416 212521 369664 440896 159201 265225
Σ
2951
2502
1539923
Daraus ergibt
ή
xf
66049 162409 234256 273529 148996 201601 1086840
χ
ίΥί
78128 185783 294272 347272 154014 231235 1290704
sich:
1 1 χ = - X Xi = - · 2 9 5 1 = 491,8333 , n 6 i=i 1 n 1 У = - Σ У± = 7 ·2 П 6 i=l
5 0 2
= 417,0000,
1 n 1 s | = - X x? - χ 2 = - · 1 5 3 9 9 2 3 - 491,83333 2 = η 6 i-i
14753,8056,
4. Ergänzungen
410
1 n XY = Σ n i=i
S
a, 1 =
1 - xy = -6 · 1290704 - 205094 = 10022,8333,
10022,8333 = 0,6793 und 14753,8056
a 0 = 417,0 - 0,6793 · 491,8333 = 82,8785. Interpretation: ax:
Für einen zusätzlichen Teilnehmer an der Klausur in "Mathe I" gibt es zwei Semester später im Durchschnitt rund 0,68 zusätzliche Teilnehmer an der Diplomvorprüfungsklausur im Fach "Statistik".
a 0 : Die Regressionskonstante a0 kann i.a.R. nur dann sinnvoll interpretiert werden, wenn der Stützbereich (des unabhängigen Merkmals) den Wert 0 einschließt. Wird zu Recht angenommen (vgl. Teilaufgabe b) ) , daß die Regressionsgerade auch für χ = 0 gilt, dann bedeutet a 0 = 83, daß bei 0 Teilnehmern an der Mathe-Klausur dennoch rund 83 Studierende an der Statistik-Klausur zwei Semester später teilnehmen. Inhaltlich könnte das bedeuten (vgl. Aufgabentext), daß im Mittel an einer VD-Klausur im Fach "Statistik" rund 83 angehende Soziologen und Politologen teilnehmen. c) Ein geeignetes Zusammenhangsmaß für die Richtung und die Stärke eines linearen Zusammenhangs zwischen metrischen Merkmalen ist der Korrelationskoeffizient nach BRAVAIS/PEARSON:
Mit s XY = 10022,8333 , s x = 4 sY r =
ι Л, Σ У1 - У 2 = iTi = 85,1529 ergibt =
n
753,8056 = 121,4652 ,
ι ~ •2502 6 sich
4172
= 7251,00 und
10022,8333 : = 0,9690 . 121,4652 · 85,1528
Wegen -1 < r < +1 ist der lineare Zusammenhang zwischen den beiden Merkmalen positiv und wegen 0 < r 2 = 0,939 < 1 ist er sehr stark ausgeprägt. Rund 94% der Varianz des abhängigen Merkmals Y werden durch die Regressionsgerade, d.h. durch die lineare Beziehung zwischen den beiden Merkmalen erklärt. d) Gesucht ist zunächst: Y (x = 435) = 82,8785 + 0,67 93 • 435 = 378,374 . Für die Diplomvorprüfungsklausur im Fach 92/93 ist mit 379 Teilnehmern zu rechnen.
Statistik
im
WS
4. Ergänzungen
411
Die zur Korrektur dieser Klausuren erforderliche Zeit wird zwischen 50-379 = 18950 min = 316 h und 70-379 = 26530 min = 442 h liegen. Voraussetzung für diese Abschätzung ist, daß das lineare Modell, d.h. die oben aufgestellte Regressionsgleichung, auch für das WS 92/93 gilt. M.a.W., das WS 92/93 muß im Geltungsbereich des linearen Modells liegen. Aufgabe 5.2 Brause arbeitet in einer Fabrik, die unter anderem Doppelkekse mit Schokoladencremefüllung herstellt. Seine Aufgabe besteht in der Zubereitung und dem Abschmecken der Schokoladencreme. Für den Geschmack der Creme ist der Kakaoanteil entscheidend. Da von Tag zu Tag erhebliche Geschmacksunterschiede bei den produzierten Keksen auftreten und Brause bekanntermaßen gerne und ausgiebig dem Bier zuspricht, vermutet A. Feuerblick, Qualitätsinspektorin, einen Zusammenhang zwischen der von Brause am jeweiligen Vorabend getrunkenen Menge Bier und dem Kakaoanteil der Schokoladencreme am darauffolgenden Tag. Um diesem auf die Spur zu kommen, ermittelt sie an sieben Tagen die Anzahl der von Brause am Vorabend geleerten Seidia1 Bier und den Kakaoanteil der Schokoladencreme am folgenden Tag.
Tag
Anzahl der am Vorabend konsumierten Seidia Bier
1 2 3 4 5 6 7
2 5 0 1 3 4 6
Kakaoanteil der Schokoladencreme in % 6,4 2,8 11, 3 10, 1 5, 8 6, 5 2,9
a) Berechnen und interpretieren Sie die Parameter einer sinnvollen ausgleichenden Regressionsgeraden! b) Berechnen Sie ein geeignetes Zusammenhangsmaß und interpretieren Sie die Stärke des Zusammenhangs! c) Wieviel ganze Seidia Bier dürfte Brause bei Gültigkeit der linearen Beziehung höchstens trinken, wenn der Kakaoanteil im Mittel nicht unter 7% sinken soll?
1) Im Fränkischen gebräuchlicher diminutiver Ausdruck mit einem Fassungsvermögen von einem halben Liter.
für einen Bierkrug
412
4. Ergänzungen
d) Welcher Kakaoanteil ist gemäß der linearen Beziehung bei Genuß von zehn Seidia Bier zu erwarten, und wie ist dieses Ergebnis zu interpretieren? Lösung 5.2 Merkmalsträger: sieben Tage; Merkmale: Anzahl der konsumierten Seidia Bier (X, metrisch), Kakaoanteil der Schokoladencreme (Y, metrisch). a) Sinnvolle ausgleichende Regressionsgerade ist: Ϋ (x) = a0 + ajX mit a
o
=
—
У_
s
_ a
i
x
'
=
xy
—Г s
'
—
1
X =
ν
n
x
— X
-
n
V
' У =
1
-
n
v=i
V
L·, У ν ' V=1
n
1 1 = - X x v - X 2 und s xy = - £ x v y v - xy . П
v-l
П
v=l
Arbeitstabelle:
V
Xv
xvyv
Уу
x2v
y2v
1
2
6,4
12,8
4
2
5
2,8
14,0
25
40, 96 7,84
3
0
11,3
0,0
0
127,69
4
1
10,1
10,1
1
102,01
5
3
5,8
17,4
9
3 3 , 64
6
4
6,5
26,0
16
42,25
7
6
2,9
17,4
36
8,41
Σ
21
45,8
97,7
91
362,80
Daraus ergibt sich: 21 45,8 , 91 , Χ = γ = 3, y = — = 6,5429, Sx = — - 32 = 4 , 97,7 s XY = -γ- - 3 • 6,5429 = -5,6716, 1 а, = - 5,6716 = -1,4179 4 so daß
und
Y(x) = 10,7966 - 1,4179X ist. Das bedeutet:
an = 6,5429 + 1,4179 • 3 = 10,7966,
4. Ergänzungen
413
-
W e n n Brause am V o r a b e n d kein Bier g e t r u n k e n hat, dann hat die Schokoladencreme am Tag darauf einen durchschnittlic h e n K a k a o a n t e i l v o n r d . 1 0 , 8 % (a 0 ) ;
-
bei jedem zusätzlich konsumierten Seidia Bier sinkt der Kakaoanteil im Durchschnitt um rd. 1,4 Prozentpunkte Ui) .
b) E i n g e e i g n e t e s M a ß zur M e s s u n g d e r S t ä r k e Zusammenhangs ist das Bestimmtheitsmaß: r2
Mit
=
S
Ί
XY
S B
Υ
lsxsyJ 1
n
N
? /
s|
V
-У
2
Y
362,8 о - 6,5429 = 9,0190 = — —
Rechenergebnissen erhält τ
,
=
- 5,6716 2 4 · 9,0190
(linearen)
2 XY
Χ
V
eines
und
den
man
= 0,8916.
F a s t 90% d e r V a r i a n z d e s a b h ä n g i g e n M e r k m a l s Y w e r d e n d u r c h die lineare Regression erklärt. W e g e n 0 < r2 < 1 ist der lineare Zusammenhang zwischen den beiden Merkmalen "stark". c) Da d e r K a k a o a n t e i l i m M i t t e l n i c h t u n t e r 7% s i n k e n s o l l , ist x, d i e A n z a h l d e r S e i d i a , w i e f o l g t a u s d e r R e g r e s s i o n s g e r a den Y(X) = 10,7966 - 1,4179X 7 < 10,7966 - 1,4179X zu b e s t i m m e n . E s e r g i b t s i c h : χ < 2, 6 7 7 6 , so d a ß B r a u s e V o r a b e n d h ö c h s t e n s 2 (ganze) S e i d i a B i e r t r i n k e n d a r f . d) M i t χ = 10
am
ist
Υ ( ΐ θ ) = 10,7966 - 1,4179 · 10 = -3,3824. E i n n e g a t i v e r m i t t l e r e r K a k a o a n t e i l ist u n s i n n i g . 10 S e i d i a Bier liegen außerhalb des Geltungsbereichs des linearen Mod e l l s . Ü b e r d e n zu e r w a r t e n d e n m i t t l e r e n K a k a o a n t e i l l a s s e n sich daher keine Aussagen machen.
Aufgabe
5.3
E i n W a s c h m a s c h i n e n h e r s t e l l e r w i r b t für e i n e s s e i n e r Produkte u.a. damit, daß sich die Schleuderdrehzahl der Waschmaschine z w i s c h e n 600 u n d 1500 U m d r e h u n g e n p r o M i n u t e (U/min) i n A b s t ä n d e n v o n 100 U / m i n e i n s t e l l e n l ä ß t . V o n d e r S c h l e u d e r d r e h z a h l e n t s c h e i d e n d a b h ä n g i g i s t d e r T r o c k n u n g s g r a d d e r W ä s c h e . Der H e r s t e l l e r w i l l d e n T r o c k n u n g s g r a d in A b h ä n g i g k e i t von der S c h l e u d e r d r e h z a h l abbilden. Der T r o c k n u n g s g r a d der Wäsche wird
414
4. Ergänzungen
dabei durch deren Restfeuchtegehalt nach dem Schleudern gemessen. Gewaschen werden Handtücher, die im trockenen Zustand 4 kg und im nassen, d.h. ungeschleuderten Zustand 8 kg wiegen. Bei vier Waschvorgängen mit verschiedenen Schleuderdrehzahlen ergaben Messungen des Gewichts der Handtücher nach dem Schleudern folgendes Ergebnis.
Schleuderdrehzahl [U/min]
Gewicht der Handtücher nach dem Schleudern in kg
600
5, 84
900
5,52
1200
5, 32
1400
5,24
a) Im nassen, d.h. ungeschleuderten Zustand wiegt die Wäsche 8 kg, und ihr Restfeuchtegehalt beträgt 100%, im trockenen Zustand wiegt sie 4 kg, und ihr Restfeuchtegehalt beträgt 0%. Bestimmen Sie unter Berücksichtigung dieser Angaben zunächst den Restfeuchtegehalt der Wäsche in Prozent bei den angegebenen Schleuderdrehzahlen! b) Berechnen Sie mit den Ergebnissen aus Teilaufgabe a) und ausgehend von den Schleuderdrehzahlen 0, 600, 900, 1200 und 1400 die Parameter der ausgleichenden Regressionsgeraden, die den Zusammenhang zwischen der Schleuderdrehzahl und dem Restfeuchtegehalt der Wäsche beschreibt! Interpretieren Sie die berechneten Parameter! Bei der Interpretation des Steigungsparameters der Regressionsgeraden ist zu berücksichtigen, daß sich die Schleuderdrehzahl der Waschmaschine nur in Abständen von 100 U/min variieren läßt. c) Bestimmen und interpretieren Sie den Wert einer geeigneten Maßzahl zur Beschreibung der Güte der linearen Beziehung zwischen der Schleuderdrehzahl und dem Restfeuchtegehalt! d) Welcher Restfeuchtegehalt und welches Gewicht der Handtücher ergibt sich bei Gültigkeit der linearen Beziehung bei einer Schleuderdrehzahl von 1000 ö/min? Nehmen Sie zu dem berechneten Wert kurz Stellung! e) Auf welche Schleuderdrehzahl muß man die Waschmaschine mindestens einstellen, um bei Gültigkeit der linearen Beziehung einen Restfeuchtegehalt der Wäsche von höchstens 36,5% zu erreichen? f) Bei welcher Schleuderdrehzahl wäre gemäß der ziehung die Wäsche vollständig trocken?
linearen
Be-
4. Ergänzungen
415
Iiöaong 5.3 Merkmalsträger: Waschvorgänge, Merkmale a)
Schleuderdrehzahl (metrisch), Restfeuchtegehalt in % (metrisch)
G sei das Gewicht der Handtücher nach dem Schleudern in kg. G -4 - · 100% .
Y =
b)
X: Y:
Schleuderdrehzahl [U/min]
Gewicht der Handtücher nach dem Schleudern in kg
Restfeuchtegehalt in %
600 900 1200 1400
5, 84 5, 52 5, 32 5,24
46 38 33 31
— / \ Y (XJ = a0 + аг · X mit
О уγ = — γ - und a0 = у - а1 · χ s2x 1 А У = ;n Е У У / v=1
1 А χ = - Σ χ ν 11 ν=1 1 n 2 sX = - Σ (x v - x ) n
°der
s
v=l
v=l
1 n S x x XY = ~ n Σ ( v - ) (yv - у) v=1 Arbeitstabelle: V 1 2 3 4 5 Σ
xv 0 600 900 1200 1400 4100
yv
672400 48400 6400 144400 336400 1208000
4100 χ = — — = 820, Ь 7
six = s XY =
1208000 = 241600 5 - 58560
1 n Sxy = -n Σ хуУу V=1
Oder
Xy
(xv - χ)2
100 46 38 33 31 248
1 n x = ~П Σ xv - X 2 / x
У •
(xv - x)(yv - y)
ХуУу
-41328 792 -928 -6308 -10788 -58560
0 27600 34200 39600 43400 144800
0 360000 810000 1440000 1960000 4570000
248 у = — = 49,6, Э oder
2 si
= -11712 oder s XY =
4570000 5 144800
л
2
820z = 241600 ,
820 · 49,6 = -11712,
4. Ergänzungen
416
a
- 11712 i = >>л-,гпп = -0,04848, a 0 = 49,6 + 0,04848 · 820 = 89,35. 241600
Erhöht man die Schleuderdrehzahl um 100 U/min, dann nimmt der Restfeuchtegehalt der Wäsche im Durchschnitt um 4,8 Prozentpunkte ab. Aus dem linearen Modell ergibt sich ein Restfeuchtegehalt von 89,35% für ungeschleuderte Wäsche. Dieser Wert ist unrealistisch, da für die ungeschleuderte Wäsche der Restfeuchtegehalt von 100 % festgelegt wurde. c) Eine geeignete Maßzahl zur Beschreibung der Güte der linearen Beziehung ist das Bestimmtheitsmaß s2 2 XY r = —2 γ ; dabei ist sx · sy n
2 4 =1 -ν=1Σ (yv У)
n
oder
41 ν=1 = ~ Σ У ν - У2·
П
η
Arbeitstabelle: V
Уу
(Уу - У)2
1
100
2540,16
2
46
3
38
134,56
1444
4
33
275,56
1089
5
31
345,96
961
Σ
248
3309,20
15610
, 3309,2 Sy = j—^ = 661,84
oder
2 r =
12, 96
2
15610 = —
Уу 10000 2116
, 49,62 = 661,84 .
(- 11712)2 241600 · 661,84
= 0,8579 .
85,79% der Varianz des Restfeuchtegehalts werden durch das lineare Modell erklärt. Daher liegt eine relativ stark ausgeprägte lineare Beziehung zwischen der Schleuderdrehzahl und dem Restfeuchtegehalt der Wäsche vor. d) Durch Einsetzen in die Gleichung der Regressionsgeraden erhält man Y(1000) = 89,35 - 0,04848 · 1000 = 40,87, G(lOOO) = 4 + 4 · 0,4087 = 5,6348. Gemäß der linearen Beziehung ergibt sich ein Restfeuchtegehalt von 40,87% und damit ein Gewicht von 5,63 kg bei einer Schleuderdrehzahl von 1000 U/min. Diese Werte widersprechen
4. Ergänzungen
417
den vorliegenden Daten, weil bereits bei 900 U/min der Restfeuchtegehalt schon 38% bzw. das Gewicht 5,52 kg beträgt. e) Durch Einsetzen in die Gleichung der Regressionsgeraden erhält man Y(X) = 36,5 89,35 - 0,04848 · X = 36,5 36,5 - 89,35 ί X = —£ — = 1090,14 . - 0,04848 Man muß die Schleuderdrehzahl der Waschmaschine mindestens auf 1100 U/min einstellen, um bei Gültigkeit der linearen Beziehung einen Restfeuchtegehalt der Wäsche von höchstens 36,5% zu erreichen. f) Durch Einsetzen in die Gleichung der Regressionsgeraden erhält man
Y(X) = 0 89,35 - 0,04848 · X = 0 - 89,35 ί X = = 1843,03 . - 0,04848 Bei einer Schleuderdrehzahl von 1843,03 U/min wäre gemäß der linearen Beziehung die Wäsche vollständig trocken. Mit dem beschriebenen Gerät kann diese Schleuderdrehzahl allerdings nicht erreicht werden. Aufgabe 5.4 In einer wissenschaftlichen Untersuchung wird behauptet, daß sich durch den Aufenthalt im Krankenhaus der Intelligenzquotient der Patienten verändert. Es wird vermutet, daß der Intelligenzquotient mit länger werdendem Aufenthalt tendenziell abnimmt. Ein Doktorand der Medizin möchte diese Behauptung empirisch untersuchen. Hierfür wählt er zwanzig Patienten eines Krankenhauses aus und stellt mit deren Einwilligung und einem allgemein anerkannten Verfahren deren Intelligenzquotienten zu Beginn und zum Ende ihres Krankenhausaufenthalts fest. Durch seine Erhebung stehen ihm die auf der folgenden Seite angegebenen Daten zur Verfügung. Fassen Sie die zur Verfügung stehenden Daten zu einer Kontingenztabelle zusammen! Berechnen und interpretieren Sie eine geeignete statistische Maßzahl zur Beschreibung des vermuteten Zusammenhangs!
4. Ergänzungen
418
Liegezeit: 1 bis 3 Tage Veränderung des Intelligenzquotienten Zunahme Patient Nr.
10 6 20 19 4 15
Abnahme um 1 bis 5 Punkte
6 bis 10 Punkte
11 bis 20 Punkte
Uber 20 Punkte
• • • • • •
Liegezeit: 4 bis 7 Tage Veränderung des Intelligenzquotienten Abnahme um
Zunahme Patient Nr.
1 bis 5 Punkte
6 bis 10 Punkte
11 bis 20 Punkte
Uber 20 Punkte
•
17 9 7 14
• • •
Liegezeit: 8 bis 14 Tage Veränderung des Intelligenzquotienten Abnahme um
Zunahme Patient Nr.
1 bis 5 Punkte
12 13 18 16 8
•
6 bis 10 Punkte
11 bis 20 Punkte
Uber 20 Punkte
• • • •
Liegezeit: über 14 Tage Veränderung des Intelligenzquotienten Abnahme um
Zunahme Patient Nr.
2 3 5
1 bis 5 Punkte
6 bis 10 Punkte
11 bis 20 Punkte
• • • •
11 1
Uber 20 Punkte
•
4. Ergänzungen
419
Lösung 5.4 Merkmalsträger: 20 Patienten, Merkmale: Liegezeit im Krankenhaus (U), metrisch klassiert, Veränderung des Intelligenzquotienten (V) ' Ordinal. Ein geeignetes Zusammenhangsmaß für ordinale Merkmale bei Vorhandensein von Bindungen ist das Kontingenzmaß von GOODMAN/KRUSKAL γ. Kontingenztabelle: V
и
Zunahme
Abnahme um 1 bis 5 Punkte
Abnahme Abnahme um um 6 bis 10 11 bis 20 Punkte Punkte
3
2
1
2
2
1
2
Abnahme um über 20 Punkte
\
1 bis 3 Tage 4 bis 7 Tage 8 bis 14 Tage über 14 Tage
1
1 2
3
nk = 3·13 + 2·10 + 1·6 + 2·8 + 2·6 + 1·5 + 1·5 + 2·5 + 1·3 = 116 , nd = 1 · 7 + 1·3 + 2·1 = 12, nk - nri nk + n d
116 - 12 116 + 12
104 = 0,8125 . 128
Wegen -1 < γ < +1 besteht zwischen den beiden Merkmalen eine relativ stark ausgeprägte monoton positive Beziehung. Bei den untersuchten Patienten bewirkt demnach eine Zunahme der Liegezeit im Krankenhaus mit starker Tendenz eine Abnahme ihres Intelligenzquotienten. Aufgabe 5.5 Dem Hypochonder Brause ist folgendes zu Ohren gekommen: Der Arzt Dr. Buse behauptet, die häufige subkutane Verabreichung von Bienengift (z.B. in Form kontrolliert zugefügter Bienenstiche) reduziere die Häufigkeit von Erkältungen. Zur Untermauerung dieser These führt er ins Feld, daß Imker von allen Beruf sgruppen am seltensten von Erkältungen belästigt werden. Da Brause Ärzten grundsätzlich mißtraut, führt er in seinem Bekanntenkreis eine Vollerhebung durch. Hier ist das Ergebnis:
420
4. Ergänzungen
Häufigkeit der Erkältungen gering gemäß Selbstauskunft ->
mittel
hoch
Beruf 4Imker
8
4
1
Gerichtsvollzieher
8
5
6
Anlageberater
6
3
4
a) Berechnen Sie für beide Merkmale jeweils ein Lagemaß und ein Streuungsmaß! b) Berechnen Sie für obige Tabelle den Wert eines Zusammenhangsmaßes!
geeigneten
c) Nennen Sie Gründe, die für das folgende alternative Vorgehen sprechen: Die obige Tabelle wird zu der untenstehenden VierFelder-Tafel zusammengefaßt, für die GOODMAN/KRUSKALs γ berechnet wird. (Zur Erinnerung: Es soll überprüft werden, ob die These "Häufige Verabreichung von Bienengift senkt die Häufigkeit von Erkältungen" für Brauses Bekanntenkreis zutrifft.)
Häufigkeit der Erkältungen gemäß Selbstauskunft
gering bis mittel
hoch
Beruf i Imker
12
1
"Nicht-Imker"
22
10
Lösung 5.5 Merkmalsträger: Brauses Bekannte, Merkmale: Beruf / Häufigkeit der Erkältungen, Merkmalstyp: nominal (klassifikatorisch)/ordinal
(komparativ),
a) Lagemaß: Merkmal "Beruf". Da es sich um ein nominales Merkmal delt, kommt hier nur der Modus in Frage. Arbeitstabelle: i
Beruf
1 Imker
13
2 Gerichtsvollzieher
19
3 Anlageberater
13
han-
4. Ergänzungen
421
Kein einzelner Beruf ist in Brauses Bekanntenkreis so häufig vertreten wie der des Gerichtsvollziehers. Merkmal "Häufigkeit der Erkältungen". Das für ordinale Merkmale geeignete Lagemaß ist der Median. Arbeitstabelle: i
Häufigkeit
fi
Fi
1
gering
0,4889
0,4889
2
mittel
0,2667
0,7556
3
hoch
0,2444
1,0000
-
1,0000
Σ
Der Median des Merkmals "Häufigkeit der Erkältungen" ist "mittel", d.h. mindestens fünfzig Prozent von Brauses Bekannten sind mit mittlerer Häufigkeit oder seltener erkältet, und mindestens fünfzig Prozent sind mit mittlerer Häufigkeit oder öfter erkältet. Streuungsmaß: Merkmal "Beruf". Für nominale Merkmale gibt es hier zwei Möglichkeiten, erstens die Entropie und zweitens das Maß vom Typ HERFINDAHL. Entropie: 3
H(A) = - X ^ ld ^ . i=l ArbeitStabelie: i
ГЧ
fi
- ^ ld ^
1
13
0,2889
0,5175
2
19
0,4222
0,5252
3
13
0,2889
0,5175
45
1,0000
1,5602
Σ
Wegen 0 £ h ( a ) = 1,5602 < ld к = 1,585 liegt hier eine sehr hohe Streuung vor (nahezu eine Gleichverteilung). Ergänzung: Relative Entropie als Normierung der Entropie , . H(Ä) 1,5602 r(a) = = = 0,9844 . ld к 1,5850
422
4. Ergänzungen
Maß vom Typ HERFINDAHL: Arbeitstabelle:
i
fi
1
0,2889
0,0835
2
0,4222
0,1783
3
0,2889
0,0835
Σ
1,0000
0,3453
3
K H (A) = Σ fi = 0,3453 , i=l S h (A) = 1 - K h (A) = 0,6547. Wegen
0 < S H (A) = 0,6547 < 1 - - = 0,6 liegt hier к hohe Streuung vor (nahezu Gleichverteilung).
eine
sehr
Ergänzung: Normiertes Streuungsmaß , . к · S H (A) SH(A)„o™. = k _ ! =
3 · 0,6547 J "
0,9821
'
Merkmal "Häufigkeit der Erkältungen". Ein Streuungsmaß für ordinale Merkmale ist das Maß auf der Basis der Entropie. k-i . . S(u) = Σ Η ( Α : ) 5=1
mit
H(A3) = -(fj(1 Id fjA + fji2 Id fj(2), j = 1,2
к - 1.
Arbeitstabelle:
A
- fj,i ld fj(i
3
fjA
AL
0,5111
0,4950
A2
0,2444
0,4966
-
-
s(u) Wegen vor.
- fj/2 ld fj,2
H(Aj)
0,4889
0,5047
0,9997
0,7556
0,3051
0,8017
-
1,8014
fj,2
-
0 < S(u) = 1,8014 < к - 1 = 2
liegt
eine
hohe
Streuung
4. Ergänzungen
423
с) A l s Z u s a m m e n h a n g s m a ß ist e i n M a ß zu w ä h l e n , d a s f ü r d a s n i e d r i g e r e S k a l e n n i v e a u a n g e w e n d e t w e r d e n k a n n . In d i e s e m F a l l e a l s o e i n e s für n o m i n a l e M e r k m a l e . H i e r g i b t e s zwei Möglichkeiten, erstens den Assoziationskoeffizienten auf der Basis v o n χ2
und zweitens die
Assoziationskoeffizient
Σ Σ ^
i=ij=i n i. n .j
Transinformation.
auf der Basis v o n χ2 :
- 1
Arbeitstabelle: 1
j i
2
n
i.
\ 1
64
2
64
0,1026
36
"•j
0,1722
0,0577
0,1119
12
Die Felder im Inneren der T a b e l l e
Daraus ergibt sich für
13
16
9 0,1259
19
36 0,1096
22
13 0,0070
25 0,1531
3
1
16 0,2238
χ2
3
11
sind wie folgt
45
besetzt:
χ2:
= 45 · (θ,2238 + 0,1531 + ··· 0,1119 - l) = 45 · 0,0638 = 2,871 .
Wegen 0 < χ 2 < η · min{(k - l),(m - l)} = 45 · 2 = 90 liegt hier eine äußerst geringe statistische Abhängigkeit zwischen dem Beruf u n d der Häufigkeit der Erkältungen in Brauses Bekanntenkreis vor.
4. Ergänzungen
424
Ergänzung: Maß von CRAMER V =
Ι γ} I j—* γ = \ η • min{(k - l),(m - 1)}
/2,871
= 0,1786.
V 90
Transinformation: τ(α, в) = η(α) + Н(в) - η(α, в); dabei ist 3
3
h(a) = - Σ fi· l d fi. ' H(B) = - Σ f.j l d f.j i=l i=l 3
h(a,
und
3
Β) = -ΣΣΪ,
ld f
ij ·
i-lj=l Arbeitstabelle: 2
1
3
fi. ld f
y ^ f 1
0,178
0, 089 0,4432
2
0,178
0,111 0,4432
3
0, 133
·:
0,5253
0,3871 0, 089
0,2613 0,267
0,489
0,5176 0,422
0,133
0, 067
0,289
0,1211
0,3520
0,3871 f
0, 022
0,3106
i.
0,3106
0,289 0,5176
0,244 -
- f.j ld f.j
0,5047
0,5087
0,4966
Die Felder im Inneren der Tabelle sind wie folgt besetzt:
H(A) = 0,5176 + 0,5253 + 0,5176 = 1,5605, Н(В) = 0,5047 + 0,5087 + 0,4966 = 1,5100, H(A,B) = 0,4432 + ... + 0,3106 = 3,0162, t(A,B) = 1,5605 + 1,5100 - 3,0162 = 0,0543.
4. Ergänzungen
425
Wegen 0 < t(a,b) = 0,0543 < тл.п{н(А),н(в)} = 1,51 liegt hier eine sehr schwache statistische Abhängigkeit vor. Ergänzung: Für die normierte Transinformation ergibt sich: l I\ 0,0543 C(A,B|BJ = 1 5 1 = 0,036. c) -
Es geht um die Häufigkeit der Bienenstiche - hierin unterscheidet sich nur (so wird für die Aufgabe unterstellt) der Beruf des Imkers von den anderen Berufen. Daher lassen sich die "Nicht-Imker" zu einer Ausprägung zusammenfassen. Es wird (in der These) lediglich zwischen "häufiger" und "seltener" unterschieden. Zudem kann bei nunmehr zwei Berufen auch eine dritte Ausprägung bei den Häufigkeiten keinen Informationsgewinn bringen (wenn sich die Ausprägungen inhaltlich sinnvoll zusammenfassen lassen). Da alle Nicht-Imker zusammengefaßt werden, sind beide Merkmale ordinal (Häufigkeit der Bienenstiche, Häufigkeit der Erkältungen), γ läßt sich also berechnen.
Aufgabe 5.6 Ein Sozialwissenschaftler vermutet, daß ein Zusammenhang zwischen dem erreichten Ausbildungsniveau und dem monatlichen Nettoeinkommen als Berufsanfänger besteht. Eine Untersuchung bei hundert Personen führte zu folgendem Ergebnis: Qualifikation vor dem Hauptschul- Mittlere Abitur Berufseintritt —> abschluß Reife Nettoeinkommen als Berufsanfänger ^ unter 1.000 DM
10
7
3
1.000 DM bis 2.000 DM
17
33
20
über 2.000 DM
0
3
7
a) Stellen Sie die bedingten Verteilungen der Nettoeinkommen dar und interpretieren Sie zwei der von Ihnen berechneten Werte! b) Welches Problem entsteht bei der Charakterisierung der Nettoeinkommensverteilung durch das arithmetische Mittel? Nennen Sie zwei wichtige Lagemaße, die dieses Problem umgehen! Wie umgehen diese Maße dieses Problem? Welches dieser beiden Maße halten Sie hier für besser geeignet? Warum? (Es sind keine Berechnungen verlangt!)
426
4. Ergänzungen
с) M e s s e n S i e d i e S t ä r k e des s t a t i s t i s c h e n Hilfe einer geeigneten Maßzahl!
Lösung
mit
5.6
Merkmale: Nettoeinkommen Schulabschluß Merkmalsträger:
100
U:
Hauptschule,
U2:
Mittlere
U3:
Abitur,
(klassiert),
Reife,
Xi: b i s 1 0 0 0
DM,
X2:
1000 b i s 2 0 0 0
X3:
über 2000
DM,
DM.
Häufigkeitsverteilung: f
-(*ik) = V '
(U).
ordinal,
Uj:
Bedingte
(X),
Personen.
Merkmalstyp: X: metrisch
a)
Zusammenhangs
( X i' ü j) '/ г ' Ф:)
i': = г ' 2 ' 3 ·
Arbeitstabelle: i
f(xih)
ψί|"2)
φι|θ3)
1
— = 0,3704 27
— = 0,1628 43
— = од 30
2
17 — = 0,6296 27
33 — = 0,7674 43
20 ^^ — = 0,6 30
3
0
— = 0,0698 43
7 — = 0,23 30
Σ
1,0000
1,0000
1,0000
Interpretation der eingerahmten E t w a 63 P r o z e n t d e r H a u p t s c h ü l e r m e n z w i s c h e n 1000 u n d 2000 DM.
Werte: haben
ein
Einstiegseinkom-
4. Ergänzungen
10 P r o z e n t d e r A b i t u r i e n t e n h a b e n ein E i n s t i e g s e i n k o m m e n 1000 DM. b)
427
bis
X3 w ä r e w i l l k ü r l i c h zu s e t z e n . S e i n e W a h l h ä t t e E i n f l u ß a u f d e n W e r t v o n χ . Dieses P r o b l e m w i r d v o n M o d u s u n d M e d i a n u m g a n g e n . Zur B e r e c h n u n g b e i d e r M a ß e w e r d e n die A u s p r ä g u n g e n n i c h t v e r w e n d e t . Der M e d i a n ist h i e r b e s s e r g e e i g n e t , d a er I n f o r m a t i o n e n ü b e r die R a n g f o l g e d e r A u s p r ä g u n g e n verwertet.
c) Es ist e i n Z u s a m m e n h a n g s m a ß für o r d i n a l e M e r k m a l e zu w ä h len. In d i e s e m Fall e x i s t i e r e n B i n d u n g e n , a l s o w i r d das Kontingenzmaß von GOODMAN/KRUSKAL berechnet. - nd + nd
=
mit der Anzahl der konkordanten n
n k = Σ Σ ij · V ir] κ ι ,:'
und der Anzahl der diskordanten n
d = Σ
κι
Σ
n
Paare
Paare
ij · n i· ,· ·
n k = 10 · (33 + 20 + 3 + 7) + 7 · (20 + 7) + 17 · (3 + 7) + 33 · 7 = 10 · 63 + 7 · 27 + 17 · 10 + 33 · 7 = 630 + 189 + 170 + 231 = 1220 , nd
= 3 · (17 + 33 + 3) + 7 · (17) + 20 · (З) = 3 · 53 + 7 · 17 + 20 · 3 = 159 + 119 + 60 = 338 ,
ν = '
1220 - 338 1220 + 338
=
882 1558
= 0,57 .
W e g e n - 1 < γ = 0,57 < +1 liegt e i n m ä ß i g a u s g e p r ä g t e r , m o n o t o n n i c h t f a l l e n d e r Z u s a m m e n h a n g vor, d . h . m i t der S c h u l b i l d u n g s t e i g t t e n d e n z i e l l das N e t t o e i n s t i e g s e i n k o m m e n .
A u f g a b e 5.7 E i n S t r e i t p u n k t b e i d e r R e g i e r u n g s k o n f e r e n z der E u r o p ä i s c h e n U n i o n , die i m D e z e m b e r 2000 in N i z z a i h r e n A b s c h l u ß fand, w a r die S t i m m e n g e w i c h t u n g im Rat d e r E U bei a l l e n Fragen, die m i t q u a l i f i z i e r t e r M e h r h e i t e n t s c h i e d e n w e r d e n m ü s s e n . Im f o l g e n d e n
428
4. Ergänzungen
finden Sie die Anzahl der Stimmen und die Einwohnerzahl der einzelnen Mitgliedstaaten für die aktuelle Situation und die zukünftigen Verhältnisse nach dem Beitritt von 12 weiteren Staaten gegenübergestellt. EU-Mitglieder und ihre Stimmen im Rat der Europäischen Union Zukünftiger Stand gemäß dem Aktueller Stand Vertrag von Nizza (15 Mitgliedstaaten) (27 Mitgliedstaaten)
Deutschland Großbritannien Frankreich Italien Spanien Niederlande Griechenland Belgien Portugal Schweden Österreich Dänemark Finnland Irland Luxemburg
Einwohner Stimmen in Mio. 82,0 10 59, 3 10 59,0 57, 6 39, 4 15, 8 10, 5 10,2 10, 0 8,8 8,1 5,3 5,2 3,7 0,4
10 10 8 5 5 5 5 4 4 3 3 3 2
Deutschland Großbritannien Frankreich Italien Spanien Polen Rumänien Niederlande Griechenland Tschechien Belgien Ungarn Portugal Schweden Bulgarien Österreich Slowakei Dänemark Finnland Irland Litauen Lettland Slowenien Estland Zypern Luxemburg Malta
Einwohner Stimmen in Mio. 82, 0 29 59,3 29 59,0 57, 6 39,4 38,7 22,5 15, 8 10,5 10, 3 10,2 10, 1 10,0 8,8 8,2 8,1 5,4 5,3 5,2 3,7 3,7 2,4 2,0 1,4 0,8 0,4 0,4
29 29 27 27 14 13 12 12 12 12 12 10 10 10 7 7 7 7 7 4 4 4 4 4 3
a) Welche Werte nimmt GOODMAN/KRUSKALs γ als Maß für einen monotonen Zusammenhang zwischen der Anzahl der Stimmen und der Einwohnerzahl der Mitgliedstaaten jeweils an? (Hinweis: Zur Beantwortung dieser Frage ist das Erstellen von Kontingenztabellen nicht notwendig!)
4. Ergänzungen
429
b) Als Faustregel galt bisher, daß die Anzahl der Stimmen der einzelnen Staaten annähernd linear mit der Quadratwurzel der Einwohnerzahl wachsen sollte. Bestimmen Sie für die aktuelle und die zukünftige Situation im Europäischen Rat jeweils eine geeignete Regressionsgerade, und vergleichen Sie die Güte der beiden Geraden! c) Welche Bedingungen müßten die Parameter der Regressionsgeraden und das Bestimmtheitsmaß erfüllen, damit man von einer direkten Proportionalität zwischen den Größen "Anzahl der Stimmen" und "Quadratwurzel der Einwohnerzahl" sprechen könnte?
Lösung 5.7 Merkmalsträger:
Staaten der EU (15 bzw. 27);
Merkmale:
Einwohnerzahl in Mio. (X), Anzahl der Stimmen im Rat (Y);
Merkmalstyp:
jeweils metrisch.
a) Aus den Tabellen ist ersichtlich, daß die Länder sowohl nach Einwohnern als auch nach Anzahl der Stimmen absteigend sortiert sind. Es gibt also einen vollständigen (positiven) monotonen Zusammenhang zwischen diesen beiden Merkmalen, und zwar für die aktuelle wie auch für die zukünftige Situation im Rat der Europäischen Union. Damit gilt in beiden Fällen: γ = 1. b) Eine geeignete Regressionsgerade ist: у (Vx) = a 0 + aj^Vx , mit a 0 = у - aj^-v/x und a x = •
S2Л
Für die aktuelle Situation (n = 15) ergibt sich damit:
У =
=
15
87 15
=
-7= У Jx~ 64,826 Vi = = = 4,3217, 15 15 2 l^-i "7=2 S r = — · У Xi - Vx vx 15 ^
=
375,3 9 - 4,3217 15
η = ^ - IVir-yi-Vi-y ^ SV
Vx
=
7*923 6,3429
=
482 372 = — -
= 6,3429,
5,8 · 4,2317 = 7,0923 ,
430
4. Ergänzungen
a 0 = у - ax • -Ух = 5,8 - 1,1181 · 4,3217 = 0,9679. Regressionsgerade ist somit: y(Vx) = 0,97 + 1,12 · Vx . •
Für die zukünftige Situation
(n = 27) erhält man:
345 У = — = 12Л78, 27 η= 94,962 Vx = = 3,517, 27 Svx,y r = 2
12,778 . 3,517 = 20,346,
481^2 _ 27
=
a-i =
17 62 729 27-
г
=
54529
20,34 6 — = 3,731, 5,4529
a 0 = 12,778 - 3,731 · 3,517 = -0,344 Regressionsgerade ist somit:
y(Vx) = -0,34 + 3,73 · Vx .
Interpretation für die zukünftige Situation:
a 0 = -0,34: Ein Land mit 0 Einwohnern hätte -0,34 Stimmen zu erwarten. Diese Aussage ist unsinnig; zudem ist χ = 0 weit außerhalb des Stützbereichs. a-L = 3,73:
Pro 1000, um die die Quadratwurzel der Einwohnerzahl eines Landes größer ist als die eines anderen Landes, ist die Anzahl der Stimmen im Rat im Mittel um 3,73 größer.
Ein geeignetes Maß für die Güte der Regressionsgeraden das Bestimmtheitsmaß: r
2 _
Vx,y Sy vx ' У
•
Für die aktuelle Situation erhält man mit
Sy = ^ r2
=
Σ У2 - У 2 = ^ 7,0923*
_
· %
627
- 5'82
=
8
'16'
_
6,3429 • 8,16 •
Für die zukünftige Situation ergibt sich mit
ist
4. Ergänzungen
431
2 6541 , Sγ2 = = 12,По = 78,982, 27 2 τ =
2 0,3 4 62 = 96,12% . 5,4529 · 78,982
Beide Regressionsgeraden liefern also einen fast vollständigen linearen Zusammenhang zwischen der Anzahl der Stimmen im Rat und der Wurzel der Einwohnerzahl. Aktuell werden z.B. über 97% der Varianz der Anzahl der Stimmen über das lineare Modell durch die Wurzel der Einwohnerzahl erklärt. Dieser Wert verschlechtert sich in der zukünftigen Situation nur geringfügig! c) Direkte Proportionalität bedeutet, daß alle Punkte auf einer Ursprungsgeraden liegen. Bei direkter Proportionalität müßte daher an = 0 und r2 = 1 sein.
Zu FS, Kapitel 6: Bestands- und Bewegungsmassen Aufgabe 6.1 Für einen Artikel Α verfügt die Lagerverwaltung über folgende Daten: Lagerbestand Artikel А Quartal
Bestand Quartalsbeginn
Zugang im Quartal
1/1997
570 Stck.
2180 Stck.
11/1997
480 Stck.
3560 Stck.
III/1997
500 Stck.
2640 Stck.
IV/1997
310 Stck.
2780 Stck.
Die Inventur zum 31.12.1997 ergab einen Bestand von 570 Einheiten. Bestimmen Sie den Durchschnittsbestand und die mittlere Verweildauer in Monaten! Schätzen Sie die jährlichen Lagerkosten, wenn pro Stück monatliche Kosten in Höhe von 0,50 DM entstehen! Wieviel Lagerkosten entfallen im Durchschnitt auf ein Stück? Lösung 6.1 a) Da die individuellen Verweildauern unbekannt sind, kann unter den Annahmen keine Fehlmengen (erfüllt), - äquidistante Beobachtungszeitpunkte (erfüllt).
432
4. Ergänzungen
-
lineare Zu- und Abgänge (fraglich).
der Durchschnittsbestand mit Hilfe von
B0 n = ' me! ) .
geschätzt werden
η
(n=4 Zeiträu-
570 570 — + 480 + 500 + 310 + — 18б0 Βο,η = ^ = — = 465. 570 = 0,5 Уgilt: 2-570
Wegen λ = У 2Β
d =
0,η ' to,η
2 · 465 · 4 3720 = 2- — — — = —— = 0,1 6 Quartale = 0,5 Monate. o,n + o,n ' 11160 23320
z
A
Arbeitstabelle: Quartal
Bestand
Zugang
Abgang
1
570
2180
2270
2
480
3560
3540
3
500
2640
2830
4
310
2780
2520
5
570
-
-
Der geschätzte Durchschnittsbestand beträgt 465 Stück, die geschätzte mittlere Verweildauer 0,5 Monate. Lagerkosten pro Artikel und Monat: 0,5 DM. Für 4 65 Artikel und zwölf Monate ergeben sich Lagerkosten von 0,5 -12-465 = 2790 DM pro Jahr . Durchschnittliche Lagerkosten pro Artikel: -
0 Verweildauer · Kosten je Artikel = 0,5-0,5 = 0,25DM. 2790
- Alternativ:
DM Jahr
11160 — Jahr
nM
= 0,25
DM
st
.
'
Die Lagerkosten für 1997 betragen 2790 DM (geschätzt). Die durchschnittlichen Lagerkosten pro Artikel betragen dann 25 Pf.
4. Ergänzungen
433
Aufgabe 6 . 2 Der Bestand einer Artikelgruppe (A-Artikel) in einem Lager beträgt zum Jahresanfang 1800 Stück. Am Ende des jeweiligen Quartals werden 2400, 3000, 2800 und 3200 Stück gezählt. a) Wie viele A-Artikel befanden sich durchschnittlich auf Lager? Auf wieviel DM belaufen sich die jährlichen Lagerkosten für die A-Artikel, wenn pro Artikel und Monat 0,128 DM Lagerkosten berechnet werden? b) Am Jahresende wird die durchschnittliche Lagerzeit der AArtikel mit 5 Tagen angegeben! Bestimmen Sie den Zugang und Abgang an A-Artikeln während des Jahres! (1 Jahr = 365 Tage)
Lösung 6 . 2 a) Die Voraussetzung B0, B n > 0 ist erfüllt. Die Beobachtungszeitpunkte sind äquidistant. Unter der Annahme einer linear approximierten Zu- und Abgangsfunktion läßt sich der Durchschnittsbestand schätzen. B0 B4 — + B, + B, + B·, + — 1 2 3 в, --2 '0,4 4 =
900 + 2400 + 3000 + 2800 + 1600 = 2675. 4
Bei diesem Durchschnittsbestand an A-Artikeln betragen die jährlichen Lagerkosten für diese Artikelgruppe
, , -τ b) d =
B
o,4 ' ten λ · Z0#4 + (1 - λ) · A0>4 '
B0 + Z0>4 - A0j4 = B4 , A
0,4 = Z0,4 ~ (B4 ~ Βθ)' B
d =
0,4 ' tp,4 λ · Z0,4 + (1 - λ) · z0(4 - (1 - λ) · (в4 - B 0 ) B
0,4 - tp,«
Z0>4 - (1 - λ) · (в4 - B 0 ) ' z0(4 - (1 - λ) · (в4 - B 0 ) = z0(4 =
+
D
α - λ). (в4 - Во).
434
4. Ergänzungen
λ wird geschätzt durch λ = 0,4 ' ^0,4 ί В0 = — я — + [i - i ^ J
B0 — B 0 + В4 Ι ( \ · (в, - в„)
2675 · 365 ( 1800 800 + 11 5: V 1800т ш = 195275 + 896 = 196171
Z0,4 =
^ )
. ·
(
3
2
0
0
-
1
8
0
0
)
А0>4 = 196171 - (3200 - 1800) = 194771 . Der Zugang an A-Artikeln betrug im betrachteten Jahr 196171 Stück und der Abgang 194771 Stück.
Zu F S , Kapitel 7: Zeitliche M e B z a h l e n , Indizes, kraftpari täten
Kauf-
Aufgabe 7.1 Die beiden folgenden Meßzahlenreihen beschreiben die Entwicklung des bundesdeutschen Exportwerts in den Jahren 1981 bis 1990. Bezugszeit der ersten Meßzahlenreihe ist das Jahr 1981; für die zweite Meßzahlenreihe wurde das Jahr 1987 als Bezugszeit gewählt. Jahr
Meßzahl
Jahr
Meßzahl
1981
1,0000
1985
1,0186
1982
1,0777
1986
0,9981
1983
1,0891
1987
1,0000
1984
1,2301
1988
1,0764
1985
1,3534
1989
1,2155
1986
1,3262
1990
1,2188
a) Bestimmen Sie für jedes Jahr des Zeitraums 1982 bis 1990 die prozentuale Veränderung des bundesdeutschen Exportwerts gegenüber dem Vorjahr! b) Berechnen Sie die Meßzahl für das Wachstum des bundesdeutschen Exportwerts zwischen 1983 und 1990! c) Berechnen Sie die durchschnittliche jährliche Wachstumsrate für den gesamten Beobachtungszeitraum von 1981 bis 1990! d) Im Jahr 1981 betrug der Wert der bundesdeutschen Exporte 396.898 Mio. DM. Berechnen Sie mit Hilfe der gegebenen Meßzahlen für jedes Jahr im Zeitraum 1982 bis 1986 den Wert der bundesdeutschen Exporte!
4. Ergänzungen
435
Lösung 7.1 a) Gesucht sind Meßzahlen mit variabler Bezugszeit (Vorjahr): xt Mt-i,t = > t=2, 3, . . ., η. *t-i können aus den gegebenen Meßzahlen mit konDiese Meßzahlen stanter Bezugszeit durch Umbasieren bestimmt werden: M
Mt- i,t
t0,t M•tJt0,t-1
Die prozentuale Veränderung des bundesdeutschen Exportwerts gegenüber dem Vorjahr ergibt sich aus (Mt_1 V M
= n"^/Mti,tn -
89,94
=
1
=
89,94 -
1
=
V
1
'
1 5 3 4
-
1
= 0Ό29, mit
M
89,90 ' M90,91 ' M91,92 ' M92,93 ' M93,94 = 1,021 · 1,019 • 1,028 · 1,032 · 1,045 = 1,1534 .
Die gesamte Preissteigerung von 1989 bis 1994 betrug 15,34% und die durchschnittliche jährliche Preissteigerung 2,9%.
438
4. Ergänzungen
b) Preisindex nach LASPEYRES (Ausgabenanteile der fünf Güter in der Bezugsperiode 1993): ^ Ρ* LPt0,t
=
9j,t0 mit den Gewichten: gj>t
•
j=i Pit0
=
Ρ* 4* ' ^ — ] tp
k
Σ
Pi,t 0 M 0 > 7
1,1699 · (1 + x)3 > 1,4368 ,
1,4368
43
(1 +
X)
-
1 + χ >
1Д699 1,2281 = 1,071.
D e r zu v e r h a n d e l n d e Z i n s s a t z m u ß a l s o m i n d e s t e n s 7,1% pro Jahr b e t r a g e n , damit die B u n d e s s c h a t z b r i e f e nicht die b e s s e re A l t e r n a t i v e sind.
446
4. Ergänzungen
4.2 Schließende Statistik Zu FS, Kapitel 10: Grundlagen der Wahrscheinlichkeitstheorie Aufgabe 10.1 Zum Streichen seiner neuen Wohnung kauft der Assistent M.E. nicht die feste Farbe bei Farben-Leicht, sondern eine billige Dispersionsfarbe aus dem Sonderangebot von OBI. In seiner Wohnung wird ein in ideeller Hinsicht wertvoller, kreisrunder Teppich mit einer im selben Baumarkt erworbenen quadratischen Plastikplane abgedeckt.
Beim Streichen der Zimmerdecke treten folgende Probleme auf: Die Plane erweist sich für ihren Zweck als zu klein. erreicht mit ihren Ecken gerade den Teppichrand.
Sie
Die Farbe tropft von der Decke! Mit welcher Wahrscheinlichkeit trifft ein Tropfen Farbe, der sich senkrecht über dem Teppich von der Zimmerdecke löst, auf die freiliegenden Teile des Teppichs? Gehen Sie bei Ihrer Berechnung davon aus, daß sich der Tropfen an jeder beliebigen Stelle über dem Teppich von der Zimmerdecke lösen kann!
Lösung 10.1 Kreisfläche: К = r2 · π ; Fläche der Plane (Quadrat): Q = s 2 , dabei ist s die Seitenlänge. Nach dem Satz von Pythagoras (a2 + b 2 = с 2 ) ist 2 s2 = (2 r)2 also s2 = 2 r2 = Q . Somit ist К - Q = (π - 2)r2 die Fläche des Teppichs, auf die zufällig ein oder mehrere Tropfen Farbe fallen können.
4. Ergänzungen
447
Die Wahrscheinlichkeit dafür, daß ein Tropfen Farbe auf die freiliegenden Teile des Teppichs trifft, ist gleich dem entsprechenden Flächenanteil, also К - Q _ (π - 2)r2
π -2
Aufgabe 10.2 Ein Unternehmer verkauft sein Produkt an zwei verschiedenen Orten (Α-Stadt und B-Stadt). Aufgrund von Marktuntersuchungen schätzt er seine Absatzchancen für jeden beliebigen Tag außer Sonntag (im weiteren "Geschäftstag") durch folgende Wahrscheinlichkeitsfunktionen ab. A-Stadt: Absatz [Stück]
0
1
2
3
Wahrscheinlichkeit
0,05
0,10
0, 65
0,20
B-Stadt: Absatz [Stück]
0
1
2
Wahrscheinlichkeit
0,10
0, 80
0,10
Die Absatzzahlen in den beiden Städten sind voneinander unabhängig. a) Der Unternehmer möchte gerne wissen, welche mittlere geschäftstägliche Verkaufszahl er für jede der beiden Städte auf lange Sicht erwarten kann. Beantworten Sie ihm diese Frage! b) Weiterhin ist der Unternehmer an einer aggregierten Betrachtung interessiert. Ermitteln Sie die Wahrscheinlichkeiten dafür, daß an einem Geschäftstag in beiden Städten zusammen kein, ein bzw. zwei Stück verkauft werden! (Falls Sie diese Aufgabe nicht lösen können, nehmen Sie im folgenden an, daß jede der möglichen Absatzzahlen gleichwahrscheinlich ist!) c) Der Artikel wird zu 100,- DM/Stück verkauft. Der Unternehmer hat in beiden Städten zusammen fixe Kosten von 100,DM/Geschäftstag (d.h. diese Kosten entstehen unabhängig vom Absatz). In Abhängigkeit vom Absatz entstehen weitere Kosten von 50,- DM/Stück. Wie groß ist die Wahrscheinlichkeit, daß der Unternehmer an einem beliebigen Geschäftstag Gewinn (größer als 0,00 DM) macht? Lösung 10.2 Definition der Zufallsvariablen.·
448
4. Ergänzungen
X A = Absatz in Stück in Α-Stadt an einem zufällig ausgewählten Geschäftstag, X B = Absatz in Stück in B-Stadt an einem zufällig ausgewählten Geschäftstag. a) Die mittleren Verkaufszahlen ergeben sich als Erwartungswerte dieser Zufallsvariablen: E(Xa) = 1 · 0,1 + 2 · 0,65 + 3-0,2 = 0,1 + 1,3 + 0,6 = 2 , E(xb) = 1 · 0,8 + 2 · 0,1 = 1. Die langfristige mittlere geschäftstägliche Absatzzahl für Α-Stadt beträgt 2 Stück und für B-Stadt 1 Stück. b) Sei die Zufallsvariable X der Absatz in Stück an einem zufällig ausgewählten Tag in beiden Städten zusammen: X = XA + XB. Da die Absatzzahlen in beiden Städten lt. Angabe voneinander unabhängig sind, sind die Zufallsvariablen stochastisch unabhängig und es gilt: p(xA = x A η X B = x B ) = p(xA = x A ) · p(xB = x B ) . Die gesuchten Wahrscheinlichkeiten folgt ermitteln:
lassen
sich
damit
wie
ρ(χ = o) = p(xA = 0 η X B = o) = K x a = o) · p(xB = o) = 0,05 · 0,1 = 0,005 , Wegen disjunkter Ereignisse ist p(x = l) = p([xA = ο η X B = l] υ [xA = 1 η x B = o]) = p(xA = o) · p(xB = l) + p(xA = l) · p(xB = o) = 0,05 · 0,8 + 0,1 · 0,1 = 0,05 und p(x = 2) = p([xA = 0 η X B = 2] и [xA = 1 η x B = l] υ [xA = 2 η xB = 0]) = p(*A = 0) · p(xB = 2) + p(xA = 1) · p(xB = 1) + p(xA = 2) · p(xB = 0) = 0,05 · 0,1 + 0,1 · 0,8 + 0,65 · 0,1 = 0,15 . Die Wahrscheinlichkeiten für einen Gesamtabsatz oder 2 Stück betragen 0,5%, 5% und 15%.
von
0, 1
c) Zunächst ist die Mindestanzahl an verkauften Artikeln zu ermitteln, die für einen Gewinn des Unternehmers nötig ist:
4. Ergänzungen
449
Gewinn = Erlös - Kosten Erlös
= 100 X,
Kosten
= 100 + 50 X,
Gewinn
= 100 X - (100 + 50 X).
Forderung:
Gewinn = 100 X - 100 - 50 X > 0 50 X > 100 X > 2.
Es müssen also mehr als zwei Artikel pro Geschäftstag verkauft werden. p(Gewinn > θ) = p(x > 2) = 1 - p(x < 2) = 1 - [p(x = 0) + p(x = 1) + p(x = 2)] = 1 - (0,005 + 0,05 + 0Д5) = 1 - 0,205 = 0,795 . Die Wahrscheinlichkeit für einen Gewinn beträgt 7 9,5%.
Zu FS, Kapitel 11: Zufallsvariable und eindimensionale Wahrscheinlichkeitsverteilungen Aufgabe 11.1 Geben Sie einige Beispiele für linkssteile empirische Häufigkeitsverteilungen, deren Wertebereich größer als Null ist, und die gegebenenfalls durch eine Lognormalverteilung approximiert werden können! Für die empirische Einkommensverteilung einer bestimmten Personengruppe ist χ = 2680 DM der Mittelwert und s2 = 595000 DM2 die Varianz. a) Bestimmen Sie die Werte der geschätzten Parameter μ und σ 2 der zugehörigen Lognormalverteilung! b) Welcher Wert der Lognormalvariablen X wird mit einer Wahrscheinlichkeit von 0,05 überschritten? Lösung 11.1 Beispiele für linkssteile empirische Häufigkeitsverteilungen mit Merkmalswerten größer als Null sind Einkommens- und Vermögensverteilungen, die Verteilung von Unternehmen nach Größe oder Umsatz, die Verteilung landwirtschaftlicher Betriebe nach Nutzfläche oder Viehbesatz, die Verteilung bestimmter Lebensdauern und dergleichen.
4. Ergänzungen
450
a) Es gilt: μ = In
—2 χ —2 2 X + sx,
V
und
σ 2 = In 1 +
х2У
Mit χ = 2680 und s' = 595000 ergibt sich: - 2
χ —2 , 2 X + sx
In
= In
7182400 ,^7182400 + 595000
7,8538
und
( σ = In
1 +
к
s x2> dr - i n V χ ;
595000 -I = 0,07 96 . 7182400.\J
b) Der Wert der Lognormalvariablen X, der mit einer Wahrscheinlichkeit von 0,05 überschritten wird, ergibt sich wie folgt: x0,95 = β μ+λ°'95σ = e7'8538+1'64 0'2821 = 4090,6 Der Betrag von 4090,6 DM wird mit einer Wahrscheinlichkeit von 0,05 überschritten und mit einer Wahrscheinlichkeit von 0,95 nicht überschritten. Die folgende Abbildung der zugehörigen Lognormalverteilung soll zur Veranschaulichung beitragen. LN(7,8538;0,0796)
2000
4000
6000
8000
4. Ergänzungen
451
Aufgabe 1 1 . 2 In den Fahrstühlen des Universitätsgebäudes F21 befindet sich der Hinweis "Tragfähigkeit 600 kg oder 8 Personen". Nehmen Sie an, daß die Körpergewichte der Fahrstuhlbenutzer voneinander unabhängig und normalverteilt sind mit Mittelwert 65 kg und Standardabweichung 12 kg. a)Bestimmen Sie die Wahrscheinlichkeit dafür, daß der Fahrstuhl überlastet ist, wenn er mit 8 Personen besetzt ist! b) Der Fahrstuhl sei mit sieben Personen besetzt. Ein Student, höheres Semester, mit einem Lebendgewicht von 110 kg steigt ein. Wie groß ist die Wahrscheinlichkeit dafür, daß dadurch der Fahrstuhl überlastet wird? Lösung 1 1 . 2 Zufallsvariable: Xf : Gewicht der i-ten Person im Fahxstuhl in kg Xi~ N(65;144) 8
a) Ρ
8
X x ± > 600 M-l
= ι - ρ X Xi < 600 i=l
z = Σ x± . i=l Gemäß dem Additionssatz für Varianzen und Mittelwerte ist: σ2
μζ
= 8 · σ | = 8 · 144 = 1152 Ο σ ζ = 33,94, = 8 · μ χ = 520 und damit Ζ ~ Ν(520;1152).
1 - ρ(ζ < 600) = 1 - Fz(600) (600 - 52θ"\
,
ч
= 1 - 0,9909 = 0,0091 . Mit einer Wahrscheinlichkeit acht Personen überladen.
von 0,91% ist der Aufzug bei
7
b) γ =
Σχί i=l
Additionssatz für Varianzen und Mittelwerte: σγ = 7 · 144 = 1008 »
σ γ = 31,75,
4. Ergänzungen
452
μ γ = 7 · 65 = 455 , Υ ~ Ν(455;1008) . Ρ(Υ + 110 > 600) = 1 - Ρ(Υ + 110 < 600) = 1 - Fy(490) = 1 - Fö(l,102) = 1 - 0,8643 = 0,1357 . Mit einer Wahrscheinlichkeit von 13,57% wird der Aufzug nach dem Zusteigen der achten Person überlastet sein.
Zu FS, Kapitel 12: Einige spezielle Stichprobenverteilungen : Verteilungen für Häufigkeiten Aufgabe 12.1 Ein fränkischer Bauer betreibt neben seiner Landwirtschaft auch Fischerei im Main und in der Regnitz. In jedem der beiden Flüsse legt er jeweils am Morgen und an der gleichen Stelle eine Reuse aus, die er nach zwölf Stunden (= ein Tag) wieder einholt. Er weiß, daß er im Main im Durchschnitt pro Tag 7,5 Fische mit seiner Reuse fängt, während es in der Regnitz im Durchschnitt 12 Fische pro Tag sind. a) Wie groß ist die Wahrscheinlichkeit, daß der Bauer im Main an einem zufällig ausgewählten Tag 1)genau fünf Fische, 2)mehr als drei Fische mit der Reuse fängt? b) Berechnen Sie außerdem die Wahrscheinlichkeit dafür, daß er an einem zufällig ausgewählten Tag weniger als 15 Fische mit seiner Reuse in der Regnitz fängt!
Lösung 12.1 Seien X n die zufällige Anzahl der Fische, die am i-ten Tag mit einer Reuse im Main gefangen werden, und X.j2 die zufällige Anzahl der Fische, die am j-ten Tag mit einer Reuse in der Regnitz gefangen werden. Beide Zufallsvariable folgen einer POISSON-Verteilung, weil die zufälligen Ereignisse (Fangen der Fische) stochastisch unabhängig sind und in einem begrenzten zeitlichen Kontinuum (einem Tag) eintreten. a) X n ~ PV(7,5).
4. Ergänzungen
453
1) ρ(χ η = δ) = fXii(5;7,5) = 0Д094 (Tabelle) . Die Wahrscheinlichkeit dafür, daß an einem Tag fünf Fische mit der Reuse im Main gefangen werden, beträgt 0,1094. 2) p(xu > з) = 1 - p(xn < з) = 1 - (о,0006 + 0,0041 + 0,0156 + 0,0389) = 1 - 0,0592 = 0,9408 (Tabelle). Die Wahrscheinlichkeit dafür, daß an einem Tag mehr als drei Fische mit der Reuse im Main gefangen werden, beträgt 0,9408. b) X j2 ~ PV(12) . Diese
Verteilung
ist
nicht
tabelliert.
Weil
aber μ = 12 > 9 ist, kann die POISSON-Verteilung durch die Normalverteilung approximiert werden. Es gilt also: X j2 ~ Ν(μ,μ) = N(l2,12). Daraus ergibt sich mit Stetigkeitskorrektur: / \ (14 + 0,5 - 12"| , ч p(x < 14) = F„[ J = Fu(o,72) = 0,7642 . Die Wahrscheinlichkeit, an einem Tag weniger als 15 Fische mit der Reuse in der Regnitz zu fangen, beträgt approximativ 0,7 642 . Aufgabe 12.2 Nach dem Konzert einer legendären irischen Rockgruppe im Münchner Olympiastadion fahren die meisten Besucher mit der UBahn Linie U2 zum Hauptbahnhof. Erfahrungsgemäß lösen 10% der Fahrgäste keine Fahrkarte. Die Fahrgäste werden durch Bedienstete der Öffentlichen Verkehrsbetriebe folgendermaßen kontrolliert. In einem U-Bahnwagenabteil mit 20 Fahrgästen werden bei einer ersten Kontrolle zunächst fünf zufällig ausgewählte Personen überprüft. Befindet sich unter ihnen kein Schwarzfahrer, wird auf eine weitere Kontrolle verzichtet. Anderenfalls werden in einer zweiten Kontrolle drei weitere Personen überprüft. a) Berechnen Sie die Wahrscheinlichkeit dafür, daß in diesem Wagenabteil zwei Kontrollen durchgeführt werden! Gehen Sie dabei davon aus, daß sich in dem Wagenabteil die zu erwartende Anzahl von Schwarzfahrern befindet! b) Wieviel Personen werden bei dieser Vorgehensweise in solchen Abteilen im Durchschnitt kontrolliert? Erläutern Sie kurz Ihre Berechnung!
454
4. Ergänzungen
с) In e i n e m U - B a h n z u g befinden sich 1000 Fahrgäste, von d e n e n jeder fünfte kontrolliert wird. Wie groß ist die Wahrs c h e i n l i c h k e i t dafür, daß m e h r als 15 Schwarzfahrer b e i der Kontrolle entdeckt werden, w e n n d e r A n t e i l an Schwarzfahrern 10% b e t r ä g t ? L ö s u n g 12.2
x
Г 1, w e n n die i - te Person schwarz fährt, i1 = ί[ л0 s o n s t .
Die G e s a m t h e i t der U-Bahnfahrer ist zweipunktverteilt mit π = 0,1. A u s d e r G e s a m t h e i t w e r d e n η = 5 F a h r g ä s t e ohne Z u r ü c k l e g e n a u s g e w ä h l t . D a r a u s folgt, daß d i e S t i c h p r o b e n v a r i a b l e n nicht s t o c h a s t i s c h u n a b h ä n g i g sind. E s gilt somit:
x
η
' = iΣ= l i x
~
m i t η = 5, N = 20 u n d N x = Ν · π = 20 · 0,1 = 2. 4
(2\ /Ί8 !
a) P(X' > 0) = 1 - P(X' = 0) = 1 -
, ..
= 1 - 0,5526 = 0,4474.
UJ M i t e i n e r Wahrscheinlichkeit v o n 0,4474 w i r d m i n d e s t e n s e i n S c h w a r z f a h r e r erwischt und somit eine zweite Kontrolle d u r c h geführt . b) In jedem Falle w e r d e n n x = 5 Personen u n d m i t einer W a h r s c h e i n l i c h k e i t von 0,4474 drei w e i t e r e Personen kontrolliert. A l s o w e r d e n im Durchschnitt 5 + 3 · 0,4474 = 6,34 Personen kontrolliert. c) Jetzt ist N = 1000 u n d η = 200. Weil
ч
0,1 < π = 0,1 < 0,9 u n d ηπ(ΐ - π)
die h y p e r g e o m e t r i s c h e Verteilung a p p r o x i m i e r t werden, d.h. es gilt:
Ν - η N - 1 durch
= 14,41 > 9 die
folglich
P(X' > 15) = 1 - P(X' < 15) = 1 - F„
'l5 + 0,5 - 20
= 1 - F„(- 1,19) = 1 - 0,117 = 0,883 .
V i 4,41
kann
Normalverteilung
X' * N(20;14,4I). Mit S t e t i g k e i t s k o r r e k t u r ist
ist,
4.
Ergänzungen
455
Mit einer Wahrscheinlichkeit von approximativ 0,883 werden bei der Kontrolle mehr als 15 Schwarzfahrer entdeckt.
Aufgabe 1 2 . 3 Ein besorgter Vater versucht des öfteren und zufällig über den Tag verteilt, seine in Karlsruhe studierende Tochter telefonisch zu erreichen. Meist ohne Erfolg! Nach einer Reihe von nur gelegentlich erfolgreichen Versuchen gewinnt er den Eindruck, die Wahrscheinlichkeit für einen "Treffer" sei nur 0,05. a) Wie groß ist die Wahrscheinlichkeit dafür, daß erst beim 10. Versuch ein Gespräch zustande kommt? b) Wie oft muß der Vater versuchen, seine Tochter zu erreichen, damit die Wahrscheinlichkeit, mit seiner Tochter zu sprechen, mindestens 0,9 ist?
Lösung 1 2 . 3 Sei X eine Zufallsvariable, die die Anzahl der vergeblichen Versuche vor dem "Treffer" beschreibt. Dann folgt X einer geometrischen Verteilung mit Parameter π. Hier ist π = 0,05. a) Beim 10. Versuch kommt ein Gespräch zustande. Das bedeutet, daß auf χ = 9 Fehlversuche ein "Treffer" folgt. Mithin ergibt sich die gesuchte Wahrscheinlichkeit aus: fx(x|t) = (l - π)χ · π , 0,959 · 0,05 = 0,032.
f, -x
Die Wahrscheinlichkeit dafür, daß erst beim 10. Versuch ein Gespräch zustande kommt, beträgt also rd. 0,032. b) Wenn sich der Vater vornimmt, (höchstens) x-mal bei seiner Tochter anzurufen, kann er sie beim ersten, zweiten, ..., xten Versuch antreffen. Für die Wahrscheinlichkeit, die Tochter zu erreichen, soll nun gelten: ίχ(θ|π) + £χ(ΐ|π) +. . - + fx(x - l|π) > 0,9 . π·
x-l X (1 - π)1 i=l endliche geometrische Re ihe
:> 0,9
456
4. Ergänzungen
π·
> 0,9 1 - (l - π)χ ^ 0,9 (1 - π)χ < 0,1 χ · 1η (1 - π) < 1η 0,1 χ >
1η 0,1 In (1 - π)
1η 0,1 = 44,9. 1η 0,95
Der Vater muß sich also vornehmen, (höchstens) 45mal bei seiner Tochter anzurufen, damit die Wahrscheinlichkeit, mit ihr zu sprechen, mindestens 90% ist. Alternativer Ansatz (über Gegenwahrscheinlichkeit): Wenn die Wahrscheinlichkeit, mit der Tochter zu sprechen, bei χ Versuchen mindestens 90% betragen soll, ist die Wahrscheinlichkeit, bei χ Versuchen keinen Erfolg zu haben, höchstens 10%. Damit erhält man unmittelbar (1 - π)χ < 0,1; die weitere Rechnung erfolgt wie oben. Aufgabe 12.4 Der Ausschußanteil einer größeren Menge von Produkten beträgt 0,3. Für eine Untersuchung der Ursachen, die zu einem so hohen Ausschußanteil geführt haben, werden fünf defekte Stücke benötigt. Daher werden zufällig und nacheinander Stücke ausgewählt, und zwar so lange, bis sich unter den ausgewählten Stücken genau fünf defekte befinden. Wie groß ist die Wahrscheinlichkeit dafür, daß insgesamt Stücke zufällig und nacheinander ausgewählt werden müssen?
20
Lösung 12.4 Die Zufallsvariable X kennzeichnet die Anzahl der ausgewählten nicht defekten Stücke vor dem r-ten defekten Stück. π = 0,3 ist die Wahrscheinlichkeit für das Ziehen eines defekten Stücks, 1 - π = 0,7 die Wahrscheinlichkeit für das Ziehen eines nicht defekten Stücks. Wenn 20 Stücke zufällig und nacheinander ausgewählt werden, bis genau r = 5 defekte Stücke gezogen sind, dann muß das letzte gezogene Stück defekt sein. Unter den verbleibenden 19 Stücken
4. Ergänzungen
457
befinden sich somit genau (r-1) = 4 defekte und χ = 15 nicht defekte Stücke in zufälliger Reihenfolge. X folgt einer negativen Binomialverteilung mit den Parametern π = 0,3 und r = 5. Somit ergibt sich die gesuchte Wahrscheinlichkeit aus = (Χ+^-1)πΓ(ΐ-π)*.
fx(*M
Mit χ = 15, r = 5 und π = 0,3 ist fx(l5|0,3;5) = ( 1 5 ^
^ 0,350,715 = 0,0447 .
Die Wahrscheinlichkeit dafür, daß insgesamt wählt werden müssen, beträgt somit 0,0447.
20
Stücke
ausge-
Aufgabe 12.5 Der Kaffeeautomat einer kleineren Universität sondert nach Einwurf von einer DM - je nach Laune (d.h. zufällig) - entweder einen Becher -
Kaffee
(π Β = 0,12) oder
(π κ = 0,08) oder
einen Becher und Kaffee -
gar nichts
(πΒK
= 0,75) oder
(л д = 0,05) ab.
Ein BWL-Student steht mit Aktenkoffer und souveränem Managerblick vor dem Kaffeeautomaten. Mit welcher Wahrscheinlichkeit kann er damit rechnen, bei nur zwei Versuchen für sich und seinen Freund jeweils einen Becher, der mit Kaffee gefüllt ist, zu bekommen? Lösung 12.5 X· =
fl, wenn i - ter Automatenkunde Kaffee und Becher erhält, 10 sonst .
η X' = Σ x i ~ b(2;0,75) i=l πχ'(ΐ - π)η-χ', falls x' = 0,l,2,...,n, fx,(x'|n,7t) = 0 sonst
458
4. Ergänzungen
• 0,752 · (l - 0,75)° = 0,5625 . Der BWL-Student kann mit einer Wahrscheinlichkeit von 56,25% damit rechnen, bei beiden Versuchen einen Becher mit Kaffee für sich und seinen Freund zu erhalten.
Zu FS, Kapitel 15: Parametrische Schätzverfahren Aufgabe 15.1 Um sich mit der Marktwirtschaft nicht nur theoretisch, sondern auch praktisch zu befassen, beabsichtigen zwei "Erstsemester" einer Fachhochschule in Sachsen, einen PC-Verleih zu gründen. Zur Beurteilung ihrer Erfolgsaussichten wollen sie abschätzen, wie viele der 2000 Fachhochschüler einen PC mieten würden, und befragen 150 zufällig ausgewählte Kommilitonen. Sie ermitteln 105 Interessenten, 41 "eingefleischte High-Tech-Gegner" und 4 Kommilitonen, die grundsätzlich solche kapitalistisch-ausbeuterischen Aktivitäten nicht unterstützen. Führen Sie eine Intervallschätzung durch für die Anzahl der Fachhochschüler, die als potentielle Kunden für die Jungunternehmer in Frage kommen! ( 1 - a = 0,9545)
Lösung 15.1 Sei 1, falls der i - te Befragte Interessent ist, 0, falls der i - te Befragte kein Interessent ist. Aus der zweipunktverteilten Gesamtheit von N = 2000 Fachhochschülern wurde eine Zufallsstichprobe vom Umfang η = 150 nach dem Prinzip einer Auswahl ohne Zurücklegen gezogen. Nach einem zentralen Grenzwertsatz kann die hypergeometrische Verteilung durch die Normalverteilung approximiert werden; dabei ist wegen des großen Auswahlsatzes von n/N = 0,075 der Korrekturfaktor für endliche Gesamtheiten zu berücksichtigen. Wenn die Approxi. . Ν - η mationsbedingungen 0,1 < π < 0,9 und ηπ(1 - π) > 9 erfüllt N — 1 sind, gilt für den Anteil der interessierten Fachhochschüler
Das Konfidenzintervall für den Anteil der Interessenten ist
'S)
ТГ < π < Τ
= Ι"«'"
4. Ergänzungen
459
dabei ist T„ =
Ρ +
2η
И ) "
2η
Μ )
1 + -— il - -1 η V Ν/ T„ =
Ρ + 1
+
η V
Ρ(1 - ρ) λ2 + η 4η—
+ λ
Ρ(1 - ρ) + λ2 ~ η 4η
1 -
-U
Ν.
und λ = λ ι—
2
Mit Ν = 2000, η = 150, ρ ergibt sich: t„ = t: =
1,02466
105/150, 1-α = 0, 9545 und λ
2,0
[θ,7 + 0,01233 - 2,0-^0,0014 + 0,000041^0,925] = 0,6239,
_1 [θ,7 + 0,01233 + 2,0 -у/0,0014 + 0,000041^0,925] = 0,7664. 1,02466
Durch Multiplikation der Intervallgrenzen mit der Anzahl der Fachhochschüler insgesamt (N = 2000) erhält man [1248;1533] als empirisches Konfidenzintervall zum Konfidenzniveau 1 - α = 0,9545 für die wahre, aber unbekannte Anzahl der Fachhochschüler, die als potentielle PC-Mieter in Frage kommen. Die Approximationsbedingungen für die Verteilung der Stichprobenfunktion Ρ sind für beide Grenzen des Konfidenzintervalls und somit auch für alle Werte im Konfidenzintervall erfüllt, denn es gilt: ntun(l - c j ^ - r f = 0,1
1 0 für a l l e i, j η t i o n s b e d i n g u n g e n für d e n T e s t e r f ü l l t . (272 - 225,14)2 (80 - 58,29)2 t = — + ··· + — 225,14 58,29
sind
die
Approxima-
=
= 9,75 + 13,00 + 6,51 + 8,67 + 6,07 + 8,09 = 52,09 . Entscheidung: Wegen
t = 52,09 > Xq,995;2 = Ю/60
Signifikanzniveau α = 0,005
wird
die
Nullhypothese
auf
dem
verworfen.
Interpretation: Die v o r l i e g e n d e S t i c h p r o b e b i e t e t h i n r e i c h e n d G r u n d zu d e r A n n a h m e , d a ß s i c h d i e V e r t e i l u n g e n d e r S c h u l a b s c h l ü s s e in b e i d e n Bildungssystemen unterscheiden. Es k ö n n t e j e d o c h e i n F e h l e r e r s t e r A r t v o r l i e g e n , d . h . H 0 w u r de v e r w o r f e n , o b w o h l H 0 r i c h t i g i s t . F a l l s H 0 r i c h t i g ist, f ü h r e n 5% a l l e r m ö g l i c h e n S t i c h p r o b e n zu e i n e r f a l s c h e n E n t scheidung, d.h. zum Verwerfen. Das Fehlentscheidungsrisiko b e t r ä g t a l s o 5%.
4. Ergänzungen
475
Aufgabe 16.2 Ein Fußballfan und Hobby-Statistiker vermutet, daß die Anzahl der Tore in einem Fußballspiel POISSON-verteilt ist. Eine einfache Zufallsstichprobe erbrachte folgendes Ergebnis: Anzahl der Tore pro Begegnung Anzahl der Begegnungen 0 1 2 3 4 5 6 und mehr
29 36 86 44 55 24 26
Insgesamt fielen 870 Tore in den 300 zufällig ausgewählten Begegnungen. Überprüfen Sie die Vermutung des Fußballfans mit Hilfe eines geeigneten statistischen Tests (α = 0,05)! Lösung 16.2 Sei Xi die Anzahl der Tore im i-ten Spiel der Zufallsstichprobe vom Umfang η = 300. Testauswahl: Ein geeigneter Test zur Überprüfung der Vermutung ist der χ2Anpassungstest, dessen Voraussetzungen erfüllt sind: - Es liegt eine einfache Stichprobe vor. - Es werden к = 7 disjunkte, nicht-leere Klassen unterschieden. Hypothesen: Auf dem Signifikanzniveau α = 0,05 wird die Nullhypothese H0: fx(x) = ί0(χ|μ) für alle χ e SR gegen die Alternativhypothese H1: fx(x) * ί0(χ|μ) für mindestens ein χ 6 94 getestet. ί0(χ|μ) ist die Wahrscheinlichkeit
der POISSON-Verteilung
mit
dem Parameter μ, der nicht bekannt und daher aus der Stichprobe zu schätzen ist.
476
4. Ergänzungen
Ein geeigneter Schätzwert für μ ist χ =
= 2,9, so daß die 300 folgenden Überlegungen für die POISSON-Verteilung mit der Wahrscheinlichkeitsfunktion f0(x|2,9) =
- e -
durchgeführt werden. Die Prüffunktion: T
f fc - nr°f " i-i
nP°
ist unter Ho approximativ χ2-verteilt mit ν = 5 Freiheitsgraden. Es wird ein Parameter (μ) aus der Stichprobe geschätzt. Entscheidungsregel: Η0 wird verworfen, wenn t > Xi_a;v = Xo,95;s = 11,07 ist. Berechnung: Arbeitstabeile
i
p° = f0(x|2,9)
nPi0
0 1 2 3 4 5 >6
29 36 86 44 55 24 26
0,0550 0,1596 0,2314 0,2237 0,1622 0,0940 0,0741
16,50 47,88 69,42 67,11 48, 66 28,20 22,23
(ni - nP?)2 0 nPi 9,4697 2,9477 3,9599 7,9582 0,8261 0,6255 0,6394
Σ
300
1
300
26,4268
X
n
Da np° > 10 für alle i, sind die Approximationsbedingungen für die Prüfverteilung hinreichend erfüllt. Entscheidung: Wegen
t = 26,43 > χ\_α.ν = Xo,95;s =
1:L 07
'
wird
die
auf dem Signifikanzniveau α = 0,05 verworfen.
Nullhypothese
4. Ergänzungen
477
Interpretation: Es gibt einen Grund, daran zu zweifeln, daß die Anzahl der Tore in einem Fußballspiel einer POISSON-Verteilung folgt. Es könnte jedoch ein Fehler erster Art vorliegen, d.h. H 0 wurde verworfen, obwohl H0 richtig ist. Falls H0 richtig ist, führen 5% aller möglichen Stichproben zu einer falschen Entscheidung, d.h. zum Verwerfen von H 0 . Das Fehlentscheidungsrisiko beträgt also 5%. Aufgabe 16.3 Für die Funktionsfähigkeit von Zündkerzen ist der Elektrodenabstand entscheidend. In einem Fertigungsbetrieb werden statistische Verfahren zur Überwachung dieses Elektrodenabstands in der Zündkerzenproduktion eingesetzt. Aus langjähriger Erfahrung weiß man, daß bei einer bestimmten Zündkerzensorte (WR6DC) der Elektrodenabstand eine (approximativ) normalverteilte Zufallsgröße ist. Außerdem ist bekannt, daß die Standardabweichung des Elektrodenabstands bei dieser Zündkerzensorte 0,01 mm beträgt. a) Mit welchem Ausschußanteil muß man bei der Produktion dieser Zündkerzensorte rechnen, wenn der durchschnittliche Elektrodenabstand seinem Sollwert 0,75 mm entspricht und der Elektrodenabstand einer Zündkerze um höchstens 0,03 mm vom Sollwert abweichen darf? b) Aus der Tagesproduktion dieser Zündkerzensorte werden 12 Zündkerzen nach dem Zufallsprinzip entnommen. In dieser Stichprobe ergibt sich ein mittlerer Elektrodenabstand von 0,7480 mm. Schätzen Sie den durchschnittlichen Elektrodenabstand der Tagesproduktion dieser Zündkerzensorte! Interpretieren Sie das Schätzergebnis! (1 — α = 0,95). c) Zur laufenden Kontrolle der Fertigung wird der Elektrodenabstand dieser Zündkerzensorte mit Hilfe eines geeigneten statistischen Tests überwacht. Mit diesem Test soll überprüft werden, ob der durchschnittliche Elektrodenabstand dem Sollwert 0,75 mm entspricht. Dazu werden jedem produzierten Los von 1000 Zündkerzen zufällig 10 Zündkerzen entnommen und der Stichprobenmittelwert bestimmt. Welche Testentscheidungen sind bei den folgenden Losen zu treffen (α = 0,01)? Interpretieren Sie die Testentscheidungen ! Los
Stichprobenmittelwert in mm
А
0,7532
В
0,7611
С
0,7489
478
4. Ergänzungen
d) Bestimmen Sie den Ablehnungsbereich des statistischen Tests aus Teilaufgabe c) in Einheiten des Stichprobenmittelwerts, so daß die Entscheidung ohne weitere Rechnung auf der Basis des Stichprobenmittelwerts getroffen werden kann!
Lösung 16.3 a) Xj^ = Elektrodenabstand der i-ten Zündkerze in der Stichprobe. Der Elektrodenabstand ist (approximativ) normalverteilt mit einer Standardabweichung von 0,01 mm. X ~ N(0,75;0,012) p(|x - μχ| > 0,03) = 1 - p(|x - μχ| < 3 · σ χ ) = 1 - [F0(3) - F„(- 3)] = 1 - 0,9973 = 0,0027.
Der zu erwartende Ausschußanteil beträgt 0,27%. b) Die Tagesproduktion dürfte hinreichend groß sein, so daß n/N < 0,05 ist und somit die stochastische Abhängigkeit der Stichprobenvariablen, die aus der Auswahl ohne Zurücklegen resultiert, vernachlässigt werden kann. Es gilt 2 0,012' Ηχ' χ = -"5Jσ
— σχ X 12 ~ ^Ι-α/2 ' Mit
-
_ - X12
σχ + λ
=
1-α/2 "
1
x12 = 0,7480, σ χ = 0,01, η = 12 und λ1_α/2 = λ 0 9 7 5 = 1,96
ergibt sich 0,7480 - 1,96 ·
0,01
< μ χ < 0,7480 + 1,96 ·
0,01
0,7480 - 0,0057 < μ χ < 0,7480 + 0,0057 0,7423 < μ χ < 0,7537 . Der durchschnittliche Elektrodenabstand der Zündkerzen aus der betrachteten Tagesproduktion liegt schätzungsweise zwischen 0,7423 und 0,7537 mm. Die Sicherheit der Schätzaussage basiert auf der Konstruktionsvorschrift für das Konfidenzintervall, gemäß der (1-α)·100% = 95% aller nach dem gleichen Prinzip ziehbaren Stichproben Schätzintervalle liefern, die den wahren Mittelwert enthalten. Somit kann man bei einem kleinen Wert von α recht sicher sein, eine richtige Schätzaussage getroffen zu haben.
4. Ergänzungen
479
с) Da η/Ν = 0,01, können die stochastischen Abhängigkeiten der Stichprobenvariablen, die aus der Auswahl ohne Zurücklegen resultieren, vernachlässigt werden. H :
o ^x = Mo = °'75'
Ηχ: μ χ * 0,75 . —
Die
Prüffunktion
μ 0 ι— ^η
ist unter χ tiv) standardnormalverteilt. Die Nullhypothese wird verworfen, wenn |t| >
^ =
Τ =
σ
H0
(approxima-
= λ 0 9 9 5 = 2,58 ist. 0,7532 - 0,75 ,— Κ7Γ, № 0,01
= 1'0119'
0,7611 - 0,75 -Д0 = 3,5101, 0,01 0,7489 - 0,75 0,01
JlÖ = -0,3479 .
Gemäß der Entscheidungsregel wird die Nullhypothese bei Los В verworfen, sonst nicht verworfen. Da eine richtige Nullhypothese nur in α·100% = 1% aller Fälle (= Stichproben) verworfen wird, hat man beim Los В aus statistischer Sicht berechtigten Grund zu der Annahme, daß der durchschnittliche Elektrodenabstand nicht dem Sollwert 0,75 mm entspricht. Bei den Losen Α und С widerspricht das Testergebnis zumindest nicht der Vermutung, daß der durchschnittliche Elektrodenabstand dem Sollwert 0,75 mm entspricht. Hier ist jedoch das Fehlentscheidungsrisiko (ß-Fehler) unbekannt. d) |t| = L ^ i L — ^ σ χ
> X1_a/2 = λ 0 9 9 5 = 2,58 ,
σ χ 4.0 < μ 0 - Хг_а/2 •
01 „.,^ - 2,58 · °' = 0,75 - щ
σχ
0,01
χ10 > μ 0 + λ1_α/2
• - ρ = 0,75 + 2,58 ·
= 0,75 - 0,0082 = 0,7418 ,
= 0,75 + 0,0082 = 0,7582 .
Die Nullhypothese wird abgelehnt, wenn der Stichprobenmittelwert kleiner oder gleich 0,7418 mm oder größer oder gleich 0,7582 mm ist. Aufgabe 16.4 Ein bestimmter PKW-Typ mit Otto-Motor verbraucht nach Werksangaben 11 Liter Benzin/100 km. Eine Werkstatt behauptet, durch
480
4. Ergänzungen
den Einbau einiger weniger Teile den Benzinverbrauch dieses PKW um mindestens 15% senken zu können. Ein Automobil-Club bezweifelt diese Behauptung. Um nachzuweisen, daß sie falsch ist, bestimmt er aufgrund einer Zufallsstichprobe den Benzinverbrauch von einigen Fahrzeugen, die entsprechend umgebaut wurden. Welche Nullhypothese hat der Automobil-Club zu testen? Lösung 16.4 Die Behauptung der Werkstatt 100
lautet
μ < 0,85 · 11 = 9,35 Liter/
km.
Wenn es dem Automobil-Club gelingt, die Nullhypothese H0: μ < 9,35 zu verwerfen, dann hat er Grund zur Annahme, daß wohl die Alternativhypothese Hj^: μ > 9,35 richtig und somit die Behauptung der Werkstatt wohl falsch ist. Aufgabe 16.5 πΒ bzw. π ΗΗ seien in Bayern bzw. in Hamburg die Anteile der wahlberechtigten Personen, die mit dem "Kruzifix-Urteil" des Bundesverfassungsgerichts vom August 1995 unzufrieden sind. Ein Meinungsforschungsinstitut will nachweisen, daß die Anteile π Β und π ΗΗ verschieden sind. Zur Durchführung des entsprechenden Tests werden in Bayern n B = 480 und in Hamburg n HH = 520 Wahlberechtigte zufällig ausgewählt und befragt. Es ergeben sich die Stichprobenanteile pB = 0,8 und p HH = 0,5 . Welche der folgenden Aussagen sind bei einem Signifikanzniveau von α = 0,05 richtig? a) Die Nullhypothese H0: π Β = π ΗΗ wird verworfen! b) Mit dem Testergebnis ist bewiesen, daß π Β * π ΗΗ ist! c) Der beobachtete Unterschied zwischen p B und p HH kann nicht nur durch die zufällige Auswahl der Befragten erklärt werden ! Lösung 16.5 Definition der Zufallsvariablen: [ 1, wenn i - ter Befragter im Bundesland j unzufrieden ist, X
>
i
1 0 sonst;
(j = В, HH).
4. Ergänzungen
Σ xj,i A n z a h l d e r u n z u f r i e d e n e n B e f r a g t e n i m B u n d e s l a n d i=l
Xj =
481
j,
Testauswahl: Test der Differenz
zweier
Anteilswerte
Voraussetzungen: Die stochastische Abhängigkeit ist vernachlässigbar, n / N < 0,05 ( B a y e r n h a t m e h r a l s 9600 E i n w o h n e r , H a m b u r g m e h r a l s 10400 E i n w o h n e r ) . Die Stichproben
sind voneinander
Die Gesamtheiten sind
unabhängig.
zweipunktverteilt.
Die Stichprobenumfänge weils größer als 400.
sind
mit
n B = 480
und
n H H = 520
Hypothesen: H0: π Β
= πΗΗ
g e g e n Ηχ: π Β
* πΗΗ .
Prüfmaß: Τ
wobei P R n B + Pнн"нн HH n,
Ρ
Τ ist unter
H0
approximativ
standardnormalverteilt.
Entscheidungsregel: H0
wird verworfen,
wenn
|t| > λ
α
= λ 0 ι 9 7 5 = 1,96
Berechnung: Ρ P
==
0,8 · 480 + 0,5 · 520 _ 644 644 480 + 520
~
da hat
1000
0,644,
ist.
je-
482
4. Ergänzungen
"
0,8 - 0,5
0,3
Ι Γ Ί TT J0,644 · 0,356 + V V480 520/
~ 0,0303 ~
9,90
·
Entscheidung: Da t = 9,90 > 1,96 = λ 0/975 ist, wird H 0
verworfen.
Interpretation: Auf einem Signifikanzniveau von 1 - α = 0,95 besteht ein Grund, daran zu zweifeln, daß die Anteile der Unzufriedenen in Bayern u n d Hamburg g l e i c h sind. Es könnte jedoch ein Fehler erster Art vorliegen, d.h. H 0 wird verworfen, obwohl H 0 richtig ist. Falls H 0 richtig ist, führen 5% aller m ö g l i c h e n Stichproben zu einer falschen Entscheidung, d.h. zum V e r w e r f e n von H 0 . Das Fehlentscheidungsrisiko beträgt also 5%. A u s s a g e a) ist somit richtig. Die A u s s a g e n b) u n d c) sind falsch, da die getroffene Entscheidung m i t e i n e m Fehlerrisiko behaftet ist. A u f g a b e 16.6 Bei m u n d g e b l a s e n e m Glas läßt es sich nur schwer vermeiden, daß w ä h r e n d d e s Herstellungsvorgangs L u f t b l a s e n in den Glaskörper gelangen. a) Welches plausibel Verwenden folgenden
Verteilungsgesetz (welche Modellverteilung) ist für die Anzahl der Luftblasen in einem Glaskörper? Sie dieses Verteilungsgesetz zur Beantwortung der Fragen!
b) Im Durchschnitt werden je 100g Glas 0,8 Luftblasen b e o b a c h tet. Mit welcher Wahrscheinlichkeit b e f i n d e n sich in einem Glas mit e i n e m Gewicht von 250g keine
Luftblasen,
-
ein oder zwei Luftblasen
-
mehr als zwei Luftblasen?
c) Ein weiterer Glasbläser soll eingestellt werden, wenn ein geeignetes statistisches T e s t v e r f a h r e n den Schluß zuläßt, daß er im Durchschnitt bei Gläsern m i t einem Gewicht von 250 g w e n i g e r als zwei Luftblasen v e r u r s a c h t . Bei e i n e m Einstellungstest ergaben zehn voneinander gige V e r s u c h e folgendes Ergebnis: i
1
2
3
4
5
6
7
8
9
10
Σ
2
5
0
1
0
3
2
0
1
0
14
unabhän-
4. Ergänzungen
483
Wird der Glasbläser eingestellt? Lösung 16.6 X = Anzahl Luftblasen in 250g Glas. a)
Die POISSON-Verteilung ist ein plausibles Modell. Es geht hier um das Auftreten von Ereignissen (Luftblasen) in einem begrenzten räumlichen Kontinuum (250g Glas). Die stochastische Unabhängigkeit der Ereignisse kann wohl unterstellt werden.
bi) Im Durchschnitt gibt es in 100g Glas 0,8 Luftblasen, also gibt es in 250g durchschnittlich 2,5 · 0,8 = 2 Luftblasen. Somit ist: X ~ PV(2). j· exp(- μ) für χ = 0,1,2,3,...; μ > 0, c(»W = 0 sonst. 2°
1
ρ ( χ = 0) = £х(о|г) = — e x p ( - 2) = - · 0 , 1 3 5 3 = 0 , 1 3 5 3 .
Mit einer Wahrscheinlichkeit von Glas keine Luftblasen enthalten.
13,53%
werden
die
250g
werden
die
250g
werden
die
250g
b2) P(x = 1) + P(X = 2) = fx(l|2) + fx(2|2) 21 22 = — exp(- 2) + — exp(- 2) = 2 · 0,1353 + 2 · 0,1353 = 0,5412.
Mit einer Wahrscheinlichkeit von 54,12% Glas eine oder zwei Luftblasen enthalten. b3) P(X > 2) = 1 - (P(X = 1) + P(X = 2) + P(X = θ)) = 1 - (0,5412 + 0,1353) = 0,3235 .
Mit einer Wahrscheinlichkeit von 32,35% Glas mehr als zwei Luftblasen enthalten. c)
Sei = Anzahl Luftblasen in 250g Glas beim i-ten Versuch. Testauswahl: Approximativer Test für den Mittelwert einer POISSON-Verteilung. Voraussetzungen:
4. Ergänzungen
484
-
1U X = Σ Yi i s t POISSON-verteilt mit dem Parameter μ χ . i=l
-
μ χ0 = 10 · μ Υ 0 = 10 · 2 = 20 > 9.
Damit der Glasbläser eingestellt wird, muß er - im langfristigen Mittel - weniger als μ γ0 = 2 Blasen je Versuch verursachen. Er muß also - im langfristigen Mittel - bei zehn Versuchen weniger als μχ0 = 20 Blasen verursachen. Hypothesen: H0: μ χ ^ μ χ 0 = 20 gegen
μ χ < 20 .
Prüfmaß: x T =
+ Ο'5 - μ χ0
Unter H 0 ist Τ approximativ standardnormalverteilt. Entscheidungsregel: H 0 wird verworfen, wenn t £ λ α . Das Signifikanzniveau wird auf 0,05 festgelegt, so daß λ α = λ 0 05 = -1,64 . Berechnung: t =
14 + 0,5 - 20 - 5,5 4= = — = -1,2298. J2Ö 4,4721
Entscheidung: t = -1,2298 > λ 0 0 0 5 = -1,64 , also wird H0 nicht verworfen. Antwort: Es gibt keinen Grund, daran zu zweifeln, daß der Glasbläser bei 250g Glas im Mittel mindestens 2 Luftblasen verursacht. Der Glasbläser wird wohl nicht eingestellt. Es könnte ein Fehler zweiter Art vorliegen, d.h. H 0 wurde nicht verworfen, obwohl H 0 falsch ist (ß-Fehler). Das Fehlentscheidungsrisiko ist nicht quantifizierbar. Aufgabe 16.7 Bei einer Befragung machten 1000 zufällig ausgewählte Berufstätige aus der Bundesrepublik Deutschland über ihre Berufsgruppe und ihre sportliche Betätigung folgende Angaben:
4. Ergänzungen
sportliche Betätigung
485
nie
gelegentlich
regelmäßig
Arbeiter
250
128
72
Angestellter
170
98
92
Beamter
40
48
32
Landwirt
47
15
8
Berufsgruppe
Überprüfen Sie mit Hilfe eines geeigneten Tests, ob die Ergebnisse der Befragung die Annahme stützen, daß die Häufigkeit der sportlichen Betätigung von der Zugehörigkeit zu einer Berufsgruppe abhängt (α = 0,05) ! Runden Sie bei Ihren Berechnungen stets auf zwei Nachkommastellen! Lösung 16.7 Zufallsvariable: Berufsgruppe des i-ten ausgewählten Berufstätigen; Y^
Häufigkeit der sportlichen Betätigung des i-ten ausgewählten Berufstätigen.
Testauswahl: Da überprüft werden soll, ob eine Abhängigkeit vorliegt,
kommt
2
der χ -Unabhängigkeitstest in Betracht. Voraussetzungen: -
Es liegt eine Auswahl ohne Zurücklegen vor. Da es jedoch mehr als N = 20000 Berufstätige in der Bundesrepublik Deutschland gibt, so daß n/N = 1000/N < 0,05 erfüllt ist, sind die Stichprobenvariablen ( , Y ± ) zumindest approximativ stochastisch unabhängig. Die identische Verteilung der (X ± , Y ± ) ist gegeben, da aus einer Gesamtheit nach dem Zufallsprinzip gezogen wird.
-
Die Gesamtheit ist zweidimensional verteilt.
-
Es liegen vor.
к =
4 und m
=
3 disjunkte,
nicht-leere
Hypothesen: «o^Xi.Yii*!»^) = f x ± ( x i) ' fYi(xz)
für
alle
( х 1' х г)
6
'
Klassen
486
4. Ergänzungen
Hj^: f X i < Y i (x 1 , x 2 ) φ f x (xi) · £у ± ( х г)
f ü r
m i n d e s t e n s e i n (хг, x 2 ) e SR 2 .
Prüffunktion: Da die hypothetischen Wahrscheinlichkeiten =
= Pi.P.j a u s d e r S t i c h p r o b e
durch
zu s c h ä t z e n sind,
ist
_ Nj>N.jV к m l N ij _ Τ = Ζ-, У У L* Ν. Ν · i=lj=l *3 η unter Η0 approximativ Freiheitsgraden.
χ2-verteilt
mit
ν = (4 - l) · (3 - l) = 6
D i e A p p r o x i m a t i o n g i l t a l s gut, da f ü r a l l e i,j
nie
Arbeiter
250
gelegentlich
128
Beamter
40
Landwirt
47
360
32
48
120 24, 48
34, 68
70
8
15
14,28
20,23
35,49 507
1000
204
289
Die Felder im I n n e r e n der Tabelle sind w i e folgt
besetzt:
Entscheidungsregel: H0
wird verworfen,
2
wenn t > χ1_α;ν
2
i.
73,44
104,04
60, 84
n
91, 80 92
182,52
ist.
450
130,05 98
170
regelmäßig
72
228,15 Angestellter
ηρ° ή > 10
= Xo95;6
=
12,59
ist.
4. Ergänzungen
487
Berechnung: _ (250 - 228,1б)2 (8 - 14,2 θ)2 228,15 14^8 = 2,09 + 0,03 + 4,27 + 0,86 + 0,35 + 4,69 + 7,14 + 5,12 + 2,31 + 3,73 + 1,35 + 2,76 = 34,71. Entscheidung: Da t = 34,71 > 12,59 = Xo,95;6< wird H0 verworfen. Interpretation: Auf einem Signifikanzniveau von α = 0,05 liefert die Stichprobe einen Grund, daran zu zweifeln, daß die Berufsgruppe und die Häufigkeit der sportlichen Betätigung voneinander unabhängig sind. Möglicher Fehler: H0 wurde verworfen, obwohl H0 richtig ist (Fehler erster Art). Falls H 0 richtig ist, führen 5% aller möglichen Stichproben zu einer falschen Entscheidung, d.h. zum Verwerfen von H 0 . Das Fehlentscheidungsrisiko beträgt also 5%. Aufgabe 16.8 Bei einem Sachbearbeiter einer Versicherungs-AG gehen an einem Arbeitstag (= acht Stunden) im Durchschnitt zwei Kfz-Schadensanzeigen ein. a) Welches Wahrscheinlichkeitsmodell ist geeignet, die Wahrscheinlichkeit dafür zu bestimmen, daß bei dem Sachbearbeiter an einem bestimmten Arbeitstag genau χ = 0,1,2,... Schadensanzeigen eingehen? Nehmen Sie an, daß die Schadensanzeigen stochastisch unabhängig und für alle Wochentage identisch verteilt sind! b) Bestimmen Sie mit dem Wahrscheinlichkeitsmodell aus Teilaufgabe a) die Wahrscheinlichkeit dafür, daß bei dem Sachbearbeiter bi) an einem bestimmten Tag genau zwei, Ьг) an einem bestimmten Tag mehr als zwei, Ьз) innerhalb von vier Tagen genau acht Kfz-Schadensanzeigen eingehen! c) Bei der Versicherungs-AG gehen je Arbeitstag im Durchschnitt 20 Kfz-Schadensanzeigen ein. Mit welcher Wahrscheinlichkeit sind es an einem bestimmten Arbeitstag mehr als 25 Schadensanzeigen? d) Überprüfen Sie Ihr Wahrscheinlichkeitsmodell aus Teilaufgabe a) mit einem geeigneten Test (α = 0,05) und interpretieren Sie das Testergebnis!
488
4. Ergänzungen
Für den Test stehen Ihnen die folgenden Daten einer einfachen Zufallsstichprobe zur Verfügung.
Anzahl der eingehenden Kfz-Schadensanzeigen X
Anzahl der Arbeitstage, an denen χ Kfz-Schadensanzeigen eingehen
0 1 2 3 4 5 und mehr
22 60 52 30 22 14
Lösung 16.8 a) Ein Arbeitstag von acht Stunden Dauer ist ein "begrenztes zeitliches Kontinuum", in dessen Grenzen zu jedem beliebigen Zeitpunkt eine Schadensanzeige eingehen kann. Da die Schadensanzeigen voneinander stochastisch unabhängig sind, folgt die Zufallsvariable X, die zufällige Anzahl der an einem Tag eingehenden Schadensanzeigen, einer POISSON-Verteilung mit Mittelwert μ χ , d.h. X ~ PV(2). b) Wahrscheinlichkeiten für bi) genau zwei Schadensanzeigen an einem bestimmten Tag: P(X = 2) = fx(2| 2) = 0,2707 ; b2) mehr als zwei Schadensanzeigen an einem bestimmten Tag: p(x > 2) = 1 - p(x < 2)
= 1 - Σ£χ(Φ) x=0
= 1 - (o,1353 + 0,2707 + 0,2707) = 0,3233 .
Ъз) Bezeichnet Y die zufällige Anzahl der Schadensanzeigen innerhalb von vier Tagen, so gilt μ γ = 4 · μ χ = 8 und damit Y ~ PV(8) . Somit ergibt folgt:
sich
die
gesuchte
Wahrscheinlichkeit
wie
8s P(Y = 8) = fY(8|8) = — · e 8 = 0,1396 .
c) X, die Anzahl der bei der Versicherungs-AG je Arbeitstag eingehenden Kfz-Schadensanzeigen, folgt einer PV(20).
4. Ergänzungen
489
Da die POISSON-Verteilung für μ > 9 durch die Normalverteilung Ν(μ;μ) approximiert werden kann, gilt approximativ: λ
P(X > 25) = 1 - P(X < 25) = 1 - Fu
25 + 0,5 - 2θ' V2Ö
= 1 - Fu(l,23) = 0,1093 . Die Wahrscheinlichkeit für mehr als 25 Schadensanzeigen an einem bestimmten Arbeitstag beträgt also approximativ 0,1093. d) Gegeben ist die Realisation einer einfachen Stichprobe vom Umfang η = 200. Der Wertebereich der Zufallsvariablen X ist in к = 6 disjunkte, nicht-leere Klassen eingeteilt. Ein geeigneter Test ist der %2-Anpassungstest. Hypothesen: H0: fx(x) = ί0(χ|μ = 2) für alle χ e 5R , Hi:fx(x) * fg(x| μ = 2) für mindestens ein χ ε 5R . Prüfmaß:
ηπ
i-1 ist
unter
1 H0
approximativ
χ2-verteilt
mit
ν = к- 1 = 5
Freiheitsgraden. Die π° sind durch die PV(2) vorgegeben und müssen nicht aus der Stichprobe geschätzt werden. Entscheidungsregel: H0 verwerfen, falls t >
xl_a;v
= Xq,95,-5
= 13*07
ist.
0 ηπ ±
N
10
Entscheidung: 2 Weil
χ0,95;5 = 11,07
ist,
kann
die
Nullhypothese
gnifikanzniveau α = 0,05 nicht verworfen
auf
dem
Si-
werden.
Interpretation: Es g i b t k e i n e n G r u n d , a n d e r R i c h t i g k e i t d e r N u l l h y p o t h e s e zu z w e i f e l n . D a s S t i c h p r o b e n e r g e b n i s s t e h t n i c h t im W i d e r s p r u c h zu d e r V e r m u t u n g , daß d i e A n z a h l d e r a n e i n e m T a g a n gezeigten Kfz-Schäden einer POISSON-Verteilung mit Mittelw e r t μ = 2 f o l g t . E s k ö n n t e j e d o c h e i n F e h l e r 2. A r t v o r l i e g e n . D a s F e h l e n t s c h e i d u n g s r i s i k o ist n i c h t q u a n t i f i z i e r b a r . Aufgabe
16.9
Sie stehen als Mitarbeiter einer staatlichen Spielbankkontrollkommission vor der Aufgabe, einen Würfel auf seine Unv e r f ä l s c h t h e i t zu ü b e r p r ü f e n . I h n e n s t e h e n a l s T e s t v e r f a h r e n ein Mittelwerttest, ein Anteilswerttest oder ein Anpassungstest zur V e r f ü g u n g . D e f i n i e r e n S i e für j e d e n T e s t g e e i g n e t e Z u f a l l s v a r i a b l e , f o r m u l i e r e n S i e j e w e i l s s i n n v o l l e H y p o t h e s e n , u n d e r l ä u t e r n Sie, w e l c h e E i g e n s c h a f t des Würfels damit überprüft w e r d e n kann! Welcher Test erscheint Ihnen am geeignetsten?
Lösung a)
16.9
Mittelwerttest Sei
die Augenzahl beim i-ten Würfeln,
Ist d e r W ü r f e l u n v e r f ä l s c h t , / E
\
(Xi)=
1 6 -
1 1 +
Zu t e s t e n i s t HQ: μ χ
6 -
1 2 +
6 -
so g i l t für d e n
1 3 +
6 -
i =
1 4 +
6 -
Ι,.,.,η. Erwartungswert:
1 5 +
6 '
6
=
3
'5·
somit:
= 3,5 g e g e n H r · μ χ
* 3,5 .
Überprüft werden kann lediglich der Erwartungswert des W ü r f e l s . W i r d H 0 v e r w o r f e n , i s t d i e s e i n I n d i z für e i n e n v e r fälschten Würfel. Allerdings kann auch ein Würfel mit korr e k t e m M i t t e l w e r t e i n v e r f ä l s c h t e r W ü r f e l s e i n (z.B. 1 u n d 6 mit der Wahrscheinlichkeit 0,5). Daher ist dieser Test nicht gut geeignet, die Unverfälschtheit zu prüfen. b)
Anteilswerttest Es g i b t v i e l e M ö g l i c h k e i t e n , d e n A n t e i l zu p r ä z i s i e r e n , z. B. A n t e i l e e i n z e l n e r A u g e n z a h l e n , A n t e i l e d e r g e r a d e n A u g e n zahlen, A n t e i l e der kleinen A u g e n z a h l e n usw.
491
4. Ergänzungen Sei x
z.B.
Γ 1, f a l l s b e i m i - t e n W u r f e i n e 6 f ä l l t i1 = \ η [ 0 s o n stt
Ist der Würfel unverfälscht, von
i = 1, 2,
so g i l t für d e n
. . ., n .
Erwartungswert
XcHi :. * = e ( x J = ± . 6
Die Hypothesen lauten
also:
1 1 H 0 : π = — u n d Η·^ π * — . 6 6 Überprüft w e r d e n kann mit d e m Test dieser Hypothesen, ob die 6 w i r k l i c h m i t e i n e r W a h r s c h e i n l i c h k e i t v o n 1/6 f ä l l t , o d e r o b s i e s e l t e n e r (oder h ä u f i g e r ) g e w o r f e n w i r d . Wird fel
H0 hin.
sein,
deutet
Allerdings
wenn
geworfen mit
verworfen, die
wird
kann
dies ein
6 tatsächlich (z.B.
1 mit
der Wahrscheinlichkeit
auf
mit
der
der
verfälschten
auch
dann
1/6).
Wür-
manipuliert
Wahrscheinlichkeit
Wahrscheinlichkeit
teilswerttest nicht gut geeignet c)
einen
Würfel
Hieraus
folgt,
5/6
daß
1/6
und
der
6
An-
ist.
Anpassungstest Sei
Xj^ d i e A u g e n z a h l b e i m i - t e n W u r f ,
Ist
der
Würfel
unverfälscht,
hat
XL
i = 1, 2,
...,n.
folgende
Wahrschein-
lichkeitsfunktion: f0(l) = f0(2) = f0(3) = f0(4) = f0(5) = f0(6) =
l, b
f 0 (x) = 0 s o n s t . Die Hypothesen lauten
also:
H 0 : f x (x) = f 0 (x), f ü r a l l e x
Η χ : f x (x) * fo( ) '
χ ε Я
und
mindestens ein
χ e 91 .
Überprüft werden kann mit diesem Test die gesamte der X L .
Verteilung
Die d u r c h H 0 spezifizierte V e r t e i l u n g ist gerade die Defin i t i o n d e r U n v e r f ä l s c h t h e i t e i n e s W ü r f e l s . S o m i t ist d e r A n passungstest der am besten geeignete Test für die Beantwortung der gestellten Frage.
A u f g a b · 16.10 Seit 1955 w i r d in der B u n d e s r e p u b l i k " L o t t o a m Samstag" gespielt. Dabei w e r d e n in jeder Ziehung sechs Zahlen aus den von 1 b i s 49 n u m e r i e r t e n K u g e l n o h n e Z u r ü c k l e g e n g e z o g e n (weitere
492
4.
Ergänzungen
gezogene Kugeln wie Zusatzzahl, Superzahl o.ä. werden im folgenden von der Betrachtung ausgeschlossen). In den insgesamt 2360 Ziehungen bis zum Jahresende 2000 wurde die Zahl 13 dabei 235 Mal gezogen. Die Sekretärin Sieglinde W. vermutet, daß die 13 eine Unglückszahl ist und glaubt daher, daß sie bisher viel zu selten gezogen worden ist. a)Nehmen Sie zunächst an, daß jede Zahl bei jeder Ziehung mit gleicher Wahrscheinlichkeit gezogen wird! Wie groß ist unter dieser Voraussetzung die Wahrscheinlichkeit, daß die 13 im Laufe einer Ziehung gezogen wird? b)Beurteilen Sie mit einem geeigneten Verfahren die Hypothese der Sekretärin, daß die 13 im Gegensatz zu allen anderen Kugeln nicht mit gleicher, sondern mit kleinerer Wahrscheinlichkeit gezogen wird! (α = 0,05)
Lösung 16.10 c) Definition der Zufallsvariablen:
{
1, „ falls beim i - ten Zug die 13 gezogen wird, 0 sonst,
für i = 1,...,6. Da die sechs Kugeln einer Ziehung ohne Zurücklegen gezogen werden, sind die X± stochastisch abhängig. Die sind identisch verteilt, weil die Kugeln aus einer "Urne" (Gesamtheit) gezogen werden. 6
Damit
folgt
Verteilung
die
Summe
X' = ^ i=l
einer
hypergeometrischen
н(б,49д).
Die Wahrscheinlichkeit, daß in einer Ziehung die 13 gezogen wird, ist daher:
• Alternative Lösung: Wird jede Zahl mit gleicher Wahrscheinlichkeit gezogen und sind die Xi identisch verteilt, so ist die Wahrscheinlichkeit dafür, daß beim i-ten Zug der Ziehung die 13 gezogen wird, jeweils gleich. Es gilt also:
4. Ergänzungen
P(Xi = 1) = —
493
für alle i.
Da es sich hierbei u m disjunkte Ereignisse handelt, ergibt sich die Wahrscheinlichkeit für die Vereinigung der Ereignisse (daß im Laufe einer Ziehung die 13 gezogen wird) wie folgt: P((X! = 1) и (X2 = 1) и . . . и (X6 = 1)) = P(Xx = 1) + P(X2 = 1) + . . . + P(X6 = 1) = — · 49 d) Da jetzt die Ziehungen als Ganze betrachtet werden, ist eine andere Definition der Zufallsvariablen als in a) erforderlich: 1, falls beim j - ter Ziehung die 13 gezogen wird, 0 sonst, für j = 1, . . .,2360. Die Xj sind stochastisch unabhängig, da die einzelnen Ziehungen zeitlich getrennt stattfinden und sich nicht beeinflussen können. Die Xj sind identisch verteilt, weil die einzelnen Ziehungen stets unter gleichen Bedingungen ablaufen. Sei π = P(Xj = 1) . Wird jede Zahl mit muß gelten:
gleicher Wahrscheinlichkeit
gezogen,
so
6 Ρ(Χή = 1) = — für alle j (H 0 ) . J ΔQ Die Hypothese der Sekretärin werttests überprüft werden. •
kann mit Hilfe
eines
Anteils-
Voraussetzungen: -
Eine einfache Zufallsstichprobe liegt vor
-
die Zufallsvariablen sind 0/1-verteilt;
-
0,1 < π 0 = — < 0,9; 49
-
ηπ0(1 - π0) = 2360 · —
43 · —
= 254 > 9 .
Alle Voraussetzungen sind damit erfüllt! Hypothesen: 6 H0 : π > — 49
gegen Η, : π