193 84 19MB
German Pages 266 [276] Year 1967
Allgemeine Methodenlehre der Statistik von
Dr. phil. Johann Pfanzagl Prof. an der Universität Köln i
Elementare Methoden unter besonderer Berücksichtigung der Anwendungen in den Wirtschafts- und Sozialwissenschaften 4., verbesserte Auflage Mit 51 Abbildungen
Sammlung Göschen Band 746/746 a
Walter de Gruyter & Co. • Berlin 1967 vormals G. J. GÖschen'sche Verlagshandlung • J. Guttentag, Verlagsbuchhandlung • Georg Reimer • Karl J. Trübner • Veit & Comp.
Die Gesamtdarstellung umfaßt folgende Bände: Bandi:
Elementare Methoden unter besonderer Berücksichtigung der Anwendungen in den Wirtschafte- und Sozial Wissenschaften (Sammlung Göschen Band 746/746 a)
Band II:
Höhere Methoden unter besonderer Berücksichtigung der Anwendung in Naturwissenschaft, Medizin und Technik (Sammlung Göschen Band 747/747 a)
© C o p y r i g h t 1967 b y W a l t e r d e G r u y t e r & C o . , v o r m a l s G . J .
Gösdien'scho
V e r l a g s h a n d l u n g — J. G u t t e n t a g V e r l a g s b u c h h a n d l u n g — G e o r g R e i m e r — K a r l J . T r ü b n e r — V e i t & C o m p . , B e r l i n 30. — A l l e R e c h t e , e i n s c h l .
der
R e c h t e d e r H e r s t e l l u n g v o n - P h o t o k o p i e n und M i k r o f i l m e n , v o m V e r l a g v o r b e h a l t e n . — A r c h i v - N r . 75 70 677. — S a t z u n d D r u d e : T h o r m a n n & G o e t s c h , B e r l i n 44. — P r i n t e d in G e r m a n y .
Inhaltsverzeichnis Seite
1 Grundbegriffe 1.1 1.2 1.3 1.4
Einleitung D i e Statistik in den Naturwissenschaften Die Statistik in den Sozialwissenschaften Gegenüberstellung von Natur- und Sozialwissenschaften . . . .
2 Häufigkeitsverteilungen 2.1 2.2 2.3 2.4
Artmäßige und zahlenmäßige Merkmale Diskrete und stetige Merkmale Extensive und intensive Merkmale Häufigkeitsverteilungen
3 Parameter 3.1 3.2 3.3 3.4
Lage-Parameter Streuungs-Parameter Der Variationskoeffizient Konzentrationsmaße
4 Allgemeine Theorie der Maßzahlen 4.1 4.2 4.3 4.4 4.5 4.6 4.7 4.8
Die Konstruktion von Maßzahlen Verhältniszahlen Meßzahlen Gliederungszahlen Beziehungszahlen Der Mittelwert von Verhältniszahlen Standardisierung Transplantation
5 Die Berechnung von Indexzahlen 5 1 5.2 5.3 5.4 5.5 5.6
Grundsätzliches Die Formeln von Laspeyres und Paasche Sub-lndizes Bepräsentat ion Erweiterung des Index-Schemas Substitution
6 Einige Beispiele für Indexzahlen 6.1 6.2 6.3
Index der Großhandelspreise In lex der Einzelhandelspreise Index der Verbraucherpreise
7 7 7 8 10
13 13 15 16 16
19 20 26 31 33
37 37 41 42 50 53 57 59 66
67 67 70 73 74 75 78
81 81 83 83
4
Inhaltsverzeichnis 6.4 Kaufkraftvergleiche 6.5 Lohnindizes 6.6 Reallohnvergleiche . 6.7 Volumenindizes und Umsatzindizes 6.8 Produktionsindizes 6.9 Produktivitätsindizes
Seite 87 89 91 92 93 96
7 Bestandsmassen — Bewegungsmassen 7.1 7.2 7.3 7.4 7.5 7.6
Grundbegriffe Der Durchschnittsbestand Analyse der Verweildauer D i e mittlere Verweildauer Abgangsordnung und Verteilung der Verweildauer Konstruktion stationärer Massen
8 Die Analyse von Zeitreihen 8.1 8.2 8.3
Ausschaltung von irregulären Schwankungen Gleitende Durchschnitte Methodische Bemerkungen zur Berechnung der gleitenden Durchschnitte 8.4 D i e Differenzenmethode 8.5 D i e Ausschaltung von Saisonschwankungen 8.6 Methoden für konstante Saisoniigur 8.7 Methoden für Saisonfigur mit variabler Amplitude 8.8 Methoden für bewegliche Saisonfigur 8.9 Harmonische Analyse 8.10 Schlußbemerkungen
9 Stichproben 9.1 9.2 9.3 9.4 9.5 9.6 9.7 9.8 9.9 9.10 9.11 9.12 9.13 9.14 9.15 9.16
Grundbegriffe Der Zufallsfehler des Mittelwertes Der Zufallstehler der relativen Häufigkeit Die Bestimmung des Stichprobenumfanges Fiktive Gesamtheiten Die geschichtete Stichprobe Die optimale Stichprobe D i e proportionale Stichprobe D i e Auswahl der Schichten Vergleich zwischen den Schichten Die Klumpenstichprobe Vergleich von Schichten und Klumpen Die mehrstufige Stichprobe Die Technik der Zufallsauswahl Das Problem der Nichtbeantwortung Verhältnis-Schätzung
10 Statistische Fehler Zufällige und systematische F e h l e r Fehler bei der Erfassung der Gesamtheit Fehler bei der Erfassung der Daten D i e Bedeutung systematischer und zufälliger Fehler bei der Stichprobenerhebung 10.5 D i e Interpretation fehlerbehafteter Zahlen 10.1 10.2 10.3 10.4
97 97 100 104 105 111 114
119 119 120 123 128 129 133 138 139 142 143
144 144 146 150 153 156 159 162 166 171 173 175 177 178 179 187 191
199 193 193 195 203 205
Inhaltsverzeichnis
5 Seite
Technischer Anhang 11 Die Gewinnung des Zahlenmaterials 11.1 11.2 11.3
211
Die Abgrenzung der Erhebungsmasse und die Festlegung der Erhebungsmerkmale 211 Die Auswahl der Erhebungseinheiten und des Erhebungsverfahrens 214 Die Aufbereitung 216
12 Die rechnerische Behandlung des Zahlenmaterials 12.1 12.2
Die Berechnung von Mittelwert und Varianz Die Berechnung von Median und durchschnittlicher weichung 12.3 Das Rechnen mit fehlerbehafteten Zahlen 12.4 Die Kompensation unabhängiger Fehler
13 Die Darstellung des Zahlenmaterials 13.1 13.2 13.3 13.4 13.5 13.6 13.7
D i e graphische Darstellung von Häufigkeitsverteilungen Die Gestaltung von Tabellen Kurvendiagramme Stabdiagramme, Flädiendiagramme Darstellung einer Struktur Kartogramme Bildstatistiken
221 Ab-
221 225 228 229
230 230 233 236 240 242 243 244
Tabelle
249
Literatur
251
Namen- und Sachverzeichnis
262
1 Grundbegriffe
1.1 Einleitung Vielfach wird die Statistik als die Lehre von der Analyse von Massenerscheinungen definiert. Während sich früher die Anwendung der Statistik tatsächlich auf große Mengen bezog, wie durch das Wort „Masse" suggeriert wird, tritt gerade in der neueren Statistik die Analyse von Stichproben kleinen Umfanges in den Vordergrund, so daß das Wort „Masse" in der obigen Definition heute nur als „Mehrheit von Individuen" interpretiert werden darf. Natürlich ist nicht jede Analyse von Massenerscheinungen Statistik. Das charakteristische Kennzeichen der statistischen Analyse ist, daß sie sich formaler Modellvorstellungen bedient. Die statistischen Methoden sind insbesondere zur Analyse von Erscheinungen geeignet, die unkontrollierten Einflüssen ausgesetzt sind. Dabei spielen sog. stochastische (d. h. auf der Wahrscheinlichkeitstheorie aufbauende) Modelle eine besondere Rolle. 1.2 Die Statistik in den Naturwissenschaften Wenn der Physiker alle Bedingungen eines Experimentes mit beliebiger Präzision festlegen kann, braucht er keine Statistik, um die Ergebnisse dieses Experimentes auszuwerten. Er braucht die Statistik jedoch dann, wenn gewisse unkontrollierte Einflüsse da sind, welche eine merkliche „Streuung" der Meßergebnisse verursachen. Dies trifft in der Physik oder Chemie bei Laboratoriumsexperimenten seltener zu als etwa bei biologischen oder psychologischen Experimenten, bei denen sich schon aus der Natur des Materials heraus unkontrollierbare Einflüsse ergeben. Es gilt jedoch vor allem dann, wenn man die Sphäre des Laboratoriumsexperimentes verläßt und sich in die Fabrik, auf das Feld oder in das Krankenhaus
8
1 Grundbegriffe
begibt: Hier sind die Möglichkeiten des „Experimentierens" sehr beschränkt. Viele maßgebliche Bedingungen sind vorgegeben, können nicht nach Belieben variiert werden — und trotzdem müssen aus den Daten ähnliche Schlüsse gezogen werden wie aus den Laboratoriumsexperimenten, bei denen man einen viel größeren Teil der Bedingungen nach Belieben festlegen kann. Wenn man eine Untersuchung darüber anstellt, ob — und wie — die Haltbarkeit von Kokillen von der chemischen Zusammensetzung des gegossenen Eisens abhängt, kann man nidit mit einem großen Experiment beginnen und Eisensorten mit den verschiedensten chemischen Zusammensetzungen unter genormten Bedingungen gießen. Man ist praktisch darauf angewiesen, die Abhängigkeit aus den verfügbaren Aufzeichnungen „herauszurechnen". Und in diesen Aufzeichnungen spiegeln sicäi natürlich alle Einflüsse des normalen Betriebsgeschehens wider und verdecken den Einfluß der chemischen Zusammensetzung vor dem oberflächlichen Betrachter. Oder: Es soll ein neues Mittel zur Behandlung der Rhesus-Inkompatibilität erprobt werden. Auch hier ist man gezwungen, die Erprobung an einem sehr inhomogenen Material vorzunehmen: Frauen, die bereits frühere Geburten hinter sich haben, Frauen, bei denen es sich um die erste Geburt handelt. Die früheren Geburten können mit oder ohne Komplikationen verlaufen sein. Es kann eine Reihe von Interruptionen vorliegen usw. usw. Alle diese Faktoren können auf den Behandlungseffekt von Einfluß sein. Auch wenn man eine gewisse Auslese trifft, verbleibt stets eine große Zahl unkontrollierbarer Einflüsse, die unter Umständen den Effekt der Behandlungsmethode bei oberflächlicher Betrachtung verdecken können. 1.3 Die Statistik in den Sozialwissenschaften Was hier für Technik und Medizin gesagt wurde, gilt in noch wesentlich stärkerem Ausmaß für die Analyse wirtschaftlicher und soziologischer Phänomene. Auch hier
1.3 D i e Statistik i n den Sozialwissensdiaften
9
ist natürlich die Möglichkeit von Experimenten gegeben. Wenn eine große Werbekampagne vorbereitet wird, kann man zwei einander möglichst ähnliche, aber voneinander isolierte Städte auswählen und in einer der beiden Städte eine Probe-Werbekampagne durchführen, um sodann die Umsatzentwicklung in beiden Städten zu vergleichen. Man hat auf diese Art verschiedene Einflüsse, wie die saisonale und konjunkturelle Entwicklung, unter Kontrolle gebracht, wenn sich saisonale und konjunkturelle Einflüsse in beiden Städten stets in gleicher Weise auswirken. Jeder Unterschied in der Entwicklung zwischen beiden Städten wird daher mutmaßlich auf den Einfluß der Werbekampagne zurückzuführen sein. (Wesentlich zuverlässigere Ergebnisse erhält man natürlich, wenn man dieses Experiment nicht mit einem einzelnen Städtepaar, sondern mit mehreren durchführt.) Die Möglichkeit, unter „kontrollierten" Bedingungen zu arbeiten, ist jedoch bei wirtschaftlichen und soziologischen Analysen beschränkter als in den meisten anderen Wissenschaften*). Eine ähnlich ungünstige Situation wie in den Sozialwissenschaften finden wir übrigens auch in der Meteorologie, und es ist nicht uninteressant, festzustellen, daß die statistischen Methoden in der Meteorologie ähnlich denen in den Sozialwissenschaften sind: emsiges Sammeln von Urmaterial, Korrelationsberechnungen, Zeitreihenanalysen usw. Die typische Aufgabe der Wirtschaftsstatistik ist die Analyse von Daten, die von sehr vielen unkontrollierten Faktoren beeinflußt sind. Hier ein Beispiel: Es ist zu beurteilen, ob das „Niveau" der Konsumentenpreise eine steigende Tendenz aufweist oder nicht. Die Fakten: In den letzten Monaten haben sich bei verschiedenen Waren Preissteigerungen, vereinzelt auch Preissenkungen, ergeben. Hier und da ist eine Ware in einer völlig neuen Qualität auf den Markt gekommen und hat •) Wie Morgenstern betont, sind allerdings auch im Bereiche der Wirtschaft weit mehr Experimentiermöglidikeiten gegeben, als tatsächlich ausgenutzt werden.
10
1 Grundbegriffe
— trotz höheren Preises — das Interesse der Konsumenten auf sich gezogen. Einige der Preissteigerungen sind lediglich saisonbedingt — vielleicht im konkreten Fall wegen eines kalten Frühjahres besonders ausgeprägt. Andere Preissteigerungen dürften auf Panikkäufe zurückzuführen sein und sind daher mutmaßlich nur vorübergehender Natur. Wir haben hier eine sehr komplexe Situation vor uns, welche von einer großen Zahl unkontrollierter Faktoren beeinflußt ist. Es ist zu beurteilen, ob das „Preisniveau" tatsächlich in Bewegung ist, ob deflatorische Maßnahmen notwendig erscheinen oder nicht. Hier ist natürlich ein Experiment undenkbar: Man kann nicht das Geschehen der letzten Monate nochmals abrollen lassen unter „kontrollierten" Bedingungen, also den saisonalen Einfluß (oder zumindest die abnorm niedrige Temperatur des Frühjahrs) und die Panikkäufe eliminieren und beobachten, wie sich das von diesen Störungen befreite „Preisniveau" entwickelt hätte. Man ist vielmehr gezwungen, die Schlüsse aus den das tatsächliche Geschehen betreffenden Daten zu ziehen, vor allem durch Zuhilfenahme von Vergleichsdaten aus anderen Perioden (durch Studium der Auswirkungen saisonaler Einflüsse in den vorhergehenden Jahren, durch Studium der Auswirkungen von Panikkäufen in früheren Zeitpunkten oder zur gleichen Zeit in anderen Ländern u. ä.). 1.4 Gegenüberstellung von Natur- und Sozialwissenschaften Die hier skizzierten Beispiele zeigen eine große Variation in der Aufgabe, die der Statistik gestellt ist. Das eine Extrem: das Experiment, bei dem ein großer Teil der Einflußfaktoren beliebig festgelegt werden kann, so daß die Auswirkungen der übrigen — unkontrollierten — Einflüsse mehr oder minder den Charakter von Zufallsschwankungen tragen. Hier besteht die Aufgabe der Statistik darin, bei der Planung des Experimentes mitzuwirken (die Größe der kontrollierten Einflußfaktoren festzulegen usw.) und bei der Auswertung die Größe der zufälligen Einflüsse zu beurteilen. Das andere Extrem: die
1.4 Gegenüberstellung von Natur- u. Sozialwissenschaften
11
Analyse von Daten, welche eine unkontrollierte Situation betreffen. Hier ist zu entscheiden: Welche Einflußfaktoren sind bei der Erhebung der Daten zu berücksichtigen? Die sorgfältige Aufzeichnung der verschiedenen tatsächlich auftretenden Kombinationen von Einflußfaktoren muß jene Informationen liefern, die man im Experiment durch planmäßige Festlegung der Einflußfaktoren erhält. Noch ein zweiter Umstand beeinflußt den Charakter und die Anwendbarkeit der statistischen Methoden entscheidend: in allen Fällen wird die statistische Arbeitsweise dadurch charakterisiert, daß sich der Statistiker von vornherein von einem beträchtlichen Teil jener Kenntnisse lossagt, über die er für jede einzelne Beobachtungseinheit verfügt oder wenigstens verfügen könnte, und daß er sich nur mit jenen Angaben über die Einheiten begnügt, die über diese bei der Erhebung registriert werden." (Anderson, „Statistische Methodenlehre", S. 6). An die Stelle der tatsächlich existierenden Einheit, des tatsächlichen Geschehens, tritt der „statistische Schatten", wie Anderson sagt, in dem nur einzelne Merkmale der Wirklichkeit registriert sind. Der Einzelfall verliert seine Individualität, er geht in einer Gruppe von Fällen auf, die alle die gleiche Merkmalskombination aufweisen, deren „statistische Schatten" identisch sind. Dieser Verlust der Individualität muß keine schwerwiegende Einbuße an Informationen mit sich bringen: Die Unfallversicherung weiß nicht, wer im nächsten Jahr einen Unfall erleiden wird und welches die näheren Begleitumstände dieses Unfalles sein werden, — aber sie weiß aus der Erfahrung vergangener Jahre, wieviele Unfälle es ungefähr sein werden, wieviele davon tödlich verlaufen werden usw. Für die Zwecke der Versicherung genügen diese Informationen. Entscheidend ist nicht der Verlust der Individualität, sondern die Frage, ob es möglich ist, alle relevanten Umstände im „statistischen Schatten" zu berücksichtigen. Vielfach kann man wirklich alle relevanten Merkmale registrieren: Wenn genetische Untersuchungen mit irgendwelchen Fliegen durchgeführt wer-
12
1 Grundbegriffe
den, ist es irrelevant, ob die Tiere gefangen oder gezüchtet wurden, wie alt und wie groß sie sind, ob sie 6 Beine haben oder eines davon durch einen Unglücksfall einbüßten: Wesentlich ist der Genotypus, und dieser kann durch seinen „Schatten" genau beschrieben werden. Die Vernachlässigung soundso vieler Merkmale bringt hier keinen Verlust an relevanten Informationen mit sich. Bedenken wir nun anderseits die Probleme, die sich bei einer Untersuchung über den Zusammenhang von Wohlstand und Kinderzahl ergeben. Hier gibt es eine Reihe psychologischer Faktoren (Wunsch nach Ungebundenheit, Angst vor Kriegsgefahr usw.), welche den zu untersuchenden Sachverhalt maßgeblich beeinflussen, die aber in den „statistischen Schatten" kaum aufgenommen werden können, die statistisch schwer erfaßbar sind. Die Vernachlässigungen, zu denen die Statistik bei der Behandlung wirtschaftlicher, soziologischer oder psychologischer Fragen gezwungen ist, sind bedeutend relevanter als in der Technik, Biologie oder Medizin. Daraus und aus dem unterschiedlichen Grad der „Kontrollierbarkeit" ergibt sich eine starke Differenzierung in der Art der zur Anwendung gelangenden statistischen Methoden. So sind es bei sozialwissenschaftlichen Untersuchungen eher die elementaren Methoden, welche sinnvolle Anwendung finden, während die fruchtbarsten Anwendungsgebiete der verfeinerten Methoden in den Naturwissenschaften (Technik, Biologie, Medizin usw.) liegen. Daraus ergibt sich eine natürliche Unterteilung des Stoffgebietes: Band I der vorliegenden Methodenlehre wendet sich vor allem an den Statistiker in den Sozialwissenschaften, Band II an den Statistiker in den Naturwissenschaften. Diese Trennung ist jedoch keineswegs streng: Der Statistiker in den Sozialwissenschaften wird immer wieder auf Fragen stoßen, welche verfeinerte Methoden erfordern, die erst in Band II behandelt werden. Umgekehrt wird der an den höheren Methoden interessierte naturwissenschaftliche Statistiker auf wesentliche Teile des I. Bandes als Vorbereitung angewiesen sein.
2.1 Artmäßige und zahlenmäßige Merkmale
13
2 Häufigkeitsverteilungen Wie bereits eingangs ausgeführt wurde, besteht das Wesen der statistischen Methoden darin, daß von jeder bei einer Erhebung erfaßten Einheit gewisse Merkmale registriert werden. Es soll daher zunächst ein systematischer Überblick über die Natur der Merkmale gegeben werden. 2.1 Artmäßige und zahlenmäßige Merkmale Herkömmlicherweise unterscheidet man zwischen artmäßigen (qualitativen) und zahlenmäßigen (quantitativen) Merkmalen. Typische Beispiele für artmäßige Merkmale sind das Geschlecht, der Familienstand und der Beruf; im Falle der Außenhandelsstatistik: die Art einer Ware oder das Bestimmungsland. Zahlenmäßige Merkmale sind etwa das Alter oder das Einkommen einer Person, die exportierte Menge u. ä. Selbstverständlich wird ein artmäßiges Merkmal nicht dadurch zu einem zahlenmäßigen, daß man den einzelnen Ausprägungen Zahlen zuordnet: So ist die Steuerklasse, deren Ausprägungen durch die Zahlen 1, 2, 3, . . . charakterisiert werden, natürlich ein artmäßiges Merkmal und kein zahlenmäßiges (es hätte wenig Sinn, festzustellen, daß sich die durchschnittliche Steuerklasse von 2,1 auf 2,2 verschoben hat). Die Unterscheidung in artmäßige und zahlenmäßige Merkmale erweist sich für die meisten Zwecke der Sozialstatistik als ausreichend. Für die Anwendung verfeinerter statistischer Methoden ist sie jedoch zu oberflächlich. Neben artmäßigen Merkmalen wie Geschlecht oder Beruf, deren einzelne Ausprägungen wirklich verschiedenartig sind, gibt es auch solche, bei denen sich die einzelnen Ausprägungen im wesentlichen nur durch ihre Intensität unterscheiden. Das einfachste Beispiel liefert die Notenskala: „sehr gut", „gut", „befriedigend", „ausreichend", „mangelhaft", „ungenügend". Hier ist eine eindeutigeOrd-
14
2 Häufigkeitsverteilungen
nung (Reihenfolge) vorgegeben, zum Unterschied etwa von dem Merkmal „Beruf", für dessen einzelne Ausprägungen (Tischler, Schneider, Verkäufer usw.) es keine natürliche Anordnung gibt. Ebenso kann man bei der Qualitätskontrolle die Produkte nach ihrer Fehlerhaftigkeit in Gruppen (1., 2., 3. Wahl) einteilen. Bei diesen Merkmalen ist eine natürliche Ordnung gegeben, die man selbstverständlich auch irgendwie durch Zahlen ausdrücken kann, bei denen diese Zahlen aber eben bloß diese Ordnung angeben und nicht mehr. Die Berechnung von Durchschnittswerten hat in diesem Falle wenig Sinn. (Dies gilt auch für die Schulnoten!) Selbst unter den zahlenmäßigen Merkmalen gibt es eine ganze Reihe, die im Grunde genommen bloß eine Ordnung zum Ausdruck bringen, so z. B. die Dioptrie — aufgefaßt als Maß für die Sehschärfe des Auges. Wir haben für diese Merkmale zwar eine konventionell festgelegte Zahlenskala; sie unterscheiden sich jedoch von den weiter unten besprochenen echten zahlenmäßigen Merkmalen dadurch, daß ihre Skala beliebigen monotonen Transformationen unterworfen werden kann, ohne daß sich deren Aussagegehalt ändert. Solche Skalen werden als topologische Skalen bezeichnet. Geordnete artmäßige Merkmale und zahlenmäßige Merkmale, deren Skala beliebigen monotonen Transformationen unterworfen werden kann, gehören logisch gesehen in eine Klasse: Es sind Merkmale, für die es eine natürliche Ordnung gibt. Ob diese Ordnung durch eine Zahlenskala repräsentiert wird oder nicht, ist im Grunde genommen nebensächlich. Daneben gibt es die sogenannten metrischen Skalen, die wir vor allem in der Physik finden: die Länge, das Gewicht, der elektrische Widerstand usw. Ein Widerstand von 200 Q ist doppelt so groß wie ein Widerstand von 100 Q, denn zwei Widerstände von je 100 Q in Serie geschaltet ergeben tatsächlich einen Widerstand von 200 Q. Hingegen wäre es sinnlos, festzustellen, daß eine Kurzsichtigkeit von 4 Dioptrien doppelt so stark ist wie eine von 2 Dioptrien. Metrische Skalen dürfen nicht mehr be-
2.2 Diskrete und stetige Merkmale
15
liebigen monotonen Transformationen unterworfen werden: Sie sind in der Regel eindeutig bis auf die Wahl der Maßeinheit. 2.2 Diskrete und stetige Merkmale Ein zweiter Einteilungsgesichtspunkt ist die Unterscheidung von diskreten und stetigen Merkmalen. Bei diskreten Merkmalen sind nur ganz bestimmte Ausprägungen möglich. Diskrete Merkmale basieren in der Regel auf einem Zählvorgang. Beispiele für solche Merkmale sind: Anzahl der Kinder, die eine Frau geboren hat, Anzahl der Beschäftigten eines Betriebes usw. Stetige Merkmale sind solche, die jeden beliebigen Wert — zumindest innerhalb eines gewissen Intervalls — annehmen können. Stetige zahlenmäßige Merkmale basieren in der Regel auf einem Meßvorgang. Beispiele für solche Merkmale sind: das Alter einer Person, ihre Körpergröße, ihr Gewicht usw. Die Unterscheidung zwischen stetigen und diskreten Merkmalen wird in der Regel nur auf zahlenmäßige Merkmale angewendet. Sie ist jedoch auch bei artmäßigen Merkmalen sinnvoll, sofern eine natürliche Ordnung gegeben ist. Selbstverständlich ist die Unterscheidung zwischen diskreten und stetigen Merkmalen eher graduell als prinzipiell. Das Gewicht einer Person ist ein stetiges, ihr Einkommen jedoch ein diskretes Merkmal, denn es kann — in Pfennigen ausgedrückt — nur ganzzahlige Werte annehmen. In der methodischen Behandlung besteht jedoch zwischen so fein abgestuften diskreten Merkmalen wie dem Einkommen (oder gar dem Umsatz eines Betriebes) und einem stetigen Merkmal kein Unterschied. Hingegen besteht ein ausgeprägter Unterschied in der methodischen Behandlung zwischen einem stetigen Merkmal und einem diskreten Merkmal mit einem kleinen Wertevorrat, wie es etwa die Kinderzahl darstellt. Umgekehrt wird ein stetiges Merkmal sehr oft „gruppiert" und dadurch für die statistische Behandlung zu einem diskreten Merkmal: So wurden in Tab. 3, S. 19, die Neu-
16
2 Häufigkeitsverteilungen
geborenen nach ihrer Größe in Gruppen zusammengefaßt. Ebenso wird oft einfach zwischen Rauchern und Nichtrauchern unterschieden, anstatt die Intensität des Rauchens zu erfassen. 2.3 Extensive und intensive Merkmale
Im Bereiche der zahlenmäßigen Merkmale kann man nach Flaskämper („Allgemeine Statistik", Teil I, S. 40) weiter unterscheiden zwischen extensiven und intensiven Merkmalen. Extensive Merkmale betreffen den Umfang einer Erscheinung, intensive Merkmale ihren Inhalt. Formal gesehen sind extensive Merkmale solche, bei denen die Summe einen Sinn hat, intensive Merkmale solche, bei denen nur Mittelwerte sinnvoll sind. Extensive Merkmale sind z. B. die Anzahl der Einwohner eines Landes, denn man kann sie mit den analogen Zahlen anderer Länder zu einer größeren Einheit zusammenfassen, z. B. die Einwohnerzahlen der europäischen Länder zu einer Einwohnerzahl Europas; ferner Wertangaben, etwa der Umsatz im Monat Januar, der mit den Umsätzen anderer Monate zu einem Jahresumsatz zusammengefaßt werden kann. Intensive Größen sind beispielsweise die Preise: Man kann zwar einen mittleren Preis errechnen, aber die Summe von Preisen für sich hat keine Bedeutung. Extensiv-intensiv schließen einander jedoch nicht aus. Der Lohn beispielsweise kann sowohl als extensives als auch als intensives Merkmal aufgefaßt werden. 2.4 Häufigkeitsverteilungen
Um einen Überblick über die Struktur einer Masse zu geben, kann man bei einem diskreten (art- oder zahlenmäßigen) Merkmal einfach angeben, wieviele Fälle (oder welcher Anteil oder Prozentsatz) auf jede einzelne Ausprägung desselben entfallen. Diese Zusammenstellung der Ausprägungen mit den zugehörigen Häufigkeiten nennt man Häufigkeitsverteilung. Oft wird die Häufigkeitsverteilung nicht nur in Form einer Tabelle angegeben (s. Tabelle 1), sondern auch graphisch dargestellt (Bild 1).
2.4 Häufigkeitsverteilungen
17
Tabelle 1 Wohnbevölkerung der B R D am 6. 6. 1961 nach dem Familienstand Familienstand
Häufigkeit in 1 0 0 0 in %
ledig verheiratet verwitwet geschieden Wohnbevölkerung
insgesamt
22 264 26 375 4 530 796
41,2 48,9 8,4 1,5
53 965
100,0
Quelle: Wirtschaft und Statistik 1963, S. 530.
/o
Bild 1. Wohnbevölkerung der Bundesrepublik Deutschland am 6. 6.1961, aufgegliedert nach dem Familienstand. Die in Tab. 1 angegebenen % - Z a h l e n werden relative Häufigkeiten genannt. E s handelt sich dabei um die Besetzungszahlen der einzelnen Ausprägungen, bezogen auf 2
Pfanzagl I
2 Häufigkeitsverteilungen
18
die Gesamtzahl der Fälle. Diese wird entweder gleich 1 gesetzt oder gleich 100, wie in unserem Beispiel. Ein weiteres Beispiel einer Häufigkeitsverteilung über einem diskreten Merkmal gibt folgende Tabelle: Tabelle 2 Aufgliederung der Münchener Familien nach der Zahl der ledigen Kinder (Ergebnisse einer repräsentativen Sonderaufbereitung mit einem Auswahlsatz von 10 °/o anläßlich der Volkszählung vom 6. Juni 1961). Kinderzahl
Häufigkeit
i
absolut
relativ
0
198 540
0,5260
1
111 580
0,2956
2
48 400
0,1282
3
13 600
0,0360
4 und mehr
5 340
0,0142
Quelle: „Münchner Statistik", Jg. 1966, Nr. 1/2, S. 62.
Bei den stetigen Merkmalen liegt die Situation etwas anders: Um die Struktur der Masse beschreiben zu können, muß man hier erst eine künstliche Gruppeneinteilung schaffen (siehe Tabelle 3, S. 19). Dabei erweist es sich oft als zweckmäßig, die Breite der einzelnen Gruppen unterschiedlich zu wählen, z. B. bei einer Verteilung, bei der die Randgruppen sonst zu schwach besetzt wären (siehe Tabelle 3, S. 19).
2.4 Häufigkeitsverteilungen
19
Tabelle 3 Aufgliederung neugeborener Kinder nach der Größe Gruppengrenzen (Die obere Grenze zählt nicht zur Gruppe)
30—35 35—40 40—42 42—44 44—46 46—47 47—48 48—49 49—50 50—51 51—52 52—53 53—54 54—55 55—56 56—58 58—60 insgesamt
Häuf gkeit absolut
in %
31 75 57 70 238 253 485 899 1612 2506 2090 1413 721 337 123 58 3
0,28 0,68 0,52 0,64 2,17 2,31 4,42 8,20 14,69 22,84 19,05 12,88 6,57 3,07 1,12 0,53 0,03
10 971
100,00
Quelle: Unveröffentlichte Seminararbeit des Stat. Instituts der Universität W i e n .
Die graphische Darstellung von Häufigkeitsverteilungen wird im Anhang, S. 230 ff., behandelt. 3 Parameter Bei vielen Problemen ist es zweckmäßig, nicht die Verteilung selbst zu betrachten, sondern nur eine (oder einige) ihrer charakteristischen Größen. Solche charakte2°
20
3 Parameter
ristische Größen sind der Mittelwert, der Median, die Varianz, die Schiefe etc. Diese Größen werden als Parameter bezeichnet. Ihre Definition setzt voraus, daß es sich um zahlenmäßige Merkmale handelt. Wichtig ist die Unterscheidung zwischen Lage-Parametern und Streuungs-Parametem. 3.1 Lage-Parameter a) Das arithmetische Mittel: Gegeben seien n Zahlen: ai, 02, ... an. Unter dem arithmetischen Mittel ä dieser n Zahlen verstehen wir: 5 = — (aj + a2 +... n
+ an) oder, unter
Verwendung Das arithmetische Mittel hat vor allem bei extensiven Größen eine anschauliche Bedeutung, da dort auch die Summe eine anschauliche Bedeutung hat: Der durchschnittliche Seifenverbrauch — das ist der gesamte Seifenverbrauch gleichmäßig auf alle Personen aufgeteilt — oder umgekehrt: Der Durchschnitts-Verbrauch multipliziert mit der Anzahl der Personen gibt den Gesamt-Verbrauch. Allgemein: Das arithmetische Mittel multipliziert mit der Anzahl der Fälle ergibt die Summe. Dies ist eine der wichtigsten Eigenschaften des arithmetischen Mittels. Neben seiner anschaulichen Bedeutung gibt es auch gewisse theoretische Gründe, die dem arithmetischen Mittel eine ausgezeichnete Stellung einräumen: So ist es beispielsweise möglich, aus dem arithmetischen Mittel zweier Gruppen und den zugehörigen Besetzungszahlen (d. h. der Anzahl der Einheiten in den einzelnen Gruppen) das gemeinsame arithmetische Mittel zu berechnen: B e i s p i e l : Auf Grund von Erhebungen des Statistischen Bundesamtes in Industriebetrieben mit 10 und mehr Beschäftigten betrug die im Jahre 1960 pro Arbeiter ausbezahlte Lohnsumme im Durchschnitt 5649 DM. Die im Jahre 1960 pro Angestellten ausbezahlte Gehaltssumme betrug 8851 DM. Die Zahl der Arbeiter betrug 6 311000, die Zahl der Angestellten 1 4 6 5 000. Aus diesen Angaben können wir leicht
3.1 Lage-Parameter
21
die Lohn- und Gehaltssumme pro Beschäftigten errechnen, die uns Aufschluß über das durchschnittliche Jahreseinkommen der in der Industrie beschäftigten Personen gibt: Lohnsumme pro Arbeiter Gehaltssumme pro Angestellten
A nTO hl Anzahl der Arbeiter
Lohn-
Anzahl derAnge- = stellten
Gehaltssumme
Lohn-und Gehaltssumme: Anzahl der Beschäftigten: Lohn- und Gehaltssumme pro Beschäftigten:
5 649 DM x 6 311000 = 35 651 Mill. DM
8 851 DM x 1465 000 = 12 967 Mill. DM
48618 Mill. DM 7 776 000 6 252 DM
Die Lohn- und Gehaltssumme wird also als gewogenes arithmetisches Mittel aus der Lohnsumme pro Arbeiter und der Gehaltssumme pro Angestellten berechnet: Gewichte sind die Zahl der Arbeiter bzw. die Zahl der Angestellten. Das Ergebnis ist natürlich verschieden von dem ungewogenen arithmetischen Mittel 5649 + 8851 = 7 2 g
2
Allgemein versteht man unter einem gewogenen arithmetischen Mittel einen Ausdruck der Form Gi ai + Gsfl2+ • • • + Gn an
G1 + G2 + . 7. + Gn
Die Größen Gi, G2, ... G„ heißen Gewichte. Ein gewogenes arithmetisches Mittel läßt sich auch noch in folgender Form anschreiben:
gl ai + g2 a,2 + • • • + gn dn, Gi wobei gi = - , daher gi + g2 + . . . + gn = 1. 2G, .-3)2
1 =
1
Dabei ist a das arithmetische Mittel von a\, az, ... an. Die Größe s wird als Standardabweichung bezeichnet. Es ist eher die Standardabweichung als die Varianz, die dem anschaulichen Begriff der „Streuung" entspricht: Wird die Abweichung jedes Einzelwertes vom Mittelwert verdoppelt, so verdoppelt sich die Standardabweichung, während sich die Varianz vervierfacht. Die Standardabweichung hat die gleiche Dimension wie die Ursprungswerte. (Haben diese die Benennung cm, so hat die Standardabweichung gleichfalls die Benennung cm, die Varianz hingegen die Benennung cm1.) Die Standardabweichung kann daher — zum Unterschied von der Varianz — sinnvoll mit irgendwelchen Lage-Parametem verglichen werden (siehe Abschnitt 3.3). Trotzdem wird in der mathematischen Statistik fast ausschließlich die Varianz verwendet, weil sich die meisten Formeln der Stichprobentheorie mit der Varianz übersichtlicher ausdrücken lassen als mit der Standardabweichimg. *) Zitiert nach Wallis und Roberts, „Statistics— a new approach", S. 80.
3.2 Streuungs-Parameter
29
Beredinet man die Standardabweichung (oder die Varianz) nicht für die Abweichungen vom arithmetischen Mittel ä, sondern von irgendeinem anderen Lage-Parameter, so erhält man stets einen größeren Wert. Das arithmetische Mittel hat also bei der Berechnung insofern eine besondere Stellung, als es unter allen denkbaren Lage-Parametern jener ist, der den kleinsten Wert der Standardabweichung ergibt. Dies ist die sog. „Minimumseigenschaft des arithmetischen Mittels". Die Frage der möglichst zweckmäßigen numerischen Berechnung von Varianz und Standardabweichung wird im Anhang, S. 221 ff. behandelt. b) Durchschnittliche Abweichung: Unter der durchschnittlichen Abweichung der Zahlen a\, ai, ... an verstehen wir: n n Für a" wird in der Regel der Median 5, manchmal auch das arithmetische Mittel ä verwendet. Verwendet man bei der Berechnung der durchschnittlichen Abweichungen statt des Medians irgendeinen anderen Lage-Parameter, so erhält man stets einen größeren Wert. Der Median spielt für die durchschnittliche Abweichung eine ähnliche Rolle wie das arithmetische Mittel für die Standardabweichung: Er ist unter allen denkbaren Lage-Parametern jener, der den kleinsten Wert der durchschnittlichen Abweichung ergibt. (Minimumseigenschaft des Medians.) Die durchschnittliche Abweichung hat — ähnlich der Standardabweichung — die gleiche Dimension wie die Ursprungswerte. Die Frage der möglichst zweckmäßigen numerischen Berechnung der durchschnittlichen Abweichung wird im Anhang, S. 225 ff. behandelt.
30
3 Parameter
Varianz (Standardabweichung) und durchschnittliche Abweichung sind nur dann sinnvolle Maße, wenn die Skala eindeutig bis auf lineare Transformationen ist. c) Quantile: Es seien n Zahlen a\, ... an gegeben. Diese denken wir uns der Größe nach geordnet und durchnumeriert. Unter dem p-Quantil äp verstehen wir OS O (M O
ffl &
(U C ¡¡J < * " o" eo" eiCT>"VI in io OMCO>jtotooH(!3mai i— 9 ä (D M 'S a ßCO a) c ^ B SP 13 > o § 2M U -S ¡3 p ho o Ü .a B es « 'S N T3
c
tu
P< ft s M VM 4—| 5a> m
o o i-H ca Ol 00, 00 CO, 00 oo i-H or 05 t-i cd ci oT1 CD oo" CO CO co" oo" o" CO C O ii--H oi-H 00 oI-H i-H H 00 •«J i-H in t> •wi-H
fr-
CO o t- t- CO CO o CO o oo Oi TP °>„ co, 05 I> CO ro CO 00 oq ^ pH i T o" i-H o" o" i-H o" i-H co" o" o" i—r — PH
C O CO (M fr- ii--H -H H in i-H t> i-H 1-1 M i—i
o i-H S CO
m OJ 2, . . . w„) für die Wertschöpfung der einzelnen Industriezweige festgelegt und sodann die Zahl der Arbeitsstunden berechnet, die zum Zeitpunkt 0 bzw. zum Zeitpunkt 1 erforderlich gewesen wären, um diese Standard-Struktur zu realisieren: / w.—"r• w] für den Zeitpunkt 0,
/ tu- ^
'
t\
für den Zeitpunkt 1.
wi
D i e s e Methode des zeitlichen Produktivitätsvergleichs ist übrigens auch für innerbetriebliche Zwecke zu empfehlen, wenn die Umrechnung auf ein Standardprodukt mittels Äquivalenzzahlen schwierig ist.
64
4 Allgemeine Theorie der Maßzahlen
Während es bei den bisher besprochenen Beispielen mehr oder minder willkürlich war, ob man die Struktur „0" oder „1" als Standard-Struktur wählt, ist in diesem Beispiel die Struk1 tur w], w°„ ....ff w° als 1' toi, 2' ....nw vor der Struktur Standard-Struktur ausgezeichnet: Der Vergleich mit w1. als Standard-Struktur beantwortet die Frage: Wie viele Arbeitsstunden müßte man aufwenden, um die Wertschöpfung des Zeitpunktes 1 zu realisieren, wenn sich die Produktivität seit dem Zeitpunkt 0 nicht geändert hätte? Die Frage, mit welcher Zahl von Arbeitsstunden man die Wertschöpfung des Zeitpunktes 0 mit den zum Zeitpunkt 1 geltenden Produktivitäten realisieren könnte, wird man demgegenüber als sekundär ansehen. Diese Version des Vergleiches würde im allgemeinen das Ausmaß der Produktivitätssteigerung unterschätzen; denn es sind vorwiegend die in Expansion begriffenen Industriezweige, welche die größten Produktivitätssteigerungen aufweisen. Den Vergleich auf der alten Wertschöpfungsstruktur aufzubauen hieße, die Bedeutung der Produktivitätssteigerungen vom Standpunkt der seinerzeitigen, nicht der jetzigen Wertschöpfung beurteilen. Bei dem letzten Beispiel zeigt sich deutlich, daß die Standardisierung einen Umstand vernachlässigt: den organischen Zusammenhang zwischen den Produktivitätssteigerungen in den einzelnen Industriesparten einerseits und der Umschichtung in der Struktur der Wertschöpfung anderseits: Es wird angenommen, daß man Produktivitäten und Wertschöpfungsstrukturen nach Belieben miteinander kombinieren kann, während in Wirklichkeit der Übergang von der Wertschöpfungsstruktur w v w2, • • • w n zu der Wertschöpfungsstruktur u i w\, • • • tu,) in einem organischen Zusammenhang mit den Produktivitätssteigerungen steht. Die Größen w i —5- sind nur fiktiv: Wären die Wi
Produktivitäten zum Zeitpunkt 1 tatsächlich die gleichen t:
t\
t°
wie zum Zeitpunkt 0, nämlich —0, —5. • • • —0 > so wäre r w. 1
w„2
w n
4.7 Standardisierung
65
die Wertschöpfungsstruktur sicher nicht w\, wl, schon deshalb nicht, weil
Y* w, ~ V wahrscheinlich das
¿-> ' wn verfügbare Arbeitsstundenpotential überschreiten würde. Allgemein gesprochen: Es besteht sehr oft zwischen den Unterschieden in der zu messenden Größe einerseits und den Strukturunterschieden anderseits ein organischer Zusammenhang. Die Verwendung einer Standard-Struktur zerstört diesen organischen Zusammenhang. Trotzdem ist das Standardisieren vielfach unvermeidlich. Vereinzelt gibt es jedoch Modelle, die es gestatten, diesen organischen Zusammenhang zwischen dem Unterschied der gemessenen Größe und den Strukturunterschieden in adäquater Form zu berücksichtigen. Ein Beispiel hierfür ist das Modell der stationären Bevölkerung. Will man die Sterblichkeit zwischen zwei Ländern vergleichen, so kann dies nicht einfach dadurch geschehen, Gestorbenem
(
— J — der beiden LänLebende / der einander gegenüberstellt. Erfahrungsgemäß bestehen nämlich zwischen den einzelnen Ländern starke Unterschiede im Altersaufbau, und diese beeinflussen — da die Sterblichkeit vom Alter abhängt — die Sterbeziffern. Die Unterschiede im Altersaufbau sind zum Teil auf einen unterschiedlichen zeitlichen Verlauf der Anzahl der Geborenen und auf Kriegseinwirkungen zurückzuführen, zum Teil auf eine unterschiedliche Sterblichkeit. Um die störenden Strukturunterschiede auszuschalten, schlug Körösi vor, allen Vergleichen einen einheitlichen Altersaufbau zugrunde zu legen. Dieses Verfahren eliminiert jedoch nicht nur jene Unterschiede, die auf die unterschiedliche Entwicklung in der Zahl der Geborenen und auf Kriegseinwirkungen zurückgehen, sondern auch jene Unterschiede, die durch die unterschiedliche Sterblichkeit selbst verursacht sind. Will man einen adäquaten Vergleich, so muß man die zufälligen Einflüsse auf den Altersaufbau 5
Pfanzaffl I
66
4 Allgemeine T h e o r i e der Maßzahlen
(Geburten, Kriege) eliminieren, jedoch j e n e Unterschiede im Altersaufbau, die sich aus der unterschiedlichen Sterblichkeit zwangsläufig ergeben, in adäquater F o r m berücksichtigen. Dies geschieht durch das Modell der stationären B e völkerung: Es wird angenommen, daß die Zahl der Geborenen von Jahr zu Jahr konstant ist, und untersucht, welche Verhältnisse sich in diesem „stationären" F a l l e unter der Einwirkung der Sterblichkeit einstellen (wie groß die Bevölkerung sein wird, welchen Altersaufbau sie hat, wie groß die durchschnittliche Lebenserwartung ist usw.). E i n e ausführliche Analyse stationärer Gesamtheiten — dieser Begriff ist nicht auf die Bevölkerungsstatistik beschränkt — findet sich in Abschnitt 7.5. Ein weiteres Beispiel für einen Versuch, den inneren Zusammenhang zwischen den Unterschieden der zu messenden Größe und den Strukturunterschieden in einem Model] zu erfassen, bietet die Theorie des Index der Verbraucherpreise (vgl. hierzu die Ausführungen auf S. 83 ff.). 4.8 Transplantation D i e Transplantation ist eine Variante der Standardisierung. D e r Zweck dieses Verfahrens besteht darin, die Auswirkungen einzelner Veränderungen zu isolieren, indem man bei einem zeitlichen oder örtlichen Vergleich die Auswirkungen einer Gruppe von Einflußgrößen dadurch herausrechnet, daß man die übrigen Einflußgrößen konstant hält. W i r wollen das Prinzip der Transplantation an einigen Beispielen erläutern: 1. B e i s p i e l : D i e Zahl der Krebssterbefälle ist in den letzten Jahrzehnten stark angestiegen: Die jährliche Zahl der Krebssterbefälle auf 10 0 0 0 der Bevölkerung betrug in Österreich in den Jahren 1 9 2 1 / 2 5 im Durchschnitt 13,1, im J a h r e 1 9 5 5 aber 22,4®). Dieser Anstieg ist zum Teil auf eine e d i t e E r h ö h u n g der Krebssterblichkeit (d. h. auf eine E r h ö h u n g der *) Vgl. H. Hansluwka: „Die Entwicklung der Krebssterblidikeit in Österreich". Der Krebsarzt, 12. Jg. (1957), S. 277.
5.1 Grundsätzliches
67
Krebs-Sterbewahrscheinlichkeit in jeder einzelnen Altersstufe) zurückzuführen, zum Teil jedoch einfach darauf, daß durch den allgemeinen Rüdegang der Sterblichkeit das Durchschnittsalter erhöht wurde und dadurch automatisch eine Erhöhung der Zahl der Krebssterbefälle auftrat. Um zu beurteilen, welche Rolle die direkte (eigentliche) Erhöhung der Krebssterblichkeit und welche Rolle die durch die Erhöhung des Durchschnittsalters induzierte Erhöhung der Krebssterblichkeit spielt, kann man so vorgehen: Als erstes berechnet man — um die Auswirkungen irregulärer Unterschiede im Altersaufbau zu beseitigen —• mit Hilfe des Modells der stationären Bevölkerung bereinigte Krebssterblichkeitsziffem. Sodann wendet man die Transplantationsmethode an: Man wiederholt die Berechnung der bereinigten Krebssterblichkeitsziffer, indem man für Krebs die Sterbewahrscheinlichkeit der Jahre 1921/25, für alle übrigen Todesursachen die Sterbewahrscheinlichkeit des Jahres 1955 zugrunde legt, und vergleicht sie mit den oben ermittelten, bereinigten Krebssterbliclikeitsziffern. 2. B e i s p i e l : Die Einsatz-Ausstoß-Analyse ermöglicht es, zu berechnen, wie viele Arbeitsstunden zur Produktion einer Tonne Eisenblech insgesamt aufgewendet werden müssen. Insgesamt heißt hier: nicht nur im Walzwerk selbst, sondern auch in jenen Industrien, welche die Rohstoffe, Energie und Maschinen für den Walzprozeß, und auch in jenen Industrien, welche die Rohstoffe, Energie und Maschinen für die Lieferanten-Industrien geliefert haben, usw. Die Zahl der Arbeitsstunden hängt danach nicht nur von der Produktivität der Walzwerke selbst, sondern auch von den Produktivitäten aller übrigen Industrien ab. Führt man einen Produktivitätsvergleich zwischen zwei verschiedenen Zeitpunkten durch, so kann man sich der Transplantationsmethode bedienen, um zu unterscheiden, wieviel von der Produktivitätssteigerung bei der Produktion von Eisenblech (gemessen durch die Ersparnis von Arbeitsstunden) auf die Produktivitätssteigerung der Walzwerke selbst und wieviel auf Produktivitätssteigerungen in den übrigen Industrien zurückzuführen ist. 5 Die Berechnung von Indexzahlen 5.1 Grundsätzliches Im Abschnitt 4.3 h a b e n wir die Berechnung von Meßzahlen behandelt. Eine wichtige Aufgabe der Meßzahlen 5*
68
5 Die Berechnung von Indexzahlen
besteht darin, den Verlauf einer Reihe durch Bezug auf eine geeignete Basis zu verdeutlichen. Vielfach hat man jedoch nicht eine, sondern mehrere sachlich zusammengehörende Reihen, und man wünscht, den Verlauf durch eine globale, alle Reihen zusammenfassende Meßzahl zu charakterisieren. Solche Meßzahlen werden Indexzahlen genannt. Nach diesem Sprachgebrauch erhalten wir eine Meßzahl, wenn wir z. B. eine Reihe betreffend die Preise von Gold auf eine gemeinsame Basis beziehen. Berechnen wir hingegen eine Reihe, welche ein globales Bild der Entwicklung aller Kleinhandelspreise gibt, erhalten wir eine Indexzahl. (Die Terminologie in der englischen Literatur ist: „relatives" für Meßzahlen, „index-numbers" für Indexzahlen.) Die Berechnung der Indexzahlen basiert auf der Methode der Standardisierung. Dies wollen wir uns am Beispiel eines Index der Verbraucherpreise überlegen: Als Ausgangspunkt dient ein bestimmtes Verbrauchsschema, d. h. eine Aufstellung über einen bestimmten Standardverbrauch. Sodann berechnet man die Kosten dieses Standardverbrauches zu den verschiedenen Zeitpunkten und vergleicht sie miteinander. Diese Kosten sind fiktive Größen: Es handelt sich ja nicht um real aufgetretene Kosten, sondern um die Kosten eines — fiktiven — Standardverbrauches. Trotzdem haben sie eine durchaus anschauliche Bedeutung. Die Standardisierung, d. h. das Rechnen mit einem fiktiven Standardverbrauch und damit mit fiktiven Kosten, ist unerläßlich: Würde man der Indexberechnung die tatsächlichen Kosten zugrunde legen, erhielte man ja einen Index, der nicht nur von den Preisänderungen beeinflußt wird, sondern auch von allen Änderungen des Verbrauches. Nur dadurch, daß man standardisiert, d. h. mit einem fiktiven konstanten Standardverbrauch rechnet, erhält man einen Index, der lediglich von Preisänderungen beeinflußt wird. Wenn wir unseren Blick vom speziellen Fall der Verbraucherpreise auf das allgemeinere Indexproblem richten,
69
5.1 Grundsätzliches
sehen wir folgende Situation vor uns: Gegeben sind zwei (oder mehrere) Serien intensiver Größen p°, P°, . . . P° und P\, Ps, •. • P'„, die hinsichtlich ihres Niveaus miteinander zu vergleichen sind. (Im Falle des Index der Verbraucherpreise: zwei Serien von Verbraucherpreisen.) Aus diesen Serien werden mit Hilfe von gegebenen Gewichten ZjV'PWir können die Indexformel also auch als gewogenes 1 Pi arithmetisches Mittel der Meßzahlen —7 deuten. Im spe-
2
Pi
70
5 Die Berechnung von Indexzahlen
ziellen Falle des Index der Verbraucherpreise: als gewogenes arithmetisches Mittel von Meßzahlen der einzelnen Preise. Die Gewichte g; entsprechen in diesem Fall den bei gegebenem Verbrauch zum Zeitpunkt 0 erforderlichen Verbrauchsausgaben (zum Unterschied von den Gewichten qu die Mengen darstellten), haben also ebenfalls eine anschauliche Bedeutung. 5.2 Die Formeln von Laspeyres und Paasdie
Zumeist ist es üblich, die Gewichte qi entweder entsprechend den Verhältnissen zum Zeitpunkt 0 oder entsprechend den Verhältnissen zum Zeitpunkt 1 zu wählen. Im Falle eines Index der Verbraucherpreise also: als Standardverbrauch entweder den Verbrauch zum Zeitpunkt 0 oder den Verbrauch zum Zeitpunkt 1 anzunehmen. Im ersten Fall bezeichnen wir die Gewichte mit q[, im zweiten Fall mit q\. Dementsprechend erhalten wir die beiden Indexformeln: Indexformel von Laspeyres:
Indexformel von Paasdie:
Der Index von Laspeyres beantwortet die Frage, wie sich das Verhältnis der Preisniveaus für einen Haushalt mit dem Verbrauch ( , . . . darbietet, der Index von Paasche beantwortet die Frage, wie es sich für einen Haushalt mit dem Verbrauch (- - M i - i ) n—1 v \nl n —1 \ nj k k Für co gilt: - P und ->• P. Daher ist ° n n—1 CT2 = P ( l - P ) Als Schätzer für a2 wird in der Praxis nicht der oben ermittelte Wert s2, sondern einfach -2 k /, k1 (4) ' - n P - n , verwendet. Dies ist erlaubt, da der Unterschied von k/n und kl(n — 1) bei allen praktisch in Frage kommenden Stichprobenumfängen belanglos ist. Aus diesem Schätzer für o2 berechnen wir nach Formel (9.2.2) [bzw. (9.2.3) im Falle der endlichen Gesamtheit] einen Schätzer für ÖJ und daraus nach (9.2.1) den maximalen Zufallsfehler. Da die Anwendung der im vorigen Abschnitt angegebenen Formel (9.2.1) für die Berechnung des maximalen
152
9
Stichproben
Zufallsfehlers auf der Voraussetzung einer Normalverteilung von x basiert, darf der Stichprobenumfang nicht zu
£
klein sein. W i e gut die Verteilung von x = ~- mit einer n Normalverteilung übereinstimmt, hängt vom Stichprobenumfang n und von P ab: J e größer n und je näher P beim W e r t V2 liegt, um so besser ist die Ubereinstimmimg mit einer Normalverteilung. (Bild 32, S. 2 0 4 zeigt die Verteilung von kln für P = 0,08 bei den Stichprobenumfängen n = 100 und n = 1000.) Als Faustregel: Die Annäherung an die Normalverteilung ist für die Anwendimg der Formel (9.2.1) ausreichend, wenn (5)
k(l-kln)>9.
1. B e i s p i e l : Eine mündliche Befragung zufällig ausgewählter Personen ergab, daß von 340 Männern 269 Raucher waren. Der Anteil der Raucher beträgt demnach 0,791 oder 79,1 %. Da 269 (1 — 0,791) = 56, ist Faustregel (5) erfüllt, und wir können den maximalen Zufallsfehler nach (9.2.1) und (9.2.2) errechnen. Bei einer Sicherheitswahrscheinlichkeit von 99 % gilt: 2,58 , e = j / 3 4 o 1/0,791 (1 — 0,791) = 0,057 oder 5,7 %. M. a. W.: Der Fehler ist mit einer Wahrscheinlichkeit von 99 % kleiner als 5,7 %, der Anteil der Raucher liegt fast sicher (99 %) zwischen 73,4 und 84,8 %. 2. B e i s p i e l : Beim Multimomentverfahren wird zu zufällig ausgewählten Zeitpunkten registriert, in welchem Zustand sich die Maschinen eines Maschinenparks befinden. Nachstehende Tabelle faßt die Ergebnisse von 4000 Multimomentaufnahmen zusammen: Maschine läuft Maschine steht
,
wartet auf Bedienung
w i l d bedient
Multimomentaufnahmen insgesamt Anteil der Wartezeit:
133 4000
= 0,033 oder 3,3 %.
3652 133 215 4000
9.4 Die Bestimmung des Stichprobenumfanges
153
Maximaler Zufallsfehler des Anteils der Wartezeit: e =
. - - - • 1'0,033 (1—0,033) = 0,007 oder 0 , 7 % . 1/ 4000 3. B e i s p i e l : Zur Bestimmung des Feuchtigkeitsgehaltes eines Rohstoffes werden an 20 verschiedenen Stellen Proben entnommen. Der durchschnittliche Feuchtigkeitsgehalt, der sich aus diesen Proben ergibt, liegt bei 8%. Aufgrund der Tabelle auf S. 249 könnte man vermuten, daß der echte Feuchtigkeitsgehalt kleiner als 30% ist. Achtung! Dieser Schluß ist falsch! Um den maximalen Zufallsfehler der 8 % anzugeben, benötigt man die Standardabweichung zwischen den Feuchtigkeitsgehalten der 20 einzelnen Proben. v 2,58
9.4 Die Bestimmung des Stichprobenumfanges
Oft ist nicht die Aufgabe gestellt, auf Grund einer Stichprobe den maximalen Zufallsfehler zu berechnen, sondern umgekehrt jenen Stichprobenumfang zu ermitteln, der notwendig ist, damit der maximale Zufallsfehler einen vorgegebenen Wert e nicht überschreitet. Zu diesem Zwecke muß zunächst der maximal zulässige Zufallsfehler festgelegt werden. Seine Größe hängt natürlich ganz von den jeweiligen Umständen ab: Wenn bei einer Wahl zwei politische Parteien auftreten, von denen bei der letzten Wahl die eine 49, die andere 5 1 % der Stimmen erhielt und nun auf Grund einer Stichprobe vorausgesagt werden soll, wer jetzt die Mehrheit gewinnen wird, wird man e in der Größenordnung von 0,5% oder noch kleiner festlegen. Handelt es sich hingegen darum, ein ungefähres Bild davon zu bekommen, wieviele Hausfrauen das superaktive Waschmittel X kennen, wird wahrscheinlich ein Wert e in der Größenordnung von 5 % noch ausreichen. (Im allgemeinen besteht die Aufgabe des Statistikers darin, seinen Auftraggebern klar zu machen, daß sie eine wesentlich höhere Genauigkeit verlangen, als im Hinblick auf die beabsichtigte Verwertung der Zahlen tatsächlich erforderlich ist.) Sobald e festgelegt ist, kann man daraus den notwendigen Stichprobenumfang n sofort ermitteln, indem man
154
9
Stichproben
auf Grund der Formeln (9.2.1) und (9.2.2) den Stichprobenumfang n als Funktion von e ausdrückt. Es gilt: (1)
n
(2) -»•00
-
—
fa
1
+
endliche Gesamtheit N
Für N geht die Formel für die endliche Gesamtheit in die Formel für die unendliche Gesamtheit über. Der Wert für n, den man aus der Formel für die unendliche Gesamtheit erhält, ist stets etwas größer als der korrespondierende Wert aus der Formel für die endliche Gesamtheit. Es ist jedoch keineswegs so, daß der notwendige Stichprobenumfang proportional dem Umfang der Gesamtheit wäre: Dieser hat meist nur einen geringen Einfluß. Um n tatsächlich berechnen zu können, benötigen wir einen Schätzer für o. Ein solcher Schätzer ist oft aus zeitlich zurückliegenden oder örtlich getrennten Erhebungen zu gewinnen. Wenn man berücksichtigt, daß der Streubereich einer Normalverteilung etwa 6a beträgt, genügt oft die Alltagserfahrung, um eine ganz grobe Schätzung für a zu erhalten: Die Körpergröße von Frauen streut etwa zwischen 150 und 180 cm. Daraus ergibt sich für a als ganz grobe Schätzung der Wert 5 cm. Will man vorsichtig sein, so wird man lieber mit einem etwas zu großen Schätzer für a arbeiten. Denn ein zu großer Wert für ö hat zur Folge, daß man den notwendigen Stichprobenumfang überschätzt, den vorgeschriebenen Wert für den maximalen Zufallsfehler also sicher einhält. Im Falle artmäßiger Merkmale wird man bei der Abschätzung der Standardabweichung folgende Überlegungen anstellen: Hat man eine ungefähre Vorstellung von der Größe von P und will man vorsichtig sein (d. h. mit einem eher zu großen Wert der Standardabweichung arbeiten), so wird man von den in Frage kommenden P-
9.4 Die Bestimmung des Stichprobenumfanges
155
Werten jenen wählen, der dem Wert V2 am nächsten liegt: Weiß man, daß P irgendwo zwischen 10% und 20% liegt, wird man mit P = 0,2 arbeiten; weiß man, daß P größer als 9 0 % ist, wird man mit P = 0,9 arbeiten. Selbst wenn man gar keine Vorstellung von der Größe von P besitzt, kann man die Standardabweichung ab"VP»-PT
0
1/2
1
Bild 27. Standardabweichung in Abhängigkeit von P.
schätzen: Sie kann nämlich, wie Bild 27 zeigt, nie größer als Vi sein. Man kann jedoch, wenn man mit dem Wert a — V2 arbeitet, den notwendigen Stichprobenumfang erheblich überschätzen: dann nämlich, wenn P nahe bei
Bild 28. Stichprobenumfang in Abhängigkeit von P.
Bild 28 zeigt den Stichprobenumfang, der bei einer unendlichen Gesamtheit notwendig ist, um P bei einer Irr-
156
9
Stichproben
tumswahrscheinlichkeit von 5 % mit einem maximalen Zufallsfehler e = ± 1 % zu schätzen. Diese Stichprobenumfänge sind größer, als man intuitiv erwarten würde. Sie reduzieren sich auf wenn man sich mit 6 — — 5 % begnügt. Für praktische Fälle kann man den notwendigen Stichprobenumfang hinreichend genau aus der Tabelle auf S. 249/50 bestimmen. B e i s p i e l : Es ist eine Erhebung über den Bekanntheits-. grad einer bestimmten Handelsmarke durchzuführen. Festzustellen ist der Anteil jener Hausfrauen, die diese Marke kennen. Dieser Anteil soll mit einer Genauigkeit von ± 2 % bestimmt werden. Wählen wir entsprechend Formel (1)
k und P mit einer Wahrn scheinlichkeit von mindestens 99% kleiner als 0,02 = 2%, gleichgültig wie groß P ist. so ist der Unterschied zwischen
Analoge Überlegungen kann man anwenden, um auch in komplizierten Fällen (z. B. bei geschichteten Stichproben) den notwendigen Stichprobenumfang zu bestimmen. 9.5 Fiktive Gesamtheiten Bisher haben wir angenommen, daß eine konkret existierende Gesamtheit vorliegt, aus der die Stichprobe nach dem Zufallsprinzip entnommen wurde. Als typisches Beispiel: Es liegt ein Los von 1 0 0 0 0 Metallstiften vor, aus dem eine Stichprobe entnommen wird, um zu entscheiden, ob der Ausschußanteil (Ausschuß = Stifte, deren Durchmesser nicht innerhalb der Toleranzgrenzen liegt) den zulässigen Höchstwert von 2 % überschreitet oder nicht. In manchen Fällen ist die Gesamtheit jedoch eine Fiktion: Betrachten wir zur Illustration den Fall, daß eine Produktion von Spezialschrauben neu aufgenommen werden soll. Zu diesem Zweck wird auf zwei verschiedenen Maschinen je eine Probeserie von 200 Stück erzeugt, um
9.5
Fiktive Gesamtheiten
157
zu entscheiden, welche Maschine mit einem geringeren Ausschußanteil arbeitet. Angenommen, Maschine 1 hätte 190, Maschine 2 hätte 194 gute Stücke produziert. Daraus kann man noch nicht schließen, daß Maschine 2 besser ist als Maschine 1. Beide Maschinen sind aufzufassen als konstante Ursachensysteme, die mit einer gewissen Wahrscheinlichkeit gute Stücke produzieren. Jede der beiden Serien ist eine Realisation im Rahmen des zugehörigen konstanten Ursachensystems, deren konkrete Gestalt vom Zufall abhängt. Zwei andere Serien, unter genau den gleichen Bedingungen produziert, hätten vielleicht gerade das umgekehrte Ergebnis gezeitigt. Interessant ist jedoch nicht, welche der konkreten Serien besser oder schlechter ist, sondern welche der Maschinen besser oder schlechter ist: Das eigentliche Ziel unserer Untersuchung ist das konstante Ursachensystem, als welches jede der Maschinen in der Modellvorstellung aufgefaßt wird. Konkret gegeben sind hier nur die beiden Versuchsserien vom Umfang je 200. Die Gesamtheiten, auf die sich die Untersuchung eigentlich bezieht, existieren nur als Modellvorstellungen: Es handelt sich um die Mengen, welche die Maschinen im Laufe ihrer Nutzungsperiode produzieren würden. Eine solche Modellvorstellung ist natürlich nur dann sinnvoll, wenn tatsächlich ein konstantes Ursachensystem vorliegt. Bild 29 zeigt das typische Bild eines solchen stationären Zufallsprozesses: Darunter verstehen wir einen Prozeß, bei dem jede Einheit eine zufällige Realisation im Rahmen eines konstanten Ursachensystems ist (in un-
* i i ? i ?i i i i i Q i i i i o 5 „Q o oo— 9D o Bild 29. Stationärer Zufallsprozeß.
9
158
Stichproben
serem konkreten Falle: dieselbe Maschine, dasselbe Material, dieselbe Art der Bedienung usw.). Die empirisch ermittelte Häufigkeitsverteilung ergibt das gleiche Bild, gleichgültig, welchen Abschnitt dieses Prozesses man betrachtet. Dies gilt hingegen nicht für den in Bild 30 dargestellten Prozeß, der einen deutlichen Gang (Trend) aufweist. (Prozesse mit Gang kommen beispielsweise dort vor, wo Abnützungserscheinungen eine Rolle spielen, etwa beim Drehen.) Hier liegt kein konstantes Ursachensystem vor. Natürlich sind auch hier die einzelnen Elemente zufallsabhängig, aber jedes Element stammt aus einem anderen Ursachensystem, jedes Element ist eine Realisation 1
0- G o
1 "
1 1
" °
°
?.?. °o
o° n 0.°
n
"
O °
O
„
o °°
°o ° 0
°
Bild 30. Zufallsprozeß mit Gang.
aus einer anderen Verteilung, die sich (z. B. infolge der Abnutzung) immer mehr nach oben verschiebt. Es wäre sinnlos, auch hier — wie das in Bild 30 angedeutet ist — eine Häufigkeitsverteilung zu bilden. Ihre Lage und Form würde davon abhängen, welchen Abschnitt des Prozesses man betrachtet und wie lang dieser Abschnitt ist. Während man bei der Behandlung technischer oder biologischer Probleme sehr häufig mit fiktiven Gesamtheiten zu tun hat, ist die Gesamtheit, mit der man es in der Wirtschafts- und Sozialstatistik zu tun hat, meist eine konkret existierende — und damit endliche. Die Aufgabe der Statistik besteht dann einfach in einer Beschreibung der konkret existierenden Gesamtheit. Diese als Teil einer übergeordneten (einem konstanten Ursachensystem ent-
9.6 Die geschichtete Stichprobe
159
sprechenden) unendlichen Gesamtheit aufzufassen, ist hier nicht immer sinnvoll. Oft führt jedoch auch in der Wirtschafts- und Sozialstatistik eine kritische Analvse zu dem Ergebnis, daß das eigentliche Ziel der Untersuchung eine fiktive Gesamtheit ist. Der an diesen Fragen besonders interessierte Leser wird auf die Ausführungen bei Menges, S. 37 ff. hingewiesen. B e i s p i e l : Die Zahl der Selbstmorde in Wien betrug im Jahre 1956 447, im darauffolgenden Jahr 500. Wenn man diese Zahlen richtig interpretieren will, muß man in Betracht ziehen, daß die Zahl der Selbstmorde in diesen beiden Jahren zufallsabhängig ist. Das eigentlich Relevante ist nicht der Unterschied zwischen diesen beiden vom Zufall beeinflußten Zahlen, sondern die Frage der Veränderung des diese Selbstmorde bedingenden Ursachensystems. Obwohl eine Totalerhebung vorliegt — es wurden ja alle in den betreffenden Zeitraum fallenden Selbstmorde erfaßt •—•, kann aus den beobachteten Unterschieden nicht ohne weiteres auf eine Änderung des Ursachensystems geschlossen werden. 9.6 Die geschichtete Stichprobe Eine reine Zufallsstichprobe ist nur dann optimal im Sinne maximaler Genauigkeit der Schätzung des Mittelwertes, wenn die Gesamtheit homogen ist. Homogene Gesamtheiten sind jedoch in der Wirtschafts- und Sozialstatistik äußerst selten. Entsprechend der in der Stichprobentheorie üblichen Terminologie wollen wir die Teilmassen, in die eine inhomogene Gesamtheit zerfällt, als Schichten bezeichnen. Die Stichprobentheorie beweist, daß es dann, wenn solche Schichten vorhanden sind, auch zweckmäßig ist, diese bei der Erhebung zu berücksichtigen. Hier einige Beispiele: 1. B e i s p i e l : Es soll eine umfassende Untersuchung über die Konsumgewohnheiten durchgeführt werden. Für diese Untersuchung zerfällt die Bevölkerung von vornherein in zwei Schichten: in die bäuerliche Bevölkerung und die übrige. Innerhalb der nicht-bäuerlichen Bevölkerung wird man zweckmäßig unterscheiden zwischen der ländlichen (nicht-bäuerlichen) Bevölkerung und der städtischen Bevölkerung, eventuell auch noch zwischen verschiedenen sozialen Gruppen.
160
9 Stichproben
2. B e i s p i e l : Um schneller zu vorläufigen Ergebnissen zu kommen, wurde in Bayern aus den bei der landwirtschaftlichen Betriebszählung 1949 eingegangenen Erhebungsbogen eine geschichtete Stichprobe entnommen: Schicht I: Betriebe unter 50 ha Betriebsfläche; hiervon kam jeder 50. Bogen in die Auswahl (Auswahlsatz = 2%); Schicht II: Betriebe mit 50 bis unter 200 ha Betriebsfläche; hiervon kam jeder 10. Bogen in die Auswahl (Auswahlsatz = 10%); Schicht III: Betriebe mit 200 ha und mehr; die Betriebe wurden voll in die Auswahl genommen (Auswahlsatz = 100 %). Selbstverständlich ist der Begriff der homogenen Gesamtheit durchaus relativ: W i r haben oben im Zusammenhang mit einer Untersuchung über die Konsumgewohnheiten die soziale Stellung als relevantes Schichtungsmerkmal erwähnt. Bei einer Untersuchung über die Häufigkeit der einzelnen Blutgruppen wäre eine Schichtung nach der sozialen Stellung völlig irrelevant. Kennt man den Anteil der einzelnen Schichten an der Gesamtheit, so ist es keineswegs notwendig, die Stichprobe aus der Gesamtheit mittels Zufallsauswahl zu entnehmen, um ein unverfälschtes E r g e b n i s zu erhalten: Man kann vielmehr die Zahl der in die Stichprobe einbezogenen Einheiten für jede einzelne Schicht willkürlich festlegen. W i r denken uns die einzelnen Schichten von 1, 2, . . . k durchnumeriert und bezeichnen die Anzahl der aus den einzelnen Schichten in die Stichprobe einbezogenen Einheiten mit: ni, ri2, . . . fifc. W e l c h e Einheiten der i. Schicht in die E r h e b u n g einzubeziehen sind, wird durch Zufallsauswahl bestimmt. Verglichen mit der Struktur der Gesamtheit ist die Struktur der so gewonnenen Stichprobe natürlich verzerrt. U m einen unverfälschten Schätzer für /J,, den Mittelwert der Gesamtheit, zu erhalten, m u ß man diese Verzerrung durch geeignete Gewichtung wieder eliminieren. D e r Mittelwert der Gesamtheit ist das gewogene arithmetische Mittel aus den Mittelwerten der einzelnen Schichten. Bezeichnen wir die Anteile der einzelnen Schichten an der Gesamtheit mit pi, pz, . . . pu,
X p; =
, ihre
161
9.6 Die geschichtete Stichprobe Mittelwerte mit
«2, • • • /-¿/c, dann gilt: k
(1)
i=1
D a die Stichprobe innerhalb jeder Schicht zufällig ausgewählt wurde, ist der Mittelwert der i. Stichprobe, x%, ein unverfälschter Schätzer für /¿¡. U m einen unverfälschten Schätzer für ß zu erhalten, m u ß man aus xi, X2, ... x/c ein gewogenes arithmetisches Mittel bilden: k
(2)
x =
t=1
Die Varianz dieses Schätzers ist (3)
o i - i X ^ -
F ü r den Fall einer endlichen Gesamtheit ist ,
^
1—1
,
ffi
f .
ni\
1 \
1*
D a b e i ist Ni der Umfang der i. Schicht. D e n U m f a n g der Gesamtheit bezeichnen wir mit N. E s gilt: N = und pi =
^
Nj
N.
— .
N
Diese Formeln gelten sowohl für zahlenmäßige als auch für artmäßige Merkmale. W i r h a b e n nur, entsprechend den Ausführungen in Abschnitt 9.3, zu berücksichtigen, daß bei artmäßigen Merkmalen öj 2 = P, (1 — Pi), wenn Pi der Anteil des ausgezeichneten Merkmales in der i. Schicht ist. M a n beachte den Unterschied zwischen Pi und Pi (Anteil der i. Schicht an der Gesamtheit). In den nachfolgenden Abschnitten 9.7 bis 9.10 werden wir uns mit der F r a g e beschäftigen, wie die Stichprobenumfänge in den einzelnen Schichten am zweckmäßigsten zu wählen sind. 11 Pfanzagl I
9 Stichproben
162
Einen ausführlichen Bericht über die Erfahrungen mit der Anwendung von Stichprobenverfahren in der amtlichen Statistik bringt das Buch „Stichproben in der amtlichen Statistik", das vom Statistischen Bundesamt in Wiesbaden herausgegeben wurde. 9.7 Die optimale Stichprobe Es liegt nahe, n\, «2, . . . njc so zu wählen, daß Oj bei gegebenem n ein Minimum wird. Eine ausreichende Genauigkeit erzielt man, indem man alle n; als kontinuierliche Veränderliche betrachtet und einfach die Regeln der Differentialrechnung für die Bestimmung eines relativen Minimums unter der Nebenbedingung n\ + «2 + ... + n/c = n anwendet"). Man erhält so als optimale Aufteilung der Stichprobe auf die einzelnen Schichten: p. (1)
n-
=
n -k
a. — •
Z P i ^ 1=1
Formel (1) gilt sowohl für den Fall der endlichen, als auch der unendlichen Gesamtheit. Indem wir diese Stichprobenumfänge in Formel (9.6.3) bzw. (9.6.4) einsetzen, erhalten wir als Wert von a\ im Falle optimaler Schichtung: ^ i A (2)
Ox (opt) = — Q T pi rrY n 1=1 ' '
0)
o i { o
V
.
k
"
i=l
unendliche Gesamtheit, l
k
t ) 1=1
endliche Gesamtheit. Sollte die Erhebung in den verschiedenen Schichten verschieden hohe Kosten pro Einheit verursachen, wird man die Stichprobenumfänge m, n2, . . . m so wählen, Streng genommen stellen die Hegeln der Differentialrechnung für die Bestimmung eines relativen Minimums notwendige Bedingungen dar. Man kann jedoch zeigen, d a ß diese Lösung tatsächlich ein Minimum ergibt. (Vgl. Schmetterer, L.: E i n f ü h r u n g in die mathematische Statistik, Wien 1966, S. 181.)
9.7 Die optimale Stichprobe
163
daß Ox = Min. bei gegebenen Kosten (statt gegebenem Stichprobenumfang) [vgl. hierzu beispielsweise Kelleret, „Theorie und Technik des Stichprobenverfahrens", S. 110 ff.]. Die praktische Verwertung dieser Ergebnisse setzt voraus: 1. Man kann die Zahlen m, ri2, . . . tatsächlich von vornherein festlegen: Die Unterlage, auf Grund derer die Stichprobe ausgewählt wird, muß demnach über die Zugehörigkeit der Einheiten zu den verschiedenen Schichten Aufschluß geben. 2. Es müssen die Varianzen c^, . . . a k bekannt sein. Informationen über die Größe der Varianzen kann man z. B. aus früheren Erhebungen beziehen. Eine weitere Möglichkeit besteht darin, die Varianzen durch eine Vorstichprobe abzuschätzen. Eine solche Vorstichprobe kann gleichzeitig auch zu anderen Zwecken dienen, beispielsweise zum Testen des Fragebogens. Die optimale Aufteilung der Stichprobe hängt nicht nur vom Anteil der einzelnen Schichten an der Gesamtheit ab, sondern auch von den Varianzen innerhalb der Schichten. Man erhält daher im allgemeinen für jedes Merkmal eine andere optimale Aufteilung, so daß man gezwungen ist, die Optimierung der Stichprobe auf ein bestimmtes Merkmal abzustellen. Als Beispiel wollen wir in diesem und den folgenden Abschnitten eine Erhebung über die Rauchgewohnheiten bei einer sehr großen Gesamtheit von männlichen Erwachsenen diskutieren. Die Gesamtheit wird nach dem Alter in drei Schichten eingeteilt. Die charakteristischen Größen der einzelnen Schichten sind in Tabelle 21 zusammengestellt. Aus den Werten für die einzelnen Schichten schätzen wir durch Gewichtung mit den Anteilen der einzelnen Schichten an der Gesamtheit den Anteil der Raucher in der Gesamtheit, P, und den durchschnittlichen täglichen Zigarettenverbrauch pro Kopf in der Gesamtheit, /u: 11°
164
9 Stichproben
l 3
P = 2 p , f , = 0,77 I 1 Tabelle 21 Angaben über die Rauchgewohnheiten in verschiedenen Altersgruppen.
Schicht
Alter
Durchschnitt!, Anteil an Anteil der tägl. Zigader Ge- Raucher rettenverbrauch samtheit pro Kopf (inkl. Nichtk raucher) Nr. P' " n Pi i l
unter 30 I 1 30 bis unter 55 2 55 und darüber! 3
0,2 0,5 0,3 1,0
0,60 0,85 0,75 p = 0,77
10 15 12
Varianz des tägl. Zigarettenverbr. Ì s.i 90 85 80
x = 13,1
In den folgenden Abschnitten wollen wir die Varianz dieser Schätzer unter verschiedenen Annahmen über die U m f a n g e der Teilstichproben in den drei Schichten m , »2, «3, berechnen. B e i s p i e l : Für die Schätzung des durchschnittlichen täglichen Zigarettenkonsums erhalten wir als optimale Aufteilung, indem wir in Formel (1) die rr; durch die Schätzwerte si ersetzen: „ „ P, ¿i n".i = n • k, • Zp' 1=1
9.7 Die optimale Stichprobe Es gilt:
165
1,844 p2 s2 = 4 , 7 4 5 p 3 s3 = 2 , 6 8 2 J ^ P i s , = 9,271
Daraus folgt: nj = 0,20n;
n*2 = 0 , 5 1 n ; nz = 0 , 2 9 n •
Für die Schätzung des Anteiles der Raucher erhalten wir folgende optimale Aufteilung, indem wir in Formel (1) die o ; durch ]/p; (1 — P ; ) ersetzen:
/—1 Es gilt: pt y p ^ l — P ) =
\rpX1 P,o ]/P (1 y 3 *
Daraus folgt:
2 V, ]/?"( i =1
1-
n° = 0 , 2 4 n ; n, =
0,0980
= °>1785 P 3') = 0 , 1 2 9 9 P.) = 0 , 4 0 6 4
0 , 4 4 n ; n\ = 0 , 3 2 n .
Die Varianz im Falle optimaler Aufteilung ist: 2 . . 1 / V r, . V Ox (opt) = i- - ( _t P . s i ) (°pt) = n O, ( o p t ) =
1 n
( t P, Vi^i
(9,271)' n
/
=
—
86,0 n
n
01652 n
166
9
Stichproben
Selbstverständlich können wir nur eine der beiden Aufteilungen realisieren. Wählen wir den Zigarettenkonsum als Kriterium für die Optimierung, so erhalten wir für den Anteil der Raudier nach Formel (9.6.3) folgende Varianz: 2 * OP = LPI ;=i
2 J
P,(l-P,) i
n
0,1687
= -'-
n
•
Würden wir umgekehrt den Anteil der Raucher als Kriterium für die Optimierung verwenden, erhielten wir für den durchschnittlichen täglichen Zigarettenkonsum nach Formel (9.6.3) folgende Varianz: t=i
p; i -87'9 «
n
Entscheiden wir uns für Optimierung nach dem Kriterium des Zigarettenkonsums und wählen wir eine Stichprobe vom Umfang n = 6000, erhalten wir als maximalen Zufallsfehler (
"
l/RfiÖ"
% ) :
= 2 , 5 8 a* (opt) = 2 , 5 8 ßp =
-
0,31,
2 , 5 8 o ^ 2 , 5 8 | / ~ 0 ^ 6 0 8 0 9 = 0,014. 9.8 Die proportionale Stichprobe
Erwartet man keine großen Unterschiede zwischen den Varianzen innerhalb der einzelnen Schichten, so wird man zweckmäßigerweise so vorgehen, daß man einfach n; = n pi setzt. Eine solche Stichprobe, bei der die Anzahl der Einheiten aus jeder Schicht proportional dem Anteil dieser Schicht an der Gesamtheit gesetzt wird, heißt „proportional". Die Varianz von x bei einer proportionalen Stichprobe ist: (1) ö| (prop) = 1 2k P, ° unendliche Gesamtheit, (2) ö| (prop) =
(1—
j
J ] Pj o\ endliche Gesamtheit.
9.8 Die proportionale Stichprobe
167
Ein Vergleich zeigt, daß o| (opt) a| (prop). Die Varianz von x wird bei einer proportionalen Stichprobe im allgemeinen etwas größer sein als die Varianz bei einer optimalen Aufteilung auf die einzelnen Schichten; der Unterschied wird jedoch gering sein, wenn die Unterschiede zwischen den Varianzen der verschiedenen Schichten gering sind. Im Falle o, = o2 = . . . = ist al (opt) = o| (prop), d. h. die proportionale Stichprobe ist optimal, wenn alle Varianzen gleich sind. Sind die o; der einzelnen Schichten unbekannt und erwartet man keine großen Unterschiede, so wird eine Vorstichprobe unrentabel erscheinen, und man wird daher statt der optimalen einfach eine proportionale Stichprobe wählen. Praktisch wird man sehr oft auch dadurch, daß sich die Erhebung auf mehrere Merkmale bezieht, genötigt, sich an Stelle einer optimalen Stichprobe mit einer proportionalen zu begnügen. Auf jeden Fall ist die Varianz von x bei einer proportionalen Stichprobe jedoch kleiner (genauer: nie größer) als die Varianz bei reiner Zufallsauswahl. Berücksichtigt man nämlich die Schichtung überhaupt nicht, d. h. bestimmt man die Stichprobe durch reine Zufallsauswahl 1 " aus der Gesamtheit,' so ist x = -n ) , t i ein unverfälschter i=i Schätzer für //. Die Varianz cr| bestimmt man nach Formel (9.2.2) bzw. (9.2.3) aus der Varianz der Gesamtheit, a . Um mit o| für den Fall der geschichteten Stichprobe vergleichen zu können, müssen wir angeben, wie sich o2 aus der Varianz innerhalb der Schichten und der Varianz zwischen den Schichten zusammensetzt. Es gilt:
(3)
/=i
i=i
9 Stichproben
168
Im Falle eines artmäßigen Merkmales vereinfacht sich diese Formel zu (4)
k
a2 =
P(1 — P),
wobei P
p.P. das gewogene arithmetische Mittel der ¿=i Anteile des ausgezeichneten Merkmales in den einzelnen Schichten, also gleich dem Anteil des ausgezeichneten Merkmales in der Gesamtheit ist. Beredinet man aus der Formel (3) unter Berücksichtigung von (9.2.2) bzw. (9.2.3) den Wert von o§ im Falle der reinen Zufallsstichprobe, so sieht man durch Vergleich mit Formel (1) bzw. (2), daß dieser stets größer (höchstens gleich) als der Wert von 0 ! (prop) ist. Die proportionale Stichprobe ist also nie ungenauer als eine reine Zufallsstichprobe. Im ungünstigsten Falle liefert sie dieselbe Genauigkeit: dann nämlich, wenn die Mittelwerte der verschiedenen Schichten gleich sind. Aus fi\ = = . . . = ¡¿u folgt nämlich, daß a| = ö| (prop). Zusammenfassend können wir also sagen: Der Übergang von der reinen Zufallsstichprobe zur proportionalen Stichprobe trägt dem Unterschied zwischen den Mittelwerten der einzelnen Schichten Rechnung. Der Genauigkeitsgewinn ist um so größer, je größer die Unterschiede zwischen den Mittelwerten sind. Der Übergang von der proportionalen Stichprobe zur optimalen Stichprobe trägt außerdem dem Unterschied zwischen den Varianzen innerhalb der einzelnen Schichten Rechnung. Der Genauigkeitsgewinn ist um so größer, je größer die Unterschiede zwischen den Varianzen sind. Haben die Verteilungen innerhalb der einzelnen Schichten alle gleiche Mittelwerte und gleiche Varianzen, so gilt Ox (opt) = a\ (prop) (wegen der gleichen Varianzen) und
9.8 Die proportionale Stichprobe
169
o | (prop) = o% (wegen der gleichen Mittelwerte), also auch ol (opt) = öi. In diesem Falle liefern also optimale Auswahl und reine Zufallsauswahl dieselbe Genauigkeit, m. a. W.: Wenn die Verteilungen innerhalb der einzelnen Schichten gleich sind (oder wenigstens gleiche Mittelwerte und Varianzen haben), bringt die Berücksichtigung der Schichten überhaupt keinen Genauigkeitsgewinn. Es ist wohl nur von theoretischem Interesse, zu bemerken, daß der Satz von der Überlegenheit der optimalen und der proportionalen Stichprobe gegenüber der reinen Zufallsstichprobe nicht mehr gilt, wenn die Besetzungszahlen der einzelnen Schichten in der Gesamtheit, Nu so klein sind, daß man den Unterschied von Ni und Ni — 1 nicht mehr vernachlässigen kann. (Vgl. hierzu: Fisz. S. 432 ff.) 1. B e i s p i e l : Bei proportionaler Aufteilung der Stichprobe auf die einzelnen Schichten erhalten wir aus = "p;:
nt = 0,2 n; «2 = 0,5 n; n3 = 0,3 n. Die Varianzen sind in diesem Falle:
k
2 , . l^-i 86,0 2 as (prop) = — ¿ j Vi s, = -•— >
'' i=l
2 1 t \ V vi, o0 (prop) = - - 2 , Pi Fi (1 -
M 0,1680 P,) = ~n •
Bei einer Stichprobe vom Umfang 6000 sind die maximalen Zufallsfehler (99%): 86 e x2 = 2,58 ox5 w (prop) ' ° = o,31 vi = 2,58 ]y/ 6000
Cip = 2,58 Of (prop) = 2,58 | / 0 , 1 6 8 0 = 0,014 \ 6000 Der Unterschied zwischen optimaler und proportionaler Aufteilung ist also im vorliegenden Falle praktisch irrelevant. 2. B e i s p i e l : Wir wollen untersuchen, wie groß die Ersparnis bei optimaler und proportionaler Aufteilung der Stich-
170
9 Stichproben
probe im Vergleich mit einer reinen Zufallsstichprobe ist. Zu diesem Zwecke schätzen wir zunächst die Varianz der Gesamtheit aus den Varianzen innerhalb der Schichten und zwischen den Mittelwerten der Schichten. Aus Formel (3) erhalten wir, wenn wir 0$ und durch die aus der Stichprobe gewonnenen Schätzer Sj bzw. xi für die Standardabweichung bzw. den Mittelwert des täglichen Zigarettenkonsums ersetzen: k k o2 = + = i=1
) Die folgenden A u s f ü h r u n g e n stützen sich in wesentlichen Punkten auf Henning „Mittelwert u n d Streuung". Vgl. auch DIN 55 3U2 **) Rechenblätter wurden von Heite h e r a u s g e g e b e n ; zu beziehen durch das Lochkartenwerk Schlitz
222 12 Die rechnerische Behandlung des Zahlenmaterials
b) ohne Rechenmaschine: Maxi zieht von jeder der Zahlen ai (i = 1,2, ... n) einen (im Grande genommen beliebigen) Wert c (den sogenannten Hilfspunkt) ab und erhält so die „reduzierten" Werte ai = aj — c, (i = 1,2, ... n). c wird so gewählt, daß die Zahlen a; möglichst klein und damit für die Rechnung möglichst bequem sind. Sodann bildet man n n St = ^ ai und S2 = ^ a* . Mittelwert und Varianz eri=i ¿=i geben sich daraus nach folgenden Formeln: 1 S[ + c, i2 = —- - (5; - - 5; n 1 n— 1 \ 2 n Wir haben also das Abziehen des Hilfspunktes c nur beim Mittelwert, nicht aber bei der Varianz rückgängig zu machen. Der Grund liegt darin, daß eine Verschiebung der Verteilung nur den Mittelwert, nicht aber die Varianz verändert. Beispiel : a'i = a, —10 a'2 ö;
ä=
11,6 9,6 10,7 9,3 9,7 10,4 10,2 9,9
+ 1,6
— + — — + +
0,4 0,7 0,7 0,3 0,4 0,2
— 0,1
S t = + 1,4 S2
2,56 0,16 0,49 0,49 0,09 0,16 0,04 0,01
ä = —- • 1,4 + 1 0 = 10,18 O s2
= A- (4,00 — 0,245) = 0,54
= 4,00
2. Die Berechnung aus zahlreichen Einzelwerten Ist die Anzahl der Einzelwerte größer als 25, dann läßt sich die Rechenarbeit dadurch vereinfachen, daß man die Werte in Gruppen zusammenfaßt. Es ist zweckmäßig, alle Gruppen gleich breit zu wählen. Da jedoch oft die Gruppeneinteilung von vornherein gegeben ist, wollen wir zunächst den allgemeinen Fall ungleicher Gruppen behandeln.
12.1 Die Berechnung von Mittelwert und Varianz
223
Im Prinzip geht man so vor, daß man für jede Gruppe die Gruppenmitte A; (das arithmetische Mittel aus unterer und oberer Gruppengrenze) bestimmt und so redinet, als ob alle Werte, die in diese Gruppe fallen, gleich der Gruppenmitte wären. (Dies bedeutet nicht, daß dieses Verfahren nur dann zu einem richtigen Mittelwert führt, wenn tatsächlich alle Werte in der Gruppenmitte vereinigt sind — was äußerst unwahrscheinlich wäre. Der Mittelwert stimmt vielmehr immer dann exakt, wenn man die Verteilung der Werte innerhalb der Gruppe durch eine beliebig geneigte Gerade darstellen kann.) Oft kann man diese Berechnung durch die Hilfspunktmethode weiter vereinfachen: Man subtrahiert von allen Gruppenmitten einen beliebigen Wert c, z. B. die Gruppenmitte einer stark besetzten Gruppe, und kommt so zu den „reduzierten" Gruppenmitten A'i = A; — c. Dann n n bildet man: S, = ^ n. Ä» S ^ ^ n . A " . Dabei ist nj die Anzahl der Werte in der i-ten Gruppe. Mittelwert und Varianz ergeben sich daraus nach den gleichen Formeln wie beim ungruppierten Material: a- = —i + c, s = n Beispiel: S
Gruppe
2
°;
grenzen*) 7 , 5 — 9,0 9 , 0 — 9,5 9,5—10,0 10,0—10,5 10,5—11,0 11,0—11,5 11,5—12,5
nä
*
9 15 16 26 18 12 4
n=100
1
~
n 1
( C'
\
S2
1
n
C'A
S, 1
I
A;1 A;1 = Aj —10,25 1 8,25 9,25 9,75 10,25 10,75 11,25 12,00
— 2,0 — 1,0 — 0,5 0 0,5 1,0 1,75
.
n1 iA l 1
n1tA1
-18) - 1 5 [—41 s j1 9 I> 12 1 7J
28
36,0 15,0 4,0 0 4,5 12,0 12,25
S t = —13 S a = 83,75
•) In diesem und den folgenden Beispielen wird die obere Gruppengrenze nicht zur Gruppe gerechnet.
224
12 Die rechnerische Behandlung des Zahlenmaterials
1Q 5 =
Tof
+
10,25 =
10'12'
Ist das Material von vornherein gruppiert, und sind die Randgruppen offen, dann kann man die Berechnung des Mittelwertes nur dann zu Ende führen, wenn man für jede offene Randgruppe die Summe der in sie faltenden Werte kennt. Man kann dann diese Summe anstelle des Produktes aus der Anzahl der Fälle und der (hier unbekannten) Gruppenmitte verwenden. Sind alle Gruppen gleich breit, so sind die reduzierten Gruppenmitten ein Vielfaches der Gruppenbreite b, wenn man für c eine geeignete Gruppenmitte wählt (Gruppenbreite = Differenz zwischen der oberen und unteren Grupnengrenze). Man kann also bei den Berechnungen die Gruppenbreite als Einheit wählen und die so gewonnenen Ergebnisse nachträglich mit der Gruppenbreite multiplizieren. Formal geschieht dies so, daß man eine beliebige Gruppe herausgreift und von dieser ausgehend die Gruppen in aufsteigender Richtung mit 1. 2, . . i n absteigender Richtung mit —1, —2, . . . numeriert. Die herausgegriffene Gruppe selbst bekommt die Nummer 0. Für die Berechnung ist es zweckmäßig, eine in der Mitte gelegene und stark besetzte Gruppe als Ausgangspunkt zu wählen. Ihre Gruppenmitte sei c. Dann bildet man zunächst die n n Hilfsgrößen S° S* = 2 " » ® ' • Mittelwert'und Vai=1 1=1 rianz ergeben sich daraus nach den analogen Formeln wie oben. Der einzige Unterschied besteht darin, daß wir bei der Berechnung des Mittelwertes mit der Gruppenbreite, bei der Berechnung der Varianz mit dem Quadrat der Gruppenbreite zu multiplizieren haben: 1 c« n - b c -i. *(ca = — S + c, s = , S — S1 n i n— 1V 2 n Man kann zeigen, daß durch die rechnerische Zusammen-
12.2 Die Berechnung von Median
225
fassung aller Fälle in der Gruppenmitte die Varianz meist vergrößert wird. Im Falle konstanter Gruppenbreite kann man diesen Effekt dadurch kompensieren, daß man die sogenannte Sheppardsehe Korrektur anbringt, d. h. s2 b2 u m ^ vermindert. Die Sheppard'sehe Korrektur erweist sich jedoch oft in ihrer Größe als bedeutungslos. Beispiel: i Gruppengrenzen "i 7,5— 8,0 8,0— 8,5 8,5— 9,0 9,0— 9,5 9,5—10,0 10,0—10,5 10,5—11,0 11,0—11,5 11,5—12,0 12,0—12,5
— — — — —
5 4 3 2 1 0 1 2 3 4
1 3 5 15 16 26 18 12 3 1 n = 100
ä
= w s2 =
(~23) + 0 2"i gg-
10'25
— — — — —
5 12 15 30 16 0 18 24 9 4
.2
"il
25 48 45 60 16 0 18 48 27 16
Sj = — 23 5° = 303 =
10>14>
(303 - 5,29) = 0,75.
Sheppard'sche Korrektur: korrigierter Wert: s2 = 0,73.
0 25 ' - = —0,02, iji
12.2 Die Berechnung von Median und durchschnittlicher Abweichung 1. Die Berechnung aus Einzelwerten Wir bezeichnen die Anzahl jener Werte, die größer als der Median ä sind, mit n+, ihre Summe mit S+. Analog ist n~~ die Anzahl der Werte, die kleiner als 5 sind, S ~ 15 Pftnzagl I
226
12 Die rechnerische Behandlung des Zahlenmaterials
deren Summe. Dann kann man die durchschnittliche Abweichung nach folgender Formel berechnen: B e i s p i e l : Gegeben sind 15 Zahlen: 8,8'
9.1
9.2 9,5 9.8 9.9
10,0
S" = 56,1 n- = 6
10.0
Median
10.3 10.5 10.5
S• = 75,1 n* = 7
10.1
10.8
Also gilt: 1 d= [(75,1-56,1)-(7-6) • 10] = 0,60. 15
11.3 11.6 . 2. Berechnung aus gruppiertem Material Zum Unterschied von der Berechnung der Standardabweichung bringt die Gruppenbildung bei der Berechnung der durchschnittlichen Abweichung keine wesentliche Ersparnis. Trotzdem wollen wir das Rechenverfahren im folgenden kurz skizzieren, da oft nur gruppiertes Material für die Berechnung zur Verfügung steht. Man ermittelt zunächst jene Gruppe, die den Median enthält. Zu diesem Zweck werden die Besetzungszahlen sukzessive aufaddiert und festgestellt, bei welcher Gruppe gerade die Hälfte der Gesamtzahl überschritten wird. Im nachstehenden Beispiel ist dies die Gruppe 10,0—10,5. Der Median liegt gerade beim 50. Wert. 40 Werte liegen unterhalb dieser Gruppe; daher ist der Median der 10. Wert in dieser Gruppe. Die Gruppe selbst enthält 26 Werte. Denkt man sich diese im Bereich 10,0 — 1 0 , 5 gleichmäßig verteilt, so liegt der 10. Wert an der Stelle 10,0 = 10,19. Dies ist unser Schätzwert für den Median.
• 0,5
12.2 Die Berechnung von Median
227
Beispiel: Gruppengrenzen
i
n
7,5— 8,0 8,0— 8,5 8,5— 9,0 9,0— 9,5 9,5—10,0 10,0—10,5 10,5—11,0 11,0—11,5 11,5—12,0 12,0—12,5
1 3 5 15 16 26 18 12 3 1
1 4 9 24 40 66
n = 100 Um die durchschnittliche Abweichung zu ermitteln, unterteilen wir die Gruppe, in der der Median liegt. (Ist die Anzahl der Werte ungerade, so lassen wir den MedianWert selbst bei den Berechnungen weg, rechnen also ab jetzt mit n — 1 statt n Werten.) Gruppengrenzen 7,5 8,0 8,5 9,0 9,5 10,0
— 8,0 — 8,5 — 9,0 — 9,5 —10,0 —10,19
10,19—10,5 10,5 —11,0 11,0 —11,5 11,5 —12,0 12,0 —12,5
i
n
1 3 5 15 16 10 16 18 12 3 1 n = 100
4 =
10,25 -2,5 — 2,0 — 1,5 — 1,0 — 0,5 — 0,15 0,1 0,5 1,0 1,5 2,0
"»
— — — — — -
'i
A
2,5 6,0 7,5 15,0 8.0 1.5
— 40,5
1.6 9,0 12,0 4,5 2,0
+ 29,1
228
12 Die rechnerische Behandlung des Zahlenmaterials
Dann wählen wir einen Hilfspunkt und ziehen diesen von jeder Gruppenmitte ab. Im konkreten Fall wählen wir als Hilfspunkt z. B. den Wert 10,25 und kommen so zu den in Spalte A ; angegebenen Zahlen. Dann berechnen wir wie bei der Hilfspunktmethode die Summe der positiven Werte: S + = 29,1 und die Summe der negativen Werte: S~ = — 40,5, dann entsprechend der obigen Formel für die durchschnittliche Abweichung: d = lin (S+ — S - ) , also d = 7ioo (29,1 + 40,5) = 0,696. Ähnlich wie bei der Berechnung der Standardabweichung ist es nicht nötig, die Subtraktion des Hilfspunktes wieder rüdegängig zu machen, da die Summen S + und S — aus gleich vielen Summanden bestehen (n+ = n~~ = 50), der Einfluß des Hilfspunktes bei der Differenzbildung also wegfällt. 12.3 Das Rechnen mit fehlerbehafteten Zahlen Gegeben seien zwei Zahlen, A, B, die mit gewissen Fehlern AA und AB behaftet sind. AA und AB werden als absolute,
und
als relative Fehler bezeichnet.
Wir interessieren uns dafür, mit welchem Fehler eine aus A und B berechnete Funktion f{A,B) behaftet ist. Wenn wir annehmen, daß die relativen Fehler klein gegen 1 sind (d. h. AA klein gegen A und AB klein gegen B), gilt: Af(A, B) = f(A + AA,B + AB) — f(A, B) = W A , ß ) AA + /b(A, B) AB. Dabei sind fA und /B die partiellen Ableitungen von f nach A bzw. B. Wir betrachten nun einige Spezialfälle: 1) /(A, B) = A ± B. Es gilt: A f(A, B) = [(A + AA) ± {B + + AB)] - [A ± B] = AA ± AB. Im Falle der Substraktion f(A, B) = A-B ist: Af{A, B) = AA-AB. Haben AA und AB entgegengesetztes Vorzeichen, so addieren sich die Fehler und können dadurch, verglichen mit A — B, sehr beachtlich werden.
12.4 Die Kompensation unabhängiger Fehler 2) f(A, B) = AB. Demnach ist:
Es gilt: fA(A, B) = B,
A f{A, B)=BAA 3) f(A, B) = | .
+ AAB
und
229
fB(A, B) = A.
Af(A, B) _. AA f(A, B) A
Es gilt: fA(A, B) = ± , fB(A, B) =
AB B -
Demnach ist: . . . . D, zlA A ,D Af(A,B) = ~ ] r - w A B
, und
zl /(A, B) zf A AB - j ^ - = — - _ .
Vgl. hierzu auch Kallmeyer sowie das einschlägige Kapitel in der Methodenlehre von Anderson, S. 83 ff. 12.4 Die Kompensation unabhängiger Fehler In manchen Fällen werden Größen miteinander kombiniert, deren Fehler den Charakter zufälliger Variabler haben. Sind diese Fehler voneinander unabhängig, so werden sie sich zum Teil gegenseitig kompensieren, vorausgesetzt, daß sie alle in der gleichen Größenordnung sind, d. h. nicht einzelne Fehler alle anderen dominieren. Diese Kompensation wird naturgemäß um so vollkommener sein und praktisch eine um so größere Rolle spielen, je größer die Anzahl der miteinander verknüpften Größen ist. Xi, X2, ... xn seien n unabhängige zufällige Variable. Der Mittelwert von x% sei flu die Standardabweichung a;. Begnügen wir uns mit der 1. Näherung, dann erhalten wir für die Funktion f(xi, x> . . . xn) Mittelwert Varianz
Mf = f(fJ-v u„ ...
ßn),
o' = 2 f*2 00 o 1—1 I I 1
TP Oí 00 1 li CO cq
o 00 OS i1 ira co CO
o o o — i iH li 1—1 m
¿ ¿
•
ira ira ira 00 co co co t 1 1 1 ci cq o T—t
¿ ¿
o O O I—i
¿
¿>
ira 00 co rH
t-
¿¿
S3 S
co co rH I 1 I I d> ^ ira N
I-) co CM I IO 1Q Ó to in i-l cq
CO TP
a IO CQ m io CO TJi
cq oo rt; •—1 •—l CSI S
oo o co co
io ira t~ o h a «i «
¿ ¿
ti ci rH
œ o » cq oo ' N ^
J.
mi i»
m in © oo (O
»
O O cq
O i—) co T-l Oí 00 OQ CO CO 1/3 Oí io rH t> O co rH co ira 00 i-i 55
¿
¿¿
N
9 3 a
c n
¿
1 rH l"H cJj co 03 cq 00 i-H co
«. Ü
o
3
t> co as t-H m rH 1 1 1 1 1 1 1 1
00
ira rH o rH o o rH I 1 1 1 OS J> ci ira oo t> cq ira O)
nS •ëc/j ä i V ai s >o
ira co co o i-H rH