Allgemeine Methodenlehre der Statistik: Band 1 Elementare Methoden unter besonderer Berücksichtigung der Anwendungen in den Wirtschafts- und Sozialwissenschaften [Reprint 2019 ed.] 9783111366067, 9783111008912


190 88 15MB

German Pages 205 [232] Year 1960

Report DMCA / Copyright

DOWNLOAD PDF FILE

Table of contents :
Inhaltsverzeichnis
Band II (Slg. Göschen Bd. 747) enthält
1. Grundbegriffe
2. Häufigkeitsverteilungen
3. Parameter
4. Statistische Fehler
5. Die Methode der Stichprobenerhebungen in der Wirtschafts- und Sozialstatistik
6. Bestandsmassen — Bewegungsmassen
7. Allgemeine Theorie der Maßzahlen
8. Die Berechnung von Indexzahlen
9. Einige Beispiele für Indexzahlen
10. Die Analyse von Zeitreihen
Technischer Anhang
11. Die Gewinnung des Zahlenmaterials
12. Die rechnerische Behandlung des Zahlenmaterials
13. Die Darstellung des Zahlenmaterials
Literaturhinweise
Namen- und Sachverzeichnis
Front Matter 2
Inhaltsübersicht
Geisteswissenschaften
Naturwissenschaften
Technik
Sammlung Göschen / Bandnummernfolge
Autorenregister
Recommend Papers

Allgemeine Methodenlehre der Statistik: Band 1 Elementare Methoden unter besonderer Berücksichtigung der Anwendungen in den Wirtschafts- und Sozialwissenschaften [Reprint 2019 ed.]
 9783111366067, 9783111008912

  • 0 0 0
  • Like this paper and download? You can publish your own PDF file online for free in a few minutes! Sign Up
File loading please wait...
Citation preview

SAMMLUNG

GÖSCHEN

BAND

746/746a

ALLGEMEINE M E T H O D E N L E H R E DER STATISTIK von

DR. P H I L . J O H A N N

PFANZAGL

a.o. P r o f . an d e r Universität Wien i

ELEMENTARE METHODEN UNTER BESONDERER BERÜCKSICHTIGUNG DER ANWENDUNGEN IN DEN WIRTSCHAFTS- UND SOZIALWISSENSCHAFTEN Mit 35 A b b i l d u n g e n

W A L T E R D E G R U Y T E R & CO. vormals G. J . G ö s c h e n ' s c h e V e r l a g s h a n d l u n g • J . G u t t e n t a g , V e r l a g s b u c h h a n d l u n g • G e o r g R e i m e r • K a r l J . T r ü b n e r • Veit & C o m p .

BERLIN

1960

© C o p y r i g h t 1960 b y W a l t e r de G r u y t e r & C o . , B e r l i n W 35. — einschl. der R e c h t e der H e r s t e l l u n g v o n P h o t o k o p i e n und v o n der V e r l a g s h a n d l u n g v o r b e h a l t e n . — A r c h i v - N r . 11 07 46. Druck: D e u t s c h e Z e n t r a l d r u c k e r e i , B e r l i n S W 6 1 . — P r i n t e d

Alle Rechte, Mikrofilmen, — S a t z und in G e r m a n y .

Inhaltsverzeichnis Seite

1 Grundbegriffe 1.1 Einleitung 1.2 Die Statistik in den Naturwissenschaften 1.3 Die Statistik in den Sozialwissenschaften 1.4 Gegenüberstellung von Natur- und Sozialwissenschaften

7

....

2 Häufigkeitsverteilungen 2.1 Artmäßige und zahlenmäßige Merkmale 2.2 Diskrete und stetige Merkmale 2.3 Extensive und intensive Merkmale 2.4 Häufigkeitsverteilungen 2.5 Die Gesamtheit 2.6 Gesamtheit und Stichprobe

3 Parameter 3.1 3.2 3.3 3.4 3.5

Lokalisations-Parameter Dispersions-Parameter Der Variationskoeffizient Der Fehler des Mittelwertes Der Fehler der relativen Häufigkeit

4 Statistische F e h l e r 4.1 4.2 4.3 4.4 4.5 4.6

Grundsätzliches Das Modell der „zufälligen Fehler" Die Interpretation fehlerbehafteter Zahlen Fehler bei der Erhebung Fehler bei der Stichprobenauswahl Die Bedeutung zufälliger und systematischer Fehler bei der Stichprobenerhebung

7 7 8 10

12 13 15 16 16 21 24

27 27 31 36 37 39

41 41 43 44 49 54 59

5 Die M e t h o d e d e r S t i c h p r o b e n e r h e b u n g in der Wirtschaftsu n d Sozialstatistik 63 5.1 5.2 5.3 5.4 5.5 5.6 5.7

Die geschichtete Stichprobe Die optimale Stichprobe Die proportionale Stichprobe Der Vergleich zwischen den Schichten Die Auswahl der Schichten Schlußbemerkungen zur geschichteten Stichprobe Die Klumpenstichprobe

63 65 66 69 71 73 73

4

Inhaltsverzeichnis 5.8 Vergleich von Schichten und Klumpen 5.9 Die mehrstufige Stichprobe 5.10 Das Problem der Nichtbeantwortung . .

6 Bestandsmassen — Bewegungsmassen 6.1 Grundbegriffe 6.2 Die Analyse der Verweildauer 6.3 Die mittlere Verweildauer 6.4 Abgangsordnung und Verteilung der Verweildauer 6.5 Die Konstruktion stationärer Gesamtheiten

7 Allgemeine Theorie der Maßzahlen 7.1 7.2 7.3 7.4 7.5 7.6 7.7 7.8

Die Die Die Die Die Der Die Die

Konstruktion von Maßzahlen Verhältniszahlen Meßzahlen Gliederungszahlen Beziehungszahlen Mittelwert von Verhältniszahlen Standardisierung Transplantation'

8 Die Berechnung von Indexzahlen 8.1 Grundsätzliches 8.2 Die Formeln von Laspeyres und Paasche 8.3 Sub-Indizes 8.4 Repräsentation 8.5 Erweiterung des Indexsdiemas 8.6 Substitution

9 Einige Beispiele für Indexzahlen 9.1 Index der Großhandelspreise 9.2 Index der Verbraucherpreise 9.3 Kaufkraftvergleiche 9.4 Lohnindizes 9.5 Reallohnvergleiche 9.6 Produktionsindizes 9.7 Produktivitätsindizes 9.8 Schlußbemerkungen

10 Die Analyse von Zeitreihen

Seite 75 76 77

81 81 83 84 87 91

95 95 99 99 105 107 110 113 120

121 121 123 126 128 129 131

134 135 136 140 142 143 144 146 147

148

10.1 Ausschaltung von zufälligen Schwankungen 148 10.2 Gleitende Durchschnitte 149 10.3 Methodische Bemerkungen zur Berechnung der gleitenden Durchschnitte 152 10.4 Die Differenzenmethode 155 10.5 Die Ausschaltung von Saisonschwankungen 156 10.6 Methoden für konstante Saisonfigur 159 10.7 Methoden für Saisonfigur mit variabler Amplitude 162 10.8 Methode für bewegliche Saisonfigur 164 10.9 Die Harmonische Analyse I65 10.10 Sdilußbemerkungen I66

Inhaltsverzeichnis Technischer

Anhang

11 Die Gewinnung des Zahlenmaterials U.l 11.2 11.3

Die Die Das Die

B e r e c h n u n g v o n M i t t e l w e r t und V a r i a n z B e r e c h n u n g d e r durchschnittlichen A b w e i c h u n g R e d i n e n mit f e h l e r b e h a f t e t e n Z a h l e n Kompensation unabhängiger Fehler

13 Die Darstellung des Zahlenmaterials 13.1 13.2 13.3 13.4 13.5 13.6 13.7

Seite

167

D i e A b g r e n z u n g d e r E r h e b u n g s m a s s e und d i e F e s t l e g u n g d e r Erhebungsmerkmale \.. 167 D i e A u s w a h l d e r E r h e b u n g s e i n h e i t e n und des E r h e b u n g s verfahrens 171 Die Aufbereitung 173

12 Die rechnerische Behandlung des Zahlenmaterials 12.1 12.2 12.3 12.4

5

Die Gestaltung von Tabellen Kurvendiagramme Stabdiagramme Flädiendiagramme Darstellung einer Struktur Kartogramme Bildstatistiken

177 177 181 182 183

184 184 187 189 189 190 191 191

Literatur

196

Namen- und Sachverzeichnis

203

B a n d i i (Slg. Göschen Bd. 747) enthält: Höhere Methoden unter besonderer Berücksichtigung der Anwendungen in Naturwissenschaft, Medizin und Technik.

1 Grundbegriffe 1.1 Einleitung

Vielfach wird die Statistik als die Lehre von der Analyse von Massenerscheinungen definiert. Während sich früher die Anwendung der Statistik tatsächlich auf große Mengen bezog, wie durch das Wort „Masse" suggeriert wird, tritt gerade in der neueren Statistik die Analyse von Stichproben kleinen Umfanges in den Vordergrund, so daß das Wort „Masse" in der obigen Definition heute nur als „Mehrheit von Individuen" interpretiert werden darf. Natürlich ist nicht jede Analyse von Massenerscheinungen Statistik. Das charakteristische Kennzeichen der statistischen Analyse ist, daß sie sich formaler Modellvorstellungen bedient. Die statistischen Methoden sind insbesondere zur Analyse von Erscheinungen geeignet, die unkontrollierten Einflüssen ausgesetzt sind. Dabei spielen sog. stochastische (d. h. auf der Wahrscheinlichkeitstheorie aufbauende) Modelle eine besondere Rolle. 1.2 Die Statistik in den Naturwissenschaften

Wenn der Physiker alle Bedingungen eines Experimentes mit beliebiger Präzision festlegen kann, braucht er keine Statistik, um die Ergebnisse dieses Experimentes auszuwerten. Er braucht die Statistik jedoch dann, wenn gewisse unkontrollierte Einflüsse da sind, welche eine merkliche „Streuung" der Meßergebnisse verursachen. Dies trifft in der Physik oder Chemie bei Laboratoriumsexperimenten seltener zu als etwa bei biologischen oder physiologischen Experimenten, bei denen sich schon aus der Natur des Materials heraus unkontrollierbare Einflüsse ergeben. Es gilt jedoch vor allem dann, wenn man die Sphäre des Laboratoriumsexperimentes verläßt und sich in die Fabrik, auf das Feld oder in das Krankenhaus begibt: hier sind die Möglichkeiten des „Experimentierens" sehr beschränkt. Viele maßgebliche Bedingungen sind vorgegeben, können nicht nach Belieben variiert werden — und trotzdem müssen aus den Daten ähnliche Schlüsse gezogen werden wie

8

1 Grundbegriffe

aus den Laboratoriumsexperimenten, bei denen man einen viel größeren Teil der Bedingungen nach Belieben festlegen kann. Wenn man eine Untersuchung darüber anstellt, ob — und wie — die Haltbarkeit von Kokillen von der chemischen Zusammensetzung des gegossenen Eisens abhängt, kann man nicht mit einem großen Experiment beginnen und Eisensorten mit den verschiedensten chemischen Zusammensetzungen unter genormten Bedingungen gießen. Man ist praktisch darauf angewiesen, die Abhängigkeit aus den verfügbaren Aufzeichnungen „herauszuredinen". Und in diesen Aufzeichnungen spiegeln sich natürlich alle Einflüsse des normalen Betriebsgeschehens wider und verdecken den Einfluß der chemischen Zusammensetzung vor dem oberflächlichen Betrachter. Oder: Es soll ein neues Mittel zur Behandlung der Rhesus-Inkompatibilität erprobt werden. Auch hier ist man gezwungen, die Erprobung an einem sehr inhomogenen Material vorzunehmen: Frauen, die bereits frühere Geburten hinter sich haben, Frauen, bei denen es sich um die erste Geburt handelt. Die früheren Geburten können mit oder ohne Komplikationen verlaufen sein. Es kann eine Reihe von Interruptionen vorliegen usw. usw. Alle diese Faktoren können auf den Behandlungseffekt von Einfluß sein. Auch wenn man eine gewisse Auslese trifft, verbleibt stets eine große Zahl unkontrollierbarer Einflüsse, die unter Umständen den Effekt der Behandlungsmethode bei oberflächlicher Betrachtung verdecken können. 1.3 Die Statistik in den Sozialwissenschaften Was hier für Technik und Medizin gesagt wurde, gilt in noch wesentlich stärkerem Ausmaß für die Analyse wirtschaftlicher und soziologischer Phänomene. Auch hier ist natürlich die Möglichkeit von Experimenten gegeben. Wenn eine große Werbekampagne vorbereitet wird, kann man zwei einander möglichst ähnliche, aber voneinander isolierte Städte auswählen und in einer der beiden Städte eine Probe-Werbekampagne durchführen und sodann die Umsatzentwicklung beider Städte vergleichen. Man hat auf

1.3 Die Statistik in den Sozial Wissenschaften

9

diese Art verschiedene Einflüsse, wie die saisonale und konjunkturelle Entwicklung, unter Kontrolle gebracht, wenn sich saisonale und konjunkturelle Einflüsse in beiden Städten stets in gleicher Weise auswirken. Jeder Unterschied in der Entwicklung zwischen beiden Städten wird daher mutmaßlich auf den Einfluß der Werbekampagne zurückzuführen sein. (Wesentlich zuverlässigere Ergebnisse erhält man natürlich, wenn man dieses Experiment nicht mit einem einzelnen Städtepaar, sondern mit mehreren durchführt.) Die Möglichkeit, unter „kontrollierten" Bedingungen zu arbeiten, ist jedoch bei wirtschaftlichen und soziologischen Analysen beschränkter als in den meisten anderen Wissenschaften"). Eine ähnlich ungünstige Situation wie in den Sozialwissenschaften finden wir übrigens auch in der Meteorologie, und es ist nicht uninteressant, festzustellen, daß die statistischen Methoden in der Meteorologie nicht unähnlich denen der Sozialwissenschaften sind: emsiges Sammeln von Urmaterial, Korrelationsberechnungen, Zeitreihenanalysen usw. Die typische Aufgabe der Wirtschaftsstatistik ist die Analyse von Daten, die von sehr vielen unkontrollierten Faktoren beeinflußt sind. Hier ein Beispiel: Es ist zu beurteilen, ob das „Niveau" der Konsumentenpreise eine steigende Tendenz aufweist oder nicht. Die Fakten: In den letzten Monaten haben sich bei verschiedenen Waren Preissteigerungen, vereinzelt auch Preissenkungen, ergeben. Hier und da ist eine Ware in einer völlig neuen Qualität auf den Markt gekommen und hat — trotz höheren Preises — das Interesse der Konsumenten auf sich gezogen. Einzelne der Preissteigerungen sind lediglich saisonbedingt — vielleicht im konkreten Fall wegen eines kalten Frühjahres besonders ausgeprägt. Andere Preissteigerungen dürften auf Panikkäufe zurückzuführen sein und sind daher mußmaßlich nur vorübergehender Natur. *) W i e O. Morgenstern betont, sind allerdings auch im Bereiche der Wirtschaft weit mehr Experimentiermöglichkeiten gegeben, als tatsädilich ausgenutzt werden.

10

1 Grundbegriffe

Wir haben hier eine sehr komplexe Situation vor uns, welche von einer großen Zahl unkontrollierter Faktoren beeinflußt ist. Es ist zu beurteilen, ob das „Preisniveau" tatsächlich in Bewegung ist, ob deflatorische Maßnahmen notwendig erscheinen oder nicht. Hier ist natürlich ein Experiment undenkbar: Man kann nicht das Geschehen der letzten Monate nochmals abrollen lassen unter „kontrollierten" Bedingungen, also den saisonalen Einfluß (oder zumindest die abnorm niedrige Temperatur des Frühjahrs) und die Panikkäufe eliminieren und beobachten, wie sich das von diesen Störungen befreite „Preisniveau" entwickelt hätte. Man ist vielmehr gezwungen, die Schlüsse aus den das tatsächliche Geschehen betreffenden Daten zu ziehen, vor allem durch Zuhilfenahme von Vergleichsdaten aus anderen Perioden (durch Studium der Auswirkungen saisonaler Einflüsse in den vorhergehenden Jahren, durch Studium der Auswirkungen von Panikkäufen in früheren Zeitpunkten oder zur gleichen Zeit in anderen Ländern u. ä.). 1.4 Gegenüberstellung von Natur- und Sozialwissenschaften Die hier skizzierten Beispiele zeigen eine große Variation in der Aufgabe, die der Statistik gestellt ist: Das eine Extrem: das Experiment, bei dem ein großer Teil der Einflußfaktoren beliebig festgelegt werden kann, so daß die Auswirkungen der übrigen — unkontrollierten — Einflüsse mehr oder minder den Charakter von Zufallsschwankungen tragen. Hier besteht die Aufgabe der Statistik darin, bei der Planung des Experimentes mitzuwirken (die Größe der kontrollierten Einflußfaktoren festzulegen usw.) und bei der Auswertung die Größe der zufälligen Einflüsse zu beurteilen. Das andere Extrem: die Analyse von Daten, welche eine unkontrollierte Situation betreffen. Hier ist zu entscheiden: welche Einflußfaktoren sind bei der Erhebung der Daten zu berücksichtigen? Die sorgfältige Aufzeichnung der verschiedenen tatsächlich auftretenden Kombinationen von Einflußfaktoren muß jene Informationen liefern, die man im Experiment durch planmäßige Festlegung der Einflußfaktoren erhält.

1.4 Gegenüberstellung von Natur- und Sozialwissenschaften

H

Noch ein zweiter Umstand beeinflußt den Charakter und die Anwendbarkeit der statistischen Methoden entscheidend: „ . . . in allen Fällen wird die statistische Arbeitsweise dadurch charakterisiert, daß sich der Statistiker von vorneherein von einem beträchtlichen Teil jener Kenntnisse lossagt, über die er für jede einzelne Beobachtungseinheit verfügt oder wenigstens verfügen könnte, und daß er sich nur mit jenen Angaben über die Einheiten begnügt, die über diese bei der Erhebung registriert werden." (O. Anderson, „Methodenlehre der Sozialstatistik", S. 6.) An die Stelle der tatsächlich existierenden Einheit, des tatsächlichen Geschehens, tritt der „statistische Schatten", wie O. Anderson sagt, in dem nur einzelne Merkmale der Wirklichkeit registriert sind. Der Einzelfall verliert seine Individualität, er geht in einer Gruppe von Fällen auf, die alle die gleiche Merkmalskombination aufweisen, also einen identischen „statistischen Schatten" haben. Dieser Verlust der Individualität muß keine schwerwiegende Einbuße an Informationen mit sich bringen: Die Unfallversicherung weiß nicht, wer im nächsten Jahr einen Unfall erleiden wird und welches die näheren Begleitumstände dieses Unfalles sein werden — aber sie weiß aus der Erfahrung vergangener fahre, wieviele Unfälle es ungefähr sein werden, wieviele davon tödlich verlaufen werden usw. Für die Zwecke der Versicherung genügen diese Informationen. Entscheidend ist nicht der Verlust der Individualität, sondern die Frage, ob es möglich ist, alle relevanten Umstände im „statistischen Schatten" zu berücksichtigen. Vielfach kann man wirklich alle relevanten, Merkmale registrieren: Wenn genetische Untersuchungen mit irgendwelchen Fliegen durchgeführt wurden, ist es irrelevant, ob die Tiere gefangen oder gezüchtet wurden, wie alt und wie groß sie sind, ob sie 6 Beine haben oder eines davon durch einen Unglücksfall einbüßten: wesentlich ist der Gemotyypus, und dieser kann durch seinen „Schatten" genau beschrieben werden. Die Vernachlässigung soundso vieler Merkmale bringt hier keinen Verlust an relevanten Informationen mit sich.

12

2 Häufigkeitsverteilungen

Bedenken wir nun anderseits die Probleme, die sich bei einer Untersuchung über den Zusammenhang von Wohlstand und Kinderzahl ergeben. Hier gibt es eine Reihe psychologischer Faktoren (Wunsch nach Ungebundenheit, Angst vor Kriegsgefahr usw.), welche den zu untersuchenden Sachverhalt maßgeblich beeinflussen, die aber in den „statistischen Schatten" kaum aufgenommen werden können, die statistisch schwer erfaßbar sind. Die Vernachlässigungen, zu denen die Statistik bei der Behandlung wirtschaftlicher, soziologischer oder psychologischer Fragen gezwungen ist, sind bedeutend relevanter als in der Technik, Biologie oder Medizin. Daraus und aus dem unterschiedlichen Grad der „Kontrollierbarkeit" ergibt sich eine starke Differenzierung in der Art der zur Anwendung gelangenden statistischen Methoden. So sind es bei sozialwissenschaftlichen Untersuchungen eher die elementaren Methoden, welche sinnvolle Anwendung finden, während die fruchtbarsten Anwendungsgebiete der verfeinerten Methoden in den Naturwissenschaften (Technik, Biologie, Medizin usw.) liegen. Daraus ergibt sich eine natürliche Unterteilung des Stoffgebietes: Band I der vorliegenden Methodenlehre wendet sich vor allem an den Statistiker in den Sozialwissenschaften, Band II an den Statistiker in den Naturwissenschaften. Diese Trennung ist jedoch keineswegs streng: der Statistiker in den Sozialwissenschaften wird immer wieder auf Fragen stoßen, welche verfeinerte Methoden erfordern, die erst in Band II behandelt werden. Umgekehrt wird der an den höheren Methoden interessierte naturwissenschaftliche Statistiker auf wesentliche Teile des I. Bandes als Vorbereitung angewiesen sein. 2 Häufigkeitsverteilungen Wie bereits eingangs ausgeführt wurde, besteht das Wesen der statistischen Methoden darin, daß von jeder bei einer Erhebung erfaßten Einheit gewisse Merkmale regi-

2.1 Artmäßige und zahlenmäßige Merkmale

13

striert werden. Unser erster Schritt besteht daher darin, uns einen systematischen Uberblick über die Natur der Merkmale zu verschaffen. 2.1 Artmäßige und zahlenmäßige Merkmale Herkömmlicherweise unterscheidet man zwischen artmäßigen (qualitativen) und zahlenmäßigen (quantitativen) Merkmalen. Typische Beispiele für artmäßige Merkmale sind das Geschlecht, der Familienstand und der Beruf; im Falle der Außenhandelsstatistik: die Art einer Ware oder das Bestimmungsland. Zahlenmäßige Merkmale sind etwa das Alter oder das Einkommen einer Person, die exportierte Menge u. ä. Selbstverständlich wird ein artmäßiges Merkmal nicht bereits dadurch zu einem zahlenmäßigen, daß man den einzelnen Ausprägungen Zahlen zuordnet: So ist die Steuergruppe, deren Ausprägungen durch die Zahlen 1, 2, 3 charakterisiert werden, natürlich ein artmäßiges Merkmal und kein zahlenmäßiges (es hätte wenig Sinn, festzustellen, daß sich die durchschnittliche Steuergruppe von 2,1 auf 2,2 verschoben hat). Die Unterscheidung in artmäßige und zahlenmäßige Merkmale erweist sich für die meisten Zwecke der Sozialstatistik als ausreichend. Für die Anwendung verfeinerter statistischer Methoden ist sie jedoch zu oberflächlich. Neben artmäßigen Merkmalen wie Geschlecht oder Beruf, deren einzelne Ausprägungen wirklich verschiedenartig sind, gibt es auch solche, bei denen sich die einzelnen Ausprägungen im wesentlichen nur durch ihre Intensität unterscheiden. Da9 einfachste Beispiel liefert die Notenskala: „Sehr gut", „Gut", „Befriedigend", „Genügend", „Nicht genügend". Hier ist eine eindeutige Ordnung (Reihenfolge) vorgegeben, zum Unterschied etwa von dem Merkmal „Beruf", für dessen einzelne Ausprägungen (Tischler, Schneider, Verkäufer usw.) es keine natürliche Anordnung gibt. Ebenso kann man bei der Qualitätskontrolle die Produkte nach ihrer Fehlerhaftigkeit in Gruppen (1., 2., 3. Wahl) einteilen. Bei diesen Merkmalen ist eine natürliche Ordnung gegeben, die man selbstverständlich auch irgendwie durch Zahlen

14

2 Häufigkeitsverteilungen

ausdrücken kann, bei denen diese Zahlen aber eben bloß diese Ordnung angeben und nicht mehr. Die Berechnung von Durchschnittswerten hat in diesem Falle wenig Sinn. (Dies gilt auch für die Schulnoten!) Auch unter den zahlenmäßigen Merkmalen gibt es eine ganze Reihe, die im Grunde genommen bloß eine Ordnung zum Ausdruck bringen, so z. B. die Dioptrie — aufgefaßt als Maß für die Sehschärfe des Auges. Wir haben für diese Merkmale zwar eine konventionell festgelegte Zahlenskala; sie unterscheiden sich jedoch von den weiter unten besprochenen echten zahlenmäßigen Merkmalen dadurch, daß ihre Skala beliebigen monotonen Transformationen unterworfen werden kann, ohne daß sich deren Aussagegehalt ändert. Geordnete artmäßige Merkmale und zahlenmäßige Merkmale, deren Skala beliebigen monotonen Transformationen unterworfen werden kann, gehören logisch gesehen in eine Gruppe: es sind Merkmale, für die es eine natürliche Ordnung gibt. Ob diese Ordnung durch eine Zahlenskala repräsentiert wird oder nicht, ist im Grunde genommen nebensächlich. Daneben gibt es die sogenannten echten zahlenmäßigen Merkmale, wie wir sie vor allem in der Physik finden: die Länge, das Gewicht, der elektrische Widerstand usw. Ein Widerstand von 200 Q ist doppelt so groß wie ein Widerstand von 100 £2, denn zwei Widerstände von je 100 £2 in Serie geschaltet ergeben tatsächlich einen Widerstand von 200 £2. Hingegen wäre es sinnlos, festzustellen, daß eine Kurzsichtigkeit von 4 Dioptrien doppelt so stark ist wie eine von 2 Dioptrien. Wir können Skalen, die nur eine Ordnung zum Ausdruck bringen, als topologische Skalen bezeichnen; Skalen, deren Informationsgehalt -darüber hinausgeht, bei denen es sinnvoll ist, Differenzen zu vergleichen usw., bezeichnen wir als metrische Skalen. (Vgl. hierzu: J. Pfanzagl.) Die hier eingeführte Unterscheidung ist keineswegs Haarspalterei. Sie wird sich bei der Anwendung von mathematischen Methoden als wesentlich erweisen.

2.2 Diskrete und stetige Merkmale

15

2.2 Diskrete und stetige Merkmale Ein zweiter Einteilungsgesichtspunkt ist die Unterscheidung von diskreten und stetigen Merkmalen. Bei diskreten Merkmalen sind nur ganz bestimmte diskrete Ausprägungen möglich. Diskrete Merkmale basieren in der Regel auf einem Zählvorgang. Beispiele für solche Merkmale sind: Anzahl der Kinder, die eine Frau geboren hat, Anzahl der Beschäftigten eines Betriebes usw. Stetige Merkmale sind solche, die jeden beliebigen Wert — zumindest innerhalb eines gewissen Intervalls — annehmen können. Stetige zahlenmäßige Merkmale basieren in der Regel auf einem Meßvorgang. Beispiele für solche Merkmale sind: das Alter einer Person, ihre Körpergröße, ihr Gewicht usw. Die Unterscheidung zwischen stetigen und diskreten Merkmalen wird in der Regel nur auf zahlenmäßige Merkmale angewendet. Sie ist jedoch auch bei artmäßigen Merkmalen sinnvoll, sofern eine natürliche Ordnung gegeben ist. (Artmäßige Merkmale ohne Ordnung sind a priori diskret.) Selbstverständlich ist die Unterscheidung zwischen diskreten und stetigen Merkmalen eher graduell als prinzipiell. Das Gewicht einer Person ist ein stetiges, ihr Einkommen jedoch ein diskretes Merkmal, denn es kann — in Pfennigen ausgedrückt — nur ganzzahlige Werte annehmen. In der methodischen Behandlung besteht jedoch zwischen so fein abgestuften diskreten Merkmalen wie dem Einkommen (oder gar dem Umsatz eines Betriebes) und einem stetigen Merkmal kein Unterschied. Hingegen besteht ein ausgeprägter Unterschied in der methodischen Behandlung zwischen einem stetigen Merkmal und einem diskreten Merkmal mit einem kleinen Wertevorrat, wie es etwa die Kinderzahl darstellt. Umgekehrt wird ein stetiges Merkmal sehr oft „gruppiert" und dadurch für die statistische Behandlung zu einem diskreten Merkmal: So wurden in Tab. 2, S. 18, die Neugeborenen nach ihrer Größe in Gruppen zusammengefaßt. Ebenso wird oft einfach zwischen Rauchern und Nichtrauchern unterschieden, anstatt die Intensität des Rauchens zu erfassen.

16

2 Häufigkeitsverteilungen 2.3 Extensive und intensive Merkmale

Im Bereiche der zahlenmäßigen Merkmale kann man nach Flaskämper („Allgemeine Statistik", Teil I, S. 40) weiter unterscheiden zwischen extensiven und intensiven Merkmalen. Grob gesprochen sind extensive Merkmale solche, bei denen die Summe einen Sinn hat, intensive Merkmale solche, bei denen nur ein Mittel sinnvoll ist. Extensive Merkmale sind z. B. die Anzahl der Einwohner eines Landes, denn man kann sie mit den analogen Zahlen anderer Länder zu einer größeren Einheit zusammenfassen, z. B. die Einwohnerzahlen der europäischen Länder zu einer Einwohnerzahl Europas; ferner Wertangaben, etwa der Umsatz im Monat Januar, der mit den Umsätzen anderer Monate zu einem Jahresumsatz zusammengefaßt werden kann. Intensive Größen sind beispielsweise die Preise: man kann zwar einen mittleren Preis errechnen, aber die Summe von Preisen für sich hat keine Bedeutung. Extensiv-intensiv schließen einander jedoch nicht aus. Der Lohn beispielsweise kann sowohl als extensives als auch als intensives Merkmal aufgefaßt werden. 2.4 Häufigkeitsverteilungen

Um einen Überblick über die Struktur der von der Erhebung erfaßten Masse zu geben, kann man bei einem diskreten (art- oder zahlenmäßigen) Merkmal einfach angeben, wieviele Fälle (oder welcher Bruchteil oder Prozentsatz) auf jede einzelne Ausprägung desselben entfallen. Dies nennt man Häufigkeitsverteilung. Oft wird die Häufigkeitsverteilung nicht nur in Form einer Tabelle angegeben, sondern auch graphisch dargestellt (Bild 1). Bild 1. Wohnbevölkerung der Bundesrepublik Deutschland am ' 13. 9. 1950, aufgegliedert nach dem Familienstand.

2.4 Häufigkeitsverteilungen

17

Tabelle 1 Wohnbevölkerung der Bundesrepublik Deutschland am 13. 9. 1950 nach d e m Familienstand Familienstand ledig verheiratet verwitwet geschieden Wohnbevölkerung insgesamt

Häufigkeit in 1 000 in o/o 21 539 21 773 3 784 601

45,2 45,6 7,9 1,3

47 696

100,0

Q u e l l e : Stat. J a h r b . f. d. B u n d e s r e p u b l i k D e u t s c h l a n d 1958, S. 39.

Die in Tab. 1 angegebenen %-Zahlen werden relative Häufigkeiten genannt. Es handelt sich dabei um die Besetzungszahlen der einzelnen Ausprägungen, bezogen auf die Gesamtzahl der Fälle. Diese wird entweder gleich 1 gesetzt oder gleich 100, wie in unserem Beispiel. Bei den stetigen Merkmalen liegt die Situation etwas anders: um die Struktur der Masse beschreiben zu können, muß man hier erst eine künstliche Gruppeneinteilung schaffen (siehe Tabelle 2, S. 18). Die Gruppeneinteilung ist hier jedoch willkürlich und kann im Prinzip beliebig verfeinert werden. Die in Bild 2 «cül dargestellte HäufigkeitsverteiBild 2. Aufgliederung neulung, bei der eine Gruppe Neugeborener Kinder nach der geborener nach der Größe Größe. aufgegliedert wurde, zeigt schon fast einen kontinuierlichen Verlauf. Je feiner wir die Gruppeneinteilung wählen, um so mehr wird sich die Häufigkeitsverteilung einer kontinuierlichen Gestalt nähern. Liegt das Modell einer unendlichen Gesamtheit vor, so

IL.

2

P f a n z a g l , Allg. M e t h o d e n l e h r e I

18

2 Häufigkeitsverteilungen Tabelle 2 Aufgliederung neugeborener Kinder nach der Größe Gruppengrenzen (die o b e r e G r e n z e z ä h l t nicht zur G r u p p e )

58—60 56—58 55—56 54—55 53—54 52—53 51—52 50—51 49—50 48—49 47—48 46—47 44—46 42—44 40—42 35—40 30—35 insgesamt

Häufigkeit absolut

in °/o

3 58 123 337 721 1413 2 090 2 506 1 612 899 485 253 238 70 57 75 31

0,03 0,53 1,12 3,07 6,57 12,88 19,05 22,84 14,69 8,20 4,42 2,31 2,17 0,64 0,52 0,68 0,28

10 971

100,00

Q u e l l e : U n v e r ö f f e n t l i c h t e S e m i n a r a r b e i t d e s S t a t . I n s t . d. U n i v . W i e n .

können wir uns die Gruppeneinteilung beliebig verfeinert denken und erhalten so eine kontinuierliche Kurve, die sog. Verteilungsdichte. In der Wirklichkeit können wir diese Verteilungsdichte natürlich stets nur durch eine Stufenkurve approximieren (denn wir haben ja stets nur eine endliche Zahl von Einheiten zur Verfügung und würden daher bei fortschreitender Verfeinerung einmal zu einem Punkt kommen, wo jede Gruppe höchstens eine Einheit erhält). Trotz-

2.4 Häufigkeitsverteilungen

19

dem leistet sie als Modellvorstellung bei theoretischen Erwägungen wertvolle Dienste. Wenn man eine Häufigkeitsverteilung angibt, wird so normiert, daß die Summe aller relativen Häufigkeiten 1 (oder 100 °/o) ergibt. Bei dem oben skizzierten Grenzübergang zur Verteilungsdichte wurde jedoch eine andere Normierung durchgeführt: Es wurde so normiert, daß die Fläche gleich 1 .ist. Bei einer Halbierung des Intervalls reduzieren sich in jedem der beiden Teilintervalle die relativen Häufigkeiten auf etwa die Hälfte (in einem auf etwas mehr, im anderen auf etwas weniger als die Hälfte). Mit fortschreitender Verfeinerung der Einteilung strebt die relative Häufigkeit daher in jedem Intervall gegen 0, d. h. die Kurve wird immer flacher und fällt schließlich mit der Abszisse zusammen. Man betrachtet daher nicht die relative Häufigkeit in den einzelnen Intervallen, sondern die Häufigkeitsdichte, d. h. die relative Häufigkeit, dividiert durch die Länge des Intervalls. In den zugehörigen graphischen Darstellungen sind also die relativen Häufigkeiten der einzelnen Gruppen nicht mehr durch die Höhe der Ordinate über den Gruppen, sondern durch die zugehörige Fläche (dem Rechteck, gebildet aus Ordinate und Gruppenintervall) repräsentiert. Die gesamte, vom Polygon der Dichten eingeschlossene Fläche entspricht der Summe aller relativen Häufigkeiten, ist also gleich 1. Bei fortlaufender Verfeinerung strebt das Polygon der Dichten gegen die Verteilungsdichte der Gesamtheit. Ist die Verteilungsdichte gegeben, so erhalten wir daraus die relative Häufigkeit, die einem bestimmten Intervall zukommt, indem wir die Verteilungsdichte über dieses Intervall integrieren: Der Wert dieses Integrals (veranschaulicht durch die von der Verteilungsdichte über diesem Intervall eingeschlossene Fläche) gibt die relative Häufigkeit, die diesem Intervall zukommt. Im Falle eines diskreten zahlenmäßigen Merkmales haben wir also eine endliche (in gewissen theoretischen Modellen eine abzählbar unendliche) Zahl von Werten 2*

20

2 Häufigkeitsverteilungen

x(2>, Nur diese Werte kommen für das betreffende Merkmal in Frage. Die relativen Häufigkeiten, mit denen sie innerhalb der Gesamtheit auftreten, bezeichnen wir mit f{xM), f(x^), . . . /(xi = o 2 ) im Verhältnis 1 : 1 auf beide Schichten aufgeteilt wird. Geht man dem Vergleich zwischen den einzelnen Schichten zuliebe von der optimalen oder proportionalen Stichprobe ab, s^ kann man trotzdem durch geeignete Gewichtung (vgl. S. 65) eine unverzerrte Schätzung für ¡i konstruieren. Der einzige Nachteil besteht darin, daß die Varianz dieser Schätzung dann größer ist, als unbedingt notwendig wäre. Im vorliegenden Beispiel ist die Varianz bei einer proportionalen Stichprobe (die wegen Ox = o 2 2

auch die optimale ist) - , bei Aufteilung auf beide Grupn pen im Verhältnis 1:1 gleich

• 1,6. Man erhält also bei n Aufteilung der Stichprobe auf beide Gruppen im Verhältnis 1 : 1 für ß eine Schätzung von derselben Genauigkeit wie Tl auf Grund einer Stichprobe vom Umfang im Falle proportionaler Aufteilung. Eine allzu schematische Anwendung der Theorie der geschichteten Stichprobe erscheint auch dann gefährlich, wenn zwar kein Vergleich zwischen den einzelnen Schichten geplant ist, die einzelnen fit aber für sich von Interesse sind. Dies trifft beispielsweise dann zu, wenn die einzel-

5.5 Die Auswahl der Schichten

71

nen Schichten regionalen Verwaltungseinheiten entsprechen und nicht nur eine Schätzung von jj. für das gesamte Gebiet benötigt wird, sondern auch die einzelnen regionalen Verwaltungen für ihren Bereich Schätzungen ihres fa benötigen. Auch hier kann eine optimale Aufteilung der Stichprobe dazu führen, daß für einzelne (kleine) Schichten die Schätzungen ungenau werden. In diesem Falle bleibt keine andere Möglichkeit, als zwischen den Forderungen nach optimaler Genauigkeit der Schätzung von // und optimalen Genauigkeiten für die Schätzungen der /(, ein praktisch gangbares Kompromiß zu schließen.

5.5 Die Auswahl der Schichten

Bei den bisherigen Überlegungen haben wir angenommen, daß die Schichten von vornherein gegeben sind. Dies ist sehr oft tatsächlich der Fall (z. B. bei der Schichtung nach Geschlecht oder sozialer Stellung). Oft ist das Schichtungsmerkmal jedoch stetig (z. B. Betriebsfläche) oder diskret mit sehr feiner Abstufung (z. B. Beschäftigtenzahl). Will man in einem solchen Falle aus erhebungstechnischen Gründen eine Schichtung vornehmen, so muß man die einzelnen Schichten erst künstlich definieren. (Vgl. hierzu Beispiel 2, S. 64, betreffend die Schichtung nach der Betriebgröße.) Man hat also, wenn man k Schachten bilden will, (k — 1) Trennungspunkte f i , . . . festzulegen, so daß die i. Schicht alle jene Einheiten umfaßt, für die das Schichtungsmerkmal x zwischen i, _ i und liegt. (Die 1. Schicht umfaßt alle Einheiten mit x < die k. Schicht alle Einheiten mit x f j t - i ) Hier erhebt sich naturgemäß sofort die Frage, wie man die Trennungspunkte wählen soll, damit die Schätzung für ¡x möglichst genau wird. Die zweckmäßigste Wahl der Trennungspunkte hängt davon ab, ob man aus den Schichten — nachdem diese festgelegt sind — eine optimale oder eine proportionale Stichprobe entnimmt.

72

5 Die Methode der Stichprobenerhebungen

Bedingungen für die zweckmäßigste Wahl der Trennungspunkte: a) optimale Stichprobe: ^ L + l i Z * ) * = f J + . ' K i c A + i ) " °i °i+i b) proportionale Stichprobe: f =

V-i + i"; +1 — ^ •

Bei dieser Optimalisierung wird angenommen, daß die Zahl der Schichten von vornherein feststeht. Befriedigende allgemeine Kriterien für die Bestimmung der optimalen Zahl der Schichten gibt es noch nicht. Man ist in der Praxis vielmehr darauf angewiesen, durch systematisches Probieren jene Zahl von Schichten zu ermitteln, ab der eine weitere Vergrößerung der Schichtenzahl die Genauigkeit der Schätzung von fx nicht mehr nennenswert steigert. Die Anwendung der oben skizzierten optimalen Abgrenzung der Schichten setzt natürlich voraus, daß man die Häufigkeitsverteilung der Gesamtheit bezüglich des Strukturmerkmales kennt. Eine solche Kenntnis kann z. B. auf früheren Erhebungen oder auf Erhebungen in regional getrennten, aber ähnlichen Gesamtheiten beruhen. Ein Beispiel, in dem die Trennungspunkte nach den obigen Formeln in extenso berechnet werden, gibt Strecker in seiner „Agrarstatistik", S. 79 ff. Der an diesem Problem interessierte Leser wird ferner auf die Arbeiten von Dalenius, Dalenius u. Gurney sowie auf die Arbeit von Zindler (1956) hingewiesen. Abschließend sei darauf hingewiesen, daß in manchen Fällen die Gesamtheit, nach dem Schichtungsmerkmal aufgegliedert, eine Häufigkeitsverteilung besitzt, die sehr stabil ist. In solchen Fällen kann man unter Umständen die Genauigkeit durch Berücksichtigung dieser Stabilität wesentlich steigern. Angenommen, die Gesamtheit ist in zwei Schichten geteilt: Schicht 1: x < Schicht 2: x gi fiDann erhält man in gewissen Fällen eine größere Genauigkeit, wenn man die gesamte Stichprobe aus Schicht 2

5.7 Klumpenstichprobe

73

entnimmt und von da aus auf Grund der stabilen Struktur auf die Gesamtheit schließt, als wenn man die Stichprobe auf beide Schichten aufteilt. (Vgl. hierzu die Arbeit von Koller.) 5.6 Schlußbemerkungen zur geschichteten Stichprobe D i e oben angeführten Formeln für die geschichtete Stichprobe bezogen sich auf den Fall unendlicher Gesamtheiten. Über die Modifikationen, die sich im Falle endlicher Gesamtheiten ergeben, kann sich der Leser bei Kellerer, „Theorie und Technik des Stichprobenverfahrens", Deming, „Some theory of sampling", oder Hansen, Hurwitz und Madow, „Sample survey methods and theory" informieren. Es ist wohl nur von theoretischem Interesse, zu bemerken, daß der Satz von der Überlegenheit der optimalen und der proportionalen Stichprobe gegenüber der reinen Zufallsstichprobe nicht mehr gilt, wenn die Besetzungszahlen der einzelnen Schichten in der Gesamtheit, N j , so klein sind, daß man den Unterschied von 2V,-,und 2V,—1 nicht mehr vernachlässigen kann. (Vgl. hierzu: M. Fisz, S. 4 3 2 ff.) Die oben angeführten Formeln bezogen sich auf zahlenmäßige Merkmale. Bei artmäßigen Merkmalen tritt an die Stelle von o? der W e r t P,- (1 —P,), wobei P,- der Anteil der ausgezeichneten Einheiten in der i. Schicht der Gesamtheit ist. Praktisch werden die Varianzen o j [bzw. P ; (1 — P , ) ] natürlich auf Grund der Stichprobe geschätzt, und zwar jeweils auf Grund der aus der betreffenden Schicht stammenden Einheiten der Stichprobe (vgl. hierzu S. 40). 5.7 Klumpenstichprobe Vielfach sind die Erhebungseinheiten von vornherein gruppiert. Solche Gruppen werden in der Stichprobentheorie als „Klumpen" bezeichnet. In diesem Falle ist es meist aus organisatorischen Gründen zweckmäßig, die Stichprobe nicht aus den einzelnen Einheiten durch Zufallsauswahl zusammenzustellen, sondern die Klumpen als Auswahleinheiten zu nehmen.

74

5 Dde Methode der Stichprobenerhebungen

1. B e i s p i e l : Bei der stichprobenweisen Aufbereitung der österreichischen Volkszählung 1951 wurde für die Auswahl der Stichprobe nidit Vioo aller in den Erhebungsbogen erfaßten Personen herangezogen, sondern Vioo der Erhebungsbogen; jeder Erhebungsbogen wurde mit allen auf ihm verzeichneten Personen in die Stichprobe einbezogen. Hier besteht der Klumpen also aus den auf einem gemeinsamen Erhebungsbogen verzeichneten Personen (d. h. einem Haushalt im Sinne der Volkszählung). 2. B e i s p i e l : Bei einer stichprobenweisen- Lohnerhebung wird man nicht einzelne Arbeiter zufällig auswählen, sondern —• aus organisatorischen Gründen — einzelne Betriebe, in diesen Betrieben aber die Unterlagen für alle dort beschäftigten Arbeiter erheben. Hier bilden die in einem Betrieb beschäftigten Arbeiter einen Klumpen. 3. B e i s p i e l : Es wird eine stichprobenweise Viehzählung durchgeführt. Man wird nicht einzelne Viehhalter auswählen und bei diesen die Erhebung durchführen. Das käme zu teuer. Man wird vielmehr als Einheit für die Stichprobenauswahl die Gemeinde ansehen und alle Viehhalter der Gemeinde in die Erhebung einbeziehen. Den Klumpen bilden hier die in derselben Gemeinde ansässigen Viehhalter. Es ist klar, daß die Theorie der reinen Zufallsstichprobe in solchen Fällen nicht anwendbar ist. Man wird vielmehr erwarten müssen, daß man bei Klumpenauswahl eine größere Streuung erhält als bei reiner Zufallsauswahl. Wir betrachten wieder den Fall einer unendlichen Gesamtheit, d. h. einer Gesamtheit, die unendlich viele Klumpen enthält. Jeder Klumpen möge aus endlich vielen Einheiten bestehen. Die Anzahl der in die Stichprobe einbezogenen Klumpen sei m, die Anzahl der Einheiten in den einzelnen Klumpen sei n 1 ; n 2 , . . . nm. Wir nehmen an, daß für jeden Klumpen die gleiche Wahrscheinlichkeit besteht, in die Erhebung einbezogen zu werden, unabhängig vom Umfang des Klumpens (d. h. von der Anzahl seiner Einheiten). Bei jeder einzelnen Einheit wird die Ausprägung eines bestimmten Merkmales x festgestellt. Die Summen von x über die Einheiten der einzelnen Klumpen seien X 1 ; X2, . . . Xm. Es gilt:

5.8 Vergleich von Schichten und Klumpen

75

Durchschnittswert von x pro Klumpen pro Einheit ,

x =

m

m

- Z_I v x ,I m 1=1

,

1 n

> ' x ', .• 1=1

m

Dabei ist n = ^ nt die Anzahl der in allen Klumpen der ¡=i Stichprobe zusammen enthaltenen Einheiten. F ü r die Varianz von X bzw. x liefert die Stichprobentheorie folgende Formeln: ö2 X.m

n

Dabei ist er die Varianz der Summen X und wird aus der Stichprobe geschätzt durch i =1 Die Varianz von x ist bei Klumpenauswahl im allgemeinen größer als bei reiner Zufallsauswahl. Lediglich dann, wenn die Klumpen selbst durch einen der reinen Zufallsauswahl äquivalenten Prozeß zustande gekommen sind, bringt die Klumpenauswahl keine Vergrößerung der Varianz mit sich. (Ein triviales Beispiel: Wenn man das Verhältnis der Genotypen AA, Aa und aa b e i der Kreuzung Aa X Aa feststellen will, gibt es im Grunde genommen ebenfalls einen Klumpeneffekt, da jedes Elternpaar mehrere Nachkommen produziert. Alle Nachkommen ein und desselben Elternpaares bilden einen Klumpen. Trotzdem kann man hier so rechnen, als ob alle Einheiten einzeln ausgewählt worden wären, da die Verteilung innerhalb der Nachkommen bei a:llen Elternpaaren dem gleichen Zufallsprozeß entspringt.) 5.8 Vergleich von Schichten und Klumpen Der Begriff der Schichten und der Begriff der Klumpen sind einander zum Verwechseln ähnlich. Und doch sind Klumpen-Stichprobe und Schichten-Stichprobe zueinander dual:

76

5 Die Methode der Stichprobenerhebungen

Schichten-Stichprobe:

Klumpen-Stichprobe:

Jede Schicht wird in die Erhebung einbezogen. Innerhalb jeder Schicht wird durch Zufallsauswahl bestimmt, welche Einheiten in die Erhebung einbezogen werden.

Es wird durch Zufallsauswahl bestimmt, welche Klumpen in die Stichprobe einbezogen werden. Von den ausgewählten Klumpen werden alle Einheiten in die Erhebung einbezogen.

Die Streuung von x bei einer geschichteten Stichprobe ist kleiner als die Streuung der Zufallsstichprobe.

Die Streuung von x bei einer Klumpen-Stichprobe ist größer als die Streuung der Zufallsstichprobe.

Der Genauigkeitsgewinn (d. h. die Verringerung der Varianz) ist um so größer, je homogener die einzelnen Schichten und je größer die Unterschiede zwischen den einzelnen Schichten sind.

Der Genauigkeitsverlust (d. h. die Vergrößerung der Varianz) ist um so kleiner, je inhomogener die einzelnen Klumpen und je kleiner die Unterschiede zwischen den einzelnen Klumpen sind.

5.9 Die mehrstufige Stichprobe Wir wollen uns das Konzept der mehrstufigen Stichprobe an Hand der zweistufigen Stichprobe klarmachen: Die statistische Masse ist in Teilmassen eingeteilt. Es wird zuerst (1. Stufe) durch Zufallsauswahl bestimmt, welche Teilmassen in die Erhebung einbezogen werden sollen. Sodann wird innerhalb der ausgewählten Teilmassen durch neuerliche Zufallsauswahl (2. Stufe) ermittelt, welche Einheiten in die Erhebung einbezogen werden sollen. B e i s p i e l : Es wird eine Untersuchung über die wirtschaftliche Lage von Personen im Rentenalter durchgeführt"). *) V g l . h i e r z u : U n e E n q u ê t e p a r S o n d a g e s u r la S i t u a t i o n M a t é r i e l l e et l e s R e s s o u r c e s d e s P e r s o n n e s A g é e s . Bull. M e n s d e S t a t i s t i q u e , N . S. S u p p l e m e n t J u i l l e t — S e p t e m b r e 1950, S. 256 ff.

5.10 Das Problem der Nichtbeantwortung

77

Das Erhebungsprogramm ist so kompliziert, daß nur eine mündliche Befragung in Betracht kommt. Dies zwingt aus Kostengründen zu einer regionalen Konzentration der befragten Personen, m. a. W.: Es werden Klumpen gebildet. Als natürliche Klumpen bieten sich hier die Gemeinden an. Man wird als 1. Stufe eine gewisse Zahl von Gemeinden auswählen und sodann als 2. Stufe innerhalb der ausgewählten Gemeinden die zu befragenden Personen etwa auf Grund der Wahllisten oder einer Kartei der Meldeämter durch Zufallsauswahl bestimmen. In der Praxis wird der Erhebungsvorgang noch: dadurch kompliziert, daß man die Gemeinden nicht auf Grund einer Zufallsstichprobe, sondern einer geschichteten Stichprobe bestimmen wird.

Im Prinzip kommen auch bei Anwendungen in der Industrie mehrstufige Stichproben vor, z. B. wenn aus einer großen Zahl von Kisten einzelne ausgewählt werden (1. Stufe) und sodann aus jeder ausgewählten Kiste eine kleine Warenprobe entnommen wird (2. Stufe). Wir kommen auf die damit verbundenen Probleme in Band II, Kapitel Streuungszerlegung, noch zurück. Das Konzept der mehrstufigen Stichprobe ist sehr allgemein. Es umfaßt sowohl das Konzept der geschichteten Stichprobe als auch das Konzept der KlumpenStichprobe als Spezialfälle: Werden alle Teilmassen (Schichten) in die Erhebung einbezogen, haben wie eine geschichtete Stichprobe. Werden innerhalb der ausgewählten Teilmassen (Klumpen) alle Einheiten in die Erhebung einbezogen, haben wir eine Klumpen-Stichprobe. Der interessierte Leser findet Näheres über das mehrstufige Stichprobenverfahren bei Kellerer, „Theorie und Technik des Stichprobenverfahrens", Deming, „Some theory of sampling", sowie Hansen, Hurwitz und Madow: „Sample survey methods and theory". 5.10 Das Problem der Nichtbeantwortung Das Problem der Nichtbeantwortung ist bei allen Erhebungen im Bereiche der Wirtschafts- und Sozialstatistik von größter Bedeutung. Ein typisches Beispiel: Von einer

78

5 Die Methode der Stichprobenerhebungen

Klinik wurde eine Untersuchung über die Treffsicherheit von Krebsdiagnosen durchgeführt. Als Ausgangsmaterial dienten 317 Personen, die innerhalb eines etwa 5—6 Jahre zurückliegenden Zeitraumes wegen Krebsverdachtes untersucht und für gesund befunden worden waren. Durch eine Nachuntersuchung sollte die Anzahl der Fehldiagnosen ermittelt werden. Es bestand die Auffassung, daß Erkrankungen, die zum Zeitpunkt der Untersuchung bereits bestanden hatten, damals jedoch nicht erkannt worden waren, in der Zwischenzeit so weit fortgeschritten sein mußten, daß sie bei der Nachuntersuchung mit Sicherheit festgestellt werden könnten. Von den 317 zur Nachuntersuchung eingeladenen Personen kamen 171. Darunter wurden vier Fälle festgestellt, bei denen der Krebs wahrscheinlich bereits im Zeitpunkt der ersten Untersuchung bestanden hatte und nicht erkannt worden war. Dieses Ergebnis sollte als Grundlage für eine Schätzung des Anteiles der Fehldiagnosen dienen. Die Schätzung des Anteiles der Fehldiagnosen ist jedoch unmöglich, solange Unklarheit über den Zustand jener 136 Personen herrscht, die der Einladung zur Nachuntersuchung nicht gefolgt waren. Es könnte ja sein, daß diese in der Zwischenzeit alle an Krebs gestorben sind. Um ein unverfälschtes Bild vom Anteil der Fehldiagnosen zu erhalten, muß man sich unbedingt Informationen über den Zustand dieser 136 nicht reagierenden Personen verschaffen. Ein Teil von ihnen wird verstorben sein. In diesen Fällen muß auf Grund des Totenregisters die Todesursache ermittelt werden. Bei den übrigen, noch am Leben befindlichen Personen muß zumindest eine stichprobenweise Nachuntersuchung durchgeführt werden. Ein weiteres Beispiel für eine durch Nicht-Beantwortung hervorgerufene Verzerrung liefert die Erhebung über die Rauchgewohnheiten (vgl. S. 55). Eine einwandfreie theoretische Behandlung des Problems der Nicht-Beantwortung ist dann möglich, wenn zwei Erhebungsmethoden (A und B) zur Verfügung ste-

5.10 Das Problem der Nichtbeantwortung

79

hen, von denen die Methode A weniger wirksam ist. Methode B sei total wirksam, d. h. alle mit Methode B befragten Einheiten liefern Daten. In der Regel ist A ein schriftliches, B ein mündliches Erhebungsverfahren. Die Kosten für die Befragung einer Einheit mit Methode A seien CA, die Kosten für die Befragung einer Einheit mit Methode B seien Cg. Es sei CA < Cß- (Wenn Cß oder CA = C B , liegt überhaupt kein Problem vor; denn dann ist es von vornherein klar, daß man Methode B anwenden wird.) Der allgemeine Plan ist nun der: Es wird zunächst eine Stichprobe vom Umfange n nach Methode A erhoben. Die Zahl der tatsächlich einlangenden Antworten sei n^. Aus diesen Unterlagen wird das arithmetische Mittel x, berechnet. Dieser Wert kann jedoch nicht als Schätzung für den echten Mittelwert angesehen werden, denn er stammt nicht aus einer Zufallsstichprobe: Er enthält ja nur Informationen von jenen Einheiten, die mit Methode A „ansprechbar" sind, und es ist im allgemeinen anzunehmen, daß die Gruppe der mit Methode A ansprechbaren und die Gruppe der mit Methode A nicht ansprechbaren Einheiten in ihrer Struktur verschieden sind (vgl. die oben angeführten Beispiele). Es ist daher notwendig, sich durch Anwendung der (absolut wirksamen) Methode B eine Information über die Gruppe der mit Methode A nicht ansprechbaren Einheiten zu verschaffen. Zu diesem Zwecke wird also aus den n—rii nicht Antwortenden mittels Zufallsauswahl eine Teilmenge der Größe r bestimmt und mit Methode B befragt. Das Ergebnis dieser Befragung liefert einen Mittelwert x2. Um eine unverfälschte Schätzfunktion für ¡x zu erhalten, müssen wir nun folgenden Ausdruck bilden: ni Xi + (n — nx) x2 x = - - — — — . x2 ist mit dem Faktor (n—n-i) und n nicht mit dem Faktor r zu versehen, weil x

Wien Niederösterreich Burgenland Oberösterreich Salzburg Steiermark Kärnten Tirol Vorarlberg

1616 1400 276 1109 327 1109 475 427 194

17 413 130 286 72 333 121 109 35

1,05 29,50 47,10 25,79 22,02 30,03 25,47 25,53 18,04

Österreich insgesamt

6934

1516

21,86

Quelle:

S t a t . H a n d b . f. d. R e p . ö s t e r r .

6. J g . , S . 7.

Der Anteil der landwirtschaftlichen Bevölkerung im gesamten Bundesgebiet, 21,86 %>, kann entweder direkt berechnet werden, indem man die landwirtschaftliche Bevölkerung im gesamten Bundesgebiet (1 516 ooo) auf die Gesamtbevölkerung (6 934 ooo) bezieht, oder aber als gewogenes arithmetisches Mittel aus dem Anteil der landwirtschaftlichen Bevölkerung in den einzelnen Bundesländern, wobei die Bevölkerungen der einzelnen Bundesländer als Gewichte dienen. A n m e r k u n g : Das gewogene arithmetische Mittel wird nicht nur im Zusammenhang mit der Mittelung von Verhältniszahlen verwendet. Wir finden auch anderweitig intensive Größen t>x, v2, .. . vm, die — mit korrespondierenden extensiven Größen A 1 ; A 2 , . . . A m multiplikativ ver-

7.7 Die Standardisierung

] 13

knüpft — sachlich sinnvolle extensive Größen «j, A2V2, . . . Amvm ergeben (z.B. wenn die ü,- Preise und die Aj konsumierte Mengen darstellen, sind die Größen , also das 2>, gewogene arithmetische Mittel der v,- berechnen. (In unserem Beispiel hat das gewogene arithmetische Mittel die Bedeutung eines Durchschnittspreises.)

Aj Vi Ausgaben). Aus diesen kann man

7.7 Die Standardisierung

Wir wollen uns das Grundproblem an folgendem Beispiel klarmachen: Auf Grund der österreichischen Konsumerhebung betrug der Anteil der Ernährungsausgaben bei Arbeitern 52,5 °/o, bei Angestellten 44,6 %>. Wenn wir dieses Ergebnis richtig interpretieren wollen, müssen wir beachten, daß der Anteil der Emährungsausgaben stark von der Höhe des Einkommens abhängt und daß der Unterschied zwischen den Arbeitern und Angestellten daher wenigstens teilweise durch die unterschiedlichen Einkommensverhältnisse bedingt sein könnte. Tabelle 16 zeigt eine Aufgliederung nach Einkommensstufen (S. 114). Wir sehen aus dieser Tabelle, daß der eingangs erwähnte Unterschied im Anteil der Bekleidungsausgaben nicht allein auf die unterschiedliche Einkommensstruktur zurückzuführen ist: Der gleiche Unterschied findet sich auch innerhalb jeder einzelnen Einkommensstufe wieder. Um ein globales Maß für den Unterschied der Bekleidungsausgaben zu erhalten, müssen wir den Unterschied in der Einkommensstruktur eliminieren: Wir fixieren eine bestimmte Einkommensstruktur, d. h. wir ordnen jeder Einkommensstufe ein bestimmtes Gewicht g, zu nur die Größen und 8

Pfanzagl,

Allg. Methodenlehre I

und berechnen

114

7 Allgemeine Theorie der Meßzahlen

Tabelle 16 Gesamtausgaben u n d Ernährungsausgaben bei Arbeitern u n d Angestellten in Wien auf Grund der Konsumerhebung 1954/55. Anteil der E r n ä h rungsausgaben Monatl. Gesamtausgaben pro Vollperson in S

in °/o Arbeiter - -

G

unter 400 400— 600 600— 800 800—1000 1000—1200 1200—1400 1400—1600 1600—1800 1800—2000 2000—2200 2200—2400 über 2400 insgesamt

• 100

Angest.

Arbeiter

Angest.

67,9 60,3 53.3 48.8 43,0 39.9 38.4 32.0 33,6 35.1 34,0 27,9

1,9 18,8 23,2 21,1 15,6 11,5 3,5 2,2

0,3 9,4 17,9 17,8 16,2

0,0

5,4 2,9 7,4 2,4 2,3 6',8

44,6

100,0

100,0

G?

74,9 62,9 55,6 52,6 46,0 43,4 39,8 40.3 42,2 30.4 35,6

52,5

Quelle: Auswertung unveröffentlichten

Aufgliederung der Gesamtausgaben nach der H ö h e der Gesamtausgaben pro Vollperson in °/'n

•100

1,0 0,8

0,4

11,2.

Materials.

D a b e i b e d e u t e n G? u n d E® d i e G e s a m t a u s g a b e n b z w . d i e E r n ä h r u n g s a u s g a b e n f ü r A r b e i t e r in d e r i. A u s g a b e n s t u f e . G? u n d E] s i n d d i e k o r r e s p o n d i e r e n d e n G r ö ß e n f ü r A n g e stellte. D i e e r s t e G r ö ß e g i b t u n s d i e d u r c h s c h n i t t l i c h e n E r n ä h r u n g s a u s g a b e n der Arbeiter, die zweite G r ö ß e die durchschnittlichen E r n ä h r u n g s a u s g a b e n der Angestellten, u n t e r Z u g r u n d e l e g u n g d e r G e w i c h t e g1, g2, • . •gm• I m all-

7.7 Die Standardisierung

115

gemeinen wird das Endergebnis des Vergleichs davon abhängen, welche Gewichte man zugrunde legt. Das Ergebnis ist nur dann von g, unabhängig, wenn das Verhältnis der Ernährungsaufgaben für Angestellte und Arbeiter in jeder Ausgabenstufe dasselbe ist. In unserem konkreten Beispiel ist das nicht der Fall. Wir erhalten demnach Werte, die von g, abhängen. Wählt man zum Vergleich die Gewichte entsprechend der Verteilung der Ausgaben auf die einzelnen Ausgabenstufen, wie sie bei den Arbeitern vorliegen, so erhält man: m ^ g Í i =i G;

m = 49,4%.

Selbstverständlich ist

£

¡

2?0

g? — '- = =i G¡

52,5.

Dies besagt: Wenn bei den Angestellten die gleiche Verteilung auf die einzelnen Auf gabenstufen vorläge wie bei den Arbeitern, würden sie im Durchschnitt 49,4 °/o für Ernährung ausgeben, während die Arbeiter 52,5 °/o ausgeben. Der Unterschied zwischen Arbeitern und Angestellten ist also zu einem beachtlichen Teil echt, d. h. nicht bloß auf Unterschiede in den Einkommen zurückzuführen. Grundsätzlich könnte man diesen Vergleich natürlich ebensogut auf der Ausgabenstruktur der Angestellten aufbauen. Im konkreten Fall ergeben sich allerdings insofern Schwierigkeiten, als die oberen Ausgabenstufen bei den Arbeitern nicht besetzt sind und man daher den Anteil der Ernährungsausgaben vorerst extrapolieren müßte. Während in den Naturwissenschaften (einschließlich Medizin, Psychologie etc.) durch das Experiment stets die Möglichkeit gegeben ist, den Einfluß eines bestimmten Faktors klar in Erscheinung treten zu lassen, muß man sich in den Sozialwissenschaften in der Regel mit einer Statistik begnügen, welche die tatsächlichen Gegebenheiten beschreibt. An die Stelle des Experimentes tritt hier die zweckentsprechend vorgenommene Aufgliederung der Daten und die Ausschaltung von störenden Strukturunterschieden auf rechnerischem Wege. Daraus ergibt sich die 8*

116

7 Allgemeine Theorie der Meßzahlen

große Bedeutung des oben beschriebenen Verfahrens der Standardisierung. Wir wollen die Anwendung der Standardisierung im folgenden noch durch einige weitere Beispiele illustrieren: 1. B e i s p i e l : Es soll das Lohnniveau in Bayern mit dem Lohnniveau Württembergs verglichen werden. Der Zweck eines solchen Vergleiches kann darin bestehen, ins einzelne zu gehen, festzustellen, bei welchen Berufen die Unterschiede besonders groß sind. Oft besteht der Zweck eines solchen Vergleiches jedoch darin, allgemeine Niveauunterschiede festzustellen. Ein einfacher Vergleich der Durchschnittslöhne ist nicht für alle Aspekte dieses Problems zweckdienlich, da die Durchschnittslöhne nicht nur vom Unterschied des Lohnniveaus, sondern auch von der unterschiedlichen Zusammensetzung der Masse der Lohnempfänger beeinflußt sind. Um Vergleichsziffern zu erhalten, die nur den Unterschied im Lohnniveau zum Ausdruck bringen, wird eine Standard-Struktur für die Masse der Lohnempfänger festgelegt und sodann die Durchschnittslöhne für Bayern und Württemberg auf Grund dieser Standard-Struktur berechnet. Ähnlich wird bei allen Indexberechnungen vorgegangen. (Wegen weiterer Einzelheiten über Indexberechnungen vgl. Kap. 9.) 2. B e i s p i e l : Die österreichische Lehrlingsstatistik zeigt zwischen den Jahren 1952 und 1956 ein Ansteigen des Anteiles der weiblichen Lehrlinge von 22 °/o auf 27 °/o. Diese Erscheinung wurde allgemein dahingehend kommentiert, daß infolge des Mangels an männlichen Lehrstellensuchenden 1956 in stärkerem Ausmaß als 1952 weibliche Lehrlinge an Stelle von männlichen aufgedungen worden sind. Um diese Hypothese zu überprüfen, wurde folgende Berechnung angestellt: Es wurde für jeden einzelnen Beruf der Anteil der weiblichen Lehrlinge im Jahre 1952 festgestellt. Sodann wurde dieser Anteil angewendet auf die Zahl der Lehrlinge in diesem Beruf 2, . . . tu n ) für die Wertschöpfung der einzelnen Industriezweige festgelegt und sodann die Zahl der Arbeitsstunden berechnet, die zum Zeitpunkt 0 bzw. zum Zeitpunkt 1 erforderlich gewesen wären, um diese Standard-Struktur zu realisieren:

> w.

„ i) ^ X für den Zeitpunkt 0, X t t ; , — i " für den Zeitpunkt 1. wi Während es bei den bisher besprochenen Beispielen mehr oder minder willkürlich war, ob man die Struktur „0" oder „ 1 " als Standard-Struktur wählt, ist in diesem Beispiel die Struktur w\, w\, . . . . w^ vor der Struktur wf, tu®, . . . . tu® als Standard-Struktur ausgezeichnet: Der Vergleich mit w j als Standard-Struktur beantwortet die Frage: wie viele Arbeits-

118

7 Allgemeine Theorie der Meßzahlen

stunden müßte man aufwenden, um die Wertschöpfung des Zeitpunktes 1 zu realisieren, wenn sich die Produktivität seit dem Zeitpunkt 0 nicht geändert hätte? Die Frage, mit welcher Zahl von Arbeitsstunden man die Wertschöpfung des Zeitpunktes 0 mit den zum Zeitpunkt 1 geltenden Produktivitäten realisieren könnte, wird man demgegenüber als sekundär ansehen. Diese Version des Vergleiches würde im allgemeinen das Ausmaß der Produktivitätssteigerung unterschätzen; denn es sind vorwiegend die in Expansion begriffenen Industriezweige, welche die größten Produktivitätssteigerungen aufweisen. Den Vergleich auf der alten Wertschöpfungs-Struktur aufzubauen hieße, die Bedeutung der Produktivitätssteigerungen vom Standpunkt der seinerzeitigen, nicht der jetzigen Wertschöpfung beurteilen.

Bei dem letzten Beispiel zeigt sich deutlich, daß die Standardisierung einen Umstand vernachlässigt: den organischen Zusammenhang zwischen den Produktivitätssteigerungen in den einzelnen Industriesparten einerseits und der Umschichtung in der Struktur der Wertschöpfung anderseits: es wird angenommen, daß man Produktivitäten und Wertschöpfungsstrukturen nach Belieben miteinander kombinieren kann, während in Wirklichkeit der Übergang von der Wertschöpfungsstruktur iVj, . . . tc" zu der Wertschöpfungsstruktur ic{, ttg, . . . ic'n in einem organischen Zusammenhang mit den Produktivitätssteigerungen steht. Die Größen w}

X

'- sind nur fiktiv: wären die Pro-

duktivitäten zum Zeitpunkt 1 -

,

, . . . — 0 , so wäre W n 2 die Wertschöpfungsstruktur sicher nicht w\, «4, . . . ic'n, 0

W

"-'l

schon deshalb nicht, weil

A

V w j - 'n 1 0

wahrscheinlich das

i

verfügbare Arbeitsstundenpotentoial überschreiten würde. Allgemein gesprochen: es besteht sehr oft zwischen den Unterschieden in der messenden Größe einerseits und den Strukturunterschieden anderseits ein organischer Zusam-

7.7 Die Standardisierung

119

menhang. Die Verwendung einer Standard-Struktur zerstört diesen organischen Zusammenhang. Trotzdem ist das Standardisieren vielfach unvermeidlich. Vereinzelt gibt es jedoch Modelle, die es gestatten, diesen organischen Zusammenhang zwischen dem Unterschied der gemessenen Größe und den Strukturunterschieden in adäquater Form zu berücksichtigen. Ein Beispiel hierfür ist das Modell der stationären Bevölkerung. Will man die Sterblichkeit zwischen zwei Ländern vergleichen, so kann dies nicht einfach dadurch geschehen, daß man die beiden Sterbeziffern ( = Lebende^) einander gegenüberstellt. Erfahrungsgemäß bestehen nämlich zwischen den einzelnen Ländern starke Unterschiede im Altersaufbau und diese beeinflussen — da die Sterblichkeit vom Alter abhängt — die Sterbeziffern. Die Unterschiede im Altersaufbau sind zum Teil auf einen unterschiedlichen zeitlichen Verlauf der Anzahl der Geborenen und auf Kriegseinwirkungen zurückzuführen, zum Teil auf eine unterschiedliche Sterblichkeit (Vgl. S. 91). Um die störenden Strukturunterschiede auszuschalten, schlug Körösi vor, allen Vergleichen einen einheitlichen Altersaufbau zugrunde zu legen. Dieses Verfahren eliminiert jedoch nicht nur jene Unterschiede, die auf die unterschiedliche Entwicklung in der Zahl der Geborenen und auf Kriegseinwirkungen zurückzuführen, sondern' auch jene Unterschiede, die durch die unterschiedliche Sterblichkeit selbst verursacht sind. Will man einen adäquaten Vergleich, so muß man die zufälligen Einflüsse auf den Altersaufbau (Geburten, Kriege) eliminieren, jedoch jene Unterschiede im Altersaufbau, die sich aus der unterschiedlichen Sterblichkeit zwangsläufig ergeben, in adäquater Form berücksichtigen. Dies geschieht durch das Modell der stationären Bevölkerung: Es wird angenommen, daß die Zahl der Geborenen von Jahr zu Jahr konstant ist, und untersucht, welche Verhältnisse sich in diesem „stationären" Falle unter der Einwirkung der Sterblichkeit einstellen (wie groß die Bevölkerung sein wird, welchen Altersaufbau sie hat,

120

7 Allgemeine Theorie der Meßzahlen

wie g r o ß die durchschnittliche L e b e n s e r w a r t u n g ist usw.). E i n e a u s f ü h r l i c h e A n a l y s e s t a t i o n ä r e r G e s a m t h e i t e n — dieser Begriff ist nicht auf die Bevölkerungsstatistik b e schränkt -— findet sich in Abschnitt 6.4. E i n weiteres Beispiel f ü r einen Versuch, d e n Z u s a m m e n h a n g zwischen d e n U n t e r s c h i e d e n d e r zu m e s s e n d e n G r ö ß e u n d d e n S t r u k t u r u n t e r s c h i e d e n in e i n e m M o d e l l zu erfassen, b i e t e t die T h e o r i e des I n d e x d e r V e r b r a u c h e r p r e i s e (Vgl. h i e r z u die A u s f ü h r u n g e n auf S. 139). 7.8 Die Transplantation D i e T r a n s p l a n t a t i o n ist eine V a r i a n t e d e r S t a n d a r d i s i e r u n g . O e r Zweck dieses V e r f a h r e n s b e s t e h t darin, d i e Ausw i r k u n g e n einzelner V e r ä n d e r u n g e n zu isolieren. W i r wollen das P r i n z i p d e r T r a n s p l a n t a t i o n an einigen Beispielen e r l ä u t e r n : 1. B e i s p i e l : Die Zahl der Krebssterbefälle ist in den letzten Jahrzehnten stark angestiegen: die jährliche Zahl der Krebssterbefälle auf 10 000 der Bevölkerung betrug in Österreich in den Jahren 1921/25 im Durchschnitt 13,1, im Jahre 1955 aber 22,4°). Dieser Anstieg ist zum Teil auf eine echte Erhöhung der Krebssterblichkeit (d. h. auf eine Erhöhung der Krebs-Sterbewahrscheinlichkeit in jeder einzelnen Altersstufe) zurückzuführen, zum Teil jedoch einfach darauf, daß durch den allgemeinen Rückgang der Sterblichkeit das Durchschnittsalter erhöht wurde und dadurch automatisch eine Erhöhung der Zahl der Krebssterbefälle auftrat. Um zu beurteilen, welche Rolle die direkte (eigentliche) Erhöhung der Krebssterblichkeit und welche Rolle die durch die Erhöhung des Durchschnittsalters induzierte Erhöhung der Krebssterblichkeit spielt, kann man die Transplantationsmethode anwenden: Als erstes berechnet man — um die Auwirkungen irregulärer Unterschiede im Altersaufbau zu beseitigen — mit Hilfe des Modells der stationären Bevölkerung bereinigte Krebssterblichkeitsziifern. Sodann wendet man die Transplantationsmethode an: Man wiederholt die Berechnung der bereinigten Krebssterblichkeitsziffer, indem man f ü r Krebs die Sterbewahrscheinlichkeit der Jahre 1921/25, f ü r alle übrigen Todesursachen die *) V g l . H. Hansluwka: „Die E n t w i c k l u n g d e r Ö s t e r r e i c h " . D e r K r e b s a r z t , 12. J g . (1957), S. 277.

Krebssterblichkeit

in

8.1 Grundsätzliches

121

Sterbewahrscheinlichkeit des Jahres 1955 zugrunde legt, und vergleicht mit den oben ermittelten, bereinigten Krebssterblichkeitsziffern. 2. B e i s p i e l : Die Einsatz-Ausstoß-Analyse ermöglicht es, zu berechnen, wie viele Arbeitsstunden zur Produktion einer Tonne Eisenblech insgesamt aufgewendet werden müssen. Insgesamt heißt hier: nicht nur im Walzwerk selbst, sondern auch in jenen Industrien, welche die Rohstoffe, Energie und Maschinen für den Walzprozeß und auch in jenen Industrien, welche die Rohstoffe, Energie und Maschinen f ü r die Lieferanten-Industrien geliefert haben usw. Die Zahl der Arbeitsstunden hängt danach nicht nur von der Produktivität der Walzwerke selbst, sondern auch von den Produktivitäten aller übrigen Industrien ab. Führt man einen Produktivitätsausgleich zwischen zwei verschiedenen Zeitpunkten durch, so kann man sich der Transplantationsmethode bedienen, um zu unterscheiden, wieviel von der Produktivitätssteigerung bei der Produktion von Eisenblech (gemessen durch die Ersparnis von Arbeitsstunden) auf die Produktivitätssteigerung der Walzwerke selbst und wieviel auf Produktivitätssteigerungen in den übrigen Industrien zurückzuführen ist.

8 Die Berechnung von Indexzahlen 8.1 Grundsätzliches Im Abschnitt 7.3 haben wir die Berechnung von Meßzahlen behandelt. Eine wichtige Aufgabe der Meßzahlen besteht darin, den Verlauf einer Reihe durch Bezug auf eine geeignete Basis zu verdeutlichen. Vielfach hat man jedoch nicht eine, sondern mehrere sachlich zusammengehörende Reihen, und man wünscht, den Verlauf durch eine globale, alle Reihen zusammenfassende Meßzahl zu charakterisieren. Solche Meßzahlen werden Indexzahlen genannt. Nach diesem Sprachgebrauch erhalten wir eine Meßzahl, wenn wir z. B. eine Reihe betreffend die Preise von Gold auf eine gemeinsame Basis beziehen. Berechnen wir hingegen eine Reihe, welche ein globales Bild der Entwicklung aller Kleinhandelspreise gibt, erhalten wir eine Indexzahl. (Die Terminologie in der englischen Literatur ist: „relatives" für Meßzahlen, „index-numbers" für Indexzahlen.)

122

8 Die Berechnung von Indexzahlen

Die Berechnung der Indexzahlen basiert auf der Methode der Standardisierung. Dies wollen wir uns am Beispiel eines Index der Verbraucherpreise überlegen: als Ausgangspunkt dient ein bestimmtes Verbrauchsschema, d. h. eine Aufstellung über einen bestimmten Standardverbrauch. Sodann berechnet man, wie hoch die Kosten dieses Standardverbrauches zu den verschiedenen Zeitpunkten sind und vergleicht die Kosten miteinander. Die miteinander verglichenen Kosten sind fiktive Größen: Es handelt sich ja nicht um real aufgetretene Kosten, sondern um die Kosten eines — fiktiven — Standardverbrauches. Trotzdem haben sie eine durchaus anschauliche Bedeutung. Die Standardisierung, d. h. das Rechnen mit einem fiktiven Standardverbrauch und damit mit fiktiven Kosten, ist unerläßlich: Würde man der Indexberechnung die tatsächlichen Kosten zugrunde legen, erhielte man ja einen Index, der nicht nur von den Preisänderungen beeinflußt wird, sondern auch von allen Änderungen des Verbrauches. Nur dadurch, daß man standardisiert, d. h. mit einem fiktiven konstanten Standardverbrauch rechnet, erhält man einen Index, der lediglich von Preisänderungen beeinflußt wird. Wenn wir unseren Blick vom speziellen Fall der Verbraucherpreise auf das allgemeine Indexproblem richten, sehen wir folgende Situation vor uns: Gegeben sind zwei oder mehrere Serien intensiver Größen pj, . . . p° und pj, p\, . • . pxn, die hinsichtlich ihres Niveaus miteinander zu vergleichen sind. (Im Falle des Index der Verbraucherpreise: zwei Serien von Verbraucherpreisen.) Aus diesen Serien werden mit Hilfe von gegebenen Gewichten qr1, • • •