Statistik 9783486785241, 9783486227024

Mit der Floskel, dies sei ein unkonventionelles Lehrbuch der Statistik, ist wenig gesagt: Es ist das erste Lehrbuch über

230 44 11MB

German Pages 329 [332] Year 1993

Report DMCA / Copyright

DOWNLOAD PDF FILE

Table of contents :
Vorwarnung
ALLGEMEINER TEIL STATISTIK – HISTORISCHES, INFRASTRUKTUR, GRENZEN
Kapitel I: Vom Gott zur Ziffer
I.1 "Mich dünkt, die Alte spricht im Fieber"
I.2 Vorstellung der Hauptdarsteller
I.3 "Summiert sieht vieles doch anders aus..."
I.4 Vom Ursprung der Zahlen
I.4.1 Einleitung
I.4.2 Können Sie bis "3" zählen?
I.4.3 Was haben Sie auf dem Kerbholz?
I.4.4 Vom Zählen zum Rechnen
I.4.5 Was wäre, wenn wir 6 Finger an einer Hand hätten?
I.4.6 Der erste Desktop, Typ "Abakus"
I.4.7 Ein indisches "Nichts" als Revolutionär
I.4.8 Die Wurzel unserer Ziffern
I.4.9 Eine unglaubliche Begegnung der toleranten Art
I.4.10 Hinweg mit dem Teufelszeug!
I.4.11 "Nach Adam Ries..."
I.4.12 Was heute alles von der Zahlenwelt und den Computern abhängt
Literarischer Anhang: Vom "Segen" der DIN-Norm
Sportlicher Exkurs: Mathematisch-statistisches Geheimnis des Fußballs
Kapitel II: "Du sollst nicht falsch' Zeugnis ablegen" - Infrastruktur der Statistik
II. 1 Was ist'Statistik'?
II.2 Institutionalisierte Statistik: Das Statistische Bundesamt
II.3 Ein Eckpfeiler der amtlichen Statistik: Die Volkszählung
II.3.1 Die Volkszählung als Basis für eine rationale Politik
II.3.2 Die Volkszählungskontroverse Mitte der 80er Jahre
II.3.3 Das Grundrecht auf informationelle Selbstbestimmung und Datenschutz
II.3.4 Möglichkeiten der Anonymisierung von Daten
II.3.5 Öffentlichkeitsarbeit
II.4 Berufskodex für Statistiker
II.4.1 Die Prinzipien im Überblick
II.4.2 Verpflichtungen gegenüber der Gesellschaft
II.4.3 Verpflichtungen gegenüber Geld- und Auftrag- bzw. Arbeitgebern
II.4.4 Verpflichtungen gegenüber Kollegen
II.4.5 Verpflichtungen gegenüber dem Auskunftsgebenden
Anhang 1: Digitale Prosa oder das Geheimnis von Rosamona
Anhang 2: An der statistischen Front: Interviewer und Auskunftspflichtiger
Kapitel III: "Den Stein aufheben, unter dem das Unwesen brütet" - Grenzen der Statistik
III. 1 Was sind "gute” Daten? Annäherungen an ein komplexes Thema
III.2 Operationalisierungsprobleme
III.2.1 Grundsätzliches
III.2.2 Beispiel des "Magischen Vierecks"
III.2.2 Beispiel der Arbeitslosenquote
III.3 Mögliche Fehler in der Statistik
III.3.1 Einteilung der Fehler
III.3.2 Zufalls-/Stichproben-'Fehler'
III.3.3 Beschreibung systematischer Fehler in der Demographie
III.3.4 Diverse unernste Szenarien
III.4 Möglichkeiten und Grenzen der empirischen Sozialforschung
III.4.1 Zur Abgrenzung der empirischen Sozialforschung
III.4.2 Kritischer Rationalismus: Karl R. Popper
III.4.3 Frankfurter Schule: Theodor W. Adorno
III.4.4 Die Positivisten
III.4.5 Ein Beispiel
III.4.6 Die Unlogik der Forschung
Literarischer Anhang
Fälschung I
Fälschung II
METHODISCHER TEIL DESKRIPTIVE STATISTIK
Kapitel IV: Verhältniszahlen
IV. 1 Variablen
IV. 2 Skalentypen
IV. 3 Häufigkeiten
IV. 4 Verhältniszahlen
IV. 5 Aussagemöglichkeiten und -grenzen ausgewählter Verhältniszahlen
IV. 5.1 Wie mißt man "Unfallgefahrdung"?
IV. 5.2 Unterschiedliche Kriminalität von Deutschen und Ausländern?
IV. 5.3 Das Erwerbsquoten-Paradoxon
IV. 5.4 Selbstmordquote nimmt mit steigendem Alter zu oder ab oder wie?
IV.5.5 100 Millionen 'fehlende' Frauen
Kapitel V: Konzentrationsmessung
V. l Einleitung
V. 2 Konzentrationsrate
V. 3 Herfindahl-Koeffizient
V. 4 Lorenzkurve
V. 5 Gini-Koeffizient
V. 6 Rechenbeispiel für den Gini-Koeffizienten
V. 7 Reale Beispiele
V. 8 Vergleich der Konzentrationsmessung mit Streuungsmaßen
Kapitel VI: Mittelwerte
VI. 1 Überblick
VI. 2 Arithmetisches Mittel
VI.2.1 Einfaches Mittel
VI.2.2 Gewogenes arithmetisches Mittel
VI.2.3 Gewogenes arithmetisches Mittel bei gruppierten Daten
VI.2.4 Charakteristika vom gewogenen arithmetischen Mittel
VI.3 Median bzw. Zentralwert sowie Quantile
VI.4 Modus oder häufigster Wert
VI.5 Geometrisches Mittel
VI.6 Harmonisches Mittel
VI.7 Zusammenfassende Darstellung der Mittelwerte
VI.7.1 Typische Lagen der Mittelwerte
VI.7.2 Verwendungszwecke und Grenzen der Mittelwerte
VI.7.3 Eigenschaften der Mittelwerte im Vergleich
Anhang: Über Sinn und Unsinn von Mittelwerten bei Umweltrisiken
Kapitel VII: Streuungsmaße
VII.1 Einleitung
VII.2 Spannweite
VII.3 Mittlere (durchschnittliche) absolute Abweichung
VII.4 Interquartils-bzw. Quartilsabstand
VII.5 Varianz und Standardabweichung
VII.5.1 Die Formeln
VII.5.2 Ein Beispiel
VII.5.3 Graphische Darstellung von Varianz und Standardabweichung
VII.5.4 Standardabweichung und mittlere absolute Abweichung
VII.5.5 Probleme der Genauigkeit bei gruppierten Daten
VII.5.6 Skalentransformation
VII.6 Variationskoeffizient
VII.7 Schiefe und Wölbung
VII. 8 Zusammenfassende Darstellung der Streuungsmaße
VII.9 Ausblick auf die Testtheorie
VII.A Ableitungen
VII.A.1 Ableitung der alternativen Formel für die Varianz
VII.A.2 Beweis der Invarianz der Standardabweichung bzgl. Transformationen
VII.A.3 Ableitung der Formeln für Schiefe und Wölbung
VII.B Beispiele
VII.B.l Ungenauigkeiten der Varianzberechnung bei gruppierten Daten
VII.B.2 Einfaches Beispiel für die Berechnung von Schiefe und Wölbung
Kapitel VIII: Mittelwerte und Streuungsmaße am Beispiel der Einkommensverteilung
VIII.1 Aussagemöglichkeiten und -grenzen
VIII.2 Beispiele
VIII.2.1 Einkommensverteilung bei Angestellten
VIII.2.2 Internationale Einkommensverteilung
VIII.3 Durchschaubare Taktiken in der Praxis
Kapitel IX: Regression und Korrelation
IX.1 Einführung
IX.2 Regressionsrechnung
IX2.1 Methode der kleinsten Quadrate
IX.2.2 Alternative Kriterien der Anpassung
IX.2.3 Transformation nicht-linearer Beziehungen
IX.3 Korrelationsrechnung
IX.4 Transformation der x- und y-Achse
IX.5 Rangkorrelation
IX.6 Korrelation versus Kausalität
IX.7 Prognosen
IX.A Ableitungen
IX.A.1 Ableitung der Parameter a und b
IX.A.2 Ableitung der Formel für r
IX.B Beispiele
IX.B.1 Beispiel 1
IX.B.2 Beispiel 2
IX.B.3 Beispiel 3
Anhang 1: Über Kausalitäten in der Naturwissenschaft und bei Umweltrisiken
Anhang 2: Leben mit der Gasmaske?
INDUKTIVE STATISTIK
Kapitel X: Stichproben, Wahrscheinlichkeiten und Zufälle
X.1 Stichproben
X.2 Wahrscheinlichkeiten
X.3 Zufallsvariable
Anhang 1: Kopf oder Zahl - Zufall oder was?
Anhang 2: Würfelt Gott?
Prosaischer Anhang: Morbid-freche Unwahrscheinlichkeiten
Kapitel XI: Normalverteilung und andere Zufallsverteilungen
XI.1 Die Normalverteilung und ihre Parameter
XI.2 Die Standard-Normalverteilung
XI.3 Rechenbeispiele
XI.4 Zentraler Grenzwertsatz
XI.5 Was ist "normal"?
XI.6 Andere Zufallsverteilungen: t- und Chiquadratverteilung
Kapitel XII: Schätz- und Test-Statistik
XII.1 Grundzüge des Schätzens
XII.2 Grundzüge des Testens
XII.3 Formalisierung: Der Test in 5 Schritten
XII Anhang zu Risiko-Bestimmung, -Minimierung und -Vermeidung
Testfall 1: Zur Rationalität von Atomkraft-Risiken
Testfall 2: Was ist eine fehlerfreundliche Technik?
Testfall 3: Wie man sich bei einem chemischen Angriff zu verhalten hat
Kapitel XIII: Chi-Quadrat
XIII.1 Grundsätzliches
XIII.2 Anpassungstest
XIIII.3 Unabhängigkeitstest
XIII.4 Homogenitätstest
XIII.5 Assoziationsmaße
Anhang
Kleines Deutsch-Englisches Wörterbuch
Statistische Tabelle 1: Standard-Normalverteilung
Statistische Tabelle 2: t-Verteilung
Statistische Tabelle 3: Chiquadrat-Verteilung
Register
Recommend Papers

Statistik
 9783486785241, 9783486227024

  • 0 0 0
  • Like this paper and download? You can publish your own PDF file online for free in a few minutes! Sign Up
File loading please wait...
Citation preview

Statistik Von

Dr. Bernd Becker Statistisches Bundesamt

R. Oldenbourg Verlag München Wien

Mit Karikaturen von Rudaina G. Haddad

Die Deutsche Bibliothek — CIP-Einheitsaufhahme Becker, Bernd: Statistik / von Bernd Becker. - München ; Wien : Oldenbourg, 1993 ISBN 3-486-22702-5

© 1993 R.Oldenbourg Verlag GmbH, München Das Werk einschließlich aller Abbildungen ist urheberrechtlich geschützt. Jede Verwertung außerhalb der Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Bearbeitung in elektronischen Systemen. Gesamtherstellung: R. Oldenbourg Graphische Betriebe GmbH, München

ISBN 3-486-22702-5

ν

INHALTSVERZEICHNIS Vorwarnung

XI

ALLGEMEINER TEIL STATISTIK - HISTORISCHES, INFRASTRUKTUR, GRENZEN

1

Kapitel I: Vom Gott zur Ziffer

1

1.1 "Mich dünkt, die Alte spricht im Fieber"

2

1.2 Vorstellung der Hauptdarsteller

3

1.3 "Summiert sieht vieles doch anders aus..."

22

1.4 Vom Ursprung der Zahlen 1.4.1 Hinleitung 1.4.2 Können Sie bis "3" zählen? 1.4.3 Was haben Sie auf dem Kerbholz? 1.4.4 Vom Zählen zum Rechnen 1.4.5 Was wäre, wenn wir 6 Finger an einer Hand hätten? 1.4.6 Der erste Desktop, Typ "Abakus" 1.4.7 Ein indisches "Nichts" als Revolutionär 1.4.8 Die Wurzel unserer Ziffern 1.4.9 Eine unglaubliche Begegnung der toleranten Art 1.4.10 Hinweg mit dem Teufelszeug! 1.4.11 "Nach Adam Ries..." 1.4.12 Was heute alles von der Zahlenwelt und den Computern abhängt

23 23 25 26 26 27 27 28 29 30 31 31 32

Literarischer Anhang: Vom "Segen" der DIN-Norm

33

Sportlicher Exkurs: Mathematisch-statistisches Geheimnis des Fußballs

35

Kapitel II: "Du sollst nicht falsch' Zeugnis ablegen" - Infrastruktur der Statistik

39

II. 1 Was ist'Statistik'?

40

11.2 Institutionalisierte Statistik: Das Statistische Bundesamt

43

11.3 Ein Eckpfeiler der amtlichen Statistik: Die Volkszählung 11.3.1 Die Volkszählung als Basis für eine rationale Politik 11.3.2 Die Volkszählungskontroverse Mitte der 80er Jahre 11.3.3 Das Grundrecht auf informationelle Selbstbestimmung und Datenschutz 11.3.4 Möglichkeiten der Anonymisierung von Daten 11.3.5 Öffentlichkeitsarbeit

48 48 52 55 59 61

11.4 Berufskodex für Statistiker 11.4.1 Die Prinzipien im Übeiblick 11.4.2 Verpflichtungen gegenüber der Gesellschaft 11.4.3 Verpflichtungen gegenüber Geld- und Auftrag- bzw. Arbeitgebern Π.4.4 Verpflichtungen gegenüber Kollegen II.4.5 Verpflichtungen gegenüber dem Auskunftsgebenden

63 63 64 65 66 66

Anhang 1: Digitale Prosa oder das Geheimnis von Rosamona

68

Anhang 2: An der statistischen Front: Interviewer und Auskunftspflichtiger

71

VI

Seite Kapitel III: "Den Stein aufheben, unter dem das Unwesen brütet" - Grenzen der Statistik

77

III. 1 Was sind "gute" Daten? Annäherungen an ein komplexes Thema

78

111.2 Operationalisierungsprobleme

79

111.2.1 Grundsätzliches

79

111.2.2 Beispiel des "Magischen Vierecks" III.2.2 Beispiel der Arbeitslosenquote

79 83

111.3 Mögliche Fehler in der Statistik 111.3.1 Einteilung der Fehler 111.3.2 Zufalls-/Stichproben-'Fehler' 111.3.3 Beschreibung systematischer Fehler in der Demographie 111.3.3.1 Überblick 111.3.3.2 Beispiel 1: Altersangaben 111.3.3.3 Beispiel 2: Auf der Suche nach den 'unsichtbaren' Frauen 111.3.3.4 Beispiel 3: Quiz: Welche Berufscodierung paßt zum Beruf des Statistikers? 111.3.3.5 Beispiel 4: Gründe für die Unterschätzung des Einkommens in Interviews 111.3.4 Diverse unernste Szenarien 111.3.4.1 Ein höllisches Szenario: Im Inferno der Fehler 111.3.4.2 Ein exotisches Szenario: Von Raubtieren und Giftschlangen 111.3.4.3 Ein alltägliches Szenario: Augenzeugen lügen nicht

87 87 89 90 90 92 95 97 99 101 101 101 101

111.4 Möglichkeiten und Grenzen der empirischen Sozialforschung 111.4.1 Zur Abgrenzung der empirischen Sozialforschung 111.4.2 Kritischer Rationalismus: Karl R. Popper 111.4.3 Frankfurter Schule: Theodor W. Adorno 111.4.4 Die Positivisten 111.4.5 Ein Beispiel 111.4.6 Die Unlogik der Forschung

102 102 103 105 108 109 115

Literarischer Anhang Fälschung 1 Fälschung II

117 117 118

METHODISCHER TEIL DESKRIPTIVE STATISTIK

123

Kapitel IV: Verhältniszahlen

123

IV. 1 Variablen

124

IV. 2 Skalentypen

124

IV. 3 Häufigkeiten

125

IV. 4 Verhältniszahlen

125

IV. 5 Aussagemöglichkeiten und -grenzen ausgewählter Verhältniszahlen IV.5.1 Wie mißt man "Unfallgefährdung"? IV.5.2 Unterschiedliche Kriminalität von Deutschen und Ausländern? IV.5.3 Das Erwerbsquoten-Paradoxon IV.5.4 Selbstmordquote nimmt mit steigendem Alter zu oder ab oder wie? IV.5.5 100 Millionen 'fehlende' Frauen

128 128 133 134 136 137

VII

Seite

Kapitel V: Konzentrationsmessung

141

V.l Einleitung

142

V.2 Konzentrationsrate

143

V.3 Herfindahl-Koeffizient

144

V.4 Lorenzkurve

145

V.5 Gini-Koeffizient

146

V.6 Rechenbeispiel für den Gini-Koeffizienten

150

V.7 Reale Beispiele

151

V.8 Vergleich der Konzentrationsmessung mit Streuungsmaßen

154

Kapitel VI: Mittelwerte

157

VI.l Überblick

158

VI.2 Arithmetisches Mittel VI.2.1 Einfaches Mittel VI.2.2 Gewogenes arithmetisches Mittel VI.2.3 Gewogenes arithmetisches Mittel bei gruppierten Daten VI.2.4 Charakteristika vom gewogenen arithmetischen Mittel

158 158 159 160 161

VI.3 Median bzw. Zentralwert sowie Quantile

163

VI.4 Modus oder häufigster Wert

165

VI.5 Geometrisches Mittel

167

VI.6 Harmonisches Mittel

169

VI.7 Zusammenfassende Darstellung der Mittelwerte VI.7.1 Typische Lagen der Mittelwerte VI.7.2 Verwendungszwecke und Grenzen der Mittelwerte VI.7.3 Eigenschaften der Mittelwerte im Vergleich

171 171 172 173

Anhang: Ober Sinn und Unsinn von Mittelwerten bei Umweltrisiken

174

Kapitel ν Π : Streuungsmaße

177

VII.l Einleitung

178

Vn.2 Spannweite

179

VII.3 Mittlere (durchschnittliche) absolute Abweichung

180

VII.4 Interquartile-bzw. Quartilsabstand

180

VII.5 Varianz und Standardabweichung Vn.5.1 Die Formeln VII.5.2 Ein Beispiel VII.5.3 Graphische Darstellung von Varianz und Standardabweichung VII.5.4 Standardabweichung und mittlere absolute Abweichung VII.5.5 Probleme der Genauigkeit bei gruppierten Daten VII.5.6 Skalentransformation

181 181 182 183 184 184 185

Vili

Seite VII.6 Variationskoeffizient

186

VII.7 Schiefe und Wölbung

186

VII.8 Zusammenfassende Darstellung der Streuungsmaße

189

VII.9 Ausblick auf die Testtheorie

190

VII. A Ableitungen VII.A. 1 Ableitung der alternativen Formel für die Varianz VII.A.2 Beweis der Invarianz der Standardabweichung bzgl. Transformationen VII.A.3 Ableitung der Formeln für Schiefe und Wölbung

190 190 191 191

VII.B Beispiele VII.B.l Ungenauigkeiten der Varianzberechnung bei gruppierten Daten VII.B.2 Einfaches Beispiel für die Berechnung von Schiefe und Wölbung

193 193 195

Kapitel Vili: Mittelwerte und Streuungsmaße am Beispiel der Einkommensverteilung

199

VIII. 1 Aussagemöglichkeiten und -grenzen

200

VIII.2 Beispiele VIII.2.1 Einkommensverteilung bei Angestellten VIII.2.2 Internationale Einkommensverteilung

201 201 204

VIII.3 Durchschaubare Taktiken in der Praxis

206

Kapitel IX: Regression und Korrelation

211

IX. 1 Einführung

212

IX.2 Regressionsrechnung IX.2.1 Methode der kleinsten Quadrate IX.2.2 Alternative Kriterien der Anpassung IX.2.3 Transformation nicht-linearer Beziehungen

212 213 215 216

IX. 3 Korrelationsrechnung

220

IX.4 Transformation der x- und y-Achse

225

IX. 5 Rangkonelation

226

IX.6 Korrelation versus Kausalität

227

IX. 7 Prognosen

228

IX. A Ableitungen IX. A. 1 Ableitung der Parameter a und b IX.A.2 Ableitung der Formel lìir r

230 230 231

IX.B Beispiele IX.B.1 Beispiel 1 IX.B.2 Beispiel 2 IX.B.3 Beispiel 3

232 232 233 233

Anhang 1 : Über Kausalitäten in der Naturwissenschaft und bei Umweltrisiken

235

Anhang 2: Leben mit der Gasmaske?

236

IX

Seite

INDUKTIVE STATISTIK

241

Kapitel X: Stichproben, Wahrscheinlichkeiten und ZufSlle

241

X.I Stichproben

242

X.2 Wahrscheinlichkeiten

244

X.3 Zufallsvariable

247

Anhang 1 : Kopf oder Zahl - Zufall oder was?

251

Anhang 2: Würfelt Gott?

252

Prosaischer Anhang: Morbid-freche Unwahrscheinlichkeiten

253

Kapitel XI: Normalverteilung und andere Zufallsverteilungen

257

XI. 1 Die Normalverteilung und ihre Parameter

258

XI.2 Die Standard-Normalverteilung

261

XI.3 Rechenbeispiele

263

XI.4 Zentraler Grenzwertsatz

266

XI.5 Was ist "normal"?

271

XI.6 Andere Zufallsverteilungen: t- und Chiquadratverteilung

272

Kapitel ΧΠ: Schätz- und Test-Statistik

277

XII. 1 Grundzüge des Schätzens

278

XII.2 Grundzüge des Testens

283

ΧΠ.3 Formalisierung: Der Test in 5 Schritten

290

XII Anhang zu Risiko-Bestimmung, -Minimierung und -Vermeidung Testfall 1: Zur Rationalität von Atomkraft-Risiken Testfall 2: Was ist eine fehlerfreundliche Technik? Testfall 3: Wie man sich bei einem chemischen Angriff zu verhalten hat

293 293 295 296

Kapitel X m : Chi-Quadrat

299

XIII. 1 Grundsätzliches

300

XIII. 2 Anpassungstest

300

XIII. 3 Unabhängigkeitstest

302

XIII.4 Homogenitätstest

303

XIII.5 Assoziationsmaße

304

χ

Seite Anhang

309

Kleines Deutsch-Englisches Wörterbuch

310

Statistische Tabelle 1: Standard-Normalverteilung

312

Statistische Tabelle 2: t-Verteilung

313

Statistische Tabelle 3: Chiquadrat-Verteilung

314

Register

315

XI

Vorwarnung!

" Wer zwei Paar Hosen hat, mache eins zu Geld und schaffe sich dieses Buch an. " (Georg Christoph Lichtenberg, Sudelbücher)

Dieses Buch war ursprünglich als normales statistisches Lehibuch gedacht. Während des Schreibens hat es sich aber zu einem unkonventionellen Lehrbuch gemausert. Wie das? Von der ursprünglichen Absicht zeugt der methodische Teil, der sich aus meinem Lehrauitrag an der Universität Mainz heraus entwickelte. Dort und besonders im allgemeinen Teil wird aber auch ganz ausführlich auf grundsätzliche Probleme und Einschränkungen der Statistik eingegangen, wie man es sonst in einem statistischen Lehrbuch nicht findet. Im methodischen Teil wird z.B. auf die Mittelwertrechnung, die Streuungsberechnung und die Regressions- sowie Korrelationsanalyse eingegangen. Auch die Schätz- und Test-Statistik wird behandelt. Worauf es mir vor allem ankam, war nicht alleine die simple Darstellung der statistischen Methoden, sondern die Beschreibung ihrer Aussagegrenzen und ihrer Interpretation. Wichtig fUr mich waren bestimmte "Ausblicke" über den üblichen Tellerrand der Statistik hinaus, die viele Statistiker zu gut zu vermeiden verstehen, um z.B. über Atomkraft-Risiken oder UmweltProbleme zu reden. Manche mögen das einem Lehibuch nicht fllr angemessen halten. Natürlich wird z.B. der Mittelwert überall in der Welt gleich berechnet, seine Formel ist quasi systemneutral. Wichtig ist aber, in welchem Zusammenhang und mit welcher Intention bestimmte ausgewählte Mittelwerte (und warum andere nicht) benutzt werden. Weiter ist zu fragen, ob eine Mittelweitbetrachtung z.B. bei Grenzwertfestsetzungen bzgl. Schadstoflbelastungen in der Umwelt überhaupt das adäquate Instrument sein kann bzw. warum gerade dieses Instrument in diesem Zusammenhang so gerne angewandt wird. Der Gebrauch eines bestimmten Mittelweltes ist dann plötzlich nicht mehr neutral. Es soll z.B. folgendes drastische Zitat bewußt im Zusammenhang mit der Mittelwert- und Streuungsberechnung gesehen werden, wo sich anscheinend einer Uber solche Berechnungen ganz schön lustig macht (Zu recht? Dazu später mehr.): "Babuhhhbaaaataahh, Babuhhhbaaaataaahh! Wird in bestimmten Regionen auch als 'Saurer-RegenTanz' zelebriert. Zu deutsch; Grenzwertbestimmung oder Höchstmengenverordnung. Anderes Wort für Ahnungslosigkeit! Da Wissenschaftler nie ahnungslos sind, haben sie fitr ihre Ahnungslosigkeit viele Wörter, viele Methoden, viele Zahlen. " βeck, Risikogesellschaft, S. 85) Schlimmer als Fehler kann eigentlich nur Ahnungslosigkeit sein bezüglich dessen, was die Statistik kann im Vergleich zu den Anforderungen, die man an sie stellt. Man hüte sich als Statistiker, sich auf die eleganten Formeln zu konzentrieren, damit man ja nicht das sieht, was dann mit den Produkten der Formeln geschieht!

XII

Breiten Raum nehmen Untersuchungen zu Fehlern in der Statistik sowie zu Grundsatzfragen der Empirie ein. Wo die Grenzen des Erkenntnisgewinns durch empirische Methoden zu sehen sind, wird durch eine ausführliche Darstellung zweier wichtiger Vor-Denker, nämlich Karl R. Popper und Theodor W. Adorno, ausgelotet. Auch wird das Umfeld der Statistik bzw. die sogenannte institutionalisierte Statistik beschrieben, womit nicht nur allein das Tätigkeitsfeld des Statistischen Bundesamtes gemeint ist. Es wird dabei auf einige ausgewählte Aspekte der Statistik eingegangen, die die Öffentlichkeit seit Jahren beschäftigt wie die Problematik von Volkszählungen oder der Datenschutz. Ein Berufskodex ßr Statistiker wird ebenfalls vorgestellt. Ich denke bei diesem Buch zunächst an den Anfänger, der seine ersten "Gehversuche" in der Statistik macht. Es kann aber auch der leicht Fortgeschrittene davon profitieren. Man/frau kann sich schließlich nicht alles im Leben merken. Zum Nachschlagen mancher Details für den Experten war dieses Buch eigentlich auch gedacht. Auch ich mußte manchmal hier und da etwas nachschlagen. Die Kritik an vielen Stellen des Buches wird übrigens nicht betrieben, um die Statistik mies zu machen. Anders wird ein Schuh draus: Nur, wer die Grenzen eines Instrumentariums kennt, kann es optimal nutzen - sei es als Statistik-Produzent, sei es als Statistik-Konsument. Wenn man Kommentare liest, daß sich mit Statistik vieles beweisen läßt - Wahres und Unwahres -, so will man damit (einige bestimmte) Datenproduzenten und -interpreten treffen; in Wirklichkeit trifft es jedoch den Konsumenten, der sich bereitwillig und kritiklos jeden statistischen Unsinn aufschwätzen läßt. Deijenige, der nicht in dieser passiven Konsumenten-Haltung verharren will, ist der eigentliche Adressat dieses Buches. Wer das aber nicht will, der lasse die Finger von diesem Buch (bzw. von den noch viel besseren Büchern, die hier zitiert werden). Der methodische Teil ist mehr als ausreichend, um zwei Semester Statistik "vollzustopfen". Trotzdem kommen hier zu kurz der Preisindex, die Zeitreihenanalyse, die Wahrscheinlichkeitsrechnung, die Stichprobentheorie, die Mehrfachregression, die Volkswirtschaftlichen Gesamtrechnungen usw. Aber die nächste (bessere?) Auflage dieses Buches kommt bestimmt. Es wird zu jedem Themenkomplex mindestens ein Beispiel durchgerechnet. Ich habe darauf Wert gelegt, möglichst einfache Berechnungen anzustellen mit dem pädagogischen Ziel, dazu anzuhalten, wenigstens einmal im Leben selbst die Varianz oder das Bestimmtheitsmaß ausgerechnet zu haben. Im Ernst, Sie sollten die Beispiele mit Ihrem Taschenrechner nachrechnen. Ich weiß, ich wollte das früher auch nicht einsehen, aber mittlerweile glaube ich daran, daß es ein Muß für das Verständnis eines statistischen Sachverhalts ist, eine Formel erst einmal 'zu Fuß' nachvollzogen zu haben. Hat man es dann verstanden, dann kann man/frau sich in Zukunft um so beruhigter auf den Computer verlassen. Jeder lernt anders, mancher kapieit es nur per Formel, ein anderer braucht eine tabellarische Übersicht oder eine Graphik. So habe ich viel Wert darauf gelegt, synoptische Zusammenstellungen zu geben, um so z.B. die Eigenschaften verschiedener Streuungsmaße auf einem Blick und auf einer Seite zu konzentrieren. Per Formeln und Graphiken wurden z.B. die Grundprinzipien der Regressions- und Korrelationsrechnung zu erläutern versucht usw. Wenn man englische Texte zur Statistik ließt, kommen einem viele Begriffe bekannt vor, andere wiederum nicht. Deswegen ist im Anhang ein kleines Deutsch-Englisches Wörterbuch wichtiger statistischer Begriffe zu finden. Als Appetithappen wird gleich zu Anfang auf die eigentlichen Hauptdarsteller, die Zahlen, ihre historische Entwicklung und ihre teilweise mythischen Hintergründe eingegangen, auf daß der Hauptgang besser munde. Der Humor sollte nicht zu kurz kommen. Vor allem die Karikaturen sollen das Studium der statistischen Formeln auflockern.

XIII

Ein Buch wie dieses fällt nicht monolithisch vom Himmel. Viele haben zum Teil entscheidenden Anteil am Gelingen dieses Buches - und manche sogar, ohne es zu wollen oder zu wissen. Zunächst möchte ich meinen Statistik-Lehrer an der Universität Frankfurt erwähnen, Prof. Dr. Grohmann, dem ich zu verdanken habe, daß ich überhaupt Gefallen an der Statistik bekam. Außerdem möchte ich folgende Namen in alphabetischer Reihenfolge nennen: Dr. Sibylle Appel, Dr. Andrä Gäiber, die Hobler-Family, Peter Knoche, Roula Maiji, Dr. Supirmaniam Narapalasingam, Dr. Karl Schoer, Ulrich Tilgner und Dr. Walter Wolf. Besonders erwähnen möchte ich Dr. Werner Heidermann, dem ich viele Anregungen zu verdanken habe sowie Rudaina G. Haddad: Mit ihr hat es einen Heidenspaß gemacht, zahllose Ideen als Karikaturen zu Papier zu bringen. Last but not least möchte ich Sayang Ong Siok Lin danken für ihre Beiträge, die leider nicht zitieibar sind. Nun, nach diesen Vorwarnungen: Willkommen in der Welt der Statistik, viel Erfolg - und sollte manchmal ein Aha-Erlebnis oder gar Schmunzeln aufkommen - so war es eigentlich gedachtl B. Becker

Allgemeiner Teil STATISTIK -

HISTORISCHES INFRASTRUKTUR GRENZEN

Kapitel I Vom Gott zur Ziffer

Inhaltsverzeichnis 1.1 "Mich dünkt, die Alte spricht im Fieber" 1.2 Vorstellung der Hauptdarsteller 1.3 "Summiert sieht vieles doch anders aus..." 1.4 Vom Ursprung der Zahlen 1.4.1 Einleitung 1.4.2 Können Sie bis "3" zählen? 1.4.3 Was haben Sie auf dem Kerbholz? 1.4.4 Vom Zählen zum Rechnen 1.4.5 Was wäre, wenn wir 6 Finger an einer Hand hätten? 1.4.6 Der erste Desktop, Typ "Abakus" 1.4.7 Ein indisches "Nichts" als Revolutionär 1.4.8 Die Wurzel unserer Ziffern 1.4.9 Eine unglaubliche Begegnung der toleranten Art 1.4.10 Hinweg mit dem Teufelszeug) 1.4.11 "Nach Adam Ries..." 1.4.12 Was heute alles von der Zahlenwelt und den Computern abhängt Literarischer Anhang: Vom "Segen" der DEN-Norm Sportlicher Exkurs: Mathematisch-statistisches Geheimnis des Fußballs

2 3 22 23 23 25 26 26 27 27 28 29 30 31 31 32 33 35

Kapitel I: Vom Gott zur Ziffer

2

1.1 "Mich dünkt, die Alte spricht im Fieber" Zahlen waren schon immer nicht nur mit Rationalem, sondern auch mit Irrationalem verbunden, mit Logik und Wahnsinn, Verstand und Mystik, Weltlichem und Göttlichem. Mit Zahlen wollte man das Unberechenbare entdecken; Zahlen symbolisierten Getter und Weltordnungen, die Prinzipien allen Seins. Hexen, Kobolde, Teufel und Götter sind nicht von der Historie der Zahlen zu trennen. Auch bei Goethes Faust findet man "Verhextes": "Aus Eins mach Zehn, Und Zwei laßgehn. Und Drei mach gleich, So bist du reich. Verlier die Vier! Aus Fünf und Sechs, So sagt die Hex, Mach Sieben und Acht, So ist's vollbracht: Und Neun ist Eins, Und Zehn ist keins. Das ist das Hexen-Einmaleins. " Fausts ungalanter Kommentar zu diesem Hexeneinmaleins: "Mich dünkt, die Alte spricht im Fieber", obwohl hier doch nur die Konstruktion eines sogenannten magischen Quadrats beschrieben wird. Man findet ein solches Quadrat z.B. auch in einem Kupferstich von Albrecht Dttrer, Melancolía I von 1514: 16 5 9 4

3 10 6 15

2 11 7 14

13 8 12 1

Im folgenden wird für jede einzelne Ziffer mystisches, verwunderliches, abergläubisches usw. aufgelistet. Die Quellen dafür sind z.B. Zweisteins neue Zahlenrevue (ZEIT, ab Heft 31/1992), P.M. Perspektive "Die Welt der Zahlen", Ifrah: Universalgeschichte der Zahlen, Frankfurt/New York 2.A 1987, Aveni: Rhythmen des Lebens, Stuttgart 1991.

1.2 Vorstellung der Hauptdarsteller

3

1.2 Vorstellung der Hauptdarsteller

1 "Ich bin so lam."

"Ich fühle mich so depressiv."

"Wie das Jetzt in der Zeit und der Punkt im Raum, so läßt sich auch die Eins unter den Zahlen nicht weiter zerlegen. Also faßt sie auch keine Vielheit in sich zusammen, worin jedoch das Wesen der Zahl besteht. Ergo ist die Eins keine Zahl." Piaton s i n 2 a + cos 2 a = 1 - e , n = 1, wobei π = y p î

4

Kapitel I: Vom Gott zur Ziffer

2 "Du bist immer so irrational. Kannst Du Dich nicht mal so natürlich geben wie ich?"

1.2 Vorstellung der Hauptdarsteller

11 1121 11 1 -Ich bin völlig ver2felt!"

"Oops, ich hab' wohl einen zuviel getrunken."

"Die Zwei ist Zweifel, Zwist, ist Zwietracht, Zwiespalt, Zwitter Die Zwei ist Zwillingsfrucht am Zweige, süß und bitter." Friedrich Rttckert Mann und Frau, Tag und Nacht, Gut und Böse, Leben und Tod, Ja und Nein, wahr und falsch. "Eure Rede sei: Ja, ja, nein, nein. Was darüber ist, ist von Übel." Bergpredigt

Σ (1 + 1/2 + 1/4 + 1/8 + 1/16 + ...) = 2

Kapitel I: Vom Gott zur Ziffer

6

36 "Mmmh, Du bist so sexy." "Sei nicht so dreist."

Aller guten Dinge sind drei. Dreifaltigkeit. Leib-Seele-Geist. Geburt-Dasein-Tod. "Dreiklang als Fundament der Harmonie." Pythagoras a 2 + b 2 = c 2 ! Auch von Pythagoras Dreimal schwarzer Kater.

1.2 Vorstellung der Hauptdarsteller

Vieiblättriges Kleeblatt. Vier Jahreszeiten. Vier Evangelisten. Vier Himmelsrichtungen. Vier Elemente (Feuer, Luft, Wasser, Erde) Vier Tugenden. Vier Mondphasen. Vier Grundrechenarten.

7

Kapitel I: Vom Gott zur Ziffer

Fünfjahresplan. Fünf Sinne (Sehen, Hören, Riechen, Schmecken, Fühlen). "Der hat seine fünf Sinne nicht mehr beisammen." Pantokrator. Islam: Fünf Pfeiler des Glaubens, fünf Propheten, fünfmaliges Gebet pro Tag. Hinduismus: Fünf heilige Bäume. "Fünf gerade sein lassen." Fünftes Rad am Wagen. Chanel No. 5.

1.2 Vontellung der HiupbbnteUer

9

Fünf-Uhr-Tee. Fünf Ringe der olympischen Spiele. Fünf-Prozent-Hürde. 3 + 2 = 5: Die Fünf ist die erste Zahl, die sich - nach den Macho-Griechen - aus einer mflnnlichen 3 und einer weiblichen 2 zusammensetzt, enthält somit den ganzen Menschen. (Die Eins zählt ja bei den Griechen nicht als Zahl.) Die Fünf steht bei magischen Quadraten der Ordnung 3 deswegen oft in der Mitte: 4 3 8

9 5 1

2 7 6

Schiller: "Piccolomini": Fünf ist der Menschen Seele, wie der Mensch aus Gutem und Bösem ist gemischt, so ist die Fünfe die erste Zahl aus Grad und Ungerade." Mephistopheles: Faust:

"Der Drudenfuß auf Eurer Schwelle "Das Pentagramma macht dir Pein?"

Moderner Fünfkampf. Fünf Bücher Moses. Gleichnis von den fünf klugen und den fünf törichten Jungfrauen. Punsch (5 Zutaten: Arrak, Zitronensaft, Gewürze, Zucker, Wasser) leitet sich aus dem indischen Wort "paflcha" = fünf ab. In unseren Breiten galt die Fünf oft als gefährliche, unheilschwangere Zahl, bei den Chinesen ist sie eine Glückszahl.

Kapitel I: Vom Oott zur Ziffer

10

"Kannst Du nicht mal an was anderes denken?"

1 2 + 3 6

Die '6* ist eine sogenannte vollkommene Zahl, denn ihre Teiler sind 1, 2, 3 (und natürlich 6). Sie ist auch die Summe aus diesen drei Zahlen.. Die nächste vollkommene Zahl ist erst wieder die 28. Jesus wurde am sechsten Tag der Woche in der sechsten Stunde ans Kreuz geschlagen. Moses riet, den Acker sechs Jahre zu bestellen und ihn dann ein Jahr brach liegen zu lassen. 666 - Zahl des Antichristen. Sechs kommt vor in Schnee- und Bergkristallen, Pflanzenzellen, Bienenwaben, Lilienkelchen und Fliegenbeinen.

1.2 Vorstellung der Hauptdarsteller

VII

7 L9 «t V Römisch, westlich, indisch, chinesisch, arabisch.

11

Kapitel I: Vom Gott zur Ziffer

12

Sieben Tage der Woche. Das verflixte siebte Jahr. Siebenschläfer. Sieben fette und sieben magere Jahre. Sieben Sachen. Sieben Weltwunder. Menora, der siebenarmige Leuchter der Juden. Siebter Himmel. Sieben Hügel Roms. Sieben Schwaben. Sieben Zwerge. Sieben-Meilen-Stiefel. Sieben Tugenden. Sieben Schöpfungstage.

1.2 Vorstellung der Hauptdanteller

ACHTsam MACHT er/sie IACHT es krACHT ACHTung sACHTe, sACHTe! NACHT

VIII "Mann, bist du antiquiert!"

14

Kapitel I: Vom Gott zur Ziffer

9 0 "Nichtsnutz!" "Neunmalkluger!"

32 1001

Eigentlich ist die "9" - da ungerade - eine männliche Zahl, so sagen die Pythagoreer. Sie ist aber anders als ihre Vorgänger 3, 5 und 7 - keine Primzahl. Obwohl sie das Produkt aus 3 · 3 - also eine Potenz - ist, zweifelten sie an der "Manneskraft" der neun, sie diffamierten die 9 als "weibisch". Bei den Römern war die neun ebenfalls weiblich: nona. Die "Schönen der Nacht", genannt nonariae, durften erst ab der neunten Stunde - das entspricht etwa 15 Uhr - ihre Liebesdienste anbieten.

1.2 Vorstellung der Hauptdarsteller

"Bei mir dreht sich alles im Kreis."

Null-Lösung. Null-Wachstum. Null-Bock. Null-Diät, null Ahnung. "Drei mal null ist null ist null." Sing- und Schunkellied des Kölner Karneval "0: Weniger als die Hälfte von 1 in der letzten besetzten Stelle, jedoch mehr als nichts." Zitat aus dem Statistischen Jahrbuch. "0: Eine Größe, die kleiner als die Hälfte der ausgewiesenen Einheit ist." Klingt schon besser. Zitat aus dem Statistischen Handbuch für die Republik Österreich.

15

16

Kapitel I: Vom Oott zur Ziffer

Georg Christoph Lichtenberg: Rede der Ziffer 8 am jüngsten Tage des 1798ten Jahres im großen Rat der Ziffern gehalten (Die Nulle, wie gewöhnlich, im Präsidenten-Stuhl)...

"Durchlauchtigste Nulle, Großgütigste Präsidentin und Stellvertreterin Unser Aller, Allerseits, nach angestammter Ungleichheit, höchst zu verehrende Mitschwestern, 9,7,6,5,4,3,2,1. ...War Sie es nicht, die den großen Gedanken faßte, die 1 zur 10, 100, 1000 etc. zu erheben, und dann, durch eine leichte Schwenkung, wiederum zu 0,1, 0,01, 0,001 etc. zu erniedrigen, wie man eine Hand umwendet. Wahrlich das Größeste, was je in der Welt, im Felde so wohl als auf dem Papier, durch Schwenkung ausgerichtet worden ist, und überdies so schwanger an Betrachtungen über Größe und Hinfälligkeit menschlicher Dinge, deren Wert oft bloß von Schwenkungen einiger Nullen abhängt, daß, teuerste Mitschwestern, (so nenne ich Euch schwesterlich wieder, da ich Zeichen der Rührung bei Euch bemerke) daß, sage ich, die Zeit meines Aufenthaltes auf dieser Bank, ja, daß die ganze Zeit, die ich hier gesessen habe, zu kurz sein würde, alles zur Geburt zu bringen. So wurde die Nulle endlich Schöpferin des großen Dezimalsystems... Doch ich fühle, ich verliere mich in der Erzählung Deiner Taten und Deines Wertes, große erhabene Nulle, sinnliches Bild des unabbildlichen Nichts. Wo würde ich ein Ende finden in Dir, dem unerschöpflichen Thema von Tausenden...(Die Präsidentin verhüllt sich und glüht schamrot durch den Schleier durch, wie der volle Mond bei einer Total-Verfinsterung. Die Rednerin bemerkt es, und geht zu einem neuen Gegenstand mit einer tiefen Verbeugung über)... "

1.2 Vorstellung der Hauptdarsteller

"Ich bin der Geist, der stets verneint."

1/2 "Sony, ich bin heute nicht ganz da."

18

Kapitel I: Vom Gott zur Ziffer

"Ich liebe Dich bis in alle Ewigkeit!" "Wenn ich Dir in die Augen schau, kribbelts bei mir in Mark und Bein!"

+ "Ach, was ist die Welt so wundeibar!" "Du nervst!"

1.2 Vorstellung der Hauptdanteller

Sepp

Simpel "Du Quadratsimpel!" "Du Wurzelsepp!"

α "Liebling, warum bist Du immer so verschlossen?"

Kapitel I: Vom Gott zur Ziffer

± "Du bist immer so vage!" "Und Du fällst immer von einem Extrem ins änderet"

Φ

=

"Irgendwie passen wir nicht zueinander."

1.2 Vorstellung der Hauptdarsteller

-

+ "Positivist!" "Nihilist!"

21

22

Kapitel I: Vom Gott zur Ziffer

1.3 "Summiert sieht vieles doch anders aus..." Nach diesen Spielereien mit Zahlen und anderen Symbolen soll die weltbewegende Frage aufgeworfen werden, in welchen Zusammenhängen Zahlen auftauchen. Im Alltag tauchen Zahlen auf. Allerdings weniger in dem Zusammenhang wie bei Tucholsky: "Weißt Du, wieviel Sternlein stehen...?" sagte ich. "Gott der Herr hat sie gezählet... " "Er hat alles gezähletΓ schimpfte er. "Gezählet - das feierliche e... Haben Sie einmal in unser Lebensbuch hineingesehen -?" "Es war die größte Überraschung, die ich jemals erlebt - nein, die ich jemals gehabt habe", sagte ich. "Das ist doch die Höhe. " "Nicht wahr? Aufzuschreiben, wie oft man jede einzelne Handlung begangen hat: es ist ja - geisteskrank ist das..." "Sie lästern", sagte ich. "Sie müssen ihn nicht lästern... Gott ist groß. " "Gott ist..." "Nicht, nicht. Natürlich ist es lächerlich. Denken Sie sich: ich habe neulich einmal einen ganzen Nachmittag auf der Bibliothek verbracht und meinen Band durchgeblättert... summiert sieht es doch anders aus als damals, als man es tat. Schlüssel gesucht: 393 mal. Zigaretten geraucht: 11 876. Zigarren: 1078. Geflucht: 454 mal... An Bettler gegeben: 205 mal. Nicht viel. Nugat gegessen - ist ein Mensch je mal auf den Gedanken gekommen, derartiges aufzuschreiben...! Nugat: 3 mal. Ich habe keine Ahnung, was Nugat ist. Die Handschrift des Buchhalters ist aber so ordentlich, daß es schon stimmen wird. Übrigens: die letzten tausend Seiten sind mit einer Buchhaltungsmaschine geschrieben. Man modernisiert sich. " "Er zählt alles", grollte er. "Erzählt Verrichtungen, die ein anständiger Mensch..."... "Ich habe demnach, sah ich an jenem Nachmittag, recht mäßig gelebt,... recht mäßig. Ich mag Ihnen die Zahl nicht nennen - aber es grenzt schon an Heiligkeit. Jetzt tut es mir eigentlich leid... Das merkwürdigste ist -" "Was?"fragte er. "Das merkwürdigste ist", sagte ich, "zu denken, daß man dies oder jenes vielleicht zum letztenmal in seinem Leben getan hat. Einmal muß es doch das letztemal gewesen sein. Am vierzehnten Februar eines Jahres hat man zum letztenmal ein Automobil bestiegen... Und man ahnt das natürlich nicht. Finales gibt es ja doch nur in Opern. Man steigt ganz gemütlich in ein Automobil, fährt, steigt aus - und weiß nicht, daß es das letztemal gewesen sein soll. Denn dann kam vielleicht die Krankheit, die lange Bettlägerigkeit... nie wieder ein Automobil. Zum letztenmal in seinem Leben Sauerkraut gegessen. Zum letztenmal: telephoniert. Zum letztenmal: geliebt. Zum letztenmal: Goethe gelesen. Vielleicht lange Jahre vor dem Tode. Und man weiß es nicht. " Gut so. Doch nun zur Historie: Woher kommen unsere Zahlen? Wie entwickelte sich unser Verständnis von den Zahlen?

1.4 Vom Ursprung der Zahlen

23

1.4 Vom Ursprung der Zahlen "Das Wesen aller Dinge ist die Zahl. " (Die Pythagoreer) "Gotische Dome und dorische Tempel sind steingewordene Mathematik. " (Oswald Spengler, Der Untergang des Abendlandes) "Theoretische Gedanken über die Gesellschaft insgesamt sind nicht bruchlos durch empirische Befunde einzulösen: sie wollen diesen entwischen wie spirits der parapsychologischen Versuchsanordnung. " (Theodor W. Adorno, Soziologie und empirische Forschung) "Mit der ganzen Algebra ist man oftmals nur ein Narr, wenn man nicht noch etwas anderes weiß. " (Friedrich der Große) "Man merkts, hier ist lang kein Krieg gewesen. Wo soll da die Moral herkommen, frag ich? Frieden, das ist nur Schlamperei, erst der Krieg schafft Ordnung... Nur wo Krieg ist, gibts ordentliche Listen und Registraturen, kommt das Schuhzeug in Ballen und das Korn in Säck, wird Mensch und Vieh sauber gezählt und weggebracht, weil man eben weiß: ohne Ordnung kein Krieg. " (Brecht, Mutter Courage und ihre Kinder)

1.4.1 Einleitung Die einigermaßen wahllos herausgegriffenen Zitate im Vorspann sind kein Leitmotiv fur die folgenden Kapitel, sie sollen lediglich die ganz verschiedenen Ansichten über Zahlen, Messen und Quantifizieren andeuten. Zahlen sind iiir uns der Inbegriff des Logischen, und doch haben sie fiir viele auch ganz andere Bedeutungen. Nicht verwunderlich ist da, dafl die Geschichte der Zahlen ebenfalls sehr vielschichtig ist, sie verlief alles andere als geradlinig. Der Bogen spannt sich von der Steinzeit Aber die Sumerer, Babylonier, Ägypter, Mayas, Azteken, Chinesen, Inder usw. bis heute. Die verschiedenen Kulturen entwickelten jeweils ihre spezifischen Sichtweisen über Gott und die Welt und damit auch über die Zahlen. Vielfach wurden unabhängig voneinander ähnliche Entwicklungen beschritten, oft endete man auch in Sackgassen. Wer sich für eine kompakte Einleitung in die Geschichte der Zahlen an sich interessiert, sei auf das exzellente Buch von Georges Ifrah verwiesen (Die Zahlen, Frankfurt/New York 1992). Die große Kulturgeschichte der Zahlen ist allerdings noch ungeschrieben. Ein paar ausgewählte Aspekte der Zahlen seien in diesem Kapitel kurz angerissen, bevor in den folgenden Kapitel das Werden der Zahlen systematisch beschrieben wird: Mit Hilfe der Zahlen suchte man Antworten auf alltägliche Probleme des Messens, Vergleichens, Archivierens usw., die sich ergaben, als sich die Gesellschaften im Laufe der Geschichte zu immer komplexeren Gebilden entwickelten, wo es darauf ankam, die Erntemengen zu bestimmen, die Vorrats- und Lagerhaltung zu regeln, die Steuern oder Tributzahlungen festzulegen oder die Anzahl der wehrpflichtigen Männer festzustellen. Auch versuchte man auf der Basis von Zahlensystemen zu gestalten: Das Streben nach Harmonie in Proportionen und Maßen ist das, was wir heute so sehr an der griechischen Kultur bewundern. Dieses Streben war bestimmend für Philosophie und Politik, fttr Musik, bildende Kunst und Architektur. Der

24

Kapitel I: Vom Gott zur Ziffer

Parthenon gilt als eine vollkommene Materialisierung dieses Ideals, was ohne Mathematik als Grundlage der komplizierten Proportionsberechnungen niemals gelungen wäre. Lange war die Zahl etwas Mythisches oder gar Gott selbst wie z.B. bei den Maya (siehe A. Aveni, Rhythmen des Lebens, Stuttgart 1991). Die Verbindung von Zahlen und Gott findet man häufiger in der Geschichte der Zahlen. Der Demograph Johann Peter Süßmilch nannte sein 1741 erstmals erschienenes Hauptwerk "Die göttliche Ordnung in den Veränderungen des menschlichen Geschlechts, aus der Geburt, dem Tode und der Fortpflanzung desselben erwiesen". In einer späteren Auflage wurde allerdings ernüchternd festgestellt, daß die "wollüstige Lebensart leider zugenommen" hat. Johannes Kepler nannte das Verfahren des Goldenen Schnitts die "Göttliche Teilung". Zeiten, wo das Zählen als Teufelswerk verdammt wurde, gab es auch. So verführte der Satan David, das Volk Israel zu zählen, wofür Gott das ganze Land mit der Pest bestrafte, wie man an mehreren Stellen in der Bibel nachlesen kann (so z.B. 1. Chronik 21). Über mehr "Teuflisches" wird noch an späterer Stelle zu berichten sein. Quantifizieren galt zu manchen Zeiten als verwerflich. Heute noch kann man den Spruch hören: "Gezählte Kinder und Schafe holt der Wolf," denn Quantifizieren heißt, sich Dinge verfügbar zu machen (siehe Ifrah, S. 36/37). Oft findet man geheimnisvolle Entsprechungen zwischen Zahlen und Natur. Aus der Masse der Beispiele sei nur die Fibonacci-Folge erwähnt, wo sich jede folgende Zahl aus der Summe der beiden vorhergehenden Zahlen ergibt. In der Natur entspricht tatsächlich fast immer die Anordnung der Blätter an einem Sproß einer Fibonacci-Folge. Auf der letzten Documenta IX hat der Künstler Mario Merz, der sich mit den Spannungen zwischen Natur und Intellekt befaßt, sein Werk dem mittelalterlichen Mathematiker Fibonacci gewidmet. Zu Fibonacci später mehr. Zählen, messen und insbesondere das Rechnen, wie wir es heute kennen, war nicht immer so selbstverständlich und weitverbreitet wie heute. Das Zählen war lange Zeit Herrschaftswissen, bestimmten Eliten vorbehalten. Es gab auch Ausnahmen wie z.B. die Inder und die Araber, die die Zahlen unter's Volk brachten. Das lxl, das heute jeder Grundschüler beherrscht, begann erst vor wenigen Generationen seinen Siegeszug in Europa. Am Anfang der Menschheit war es auch nicht überlebenswichtig, rechnen zu können, während heute jede halbwegs arbeitsteilig ausgerichtete Gesellschaft ohne Zahlen bzw. ein irgendwie geartetes Zählsystem - geschweige denn ohne Computer - organisatorisch zusammenbrechen würde. Als PC-Benutzer kann man sich nicht mehr vorstellen, daß alles mit einem "digitalen" und dazu noch "persönlichen" Computer in Form der eigenen 10 Finger begann. Im Irrationalen lag oft die Keimzelle des Rationalen; dies gilt im besonderen für die Geschichte der Zahlen. Noch heute sind mit den Zahlen Reste von Irrationalem verbunden. Oder können Sie von sich behaupten, noch nie an einem Freitag, den 13, ein ungutes Gefühl gehabt zu haben? Die Zahlen waren früher von Phantasien und Phantastereien, Mythen und Metaphysik, Träumen und Poesie kaum zu trennen. Haben Sie sich schon einmal gefragt, warum "zählen" und "erzählen" den gleichen Wortstamm haben? Nach und nach gewann das Rationale die Oberhand und führte schließlich zum Triumph der Zahlen über die Götter durch den ungeahnten Aufschwung von Technik, Wissenschaft und Ökonomie. Wie sah nun die Entwicklung der Zahlen und des Zahlenverständnisses im einzelnen aus?

1.4 Vom Ursprung der Zahlen

25

1.4.2 Können Sie bis "3" zählen? Als ich begann, Arabisch zu lernen, stöhnte ich über die arabische Grammatik. Da gibt es z.B. nicht einfach einen Singular und einen Plural wie bei uns, sondern es ist auch noch der Dual zu berücksichtigen, nämlich "zwei" Autos neben dem Singular "ein" Auto und dem (in unserem Sinne) eigentlichen Plural "die" Autos. Ähnliches gibt es auch im Altgriechischen. Bei den Sumerern steht die "1" für den Mann oder den Phallus, die "2" bedeutet die Frau und "3" bedeutet "viel". Ähnliches findet man im Französischen, wo "trois" und "très" nicht zufällig etymologisch verwandt sind. Aus dem europäischen Sprachraum ließe sich diese Liste beliebig verlängern mit "drei", "three", "troppo" usw. Die "drei" scheint somit eine kritische Grenze zu markieren, ab der die Mehrzahl, die Vielheit, das Unbestimmte beginnt. Bei einem Volksstamm im Süden Deutschlands wird noch heute der Schlachtruf verwendet: "Oans, zwoa, g'suffa!" Es wird berichtet, daß dieser Ruf bei häufig vorkommenden feucht-fröhlichen Anlässen verwendet wird mit der nicht seltenen Folge, daß das Zählvermögen nach einigen Wiederholungen des Trinkvorgangs schon bei der eins endet oder ganz aussetzt. Wie Ifrah berichtet (s.S. 23), haben die Römer nur ihren ersten vier Knaben eigene Namen gegeben, ab dem Fünften wurde schlicht durchnummeriert: Quintus, Sextus, Octavius,... Nach Aveni (s.S. 140 ff.) kannten die Römer zunächst nur vier Monate im Jahr, die nach Gottheiten benannt wurden: Martius, Aprilis, Maius und Junius. Erst später wurden sechs weitere Monate hinzugefügt, wobei man aber schlicht - wie bei der Namensgebung für die Kinder - durchzählte: Quintiiis, Sextiiis, September, October, November, December. Der Rest des Jahres war für die damalige Zeitrechnung einfach nicht existent, weil es die Winterzeit war, in der die Äcker brach liegen. Man fand es damals ganz normal, daß man diese Zeit nicht zählte, weil zu dieser Zeit eh nichts los war - für heutige "moderne" bzw. "aufgeklärte" Vorstellungen von einer linear verlaufenden Zeit (im Gegensatz zum damals noch vorherrschenden organischen, an natürlichen Zyklen orientierten Zeitbegriff) einfach unglaublich, und doch ist bis heute davon noch ein Rest übrig geblieben in dem Ausspruch "zwischen den Jahren", der sich auf die Zeit nach Weihnachten bezieht, die man eigentlich der Besinnung widmen sollte. Später haben die Römer natürlich dieses "Zeitloch" gestopft, indem man den Januar und Februar eingefügte. Schließlich wurde der Quintiiis und Sextiiis nach den zwei Kaisern Julius (Cäsar) und Augustus umbenannt. Nun ein Test: Können Sie auf die Schnelle - ohne abzuzählen - fünf Teller auf einem Tisch unmittelbar als fünf Einheiten erkennen? Ich bin mir nicht sicher, aber ich glaube, ich bin dazu nicht in der Lage, denn - mehr unbewußt als bewußt und ganz blitzschnell - scheine ich dazu zu neigen, alle Teller zunächst einmal in jeweils kleinere "Häppchen" von 2 bzw. 3 Einheiten zu zerlegen, um ein erstes Gefühl dafür zu bekommen, ob wirklich fünf (und nicht sechs oder vier) Teller auf dem Tisch stehen. Sicher bin ich mir erst, wenn ich wirklich nachzähle. Probieren Sie es einmal selbst! Es scheint wohl etwas dran zu sein, daß beim Menschen, zwar nicht unbedingt schon bei der drei, so doch schon relativ bald, so etwa zwischen vier und sechs, das konkrete Zahlengefühl an Grenzen gerät. Hinter dieser Grenze beginnt das Unbestimmte, das man auf den ersten Blick nur noch mit Begriffen wie "wenige", "einige" oder "viele" beschreiben kann. Ganz zu schweigen von wirklich großen Zahlen: Jeder wäre gern Besitzer von einer Million DM, doch niemand kann sich so richtig vorstellen, wieviel Geld das ist, weil wir normalerweise nicht daran gewöhnt sind, in solchen Dimensionen zu denken. Ein anderes Beispiel ist die Höhe des Bruttosozialprodukts. Ich wußte es einmal zu Zeiten meiner Diplomprüfung, weil es damals einen Professor gab, der sol-

Kapitel I: Vom Gott zur Ziffer

26

chen Unsinn gern abfragte. Hätten Sie gewußt, daß es jetzt ungefähr zwischen 2 OOO und 3 000 Mrd. DM liegt? Im Jahr 1987 betrug es ziemlich genau 2 000 Mrd. DM bzw. - ausführlich -: 2 000 000 000 000 DM. Mit dieser Zahl mit ihren zwölf Nullen kann niemand etwas anfangen. Man kann höchstens noch Vergleiche mit einem anderen Zeitraum oder mit anderen Ländern anstellen (etwa: doppelt so groß wie... usw.) bzw. man kann mit den jährlichen Verändemngsraten (etwa: S % mehr als letztes Jahr) hantieren, aber die absolute Höhe des Bruttosozialprodukts vermag uns keinen sinnlichen Eindruck mehr zu vermitteln. Die Begrenztheit unseres Zahlenverständnisses hat schon sehr frühzeitig ein Steinzeit-Einstein entdeckt, wie das folgende Kapitel zeigen wird.

1.4.3 Was haben Sie auf dem Kerbholz? Den Beginn des Zeitalters des "Zählens" stellt man sich in etwa so vor, daß z.B. ein Schäfer, der am Abend die Vollständigkeit seiner Herde überprüfen will, für jedes Schaf einen Finger, einen Stein oder eine Einkerbung in einem Knochen oder Holzstück (Kerbholzt) als Merkposten benutzt. Hat der Schäfer eine kleine Herde, dann kann er seinen persönlichen Computer in Form seiner 10 Finger benutzen. Bei einer größeren Herde wird er ein Stück Holz nehmen und für jedes Schaf, das am Morgen zum Weiden ging, eine Kerbe einritzen. Am Abend überprüft er nun, ob für jede Kerbe im Holz auch ein Schaf zurückkam. Bleibt eine Keibe übrig, dann fehlt ein Schaf und ihm bleibt nichts anderes übrig, als noch einmal rauszugehen, um sein verlorenes Schaf zu suchen. Das dahinter stehende Prinzip nennt man Methode der Entsprechung oder Bijektion (Ifrah, S. 27). Diese Technik war so effektiv, daß man Jahrtausende damit klar kam. Man konnte Bestände überprüfen, gelieferte Waren nachzählen oder simple Buchführungen ausführen, ohne auch nur eine Ahnung von einem Zahlensystem zu haben oder ohne eine Schrift zu besitzen. Bevor Sie über diese Steinzeit-Methode lächeln, denken Sie mal an Ihren Rosenkranz. Oder wie Sie (nicht nur als Kind) Ihre fünf oder zehn Finger zum Rechnen benutzten. In islamisch geprägten Ländern ist es üblich, mit Hilfe einer Kette mit 33 Steinen die 99 Namen Allahs aufzusagen.

1.4.4 Vom Zählen zum Rechnen Man kann mit dem Kerbholz Daten speichern und mit anderen Datenmengen Vergleiche anstellen, aber man kann noch nicht damit Rechnen. Dazu bedurfte es eines entscheidenden Aktes der Abstraktion. Man mußte zunächst jedem zu zählenden Element, seien es Schafe, Kühe oder Bäume, ein bestimmtes Symbol, also eine Zahl, zuordnen. Das entspricht noch dem Prinzip der Bijektion. Dazu muß man noch eine von allen akzeptierte Konvention einführen, die den Zahlen eine genau bestimmte Ordnung gibt z.B. in der Art, daß die sechs genau um eine Einheit größer als die fünf ist oder daß z.B. die 20 um genau 8 Einheiten größer ist als die 12 usw. Bleiben wir beim Beispiel des Schäfers: Dieser hat festgestellt, daß er fünf Schafe hat. Nun trifft er in einem fernen Ort einen anderen Schäfer, der sechs Schafe besitzt. Wie können sie nun ihre Schafherden vergleichen, die fernab in ihrer Heimat weiden? Sie können natürlich nicht auf ihre einzelnen Schafe deuten. Sie brauchen stattdessen einen Maßstab, der ihnen beiden geläufig ist und der als Stellvertreter für die konkreten, lebendigen Schafe fungiert. Wenn sie durch diese Konvention wissen, daß die sechs um eine Einheit größer ist als die fünf, dann können sie nicht nur bestimmen, wer die größere Herde hat, sondern auch, um wieviel sich die Größe ihrer Herden unterscheidet oder wie groß ihre Herden zusammen sind usw.

1.4 Vom Ursprung der Zahlen

27

Soll man diese Banalitäten eigentlich so ausführlich darstellen, wo doch jedes Kind so etwas weiß? Und doch war die Entdeckung dieses ordinalen Aspekts der Zahlen ein enormer intellektueller Schritt der Menschheit und ebnete entscheidend den Weg für die Quantifizierung der Welt.

1.4.5 Was wäre, wenn wir 6 Finger an einer Hand hätten? Nun, da der Mensch rechnen lernte, eröffnete er sich eine scheinbar grenzenlose neue Welt, denn die Menge der Zahlen ist schließlich unendlich. Als Jäger und Sammler war die Anzahl der Gegenstände, mit denen er tagtäglich umzugehen hat, mengenmäßig jedoch eher überschaubar. Je mehr Menschen aber seßhaft wurden und sich eine gewisse Arbeitsteilung entwickelte, als neue Probleme in Form der Lagerhaltung, Güterverteilung oder Steuereinziehung auftauchten, nahm die Dimension der Mengen der zu zählenden Gegenstände rasch zu. So blieb es nicht aus, daß der Mensch bald an eine Kapazitätsgrenze stieß in der Erfindung und Handhabung neuer Symbole für die großen Zahlen. Er erkannte, daß er ein System in seine Zahlenwelt bringen mußte. Was wäre nun das ideale Zahlensystem? Man braucht einige wenige Symbole, die man auf geschickte Weise miteinander kombinieren kann, um sowohl kleine als auch große Zahlen auszudrücken. Wir gebrauchen zehn Ziffern und nennen deswegen unser System "Dezimalsystem". Aber warum gerade die Basis "10"? Legt man Wert auf möglichst viele Teiler, dann hätte das Duodezimalsystem erheblich mehr Vorteile, denn die 12 läßt sich durch 2, 3, 4 und 6 teilen. Kaufleute und Buchhalter wüßten das zu schätzen, denn man erhielte beim Dividieren als Ergebnis häufiger ganze Zahlen und man bräuchte weniger Brüche zu berechnen; beim Dezimalsystem kann man die 10 nur durch 2 und S ohne Rest teilen. Auch die Zeit- und Winkélrechnung würden uns leichter fallen, denn die basieren bei uns sowieso schon auf dem Duodezimalsystem. Die Sumerer, Assyrer und Babylonier haben so gerechnet, und wir haben diese Zeit- und Winkelrechnung von ihnen geerbt. Auch das Dutzend ist für uns noch ein gängiger Begriff. Anders dagegen die Maya und Azteken: Sie haben ein Zahlensystem mit der Basis 20 entwickelt. Im Französischen gibt es noch heute den merkwürdigen Begriff "quatre-vingt". Es muß also auch in unseren Breiten mit dem 20er-System experimentiert worden sein. Aber damit nicht genug, denn die Sumerer und Babylonier haben auch mit einem System auf der Basis 60 gearbeitet (siehe wieder die Zeit- und Winkelrechnung), ist ja klar, denn die 12, die sie sowieso schon benutzten, "paßt" 5 mal in die 60. Aber damit ist das menschliche Abstraktionsvermögen wohl ziemlich nahe an seine Kapazitätsgrenze gekommen. Trotz dieser unterschiedlichen Zahlensysteme und deren Relikte bis in unserer Zeit hat sich nur eins mit großem Erfolg durchgesetzt, nämlich das Dezimalsystem. Obwohl es nicht die Vorteile des Duodezimalsystems hat, wird es heute weltweit angewandt. Warum? Die einfache Erklärung ist, daß unser erster persönlicher Computer ein Dezimalsystem ist, nämlich unsere zehn Finger. Hätten wir sechs Finger, dann hätten wir höchstwahrscheinlich ein Duodezimalsystem.

1.4.6 Der erste Desktop, Typ "Abakus" In grauer Vorzeit, vielleicht vor mehr als 30 000 Jahren, begann also der Mensch mit Hilfe der Finger, dem Keibholz oder mit Steinen zu zählen. Nach Iftah (s.S. 83) ist noch nicht einmal das Rad so alt wie diese Rechentechnik, allenfalls das Feuer dürfte so alt sein. Kieselsteine waren beim Rechnen sehr beliebt, erst auf dem Boden in Furchen, dann auf dem Tisch, wo Linien für die Einer, Zehner, Hunderter usw. gezogen waren. "Kieselstein" heißt übrigens auf lateinisch "calculus", woraus sich unser Wort "kalkulieren" ableitet. Im Arabischen hat das Wort für Kieselstein ("haswah") dieselbe etymologische Wurzel wie die beiden Wörter für "abzählen" und "Statistik", nämlich "e'hsa" und "e'hsa'at".

28

Kapitel I: Vom Gott zur Ziffer

Das Rechnen mit den Kugeln wurde so erfolgreich, daß man begann, die Kugeln in Rechenbrettern zusammenzufassen: Der erste Desktop, Typ "Abakus", war kreiert. Diese Rechentechnik wird heute noch benutzt, so z.B. in Asien, wo man oft das interessante Schauspiel sehen kann, daß ein Geldwechsler in Hongkong souverän mit Dollars und DM hantiert. Mit seinem Taschenrechner, made in Japan, berechnet er die Wechselkurse, er verzieht keine Miene beim Feilschen um den Kurs, aber dann, nach Abschluß des Deals, prüft er wie selbstverständlich seine Rechnungen noch einmal auf dem Abakus nach. Die Jordan Times berichtete am 20. Dezember 1992 über die gerade stattgefundenen süd-koreanischen Präsidentschaftswahlen, daß 300 Abakus-Experten dazu ausersehen waren, die Kalkulation der 24 Millionen abgegebenen Stimmen zu überwachen. Man hat sich zu diesem Schritt entschlossen, weil bei den letzten Präsidentschaftswahlen 1987, die mit Hilfe des Computers durchgeführt wurden, Unregelmäßigkeiten vorgekommen sein sollen. Keine Alternativen hatten da die Händler im Mittelalter, ganz zu schweigen von den armen Römern, denen wohl nichts anderes übrig blieb, als mit dem Abakus zu addieren und subtrahieren, denn die römischen Zahlensymbole, die noch auf die steinzeitlichen Kerbholzzeichen zurückgehen, ließen unser simples Rechnen auf einem Stück Papier nicht zu. Stellen Sie sich z.B. vor, Sie müßten die Übungen im methodischen Teil dieses Buches mit den römischen Ziffern durchführen. Oder, Sie möchten sich aus dem Statistischen Jahrbuch von 1992 Zahlen heraussuchen. Allein die Jahreszahl auf dem Buchdeckel wäre mit MCMXCI1 ziemlich unansehnlich, ganz zu schweigen von den Schwierigkeiten, mit einem solchen Zahlensystem zu rechnen. Vielleicht war gerade die Effizienz des Abakus dafür verantwortlich, daß die Römer kein besseres Zahlensystem erfanden, denn mit dem Abakus konnten sie diesen Mangel gut überspielen. Der Abakus war eine sehr wichtige Erfindung der Menschheit. Er war über Jahrhunderte der höchste Stand der Rechentechnik. Aber spätestens seit dem 9. Jahrhundert stand das indische bzw. arabische Zahlen- und Rechensystem ante portas, die den Abakus unnötig machte. Man behinderte allerdings den Siegeszug dieser neuen Technik, sie wurde gar zeitweise als Teufelswerk verdammt. Allah sei gedankt dafür, daß sich das arabisch-indische Ziffernsystem im Mittelalter schließlich doch durchsetzte. Was war das für ein neues System, was da aus Asien kam, und warum hat es so lange gedauert, bis Europa davon endlich, aber dann um so intensiver Gebrauch machte?

1.4.7 Ein indisches "Nichts" als Revolutionär Das, was die Araber aus Indien mitbrachten, waren - äußerlich betrachtet - zunächst einmal neue Ziffern. Die kulturelle Revolution dieses Zifiernsystems liegt aber nicht darin, daß wir einheitliche, einfache Symbole bekamen. Auch daß das System ein Dezimalsystem war, war nicht entscheidend, denn das hatten wir schon von den Römern. Wichtiger war schon eher, daß nun der Zahlenwert jeder Ziffer variabel bzw. positionsabhängig wurde. Das Positionssystem lag schon implizit dem Abakus zu Grunde: Steht z.B. eine Kugel auf der Stelle der "Einer", dann repräsentiert sie den Wert "1". Steht eine Kugel dagegen auf der Zehner-Stelle, dann hat sie den Wert "10". Der variable Wert der Kugel bzw. jeder Ziffer ist Folge des Positionssystems. Auf dem Abakus sieht man das sofort. Im Vergleich dazu ist eine römische fünf, also "V", immer eine fünf, egal wo sie in der Abfolge von verschiedenen Zahlen steht (additives Ziffernsystem). Das Positionssystem war auch bei den Chinesen seit langer Zeit bekannt, aber eine entscheidende Kleinigkeit, eigentlich ein "Nichts", hatten sie "übersehen". Dieses "Nichts" war beim Abakus ebenfalls implizit "präsent", denn ohne dieses "Nichts" funktioniert er nicht.

1.4 Vom Ursprung der Zahlen

29

Das Entscheidende ist nun, wie man auch auf einem Blatt Papier unterscheiden kann, welche "1" die "1" und welche "1" die "10" repräsentiert. Natürlich weiß heutzutage jeder, wie das geht, ich brauche nämlich bei der "10" ein Leerzeichen, das für "Nichts" steht: die "Null". Erst damit wird jedes Rechnen zum Kinderspiel. Neben den Indern wurde die Null zusammen mit dem Positionssystem nur noch von den Maya und den Babyloniern entwickelt. Doch nur die Inder führten es vor etwa 1500 Jahren in den Alltag ein, um damit zu rechnen, und besonders die Araber machten es zu einem Instrument für die Massen.

1.4.8 Die Wurzel unserer Ziffern Wir bezeichnen "unsere" Ziffern als "arabische" Ziffern. In arabischen Ländern verwendet man aber nicht diese, sondern sogenannte "indische" Ziffern und bezeichnet unsere Ziffern als "westliche" oder "europäische" Ziffern. Obwohl all diese Ziffern nicht nur verschieden benannt werden, sondern auch noch völlig verschieden aussehen, haben sie alle einen gemeinsamen Ursprung in Indien. Die in Arabien üblichen als auch unsere Ziffern, die vor allem durch die Mauren über Spanien zu uns gekommen sind, lassen sich jeweils auf ein gemeinsames indisches Ur-Zeichen zurückführen. In der folgenden Graphik wird versucht, eine grobe Vorstellung zu geben, wie sowohl unsere als auch die in arabischen Ländern gebräuchlichen Ziffern von einem indischen Ur-Zeichen (bzw. bei der 5 von zweien) abgeleitet werden können. In Wirklichkeit ist die Ableitung viel komplizierter, was in einem früheren Buch von Ifrah nachvollzogen werden kann (Universalgeschichte der Zahlen, Frankfurt/New York, 2. Aufl. 1987, S. 540-544). Die mit einem Stern (*) versehenen Ziffern werden heute noch in Indien verwandt. Der Einfluß der Araber auf unsere Ziffern, unsere Rechentechnik und sogar auf unser Zahlenverständnis ist enorm. Wußten Sie, daß sogar die Reihenfolge bei der Verbalisierung von Zahlen arabisch beeinflußt ist? Haben Sie sich schon einmal gefragt, warum die Deutschen (neben einigen anderen Europäern) z.B. die Zahl "21" als "ein-und-zwanzig", also von rechts nach links, lesen, wo doch andere von "twenty-one", "veinti-uno" oder "vingt-et-un" sprechen? Die Araber machen es wie wir, sie lesen diese Ziffern (genauso wie ihre Schrift) von rechts nach links. Allerdings schreiben sie ihre Ziffern - wie wir - von links nach rechts. Als ich für einige Jahre in Jordanien arbeitete, hat mir diese Eigenart bei der täglichen Arbeit öfters Kopfzerbrechen bereitet. Natürlich war fìir mich Englisch das Kommunikationsmittel, also redet jeder von "twenty-one". Wehe dem aber, der gedanklich ins Arabische oder Deutsche abdriftete, denn dem konnte es passieren, daß aus der "21" plötzlich eine "12" wurde. Zahlendreher dieser Art waren nicht selten Ursache stundenlanger verzweifelter Fehlersuche. Übrigens ist auch das Wort "Ziffer" arabischen Ursprungs, denn es leitet sich von dem Wort "sifr" ab, das die arabische Bezeichnung für das entscheidende Element der neuen Rechentechnik, nämlich der Null, ist. Auch die Wörter "Algebra" und "Algorithmus" sind arabischen Ursprungs. Letzteres geht auf den Namen eines der größten arabischen Gelehrten der Mathematik, nämlich Mohammed Ibn Musa alCharismi, zurück. Das Wort Algebra leitet sich aus einem seiner Buchtitel ab.

Kapitel I: Vom Gott zur Ziffer

30

y

"Arabische'TIndische « Ziffern

Indischer Ursprung

"Westliche"/" Arabische" Ziffern

_

1

'S r

V

2

τ

r

3

E

ñ f

o

a

e

7 V A cr



L9

*

f

* Τ

Y

4 Lj *

5

5

V

e*

6

3

\

7

-ς s S

8

ι

*

Ρ o

9 *

0

* In Indien heute noch verwendete Ziffer. - Quelle: Stark gekürzte Zusammenfassung einer Darstellung von Georges Ifrah, Universalgeschichte der Zahlen, Frankfiirt/New York, 2. Aufl. 1987, S. 540-544.

1.4.9 Eine unglaubliche Begegnung der toleranten Art Ohne "unser" modernes Zahlensystem wäre jeder Fortschritt auf dem Gebiet der Mathematik, Physik, Technik und überhaupt in fast jeder Wissenschaft nicht möglich gewesen. Auch auf anderen Gebieten sind wir entscheidend gerade von den Arabern beeinflußt worden, wie z.B. in der Astronomie, Geographie, Medizin, Pharmakologie, Philosophie, ja auch Poesie und Musik. Dazu kommt die Prägung eines neuen, verfeinerten Lebensstils, der im rustikalen abendländischen Mittelalter nicht bekannt war. Das Abendland verweist gerne auf seine römischen und insbesondere griechischen Wurzeln. Was wir aber den Arabern zu verdanken haben, wird eher verdrängt. Die Ressentiments sind beidseitig und reichen weit in die Vergangenheit zurück. Es gab aber auch Ausnahmen:

1.4 Vom Ursprung der Zahlen

31

Beispielhaft sei nur an den Staufer Friedrich II., seines Zeichens römisch-deutscher Kaiser sowie König von Sizilien und Jerusalem, erinnert. Er unterhielt sich im 13. Jh. mit seinem moslemischen Lehrer in der Sprache der gebildeten Welt, nämlich Arabisch. Er erkannte als einer der ersten Europäer den hohen kulturellen Stand der Araber, und er war mitverantwortlich für den beginnenden Wissenstransfer vom Orient in das christliche Mittelalter. Wenn Sie mehr über den hohen Stand der arabischen Kultur und deren positive Einflüsse auf das damalige "barbarische" Europa wissen wollen, dann schauen Sie z.B. einmal in die Bücher von Sigrid Hunke oder in den schön bebilderten Band von Montávez/Bravo-Villasante, Europa unter dem Halbmond, München 1991. Friedrich II. sorgte auch ittr eine rühmliche Ausnahme im ansonsten grausamen Kapitel der Kreuzzüge: Was vor ihm keinem gelang (und was wohl auch niemand ernsthaft versuchte), war der nur auf dem Verhandlungsweg gewonnene freie Zugang der Christen zur heiligen Stadt Jerusalem, wobei er darauf Wert legte, daß auch den Moslems diese Stadt weiter offenstand. Ein solches Maß an Toleranz auf beiden Seiten war eine der wenigen Ausnahmen in den ansonsten bis heute alles andere als freundlichen Beziehungen zwischen Orient und Okzident. Bald sank aus den verschiedensten Gründen der Stern der arabischen Kultur, und fast parallel dazu setzte in Europa ein Prozeß der Erneuerung auf allen Gebieten ein. Schließlich ging mit der Zerschlagung des osmanischen Reiches zu Beginn unseres Jahrhunderts (wo die Araber den Europäern halfen) eines der vorläufig letzten Kapitel orientalischer Größe zu Ende. Das Abendland, allen voran England und Frankreich, teilten sich als "Dank" die arabischen Reste als Kolonien, Protektorate oder Mandatsgebiete nach eigenem Gutdünken untereinander auf.

1.4.10 Hinweg mit dem Teufelszeug! Die arabisch-europäischen Ressentiments sind Gründe dafür, daß so ziemlich alles, was aus dem Orient kam, zumindest kritisch beäugt, wenn nicht gar ganz verteufelt wurde. Dazu gehört auch das neue arabisch-indische Zahlensystem. Insbesondere die Kirche stemmte sich gegen den Einfluß des Neuen, denn ihr Dogmatismus und Mystifizismus vertrugen sich nicht mit den neuen Ideen der Wissenschaft und Philosophie. Die Vorstellungen von Himmel und Hölle, Seelenheil und Sünde standen im krassen Gegensatz zur Logik, die das neue Denksystem repräsentierte. Die Front derer, die lieber mit den römischen Ziffern als mit den "teuflischen Zeichen der Araber, dieser Handlanger des Satans" (Ifrah S. 227) rechnen wollten, war lange Zeit nahezu undurchdringlich. Viele Anhänger der neuen Lehre nutzten die neuen Zahlen als Geheimzeichen - daher die Teil-Bedeutung des Wortes "Chiffre", das sich ebenfalls von dem arabischen Wort "sifr" ableitet. Eine der wenigen Ausnahmen war der französische Mönch Gerbert d'Aurillac, der um die erste Jahrtausendwende zum Papst Silvester II. ernannt wurde. Lange bevor er Papst wurde, hatte er sich in Spanien von arabischen Lehrern in die neue Rechentechnik sowie in die Astronomie einführen lassen. Später wurde er u.a. der Hexerei angeklagt. In der Mitte des 17. Jahrhunderts, also etwa 600 Jahre nach seinem Tod, ließen die päpstlichen Behörden sogar sein Grab öffnen, "um zu überprüfen, ob es noch von höllischen Teufeln bewohnt war" (Ifrah, S. 227).

1.4.11 "Nach Adam Ries..." Vor allem im Land der Renaissance, also in Italien, konnte am ehesten der klerikale Widerstand gebrochen werden. Dafür waren allerdings auch fundamentale ökonomische Veränderungen die Ursache, denn der zunehmende Handel und das aufstrebende Handwerk sowie die Einführung des Geldes erforderten neue Rahmenbedingungen in Form von Rechenhaftigkeit, Normierung und Vorhersehbarkeit. Die sich ändernden ökonomischen Bedingungen beeinflußten natürlich auch alle anderen Aspekte des Lebens wie

32

Kapitel I: Vom Gott zur Ziffer

z.B. die Kunst und Philosophie, wodurch sich eine radikal neue Sicht von Mensch und Natur sowie Raum und Zeit entwickelte. Nur der Kaufmann, der mit verschiedenen Gütern und deren Mengen, Preisen, Lieferbedingungen und Rechtsnormen - dazu auch noch in den verschiedenen Orten am Mittelmeer - klarkam, hatte am Markt eine Chance. Wie sich die Rationalität des kaufmännischen Denkens entwickelte, kann man in dem vielbändig angelegten, noch nicht abgeschlossenen Werk "Ars mercatoria" nachlesen. Diese Geschichte ist ebenso interessant und verschlungen wie die Geschichte der Zahlen selbst. Unter den vielen neuen Gelehrten sei z.B. Leonardo von Pisa, genannt Fibonacci, erwähnt, der im beginnenden 13. Jahrhundert ein einflußreicher Lehrer und Verfasser von mathematischen Büchern war. Allerdings nannte er sein wichtigstes Buch nicht "Buch der Algebra", sondern - noch unter dem Einiluß der alten Tradition - Liber Abaci, also "Buch des Abakus". In Deutschland dauerte es etwa 300 Jahrhunderte länger, bis ein ähnliches Buch entstehen konnte und zwar von einem gewissen Herrn Ries, eher bekannt unter seiner sächsischen Namens-Version Adam Riese mit einem "e" am Ende. Anfang des 16. Jahrhunderts schrieb er die ersten Rechenanleitungen, die allesamt zu Bestsellern wurden. Adam Ries ebnete mit seinem pädagogischen Geschick den Weg für die indisch-arabische Rechentechnik. Ries unterhielt eine florierende Rechenschule, zuerst in Erfurt, das damals eine bedeutende Handelsstadt war, und später im sächsischen Annaberg, wo der Silbererzabbau einen ungeheuren Aufschwung nahm. Er wurde u.a. Beamter in der Buchhaltung der Edelmetallbergwerke eines sächsischen Fürsten. 1539 wurde er gar zum "Churfìirstlich Sächsischen Hof-Arithmeticus" ernannt. Ries lebte in einer Zeit des Umbruchs, es war z.B. die Zeit von Luther, der Fugger und derer von Thum und Taxis. Seine Ideen trafen auf eine wachsende Nachfrage. Trotzdem bekam er wegen seiner protestantischen Reden Probleme mit der Obrigkeit, und er wurde von der Geheimpolizei verfolgt. Nur sein hohes Ansehen hat ihn wohl vor der drohenden Ausweisung geschützt. Die Bücher von Ries sind voll mit praktischen Beispielen aus den verschiedensten Bereichen des mittelalterlichen Lebens wie z.B. Gewinn- und Verlustrechnung, Viehkauf, Geldwechseln, Zinsrechnung, natürlich das lxl, Vergleich von Gewichten, Silber- und Goldrechnung. Letztes ist besonders wichtig für die Bestimmung des Silber- oder Goldgehalts von Münzen, denn der Geldtausch spielte um diese Zeit eine zunehmende Rolle.

1.4.12 Was heute alles von der Zahlenwelt und den Computern abhängt Der Rest der Geschichte ist bekannt: Heute läuft ohne Zahlen und Computer nichts mehr. Waren es zunächst die Mathematiker, Naturwissenschaftler oder Techniker, die mit Zahlen und Formeln umgingen, so wurden später auch alle anderen Aspekte des Lebens vom Trend zum Quantifizieren erfaßt. Betriebsoder Lohnbuchhaltung, das Banken-, Versicherungs- oder Finanzwesen, die Sozialversicherung, jede Art von Kontrollwesen, Gas-, Wasser- oder Stromrechnungen, die U-Bahn oder das Fliegen, Radio, Fernsehen - um nur ein paar wenige Beispiele zu nennen - sind ohne Computer nicht mehr vorstellbar und auch nicht mehr organisierbar. Wen die letzten 100 Jahre der Entwicklung der Rechenmaschinen aus der Sicht eines Ingenieurs interessieren, sei auf das Buch "Moderne Rechenkünstler" von Hartmut Petzold (München 1992) verwiesen. Wir sollten uns eigentlich erfreuen an den Errungenschaften der Wissenschaften. Sie machen unser Leben auf der nördlichen Erdhalbkugel leichter, gesünder, länger, sicherer, abwechslungsreicher. Sie haben uns aber auch ein Reihe von Problemen beschert (zu mehr Details siehe spätere Kapitel, aber besonders Ulrich Beck, Risikogesellschaft, Frankfurt 1986).

Literarischer Anhang: Vom "Segen" der DIN-Norrn

33

Literarischer Anhang: Vom "Segen" der DIN-Norm Zum Relaxen eine Zugabe. Sie stammt aus dem Buch "Kopfjäger - Bericht aus dem Inneren des Landes" von Uwe Timm:

"Dr. Bär, ein Kirchenjurist im schwarzen Anzug, die weißen Kragenspitzen über dem schwarzen Pullover, lila Socken, hatte bislang die 100.000 Blatt Schreibmaschinenpapier, die von der bischöflichen Diözese jährlich gebraucht wurden, stets in einer bayerischen Papierfabrik bestellt. Nun aber wollte er sich andere Kostenvoranschläge einholen, weil die Preise, wie er selbst sagte, geradezu unverschämt und gar nicht katholisch waren... Ja, sagte Godemann, wenn ich einen Wunsch frei hätte, dann einen Tag mit 25 Stunden, nur ganz bescheidene 25 Stunden, eine Stunde mehr, nur eine, um an das zu denken, wozu ich tagsüber keine Zeit habe. Je mehr es einem an Zeit fehlt, sagte Dr. Bär und knabberte eine der angebotenen, mit einer weißen Vanillemasse gefüllten Waffeln, desto schneller vergeht sie. Godemann nahm die Brille ab, steckte kurz den Bügel in den Mund, als lutschte er daran. Ja, sagte er: Was ist Zeit, fragt Augustinus. Diese Schwierigkeit, Zeit zu messen. Denn Vergangenheit und Zukunft sind nicht. Die Gegenwart aber ist ohne Ausdehnung und Dauer... Und wieder nahm er den Brillenbügel in den Mund. Dr. Bär hätte jetzt sagen können, vielleicht auch sagen wollen, ich bin Jurist, ich will Papier bestellen, ich habe Augustinus nicht gelesen, weiß aber, daß der Bischof eine Abhandlung über Augustinus geschrieben hat, jedenfalls gab sich Dr. Bär einen Ruck, das schülerhafte Staunen war verschwunden. Lesen Sie Eco! sagte Godemann... Das Mittelalter war die Zeit, in der es von Wunderlichkeiten wimmelte. Sie waren die Realität. Die Wirklichkeit war ein Delirium... Es war eben noch nicht alles berechenbar, und wenn, dann nur über den Fuß und über die Elle, Körperteile also, die man immer bei sich trug und die dennoch höchst ungenau waren. Denn wo war die Urhand? Wo die Ureile? Was dachte Monsignore Bär? Man sah es ihm an: Gott, was soll das? Wohin will der? Was will er denn? Welch ein Dunkell Godemann setzte sich die verschmierte Brille auf: Die Hand eines Süditalieners ist kleiner als die eines Schweden. Ein wirres Durcheinander, die Zeit der Sektierer. Häretische Sekten machten die Straßen unsicher, wollten wunderbare Welten errichten. Sodomie und phantastische Utopien, Mord und Totschlag, Elle und Fuß. Da, plötzlich, beginnt Thomas die Welt zu ordnen. Keine Halluzinationen mehr, sondern Dinge, die berechenbar werden, also auch begreifbarer - die Lust zu schwimmen lobt Thomas, was ja verständlich ist bei dem enormen Körpergewicht-, und so entwickelt sich langsam, voll mühsamer Gedankenarbeit, der Blick für Größe heraus, für die meßbare Größe. Einige Jahrhunderte später vermessen die Spanier Florida. Aneinandergekettete Sklaven werden in die Sümpfe, in die Mangrovenwälder getrieben, um mit genormten Ketten das Land zu vermessen, sozusagen Kette an Kette zu legen, von der Malaria geschüttelt, von Vipern gebissen. Menschen starben zu Tausenden in Fiebersümpfen, ausgezehrt, mit eiternden Geschwüren, so wird unter enormen Mühen versucht, die Welt zu ordnen, eine einheitliche nachprüfbare Größe zu finden, ein Maßfür die Kontinente, Länder, Straßen und Wege, also för alle Größen... Das chaotische Kunterbunt verschwindet langsam, sagt der Mann für Außen und nimmt die Brille wieder ab, steckt den Brillenbügel in den Mund, zieht ihn sogleich wieder heraus: 1792 beschließt die Französische Akademie der Wissenschaften, ein einheitliches Längenmaß festzulegen, den vierzigmillionsten Teil des Erdmeridians... Und so schickt man, im Juni 1792, in dem Jahr, als die Monarchie abge-

34

Kapitel 1: Vom Gott zur Ziffer

schafft wird, zwei Mathematiker und Astronomen los, Mitglieder der Akademie der Wissenschaften: Pierre Méchain und Jean-Baptiste Delambre. Méchain arbeitet in Richtung Barcelona, Delambre in Richtung Dünkirchen. Zwischen diesen Orten und dem Schnittpunkt Paris soll der Meridian vermessen werden... Die beiden ziehen mit ihren Theodoliten durch ein Land, das in Blut und Gewalt ertrinkt... Die beiden bringen das Urmeter mit, das man zuvor lediglich geschätzt hatte, wenn auch, wie sich jetzt zeigte, recht genau. In Bronze gegossen wird das Meter am Justizpalast in Paris angebracht, dort kann ein jeder nachmessen, wann immer er will, keine Willkür mehr, keine Beliebigkeit, sondern - das will die wahre Revolution - ein vom menschlichen Geist berechneter Abschnitt der Schöpfung (Godemann nickte kurz dem Monsignore zu), der vierzigmillionste Teil des Meridians dieser Erdkugel. Danach berechnen sich von nun an auch alle anderen Maße: Volumen, Umfang, Gewicht. Unification et simplification. Vive le dix! Und dieses Urmeter ist auch die Ausgangsgröße für das DIN-Format. Das DIN-Format? Herr Bär setzte sich auf die Kante des Sessels, er saß jetzt da wie auf dem Sprung. Ja, sagte Godemann und lutschte kurz am Brillenbogen. Die Deutsche-Industrie-Norm, kraft der das Blatt in den Briefumschlag paßt, anders als in Italien, Brasilien, in den USA oder gar Indien, wo Sie, kaufen Sie Schreibmaschinenpapier, nie wissen, ob das Blatt später zusammengefaltet in den Briefumschlag paßt, wo man dann, um es hineinzubekommen, noch einen Falz machen muß, was dann einen dieser häßlichen Papierhubbel hinterläßt, der sich immer im Briefumschlag durchdrücken wird, oder Sie greifen zur Schere, schneiden den überstehenden Rest ab, stellen dann fest, daß die nun neu entstandene Papierkante etwas schief ist... Sie werden doch sicherlich die aus den unterentwickelten Ländern kommenden zurechtgestutzten, verstümmelten Briefe kennen, eine Folge zweier nicht aufeinander bezogener Größen. Das ist eben die Leistung der DIN-Norm: Ergebnis des rechten Maßes (er klopft auf einen Stoß Schreibmaschinenpapier DINA 4, den er vorsorglich auf den Tisch gelegt hatte), darin steckt der Schweiß der vom Fieber geschüttelten Sklaven in Florida, die eisigen Nächte vor Dünkirchen,... die Frage nach der Zählbarkeit der Zeit, und sehen Sie, unser Wasserzeichen, das mich, halte ich den Bogen vor das Licht, immer an den schwimmenden Thomas von Aquin denken läßt, das Maß, das der Mensch aus der Schöpfung genommen hat, nicht an-maßend, sondern maß-voll. Gibt es einen Mengenrabatt? fragte Monsignore Bär eingeschüchtert. Die Firma, bei der wir bisher Papier bezogen haben, gewährte einen Rabatt von 2 % bei einer Stückzahl von... Selbstverständlich sagte Godemann. Bei einer Bestellung von 200.000 Blatt gewähren wir 2 % Rabatt. Man sah die Enttäuschung im Gesicht von Herrn Bär. Da reichte Godemann ein Blatt hinüber, und Herr Bär hielt es gegen das Licht, das durch große Fenster fiel. Und da, langsam, trat ein Lächeln in Monsignores Gesicht, ein sehr innerliches, leuchtendes Lächeln. Das Wasserzeichen zeigte einen kleinen stilisierten Fisch. Auf diesem Papier konnte man wahrhaft berufen schreiben. Herr Bär bestellte 2000.000 Blatt für die Diözese, selbstverständlich mit Wasserzeichen, sagte er, und reichte das Blatt Papier Godemann über den Tisch. "

Sportlicher Exkurs: Mathematisch-statistisches Geheimnis des FuBballs

35

Sportlicher Exkurs: Mathematisch-statistisches Geheimnis des Fußballs In einem wichtigen Bundesligaspiel traf Werder Bremen auf Borussia Dortmund. Folgender Augenzeugenbericht dokumentiert wichtige Szenen des Spielverlaufs. Es sei vorweggenommen: Bremen gewann 1: 0 und hat "dabei eben einfach unberechenbares Glück gehabt": "Die Welt ist voller Rätsel, zumal die Fußballwelt. Da ist als erstes das Geheimnis, wie aus einer definierten Zahl von achteckigen Lederflicken so ein verdammt runder Ball entstehen kann. Nicht weniger als ein kleiner Exkurs über die Entwicklung der Fläche zum Raum ist da als Antwort gefordert. Wer sich darauf einläßt, landet ohne großes Zutun bei Einstein in der Diele. Nicht nur in diesem Sinn ist Fußball recht eigentlich eine mathematische Angelegenheit, wenngleich auch, um den berühmten Fußbailehrer Otto Rehhagel zu zitieren: "kein Computerspiel". Ist das Feld nicht auffällig rechteckig? Lauern nicht Kreise oder Halbteile dieser unberechenbaren Form allüberall auf dem Spielfeld? Läßt sich am Ende ein Torschuß nicht auf die Frage reduzieren, welchen Winkel die Flugstrecke des Balls als Schenkel zu einem beliebigen Punkt innerhalb des Tores mit der Grasnarbe als gedachter Basis zu beschreiben hat? Die Berechnung eines Dreiecks, wir erinnern uns, ist dann möglich, wenn mindestens eine Seite und die beiden anliegenden Winkel gegeben sind. Wir wissen nicht, welche Berechnungen der Mathematikstudent und Fußballprofi unter Vertrag des SV Werder Bremen Marco Bode am Sonntag abend im Weserstadion angestellt hat, bevor er um 18.20 Uhr eine astreine Flanke von Wynton Rufer aus 14 Metern voll abgezogen, aber eben doch leicht über das Tor von Dortmunds Torwart Stefan Klos setzte. Werder Bremen gegen Borussia Dortmund: Das war ein hochgerechnetes Meisterschaftsspiel, das zu diesem Zeitpunkt schon 18 Minuten alt war. Es sollte ein Spiel werden mit vielen Gleichungen, die nicht aufgingen. Die gelb-schwarze Nuß aus Dortmund wollten die Bremer unbedingt knacken. Und darum griffen sie an, bis der Rasen rauchte: Das Gurkentor, daß Frank Neubarth dann in der 36. Minute mehr auf den Fuß sprang als daß es als Ergebnis eines klugen Rechenweges hätte gelten können, war dem Spielverlauf angemessen, dem Niveau aber nicht. Zu gut waren die Kombinationen der Bremer bis dahin, ihr Kampf, ihr Können und ihre Kraft, als das dieser getretenermaßen wurstelige 3,78-m-Schuß von Neubarth eine Krönung hätte sein können. Da unterscheidet sich der Fußball dann doch von der Mathematik: Der Weg zur Lösung einer Aufgabe ist egal, Hauptsache, es rasselt... Wer denn nun Deutscher Meister wird, fragten die Journalisten am Ende die Trainer, und Otto Rehhagel, kein Mann von vielen Worten, antwortete, was er zu dieser Frage seit zwölf Jahren antwortet: "Wer am letzten Spieltag oben steht. " Die deutsche Fußballmeisterschaft, wir haben es geahnt, ist eben eine Additionsaufgabe. " (taz vom 11. Mai 1993)

Kapitel II "Du sollst kein falsch' Zeugnis ablegen" - Infrastruktur der Statistik -

"Wenn man mit Mißtrauen über die Statistik redet, gilt dieses Mißtrauen unkundiger Verwendung, nicht aber sachverständiger Erhebung der Daten... Wollen wir... die Durchsichtigkeit und Öffentlichkeit unserer Politik, dann müssen wir unsererseits auch dazu bereit sein, die Daten dafür zu liefern. " (Aus der Ansprache Richard von Weizsäckers beim Besuch des Statistischen Bundesamtes am 27.10.1986)

Inhaltsverzeichnis 11.1 Was ist 'Statistik'? 11.2 Institutionalisierte Statistik: Das Statistische Bundesamt 11.3 Ein Eckpfeiler der amtlichen Statistik: Die Volkszählung 11.3.1 Die Volkszählung als Basis für eine rationale Politik 11.3.2 Die Volkszählungskontroverse Mitte der 80er Jahre 11.3.3 Das Grundrecht auf informationelle Selbstbestimmung und Datenschutz 11.3.4 Möglichkeiten der Anonymisierung von Daten 11.3.5 Öffentlichkeitsarbeit 11.4 Berufskodex für Statistiker 11.4.1 Die Prinzipien im Übeiblick 11.4.2 Verpflichtungen gegenüber der Gesellschaft 11.4.3 Verpflichtungen gegenüber Geld- und Auftrag- bzw. Arbeitgebern 11.4.4 Verpflichtungen gegenüber Kollegen 11.4.5 Verpflichtungen gegenüber dem Auskunftsgebenden Anhang 1: Digitale Prosa oder das Geheimnis von Rosamona Anhang 2: An der statistischen Front: Interviewer und Auskunftspflichtiger

40 43 48 48 52 55 59 61 63 63 64 65 66 66 68 71

Kapitel II: Infrastruktur der Statistik

40

Π.1 Was ist 'Statistik'?

"Wenn ein Mensch stirbt, ist's ein Malheur, bei 100 Toten ist's eine Katastrophe, bei 1000 Toten eine Statistik " (eine bei Bohley aus seinem Buch 'Statistik' zitierte und Gérard Calot zugeschriebene Definition von 'Statistik') Zugegeben, dies ist eine ziemlich drastische Definition von Statistik, aber ich habe keine bessere gefunden. Zweierlei drückt dieses Zitat allerdings ganz klar aus, nämlich zum einen, • •

daß die Statistik selbstredend nur die quantitativen Aspekte des Lebens erfaßt, und zum anderen, daß die Statistik nicht an Einzelphänomenen, sondern nur an Massenphänomenen interessiert ist.

Etwas leichter ist es, die Arbeit eines Statistikers zu beschreiben. Folgende Geschichte habe ich von einem Kollegen, Farhad Mehran. Eines Tages fragte ihn seine Tochter, warum er soviel Geld verdient, wo er doch nur Zahlen addiert. Ihr Vater lächelt milde, schüttelt leicht sein Haupt und sagt: 'Mein Lidies, geh hinaus in den Garten und zähl die Bäume.' Nach einigen Minuten kommt seine Tochter zurück, aufgelöst in Tränen: 'Papi', sagt sie, 'ich kann die Bäume nicht zählen, denn da sind große Bäume, kleine Bäume, Büsche, einige haben Nadeln, andere haben Blätter, einige haben einen Stamm, andere haben 2 Stämme...' Ihr Vater lächelt wieder und nimmt sie sanft auf seinen Arm: 'Siehst du, das ist es, wofür ich bezahlt werde, ich zähle nicht einfach nur, ich mache Entscheidungen, was ein Baum ist, wie man Bäume zählt usw.' Wir können wir einen Schritt weitergehen und nun verschiedene Stufen der Statistik unterscheiden. Folgende Unterscheidung wird häufig verwandt: Zum einen gibt es die deskriptive Statistik, die die verschiedenen Aspekte des Lebens wie z.B. die Bevölkerung, Autos, Regenmenge, Geburten, Äpfel, Arbeitslose usw. beziffert. Zum zweiten gibt es die analytische bzw. schließende Statistik, die das deskriptive Material zunächst mit zum Teil einfachen Mitteln wie Verhältniszahlen oder Mittelwerten, zum Teil aber auch mit relativ komplexen Methoden wie Zeitreihenanalyse oder multiple Regressionsanalyse verdichtet, um daraus Hypothesen zu formulieren, die man schließlich mit Hilfe der schließenden Statistik den diversen Hypothesentests unterziehen kann. Schließlich kann das so aufbereitete Zahlenmaterial als Basis fììr die politische Planung und Entscheidung verwandt werden. Diese Dreiteilung ist natürlich eher hypothetisch, denn normalerweise sind zumindest die ersten beiden Schritte kaum voneinander zu trennen. Ein Beispiel soll diese drei Schritte erläutern: Jeder kennt die Geschichte von Don Juan. Unsterblich wurde dieser, heute nicht mehr ganz zeitgemäße sogenannte 'Frauenheld' in Mozarts Oper 'Don Giovanni'. Der Diener Don Giovannis, Leporello, hat die Nase voll von dem Lebenswandel seines Herren. Aber er kommt über seine zaghafte Kritik ('Euer Leben gleicht aufs Haar dem eines Schelmen') nicht hinaus. So beschreitet er andere Wege: Schritt 1 'Beschreibung': In Gegenwart von Donna Elvira, eins der vielen 'Opfer" von Don Giovanni, singt Leporello seine berühmte Registerarie:

II. 1 Was ist 'Statistik?

41

"Schöne Dorm, dies genaue Register, Es enthält seine Liebesaffären; Der Verfasser des Werks steht vor Ihnen, Wenn's gefällig, so gehn wir es durch. In Italien sechshundertundvierzig, Hier in Deutschland zweihundertunddreißig, Hundert in Frankreich und neunzig in Persien, Aber in Spanien, ja in Spanien schon tausendunddrei! Hier ein schmuckes Kammerkätzchen, Dort ein nettes Bürgerschätzchen, Kammerzofen, Baronessen, Hochgeborne Prinzessen, Mädchen sind's von jedem Stande, Jeder Gattung und Gestalt, Schön und häßlich, jung und alt. " Schritt 2 'Analyse': Nun, das Register ist noch lange nicht zuende, doch wird das Prinzip schon deutlich: Aus Leporellos Register ließe sich eine Tabelle konstruieren etwa mit dem Titel 'Don Giovannis weibliche Bekanntschaften nach Alter, sozialer Stellung und Nationalität'. Mit der Beschreibung geht eigentlich schon die Analyse Hand in Hand. Man könnte die Tabelle noch mit einigen Verhältniszahlen anreichern wie etwa mit der 'Altersstruktur' oder der 'prozentualen Verteilung nach Nationalitäten' der von Don Giovanni mehr oder weniger beglückten Damen. Schritt 3 'Entscheidung': Nicht immer ist es so einfach, mit einer so simplen statistischen Beschreibung und Analyse eine Entscheidung herbeizuführen, aber in Don Giovannis Fall ist das statistische Material so offensichtlich. Leporello erreicht, wozu er selbst zu schwach ist: Donna Elvira ist entsetzt und schwört furchtbare Rache ('Nur ein Gedanke füllt die Seele mir noch, Rache und Verachtung."). Das Ende von Don Giovanni war von Mozart bestimmt nicht dazu gedacht, die Macht der Statistik zu demonstrieren, im Normalfall schenkt man der Statistik eher geringere Aufmerksamkeit. Doch in diesem Fall ist es schon beeindruckend, wie in der Schlußszene Don Giovanni äußerst bühnenwirksam in einem Flammenmeer mit der gesanglichen Untermalung eines Geisterchores im Boden verschwindet mit den Worten: "Welch ungewohntes Angstgeföhl! Höllische Geister nahen sich, Es stürmt das wilde Flammenmeer Der Hölle her zu miri'' Scherz beiseite! Keine Statistik existiert im luftleeren Raum. Man braucht eine Infrastruktur. Im folgenden ist die statistische Infrastruktur in zwei Gruppen eingeteilt, zum einen die externen Faktoren der Statistik und zum zweiten die statistischen Instrumente sowie die statistischen Quellen. Bei der externen Infrastruktur kann man z.B. unterscheiden nach folgenden Faktoren: Externe Infrastruktur: • Nachfrage nach Daten • Statistische Gesetze • Budget Wie wir später noch sehen werden, wird normalerweise bei uns der Bedarf nach bestimmten Daten primär von Ministerien formuliert und - da bei uns keine Statistik ohne gesetzliche Grundlage durchge-

Kapitel II: Infrastruktur der Stilistik

42

führt werden darf - in Gesetzesform gefaßt sowie - hoffentlich - mit einem entsprechenden Budget versehen. Um eine Statistik durchzuführen, braucht man auch eine effektive interne Infrastruktur wie z.B. eine Statistik-Organisation sowie qualifiziertes Personal für Datenbeschafiung, Datenverarbeitung und Datenveröffentlichung in Kombination mit der entsprechenden technologischen Ausstattung, adäquate wissenschaftliche Methoden (Konzepte, Definitionen, Methoden) sowie ein harmonisiertes Klassifikationssystem (wie z.B. in geographischer, ökonomisch-sektoraler oder beruflicher Hinsicht): Interne Infrastruktur: • Organisation • Qualifiziertes Personal • Technologischer Standard • Wissenschaftliche Methoden • Harmonisiertes Klassifikationssystem Schließlich braucht man ein System von Datenquellen, das z.B. aus ökonomischen Gründen, aber auch, um die Auskunftspersonen zu entlasten, möglichst eng z.B. in methodischer sowie in zeitlicher Hinsicht aufeinander abgestimmt sein sollte: Datenquellen: • Zensen und Surveys für Haushalte und Unternehmen • Administrative Quellen/Register (aggregierte bzw. anonymisierte Daten von Finanzbehörden, Zoll, Sozialversicherung, Kraftfahrtbundesamt usw.) • Private Institutionen • Internationale Institutionen Das Wichtigste überhaupt für jedwede Art von Statistik ist jedoch die Wahrung ihrer Integrität. Nur so kann sie ihre Akzeptanz im sozialen Dialog wahren. Für die Statistik dienen die Grundsätze von Neutralität, Objektivität, Wissenschaftlichkeit und Unabhängigkeit als Basis ihrer Glaubwürdigkeit (siehe § 1 des Gesetzes über die Statistik für Bundeszwecke - Bundesstatistikgesetz - vom 22. Januar 1987). Dazu gehört auch deren Verläßlichkeit im Sinn von Konsistenz, Vollständigkeit, Fehlermargen und Aktualität. Komponenten der statistischen Integrität sind darüber hinaus die öffentliche Meinung darüber, wie nützlich Statistiken sind und ob der Datenschutz gegeben ist; dies ist auch wichtig, um die Bereitschaft der Auskunftspersonen zu richtiger und vollständiger Auskunft zu erhalten. Damit hängt wieder zusammen, ob eine Nachfrage nach Statistiken besteht und ob finanzielle Mittel für die Durchführung von Statistiken bereitgestellt werden, womit sich der Kreis zur externen Infrastruktur der Statistik schließt. Integrität der Statistik: • Akzeptanz im sozialen Dialog • Glaubwürdigkeit • Verläßlichkeit • Relevanz • Datenschutz Wie ist nun ganz konkret die Aufgabenstruktur in der amtlichen Statistik gestaltet?

II.2 Institutionalisierte Statistik: Das Statistische Bundesamt

43

Π.2 Institutionalisierte Statistik: Das Statistische Bundesamt "Zunächst einmal: der Deutsche schreibt, wenn ihm nichts anderes übrig bleibt. Er fertigt sich fltr jeden Krempel als erstes einen blauen Stempel und gründet um den Stempel froh ein großes Direktionsbureau. Und das Bureau beschäftigt Damen und trägt auch einen schönen Namen und hat auch einen Kalkulator und einen braven Registrator und einen Chef und Direktoren und vierzehn Organisatoren und einen Pförtner fllr die Nacht. " (Kurt Tucholsky, Noch immer) Der amtlichen Statistik war primär die Aufgabe zugedacht, umfassendes, aktuelles und verläßliches Datenmaterial für die gesetzgebenden Körperschaften und für die Bundesregierung und -Verwaltung bereitzustellen. Die amtliche Statistik war demnach zunächst einmal Bundesstatistik, wie es in Artikel 73 Nr. 11 GG beschrieben ist (zu mehr Details vgl. die ausführliche Darstellung in dem vom Statistischen Bundesamt herausgegebenen Buch 'Das Arbeitsgebiet der Bundesstatistik'). Statistische Unterlagen werden in erster Linie für die Durchführung von Verwaltungsaufgaben, als Entscheidungsgrundlagen für Planungs- und Reformvorhaben, als Erfolgskontrolle staatlicher Maßnahmen sowie als Basis der allgemeinen Beobachtung der sozialen und ökonomischen Entwicklung benötigt. Über den staatlichen Bereich hinaus berücksichtigt die amtliche Statistik außerdem zunehmend die Informationswünsche der an der politischen Willensbildung beteiligten Gruppen wie z.B. die Parteien, die Sozialpartner, die Kammern und Verbände, die Wissenschaft und Forschung. Damit hat sich die amtliche Statistik immer mehr zu einem Dienstleistungsbetrieb entwickelt. Ergänzend zum Grundgesetz wurde dies auch in der letzten Fassung des Bundesstatistikgesetzes vom 22. Januar 1987 im § 1 beschrieben. Wichtigstes Prinzip in der amtlichen Statistik ist, daß jede Bundesstatistik 'durch Gesetz angeordnet' werden muß (siehe § S des Budesstatistikgesetzes). Ohne gesetzliche Grundlage läuft also nichts, darf kein Fragebogen gedruckt werden, geschweige denn darfein Interviewer Informationen bei den Auskunftspersonen erheben. In den meisten Fällen werden die Gesetzesvorlagen von den fachlich zuständigen Ministerien vorbereitet, wobei weitgehend auch die Informationswünsche der übrigen Konsumenten berücksichtigt werden. Zunehmend wird das statistische Arbeitsprogramm auch von den Anforderungen internationaler Organisationen, vor allem den Europäischen Gemeinschaften, mitgestaltet. Organisatorisches Grundprinzip der amtlichen Statistik ist ihre fachliche Konzentration in den statistischen Ämtern mit dem Statistischen Bundesamt primär zur methodischen und technischen Vorbereitung von einzelnen Statistiken sowie deren Zusammenstellung und Publikation einerseits und den statistischen Landesämtern zur Durchführung und Aufbereitung der Statistiken andererseits. Nur in wenigen Ausnahmefällen sind auch andere Stellen mit der Durchführung von Bundesstatistiken beauftragt wie z.B. die Landwirtschafts-, Verkehrs- und Aibeitsverwaltung sowie die Deutsche Bundesbank. Der schematische Ablauf von Bundesstatistiken ist aus der folgenden Darstellung ersichtlich.

Kapitel II: Infrastruktur der Statistik

44

Schematischer Ablauf von Bundesstatistiken Rechtsgrundlagen für das Gebiet der Europäischen Gemeinschaften: Verordnungenen, Richtlinien oder Entscheidungen

für das Bundesgebiet: Verabschiedung der Bundesgesetze durch das Parlament (meist auf Veranlassung der und Entwurf durch die Ministerien)

t

$

Ζ Befragte (Personen, Haushalte, Unternehmen usw.)

Π.2 Institutionalisierte Statistik: Das Statistische Bundesamt

45

Die Aufgaben der Bundesstatistik sind vielfältig. In historischer Sicht stand nach dem Zweiten Weltkrieg zunächst die Gewinnung von Bestands- und Entwicklungsdaten über die Bevölkerung und die Wirtschaft im Vordergrund. Später wurden weitere Aspekte ausgebaut wie z.B. Uber Preise, Kosten, Konjunkturschwankungen, Einkommensentwicklung und -Verteilung. Dann wurde zunehmend das Augenmerk auf gesellschaftliche Probleme gerichtet wie die Situation benachteiligter Bevölkerungsgruppen, berufliche Mobilität, Bildungswesen, Umweltschutz, Regionalpolitik, Strukturwandel, Energieversorgung, Vermögensverteilung. Die vielfältigen Aufgaben können auch an dem in der folgenden Übersicht dargestellten Veröffentlichungssystem des Statistischen Bundesamtes abgelesen werden:

Veröffentlichungssystem des Statistischen Bundesamtes Art der Veröffentlichung Fachserien

Systematische Verzeichnisse

Zusammenfassende Veröffentlichungen

Thema 1. Bevölkerung und Erweibstätigkeit 2. Unternehmen und Arbeitsstätten 3. Land- und Forstwirtschaft, Fischerei 4. Produzierendes Gewerbe 5. Bautätigkeit und Wohnungen 6. Handel, Gastgewerbe, Reiseverkehr 7. Außenhandel 8. Verkehr 9. Geld und Kredit 10. Rechtspflege 11. Bildung und Kultur 12. Gesundheitswesen 13. Sozialleistungen 14. Finanzen und Steuern 15. Wirtschaftsrechnungen 16. Löhne und Gehälter 17. Preise 18. Volkswirtschaftliche Gesamtrechnungen 19. Umweltschutz Unternehmens- und Betriebssystematiken Gütersystematiken Personensystematiken Regionalsystematiken Sonstige Systematiken Statistisches Jahrbuch Wirtschaft und Statistik Allgemeine Querschnittsveröffentlichungen Thematische Querschnittsveröffentlichungen Veröffentlichungen zu Organisations- und Methodenfragen Kurzbroschüren

Karten Statistik des Auslandes Fremdsprachige Veröffentlichungen Die statistischen Ämter arbeiten weltweit mit anderen Institutionen zusammen. Auf die Bedeutung der Europäischen Gemeinschaften wurde schon hingewiesen. Dazu gibt es die Vereinten Nationen oder die OECD, um nur einige wenige zu nennen. Folgende Übersicht listet weitere Institutionen auf:

46

Kapitel II: Infrastruktur der Statistik

Auswahl internationaler Institutionen, mit denen das Statistische Bundesamt kooperiert Region Europa

Weltweit

Nichtamtliche internationale Organisationen

Institution Statistisches Amt der EG (SAEG) Europäische Gemeinschaften Europarat Brüsseler Zollrat (CCC) Europäische Organisation für Weltraumforschung (ESRO) Statistisches Amt der Vereinten Nationen Konferenz Europäischer Statistiker Wirtschaftskommission der Vereinten Nationen für Europa (ECE) Organisation für wirtschaftliche Zusammenarbeit und Entwicklung (OECD) Organisation der Vereinten Nationen für Erziehung, Wissenschaft und Kultur (UNESCO) Allgemeines Zoll- und Handelsabkommen (GATT) Internationale Arbeitsorganisation (ILO) Organisation der Vereinten Nationen für Ernährung und Landwirtschaft (FAO) Internationales Statistisches Institut (ISI) Internationale Vereinigung zur Erforschung des Volkseinkommens (IARIW)

Sitz Luxemburg Brüssel/Luxemburg Straßburg Brüssel Paris New York Genf Genf Paris Paris Genf Genf Rom Den Haag New Haven/USA

Zu diesen internationalen Institutionen kommen noch eine Vielzahl nationaler und internationaler halb- oder nichtamtlicher Institute, Universitäten usw., die weitere Informationen bereitstellen bzw. die auf der Grundlage der amtlichen Daten weitere Forschungen anstellen. Angesichts der Vielfalt von statistischen Institutionen ist es nicht verwunderlich, daß man bei der Suche nach Informationen zu einem bestimmten Thema unter vielfältigen Anbietern auswählen kann. Am Beispiel des Aibeitsmarktes wird in der folgenden Übersicht gezeigt, wo man welche Informationen zu diesem Thema finden kann:

II.2 Institutionalisierte Statistik: Das Statistische Bundesamt

47

Fundstellen zum Thema Arbeitsmarkt: Wie denn, wo denn, was denn? Übergeordneter Aspekt? Was?

Wie?

Wo? Wann? Mögliche Quellen:

Soll die Fragestellung "Arbeitsmarkt" primär gesehen werden im Zusammenhang mit z.B. Wachstum, Konjunktur, Einkommen? Arbeitsmarkt allgemein, Erwerbstätige, abhängig Beschäftigte, Erwerbs- bzw., Arbeitslose, Nicht-Erwerbspersonen, Schaler, Studenten, Rentner/Pensionäre usw. sachliche Gliederung wie z.B. Geschlecht, Alter, Familienstand usw. sektorale Gliederung wie z.B. Gesamtwirtschaft, grobe oder feine Unterteilung nach Industriezweigen (in welcher Systematik?) berufliche Gliederung räumliche/regionale Gliederung (international, national, Bundesländer, Kreise, Arbeitsmarktregionen, Städte, Stadtteile usw.) Jahrzehnt, jährlich, halbjährlich, vierteljährlich, monatlich; lange Zeitreihen, nur ein Zeitpunkt, Prognosen usw. Statistisches Bundesamt: Statistisches Jahrbuch Wirtschaft und Statistik Fachserie 1: Bevölkerung und Erwerbstätigkeit Fachserie 18: Volkswirt. Gesamtrechnungen Statistische Landesämter Bundesanstalt für Arbeit: Amtliche Nachrichten der Bundesanstalt ftlr Arbeit Bundesministerium für Arbeit und Sozialordnung: Arbeits- und Sozialstatistik Bundesministerium für Wirtschaft: Monatsberichte Deutsche Bundesbank: Monatsberichte Statistische Beihefte Institute: Periodische Veröffentlichungen von DIW/Berlin, Institut für Weltwirtschaft/Kiel, HWWA/Hamburg, RWI/Essen, IFO-Institut/München Sachverständigenrat zur Begutachtung der gesamtwirtschaftlichen Entwicklung diverse Gutachten der Wissenschaftlichen Beiräte der Ministerien Verbände Gewerkschaften Unternehmensveröffentlichungen Universitäten (Forschungsarbeiten, Dissertationen, Diplomarbeiten usw.) Fachzeitschriften, Zeitungen, Magazine Internationale Veröffentlichungen: Statistisches Amt der EG Statistisches Amt der UN OECD

Dieser Einblick in die Arbeitsweise der amtlichen Statistik mag genügen. Es ist hier nicht der Platz, auf Details der amtlichen Statistik einzugehen. Es soll stattdessen ein Komplex aus dem Bereich der amtlichen Statistik herausgegriffen werden, an dem exemplarisch einige neuere Tendenzen in der Statistik selbst und ihre vielfältigen Beziehungen zur Öffentlichkeit gezeigt werden können. Jeder wird sich noch an die Volkszahlungskontroverse in den 80er Jahre erinnern. Die Volkszählung ist einer der wichtigsten Eckpfeiler der amtlichen Statistik als eine der wenigen Vollzählungen, sie ist aber auch in der öffentlichen Meinung ein sensibles Thema, weil jeder Bürger zwangsläufig von der Volkszählung betroffen ist. Dieser Themenkomplex soll in den nächsten Kapiteln näher untersucht werden.

Kapitel II: Infrastruktur der Statistik

48

Π.3 Ein Eckpfeiler der amtlichen Statistik: Die Volkszählung Π.3.1 Die Volkszählung als Basis fur eine rationale Politik Beruf:

Kaiser von Österreich König von Ungarn etc. Adresse: Hofburg (handschriftliche Eintragungen des österreichischen Kaisers Franz Joseph I. (1830-1916) in seinem 'Anzeigezettel zur Zählung der Bevölkerung und der wichtigsten häuslichen Nutztiere nach dem Stande vom 31. Dezember 1900') Medizius: Sie heißen? Pliventrans: Franz Pliventrans. Medizius: Beruf? Pliventrans: Stemschnuppenzähler. Medizius: Haben Sie sich schon einmal verzählt? Pliventrans: Ja, hauptsächlich bei Tag. (Karl Valentin, Musterung in alter Zeit) "Als der Alte Fritz die "Seelentabelle" von 1769 mit der von 1756 verglich, erschien ihm die Bevölkerungszunahme falsch registriert. Da wurde der Kreisdirektor der Prignitz zum Bericht aufgefordert. Der schob die Schuld auf die Gendarmen, von denen manche alt, invalide und unwissend seien. Der König war über die Antwort höchstlichst entrüstet. So wichtige Tabellen, schrieb er zurück, müßten die Landräte selbst ausfüllen, um über die Zustände ihres Kreises im Bilde zu sein. Das sei keine untergeordnete Arbeit für die "Kreisausreiter" und andere Unterbeamte. " (Ernst Wagemann, Die Zahl als Detektiv, München, 2. Aufl. o.J.) "Wer mag zum ...formular Den Text erfunden? Ob der in jenen Stunden, da er dies Wundergewirr gebar, Wohl ganz — oder total — war? Du liest den Text. Du sinnst. Du spinnst. Du grinst - "Welch Rinds" - Und du beginnst wieder und wieder. - Eiskalt Kommt die Vision dir "Heilanstalt". Für ihn? Für dich? - Dein Witz erblaßt. Der Mann, der jenen Text verfaßt, Was mag er dünkeln oder wähnen? Ahnt er denn nichts von Zeitverlust und Tränen? (Joachim Ringelnatz, Wie mag er aussehen - Entwarnung: "...formular" heißt tatsächlich "Steuerformular", über das Ringelnatz hier gerade verzweifelt, nicht etwa "Volkszählungsformular"!) "Schlechte" Daten machen "gute" Politik unmöglich, "gute" Daten sind die unverzichtbare Basis für rationale Politik. Am Beispiel der Volkszählung soll gezeigt werden, welche Bedeutung ausgewählte Merkmale bzw. Merkmalskomplexe für ausgewählte Politikbereiche haben. Mit "Volkszählung" ist normalerweise der gesamte Komplex von Volks-, Berufs-, Gebäude- und Wohnungszählung gemeint. Hier soll das Augenmerk nur auf die Volkszählung im engeren Sinne, also auf deren demographische Komponente gerichtet werden. Wer mehr Details wissen möchte, sei auf den ausgezeichneten Übersichtsartikel in Wirtschaft und Statistik, Heft 3/1987, verwiesen.

II.3 Ein Eckpfeiler der amtlichen Statistik: Die Volkszahlung

49

Im allgemeinen ist der direkte "Nutzen" bzw. Effekt einer Volkszählung fur den Einzelnen nicht unmittelbar erkenntlich. Üblicherweise schüren Datenagglomerationen in irgendwelchen Computern eher das Gefühl der Intransparenz für den Einzelnen, der unmittelbare Bezug des Einzelnen zwischen "Hergabe seiner Daten" und seinem "Nutzen" ist nicht einsichtig, zumal dann, wenn Jahre vergehen, bis nach einer Großzählung aggregierte Daten wie z.B. über die Anzahl der Wohnbevölkerung oder der Erwerbstätigen o.ä. in irgendwelchen Zeitungen erscheinen. Es kommt dann schon eher die Angst vor dem "großen Bruder" auf. Das ändert sich allerdings, wenn man erfährt, daß z.B. der Finanzausgleich nach der vom Statistischen Bundesamt festgestellten Einwohnerzahl zu erfolgen hat. Im Jahr 1985 betrug das Volumen des Finanzausgleichs zwischen den Ländern einschließlich des kommunalen Finanzausgleichs (hier: allgemeine Zuweisungen) insgesamt etwa 67 Mrd. DM. Dies bedeutet pro Kopf der Bevölkerung etwa 1000 DM pro Jahr. Ist die Einwohnerzahl durch eine fehlerhafte Volkszählung regional verzerrt, dann bedeutet dies, daß das betreffende Land bzw. die betreffende Gemeinde pro Jahr 1000 DM zuviel oder zuwenig pro falsch ermitteltem Einwohner aus dem gemeinsamen Topf des Finanzausgleichs zur Finanzierung seiner Länder- (z.B. Schulen, Universitäten) bzw. kommunalen Aufgaben (z.B. Müllabfuhr, Sozialhilfe) bekommt. Nach dem Bundeswahlgesetz werden die Wahlkreise nach der amtlichen Einwohnerzahl eingeteilt. Nur so wird gewährleistet, daß jeder Stimme für die Kandidaten das gleiche politische Gewicht zukommt. Für die Planung von Infrastruktureinrichtungen wie Schulen, Fachhochschulen und Universitäten oder Krankenhäuser ist neben der Anzahl der Einwohner auch deren Altersstruktur sowie deren regionale Verteilung von Bedeutung. Dies gilt auch für den Wohnungsbau, die Energieversorgung, Verkehrs- und Umweltplanung, sei es für die Planung von Erholungseinrichtungen oder sei es für die Abschätzung von Umweltbelastungen durch Abfälle, Kraftwerke oder Straßenbau. Für den Aibeitsmarkt ist außerdem von Bedeutung, wie regional die sektorale und berufliche Struktur der Erweibspersonen bzw. der Nichterwerbspersonen in Kombination mit der Ausbildung aussieht. Da z.B. insbesondere bei Frauen auch der Familienstand bçw. die Haushaltsstruktur eine Rolle bei der Erwerbsneigung spielt, sind auch diese Daten für eine rationale Planung im Bereich von Aibeitsmarkt und Bildung notwendig. Im Bereich der Sozialen Sicherung kommt es bei den mit einem Kapitaldeckungsverfahren arbeitenden Lebensversicherungen darauf an, die Lebenserwartung der Versicherten und damit ihre zukünftigen Einnahmen bzw. Ausgaben abschätzen zu können. Die nach dem Umlageverfahren arbeitenden Gesetzlichen Rentenversicherungen müssen die Anzahl und Struktur der Gesamtbevölkerung kennen, denn sie hat durch ihre Beitragszahlungen für die Zahlungen an die Rentner aufzukommen. Die Stichtagsdaten der Volkszählung bilden dabei nur einen, aber einen wichtigen Teil der umfangreichen Berechnungen im Rahmen von Bevölkerungsvorausschätzungen, wo z.T. mit Hilfe anderer Daten Uber Zu- und Abgänge nach Altersjahren z.B. im schulischen Bereich, auf dem Aibeitsmarkt oder in der Sozialen Sicherung möglichst realistische Vorausschätzungen von Niveau und Struktur der Bevölkerung angestrebt werden. Die folgende Übersicht versucht, die wichtigsten Merkmale einer Volkszählung ihren entsprechenden Politikbereichen zuzuordnen:

50

Merkmal(-skomplex) Einwohnerzahl Alter, Geschlecht, Familienstand, Haushaltsstruktur

Erweibsbeteiligung, Beruf, Wirtschaftszweig, Ausbildung

Kapitel II: Infrastruktur der Statistik

Hauptsächlicher Politikbereich (Überlappungen möglich) • Verteilung des Finanzausgleichs • Einteilung der Wahlkreise • Bevölkerung und Familie • Wohnungsbau • Energieversorgung • Verkehrsplanung • Bildung • Umwelt • Bildung • Arbeitsmarkt • Soziale Sicherung

Dazu kommt, daß die Volkszählung aus methodischer Sicht (noch) ein unverzichtbarer Eckpfeiler für die repräsentativen bevölkerungsstatistischen Stichproben in den Jahren zwischen den Volkszählungen ist. Mit Hilfe der Volkszählung wird nämlich der Auswahlplan für die in den folgenden Jahren durchzuführenden Stichproben bestimmt. Außerdem kann nur eine Großzählung verläßliche regionale Angaben liefern. In den meisten Ländern wird heute so Bevölkerungsstatistik betrieben. Eine Untersuchung von Bernd Störtzbach mit dem Titel 'Volkszählungen im internationalen Vergleich' (Wirtschaft und Statistik 3/1987) kam zu dem Ergebnis, daß nur mit ganz wenigen Ausnahmen Volkszählungen in der traditionellen Form einer Befragung aller Bürger mit Auskunftspflicht immer noch das Grundkonzept der bevölkerungsstatistischen Praxis sind. Bei einem internationalen Vergleich der statistischen Praxis ist immer zu berücksichtigen, daß der jeweilige soziale, kulturelle und juristische Rahmen und damit auch die Ausgestaltung der statistischen Institutionen und Instrumente unterschiedlich sein können. Wie im folgenden gezeigt wird, sind nur in wenigen Ländern die Voraussetzungen vorhanden, um alternative Zählungsmethoden z.B. in Form einer registergestützten Zählung durchzuführen. Will man dem Bürger die Befragung mit Auskunftspflicht nicht zumuten, dann ist unter den heutigen Bedingungen neben einer Volkszählung auf Registeibasis nur eine freiwillige Befragung möglich. Freiwillige Befragungen scheinen das sogenannte mildere Mittel zu sein, doch hat man noch zu wenig Erfahrung damit, wie die Antwortausfälle zu behandeln sind. Eine Zählung auf Registeibasis scheint nur auf den ersten Blick eine Lösung zu sein, um dem Bürger eine lästige Erhebung zu ersparen. Eine registergestützte Zählung ist nämlich nur möglich mit einem effizienten Bevölkemngs-, Wohnungs- und Adressenregister, bei dem jede Adressen- und sonstige wichtige persönliche Änderungen meldepflichtig sind. Voraussetzung dieses Registers ist darüberhinaus eine unveränderliche Personennummer, die bei Geburt oder Einwanderung zugeteilt wird. Bisher werden registergestützte Zählungen nur in den skandinavischen Ländern und in Singapur durchgeführt. In Dänemark wurde 1981 erstmals eine Volkszählung ausschließlich auf Registerbasis durchgeführt. Grundlage dafür war ein zentrales Bevölkerungsregister mit den wichtigsten Daten über die Personen und deren Wohnungsverhältnisse sowie deren Personenkenn-Nummer. Dies waren auch die Voraussetzungen, die in Schweden gegeben warea Anders als in Schweden war es in Dänemark aber auch noch möglich, auf weitere Register wie z.B. die Arbeitslosenversicherung, auf das Unternehmens- und Betriebsregister sowie Finanzamtsregister über die Einkommen der Arbeitgeber bzw. über die Löhne und Gehälter ihrer Beschäftigten zurückzugreifen. Mußten in Schweden diese Angaben von den Auskunftspersonen noch ergänzt werden, so konnte in Dänemark ganz auf die Mitwirkung der Bürger verzichtet werden.

II.3 Ein Eckpfeiler der amtlichen Statistik: Die Volkszählung

51

In Singapur wurde erstmals mit der Zählung 1990 auf Register zurückgegriffen. Dabei wurde so gründlich mit der alten statistischen Tradition gebrochen, daß man den Hinweis filr nötig fand, daß eigentlich nur noch das persönliche Interview die einzige Beziehung zu der alten Art von Volkszählungen sei (siehe Lau Kak En, A New Approach to the Conduct of the 1990 Singapore Census of Population, Singapore Journal of Statistics October 1990). Das Interview war nur deswegen nötig, weil man einige Fragen zusätzlich stellte, die normalerweise nicht in den entsprechenden Registern enthalten sind. In Zukunft wird man in Singapur - ähnlich wie in Dänemark - wohl ganz auf den Bürger als persönlich angesprochene Auskunftsperson verzichten können. Im nächsten Kapitel soll u.a. der Frage nachgegangen werden, ob die gerade diskutierte registergestutzte Zählung eine wünschenswerte Alternative der traditionellen Zählung sein kann.

52

Kapitel II: Infrastruktur der Statistik

Π.3.2 Die Volkszählungskontroverse Mitte der 80er Jahre "Nie sollst du mich befragen, noch Wissens Sorge tragen, woher ich kam der Fahrt, noch wie mein Nam' und Art!" (Richard Wagner, Lohengrin, 1. Aufzug, 3. Szene) "60Millionen Erbsen" (Titel eines Werks von Anselm Kiefer mit Anspielungen auf die Volkszählung 1987; Kiefer, der sich angeblich nicht zählen ließ, bezeichnet mit diesem Titel eine Bibliothek von riesigen Bleifolianten, die mit Erbsen vollgestopft und mit Videokameras und Filmstreifen garniert sind.) Asterix: Da ist Kleinbonum! Also, hast du kapiert, Obelix? Für diese Art Erhebung braucht man Takt und Fingerspitzengefühl! Obelix: Kapiert! Wir stürmen rein, hauen alles kurz und klein und befragen das Volk, ohne es vor den Kopf zu stoßen! (Unnötig, den Titel der Comicreihe anzugeben, da selbstredend.) "Satan stand wider Israel auf und verführte David, Israel zu zählen... In Gottes Augen herrschte Mißfallen wegen des Geschehnisses, und schlug Israel. Da sprach David zu Gott: 'Ich habe schwer gesündigt, da ich dieses Werk unternahm. Nun verzeih doch die Sünde deines Knechtes! Denn ich habe ganz töricht gehandelt."... Gad ging zu David und sprach zu ihm: 'So spricht Jahwe: Wähle dir aus, ob drei Jahre Hungersnot herrschen soll oder drei Monate Niederlage vor deinen Feinden... oder ob drei Tage ... die Pest im Lande sein soll'... David antwortete Gad: 'Meine Not ist sehr groß. Doch ich will lieber in die Hand Jahwes fallen...' Da sandte Jahwe eine Pest über Israel, und es fielen von Israel siebzigtausend Mann." (Altes Testament, 1. Chronik 21)

Kaum eine andere statistische Erhebung kann die Wellen der Empörung so hoch schlagen lassen wie Volkszählungen. Daran ändert auch nichts die Tatsache, daß weltweit die meisten Volkszählungen reibungslos abgewickelt werden. Es kommt vor, daß heute eine ganze Erhebung scheitern kann wegen eines Zählungsdetails, dessen Brisanz all die Jahrzehnte vorher niemand gesehen hat. Auch kommt es vor, daß in einem Land Fragen möglich sind, die in einem anderen Land völlig indiskutabel sind. Hier ein paar Beispiele zu diesen und anderen Aspekten: • Die Ergebnisse der Zählung vom Jahr 1990 in den USA waren monatelang heftig umstritten. In diesem Streit wurde der Zählungsbehörde vorgeworfen, Fehler gemacht zu haben. Man gestand schließlich ein, etwa 5 Millionen Personen nicht erfaßt zu haben. Die Untererfassung betraf vor allem Gebiete in Großstädten mit Minoritäten wie Schwarze oder Hispano-Amerikaner. Die Kritik an der Zählung kam deswegen auch primär von den großen Städten, die um eine Reduzierung ihrer staatlichen Zuweisungen fürchteten. Argumentiert wurde, das Geld würde dann fehlen bei der Bekämpfung von Armut und bei der Unterstützung eben dieser Minoritäten. Es wurde aber schließlich entschieden, die Zählung - trotz ihrer Fehler - nicht zu wiederholen (siehe The New York Times vom 16. Juli 1991). • Ebenfalls finanzielle Befürchtungen haben die österreichische Stadt Telfs zu ungewöhnlichen Maßnahmen greifen lassen: Da Telfs bislang 9954 Bürger gezählt hat, waren noch 47 Personen 'aufzutreiben', um die magische Bevölkeningszahl von 10 000 zu überspringen, ab der es höhere Zuweisungen aus dem Finanzausgleich gibt. Man erwog, ein Preisausschreiben mit attraktiven Preisen auszusetzen, um insbesondere solche Personen mit einem Zweitwohnsitz in Telfs dafür zu gewinnen, diesen zu

II.3 Ein Eckpfeiler der amtlichen Statistik: Die Volkszahlung

53

ihrem Hauptwohnsitz zu erklären (siehe Die Presse vom 18. März 1991). Ich weiß nicht, ob die Telfser mit ihrer Aktion Erfolg hatten. In diesen beiden Beispielen ging es primär um finanzielle Nachteile, die man durch die Ergebnisse der Volkszählung befürchtete. Oft geht es aber um mehr als nur um Geld. Dazu die folgenden Beispiele: • In Nigeria wurde 1991 erstmals wieder nach drei vergeblichen Versuchen seit 1963 gezählt. Alle Versuche zerbrachen bisher an vielfältigen Konflikten in diesem Vielvölkerstaat. Politische, religiöse sowie Stammesführer haben in Ermangelung besserer Daten seitdem die Zahlen ihrer 'Schäfchen' nach eigenem Dünken 'gestaltet', weil davon Geldzuteilungen von der Hauptstadt abhingen. Bei der Zählung im Jahr 1991 wurde bewußt nicht nach der Stammeszugehöhrigkeit oder der Religion gefragt, um die Zählung nicht schon wieder scheitern zu lassen. Interessant war z.B. folgendes Detail der Zählungsorganisation: Jeweils eine Frau und ein Mann zählten gemeinsam, um etwaige Kritik von Moslimen gegen eine Befragung der Frauen durch Männer zu entkräften. Während der Zählung gab es übrigens drei Tage arbeitsfrei; alle Nigerianer mußten zu Hause bleiben. Erwähnt sei schließlich das Ergebnis: Hatte man bisher geglaubt, in Nigeria lebten zwischen 100 bis 150 Millionen Menschen, so kam die Zählung überraschender Weise nur auf fast 89 Millionen Nigerianer (siehe FAZ vom 14. April 1992). • Die Probleme Libanons sind wohl jedem bekannt. Es verwundert da nicht, daß seit 1932 keine Volkszählung mehr durchgeführt wurde. Niemand wagt, den ausgeklügelten Konfessions- und TribalProporz durch Befragungen zu hinterfragen. Jede Gruppe legt ihre eigenen Schätzungen vor. Man vermutet, daß die am wenigsten an der Macht beteiligten Schiiten möglicherweise fast ein Drittel der Bevölkerung ausmachen. Man kann solche Vermutungen äußern, aber sie sollten - Gott behüte - nicht durch Zählungen quantifiziert werden (Ulrich Tilgner, Libanon: Die Schatten der Vergangenheit, gesendet im Bayerischen Rundfunk am 5. August 1992). • In Jordanien plant man schon lange eine Volkszählung. Viele Gründe sind für die zeitlichen Verschiebungen verantwortlich. Sie kommt nun vielleicht im Jahr 1993. Absolutes Tabu ist jedoch eine Frage, die nach Jordaniern/Palästinensern unterscheidet. Man schätzt, daß etwa zwei Drittel der jordanischen Bevölkerung Palästinenser sind, es könnten aber auch mehr sein. Offizielle Politik war bisher, die Palästinenser mit einem jordanischen Paß zu versehen. Sie sind auch an der politischen Macht beteiligt, ökonomisch sind sie sowieso dominant. Die Verteilung der Macht zwischen Jordaniern und Palästinensern in Jordanien wird in der näheren Zukunft sehr davon abhängen, wie die Friedensgespräche mit den Nachbarländern ausgehen werden. • Ein schweres soziales und politisches Gewitter gab es im Land des Donnerdrachen, in Bhutan, als die Ergebnisse der letzten Volkszählung von 1988 veröffentlicht wurden: Die alteingesessenen Drupkas sind nach der Öffnung des Landes auf dem besten Wege zu einer Minderheit zu werden. Heute machen die bhutanesischen Buddhisten nur noch 48 % der gesamten Bevölkerung aus, während die nepalesischen Hindus schon 45 % erreicht haben. Die Hindus siedelten sich bevorzugt im klimatisch günstigen Süden an und verdrängten nach und nach die alteingesessene Bevölkerung. Man reagierte schroff: Wer nicht nachweisen konnte, daß er seit 1958 bhutanesischer Staatsbürger ist, wird zum illegalen Einwanderer erklärt und hat das Land zu verlassen. Darauf reagierten die Hindus mit Widerstand oder mit Flucht nach Indien und Nepal. Bhutan stehen schwere Zeiten bevor (siehe Frankfurter Rundschau vom 31. Dezember 1991 sowie Asiaweek vom 11. September und 2. Oktober 1992). • In Mexiko wurde 1990 gezählt. Doch so richtig glauben will die Ergebnisse keiner. Mexiko-City erstickt an seinen Problemen wie Bevölkerungswachstum, Wohnungsnot, Wassermangel, Transportproblemen, Kriminalität, Abfallbeseitigung, Luftverschmutzung. Man vermutet, daß man von offizieller Seite die Bevölkerungszahl 'drücken' will, denn sonst müßte man sich ja um die gewaltigen Probleme kümmern. Ein Artikel in der Frankfurter Rundschau vom 6. August 1990 endet mit dem Satz: "Der Verdrängungsmechanismus funktioniert."

54

Kapitel II: Infrastruktur der Statistik

• In der Türkei wurde am Sonntag, dem 21. Oktober 1990, eine neunstündige Ausgangssperre verhängt, um die Volkszählung durchzuführen. Es wurde am Samstag von langen Warteschlangen vor den Lebensmittelgeschäften und den Videoshops berichtet. Fußballspiele wurden von Sonntag auf Samstag vorverlegt. Erste Ergebnisse der Zählung werden drei (!) Tage später erwartet. Zum ersten Mal wurde bei dieser Zählung darauf verzichtet, z.B. nach der Religion und der Muttersprache zu fragen. Man befürchtete wohl sonst ähnlichen 'Ärger' wie in manchen anderen Ländern. Diese Zählung soll angeblich die letzte mit Ausgangssperre gewesen sein. Bei der nächsten Zählung ist geplant, die Fragebögen per Post zu verschicken. • In Großbritannien lösten Testerhebungen 1979 Diskussionen Uber die Akzeptanz der für 1981 geplanten Volkszählung aus, weil u.a. die Fragen über die ethnische Zugehörigkeit im Fragebogen enthalten sein sollten. Diese Fragen wurden daraufhin 1981 nicht gestellt. 1985/86 sollten wieder Probeerhebungen klären, ob in der für 1990 geplanten Volkszählung u.a. Fragen zur ethnischen Zugehörigkeit in Kombination mit Fragen nach dem Geburtsland und der Sprache gestellt werden sollten. Ich bin nicht darüber informiert, wie die Probeerhebungen ausgingen. Zahlreich sind also die Probleme, die durch eine Volkszählung zwar nicht heraufbeschworen, aber aufbrechen können. Es sind oft Verteilungs- und Machtfragen, religiöse und tribale Konflikte, die durch entsprechende Fragen in der Volkszählung berührt werden. Daß eine Volkszählung jedoch u.a. an Datenschutzfragen scheiterte wie bei uns im Jahr 1983, scheint ein neues Kapitel in der langen Historie von Volkszählungskontroversen zu öffnen. Doch es wird oft vergessen, daß diese Befürchtungen nicht ein spezifisch deutsches Phänomen sind: • In der Schweiz wurde bei der Volkszählung 1980 kritisiert, daß die Erhebungsunterlagen offen an den Zähler zurückgegeben werden sollten. Bei der nächsten Zählung im Jahr 1990 wurde deswegen - wie in der Bundesrepublik 1987 - ermöglicht, daß der Auskunftspflichtige die Bögen in einem verschlossenen Umschlag zurückgeben konnte. • Nach der Volkszählung 1980 in Schweden beauftragte die Regierung die statistischen Behörden Alternativen zur traditionellen Volkszählung zu prüfen. Der dazu gebildete Ausschuß kam zu dem Ergebnis, daß eine registergestützte Zählung nur dann verläßliche Ergebnisse liefern würde, wenn die schon in Schweden vorhandenen Register verbessert und ausgebaut werden würden. Die darauf in der Öffentlichkeit aufgekommene Diskussion kreiste um die Problematik, inwieweit eine Volkszählung auf Registerbasis die Geheimhaltung und den Schutz der Intimsphäre des Bürgers gewährleisten könnte (siehe zu den letzten drei Beispielen: Bernd Störtzbach, Volkszählungen im internationalen Vergleich, Wirtschaft und Statistik 3/1987). Die Problematik von Erhebung und Schutz der Persönlichkeitsrechte wurde also in anderen Ländern früher als in der Bundesrepublik erkannt. Beleuchten wir nun etwas näher, um was es genau bei uns ging: Wie Erwin K. Scheuch schildert (siehe: Wie spricht der Staat mit seinen Bürgern?, hrsg. vom Statistischen Bundesamt, Stuttgart 1989, S.35 ff.), erschien Anfang der 80er Jahre im 'Stern' eine Karte mit geheimen Raketenstandorten. Daraufhin fragten die Grünen die Bundesregierung, ob diese Standorte der Wahrheit entsprachen. Als man auf diese Anfrage keine Auskunft erhielt, leitete man daraus ab: "Uns gibt man keine Auskunft. Dann lassen wir uns auch nicht zählen." Weitere Beispiele finden sich im Anhang dieses Buches (s.S. 246 ff.): "Wir sind bei den Atomkraftwerken nicht gefragt worden, jetzt wollen wir nicht gefragt werden", "Mißbrauch ist nur zu verhindern, wenn die Daten gar nicht erst gesammelt werden!" oder "Reden ist Silber, Schweigen ist Gold." Wie man schon an dieser kleinen Auswahl sieht, sind die Argumente gegen die Volkszählung von unterschiedlichem Niveau. Immerhin gibt es Spuren von Humor wie z.B.: "Nur Schafe lassen sich zählen"

II.3 Ein Eckpfeiler der amtlichen Statistik: Die Volkszählung

55

Oder: "Hinweis! Hiermit wird öffentlich bekanntgegeben, daß ab sofort alle Herrschenden vollständig erfaflt und ihre Tage gezählt werden. Das Volk." Teilweise stieß die Infragestellung staatlicher Datensammlung auf Unverständnis (Scheuch: "Schülerlogik", "Sabotage der Volkszählung"). Es genügte auch nicht, an vermeintlich "höhere Werte" zu appellieren. Heinz Grohmann zitiert Kollegen mit pathetischen Sprüchen, die die Volkszählung als einen "hochbedeutenden sozialen Vorgang" hochstilisieren, wo das "Gefühl einer nationalen Zeremonie" entsteht; andere betonen nach Grohmann die "emotionale und erzieherische Funktion" der Zählung, ein "ritualer Aspekt im Leben einer Nation" (siehe: Wie spricht der Staat mit seinen Bürgern?, hrsg. vom Statistischen Bundesamt, Stuttgart 1989, S. 19 ff.). Zum Glück wurde aber - zunächst nur von wenigen - begriffen, daß man sich mit Fragen des Datenschutzes und dem Schutz der Persönlichkeitsrechte - insbesondere angesichts der stetig steigenden Möglichkeiten der elektronischen Datenverarbeitung - sowie überhaupt mit dem Sinn und Nutzen von Statistiken schon ernsthafter auseinander setzen mußte. Für sehr ernst zu nehmen halte ich Einwände wie z.B. solche: "Glauben Sie denn, daß bürgerfeindliche Entscheidungen durch Daten verhindert werden? Glauben Sie denn, daß Arbeitslosigkeit, Betonsiedlungen ... oder gigantische Straßenbauten durch "bessere Daten" verhindert worden wären?" In einem ausführlicheren Flugblatt war zu lesen (a.a.O., S. 251): "Die Politiker behaupten, es sei wichtig, genaue Daten über den Arbeitsmarkt,... die Altersstruktur der Bevölkerung, ... die Verkehrssituation zu erheben. ... Diese Aufstellung läßt sich beliebig erweitern, z.B. in der Energiepolitik, der Schul-, Krankenhaus- und Wohnungsbaupolitik sowie der Sozialpolitik. Trotz intensiver Nachforschungen bei kommunalen Behörden konnte kein Beispiel dafür genannt werden, daß irgendein Projekt aufgrund fehlender oder veralteter Daten ... nicht geplant oder in Angriff genommen werden konnte." Es ist zwar prinzipiell dem Statistiker nicht vorzuwerfen, wenn seine Daten - so "gut" sie auch sein mögen - nicht genutzt werden, doch läßt dies enorme Aufwendungen für Datensammlungen und Analysen als fragwürdig erscheinen, wenn es sich tatsächlich herausstellen würde, daß "die" Politiker sie kaum, selten oder gar nicht berücksichtigen bzw. wenn "falsche" Politik im Interesse von Minderheiten betrieben wird, obwohl "gute" Daten vorliegen. Er hagelte Schlagworte wie "Schnüffelstaat", "Erfassungsstaat", "Verdatung", "gläserner Mensch". Das Jahr 1984 war damals auch nicht weit, das an den Roman "1984" von George Orwell über einen totalen Überwachungsstaat erinnerte. Die Zahl der Volkszählungsgegner wuchs, je näher der geplante Zahlungstermin im Jahr 1983 rückte. Sehen wir im nächsten Kapitel, wie das Bundesverfassungsgericht über die zunächst für 1983 geplante Volkszählung argumentierte.

Π.3.3 Das Grundrecht auf informationelle Selbstbestimmung und Datenschutz Ende 1983 fällte das Bundesverfassungsgericht das sogenannte 'Volkszählungsurteil'. Es setzte die Volkszählung 1983 aus. In Kurzfassung: Das Hauptargument war, daß der geplante Melderegisterabgleich, d.h. die Aktualisierung der Daten im Einwohnermelderegister durch die Ergebnisse der Volkszählung, nicht zulässig ist. Prinzipiell wurde jedoch die Statistik als notwendige Basis einer rationalen Politik bezeichnet, die nur dort ihre Grenze findet, wo das aus dem Grundrecht der freien Entfaltung der Persönlichkeit abgeleitete Recht auf'informationelle Selbstbestimmung' negativ berührt wird. Im einzelnen stellte das Bundesverfassungsgericht folgendes fest (siehe Entscheidung des Bundesverfassungsgerichts vom 15. Dezember 1983 zum Volkszählungsgesetz 1983 ('Volkszählungsurteil', ):

56

Kapitel II: Infrastruktur der Statistik

"Prüfungsmaßstab ist in erster Linie das durch Art. 2 Abs. 1 in Verbindung mit Art 1 Abs. 1 GG geschützte allgemeine Persönlichkeitsrecht... Die bisherigen Konkretisierungen durch die Rechtsprechung umfaßt... auch die aus dem Gedanken der Selbstbestimmung folgende Befugnis des Einzelnen, grundsätzlich selbst zu entscheiden, wann und innerhalb welcher Grenzen persönliche Lebenssachverhalte offenbart werden... Diese Befugnis bedarf unter den heutigen und künftigen Bedingungen der automatischen Datenverarbeitung in besonderem Maße des Schutzes.. " Im weiteren Verlauf werden die Gefahren der EDV geschildert, um dann den Begriff der informationellen Selbstbestimmung einzuführen. Die folgenden, sehr bemerkenswerten Sätze sollen hier ungekürzt zitiert werden: "Wer nicht mit hinreichender Sicherheit überschauen kann, welche ihn betreffende Information in bestimmten Bereichen seiner sozialen Umwelt bekannt sind, und wer das Wissen möglicher Kommunikationspartner nicht einigermaßen abzuschätzen vermag, kann in seiner Freiheit wesentlich gehemmt werden, aus eigener Selbstbestimmung zu planen oder zu entscheiden. Mit dem Recht auf informationelle Selbstbestimmung wären eine Gesellschaftsordnung und eine diese ermöglichende Rechtsordnung nicht vereinbar, in der Bürger nicht mehr wissen können, wer was wann und bei welcher Gelegenheit über sie weiß. Wer unsicher ist, ob abweichende Verhaltensweisen jederzeit notiert und als Information dauerhaft gespeichert, verwendet oder weitergegeben werden, wird versuchen, nicht durch solche Verhaltensweisen aufzufallen. Wer damit rechnet, daß etwa die Teilnahme an einer Versammlung oder einer Bürgerinitiative behördlich registriert wird und daß ihm dadurch Risiken entstehen können, wird möglicherweise auf eine Ausübung seiner entsprechenden Grundrechte (Art. 8, 9 GG) verzichten. Dies würde nicht nur die individuellen Entfaltungschancen des Einzelnen beeinträchtigen, sondern auch das Gemeinwohl, weil Selbstbestimmung eine elementare Funktionsbedingung eines auf Handlungs- und Mitwirkungsfähigkeit seiner Bürger begründeten freiheitlichen demokratischen Gemeinwesens ist. " Das Recht auf informationelle Selbstbestimmung gilt nicht schrankenlos: "Einschränkungen (des) Rechts auf "informationelle Selbstbestimmung" sind nur im überwiegenden Allgemeininteresse zulässig... Ein Zwang zur Angabe personenbezogener Daten setzt voraus, daß der Gesetzgeber den Verwendungszweck bereichsspezifisch und präzise bestimmt und das die Angaben ftir diesen Zweck geeignet und erforderlich sind. " Dies gilt primär für Verwaltungsaufgaben wie z.B. die Datenerfassung der Einwohnermeldebehörden, der Sozialämter, der Finanzämter, der Krankenkassen usw., wo es gerade auf Individualdaten ankommt. Damit ist aber der Sinn und Zweck der Statistik z.B. in Form einer Volkszählung nur unvollkommen beschrieben. Bei der Statistik kommt es nicht auf Individualdaten, sondern auf anonymisierte und aggregierte Datenmassen an. Dies hat auch das Bundesverfassungsgericht gesehen. Dazu sei wieder auf das betreffende Volkszählungsurteil des Bundesverfassungsgericht verwiesen: "Die Statistik hat erhebliche Bedeutung für eine staatliche Politik, die den Prinzipien und Richtlinien des Grundgesetzes verpflichtet ist. Wenn die ökonomische und soziale Entwicklung nicht als unabänderliches Schicksal hingenommen, sondern als permanente Aufgabe verstanden werden soll, bedarf es einer umfassenden, kontinuierlichen sowie laufend aktualisierten Information über die wirtschaftlichen, ökologischen und sozialen Zusammenhänge. Erst die Kenntnis der relevanten Daten und die Möglichkeit, die durch sie vermittelten Informationen mit Hilfe der Chancen, die eine automatische Datenverarbeitung bietet, für die Statistik zu nutzen, schafft die JUr eine am Sozialstaatsprinzip orientierte staatliche Politik unentbehrliche Handlungsgrundlage. "

II.3 Ein Eckpfeiler der amtlichen Statistik: Die Volkszählung

57

Dies ist das Hohelied auf die Statistik. Es ließe sich allenfalls am Stil herummäkeln, wie schon Richard von Weizsäcker richtig erkannte (aus seiner Ansprache bei seinem Besuch des Statistischen Bundesamtes am 27.10.1986): "Hier wird in einem Deutsch, das sich an Immanuel Kant orientiert, in einem sehr langen, richtig durchkonstruierten kunstreichen Satzbau eine einfache Erkenntnis vermittelt". Nach dieser Stilkritik heißt es in dem Urteil des Bundesverfassungsgerichtes bzgl. des Unterschieds der statistischen Datensammlung zu Daten der allgemeinen Verwaltung weiter: "Bei der Datenerhebung fUr statistische Zwecke kann eine enge und konkrete Zweckbindung der Daten nicht verlangt werden. Es gehört zum Wesen der Statistik, daß die Daten nach ihrer statistischen Aufbereitung flir die verschiedensten, nicht von vornherein bestimmbaren Aufgaben verwendet werden sollen; demgemäß besteht auch ein Bedürfnis nach Vorratsspeicherung... Die Volkszählung muß Mehrzweckerhebung und -Verarbeitung ... sein, wenn der Staat den Entwicklungen der industriellen Gesellschaft nicht unvorbereitet begegnen soll. " Natürlich ist dies nun kein Freibrief für hemmungslose Datensammlung und beliebige Verknüpfung derselben. Dazu wird in dem Urteil gesagt: "Ist die Vielfalt der Verwendungs- und Verknüpfungsmöglichkeiten damit bei der Statistik von der Natur der Sache her nicht im voraus bestimmbar, müssen der Informationserhebung und -Verarbeitung innerhalb des Informationssystems zum Ausgleich entsprechende Schranken gegenüberstehen. Es müssen klar definierte Verarbeitungsvoraussetzungen geschaffen werden, die sicherstellen, daß der Einzelne unter den Bedingungen einer automatischen Erhebung und Verarbeitung der seine Person betreffenden Angaben nicht zum bloßen Informationsobjekt wird. " Dieser Passus hatte u.a. zur Folge, daß die iur 1983 geplante Volkszählung durch eine einstweilige Verfügung ausgesetzt wurde, denn - wie schon erwähnt - war damals noch vorgesehen, daß die statistischen Daten auch zur Aktualisierung der Daten bei den Einwohnermeldeämtern (Melderegisterabgleich) verwendet werden dürften, was jedoch eine für den Einzelnen nicht mehr überschaubare Verquickung von Statistik und Verwaltung bedeutet hätte. Während es für die Verwaltung unabdingbar ist, die Identifizierungsmerkmale wie Name und Anschrift zu kennen, dienen sie in der Statistik nur als temporäres Sortiermerkmal und Hilfsmittel zur Vollzähligkeitskontrolle; danach sind die Identiflzieningsmerkmale für die Statistik nicht mehr nötig und werden deswegen auch gelöscht. Statistik und Verwaltung müssen also klar voneinander getrennt bzw. voneinander abgeschottet werden, wie das Urteil fordert. Dies ist auch für die Integrität der Statistik selbst unverzichtbar: "Für die Funktionsfähigkeit der amtlichen Statistik ist ein möglichst hoher Grad an Genauigkeit und Wahrheitsgehalt der erhobenen Daten notwendig. Dieses Ziel kann nur erreicht werden, wenn bei dem auskunftspflichtigen Bürger das notwendige Vertrauen in die Abschottung seiner flir statistische Zwecke erhobenen Daten geschaffen wird... Kann ... nur durch eine Abschottung der Statistik die Staatsaufgabe "Planung" gewährleistet werden, ist das Prinzip der Geheimhaltung und möglichst frühzeitigen Anonymisierung der Daten nicht nur zum Schutz des Rechts auf informationelle Selbstbestimmung des Einzelnen vom Grundgesetz gefordert, sondern auch für die Statistik selbst konstitutiv. " Natürlich wird auch Kritik an dem Recht auf informationelle Selbstbestimmung geübt. Zum einen wird dieses Recht als übersteigert angesehen, denn die bisherigen Datenschutzmaßnahmen seien schon ausreichend. Auch wird geltend gemacht, daß es bestimmte Daten gibt, die keines besonders verschärften

Kapitel II: Infrastruktur der Statistik

58

Schutzes bedürfen. Peter Bohley z.B. argumentiert in seinem Buch 'Statistik" (MUnchen/Wien 3. Aufl. 1989, S. 732) wie folgt: "Selbstbestimmung kann es nicht geben bezüglich Informationen, wie sie bei Volkszählungen erfaßt •werden, sind diese doch mehr oder weniger öffentliche Güter. Es liegt im Wesen öffentlicher Güter, daß ihr Produzent oder 'Träger' kein Eigentum an ihnen reklamieren und nicht über deren 'Schicksal' bestimmen kann, weil sie ohne sein Zutun diffundieren. 'Informationelle Selbstbestimmung' ist bei allgemein zugänglichen Daten daher ein Widerspruch in sich. " Bohleys denkt wohl an die Praxis in anderen Ländern wie in den skandinavischen oder in Singapur, wo man extra betont, Statistik mit Registern über einheitliche Personennummern kostengünstig und zeitsparend verbinden zu können. Bohley fährt fort: "Will man einen 'Moloch Verwaltung' oder dem 'Leviathan Staat' engere Schranken setzen, kann man dies 'offen' tun, doch sollte man nicht über die Hintertreppe durch Informationsmangel Ineffizienz und Verteuerung des Staats- oder Verwaltungsapparats hervorrufen, also paradoxerweise das Gegenteil von Erstrebenswertem!" Nun, Bohley bewertet also Effizienz- und Kostenargumente offensichtlich höher als die potentiellen Gefahren, die das Bundesverfassungsgericht beschrieben hat. Jedoch angesichts der fast täglich gemeldeten Vorfälle über Speicherung bzw. Nicht-Löschung und Verwendung bzw. Mißbrauch von Daten - allerdings nie aus dem Bereich der amtlichen Statistik -, die die amtlich bestellten Datenschützer auf Trab halten und dicke Berichte schreiben lassen, kann einem manchmal angst und bange werden. Eher zufällig seien aus den in der Presse gemeldeten Vorfälle ein paar herausgegriffen: •

Register aller Finnen gestohlen: Unbekannte haben ein auf Mikrofilm gelagertes Register mit den wichtigsten Daten aller 4,9 Millionen Bürgern Finnlands gestohlen (siehe FAZ vom 26. November 1988).



Ein bißchen Bauchweh: Bei der nordrhein-westfälischen Polizei ist eine Liste mit Angaben über die Trinkgewohnheiten von Autofahrern aufgetaucht (siehe SPIEGEL 6/1992).



Arbeitgeber als Kommissar: Kumpanei statt Datenschutz: Polizei und BASF-Konzern haben jahrelang Hand in Hand gearbeitet (siehe ZEIT vom 10. Februar 1992).



Blaues Wunder: Bürger werden dreist bespitzelt, Parlamentarier mit geheimen Dossiers versorgt: Der Verfassungsschutz legt die neuen Datenschutzgesetze beliebig aus (siehe SPIEGEL 15/1992).



Polizist beschafft Adressen für Kettenbriefe, Datenschutzbeauftragte Leuze spürt Verstöße auf (siehe FAZ vom 19. Dezember 1992).



Das sind Symbole für Sektkelche - unser Kürzel für Alkoholiker / Bericht des Bundesdatenschützers nennt zahlreiche Beispiele für Mißbrauch / Entwicklung zum "gläsernen Bürger" befürchtet (siehe Frankfurter Rundschau vom 19. Mai 1993).

Wie das Verfassungsgericht sagt, gibt es beim heutigen Stand der Informations-Technologie keine unwichtigen oder unsensiblen Informationen mehr: "...insoweit gibt es unter den Bedingungen der automatischen Datenverarbeitung kein 'belangloses' Datum mehr. Wieweit Informationen sensibel sind, kann hiernach nicht allein davon abhängen, ob sie intime Vorgänge betreffen. Vielmehr bedarf es zur Feststellung der persönlichkeitsrechtlichen Bedeutung

II.3 Ein Eckpfeiler der amtlichen Statistik: Die Volkszählung

59

eines Datums der Kenntnis seines Verwendungszusammenhangs: Erst wenn Klarheit darüber besteht, zu welchem Zweck Angaben verlangt werden und welche Verknüpfungs- und Verwendungsmöglichkeiten bestehen, läßt sich die Frage einer zulässigen Beschränkung des Rechts auf informationelle Selbstbestimmung beantworten. " Das läßt einem fordern, nicht nur den Mißbrauch, sondern jegliche Datensammlung zunächst einmal in Frage zu stellen. Statistiken dürften nur durchgeführt werden, wenn der Bürger im Prinzip stets weiß, welche Daten von ihm wann für welchen Zweck - und nur für diesen - verwendet werden. Da halte ich es lieber mit einem Zitat von Spiros Simitis, dem langjährigen hessischen Datenschutzbeauftragten (Frankfurter Allgemeine Magazin 44/1991, S. 17): "Eine demokratische Gesellschaft sollte immer weniger wissen wollen, als sie wissen könnte. " Konkret zur Geheimhaltung der Daten siehe das folgende Kapitel. Das Vertrauen des Bürgers in die Statistik kann zudem durch Aufklärung des Einzelnen gefördert werden. Dazu das übernächste Kapitel.

Π.3.4 Möglichkeiten der Anonymisierung von Daten Die Bereitschaft des Einzelnen, seine Daten für statistische Zwecke zur Verfügung zu stellen, und die Geheimhaltung der Daten sind im Prinzip nicht zu trennen. Die Vollständigkeit und Genauigkeit der Daten dürfte mit dem dem Einzelnen zugesicherten Schutz seiner persönlichen Daten korrelieren. Das Grundrecht auf informationelle Selbstbestimmung wäre ohne Geheimhaltung das Papier nicht wert, auf dem es steht. Die amtliche Statistik durfte Einzeldaten z.B. für wissenschaftliche Zwecke nur dann weiterleiten, wenn Vorsorge getroffen war, daß "sie Auskunftspflichtigen oder Betroffenen nicht mehr zuzuordnen sind." Dieser Grundsatz der absoluten Anonymität war im alten Bundesstatistikgesetz vom 14. März 1980 geregelt (siehe § 11 Abs. 5). Es ergibt sich jedoch nun ein Zielkonflikt zwischen Anonymität der Daten und dem Nutzen für die Wissenschaft: Um Rückschlüsse auf den Einzelnen absolut unmöglich zu machen, muß nämlich im Prinzip das Einzelmaterial so verändert werden, daß sein Informationsgehalt für wissenschaftliche Zwecke unbrauchbar werden kann. Im neuen Bundesstatistikgesetz wurde deswegen konkretisiert, daß Einzelangaben für z.B. wissenschaftliche Zwecke weitergegeben werden dürfen, wenn "nur mit unverhältnismäßig großem Aufwand an Zeit, Kosten und Arbeitskraft" Daten einzelnen Personen zugeordnet werden könnte (siehe § 16 Abs. 6 des Bundesstatistikgesetzes vom 22. Januar 1987). Dies bezeichnet man als faktische Anonymität. Allerdings wurde nicht näher spezifiziert, was im einzelnen dieser UnVerhältnismäßigkeitsgrundsatz bedeutet. Deswegen wurde vom Statistischen Bundesamt sowie der Universität Mannheim/ZUMA ein Forschungsprojekt durchgeführt mit dem Auftrag, die faktische Anonymität bzgl. der Übermittlung von Einzelangaben an die Wissenschaft zu operationalisieren. Die Ergebnisse dieser Bemühungen sind in der Zeitschrift "Wirtschaft und Statistik" im Heft 3/1992 von Helmcke/Knoche zusammengefaßt worden. Ausführlicher geschieht dies in dem vom Statistischen Bundesamt herausgegebenen Band 19 der Schriftenreihe "Forum der Bundesstatistik" mit dem Titel "Die faktische Anonymität von Mikrodaten" (Wiesbaden 1991). Im einzelnen wurden bei diesem Projekt Kriterien für den Begriff der faktischen Anonymität entwickelt und in der Praxis getestet. In Form einer Kosten-Nutzen-Analyse wurden verschiedene Szenarien durchgespielt, in denen ein "Datenangreifer" mit unterschiedlichem Aufwand an Zeit, Kosten und Arbeitskraft, verschiedenen Motiven, verschiedenen Deanonymisierungsstrategien sowie unterschiedlichem Zusatzwissen versucht, Daten zu re-identifizieren.

Kapitel II: Infrastruktur der Statistik

60

Theoretisch ist das Problem einfach zu beschreiben: Ein Datenangreifer, z.B. ein Wissenschaftler versucht rechtswidrig, Datensätze der amtlichen Statistik, die ihm filr Forschungszwecke zur Verfügung gestellt wurden, tatsächlichen Personen zuzuordnen. Er braucht also neben dem anonymisierten Datenfile ADF noch ein sogenanntes Zusatzwissen z.B. in Form eines Identifikations-Datenfiles IDF, der Namen, Anschriften usw. der tatsächlichen Personen enthält. Es müssen nun Merkmale vorhanden sein, die auf beiden Files gleichzeitig und möglichst in identischer Gliederung und Genauigkeit vorhanden sind. Es muß also eine genügend große Schnittmenge da sein, um entscheiden zu können, welche Datensätze aus ADF zu welchen Datensätzen von IDF gehören. Beispiel: Es ist auf ADF nur das Alter und der Beruf gespeichert, auf IDF ist dagegen das Alter und der Name mit Adresse gespeichert. Das in beiden Files gemeinsame Merkmal ist nur das Alter. Findet man gleichaltrige Personen, dann könnte man einen neuen Datenfile kreieren, der nun den Namen, die Adresse, das Alter und den Beruf enthält. Damit wäre die Re-Identifikation gelungen. Doch in der Praxis beginnt das Problem schon bei relativ einfachen Beispielen kompliziert zu werden. Ein paar Problemfälle: •





Die Zuordnung gelingt in unserem einfachen Beispiel nur dann eindeutig, wenn alle Personen ein unterschiedliches Alter haben. Haben auch nur zwei Personen das gleiche Alter, kann man ohne weiteres Zusatzwissen den Doppelgänger nicht von der realen Person unterscheiden. Sind im Extremfall alle Personen gleich alt, dann scheitert natürlich jede Zuordnung. Außerdem muß man wissen, daß alle Personen in IDF auch in ADF enthalten sind. Je größer der Prozentsatz von Personen wird, der nur in einem der beiden Files enthalten ist, um so ungenauer wird die Zuordnung. Anhand des Beispiels bedeutet das, daß man zwar Datensätze auf Grund des gleichen Alters zuordnen kann, aber es kann sich um einen Doppelgänger handeln. Dazu kommt, daß das in beiden Files vorkommende Merkmal des Alters möglicherweise unterschiedlich gegliedert bzw. definiert ist (Altersjahr, Geburtsjahr, genaues Alter mit Jahr, Monat und Tag oder Jahresangabe oder gar Jahrgangsklasse), unterschiedlichen Zeitpunkten angehört oder schlicht unterschiedlich genau ist. Es ergeben sich dabei Inkompatibilitäten bzw. Unscharfen, die das eindeutige Auffinden von identischen Personen immer unwahrscheinlicher bzw. immer teurer werden lassen.

Die Ergebnisse der Simulationsversuche waren ernüchternd für etwaige "Datenangreifer". Es lagen in den meisten Fällen die Kosten der Deanonymisierung sehr hoch, ohne jedoch auch nur annähernd die maximal mögliche Trefferquote zu erzielen. Probleme der Inkompatibilität und Doppelgänger verhinderten höhere Trefferquoten. Die Annahme, daß durch eine Erhöhung der Anzahl von Merkmalen, die in beiden Files enthalten sind, auch die Trefferquote steigt, hat sich nicht gezeigt, denn dieser Effekt wird im allgemeinen konterkariert durch die Unschärfen der zusätzlichen Merkmale. Die große praktische Bedeutung von Unscharfen der Merkmalsausprägungen ist bisher, so stellt der Bericht über das Forschungsprojekt fest, sehr unterschätzt worden, was reziprok bisher zu einer Überschätzung des Re-Identifikationsrisikos führte. Trotz dieser Ergebnisse soll die Gefahr der Deanonymisierung nicht unterschätzt werden. Weniger im Fall von sogenannten Massenfischzügen, sondern vielmehr bei gezielter Suche von Einzelpersonen bzw. in Einzelfischzügen sinkt der Deanonymisierungsaufwand erheblich, und die Trefferquote steigt. Es gibt insbesondere vier Kriterien, die eine Deanonymisierung bei Einzelfischzügen begünstigen:

II.3 Ein Eckpfeiler der amtlichen Statistik: Die Volkszählung

• • • •

61

Eine gesuchte Person gehört einer kleinen, durch ein spezielles Merkmal identifizierbaren Subpopulation an. Der Datenfile enthält relativ detaillierte Regionalangaben. Der Datenangreifer weiß, daß die gesuchte Person im Datenfile enthalten ist. Die Merkmale der Person sind korrekt bzw. genau so im File enthalten, wie es der Datenangreifer erwartet.

Das Forschungsprojekt hat deswegen eine Reihe von Empfehlungen ausgesprochen und an Hand von zwei Erhebungen der amtlichen Statistik, nämlich dem Mikrozensus und der Einkommens- und Verbrauchsstichprobe, konkretisiert. Einige seien hier genannt: Allgemeine Schutzvorkehrungen: • • •

Vertragliche Bindung des Empfängers faktisch anonymer Daten Geheimhaltung der lokalen Umsetzung der Stichprobenpläne Systemfreie Anordnung der Daten

Anonymisierungsmaßnahmen für Mikrozensus a) Grundfile: • • •

Regionalangaben stark vergröbert Möglichst Vergröberung auch aller anderen Variablen Nur Weitergabe von Substichproben von 70 %

b) Regionalfile: • • •

Keine Regionaleinheit mit weniger als 100 000 Personen Vergröberung anderer SchlUsselmerkmale wie Beruf, Wirtschaftszweig, Alter in Abhängigkeit von Besetzungszahlen Nur Substichprobe von mindestens 85 %

Π.3.5 Öffentlichkeitsarbeit Zum Recht auf informationelle Selbstbestimmung gehört untrennbar auch eine Aufklärungspflicht des Staates gegenüber seinen Bürgern über Sinn, Zweck und Ausgestaltung einer geplanten Erhebung. Dies wurde auch konkret in § 16 des Volkszählungsgesetzes 1987 beschrieben: §16 Unterrichtung Die Auskunftspflichtigen sind schriftlich zu unterrichten über: 1. Zweck, Art und Umfang der Erhebung, 2. die Erhebungs- und Hilfsmerkmale..., 3. die statistische Geheimhaltung... Darüber hinaus sollten die mit Erhebungen beauftragten Behörden weitergehende Maßnahmen der Öffentlichkeitsarbeit ergreifen, die im weitesten Sinn dazu dienen, über die Arbeitsweise der amtlichen Statistik sowie deren Zusammenhang mit der politischen Planung und über die Maßnahmen zur Wahrung des Statistikgeheimnisses zu informieren. Im Fall von Großzählungen kann das durchaus bedeuten, relativ aufwendige Aufklärungskampagnen zu veranstalten, die multi-medial über Zwecke der Zählung berichten und mögliche Bedenken versachlichen.

Kapitel II: Infrastruktur der Statistik

62

Bevor die Volkszählung 1987 durchgeführt wurde, hat das Statistische Bundesamt dies im Rahmen einer multi-medialen Informationskampagne versucht. Dabei hat sich z.B. gezeigt, daß die Mehrheit der Bevölkerung durchaus die Notwendigkeit einer Volkszählung einsah, jedoch war vielen nicht bekannt, • • •

wie das Fragenprogramm der Volkszählung im einzelnen aussah, wie der Datenschutz gewährleistet würde und wie überhaupt der Zusammenhang zwischen Volkszählung, Statistik und politischer Planung ist.

Wie Sie sich sicher noch erinnern werden, war diese Kampagne sehr umfangreich. Vielleicht sind Ihnen noch einige Headlines' in Erinnerung geblieben wie z.B. "Bei und sind alle Schotten dicht" "Ihr Bankkonto geht uns nichts an" "Ihr Name steht auf einem anderen Blatt" Parallel zu dieser Informationskampagne wurden regelmäßig Stichproben durchgeführt darüber, wie sich das Meinungsbild in der Bevölkerung Uber die Volkszählung (kurz: VZ) änderte. Einige wichtige Ergebnisse sind in der folgenden Tabelle wiedergegeben, die aus dem Artikel 'Informationskampagne zur Volkszählung 1987' von Sibylle Appel (Wirtschaft und Statistik 9/1987) stammt. Natürlich kann man wie Appel sagt - nicht eine monokausale Beziehung zwischen der Kampagne und dem Meinungsbild der Bevölkerung unterstellen. Trotzdem sind die Ergebnisse sehr aufschlußreich: Meinungsbild in der Bevölkerung vor der Volkszählung (VZ) 1987 Prozentsatz der Personen, die davon gehört meinen, daß die Mehrheit der ihre Auskunft verweigern haben, daß Leute... die VZ sind werden demnächst eine VZ stattfinden soll gegen für 16 1985 Dezember 56 44 18 28 1986 Januar/Februar 58 33 14 19 10 April 80 43 Juni 83 40 22 14 September 84 38 24 14 November 80 36 20 13 Dezember 84 35 26 9 1987 Januar 83 36 23 9 März 91 31 8 32 98 19 56 April 7 98 4 Mai Quelle: Sibylle Appel, Informationskampagne zur Volkszählung 1987, Wirtschaft und Statistik 9/1987. Jahr

Monat

Nach diesen Daten hat sich in den eineinhalb Jahren bis zur Zählung die Akzeptanz bzgl. Volkszählung in der Bevölkerung erhöht. Daraus kann man meiner Meinung nach durchaus auf die Wichtigkeit und Effizienz der öffentlichkeitsarbeit schließen. Oder auch umgekehrt: Wenn man es nicht schafft, die Bevölkerung von der Notwendigkeit einer Zählung zu überzeugen, sollte man die Zählung besser unterlassen. Hilfreich für die Akzeptanz statistischer Zählungen kann neben einer ausreichenden Informationspolitik der statistischen Behörden auch ein elaborierter Berufskodex der Statistiker sein. Ein solcher wird in Kurzfassung dargestellt.

II.4 Benifskodex fllr Statistiker

63

Π.4 Berufskodex für Statistiker Π.4.1 Die Prinzipien im Überblick Das Internationale Statistische Institut (ISI) mit Sitz in Den Haag ist eines der wichtigsten internationalen Diskussionsforen für Statistiker aller Fachrichtungen. Mitte der 80er Jahre hat das Institut aus Anlaß seines 100jährigen Bestehens einen Berufskodex fUr Statistiker ausgearbeitet. Seine Grundzüge sind in einem Artikel in der Zeitschrift "Wirtschaft und Statistik", Heft 8/1986 dargestellt worden. Darauf und auf den im Statistischen Bundesamt in Deutsch vorliegenden Text der ISI wird im folgenden Bezug genommen. Die berufsethischen Prinzipien lassen sich - je nach Zielgruppe - in vier Abschnitte einteilen: 1. Verpflichtungen gegenüber der Gesellschaft • Berücksichtigung unterschiedlicher Interessen • Erweiterung des Anwendungsbereichs der Statistik •

Streben nach Objektivität

2. Verpflichtungen gegenüber Geld- und Auftrag- bzw. Arbeitgebern • Klarstellung der Rechte und Pflichten • Neutrale Bewertung alternativer Methoden und Verfahren • Keine Präjudizierung der Ergebnisse • Geheimhaltung vertraulicher Informationen 3. Verpflichtungen gegenüber Kollegen / Berufsstand • Erhaltung und Stärkung des öffentlichen Vertrauens in die Statistik • Offenlegung und Überprüfung von Methoden und Erkenntnissen • Vermittlung berufsethischer Grundsätze 4. Verpflichtungen gegenüber dem Auskunftsgebenden • Vermeidung unangemessenen Eindringens in die Privatsphäre • Gewinnung der Auskunftsbereitschaft durch Information • Schutz der Interessen der Auskunftsgebenden • Sicherung der Vertraulichkeit statistischer Unterlagen • Verhinderung einer Aufdeckung von identitätsbezogenen Angaben Der Kodex versteht sich nicht als Sammlung von veibindlichen Regeln, sondern als Dokumentation von weithin anerkannten Grundsätzen der Statistik. Auch sollen diejenigen Faktoren aufgezeigt werden, die der Anwendung dieser Grundsätze entgegenstehen könnten. Bei Zielkonflikten zwischen verschiedenen Prinzipien versucht der Kodex zwar keine Lösungen anzubieten oder den Prinzipien eine bestimmte Priorität einzuräumen, doch kann er ein wertvolles Hilfsmittel sein bei der Entscheidung. Er will auf keinen Fall das Verantwortungsbewußtsein des einzelnen Statistikers ersetzen. Natürlich gibt es nicht "den" Statistiker. Es gibt Statistiker in der amtlichen Statistik und in der Forschung. Es gibt den reinen Wissenschaftler, den reinen Empiriker oder jede denkbare Abstufung dazwischen. Und dann gibt es jeweils wieder unterschiedliche Spezialisierungen und Qualifikationsstufen von Statistikern. Bei dieser Variationsbreite ist der Kodex für den einzelnen Statistiker von unterschiedlicher

64

Kapitel II: Infrastruktur der Statistik

subjektiver und objektiver Relevanz. Es wird deswegen in der Präambel des Kodex davon ausgegangen, daß er dem Statistiker zumindest die Möglichkeit bieten soll, sich bei seinen ethischen Urteilen und Entscheidungen stärker an gemeinsamen Wertmaßstäben und Erfahrungen zu orientieren. Im folgenden werden die oben genannten vier Abschnitte der Prinzipien im Einzelnen ausführlicher dargestellt.

Π.4.2 Verpflichtungen gegenüber der Gesellschaft Die Erhebung von Daten und deren Veröffentlichung ist notwendig, weil ein "breiter Zugang zu gut fundierten Informationen für die Gesellschaft von Vorteil" ist. Dies deckt sich mit den Grundsätzen, die das Bundesverfassungsgericht in seiner Entscheidung über die Volkszählung getroffen hat (siehe BVerfGE 65, 1 vom 15. Dezember 1983): "Das Grundgesetz hat... die Spannung Individuum - Gemeinschaft im Sinne der Gemeinschaftsbezogenheit und Gemeinschaftsgebundenheit der Person entschieden... Grundsätzlich muß daher der Einzelne Einschränkungen seines Rechts auf informationelle Selbstbestimmung im überwiegenden Allgemeininteresse hinnehmen." Das Vertrauen der Öffentlichkeit in statistische Ergebnisse hängt auch von ihrer glaubwürdigen Darstellung ab. An dieser Nahtstelle zur Öffentlichkeit ist es entscheidend, ob nicht nur die Aussagemöglichkeiten, sondern vor allem die Aussagegrenzen der Ergebnisse offen dargestellt werden. Ansonsten ist die Gefahr einer Über- oder Unterschätzung sowohl des Aussagegehaltes als auch der Generalisierbarkeit der Daten gegeben. Trägt der Statistiker dem nicht Rechnung, so kann er - trotz gewissenhaften methodischen und technischen Inputs - bei der Präsentation der Daten erheblichen Schaden anrichten. Das ganze folgende Kapitel wird dem Versuch gewidmet sein, nicht nur die Aussagemöglichkeiten, sondern gerade auch die Aussagegrenzen der Empirie zu zeigen. Der Sinn dieses Kapitels wird nicht sein, die Möglichkeiten der Statistik in Bausch und Bogen zu verdammen - dann hätte ja dieses Buch dort enden können, ich würde meinen Beruf aufgeben, um auf Samoa oder anderswo meinen frustrierten vorzeitigen Ruhestand zu genießen. Das Kapitel will nüchtern die Grenzen der Statistik aufzeigen und nur auf dieser Basis kann man ernsthafte Statistik betreiben, sei es in der Industrie, an der Universität oder in einer statistischen Behörde. Trotzdem ist es nicht auszuschließen, daß Daten von den unterschiedlichsten Gruppen verschieden ausgelegt, wenn nicht falsch interpretiert oder gar mißbraucht werden. Dieses Risiko wird gesehen, doch der potentielle Nutzen der Daten wird höher eingeschätzt als das Risiko. Gleichwohl sollte sich der Statistiker stets dieses Risikos bewußt sein und entsprechende Vorkehrungen bei der Planung, Durchführung und Veröffentlichung von Erhebungen treffen, um Fehldeutungen oder Mißbrauch der Daten zu minimieren. Ausdrücklich wird gesagt, daß es keine Information gibt, die nicht irgend einem Individuum oder einer Gruppe nutzen bzw. schaden könnte. Es ist gerade der Sinn der Statistik, die Basis politischer Maßnahmen zu bilden. Etwaige Beeinträchtigungen Einzelner müssen hingenommen werden, wenn insgesamt für die Gesellschaft ein Nutzen damit verbunden ist. Ein von der ISI genanntes Beispiel sind Daten über regionale Kriminalitätsraten, die dazu führen könnten, daß Polizeiaktivitäten in Bezirken mit hoher Kriminalität verstärkt werden zu Lasten von solchen Regionen mit niedriger Kriminalität. Gefordert ist der Statistiker, "die vorhandenen Möglichkeiten zu nutzen, den Anwendungsbereich statistischer Untersuchungen zu erweitern und ihre Ergebnisse einem möglichst breiten Kreis zugute kommen zu lassen." Allerdings wird gleichzeitig zugestanden, daß für die unterschiedlichen Arbeitsbereiche der Statistiker unterschiedliche Freiheitsgrade bei der Verwirklichung dieses Grundsatzes gelten. Die Chancen der Statistiker z.B. im öffentlichen Dienst oder in Handel und Industrie scheinen tendenziell geringer zu sein als die der Statistiker im universitären Bereich. Die Möglichkeit der Einflußnahme und

II.4 Benifskodex für Statistiker

65

Dominanz von Arbeitgebern oder Kunden bei den Entscheidungen über Umfang, Schwerpunkt, Durchführung und Publikation statistischer Untersuchungen wird gesehen. Trotz dieser Restriktionen soll der Statistiker nie aufgeben, nach Objektivität zu streben: "Obwohl Statistiker bei ihrer Arbeit in das gesellschaftliche Wertesystem eingebunden sind, sollten sie ihre berufliche Integrität ohne Furcht oder Zugeständnisse wahren." Dies halte ich fUr einen der wichtigsten, aber auch schwierigsten Grundsätze, dessen Durchsetzung in der Praxis durchaus problematisch sein kann, zumal dann, wenn der Ethos des Statistikers mit den Anforderungen des Arbeitgebers oder Kunden schwer zu vereinbaren ist. Die Grenzen sind allerdings nicht klar zu ziehen, denn es wird eingestanden, daß die "Wissenschaft ... niemals völlig objektiv sein (kann); auch die Statistik bildet da keine Ausnahme." Dieser Grundsatz ist so wichtig, daß er auch im Gesetz über die Statistik für Bundeszwecke (Bundesstatistikgesetz - BStatG) vom 22. Januar 1987 genannt wird. Dort heißt es im § 1: Für die Bundesstatistik "gelten die Grundsätze der Neutralität, Objektivität und wissenschaftlichen Unabhängigkeit." Die Integrität und damit Akzeptanz jeder Statistik hängt entscheidend davon ab, diese Grundsätze einzuhalten. Nur so kann es gelingen, "gesellschaftliche, wirtschaftliche und ökologische Zusammenhänge" aufzuschlüsseln als Basis "fìir eine am Sozialstaatsprinzip ausgerichtete Politik", wie das Bundesstatistikgesetz es im selben Paragraphen fordert. Negativ formuliert es das Bundesverfassungsgericht, denn "die Gefährdung der amtlichen Statistik (läuft) darauf hinaus, eine wichtige Voraussetzung sozialstaatlicher Politik in Frage zu stellen" (siehe BVerfGE 65,1). Ähnliche Grundsätze sind auch in dem bereits 1954 von den Vereinten Nationen veröffentlichten und 1980 überarbeiteten "Handbook of Statistical Organization" enthalten.

Π.4.3 Verpflichtungen gegenüber Geld- und Auftrag- bzw. Arbeitgebern Gegenüber Geld- und Auftrags- bzw. Arbeitgebern gelten eine Reihe von Verpflichtungen wie z.B. •



• •

Statistiker sollten im voraus mit ihrem Arbeit- oder Geldgeber ihre jeweiligen Verpflichtungen klären; insbesondere sollten sie den Arbeit- oder Geldgeber auf die entsprechenden Abschnitte des für sie gültigen berufsethischen Kodex verweisen. Statistiker sollten, bevor sie mit einer Untersuchung beginnen, die verfugbaren Methoden und Verfahren sorgfältig prüfen und dem Geld- und Arbeitgeber eine unparteiische Beurteilung der jeweiligen Vor- und Nachteile vorlegen. Statistiker sollten keine vertraglichen Regelungen akzeptieren, die von einem bestimmten Ergebnis einer vorgesehenen statistischen Untersuchung abhängig gemacht werden. Statistiker sollten vertrauliche Informationen geheimhalten; dies gilt allerdings nicht für die verwandten statistischen Methoden und Verfahren, mit deren Hilfe die zur Veröffentlichung freigegebenen Daten gewonnen wurden.

Diese Regelungen dürften primär für privatwirtschaftlich geführte Institutionen wie Markt- und Meinungsforschungsinstitute oder freiberuflich tätige Statistiker gelten, während der abhängig beschäftigte bzw. im öffentlichen Dienst beschäftigte Statistiker in geringerem Maß Einflußmöglichkeiten auf die vertragliche Gestaltung seiner Arbeitsinhalte haben dürfte, zumal gesetzliche Vorschriften bestimmte Erhebungen sogar zwingend vorschreiben bzw. Geheimhaltungsvorschriften den Umfang und die Struktur der veröffentlichten Informationen regeln. Andererseits ist der anscheinend größere Freiheitsgrad der privatwirtschaftlich organisierten Statistik eingeschränkt durch finanzielle Restriktionen oder durch die relativ unsichere berufliche Stellung des freiberuflich tätigen Statistikers. Insbesondere beim freiberuflich tätigen Statistiker sind Interessenkollisionen möglich, wenn der Auftraggeber im voraus bestimmte Ergebnisse der statistischen Untersuchung erwartet.

Kapitel II: Infrastruktur der Statistik

66

Würde sich der Auftraggeber durchsetzten hinsichtlich der Manipulation von Methode, Erhebung und/oder Ergebnissen, wäre nicht nur der Grundsatz der Objektivität verletzt, sondern damit wäre die Integrität der Statistik und deren Akzeptanz durch die Öffentlichkeit in Frage gestellt.

Π.4.4 Verpflichtungen gegenüber Kollegen Im einzelnen sollten Statistiker die folgenden Verpflichtungen gegenüber ihren Fachkollegen einhalten: •



Da das Ansehen der Statistiker im wesentlichen vom Vertrauen der Öffentlichkeit abhängig ist, sollte jeder Statistiker versuchen, durch sein Verhalten und durch seine Arbeit dieses Vertrauen zu stärken. Jeder Statistiker sollte einen regelmäßigen Erfahrungsaustausch mit seinen Kollegen pflegen und insbesondere offen hinsichtlich spezifischer Probleme und Erkenntnisse, z.B. methodischer oder verfahrenstechnischer Art, unterrichten.

Das Ansehen der Statistik hängt nicht nur von dem Ansehen jedes einzelnen Statistikers ab, sondern auch vom Ansehen des Berufsstandes insgesamt. Nicht nur um letzteres zu erhalten und zu stärken sollte der einzelne Statistiker gehalten sein, ein faires Verhältnis mit seinen Kollegen nach den gerade genannten Kriterien zu pflegen. Würde sich dieser Grundsatz allerdings nicht mit dem der Objektivität vereinbaren lassen, dann würde ich der Objektivität klar den Vorzug geben. Als Kommunikationsforen für Statistiker aller Fachrichtungen ist auf internationaler Ebene das International Statistical Institute (ISI) zu nennen. Auf nationaler Ebene gibt es z.B. die Deutsche Statistische Gesellschaft.

II.4.5 Verpflichtungen gegenüber dem Auskunftsgebenden Gerade im Bereich der amtlichen Statistik werden viele Erhebungen mit Auskunftspflicht durchgeführt. Dies bedeutet jedoch nicht, daß der Statistiker keine Verpflichtungen gegenüber dem Auskunftspflichtigen bei der Planung, Durchführung und Publikation statistischer Erhebungen hätte. Dies gilt genauso für die anderen nicht-amtlichen Bereiche der Statistik, wo noch hinzu kommt, daß der Statistiker die Mitwirkung der Auskunft gebenden Personen erst noch gewinnen muß. Im einzelnen sollten folgende Grundsätze berücksichtigt werden: •





Statistiker sollten sich bewußt sein, daß ihre Arbeit möglicherweise einen Eingriff in die Privatsphäre anderer darstellt. Sie sollten unangemessene Eingriffe vermeiden und möglichst schonende und angemessene Verfahren einsetzen. Sowohl bei freiwilligen als auch bei auskunftspflichtigen Erhebungen sollten die Auskunftsgebenden umfassend Uber Sinn und Zweck der Erhebung informiert werden, um deren Einwilligung (bei freiwilligen Erhebungen) bzw. deren Bereitschaft (bei auskunftspflichtigen Erhebungen) zu gewinnen. Grundsätzlich sollten statistische Einzelangaben vertraulich behandelt werden; das schließt ein, daß weitergegebene oder veröffentlichte Daten keinen RUckschluß auf Individuen zulassen dürfen.

Der Statistiker soll stets auf den schon erwähnten Grundsatz der Verhältnismäßigkeit zu achten. So sollten z.B. der Fragenumfang, ihr Detaillierungsgrad, der Stichprobenumfang, das Frageprogramm anderer Statistiken usw. daraufhin abgestimmt werden, daß den Auskunftspersonen ein möglichst geringer Aufwand abverlangt wird.

II.4 Berufskodex für Statistiker

67

Grundsätzlich sollte zwischen Statistiker und Auskunftgebendem eine sachliche Beziehung auf der Grundlage gegenseitigen Respekts herrschen. Es ist nicht zu erwarten, daß Auskunftspersonen in der Mehrzahl mit Begeisterung an Erhebungen teilnehmen. Der schon erwähnte Konflikt zwischen den Interessen des Individuums und denen der Gesellschaft läßt sich grundsätzlich nicht auflösen, er läßt sich jedoch z.B. durch sachliche Informationen mildern. Und nur so kann sichergestellt werden, daß vollständige und richtige Angaben gemacht werden.

68

Kapitel II: Infrastruktur der Statistik

Anhane 1: Digitale Prosa oder das Geheimnis von Rosamona Alle Jahre wieder beglückt uns ein voluminöses Buch, vollgepackt mit aktualisierter digitaler Prosa. Schnöde wirken da vergleichbare Werke wie das Kurs- oder Telefonbuch, nicht nur weil ihnen das graphische Element fehlt. Auch digitale Kunstwerke der bildnerischen Avantgarde wie On Kawara oder Hanne Datboven, allesamt 1991 zu bestaunen im Frankfurter Museum für Moderne Kunst, bleiben da im Anspruch zurück, denn ihnen fehlt der greifbare und nachvollziehbare Lebensbezug. Seit einiger Zeit kommt uns dieses Werk sogar zweibändig ins Haus, so daß man schon literarische Vergleiche mit Faust I und II oder gar mit Winnetou suchen muß, wobei letzter (noch) unerreicht durch seine dreibändige Konzeption ist. Die Rede ist vom Statistischen Jahibuch, das nun in seiner Ausgabe von 1992 vorliegt. Band I handelt vom Innersten des (noch nicht ganz) vereinten Deutschland, und in Band II gibt man Einblicke in das Ausland. Gehören Sie auch zu denjenigen, die es nicht abwarten können, ein Buch auf dem schnellsten Weg zu vereinnahmen, indem man erst den Anfang und dann den Schluß liest? Atemberaubend die Präsentation der Extreme gleich auf den ersten Seiten: Es ist da von den "äußersten Grenzpunkten" (Seite 12) und von den "Ortshöhenlagen" (12) die Rede. Zwischen Emden und Höchenschwand in Baden-Württemberg wird sich also die Dramatik des ersten Bandes entfalten, genug Raum, um über 1000 Seiten zu füllen, denn immerhin liegen mehr als 1000 Höhenmeter zwischen der mittleren Höhenlage des jeweiligen Ortskerns über Normal-Null. Die letzten Seiten dagegen enden mit einem deutlichen sozialen Touch, denn dort werden die Gewerkschaften behandelt. Also kein Ausklang in sozialer Harmonie? Haben wir hier ein weiteres Werk der sozialkritischen Art vor uns liegen? Genügend Zündstoff wird auch durch die Lektüre des Inhaltsverzeichnisses angedeutet: Geburt und Tod, Heirat und Scheidung, Arbeitswelt, Einkommen und Steuern, Kriminalität klingen dort an, welch ein heroischer Spannungsbogen, als wär's ein Werk von Hauptmann! Ein umfangreicher Index läßt die Feinstruktur des Werkes erahnen, denn dort findet man alleine nur unter dem Buchstaben "A" Begriffe wie Abgeurteilte, Abhängige, Abtreibungen, Aktien, Arbeitslose, Arbcitsunfölle, Asylbewerber, Atomenergie, Ausländer, Aussperrungen, Autos usw., die alle auf akute Probleme des Individuums und auf seine Eingebundenheit in den gesellschaftlichen Kontext hinweisen. Nach dieser reißerischen Aufmachung konnte ich das Buch nicht einfach weglegen, ich mußte weiterlesen, ich wurde förmlich hineingesogen in seine eigentümliche, phantastische Welt, die sich einer virtuosen Kombination von unterschiedlichen Stilmitteln wie Zahlen, Buchstaben und Linien bedient, bis hinein in ihre letzten Verästelungen in Fußnoten, Verweisen und Erläuterungen. Hier nun, nach dieser schlauchenden Odyssee, meine Eindrücke ungeschminkt: In der Tat verspricht das Buch nicht zu viel, jeder Aspekt zwischen Wiege und Bahre wird angesprochen. Die deutsche Bevölkerungszahl liegt jetzt bei fast 80 Mill. (Band II, S. 20). Auch sollte man die fast 31 Mill. Schweine nicht vergessen sowie die 106 Mill. Hühner in deutschen Landen (II, 255). Überrascht mußte ich zur Kenntnis nehmen, daß Deutschland von Italien, Japan, Spanien oder Griechenland bezüglich der Welt niedrigster Geburtenziffer abgehängt wurde (II, 222). Aber dafür sind wir bei der durchschnittlichen Haushaltsgröße von nur 2,3 noch vorne bzw. hinten (II, 231). Auf jede 3. bestehende Ehe kommt eine geschiedene, welche Dramen müssen sich hinter jedem Einzelfall abspielen. Ich finde mich auch wieder als Nummer in der Scheidungsstatistik, aber als eine bisher ganz und gar nicht unglückliche (22). Geschickt dosiert gibt es Erfreuliches zu berichten wie z.B. die Angaben zur Lebensqualität: Der meisten Sommertage erfreut sich Karlsruhe, im Jahresdurchschnitt ist es in Freiburg am wärmsten, allerdings regnet es in Oberstdorf am meisten (18).

Anhang 1: Digitale Prosa oder das Geheimnis von Rosamona

69

Deutschland tendiert dahin, ein moslemisches Land zu werden, denn der Islam ist schon die drittwichtigste Religion bei uns, bzw. sogar die zweitwichtigste, wenn man Katholiken und Protestanten zusammenzählt. Man kann diesem Buch aber nicht vorwerfen, es sei religiös, die Frage "Wo ist Gott?" wird gottlob nicht gestellt. Doch gibt es versteckte Hinweise, die mich stutzen lassen: So ist auf S. 67 unschwer abzulesen, daß in den letzten 30 Jahren der Anteil der "Gottlosen" stark zunahm; Trost scheint der Autor uns spenden zu wollen mit der Präsentation der nächsten Seite, wo die Bevölkerung nach Art des Krankenversicherungsschutzes aufgelistet ist. So irren zwar viele ohne Gottvertrauen durchs Leben, aber so gut wie niemand mehr muß dies tun, ohne krankenversichert zu sein. Aus pädagogischer Sicht ist wertvoll, daß dieses Buch jugendfrei ist, Schweinereien (außer den oben schon erwähnten 31 Mill.) werden nicht geboten. Die Zeiten des Sexismus scheinen ein Ende zu haben, tauchen doch jetzt auch in diesem amtlichen Werk Begriffe wie "Ausländer(-innen)" (76) auf. Auch die Feinschmecker werden bedient, die aufschlußreiche Tabelle "Bestockte Rebfläche nach Sorten" (180) verrät, daß es besonders mit dem Burgunder und Trollinger aufwärts geht, während der MüllerThurgau stagniert; der Silvaner scheint out zu sein. Unstet ist das Gedeihen des westdeutschen Spargel, Wirsing und Kohlrabi - trotz neudeutscher Küche (174/5). Dramatisch wird es bei den schaurigen Geschichten Uber Unfälle. So sind doch immerhin 3200 Fahrradfahrer mit Alkoholeinfluß in Unfälle verwickelt gewesen (368). Verstört haben die 353 "Fußgänger", die "beim Spielen auf oder neben der Fahrbahn" zu Schaden kamen!? Höhepunkte der sprachlichen Gestaltungskraft sind Schöpfungen wie "Sonstige Nichtwohngebäude" aller "genehmigten Nichtwohngebäude" nach "städtebaulichen Festsetzungen" in "Sondergebieten" (259) (die übrigens 445 betragen). Dazu wird als Erläuterung (251) mitgeliefert, daß "Nichtwohngebäude" solche sind, die "überwiegend für Nichtwohnzwecke" bestimmt sind; dazu gehören u.a. "nichtlandwirtschaftliche Betriebsgebäude" sowie "sonstige Nichtwohngebäude". Alles klar? Mein poetischer Favorit war jedoch ein Ausdruck, der an wagnerianisches Niveau heranreichte: "Bewohnte Wohneinheiten in Wohngebäuden nach Wohnfläche je Wohneinheit", zuletzt dargeboten in der Ausgabe von 1989. Syntax und Sprachgefühl sind schier nicht zu übertreffen, doch gerade dieses Juwel fiel einem technokratischen Konstrukt zum Opfer. Seit 1991 heißt es nun: "Bestand an Wohngebäuden und Wohnungen", das sich lediglich in einer schlichten Fußnote wie folgt fortsetzt: "Ohne Wohnheime und Wohnungen in Wohnheimen." (258) Welch ein Ni veau-Verlust! Heute muß ich mich stattdessen zufriedengeben mit der Erläuterung von Luftfahrzeugen (334), denn die umfassen den Gesamtbestand (der einfache Bestand reicht wohl nicht) an Luftfahrzeugen, wie er der beim Luftfahrt-Bundesamt geführten Luftfahrzeugrolle über die dort eingetragenen Luftfahrzeuge zu entnehmen ist. Nein, ich will mich überhaupt nicht an der üblichen Kritik am Statistischen Jahrbuch beteiligen. Ich bemängele mitnichten die manchmal holzhammerartige Begriffsbildung wie Nettoreproduktionsrate o.ä. oder daß angeblich brandaktuelle Themen wie Verteilung des Produktivkapitals oder Nord-Süd-Konflikt nicht angesprochen werden. Immerhin finden sich z.B. Umweltdaten in diesem Buch. Es braucht eben alles seine Zeit. Doch man sollte dieses wertvolle Buch nicht verschlimmbessern. So vermisse ich seit neuestem das Thema "Rosen" (wie überhaupt die Liebe zu kurz kommt). Holunderbüsche wie in Kleists Werken habe ich schon immer vergeblich in diesem Werk gesucht. Früher konnte ich immerhin noch in Melancholie ob der abnehmenden Produktion von Rosen sowohl auf dem Freiland wie auch in Unterglasanlagen verfallen. Doch seit 1990 ist dieser Nachweis der Rosen ersatzlos gestrichen. Nur noch ein Relikt von dem Rosenbestand in Baumschulen, darunter Containerpflanzen, konnte die Streichung überleben (179) nebst dem Er-

70

Kapitel II: Infrastruktur der Statistik

zeuger-Preisindex für Treibrosen (612). Dies halte ich für eine substantielle Verarmung! Ganz zu schweigen von dem Verschwinden der Topfpflanzen wie Usambaraveilchen, Priemein und Erika (zuletzt 1989) Zum Schluß: Rosamona! Ich möchte Ihnen eben nicht alles verraten. Kaufen Sie sich dieses Buch doch selbst und lesen Sie auf Seite 170, Fußnote 4, nach.

Anhang 2: An der statistischen Front: Interviewer und Auskunftspflichtiger

71

Anhang 2: An der statistischen Front: Interviewer und Auskunftspflichtiger Keine Statistik ohne Erhebung. Man kann mit Hilfe von Postkarten oder Telefon Erhebungen durchführen. Dies ist aber alles nichts im Vergleich zu einem hautnahen Interview von Angesicht zu Angesicht zwischen Interviewer und dem Befragten bzw. "Auskunftspflichtigen". Dies ist die statistische Front, hier entscheidet sich, wie gefragt wird, wie es beim Befragten verstanden wird, was er antwortet, wie es der Interviewer versteht, wie es in dem Fragebogen eingetragen wird. Eine Erhebung kann hier scheitern oder zu neuen aufregenden Erkenntnissen führen. Im allgemeinen ist aber der Interviewer-Alltag sehr prosaisch. Es interessiert sich ja auch niemand dafür, was hier tagtäglich passiert. Es gibt deswegen auch keine mir bekannten literarischen Belege darüber, wie sich der Befragte fühlt, wie und was er denkt, was er von der ganzen Sache hält, in die er oft wenn es keine Vollzählung ist - kraft Zufall hineingeraten ist. Ganz zu schweigen vom Interviewer. Es gibt zwar zentimeterdicke Anleitungen für die Interviewer, wie sie sich in einem Interview zu verhalten haben. Aber damit hat es sich. Es gibt allerdings folgende Stelle: "Es ist nicht das ewige Treppauf-Treppab, sondern der ständige Kampf gegen die eigene Trägheit, die Peinlichkeit, die Versuchung, gleich bei der ersten Etage aufzugeben, nach der ersten Tür, die sich nicht öffnet. Auch nicht aufzugeben nach der zweiten Tür, hinter der, nach dem Läuten, ein Schlurfen zu hören ist, eine Frage: Wer issen da?... Die Treppen knarren. Klingeln, ein vor Mißtrauen erstarrtes Gesicht, Tür zu, gegenüber klingeln, der Spion verdunkelt sich, die Tür wird nicht geöffnet, weiter, klingeln, die Tür geht auf, ohne Kette, ohne Riegel, endlich-: wollen Se nich reinkommen, inne gute Stube? Eines dieser staubfreien, aufpolierten Wohnzimmer, in denen die Kissen mit Kniff wie durch einen Karateschlag betäubt auf den Sofas liegen. Setzen Se sich doch. Auch das kostet Kraft - wollt grad nen Kaffee machen -, sitzen zu bleiben, auch das kostet Kraft, zuzuhören.... Was die Leute alles auskotzen, zögernd, stotternd oder wasserfallartig, all die Krankheitsbilder, die Hautflechten, den Pilzbefall... Und all die anderen alltäglichen Ereignisse, entlaufene Hunde, entflogene Wellensittiche, vergessene Handtaschen, verlorene Geldbörsen, Raubüberfälle, Selbstmorde.. " Diese Literaturstelle bezieht sich allerdings nicht auf einen amtlichen Interviewer, sondern auf einen "Drücker", der Zeitungsabonnements verkauft. Dementsprechend ist der Charakter dieses Auszugs eher von Tristesse im alltäglichen Treppauf-Treppab und den knarrenden Dielen hinter den Eingangstüren geprägt. Die Stelle stammt von Uwe Timm aus seinem Buch "Kopfjäger - Bericht aus dem Inneren des Landes" Um die statistische Front selbst kennenzulernen, habe ich mich freiwillig für verschiedene Erhebungen als Interviewer gemeldet. Oftmals - so muß ich bekennen - habe ich mich wie der von Timm beschriebene Drücker gefühlt, obwohl ich in offizieller Mission und mit amtlichem Ausweis kam und obwohl der Befragte - in den meisten Fällen jedenfalls - der Auskunftspflicht unterlag. Diese Tristesse spürte ich zur Zeit der Diskussionen um Pro und Kontra "Volkszählung" Mitte der 80er Jahre. Es war oft alles andere als ein Vergnügen, als amtlicher Interviewer einem verunsicherten Befragten gegenüber zu sitzen. Da gab es nur wenige Ausnahmen etwa der Art: "Ach, da sind Sie ja endlichl Haben Sie sich endlich hierher getraut? Kommen Sie, trinken Sie erst 'mal wasl" Lassen Sie mich drei Episoden aus meinem Interviewer-Dasein erzählen. Sie basieren alle auf persönlichen Erfahrungen, aber auf Grund einer gewissen literarischen Freiheit und besonders auf Grund des Datenschutzes ist heute absolut kein Rückschluß mehr auf konkrete Personen möglich.

72

Kapitel II: Infrastruktur der Statistik

Es begann zunächst einmal mit einem Paukenschlag: Ich übernahm einen Bezirk, der schon im Voijahr von einem Kollegen bearbeitet worden war. Bei der ersten Begehung des Bezirks fand ich alle Häuser, die in dem Bezirk sein maßten. Mir fiel allerdings eine lange Mauer auf, hinter der aber anscheinend nichts als Bäume war. Bei näherer Inspektion fand ich eine versteckte Tür, die gerade noch in meinem Bezirk lag. Also klingelte ich, aber es kam keine Antwort. Beim nächsten Besuch klingelte ich wieder, es meldete sich jemand, ich sagte mein übliches Sprüchlein: "Guten Tag, ich bin der soundso, ich komme vom.., es handelt sich um die Erhebung xy usw." Mir wurde allerdings beschieden, es sei niemand da und hier gebe man keine Auskünfte. Nun denn, so was kann ja vorkommen, abwimmeln gehört zum Geschäft. Wenn niemand öffnet bzw. wenn die zu befragende Person nicht angetroffen wird, dann gibt es Vordrucke, die man als Interviewer ausfüllt und in den Briefkasten steckt. So weit, so gut. Am nächsten Tag kam ich wie gewohnt in mein Büro, doch schon von weitem hörte ich nervend mein Telefon klingeln. Ich nehme den Hörer ab und muß mir folgendes anhören: "Hier ist der Personenschutz von Herrn Dr. soundso, Sie waren gestern an der Tür soundso, Sie haben einen Zettel eingeworfen, es handelt sich um die Erhebung xy, wir bitten Sie von weiteren Besuchen abzusehen usw." Mein bescheidener Versuch, etwas über Sinn und Zweck der Erhebung zu sagen, war fruchtlos, denn die Verbindung war schon unterbrochen. Kurz darauf kam mein Chef angeschossen, und das für die Erhebung zuständige Statistische Landesamt rief auch gleich an. Alles war in Aufregung. Zum Glück hatte ich alle Schritte der Kontaktaufnahme korrekt ausgeführt, doch trotzdem sah ich mich schon auf irgendwelchen Videokassetten, beäugt von irgendwelchen Personenschützern, womöglich stand ich kurz davor, in die Klauen der Rasterfahndung zu geraten. Ich Uberlegte, ob ich in letzter Zeit alle Strafzettel oder Rechnungen ordnungsgemäß bezahlt und ob ich mich auch sonst ordentlich benommen hätte, was ja notfalls durchaus strafmildernd eingebracht werden könnte... Nun, so weit kam es nicht. Die Quintessenz war, daß ich diesen "Fall" ab sofort los war, das Statistische Landesamt werde sich selbst darum kümmern. Ich weiß nicht, wie mit diesem Fall weiter verfahren wurde. Einmal befragte ich den Zuständigen im Landesamt, aber der sagte nur: "Ach so, dieser Fall...", aber weiter ließ er sich keine Details entlocken. Dieses Erlebnis saß mir noch lange in den Knochen. In einem anderen Bezirk, der von weniger betuchten Leuten bewohnt wird, hatte ich ein im Ansatz ähnliches Erlebnis. Ich klingelte ahnungslos an einem hohen Hoftor, worauf mir - so schien es - ein Rudel kläffender Untiere antwortete. Dann meldete sich eine unfreundliche Stimme mit dem dezenten Hinweis, daß ich mich schleunigst von dannen machen solle. Er wußte schon, was ich wollte, denn er hatte mich wohl schon beobachtet, als ich bei seinen Nachbarn gewesen war. Nun, ich warf cool meinen Zettel in den Briefkasten und kündigte mich für den nächsten Tag wieder an. Das Spiel ging noch zwei weitere Male so. Beim dritten erfolglosen Versuch gibt man routinegemäß den Fall an das Statistische Landesamt ab, was ich mit Freuden tat. Im nächsten Jahr erwartete ich dasselbe Schauspiel. Doch diesmal wurde mir die Tür geöffnet, man trat mir zwar nicht freundlich, aber auch nicht feindlich gegenüber. Das Rudel Wölfe entpuppte sich als fette Minis, die außer einer akustischen Bedrohung sonst ganz harmlos waren. Der Fragebogen wurde anstandslos ausgefüllt - wenn man von einigen deftigen Kommentaren zur Notwendigkeit dieser und jener Frage absieht: "Das wißt Ihr doch schon, das habe ich doch dem Finanzamt schon gesagt, und das da geht Euch doch überhaupt nichts an". Hinweise darauf, daß dies Statistik sei und der Geheimhaltung unterliege und mit dem Finanzamt oder anderen Ämtern nichts zu tun habe, stoßen auf taube Ohren - das ist immerhin besser, als große Diskussionen durchstehen zu müssen. Es könnte auch sein, daß dieser Herr so relativ moderat geworden ist, weil im Jahr zuvor das Statistische Landesamt ihm die Notwendigkeit der Erhebung verdeutlicht hat. Sachliche Aufklärung wirkt oft Wunder. Es ist mir schon oft gelungen, in geduldigen Gesprächen den "auskunftspflichtigen" Bürger seine Scheu oder gar Angst vor einer Erhebung zu nehmen, was sich dann

Anhang 2: An der statistischen Front: Interviewer und Auskunftspflichtiger

73

an Äußerungen wie den folgenden zeigt: "Ach, Sie wollen ja gar nicht das (oder jenes) wissen? - War das schon alles? - War ja gar nicht so schlimml". Im dritten und letzten Jahr werde ich von der ganzen Nachbarschaft und so auch von diesem Herrn freundlich begrüßt, als wäre ich der sympathische Herr Kaiser von der ... - naja, Sie wissen schon, von dieser Versicherung. Hier und da bekomme ich meinen Kaffee, bei einer Familie gibts meine Lieblingsspeise: Quetschekuche mit Sahne, und dabei werde ich über den neuesten Stand der Familiensaga aufgeklärt: "Wisse Se noch, die Oma, die is im letzte Winder gestorbe, und die Dorle, gell, die Kleine mit dene scheene Locke, die hat geheiratet und kriegt auch schon was Kleines". Der besagte Herr steht da nicht zurück und spendiert tatsächlich eine Flasche Bier. Zum Glück gibts für Interviewer noch keine Promillegrenze. Die letzte Geschichte ist eigentlich eine alltägliche, aber für mich ist sie eine besondere. Es geht um eine alte Dame. Bei meinem ersten Besuch hörte ich das schon von Timm so treffend beschriebene Schlurfen hinter der Tür. Nach dem dritten Klingeln schließlich hieß es, sie könne jetzt nicht aufmachen, sie mache generell nicht auf bei Fremden. Ich sagte: "Macht nichts", hängte mein übliches Sprüchlein Uber den Zweck meines Besuches an und ich werde morgen noch einmal vorbeischauen. Am nächsten Tag dasselbe Spiel. Schließlich ging doch die Tür auf, gerade so weit, wie es der Riegel zuließ: Sie mache generell nicht auf, hieß es wieder, aber immerhin haben wir uns einmal gesehen. Ihr ginge es auch nicht gut, ich solle doch morgen noch einmal kommen. O.K., kein Problem. Am nächsten Tag macht sie schließlich auf und fllhrt mich in ihr kleines Zimmer. Sie mache ja eigentlich prinzipiell nicht auf, sagte sie wieder, aber bei mir sei das eine Ausnahme. In solchen Fällen beschleicht mich manchmal das bedrückende Gefühl, wie relativ leicht es doch ist - abgesehen von den dreimaligen Versuchen -, gerade bei älteren Menschen in die Wohnung zu kommen, denn bis jetzt hatte ich noch keine Gelegenheit, meinen Ausweis zu zeigen. Ich erklärte noch einmal den Zweck meines Besuches, wir füllten den Bogen aus und ich sagte: "Also, dann bis zum nächsten Jahr." Sie antwortete: "Ach, das ist ja noch lange bis dahin, wer weiß, ob ich dann noch bin." - "Natürlich werden wir uns nächstes Jahr Wiedersehen," sagte ich wie automatisch, was sollte ich sonst sagen. Das nächste Jahr klingele ich wieder. Ich höre das Schlurfen: "Wer ist denn da?" Ich sage meinen üblichen Spruch, in der Annahme, daß sie mich schon längst vergessen hätte. "Ach, sie sind das wieder, der Herr von der Statistik, kommen sie rein." Diesmal blieb ich länger, es gab Kaffee und ich schaute mir alle Bilder von den Enkeln an. "Sie wissen ja, mir geht's nicht gut, meine Tochter kommt manchmal und schaut nach mir." Das klang, als komme sie nie. Ich ging schließlich, "Also, dann bis nächstes Jährt" usw., die selben Sätze wie letztes Mal, aber diesmal meinte ich es ehrlich. Im dritten Jahr klingelte ich wieder, das Schlurfen, "Wer ist denn da?" Sie macht sofort auf. Diesmal gibt es sogar Kuchen zum Kaffee. Sie hätte sich darauf gefreut, daß ich wiederkomme. Ich bleibe noch etwas länger als letztes Mal. Bei der Verabschiedung dieselben Worte wie in den letzten Jahren. Monate später habe ich gehört, daß sie erst in ein Heim gekommen und dann gestorben sei.

Kapitel III "Den Stein aufheben, unter dem das Unwesen brütet" - Grenzen der Statistik "Wer will was Lebendigs erkennen und beschreiben, Sucht erst den Geist heraus zu treiben. Dann hat er die Teile in seiner Hand, Fehlt, leider! nur das geistige Band. " (J. W. Goethe, Fausti) Inhaltsverzeichnis III. 1 Was sind "gute" Daten? Annäherungen an ein komplexes Thema III. 2 Operationalisierungsprobleme 111.2.1 Grundsätzliches 111.2.2 Beispiel des "Magischen Vierecks" III.2.2 Beispiel der Arbeitslosenquote 111.3 Mögliche Fehler in der Statistik 111.3.1 Einteilung der Fehler 111.3.2 Zufalls-/Stichproben-'Fehler' 111.3.3 Beschreibung systematischer Fehler in der Demographie 111.3.3.1 Überblick 111.3.3.2 Beispiel 1: Altersangaben 111.3.3.3 Beispiel 2: Auf der Suche nach den 'unsichtbaren' Frauen 111.3.3.4 Beispiel 3: Quiz: Welche Berufscodierung paßt zum Beruf des Statistikers? 111.3.3.5 Beispiel 4: Gründe für die Unterschätzung des Einkommens in Interviews 111.3.4 Diverse unernste Szenarien 111.3.4.1 Ein höllisches Szenario: Im Inferno der Fehler 111.3.4.2 Ein exotisches Szenario: Von Raubtieren und Giftschlangen 111.3.4.3 Ein alltägliches Szenario: Augenzeugen lügen nicht 111.4 Möglichkeiten und Grenzen der empirischen Sozialforschung 111.4.1 Zur Abgrenzung der empirischen Sozialforschung 111.4.2 Kritischer Rationalismus: Karl R. Popper ΠΙ.4.3 Frankfurter Schule: Theodor W. Adorno 111.4.4 Die Positivisten 111.4.5 Ein Beispiel 111.4.6 Die Unlogik der Forschung Literarischer Anhang Fälschung 1 Fälschung II

78 79 79 79 83 87 87 89 90 90 92 95 97 99 101 101 101 101 102 102 103 105 108 109 115 117 117 118

78

Kapitel III: Orenzen der Statistik

III.l Was sind "gute" Daten? Annäherungen an ein komplexes Thema "Die Qualität eines Volkswirts erkennt man daran, ob er in der Lage ist, auch aus einerfalschen Statistik die richtigen Schlüsse zu ziehen. " (Helmut Schlesinger, Präsident der Bundesbank) "Wer irgend einem bunt zusammengewürfelten Expertenkreis eine beliebige Frage stellt - etwa: ist Formaldehyd giftig? -, erhält von, sagen wir, fünf Wissenschaftlern fünfzehn verschiedene Antworten, alle mit ja-aber, einerseits-andererseits garniert - wenn die Befragten gut sind; wenn nicht, zwei oder drei scheineindeutige. " (Ulrich Beck, Gegengifte - Die organisierte Unverantwortlichkeit) In einer gründlichen "Untersuchung zur Methode und Genauigkeit der Volkszählung 1970" des Statistischen Bundesamtes (Fachserie 1, Volkszählung vom 27. Mai 1970, Heft 26) findet sich die folgende Passage: "Keine statistisch ermittelte Zahl stimmt absolut genau mit dem "wahren Wert" überein. Jede Statistik kann daher nur beurteilt werden, wenn einerseits die Methoden, die ihr zugrunde liegen, und andererseits die Genauigkeit ihrer Ergebnisse bekannt oder hinreichend genau abschätzbar sind. Die Gewinnung statistischer Daten durch Großzählungen verlangt die Mitwirkung einer sehr großen Zahl von Personen, sei es als Befragte, als Zähler oder als Bearbeiter der erhobenen Angaben. Dabei ist es unvermeidbar, daß die Qualität der Ergebnisse durch unvorhergesehene bzw. nur zum Teil beeinflußbare Unzulänglichkeiten beeinträchtigt wird. Der gewöhnliche Bürger ist kein homo statisticus; er wird auch bei gutem Willen die eine oder andere Frage ungenau oder gar nicht beantworten. Andererseits ist der Zähler kein Kriminalbeamter, der nicht ruht, bis er mit fachmännischem Scharfsinn den letzten Haushalt... herausgeholt hat." Es gibt noch extremere Positionen, die vermuten, daß es je nach Merkmal unter Umständen "den" wahren Wert nicht gibt, weil das Messen nicht im Labor an einem toten Objekt geschieht, sondern an Personen: Eine Befragung ist ein sozialer Akt, bei dem es darauf ankommt, wie die Personen agieren, welche Rollen sie spielen, wie Worte, Definitionen, Gesten interpretiert werden und wie ihre unterschiedlichen Ziele und Interessen aufeinander einwirken. Dies spielt sogar eine Rolle bei einfachen Fragen wie z.B. nach dem Alter. Das Alter gehört allerdings in den Industrieländern zu den Fragen, die noch am genauesten beantwortet werden - zu diesem Thema gibt es an späterer Stelle noch einiges zu sagen. Bei anderen Fragen jedoch wie z.B. nach dem Beruf, Einkommen oder ganz besonders bei Meinungsfragen hängt die Antwortvariabilität u.a. davon ab, wie der Interviewer und der Befragte miteinander agieren. Was "gute" Daten sind, kann kaum einer beantworten. Es gibt mehrere Kriterien, die bei der Beurteilung eine Rolle spielen wie z.B. Genauigkeit, Konsistenz, Vollständigkeit, Aktualität, Nützlichkeit bzw. Relevanz. Im folgenden Bild wird versucht, einige Kriterien im Prozefi der Datengewinnung, Datenverarbeitung und Datenpräsentation darzustellen, um ein Gespür dafür zu entwickeln, wo der "graue Bereich" bzw. die Lüge beginnt:

ΙΠ.2 Operational isierungsprobleme Stufe Planung Datengewinnung Datenverarbeitung Datenpräsentation Benutzer der Daten

o.k. o.k. o.k. o.k. richtig informiert

Daten-"handling" ungenau lückenhaft unkorrekt fehlerhaft unvollständig/falsch informiert

79

undurchsichtig gefälscht manipuliert betrügerisch mit Absicht hinter's Licht geführt

li

li

li

"gute" Statistik

"graue Zone" (je nach Fehlergrad einzuordnen zwischen brauchbarer bzw. nutzloser Statistik)

Fälschung/Betrug/Lüge

Man muß wohl davon ausgehen, daß es nach diesem Schema kaum die "gute" Statistik gibt, denn auf jeder Stufe des Daten-"handlings" werden sich Fehler einschleichen. Die "graue Zone" dürfte in der Statistik - wie bei jedem Menschenwerk - ziemlich groß sein. Sobald jedoch absichtlich in das Daten"handling" eingegriffen wird, um die Ergebnisse zu beeinflussen, befinden wir uns eher in der rechten Spalte. Diese Darstellung ist wohl noch etwas grob, um genauere Antworten auf die Frage nach den "guten" Daten zu bekommen. Schauen wir uns deswegen im folgenden näher an, welche Probleme es bei der Frage der Genauigkeit statistischer Daten gibt. Dazu wird zunächst von den sogenannten Operationalisierungsproblemen ausgegangen. Dann wird auf das weite Feld der statistischen Fehler eingegangen, um schließlich die Möglichkeiten und Grenzen der empirischen Sozialforschung näher zu untersuchen.

ΙΠ.2 Qperationalisierungsprobleme ΙΠ. 2.1 Grundsätzliches Wenn ein Statistiker mit der Arbeit beginnt, muß er geklärt haben, was er überhaupt quantifizieren will. Will er - wie am Anfang des letzten Kapitels schon einmal angesprochen - Bäume zählen, so muß er wissen, was mit einem Baum gemeint ist, wie man also von einem mehr oder weniger abstrakten Begriff zu einer operationalisieibaren bzw. beobachtbaren Kategorie kommt. Es muß also gesagt werden, ob man nur Laubbäume meint oder auch Nadelbäume eingeschlossen sein sollen, ob man jeden Baum unabhängig von seiner Größe zählen soll usw. Nicht eingegangen werden soll hier auf die sogenannten Adäquationsprobleme, die z.B. von Max Weber diskutiert wurden. Zu den Unterschieden siehe z.B. Hans Peter Litz in seinem Aufsatz 'Statistische Adäquation und Idealtypus' in der Zeitschrift Allgemeines Statistisches Archiv 1990. Am Beispiel des sogenannten 'magischen Vierecks' und am Beispiel der Aibeitslosenquote soll nun weiter über Operationalisierungsprobleme gesprochen werden.

ΙΠ.2.2 Beispiel des "Magischen Vierecks" Im Gesetz zur Förderung der Stabilität und des Wachstums der Wirtschaft vom 8. Juni 1967 heißt es im § 1, wirtschaftspolitische Maßnahmen seien so zu treffen, daß sie im Rahmen der marktwirtschaftlichen Ordnung gleichzeitig zu Stabilität des Preisniveaus, zu einem hohen Beschäftigungsstand und außenwirtschaftlichem Gleichgewicht bei stetigem und angemessenem Wirtschaftswachstum beitragen." Das klingt gut, nur: was ist ein 'stetiges und angemessenes Wirtschaftswachstum', was ein

80

Kapitel III: Grenzen der Statistik

'außenwirtschaftliches Gleichgewicht', was ist die 'Stabilität des Preisniveaus' oder was ist ein 'hoher Beschäftigungsstand'? Nun, immerhin wissen Sie jetzt, was das magische Viereck ist. Das Wort 'magisch' soll andeuten, daß diese vier Zielsetzungen nur schwer, geschweige denn gleichzeitig zu erreichen sind. Doch damit sind die vier Zielsetzungen im statistischen Sinn noch nicht ausreichend definiert. Das Gesetz über die Bildung eines Sachverständigenrates zur Begutachtung der gesamtwirtschaftlichen Entwicklung vom 14. August 1963 bringt da auch nicht viel mehr Klarheit, denn dort heißt es im § 2, der Sachverständigenrat soll "untersuchen, wie im Rahmen der marktwirtschaftlichen Ordnung gleichzeitig Stabilität des Preisniveaus, hoher Beschäftigungsstand und außenwirtschaftliches Gleichgewicht bei stetigem und angemessenem Wachstum gewährleistet werden können." Nun, versuchen wir einmal eine Definition anhand der folgenden Übersichten, wobei vorausgeschickt werden soll, daß dies nur einer von vielen anderen Definitionsversuchen ist.

III.2 Operationalisieningsprobleme

Zielgröße Theoretischer Hintergrund

Üblicher Indikator Beschreibung des Indikators Kritik an der ausschließlichen Verwendung dieses Indikators

Zielgröße Theoretischer Hintergrund

üblicher Indikator Beschreibung des Indikators Kritik an der ausschließlichen Verwendung dieses Indikators

hoher Beschäftigungsstand (Vollbeschäftigung) Grundsätzlich sollte auf allen Faktormärkten Vollbeschäftigung herrschen, d.h. die angebotenen Faktormengen sollten auch im Produktionsprozeß eingesetzt werden. Wegen des besonderen sozialpolitischen Charakters des Faktors Arbeit wird ihm bei der Messung des Beschäftigungsstandes Priorität eingeräumt. Arbeitslosenquote Anteil der registrierten Arbeitslosen zur Anzahl der abhängigen Erwerbspersonen Teilgruppen bleiben unberücksichtigt: im Zähler: arbeitswillige Erweibslose, die sich nicht beim Arbeitsamt registriert haben im Nenner: Selbständige, Mithelfende Familienangehörige (dafür sind die unkündbaren Beamten und alle anderen Beschäftigten im öffentlichen Dienst enthalten) er differenziert nicht nach: Problemgruppen (Ältere, Jugendliche, Frauen, Behinderte usw.) Dauer der Arbeitslosigkeit Struktur und Intensität der gesuchten Arbeit ergänzende Faktoren des Arbeitsmarktes bleiben unberücksichtigt: Kurzarbeit, Überstunden und Offene Stellen langfristige Entwicklung z.B. der Frauenerwerbstätigkeit

Stabilität des Preisniveaus Langanhaltende, aber insb. fluktuierende Inflationsraten erschweren die Tranzparenz von ökonomischen Entwicklungen und verzerren damit die realen und Einkommensstrukturen, besonders dann, wenn Güter- und Faktorpreise unterschiedlich schnell auf Preisniveauänderungen reagieren können. Es kommt stets auf die Konstanz des Preisniveaus, also des Durchschnitts aller Preise, und nicht auf die Konstanz von Einzelpreisen an. Preisindex des privaten Verbrauchs Durchschnitt der Entwicklung aller Preise eines für mehrere Jahre konstanten Warenkorbs, der den durchschnittlichen Konsum von Gütern und Dienstleistungen eines durchschnittlichen Haushalts repräsentiert. Er stellt primär auf den privaten Verbrauch ab. Andere volkswirtschaftliche Preisentwicklungen wie z.B. für Importe, Investitionen, Staatsverbrauch gehen nur indirekt, mit Zeitverzögerung oder gar nicht ein.

81

82

Zielgröße Theoretischer Hintergrund

Üblicher Indikator Beschreibung des Indikators Kritik an der ausschließlichen Verwendung dieses Indikators

Zielgröße Theoretischer Hintergrund

Üblicher Indikator Beschreibung des Indikators Kritik an der ausschließlichen Verwendung dieses Indikators

Kapitel ΠΙ: Grenzen der Statistik

Außenwirtschaftliches Gleichgewicht Ungleichgewichte bzgl. Import- und Export- bzw. Kapital strömen schaffen nicht nur Überschüsse bzw. Defizite zwischen den Ländern, sondern bewirken auch mittelfristig ungleiche Beschäftigungs- und Einkommenseffekte. Beispiel eines simplen 2-Länder-Falles: Ein Überschußland hat tendenziell hohe Beschäftigung und hohe Einnahmen vom Ausland, Inflation droht; das Defizitland leidet tendenziell unter Arbeitslosigkeit und Geldmangel, Deflation droht. Tendenziell maßten die Wechselkurse angepaßt werden oder die Faktoren mttßten aber die Landesgrenzen hinweg mobil sein. Auf Dauer sind solche Ungleichgewichte für alle Beteiligten von Nachteil. Saldo der Handelsbilanz Der Handelsbilanzsaldo ergibt sich aus der Differenz von Export und Import. Die Handelsbilanz ist nur eine Teilbilanz der Zahlungsbilanz. Zusammen mit der Dienstleistungsbilanz (einschl. Reiseverkehr) ergibt sie den Außenbeitrag. Dieser zusammen mit den Übertragungen (einschl. Gastaibeiterüberweisungen, Nettobeitrag zum EG-Haushalt und Entwicklungshilfe) ergeben die Leistungsbilanz, die wiederum zusammen mit der Kapitalbilanz und der Devisenbilanz die Zahlungsbilanz bilden. Grundsätzlich ist die Zahlungsbilanz immer ausgeglichen. Entscheidend ist die Entwicklung der einzelnen Komponenten. Beispielsweise hatte die Bundesrepublik bisher fast immer eine positive Handelsbilanz gehabt; die Überschüsse werden jedoch teilweise benötigt, um negative Bilanzen im Reiseverkehr und bei den Übertragungen zu finanzieren. Unausgeglichene Teilbilanzen können je nach Situation tolerieibar sein. Es kommt auch darauf an, wie andere Politikbereiche wie z.B. bzgl. Handelsbedingungen (Zölle, Kontingente usw.), Kapitalverkehr oder Wechselkurs ausgestaltet sind. angemessenes Wirtschaftswachstum Steigen die Leistungen einer Volkswirtschaft, dann bedeutet dies eine höhere Produktion bzw. ein größeres Waren- und Dienstleistungsangebot und gleichzeitig auch höhere Einkommen, was allgemein als Wohlstandssteigerung interpretiert wird. Jährliche Steigerung des realen Bruttosozialprodukts Das Bruttosozialprodukt ist das umfassende Maß aller primär marktmäßig produzierten und beweiteten Güter und Dienstleistungen innerhalb eines bestimmten Zeitraums. Das Bruttosozialprodukt erfaßt z.B. nicht soziale bzw. Haushaltstätigkeiten. Negative Wachstumseffekte wie z.B. Umweltverschmutzung gehen nicht bzw. deren Bekämpfung geht positiv als Dienstleistung in das Sozialprodukt ein. Soziale Verteilung des Wohlstands und seines Zuwachses wird nicht berücksichtigt. Sinnvoll wäre die Ergänzung um das reale Bruttosozialprodukts pro Kopf der Bevölkerung. Mittelfristig sollte man in Betracht ziehen, parallel zum Konzept des Bruttosozialprodukts z.B. ökologische Indikatoren zu entwickeln; langfristig sollte man versuchen, die Messung des Bruttosozialprodukts selbst im oben angedeuteten Sinn zu erweitern.

III.2 Operational isienjngsproblemc

83

Dieses Beispiel war nur eins von vielen, um die grundsätzliche Problematik des Operationalisierungsproblems zu zeigen. Im folgenden Kapitel wird aus dem magischen Viereck eine Komponente herausgegriffen, um die Problematik zu vertiefen.

ΙΠ.2.2 Beispiel der Arbeitslosenquote "JederflinfteArbeitslose ist gemäß den neuesten Zahlen in der Verwaltung oder im Büro beschäftigt. Häufig handelt es sich dabei um ältere kaufmännische Angestellte. " (Interessant! Aus der Weltwoche, zitiert nach dem Hohl-SPIEGEL 6/1992) Vielleicht meinen Sie nun, daß die Definition eines hohen Beschäftigungsstandes ein relativ komplexes Problem sei. Nun, dann greifen wir uns sein Gegenteil, nämlich die Arbeitslosenzahlen heraus. Wer arbeitslos ist, sollte doch leicht zu definieren sein. Weit gefehlt. Es fängt schon einmal mit einem Begriffswirrwarr an. Nach dem Internationalen Arbeitsamt (siehe Hußmanns/Mehran/Verma, Surveys of economically active population, employment, unemployment and underemployment: An ILO manual on concepts and methods, Genf 1990) ist ein Erwerbsloser deijenige, der in einer bestimmten Referenzperiode (normalerweise eine bestimmte Woche, für die die Daten der Arbeitsmarktstatistik erhoben werden) • • •

ohne Arbeit ist und gegenwärtig für Arbeit verfügbar wäre und der Arbeit sucht.

Ein solche Person darf keiner noch so geringen Erweibstätigkeit nachgehen, denn dann wäre sie nach der strengen ILO-Definition der Erwerbstätigkeit (mindestens eine Stunde pro Referenzperiode) automatisch ein Erwerbstätiger, obwohl diese Person sich subjektiv vielleicht als Erwerbsloser sieht. Im Mikrozensus, einer jährlichen 1 %-Stichprobe der Bevölkerung und des Arbeitsmarktes, werden diese Erwerbslosen nachgewiesen. Allerdings weicht die Definition der Erwerbslosen im Mikrozensus von der international üblichen ILO-Definition ab, da nicht unterschieden wird, ob ein Erwerbsloser gegenwärtig für eine Arbeit verfügbar wäre. Die Erwerbslosen im Mikrozensus sind also etwas überhöht. Auf diesem Mikrozensus basiert auch die sogenannte EG-Arbeitskräftestichprobe, die sich methodisch vom Mikrozensus vor allem dadurch unterscheidet, daß die Erwerbslosen nach der ILO-Definition nachgewiesen werden, also ohne die Personen, die nicht für eine Erwerbstätigkeit zur Verfügung stehen. Neben den sogenannten Labour Force Surveys als Datenquelle für Erwerbslosenzahlen gibt es auch Daten aus den Verwaltungsunterlagen der nationalen Arbeitsämtern. Dabei handelt es sich um die Personen, die sich beim Arbeitsamt arbeitslos gemeldet haben. Diese nennt man im deutschen Sprachgebrauch (registrierte) Arbeitslose und nicht Erwerbslose. Wie verschiedenen in europäischen Ländern der Arbeitslose definiert ist, zeigt die folgende Obersicht:

84

Kapitel III: Grenzen der Statistik

Arbeitslosendefinitionen nach ausgewählten Merkmalen in ausgewählten EG-Ländern Merkmal (Auswahl)

Bundesrepublik Deutschland

Frankreich

Italien

Niederlande

I. Merkmale der gesuchten Tätigkeit X X 1. Arbeitsuche X X 2. Art der gesuchten Tätigkeit - Vollzeit X X X X X X - Teilzeit X 20 18 - Mindestwochenstunden X X X - Ausbildung im Betrieb 3. Dauer der gesuchten Tätigkeit X -dauerhaft X X X X X - vorübergehend II. Merkmale der Person 1. Alter des Arbeitslosen 16 15 15/16 - Mindestalter 15 64 - Höchstalter 64 X X X 2. Neueintritte ins Erwerbsleben X (Jugendliche) 3. Wiedereintritt nach beruflicher X X X X Inaktivität X X X X 4. Als vermittlungsfähig angesehene Behinderte X 5. Ferienkräfte (Schüler/Studenten) 6. Ruhegehaltsempfänger X X X 7. Empfänger sonstiger Renten X X Quelle: Gekürzte Darstellung einer Tabelle aus: Statistisches Amt der Europäischen Gemeinschaften, Definition der eingeschriebenen Arbeitslosen, Luxemburg 1985, S. 62. In der Bundesrepublik und in den Niederlanden fällt zum Beispiel auf, daß nur solche in der Arbeitslosenstatistik geführt werden, die mindestens 18 bzw. 20 Stunden pro Woche arbeiten wollen. Indirekt ist der Tabelle auch zu entnehmen, daß diese Arbeitslosen zur Zeit durchaus einer Tätigkeit nachgehen können. Damit gibt es zumindest diese beiden Unterschiede zwischen den Erwerbslosen und den Arbeitslosen, wobei die Mindeststundenzahl die Anzahl der Arbeitslosen tendenziell vermindert und wobei die einer Beschäftigung nachgehenden Arbeitslosen die Anzahl der Arbeitslosen tendenziell erhöhen. Wer mehr über Erwerbslosen- und Arbeitslosenstatistik, insbesondere über die methodischen Unterschiede in der Erfassung der Daten, wissen möchte, sei auf die Aufsätze von Hans-Ludwig Mayer verwiesen, so z.B. 'Entwicklung und Struktur der Erwerbslosigkeit - Ergebnisse des Mikrozensus und der EGArbeitskräftestichprobe' in Wirtschaft und Statistik 1/1990. Damit kennen wir jetzt die beiden wichtigsten Konzepte bzgl. Personen, die auf der Suche nach einer Beschäftigung sind. Welches Konzept man aussucht, hängt davon ab, was man mit den Daten untersuchen will. Folgende Untersuchungsaspekte wären denkbar:

III.2 Operationalisieningsprobleme

• • • • • • • •

85

individuelle psychosoziale Betroffenheit durch Arbeitslosigkeit familiäre Betroffenheit durch Arbeitslosigkeit gesamtgesellschaftlicher Wohlfahrtsverlust durch Arbeitslosigkeit Konsequenzen für die Lohnpolitik Konsequenzen für die Ausbildungspolitik Isolierung von Problemgnippen Finanzbedarf und Einnahmeausfall der Arbeitslosenversicherung Arbeitsanfall für Arbeitsverwaltung

In den ersten beiden Fällen würde ich zu den Daten aus den Labour Force Samples (bzw. Mikrozensen) raten, denn dort kann man in Kombination mit anderen dort erhobenen Merkmalen diese Aspekte der Arbeitslosigkeit besonders gut untersuchen. Die letzten beiden Aspekte sollten dagegen selbstredend nur mit dem Datenmaterial der Arbeitsämter belegt werden. Die anderen Aspekte könnten von beiden Datenquellen gleichermaßen bedient werden. Wenden wir uns nun dem Nenner der Arbeitslosenquote zu. Dort steht normalerweise die Anzahl der Erwerbspersonen bzw. die Anzahl der abhängigen Erweibspersonen (also ohne die Selbständigen). Die Arbeitslosen bzw. Erwerbslosen sind also nicht nur im Zähler, sondern auch im Nenner enthalten. Für die Erweibspersonen gibt es nun als Datenquelle den Mikrozensus bzw. die darauf basierende sogenannte EG-Arbeitskräftestichprobe bzw. die Volkswirtschaftlichen Gesamtrechnungen (VGR), die auf der Grundlage aller verfügbaren Datenquellen jahresdurchschnittliche Erwerbspersonen berechnet. Es sind eine Vielzahl von Kombinationen von Zähler und Nenner denkbar. Viele dieser Möglichkeiten werden auch tatsächlich berechnet und - je nach den Zwecken - von verschiedenen Institutionen veröffentlicht. Folgende Übersicht versucht nun, die wichtigsten Arbeitslosenquoten darzustellen und fur ein Jahr zu quantifizieren. In dieser Übersicht gibt es sechs verschiedene Ergebnisse fur die Arbeitslosenquote für das Jahr 1984. Die Spannweite der Ergebnisse reicht von 6,8 % bis 9,3 %. Man kann die verschiedenen Ergebnisse im wesentlichen zu drei Gruppen zusammenfassen: Zum einen die, bei denen im Nenner die Erwerbspersonen stehen, und zum anderen die, bei denen im Nenner die abhängigen Erwerbspersonen stehen. Natürlich sind bei der letzten Gruppe die Arbeitslosenquoten etwas höher, weil der Nenner kleiner ist als bei der anderen Gruppe. Die dritte Gruppe bildet die letzte Quote der folgenden Tabelle, bei der die Erwerbslosen der EG-Arbeitskräftestichprobe im Zähler stehen. Natürlich ist das die niedrigste Quote aller drei Gruppen (Grund: s.o.). Die Unterschiede lassen sich erklären und sind durch unterschiedliche Interessen bei der Nachweisung von Arbeitslosenquoten bedingt. Ich selber favorisiere die letzte Quote. Aber nicht, weil sie die niedrigste ist, sondern weil sie im internationalen Vergleich die methodisch richtige ist. Es gibt Bestrebungen, diese Zahl auch auf nationaler Ebene zur dominanten Quote zu erklären, aber - wie das oft so ist - werden Konzeptänderungen gerade bei sensiblen ökonomischen Indikatoren wie der Arbeitslosenquote kritisch beäugt. Es würde ein Sturm im Expertenlager und ganz bestimmt in der Presse entfacht, wenn plötzlich eine andere, dazu noch eine deutlich niedrigere Quote favorisiert würde. Es kämen wahrscheinlich Verdächtigungen auf wie z.B. die, daß man das Arbeitslosenproblem zwar nicht zu lösen, aber sehr wohl durch statistische Tricks zu verharmlosen verstünde o.ä. Also bleibt vorerst alles beim Alten...

86

Kapitel III: Grenzen der Statistik

Arbeitslosenquoten im Jahresdurchschnitt nach verschiedenen Konzepten 1984 Abgrenzung/Datenquellen des Nenners Zählers Quelle Abgrenzung Abgrenzung Erwerbseinschl. Registrierte Bundesanstalt personen Soldaten Arbeitslosen für Arbeit ohne Soldaten

Abhängige Erweibspersonen

einschl. Soldaten ohne Soldaten

Erwerbslose

EG-ArbeitsErwerbsohne Soldaten kräfte-Stichpersonen probe Quelle: Karl Schoer, internes Papier, Statistisches Bundesamt, Oktober

Veröffentlichung Institution in % Quelle VGR 1983

8,2

OECD

Mikrozensus 1982

8,1

VGR 1983 VGR 1984 VGR 1984

8,4 8,4 9,3

BMWi Deutsche Bundesbank SAEG SAEG SVR

Mikrozensus 1982

9,1

EG-Aibeitskräfte-Stichprobe 1984 1985

6,8

BA, BMWi Deutsche Bundesbank ILO SAEG

III.3 Mögliche Fehler in der Statistik

87

III.3 Mögliche Fehler in der Statistik "Wer nicht mehr liebt und nicht mehr irrt, Der lasse sich begraben. " (J. W. Goethe, Epigrammatisches) "Nur der Betrug entehrt, der Irrtum nie. " (Lichtenberg)

m . 3 . 1 Einteilung der Fehler "Irren ist menschlich" ist eine uralte Erkenntnis. Das gilt für Jedermann, so auch für Statistiker. Statistiken sind mit Fehlern behaftet wie alles andere Menschenwerk auch. In der Mathematik ergeben Additionen immer ein ganz bestimmtes Ergebnis, es sei denn, jemand hat sich verrechnet. Verrechnen kann man sich gerade in der Statistik. Fehler können aber nicht nur beim schlichten Addieren auftreten, sondern auf allen Ebenen und in allen Aspekten der Statistik. Das Eingeständnis von Fehlern in einer Statistik ist nichts ehrenrühriges. Ganz im Gegenteil: Mit der Vertuschung von Fehlern beginnt die Manipulation. Anders wird ein Schuh daraus: Nur die Kenntnis der Ergebnisse zusammen mit ihren Fehlermargen läßt die Abschätzung ihrer Relevanz zu und macht sie brauchbar als Basis für Entscheidungen. Es gibt eine Reihe von Klassifizierungsversuchen der statistischen Fehler. Die bekannteste ist, zwischen systematischen und Stichproben- bzw. Zufallsfehlern zu unterscheiden. Zufallsfehler sind solche, die darauf beruhen, dafl man nicht die gesamte Bevölkerung bzw. die Grundgesamtheit, sondern nur einen Teil, eben eine Stichprobe, befragt. Deren Ergebnisse können natürlich nicht genau die Grundgesamtheit abbilden, sondern sie können innerhalb gewisser Bandbreiten um den 'wahren' Wert in der Grundgesamtheit schwanken. Diese Schwankungen sind bei echten Zufallsstichproben auf Grund der Charakteristika der Stichprobe und der Grundgesamtheit berechenbar. Anders dagegen die systematischen Fehler. Sie können im gesamten Prozeß einer Erhebung, angefangen bei ihrem Design, in der Erhebung, der Bearbeitung in den statistischen Ämtern und schließlich bei der Präsentation bzw. Interpretation der Ergebnisse, auftreten. Sie sind nicht nur auf Totalzählungen beschränkt, sondern sie können natürlich auch bei Stichproben auftreten. In der folgenden Darstellung werden einige der wichtigsten Fehler dargestellt. Diese Darstellung geht auf eine ähnliche in dem Buch "Wirtschafts- und Sozialstatistik, Gewinnung von Daten" von Krug/Nourney zurück (München 2. Aufl. 1987, S. 160).

Kapitel ΙΠ: Grenzen der Statistik

88

Mögliche Fehlerquellen bei statistischen Erhebungen

Zufallsfehler Durch Stichprobe bedingte systematische Fehler • Verzerrung durch die Auswahlmethode • Verzerrung durch die Auswahltechnik Systematische Fehler von Stichproben und Totalerhebungen Organisatorische Fehler • • • •

der Termin- und Ablaufplanung der Organisation der Erhebung beim Datenschutz der Öffentlichkeitsarbeit

Personelle und finanzielle Probleme • mangelhafte Schulung und Einweisung des Personals • nicht adäquate Personal- und Finanzausstattung Erfassungsfehler • Mängel der Erfassungsgrundlage: Einheiten sind ausgelassen, mehrfach vertreten, nicht zur Erhebungsgesamtheit gehörig • Nichtbeantwortung: Einheiten werden nicht aufgefunden, nicht angetroffen, verweigern die Auskunft Technische und Datenverarbeitungsfehler: Mängel bei • dem Ein- und Übertragen, Verschlüsseln und Ablochen • der Übernahme auf und Verarbeitung durch elektronische Datenträger • der Plausibilitätskontrolle Inhaltliche Fehler In der Vorbereitungsphase: Mängel bei • der Operationalisierung von theoretischem Konzept in Frageform • der Fragetechnik und Fragebogengestaltung In der Erhebungsphase: Verständnis-, Vermittlungs-, Übertragungsfehler bei • den Auskunftspersonen • den Interviewern In der Aufbereitungs- und Veröffentlichungsphase: Fehler bei • der Auswertung der Ergebnisse • der Darstellung der Ergebnisse • der Interpretation der Ergebnisse

III.3 Megliche Fehler in der Statistik

89

ΙΠ.3.2 Zufalls-/Stichproben-'Fehler' Trotz der prinzipiellen Unsicherheit von Stichprobenergebnissen haben sie gegenüber einer Totalzählung den unschlagbaren Vorteil, daß sie billiger sind und weniger Auskunñspersonen "belästigen'. Eine Stichprobe kann entweder schneller als eine Vollzählung sein (weniger Einheiten) oder sie kann genauer (wenn nur relativ gute Interviewer ausgewählt werden) bzw. detaillierter (mehr Fragen) als eine Vollzählung sein. Allerdings sind Vollzählungen (noch) unerläßlich, wenn man sehr detaillierte regionale Daten nachweisen will. Desweiteren sind Vollzählungen unerläßlich für die Gewinnung des Stichprobenplans für die Stichproben. In der folgenden Übersicht wird versucht, den Stichprobenfehler zu erläutern:

Merkmal (verkürzte Darstellung)

Wohnbevölkerung Männer Erwerbstätige mit Hauptschulabschluß Mit Abitur Frauen

Umfang des Slichprobenfehlers Bundesgebiet Fälle Einfacher (hochrelativer gerechnet) Standardfehler 1000 % 61 321 0,13 29205 0,13

Stadt mit 200 000 Einwohnern Einfacher Fälle relativer (hochStandardfehler gerechnet) 1000 % 200,00 2,2 95,25 2,3

12055

0,17

39,32

3,0

32 115

0,12

104,75

2,1

Quelle: Zindler/Schmidt/Meyer, Volkszählung 1986 - Vollerhebung oder Stichprobe, Wirtschaft und Statistik 2/1985, S. 79 ff. Zum Verständnis der Tabelle:

"Im ersten Beispiel betrachten wir eine Personengruppe, die relativ häufig vorkommt. Im Bundesgebiet gab es im Jahr 1978 etwa 12,1 Millionen erwerbstätige Männer mit Hauptschulabschluß als höchstem Abschluß an einer allgemeinbildenden Schule. Der einfache relative Standardfehler für diese Zahlenangabe würde etwa 0,17% betragen, was absolut einer Zahl von etwa 20 600 Männern entspräche, d.h. die "exakte" Zahl der erwerbstätigen Männer mit Volksschulabschluß läge mit einer Wahrscheinlichkeit von 68 % innerhalb eines Bereichs von ± 20 600 um den hochgerechneten Stichprobenwert und einer Wahrscheinlichkeit von 95 % im doppelten Fehlerbereich (± 41 200); in rund 5 % der Fälle einer Stichprobenziehung nach dem beschriebenen Auswahlverfahren sogar außerhalb des Fehlerbereichs von ± 41 200 Männern... In einer Großstadt mit 200 000 Einwohnern würde sich der einfache relative Standardfehler ßr dieses Nachweisungsmerkmal auf etwa 3,0% erhöhen. Ermittelt man aus der Stichprobe einen hochgerechneten Wert von rund 39 300 Männern mit Hauptschulabschluß, würde die exakte Anzahl mit 68 % Wahrscheinlichkeit zwischen rund 38 100 und 40 500, mit 95 % Wahrscheinlichkeit zwischen rund 36 900 und 41 700 und in 5 % der Stichprobenfälle sogar unter 36 900 oder über 41 700 liegen. "

Kapitel ΙΠ: Grenzen der Statistik

90

ΙΠ.3.3 Beschreibung systematischer Fehler in der Demographie

III. 3.3.1 Überblick Systematische Fehler können vielfältiger Art sein. Im folgenden seien nur einige Beispiele aus der Bevölkerungsstatistik aufgeführt. Viele der Anregungen stammen aus folgenden Büchern: • •

United Nations, Handbook of population and housing censuses, part II, demographic and social characteristics, New York 1992 UN, Demographic Yearbook

III.3 Mögliche Fehler in der Statistik

Meikmal Alter

Familienstand

Haushaltsstruktur

Erweibstätigkeit

Beruf, Wirtschaftszweig

Einkommen

Religion, Ethnische Merkmale Gesundheit, Behinderungen

91

Beschreibung des Fehlers Primär für sog. Entwicklungsländer gilt: Die Genauigkeit der Altersangaben hängt nicht nur von der Fragestellung, sondern auch vom Grad der Notwendigkeit in einer Gesellschaft ab, sein genaues Alter zu kennen. Bei relativ hohem Grad von Analphabetismus, schwacher Präsenz von Meldebehörden (PaßPflicht?) oder geringer Verbreitung von Schul-Jahrgangs-Klassen bzw. arbeits- oder sozialversicherungsrechtlicher Altersgrenzen ist mit folgenden Effekten zu rechnen: 1. Bevorzugung von Jahresangaben mit der Endziffer "0" und "5" 2. In geringerem Maße, aber doch auch noch von signifikanter Größenordnung, Bevorzugung der geraden Endziffern "2" und "8" 3. Möglicherweise Übertreibung in höheren Altersklassen Die Antwortvariabilität hängt einerseits von den vorgegebenen Antwortkategorien und andererseits von den sozio-kulturellen Besonderheiten ab. Personen, die unverheiratet zusammenleben oder Personen, die zwar nicht geschieden, aber nicht mehr zusammenleben, werden in einer Gesellschaft, in der die Ehe einen hohen Stellenwert hat, dazu neigen, als Familienstand "verheiratet" anzugeben, womit diese Kategorie überhöht nachgewiesen wird. Die Struktur eines Haushalts bzw. die Anzahl der Haushaltsmitglieder hängt entscheidend davon ab, wie der Haushalt definiert ist und besonders davon, wie der Interviewer die Definitionen der Person übermittelt, die die Fragen beantwortet. Je größer die übliche Haushaltsgröße ist, je mehr Generationen zusammenleben und je weiter der übliche Haushaltsbegriff in einer Gesellschaft gefaßt ist, um so eher ist mit Unscharfen bei den Antworten zu rechnen. Die Definition der Erweibstätigkeit ist relativ komplex und sehr weit gefaßt ("mindestens 1 Stunde"), doch der Platz im Fragebogen ist beschränkt. Deswegen besteht eine Tendenz, insb. kleinere Beschäftigungen zu "vergessen". Fehler kann durch adäquate Fragebogengestaltung verringert werden. Die Antwortqualität hängt entscheidend von der Fragestellung ab. Wird z.B. nur in einer ungenauen Frage nach dem Beruf gefragt, tendiert der Antwortende eher zu einer mehr allgemeinen Bezeichnung wie z.B."Aibeiter" oder "Angestellter". Beim Wirtschaftszweig gilt ähnliches, denn tendenziell sind Antworten wie "Handel", "Industrie" oder "Staat" überrepräsentiert. Detailliertere Fragestellungen würden einen erheblichen Gewinn an Genauigkeit bringen. Die Beantwortung von Einkommensfragen ist stark von persönlichen Einstellungen und Befürchtungen abhängig. Von der Fragestellung ist abhängig, inwieweit dem Befragten übermittelt werden kann, was unter "Einkommen" verstanden wird (brutto oder netto?, einschl. oder ohne Sozialversicherungsabgaben, Sonderzahlungen/Überstunden? usw.). Weil das Einkommen im allgemeinen eine komplexe ökonomische Größe mit z.T. mehreren Komponenten ist, besteht eine Tendenz, insb. nicht regelmäßige oder eher geringfügige Einkommen zu vergessen. Fehlinterpretationen bzw. bewußte Falschangaben aus den verschiedensten Gründen - je nach Land - sind weit veibreitet. Diese sowohl sensitiven als auch schwer klassifizierbaren Merkmale haben einen besonders hohen Grad der Ungenauigkeit. Mit steigendem Differenzierungsgrad der Fragen dürfte auch die Genauigkeit der Antworten zunehmen, doch sind dafür im allgemeinen in den üblichen Personenbefragungen keine Zeit und kein Platz vorhanden.

Kapitel III: Grenzen der Statistik

92

Versuche, die systematischen Fehler zu quantifizieren, gibt es zuhauf. Hier seien zwei dargestellt. Sie stammen aus dem Report von Walter Müller u.a., Die faktische Anonymität von Mikrodaten, Band 19 der Schriftenreihe "Forum der Bundesstatistik", hrsg. vom Statistischen Bundesamt, Wiesbaden 1991. Quantifizierun g systematischer Fehler Antwortvariabilität in % aller Befragten zwischen Mikrozensus beim Retest von und Volkszählung 1970 ALLBUS 1984 0,0 Geschlecht Staatsangehörigkeit 1,2 1,3 Familienstand 2,1 Geburtsjahr 2,6 3,3 6,5 Erweibstätigkeit 7,4 Stellung im Beruf 10,0 6,5 7,8 Beruf 7,8 allgemeiner Schulabschluß Wirtschaftsbereich 11,0 10,2 überwiegender Lebensunterhalt 11,3 13,0 überwiegende Einkünfte Aibeitswochenstunden 18,2 44,8 Einkommen Quelle: Zusammenstellung aus: Walter Millier u.a., Die faktische Anonymität von Mikrodaten, Band 19 der Schriftenreihe "Forum der Bundesstatistik", hrsg. vom Statistischen Bundesamt, Wiesbaden 1991, S. 125,127. Merkmal

III.3.3.2 Beispiel 1: Altersangaben In vielen ärmeren Ländern kann man das Phänomen beobachten, daß es dort anscheinend besonders viele Personen gibt, die ein Alter haben, das mit 'S' oder Ό' endet. Wenn man genauer hinschaut, dann gibt es auch dazwischen noch beliebte Altersangaben, die mit '2' oder '8' enden, wie die folgende Graphik zeigt. In höheren Altersklassen nimmt der Anteil dieser Personen anscheinend zu. Um Platz zu sparen, wurden in der folgenden Graphik die Ergebnisse für Indien, Gambia und Kolumbien in ein Schaubild gepackt. Hoffentlich wurde dadurch seine Verständlichkeit nicht beeinträchtigt. Daß gerade diese drei Länder ausgewählt wurden, ist willkürlich. Es war primär daran gedacht, jeweils ein Land der drei Kontinente Asien, Afrika und Südamerika zu berücksichtigen.

III.3 Mögliche Fehler in der Statistik

Alteisstrukturen in ausgewählten Landern 10

η

8

fi

6 %

n 4-1

10

Γ nil Π Π " πη UM η π nUíln π„

20

π

-

30

40

Γ "

50

Alter Η Indien

Ο Gambia

G Kolumbien

Man kann diesen Sachverhalt noch wie folgt graphisch präzisieren:

60

70

Kapitel III: Grenzen der Statistik

94

Typisches Doppel-W-Muster einer Altersstruktur in ausgewählten Ländern: Schaubild 1: Großes W-Muster innerhalb eines 10-Jahres Intervalls Schaubild 2: Kleines W-Muster innerhalb eines 5-Jahres-Intervalls

%

%

xO

1

xl

1

x2

1

x3

1

x4

1

x5

1

x6

1

x7

1

x8

1

x9

1

yO Altersjahre

Diese Ergebnisse haben natürlich nichts mit Zauberei zu tun, sondern sie sind schlicht das Ergebnis von sozio-kulturellen Besonderheiten in ärmeren Ländern. So wurde neulich berichtet, daß man erwägt, in Mexiko Personalausweise einzuführen (siehe FAZ vom 23. Juli 1992). Dabei wurde offenbar, daß viele Mexikaner keinen Paß, sondern allenfalls einen Führerschein besitzen; viele haben noch nicht einmal dieses Dokument, geschweige denn eine Geburtsurkunde. Das liegt daran, daß die Vorbedingung für einen Führerschein oder für einen Paß die Ausstellung einer Geburtsurkunde ist, aber das würde Geld kosten, was eben die Mehrheit der Mexikaner nicht hat. So wird es verständlich, daß Altersangaben schlicht geschätzt werden, wobei man - sieht man von der 'S' ab - den 'runden' Endziffern offensichtlich den Vorzug gibt. Trotzdem sind solche Altersangaben nicht wertlos. Man kann z.B. die Einzelangaben zu Altersgruppen von 5 oder 10 Jahren zusammenfassen und erhält so relativ verläßliche Altersstrukturen.

III.3 Mögliche Fehler in der Statistik

95

IIL3.3.3 Beispiel 2: Auf der Suche nach den 'unsichtbaren' Frauen "Governments do not consider much of women's work to be economically productive and thus do not count it. If women's unpaid work in subsistence agriculture and housework and family care were fully counted in labour force statistics, their share of the labour force would be equal to or greater than men's. And if their unpaid housework and family care were counted as productive outputs in national accounts, measures of global output would increase 25 to 30 per cent. Even if governments do consider women's work to be economically productive, they overlook or undervalue it.. Without good information about what women really do - and how much they produce - governments have little incentive to respond with economic policies that include women. " (UN, The World's Women 1970-1990, Trends and Statistics)

Man sollte eigentlich meinen, es gäbe nichts einfacheres, als Erwerbstätige zu zählen. Weit gefehlt! Es ist nun nicht so, daß z.B. Interviewer zu dumm wären, alle Erwerbstätige zu erfassen, oder daß vielleicht die Definitionen der Erwerbstätigkeit unklar seien. Nichts von alledem. Schauen wir uns folgende Tabelle über die Erwerbsbeteiligung ägyptischer Frauen an:

Jahr 1981 1982 1983 1984 Quelle: ILO,

Erwerbstätige in Ägypten darunter Frauen in % Insgesamt Frauen von Spalte 2 777 8 9946 796 8 10115 11526 1945 17 2086 11819 18 Year Book of Labour Statistics 1989-90, Genf 1990, S. 341.

Die Anzahl aller Erwerbstätigen erhöht sich im Zeitablauf anscheinend relativ stetig, doch der Anteil der Frauen macht einen merkwürdigen Sprung zwischen den Jahren 1982 und 1983. Um das Ergebnis vorwegzunehmen: Da ist kein Trick dabei, die Statistiker haben lediglich einen Fehler korrigiert, die bisher statistisch 'unsichtbaren' Frauen wurden entdeckt. Um das allerdings halbwegs vernünftig zu erklären, muß mit den folgenden Erläuterungen etwas weiter ausgeholt werden, es muß die statistische Infrastruktur im weitesten Sinne angesprochen werden und ihre Abhängigkeit von sozialen und kulturellen Faktoren. Man könnte vermuten, daß die Brille, durch die die Statistiker die Welt betrachten, von Verzerrungen relativ frei sei. Zumindest sollte man meinen, daß sie von einem Geschlechts-Bias relativ verschont seien, weil wir uns doch bemühen, möglichst wertfrei und offen unsere tägliche Arbeit zu verrichten. Und schließlich gibt es kaum eine Personenbefragung, wo nicht nach dem Geschlecht differenziert wird. Richtig! Aber gleichzeitig auch wieder falsch! Mit einer Rubrik 'männlich/weiblich' im Fragebogen alleine ist es noch nicht getan, es kommt auf den Blickwinkel an bzw. darauf, was - aus welchen Gründen auch immer - primär als wichtig und - als Kehrseite davon - als sekundär eingestuft wird. Damit sind nicht alleine nur die Statistiker und deren Auftraggeber angesprochen, sondern das dürfte jeder Berufsgruppe oder ganz allgemein jeder Gruppe in einer bestimmten Gesellschaft so ergehen. Erwerbstätig zu werden ist immer noch ein Entscheidungsproblem für Frauen. Wenn frau erwerbstätig ist, dann hat primär sie sich (und nicht der Mann) zu fragen, wie lange und wie intensiv sie erwerbstätig sein soll oder darf. Gott sei dank ändert sich das jetzt langsam. Trotzdem sind heute z.B. noch fast alle Teilzeitbeschäftigte Frauen (gut 92 %; siehe Statistisches Jahrbuch 1992, S. 123); im internationalen Vergleich ist in Deutschland der Anteil der Frauen an den Erwerbspersonen in den letzten Jahren zwar deutlich auf ein höheres Niveau gestiegen, aber es gibt z.B. skandinavische Länder mit einem noch höheren Anteil. Auch auf anderen Gebieten wie durchschnittlicher Schulbesuch oder politische Partizipation

Kapitel III: Grenzen der Statistik

96

sind Frauen gegenüber den Männern im Vergleich zu anderen industrialisierten Ländern unterrepräsentiert bzw. bei der Arbeitslosigkeit überrepräsentiert (Quelle: UNDP, Human Development Report 1992). Als ich fUr ein paar Jahre in Jordanien arbeitete, fiel mir diese Ungleichheit zwischen Männern und Frauen natürlich besonders auf. Arabische Länder haben traditionell den weltweit niedrigsten Anteil von Frauen an der Anzahl der Erweibspersonen (Quelle: UNDP, Human Development Report 1992). Die Gründe dafiir liegen im sozio-kulturellen Bereich und in der islamischen Religion begründet. Traditionell, schon vor Mohammed, arbeitete frau in der arabischen Welt eben nicht bzw. - und das ist jetzt entscheidend: wenn frau schon arbeitet, dann wird es nicht als Arbeit angesehen. Dies ist allerdings kein spezifisch arabisches Phänomen, sondern mehr oder weniger weltweit so. Wenn dieses Denken mehrheitlich in einer Gesellschaft verbreitet ist, dann ist es nicht überraschend, wenn sich dies auch auf die Methoden und Instrumente der Statistik niederschlägt. Und hier liegt schließlich der Schlüssel fur das, was mit dem ägyptischen Labour Force Survey Anfang der achtziger Jahre geschah: Bis 1982 hat man das Merkmal der Erwerbstätigkeit wie immer und wie fast überall in der Welt erhoben, nämlich mit einfachen Fragen wie z.B.: "Sind Sie in der Berichtswoche erwerbstätig gewesen?" Normalerweise werden bei solche Fragen nur die Tätigkeiten angegeben, auf die einige oder alle der folgenden Merkmale zutreffen: • • • •

arbeitsvertraglich und sozialversicherungsrechtlich abgesichert festes Gehalt Regelmäßigkeit Vollzeitbeschäftigung

Dagegen werden weniger solche Erwerbstätigkeiten angegeben, auf die einige der folgenden Eigenschaften zutreffen: • • • • •

saisonale oder Gelegenheitsarbeit Teilzeitbeschäftigung keine geldliche Entlohnung Heimarbeit mithelfendes Familienmitglied

Die zuerst genannten Tätigkeiten sind fUr eine Familie von besonderer Bedeutung, weil daraus zumeist der Lebensunterhalt einer ganzen Familie finanziert werden muß. Normalerweise werden solche Tätigkeiten vom sogenannten 'Familienoberhaupt', also dem Mann, ausgeübt. Und das ist es, was man normalerweise in einer Erwerbstätigkeitsstatistik wiederfindet. Anders dagegen bei Tätigkeiten, auf die eher die zweite Merkmalskategorie zutrifft: Dies sind oft zusätzliche Tätigkeiten von Familienmitgliedern, zumeist von Frauen. Und solchen Tätigkeiten wird oft nicht eine so große Bedeutung beigemessen, weil sie - gemessen am Haupteinkommen des Mannes - eher von geringer Höhe sind oder schlicht deswegen, weil man aus Tradition diese Tätigkeit nicht als Tätigkeit ansieht. Letzteres ist in ärmeren Ländern vor allem dann der Fall, wenn es sich um landwirtschaftliche Tätigkeiten handelt, die zumeist - wie man fälschlicherweise meint - die Frau 'mal so nebenbei' ausfuhrt. Genau dies war einer der Hauptgründe dafür, warum die Erweibstätigkeit von Frauen in Ägypten bis 1982 so gering ausfiel. Dann hat man ab 1983 den Fragebogen geändert, indem man in einer Version eine Liste von typischen Aktivitäten ergänzt hat, wo man der Meinung war, daß diese Tätigkeiten normalerweise nicht angegeben werden. In einer zweiten Version hat man die überlicherweise recht knappe Frage "Sind Sie erwerbstätig?" in mehrere Teilfragen unterteilt. Beide Techniken führten zu einer höheren Anzahl von nachgewiesenen Beschäftigungen, insbesondere von Frauen in der Landwirtschaft (zu Details

III.3 Mögliche Fehler in der Statistik

97

siehe Anker/Anker, Measuring the female labour force in Egypt, International Labour Review, 4/1989, S. 511 Cf.). Statistiker leben selbstverständlich nicht im luftleeren Raum. Sie setzen Grundsätze um, die allgemein für üblich angesehen werden, und das geschieht innerhalb des ihnen gegebenen infrastrukturellen Rahmens. Zur statistischen Infrastruktur gehört z.B. • • • •

die Nachfrage nach bestimmten Daten der finanzielle Rahmen die personelle und sachliche Ausstattung die methodischen, deflatorischen und klassifikatorischen Konzepte usw.

Wenn bestimmte Tätigkeiten gemeinhin als nicht so wichtig oder gar nicht als Tätigkeit angesehen werden, dann schlägt sich das nicht nur beim Statistiker, dem Interviewer oder bei der Auskunftsperson nieder, sondern dann gilt das auch fìir die gesamte Ausgestaltung und Ausrichtung der statistischen Infrastruktur. Der ägyptische Labour Force Survey ab 1983 bedurfte nicht nur einer Änderung des Fragebogens, sondern auch einer besonderen Auswahl und Schulung der Interviewer, der Bereitstellung erheblicher finanzieller Mittel und last but not least das Wollen von Entscheidungsträgern, einen neuen Ansatz in der Erwerbstätigkeitsstatistik durchzusetzen. Aus mir nicht bekannten Gründen endet die Zeitreihe über die Erweibstätigen in Ägypten aus dem Labour Force Survey mit dem Jahr 1984. Auch das jüngste Jahrbuch der ILO verzeichnet ab 1985 nur Striche. Vermutlich war der materielle Aufwand 1983 und 1984 so groß, daß man ihn nicht jährlich wiederholen konnte. Wer nun meint, solche 'Fehler' werden nur in Ägypten gemacht, hat sich gründlich getäuscht. In den achtziger Jahren rumorte es in der deutschen Szene der Erwerbstätigkeitsexperten, daß zu wenige, insb. geringfügige Beschäftigungen statistisch nachgewiesen werden. Ab 1990 wagte man schließlich einen ähnlichen Schritt wie in Ägypten acht Jahre vorher und man war erstaunt, welche Ergebnisse man damit erzielte (fiir Details siehe H.-J. Heidenreich, Erste Ergebnisse des Mikrozensus April 1990, Wirtschaft und Statistik 11/1991, S. 715 IT.): Aufgrund einer erweiterten Fragestellung im Mikrozensus, einer jährlichen 1 %-Stichprobe der Bevölkerung und des Arbeitsmarktes, schätzt man, etwa 700 000 Erwerbstätige mehr 'gefunden' zu haben, die sich ohne Änderung des Fragebogens nicht als erwerbstätig eingestuft hätten. Etwa 70 % dieses 'Zuwachses' trugen Frauen bei. Trotz dieser schärferen Fragestellung im Mikrozensus vermutet man, gerade die geringfügigen Beschäftigungen immer noch zu unterschätzen (siehe Hannelore Pöschl, Geringfügige Beschäftigung 1990, Wirtschaft und Statistik 3/1992, S. 166 ff., hier Fußnote 4).

III.3.3.4 Beispiel 3: Quiz: Welche Berufscodierung ραβί zum Beruf des Statistikers? Bei der Erhebung, Aufbereitung und Darstellung von Berufsangaben sind mehrere Schwierigkeiten zu überwinden. Zum einen kommt es darauf an, ob die Auskunftsperson 'in der richtigen Stimmung' ist, um brauchbare Angaben zu machen. Häufig sind Fragebögen sehr lang, und wenn der Interviewer zur Frage nach dem Beruf kommt, ist die Auskunftsperson (und der Interviewer) vielleicht nur noch daran interessiert, das Interview schnell 'hinter sich zu bringen'. Da kommt es natürlich sehr darauf an, wie gut es der Interviewer versteht, dem verständlichen Verhalten der Auskunftsperson entgegenzuwirken. Hilfreich ist da eine entsprechende Gestaltung des Fragebogens. Empfohlen wäre eine zweistufige offene Frage,

Kapitel III: Grenzen der Statistik

98

• •

zum einen nach dem Beruf (mögliche Antworten z.B.: Arbeiter, Bäcker, Lehrer usw.) und zum anderen nach der Haupttätigkeit (mögliche Antworten z.B.: 'Gräben graben' beim Arbeiter, 'Brot backen' oder 'Brotbackmaschinen beaufsichtigen' beim Bäcker, 'Mathematik oder Deutsch lehren' oder 'Fahrschullehrer' beim Lehrer usw.)

Zu diesen Vorschlägen siehe Hußmanns/Mehran/Verma, Surveys of economically active population, employment, unemployment and underemployment: An ILO manual on concepts and methods, Genf 1990, S. 167 fit. Allerdings ist der Platz in den Fragebögen knapp bemessen, so daß die Frage nach dem Beruf (und meistens auch der Wirtschaftszweig) nur einstufig ausfällt. Dann darf man sich auch nicht wundern, wenn man häufig Antworten erhält wie 'Arbeiter', 'Angestellter', 'Bttroangestellte/r1 usw. (zu mehr Details siehe Heiberger/Becker, Sozialversicherungspflichtig Beschäftigte in der Beschäftigtenstatistik und im Mikrozensus, Wirtschaft und Statistik 4/1983, S. 290 if.). Natürlich wird in den Intervieweranweisungen und im Fragebogen darauf hingewiesen, solche pauschalen Berufsangaben zu unterlassen, doch auszuschließen sind sie dadurch nicht. Pauschale Berufsangaben wie 'Arbeiter' und 'Angestellte' erschweren erheblich die Codierung der Klartextangaben zum Beruf. Es Iäßt sich deswegen nicht vermeiden, daß nach der 'Klassifizierung der Berufe des Statistischen Bundesamtes' bestimmte, eher unspezifische Berufscodierungen relativ oft vergeben werden zu Lasten solcher Berufe, die sehr spezifisch beschrieben sind. Beispiele: •



Die Berufssignierung S31 'Hilfsarbeiter ohne nähere Tätigkeitsangabe' wird wohl nur deswegen so oft vergeben, weil die Klartextbezeichnung im Fragebogen nur 'Arbeiter', ggf. mit den wenig hilfreichen Zusätzen 'Produktions-' oder 'Industrie-', lautet. Ähnlich bei der Berufssignierung 781 Organisations-, Verwaltungs-, Büroberufe', die oft nur auf Grund von Klartextbezeichnung wie 'Angestellter1, ggf. ergänzt mit den ebenfalls unklaren Bezeichnungen wie kaufmännischer Angestellter oder Verwaltungs- oder Büroangestellter ergänzt sind.

Doch selbst dann, wenn bis zum Signieren alles nach den Regeln der statistischen Kunst verlaufen sollte, kann das Signieren auch noch seine Fallstricke haben - von simplen Signierfehlern einmal abgesehen. Die Berufssystematik ist historisch gewachsen und nach unterschiedlichen Kriterien aufgebaut. Zusammenfassungen von Berufen erfolgen z.B. • • • •

nach nach nach nach

dem bearbeiteten Material (z.B. Papier-, Textil- oder Bekleidungsberufe), der überwiegend ausgeübten Tätigkeit (z.B. Montierer), dem Wirtschaftszweig (z.B. Landwirte, Bergleute, Chemiearbeiter, Bauberufe usw.), der Berufsaufgabe (z.B. Ordnungs- und Sicherheitsberufe, Gesundheitsberufe) usw.

Der Tätigkeit nach ähnliche Berufsbezeichnungen wie z.B. Schleifer sind demnach - je nach dem bearbeiteten Material (Glas, Holz, Keramik, Metall, Stein) - unterschiedlichen Berufsordnungen zuzuweisen. Dagegen können Berufe mit unterschiedlichen Tätigkeiten - wie z.B. Maschinenbedienung, Bttrotätigkeiten oder Dienstleistungen - z.B. in den Verkehrsberufen enthalten sein. Zusätzlich wird die Zuordnung der Berufsbezeichnungen dadurch erschwert, daß z.B. die Qualifikation einzelner Berufsordnungen recht unterschiedlich und die Grenze zu allgemeinen Hilfsarbeitertätigkeiten fließend ist. In der Berufsordnung 273 'Maschinenschlosser1 sind u.a. Arbeitnehmer mit bestimmten Spezialisierungen wie z.B. Getriebeschlosser oder Turbinenschlosser genauso enthalten wie Maschinenschlosserhelfer. Um die Verunsicherung zu komplettieren, sei zum Abschluß ein Quiz gewagt: Welches ist der richtige Berufscode fUr einen Statistiker im Statistischen Bundesamt? Nun, wurde im Fragebogen 'Statistiker1 angegeben, so gibt es nur die Wahl 881 'Wirtschafts- und Sozialwissenschaftler, a.n.g., Statistiker1 bzw.

III.3 Mögliche Fehler in der Statistik

99

8814 'Marktforscher, Statistiker1 zu signieren. Steht allerdings im Fragebogen die Bezeichnung 'Beamter', so wird die Ziffer 781 'Bürofachkräfte' bzw. 7811 'Verwaltungsfachkräfte (öffentlicher Dienst)' fällig. Steht dagegen z.B. 'Regierungsrat' im Fragebogen, gibt es schließlich eine dritte Möglichkeit, nämlich dann wird der Code 762 'Leitende und administrativ entscheidende Verwaltungsfachleute' signiert.

III.3.3.5 Beispiel 4: Gründe für die Unterschätzung des Einkommens in Interviews In periodischen Abständen wird eine sogenannte Einkommens- und Verbrauchsstichprobe EVS durchgeführt, wo Haushalte nach ihren Veibrauchsgewohnheiten sowie nach ihren Einkommensquellen befragt werden. Dies geschieht relativ detailliert; insbesondere die Käufe sollen so detailliert sein, um daraus einen typischen Warenkorb konstruieren zu können, der wiederum Grundlage der Preisstatistik ist. Hier soll allerdings nur das Einkommen interessieren. In der EVS wird das Einkommen zweimal befragt, einmal im Grundinterview und dann detaillierter in der Feinanschreibung. Sieht man einmal davon ab, daß das Einkommen bei 'uns' eine recht sensible Größe ist (anders als in Ländern wie z.B. China), so kann das Einkommen manchmal das Ergebnis recht umfangreicher Berechnungen sein. Beispielsweise • setzt sich das Einkommen nicht selten aus verschiedenen Einzelposten zusammen, • fließen einige Einkommensquellen nicht regelmäßig, • weiß man oft wirklich nicht mehr genau, wie hoch das Einkommen ist, zumal dann, wenn nach • verschiedenen Darstellungsmöglichkeiten wie brutto/netto, mit/ohne Sozialversicherung, mit/ohne private Krankenversicherung, mit/ohne Vermögensbildung usw. gefragt wird. Es ist also eine Untererfassung der Einkommen im ersten, gröberen Grundinterview zu erwarten. Vergleicht man die Einkommensangaben aus den zwei verschiedenen Interviews, so wurde z.B. fur die EVS 1978 folgendes festgestellt: Haushalte von Nichtselbständigen nach der Abweichung der Größenklasse des Nettoeinkommens laut Januar-Anschreibung gegenüber dem Grundinterview sowie nach der Haushaltsgröße 1978 Gegenstand der Nachweisung Haushalte insg. mit... Haushaltsmitglied(ern) 3 4 5 u.m 2 1

% Einkommensgrößenklasse nach der Januar-Anschreibung war gegenüber dem Grundinterview • gleich • höher, davon um ... Größenklasse(n) 1 2 3 und mehr • niedriger, davon um... Größenklasse(n) 1 2 3 und mehr Quelle: M. Euler, Genauigkeit von Einkommensangaben fassung, Wirtschaft und Statistik 10/1983, S. 813 ff.

54 34 58 39 29 23 14 8 15 8 8 7 5 5 1 1 1 2 in Abhängigkeit

32 60 32 14 14 8 6 1 1 von der

24 19 19 67 71 75 29 34 29 19 17 16 19 20 30 9 10 6 6 7 3 1 1 2 2 2 1 Art der statistischen Er-

In diesem Aufsatz heißt es: "Wie aus (der) Tabelle ... hervorgeht, stimmte nur in etwa einem Drittel der in der Untersuchung einbezogenen Haushalte die im Grundinterview angegebene Größenklasse des Haushaltsnettoeinkommens mit der aufgrund der Anschreibungen errechneten Größenklasse überein. In

100

Kapitel III: Grenzen der Statistik

58 % der Fälle lag die errechnete Größenklasse Ober der im Interview genannten, und zwar in 29 % der Fälle um eine Größenklasse, in 14 % um zwei Größenklassen und in 15 % sogar um drei und mehr Größenklassen. Haushalte, bei denen die errechnete Größenklasse niedriger war als die geschätzte (8 %), hatten sich meist nur um eine Größenklasse verschätzt (5 %). Eine Kompensation der Schätzfehler ist also nicht nur deshalb ausgeschlossen, weil der Anteil der Haushalte mit Überschätzungen des effektiven Einkommens fiir die Gesamtheit der hier dargestellten Haushalte nur etwa ein Siebtel so hoch war wie der Anteil der Haushalte mit Unterschätzungen, sondern auch wegen des unterschiedlichen Ausmaßes der Unter- bzw. Überschätzungen... Wie (die) Tabelle ... ebenfalls zeigt, wurde die dem errechneten Einkommen entsprechende Einkommensgrößenklasse im Grundinterview um so seltener genannt, je mehr Personen sich im Haushalt befanden... Vielleicht ist einer der wichtigsten Gründe, weshalb in Interviews das Haushaltsnettoeinkommen häufig unterschätzt wird, darin zu suchen, daß zum Zeitpunkt des Interviews nicht alle Haushaltsmitglieder anwesend sind und daß die Personen, die interviewt werden, über die Einkommen der übrigen Haushaltsmitglieder nicht oder nicht ausreichend informiert sind. Daß noch andere Faktoren mitspielen, zeigt sich schon daran, daß ... auch bei alleinlebenden Personen in 39 % der Fälle die Höhe des eigenen Einkommens unterschätzt wird. Vermutlich denkt die Auskunftsperson in erster Linie nur an die wichtigsten, regelmäßig gezahlten Einkommen, während staatliche Transferzahlungen, wie Wohngeld, Kindergeld, Kriegsopferrente, wahrscheinlich ebenso häufig vergessen werden wie bestimmte private Übertragungen oder Einkünfte aus Vermögen (Zinsen, Dividenden u.ä.); das gilt besonders dann, wenn diese Einkünfte nur in größeren zeitlichen Abständen anfallen. "

III.3 Mögliche Fehler in der Statistik

101

ΙΠ.3.4 Diverse unernste Szenarien III. 3.4.1 Ein höllisches Szenario: Im Inferno der Fehler "Wenn wir das Reich der logischen Finsternis betreten, so könnten wir es nach vielen Richtungen durchstreifen. Wir treffen hier die verschwimmenden Gestalten der Ungenauigkeiten und der kleinen Unklarheiten. Im Mantel der Liebe treiben sich die leichtfüßigen Kobolde der Schnitzer und Versehen umher. Mitten durch das ganze Gewimmel hindurch tapsen tolpatschig die schweren Böcke entlang. Lug und Trug stolzieren Arm in Arm. Daneben taucht die mokante Fratze der taktischen Winkelzüge auf. Dicht auf den Fersen folgt ihnen in scholastischem Gewände die quaternio terminorum, um sich heimlich zwischen sie alle zu schieben. Schleichend nähert sich mit riesigem Maulwerk die gefräßige Täuschung, der in aller Harmlosigkeit die Menschen zum Opfer fallen. Mit sich selbst streitend kommt das doppelköpfige Monstrum des Widerspruchs nicht von der Stelle. In größerer Tiefe des Höllenschlundes lauern die grinsenden Teufelsfratzen der boshaften und böswilligen Irreßhrung. Wir aber inspizieren genauer die statistischen Irrtümer, die wir inmitten der juristischen Rabulistik, des theologischen Hokuspokus, der philosophischen Spintisiererei, des künstlerischen Kitsches, der medizinischen Kurpfuscherei antreffen. Je ein Distrikt der statistischen Lüge findet sich wohl in jedem Höllenkreise - denn zu welchem guten oder schlechten Zwecke wäre die Statistik noch nicht mißbraucht worden! Wir haben nur nachzuholen, was Dante in seiner Göttlichen Komödie zu schildern vermied: weil es den Dichter nicht reizen konnte, das Exerzierreglement der Unlogik zu durchblättern, das wir hier zu betrachten haben. " (E. Wagemann, Narrenspiegel der Statistik, 2. Aufl. Hamburg 1942)

111.3.4.2 Ein exotisches Szenario: Von Raubtieren und Giftschlangen "Wenn du eine 'Tatsache, Situation oder Erfahrung' beschreibst, dann zählt nicht, was du gesehen hast, sondern was der Leser sich vorstellt, wenn er deine Beschreibung liest. Manches läßt sich 'durch Fakten beweisen', anderes nicht. Nehmen wir einmal an, du gehst um die Ecke eines Tempels, der fünf Meter fünfunddreißig lang ist und von drei Säulen getragen wird, und ein Waschbär oder ein Frosch jagt dir einen Schreck ein. Nun, da beschreibst du eben den Waschbären als einen riesigen Jaguar oder den Frosch als eine große, zusammengerollte und angriffsbereite Lanzenotter. Das wollen die Leute lesen Raubtiere und Giftschlangen verkaufen Bücher, Waschbären und Frösche nicht. Schließlich macht sich jemand auf, mißt den Tempel und veröffentlicht seine Ergebnisse. Wenn er zeigt, daß du die Tempellänge mit 5,35 m richtig angegeben hast, 'beweist' er damit gleichzeitig, daß du den Jaguar oder die Lanzenotter gesehen hast. Solange es keinen überwältigenden Beweis für das Gegenteil gibt, wird jede Lüge, die auf derselben Seite steht wie eine erwiesene Wahrheit, ebenfalls zur Wahrheit. So denken die Menschen nun einmal." - (R. D. Bruce, Zur Authentizität von Wolfgang Cordans 'Geheimnis im Urwald', in: Authentizität und Betrug in der Ethnologie, hrsg. von H. P. Duerr, Frankfurt 1987, S. 160)

111.3.4.3 Ein alltägliches Szenario: Augenzeugen lügen nicht "'Wir sind schlechte Beobachter', konzediert der langjährige Leiter der Hamburger Journalisten Schule (Henri Nannen-Schule), Wolf Schneider, in seinem medienkritischen Klassiker 'Unsere tägliche Desinformation'. Schneider belegt seine These unter anderem mit einem aufschlußreichen Verkehrsversuch: 'Da sehen also ftinfeehn Leute, wie auf einer zweispurigen Autobahn ein Opel einen querstehenden Renault rammt. Befragt, wo der Renault im Augenblick des Aufpralls gestanden habe, antworteten sie: 'Auf dem linken Fahrstreifen', 'Auf der rechten Spur', 'Dazwischen', ja sogar 'Auf der Mittelspur' (was eine dreispurige Autobahn voraussetzen würde) - und das, obwohl die ftinfzehn nicht zufällig Zeuge eines Verkehrsunfalls wurden, sondern Testpersonen waren, die wußten, daß sie aufpassen müssen, weil sie hinterhergefragt werden (...) Walter Lippmann hat dieses Phänomen schon 1922 beschrieben: Augenzeugen berichten nicht, sie interpretieren, sie wandeln um - auch wenn sie sich noch so sehr um eine Abschilderung der Realität bemühen; auf dem Weg zum Bewußtsein werden die Informationen 'durch die geläufigen Denkschemata unterbrochen'. " (Klemens Ludwig, Augenzeugen lügen nicht, München 1992, S. 17/18)

102

Kapitel III: Grenzen der Statistik

III.4 Möglichkeiten und Grenzen der empirischen Sozialforschung "Durch die Statistik ist... ein festes Fundament unangreifbarer Tatsachen ...zu schaffen. " (Lenin, Statistik und Soziologie, Werke Bd. 23, zitiert nach A. Donda u.a., Statistik, Berlin 1986) "Ebenso wie die inquisitorische Kirche den Gottesbeweis, ist die regierende Wissenschaft den Wahrheitsbeweis schuldig geblieben. " (Ulrich Beck, Gegengifte) "Geheimnisvoll am lichten Tag Läßt sich Natur des Schleiers nicht berauben. Und was sie deinem Geist nicht offenbaren mag, Das zwingst du ihr nicht ab mit Hebeln und mit Schrauben. " (J. W. Goethe, Fausti) "Die Menschen überall sind lose, sie trudeln, wirbeln, schlendern und schlendern noch inmitten ungeheurer Prozesse, die sie nichts angehen, zu deren Bewußtsein sie niemals gelangen: sie sind im Grunde bei all ihrer 'Intelligenz' unendlich unschuldig, sie handeln trotz ihres heillosen subjektiven Wissens um sich selbst aus einem geheimen kollektiven Schwerpunkt wie die Kleistsche Marionette - leider kommt ihre Grazie nur selten zum Vorschein. " (Botho Strauß, Beginnlosigkeit) "... wir stoßen fast niemals zufällig auf eine Lücke in unserem Wissen. Nichtwissen ist, wie Wissen, immer zielgerichtet... Wir stehen unter dem Einfluß der Tradition unserer Wissenschaft, des kulturellen und politischen Milieus unserer Umwelt und unter dem unserer eigenen Persönlichkeit. " (Gunnar Myrdal, Objektivität in der Sozialforschung)

III.4.1 Zur Abgrenzung der empirischen Sozialforschung Das weite Feld der Statistik soll hier grob in zwei Teilbereiche unterteilt werden, zum einen die sogenannte amtliche Statistik, auf die im vorherigen Teil dieses Buches eingegangen wurde, und zum anderen die empirische Sozialforschung, die primär an Universitäten und Instituten angesiedelt ist. Natürlich ist ihnen beiden gemeinsam, Daten zu erheben, aufzubereiten und zu veröffentlichen. Die Daten der amtlichen Statistik dienen als Grundlage der Planung einer am Sozialstaatsprinzip orientierten staatlichen Politik. Zur Wahrnehmung dieser Funktion bedarf die amtliche Statistik einer gesetzlichen Grundlage, und in der Regel ist die Durchführung von Erhebungen für die Befragten mit Auskunftspflicht verbunden. Oft sind ihre Erhebungen Totalzählungen, die wiederum die Basis für Stichproben sowohl der amtlichen Statistik als auch der nicht-amtlichen Statistik liefern. Die empirische Sozialforschung legt dagegen ihren Schwerpunkt einerseits auf mehr subjektive Daten wie z.B. Meinungen und andererseits insbesondere auf die Forschung bzw. die Überprüfung von sozialwissenschaftlichen Hypothesen. Für die folgenden Überlegungen sei vereinfachend gesagt, daß die amtliche Statistik primär Daten produziert, während die nicht-amtliche Statistik primär die Forschung abdeckt. Die Ergebnisse der folgenden Kapitel gelten dementsprechend primär für die Methodologie der Forschung, doch ist die Datenproduktion - unabhängig von ihrer institutionellen Verankerung - davon nicht ausgenommen. Das Thema ist weitgefaßt und damit eigentlich innerhalb von einigen Seiten nicht befriedigend abzuhandeln. Ich beschränke mich deswegen auf drei wesentliche Repräsentanten bzw. Schulen. Zunächst werden die wesentlichen Ideen von Karl R. Popper, der den kritischen Rationalismus vertritt, dargestellt. Popper werden wir auch später noch einmal bei den statistischen Hypothesentests im letzten Teil dieses

III.4 Möglichkeiten und Grenzen der empirischen Sozialforschung

103

Buches begegnen. Dann wird auf Theodor W. Adorno von der sogenannten Frankfurter Schule eingegangen. Beide sind beteiligt gewesen an dem vor Uber 30 Jahren stattgefundenen sogenannten Positivismusstreit. Die dritte Gruppe ist schließlich die der Positivisten selbst. Wer die Diskussion über den Positivismusstreit im Detail verfolgen will, sei auf das "Buch zum Streit", nämlich die Sammlung der damals erschienenen Aufsätze und Vorträge verwiesen: Adorno u.a., Der Positivismusstreit in der deutschen Soziologie, Neuwied/Berlin 1969.

m . 4 . 2 Kritischer Rationalismus: Karl R. Popper "Nicht vom Beginn an enthüllten die Götter den Sterblichen alles; Aber im Laufe der Zeit finden wir suchend das Bess're. Sichere Wahrheit erkannte kein Mensch und wird keiner erkennen Über die Götter und alle die Dinge, von denen ich spreche. Sollte einer auch einst die vollkommenste Wahrheit verkünden, Wüßte er selbst es doch nicht: es ist alles durchwebt von Vermutung. " (Xenophanes, Leitspruch von Karl R. Popper) "So ist die empirische Basis der objektiven Wissenschaft nichts 'Absolutes'; die Wissenschaft baut nicht auf Felsengrund. Es ist eher ein Sumpf land, über dem sich die kühne Konstruktion ihrer Theorien erhebt; sie ist ein Pfeilerbau, dessen Pfeiler sich von oben her in den Sumpf senken - aber nicht bis zu einem natürlichen, 'gegebenen' Grund. Denn nicht deshalb hört man auf, die Pfeiler tiefer hineinzutreiben, weil man auf eine feste Schicht gestoßen ist: wenn man hofft, daß sie das Gebäude tragen werden, beschließt man, sich vorläufig mit der Festigkeit der Pfeiler zu begnügen. " "Die Theorie ist das Netz, das wir auswerfen, um 'die Welt' einzufangen, - sie zu rationalisieren, zu erklären und zu beherrschen. Wir arbeiten daran, die Maschen des Netzes immer enger zu machen. " [(t->p)pj->t Ist ρ aus t ableitbar und ist ρ falsch, so ist auch t falsch. (alle drei Zitate stammen aus: Karl. R. Popper, Logik der Forschung)

Vor etwa 400 Jahren begab man sich in Europa auf die Suche nach Naturgesetzen. Man wollte sich mit der Naturwissenschaft abgrenzen von anderen Systemen wie Glaube oder Tradition (obwohl in dem Wort 'Gesetz' noch das 'Gebot der Götter' mitschwingt). Es war damals die Zeit von z.B. Nikolaus Kopernikus (1473-1543), dem Zertrümmerer des ptolemäischen Weltbildes, von Johannes Keppler (1571-1630) mit seinen Gesetzen zur Planentenbewegung sowie von Galileo Galilei (1564-1642) mit seinen Fall- und Bewegungsgesetzen. Francis Bacon (1561-1626) beschrieb den methodologischen Hintergrund: Nur die Methode der Induktion, d.h. der Schluß vom Besonderen auf das Allgemeine, bringe Erkenntnisgewinn: Man stellt zunächst Beobachtungen an, die sukzessive verallgemeinert werden, die dann schließlich in allgemeine Gesetzmäßigkeiten Uber die Natur mUnden. Erste Zweifel an der Methode der Induktion bekam Hume (1711-1776). Er vertritt zwar ebenfalls die Meinung, daß Wissenschaft sich auf Erfahrung und Beobachtung zu stützen habe, doch mit der Induktion, so erfolgreich sie auch sein mag, handelt man sich das Dilemma ein, daß man aus noch so vielen Einzelbeobachtungen logisch nicht auf allgemeine Sätze schließen kann: Wenn bisher die Sonne immer morgens aufging, kann man daraus zwar vermuten, daß es auch morgen so sein wird, aber logisch ist dieser Schluß deswegen noch lange nicht. Die äußerst erfolgreiche Naturwissenschaft basiert demnach auf einem System, das weder aus der Erfahrung, noch aus der Logik sich ableiten läßt; aber ohne die Induktion gäbe

104

Kapitel III: Grenzen der Statistik

es unsere heutige Wissenschaft nicht. Daraus zog Hume den skeptischen Schluß: "Die Einsicht in die wahren Ursprünge und Ursachen aller Vorgänge bleiben dem Menschen völlig verborgen." Beobachten alleine genügt nicht, eine Theorie oder Wissenschaft aufzubauen. Beobachtungen setzen schon bestimmte Probleme, Interessen, Vermutungen, Fragestellungen voraus. "Die Aufgabe: 'Protokolliere, was Du eben erlebst!' ist nicht eindeutig (soll ich protokollieren, dafl ich eben schreibe, daß ich die Glocke, einen Zeitungsausrufer und einen Lautsprecher höre - oder daß ich mich darüber ärgere?); aber selbst wenn sie lösbar wäre: auch eine noch so reiche Sammlung solcher Sätze würde nie zu einer Wissenschaft führen. Wir brauchen Gesichtspunkte, theoretische Fragestellungen." (Dieses und die folgenden Zitate stammen aus Poppers Buch: Logik der Forschung, Tübingen 8. Aufl. 1984, hier S. 71.) Popper dreht den Spieß um, es gäbe keine "logische, rational nachkonstruierbare Methode, etwas Neues zu entdecken,... jede Entdeckung enthalte ein 'irrationales Moment', sei eine 'schöpferische Intuition' (S. 7). Die Theorien - wie immer sie auch zustande kamen - sind es also, die zuerst da sein müssen, und erst dann werden aus ihnen Folgerungen deduktiv abgeleitet, die möglichst so formuliert sein müssen, daß sie empirisch geprüft werden können. Das ist die Methode der Deduktion. Im einzelnen läuft die deduktive Methode zur Überprüfung von Theorien und den daraus abgeleiteten Folgerungen wie folgt ab: "der logische Vergleich der Folgerungen untereinander, durch den das System auf seine innere Widerspruchslosigkeit hin zu untersuchen ist; eine Untersuchung der logischen Form der Theorie mit dem Ziel, festzustellen, ob es den Charakter einer empirisch-wissenschaftlichen Theorie hat, also z.B. nicht tautologisch ist; der Vergleich mit anderen Theorien, um unter anderem festzustellen, ob die zu prüfende Theorie, falls sie sich unter den verschiedenen Prüfungen bewähren sollte, als wissenschaftlicher Fortschritt zu bewerten wäre; schließlich die Prüfung durch 'empirische Anwendung' der abgeleiteten Folgerungen" (S. 7/8). Bei der empirischen Überprüfung kommt einem die Asymmetrie des Veriflzierungsproblems zugute: Ein Satz kann niemals endgültig verifiziert, jedoch potentiell immer falsifiziert werden. "Bekanntlich berechtigen uns noch so viele Beobachtungen von weißen Schwänen nicht zu dem Satz, daß alle Schwäne weiß sind" (S. 3), aber es würde die Entdeckung eines einzigen schwarzen Schwans genügen, die Hypothese "Alle Schwäne sind weiß" zu widerlegen. 'Falsifizierbarkeit' ist also das Schlagwort: Fällt eine Überprüfung positiv aus, so wissen wir lediglich, daß das System die Prüfung vorläufig bestanden bzw. daß es sich vorläufig bewährt hat. Werden die Folgerungen allerdings falsifiziert, so trifft ihre Falsifikation auch das System, aus dem sie deduziert wurden. "Wir fordern zwar nicht, daß das System auf empirisch-methodischen Wege endgültig positiv ausgezeichnet werden kann, aber wir fordern, daß es die logische Form eines Systems ermöglicht, dieses auf dem Wege der methodischen Nachprüfung negativ auszuzeichnen: Ein empirisch-wissenschaftliches System muß an der Erfahrung scheitern können" (s.S. 15). Objektivität gewinnt diese Methode durch ihre Nachprüfbarkeit: "Die Objektivität der wissenschaftlichen Sätze liegt darin, daß sie intersubjektiv nachprüfbar sein müssen." (s.S. 18) Die populäre Ansicht, daß die Wissenschaften eine Sammlung von Tatsachen bzw. harten Facts sei, ist also falsch. Schon Gottfried Wilhelm Leibniz (1646-1716) erkannte, daß Erfahrungsdaten nur wahrscheinliche Ergebnisse sind: Eine Reihe von Beobachtungen läßt sich mit wahrscheinlich unendlich vielen verschiedenen Erklärungen in Verbindung bringen. Newtons Gesetze der Mechanik galten über 200 Jahre unangefochten, bis Einstein sie aus den Angeln hob. Vielleicht sind Newtons und Einsteins Hypothesen gleichermaßen falsch, aber bisher sind Einsteins Überlegungen nicht widerlegt worden. Interessant ist in diesem Zusammenhang, daß wir auf Newtons 'Gesetze' aufgrund ihrer Tauglichkeit für unsere normale Alltagswelt (noch) nicht verzichten können bzw. brauchen.

III.4 Möglichkeiten und Grenzen der empirischen Sozialforschung

105

Die Methode der Wissenschaft charakterisiert Popper als "die des tentativen Lösungsversuchs (oder Einfalls), der von der schärfsten Kritik kontrolliert wird. Es ist eine kritische Fortbildung der Methode des Versuchs und Irrtums ('trial and error1)" (siehe 'Positivismusstreit', S. 106). Die wissenschaftliche Objektivität leitet sich ab z.B. aus dem "Wettbewerb (sowohl der einzelnen Wissenschaftler wie auch der verschiedenen Schulen)" (S. 113) untereinander. Zur Methode und Objektivität wird im nächsten Kapitel noch etwas zu sagen sein. Zuvor soll noch auf die Popper-Kuhn-Kontroverse eingegangen werden. Thomas S. Kuhn stellt den Erkenntnisfortschritt generell in Frage (siehe sein Buch 'Die Struktur wissenschaftlicher Revolutionen'). Normalerweise steht die Wissenschaft innerhalb einer bestimmten Tradition; sie basiert auf den Konventionen bestimmter Kreise von Wissenschaftlern, die Wissenschaft wird zur Tradition, Schule bzw. Paradigma. Abweichende Meinungen haben normalerweise kaum Chancen, sich durchzusetzen. Dadurch wird die herrschende Meinung immun gegen die empirische Falsifikation. Allenfalls erhebliche Widersprüche können zu Krisen der herrschenden Wissenschaft führen, die dann in einer Art wissenschaftlicher Revolution - quasi eruptiv, 'Uber Nacht' - zu einem neuen Paradigma führen. Kuhn schreibt z.B.: "Wenn eine wissenschaftliche Theorie einmal den Status eines Paradigmas erlangt hat, wird sie nur dann für ungültig erklärt, wenn ein anderer Kandidat vorhanden ist, der ihren Platz einnehmen kann." Mit einem Seitenhieb auf Popper fährt er fort: "Kein bisher durch das historische Studium der wissenschaftlichen Entwicklung aufgedeckter Prozeß hat irgendeine Ähnlichkeit mit der methodologischen Schablone der Falsifikation durch unmittelbaren Vergleich mit der Natur." Die neue Theorie setzt sich an die Stelle der alten, um eine neue Schule zu begründen, die allerdings nicht unbedingt der Wahrheit näher gekommen zu sein braucht. Kuhn setzt also dem Popperschen Prozeß der eher graduellen Annäherung an die Wahrheit einen eher sprunghaften Prozeß von Theorie-Mutationen gegenüber - ohne Gewähr dafür, sich dadurch irgendwie irgendwann der Wahrheit zu nähern. Mit seine Worten: "...wir müssen vielleicht die - ausdrückliche oder unausdrückliche - Vorstellung aufgeben, daß der Wechsel der Paradigma die Wissenschaftler und die von ihnen Lernenden näher und näher an die Wahrheit heranführt."

ΙΠ.4.3 Frankfurter Schule: Theodor W. Adorno Die Gesellschaft ist widerspruchsvoll und doch bestimmbar; rational und irrational in eins, System und brüchig, blinde Natur und durch Bewußtsein vermittelt. Dem muß die Verfahrensweise der Soziologie sich beugen. Sonst gerät sie, aus puristischem Eifer gegen den Widerspruch, in den verhängnisvollsten: den zwischen ihrer Struktur und der ihres Objekts. " (Th. W. Adorno, Zur Logik der Sozialwissenschaften) "Mit der Ausbreitung der bürgerlichen Warenwirtschaft wird der dunkle Horizont des Mythos von der Sonne der kalkulierenden Vernunft aufgehellt, unter deren eisigen Strahlen die Saat der neuen Barbarei heranreift. " (Horkheimer/Adorno, Dialektik der Aufklärung) Es soll im folgenden der Versuch unternommen werden, nicht nur die Ideen von Adorno darzustellen, sondern sie auch gleichzeitig mit denen von Popper zu vergleichen. Liest man z.B. die beiden Referate von Popper und Adorno, die den sogenannten Positivismusstreit auslösten (siehe dazu und zu den folgenden Zitaten das entsprechende "Buch zum Streit", S. 103-143), so sind kaum Unterschiede zwischen den beiden festzustellen. Dahrendorf verwies jedoch auf die "Ironie solcher Übereinstimmungen... Die Diskussion brachte eine Reihe von amüsanten Belegen für Gemeinsamkeiten der Referenten in Formulierungen, hinter denen sich tiefe Differenzen in der Sache veibergen." (S. 146). Er schlägt vor, diese Unterschiede z.B. anhand folgender Kriterien zu untersuchen:

Kapitel III: Grenzen der Statistik

106

• • • •

ihr Verständnis von Natur- und Geisteswissenschaften die Rolle der Kritik die Rolle der Empirie ihre Erwartungen

Popper sieht zwischen Sozialwissenschaften und Naturwissenschaften Ähnlichkeiten. Sie stellen allgemeine Aussagen auf, um sie der Kritik zu stellen. Adorno dagegen sieht eher einen Gegensatz zwischen beiden Wissenschaften. Er begreift die Gesellschaft im Gegensatz zur Natur nicht nur als heterogen, sondern bis ins Tiefste hinein als widersprüchlich auf Grund einer durch den Menschen erschaffenen Organisationsform, die wiederum den Menschen nicht nur beeinflußt, sondern ihn bis ins Innerste formt bzw. verformt. Ein Mensch, der autonom der Umwelt gegenübersteht, ist somit lediglich eine abstrakte Idee. Diesen Menschen gibt es nicht. Ein Mensch ist nur gesellschaftlich definiert vorstellbar: Er mag heutzutage ein Arbeiter oder ein Unternehmer sein, zur Feudalzeit mag er ein Leibeigener oder ein Fürst gewesen sein, aber "den" Menschen an sich gibt es nicht. Die Gesellschaft mit ihren spezifischen Produktions- und Organisationsverhältnissen gibt zwar dem Menschen Arbeit, Nahrung, Wohnung, sie erhält ihn am Leben, aber gleichzeitig bedroht sie ihn mit psychischer und physischer Vernichtung. Die psychischen Aspekte stellt z.B. Herbert Marcuse in seinem Buch "Der eindimensionale Mensch" (Neuwied/Berlin 1967) heraus. Die physische Bedrohung braucht man an dieser Stelle ebenfalls nicht weitschweifend zu erklären, es sollen hier Stichworte wie Atombombe, Tschernobyl oder Bhopal reichen. Die Methodik von Naturwissenschaften und Soziologie müssen unterschiedlich sein. Besonders ausführlich begründet dies Adorno, wo er die positivistische Soziologie angreift: "Soziologie hat Doppelcharakter: in ihr ist das Subjekt aller Erkenntnis, eben Gesellschaft, der Träger logischer Allgemeinheit, zugleich das Objekt. Subjektiv ist Gesellschaft, weil sie auf die Menschen zurückweist, die sie bilden... Objektiv ist sie, weil auf Grund ihrer tragenden Struktur ihr die eigene Subjektivität nicht durchsichtig ist, weil sie kein Gesamtsubjekt hat... Solcher Doppelcharakter aber modifiziert das Verhältnis sozialwissenschaftlicher Erkenntnis zu ihrem Objekt, und davon nimmt der Positivismus keine Notiz. Er behandelt Gesellschaft, potentiell das sich selbst bestimmende Subjekt, umstandslos so, als ob sie Objekt wäre, von außen her zu bestimmen. Buchstäblich vergegenständlicht er, was seinerseits Vergegenständlichung verursacht und woraus Vergegenständlichung zu erklären ist. Solche Substitution von Gesellschaft als Subjekt durch Gesellschaft als Objekt macht das verdinglichte Bewußtsein der Soziologie aus." (Positivismusstreit, S. 43) Durch diese komplexe Sicht entsteht das grundsätzliche Dilemma, daß entscheidende Bausteine der Theorie sich der Quantifizierung entziehen. Die kritische Theorie hat dann "die durch die ... Zerlegung in Einzelprobleme verschwindenden Zusammenhänge mitzudenken und zu den Fakten zu vermitteln. Sogar wenn ein Lösungsversuch der 'sachlichen Kritik', wie Popper sie festsetzt, also der Widerlegung nicht ohne weiteres zugänglich ist, kann gleichwohl das Problem von der Sache her zentral sein... Begriffe wie der der Hypothese und der ihm zugeordnete der Testbarkeit sind von den Naturwissenschaften auf die von der Gesellschaft nicht blank zu übertragen." (S. 52/3) Irgend ein Faktum in der Gesellschaft läßt sich somit nicht isoliert verstehen von den gesellschaftlichen Bedingungen. Gesellschaft muß stets in ihrer Gesamtheit bzw. Totalität gedacht werden. "System und Einzelheit sind reziprok und nur in ihrer Reziprozität zu erkennen." (S. 127) Oder, ganz simpel: "Um zu wissen, was ein Arbeiter sei, muß man wissen, was kapitalistische Gesellschaft ist." (S. SS) Aus der umfassenden Sicht der Gesellschaft folgt das Rezept für Änderungen, wie es Adorno ganz drastisch beschreibt: "Wird jedoch in einer Gesellschaft, in der Hunger angesichts vorhandener und of-

III.4 Möglichkeiten und Grenzen der empirischen Sozialforschung

107

fensichtlich möglicher Güterftille jetzt und hier vermeidbar wäre, gleichwohl gehungert, so verlangt das Abschaffung des Hungers durch Eingriff in die Produktionsverhältnisse" (S. 74). Wie im letzten Kapitel dargestellt wurde, vertritt Popper die Meinung, daß wir Behauptungen oder Hypothesen Uber die Gesellschaft nicht induktiv, sondern nur deduktiv gewinnen können. Die so gewonnenen Hypothesen können nur falsifiziert werden, z.B. nach der Methode des trial and error. Adorno widerspricht nicht unbedingt diesen Thesen, aber er macht folgende Kommentare dazu: "Zögern würde ich,... den Grundsatz trial and error zu adoptieren; gerade er schleppt naturwissenschaftliche Assoziationen mit sich... Aber manche Gedanken, und am Ende die essentiellen, entziehen sich dem Test und haben doch Wahrheitsgehalt..., weil das Ganze, das die greifbaren Phänomene präformiert, selbst niemals in partikulare Versuchsanordnungen eingeht." (S. 133/4) Und, noch härter, hier allerdings primär gegen die Positivisten gerichtet: "Herrscht der methodologische Wille, Probleme eindeutig entscheidbar, falsifizierbar zu machen, unreflektiert vor, so schrumpft die Wissenschaft auf Alternativen zusammen, die nur durch Elimination von 'variables', also abstrahierend vom Objekt und dadurch es verändernd, herausspringen. Nach diesem Schema arbeitet der methodologische Empirismus in entgegengesetzter Richtung als Erfahrung." (S. 42) Beide, sowohl Popper als auch Adomo, haben einen weiten Theoriebegriff zulasten der Empirie. Dem Primat der Theorie muß sich die Empirie unterordnen, woraus ein wesentlicher Unterschied zu den Positivisten folgt. Die Aufgabe der Empirie ist für beide die kritische Korrektur der Theorie. Gerade bei Adorno ist dies allerdings ein Problem: Einerseits gilt es die Totalität der Gesellschaft zu erfassen, andererseits vermag die Empirie primär nur Fakten bzw. die in der Totalität enthaltene soziale Einzelphänomene und damit wohl kaum die Gesamtheit der Gesellschaft zu erfassen. Bei diesem Anspruch bleibt es nicht aus, daß das empirische Substrat verglichen mit dem theoretischen Anspruch nicht mehr als "Tropfen auf den heißen Stein" sind, während die empirischen Beiträge zu den zentralen Strukturgesetzen eher vage und damit "allemal anfechtbar" sind (S. 83) Ein weiteres Problem der Empirie ist, daß alle "untersuchten Gegebenheiten, die subjektiven nicht weniger als die objektiven Verhältnisse, durch die Gesellschaft vermittelt sind. Das Gegebene, die Fakten, auf welche sie ihren Methoden nach als auf ihr Letztes stößt, sind aber kein Letztes sondern ein Bedingtes" (S. 99) bzw. das "Erkenntnisproblem ... bleibt, daß die ermittelten Fakten nicht getreu die darunterliegenden gesellschaftlichen Verhältnisse spiegeln, sondern zugleich den Schleier ausmachen, durch den jene, und zwar notwendig, sich verhüllen." (S. 100) Beachtet man dies nicht, so kann man von empirischen Ergebnissen hinters Licht geführt werden: "Brächte ... eine Befragung die statistisch überwältigende Evidenz dafür bei, daß die Arbeiter sich nicht mehr für Arbeiter halten und leugnen, daß es so etwas wie Proletariat überhaupt noch gibt, so wäre der Beweis für die Nichtexistenz des Proletariates keineswegs geführt. Es müßten vielmehr solche subjektiven Befunde mit objektiven, wie der Stellung des Befragten im Produktionsprozeß, ihrer Verfugung oder Nichtverfügung über die Mittel der Produktion, ihrer gesellschaftlichen Macht oder Ohnmacht verglichen werden. Dabei behielten freilich die empirischen Befunde über die Subjekte durchaus ihre Bedeutung. Nicht bloß wäre ... zu fragen, wie derlei Bewußtseinsinhalte zustande kommen, sondern auch, ob durch ihre Existenz nicht an der sozialen Objektivität etwas Wesentliches sich geändert habe." (S. 98) Wie schon im letzten Kapitel erwähnt wurde, führt Popper an, daß durch verschiedene Mechanismen die Objektivität der Wissenschaften gesichert sei, so z.B. durch den Wettbewerb der Wissenschaftler untereinander. (S. 113) Dem entgegnet jedoch Adorno ganz vehement: "Die Fragwürdigkeit dieser Kategorien ist eklatant. So steckt in der des Wettbewerbs der gesamte Konkurrenzmechanismus mitsamt dem Funesten, von Marx Denunzierten, daß der Erfolg auf dem Markt vor den Qualitäten der Sache, auch geistiger Gebilde, den Primat hat." (S. 37) Und überhaupt sei ja die Wissenschaft "nicht nur gesellschaftliche Produktivkraft, sondern ebenso gesellschaftliches Produktionsverhältnis;... es rührt kritisch an die

108

Kapitel III: Grenzen der Statistik

Grundthese von der absoluten Eigenständigkeit der Wissenschaft, von ihrem konstitutiven Charakter für jegliche Erkenntnis." (S. 10) Adorno selbst hat am Ende seines Vortrags einen Vergleich zwischen seinen und Poppers Positionen angestellt: "Herr Popper h a t . . . die Verschiedenheit unserer Positionen so bezeichnet, daß er glaubte, wir lebten in der besten Welt, die je existierte, und ich glaubte es nicht. Was ihn anlangt, so hat er wohl... ein wenig übertrieben. Vergleiche zwischen der Schlechtigkeit von Gesellschaften verschiedener Epochen sind prekär; daß keine besser gewesen sei als die, welche Auschwitz ausbrütete, fällt mir schwer anzunehmen." (S. 141) Adorno fordert, und da ist er mit Popper wieder einig, Phantasie und Utopie. Er meint, daß nur derjenige, der eine Gesellschaft anders als die gerade existierende sich vorstellen kann, sie als Problem erkennen kann, wodurch Ansätze offenbar werden, wie sie möglicherweise verändert werden kann. Die Neigung gerade der Positivisten, auf eine Utopie zu verzichten, liegt nach Adorno wohl darin begründet, daß man sich nicht der Gefahr aussetzen will, zu erkennen, daß man nichts ändern kann. Ähnlich wie bei Popper entspringt die Richtschnur fur Utopie oder von dem, was noch nicht ist, "aus der Kritik, also dem Bewußtsein der Gesellschaft von ihren Widersprüchen und ihrer Notwendigkeit." (S. 139)

III.4.4 Die Positivisten "Kern der Kritik am Positivismus ist, daß er der Erfahrung der blind herrschenden Totalität ebenso wie der treibenden Sehnsucht, daß es endlich anders werde, sich sperrt... Den Positivisten ist das System... ein Erstrebenswertes, ... den Dialektikern ... der Kern des zu Kritisierenden. " (Th. IV. Adorno, Einleitung (zum Positivismusstreit)) Der Begriff Positivismus geht auf Auguste Comte (1798-1857) und sein Hauptwerk "Cours de philosophie positive" zurück. In neuerer Zeit wurde vom sogenannten Wiener Kreis der Neopositivismus begründet, dessen bekanntester Vertreter Rudolf Carnap (1891-1970) ist. Im folgenden werden die Positivisten aus der Sicht von Adorno dargestellt. Comte dachte ursprünglich daran, "die Erkenntnis vom religiösen Glauben und der metaphysischen Spekulation zu befreien. Indem man sich streng ans Tatsächliche hält, hofft man auf Objektivität nach dem Modell der einerseits mathematischen, andererseits empirischen Naturwissenschaften" (siehe Horkheimer/Adorno, Soziologische Exkurse, Frankfurt 1956, S. 9). Und weiter: "Es kommt ihr auf 'Exaktheit' an, nicht auf absolute Wahrheit oder die Realisierung einer gerechten Gesellschaft" (ebd., S. 11), "sie wollte wie die Naturwissenschaft von jeglicher Teleologie sich emanzipieren und mit regelhaften Kausalzusammenhängen sich zufriedengeben" (ebd., S. 14). Mit diesen Auffassungen der Positivisten geht Adorno hart ins Gericht: Gegen das Ziel der kritischen Theorie, die benennen will, "was insgeheim das Getriebe zusammenhält," bzw. die die Welt entzaubern, "den Stein aufheben (will), unter dem das Unwesen brütet,... sträubt sich die soziologische Tatsachenforschung. Entzauberung... ist ihr nur ein Spezialfall von Zauberei; die Besinnung aufs verborgen Waltende, das zu verändern wäre, bloßer Zeitverlust auf dem Weg zur Änderung des Offenbaren." (siehe wieder 'Positivismusstreit', S. 81/2) Er geht sogar noch weiter und wirft solcher Soziologie vor, zur Ideologie, zur Affirmation des Bestehenden zu verkommen: "Sobald die Soziologie sich ... bescheidet, zu registrieren und zu ordnen, was ihr Faktum heißt, und die dabei abdestillierten Regeln verwechselt mit dem Gesetz, das über den Fakten waltet und nach dem sie verlaufen, hat sie sich bereits der Rechtfertigung verschrieben, mag sie nichts davon ahnen." (S. 95)

III.4 Möglichkeiten und Grenzen der empirischen Sozialforschung

109

Trotz des Adornoschen Primats der Theorie lassen sich bei ihm verstreut einige anschauliche Beispiele finden. Generell werden den Positivisten bzw. der empirischen Praxis, wo die amtliche Statistik nicht auszunehmen ist, ihr Drang zum Klassifizieren vorgeworfen: "Von Anbeginn zerlegt die positivistische Soziologie die Subjekte nach den Sektoren der Gesellschaft, denen sie gleichzeitig angehören, wie Familie, Beruf, Religion, Partei, Wohngebiet. Es bleibt bei der klassifizierenden Aufzählung; die Interdependenz jener Bereiche wird nicht begriffen. Aus der Not des Verlustes eines Begriffs von der Gesellschaft wird die Tugend der Überschaubarkeit ihrer Teilgebiete gemacht." (Soziologische Exkurse, S. 12) Ulrich Beck z.B. formuliert das am Beispiel der Schichten wie folgt (siehe 'Risikogesellschaft', Frankfurt 1986, S. 140/1): "Der Schichtungsbegriff ist... ein Klassenbegriff im Abschiedszustand...Wäre doch gelacht! Die Wirklichkeit muß reinpassen! Die Begriffe etwas runder, weicher, offener ftlr alles das machen, was in sie nicht mehr hineinpaßt, aber ganz offensichtlich in sie hineingehört. Diese Wabbelmasse mit operationaler Superausstattung - das ist der 'moderne' Schichtungsbegriff. Ihm sieht man die Datenmassen an, die er so oder so - mit 'oberer Unteninterschicht' oder 'unterer Obermittelschicht' - verarbeiten ... muß... Da bleibt nur eines übrig: Daten von der Realitätsfrage abkoppeln! Sie irgendwie sortieren. Und das weiter 'Schichten' nennen." Weiter holt Adorno bei der Bestimmung der Kategorien 'Prestige bzw. Status' aus: "Wie wenig gleichgültig die Wahl der vermeintlichen Koordinatensysteme ist, läßt an der Alternative sich exemplifizieren, gewisse soziale Phänomene unter Begriffe wie Prestige und Status zu bringen oder sie aus objektiven Herrschaftsverhältnissen ableiten. Der letzteren Auffassung zufolge unterliegen Status und Prestige der Dynamik des Klassenverhältnisses und können prinzipiell als abschaflbar vorgestellt werden; ihre klassifikatorische Subsumtion dagegen nimmt tendenziell jene Kategorien als schlechthin Gegebenes und virtuell Unabänderliches hin. So inhaltlich konsequenzreich ist eine scheinbar bloß die Methodologie betreffende Unterscheidung." (Positivismusstreit, S. 14) Was für die Kategorien gilt, gilt erst recht auch für die Erhebungsmethodik: "Aber die gewonnenen Durchschnittswerte, mag auch ihre Gültigkeit objektiv sein, bleiben meist doch objektive Aussagen über Subjekte; ja darüber, wie die Subjekte sich und die Realität sehen. Die gesellschaftliche Objektivität, den Inbegriff all der Verhältnisse, Institutionen, Kräfte innerhalb dessen die Menschen agieren, haben die empirischen Methoden: Fragebogen, Interview und was immer an deren Kombination und Ergänzung möglich ist, ignoriert." (ebd., S. 84) Kein Wunder, daß dann die Empirie nicht mehr viel Substantielles zu bieten hat. Er mokiert sich geradezu über "die unzweifelhafte Irrelevanz so vieler empirischer Studien" (S. 86) bzw. über "jene zahllosen, lediglich der akademischen Karriere zuliebe durchgeführten Projekte..., bei denen die Irrelevanz des Objekts mit dem Stumpfsinn des Researchtechnikers glücklich sich verbindet" (S. 130). Damit verkennen die Positivisten, daß alles "mathematische Raffinement" bzw. die "Zurüstung von Wissenschaft zu einer Technik neben den anderen ihren eigenen Begriff unterhöhle." (S. 26)

ΠΙ.4.5 Ein Beispiel "Das Scheitern einer Ehe wird allgemein als ein privates Problem der Beteiligten betrachtet. Dabei ist auffällig, daß die Beschuldigungen weitaus mehr gegen die Frauen gerichtet sind, die sich auch häufiger selbst die Schuld für das Scheitern der Ehe geben... Die gesellschaftlich bedingten Rollenkonflikte, in die sie verstrickt sind, werden von ihnen häufig nicht erkannt und daher personalisiert. " (Brigitte Brück u.a., Feministische Soziologiej "Vieles, was sich Männer und Frauen heute noch um die Ohren schlagen, haben sie nicht persönlich zu verantworten..

Kapitel III: Grenzen der Statistik

110

Ehe läßt sich von Sexualität trennen, und die noch einmal von Elternschaft, die Elternschaft läßt sich durch Scheidung multiplizieren und das Ganze durch das Zusammen- oder Getrenntleben dividieren und mit mehreren Wohnsitzmöglichkeiten und der immer vorhandenen Revidierbarkeit potenzieren. Aus dieser Rechenoperation erhält man rechts vom Gleichheitszeichen eine ziemlich umfängliche, selbst noch im Fluß befindliche Ziffer, die einen leichten Eindruck von der Vielfalt von direkten und mehrfach verschachtelten Schattenexistenzen vermittelt, die sich heute hinter den gleichgebliebenen und so treuen Wörtchen Ehe und Familie immer häufiger verbergen. " (Ulrich Beck, Risikogesellschaft) "Das selbstbestimmte Individuum ist die frechste Lüge der Vernunft. " (Botho Strauß, Beginnlosigkeit) "Lebst Du mit ihr gemeinsam - dann fühlst du dich recht einsam. Bist du aber allein - dann frieren dir die Beine. Lebst du zu zweit? Lebst du allein? Der Mittelweg wird wohl das richtige sein. " (Kurt Tucholsky, Wie mans macht...) Zur gleichen Zeit ist auch seine Freundin bei ihrem Psychiater Freundin: Ständig. 3 Psychiater: Wie oft W.A.: Eigentlich kaum, Psychiater: Haben sie mal in der Woche unschlafen sie zuoft Verkehr? vielleicht 3 mal in der gefähr. Gestern wollte sammen? Woche. Z.B. gestern, er auch schon wieder da wollte sie auch nicht mit mir schlafen. mit mir schlafen. (Aus dem Film 'Der Stadtneurotiker' von und mit Woody Allen) Woody Allen bei seinem Psychiater

"Kurzzeitige Wortgefechte, die zu Lärmbelästigungen führen, sind sozial adäquat und von den übrigen Hausbewohnern hinzunehmen. Diese Art der Äußerungen gehört natürlicherweise zum menschlichen Erscheinungsbild und ist mehr oder minder Bestandteil einer kommunikativen Begegnung von Menschen, insbesondere von Ehepartnern. Gerade bei letztgenannten sind Streitigkeiten verbaler Natur häufiger anzutreffen, da sich aus dem Miteinander in der Ehe naturgemäß eher Konflikte ergeben, die durch lautstarke Auseinandersetzungen ausgetragen werden, ohne daß ein außenstehender Dritter dies als Störung im Sinne des nordrheinwestfälischen Immissionsschutzgesetzes empfindet. " (Aus einem Urteil des Amtsgerichtes Düsseldorf, zitiert aus dem Hohl-SPIEGEL 8/1992)

Nach diesem Gewaltmarsch durch die Wissenschaftstheorie mit den intellektuellen Schwergewichten Adorno und Popper soll nun an einem Beispiel aufgezeigt werden, wie eine die Grundprinzipien sozialen Geschehens und Abhängigkeiten andeutende Analyse, also "über die Dinge, die das Getriebe zusammenhalten", aussehen könnte. Als Beispiel habe ich mir die Partnerbeziehungen herausgegriffen. Zu diesem Thema gibt es natürlich Unmengen von Literatur, vom reinsten Positivistischen bis hinein ins Deutende jeglicher Couleur. Hier seien aber nur ein paar genannt wie z.B. Brigitte Brück u.a. mit ihrer 'Feministischen Soziologie' (Frankfurt u.a. 1992) sowie Ulrich Beck mit seiner 'Risikogesellschaft - Auf dem Weg in eine andere Moderne' (Frankfurt 1986). Altmeister Adorno darf da natürlich fürs Grundsätzliche auch nicht fehlen. Es ist nun nicht so, daß es massenhaft positivistische Literatur gäbe, die nur nackte Daten unkritisch zusammenfügt, um dies Analyse zu nennen. So gibt es einen weiten Bereich der Statistik, der zunächst einmal deskriptiv einen Überblick über Sachverhalte zu geben versucht. Man kann schließlich nicht gleich mit einer Theorie bzw. Analyse ins Haus fallen, ohne auch nur die geringste Ahnung von Größenord-

III.4 Möglichkeiten und Grenzen der empirischen Sozialforschung

111

nungen zu haben, auch auf die Gefahr hin, daß die vorhandenen Daten schon durch die Art der Fragestellung oder durch die Art der Datenerhebung sowie -darstellung verzerrt sein könnten. Statistische Jahrbücher sind so immer die erste und beste Quelle, um einen Überblick zu einem Thema zu bekommen. Weitere Veröffentlichungen zum Thema z.B. auch vom Statistischen Bundesamt sind da sehr informativ. So sind z.B. in den letzten Jahren einige interessante Aufsätze zum Thema Ehe, Familie, Partnerbeziehungen erschienen: • • •

Hannelore Pöschl, Formen des Zusammenlebens, Wirtschaft und Statistik 10/1989 dies., 'Singles* - Versuch einer Beschreibung, Wirtschaft und Statistik 10/1990 Bretz/Niemeyer, Private Haushalte gestern und heute, Ein Rückblick auf die vergangenen 150 Jahre, Wirtschaft und Statistik 2/1992

Die Aufgabe des Statistischen Bundesamtes ist natürlich primär die Datenproduktion, aber das heißt nicht, daß dort nicht auch noch hervorragende Analysen gemacht werden, die sich vom positivistischen Datenkaleidoskop erheblich unterscheiden. Bedenklicher ist da eher, wenn spezialisierte Institute, deren Schwergewicht nicht auf der Datenproduktion, sondern auf der Interpretation liegt, über mehr schlechte als rechte Tabellenkommentierungen zum Thema der Partnerbeziehungen oder irgendwelchen anderen Themen nicht hinaus kommen. Natürlich maße ich mir nicht an, alles besser machen zu können. Trotzdem will ich in den folgenden zwei Übersichten versuchen, zunächst einmal die "harten facts" in Form von Trendaussagen zum Thema Familie, Ehe und Partnerbeziehungen und deren Einbettung in größere soziale Aspekte wie Ausbildung oder Arbeitsmarkt darzustellen. Dabei beziehe ich mich auf die überall verfügbaren Daten z.B. aus Statistischen Jahrbüchern. Schon eine Zusammenstellung wie diese gibt ein 'lebendiges' bzw. facettenreiches Bild von Tendenzen, wo man eigentlich schon über jede einzelne von diesen sich sehr intensiv auseinandersetzen könnte. Durch die synoptische und dazu auch noch sehr knappe Darstellung setze ich mich natürlich dem Vorwurf aus, dem positivistischen Klassifizierungszwang erlegen zu sein bzw. den Versuch zu machen, alles 'Reale' in die 'richtige' Schublade pressen zu wollen. Doch die Alternative wäre, entweder ein eigenes dickes Buch über dieses Thema zu schreiben oder es ganz zu lassen. Zu Demonstrationszwecken scheinen mir aber diese beiden Übersichten durchaus vertretbar. Es geht hier nicht um eine erschöpfende Analyse, sondern nur um die Andeutung des Prinzips, wie man positivistischem Flachsinn begegnen könnte. Wer durch diese zwei Übersichten Appetit auf ausfuhrlichere Literatur bekommen hat, der soll z.B. mit den beiden vorhin schon erwähnten Büchern von Brück und insbesondere Beck und die dort angegebene Literatur beginnen. Ein Blick in die schöngeistige Literatur kann auch nicht schaden. So wurde das schon seit Jahrzehnten zeibröselnde Ideal der bürgerlichen Ehe z.B. bei dem Skandinavier Henrik Ibsen (1828-1906) thematisiert, z.B. mit Nora, die aus ihrem "Puppenheim" ausbricht. Im zweiten Schaubild soll - wie auch durch einige Zitate am Anfang dieses Kapitels angedeutet wird - vor allem klar werden, daß viele Probleme zwischen den Partnern von externen Verhältnissen abhängen. So erfordern die "Zwänge" - also der Markt - einen Trend zur Individualisierung, was oft als Drang zur Verwirklichung des Ichs interpretiert wird. Damit dringt der Marktmechanismus bis in die bisher eher marktfreien Beziehungen in Familie und Ehe ein. Dies hat wie kein zweiter mein fast-Namensvetter, Gary S. Becker, erkannt, wofür er auch 1992 mit dem Wirtschafts-Nobelpreis ausgezeichnet wurde. Nach ihm handelt "jeder" Mensch zweckorientiert, als "homo oeconomicus". Jede Aktion, sei es die Entscheidung um eine bessere Ausbildung (= Bildung von Human-"kapital"!>, sei es Heirat oder Kinder bekommen oder Scheidung, ja selbst die Entscheidung, ein

112

Kapitel III: Grenzen der Statistik

Verbrechen zu begehen, hängt nach G. S. Becker davon ab, welchen Nutzen, i.d.R. in Geld bemessen, das Individuum mittel- und langfristig darin sieht. Unternehmen handeln danach, und nach G. S. Becker tun dies auch Haushalte und Einzelpersonen, weil sie stets ertrags-, einkommens-, Vermögens- oder schlicht: nutzenmaximierend handeln. Insofern hat G. S. Becker seine Zeit des Forschens "sinnvoll" verbracht, denn "mit diesem Preis und vor allem mit der damit verbundenen monetären Gratifikation (hat er) den zentralen Baustein seiner theoretischen Arbeiten gleichsam praktisch werden lassen" - wie die taz zur Preisverleihung am 14.10.1992 so herrlich kommentierte. Die Verinnerlichung des Marktprinzips und dessen Relevanz sogar bei sensiblen, intimen Entscheidungen hat die FAZ - ebenfalls am 14.10.1992 - zu der Überschrift veranlaßt: "Der Gatte als Vermögensobjekt." Die Familie gilt bei G. S. Becker als Mini-Fabrik. Mathematisch elegant läßt sich so z.B. nachweisen, warum bei steigenden Löhnen die Kinderzahl sinkt, denn nun wird es attraktiver, daß beide Ehepartner arbeiten gehen und das höhere Einkommen in die Ausbildung ihrer (nun geringeren Anzahl von) Kinder stecken. In den vom Markt gebeutelten Menschen verpflanzt G. S. Becker die Marktgesetze, er zieht ihnen ein rationales Gerüst in Form des Nutzenkalküls ein. Heureka! Ehe-Dramen sind nun passé, die Welt ist wieder in Ordnung. Alle Widersprüche zwischen Markt und Mensch sind weggebügelt; ist ja klar, denn anders würde der "Mensch" nicht in seine Formelwelt passen.

III.4 Möglichkeiten und Grenzen der empirischen Sozialforschung

1J 3

Familie, Partnerbeziehungen, Rollenverteilungen I: Statistische Trends ("facts") Merkmal, Kategorie Geschlechterverhältnis allgemein

Familie, Ehe

Liebe, Sexualität Fertilität Ausbildung

Arbeit, Beruf, Mobilität

Einkommen Arbeitslosigkeit

Soziale Sicherung

Recht Partizipation

Beschreibung von ausgewählten statistischen Trends der letzten Jahre 'Kampf der Geschlechter 'Man' gesteht der Frau theoretisch mehr Freiräume in Bildung, Familie, Beruf ein, aber de facto schließt 'man' aus Mutterrolle immer noch mehrheitlich auf die 'typische' Frauenrolle als Erzieherin, Köchin, und 'man' legt im Zweifel immer noch Berufsverzicht bzw. Unterordnung im Beruf nahe Doppelbelastung der Frau, sinkende Heiratsziffern, steigende ScheidungszifFern abnehmende Familiengröße (Dinks: "Double Income - no kids") Trend zu 'unvollständigen' Familien, Trend zum Einpersonenhaushalt Trend zu nichtehelichen flexiblen Formen des Zusammenlebens Verändertes Verständnis von Liebe, Treue, Partnerschaft trotzdem weiter Wunsch nach stabiler Partnerschaft sinkende Geburtenziffern Bildungswelle, Trend zur 'höheren' Ausbildung Hauptschulabschluß allein reicht nicht mehr Angleichung der Bildungschancen und -niveaus zwischen den Geschlechtern steigende Anteile von Frauen in bisher 'typischen' Männer-Fachrichtungen trotzdem noch z.T. stark unterschiedliche Geschlechterproportionen je Fachrichtung Steigende Akademisierung Steigender Anteil von erwerbstätigen Frauen trotzdem gibt es noch die 'typischen' Männerberufe Vollzeit- und lebenslange Beschäftigungsverläufe sind weiter 'typisch' männliche Erweibsbiographien steigende Teilzeitaibeit, ist aber fast ausschließlich Frauensache Zunahme (trotz statistischer Untererfassung) von 'kleinen' und damit eher von Frauen ausgeübten Beschäftigungen Rationalisierungsgefahr besonders bei Frauenberufen Zunahme der regionalen, sektoralen oder hierarchischen Mobilität Weiter ungleiche Entlohnung von Mann und Frau hohe Sockelarbeitslosigkeit hoher Frauenanteil sowie von anderen benachteiligten Gruppen vermutlich hohe Dunkelziffer vermutlich hohe Unterbeschäftigung Gleichstellung von Mann und Frau im Rentenrecht Anerkennung von Erziehungszeiten relativ viele alleinerziehende Frauen sind Sozialhilfeempfänger neues Scheidungsrecht (Zerrüttungsprinzip) neues Namensrecht Zunehmender Frauenanteil in Parlament/Regierung/Parteien/Verwaltung trotzdem noch eklatantes Ungleichgewicht zwischen den Geschlechtern

Π4

Kapitel III: Grenzen der Statistik

Familie, Partnerbeziehungen, Rollenverteilungen II: Hintergrund-Analyse Versuch einer schematischen sozio-ökonomischen Hintergrund-Analyse gegenwärtige und mögliche zukünftige Tendenzen Beginn der Industrialisierung Produktionsverhältnisse: • Macht des Marktes: Befreiung aus feudaler AbMarktsystem ist sehr erfolgreich und dringt zunehmend in die bisher hängigkeit ('freie' Individuen) war 'marktfreien' Bereiche wie z.B. der Familie ein. Bedingt Voraussetzung für IndusZwang/Wunsch nach Lockerung der strikten Rollenzuweisungen trialisierungsprozeß unter kapizwischen den Geschlechtern. talistischen Produktionsverhältnissen. • Bildung/Arbeitsmarkt: Marktgesetze gelten nur im Beruf Der 'Run' insb. der Frauen in die Bildungsinstitutionen und auf den (Trennung von Aibeit und Kapital, Arbeitsmarkt hebelt die traditionale Rolle der Familie aus und Konkurrenz, Bezahlung nach gefährdet die bisherige Organisation von Produktion und ReLeistung, Mobilität). produktion bzw. Regeneration. Der erfolgreiche Markt gefährdet so seine eigene Basis. Frauen werden auf dem Arbeitsmarkt nicht voll absorbiert, Versuch • Enklaven: des Abdrängens in untere Hierarchien, Unterbeschäftigung, ArDagegen funktioniert die Familie beitslosigkeit sowie - in Kombination mit Scheidung - Arweiter nach traditionalen/feudalen Grundsätzen (Aufopferung für den mut/Sozialhilfe. anderen, unentgeltliche Erziehung, 'Zurück zum Herd' ist der Frau immer weniger möglich, da der Trend zum 'marktgerechten Single' die Funktion der Familie aushöhlt. Betreuung und Pflege, emotionale Primär bei Männern Aufweichung der lebenslangen Standard-VollZuneigung). Der Markt braucht seine Enklaven, zeit-Erwerbsbiographie durch Teilzeit-, Sonntags-, Nacht-, Saison-, Heimarbeit (Computer!) sowie Sabbatical, freie Mitarbeit. denn Beruf und Familie bedingen Verrentung, Unterbeschäftigung, Arbeitslosigkeit, Armut trifft nicht und ergänzen sich bzgl. mehr Klasse oder Schicht, sondern Individuen, die dies subjektiv als Produktion (im Betrieb) sowie eigenes Versagen fehlinterpretieren. Reproduktion und Regeneration (in der Familie). • Identität/Partnerbeziehungen: • Feste Rollenzuweisungen: Die Suche beider Geschlechter nach der eigenen Identität/ EmanzipaDefinition des Mannes primär tion/Selbstverwirklichung entpuppt sich als Verinnerlichung der durch Beruf, woraus Abwertung Markterfordernisse nach dem 'freien', möglichst bindungslosen bzw. anderer, sogenannter flexiblen/mobilen Individuum. 'unproduktiver' Tätigkeiten, so Außerdem Gefährdung des Einzelnen durch Standardisierung via auch im Haushalt, folgt, was unFreizeit- und Medien-Industrie. mittelbar auch die Rolle der Angst vor Alleinsein und der eigenen Leere fördert dagegen wieder Frau/Mutter quasi naturgesetzlich 'Flucht in die Zweisamkeit', wobei diese objektiv immer weniger festlegt. halten kann, was sie subjektiv soll. Dieser Zirkel ist der Motor des Trends zu Schrumpffamilien, zu neuen • Zunehmende Zwänge: Formen des Zusammenlebens, Scheidung, Wiederheirat (mit oder Knappe Einkommen, Wohnungsohne Kind) usw., wandelt die scheinbar naturgegebene Ein-Ehe-einsituation, Kosten der KindererKind-ein-Haus-Biographie zunehmend in eine multiple Beziehungsziehung, sonstiger Konsum, Mobiographie. bilität usw. erfordern Trend zur Kinder 'stören' in diesem System zunehmend. Kleinfamilie und Aufweichung Die gesellschaftlichen Konflikte werden in Zweieibeziehungen hineinanderer sozialer Netze wie Vergetragen und dort vergeblich zu lösen versucht. Psychiatrie, Familienwandtschaft oder Freundschaft. therapie o.ä. sind so gesehen Sackgassen.

III.4 Möglichkeiten und Grenzen der empirischen Sozialforschung

115

m.4.6 Die Unlogik der Forschung "Den kleinen Unterschied zwischen Sicherheit und wahrscheinlicher Sicherheit trennen Welten. Im Atomzeitalter hängt daran das Überleben aller. "

Möglicherweise anspielend auf Poppers Buch "Logik der Forschung" hat Beck eine "Unlogik der Forschung" skizziert. Hintergrund sind gewandelte Bedingungen der Forschung angesichts von GroßTechnologien wie Atom oder Chemie bzw. angesichts des sich androhenden Großeinsatzes der Gen-Technologie. Sie zeichnen sich u.a. dadurch aus, daß sie mit hohem Kapitaleinsatz ausgestattet, aber auch mit hohen Risiken verbunden sind; dies hat wieder Einfluß auf die Qualität des Forschungsprozesses sowie seine Forschungslogik. So ist die Sicherheit eines Atomkraftwerks nicht im Labor zu simulieren. Tritt der unwahrscheinliche GAU doch ein, dann wird keiner mehr da sein, um dies zu registrieren. In seinem Buch "Gegengifte" (Frankfurt 1988, S. 204 ff.), aus dem auch das Zitat am Anfang dieses Kapitels stammt, hat Beck seine Kritik an der Wissenschaft im Rahmen der Groß-Technologie in Thesen zusammengefaßt. Schon sein erster von 10 Sätzen hebt einen Kernsatz der Popperschen Forschungslogik, nämlich die Überprüfbarkeit von Hypothesen, aus den Angeln: "Die scheinbar so selbstverständliche Übertragung des naturwissenschaftlichen Vorgehens auf Großgefahren hat unter der Hand die Grundlagen der naturwissenschaftlichen Experimentierlogik außer Kraft gesetzt. Es handelt sich um nicht weniger als eine klassische Falsifikation (im streng Popperschen Sinne) der Logik der Forschung selbst: (1) Hypothesen über Sicherheitsfragen von Großgefahren sind experimentell nicht überprüfbar. Die größtmögliche Gefahr setzt die Grundlagen der bisherigen wissenschaftlichen Sicherheit außer Kraft. (2) Die Welt wird zum Labor. Die Menschheitsexperimente, die veranstaltet werden, entziehen sich dem naturwissenschaftlich-technischen Zugriff. Das Experiment und sein Ausgang sind (ähnlich dem Unfall) unabschließbar geworden - räumlich und zeitlich ebenso wie international und interdisziplinär offen, nicht zurechenbar in Folgen und Fehlern. (3) Damit hat die Naturwissenschaft ihre exklusive Beurteilung dessen, was ein Experiment besagt, aufgegeben. Die Forschung wurde sozusagen implizit vergesellschaftet. Die Öffentlichkeit, die Regierungen, die Bestandteil des Experimentes sind, nehmen interne Mitsprachen in Anspruch. Realexperimente, wie die Beurteilung atomarer, chemischer und genetischer Gefahren, sind in einem prinzipiellen Sinne zweideutig, zweideutbar geworden: wissenschaftlich kontrollierte Empirie und öffentliche Erfahrung brechen auseinander, konkurrieren und ringen miteinander um die Interpretation der Ergebnisse. (4) Ebenso wie das Laborexperiment haben die Großgefahren auch den Unfall abgeschafft - jedenfalls als räumlich-zeitlich eingrenzbares Ereignis. Entsprechend entstammen auch die Maßstäbe, in denen die Gefährlichkeit der Gefahr gemessen wird - Tote, Verletzte usw. -, einem anderen Jahrhundert, und die Berechnungsgrundlagen für Unfallstatistiken sind Makulatur. Die Toten von Tschernobyl werden nie gezählt werden. Sie sind auch zum größten Teil noch gar nicht gestorben. Generationen und Länder, die von dem Ereignis selbst kaum noch etwas wissen, werden die unüberschaubaren Langzeitzerstörungen, die dieser 'Unfall' ausgelöst hat, mit ihrem Leben und ihrer Gesundheit bezahlen müssen. (5) Die möglicherweise alle Ausgangshypothesen widerlegenden Folgen werden ihrerseits interdisziplinär verwaltet und öffnen damit der methodenabhängigen Be-, Ver- und Umrechnung Tor und Tür. Innerwissenschaftliche Entscheidungen, statistische Verfahren und Definitionen entscheiden wesentlich mit darüber, ob und in welchem Ausmaß die anonymen Folgen aus ihrer Vereinzelung (Krebs, Leukämie usw.) befreit werden... Eine Untersuchung über den Zusammenhang von Kinderkrebs und Strahlungs-

116

Kapitel III: Grenzen der Statistik

dichte in Großbritannien, durchgeführt von einer Medizinerin, gewinnt für das Weltexperiment Kernenergie die Bedeutung, die früher einem internen Labortest zukam. Umgekehrt müßten Folgen erst im 'statistischen Ringkampf aus ihrer globalen Anonymisierung befreit werden. (6) Die wissenschaftliche Kalkulation von Risiken bleibt in einen Zirkel der technischen Beherrschbarkeit eingebunden. Die Abstraktheit des Kalküls gegenüber besonderen Technologien garantiert die Vergleichbarkeit; die Vergleichbarkeit mit bereits akzeptierten Technologien garantiert die Kalkulierbarkeit, die aber gerade deswegen nicht überprüfbar zirkulär vorausgesetzt werden muß, erzwingt die Negation des nie Auszuschließenden; den Dogmatismus. (7) Die technische Beherrschbarkeitsannahme schlägt angesichts von Gefahren, die sich technisch nicht ausschließen, nur minimalisieren lassen, in technologische Irrationalität um. (8) Das ganze Weltexperiment wird von Anfang bis Ende auf der Grundlage von Wahrscheinlichkeiten berechnet und ausgewertet, die unwahrscheinliche Gegenfälle in Bestätigungen umzuwandeln erlauben und überhaupt erst in Zeiträumen, die sowohl die Lebensspanne eines Menschen als auch sein Vorstellungsvermögen bei weitem übersteigen, 'signifikanten' Überprüfungen zugänglich wären. (9) Forschung muß einen Pakt mit dem Kapital eingehen, über dessen Ent- oder Verwertung mit den Ergebnissen entschieden wird. Mit der potentiellen Widerlegung der Ursprungsannahmen wackeln Regierungen, drohen Entschädigungslawinen, und nicht zuletzt der Glaube an die Erkenntnisfähigkeit der Technikwissenschaflen schmilzt dahin. (10) Alle Zäune zwischen Theorie und Praxis, Unzuständigkeitßr Folgen, wertfreie Überprüfung von Theorie, handlungsentlasteter Freiraum für Forschung werden niedergerissen, bestimmen nicht mehr die Wirklichkeit, nur noch die Vorstellung.

Literarischer Anhang

117

Literarischer Anhang Fälschung I Wenn man als Tourist in der Trümmerlandschaft von Beirut gestanden hat, vermag man nicht zu erfassen, was sich während des Krieges in dieser Stadt abgespielt haben mag. Wie selbstverständlich grenzen dort heute zerschossene Häuser, halb zusammengefallen, teilweise wieder - wo es nur gerade geht - bewohnt in den oberen Stockwerken oder von ambulanten Händlern belegt in den Erdgeschossen, an völlig intakte Viertel. Anders als quantifizierende Statistiker vermögen Schriftsteller oder Journalisten wohl eher, auch ungewöhnliche Umstände noch irgendwie in Worte zu fassen und nicht Dabeigewesenen etwas vom Geschehen zu vermitteln, aber in Beirut hat anscheinend so mancher verbal kapitulieren müssen. Es dürfte auch nicht ausgeschlossen sein, daß mancher Journalist das Geschehene etwas freier dargestellt haben mag als andere. Von diesen und anderen Aspekten handelt das Buch 'Die Fälschung' von Nicolas Born, aus dem folgende Zitate entnommen sind: "Was war an den Fotos von arbeitslosen Werftarbeitern nicht in Ordnung? Das Problem Arbeitslosigkeit? Schön, Arbeitslosigkeit war nicht in Ordnung. Vielleicht waren alle Fotos von der Wirklichkeit nicht in Ordnung, falsch, alle Sätze über die Wirklichkeit falsch. Es passierte dabei etwas mit der Wirklichkeit, mit den Gesichtern der Arbeitslosen, mit dem falschen Auge, dem verdrehten, das die Bilder aufnahm, mit den bösen verdrehenden Beschreibungswörtern, die etwas herstellten, wie sie damit etwas verschlimmerten und auch verbesserten, nebenbei andeuteten, ob und wie noch Geschäfte zu machen seien in jener (jener!) Wirklichkeit... Er haßte die eigenen Bericht, ohne bisher mit dem H aß in sich zu dringen, er haßte sie besonders, wenn sie fertig waren und gedruckt, dann sah er sich selbst in den Sätzen sitzen und feixen, obszöne zweideutige Winke geben, sich hindurchwagen und -lügen durch ein Lügengewebe, sich hindurchschlagen und hindurchbehaupten, schwören, etwas gesehen zu haben, jenen Tod, jene Wunde, er, ein einzelner, mitgestorben zu sein, hineingestarrt zu haben in die Gefahr, in den unverständlichen Abgrund. Wieder lauter erklärende und klarmachende Sätze, Mischungen, da stand es. Wie er turnte. Wo war das Wichtige? Und wie er das Wichtige haßte, wie er es haßte, den Tod, der so etwas wie eine Vergeßlichkeit war, hinüberzuretten in ein Weiterleben, das ein Weiterlesen war, ein Kannibalismus, ein Dabeisein ohne Dasein. Abgeschmackt. " (Nicolas Born, Die Fälschung)

118

Kapitel III: Grenzen der Statistik

Fälschung Π Winston schaltete auf dem Televisor 'Frühere Nummern' ein und verlangte die entsprechenden Ausgaben der Times, die schon nach ein paar Augenblicken aus der Rohrpostanlage herausglitten. Die Botschaften, die er erhalten hatte, bezogen sich auf Zeitungsartikel oder Meldungen, die aus diesem oder jenem Grunde zu ändern oder, wie die offizielle Phraseologie lautete, richtigzustellen för nötig befunden wurde. So ging z.B. aus der Times vom ¡7. März hervor, daß der Große Bruder in seiner Rede am Tage vorher prophezeit hatte, die Südindien-Front würde ruhig bleiben, aber in Nordafrika würde bald eine eurasische Offensive losbrechen. In Wirklichkeit jedoch hatte das eurasische Oberkommando seine Offensive in Südindien angesetzt, und in Afrika hatte Ruhe geherrscht. Deshalb mußte eine neue Fassung von der Rede des Großen Bruders geschrieben werden, die eben das voraussagte, was wirklich eingetreten war. Im zweiten Falle hatte die Times vom 19. Dezember die offiziellen Voraussagen der Produktion verschiedener Gebrauchsgüter während des vierten Quartals von 1983 publiziert, das gleichzeitig das 6. Quartal des neunten Dreijahresplans war. Die heutige Ausgabe enthielt einen Bericht der tatsächlichen Produktion, aus der hervorging, daß die Voraussage in jeder Sparte grob unrichtig waren. Winstons Aufgabe bestand nun darin, die ursprünglichen Zahlen richtigzustellen, indem er sie mit den späteren in Übereinstimmung brachte. Was die dritte Botschaft betraf, so bezog sie sich auf einen ganz einfachen Irrtum, der in ein paar Minuten eingerenkt werden konnte. Noch im Februar hatte das Ministerium für Überfluß ein Versprechen verlautbaren lassen (eine 'kategorische Garantie' hieß der offizielle Wortlaut), daß während des Jahres 1984 keine Kürzung der Schokoladeration vorgenommen werden würde. In Wirklichkeit sollte, wie Winston nun wußte, Ende dieser Woche die Schokoladeration von dreißig auf zwanzig Gramm herabgesetzt werden. Man brauchte nun nichts weiter zu tun, als statt des ursprünglichen Versprechens eine warnende Äußerung zu unterschieben, daß es vermutlich nötig sein würde, die Ration im Laufe des Monats April zu kürzen. Nachdem Winston von jeder der Botschaften Kenntnis genommen hatte, heftete er seine sehsprechgeschriebenen Korrekturen an die jeweilige Ausgabe der Times und steckte sie in den Rohrpostzylinder. Dann knüllte er, mit einer fast völlig unbewußten Bewegung, die ursprüngliche Meldung und alle von ihm selbst gemachten Notizen zusammen und warf sie in das Gedächtnis-Loch, um sie von den Flammen verzehren zu lassen. Was in dem unsichtbaren Labyrinth geschah, in dem die Rohrpoströhren zusammenliefen, wußte er nicht im einzelnen, sondern nur in groben Umrissen. Wenn alle Korrekturen, die in einer Nummer der Times nötig geworden waren, gesammelt und kritisch miteinander verglichen worden waren, wurde diese Nummer neu gedruckt, die ursprüngliche vernichtet und an ihrer Stelle die richtiggestellte Ausgabe ins Archiv eingereiht. Dieser dauernde Umwandlungsprozeß vollzog sich nicht nur an den Zeitungen, sondern auch an Büchern, Zeitschriften, Broschüren, Plakaten, Flugblättern, Filmen, Liedertexten, Karikaturen an jeder Art von Literatur, die irgendwie von politischer oder ideologischer Bedeutung sein konnte. Einen Tag um den anderen und fast von Minute zu Minute wurde die Vergangenheit mit der Gegenwart in Einklang gebracht. Auf diese Weise konnte ftir jede von der Partei gemachte Vorhersage der dokumentarische Beweis erbracht werden, daß sie richtig gewesen war; auch wurde nie geduldet, daß man eine Verlautbarung oder Meinungsäußerung aufhob, die den augenblicklichen Gegebenheiten widersprach. Die ganze Historie stand so gleichsam auf einem auswechselbaren Blatt, das genausooft, wie es nötig wurde, radiert und neu beschrieben werden konnte. In keinem Fall wäre es möglich gewesen, nach Durchführung des Verfahrens nachzuweisen, daß eine Fälschung vorgenommen worden war. Die größte Gruppe der Abteilung Registratur, weit größer als die Winstons, bestand aus Personen, deren Aufgabe lediglich war, alle Ausgaben von Büchern, Zeitungen und anderen Druckerzeugnissen ausfindig zu machen und zu sammeln, die außer Gebrauch gesetzt und vernichtet werden mußten. Eine Nummer der Times, die vielleicht infolge von Änderungen in der politischen Gruppierung oder der vom Großen Bruder ausgesprochenen irrtümlichen Prophezeiungen ein dutzendmal neu abgefaßt worden war, stand noch immer mit ihrem ursprünglichen Datum versehen in ihrem Regal, und es gab auf der ganzen Welt keine andere Ausgabe, die mit ihr in Widerspruch hätte stehen können. Auch Bücher wurden immer wieder aus

Literarischer Anhang

119

dem Verkehr gezogen und neu geschrieben und ohne jeden Hinweis auf die vorgenommenen Veränderungen neu aufgelegt. Sogar die geschriebenen Weisungen, die Winston erhielt, und deren er sich in jedem Fall nach Gebrauch sofort entledigte, sprachen nie aus oder ließen durchblicken, daß eine Fälschung vorgenommen werden sollte: immer wurde nur von Weglassungen, Irrtümern, Druckfehlern oder falschen Zitaten gesprochen, die im Interesse der Genauigkeit richtiggestellt werden mußten. In Wirklichkeit, so dachte er, währender die Ziffern der Angaben des Ministeriums fltr Überfluß neu einsetzte, war es auch nicht einmal eine Fälschung. Es war lediglich die Einsetzung eines Unsinns an Stelle eines anderen. Der größte Teil des Materials, das man bearbeitete, hatte keinerlei Relation zur Wirklichkeit, nicht einmal die Relation, die eine direkte Lüge zur Wahrheit hat. Die Statistiken waren in ihrer ursprünglichen Fassung genauso wohl eine Ausgeburt der Phantasie wie in ihrer berichtigten Form. Sehr häufig wurde erwartet, daß man sie nach eigenem Ermessen zurechtstutzte. So hatten zum Beispiel die Voraussagen des Ministeriumsßr Überfluß die Schuhproduktion für ein Vierteljahr auf 145 Millionen Paare geschätzt. Die tatsächliche Produktion wurde mit 62 Millionen angegeben. Winston jedoch setzte, als er die Vorhersage neu schrieb, daflir 57 Millionen ein, um so die übliche Behauptung zu ermöglichen, die Quote sei übererfüllt worden. In jedem Fall aber kamen zweiundsechzig Millionen der Wahrheit nicht näher als siebenundflinfzig oder einhundertflinfundvierzig Millionen. Sehr wahrscheinlich waren überhaupt keine Schuhe produziert worden. Noch wahrscheinlicher war es, daß niemand wußte, wieviel Schuhe produziert worden waren, oder daß sich überhaupt niemand darum kümmerte. Man wußte nur so viel, als daß jedes Vierteljahr auf dem Papier astronomische Zahlen von Schuhen produziert wurden, während etwa die Hälfte der Bevölkerung Ozeaniens barfuß lief. Und so war es mit jeder Gattung berichteter Tatsachen, ob es sich nun um große oder kleine handelte. Alles löste sich in einer Welt des leeren Scheins auf, in der zuletzt sogar die gültige Jahreszahl unsicher geworden war. (George Orwell, 1984)

Methodischer Teil DESKRIPTIVE STATISTIK

Kapitel IV Verhältniszahlen

"Sieben Lehrer pro Quadratmeter. " (Überschrift eines Artikels in der taz vom 8. Mai 1993, in dem es um die Beschreibung des Kundenstammes eines schwedischen Möbelhauses ging.) Einen Porsche pro Stunde: Nach den kräftigen Niederschlägen am Mittwochabend wird zumindest einer die Mengenberechnung nicht mehr nach Liter pro Quadratmeter vornehmen. Für ihn ist eine neue Maßeinheit aktuell geworden. Sein offenstehendes Porsche-Cabrio, vor dem Frankfurter Hof geparkt, war, zum Vergnügen einiger Fenstergucker und Angestellten des Hotels, nach rund 60 Minuten fast randvoll, "wie eine Badewanne", so ein Augenzeuge. Es gab einen Kurzschluß, die Alarmanlage setzte noch ein. Doch der Besitzer war nicht zu finden. Dieser Fahrer, meine ich, könnteftirderhinsagen: "Es regnete einen Porsche pro Stunde. " (Frankfurter Rundschau vom 15. Mai 1993) Inhaltsverzeichnis IV. 1 Variablen IV. 2 Skalentypen IV.3 Häufigkeiten IV. 4 Verhältniszahlen IV.5 Aussagemöglichkeiten und -grenzen ausgewählter Verhältniszahlen IV.5.1 Wie miflt man "Unfallgefährdung"? IV.5.2 Unterschiedliche Kriminalität von Deutschen und Ausländern? IV.5.3 Das Erwerbsquoten-Paradoxon IV.5.4 Selbstmordquote nimmt mit steigendem Alter zu oder ab oder wie? IV.5.5 100 Millionen 'fehlende' Frauen

124 124 125 125 128 128 133 134 136 137

Kapitel IV: Vertilltniszahlen

124

IV. 1 Variablen Eine statistische Variable ist die meßbare Ausprägung von Merkmalen. Merkmale können z.B. sein: Körpergröße, Einkommen, Berufe, Schulnoten. Merkmalsausprägungen können - qualitativer oder - quantitativer Art sein. Zu ersteren gehören z.B. die Merkmalsausprägungen "männlich" und "weiblich" des Merkmals "Geschlecht" oder z.B. die Merkmalsausprägungen "gut" oder "befriedigend" des Merkmals "Schulnoten". Zu den quantitativen Merkmalsausprägungen gehören Zahlenwerte, z.T. ergänzt um Maßeinheiten wie z.B. cm, kg, DM. Bei den quantitativen Merkmalsausprägungen kann man weiter unterscheiden zwischen - quantitativ - stetig - quantitativ - diskret Eine Merkmalsausprägung ist quantitativ - stetig, wenn sie beliebig unterteilbar ist wie Längenangaben. Quantitativ - diskrete Merkmalsausprägungen können z.B. Mengenangaben wie Anzahl der Geschwister oder Familiengröße sein.

IV.2 Skalentvpen Man unterscheidet bei den Merkmalsausprägungen im allgemeinen zwischen folgenden Skalentypen: 1. Nominalskalierte Merkmale 2. Ordinalskalierte Merkmale 3. Metrisch skalierte Merkmale Letztere sind gelegentlich noch weiter unterteilt in Intervallskalen und Ratioskalen. Folgende Übersicht verdeutlicht anhand von typischen Charakteristika nebst Beispielen die Unterschiede zwischen den verschiedenen Skalentypen: Skalentyp

NominalSkala Ordinal-/ RangSkala IntervallSkala RatioSkala

Merkmalsausprägungen lassen folgende Operationen zu: QuotientenKlassiQuantiRangfestfizierung bildung fizierung der stellung Abstände nein nein nein ja

nein

nein

ja

ja

nein

ja

ja

ja

ja

ja

ja

ja

Beispiele

Berufe, Geschlecht, Farben, Familienstand, sonstige qualitative Eigenschaften Schulnoten, Güteklassen, Erdbebenskala, Intelligenz, Aggressivitätsniveau Temperaturen, Kalenderzeiten Alter, Größe, Einkommen, Entfernungen, Preise, Gewichte, Volumen

IV.3 Häufigkeiten

125

IV.3 Häufigkeiten Merkmalsausprägungen faßt man normalerweise graphisch oder tabellarisch zu bestimmten Häufigkeiten bzw. zu Gruppen von Häufigkeiten zusammen. Dabei unterscheidet man zwischen absoluten, relativen und kumulierten Häufigkeiten: 1. Absolute Häufigkeiten. Häufigkeiten bezeichnet man oft mit dem Symbol f als Abkürzung für deren englische Bezeichnung "frequency". Sind die Häufigkeiten zu Klassen zusammengefaßt, dann bezeichnet f| die absolute Häufigkeit in der i-ten Klasse einer bestimmten Häufigkeitsverteilung. Bei η verschiedenen Beobachtungen und k verschiedenen Gruppen von Merkmalsausprägungen gilt: k Zfj =n i=l 2. Bei relativen Häufigkeiten werden die absoluten Häufigkeiten in Beziehung zur Gesamtzahl η der Merkmalsausprägungen gesetzt, also k η Relative Häufigkeiten werden gerne berechnet, um die Struktur einer Verteilung zu erkennen. Man erhält Prozentangaben bzw. Gliederungszahlen, die - wie wir gleich noch sehen werden - eine bestimmte Art von Verhältniszahlen sind. Es gilt: k

Σίi=l

3. Kumulierte Häufigkeiten. Bei kumulierten Häufigkeiten werden entweder die absoluten oder die relativen Häufigkeiten aller vorhergehenden Klassen addiert. Die Nützlichkeit dieser Berechnung werden wir an späterer Stelle sehen, z.B. bei der Konzentrationsmessimg oder bei einem bestimmten Mittelwert, dem Median, bzw. bei allen auf diesem Mittelwert beruhenden Streuungsberechnungen.

IV.4 Verhältniszahlen "Dem Volkswitz erscheint... der Statistiker als der Mann, der sich ausrechnet, wieviel Spatzen auf eine Telegraphenstange 'entfallen', oder wieviel Mäuse durchschnittlich auf eine Speckschwarte kommen.'' (Ernst Wagemann, Narrenspiegel der Statistik)

Setzt man verschiedene Merkmale zueinander in "Beziehung" oder ins "Verhältnis" oder - in mathematischer Sicht - bildet man den Quotienten zweier Merkmale bzw. von deren Merkmalssausprägungen, dann erhält man Verhältniszahlen. Sie sind in der deskriptiven Statistik sehr beliebt, und sie kommen in den unterschiedlichsten - mehr oder weniger sinnvollen - Kombinationen vor, so daß sich eine Systematisierung wie z.B. die folgende empfiehlt, bevor im weiteren Verlauf dieses Kapitels auf deren Sinnhaftigkeit eingegangen wird:

Kapitel IV: Verhâltniszahlen

126

= Teilmasse a zur Gesamtmasse A (wird oft auch "Quote" genannt)

a und b gehören verschiedenen Massen an, jedoch zwischen a und b besteht sinnvolle Relation (wird oft auch "Dichte" genannt)

= a zu unterschiedlichen Zeitpunkten (wird oft auch "Index" genannt)

Gliederungszahlen geben das Verhältnis von Teilmasse zu Gesamtmasse an. Sie werden oft als "Quoten" bezeichnet. Beispiele für Gliederungszahlen: •

Arbeitslosenquote

Arbeitslose Erwerbspersonen



Ausschuß

defekte Glühbirnen produzierte Glühbirnen



Altersquote

Bevölkerung im Alter von ... und mehr Jahren Gesamtbevölkerung



Erwerbsbeteiligung

Erwerbstätige/Erweibspersonen Bevölkerung



altersspezifische Erwerbsbeteiligung

Arbeitslose Erwerbstätige + Arbeitslose

Erwerbspersonen im Alter von... bis unter... Jahren Bevölkerung im Alter von... bis unter... Jahren



Staatsquote

_ Staatsausgaben ~ Bruttosozialprodukt



Ausländeranteil

Ausländer ~ Gesamtbevölkerung



Kapazitätsauslastung

_ ausgelastete Kapazitäten j e Betrieb, Gesamtwirtschaft, usw. Gesamtkapazität

Eine Gliederungszahl wird in der Regel in % angegeben, also z.B.: "Die Arbeitslosenquote beträgt 12,5%". Im allgemeinen reicht die Höhe der allgemeinen Aibeitslosenquote für eine erste Orientierung Uber die Lage auf dem Arbeitsmarkt aus. Für detailliertere Analysen muß man jedoch spezifische Quoten heranziehen, die z.B. noch dem Alter, nach dem Geschlecht, nach der Dauer der Arbeitslosigkeit oder nach der Region gliedern. Die Quotienten der Beziehungszahlen gehören verschiedenen Massen an, doch kann es aus sachlichen oder anderen Aspekten heraus sinnvoll sein, quantitative Beziehungen zwischen verschiedenen

IV. 4 Verhältniszahlen

127

Merkmalen herzustellen. Oft werden diese Beziehungszahlen auch "Dichten" genannt. Da die Merkmale aus verschiedenen Massen stammen, ist die Gefahr groß, daß man unsinnige Merkmale in Beziehung setzt bzw. zumindest solche, die nicht ganz zueinander passen bzw. wo man bei der Interpretation gelegentlich zu schiefen oder gar falschen Schlüssen kommen könnte. Beispiele für Beziehungszahlen: Viele Beziehungszahlen stammen aus der Bevölkerungsstatistik. Hier werden Ereignisse wie z.B. Geburten oder Sterbefälle (= Bewegungsmasse pro bestimmtem Zeitintervall wie z.B. ein Jahr) in Beziehung gesetzt zu einer sinnvollen Bestandsmasse wie z.B. die Zahl der Einwohner (= Bestandsmasse zum Zeitpunkt x). *

„ . .„ Geburtenz.ffer

=

Zahl der Lebendgeborenen E i n w o h n e r ,%00

Diese Geburtenziffer gibt die Anzahl der Geburten je 1000 Einwohner an. β

„ . . . . Fnichtbarkeitsrate

Zahl der Lebendgeborenen = Frauen im gebärfähigen Alter

Wie bei den Gliederungszahlen so versucht man auch bei den Beziehungszahlen sinnvolle Größen im Zähler und Nenner zu vergleichen. Die Geburtenziffer ist im allgemeinen schnell berechnet, da die Zahl der Geburten und die der Einwohner (eines Stadt, eines Landes, usw.) relativ leicht verfügbar sind. Will man stattdessen Geburtenziffern z.B. in regionaler Hinsicht vergleichen, wobei Einflüsse wie z.B. unterschiedliche Geschlechts- und Altersstrukturen ausgeschaltet sein sollen, so sollte man Fruchtbarkeitsraten, wenn möglich sogar altersspezifische, berechnen. .

„ . .„ Sterbeziffer

=



„ „ ... Bevölkerungsdichte

=

Gestorbene Einwohner

Bevölkerung einer Region 5— — km·' der Region

Dies ist eine der bekanntesten Beziehungszahlen. Sie ist aber auch eine der mißverständlichsten Größen, wenn man nicht beachtet, welche Regionen man in Beziehung setzt. Relativ unproblematisch ist der Vergleich der Bevölkerungsdichte von Großstädten wie z.B. Singapur, Kairo oder Frankfurt oder von Staaten wie z.B. der Bundesrepublik Deutschland und Österreich. Eher verzerrend wären dagegen Vergleiche der Bevölkerungsdichten von Singapur und Ägypten, denn Singapur ist ein dichtbesiedelter Stadtstaat, während Ägypten eigentlich nur in einem regional eng begrenzten Gebiet, nämlich im Niltal und delta besiedelt ist, aber ansonsten weite Wüstengebiete umfaßt. Ernte von... int = Anbaufläche in ha

*

Hektarertrag



Verkehrsdichte

Kfz-Bestand Straßenabschnitt

Arztedichte

Ärzte Einwohner

Indexzahlen werden durch Merkmale gebildet, die man zu unterschiedlichen Zeitpunkten beobachtet. Beispiele für Indexzahlen sind:

Kapitel IV: Verhältniszahlen

128

„ . , . ... Produktionsentwicklung

=

Produktion im Jahr t + i Produktion im Jahr t

Entwicklung der Anzahl der Studenten

Studenten im Semester t + i Studenten im Semester t

Solche Indexzahlen sind ebenfalls sehr beliebt. Man sollte jedoch mindestens auf Zweierlei achten: Zum einen darf die Definition von "Produktion" oder "Studenten" sich im Zeitablauf nicht verändern. Andernfalls würde man Änderungen in der Definition fälschlicherweise der zeitlichen Entwicklung zuordnen. Zum anderen hängt die zeitliche Entwicklung entscheidend von der Wahl von t + i und t ab. Bei zyklischen Entwicklungen hat man praktisch alle "Gestaltungs"-Möglichkeiten, einen bestimmten Trend hervorzuzaubern. Ist z.B. t und t+i jeweils ein Boomjahr, dann dürfte das Ergebnis bzgl. der zeitlichen Entwicklung z.B. des Bruttosozialproduktes noch relativ vernünftig sein. Man sollte es aber unbedingt vermeiden, ein Boomjahr mit einem Rezessionsjahr (oder umgekehrt) in Beziehung zu setzen, denn die Wachstumsrate würde unverhältnismäßig groß bzw. klein sein. Dies sind bekannte Manipulierungsversuche, die man besonders gerne bei Graphiken ausnutzt. Seien sie Trends gegenüber, die man aus einer Zeitreihe "zaubert", die sie nicht genau kennen, sehr kritisch. Der bekannteste Index ist der Preisindex der privaten Lebenshaltung. Hier geht man von einem bestimmten Basisjahr aus, bestimmt dafür die Verbrauchsstruktur typischer Haushalte und ermittelt für diesen sogenannten Warenkorb periodisch die Preisentwicklung. Dies nennt man aus methodischer Sicht einen Preisindex nach Laspeyres. Es gibt daneben noch andere Typen von Indizes, die in der folgenden Graphik dargestellt sind: Index-Typ

Preisindex

Laspeyres

t Ρ

. W o =,=0 L t .Σροςο i=0 t

Paasche

Mengenindex t . W o

IVPo t

ΣΡΛ V

?

i y ,

s * * Ä

v

·

IV.5 Aussagemöglichkeiten und -grenzen ausgewählter Verhältniszahlen IV.5.1 Wie mißt man "UnfallgeHihrdung"? "Wer aus der Kurve fliegt, landet immer in der Statistik. " (GEO, Heft U/1989) "Es sindja gar nicht die Raser, die so schnellfahren. " (Auweia! Martin Bangemann, EG-Vizepräsident, in einem Interview in 'auto-motor-sport' 19/1992)

IV.5 Aussagemöglichkeiten und -grenzen ausgewählter Verhältniszahlen

129

"Fuhr vor einigen Jahren noch jeder zehnte Autofahrer zu schnell, so ist es mittlerweile heute 'nur noch'jeder flinfte. Doch auchßinf Prozent sind zu viele.. ") (Jaul! Aus der Norderneyer Badezeitung, zitiert nach dem Hohl-SPIEGEL 41/1991)

Es sei hier ein Beispiel besprochen, das mit Leid, Tränen, Verletzungen und Tod, mit Verlusten in jeder Beziehung, sowohl immaterielle als auch materielle, zerstörten Lebensplänen usw. zu tun hat. Natürlich kann das durch Unfälle angerichtete Leid niemand beschreiben, geschweige denn messen. Einen Unfall kann man statistisch nur daran messen, was sich in irgendwelchen Polizeireports, Versicherungsunterlagen, Zeitungsmeldungen oder Augenzeugenberichten numerisch niederschlägt. Aus statistischer Sicht findet man auch auf diesem Gebiet - genauso wie auf anderen Gebieten - viel methodischen Unfug vor. Es sei nun gefragt, welches Verkehrsmittel am gefährlichsten ist. Das bedingt aber zu fragen, was überhaupt ein Unfall ist und zu was man ihn in Beziehung setzen muß, um Vergleiche anstellen zu können. Fragen Sie 10 Statistiker oder Laien zu dieser Problematik der Messung von Unfallgefährdung, dann erhalten Sie garantiert ein Vielfaches von 10 als Antwort. Ich weiß natürlich auch nicht die einzige und richtige Antwort, denn die gibt es schlicht und ergreifend nicht. Der berühmteste Hinweis zuerst: Es kommt eben immer darauf an, nämlich darauf, was Sie wissen wollen, welche Daten verfügbar usw. Fangen wir mal ganz einfach an: Was ist das gefährlichere Verkehrsmittel, das Auto, die Bahn oder das Flugzeug? Es muß also eine Verhältniszahl bzw. genauer eine Beziehungszahl gefunden werden, wo im Zähler ein Ausdruck für die Gefährlichkeit eines Verkehrsmittels steht, z.B. ausgedrückt durch den noch zu definierenden "Unfallschaden", und wo im Nenner eine ebenfalls noch zu definierende Größe steht, die die Anzahl der Verkehrsmittel, den Umfang der Fahrleistung oder Fahrdauer oder schlicht den Reiseumfang beschreibt. Folgende Formel könnte also der Ausgang unserer Überlegungen sein: », , „ . Unfallschaden Unfallgefährdung = R e i s e u m f a n g Wie schon anfangs erwähnt wurde, kann man nicht den gesamten Umfang eines Unfallschadens statistisch ermitteln. Man muß sich auf bestimmte wenige, möglicherweise sogar sehr grobe Indikatoren beschränken. Was man in Zeitungen üblicherweise über Unfälle ließt, ist die Anzahl der Toten und Verletzten sowie der angerichtete Sachschaden, ausgedrückt in Geldgrößen. Man könnte vereinfachend sagen, daß es reicht, im Zähler die Anzahl der Unfälle einzusetzen. Damit sind Bagatellunfälle bis zur Massenkarambolage eingeschlossen. Man muß aber berücksichtigen, daß bei Flugzeugunfällen fast nur sogenannte Totalverluste vorkommen. Bagatellschäden sind im Luftverkehr eher die Ausnahme, während sie bei Unfällen mit Autos wohl die Hauptmasse aller Unfälle ausmachen, vor allem, wenn man auch noch solche Unfälle in die Betrachtung mit einbeziehen wollte, die ohne Polizei geregelt werden; die Dunkelziffer scheint hier sehr hoch zu sein (siehe "Verunglückte Statistik" in Die Zeit vom 26. Februar 1993). Würde man sich z.B. nur auf die Anzahl der Personenschäden, möglicherweise sogar nur auf die Anzahl der Unfall-Toten beschränken, so hätte man den Einwand, daß Flugzeugunfälle eigentlich nur Tote, aber kaum Verletzte verursachen, beiseite geräumt; aber nun bliebe die Masse der Unfallverletzten der Auto- und Bahn-Unfälle außerhalb der Betrachtung. Bei der Definition eines Unfall-Toten muß man außerdem bedenken, daß - sofern man an internationalen Vergleichen interessiert ist - ein Unfall-Toter unterschiedlich definiert wird. Studiert man die Fußnoten der entsprechenden Tabellen in statistischen Jahrbüchern, z.B. die der ECE über die Statistiken

130

Kapitel IV: Verhiltmszahlen

von Straßenverkehrsunfällen, dann wird ein Unfalltoter in Portugal und Spanien nur dann als solcher gezählt, wenn er innerhalb von 24 Stunden nach dem Unfall verstaib. In Griechenland und Österreich beträgt diese Frist drei Tage, in Frankreich und Italien etwa eine Woche und in vielen anderen Ländern sowie in den Vereinigten Staaten 30 Tage. Betrachtet man nun den Nenner, so ergeben sich ebenfalls zahlreiche Probleme. Man könnte z.B. daran denken, die Zahl der Verkehrsmittel als Bezugsgröße auszuwählen. Dies ist - zumindest bei internationalen Vergleichen über die Gefährlichkeit des Straßenverkehrs - eine häufige Lösung, da die Anzahl der Autos leicht feststellbar ist. Auch wäre die Zahl der Passagiere oder Reisenden als Bezugsgröße möglich, doch liegen dafür eher nur für den Bahn- und Flugverkehr verläßliche Zahlen vor. Beim Auto weiß man eigentlich nur, daß naturgemäß zumindest der Fahrer drin gesessen haben muß; Uber die Anzahl der Mitfahrer weiß man aus keiner Statistik genaues. Dazu kommt, daß Autos eher mal für kürzer oder länger in der Garage stehen; solche Pausen gibt es dagegen bei Flugzeugen so gut wie nie, es sei denn, sie müssen gewartet werden oder es gibt gerade mal wieder eine Flaute im internationalen Flugverkehr. Ein weiterer Aspekt wäre, die Länge oder die Dauer der Fahrt oder des Fluges zu berücksichtigen, z.B. gemessen in Anzahl der Personenkilometer oder Passagierkilometer. Denn für die Unfallhäufigkeit spielt es eine Rolle, wie oft oder wie lange sich das betreffende Verkehrsmittel der Wahrscheinlichkeit ausgesetzt hat, daß überhaupt ein Unfall passieren kann. Ein Auto, das nur einmal pro Woche zur Fahrt in den Supermarkt benutzt wird, hat demnach eine viel geringere Wahrscheinlichkeit, in einen Unfall verwickelt zu sein, als ein Auto, das von einem Vertreter tagaus/tagein auf seinen Dienstfahrten benutzt wird - sofern man sich nur auf die gefahrenen Kilometer oder die im Auto verbrachten Stunden beschränkt. Diese letzte Einschränkung wurde gemacht, da es durchaus einen Unterschied macht, wozu ein Verkehrsmittel benutzt wird. Ein Auto, das nur einmal pro Woche zum Supermarkt fährt, kann durchaus einem hohen Unfallrisiko ausgesetzt sein, wenn es stimmt, daß gerade in Städten die meisten Unfälle passieren, schon alleine deswegen, weil dort sehr viele Autos unterwegs sind. Ein Vertreter, der zwar sehr oft unterwegs ist, dies aber bevorzugt auf Autobahnen oder wenig befahrenen Straßen tut, kann damit ein durchaus relativ geringes Unfallrisiko - gemessen an seinen Fahrleistungen in km - eingehen. Bei Flugzeugen ist dies ähnlich: Am gefährlichsten sind die Starts und Landungen. Wird nun ein Flugzeug primär auf Kurzstrecken eingesetzt mit naturgemäß vielen Starts und Landungen, so hat es im Vergleich zu einem Langstreckenflugzeug durchaus ein relativ höheres Unfallrisiko. Dazu kommen noch weitere Faktoren, die man kaum quantifizieren kann. So gibt es pro Fluggesellschaft, Eisenbahngesellschaft oder Autotyp gewisse Unterschiede, die die Unfallhäufigkeit zusätzlich beeinflussen wie z.B. die Sicherheitsausstattung, die Wartungsintervalle und -gründlichkeit, das Alter der Transportmittel, die Ausbildung der Piloten/Fahrer usw. Gerade beim Auto kann man noch eine Liste weiterer anschaulicher Faktoren ergänzen wie z.B. der Zustand der Straßen, der Anteil unterschiedlicher Straßensysteme (Autobahnen, Landstraßen, Stadtverkehr), die Kraftfahrzeugdichte, der Ausbau des öffentlichen Verkehrs, der Anteil anderer Verkehrsteilnehmer wie Fußgänger oder Lastwagen. Dazu kommt - sollte es einmal gekracht haben -, wie gut die ärztliche Versorgung am Unfallort selbst oder später im Krankenhaus ist. Nach dieser Diskussion vermag ich immer noch nicht, eine typische Beziehungszahl zu definieren, die die unterschiedliche Unfallgefährdung von verschiedenen Verkehrssystemen quantifizieren kann. Sofern das Flugzeug im Vergleich mit den anderen Verkehrssystemen gesehen werden soll, so tendiere ich dazu, die Anzahl der Unfall-Toten in Beziehung zur Anzahl der Passagier-Kilometer oder PassagierStunden zu setzen, obwohl die bisherige Diskussion gezeigt hat, daß dies kein vollkommen ausreichendes Maß zur Messung der relativen Unfallgefährdung verschiedener Verkehrssysteme ist. Dazu kommt, daß zu seiner Bestimmung kaum verläßliche Statistiken vorliegen.

IV.5 Aussagemöglichkeiten und -grenzen ausgewählter Vertiâltniszahlen

131

In folgender Übersicht werden noch einmal die wichtigsten Optionen bei der Bestimmung einer solchen Beziehungszahl zusammengefaßt: Alternative Optionen bei der Definition einer Beziehungszahl zwecks Quantifizierung der Unfallgefährdung Zähler Nenner Sachschaden in DM Bestand an Verkehrsmittel, ggf. differenziert nach Personenschaden in DM Alter Anzahl der Unfälle Wartung Sicherheitsstandard usw. Bagatellschäden Anzahl der Reisenden/Passagiere leichte Unfälle zurückgelegte Fahr-/Flugleistung bzw. schwere Unfälle Fahrt-/Flugdauer nach Anzahl der Unfallbeteiligten durch Unfall verletzte Personen Art (Kurz-/Langstrecken, Autobahn/ durch Unfall getötete Personen Landstraßen usw.) Verkehrsdichte usw. Mit dieser Liste kann sich jeder seine gewünschte Beziehungszahl mixen. Solange man den entsprechenden Untersuchungen noch entnehmen kann, wie die jeweilige Beziehungszahl berechnet wurde, ist zunächst nicht viel einzuwenden, denn - wie gesagt - es gibt durchaus mehrere, mehr oder weniger gleichberechtigte Methoden, Beziehungszahlen zur Unfallgefährdung zu konstruieren. Gemein wird es allerdings, wenn nur noch von der 'Unfallgefährdung' gesprochen wird, ohne genau oder allenfalls nur verschleiernd anzugeben, was im Nenner und was im Zähler der Beziehungszahl 'Unfallgefährdung' steht. Zwei verschiedene Methoden mit unterschiedlichen Ergebnissen zur relativen Gefährlichkeit von Autobahnen sind in folgendem Beispiel beschrieben (siehe GEO, Heft 11/1989): "Die Autobahnen sind ein gutes Beispiel für solche Elastizität von Fakten. Fest steht - da sind sich die Statistiker ganz sicher -, daß dieses vier- bis achtspurige Denkmal deutscher Werte im vergangenen Jahr 8618 Kilometer lang war, darauf 121,1 Milliarden Kilometer gefahren, dabei 20 295 Unfälle mit Personenschaden verursacht und dadurch 714 Menschen getötet worden sind. So weit, so gut, sagen die einen Zahlendeuter, so weit, so schlecht, die anderen. Beide vergleichen die Autobahn mit den anderen außerörtlichen Straßen: 164 972 Kilometer lang, 215,5 Milliarden gefahrene Kilometer, 4928 Tote. Der eine - Sprecher eines Automobilclubs oder einer Regierungspartei beispielsweise - rechnet vor: 714 Tote geteilt durch 121,1 Milliarden dort gefahrene Kilometer = 5,9 Tote pro Milliarde Fahrtkilometer. Also: Die Autobahnen sind die sichersten Straßen der Republik Denn dieselbe Rechnung ergibt für die außerörtlichen Bundes-, Landes- und Kreisstraßen 22,87 Tote auf eine Milliarde Kilometer. Stimmt. Der andere - Mitglied eines Unfallforschungsvereins oder einer Oppositionspartei zumeist - rechnet nach: Länge der Straßen in Relation zu den Opfern. Die Kölner "Gesellschaft ßr Unfallforschung bei Verkehrsunfällen" würde gern "pietätvoll für jeden Toten ein kleines Holzkreuz setzen". Dann müßte fürs letzte Jahr alle 12 Kilometer eins am Rande der Autobahn aufgestellt werden und "nur" alle 63 Kilometer eins an dem restlichen - inklusive innerstädtischem - Straßennetz von etwa 500 000 Kilometern, obwohl dort dichter Gegenverkehr herrscht, Kinder spielen, Fußgänger und Radfahrer sich tummeln. Also sind die Autobahnen "nicht die sichersten, sondern die unfallreichsten" Straßen der Republik. Stimmt. " Nun, natürlich haben Sie nach der Lektüre dieses Kapitels erkannt, wie verschieden hier gerechnet wurde, nicht wahr? Zum Abschluß dieses Kapitels sei folgendes, ebenfalls schnell zu durchschauendes

132

Kapitel IV: VeiMUtniszahlen

Beispiel aus 'National Geographie' vom April 1992 zitiert, wo es um die scheinbare geschlechtliche "Diskriminierung" durch Blitzschläge geht: "It seems a deadly form of sex discrimination: When the National Weather Service tallies up the deaths caused by lightning each year in the United States, an overwhelming number of the victims are male. Of 74 lightning-related deaths in 1990, females numbered only seven. " So oder so ähnlich sind viele abschreckende Muster-Beispiele aus dem Kapitel "Verhältniszahlen" in ungezählten Presseartikeln strukturiert (besonders in dem Teil der Presse, wo die Überschriften größer zu sein pflegen als der nachfolgende Text): Man wird mit einer kurios anmutenden Aussage konfrontiert und wird - da man sie zunächst nicht näher hinterfragt - zu abwegigen Schlußfolgerungen verleitet. In unserem Beispiel mUßte die voreilige Schlußfolgerung eigentlich lauten, daß Männer irgendwie Blitze magisch anzuziehen scheinen. Es kann sich aber auch ganz anders verhalten: Männer sind vielleicht nur deswegen häufiger Opfer von Blitzschlägen, weil sie sich möglicherweise häufiger dem Risiko aussetzen, von einem Blitz getroffen zu werden. In dem Bericht aus Amerika fällt die Erklärung für dieses "Phänomen" auch dementsprechend aus: "Little research has focused on the causes of the disparity. But it's acknowledged that men tend to be outdoors more than women, at work or at play, and are thus more vulnerable to a strike. Examining lightning fatalities from 1968 through 1985, the Centers for Disease Control found that 85 percent were male and that a third of them died on the job. The victims included farm laborers, construction workers, nurserymen, and land surveyor. "

IV.5 AussagemÄglichkeiten und -grenzen ausgewählter Verhältniszahlen

133

IV.5.2 Unterschiedliche Kriminalität von Deutschen und Ausländern? Mann: Frau: Mann: Frau: Mann:

Du hast also die Putzfrau rausgeworfen! Ja, weil sie geklaut hat. Eine Farbige noch dazu! Na und... Wir können es uns doch leisten... Sie ist eine Farbige aus Harlem. Sie hat eben kein Geld. Sie hat ein Recht, uns zu bestehlen. Wen soll sie denn sonst bestehlen. Wenn nicht uns. (aus dem Film 'Der Stadtneurotiker' von Woody Allen)

"Um die Kraftlosigkeit der These von der 'höheren Kriminalitätsbelastung der Ausländer' nochmals zu verdeutlichen: Was die Häufigkeit von Straftaten (ohne Verkehrsdelikte), errechnet auf 100 000 Einwohner, angeht, weist Frankfurt fast die zweifache Belastung von Darmstadt auf. Wie würden die Frankfurter wohl reagieren, wenn sie amtlich bescheinigt bekämen, sie seien krimineller als die Darmstädter?" (Norbert Kostede, Der Ausländer als Verbrecher, Die Zeit, 19.6.1992) "Alle Menschen zählen! Statistiker gegen A usländerfeindlichkeit! " (Aufkleber-Aktion vom Statistischen Bundesamt gegen Ausländerfeindlichkeit, siehe FAZ vom 15.12.1992) Das letzte Zitat deutet an, daß die Überschrift dieses Kapitels durchaus doppeldeutig zu verstehen ist. Lang ist die Liste von rassistisch motivierten Übergriffen gegen Ausländer in Deutschland (siehe z.B. amnesty international, ai-Info 12/1992). Überwiegend wird jedoch nur ein Aspekt gesehen, nämlich die "Angst" "des" Deutschen vor "den bösen" Ausländern. In Zeiten steigender Zahlen von Ausländern in der Bundesrepublik, ggf. gepaart mit zunehmenden konjunkturellen Problemen, haben Thesen Hochkonjunktur, die bevorzugt Minderheiten, so z.B. "den" Ausländern, irgend etwas Negatives nachzusagen versuchen. Je nach Gesinnung wird jede sich bietende Gelegenheit wahrgenommen, Daten so hinzudrehen, bis man "die" Ausländer in der "richtigen" statistischen Rubrik wiederfindet, in einer negativen natürlich, um dann daraus irgendwelche politischen Forderungen abzuleiten, meist zum Nachteil der Ausländer. So erscheinen in manchen Zeitschriften oder Magazinen unkommentiert Sätze wie folgender: "Mit falschen Papieren eingereiste Ausländer und abgewiesene, aber untergetauchte Asylbewerber haben überproportional dazu beigetragen, daß der Ausländeranteil bei Gewalttaten laut Bundeskriminalamt (BKA) mittlerweile 25 Prozent erreicht hat - obwohl die Nichtdeutschen nur 8,5 Prozent der Bundesbevölkerung ausmachen." (siehe Der Spiegel, Heft 46/1992, S. 61) Konzentrieren wir uns nur auf den statistischen Aspekt. Zunächst einmal muß klargestellt werden, daß es sich bei den zitierten Zahlen nicht um Gewalttaten, sondern um Tatverdächtige handelt. Aber dieser Fehler ist relativ klein verglichen mit dem, der begangen wird, wenn man die 25 % kommentarlos den 8,5 % gegenüberstellt. Diese beiden Zahlen sind zwar nicht falsch, aber sie müssen zu falschen Schlußfolgerungen verleiten, wenn man sie nicht hinterfragt. Sie erinnern sich an das Beispiel von den Blitzschlägen, die anscheinend bevorzugt Männer heimsuchen! Es soll hier nicht - wie im Beispiel von der Unfallhäuiigkeit - untersucht werden, wie man 'Kriminalität' überhaupt messen kann. Auch wird nicht weiter problematisiert, daß es bei Kriminalitätsstatistiken immer eine mehr oder minder große Dunkelziffer gibt - möglicherweise unterschiedlich je nach Straftatbestand. Es wird im folgenden von einer bestimmten Statistik, nämlich der Polizeilichen Kriminalitätsstatistik ausgegangen. Man muß zunächst wissen, daß es gewisse Straftaten gibt, die zum einen Deutsche nicht begehen können (z.B. Verstoß gegen das Asylgesetz ) und die zum anderen Ausländer nicht begehen können

Kapitel IV: Veridhniszahlen

134

(z.B. Verstöße gegen das Wahl-, Wehr- oder Beamtenrecht). Dazu kommt, daß in der Statistik auch Personengruppen nachgewiesen werden, die nicht zur Wohnbevölkerung gehören wie z.B. Touristen oder Stationierungsstreitkräfte. Will man nun die Kriminalitätshäufigkeit nach verschiedenen Kriterien wie z.B. die Nationalität unterteilen, so sollte man darauf achten, daß man nicht Äpfel mit Birnen vergleicht. Das ist aber ganz schnell geschehen, wenn man unterstellt, Deutsche und Nichtdeutsche hätten dieselbe Sozialstruktur. Deutsche und Nichtdeutsche unterscheiden sich aber bezüglich ihrer Sozialstruktur z.T. erheblich, so z.B. nach • • • • • • • •

Altersstruktur Geschlechtsstruktur Einkommensstruktur Bildungsstruktur Berufsstruktur Lebensumständen inkl. Wohngebieten kulturellen Hintergrund Art und Schwere der begangenen Straftaten

Wenn man weiß, daß Täter überproportional junge, in Großstädten lebende Männer sind, so läßt sich damit ein Großteil der relativ hohen Anzahl an ausländischen Tatverdächtigen erklären, denn Ausländer leben in der Bundesrepublik eher in Großstädten und haben im Vergleich zu den Deutschen ein niedrigeres Durchschnittsalter; sie leben auch oft getrennt von ihren insb. weiblichen Familienmitgliedern, die sich noch oder wieder im Heimatland aufhalten. In dem Artikel von Norbert Kostede steht folgender Satz, der hier als Resümee dienen soll: 'Würde man den Vergleich auf ein deutsches Milieu mit demselben Sozialprofll beschränken, dann würde von dem populären Vorurteil: 'Ausländer sind krimineller als Deutsche' nichts mehr übrigbleiben. "

IV.5.3 Das Erwerbsquoten-Paradoxon Statistische Probleme beim Vergleich von gleichen Tatbeständen in unterschiedlichen Populationen sind eigentlich uralt und deren Lösungen ebenfalls, doch tauchen diese Probleme immer wieder in neuer Form auf, ohne das man auch gleich die Lösung mitliefert. Stellen Sie sich z.B. den Arbeitsmarkt eines fiktiven Landes vor, der in der folgenden Tabelle quantifiziert wird: Alter

15-20 20-30 30-40 40-50 50 und mehr Insgesamt

Bevölkerung Β Β1 Β2 1 2 20 20 20 40 20 40 20 20 20 20 100 140

Erwerbspersonen E E1 E2 3 4 10 9,5 14 27 14 27 10 9,5 10 9,5 58 82,5

Erwerbsquote Q 02 Qi 5=3/1 6=4/2 0,500 0,475 0,700 0,675 0,700 0,675 0,500 0,475 0,500 0,475 0,580 0,589

In diesen Beispiel gibt es 2 Gruppen, die nach ihrer Beteiligung am Erweibsleben und ihrem Alter dargestellt sind. Die Erweibsquote von Gruppe 1 beträgt 58 % und die von Gruppe 2 fast 59 %. Die Erwerbsquote der zweiten Gruppe ist also größer als die der ersten Gruppe. Nach dem Alter unterschieden ist

I

IV.S Aussagemöglichkeiten und -grenzen ausgewählter Vertiflltniszahlen

135

das Bild jedoch genau umgekehrt, keine der altersspezifischen Erwerbsquoten der Gruppe 2 ist größer als die von Gruppe 1. Wie das? Das Paradoxon ist natürlich in Wirklichkeit gar keines. Die Lösung ist darin zu suchen, daß sich in der so einfach aussehenden Tabelle zwei Effekte niederschlagen: • •

zum einen die in beiden Gruppen unterschiedliche A //««struktur und zum anderen die in beiden Gruppen unterschiedliche Erwerbsneigung.

Zum Zweck eines einfacheren Vergleichs sollte man einen dieser beiden Effekt eliminieren, bevor man zu weiteren Analysen schreitet. Diese Vorgehensweise nennt man Standardisierung. Bei zwei verschiedenen Gruppen hat man nun die Wahl unter zwei Möglichkeiten der Standardisierung: 1. Man behält die Altersstruktur von Gruppe 1 bei und wendet sie auf die Erweibsquoten der Gruppe 2 an oder 2. Man behält die Altersstruktur von Gruppe 2 bei und wendet sie auf die Erweibsquoten der Gruppe 1 an. Wählt man den ersten Weg der Standardisierung nach dem Alter, so muß man folgende Rechenschritte durchführen: Alter von... bis unter ... Jahren 15-20 20-30 30-40 40-50 50 und mehr Insgesamt

Altersstruktur A A1 A2 7 0,200 0,200 0,200 0,200 0,200 1

8 0,143 0,286 0,286 0,143 0,143 1

Jetzt ergibt sich für Gruppe 1 eine Erwerbsquote von

Hilfstabelle Gruppe 1

Gruppe 2

lBrA2Qi 9 7,15 20,02 20,02 7,15 7,15 61,49

IB2AiQ2 10 13,30 18,90 18,90 13,30 13,30 77,70

= 61,49 % und für Gruppe 2 eine Er-

77,7 weibsquote von "J^T= 55,5 %. Hätte also Gruppe 1 die Altersstruktur von Gruppe 2, dann würde Gruppe 1 - wegen der im Vergleich zu Gruppe 2 in jeder Altersgruppe höheren Erweibsquoten - auch eine in der Summe höhere Gesamterwerbsquote von 61,49 % (im Vergleich zu 58,9 % bei Gruppe 2) haben. Hätte Gruppe 2 jedoch die Altersstruktur von Gruppe 1, dann wäre ihre Gesamterwerbsquote mit 55,5 % niedriger als die von Gruppe 1 mit 58 %. Das Paradoxon wäre damit aufgelöst.

Kapitel IV: Verhältniszahlen

136

IV.5.4 Selbstmordquote nimmt mit steigendem Alter zu oder ab oder wie? Die Selbstmordquote nimmt mit steigendem Alter der Selbstmörder zu, ab bzw. zu und ab. Alle diese Ergebnisse sind richtig und lassen sich im folgenden beweisen. Mit Statistik kann man eben doch alles beweisen, man muß nur wissen, wie. Siehe dazu die folgende Tabelle und das dazu gehörende Schaubild. Altersklasse

Bevölkerung (B)

Gestorbene (G)

Selbstmorde (SM)

SM XSM

1000 15-24 4461,9 0,677 4,043 25-44 9923,0 15,528 2,103 45-64 2,385 8110,7 77,976 75+ 3330,9 228,728 1,675 Nachweis: Männliche Bevölkerung, alte Länder der Bundesrepublik, 1990; amt, Statistisches Jahrbuch 1992, S. 63,470/1.

SM Β

SM G

% 16,7 9,9 0,15 30,7 0,21 13,5 34,9 0,29 3,1 24,5 0,50 0,7 Quelle: Statistisches Bundes-

Selbstmordquote der Männer nach dem Alter 1990 (SM: Selbstmörder, G: Gestorbene, B: Bevölkerung, jeweils der entsprechenden Altersklasse)

Altersklasse a

SM/Summe SM

*

SM/G

'—•

SM/B

Wie man in Spalte 4 sieht, gibt es im Alter "45-64" die absolut meisten Selbstmorde. Das zeigt auch die relative Betrachtung anhand der Gliederungszahl Selbstmorde/Gesamtzahl der Selbstmorde in Spalte 5. Bezieht man die Selbstmorde aber auf die Bevölkerung, also der noch Lebenden in der jeweiligen Altersgruppe, dann nimmt diese Beziehungszahl mit steigendem Alter zu (siehe Spalte 6). In der 7. Spalte ist schließlich die Gliederungszahl der Selbstmorde pro Gestorbener in der jeweiligen Altersklasse dargestellt. Hier nehmen mit steigenden Alter die Anteile der Selbstmorde an allen Gestorbenen ab. Also stimmt jede der gemachten Aussagen. Es kommt eben immer darauf an, was im Zähler und im Nenner steht. Man muß sich also schon gut überlegen, was man ausdrücken will und welche Verhältniszahl dafür am zweckmäßigsten ist. Ebenso muß der Zahlenkonsument bei der Interpretation der Verhältniszahlen wissen, welche Darstellungsmöglichkeiten es gibt.

IV.S Aussagemftglichkeiten und -grenzen ausgewählter Verhältniszahlen

137

IV.5.5 100 Millionen 'fehlende' Frauen Nach den bisherigen Beispielen werden Sie wohl in Zukunft nicht mehr so einfach simplen Verhältniszahlen trauen wollen. Richtig sol Jetzt soll dagegen eine Verhältniszahl dargestellt werden, die trotz ihrer einfachen Struktur sehr erschreckende Ergebnisse liefert: Normalerweise hat es die Natur so eingerichtet, daß auf 100 geborene weibliche Babys etwa 105 oder 106 männliche Babys kommen. Dies nennt man die neugeborene männliche Babies Geschlechtsproportion = neugeborene weibliche Babies Der Grund dafür ist möglicherweise, daß das männliche Geschlecht in biologischer Betrachtung eigentlich das schwächere Geschlecht ist (zu einer kritischen Sicht siehe z.B. die Schriften von Marvin Harris, z.B. 'Menschen'). Das ftihrt u.a. dazu, daß in mittleren Altersklassen, sofern nicht andere Einflüsse wie Wanderungen den statistischen Nachweis erschweren, die Geschlechtsproportion sich in etwa ausgleichen wird. In höheren Altersklassen schließlich gibt es relativ mehr Frauen als Männer. Insbesondere in letzter Zeit machen Berechnungen auf sich aufmerksam, daß mehr als 100 Millionen Frauen "fehlen". Der Grund dafür ist - so zeigen viele Untersuchungen -, daß in Regionen, wo männlicher Nachwuchs "präferiert" ist (wie z.B. in moslemischen oder asiatischen Ländern), Mädchen gegenüber den Jungen benachteiligt werden - sei es durch relativ schlechtere Ernährung, sei es durch relativ schlechtere Gesundheitsvorsorge -, so daß sie - trotz ihrer relativen biologischen Robustheit - eher als Jungen im Kindesalter sterben. Dieses Horrorbild war schon öfters in der Geschichte beobachtbar, so soll auch in Europa dies vor noch nicht allzu langer Zeit vorgekommen sein. Neu ist die Quantifizierung dieses Horrors mit 100 Millionen Menschen, deren Lebenschancen so ungünstig "gestaltet" werden, daß sie um Jahrzehnte ihres Lebens gebracht werden. Es gibt theoretisch zwei Wege, dem Horror statistisch auf die Spur zu kommen: Zum einen kann man die gestorbenen Kinder nach Geschlecht unterscheiden. Oder man vergleicht die Geschlechterproportion der lebenden Kinder. Letztere Methode ist der häufigste und einfachere Weg des Nachweises. Was man braucht, ist eine simple Kalkulation. Durch einen Blick in das Statistische Jahrbuch irgend eines Landes weiß man, daß die Geschlechtsproportion der z.B. unter Zehnjährigen 1,1 beträgt, also die Anzahl der männlichen Kinder m t ist um 10% höher als die Anzahl der weiblichen Kinder w t .

Unterstellt man, daß die Geschlechtsproportion eigentlich 1,06 sein könnte, dann kann man durch folgende Formel die Anzahl der eigentlich zu erwartenden Mädchen w e berechnen:

Die "fehlenden" Mädchen Wf ergeben sich dann wie folgt: mt Wf=We-Wt=

j^Jg-W,

Kapitel IV: Verh&hniszahlen

138

Wendet man diese Rechnung für alle Länder an, in denen man Diskriminierungen der genannten Art unterstellen kann, wovon die größten China und Indien sind, dann erhält man je nach Annahmen eine Zahl von bis zu 100 Millionen "fehlenden" Frauen. Es sei im folgenden aus UNDP, Human Development Report 1991, New York - Oxford 1991, S. 27, zitiert: "100 million women missing Around 105 males are conceivedfor every 100 females. But the male advantage is short lived - biology thereafter seems to favour women. If both sexes receive similar nutrition and health care, women live noticeably longer - they are more resistant to disease and generally hardier. They enjoy this advantage right from the outset, even in the womb, and especially during the months immediately following birth. As a result, in populations where girls are treated much the same as boys, there are about 106females for every ¡00 males. If women, and especially girls, do not receive equal treatment, the story changes. In most of Asia and North Africa, far fewer female children and women survive, because they suffer active discrimination. In South and West Asia and in China, there are only 94 females for every 100 males. This means a shortfall of about 12 % of the 'natural'figure. In China alone, some 44 million women are missing taking into account the difference in age structure. Adding this figure to the shortages in North Africa and in South, South-East and West Asia, as Amartya Sen has demonstrated, nearly 100 million women are missing. "

"Welchen Beruf üben Sie derzeit aus?"

Kapitel V Konzentrationsmessung

"Reicher Mann und armer Mann Standen da und sahen sich an. Und der Arme sagte bleich Wäre ich nicht arm, wärst du nicht reich. " (Bert Brecht) "Ich gebe zu, daß es ein großer Unterschied ist, ob ich selber hungere oder ob ich lebe, wo Hunger herrscht. Aber zu meiner Entschuldigung darf ich wohl anfiihren, daß filr mich leben, wo Hunger herrscht, wenn nicht ebenso schlimm wie hungern, so doch wenigstens sehr schlimm ist. Es wäre ja flir andere nicht wichtig, wenn ich Hunger hätte, aber es ist wichtig, daß ich dagegen bin, daß Hunger herrscht. " (Bert Brecht, Geschichten vom Herrn Keuner)

Inhaltsverzeichnis V.l Einleitung V.2 Konzentrationsrate V.3 Herfindahl-Koeffizient V.4 Lorenzkurve V.5 Gini-Koeflizient V.6 Rechenbeispiel für den Gini-Koeffizienten V.7 Reale Beispiele V.8 Vergleich der Konzentrationsmessung mit Streuungsmaßen

142 143 144 145 146 150 151 154

Kapitel V: Konzentrationsmessung

142

V . l Einleitung Extreme Konzentrationen speziell unter sozialen und ökonomischen Aspekten sind etwas, was es eigentlich aus theoretischer Sicht gar nicht geben sollte. Das klassische Modell der vollkommenen Konkurrenz glaubt zwar keiner, weil es von so vielen irrealen Voraussetzungen ausgeht wie z.B. unendlich schneller Reaktionsgeschwindigkeit aller Marktteilnehmer bei vollkommener Transparenz über alle relevanten Maiktbedingungen. Trotzdem ist "herrschende" Meinung, daß die Realität doch "irgendwie" so wie das Modell der vollkommenen Konkurrenz beschaffen ist oder doch zumindest beschaffen sein sollte. Liegt etwas im argen, dann ist es die Aufgabe des Bundeskartellamts einzuschreiten. Nun wissen wir, daß es doch eine ganze Menge von Großkonzernen gibt, die dazu auch noch immer größer zu werden scheinen. Droht mal wieder eine Fusion, dann wird in den Medien darüber diskutiert, ob die Fusion wegen Wettbeweibsverzerrung nicht lieber veiboten werden soll oder ob man nicht doch z.B. aus Gründen der Arbeitsplatzerhaltung oder wegen des harten internationalen Wettbewerbs die Fusion "ausnahmsweise" zulassen soll. Letzteres scheint Sinn zu machen, wenn man die übermächtig erscheinenden multinationalen Konzerne in Betracht zieht, die kaum einer nationalen Kontrolle zu unterliegen scheinen. Es soll im folgenden nicht der wettbewerbspolitische Aspekt im Vordergrund stehen über Pro und Kontra von Machtzusammenballungen, sondern wir wollen prüfen, inwieweit die statistischen Instrumente in der Lage sind, Konzentration zu messen. Natürlich können wir nicht alle Instrumente prüfen, das wäre ein separates Buch. Im allgemeinen wird aus statistischer Sicht zwischen • •

absoluter und relativer Konzentration

unterschieden. Ein Beispiel für die absolute Konzentrationsmessung ist die Konzentrationsrate. Für die relative Konzentration soll hier stellvertretend auf die Lorenzkurve und den Gini-Koefflzienten eingegangen werden. Der Unterschied zwischen der absoluten und relativen Konzentration ist, daß im ersten Fall untersucht wird, wie sich ein bestimmter Anteil z.B. des Umsatzes einer Branche auf eine bestimmte Anzahl von Unternehmen verteilt. Bei relativer Konzentration wird gezeigt, wie sich ein bestimmter Umsatzanteil auf einen bestimmten Anteil von Unternehmen verteilt. Der absolute und relative Aspekt wird noch einmal unterteilt in • •

statischer und komparativ-statischer Analyse.

Eine statische Analyse bezieht sich auf einen Zeitpunkt t, für den z.B. eine Konzentrationsrate berechnet wurde. Ideal wäre es, wenn man auch Konzentrations maße hätte, die die Konzentration im Zeitablauf messen würden. Da man diese Maße aber nicht hat, beschränkt man sich darauf, statische Maße wie eben z.B. die Konzentrationsrate zu verschiedenen Zeitpunkten zu vergleichen und dies nennt man dann komparativ-statische Analyse. Eine typische Aussage einer statischen Analyse ist z.B.: "Die Branche χ ist stark konzentriert." Eine Aussage der komparativ-statischen Analyse ist z.B.: "Zwischen t und t+1 hat sich die Konzentrationsrate um a erhöht."

V.2 Konzentrationsrate

143

V.2 Konzentrationsrate Es sei unterstellt, man habe vier verschiedene Märkte, in denen jeweils fünf Unternehmen tätig sind. Die Größenverhältnisse auf den Märkten, z.B. gemessen am Umsatz der Unternehmen, sei in folgender Tabelle mit den Verteilungen A - D dargestellt: Unternehmen

Verteilung

1 2 3 4 5 Insgesamt Konzentrationsrate (k=2) Herfindahl-Koefiizient Gini-Koeffizient

A 500 0 0 0 0 500 100 1 80,0

Β 220 140 100 30 10 500 72,0 0,316 42,4

C 250 100 80 50 20 500 70,0 0,327 40,8

D 100 100 100 100 100 500 40,0 0,200 0

Verteilung A zeichnet sich dadurch aus, daß es eigentlich nur ein dominantes Unternehmen 1 gibt, quasi ein Monopolist, und die vier anderen Unternehmen haben zumindest im relevanten Zeitpunkt t nichts zu melden gehabt, d.h. sie haben keinen Umsatz gemacht. Die vier anderen Beispiele zeigen, daß auch dort der gesamte Umsatz der Branche 500 betrug, aber er verteilt sich mehr oder weniger gleichmäßig auf alle flinf Unternehmen. Das Gegenteil des Monopol-Falles A ist Verteilung D, denn dort haben alle Unternehmen einen gleich großen Umsatz von jeweils 100. Verteilung Β und C liegen zwischen diesen beiden Extremen. Würde man nun z.B. sagen, man interessiert sich für den Umsatz der k größten Unternehmen, um die Konzentration einer Verteilung zu quantiflzieren, dann hätte man damit schon die Definition eines absoluten Konzentrationsmaßes, nämlich die der Konzentrationsrate KR, verbalisiert. Wenn also x¡ der Umsatz des Unternehmens i ist (wobei i=l,2,..,n), dann ist Xx¡f¡ der Gesamtumsatz der Branche. Die Häufigkeit f¡ braucht man allerdings nur bei gruppierten Daten. Bei gegebenem k setzt man den Umsatz dieser k Unternehmen in Relation zum Gesamtumsatz der Branche, das Ergebnis nennt man die Konzentrationsrate KR: k Σ xifi Konzentrationsrate = KR = Σ xifi i=l wobei η = Anzahl der aller Unternehmen der Branche und k = Anzahl der k größten Unternehmen, k£n. Die Konzentrationsrate bezeichnet man gelegentlich als Konzentrationskoeffizienten, Konzentrationsgrad oder Konzentrationsverhältnis (engl.: concentration ratio). Die Konzentrationsrate für die Verteilungen A - D sind in der Tabelle filr k=2 angegeben. Natürlich ist sie bei Verteilung A mit 100 % am höchsten und bei Verteilung D mit 40 % am niedrigsten. Die anderen Verteilungen liegen dazwischen.

Kapitel V: Konzentrationsmessung

144

Dieses Maß ist sehr beliebt, denn es ist sehr anschaulich und normalerweise - wenn man die Summe des betreffenden Merkmals wie z.B. den Umsatz der gesamten Branche kennt - einfach zu bestimmen. Es gibt allerdings den Nachteil, daß man sich für ein bestimmtes k entscheiden muß. Damit läßt dieses Maß die Informationen über den Rest den Verteilung außer acht. Auch hat die Wahl von k etwas willkürliches. Bei Verteilung Β ist bei k=2 die Konzentrationsrate 72 % und bei Verteilung C 70 %. Würde man aber k=l wählen, dann wäre Verteilung Β mit 44 % weniger stark konzentriert als Verteilung C mit SO %. Will man alle Informationen einer Verteilung berücksichtigen, muß man entweder mit anderen Konzentrationsraten wie z.B. dem Herfindahl-Index oder mit relativen Konzentrationsmaßen arbeiten.

V.3 Herfindahl-Koeffizient Ein alternatives Konzentrationsmaß ist der Herfindahl-Koeffizient HK: η HK = Σ Pi 2 i=l Für dieses Maß muß man nur die Marktanteile p¡ der einzelnen Merkmalsträger kennen, was an folgendem Beispiel anhand der uns schon vom letzten Beispiel her bekannten Verteilung Β demonstriert werden soll: Unternehmen

Verteilung Β vor der Fusion nach der Fusion 220 0,1936 220 0,1936 140 140 0,0784 0,0784 100 0,0400 140 0,0784 30 0,0036 10 0,0004 500 500 0,3160 0,3504

1 2 3 4 5 Insgesamt

In den Herfindahl-KoefFizienten gehen alle i verschiedenen Merkmalsträger in die Berechnung ein, was ein Vorteil gegenüber der Konzentrationsrate ist. Das Ergebnis für Verteilung Β ist ein Wert von 0,3160. Nun sei unterstellt, daß die Unternehmen 3,4 und S fusionieren. Nach der Fusion gibt es nur noch 3 Unternehmen. Unsere alte Konzentrationsrate mit k=2 würde davon unbehelligt bleiben. Doch der Herfindahl-Koeffizient ändert sich durch die Fusion, denn er berücksichtigt ja alle Werte der Verteilung. Er steigt in unserem Beispiel von 0,3160 auf0,3504, das heißt die Konzentration ist gestiegen. Der Wertebereich von HK hängt von der Zahl η der Merkmalsträger und der Art der Verteilung der Merkmalswerte ab: r^HKíS 1

V.4 Lorenzkurve

J 45

V.4 Lorenzkurve Ordnet man die Merkmalsträger der Größe nach auf der Abszisse eines Quadrats an und die entsprechenden kumulierten Merkmalssummen auf der Ordinate, dann bezeichnet man die Verbindung der Koordinatenwerte als Lorenzkurve, wie in der folgenden Graphik demonstriert wird. Da man die 'Kurve' meistens nur abschnittsweise definieren kann, weil also oft die Kurve keine Kurve, sondern eine Folge von Strecken ist, wird hier das Wort 'Kurve' in Anführungszeichen gesetzt.

kumulierte Merkmalswerte

Aufreihung der Merkmalsträger nach ihrer Größe (der "Kleinste" ganz links, der "Größte" ganz rechts) Ähnlich wie im Fall der kumulierten Häufigkeiten kann man aus der Lorenzkurve z.B. folgende Aussagen gewinnen: "Auf χ % aller Merkmalsträger entfallen y % der Merkmalssumme." Für eine erste Orientierung über die Gleichheit bzw. Ungleichheit einer Verteilung ist diese Kurve sehr beliebt. Wie man aus der obigen Graphik erahnen kann, wird sie um so mehr nach rechts gebogen sein, wenn die Verteilung sehr ungleich ist. Umgekehrt gilt, daß die Lorenzkurve sehr nahe an der 45-Grad Linie liegen wird, wenn die Verteilung relativ gleich verteilt ist. Solche Fälle sind in den folgenden Skizzen dargestellt:

146

Kapitel V: Konzentrationsmessung

Man sieht also, je größer die Fläche zwischen Lorenzkurve und der 45-Grad Linie ist, um so konzentrierter ist eine Verteilung. Diese geometrischen Bedingungen versucht man mit dem Gini-Koeffizienten zu quantifizieren.

V.5 Gini-Koefllzient In folgender Graphik sei die Fläche zwischen Lorenzkurve und 45-Grad Linie als F j und die unter der Lorenzkurve liegende Fläche als F2 bezeichnet. Da die Lorenzkurve in einem Quadrat mit den Kantenlängen von jeweils 1 gezeichnet ist, weiß man, daß die Gesamtfläche des Quadrats 1 beträgt und damit beträgt die Fläche eines Dreiecks 0,3. Also muß die Summe F der beiden Flächen F j und F2 genau 0,5 betragen:

V.5 Gini-KoeSizient

147

Der Gini-Koeffizient sei nun definiert als die Relation der Fläche zwischen der Lorenzkurve und der 45-Grad Linie, also F], und der Gesamtfläche F des Dreiecks, das F j und F2 zusammen bilden, also: Gini-Koeffizient = GK =

Fläche zwischen Lorenzkurve und 45-Grad Linie Gesamtfläche des Dreiecks ~ F

F!+F2

=

Fl ÖJ=2F1

Es stellt sich nun die Frage, wie groß F j ist. Dazu mufl man sich an den Geometrie-Unterricht in der Schule erinnern, als die Fläche eines Trapezes behandelt wurde: m,

L

/ ,, • ·

m

1

1 Fläche eines Trapezes = h · m wobei gilt: m = 0,5 (m¡ + ΠΙ2)

\

\

Wenn man nun weift, dafi die Fläche eines Trapezes das Produkt aus Höhe und der mittleren Breite ist, kann man die Fläche von F j berechnen. Normalerweise liegt eine Verteilung nach gewissen Größenklassen vor. Man kennt die kumulierten relativen Häufigkeiten der Merkmalsträger f j ^ j ^ j (was in unserem Trapez dem m j und entspricht) und man kennt die relativen Häufigkeiten der Merkmalssumme Pi (was im Trapezbeispiel dem h entspricht). Das sei an folgender Graphik gezeigt:

Kapitel V: Konzentrationsmessung

148

Mit dieser Kenntnis kann man die Flächen F¡ berechnen. Σ F¡ ist allerdings größer als die Fläche F | , die uns eigentlich interessiert, nämlich sie enthält zusätzlich auch die gesamte Fläche des oberen Dreiecks. Da man aber weiß, daß die Fläche dieses Dreiecks 0,5 beträgt, muß man eben diese 0,5 von 2a Fj abziehen, um F j zu erhalten, also: F|=ZFÍ-0.5 = 0,5 [ I ( f k u m > i . i + f k u m i i ) P i l - 0 , 5 = ° · 5 £ f kum,i-r P i + °>5 2 f kum,i ' Pi " °· 5 also: GK = 2F

1 = ^ficum,i-l ' P i + ^ k u m . i

Pi"1

und damit: η

η

GK = [ Σ f kum,i-l ' Pi + Σ fkum,i ' Pi ] - 1 i=l i=l oder alternativ: η GK = [ Σ ( f kum,i-l + f kum,i) Pi] - 1 i=l Die beiden Formeln sind äquivalent. In der zweiten Formel sind die eckigen Klammern eigentlich nicht nötig, aber sie erhöhen die Lesbarkeit.

V.5 Gini-Koeffizient

149

Der Wertebereich des Gini-Koeffizienten liegt zwischen Null und 1, also: 0

f

rr*

i

Die Wölbung ergibt sich aus dem relativen vierten Moment, wobei allerdings zu berücksichtigen ist, daß die Referenzverteilung, also die Normalverteilung, eine Wölbung von genau 3 hat. Zieht man also 3 von der Wölbung ab, dann bedeutet eine Wölbung von Null eine Normalverteilung. m¿ Wölbung = - ¿ r - 3 lyixj-x)4·^ η^ [^2

f

i]2

"3

VII. Β Beispiele

193

VII.Β Beispiele VII.B.1 Ungenauigkeiten der Varianzberechnung bei gruppierten Daten Zur Quantifizierung der Ungenauigkeiten bei der Varianzberechnung von gruppierten Daten sei von den folgenden zwei Beispielen ausgegangen. Das erste Beispiel unterstellt eine symmetrische Verteilung, der zweite Fall zeigt eine linkssteile Verteilung. In beiden Fällen wird in den ersten vier Spalten die Streuung auf der Basis der Original werte berechnet. Die folgenden Spalten zeigen jeweils die Zusammenfassung der Originalwerte zu Dreiergnippen, wobei zum einen von Klassenmitten (bzw. der Einfachheit halber von der mittleren Klasse) und zum anderen von Klassenmitteln ausgegangen wird. Berechnung der Streuung im symmetrischen Fall: Berechnung der Streuung auf der Basis der Originalwerte

Xi 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Insg.

fi

xf

1 2 3 4 5 6 7 8 7 6 5 4 3 2 1 64

1 4 9 16 25 36 49 64 63 60 55 48 39 28 15 512

(x-i) 2 f 49 72 75 64 45 24 7 0 7 24 45 64 75 72 49 672

Berechnung der Streuung mit gruppierten Daten auf der Basis der jeweiligen Klassenmitte X

f

xf

Berechnung der Streuung mit gruppierten Daten auf der Basis vom jeweiligen Klassenmittel

(x-x) 2 f

X

xf

(x-x) 2 f

2

6

12

216

2,33

14

192,67

5

15

75

135

5,13

77

123,27

8

22

176

0

8,00

176

0

11

15

165

135

10,87

163

123,27

14

6

84

216

13,67

82

192,67

64

512

702

512

631,87

-

-

Interessant ist, daß im symmetrischen Fall in allen drei Fällen das arithmetische Mittel stets das selbe bleibt (wie die übernächste Tabelle zeigt), während die Streuung bei den Klassenmitten höher und bei den Klassenmitteln niedriger als die Streuung bei der Berechnung mit den Originalwerten ausfällt. Das selbe Ergebnis stellt sich auch im folgenden asymmetrischen Fall ein, nur daß nun auch das arithmetische Mittel im Fall der Klassenmitten (nicht bei den Klassenmitteln) ungenau wird.

¡94

Kapitel VII: StreuungsmaBc

Berechnung der Streuung im asymmetrischen (linkssteilen) Fall: Berechnung der Streuung auf der Basis der Originalwerte

Xi

fi

xf

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Insg.

2 4 6 8 10 12 11 10 9 8 7 6 5 4 3 105

2 8 18 32 50 72 77 80 81 80 77 72 65 56 45 815

(x-x)2f 91,45 132,80 136,05 113,22 76,28 37,25 6,39 0,57 13,80 40,07 73,40 107,77 137,19 155,66 157,17 1279,05

Berechnung der Streuung mit gruppierten Daten auf der Basis der jeweiligen Klassenmitte

Berechnung der Streuung mit gruppierten Daten auf der Basis vom jeweiligen Klassenmittel (x-x)2f

f

xf

(x-x)2f

χ

2

12

24

395,77

2,33

28

353,63

5

30

150

225,70

5,13

154

207,28

8

30

240

1,98

7,93

238

0,88

11

21

231

222,79

10,90

229

207,43

14

12

168

469,82

13,83

166

442,35

105

813

1316,06

-

815

1211,57

X

-

xf

Die Ergebnisse für das arithmetische Mittel und für die Streuung lassen sich in folgender Kurzform zusammenfassen: Berechnung auf der Basis der Originalwerte

Maß

symmetrischer Fall • arithmetisches Mittel • Varianz • Standardabweichung asymmetrischer Fall • arithmetisches Mittel • Varianz • Standardabweichung

Berechnung mit gruppierten Daten auf der Basis der jeweiligen vom jeweiligen Klassenmitte Klassenmittel

8,00 10,50 3,24

8,00 10,97 3,31

8,00 9,87 3,14

7,76 12,18 3,49

7,74 12,53 3,54

7,76 11,54 3,40

Die Schlußfolgerungen sind : Verwendung von Klassenmitten: Die mit den Originalwerten berechnete Standardabweichung s 0 tendiert dazu, kleiner zu sein als die mit den jeweiligen Klassenmitten berechnete Standardabweichung s*, also: s 0 < s* Verwendung von Klassenmitteln: Die mit den Originalweiten berechnete Standardabweichung s 0 tendiert dazu, größer zu sein als die mit dem jeweiligen Klassenmittel berechnete Standardabweichung s**, also: s 0 > s** bzw. noch allgemeiner: s** < s 0 < s*.

195

VII.B Beispiele

Vn.B.2 Einfaches Beispiel fur die Berechnung von Schiefe und Wölbung An Hand des einfachen Beispiels, was wir schon im vorigen Kapitel kennengelernt haben, sollen nun "per Hand" die Schiefe und die Wölbung berechnet werden. Das Beispiel ist nicht besonders realistisch und es verletzt auch einige Bedingungen, die für die Berechnung von Schiefe und Wölbung genannt wurden (zu geringe Anzahl von Klassen), doch soll dieses Beispiel nur dem Zweck dienen, einmal "per Hand" die Formel für die Schiefe und Wölbung durchgerechnet zu haben. Hat man dann deren Prinzip verstanden, kann man in Zukunft die relativ komplexen Berechnungen getrost dem Computer überlassen. Die Werte der Schiefe und Wölbung (dazu noch von s 2 und s) bei einem χ = 147,72 ergeben sich nach folgenden Zwischenrechnungen: m

i 135 145 155 165 Insg.

fi 3 4 2 2 11

m.-x 1 -12,73 -2,73 7,27 17,27 -

(m¡-*)2 161,98 7,44 52,90 298,36 -

(m¡-x)2f¡ 485,95 29,75 105,79 596,69 1218,18

(m¡-x)3fi -6184,82 -81,14 769,35 10306,54 4809,92

(m¡-x)4f¡ 78715,93 221,30 5595,25 178021,99 262554,47

Die Zwischenergebnisse werden wie folgt weiterverwandt: Maß s^

Berechnung =• ^ =

110,7438

s Schiefe

= VH0,74 = 10,5235 4809,9174 Λ/1218,18 , v 11 11 '

Wölbung

_ 262^54,47 _ 12264,19 - 3 = - 1,054

437,2652 1165,4111

Trägt man noch der Tatsache Rechnung, dafl bei kleinen Stichproben der Wert (n-1) und nicht η in die Berechnungen eingeht, so ergäben sich folgende Ergebnisse: s 2 = 121,82 bzw. s = 11,04. Normalerweise kann man bei guter Statistik-Software wie z.B. SPSS und SAS zwischen beiden Alternativen η und (n-1) wählen.

Kapitel V i l i

Mittelwerte und Streuungsmaße am Beispiel der Einkommensverteilung

Inhaltsverzeichnis Vili. 1 Aussagemöglichkeiten und -grenzen VIII.2 Beispiele VIII.2.1 Einkommensverteilung bei Angestellten VIII.2.2 Internationale Einkommensverteilung VIII.3 Durchschaubare Taktiken in der Praxis

200 201 201 204 206

200

Kapitel VIII: Mittelwerte und Streuungsmaße am Beispiel der Einkommensverteilung

V l l l . l Aussagemöglichkeiten und -grenzen Die Mittelwerte und Streuungsmaße wurden ausführlich in den beiden letzten Kapiteln dargestellt. Jetzt sollen sie noch einmal in der Gesamtschau in Form einer Synopse auf ihre Aussagemöglichkeiten und -grenzen hin betrachtet werden. Dies geschieht in drei Teilen: Zuerst werden die Mittelwerte, dann die Streuungsmaße und schließlich weitere Maße zur Kennzeichung einer Verteilung, zu dem auch das an anderer Stelle diskutierte GiniMaß oder der Gini-Koeflizient gehört, aufgelistet. Teil I: Mittelwerte Beschreibungsmöglichkeiten

Median

X

Zeigt typisches Einkommen bzgl. • Häufung ("Masseneinkommen") • ordinalem Aspekt (mittleres/mittiges/zentrales Einkommen) • Durchschnitts-Einkommen • Ersatzwerteigenschaft ("Hätten alle ein Einkommen in der Höhe des Mittelwerts, dann würde sich die gleiche Summe der Einkommen ergeben") • kann von extremen, aber untypischen Werten beeinflußt/verzerrt sein ("ein Millionär unter lauter Habenichtsen") • berechneter Wert, kann deshalb mit tatsächlichen Werten nicht identisch sein

Modus X

X X X

X

X

-

-

Teil II: Streuungsmaße Beschreibungsmöglichkeiten Zeigt charakteristische Einkommensbereiche: • Spannweite des gesamten Einkommensbereichs • typisiert bestimmte Gruppen (Armut, obere "Zehntausend" usw.) • Mittelklasse • Durchschnittliche Abweichung der Einzelwerte vom Mittelwert • soziologisch/ökonomisch nicht unmittelbar anschauliches Maß

SW

d

Quantité

IQA

s·2, s

X

-

-

-

-

-

-

X

-

-

-

-

X

X

-

-

X

-

-

-

-

-

-

-

χ

201

Vili.3 Durchschaubare Taktiken in der Praxis

Teil III: Ergänzende Maße Beschreibungsmöglichkeiten • Relatives Maß der Streuung, bezieht s auf das arithmetische Mittel, wodurch Vergleiche zwischen verschiedenen Verteilungen möglich werden • Quantifiziert, wie viel das Maximum der Verteilung von einer symmetrischen Verteilung nach links oder rechts abweicht • Quantifiziert, wie viel das Maximum der Verteilung von einer Normalverteilung nach oben oder unten abweicht • Quantifiziert die Ungleichheit bzw. Konzentration einer Verteilung

VK X

Schiefe

Wölbung

Gini

-

-

-

-

X

-

-

-

-

X

-

-

-

-

X

ΥΙΠ.2 Beispiele VIII.2.1 Einkommensverteilung bei Angestellten '"Ein Arbeiter verdient pro Stunde durchschnittlich 15 DM. Eine Arbeiterin bekommt durchschnittlich 10 DM Stundenlohn Sie verdient also ein Drittel weniger als er'... Der Mann ist Maß (hier: Ausgangspunkt) aller Dinge. Aus der Perspektive der Arbeiterin ergeben dieselben Zahlen folgendes Bild: 'Er verdient die Hälfte mehr als sie'. 'Die Hälfte' - das klingt sehr viel empörender als 'ein Drittel', das schon empörend genug war. " (Brück, Feministische Soziologie)

Ein nicht ganz frei erfundenes Beispiel, das vielleicht in etwa der Verdienststruktur von Angestellten (ohne teilzeitbeschäftigte Angestellte) entspricht, ist in folgender Graphik dargestellt, wo zwischen weiblichen und männlichen Angestellten unterschieden wird. Hier soll nicht die Diskussion aufgerollt werden, warum die Verdienststruktur nach Geschlecht so ungleich ist. Bevor man dies kann, muß man zunächst einmal die Verhältnisse nüchtern mit dem üblichen Instrumentarium der Statistik untersuchen.

202

Kapitel VIII: Mittelwette und Streuungsmaße am Beispiel der Einkommensverteilung

Einkommen

Es fällt natürlich sofort ins Auge, daß der häufigste Wert bei den Frauen "meilenweit" von dem der Männer entfernt ist. Auch scheint die Verteilung der Frauengehälter enger um das Mittel herum zu streuen. Schaut man sich die tatsächlichen Werte in folgender Tabelle an, so beträgt der Modus bei den Männern 5408 DM und ist damit um fast 60 % größer als der von Frauen (3396 DM) bzw. - je nach Standpunkt - der Modus der Frauen ist um gut ein Drittel geringer als der von Männern. Ähnliche große Unterschiede zwischen den Geschlechtern sind auch beim Median und dem arithmetischen Mittel festzustellen. SO % aller Männer verdienten weniger als 5746 DM bzw. 50 % verdienten mehr als diesen Wert (Median). Durchschnittlich verdienten die Männer 6076 DM (arithmetisches Mittel). Da es sich hier um linkssteile Verteilungen handelt, ist auch hier die übliche Reihenfolge von Modus, Median und arithmetischem Mittel festzustellen: Bei den Männern ist der Modus am kleinsten, der Median liegt mit 5746 DM in der Mitte und das arithmetische Mittel ist mit 6076 DM am größten. Die selbe Reihenfolge gilt natürlich auch bei den Frauen. Bei den Streuungsmaßen, die auf dem Median basieren, ist der Interquartilsabstand, also die Breite der 50 % mittleren Werte der Verteilung, bei den Männern mit 2620 DM deutlich größer als bei den Frauen, wo er nur 1545 DM beträgt. Ein Viertel der Männer verdiente weniger als 4577 DM (erstes Quartil) und ebenfalls ein Viertel der Männer verdiente 7197 DM und mehr. Verwendet man statt Quartile die Dezile, so kann man feststellen, daß 10 % der Männer weniger als 3697 DM verdienten und das Zehntel am anderen Ende der Verdienstskala beginnt bei 8804 DM. Das untere Dezil bei den Männern ist größer als der Modus bzw. der Median bei den Frauen. D.h. daß das höchste Einkommen im unteren Zehntel der Männer h ist als die höchsten Einkommen der Frauen in der unteren Hälfte der Einkommensskala. Bei den Streuungsmaßen, deren Berechnung auf dem arithmetischen Mittel beruhen, liegt die Standardabweichung bei den Männern bei 2149 DM und bei den Frauen bei 1405 DM. Die durchschnittliche absolute Abweichung ist in beiden Fällen mit 1631 DM bei den Männern und 999 DM bei den Frauen kleiner als die Standardabweichung.

Vili.3 Durchschaubare Taktiken in der Praxis

Maß Mittelwerte • Modus • Median • arithmetisches Mittel Streuungsmaße a) auf Median basierend • Interquartilsabstand • 1. Quartil Q1 • 3. Quartil Q3 • 1. DezilDl • 9. Dezil D9 b) auf arithmetischem Mittel beruhend • Varianz s^ • Standardabweichung s • durchschnittliche absolute Abweichung d Ergänzende Maße • Variationskoeffizient VK • Schiefe • Wölbung • Gini-Koeffizient

203

Männer

Frauen

5408 5746 6076

3396 3549 3727

2620 4577 7197 3697 8804

1545 2853 4398 2198 5332

4618108 2149 1631

1973339 1405 999

35% 1,12 2,31 19,0 %

38% 1,99 10,03 19,2 %

Bezieht man die Standardabweichung auf das jeweilige arithmetische Mittel (Variationskoeffizient VK) so beträgt er bei den Männern 35 % und bei den Frauen 38 %. Damit hat sich der ursprüngliche Eindruck nicht bestätigt, daß die Frauen-Verdienste relativ stärker um das Mittel konzentriert seien als bei den Männern. Absolut betrachtet gilt das aber doch, denn der Interquartilsabstand ist bei den Männern viel größer als bei den Frauen. Dies sieht man besonders deutlich in der Darstellung als Box-Plot Diagramm. Bei den Männern sehen die Verhältnisse wie folgt aus:

Q=4577

Q 3 = 7197

Median=5746 I I Interquartilsabstand = 2620 Bei den Frauen ist die Box an Hand dieser Daten natürlich viel kleiner und liegt viel weiter links, wie man hier deutlich erkennen kann:

Q j = 2853

Q 3 =4398

Median=3549 I I Interquartilsabstand = 1545

204

Kapitel VIII: Mittelwerte und Streuungsmaße am Beispiel der Einkommensverteilung

Damit sind nur kurz die Möglichkeiten der beschreibenden Statistik dargestellt. Jede bessere weitergehende Analyse würde jetzt auf der Basis der bisher gewonnen Maße aufbauen. Doch dies soll hier nicht geleistet werden, dieser Überblick soll genügen.

VIIL2.2 Internationale Einkommensverteilung Nach dem Human Development Report 1992 der UNDP ist die internationale Einkommensverteilung äußerst ungleich und wurde in den letzten 30 Jahren immer ungleicher. Maßstab ist das Bruttoinlandsprodukt (BIP), das nicht gerade das perfekteste Maß ist, das aber für alle 160 in Betracht gezogenen Länder am ehesten verfügbar ist. Das ärmste Land ist Moçambique mit einem Bruttoinlandsprodukt pro Kopf von 80 $ im Jahr 1989. Das reichste Land ist die Schweiz mit 29 880 $. Das arithmetische Mittel liegt bei immerhin 3 735 $, was gar nicht so schlecht klingt. Betrachtet man aber den Median, so erhält man einen erschreckend geringen Wert von 360 $. Natürlich ist - wie gesagt - das BIP nicht der adäquate Maßstab, denn es mißt primär nur die gehandelten und mit Marktpreisen versehenen Güter und Dienstleistungen. Gemessen an der Kaufkraft für Güter, die für uns wie selbstverständlich zum Leben gehören, indiziert ein so krasser Unterschied im BIP pro Kopf zwischen den Ländern doch recht zutreffend eine enorme Ungleichheit in der Verfügbarkeit an Gütern und Dienstleistungen und damit auch an Lebenschancen. Um noch einmal die Struktur der Verteilung vom BIP pro Kopf sowie die große Diskrepanz zwischen Median und arithmetischem Mittel zu demonstrieren, sei auf folgende Graphik verwiesen:

Staaten nach der Höhe ihres pro-Kopf Einkommens ^Bruttoinlandsprodukt pro Kopf) 1989

Einkonmensklassen (bis unter... $)

Das gewogene arithmetische Mittel liegt in diesem Fall so hoch, daß 78 % des Pro-Kopf Einkommens der Weltbevölkerung unter ihm liegen bzw. nur 22 % liegen über ihm. Der Median oder der häufigste Wert sind in diesem Fall ganz bestimmt die Mittelwerte, die am ehesten der Beschreibung dieser weltweiten Einkommensungleichverteilung gerecht werden.

Vili.3 Durchschaubare Taktiken in der Praxis

205

Die UNDP argumentiert in ihrem Report primär mit Quintilen und dem Gini-Koefiizienten; folgende Werte hat man ermittelt (siehe den Report, S. 36): Jahr

1960 1970 1980 1989

Globale Einkommensverteilung 1960 - 1989 Anteil am Bruttoinlandsprodukt Ärmstes Quintil Reichstes Quintil Verhältnis der in % in % Reichen zu den Armen 1 2 3 = Spalten 2 : 1 70,2 30: 1 2,3 2,3 73,9 32:1 76,3 45 : 1 1,7 82,7 59:1 1,4

GiniKoeffizient 4 0,69 0,71 0,79 0,87

Demnach haben 1989 die ärmsten 20 % der Weltbevölkening gerade mal einen Anteil von 1,4 % am Welt-Bruttoinlandsprodukt (BIP), während andererseits die 20 % reichsten der Welt einen Anteil von fast 83 % haben. Wenn man genauer in die Tabellen in diesem Report schaut, dann findet man auch, daß die reichsten 10 % über mehr als die Hälfte, nämlich fast 56 %, des Welt-BIP verfügen. Zu diesen Ländern zählen natürlich die reichen europäischen Länder sowie die USA, Kanada und Japan. Die UNDP hat die Verhältnisse auch auf beeindruckende Weise in Form einer Graphik dargestellt, wo die horizontale Schichtung der Quintile einem Kelch mit großem Kopf, aber winzig dünnem Stiel gleicht:

Benutzt man für einen Zeitvergleich ab 1960 den Gini-Koefiizienten, der eine statistische Größe zur Quantifizierung von ungleichen Verteilungen ist, erkennt man einen Anstieg von 69 % im Jahr 1960 auf 87 % im Jahr 1989 (zum Gini-Koefiizienten und zu einer Kommentierung gerade der letzten Zahl siehe das Kapitel "Konzentrationsmessung" in diesem Buch). Das kommt schon 100 %, was völlige Ungleichverteilung bedeutet, so nahe, daß man es eigentlich gar nicht glauben mag und wo der Gini-KoeSizient

206

Kapitel VIII: Mittelwelte und Streuungsmaße am Beispiel der Einkommensverteilung

aus dem letzten Kapitel Uber die Konzentration der Angestellten-Gehälter mit noch nicht einmal 20 % lächerlich gering wirkt. Wem diese Zahlen und vor allem die beängstigende Tendenz der letzten 30 Jahre noch nicht genügen, sei daran erinnert, daß die bisherigen Ergebnisse auf dem Vergleich vom BIP pro Kopf beruhen, also auf Durchschnittszahlen pro Land. WUrde man jedoch noch die Einkommensdisparitäten innerhalb jedes Landes berücksichtigen, kämen noch weit höhere Zahlen heraus. Dieser Vergleich ist allerdings für alle Länder nicht möglich, weil es keine Daten gibt. Die UNDP hat es lediglich für 41 Länder geschafft. Das Ergebnis ist: War die Relation vom oberen zum unteren Quintil beim Durchschnittsvergleich in diesen 41 Ländern 65 :1, so steigt diese Relation um mehr als das zweifache auf 140 : 1, wenn man die intranationalen Einkommensunterschiede auch noch berücksichtigt. Es sei jedem die Lektüre dieses Reports empfohlen! Noch einmal wiederholt sei, daß gewisse Betrachtungsweisen bei der Streuungs- und Konzentrationsmessung gleich sind. Deswegen ist dieses letzte Beispiel bewußt zweimal in diesem Buch zu finden. Lesen Sie dieses Kapitel unbedingt zusammen mit Kapitel V.7 und V.8.

VITT.3 Durchschaubare Taktiken in der Praxis "Finden Sie auch..., daß es verdammt viel wichtigere Probleme im Bereich Gesundheitswesen gibt als die Frage, ob der Arzt viermal oder fünfmal mehr verdient als der 'homunculus vulgaris'?" (Rundbrief der 'Aktionsgemeinschaft Baden-Württembergischer Ärzte', zitiert aus dem HohlSPIEGEL 8/1992) Mancher kennt vielleicht das herrliche Beispiel über einen verzweifelten Statistik-Konsumenten, der gerne etwas über die Einkommensverteilung in dem Dorf Neureichenbach am Kleinen Protz erfahren möchte (siehe H. Swoboda, Knaurs Buch der modernen Statistik, München-Zürich 1971). Dieser arme Mensch geht zuerst zu einem Makler, der ihm erzählt, daß das Durchschnittseinkommen in Neureichenbach 82 000 Taler beträgt. Ein befreundeter Bankdirektor sagt ihm jedoch etwas anderes, nämlich daß die Hälfte dort ein Einkommen von 29 000 Taler und mehr hat, daß die stärkste Einkommenskategorie zwischen 12 000 und 24 000 Talern liege und daß das häufigste Einkommen 18 000 Taler sei. Im Landratsamt sagt man ihm, das Durchschnittseinkommen beträgt 29 000 Taler. Schließlich erzählt ihm der Lehrer Rechenmeier, daß 2/3 der Familien weniger als 30 000 Taler haben und daß das Pro-Kopf Einkommen nicht mal 7 500 Taler beträgt. Der arme Konsument summiert seine Erfahrungen schließlich in dem Satz, daß er nun bestätigt bekommen hätte, was er schon immer vermutete, daß nämlich alle "Statistiker notorische Lügner und Wahrheitsverdreher" sind. Die Situation des Armen ist verständlich, doch er hätte besser daran getan, zuerst dieses StatistikLehrbuch zu lesen, bevor er sich bzgl. Daten ratsuchend an andere wendet. Wir haben in den letzten beiden Kapiteln ein ziemlich diversifiziertes Instrumentarium der Mittelwert- und Streuungsberechnung kennengelernt. Es ist also für jeden etwas dabei in der großen statistischen "Trick"-kiste. Verschiedene Formeln führen natürlich zu verschiedenen Ergebnissen. So pickt sich eben jeder heraus, wie er es braucht. Günstigstenfalls sei unterstellt, daß dies oft aus Nachlässigkeit geschieht oder weil man nicht die Alternativen kennt. Wer mit dem häufigsten Wert klar kommt, hat vielleicht keine Lust, das arithmetische Mittel mühsam auszurechnen. In der Realität muß man jedoch meistens eine Absicht unterstellen, warum bestimmte Mittelwerte und/oder Streuungsmaße ausgewählt werden und warum andere eben nicht gewählt werden. Wie wir nun schon wissen, gibt es bei linkssteilen Verteilungen (wie z.B. bei Einkommensverteilungen) bei der

207

VIII.3 Durchschaubare Taktiken in der Praxis

Größenordnung von Modus, Median und arithmetischem Mittel eine bestimmte Reihenfolge: Das arithmetische Mittel ist immer der größere Wert der drei Mittelwerte, bei sehr ungleichen Verteilungen ist es sogar ziemlich groß im Vergleich zu den anderen beiden Werten. Der Median ist meistens der mittlere von den beiden anderen. Ist man also z.B. an der Darstellung von kleinen Einkommenswerten interessiert, so wählt man eben den Modus und verschweigt die beiden anderen Werte. Ist man dagegen am Nachweis von hohen Einkommen interessiert, dann wählt man eben das arithmetische Mittel. Diese "Selektion" geht meistens einher mit einer veibalen/begrifflichen Verschleierung des Mittelwertes, über den man gerade spricht. Man spricht z.B. nicht vom Modus, sondern man spricht gerne einfach nur von "dem" Mittelwert in der Hoffnung, daß der Adressat nicht nachfragt, um welchen "Mittelwert" es sich gerade handelt. In der Statistik geht es somit zu wie auf anderen Gebieten auch, wenn es darum geht, jemanden hinters Licht zu führen: Es gehören immer zwei dazu, nämlich einer, der etwas zu verschleiern versucht, und jemand, der gutgläubig jede angebotene Information als wahr übernimmt. Dieses Buch soll nicht dazu dienen, mit welchen statistischen Tricks man Leute aufs Kreuz legen kann, sondern dazu, wie man leichter die Tricks der anderen durchschauen kann. Ein klassisches Gebiet, wo mit verschiedenen statistischen Begriffen jongliert wird, sind z.B. Tarifauseinandersetzungen. Oft gehen z.B. die Gewerkschaften und ihnen nahe stehende Gruppierungen vom Modus oder Median aus, wenn es um den Nachweis der hoffnungslosen Lage der Arbeiterklasse geht. Arbeitgeber haben dagegen eher die Tendenz, mit dem arithmetischen Mittel zu argumentieren, wenn es um den Nachweis des exzellenten ökonomischen Wohlstands der arbeitenden Bevölkerung geht. Alle haben recht und gleichzeitig eben wieder nicht. Umgekehrtes ist z.B. bei den bekannt hohen Einkommen von Ärzten zu beobachten: Um die trostlose finanzielle Situation derselben zu demonstrieren, benutzen deren Standesvertreter gerne den Modus, denn viele junge Ärzte haben gerade erst ihre Praxis eröffnet und verdienen noch nicht so viel, um sich gleich einen Porsche leisten zu können. Man könnte diese Liste beliebig fortführen. Man frage sich also bei Angaben über Einkommen und deren Streuungsmaßen stets danach, von wem bzw. welchen Gruppierungen sie geliefert werden und welche Interessen dahinter stehen könnten - oder wie schon die alten Römer sagten: Cui bono? Für den "täglichen Gebrauch" schlage ich folgende Faustregeln für die Benutzung von Mittelwerten und Streuungsmaßen vor: Sachverhalt • mehr beschreibende Statistik • insbesondere bei asymmetrischen Verteilungen • mehr schließende Statistik, insbesondere bei der Teststatistik • bei symmetrischen Verteilungen wie z.B. der Normalverteilung

Mittelwert

Streuung

Modus, Median

Quantile, d, IQA

AM

S2

Kapitel IX Regression und Korrelation "Während einer nur Zahlen und Zeichen in seinem Kopf hat, kann er nicht dem Kausalzusammenhang auf die Spur kommen. " (Schopenhauer) "Das Alter (Zahl der Jahre) macht klug, das ist wahr, dieses heißt aber nichts weiter als Erfahrung macht klug. Hingegen Klugheit macht alt (das heißt Reue, Ehrgeiz, Ärger macht die Backen einfallen, die Haare grau, und ausfallen) ist nicht minder wahr. Diese täglichen Lehren mit Züchtigung, zwar nicht auf den Arsch, aber an gefährlicheren Teilen eingeschärft, sind ein wahres Gift. " (Georg Christoph Lichtenberg, Sudelbücher) "Ich hab ihm die Jahre über immer um abends um 9 Uhr immer noch a Tasse Salbei-Tee gekocht als Vorbeuchung gegen Erkältunge. Er neicht zu Erkältunge. Aber er hat ihn erst gar net trinke wolle. Aber dann hat er ihn doch immer getrunke wenn mer es ihm e paarmal gesacht hat. Er wollte ebe nur, daß mer es ihm oft sacht. Aber seit vorvorgestern, da hat er seinen Tee net mer getrunke. Er hat gesacht, ich soll ihn selber trinke. Und ich hab gesacht: "Artur, Du wirst Dich erkälte, wenn Du Deinen Salbei-Tee net trinkst. Du neichst zu Erkältunge. " Und er hat gesagt: "Ich war seit 20 Jahr net mehr erkältet. " Und da hab ich gesagt: "Ja, des stimmt. Ebe weil Du immer Deinen Salbei-Tee getrunke hast. "" (Frau vom BuchhalterMünzenberger in der Femsehserie "Die Familie Hesselbach")

Inhaltsverzeichnis IX. 1 Ernährung IX.2 Regressionsrechnung IX.2.1 Methode der kleinsten Quadrate IX.2.2 Alternative Kriterien der Anpassung IX.2.3 Transformation nicht-linearer Beziehungen IX.3 Korrelationsrechnung EX.4 Transformation der x- und y-Achse IX. 5 Rangkorrelation IX.6 Korrelation versus Kausalität IX.7 Prognosen IX. A Ableitungen IX. A. 1 Ableitung der Parameter a und b IX. A. 2 Ableitung der Formel für r EX.B Beispiele IX.B.1 Beispiel 1 IX.B.2 Beispiel 2 IX.B.3 Beispiel 3 Anhang 1: Über Kausalitäten in der Naturwissenschaft und bei Umweltrisiken Anhang 2: Leben mit der Gasmaske?

212 212 213 215 216 220 225 226 227 228 230 230 231 232 232 233 233 235 236

Kapitel DC: Regression und Korrelation

212

IX. 1 Einführung Die Art und Stärke des Zusammenhangs zwischen zwei (oder mehreren) Variablen wird mit Hilfe der Regressions- und Korrelationsanalyse quantifiziert. Der Einfachheit halber geht man oft vom zweidimensionalen Fall, also von zwei Variablen, aus. Außerdem unterstellt man oft zunächst einmal einen linearen Zusammenhang zwischen den Variablen. So reduziert sich das Rechenproblem darauf, aus einer zweidimensionalen Häufigkeitsverteilung ("Punktwolke") eine Gerade y=a+bx zu berechnen. Dies ist Gegenstand der Regressionsrechnung, die die Art des Zusammenhangs zwischen den Variablen analysiert. Die Korrelationsanalyse quantifiziert darüber hinaus die Stärke des Zusammenhangs zwischen den Variablen. Da häufig schon durch bloßen Augenschein gewisse Vorstellungen Uber den quantitativen Zusammenhang zwischen den Variablen gewonnen werden können, wird üblicherweise der den quantitativen Verhältnissen am ehesten entsprechende Funktionstyp (ggf. mit einigen wenigen Alternativen) ex ante festgelegt. Das bedeutet, daß die Regressionsrechnung nicht den optimalen Funktionstyp als Resultat, sondern lediglich die Parameter des schon ex ante festgelegten Funktionstyps liefert. Bei einer Geraden bedeutet dies die Berechnung der zwei Parameter einer Geraden, nämlich die Steigung b und das absolute Glied a. Die Korrelationsrechnung liefert dazu ein Maß fiir den Grad der "Anschmiegung" der Werte der berechneten Funktion an die originäre Punktwolke. Rechnet man alternative Funktionstypen durch, so liefert die Korrelationsrechnung Anhaltspunkte für die Auswahl des relativ "besten" Funktionstyps. Auf jeden Fall muß man sich im klaren darüber sein, daß die Regressions- und Korrelationsanalyse lediglich das zahlenmäßige Verhältnis zwischen den Variablen mit einer mathematischen Funktion zu beschreiben versucht, aber aus prinzipiellen Gründen kann sie keine Aussagen zu den ursächlichen Beziehungen zwischen den Variablen treffen. Zwar unterstellt man gewisse Beziehungen zwischen den Variablen, indem man üblicherweise der Variablen χ das vermutlich unabhängige bzw. beeinflussende Merkmal zuordnet (Regressor) und der Variablen y das vermutlich abhängige, beeinflußte bzw. reagierende Merkmal (Regressand) zuweist. Der Kausalität kann man aber lediglich durch ergänzende, außerhalb der rein statistischen Berechnungen liegenden Überlegungen/Theorien näher zu kommen versuchen.

IX.2 Regressionsrechnung Ausgangspunkt sollen zweidimensionale Häufigkeitsverteilungen sein, wie sie z.B. in den folgenden Skizzen dargestellt sind:

*

*

*

*

* *

b>0 positiver (enger) Zusammenhang

b

Ihr Erwartungswert E(X) = μ und ihre Varianz V(X) = σ 2 sind allerdings von erfreulicher Einfachheit. Die Normalverteilung hat darüber hinaus noch einige weitere vorteilhafte Eigenschallen: 1. Sie ist durch zwei Parameter μ und σ eindeutig bestimmt, was man auch vereinfachend mit Ν(μ;σ) ausdrückt. Eine Normalverteilung N(3;2) hat also den Mittelwert μ = 3 und die Standardabweichung σ = 2. 2. Sie ist symmetrisch, woraus folgt, dafl ihr Mittelwert χ (bzw. üblicherweise μ) = Median = Modus. 3. Im Abstand von ±σ um μ herum befinden sich die Wendepunkte der Funktion. 4. Durch die Funktion der Normalverteilung ist bekannt, daß sich im Abstand von ±σ um μ herum gut zwei Drittel (genau 68,3 %) der Gesamtfläche unter der Glockenkurve befinden. Im Abstand von ±2σ um μ herum sind es 95,4 %. Dies sei an den folgenden beiden Graphiken dargestellt:

XI. 1 Die Normal Verteilung und ihre Parameter

μ+σ

μ-σ

μ-2σ

259

μ

μ+2σ

Fläche unter der Glockenkurve im Abstand von ±σ bzw. ±2σ um μ

5. Der Vollständigkeit halber sei noch ergänzt, daß sie sich theoretisch nach beiden Seiten ins Unendliche fortsetzt, ohne die x-Achse zu erreichen. Die Normalverteilung ist äußerst beliebt in der schließenden Statistik. Je nach den Parametern der Normalverteilung gibt es jedoch unendlich viele verschiedene Ausprägungen der Normalverteilung:

Darstellung verschiedener Normalverteilungen

Dieses Durcheinander sei im folgenden etwas sortiert Zunächst werden die Normalverteilungen herausgepickt, die das selbe σ haben, nur ihr Mittelwert μ ist verschieden:

260

Kapitel XI: Nomuilvetteiliing und andere Zufalbveiteilungen

Verschiedene Normalverteilungen mit identischen σ, aber unterschiedlichem μ In der nächsten Graphik haben alle Normalverteilungen den selben Mittelwert μ, aber unterschiedliche Streuung σ:

XI.2 Die SUndard-NoimalVerteilung

261

Verschiedene Normalverteilungen mit identischem μ, aber unterschiedlichem σ Damit sind die Vereinfachungsmöglichkeiten noch nicht erschöpft. Im folgenden Kapitel wird gezeigt, wie man alle Normalverteilungen in eine einzige, nämlich in die Standard-Normalverteilung überführen kann.

XI.2 Die Standard-Normalverteilung Aus den beiden letzten Graphiken kann man folgende Strategie der Überführung einer beliebigen Normalverteilung in eine einzige ableiten: Das vorletzte Schaubild, in dem sich alle Normalverteilungen nur bezüglich des Mittelwertes unterschieden, legt zunächst einmal eine lineare Transformation nahe, am besten in den Nullpunkt. Dies geschieht durch die folgende Formel: a) Transformation in den Nullpunkt: χ-μ Das letzte Schaubild, wo sich die Normalverteilungen nur durch das σ unterschieden, legt nahe, nach der Transformation in den Nullpunkt noch eine Normierung mit Hilfe der Standardabweichung σ vorzunehmen:

262

Kapitel XI: Normalverteilung und andere Zufalbverteilungen

Χ-μ

b) Transformation und Normierung durch die Standardabweichung: —~ Damit ergibt sich folgende Standardisierungsformel mit einem Parameter, den man üblicherweise mit ζ bezeichnet: c) Standardisierungsformel: ζ =

χ-μc

Damit kann man jede beliebige Normalverteilung in eine einzige Standard-Normalverteilung überführen bzw. umgekehrt: Man kann ausgehend von der Standard-Normalverteilung jede beliebige Normalverteilung berechnen. Die Zufallsvariable heißt nun z. Aus der Menge der möglichen Normalverteilungen zeichnet sich die Standard-Normalverteilung durch besondere Einfachheit aus. Sie hat den Mittelwert μ = 0 und die Standardabweichung σ = 1. Ihr Erwartungswert ist also E(Z) = 0 und ihre Varianz V(Z) = 1. Man bezeichnet sie auch kurz mit N(0;1). Dazu kommt noch die äußerst günstige Eigenschaft, daß die Fläche unter ihrer Glockenkurve genau 1 beträgt. Das Schema der Standardisierung sei noch einmal an folgender Graphik gezeigt. Ist ein spezielles x* gegeben, so ist mit Hilfe der Standardisierungsformel das entsprechende z* berechenbar und umgekehrt:

μ-2σ

μ-σ

* μ

μ+σ

μ+2σ

+1

+2

ζ -2

Schema der Standardisierung

XI.3 Rechenbeispiele

263

XI.3 Rechenbeispiele Nehmen wir einmal an, die Verteilung eines bestimmten Merkmals sei normalverteilt. Diese Normalverteilung soll einen Mittelwert von μ=100 und eine Standardabweichung von σ=5 haben. Man könnte nun fragen, wie groß der Anteil von Einheiten ist, deren Merkmalsausprägung zwischen μ=100 und x*= 105,1 liegt. Es empfiehlt sich, die Berechnung in mehrere Teilschritte zu zerlegen: 1. Schreibe die wichtigen Größen separat auf ein Stück Papier, also: μ = 100, σ = 5, Fläche des Intervalls [μ=100; x»=105,l] 2. Zeichne diese Größen in einer Graphik der Normalverteilung ein (siehe folgende Graphik). χ*-μ 3. Standardisiere die Werte der Normalverteilung: z* = — =

105,1 - 100 5,1 — ^ = ^ = 1,02

4. Markiere dieses z* in einer zusätzlichen Abszisse, so wie in der folgenden Graphik. 5. Schaue in der statistischen Tabelle 1 nach, welcher Wert bei z* = 1,02 angegeben ist. In unserem Fall steht bei ζ* = 1,02 ein Weit von 3461. Wieso? Schaue in der folgenden Tabelle im Schnittpunkt der Reihe mit z*=l,0 und der Spalte mit z*=0,02 nach! 6. Resultat: 0,3461 bzw. 34,61% aller Einheiten liegen im Intervall [0; 1,02] bzgl. der Zufallsvaribalen ζ bzw. im Intervall [μ=100; x*=105,l] bzgl. der Zufallsvariablen x.

z· 0,0 0,1 0,2 0,3 0,4

0,00 0,0000 0398 0793 1179 1554

0,01 0,0040 0438 0832 1217 1591

0,5 0,6 0,7 0,8 0,9

1915 2257 2580 2881 3159

1950 2291 2611 2910 3186

3643

3665

1,0 1,1

0,02 1 1 1 1 I 1 1 1 1 1 4.

0,03 0,0120 0517 0910 1293 1664 2019 2357 2673 2967 3238

3461

3485

3686

3708

Kapitel XI: Nomulverteilung und andere Zufatlsverteilungen

264

100

x*=105,l

Nl/

M/

0

z*=l,02

χ

ζ

Der Weg funktioniert auch umgekehrt und sei an folgendem Beispiel demonstriert: Jemand interessiert sich dafür, in welchem Intervall das 3. Quartil einer normalverteilten Variablen liegt, die sich durch ein μ=100 und σ=5 auszeichnet. Es sei in Erinnerung gerufen, daß das 3. Quartil genau 25 % aller Einheiten umfaßt, die "rechts" vom Median liegen. Der Median einer Normalverteilung ist mit μ identisch. Es gilt also das Intervall zu finden, daß - von μ aus gesehen - eine Fläche von 25 % umfaßt. Suche in der ausführlichen statistischen Tabelle 1 im Anhang den Wert 2500. Richtig! Den gibt es nicht. Dafür gibt es aber die Werte 2486 für z+=0,67 und 2517 für z*=0,68. Der gesuchte Wert von z* liegt zwischen 0,67 und 0,68. Es muß also die Differenz von 0,01 zwischen beiden z*-Werten interpoliert werden: Die Differenz von 2486 zu 2500 beträgt 14 und die Gesamtdifferenz beträgt 31 (=2517-2486). Nach einem simplen Dreisatz muß man die 0,01 mit 14/31 multiplizieren und zu z*=0,67 addieren: z* = 0,67 +

0,01 · 14

= 0,67 + 0,00452 = 0,67452

Berechne nun, welchem x* dieses z* entspricht: χ* = z* • σ + μ = 0,67452 · 5 + 100 = 3,37260 + 100 = 103,37260 » 103,4 Resultat: Das 3. Quartil liegt im Intervall [100; 103,4],

XI.3 Rechenbeùpiele

265

Das Schema der Berechnung ist wie folgt: Schemata zur Benutzung der statistischen Tabelle 1 Schema 1: Von x* zur Wahrscheinlichkeit Schema 2: Von der Wahrscheinlichkeit zu x* Welches Intervall ist gesucht? Welche Wahrscheinlichkeit ist vorgegeben? i 4Rechne x* in z* um nach der Formel: Suche die Wahrscheinlichkeit in der Tabelle 7* =

X

i

Lese z* ab (ggf. interpoliere)

σ

i

Suche ζ* in der Tabelle i Lese die entsprechende Wahrscheinlichkeit ab

i

Berechne den entsprechenden Wert von x* nach der Formel: χ* = z* • σ + μ

Am Anfang dieses Kapitels wurde gesagt, daß im Abstand von ±σ bzw. ±2σ um μ herum genau 68,3 bzw. 95,4 % der Gesamtfläche einer Normalverteilung liegt. Wieso? Geht man von der Standard-Normalverteilung aus, so hat man die Fläche zu berechnen, die im Abstand von ±1 bzw. ±2 um 0 herum liegt. Da es sich um ein symmetrisches Problem handelt, reicht es, das Intervall [0;1] bzw. [0;2] zu bestimmen und jeweils mit 2 zu multiplizieren: Aus der Tabelle im Anhang ergibt sich ein Wert für z* von 3413 im Falle von σ=1 bzw. 4772 im Falle von σ=2. Mit jeweils 2 multipliziert ergeben sich die gesuchten Flächen als: Fläche im Intervall [-σ; +σ]: = 2 · 0,3413 = 0,6826 » 68,3 % Fläche im Intervall [-2σ; +2σ]: = 2 · 0,4772 = 0,9544 » 95,4 % Zwei weitere Beispiele für die Fläche im Intervall folgenden Graphiken dargestellt:

1,645] bzw. [-1,96; 1,96] sind in den

Kapitel XI: Normalverteilung und andere Zufalbverteilungen

266

Fläche im Intervall 0] : + Fläche im Intervall Í0:1.6451: = Gesamtfläche [-; 1,645]:

0,5000 0.4500 0.9500

Fläche [-1,96; 0]: + Fläche Í0:1.961: = Gesamtfläche [-1,96; 1,96]:

0,4500 0.4500 0.9500

z*=1,645

z**=-l,96

0

z*=l,96

Zwei Beispiele zur Benutzung der Tabelle der Standard-Normalverteilung Im den folgenden Kapiteln werden wir den beiden letzten Beispielen noch häufiger begegnen, das obere bei der Bestimmung des kritischen Wertes von ζ bei einem rechtsseitigen Test, das untere bei einem beidseitigem Test, jeweils bei einer Irrtumswahrscheinlichkeit von α = 5 %.

XI.4 Zentraler Grenzwertsatz Bei Stichproben zeigt sich eine Eigenart ihrer Mittelwerte, die mit dem imposant klingenden Begriff "zentraler Grenzwertsatz" beschrieben wird. Er kann jedoch mit einem relativ simplen Würfel-Beispiel demonstriert werden, das uns noch aus dem letzten Kapitel bekannt ist: Jede der 6 Merkmalsausprägungen kommt beim Würfel mit der Häufigkeit f| = 1/6 vor. Der Mittel21 wert μ der Grundgesamtheit ist -g- = 3,5. Nun sollen aus dieser Grundgesamtheit Stichproben gezogen werden mit dem Umfang η = 2, wobei insgesamt folgende 36 verschiedene Stichprobenergebnisse möglich sind (mit Zurücklegen und mit Berücksichtigung der Reihenfolge):

XI.4 Zentraler Grenzwertsatz

Stichprobenergebnisse (Elementarereignisse) (11) (12X21) (13)(31)(22) (14X41X23X32) (15X51X24X42X33) (16)(61)(25)(52)(34)(43) (26)(62)(35)(53)(44) (36X63X45X54) (46X64X55) (56X65) (66) 36 Stichproben

267

ΣΧΪ

X

2 3 4 5 6 7 8 9 10 11 12

1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0 5,5 6,0 x=3,5

P(*i) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36

0,028 0,056 0,083 0,111 0,139 0,167 0,139 0,111 0,083 0,056 0,028 Σ=ι

Wird nun eine Stichprobe im Umfang n=3 gezogen, so gibt es 6 · 6 · 6 = 216 verschiedene Stichprobenergebnisse, die hier nicht explizit dargestellt werden sollen. Auf der nächsten Seite sind dagegen die Ergebnisse zusammenfassend wie folgt dargestellt: Zunächst ist die Grundgesamtheit mit ihren 6 Merkmalsausprägungen eingezeichnet mit ihrer typischen rechteckigen Verteilung. In der Mitte sieht man das Bild der Ergebnisse, das sich ergibt, wenn man Stichproben im Umfang n=2 aus der Gnindgesamtheit zieht. Man erkennt, daß die Stichprobenergebnisse, die aus einer Rechteckveiteilung gezogen wurden, nicht wieder eine Rechteckverteilung ergeben, sondern sich deutlich in der Mitte um den Mittelwert 3,5 herum konzentrieren. Diese Tendenz zur Konzentration der Stichprobenergebnisse um den Mittelwert herum wird noch verstärkt, wenn man sich das Bild der Stichprobenergebnisse bei n=3 ansieht. Es zeigt sich also schon bei n=3 die Tendenz, die der zentrale Grenzwertsatz beschreibt. Noch deutlicher würde diese Tendenz natürlich bei n=4 oder n=5 usw., aber bei n=4 bzw. n=5 müflte man 1296 bzw. 7776 verschiedene Stichprobenergebnisse berechnen, sortieren und graphisch darstellen. Dies soll hier unterbleiben und stattdessen soll auf der übernächsten Seite generalisiert werden.

Kapitel XI: Normalverteilung und andere Zufallsverteilungen

268

Gnindgesamtheit Wahrscheinlichkeit 0.18-1

y

/

s

Γ

0.160.14· •

:. •

0.120.10.08-

W00§M

0.060.040.02ο-

s 1

2

3

4

5

6

Verteilung der Stichprobenmittelwerte bei n=2

Verteilung der Stichprobenmittelwerte bei n=3

Merkmalsausprägung

XI.4 Zentraler Greozwatsatz

269

Im allgemeinen Fall gilt: a) Mit steigendem η wird sich für die Verteilung der Stichproben-Mittelwerte x-^fast (approximativ) eine Noimalverteihing ergeben, unabhängig von der Art der Verteilung der Grundverteilung. b) Spezialfall: Ist die Grundverteilung normalverteilt, dann ist auch die Verteilung der StichprobenMittelwerte ebenfalls genau normalverteilt. Formal sagt der zentrale Grenzwertsatz: Ist eine Grondgesamtheit

σ 2 χ ) gegeben mit dem Er-

wartungswert E(x) = μ χ und der Varianz V(x) = σ 2 χ , dann sind die Stichproben-Mittelwerte x¡ daraus approximativ normalverteilt mit einem Erwartungswert für den Mittelwert χ von E(x) = μ und der σ2χ σ2χ Varianz V(x) = , es ergibt sich also eine Normalverteilung Ν (μ χ ; ""¡j - ) filr die Stichprobenmittelwerte. Allgemein soll dies auch an den folgenden generalisierenden Beispielen gezeigt werden. Die erste Zeile zeigt verschiedene Verteilungen der Grundgesamtheit. Die drei folgenden Zeilen zeigen die resultierenden Verteilungen der Stichprobenmittelweite bei verschiedenen Stichprobenumfängen von η = 2, 6 oder 30. Als Faustregel kann man daraus ableiten, daß bei η > 30 das arithmetische Mittel der Stichprobe annähernd normalverteilt ist, unabhängig von der Verteilung der Grundgesamtheit.

270

Kapitel XI: Normalverteilung und anden Zufallsverteilungen

Drei extreme Beispiele von Dichtefunktionen der Grundgesamtheit

Entsprechende Verteilungen der Stichprobenmittelwerte a) bei einem Stichprobenumfang von η = 2:

b) bei einem Stichprobenumfang von η = 6:

XI.3 W u ist "normal"?

271

XI.5 Was ist "normal"? Der Begriff "normal" ist eher verwirrend. Ihren Namen erhielt die Normalverteilung von dem Mathematiker und Astronomen Gauß (1777-1827) und Laplace (1749-1827). Mit "normal" in normativer Betrachtung hat dieser Begriff jedoch nichts zu tun. So ist es nicht verwunderlich, daß fast alle Verteilungen aus dem sogenannten "täglichen Leben" nicht normalverteilt sind. Die meisten ökonomischen oder soziologischen Merkmale wie z.B. Umsatz, Produktion, Einkommen, Vermögen, Bildungsgrade, Prestige u.a. sind (meistens sogar äußerst) ungleich verteilt, sie sind in eine bestimmte Richtung (linkssteil/rechtsschief) geneigt und somit weit entfernt von dem eleganten Bild der symmetrischen Normalverteilung. Fündig wird man eher im biologischen oder technischen Bereich. Siehe dazu die folgende Tabelle für Beispiele. In Lehrbüchern wimmelt es an Rechenbeispielen, wo es z.B. bei der Endkontrolle in Betrieben um die Verteilung der Verpackungs-Gewichte von Kaffeedosen geht. Jemand hat auch schon einmal die Verteilung der Intelligenzquotienten von Wehrpflichtigen als Beispiel herangezogen. Meines Wissens wurde aber bisher noch nicht die pädagogische Bedeutung der ebenfalls instruktiven Beispiele wie die Länge von Ziegenbärten oder die geruchliche Dauerhaftigkeit von Stinktier-Sekreten (gemessen in Tagen) ausgelotet. Diese bedauernswerte Lücke wird allerdings in diesem Buch nicht geschlossen werden - in dieser Auflage wenigstens noch nicht. Merkmal

biologische Beispiele

technische Beispiele ökonomische, soziale Beispiele

Stichprobenmittelwerte

(approximativ) normalverteilt Beispiele aus dem "täglichen Leben Baumhöhe Schwangerschañsdauer Anzahl Leopardenflecken Körpergröße Lebenserwartung Gewicht von Hühnereiern Reißfestigkeit von Seilen Brenndauer von Glühbirnen Einkommen Vermögen Umsatz Bildungsabschlüsse Prestige Stichprobenstatistik

nicht normalverteilt

X X X X X X X X X X X X X χ

Es wird Zeit, die Vorstellung von der Normalverteilung zu entstauben. Die Bedeutung der Normalverteilung liegt nicht in der Beschreibung alltäglicher Phänomene wie die Reißfestigkeit von Zwirnsfäden oder die Flecken-Häufigkeit von Leopardenfellen, sondern vielmehr in ihrer Bedeutung in der Stichprobenstatistik. Nach dem zentralen Grenzwertsatz wird die Verteilung der Stichprobenwerte sich mit steigendem Stichprobenumfang stets einer Normalverteilung (zumindest) annähern, egal wie die Grundgesamtheit verteilt ist, und nur dies macht das Entscheidende für die Stichproben- und Test-Statistik aus.

Kapitel XI: Normal Verteilung und andere Zufallsverteilungen

272

XI.6 Andere Zufallsverteilungen: t- und Chiauadratverteilung Von den zahlreichen anderen Zufallsveiteilungen seien hier noch zwei weitere erwähnt, nämlich die t-Verteilung und die χ^-Verteilung, die in der Stichprobenstatistik und insbesondere in der Teststatistik eine besondere Rolle spielen. Der englische Statistiker Gösset (1876-1937) entwickelte eine Zufallsvariable, die vor allem bei kleinen Stichproben angewandt wird. Er veröffentlichte sie unter dem Pseudonym 'Student', später nannte man sie nach dem von Ciosset verwendeten Symbol 't' schlicht t-Verteilung. Die t-Verteilung hat vieles gemein mit der Normalverteilung, besonders für große Stichprobenumfänge ist sie sogar fast mit ihr identisch, wie das folgende Bild zeigt: V>30;NV

Drei verschiedene t-Verteilungen Der einzige Parameter der t-Verteilung ist der Freiheitsgrad v. Mit Freiheitsgrad bezeichnet man die Anzahl der frei variieibaren, weil unabhängigen Variablen. Will man z.B. einen Mittelwert aus η verschiedenen Einzelwerten berechnen, dann hat man nur n-1 Freiheitsgrade, denn der η-te Wert ergibt sich durch die Vorgabe des Ergebnisses für den Mittelwert. Beispiel: Der Mittelwert 6 ergibt sich durch Addition der drei Werte 3 + 6 + 9, die Summe ist 18, geteilt durch n=3 ergibt nach Adam Ries den Mittelwert 6. Dasselbe Ergebnis erhält man auch durch die Einzelwerte 5 + 6 + 7 = 18, geteilt durch 3 ergibt wieder 6. Frei wählbar sind aber nur zwei Werte, z.B. 5 und 6, denn, um die Summe 18 zu erhalten, muß der dritte Wert eine 7 sein. Also hat man für die drei Summanden nur n-1=3-2=2 Freiheitsgrade. Die t-Verteilung ist symmetrisch und sie hat den Erwartungswert E(t) = 0 und die Varianz V(t) = ^ , falls ν £ 3. Im Anhang befindet sich die statistische Tabelle 2, die die Werte der Verteilungsfunktion der t-Verteilung darstellt. Eine andere, sehr wichtige Verteilung ist die χ^-Verteilung. Wie die folgende Graphik zeigt, ist auch sie von der Anzahl der Freiheitsgrade abhängig, aber im Unterschied zur Normal- und t-Verteilung ist sie nicht symmetrisch. Sie nähert sich allerdings wie die t-Verteilung mit steigendem Stichprobenumfang der Normalverteilung an.

XI.6 Andere Zufallsvetteiluiigen: t- und Chiquadratverteilung

273

Ihre Kennzahlen lauten: Erwartungswert Ε(χ) = ν und die Varianz Υ(χ) = 2 ν

Drei verschiedene χ^-Verteilungen Im Anhang befindet sich die statistische Tabelle 3 mit den Werten für die χ2-Verteilung. In späteren Kapiteln werden wir auf die drei bisher genannten Zufallsverteilungen in extenso zurückkommen.

Kapitel XII Schätz- und Test-Statistik

"Die große Tragödie der Wissenschaft: die Ermordung einer schönen Hypothese durch eine häßliche Tatsache. " (Γ. H. Huxley) Karlstadt "Legen Sie Wert darauf, daß das Haus bald verkauft wird?" Valentin "Nein, sofort - in sofortiger Bälde!" Karlstadt "Kaufen Sie sich dann wieder ein neues Haus?" Valentin "Niemals mehr! Ich suche ein altes tausend Meter tiefes Bergwerk zu mieten. " Karlstadt "Und das wollen Sie dann bewohnen?" Valentin "Selbstverständlich!" Karlstadt "Das ist ja unheimlich!" Valentin "Schon - aber sicher!" Karlstadt "Vor wem?" Valentin "VorMeteorsteinen." Karlstadt "Aber Meteorsteine sind doch ganz selten. " Valentin "Schon, aber bei mir geht die Sicherheit über die Seltenheit. " (Karl Valentin, Hausverkauf, in: Buchbinder Wanniger)

Inhaltsverzeichnis XII. 1 Grundzüge des Schätzens XII.2 Grundzüge des Testens ΧΠ.3 Formalisierung: Der Test in 5 Schritten XII Anhang zu Risiko-Bestimmung, -Minimiemng und -Vermeidung Testfall 1: Zur Rationalität von Atomkraft-Risiken Testfall 2: Was ist eine fehleifreundliche Technik? Testfall 3: Wie man sich bei einem chemischen Angriff zu verhalten hat

278 283 290 293 293 295 296

Kapitel XII: Schatz- und Test-Statistik

278

ΧΠ.1 Grundzüge des Schätzens Wäre man allwissend, wttßte man als Statistiker Bescheid über alle Details einer Grundgesamtheit. Man würde insbesondere alle Parameter μ, σ usw. einer Gnindgesamtheit kennen. Man könnte daraus in einem sogenannten direkten Schluß wissen, wie wahrscheinlich das Auftreten bestimmter Stichprobenkennzahlen wie Mittelwert und Streuung sein wird. Dann bräuchte man aber eigentlich auch keine Stichprobe, keine Statistik und keine Statistiker. Ich als Statistiker sage da nur: "Gott sei Dank ist dem nicht so". Unsereins muß sich damit abfinden, dafi die Grundgesamtheit zumindest teilweise unbekannt ist. Der Normalfall ist, dafl wir von Stichprobengrößen wie x, s durch einen sogenannten Rttckschluß bzw. indirekten Schluß auf die teilweise unbekannten Parameter der Grundgesamtheit schließen müssen. Das Schema ist in folgender Übersicht dargestellt: Beobachtete Stichprobenkennzahlen (x, s usw.)

A

Rückschluß bzw. indirekter Schluß 4. (Unbekannte) Parameter der Grundgesamtheit (μ, σ 2 usw.) i Berechnung von Vertrauensintervallen Mehr Uber die Grundgesamtheit in Erfahrung zu bringen kann zum einen durch die Berechnung von Vertrauensintervallen und zum anderen durch Hypothesentests geschehen. Ersteres geschieht im Rahmen der Schätz-Statistik, letzteres im Rahmen der Test-Statistik. Bei der Schätz-Statistik beschreibt man, wo ausgehend von einem Stichprobenergebnis íür χ der zum ihm gehörende Mittelwert μ der Grundgesamtheit liegen wird, wenn man eine bestimmte Wahrscheinlichkeit bzw. ein Vertrauensintervall von z.B. (I-α) = 95 % für die mittleren Werte vorgibt. Die restlichen 5 % teilen sich je zur Hälfte auf die beiden Schwanzenden der Verteilung auf. Wenn man weiß, daß die Grundgesamtheit normalverteilt ist oder wenn der Stichprobenumfang ausreichend groß ist (was man normalerweise bei η ¿ 30 als erfüllt ansieht), dann kann man mit der schon bekannten Größe ζ das Intervall berechnen, in dem der tatsächliche Wert von μ liegen wird. Da - wie wir noch aus dem letzten Kapitel über die Normalverteilung wissen - sich ζ aus der Formel x-u ζ berechnet und da - wie wir vom zentralen Grenzwertsatz her wissen - Stichprobenmittelwerte χ aus einer Gnindgesamtheit mit dem Mittelwert μ und der Standardabweichung σ zu einer Normalverσ teilung mit einem Erwartungswert μ und einer Standardabweichung ~j= führen, kann man das Vertrauensn

V

intervall für μ mit einer Wahrscheinlichkeit von z.B. 95 % nach der folgenden Formel berechnen:

P ( x - Z o / 2

^

*

+

z

aJ2

^ >

=

1

-

a

=

0

·

9 5

XII. 1 GnindzQge de» Schätzen»

279

Der Suffix χ zeigt an, daß wir ein Vertrauensintervall ausgehend von den Stichprobenwerten für χ berechnen. Der Suffix von α/2 bei der Größe ζ besagt, dafi wir die Irrtumswahrscheinlichkeit α = 5 % auf die linke und rechte Schwanzhälfte der Verteilung aufteilen müssen. Wie wir ebenfalls noch aus dem letzten Kapitel wissen oder wie man leicht aus der statistischen Tabelle 1 aus dem Anhang ablesen kann, entspricht ein (I-α) von 95 % einem ζ von 1,96 bzw. die Fläche unter der Glockenkurve der Normalverteilung im Intervall [-z=-l,96; z=+l,96] entspricht genau 95 % der Gesamtfläche einer Standard-Normalverteilung. Folgende Graphik erklärt dies auf einen Blick:

χ μχ

μχ+1.96^

Das folgende Schaubild versucht aus einer anderen Sicht das Vertrauensintervall für μ χ zu erklären: Die verschiedenen Mittelwerte aus einer Stichprobe bilden eine Normalverteilung. Betrachtet man ein 95 %iges Vertrauensintervall, dann werden die meisten, nämlich 95 % aller Stichprobenwerte, im Vertrauensintervall liegen, d.h. sie schließen das zu ihnen gehörende μ aus der Grundgesamtheit ein. Nur wenige, also genau 5 %, werden außerhalb liegen. In unserem Schaubild sind fünf Stichprobenmittelwerte dargestellt, von denen nur einer, nämlich der vierte, außerhalb des Vertrauensintervalls liegt.

280

{Capitel XII: Schttz- und Test-Statistik

Es sei noch einmal wiederholt: Die bisher benutzte Formel für das Vertrauensintervall gilt dann, wenn die Grundgesamtheit normalverteilt ist oder wenn der Stichprobenumfang genügend groß ist. Außerdem muß auch noch in beiden Fällen die Standardabweichung σ der Grundgesamtheit bekannt sein. Dies sind ziemlich restriktive Bedingungen. Oft ist aber z.B. die Standardabweichung nicht bekannt. Dann kann man ersatzweise auf die Standardabweichung s der Stichprobe zurückgreifen. Es sollte aber gewährleistet sein, daß der Stichprobenumfang mindestens 100 beträgt. Ist jedoch zumindest bekannt, daß die Grundgesamtheit normalverteilt ist, dann kann man beim Schätzen auch anstatt der Größe ζ aus der Normalverteilung die Größe t aus der t-Verteilung verwenden. Die genannten verschiedenen Fälle sind in folgender Übersicht einmal dargestellt:

281

XII. 1 GnmdzOgc des Schätzens

Vertrauensintervall für μ

n=?

η

= 1 _ α

100 100 100 1 »~ ¡^= .) = 0,95 Ρ ( 1000 - 1,96 - j = £ μ χ S 1000 + 1,96 Ρ ( 1000 - 32,67 2S μ χ 5 1000 + 32,67 ) = 0,95 Ρ ( 967,33 á μ χ < 1032,67 ) = 0,95 Das Ergebnis lautet, daß nach den Ergebnissen der Stichprobe mit χ = 1000 Stunden der Mittelwert der Grundgesamtheit für die wahre Brenndauer der Glühbirnen mit einer Wahrscheinlichkeit von 95 % im Bereich von 967,33 ^ 1032,67 Stunden liegen wird. Unterstellt, die Grundgesamtheit der Glühbirnen wäre nicht normalverteilt und die Standardabweichung wäre nicht bekannt, so könnte man die Prüfgröße ζ für die Berechnung des Vertrauensintervalls nicht so ohne weiteres anwenden, es sei denn - siehe die vorherige Übersicht - der Stichprobenumfang betrüge mindestens 100; für die nicht bekannte Standardabweichung der Grundgesamtheit müßte man dann stellvertretend die Standardabweichung der Stichprobe nehmen. Unterstellt, die betrüge HO, dann kann man das Vertrauensintervall folgendermaßen berechnen:

Kapitel XII: Schatz- und Test-Statistik

282 Λ

A + ζ

Ρ(χ-Ζα/2 ή ζ * μχ* *

Ρ ( 1000-1,96 ^ = ^ μ

χ

5

α/2^)

= 1

"

α

1000 + 1,96

) = 0,95

Ρ ( 1000 - 21,56 £ μ χ 2 1000 + 21,56) = 0,95 Ρ ( 978,44 £ μ χ £ 1021,56 ) = 0,95 Wenn man nun davon ausgeht, die Standardabweichung der Grundgesamtheit sei unbekannt, aber die Grundgesamtheit sei zumindest normalverteilt, dann kann man kleine Stichproben, z.B. im Umfang von η = 25 durchführen. Dann aber darf man nicht mehr die Prüfgröße ζ verwenden, sondern man mufi auf die Prilfgröße t umsteigen. Die Standardabweichung der Stichprobe sei in diesem Fall 90. Ist n=25, so beträgt die Anzahl der Freiheitsgrade n-1 = 24. Bei einer Wahrscheinlichkeit von 95 % muß man nun in der statistischen Tabelle 2 im Anhang in der Zeile "24" und der Spalte "0,975" (denn α/2 ist 0,025) den entsprechenden t-Wert ablesen, der in unserem Fall 2,064 beträgt. Das Vertrauensintervall berechnet sich dann so: P(i-tot/2

Ρ ( 1000 - 2,064

+ta/2

á μ χ έ 1000 + 2,064

1-α

) = 0,95

Ρ ( 1000 - 37,15 £ μχ £ 1000 + 37,15 ) = 0,95 Ρ ( 962,85 «S μ χ £ 1037,15 ) = 0,95 In der folgenden Tabelle sind die Ergebnisse der letzten drei Beispiele noch einmal aufgelistet. Dazu sind auch die Ergebnisse angegeben, die sich einstellen würden, wenn das Vertrauensintervall 90 % oder 99 % betragen würde. Wie man erkennt, wird - unabhängig von der verwandten Prttfgröße - das Vertrauensintervall um so größer, je größer die Wahrscheinlichkeit ist. Ist ja auch klar: Je höher man das Vertrauensniveau der Schätzung ansetzt, so ist das gleichbedeutend mit einer Verbreiterung des Vertrauensintervalls.

Prüfgröße

Bedingungen

z*

σ=100 n=36 o=unbekannt n=100 o=unb., GG=NV n=25

z* t*

Vertrauensintervalle für μ χ Vertrauensniveau (I-α) = 0,90 (1-α) = 0,95 972,6 á μ χ 5 1027,4 967,3 £ μ χ £ 1032,7

(1-α) = 0,99 957,1 á μ χ £ 1042,9

981,9 ¿ μ χ 5 1018,1

978,4 S μ χ á 1021,6

971,7 £ μ χ ^ 1028,3

969,2 = 1 " α

Der Chef der Fabrik läßt nun von seinem Chefstatistiker wieder eine seiner routinemäßigen Stichproben von η = 36 Birnen durchführen. Die Stichprobe liefert diesmal eine durchschnittliche Brenndauer von 1030 Stunden. Wie immer setzt er sich ein Signifikanzniveau von α = 5 %. Dieses Signifikanzniveau bzw. Intumswahrscheinlichkeit ergibt nach der statistischen Tabelle 1 im Anhang einen sogenannten kritischen Wert z* von 1,96. Man setze nun alle notwendigen Werte in die Formel ein: 100 . 100 Ρ ( 1000 - 1,96 - f = < χ < 1000 + 1,96 ~ ¡ = ) = 1 - α = 0,95

Kapitel XII: Schätz- und Test-Statistik

284

Ρ ( 967,33 < χ < 1032,67 ) = 0,95 Die Intervallgrenzen liefern die sogenannten kritischen Weite flir die Stichprobenmittelweite x*. Liegt der Stichprobenmittelwert innerhalb dieser Grenzen, dann wird die Null-Hypothese nicht abgelehnt. Liegt das Stichprobenergebnis außerhalb dieser Grenzen, dann wird die Null-Hypothese mit einer Irrtumswahrscheiiüichkeit von 5 % abgelehnt. Unser Stichprobenergebnis von 1030 Stunden liegt gerade noch innerhalb des Nichtablehnungs-Intervalls [967,33; 1032,67], Es sind nun verschiedene Formulierungen des Ergebnisses möglich, die alle mehr oder weniger gleichrangig sind: •

Mit 95 %iger Wahrscheinlichkeit bzw. 5 %iger Irrtumswahrscheinlichkeit kann der Chef der Glühlampenfirma auf Grund dieses Ergebnisses nicht davon ausgehen, daß die durchschnittliche Brenndauer seiner Birnen signifikant vom Wert von 1000 Stunden abweicht. Das Stichprobenergebnis von 1030 Stunden liegt zwar über dem Wert von 1000 Stunden, dieses Ergebnis ist aber nur eins der 95 % anderen Ergebnissen, die unter den gegebenen Bedingungen im Bereich von 967,33 und 1032,67 Stunden zu erwarten sind.

Oder: •

Die These, daß die durchschnittliche Brenndauer 1000 Stunden beträgt, kann unter den gegebenen Bedingungen (noch) nicht verworfen werden.

Oder: •

Das Ergebnis falsifiziert nicht die Hypothese, daß die durchschnittliche Brenndauer 1000 Stunden beträgt, denn es ist nicht eins der 5 % aller Stichproben-Ergebnisse, die außerhalb des genannten Intervalls liegen.

Oder: •

Das Stichprobenergebnis ist nicht signifikant.

Unser Beispiel läßt sich auch an Hand der folgenden Skizze erläutern. Liegt ein Stichprobenergebnis innerhalb des schraffierten Gebiets, dann gehört es nach unserem Beispiel zu den 5 % aller Ergebnisse, die uns Veranlassung geben, das Ergebnis als signifikant einzustufen, um damit die ursprüngliche Hypothese zu verwerfen. Dies ist der Ablehnungsbereich der sogenannten Null-Hypothese HQ. Liegt das Stichprobenergebnis dagegen im mittleren Bereich, dann kann die Null-Hypothese (noch) nicht verworfen werden bzw. sie ist (noch) nicht falsifiziert worden: Das ist der sogenannte Nichtablehnungsbereich der Null-Hypothese. Dieses Wort "Nichtablehnungsbereich" ist natürlich kein gutes Deutsch. Normalerweise wird in Lehrbüchern das Wort "Annahmebereich" benutzt. Doch dies klingt nach "Verifizierung", was wiederum nicht zum Postulat von Popper paßt, daß Hypothesen nur falsifiziert, aber nicht verifiziert werden können. Für einen Grenzfall halte ich die Formulierung, daß ein Ergebnis, das in diesen Bereich fällt, nur vorläufig "angenommen" bzw. vorläufig (noch) beibehalten wird - quasi anstatt einer momentan (noch) nicht vorhandenen "besseren" Alternativ-Hypothese. Keinesfalls bedeutet das Wort "Annahme", daß die (noch) nicht verworfene Hypothese als wahr o.ä. eingestuft werden darf.

XII.2 GnindzOge des Testais

285

Beidseitiger Test: Kritische Grenzen beim Signifikanzniveau bzw. bei einer Irrtumswahrscheinlichkeit vona

Natürlich gibt es auch rechts- und linksseitige bzw. einseitige Tests. Ihrer bedient man sich, wenn es Veranlassung gibt zu vermuten, daß sich in einer Richtung etwas geändert haben könnte oder wenn es besonders wichtig ist zu wissen, was in einer bestimmten Richtung sich geändert haben könnte. Bleiben wir beim Glühlampenfabrikant. Durch technischen Fortschritt hat er versucht, die Brenndauer zu erhöhen, ohne seine Produktionskosten zu erhöhen. Dies wäre natürlich ein Werbeargument. Doch bevor er eine neue Werbekampagne startet, muß er sich sicher sein, daß die Brenndauer tatsächlich gestiegen ist. Der Test wird logisch so ablaufen, daß er als Null-Hypothese unterstellt, die Brenndauer hat sich nicht verändert, d.h. μ^=1000 Stunden. Als Alternativ-Hypothese wird er dagegen unterstellen, daß μ^>1000 Stunden sei. Kann er die Null-Hypothese verwerfen, dann spricht vieles dafür, daß die Alternativ-Hypothese die Gegebenheiten der Grundgesamtheit im Augenblick besser beschreibt, daß also die Brenndauer höchstwahrscheinlich gestiegen ist. In diesem Beispiel ist also ein rechtsseitiger Test angesagt. Die Formel daiQr lautet:

P ( x < μο + ζ

α

^)=1-α

Behalten wir die alten Daten bei; die Stichprobe mit dem Mittelwert von 1030 Stunden sei schon aus der Menge von Birnen gezogen worden, die nach dem neuen Produktionsverfahren angefertigt wurde. Setzt man unsere Daten ein, so ergibt sich:

Kapitel XII: SchUz- und Test-Statistik

286

Ρ ( χ < 1000 + 1,645

= 0,95

Ρ ( x < 1000 + 27,42) = 0,95 P ( x < 1027,42) = 0,95 Jetzt liegt unser Stichprobenergebnis von χ = 1030 Stunden rechts vom kritischen Wert von x* = 1027,42 Stunden. Das Ergebnis lautet nun, daß die Null-Hypothese - die Brenndauer beträgt 1000 Stunden - verworfen werden mufi. Aufgrund des Stichprobenergebnisses ist mit einer Irrtumswahrscheinlichkeit von 5 % zu schließen, daß die Brenndauer der Birnen signifikant von der Null-Hypothese verschieden ist, d.h. die Birnen der Grundgesamtheit brennen jetzt signifikant länger. Warum ist jetzt plötzlich die Hypothese zu verwerfen? Das einzige, was sich zum vorherigen Ergebnis geändert hat, ist der Wechsel vom beidseitigen zum einseitigen Test. Schauen wir uns dazu das Schema eines einseitigen, in unserem Fall eines rechtsseitigen Tests an: Rechtsseitiger Test: Kritische Grenze beim Signifikanzniveau bzw. bei einer Iniumswahrscheinlichkeit von α

V

Nichtablehnungsbereich der

Der Unterschied zum beidseitigen Test ist, daß sich die Irrtumswahrscheinlichkeit von 5 % jetzt nicht gleichmäßig auf die beiden Schwanzenden verteilt. Jetzt kommen die 5 % nur auf der rechten Seite zum Tragen, d.h. auf der rechten Seite ist der Ablehnungsbereich breiter / größer geworden. Das führt da-

XII.2 OrundzOge de* Testera

287

zu, daß das Stichprobenergebnis aus dem Nichtablehnungsbereich herausfällt bzw. in den Ablehnungsbereich hineinfällt. Ganz analog zum Schätzen gibt es - je nach Beschaffenheit der Grundgesamtheit bzw. der Stichprobe - verschiedene Formeln, von denen hier die uns schon bekannten drei Formeln interessieren, die in der folgenden Übersicht auf die Bedingungen eines Tests abgewandelt und in Form eines Entscheidungsbaumes dargestellt sind (Nach dem Motto: "Wenn χ und y gegeben sind, dann nehme man die Formel xyz."): Hypothesentests

Nichtparametrische Tests

Parametertests, z.B. für μ

σ bekannt

σ unbekannt

/V

\

GG = NV

\

n=? Prüfgröße (einseitig) Prüfgröße (zweiseitig)

GG = NV

nS30

/ η Ablehnung von HQ

Ein weiteres Beispiel stammt aus der stochastischen Einfachregression. Wenn Sie sich noch an das Kapitel über die Regressions- und Korrelationsanalyse erinnern, so war das Ziel der Einfachregression, aus einem gegebenen Datenmaterial / einer Punktwolke bzgl. zweier Variablen eine Gerade zu berechnen. Eine Gerade ist eindeutig durch zwei Parameter, nämlich durch das absolute Glied a und durch die Steigung b, bestimmt, wobei die Steigung b die wichtigere der beiden Größen ist. Ergibt sich z.B. auf Grund des Datenmaterials, daß b deutlich von 0 verschieden ist, so bedeutet das, daß sich mit Variation von der unabhängigen Variablen χ auch die abhängige Variable y verändert. Das Datenmaterial im Umfang von η kann man nun als Zufallsstichprobe aus einer Grundgesamtheit ansehen, wobei der Wert von b eine Zufallsvariable darstellt, die bei dieser Stichprobe vielleicht nur zufällig von Null verschieden ist. Eine andere Stichprobe könnte vielleicht gerade den Wert 0 liefern. Bei der stochastischen Regression stellt man nun eine Hypothese über b auf, die man einem Test unterwirft. Normalerweise wird man ein b=0 als Null-Hypothese unterstellen. Die Gerade, die sich bei einer Stichprobe im Umfang von n=6 ergab, sei nun die folgende: y = a + b x¡ = 12,44 -1,0933 x¡ Die Standardabweichung der Gnindgesamtheit sei nicht bekannt, aber man weiß, daß die Grundgesamtheit normalverteilt ist. Deswegen muß man, wie aus der Übersicht Aber die verschiedenen Arten von Hypothesentests hervorgeht, einen sogenannten t-Test durchführen. Die Prttfgröße wird im Fall der Einfachregression wie folgt beschrieben:

Kapitel XII: Schitz- und Test-Statistik

292

wobei b die Steigung ist, die sich aus der Stichprobe ergab, und β die Steigung der Gmndgesamtheit ist (die normalerweise bei der Null-Hypothese als 0 unterstellt wird), sj, ist die Streuung der Stichprobe, die in unserem Fall 0,05811 betragen soll. Für den t-Test braucht man zusätzlich noch die Anzahl der Freiheitsgrade, die bei n=6 und zwei Variablen genau n-2=4 beträgt. Der Test lauft nun wie folgt ab: 1. Schritt:

Formulierung der Hypothesen:

Ho:b = 0

HA: b > 0 2. Schritt:

Feststellen der relevanten Größen: rechtsseitiger t-Test, a=5%, n=6 d.h. v=4, sj,=0,05811

3. Schritt: 4. Schritt:

Bestimmung des kritischen t-Wertes t* = 2,132 Stichprobenergebnis b=-l,0933 führt zu einem t-Wert von b-0 S|j

5. Schritt:

-1,0933-0 •=-18,81 0,05811

Entscheidung: t = I-18,81 | > t * = 2,132 Die Null-Hypothese mufi verworfen werden. b

Für gewöhnlich gibt man in veröffentlichten Tests den Weit für b und sj, an, so daß t = ~ leicht selbst kalkuliert werden kann.

ΧΠ Anhang zu Risiko-Bestimmung, -Minimiening und -Vermeidung

293

Χ Π A n h a n g zu Risiko-Bestimmung. -Minimierung und -Vermeidung "Ein Defekt in der Brennstoffzufuhr, was natürlich nicht vorkommen sollte, eine einzige blöde Panne genügt, sagte ich, und was nützt es mir, daß von 1000 Flügen, die ich mache, 999 tadellos verlaufen; was interessiert es mich, daß am gleichen Tag, wo ich ins Meer stürze, 999 Maschinen tadellos landen?" (Max Frisch, Homo Faber) "Je planmäßiger die Menschen vorgehen, um so wirksamer trifft sie der Zufall. " (Friedrich Dürrenmatt) "Wenn irgendwas schiefgehen kann, dann geht es auch schief." (frei nach Murphys Gesetzen) "Wenn ein System komplex genug ist, dann produziert es von selber Fehler. Deshalb darf man solche Systeme nicht bauen. " (Charles Perrow) Standardargument der Agrarlobby: "Weniger als 1 Promille der einheimischen Eier sind mit Salmonellen infiziert. " Umrechnung: "Selbst wenn nur jedes 1000. Exemplar salmonellenverseucht sei, kämen in Deutschlandjährlich immerhin 10 Millionen infizierte Eier auf den Markt. " (Zusammenfassung aus dem SPIEGEL 6/1993)

Testfall 1: Zur Rationalität von Atomkraft-Risiken In Lehrbüchern werden normalerweise Beispiele herangezogen, die aus der Welt der Technik stammen. So wird die Lebensdauer von Glühbirnen oder Autoreifen getestet. Alternativ geht man von Irrtumswahrscheinlichkeiten von α = 5 % und - seltener - von 1 % oder 10 % aus. Es gibt viele Bereiche, wo solche Irrtumswahrscheinlichkeiten durchaus vertretbar sind. Problematisch wird dies jedoch, wo es z.B. um Sicherheitsfragen oder um Gesundheitsrisiken geht. Arzneimittel dürfen z.B. nicht den geringsten Zweifel daran lassen, daß sie durch Nebeneffekte nicht gesundheitsgefährdend sind. Ähnlich verhält es sich z.B. mit der Sicherheit von chemischen Fabriken oder von Atomkraftwerken. Gäbe es den geringsten Zweifel an ihrer Zuverlässigkeit, dann dürften sie nicht oder zumindest nicht so gebaut werden. Spätestens nach den Geschehnissen in Bhopal oder Tschernobyl sind die potentiellen Gefährdungen von großtechnischen Anlagen - zumindest zeitweise - ins öffentliche Bewußtsein gedrungen. Viele Beispiele über solche und andere Katastrophen, die oft das Ergebnis von unwahrscheinlichen bzw. hahnebüchenen Verkettungen von Verharmlosung, Ignoranz und Dummheit sind, wurden in dem Buch Wormale Katastrophen - Die unvermeidbaren Risiken der Großtechnik' von Charles Perrow zusammengetragen. Wie es jedoch tatsächlich mit der Rationalität bei der Risikoabschätzung bei großtechnischen Anlagen, speziell bei Atomanlagen, bestellt ist, damit setzt sich z.B. Ulrich Beck in seinem Buch 'Risikogesellschaft' auseinander. Im folgenden sind einige Ausschnitte aus dem 1. und 3. Teil dieses Buches zum Nachdenken wiedergegeben: "Der Rationalitätsanspruch der Wissenschaften, den Risikogehalt des Risikos sachlich zu ermitteln, entkräftet sich permanent selbst: Er beruht zum einen auf einem Kartenhaus spekulativer Annahmen und bewegt sich ausschließlich im Rahmen von Wahrscheinlichkeitsaussagen, deren Sicherheitsprognosen durch tatsächliche Unfälle strenggenommen nicht einmal widerlegt werden können...

294

Kapitel XII: Schitz- und Test-Statistik

Die Reaktorsicherheitsstudien beschränken sich auf die Schätzung bestimmter quantifizierbarer Risiken anhand wahrscheinlicher Unfälle. Die Dimensionalität des Risikos wird also vom Ansatz her bereits auf technische Handhabbarkeit eingeschränkt. Bei breiten Teilen der Bevölkerung und Kernenergie-Gegnem steht dagegen gerade das Katastrophenpotential der Kernenergie im Zentrum. Auch noch so gering gehaltene Unfallwahrscheinlichkeit ist dort zu hoch, wo ein Unfall die Vernichtung bedeutet. Femer spielen in der öffentlichen Diskussion Risikoeigenschaften eine Rolle, die in den Risikostudien gar nicht behandelt werden, etwa die Weiterverbreitung von Atomwaffen, der Widerspruch zwischen Menschlichkeit (Irrtum, Versagen) und Sicherheit, Langfristigkeit und Irreversibilität getroffener großtechnologischer Entscheidungen, die mit dem Leben zukünftiger Generationen spielen. Mit anderen Worten, in Risikodiskussionen werden die Risse und Gräben zwischen wissenschaftlicher und sozialer Rationalität im Umgang mit zivilisatorischen Gefährdungspotentialen deutlich. Man redet aneinander vorbei... Die Kernenergie ist in diesem Sinne ein höchst gefahrenvolles Spiel mit der unterstellten 'Irrtumslosigkeit' technologischer Entwicklung. Sie setzt Sachzwänge von Sachzwängen frei, die kaum revidierbar und nur beschränkt lemfähig sind. Sie legt (etwa in der Beseitigung bzw. Lagerung des Atommülls) die Menschen über mehrere Generationen hinweg fest, also für Zeiträume, in denen noch nicht einmal die Bedeutungsgleichheit der Schlüsselworte gesichert ist. Auch in ganz andere Bereiche wirft sie die Schatten unabsehbarer Folgen. Dies gilt in den sozialen Kontrollen, die sie erfordert und die in der Formel von dem 'autoritären Atomstaat' ihren Ausdruck gefunden haben. Dies gilt aber auch für biologisch-genetische Langzeitwirkungen, die heute noch gar nicht absehbar sind. Demgegenüber sind dezentrale Formen der Energieversorgung möglich, die diese 'Eigendynamik der Sachzwänge' nicht enthalten. Entwicklungsvarianten können also die Zukunft verbauen oder offenlassen. Je nachdem wird eine Entscheidung für oder gegen eine Reise ins unbekannte Niemandsland der zwar ungesehenen, aber absehbaren 'Nebenfolgen' getroffen. Wenn der Zug einmal abgefahren ist, ist es schwer, ihn wieder anzuhalten. Wir müssen also Entwicklungsvarianten wählen, die die Zukunft nicht verbauen und den Modernisierungsprozeß selbst in einen Lernprozeß verwandeln, in dem durch die Revidierbarkeit der Entscheidungen die Zurücknahme später erkannter Nebenwirkungen immer möglich bleibt. "

XII Anhang zu Risiko-Bestimmung, -Minimiening und -Vermeidung

295

Testfall 2: Was ist eine fehlerfreundliche Technik? Das folgende Interview wurde mit Christine von Weizsäcker mit der Zeitschrift GEO-Wissen 'Risiko' geführt. Sie hat bei der Auseinandersetzung um die Kernenergie den Begriff der Tehlerfreundlichkeit' bzw. 'Fehlertoleranz' geprägt. Wäre unser Dasein ohne Fehler leichter..? Gewiß nicht für Journalisten, Versicherungsvertreter und Wissenschaftler. Es gäbe weder Sensationen zu berichten, noch Schäden zu versichern, noch wissenschaftliche Hypothesen im Experiment zu überprüfen. Welches wären die Folgen von Fehlerlosigkeit? Stellen Sie sich ein Lebewesen vor, das fehlerlos und unbegrenzt tüchtig ist... Ein solcher Organismus wäre ohne Frage sehr erfolgreich. Freilich nur für kurze Zeit, bis er, am eigenen Erfolgsmodell festhaltend, fast die ganze Biologie des Erdballs ausgelöscht hätte und dann selber ausstürbe. Unbegrenzte Tüchtigkeit bewirkt ein Desaster. Folglich gibt es in der Natur Mechanismen, die das verhindern? Daß in unserer Welt zur Tüchtigkeit auch Robustheit, Fehlertoleranz und Schadensbegrenzung gehört, ist leicht zu verstehen. Daß man daneben aber auch eine Tüchtigkeitsbegrenzung braucht, ist eher überraschend. Doch erst sie erlaubt eine nachhaltige Entwicklung. Fehler machen die Evolution flexibel. Ist das ein Plädoyer fürs Fehlermachen? Ja. Doch das will gekonnt sein. Wir müssen Rahmenbedingungen schaffen, innerhalb derer man ziemlich unbeschadet und schnell aus Fehlern lernen kann. Andere Fehler sollten wir vermeiden. Welche denn? Fehler, deren Auswirkungen räumlich und zeitlich nicht begrenzt sind. Fehler, bei denen der Zusammenhang zwischen Ursache und Wirkung undurchsichtig ist. Fehler, die keine Umkehr erlauben. Fehler, bei denen die Verantwortlichen nicht identifiziert werden können und auch nicht die Hauptbetroffenen sind. Fehler, die in Alles-oder-nichts-Spiele von der Größenordnung der Menschheitsgeschichte münden.

Kapitel XII: Schätz- und Test-Statistik

296

Testfall 3: Wie man sich bei einem chemischen Angriff zu verhalten hat Natürlich werden große Katastrophen nicht passieren, sagt man. Allenfalls theoretisch kann man sich das Risiko eines GAUs o.ä. einmal ausdenken. Allenfalls beruhigend-prophylaktisch können Strategien für den Ernstfall gemeint sein. Ist ja alles nur halb so schlimm, wenn man nur weiß, wie man sich richtig zu verhalten hat, wenn doch einmal ein "kleines Malheur" passieren sollte. Folgende Ratschläge sind mir untergekommen im Nahen Osten: Am 2. August 1990 marschierte Iraq in Kuwait ein. Zu dieser Zeit hielt ich mich beruflich in Jordanien auf. Als die Spannungen zwischen Bagdad und der UN eskalierten, hielt man in dieser Region alles für möglich, so auch einen Giftgasangriff, bei dem auch Amman in Mitleidenschaft gezogen werden könnte, man wußte nur dreierlei nicht: Wann, von wem (aus westlicher oder östlicher Richtung?, und was wäre zu tun, wenn... Zum Glück wurde Ausländern bald empfohlen, das Land vorübergehend zu verlassen, denn es war kein Spaß, jederzeit mit dem Schlimmsten rechnen zu müssen. Diejenigen, die nicht einfach mal so eben Jordanien verlassen konnten, wurden mit einem Flugblatt darauf vorbereitet, was im Ernstfall zu tun wäre. Hier ein Auszug (mit noch fast allen Englisch-Fehlem), bei dem zu beachten ist, daß dies anscheinend wirklich ernst gemeint war; allerdings konnte ich nicht ausfindig machen, wer dieses Flugblatt zu verantworten hat: WHAT TO DO IN CASE OF AN ATTACK WITH CHEMICAL WEAPONS If you notice these systems:

(a) Suffocation or falling down ofpeople or animal. (b) Falling of dead birds from trees. (c) Car accidents. (d) Obvious fog.

All these systems confirm gas present. When you notice them, follow these directions (Ifyou are outdoor, you can't do anything; if you are indoor follow the directions below): 1. Close all openings and doors, exhaust fan. 2. Shut off airconditioning. 3. Lock doors and windows and stop anyone from entering or leaving. 4. Don't try to flee with your car, you won't make it. 5. Cover all your body, wear clothes with long sleeves, wear socks, gloves, head cover and cover your face with wet towels or wet blankets. 6. Gas will disappear in one or two hours. 7. If you notice some systems, follow these directions: Wounds and blisters in the skin:

Do not scratch or open the blisters.

Headache or dizziness:

Take shower immediately and continue for sometime. Don't panic or exert energy to reduce inhailing air. It is best to stay inside and be calm.

Amen! Da kann man nur noch ergänzen: Achtung! Wenn Sie Vögel von den Bäumen fallen sehen, dann sind Sie zwar schon tot, aber machen Sie ja die Tür gut zu!

"Welche Stellung im Beruf haben Sie?"

Kapitel XIII Chi-Quadrat

Inhaltsverzeichnis

XIII. 1 Grundsätzliches Xm.2 Anpassungstest ΧΠΙ.3 Unabhängigkeitstest xm.4 Homogenitätstest Xm.5 Assoziationsmaße

300 300 302 303 304

Kapitel XIII: Chi-Quadrat

300

X m . l Grundsätzliches Bisher wurden beim statistischen Test Hypothesen Aber bestimmte Parameter wie μ oder σ der Grundgesamtheit getestet. Jetzt wird ein Test beschrieben, der nicht Parameter, sondern bestimmte Eigenschaften bzw. den Typ der Zufallsverteilung untersucht. Tests dieser Art sind die sogenannten nicht-parametrischen Tests. Der Bekannteste ist der sogenannte Chi-Quadrat- bzw. χ^-Test. Beim x 2 -Test wird eine aus einer Zufalls-Stichprobe gewonnene Häufigkeitsverteilung mit der Verteilung einer Gnindgesamtheit verglichen. Der Test quantifiziert die Differenz zwischen den in der Stichprobe beobachteten Werten mit denen der auf Grund der bekannten Werte einer Grundgesamtheit erwarteten Werten. Die "beobachteten" Werte sind die empirischen x¡. Die "erwarteten" Werte bezeichnen die, die eigentlich eintreten müßten, wenn die Merkmalsausprägungen sich entsprechend der Null-Hypothese bzw. nach dem Laplace'schen Wahrscheinlichkeitsbegriff vom unzureichenden Grund einstellen würden. Es gibt vor allem drei verschiedene χ^-Tests, den • • •

den χ^-Anpassungstest, den χ^-Unabhängigkeitstest und den χ^-Homogenitätstest.

Alle drei werden im folgenden dargestellt. Fttr das Verständnis dieses Kapitels ist es von Vorteil, die drei vorhergehenden Kapitel über Wahrscheinlichkeiten, die Normalverteilung und über das Schätzen und Testen gelesen zu haben, denn im folgenden Kapitel wird dieses Wissen teilweise vorausgesetzt.

ΧΙΠ.2 Anpassungstest Ein altes Beispiel für diesen Test ist das Prüfen, ob ein bestimmter Würfel gefälscht ist oder nicht. Nach dem Laplace'schen Wahrscheinlichkeitsbegriff wäre man geneigt, den Würfel dann als "echt" zu bezeichnen, wenn jede der 6 Seiten des Würfels bei η Würfen l/6n erscheinen würde, d.h. man "erwartet" z.B. die "6" bei 60 Würfen genau 1/6-60=10 mal. Allerdings wissen wir schon aus dem Kapitel über die Wahrscheinlichkeiten - und hier speziell vom Münz- und Lottobeispiel -, daß in der Realität die Münzen, Würfel oder die Lottokugeln nicht genau das theoretisch erwartete Ergebnis liefern, schon gar nicht, wenn man "nur" 60, 600 oder gar 6000 mal die Münze oder den Würfel wirft bzw. die Lottozahlen zieht. In Wirklichkeit sind die Ergebnisse "ungleichmäßig" bzw. zufällig verteilt. Nur in einer Grenzbetrachtung mit n — w i r d der theoretische Wert erreicht, wenn die Münze oder Würfel echt sind. Wie kann man nun - ohne unendlich viele Tests durchzuführen - trotzdem prüfen, ob z.B. ein Würfel echt ist? Formelmäßig wird beim χ^-Test die Differenz zwischen beobachteten und erwarteten Werten quantifiziert bzw. in eine Größe transformiert, die man Chi-Quadrat-Variable nennt und welche wir schon im Kapitel über die Normalverteilung kurz dargestellt haben: k Σ (bj - e¡) 2 ,2 = i=l

XIII.2 Chi-Qiudral-Anpassungstest

301

wobei "b¡" die beobachteten und "e¡" die erwarteten Werte repräsentieren. Es sei folgendes Beispiel durchgerechnet, bei dem ein Würfel 60 mal geworfen wurde: Erwartete

Stichprobenwerte

Schritte zur Berechnung von χ 2

Werte für x¡ Xj

e

bi

o o o o o o

1 2 3 4 5 6 Insgesamt

15 7 4 14 5 17 60

(bi-ei)2

b¡-e¡

i

5 -3 •6 4 -5 7 0

60

£ (b¡ - e¡) z X -

25 9 36 16 25 49

e· 2.5 0,9 3.6 1,6 2,5 4,9 16,0

-

Demnach beträgt das berechnet Chi-Quadrat χ 2 = 16,0. Wie ist dieser Wert zu beurteilen? Wenn die erwarteten und beobachteten Werte exakt übereinstimmen würden (b¡=e¡), dann wäre χ 2 = 0. Andererseits wäre χ 2 um so größer, je mehr b¡ und ej voneinander abweichen würden. In folgender Tabelle sind verschiedene Beispiele und deren Ergebnisse für Chi-Quadrat aufgelistet: Versuch 1 2 3 4

Beobachtete Einzelwerte bl 10 12 5 15

b2 10 15 13 7

b3 10 6 15 4

b4 10 12 17 14

X2 b5 10 7 6 5

b6 10 16 13 17

0,0 9,4 11,3 16,0

Es gilt nun - analog wie zu den anderen bisher kennengelernten Tests - eine Null-Hypothese aufzustellen und eine kritische Grenze zu definieren, ab der die Null-Hypothese verworfen werden kann. Es gilt nun α und die Anzahl der Freiheitsgrade ν festzulegen. Die Freiheitsgrade bestimmen sich nicht nach dem Stichprobenumfang n, sondern nach der Anzahl k der verschiedenen Klassen der Häufigkeitsverteilung. Die Freiheitsgrade ergeben sich nach der Formel k-l=v. k beträgt in unserem Fall 6, also ist v=5. Angenommen, unser Signiflkanzniveau sei wieder a=5 % und die Anzahl der Freiheitsgrade ist 5, so kann man den Chi-Quadrat-Test wieder nach den üblichen 5-Schritte-Verfahren durchführen: 1. H„: Der Würfel ist echt. 2. α = 5 %, v=5 3. Kritischer Wert χ 2 * = 11,1 (siehe die statistische Tabelle 3 im Anhang). 4. Auf Grund der Stichprobe - nach obiger Tabelle der Versuch Nr. 4 - ergab sich ein χ 2 = 16,0. 5. Entscheidung: χ 2 = 16,0 > χ 2 * =11,1, d.h. die Null-Hypothese muß verworfen werden.

Kapitel XIII: Chi-Quadrat

302

Der kritische Wert von χ 2 * ist also kleiner als der durch Versuch 4 sich ergebende, d.h. unser Würfel ergab Beobachtungswerte bj, die zu so großen Abweichungen von den zu erwarteten Werten e¡ führen, daß χ 2 größer als der kritische Wert χ 2 * bei α = 5 % wird, d.h. unser Ergebnis ist signifikant, d.h. die NullHypothese muß verworfen werden, d.h. der Würfel ist gefälscht. Im Vergleich zu den anderen drei Versuchen würde bei einer Irrtumswahrscheinlichkeit von α = 5 % auch Versuch Nr. 3 dazu führen, daß die Nullhypothese verworfen würde. Versuch 1 und 2 dagegen ergeben jeweils Werte für Chi-Quadrat, die die Null-Hypothese nicht verwerfen. Würde man den Test nicht mit einem Signifikanzniveau von 5 %, sondern mit 10 % bzw. 1 % durchführen, dann ergäben sich aus der statistischen Tabelle 3 im Anhang die folgenden Ergebnisse für die kritischen Werte von χ 2 *: Kritische Werte χ 2 * bei unterschiedlichem Signifikanzniveau a=0,10 a=0,05 a=0,01 V 5 9,24 15,1 11,1 Aus den Werten dieser Tabelle kann man ablesen, welche der vier verschiedenen Versuche bei welcher Irrtumswahrscheinlichkeit zu dem Ergebnis führen würden, daß der Würfel gefälscht ist: Testergebnisse für die Versuche 1-4 bei unterschiedlichen Signifikanzniveaus Versuch a=0,10 a=0,05 a=0,01 1 nicht gefälscht nicht gefälscht nicht gefälscht 2 nicht gefälscht gefälscht nicht gefälscht 3 gefälscht gefälscht nicht gefälscht 4 gefälscht gefälscht gefälscht Wichtig zu merken ist, daß dieser Test nur durchgeführt werde darf, wenn jedes e¡ gilt: e¡£5 Ist dies nicht erfüllt, dann müssen solange Häufigkeitsklassen aggregiert werden, bis diese Bedingung erfüllt ist.

X m . 3 Unabhängigkeitstest Dieser Test untersucht die Beziehungen zwischen mindestens 2 Variablen. Für diesen Test benutzen wir sogenannte Kontingenz-Tabellen. Beispiel: Region Norden Süden Insgesamt

0-5 20 30 50

Arbeitslosenrate in % 5-10 30 25 55

Gemäß der 5-Schritte-Regel läuft der Test wie folgt ab:

Insgesamt 10 und mehr 40 20 60

90 75 165

Xm.4 Homogenitltstcst

303

1. Hypothese: Die Aibeitslosenrate ist unabhängig von regionalen Einflüssen. 2. Das Signifikanzniveau sei α = 5%. Die Anzahl der Freiheitsgrade berechnet sich jetzt wie folgt: ν = (Spaltenzahl -1) · ( Zeilenzahl -1) In unserem Fall also: ν = (3-1)·(2-1) = 2 3. Unter diesen Bedingungen ergibt sich der kritische Wert χ 2 * als 5,99. 4. Aufgrund der Stichprobe muß man nun folgende Rechnung durchführen, bei der die beiden Ergebnisse filr die nördliche und südliche Region durch einen simplen Dreisatz mit den Ergebnissen für "Insgesamt" verglichen werden:

Region

b

e

b-e

(b-e)2

Y2

* Norden

Süden

Insgesamt

20

90 ^ • 5 0 = 27,27

-7,27

30

90 1 ^ 5 5 = 30,00

0

40

90 1 ^ 6 0 = 32,73

7,27

52,85

1,615

7,27

52,85

2,325

30

• ^ • 5 0 = 22,73

25

75 jgj-55 = 25,00

0

20

75 lgj-60 = 27,27

-7,27

165

52,85

-*)2 e 1,938

0

0

0

52,85

1,938

-

7,816

0

-

0

5. Entscheidung: χ 2 = 7,816 > χ 2 * = 5,99. Das Ergebnis ist signifikant, d.h. die Hypothese wird verworfen, d.h. es gibt einen Zusammenhang zwischen Arbeitslosenrate und Region.

Xm.4 Homogenitätstest Beim Homogenitdtstest wird untersucht, ob zwei oder mehr Stichproben aus der gleichen Grundgesamtheit stammen. Es sei von zwei Stichproben bzgl. der Erwerbsbeteiligung ausgegangen. Folgende Resultate haben sich ergeben: Enveibsbeteiligung Abhängige Ab Selbständige S Arbeitslose A Nicht aktive NA Insgesamt

Insgesamt

Stichprobe 1 40 5 5 50 nj=100

2 30 5 5 60 n2=100

70 10 10 HO 200

Kapitel XHT: Cbi-Quadrat

304

Zu entscheiden ist, ob es einen Unterschied in der Erwerbsneigung (EN) zwischen den zwei Stichproben gibt, was nahelegen würde, dafi die zwei Stichproben aus zwei verschiedenen Grundgesamtheiten stammen. Die Schritte des Test sind die folgenden: 1. Hypothese: Die zwei Stichproben stammen aus der selben Grundgesamtheit. 2. α = 5% und v = 3. 3. χ** = 7,81 4. Nach der Stichprobe berechnet sich der Wert für γ } wie folgt: EN

Stichprobe

b

e

Y2

Λ Ab

40

S

5

A

5

NA

50

Ab

30

S

5

A

5

1

2

60

NA

200

Insgesamt

100-70 200 ~ 3 5 100· 10 200 ~ 5 10010 200 ~ 5 100110 τ_ 55 200 100-70 200 ~ 3 5 100-10 200 " 5 100-10 200 " 5 100-110 . . 200 ~ 5 5 -

_ (M* e 0,714 0 0 0,455 0,714 0 0 0,455 2,337

X 2 = 2,337 5. Entscheidung: y} = 2,337 < 7,81, d.h. die Null-Hypothese wird nicht verworfen. Das bedeutet, die 2 Stichproben stammen höchstwahrscheinlich aus der selben Grundgesamtheit.

ΧΙΠ.5 AssoziationsmaPe Diese Maße basieren zwar alle auf χ^, doch sie geben in gewisser Beziehung Hinweise auf die Stärke des Zusammenhangs.

Phi-Koeffizient:

Φ=

XIII.5 Assoziationsmaße

305

Bei 2x2-Tabellen liegt Φ zwischen 0 und 1.

Kontingenz-Koeffizient: c = Liegt zwischen 0 und 1, aber er erreicht nie ganz 1

Cramér's V:

V=

Wenn k die kleinere Zahl der Spalten- oder Zeilenzahl ist, dann kann V maximal 1 sein. Wenn η oder k = 2 ist, dann gilt Υ=Φ.

"Haben Sie regelmäßige Einkünfte?"

Anhang

Inhaltsverzeichnis Kleines Deutsch-Englisches Wörterbuch

310

Statistische Tabelle 1: Standard-Normalverteilung

312

Statistische Tabelle 2: t-Verteilung

313

Statistische Tabelle 3: Chiquadrat-Verteilung

314

Anhang

310

Kleines Deutsch-Englisches Wörterbuch

Deutsch

Englisch

Häufigkeitsverteilung) stetiges Merkmal diskrtes Merkmal gruppierte Daten Klassenintervall Klassengrenze Klassenmitte aggregierte Daten kumulierte Häufigkeiten Prozentverteilung

firequency(-distribution) continuous variable discrete variable grouped data class interval class limit midpoint of class aggregated data cumulative frequency percent distribution

Verhältniszahlen Zähler Nenner Beispiele: Geburtenrate Steiberate Arbeitslosenquote Bevölkerungsdichte Lorenz-Kurve

numerator / nominator denumerator / denominator / base examples: birth rate death rate unemployment rate population density Lorenz curve

Verschiedenes Zensus, 100 %-Zählung Stichprobe Fragebogen Preisindex fUr die Lebenshaltung Preisniveau Warenkorb Volkswirtschaftliche Gesamtrechnungen BIP (Bruttoinlandsprodukt) BSP (Bruttosozialprodukt) pro Kopf jährliche prozentuale Veränderung Summiemngszeichen

census (sample) survey questionnaire consumer price index price level basket of commodities national accounts GNP (gross national product) GDP (gross domestic product) per capita annual percent change summation sign

Kleine· Deubch-EogUidiei Wdrtabuch

Lagern aße Durchschnitte arithmetisches Mittel gewogenes Mittel Median / Zentralwert Modus / häufigster Wert geometrisches Mittel Schwerpunkt

measures of location averages arithmetic mean weighted mean median mode geometrical mean center of gravity

Verteilungsmaße Spannweite Varianz Standardabweichung Variationskoefiizient Schiefe

measures of dispersion range mean deviation / variance standard deviation coefficient of variation / relative dispersion skewness

Regressionsanalyse Korrelationsanalyse Steigung b absolutes Glied a Gerade abhangige / unabhängige Variable Freihand-Methode Methode der kleinsten Quadrate Bestimmtheitsmaß Rang-Korrelationskoeffizient horizontale Transformation

regression analysis correlation analysis slope b contant term / intercept a straight line dependent / independent variable freehand method method of least squares coefficient of determination rank correlation coefficient shifting the origin

Schltzen und Testen Wahrscheinlichkeit Normalverteilung glockenförmig Dichtfunktion Verteilungsfunktion Grundgesamtheit Zufall(-sfehler) "faire" Münze Grenzwertsatz Freiheitsgrad Vertrauens- / Konfidenzintervall Hypothesentest (ein-) zweiseitiger Test Entscheidungsregel Hypothese, verworfen / akzeptiert kritischer Wert Signifikanzniveau / Irrtuniswahrscheinlichkeit

probability normal distribution bell shaped density function distribution function population (random) error fair coin central limit theoren degree of freedom confidence interval hypothesis - testing (one-) two-tail test decision rule hypothesis, rejected / accepted critical value level of significance

311

Anhang

312

Statistische Tabelle 1; Standard-Normalverteilung Standard-Normalverteilung Ζ = Ν (0; 1) Wahrscheinlichkeiten der Zufallsvariablen ζ über dem Intervall [0; z*\ = Fläche zwischen der Glockenkurve und der Abzisse innerhalb des Intervalls z=0 und z=z*.

y\ 0

«·

z* 0,0 0,1 0,2 0,3 0,4

0,00 0,0000 0398 0793 1179 1554

0,01 0,0040 0438 0832 1217 1591

0,02 0,0080 0478 0871 1255 1628

0,03 0,0120 0517 0910 1293 1664

0,04 0,0160 0557 0948 1331 1700

0,05 0,0199 0596 0987 1368 1736

0,06 0,0239 0636 1026 1406 1772

0,07 0,0279 0675 1064 1443 1808

0,08 0,0319 0714 1103 1480 1844

0,09 0,0359 0753 1141 1517 1879

0,5 0,6 0,7 0,8 0,9

1915 2257 2580 2881 3159

1950 2291 2611 2910 3186

1985 2324 2642 2939 3212

2019 2357 2673 2967 3238

2054 2389 2703 2995 3264

2088 2422 2734 3023 3289

2123 2454 2764 3051 3315

2157 2486 2794 3078 3340

2190 2517 2823 3106 3365

2224 2549 2852 3133 3389

1,0 1,1 1.2 1,3 1,4

3413 3643 3849 4032 4192

3438 3665 3869 4049 4207

3461 3686 3888 4066 4222

3485 3708 3907 4082 4236

3508 3729 3925 4099 4251

3531 3749 3944 4115 4265

3554 3770 3962 4131 4279

3577 3790 3980 4147 4292

3599 3810 3997 4162 4306

3621 3830 4015 4177 4319

1,5 1,6 1,7 1,8 1,9

4332 4452 4554 4641 4713

4345 4463 4564 4649 4719

4357 4474 4573 4656 4726

4370 4484 4582 4664 4732

4382 4495 4591 4671 4738

4394 4505 4599 4678 4744

4406 4515 4608 4686 4750

4418 4525 4616 4693 4756

4429 4535 4625 4699 4761

4441 4545 4633 4706 4767

2,0 2,1 2,2 2,3 2,4

4772 4821 4861 4893 4918

4778 4826 4864 4896 4920

4783 4830 4868 4898 4922

4788 4834 4871 4901 4925

4793 4838 4875 4904 4927

4798 4842 4878 4906 4929

4803 4846 4881 4909 4931

4808 4850 4884 4911 4932

4812 4854 4887 4913 4934

4817 4857 4890 4916 4936

2,5 2,6 2,7 2,8 2,9

4938 4953 4965 4974 4981

4940 4955 4966 4975 4982

4941 4956 4967 4976 4982

4943 4957 4968 4977 4983

4945 4959 4969 4977 4984

4946 4960 4970 4978 4984

4948 4961 4971 4979 4985

4949 4962 4972 4979 4985

4951 4963 4973 4980 4986

4952 4964 4974 4981 4986

3,0 4987 4987 4987 4988 4988 4989 4989 Beispiele: Die Fläche zwischen 0 und ζ* = 1 beträgt 0,3413. Die Fläche zwischen 0 und z* = 1,55 beträgt 0,4394.

4989

4990

4990

Statistische Tabelle 2: t-Verteilung

313

Statistische Tabelle 2: t-Verteilung t-Verteilung t: Quantité a

α

V 1 2 3 4 5

0,90 3,078 1,886 1,638 1,533 1,476

0,95 6,314 2,920 2,353 2,132 2,015

0,975 12,706 4,303 3,182 2,776 2,571

0,99 31,821 6,965 4,541 3,747 3,365

0,995 63,657 9,925 5,841 4,604 4,032

0,9995 636,619 31,598 12,941 8,610 6,859

6 7 8 9 10

1,440 1,415 1,397 1,383 1,372

1,943 1,895 1,860 1,833 1,812

2,447 2,365 2,306 2,262 2,228

3,143 2,998 2,896 2,821 2,764

3,707 3,499 3,355 3,250 3,169

5,959 5,405 5,041 4,781 4,587

11 12 13 14 15

1,363 1,356 1,350 1,345 1,341

1,796 1,782 1,771 1,761 1,753

2,201 2,179 2,160 2,145 2,131

2,718 2,681 2,650 2,624 2,602

3,106 3,055 3,012 2,977 2,947

4,437 4,318 4,221 4,140 4,073

16 17 18 19 20

1,337 1,333 1,330 1,328 1,325

1,746 1,740 1,734 1,729 1,725

2,120 2,110 2,101 2,093 2,086

2,583 2,567 2,552 2,539 2,528

2,921 2,898 2,878 2,861 2,845

4,015 3,965 3,922 3,883 3,850

21 22 23 24 25

1,323 1,321 1,319 1,318 1,316

1,721 1,717 1,714 1,711 1,708

2,080 2,074 2,069 2,064 2,060

2,518 2,508 2,500 2,492 2,485

2,831 2,819 2,807 2,797 2,787

3,819 3,792 3,767 3,745 3,725

26 27 28 29 30

1,315 1,314 1,313 1,311 1,310

1,706 1,703 1,701 1,699 1,697

2,056 2,052 2,048 2,045 2,042

2,479 2,473 2,467 2,462 2,457

2,779 2,771 2,763 2,756 2,750

3,707 3,690 3,674 3,659 3,646

40 60 120

1,303 1,296 1,289 1,282

1,684 1,671 1,658 1,645

2,021 2,000 1,980 1,960

2,423 2,390 2,358 2,326

2,704 2,660 2,617 2,576

3,551 3,460 3,373 3,291

oo

Anhang

314

Statistische Tabelle 3: Chiauadrat Verteilung X2-Verteilung: Quantité α

ν 1 2 3 4 5

0,900 2,71 4,61 6,25 7,78 9,24

0,950 3,84 5,99 7,81 9,49 11,1

α 0,975 5,02 7,38 9,35 11,1 12,8

0,990 6,6 9,2 11,3 13,3 15,1

0,995 7,9 10,6 12,8 14,9 16,7

6 7 8 9 10

10,6 12,0 13,4 14.7 16,0

12,6 14,1 15,5 16,9 18,3

14,4 16,0 17,5 19,0 20,5

16,8 18,5 20,1 21,7 23,2

18,5 20,3 22,0 23,6 25,2

11 12 13 14 15

17,3 18,5 19,8 21,1 22,3

19,7 21,0 22,4 23,7 25,0

21,9 23,3 24,7 26,1 27,5

24,7 26,2 27,7 29,1 30,6

26,8 28,3 29,8 31,3 32,8

16 17 18 19 20

23,5 24,8 26,0 27,2 28,4

26,3 27,6 28,9 30,1 31,4

28,8 30,2 31,5 32,9 34,2

32,0 33,4 34,8 36,2 37,6

34,3 35,7 37,2 38,6 40,0

21 22 23 24 25

29,6 30,8 32,0 33,2 34,4

32,7 33,9 35,2 36,4 37,7

35,5 36,8 38,1 39,4 40,6

38,9 40,3 41,6 43,0 44,3

41,4 42,8 44,2 45,6 46,9

26 27 28 29 30

35,6 36,7 37,9 39,1 40,3

38,9 40,1 41,3 42,6 43,8

41,9 43,2 44,5 45,7 47,0

45,6 47,0 48,3 49,6 50,9

48,3 49,6 51,0 52,3 53,7

40 50

51,8 63,2

55,8 67,5

59,3 71,4

63,7 76,2

66,8 79,5

315

Register

Register

diskretes Merkmal 124

Abakiis 27 Ablauf von Bundesstatistiken 43ff Ablehnungsbereich 284 absolute Häufigkeit 125 Abweichung -, mittlere absolute 180 -, mittlere quadratische 18 Iff Adäquationsproblem 79 additives Ziffernsystcm 28 Akzeptanz der Statistik 62 Alternativhypothese 284 Altersangaben 92ff amtliche Statistik 43ff Anonymisierung 59£f Anpassungstest 300 Aibeitslosenquote 83 arithmetisches Mittel 158 Assoziationsmafle 304

Einkommensangaben 99fif Einkommensverteilung 151ff, 199ff empirische Sozialforschung 102ff Erwartungsweit 258 Erweibsbeteiligung 95 Erwerbslose 83 Erweibsquote 134 Exzeß 186

Berufscodierung 971T Berufskodex der Statistiker 63ff Bestandsmasse 127 Bestimmtheitsmaß 220 Bewegungsmasse 127 Beziehungszahl 126 Bijektion 26 Boxplot-Diagramm 180 Bruttoinlandsprodukt 152,204,217 Bundesstatistikgesetz 43,65 Bundesverfassungsgericht 55ff, 65 Chi-Quadrat 272,299ff -Anpassungstest 300 -Homogenitätstest 303 • Unabhängigkeitstest 302 concentration ratio 143 Daten -, gruppierte 160,184,193 -, metrische 124 -, nominale 124 -.ordinale 124 Datenmißbrauch 58,64 Datenquellen 47 Datenschutz 55£f Deduktion 104 Dezile 165 Dezimalsystem 27 Dichtefunktion 248 dichtester Weit 165

faktische Anonymität 59 Falsifikation 283 Fehler 87ff, 290 Freiheitsgrad 180,272,301 geometrisches Mittel 167 Geschlechtsproportion 137 Gesetz der großen Zahl 246 Gini-Koeffizient 1461Γ Gliederungszahl 126 Gnindgesamtheit 242 gruppierte Daten 160,184ff, 193ff harmonisches Mittel 169 Häufigkeitsverteilung 125 häufigster Wert 165 Herfindahl-Koeffizient 144 Hypothesentest 102,283ff Identifizieiungsmerkmal 57 Indexzahl 126 indisches Ziffernsystem 29 Induktion 103 induktive Statistik 241 informationelle Selbstbestimmung 55ff Infrastruktur der Statistik 4 Iff Integrität der Statistik 42 Interquartilsabstand 180 Intervallskala 124 Irrtumswahrscheinlichkeit 279 Kausalität 227ff, 235ff Klassenbildung 160 Klassengrenze 160 Klassenhäufigkeit 160 Klassenmitte 160 klassierte Daten 160 klassischer Wahrscheinlichkeitsbegriff 244 Konzentration 141ff,206 Konzentrationsrate 143 Korrelation 220ff

316

Korrelationskoeffizient 221 Kriminalität 133 kritischer Rationalismus 103ff kritischer Wert 283 Kurtosis 186 Labour Force Survey 83, 95 Laplacesche Wahrscheinlichkeit 244 Laspeyres-Index 128 Linearisierung durch Logarithmierung 216 linkssteil 171 Lorenzkurve 145 Lottozahlen 246 magisches Viereck 79ff Median 163 Melderegisterabgleich 57 Merkmal -, diskretes 124 -, qualitatives 124 -, quantitatives 124 -, stetiges 124 Merkmalsausprägungen 124 Methode der kleinsten Quadrate 213ff metrische Skala 124 Mikrozensus 83 Mittel -, arithmetisches 158 -, geometrisches 167 -, harmonisches 169 Modalwert 165 Modus 165 Momente 191 nichtparametrischer Test 299ff Nominalskala 124 Normalgleichungen 214ff, 230ff Normalverteilung 257ff Null-Hypothese 284 offene Randklasse 161 Öffentlichkeitsarbeit 6 Iff Operationalisierungsproblem 79ff Ordinalskala 124 Paasche-Index 128 Positionssystem 28 Positivismus 102ff, 108ff Preisindex 128 Prognose 228ff Quantil 163

Register

Quartilsabstand 180 Quoten 126 Rangkorrelationskoeffizient 226 Rangskala 124 Ratioskala 124 rechtsschief 171 Regression 21 Iff Risiko 293ff Schätzen 277ff Schiefe 186,195 Signifikanz 283 Skalentransformation 185ff Skalentyp 124 Spannweite 179 Standardabweichung 18 Iff Standardfehler 89 standardisierte Zufallsvariable 262 Standard-Normalverteilung 261ff Statistisches Bundesamt 43ff -, Veröffentlichungen 45 Statistisches Jahrbuch 28,68 Stichprobe 242 Streuungsberechnung 152, 154,177ff systematische Fehler 87, 90 Teststatistik 283ff Transformation 216ff, 225ff, 261 t-Verteilung 272,281ff Variable 124 Varianz 181ff Variationskoeffizient 186 Verdienststruktur 201 Verhältniszahl 123ff Vermögensverteilung 151 Verteilungsfunktion 249 Vertrauensintervall 278 Volkszählung 24,48ff wahrer Wert 78 Wahrscheinlichkeit 244 Wölbung 186,195 Zahlen 2ff -, Historie 23ff zentraler Grenzwertsatz 266ff Zentralwert 163 Zufallsfehler 87, 89 Zufallsvariable 247