Statistische Auswertung von Mess- und Versuchsdaten mit Taschenrechner und Tischcomputer: Anleitungen und Beispiele aus dem Laborbereich 9783110848793, 9783110072631

222 19 76MB

German Pages 598 [600] Year 1980

Table of contents :
Hinweise für den Leser
A Rechnen mit Taschenrechnern und Tischcomputern
1. Rechnermodelle und ihre Anwendungsbereiche
2. Rechenschieber, Logarithmentafel und Elektronenrechner im Vergleich
3. Mathematische Grundlagen
3.1 Rechnen mit Summen
3.2 Rechnen mit Produkten
4. Zahlendarstellung auf dem Rechner
4.1 Festkomma
4.2 Fließkomma
4.3 Gleitkomma
4.4 Rechengenauigkeit
5. Logiksysteme
5.1 Allgemeines
5.2 Algebraische Logik
5.3 Umgekehrte Polnische Notation (UPN)
6. Rechnen mit Speichern
6.1 Feste und veränderbare Speicher
6.2 Konstantenspeicher
7. Programmierbare Rechner
7.1 Allgemeines
7.2 Sprungbefehle
7.3 Unterprogramme
7.4 Ändern von Programmen
8. Mathematische Funktionen
8.1 Allgemeines
8.2 Berechnung der Funktionen
B Statistische Auswertung von Versuchs- und Analysendaten
9. Der Durchschnittswert
10. Fehlerarten bei Meßwerten
10.1 Zufallsfehler
10.2 Systematische Fehler
10.3 Kombination zufälliger und systematischer Fehler
11. Säulendiagramm und Normalverteilung
12. Mittelwerte
12.1 Arithmetischer Mittelwert
12.2 Geometrischer Mittelwert
12.3 Harmonischer Mittelwert
12.4 Der Zentralwert (Median)
13. Streuungsmaße
13.1 Allgemeines
13.2 Die Spannweite
13.3 Die Standardabweichung
13.4 Vertrauensbereiche
13.5 Das Prognoseintervall
13.6 Das Toleranzintervall
14. Stichprobenumfang
14.1 Stichprobenumfang bei bekannter Streuung σ
14.2 Stichprobenumfang bei unbekannter Streuung σ
15. Zufallsauswahl von Stichproben
15.1 Allgemeines
15.2 Zufallszahlen und deren Anwendung
16. Die Poissonverteilung
17. Statistische Testverfahren
17.1 Allgemeines
17.2 Der Ausreißertest
17.3 Trendtest nach Neumann
17.4 Vergleich zweier Varianzen (F-Test)
17.5 Vergleich zweier Mittelwerte (t-Test)
17.6 Vergleich Mittelwert-Sollwert
17.7 Differenzen-t-Test
17.8 λ-Test (Attributive Prüfung)
18. Korrelations- und Regressionsrechnung
18.1 Allgemeines
18.2 Methode der kleinsten Fehlerquadrate
18.3 Der Korrelationskoeffizient
18.4 Die Standardabweichung der Ausgleichsfunktion
18.5 Lineare Korrelation und Regression
18.6 Prüfung von Meßwerten auf Normalverteilung
18.7 Nicht lineare Korrelation und Regression
19. Liste der Programme
20. Register der Beispiele
21. Rechnerschlüssel
22. Literaturverzeichnis
23. Sachregister

Recommend Papers

Begegnung mit dem Materiellen: Perspektiven aus Architekturgeschichte und Soziologie 9783839451601

Der Umgang mit Dingen und materiellen Strukturen gehört seit jeher zu den zentralen Erfahrungen ästhetischer Produktion.

142 84 27MB Read more

Mit Kochlöffel und Staubwedel: Erzählungen aus dem Dienstmädchenalltag 9783205791027, 9783205785811

116 54 6MB Read more

Statistische Auswertungen mit Regressionsprogrammen: Lineare Regression und Verwandtes - Multivariate Statistik - Planung und Auswertung von Versuchen [Reprint 2018 ed.] 9783486805543, 9783486255324

Geradezu jeder Computerbenutzer hat Zugang zu einem Programm, welches die wichtigsten Funktionen der Regressionsrechnung

144 106 27MB Read more

Aus dem Reich von Insulinde. Sumatra und der Malaiische rchipel

179 54 193MB Read more

Die Evolution der Kooperation: Aus dem Amerikanischen übersetzt und mit einem Nachwort von Werner Raub und Thomas Voss 9783486851748, 9783486591729

Wie ist Kooperation möglich in einer Welt von Egoisten, in der es keine zentrale Autorität gibt? Axelrod entwickelt aus

190 95 6MB Read more

Komplotte, Ketzer und Konspirationen: Zur Logik des Verschwörungsdenkens - Beispiele aus dem Nahen Osten [1. Aufl.] 9783839413418

Den Ländern des Nahen Ostens wird eine überdurchschnittlich hohe Affinität zum Verschwörungsdenken nachgesagt. Von den h

143 64 2MB Read more

Planung und Auswertung von Versuchen und Erhebungen [überarbeitete und erweiterte Auflage] 9783486710755, 9783486583007

In diesem leicht verständlich geschriebenen Buch wird Wert darauf gelegt, dass vor Beginn einer Forschungsarbeit eine ex

154 17 13MB Read more

Mathematik mit Simulationen lehren und lernen: Plus 2000 Beispiele aus der Physik 9783110250060, 9783110250046

Mathematics course with 60 Java-based interactive mathematic simulations by the author Comprehensive and systematically

167 46 25MB Read more

Konstruktionsfibel SolidWorks 2008 - Beispiele aus Maschinen- und Vorrichtungsbau 9783834805195, 383480519X

335 94 8MB Read more

Reisebilder und Skizzen aus dem europäischen Rußland und Polen

376 79 30MB Read more

Statistische Auswertung von Mess- und Versuchsdaten mit Taschenrechner und Tischcomputer: Anleitungen und Beispiele aus dem Laborbereich
9783110848793, 9783110072631

Author / Uploaded
Siegfried Noack

0 0 0
Like this paper and download? You can publish your own PDF file online for free in a few minutes! Sign Up

File loading please wait...

Citation preview

Statistische Auswertung von Meß- und Versuchsdaten mit Taschenrechner und Tischcomputer

Siegfried Noack

Statistische Auswertung von Meß- und Versuchsdaten mit Taschenrechner und Tischcomputer Anleitungen und Beispiele aus dem Laborbereich

W DE G Walter de Gruyter · Berlin · New York 1980

Autor Dr. rer. nat. Siegfried Noack Hermsdorfer Straße 99 D-1000 Berlin 26

CIP-Kurztitelaufnahme der Deutschen Bibliothek Noack, Siegfried: Statistische Auswertung von Meß- und Versuchsdaten mit Taschenrechner und Tischcomputer: Anl. u. Beisp. aus dem Laborbereich. Siegfried Noack. - Berlin, New York: de Gruyter, 1980. ISBN 3-11-007263-7

© Copyright 1980 by Walter de Gruyter & Co., vormals G.J. Göschen'sche Verlagshandlung, J. Guttentag, Verlagsbuchhandlung Georg Reimer, Karl J. Trübner, Veit & Comp., Berlin 30. Alle Rechte, insbesondere das Recht der Vervielfältigung und Verbreitung sowie der Übersetzung, vorbehalten. Kein Teil des Werkes darf in irgendeiner Form (durch Photokopie, Mikrofilm oder ein anderes Verfahren) ohne schriftliche Genehmigung des Verlages reproduziert oder unter Verwendung elektronischer Systeme verarbeitet, vervielfältigt oder verbreitet werden. Printed in Germany. Druck Karl Gerike, Berlin; Bindearbeiten: Buchgewerbe GmbH Lüderitz & Bauer, Berlin. Einbandentwurf: Thomas Bonnie, Hamburg

Vorwort

Bei der Planung und Auswertung naturwissenschaftlicher Versuche bedient man sich häufig mathematisch-statistischer Methoden. Die Lösung statistischer Problemstellungen ist

jedoch oft

mit einem erheblichen Rechenaufwand verbunden. Da aber eine "Statistik" nicht Selbstzweck sein soll, sondern als Entscheidungshilfe dazu dient, bei der Beurteilung von Versuchs- und Meßergebnissen das persönliche Empfinden des Einzelnen durch ein objektives Maß zu e r s e t z e n ,

erscheint die Forderung ver-

n ü n f t i g , den zeitlichen Aufwand bei der Auswertung der Daten so gering wie möglich zu halten. Hierbei können elektronische Taschen- bzw. Tischrechner eine wertvolle Unterstützung bieten. V o r t e i l h a f t sind insbesondere programmierbare M o d e l l e , bei denen die erstellten Programme auf Datenträgern - z.B. kleinen Magnetkarten oder Bandkassetten - gespeichert werden können. Die einmal aufgezeichneten Programme stehen dann jederzeit sind Fehler,

zur Verfügung. Dadurch

die bei einem manuellen Eintasten des Programms

entstehen können, weitgehend ausgeschlossen. Durch geschickte Programmierung kann

man sogar erreichen,

daß lediglich die

auszuwertenden Daten eingegeben werden müssen, der Rechner aber alle w e i t e r e n Operationen selbständig

durchführt.

Zu einer optimalen Programmgestaltung gehören jedoch eine gute Kenntnis des entsprechenden Rechners sowie der anzuwenden Algorithmen. Vielfach läßt sich durch eine mathematische Umformung eine kompliziert erscheinende Formel vereinfachen und "computergerecht" umgestalten!

VI

Vorwort Voraussetzung für eine korrekte statistische Datenauswer-

tung ist

aber auch die richtige Interpretation der erhaltenen

Ergebnisse, wobei eine Kenntnis des theoretischen Hintergrundes in gewissem Umfang wünschenswert erscheint. Das vorliegende Buch soll Naturwissenschaftlern und Ingenieuren daher eine Anleitung in zweierlei Hinsicht geben: 1.

wie man den Rechengang bei

der Auswertung mit H i l f e eines

2.

welche Formeln und statistische Methoden wann anzuwenden

Taschen- bzw. Tischrechners

durchführen kann,

sind und welche Aussagen man mit den Ergebnissen

treffen

kann. Schließlich werden auch die wichtigsten theoretischen Gesichtspunkte behandelt, soweit dies für das weitere Verständnis notwendig erschien. Das Buch gibt im Teil A zunächst H i n w e i s e , welche Gesichtspunkte bei der Auswahl eines Rechners für die statistische Datenauswertung maßgeblich sind sowie eine Einführung in die wichtigsten Logik-Systeme. Es folgt eine umfangreiche Darstellung der Rechner-Operationen schen Funktionen. speichern

und der benötigten mathemati-

Ausführlich wird das Rechnen mit Konstanten-

behandelt.

Im Teil B werden die

Berechnung von statistischen Kenn-

größen, die Durchführung von Hypothesentests sowie die Korrelations- und Regressionsrechnung b e s p r o c h e n , Formeln,

Pro-

gramme und allgemeine Rechenhinweise gegeben sowie die Ergebnisse diskutiert. Ein breiter Raum widmet sich der Berechnung von Verteilungsintegralen und Signifikanzschranken, die bei Hypothesentests und der Berechnung von Vertrauensbereichen Damit ist

eine Rolle spielen.

man praktisch unabhängig von Tabellenwerken.

Sowohl Naturwissenschaftler und Ingenieure, die sich in der Praxis mit der statistischen Behandlung von Versuchsergebnissen b e s c h ä f t i g e n müssen, als

auch Studenten der genannten

Fachrichtungen werden hier sicher wertvolle Hinweise und Anregungen finden.

Vorwort

VII

Die in den Rechen- und Programmbeispielen verwendeten Tastensymbole und Programmbefehle orientieren sich an den Modellen "Compucorp 326 Scientist" sowie "Compucorp 327 Scientist". Das Modell 326 ist

ein nicht druckender Tischrechner

mit L e u c h t z i f f e r n a n z e i g e ,

der über 160 Programmspeicherplätze

sowie 12 Konstantenspeicher

v e r f ü g t . Das Gerät

"327" b e s i t z t

4l6 Programmschritte, kk direkt und indirekt adressierbare Konstantenspeicher

und einen Drucker zur Dokumentation der Da-

ten und Ergebnisse. Bei beiden G e r ä t e n können mit Hilfe Bandstation sowohl Programme als

einer

auch Daten gespeichert wer-

den, die bei Bedarf wieder vom Band abrufbar

sind.

Eine Übertragung der Rechenoperationen b z w . Programme auf andere Rechnertypen, die ebenfalls über eine algebraische Logik v e r f ü g e n ,

ist

unter Beachtung der jeweiligen Besonderhei-

ten des Rechners ohne Schwierigkeiten möglich. Das Buch erhebt keinen Anspruch auf V o l l s t ä n d i g k e i t . D i e s ist

wegen der V i e l f a l t der auf dem Markt angebotenen Rechner

einerseits und der zahlreichen statistischen Problemstellunggen andererseits auch kaum m ö g l i c h . Das Literaturverzeichnis erlaubt dem interessierten Leser aber ein v e r t i e f t e s Studium der einzelnen Sachgebiete. Zum Schluß noch ein Hinweis an alle "Experimentatoren": Ein unbefriedigendes

Ergebnis eines Versuchs b z w . einer Mes-

sung aufgrund falscher oder ungenügender Planung kann auch durch eine noch so gute "Statistik" nicht besser werden!

Siegfried Noack

Berlin, November 1979

Inhaltsverzeichnis

Hinweise für den Leser A

XV

Rechnen mit Taschenrechnern und Tischcomputern ....

1. Rechnermodelle und ihre Anwendungsbereiche 2. Rechenschieber, Logarithmentafel

l 3

und Elektronen-

rechner im Vergleich 3. Mathematische Grundlagen

16 20

3.1 Rechnen mit Summen

20

3.2 Rechnen mit Produkten

23

4. Zahlendarstellung auf dem Rechner 4.1 Festkomma

25 25

4.2 Fließkomma

26

4.3 Gleitkomma

29

4.4 Rechengenauigkeit

32

5 . Logiksysteme

33

5.1 Allgemeines

33

5.2 Algebraische Logik

35

5 - 2 . 1 Rechenoperationen

35

5.2.2

Löschen von f a l s c h eingegebenen Zahlen ..

37

5.2.3

Rechnen mit einer Konstanten

38

5.2.4

Kettenrechnungen

40

5.2.5

Rechnen mit Klammern

46

5.2.6

Kurzwegrechentechnik

48

5.3 Umgekehrte Polnische Notation ( U P N )

54

5.3.1

Allgemeines

54

5.3.2

Kettenrechnungen bei der UPN-Logik

57

5.3.3

Kurzwegrechentechnik bei der UPN-Logik .. fc>0

X

Inhalt 5.3·4 Vergleich von UPN mit algebraischer Logik ..

6.

Rechnen mit Speichern

64

6.1 Feste und ver nderbare Speicher

64

6.2 Konstantenspeicher

7.

65

6.2.1 Allgemeines

65

6.2.2 Direkt adressierbare Speicher

66

6 . 2 . 3 Indirekte Adressierung von Speichern

70

6 . 2 . 4 Verkn pfung von Speicherinhalten

7k

6.2.5

77

Speicherarithmetik

Programmierbare Rechner

90

7.1 Allgemeines

90

7.2 Sprungbefehle

7.4

93

7.2.1 Unbedingte Spr nge

93

7 . 2 . 2 Bedingte Spr nge

94

7 - 3 Unterprogramme

8.

6l

ndern von Programmen

97 100

Mathematische Funktionen

102

8. l Allgemeines

102

8.2 Berechnung der Funktionen

103

8.2.1 Die Funktion y = -/χ"" 2 8.2.2 Die Funktion y = χ

103 104

8 . 2 . 3 Die Funktion y = 1/x

105

8.2.4 Die Funktion y = e*

106

8.2.5 Die Funktion y = In χ

107

8.2.6 Die Funktionen y = 10X und y = log χ

1θ8

8.2.7 Die allgemeine Potenzfunktion y = a bzw. z = xy

109

8.2.8 Die trigonometrischen Funktionen und ihre Inversen

114

8.2.9 Die Funktion y = Integer χ

115

8.2.10 Die Funktion y = χ - Absolut

120

8.2.11 Die Funktion y = n! (η-Fakult t)

121

Inhalt B

XI

Statistische Auswertung von Versuchs- und Analysendaten

139

9. Der Durchschnittswert

14l

10. Fehlerarten bei Meßwerten

143

10. l Zufallsfehler

143

10.2 Systematische Fehler

144

10.3 Kombination zufälliger und systematischer Fehler

146

11. Säulendiagramm und Normalverteilung 12. Mittelwerte

152 158

12.1 Arithmetischer Mittelwert

158

12.1.1 Arithmetisches Mittel aus nicht klassifizierten Werten

158

12.1.2 Arithmetisches Mittel aus klassifizierten Werten

162

12.1.3 Spezielle Methoden zur Berechnung von x.. 166 12.2 Geometrischer M i t t e l w e r t

168

12.3 Harmonischer M i t t e l w e r t

173

12.4 Der Zentralwert ( M e d i ä n )

175

12.4.1 Definition

175

12.4.2 Sortieren von Daten

177

12.4.3 E i g e n s c h a f t e n und Anwendung des Medians.. 186 13. Streuungsmaße

187

13. l Allgemeines

187

13.2 Die Spannweite

188

13.3 Die Standardabweichung 13.3.1 Definition

192

und Bedeutung der

Standardabweichung

192

13.3.2 Integration der Normalverteilung

202

13.3.3 Schranken der Normalverteilung

2l6

13.3.4 Berechnung der Standardabweichung

222

13.3.5 Der V a r i a t i o n s k o e f f i z i e n t

232

13.3.6 Streubereiche

233

13.3.7 Standardabweichung des M i t t e l w e r t e s

234

XII

Inhalt 13.4 Vertrauensbereiche

236

13.4.1 Allgemeines

236

13.4.2 Vertrauensbereich des Mittelwertes

238

13.4.3 Berechnung der t-Werte

246

13.4.4 Rechenprogramm zur Ermittlung des Vertrauensbereiches für beliebige statistische Sicherheiten

254

13.4.5 Integration der t-Verteilung

268

13.4.6 Vertrauensbereich der Standardabweichung. 286 13.4.7 Berechnung der Chi-Quadrat-Werte

288

13.4.8 Rechenprogramm zur Ermittlung des Vertrauensbereichs der Standardabweichung für beliebige

Sicherheiten

292

13.5 Das Prognoseintervall

300

13.6 Das Toleranzintervall

302

13.6.1 Toleranzintervall bei einseitiger Fragestellung

303

13.6.2 Toleranzintervall bei zweiseitiger Fragestellung

305

14. Stichprobenumfang

309

14.1 Stichprobenumfang bei bekannter Streuung O 14.2 Stichprobenumfang bei unbekannter Streuung Cf 15. Zufallsauswahl von Stichproben

309 ...

314 320

15. l Allgemeines

320

15.2 Zufallszahlen und deren Anwendung

322

15.2.1 Erzeugung von Zufallszahlen ( Z u f a l l s zahlengenerator)

322

15.2.2 Elektronischer Würfel

326

15.2.3 Münzwerfen

328

15.2.4 Zahlenlotto

329

15.2.5 Elektronisches Roulette

329

15.2.6 Randomisierung

331

15.2.7 Normalverteilte Zufallszahlen

336

Inhalt 6. 17.

XIII

Die Poissonverteilung

344

Statistische Testverfahren

356

17. l Allgemeines

356

17.2 Der Ausreißertest

364

17.2.1 Allgemeine Bemerkungen zum Ausreißerproblem

364

17.2.2 Ausreißertest nach Graf und Henning .... 364 17.2.3 Ausreißertest

nach Nalimov

373

17.3 Trendtest nach Neumann

383

17.4 Vergleich zweier Varianzen ( F - T e s t )

389

17.4.1 Durchführung und Voraussetzungen

389

17.4.2 Integration der F-Verteilung

394

17.4.3 Signifikanzschranken der F-Verteilung .. 421 17.4.4 Rechenbeispiel zum F-Test

425

17.5 Vergleich zweier Mittelwerte ( t - T e s t )

428

1 7 . 5 « 1 Testvoraussetzungen und Durchführung

... 428

17.5.2 Rechenprogramm zum t-Test

438

17.5.3 Stichprobenumfang beim Vergleich zweier M i t t e l w e r t e 17.6 Vergleich Mittelwert-Sollwert 17.7 Differenzen-t-Test 17.8 18.

A- Test (Attributive Prüfung)

Korrelations- und Regressionsrechnung

454 459 462 469 474

18. l Allgemeines

4?4

18.2 Methode der kleinsten Fehlerquadrate

476

18.3 Der K o r r e l a t i o n s k o e f f i z i e n t

494

18.4 Die Standardabweichung der Ausgleichsfunktion.. 505 18.5 Lineare Korrelation und Regression

509

18.5.1 Die Ausgleichsgerade und ihre Kenngrößen

509

18.5.2 Rechenprogramm und Beispiel zur linearen Korrelation

515

18.5.3 Prüfung der Konstanten der Ausgleichsgeraden

530

XIV

Inhalt 18.6

Prüfung von Meßwerten auf Normalverteilung ...

18.7

Nicht lineare Korrelation und Regression

535 5^6

18.7.1 Linearisierbare Funktionsmodelle

5^8

18.7.1 Nicht linearisierbare Funktionsmodelle. 556 19«

Liste der Programme

557

20.

Register der Beispiele

560

21.

Rechnerschlüssel

564

22.

Literaturverzeichnis

570

23.

Sachregister

580

Hinweise für den Leser

Die für- die einzelnen Problemstellungen a u f g e f ü h r t e n Rechenprogramme sind für 327 geschrieben.

die Modelle Compucorp Scientist 326 und

Dies sind G e r ä t e , die eine algebraische Re-

chenlogik und 12 bzw. 44 Konstantenspeicherplätze besitzen sowie über l60 bzw. 4l6 Programmschritte verfügen. Die Modelle wurden - stellvertretend für andere Geräte mit algebraischer Logik - deshalb ausgewählt, weil ihre "Programmiersprache" besonders einfach verständlich ist sprechenden Programm-Befehle für

und die

ent-

die Berechnung mathematischer

Funktionen, das Rechnen mit S p e i c h e r n , die

Speicherarithmetik,

bedingte und unbedingte Sprünge sowie die Durchführung von Unterprogrammen in weitestgehend ähnlicher Form auch auf anderen Rechnersystemen vorhanden sind.

Wegen der schnell f o r t s c h r e i t e n d e n Entwicklung von Taschenund Tischrechnern wurden zum Zeitpunkt der F e r t i g s t e l l u n g des Buches die Modelle Compucorp 326 und 327 nicht mehr h e r g e s t e l l t , sind j e d o c h noch teilweise im Handel e r h ä l t l i c h . Da die

für diese Geräte angegebenen Programme aber vor allen

Dingen den prinzipiellen Ablauf des j e w e i l i g e n Problems auf einem Rechner demonstrieren sollen, wird ihre Anschaulichkeit dadurch nicht gemindert. Vom logischen A u f b a u her sind die Programme daher auch auf andere R e c h e n s y s t e m e anwendbar.

XVI

Hinweise für

den Leser

Mit Hilfe des am Schluß angegebenen "Rechnerschlüssels" ist

es möglich, die entsprechenden Tastenbefehle auf die Mo-

delle TI 59 (Texas Instruments,

algebraische Logik) und HP-97

( H e w l e t t Packard, Umgekehrte Polnische N o t a t i o n ) zu übertragen. Modellbezogene Besonderheiten sind dabei den jeweiligen Handbüchern zu entnehmen. Um den Aufbau der

Programme besser verstehen zu können,

e m p f i e h l t es sich, zunächst den Teil A ("Rechnen mit Taschenrechnern und Tischcomputern") durchzuarbeiten, in dem vor

al-

lem die einzelnen Rechnerfunktionen sowie das Prinzip der

al-

gebraischen und der UPN-Logik erklärt sind. In dem zu jedem Programm angegebenen A b l a u f p l a n , weise in die Rechenbeispiele eingearbeitet ist,

der teil-

werden die Da-

teneingabe und die Ausgabe der Ergebnisse an einem Zahlenbeispiel erläutert. Besonders intensiv sollte man sich im Teil A mit dem Abschnitt 6 "Speicherarithmetik"

beschäftigen,

da hier die

für

statistische Auswertungen unerläßliche Bildung von Summen JTx, ^x j ^ V i j i y

^yx bei der linearen Korrelation)

(z.B.

behandelt

wird. Die im Teil B ( " S t a t i s t i s c h e Auswertung von Versuchs- und Analysendaten") angegebenen Formeln zur Lösung von Verteilungsintegralen bzw. der Berechnung von Signifikanzschranken ( i n t e gralgrenzen) sollen den Benutzer eines Rechners möglichst unabhängig von statistischen Tabellenwerken machen. Man sollte daher einen einmaligen höheren Programmieraufwand nicht scheuen. Sind nämlich die Programme erst einmal auf einem Datenträger ( K a s s e t t e oder Magnetkarte) gespeichert, dann bieten sie den Vorteil einer enormen Zeitersparnis. In den zu den Programmen gehörigen Ablaufplänen ist

ange-

d e u t e t , wie die Zahlen auf der Anzeige des Rechners erscheinen. Der dort angegebene Dezimalpunkt entspricht dem im deutschen Sprachraum üblichen Komma. Bei einem druckenden Rechner kann man zur Dokumentation der Ergebnisse die STOP-Befehle durch eine PRINT-Anweisung ergänzen ( D a t e n e i n g a b e ) bzw. ersetzen (Ausgabe der E r g e b n i s s e ) .

Teil A Rechnen mit Taschenrechnern und Tischcomputern

1. Rechnermodelle und ihre Anwendungsbereiche

Bei der statistischen Auswertung von Meßergebnissen unter Zuhilfenahme von elektronischen Taschen- b z w . Tischrechnern erhebt sich die Frage, welche Modelle hier am geeignetsten sind. Es ist

klar, daß an die zu verwendenden Rechner be-

stimmte Forderungen zu stellen sind. Das Angebot an verschiedenen Typen ist

aber so groß, daß

es zunächst unüberschaubar scheint. Eine gewisse Übersicht erhält man jedoch, wenn man eine Unterteilung nach dem Zweck vornimmt, den die Geräte e r f ü l l e n sollen. Eine Aufteilung in 4 Gruppen schafft

hier etwas Klarheit:

Gruppe l = Grundmodelle Hierunter sollen Geräte verstanden werden, mit denen

le-

diglich die 4 Grundrechenarten durchgeführt werden können. Außer den Tasten für Addition, Subtraktion, Multiplikation und Division verfügen Modelle dieser Art noch über eine Taste zum Löschen von falsch eingegebenen Werten bzw. f e h l e r h a f t durchgeführten Rechenoperationen. Einfache Rechenprobleme, wie z . B . die

"Bilanz" vom Ein-

kaufsbummel oder die Berechnung der Mehrwertsteuer sind durchführbar. Für die statistische

Auswertung d ü r f t e n Rechner die-

ser Kategorie jedoch weniger geeignet sein, da ihnen wichtige Funktionen fehlen. Gruppe 2 = Erweiterte Grundmodelle Zusätzlich zu der Möglichkeit, die Grundrechenarten durchführen

k

1. Rechnermodelle und ihre Anwendungsbereiche

zu können, haben diese Geräte oft

weitere "Funktionen" wie

Prozentautomatik, Tasten zur Berechnung von Quadraten und Wurzeln oder K e h r w e r t e n , sowie teilweise einen Konstantenspeicher, der es erlaubt, ein Ergebnis gewissermaßen im Rechner zu "notieren", um es bei Bedarf wieder abrufen

zu können. Fehlen-

de wichtige mathematische Funktionen (in x,

e

u s w . ) sowie

eine meist zu geringe Speicherkapazität bedingen aber, daß auch diese Gruppe für unsere Zwecke ausscheidet. Gruppe 3 = Kaufmännische Rechner Die Typen dieser Gruppe sind für die Lösung w i r t s c h a f t s bzw. finanzmathematischer Probleme gedacht und kommen daher ebenfalls nicht in Frage. Gruppe 4 = Technisch-Wissenschaftliche Rechner Das Angebot innerhalb dieser Geräteklasse ist

auch wie bei

den anderen Modellen sehr groß. Eine Vielzahl mathematischer Funktionen, mehrere Konstantenspeicher, die Möglichkeit, in den Speichern auch zu rechnen,

sowie eventuell die Programmier-

barkeit zeichnet diese Art von Rechnern aus. Mit ihnen lassen sich im allgemeinen eine Vielzahl von Aufgaben aus Technik und Naturwissenschaft lösen. Bei einigen Modellen ist

es möglich, die Programme auf

kleine Magnetkarten oder Bandkassetten

aufzuzeichnen,

so daß

diese immer abrufbereit sind. Weiterhin verfügen einige Rechner auch über einen Drucker.

Damit können sowohl die eingege-

benen Daten wie auch die Ergebnisse dokumentiert werden. Es sei darauf hingewiesen,

daß auch speziell für

sche Berechnungen Geräte angeboten werden, wie z.B. SR

statisti"Commodore

6l". Eine weitere Möglichkeit der Einteilung der Rechnertypen

ist

die nach der angewendeten Rechenlogik. Hierbei kann man 2

Hauptgruppen unterscheiden: 1.

Rechner mit algebraischer Logik,

2.

Rechner mit der "Umgekehrten Polnischen Notation" ( U P N ) .

1. Rechnermodelle und ihre Anwendungsbereiche Beide Systeme werden in den Kapiteln 5 - 2 und 5.3

5

ausführ-

lich besprochen. Speziel'l bei

der Anwendung von Formeln aus dem Bereich der

Statistik sind Summen oder Produkte bestimmter Ausdrücke zu bilden. Bei der Durchführung einer Regressionsrechnung z . B . 2 2 müssen die Summen für die Ausdrücke , , y, y , und xy für alle Meßwertpaare gebildet werden. Hierbei sind "rechnende Speicher" sehr von Vorteil, die es u.a. erlauben, in den Speichern selbst Zahlenwerte zu addieren oder zu multiplizieren. Man spricht in diesem Zusammenhang auch von "Registerarithmetik" bzw. "Speicherarithmetik" (siehe Kap. 6 ) . Weiterhin sollte die Möglichkeit der Programmierung gegeben sein. Da viele statistische Berechnungen aus immer wiederkehrenden Rechenabläufen bestehen ( w i e z.B. die Bildung von 2 2 x,x , y , y und xy für mehrere Zahlenpaare x / y ) , ist nur eine Eingabe des Rechengangs in den Programmspeicher notwendig. Fürverschiedene Datenpaare läuft dann die Berechnung automatisch ab.

Die Möglichkeit, die Programme und Daten zu speichern, wie die Daten und Ergebnisse

zu drucken, ist

so-

wünschenswert,

aber nicht unbedingt eine Voraussetzung für eine schnelle Auswertung. Rechner für die statistische Auswertung von Versuchsdaten sollten daher folgende Möglichkeiten b e s i t z e n : 1.

4 Grundrechenarten

2.

Mathematische Funktionen, wie z . B . 1/ ,)6

,

, In

INTEGER x, 3. 4.

, log x,

e X , 10X, y X ,

x-ABSOLUT u . a . m .

Mehrere "rechnende Speicher" ( e t w a 8-12) Programmierbarkeit mit der Möglichkeit, logische Entscheidungen vorzunehmen (Schleifenbildung)

5.

Rechnen mit sehr kleinen und sehr großen Zahlen. Dies ist

möglich, wenn im Gleitkomma-Format gerechnet

werden kann. Die meisten "Technisch-Wissenschaftlichen" -99 +99 verfügen über einen Rechenbereich von 10 bis 10

6 6.

1. Rechnermodelle und ihre Anwendungsbereiche Eventuell Drucker sowie eine Möglichkeit zum Speichern von Programmen bzw. Daten (Magnetkarte oder Bandkassette). Es gibt bereits Taschen- bzw. Tischrechner, welche die ge-

forderten Möglichkeiten besitzen. Als Beispiel für einen druckenden Taschenrechner sei das programmierbare Modell HP19 C genannt (Hewlett-Packard), das allerdings keine Möglichkeit b i e t e t , die Programme extern zu speichern. Ein einmal eingetastetes Programm bleibt aber auch nach Abschalten des Geräts im Programmspeicher erhalten, bis es durch ein neues ersetzt wird. Als Beispiel eines für statistische Auswertung geeigneten Tischmodelles sei das System Compucorp 32? und die 392 angeführt.

Bandstation

Dieser programmierbare Rechner verfügt auch

über einen Drucker. Weiterhin besteht die Möglichkeit, die Bandstation über den Rechner zu steuern. Falls der Umfang des Programms größer ist,

als der interne Programmspeicher ( 4 l 6

Speicherplätze) aufnehmen kann, können somit Programmteile vom Band nachträglich ,"eingelesen" werden.

Die folgende Zusammenstellung gibt eine Übersicht dreier Rechnermodelle, die für die statistische Datenauswertung geeignet erscheinen: a)

Compucorp Scientist 326/327 (algebraische Logik ohne Hierarchie)

b)

Texas Instruments TI 59 (algebraische Logik mit

c)

Hierarchie)

Hewlett Packard HP 97 (umgekehrte Polnische N o t a t i o n )

Selbstverständlich sind auch andere Geräte für die Datenauswertung verwendbar, sofern sie über die o.g. verfügen.

Eigenschaften

1. Rechnermodelle und ihre Anwendungsbereiche

a)

Modelle COMPUCORP SCIENTIST 326 und 32?

Bandstation COMPUCORP 392 Modell

326

Uandkasse tte

Modell

32?

8

1. Rechnermodelle und ihre Anwendungsgebiete

Bei den Systemen Compucorp 326 und 327 handelt es sich um zwei programmierbare Tischrechner mit Magnetbandstation (Compucorp 392)

zur Speicherung von Programmen und Daten. Während das Modell 326 über 12 Konstantenspeicher sowie

l60 Programmschritte v e r f ü g t ,

besitzt das Gerät Compucorp 327

kk Konstantenspeicher und 4l6 Programmspeicherplätze und

ist

außerdem mit einem Drucker a u s g e s t a t t e t , so daß eine Dokumentation der Daten und Ergebnisse ermöglicht wird. Rechenlogik Beide Modelle besitzen eine algebraische Logik ohne Hierarchie. In beiden Geräten wird also durch die [ = [ gang abgeschlossen.

- Taste eine Rechen-

Außerdem verfügen beide Systeme über k

Klammerebenen, in denen ebenfalls gerechnet werden kann. Die Nummer dieser Klammerebene wird durch eine entsprechende Z i f fer links in der Anzeige kenntlich gemacht. k

Beispiel:

*

3

l =?

Die Rechenschritte werden also so, wie sie hen,

auf dem Papier

ste-

abgearbeitet.

Funktionen Beide Geräte haben die wichtigsten mathematischen Funktionen festverdrahtet: sin x,

^"^^

,

2

, 1/x,

x! ,

5C

e ,

In x,

"V

10 ,

log x,

cos x, tan x, Arcus-Funktionen und automatische Bildung

von ^"x, ^x sind z.B.

und

n

aus n Einzelwerten. Weitere Funktionen

x-Absolut, Integer x, Fraction x (Vor- und Nachkom-

mateil von

) , M i t t e l w e r t , Standardabweichung.

Konstantenspeicher, Speicherarithmetik Sowohl das System Compucorp 326 als fügen über Speicher, kann z.B. ren.

auch der Rechner 327 ver-

in denen auch gerechnet werden kann. Man

in einem Speicher Zahlen addieren oder multiplizie-

Dies ist

für die Bildung von Summen bzw. Produkten von

entscheidender Bedeutung. Will man z.B. zu dem Inhalt des Speichers

l eine 5 addieren,

dann geschieht das durch den Befehl

1. Rechnermodelle und ihre Anwendungsgebiete

Da der Befehl

STO +

nur einen Programmschritt b e l e g t , spart

man erheblich an Programmschritten ein.

Der ausführliche Be-

fehl lautet

Selbst wenn man berücksichtigt, daß die Befehle RCL l STO l auch nur jeweils l Programmspeicherplatz benötigt man dennoch bei

und

belegen, dann

der "ausführlichen" Addition im Spei-

cher 5 Programmschritte, also 66% mehr! Programmierung Bei beiden Rechnern können die Tastenfolgen zur Lösung eines Problems durch Drücken des LOAD-Schalters in den Programmspeicher "eingelesen" werden. TAPE" auf

Durch Drücken der Taste "WRITE ON

der Kasettenstation kann dann das Programm auf Ma-

gnetband gespeichert werden. Ein großer V o r t e i l der Geräte ist, Rechner,

d.h.

also "per

daß die Bandstation vom

Programm" gesteuert werden kann. Da-

mit können theoretisch beliebig große Programme verarbeitet werden. Zur Programmierung von S c h l e i f e n , Verzweigungen und Unterprogrammen sind entsprechende logische Entscheidungen ebenfalls festverdrahtet! a) Der Inhalt des X-Registers kann gegen Null geprüft werden, d.h. gen

man kann t e s t e n , ob eine der Bedingun-

x = 0, x < 0 ,

f ü l l t ist.

x>0,

Wenn ja,

^ 0,

^ 0,

kann der Sprung zu einer be-

stimmten Programm-Marke ( L a b e l )

erfolgen.

b) Bestimmte Programm-Marken ( L a b e l s ) Befehl

JUMP

^ 0 er-

n (n = Adresse

können durch den

des Labels) ohne eine

Bedingung angesprungen werden. c) Durch

BRANCH

n

kann ein

Unterprogramm erreicht

werden. RETURN bewirkt Rücksprung ins

Hauptprogramm.

10

b)

1. Rechnermodelle und ihre Anwendungsbereiche

Modell TEXAS INSTRUMENTS TI 59

Modell TI 59

sinh χ l coshx

tanh χ

Magnetkarten

Drucker PC-100 A

1. Rechnermodelle und ihre Anwendungsbereiche Das Modell TI 59 von Texas Instruments ist

ein

11

programmier-

barer Taschenrechner mit eingebautem Magnetkartenleser zur Aufzeichnung der Programme. Der Rechner verfügt über einen speziellen Programmspeicher, der es erlaubt Programmspeicherplätze und Konstantenspeicherplätze ineinander umzuwandeln. Es stehen maximal 960 Programmschritte

bzw. höchstens 100 Kon-

stantenspeicher zur Verfügung. Zur Aufzeichnung der Daten, Ergebnisse und Programme kann ein Drucker angeschlossen werden ( M o d e l l PC-100 A oder PC-100 B/C). Rechenlogik Das Gerät b e s i t z t - ebenso wie das System Compucorp - eine

al-

gebraische Rechenlogik. Im Gegensatz zu den Modellen von Compucorp und auch anderen Geräten a r b e i t e t der Rechner "TI 59" mit Hierarchie. Dies b e d e u t e t , daß Punkt- vor Strichrechnung ausgeführt wird, so wie nach den Regeln der Mathematik. Damit e n t f ä l l t teilweise die sonst notwendige Benutzung von Klammern. Nach den Regeln dieser "Algebraischen Hierarchie" wird eine Multiplikation oder Division vor einer Addition bzw. Subtraktion ausgeführt, Reihenfolge

der auszuführenden

Beispiel: Die

wenn nicht durch Klammern eine andere

k +

|-

-

l

=

Schritte f e s t g e l e g t worden

ist.

?

Tastenfolge l a u t e t : ] k \ \ + \ \ 3 \ \ : \ \ 2 \ \ - \ \ l \ \ = \

Dabei wird intern zuerst der Quotient 3/2 berechnet und zur k addiert. Anschließend wird vom Gesamtergebnis l abgezogen. k + 3 5 - l zu lösen, ist das Setzen

Um allerdings die Aufgabe einer Klammer notwendig:

Die Klammer wäre dagegen bei

dem System ohne Hierarchie nicht

erforderlich. Man erkennt, daß -

je nach Problemstellung - sowohl das

algebraische System mit als bzw. Nachteile aufweist.

auch das ohne Hierarchie V o r t e i l e

12

1. Rechnermodelle und ihre Anwendungsbereiche

Funktionen Das Gerät ist

mit den gleichen mathematischen Funktionen

aus-

g e s t a t t e t , die auch für das System Compucorp angegeben sind. Konstantenspeicher, Speicherarithmetik Auch der Rechner "TI 59" verfügt über Konstantenspeicher,

in

denen man addieren, subtrahieren, multiplizieren bzw. dividieren kann. Soll z.B. der Inhalt des Speichers 01 um den Wert 4 erhöht w e r d e n , so ist

dazu die Tastenfolge

erforderlich. Dies entspricht dem Befehl 4 STO + 0 1 bei dem Modell Compucorp 32?. Um eine Multiplikation des Speicherinhalts mit 4 zu erreichen, wäre dagegen die Tastenfolge

notwendig. Weiterhin

ist

auch eine indirekte Adressierung

tenspeicher möglich, wenn zwischen den Tasten|STO| bzw.

|Prd | und der Adresse die Taste

der Konstan|RCLl

|SUM|

|lnd[ b e t ä t i g t wird. Da-

bei bedeutet beispielsweise der Befehl

daß die Zahl, k in demjenigen Speicher abgelegt w i r d , Adresse im Speicher

01 steht. Befindet

dessen

sich also darin z.B.

die

Zahl 10, dann gelangt die "k" durch den obigen Befehl in den Konstantenspeicher

10.

Programmierung Ebenso wie bei

dem System von Compucorp können auch mit dem

"TI 59" Schleifen, Verzweigungen und Unterprogramme programmiert werden. Mit einem Sprungbefehl können bis

zu 72 Labels

(Programm - Marken) angesprungen werden. Dem Befehl

JUMP CHS

beim System Compucorp (Sprung zum Label CHS) entspricht beim "TI 59" der

Befehl GTO CHS (Go T o ) , bzw. SBR CHS, wenn mit

Label CHS ein Unterprogramm beginnt.

1. Rechnermodelle und ihre Anwendungsbereiche c)

Modell HEWLETT PACKARD HP 97

Modell HP 97

P^S ENTt

-22.68

11.88 CALENDAR FUNCTIONS (DT-mm ddyyyy; SUNDAY =O) :

ODT,

DT2

OAOVS 1>AWKS,DYS DT»DOW

Magnetkarte

-17.0S

i4.ee -i5.ee

ENTt 2+ ENTt

J2.es ENTt -9.ee J+ 5.08 ENTt -24.ee, -2.ee -29.88

-9. fit! ES'Tt

-35.00 -21.5? 5.29 Ausdruck

2+ χ #**

**»·

Ik

1. Rechnermodelle und ihre Anwendungsbereiche

Der Rechner "HP 97" ist

- im Gegensatz zu den Modellen von

Compucorp und Texas Instruments - mit einer Rechenlogik ausg e s t a t t e t , die man als

"Umgekehrte Polnische N o t a t i o n " , abge-

kürzt UPN, bezeichnet. Im Gegensatz zu der algebraischen Logik fehlt hier die [=~|- Taste. Dafür ist

hier eine sog. ENTER-Taste vorhanden.

Klammern gibt es bei der UPN-Logik auch nicht. Der Rechner verfügt über 224 Programmspeicherzeilen sowie 26 Konstantenspeicher. Ein eingebauter Magnetkartenleser

er-

möglicht auch hier das Speichern von Programmen und Daten. Ähnlich wie bei

dem Modell Compucorp kann man auch hier mit

dem eingebauten Drucker seine Daten, Ergebnisse und Programme dokumentieren. Rechenlogik Chrakteristisch ist

hier, daß sämtliche Rechengrößen zunächst

in dem sog. Stack-Register

gespeichert werden. Danach erst

wird die Operations-Taste gedrückt, und es e r f o l g t die

ent-

sprechende Berechnung.

Beispiel:

4 x 5 =

?

Die hier anzuwendende Tastenfolge lautet: | 4 | | ENTER | | 5 | |

|

Die Eingabe der Daten erfolgt hier also nicht "wie auf dem Papier". Dafür b e s i t z t die UPN-Technik aber den Vorteil, daß alle Rechnungen nach dem gleichen Schema ablaufen. Funktionen Auch der l—' 7X5

wie

"HP 97" hat 2 „ , x i 1/Xf

die wichtigsten mathematischen Funktionen ., . , In x, sin x, cos x, tan usw.

e ,

f e s t v e r d r a h t e t . Darüberhinaus v e r f ü g t das Gerät über 10 f r e i belegbare Funktionstasten, denen selbstgewählte

Funktionen bzw.

Unterprogramme zugeordnet werden können. Weiterhin hat auch dieser Rechner für die statistische Auswertung wichtige Funktionen wie Integer x und x-Absolut.

1. Rechnermodelle und ihre Anwendungsbereiche

15

Konstantenspeicher, Speicherarithmetik Der "HP 97" verfügt sen 0 bis

über 16 sog. Primärspeicher mit den Adres-

9 und A , B , C , D , E und I.

folgt wie bei

Das Speichern von Zahlen

den Modellen von Compucorp und Texas Instruments

durch Drücken der STO-Taste und anschließend Speicher-Rückruf ist die Speicheradresse le

STO +

er-

entsprechend RCL n

der Adresse. Beim

zu d r ü c k e n , wobei n

darstellt. W e i t e r h i n kann durch die Befeh-

n , STO - n , STO

gerechnet werden, d.h.

n , STO : n

in den Speichern

man kann in den Speichern Zahlen addie-

ren ,multiplizieren usw.. Neben den Primärspeichern

verfügt

der

"HP 97" noch über 10

sog. Sekundär-Speicher, die geschützt sind. Man kann diese Konstantenspeicher n i c h t direkt über die Befehle STO und RCL erreichen. Durch Betätigen einer entsprechenden Taste lassen sich die Inhalte

der Primär- und Sekundärspeicher austauschen.

Programmierung Ähnlich wie bei

dem Modell Compucorp wird beim E i n t a s t e n des

Programms ein sog. Tastencode a n g e z e i g t ,

der zur späteren Kon-

trolle dient. Genauso wie bei

den beiden anderen beschriebenen Geräten

besteht auch hier die M ö g l i c h k e i t , S c h l e i f e n , Verzweigungen und Unterprogramme in das Programm mit einzuarbeiten. Hierzu können im Programm bis

zu 2O Labels ( M a r k e n ) gesetzt werden,

um entsprechende Stellen im Programm erreichen zu können. Dabei

h i l f t die

Taste GTO ( = Go To) g e f o l g t von dem Namen des

Labels. Der Befehl GTO 2 bedeutet also, daß ein Label 2 erfolgen

Sprung zum

soll.

Der Fortgang des Programms kann durch Einbau von logischen Entscheidungen in das Programm von b e s t i m m t e n Bedingungen abhängig gemacht werden. Dabei ist

einmal der Vergleich des X-

Registers mit Null m ö g l i c h , zum anderen können auch die halte von X- und Y-Register verglichen werden. Ist sprechende Bedingung e r f ü l l t die Vergleichsoperation fehl - ausgeführt.

(z.B.

= 0),

die

Inent-

dann wird der auf

folgende Schritt- meist ein Sprungbe-

Ansonsten

Sprung zum nächsten Schritt.

2. Rechenschieber, Logarithmentafel und Elektronenrechner im Vergleich

Bis vor wenigen Jahren waren die einzigen H i l f s m i t t e l , die praktisch jedermann zur Auswertung von Meßergebnissen zur Verfügung standen Rechenschieber und Logarithmentafel. Heute, da man bereits Taschenrechner für erstehen kann, ist

50 DM und weniger

der Rechenschieber weder vom finanziellen

noch vom technischen Standpunkt her eine Konkurrenz für den Elektronenrechner. Eine Reihe von Gesichtspunkten geben nämlich dem elektronischen Taschen- bzw. Tischrechner sowohl gegenüber dem "klassischen" Rechenschieber als

auch gegenüber der Logarith-

m e n t a f e l eindeutig den Vorzug: 1.

Selbst mit den einfachsten Geräten können alle fr Grund-

rechenarten

durchgeführt werden. Man kann also - im Gegen-

satz zum Rechenschieber - auch addieren und subtrahieren! Dies ist

besonders dann von V o r t e i l , wenn Summen oder

Diffe-

renzen bestimmter Ausdrücke zu bilden sind. 2.

Mit einem Rechner, der über eine Gleitkommadarstellung

fügt (siehe Kap. 4 . 3 ) , können Zahlen im Bereich zwischen 10 und 1O+ 99 verarbeitet werden, ohne das beim Rechenschieber

ver- 99

häufig notwendige Ausklammern von Zehnerpotenzen; die Möglichkeit eines dabei a u f t r e t e n d e n 3.

Fehlers ist

somit ausgeschlossen.

Manche Rechenschieber verfügen zwar auch über eine Expo-

nentialskala (e-Funktion) bzw. über trigonometrische Skalen. Die Genauigkeit ist eines Rechners.

aber überhaupt nicht vergleichbar mit der

2. Rechenschieber und Elektronenrechner k.

im Vergleich

17

Das Argument, man könne ja - wenn die Genauigkeit eines

Rechenschiebers entsprechend

nicht ausreicht - eine Logarithmentafel mit

hoher Stellenzahl verwenden, ist

auch nicht

haltbar. Auch mit Hilfe einer L o g a r i t h m e n t a f e l können keine Additionen und Subtraktionen durchgeführt werden! Das Ablesen der Mantissen in den Spalten der Tafeln kann oft

zu Ablese-

fehlern führen. Ferner müssen Aufgaben über die Logarithmengesetze erst umgeformt w e r d e n , was u.a.

auch einen erhöhten

Zeitaufwand b e d e u t e t . 5.

Weder beim Rechenschieber noch bei der Logarithmentafel

hat man die Möglichkeit,

Zwischen- oder Endergebnisse zu spei-

chern, falls diese bei späteren Berechnungen benötigt werden. 6.

Die Ablesegenauigkeit

Die 3· bzw. k.

beim Rechenschieber ist

nur begrenzt

signifikante Stelle kann im allgemeinen nur ge-

schätzt werden. Daher können D i f f e r e n z e n von f a s t gleich großen Zahlen, wie sie bei statistischen Berechnungen h ä u f i g a u f t r e t e n , nur mit einem relativ großen Fehler e r m i t t e l t werden. Beispiel

l

Zu berechnen sei der Ausdruck

=]/

-1.4

. Der "wahre" Wert

für -j/T beträgt 1.4142 . . . , woraus für die D i f f e r e n z f o l g t : =f2

- 1.4l

= 0.0042 . Liest man auf dem Rechenschieber einen

Wert von 1.412 für ~f2 =·/2~* - 1.4l

a b , dann erhält man für

= 1.412 - 1.4l

die

Differenz:

= O.OO2 . Der Fehler b e t r ä g t ge-

genüber dem korrekten Ergebnis mehr als

50% !

Bei sehr kleinen D i f f e r e n z e n kann der Fehler sogar noch erheblich größer werden, wie das folgende Beispiel aus der Statistik z e i g t : Aus den Einzelwerten X 1 = 40.4l x2 = 40.05 x 3 = 40.39 einer Messung soll die Standardabweichung s nach der Formel

18

2. Rechenschieber und Elektronenrechner

im Vergleich

(D

n - l

berechnet werden. Die folgende Tabelle zeigt eine Gegenüberstellung der mit einem Rechner ermittelten "exakten" Werte und den Ergebnissen, Tab. l

die mit einem Rechenschieber erhalten wurden.

Vergleich der Genauigkeit von Rechenschieber und Rechner

= 40.

= 40.05 ,

, = 40.39

Berechneter

Rechen-

Taschen-

Ausdruck

schieber

rechner

2 l

1630

1632.968l

X

2 2

1610

1604.0025

X

2 3

1628

1631.3521

4868

4868.3227

14600

14604.7225

4865

4868.2408

3

0.0818

1.225

0.202

X

Z*2

= s,

(Z-) 2 f (Z-) 2 = s 2 S

l -

S

2

s

Das mit dem Rechenschieber erhaltene Ergebnis ist

um ca. 600%

größer als der W e r t , den man mit einem Rechner e r m i t t e l t ! Der große Fehler, den man bei bers meist m a c h t , ist

Anwendung des Rechenschie-

die zu grobe Rundung von Zwischen- bzw.

Endergebnissen, wie aus dem obigen Beispiel hervorgeht. Ebenso erhält man aber falsche Ergebnisse, wenn auch der Rechner

2. Rechenschieber und Elektronenrechner im Vergleich über eine zu geringe Stellenzahl verfügt.

19

Man sollte bei dem

für die statistische Auswertung zu verwendenden Rechner darauf achten, daß er über 8 - 1 0 oder mehr D e z i m a l s t e l l e n verfügt. Da es für

den Rechner keine Zeitersparnis b e d e u t e t ,

mit

weniger Stellen zu rechnen, sollte man eine gegebene Aufgabe auch stets mit der vollen zur Verfügung stehenden Stellenzahl zu Ende führen und erst am Schluß der Auswertung das Ergebnis - dann allerdings sinnvoll - auf- bzw. abrunden. Eine etwa vorhandene "Rundungsautomatik" sollte daher nur für

das End-

ergebnis einer Berechnung benutzt werden. Hinweise auf die Rundungsfehler der einzelnen Rechnertypen finden sich in den entsprechenden Handbüchern. Einen allgemeinen Überblick über die Problematik gibt J . M . Smith ( 1 ) .

3. Mathematische Grundlagen

3.1 Rechnen mit Summen

Gegeben sei eine Menge von Daten χ. , x„ , x _ , ... x . Die j— ^ η _Summe dieser Daten wird durch den griechischen Buchstaben 2= Sigma dargestellt. Man definiert:

i=n

x

+ x

+ x

)

+ ...

+ x

n

=

J~x. ±=1

(2)

l

und spricht: "Summe aller x i von i=l bis

i=n". In verallge-

meinerter Form kann man auch schreiben:

i=n k

k+1

k+2

"""

n ~ .£-, i i=k

was bedeutet: "Summe aller x i von i=k bis

, '

( J> 3)

i=n". Dabei kann

k jeden beliebigen ganzzahligen Wert annehmen. Zur Vereinfachung l

t man f r den Fall, da

i von l bis n

l u f t , sowohl die Grenzen am Summenzeichen als auch den Index i weg. Es gilt also:

(4)

Multiplikation mit einer Konstanten Werden alle Glieder einer Summe mit einem konstanten Faktor m u l t i p l i z i e r t , so gilt:

c ·χ. + c ·χ2 + c ·χ_ + ...

+ c .χ

= ^"c-χ

= c s x .

(5)

3.1 Rechnen mit Summen

21

Eine Konstante vor den Gliedern einer Summe darf vor das Summenzeichen gezogen werden, sofern sie als Faktor bei allen Gliedern auftritt. Addition von Teilsummen Gegeben seien zwei Datengruppen mit Xj

+ x2 + x 3 + ... H- xn

+

YI

+ y2

+

y3

+

jeweils n Gliedern: ... yn .

Für die Summe dieser beiden Reihen gilt dann:

(6)

...

+

(x n + y n )

Somit f o l g t :

y) .

(7)

Spezialfälle Sind die Glieder einer Summe alle i d e n t i s c h , gilt also : ll dann f o l g t : X

2

3

"

n

(8)

Weitere Fälle:

y)

y) =

C

2y

(9)

(10)

22

3. Mathematische Grundlagen

Doppelsummen Den Ausdruck j=m

i=n

5 bezeichnet

man als Doppelsumme. Seine Bedeutung ist

Zunächst durchläuft j=l

ist.

folgende:

der Index i alle Werte von l bis n, wobei

Die Summe der entsprechenden Werte ist

die 1. Teil-

summe. Anschließend durchläuft i für j=2 alle Werte von l bis n. Die Addition der entsprechenden Werte ergibt die 2. Teilsumme. Man verfährt so w e i t e r , bis

für

alle j von j=l bis j=m

alle m Teilsummen gebildet sind. Die Doppelsumme ( =Ge s amtsumme ) ergibt sich dann durch Summieren der einzelnen Teilsummen. Es gilt also: j=m

i=n

Z^ij

±

bzw.

j=m

=

.

0

JUMP

kleiner Null

< 0

JUMP

größer/gleich Null

^0

JUMP

kleiner/gleich Null

JUMP

JUMP

JUMP

+

+

n

größer/kleiner Null

^0

(ungleich Null)

Will man den Inhalt des X-Registers nicht mit Null sondern mit einer Zahl y vergleichen, also die Bedingungen x > y , x< y , = y

usw. ü b e r p r ü f e n , dann muß zunächst die D i f f e r e n z

- y

gebildet und diese dann mit Null verglichen werden. Soll also z.B. ist

getestet werden, ob die Bedingung x>-y dies möglich, indem man die Forderung

e r f ü l l t ist, - y^O prüft.

dann In

Tab. 39 sind die verschiedenen Möglichkeiten zusammengefaßt.

96

7. Programmierbare Rechner

Tab. 39

Befehlsfolgen

f r den Vergleich

zweier Zahlen χ und y ( S y s t e m Compucorp) Testbedingung

Tastenfolge

χ = y

χ - y= 0

χ > y

—> χ - y> 0

JUMP

χ< y

—> χ - y< 0

JUMP

χ ^ y

—> χ -

x^ y

—> χ - y^ 0

•D * Ξ

JUMP

JUMP

χ -5 y Ist

die g e t e s t e t e Bedingung erf llt,

Sprung zum LABEL

dann erfolgt ein

n.

Bei einigen Ger ten

( z . B . HP 19 C und HP 97) ist

gleich von χ und y d i r e k t m g l i c h , so da

die

ein Ver-

Bildung der

D i f f e r e n z χ - y dann entfallen kann. Zus tzlich zu den genannten Testbedingungen kann man bei dem System Compucorp pr f e n ,

ob nach einem STOP-Befehl das

X-Register b e l e g t worden ist

oder nicht. Damit kann f e s t g e -

stellt w e r d e n , ob eine Eingabe s t a t t g e f u n d e n hat. sprechende T e s t b e f e h l

lautet |JUMP| | + | f~] [~=1 l t .

mit diesem Test gepr f t , gr

n

Der ent-

Es wird

also

ob der Inhalt des E i n g a b e r e g i s t e r s

e r , kleiner oder gleich Null

ist.

7.3

Ist

eine Eingabe e r f o l g t ,

Unterprogramme

so wird ein Sprung zum LABEL n

97

aus-

geführt.

7.3 Unterprogramme O f t m a l s kommen in einem Programm Teile v o r , die sich wiederholen. Ist

z.B.

eine b e s t i m m t e Funktion für verschiedene

Variable zu berechnen,

so könnte man dabei folgendermaßen

vor-

gehen: Die im Laufe des Programms a n f a l l e n d e n verschiedenen Werte für

die Variable werden immer in dem gleichen Konstan-

tenspeicher abgelegt. Die Funktion wird dann jeweils gesondert in einem Unterprogramm b e r e c h n e t . Unterprogramme können an einer beliebigen Stelle im Programm aufgerufen

werden. Für die Erstellung eines solchen Un-

terprogramms ( e n g l . Subroutine) gelten folgende a)

Regeln:

Das Unterprogramm b e g i n n t mit einer symbolischen Adresse.

Diese ist entweder eine Schrittnummer

oder eine "Marke" b z w . ein LABEL im Programm. b)

Das Unterprogramm e n d e t m e i s t mit dem Befehl RETURN

oder einer entsprechenden

Taste.

Dadurch wird der Rücksprung zu der Stelle im Hauptprogramm b e w i r k t , von wo aus der Sprung

in

das Unterprogramm e r f o l g t e . c)

Das Unterprogramm kann von einer beliebigen S t o l l e des Hauptprogramms aus a u f g e r u f e n werden. Der Rechner "merkt" sich jeweils die Rücksprungadresse. Dies ist

die Stelle, von wo aus der

Sprung in das Unterprogramm ausging. d)

Bei einigen G e r ä t e n können mehrere Unterprogramme ineinander g e s c h a c h t e l t w e r d e n , d . h .

ein Unter-

programm kann ein w e i t e r e s Unterprogramm a u f r u f e n

usw.

98

7· Programmierbare Rechner e)

Der Aufruf

der Unterprogramme e r f o l g t durch

spezielle Befehle wie BRANCH n

(engl. to branch = verzweigen, Compucorp Scientist 326 u. 327)

SBR

n

(engl. subroutine = Unterprogramm, Texas Instruments TI58/59)

GSB

n

(engl. g_o to subroutine = gehe zum Unterprogramm, Hewlett Packard HP 97)

Beispiel zur Unterprogrammtechnik (Beispiel 9) Es sei

die Funktion

„

i

=

3 (x3 + 3x2 +5 4) (y + 3y2 + 4) S 3 (z· + 3z + k)

zu berechnen. Man kann dabei so vorgehen, daß man eine Teil3 2 funktion u = k + 3k + 4 d e f i n i e r t und nacheinander für k = x,

k = y und für

k = z in einem Unterprogramm den

jewei-

ligen Wert für u e r m i t t e l t . Dazu müssen die verschiedenen Variablen x, y und z vor dem Sprung in das Unterprogramm immer in einem bestimmten Konstantenspeicher abgelegt werden. Die allgemeine Variable k in dem o . g . Ausdruck für

u wird dann

durch den entsprechenden Inhalt des Konstantenspeichers (x, y oder z) dargestellt. Das Unterprogramm, in dem die Funktion u = k 3 + 3k 2 + k berechnet wird, enthält gewissermaßen allgemeine Vorschrift

die

für die Berechnung von u. Das "Schema"

zur Berechnung von u ist

ja unabhängig von dem W e r t , den die

Variable k annimmt. Die obige Formel für mein formuliert werden als F = u(k=x) · u(k=y)

/ u(k=z)

F kann somit allge-

7-3

Wir wollen annehmen, da

Unterprogramme

99

die Variablen x, y und z im Speicher

l abgelegt werden und das Unterprogramm mit dem LABEL l beginnen soll. Ein Programm zur Berechnung von F unter Anwendung der Unterprogrammtechnik k nnte f r den Rechner Compucorp 326 Scientist z.B. so aussehen: Tab. ΊΟ

Rechenbeispiel zur

Tasten

Kommentar

STOP

Eingabe χ k = χ

u(k

Kommentar

Tasten

Unterprogramm

-A

BRANCH

Unterprogrammtechnik

= x)

1

LABEL RCL

1

Eingabe y

STOP

k = y

.STO 5

STO | | 5 u(k

RCL

= y)

| 1

+

Eingabe z

3 A· l·

STO

Li

u(k

Ϊ

k + 3

= z)

u(k =x)

k u(k

= y)

+

3k

k 3 + 3k2 + k R cksprung

RCL

u(k

= z)

zum

Hauptprogramm F

100

7- Programmierbare Rechner

Man erkennt, daß in allen 3 Fällen, in denen das Unterprogramm aufgerufen w i r d ,

der RETURN-Befehl immer den Rück-

sprung zu der Stelle im Hauptprogramm b e w i r k t , von der aus der Sprung in das Unterprogramm e r f o l g t ist.

Die in den 3 Fällen

im Unterprogramm berechneten Teilfunktionen u ( k = x ) , u ( k = y ) und u ( k = z ) werden nach dem Rücksprung in das Hauptprogramm in den Speichern 2,

3 bzw. k abgelegt. Mit diesen abgespei-

cherten Werten wird dann am Schluß des Programms die Funktion F berechnet. Mit Hilfe der Unterprogrammtechnik kann man eine große Zahl von Programmspeicherplätzen einsparen. Dies ist

insbe-

sondere dann von V o r t e i l , wenn die Unterprogramme selbst sehr umfangreich sind und mehrmals vom Hauptprogramm aus

aufgerufen

werden. Wird dagegen ein Programmteil nur einmal b e n ö t i g t , so

ist

es nicht sinnvoll, diesen Programmabschnitt als Unterprogramm zu schreiben, da durch den Sprungbefehl und das RETURN 2 zusätzliche Schritte verbraucht werden gegenüber einer Verarbeitung des Programmteils

im Hauptprogramm. Dies gilt auch für

den Fall, daß das Unterprogramm nur aus 2 Schritten b e s t e h t . In diesem Fall werden durch den Sprungbefehl z.B.

beim Modell

Compucorp auch 2 Schritte b e n ö t i g t . Das wiederholte Aufrufen des Unterprogramms erfordert also in diesem speziellen Fall genausoviele Programmspeicherplätze

wie die Wiederholung der

Schritte im Hauptprogramm.

7.4 Ändern von Programmen Nur selten ist

das erstellte Programm f r e i von Fehlern.

Es gibt 3 M ö g l i c h k e i t e n , die zu einem falschen Programm führen können: a)

Es wurde eine falsche Instruktion "geladen".

b)

Es wurde eine Instruktion zuviel geladen.

c)

Es wurde eine Instruktion vergessen.

7.^

Um die

Ändern von Programmen

101

entsprechende Stelle im Programm, die verändert wer-

den muß bzw. eingefügt werden muß, zu e r r e i c h e n ,

besitzen

ei-

nige Rechner die Tasten FORWARD

bzw.

Ein einmaliges Betätigen dieser Tasten im LEARN- oder LOADModus hat

zur F o l g e , daß das Programm um einen Schritt vor-

wärts bzw. rückwärts geht. Dabei wird das Programm zunächst weder verändert noch

ausgeführt.

Befinden sich im Programm Sprungadressen ( L A B E L s ) , so kann man durch JUMP n oder GO TO n (n= Nummer des

LABELs b z w .

Schrittnummer) im RUN-Modus der f e h l e r h a f t e n Stelle oft kommen. Dieses Vorgehen ist

näher-

besonders bei umfangreichen Pro-

grammen zu empfehlen. Die 3 möglichen Fehler können folgendermaßen korrigiert werden: zu

a)

Man geht mit FORWARD oder BACKSPACE im Programm im LOAD- b z w . LEARN-Modus soweit vor oder zurück, bis die f e h l e r h a f t e r e i c h t ist.

Stelle er-

Dann wird der richtige Befehl

e i n g e t a s t e t , wobei die f e h l e r h a f t e

Instruk-

tion automatisch überschrieben wird. zu

b)

Man geht mit

FORWARD oder BACKSPACE zu dem

entsprechenden Programmschritt. M i t | R E M O V E | ( b e i manchen Rechnern: DELETE) wird der zuviel geladene Programmbefehl e n t f e r n t . zu

c)

Man geht mit FORWARD oder BACKSPACE bis

zu

dem Programmschritt, der dem einzufügenden Befehl folgen soll. Mit der Taste |lNSERT| wird ein freier Programmplatz erzeugt. Anschließend wird der f e h l e n d e Schritt eingetastet.

8. Mathematische Funktionen

8.1 Allgemeines

Ein Rechner für die statistische Datenauswertung sollte - wie im Abschnitt

l bereits erwähnt - neben den Grundrechen-

arten auch eine Reihe von mathematischen Funktionen in "festverdrahteter" Form besitzen. Hierzu gehören insbesondere Funktionen wie y=\/x"' , y=x , y = l / x , y = e , y=ln x und y=a funktion).

(Potenz-

Für spezielle Problemstellungen, wie z . B . die Lö-

sung von Verteilungsintegralen oder die Simulation von normalv e r t e i l t e n Meßwerten, benötigt man auch die Funktionen y=sin x , y=cos x, y=tan

trigonometrischen

sowie deren Umkehrfunk-

tionen ( A r c u s - F u n k t i o n e n ) . Die w i s s e n s c h a f t l i c h - t e c h n i s c h e n Taschen- bzw. Tischrechner

sind mit den entsprechenden Tasten

ausgerüstet. Durch Reihenentwicklung oder auf iterativem Wege lassen sich zwar auch die m e i s t e n Funktionen nur unter Anwendung der Grundrechenarten darstellen. Die entsprechenden Algorithmen sind aber meist so kompliziert,

daß sie mehr oder weniger nur

akademisches Interesse haben. Es sei

aber darauf hingewiesen,

daß intern die Berechnung der Funktionen auf diesem Wege folgt. Da die Ergebnisse

er-

somit nur Näherungslösungen sind -

die Reihentwicklung muß ja bei unendlichen Reihen nach einer bestimmten Anzahl von Gliedern abgebrochen werden - sind die über die Funktionstasten

e r m i t t e l t e n Werte s t e t s mit einem ge-

ringen Fehler b e h a f t e t . Dieser ist

aber im allgemeinen so

klein, daß er entweder vernachlässigt werden kann oder intern durch Rundung sogar beseitigt w i r d : Der berechnete Wert V§T = 8 , 9 9 9 9 9 9 . . . wird automatisch auf 9,0000...

aufgerundetl

8.1

Allerdings ist

M a t h e m a t i s c h e Funktionen,

Allgemeines

103

dieser "Komfort" n i c h t bei allen Geräten gege-

ben. Speziell im Bereich der S t a t i s t i k und der

Wahrscheinlich-

keitsrechnung sind w e i t e r h i n die Funktionen y = x-Absolut = |x| y = x-Fakultät = und

, ! ,

y = Integer

von Bedeutung. Da viele Rechner diese Funktionen noch n i c h t

in

f e s t v e r d r a h t e t e r Form b e s i t z e n , wird auf deren Berechnung hier besonders

eingegangen.

8.2 Berechnung der Funktionen Die E r m i t t l u n g der e n t s p r e c h e n d e n Funktionswerte so, daß zunächst das Argument

geschieht

in das E i n g a b e r e g i s t e r ( A n z e i -

g e ) gebracht werden muß. Dies kann entweder durch Eingabe von geschehen,

oder

aber das A r g u m e n t

Berechnung. Nach dem Drücken der

ist

das Ergebnis einer

F u n k t i o n s t a s t e wird der Funk-

tionswert berechnet und in die Anzeige gebracht. Das A r b e i t s bzw. Y-Register

wird dabei n i c h t b e e i n f l u ß t mit Ausnahme der }£ P o t e n z f u n k t i o n y=a .

8.2.1

Die Funktion y =

Drückt man auf

einem Rechner die

so b e d e u t e t d i e s , daß aus dem W e r t x,

Taste mit

dem Symbol

der in der Anzeige b z w .

im X-Register s t e h t , die Quadratwurzel gezogen w i r d . Da ein Taschen-

oder Tischrechner

zumindest auf d i r e k t e m

Wege keine imaginären b z w . komplexen Zahlen v e r a r b e i t e n k a n n , e r f o l g t bei

dem V e r s u c h , aus einer negativen Zahl eine W u r z e l

4

5. Mathematische Funktionen

zu ziehen, eine Fehlermeldung. Besitzt der Rechner keine Taste zur Berechnung von ~yx , so kann man nach Newton auf iterativem Wege die

Lösung e r m i t t e l n .

Es gilt

a.

a .) = a. i i+l

(22)

Man beginnt mit a , einem Näherungswert, der liegen soll. Den erhaltenen W e r t für

a.

in der Nähe von = a„

. = a.

setzt man wieder in die linke Seite der Gleichung ein und erhält den Wert a _ . Das Verfahren wird solange f o r t g e s e t z t , sich a. und a.

bis

nur noch um einen geringen, vorgegebenen Be-

trag unterscheiden. Der Wert a.

ist

dann eine Näherung für"^x

.

Eine ausführliche Darstellung des Verfahrens findet man bei

3.2.2

Die Funktion y = kann eine gegebene Zahl

Mit H i l f e der Taste

driert werden. Das Ergebnis ist ob

qua-

immer positiv, gleichgültig,

selbst positiv oder negativ war. Ist

die Quadrier-Taste nicht vorhanden,

drat der Zahl

so kann das Qua-

"explizit" durch Multiplikation von

mit sich

selbst erhalten werden. Beispiel

y = (6,43)'

Algebraische Logik:

6

•

4

3

X

UPN-Logik:

6

-

4

3

ENTER

=

41.3499

X

41.3499

Bei einem R e c h n e r mit Gleitkomma-Darstellung und einem Zahlenbereich von 10-99 bis 10+99 können nur x-Werte quadriert -49 +49 werden, die zwischen 10 und 10 liegen.

5.2.3

8.2.3

Die Funktion y = 1/x

105

Die Funktion y = 1/x

Die "Reziproktaste"

1/x

Berechnung von Brüchen, bei

ist

besonders n ü t z l i c h bei der

denen im Nenner ein zusammenge-

setzter Ausdruck s t e h t und dieser zuerst e r m i t t e l t werden m u ß . Beispiel Es soll der Ausdruck

a =

berechnet werden.

Y3(4,9 + 2,5) Die entsprechende Tastenfolge

unter Verwendung der Funktions-

taste |l/x[ lautet: Tab. kl

Rechenbeispiel Funktionstaste

Tastenfolge

X-Register

zur Anwendung der 1/x Y-Register

Operation

4.9 4.9

2.5

4.9

7-4

7.4

4,9 + 2,5 = 7,4

7.4 22.2

7.4

4.7328

7.4

O.2112

7.4

3

7,4 = 2 2 , 2

22,2

:,732i

= 4,7328 = 0,2112

W e i t e r e Möglichkeiten den obigen Ausdruck zu berechnen w ä r e n durch Anwendung von K l a m m e r t a s t e n bzw. Verwendung eines Konstantenspeichers gegeben. Hierbei sind aber in jedem Fall mehr

106

8. Mathematische Funktionen

Tastenschritte notwendig als unter Verwendung der Reziproktaste .

8.2.4

Die Funktion y = e X

Die e-Funktion hat

in vielen Formeln aus dem Bereich der

Naturwissenschaften eine grundlegende Bedeutung und ist deshalb praktisch auf jedem wissenschaftlich-technischen Rechner in festverdrahteter Form vorhanden. Die Funktion y = e ^£ stellt eine Potenzfunktion dem Exponenten

dar mit

und der Basis

e = 2,71828182846

Die Zahl e ist

(23)

bekanntlich eine irrationale Zahl, d.h. der

"exakte" Zahlenwert

ist

nicht explizit angebbar.

Da aber auf dem Rechner naturgemäß nur endlich viele Stellen zur Verfügung s t e h e n , kann jede irrationale Zahl auch nur als "quasi-rationale" Zahl mit endlicher Stellenzahl behandelt werden. Auf praktische Ergebnisse von Berechnungen hat das aber keinen Einfluß. Der Exponent kann bei einem Rechner mit einem Zahlen-99 +99 bereich zwischen 10 " und 1O " (Gleitkomma) jeden Wert zwischen -22? und + 229 einschließlich Null annehmen, denn es gilt: =

2,6-10-"

e +229 = 2 , 8 - 1 0+ "

Bei einigen Rechnern kann es vorkommen, daß in der Nähe dieser

"Grenzwerte" f e h l e r h a f t e Ergebnisse zustande kommen. Man -98 sollte daher sicherheitshalber den Bereich zwischen 10 und + 98 10 nicht überschreiten (x zwischen - 2 2 5 , 6 und + 2 2 5 , 6 ) . Die e-Funktion kann auch durch eine Reihenentwicklung dargestellt werden:

Die Funktion y = e

e

Mit x°= l

χ

und

χ 2!

= 1 + χ +

0! = l

10?

(24)

3!

sowie

χ

,n=oo

= χ

und

l!

= l

folgt:

n

-ΣΙ- r

(25)

n=0

Weiterhin kann die Zahl e auch als ( l + l/n)

Grenzwert des Ausdrucks

f r n gegen Unendlich d a r g e s t e l l t werden:

(26)

e = lim ( l + - )" n n-» oo

Die genannten Beziehungen haben aber f r praktische Berechnungen nur geringe Bedeutung und sind hier nur der Vollst ndigkeit halber angef

hrt.

Wer sich genauer informieren will: Im "Handbook of Mathematical Functions" von Abramowitz und Stegun f hrliche

Zum Schlu

noch zwei w i c h t i g e S p e z i a l f a l l e :

e° = l

8.2.5

(3) sind aus-

Abhandlungen nachzulesen!

und

(2?)

Die Funktion y = In χ

Die Funktion y = In χ ist e-Funktion. Dies bedeutet, da

die

Umkehrfunktion zu der o.g.

In χ f r ein gegebenes χ den-

jenigen Zahlenwert d a r s t e l l t , mit

dem man e potenzieren mu ,

um χ zu erhalten. Die Funktion y = In χ ist

somit eine Loga-

rithmusfunktion und zwar mit der Basis e. Die Logarithmen von

108

8. Mathematische Funktionen

Zahlen zur Basis e bezeichnet

man auch als

"natürliche Loga-

rithmen". Sie stellen diejenigen Werte dar, mit denen man die Zahl e potenzieren muß, um einen gegebenen Zahlenwert zu

er-

halten. Beispiele e 2 ' 3 0 2 5 = 10

In 10 = 2,3025 In

0,6931

2 = 0,6931

usw.

Entsprechend den bei der e-Funktion genannten Beziehungen e

= 1

und e

= e

gilt:

In l = 0 Versucht man, für

und

(28)

In e = l

den Wert 0 oder einen negativen Zahlenwert

durch Drücken der Taste

|In

| den natürlichen Logarithmus zu

berechnen, so erfolgt eine Fehlermeldung! Dies rührt d a h e r , v

daß die

Funktion y = e

nur positive Zahlenwerte annehmen

kann und somit Logarithmen nur von positiven Zahlen berechnet werden können. Ähnlich wie die e-Funktion, kann auch zur Berechnung von In

eine Reihenentwicklung angegeben werden:

c-

*

11= OO

In

= 2

2n + 1

+ 1

n=0

8.2.6

Die Funktionen y = 10

1

(29)

und y = log

Diese Funktionen sind ähnlich wie die e-Funktion bzw. die natürliche Logarithmus-Funktion zu behandeln. Basis die Zahl 10. Die Funktion y = log

Nur ist

hier die

gibt also die Zah-

lenwerte an, mit der man die Zahl 10 potenzieren muß, um eine

5.2.6

Die Funktionen y = 10

und y = log

109

vorgegebene Zahl x zu erhalten. Sind die entsprechenden Funktionstasten nicht vorhanden, so kann man die Funktionswerte über die folgenden Beziehungen ermitteln:

10X = e x log

=

ln

10

(30)

In x In 10

In 10 = 2,302585. Ferner gelten ähnlich wie bei

y = e

und y = In

die

Spe-

zialfälle: 10° = l

10

= 10

(3D

•

log 1 = 0

8.2.7

log 10=

l

Die allgemeine Potenzfunktion y = a

X

bzw. z =

V

Mit Hilfe dieser Funktionstaste kann für einen b e l i e b i g e n Exponenten

und eine beliebige Basis a ( b z w . einen Exponenten y und eine Basis x) die Potenz a x bzw. v ·' b e r e c h n e t w e r d e n , sofern die Potenzgesetze eingehalten werden. Der E i n f a c h h e i t halber soll die Funktion im folgenden als

y = a

bezeichnet

werden. Es gelten folgende Regeln: a positiv

> x positiv, n e g a t i v oder Null

a negativ

> x ganzzahlig p o s i t i v , ganzzahlig negativ oder N u l l

a Null

> x positiv

Diese Bedingungen gelten für das System Compucorp. Für andere Rechnersysteme sind weitere Einschränkungen m e i s t dadurch gegeben, daß negative Exponenten bei negativer Basis zu einer

8. Mathematische Funktionen

110

Fehlermeldung führen. Dies ist

eigentlich nur dann mathema-

tisch nicht zulässig, wenn der Exponent gebrochen ist. sem Fall würde man versuchen, die Wurzel aus einer Zahl zu ziehen, was nicht erlaubt

In

die-

negativen

ist.

Die folgende Tabelle gibt den Rechengang für die Berechnung von Potenzen für einen Rechner mit algebraischer Logik (System Compucorp) und ein Gerät mit UPN-Logik (HP 97) wieder: Tab. 42

Berechnung der allgemeinen Potenzfunktion mit algebraischer und UPN-Logik(a

Algebraische Logik

UPN Logik

Tastenfolge

X

Tastenfolge

Eingabe a

a

Eingabe

a

X

Eingabe

a

=

a

a a

X

a a

X

a a

X

X

X

X

y

y

X

X

Y

y

ENTER Eingabe

bzw. y )

y

y

y

X

y

X

Man erkennt, daß bei beiden Logik-Systemen die Basis in das y-Register und der Exponent

in das Eingaberegister

( A n z e i g e ) gelangt. Bei der algebraischen Logik b e d e u t e t dies, daß z.B. mit der Tastenfolge

auf einfache Weise die Potenzen 3", 3 ^ , 3 ' , 3 werden können. Für einen UPN-Rechner wäre die

usw. berechnet entsprechende

Tastenfolge:

LLJLf

m

r* 11 yx

Bei der algebraischen Logik wird also nach Eingabe der

i.2.7

Die allgemeine Potenzfunktion y=a

Basis a die Potenztaste gedrückt,

bzw.

z=x

anschließend

eingegeben und zur Berechnung der Potenz a^

v

111

der Exponent

die Gleich-Taste

betätigt. Bei UPN-Geräten gibt man zunächst - durch ENTER getrennt - Basis und Exponent ein.

Anschließend wird durch

Drücken der Potenztaste die Berechnung durchgeführt. Will man die Basis a nicht in die x-te zahligem

- erheben, sondern die n-te

Potenz - bei ganz-

Wurzel z i e h e n ,

dies der Aufgabe gleich, den Ausdruck a kann man mit Hilfe der Reziproktaste tun.

zu berechnen. Dies Soll z . B . die 3.

Wurzel aus der Zahl 2 gezogen w e r d e n , so ist Tastenfolge

so kommt

dafür folgende

anzuwenden:

n Tab. 43

Berechnung des Ausdrucks y =

jAa '

am Beispiel y = UPN-Logik

Algebraische Logik Tastenfolge

Y

2

2

a

X

X

3

DZ3 =

Tastenfolge

X

m

2

Y

2

2 aX

ENTER

2

2

3

2 aX

3

3

2

1/3

2 aX

1/x

1/3

2

V

2 ax

y

VT

2

X

Die Reziproktaste nach Eingabe des Wurzelexponenten bewirkt, daß die n-te

Wurzel aus der zuerst eingegebenen Zahl errech-

net wird. Ist

der Exponent der Potenz selbst ein zusammengesetzter

Ausdruck, so muß dieser bei einem algebraischen Rechner in Klammern gesetzt werden, oder aber der Exponent muß zuerst berechnet und dann in einem Konstantenspeicher abgelegt werden.

112

8. M a t h e m a t i s c h e Funktionen

Bei der Berechnung von Potenzen .sind folgende Sonderfälle zu beachten: a° = l

0 = 0

ox = o

> 0

1° = l 1 = 1

Die f o l g e n d e n Beispiele sollen die Möglichkeiten a u f z e i g e n ,

die

bei der Anwendung der Potenziertaste gegeben sind (Beispiel 10). Tab.

44

Beispiele zur Anwendung der v a (System Compucorp)

1

Zu berechnender

Tas t e n f o 1,?e

Ergebnis

Ausdruck

35

3

(-3)5

CH S

3 o,7

(-3

3 5

a

X

a

3 a

1=

5

X

X

3

CH s

3

11

5

1.

0

CH S

243.0000

a

-243.0000

=

7

:=

X

C HS

5

X

3

a

2.1577 =

-0.004l

5

.

(_3)3,5

ERROR =

^ s (-3) ^

CH s

-

3 5

1

a

X

C HS

3 ERROR

5.2.7

Die allgemeine Potenzfunktion y=a

Fortsetzung von Tab. 44

113

B e i s p i e l e zur Anwendung ( S y s t e m Compucorp)

der Potenziertaste Zu berechnender

b z w . z=y

Ergebnis

Tastenfolge

Ausdruck

2

5

2

a

0

1.27.10 30

0

CHS

-,-300

(1,01)

1.5838

a

10000

4.91-10 -9l

m turn 1

0

0 l

1.64-10 43 0

0

EXP

l

l

2

EXP

2.71828..

n = 10 12

,do 9 8 )

0

EXP

do' 20 )

EXP

(ΙΟ* )

EXP

,(2+ln3)

1.0000

a

CHS

a

A

l

l

/

(

2

χ

, .. l

1.0000

0

8.5659

114

8. M a t h e m a t i s c h e Funktionen

Man erkennt, daß sowohl die Basis als

auch der Exponent

praktisch jede Größe annehmen können, sofern die Potenzgesetze eingehalten und keine unerlaubten mathematischen Operationen vorgenommen werden. Ferner darf das Ergebnis die Kapazität des _ GO

Rechners (10

i QQ

bis

( - 2 ) 0 ' 5 = Vr2"'

10

) nicht überschreiten. Die Ausdrücke

und 2100° = 10301

können daher auf einem

Rechner nicht direkt e r m i t t e l t werden: Bei einem Versuch würde eine Fehlermeldung erscheinen! Verfügt der Rechner nicht über eine spezielle Taste a oder y

•^

x

zur Berechnung einer P o t e n z , sind jedoch die Funkl

l

l

tionstasten [ e [ und [In vorhanden, so ist eine Bereche nung von a für positive a-Werte nach folgender Beziehung möglich: a

8.2.8

= e

x · _Ln

***^ ~ a .> ,

-

69 den Ausdruck l o g ( n ! ) zu berechnen g e s t a t t e t :

log(n! ) -

1nf

' "

In 10 l n < n · )

l n ( n ! ) = In /""( n+ 1 )

= In

In 1 /~z = ( z - -5·) In z

- z

1

N +

1

1 360 z 3

12 z

(44)

(z = n + 1)

ln(2 7

)

+

R

1

1

1260 z5

1680 z 7

Den entsprechenden Wert für n! selbst erhält man aus dem Ergebnis mit n! = I 0 1 0 g ( n ! ) Diese Gleichung kann 69 ist.

Für größere

(45)

benutzt w e r d e n , wenn n nicht größer -Werte ist

als

dann nur der Logarithmus von

n! angebbar. Insgesamt gesehen kann die obige Formel für nq£

Werte von 0 ( 0 ! = 1 ) bis

ca.

1CT

q£

c

( 107 ! a#10

qA

mit

c »# 107 )

mit einer ausgezeichneten Genauigkeit angewandt w e r d e n , wie die folgende Zusammenstellung von Rechenbeispielen zeigt. Dabei sind für

ganzzahlige n die Werte für n! aus Gl. 37 (Stir-

lingsche F o r m e l ) , Gl.

44 bzw. 45 ( U n i v e r s a l f o r m e l ) und aus der

5.2.11

Die Funktion y = n!

Definitionsgleichung n ! = 1

2

3

( -Fakultät)

...

131

gegenüberge-

stellt. Tab.48

Berechnung von n! nach verschiedenen

n

n! ( D e f in. )

Methoden

n! ( Stirling)

F %

n! ( Universal)

F %

0,03

0

1

0,9221

7,8

0,99969254873

1

1

0,9595

4,1

0,99999889987

w-1*

2

2

1,9454

2,7

1,99999993063

4-10' 6

3

6

5,8765

2,1

5,99999998302

3 ·10~ 7

6

720

711,4851

1,2

719,999999985

2 ·10~9

10

3628800

3601420,4591

0,8

3628799.99993

l.io-9

50

3,041 -10

0,2

3,04l · 10

,,

(.L

3,036-io b q

Man erkennt, daß die Abweichungen

der mit Hilfe

64

4-10

der

9q

"Univer-

salformel" ermittelten Ergebnisse nur um ganz geringe Beträge von den nach der Definitionsgleichung berechneten Werten abweichen. Dies gilt auch für gebrochene

- W e r t e , wenn man diese

mit nach G1.42 berechneten Werten vergleicht.

Der Ausdruck

(

k

)

= n über k

Eng verwandt mit dem Begriff

der Fakultät ist

der Ausdruck

( " ) , gesprochen "n über k". Es gilt

< k) =

(46) k! (n - k ) !

132

8. Mathematische

Funktionen

Für die Berechnung von "n über k" gelten folgende

n = k

n < k

=

Regeln:

l

= 0

n > k

) = l

Ist

n größer als

69, so führt die direkte Berechnung von ( . )

nach Gl. 46 zu einer Fehlermeldung, da bereits beim Berechnen von n! im Zähler des Ausdrucks die schritten wird. Es gibt aber F ä l l e , 69 ist,

Kapazität des Geräts überin denen n zwar größer

als

der Ausdruck (, ) selbst aber die Kapazität von 10 K.

noch nicht überschreitet. In diesem Fall muß ( ,

) auf andere

Weise errechnet werden. Nach einer entsprechenden Umformung von Gl.

46 erhält man:

LABEL 2

X

STO 3

RCL χ 3 STO + 1 1

f

J

J

Γχ

1 j: = j + l

f

j *

STO + 4

1 (Z^M.·d f j ) /Z f j = ~ J Ausgabe

χ

163

164

12. Mittelwerte

In den Schritten l bis 5 erfolgt die Löschung der Speicher 2 , 3 und 4. Die fortlaufende

Nummer

der Klasse, für

l,

die die

Werte XM und f eingegeben werden sollen, wird in den Schritten 7 bis

9 gebildet und als

Kennzahl bei

Befehl ( S c h r i t t 10) angezeigt.

dem nachfolgenden STOP-

Nach Eingabe der Klassenmitte

der j-ten Klasse und anschließendem START erfolgt ein Sprung nach LABEL l , u n d der eingegebene W e r t wird im Speicher 3 abgelegt. Beim nächsten STOP-Befehl ( i n der Anzeige erscheint der eingegebene Wert x^ ) erfolgt die Eingabe der

Häufigkeit

f i in der j-ten Klasse. J Nach erneutem START wird zunächst im Schritt 16 der eingegebene f .-Wert zu dem bisherigen Inhalt U von Speicher 2 addiert.In den Schritten l? und 18 erfolgt dann die Bildung des Produkts halt des Speichers

· f . und seine Addition zu dem In-

1. Schließlich wird in den Schritten 19 und

20 die Klassennummer j um l erhöht. Anschließend erfolgt

ein

Rücksprung zum LABEL 0. Wird nach Eingabe aller Daten nach dem STOP-Befehl bei

Schritt 10 einfach

ein Wert eingegeben w u r d e , dann ist

"START" gedrückt, ohne daß die Bedingung für den

Sprung nach LABEL l in Schritt 11 nicht erfüllt, gramm wird bei

LABEL 2 mit

(Schritte 23 bis

25)

und das Pro-

der Berechnung und Anzeige von

~x

fortgeführt.

Beispiel 3 In einem Laborversuch wurde von 2000 roten Blutkörperchen der Durchmesser bestimmt. Die Werte lagen zwischen 5,6 und 9,2 /um. Der Datenvorrat wurde in 10 Klassen e i n g e t e i l t , wobei folgende Häufigkeiten resultierten: Klassennummer

j

X

M. J (*im)

1

5,6

2

6,0

3 4

6,4 6,8

5

7,2

f . J

Klassennummer

j

*M. J

f . J

(/um)

5 78 144 479 542

6

7 8 9 10

7,6 8,0 8,4 8,8 9,2

358 279 99 15 1

12.1.2

Arithm. Mittel aus klassierten Werten

165

Progratnmablauf (System Compucorp 3 2 6 ) : a)

Programm eintippen bzw. einlesen (Band o.

b)

|JUMP][START] [START]

c)

Kassette)

Anzeige

7 Γ

Eingabe x_

Eingabe f

5.6000 j

.6000

/

5.0000

7

/a. Eingabe

Eingabe

/

/

6.0000 /

[_

6.0000 /

/

78.0000 /

7

/10.

/

Eingabe x_

9.2000

10

9.2000

/

166

12. Mittelwerte

Eingabe f

1.0000

10

/ll.

7.2500 /

Ausgabe |RCL| | 2 |

= Ausgabe n

2000.0000

/

Durch Abrufen des Speichers 2 nach Ausgabe des Mittelwertes wird der Wert n als

die Summe der eingegebenen f .-Werte in die J eine zusätzliche Kontrolle der

Anzeige gebracht. Dadurch ist Rechnung möglich.

12.1.3

Spezielle Methoden zur Berechnung von

Oftmals unterscheiden sich bei der Ermittlung des arithmetischen Mittels die Einzelwerte nur in den l e t z t e n Stellen. Beispiel: Eichung einer Analysenwaage (Beispiel 4) Auf einer Analysenwaage wird ein 50g ~ Gewicht a u f g e l e g t , und es werden 8 wiederholte Ablesungen gemacht. Es ist

das arith-

metische Mittel der 8 Einzelwerte zu berechnen.

Nr.

x± ( g )

Nr.

x± ( g )

1

49,96898

2

49,96909

5 6

3 k

49,96909

49,96905 49,96912 49,96898 .49,96904

49,96908

7 8

Bei der Berechnung von

müßten für

ersten S t e i l e n 4 9 , 9 6 . . .

jeweils erneut eingegeben werden,

wenn man die

alle 8 Einzelwerte die

"direkte" Methode z.B. nach Programm 5 anwendet.

12.1.3

Spezielle Methoden zur Berechnung von

1&7

Folgende Überlegung f ü h r t hier zu einer V e r e i n f a c h u n g : Subtrahiert man von den Meßwerten x.

eine f e s t e Größe a, so

erhält man für das arithmetische M i t t e l von y. = x. - a : i i a = Mit

x

= —s x.

x

= a +

Für das o.g.

n

-2.(xi-a)=^-2.xi-

„-

n

-a

(54)

f o l g t dann nach Umformung:

i- jr y±

(55)

Beispiel wählt man zweckmäßig a = 49,96000. Es

müssen dann lediglich die Zahlenwerte 0,00898 ; 0,00909 usw. eingetastet werden. Um auch das Eingeben der führenden Nullen zu vermeiden, multipliziert man die y . - W e r t e zunächst mit

ei-

nem entsprechenden Faktor c :

c ·x = c ·a

+

— c £ y.

= c·a

+

(56)

— ^~c · y .

Nach Umformung folgt daraus:

*

=a

+

(57)

-±- IWi

Multipliziert man die

y . - W e r t e im Beispiel mit

sind lediglich die letzten 3 Z i f f e r n

c = 10 , dann

der Meßwerte

einzugeben:

898, 909, 909, 908 usw. Die entsprechende Summe wird dann durch den Faktor c - n

dividiert; zu dem Ergebnis addiert man

den Wert a und erhält den gewünschten M i t t e l w e r t x. Durch diese Berechnungsweise spart man zahlreiche Tastenschritte. Während mit der "direkten" Methode für die Eingabe jedes Meßwertes 8 Tasten (einschließlich Dezimalpunkt) gedrückt werden müssen, sind mit der v e r e i n f a c h t e n Methode nach Gleichung 57 nur 3 Z i f f e r n t a s t e n

je Meßwert zu b e t ä t i g e n . Dies

bedeutet insbesondere bei sehr langen Meßreihen eine erhebliche Zeitersparnis. Ein entsprechendes Rechenprogramm sollte so aussehen, daß man vor Eingabe der Meßwerte in der vereinfachten Form die

168

12. Mittelwerte

Größen a und c eingibt. Anschließend werden für

alle Meßwerte

die Produkte c . y . eingetippt und automatisch summiert. Die Anzahl der Einzeldaten wird m i t g e z ä h l t .

Nach Eingabe aller Ein-

zelwerte e r f o l g t dann die Berechnung von

aus a,

c, n und

^c.y. . Lohnt sich die Vereinfachung der Daten nicht (weil die W e r t e zu stark s t r e u e n ) , dann gibt man einfach für

a und

c die Werte Null bzw. Eins ein. In der Praxis kann man aber auch so vorgehen, daß man zunächst mit den "normalen" Programmen 5 oder 6 den Mittelwert c.y.

berechnet

und

aus dem Ergebnis dann "manuell"

m i t t e l t : Dividieren von c - y .

er-

durch c und anschließende Addi-

tion von a. Wegen dieser einfachen, aber ebenso

zeitsparenden

Arbeitsweise wurde auf die Angabe eines speziellen Rechenprogramms hier v e r z i c h t e t .

12.2 Geometrischer Mittelwert Zahlreichen Problemen der Naturwissenschaften liegt nicht die bereits erwähnte symmetrische Normalverteilung zugrunde, sondern die schiefe logarithmische Normalverteilung, deren Form in der folgenden Abbildung dargestellt

ist:

•D O

X

• Meflwert Abb.5

Logarithmische Normalverteilung

12.2

Geometrischer M i t t e l w e r t

169

Eine logarithmische Normalverteilung kann insbesondere in folgenden Fällen angenommen werden: 1.

Die Meßergebnisse erstrecken

sich über einen großen

Bereich von mehreren Zehnerpotenzen wie z . B . bei der Keimzahlbestimmung in Lebensmitteln oder bei der spektrochemischen Bestimmung von Metallspuren. 2.

Die Ergebnisse liegen nahe bei dem Wert Null. Bei einer

chemischen Analyse bedeutet dies, daß der "wahre" W e r t in der Nähe des Kontroll- bzw. Blindwertes l i e g t , z . B . bei Konzentrationsmessungen im Spurenbereich. Der "wahre" Wert bzw. das "richtige" Ergebnis wird hier nicht durch das arithmetische M i t t e l der Einzelwerte x . , sondern durch den arithmetischen M i t t e l w e r t der Logarithmen wiedergegeben bzw. - bei einer in der Praxis immer nur endlichen Zahl von Messungen - g e s c h ä t z t . Es gilt daher: __ log

= — ( l o g x^^ + log x 2 + ...

Man d e f i n i e r t log

+ log x f i )

(58)

weiterhin: (59)

= log XG

Dabei stellt x„ den "Durchschnittswert" aller x . - W e r t e dar, (a

d.h.

l

es repräsentiert den "wahren" W e r t / u . Formt man G1.58 nach den Logarithmengesetzen u m , so e r h ä l t

man

die

Beziehung

log x = log x^ = log (

Entlogarithmieren f ü h r t

xfi = ( X . x x

G

...

1·

2

...

x^) ,1/n

(60)

schließlich zu der Gleichung

x)1/n =

= Geometrischer M i t t e l w e r t

. , ...

x ·

(6l)

170

12. Mittelwerte

Somit gilt folgender Satz: Der geometrische Mittelwert x_ von n Einzelwerten u

ist

gleich der

- t e n Wurzel aus dem Produkt aller

n Einzelwerte x. bis l Dabei ist

n

.

zu beachten, daß keiner der Werte gleich Null sein

darf, da dann das gesamte Produkt auch gleich Null wird. Zwischem dem arithmetischen und dem geometrischen Mittel einer gegebenen Reihe von Einzelwerten besteht die Beziehung

(62) Berechnet man von einer Datenreihe fälschlicherweise den arithmetischen Mittelwert,

obwohl das geometrische Mittel we-

gen der logarithmischen Verteilung der Einzelwerte richtig wäre, so erhält man s t e t s einen zu großen Schätzwert für das "richtige" Ergebnis /u.

Berechnung des geometrischen Mittelwertes Die Berechnung von Einzelwerte ist

durch Addition der Logarithmen der

zwar prinzipiell möglich und auch richtig aber

unzweckmäßig, da auf dem Rechner noch die |log| - Taste gedrückt werden muß. Einfacher ist

das Multiplizieren der n W e r t e , wo-

bei dann aus dem Produkt die n-te Wurzel zu ziehen ist. Dabei ist

- wie erwähnt - zu beachten, daß kein Meßwert gleich Null

oder kleiner als Null ist, da dann die n-te Wurzel nicht definiert ist Lediglich

und auf dem Rechner eine Fehlermeldung erscheint.

in den Fällen, in denen die Einzelwerte sehr große

Zahlen darstellen, ist

es günstiger, das geometrische Mittel

über die Addition der Logarihmen nach G1.5Ö zu berechnen. Denkbar wäre nämlich, daß durch bestimmte extrem große Einzelwerte bereits ein so großes Teilprodukt gebildet wird, daß

12.2

Geometrischer M i t t e l w e r t

die Rechnerkapazität überschritten w i r d , obwohl das Produkt 99 aller Einzelwerte ein Ergebnis l i e f e r t , das kleiner als 10 (größter möglicher Zahlenwert auf einem Rechner mit Gleitkommadarstellung)

ist.

Programm Nr.8

Geometrischer M i t t e l w e r t

Speicherbelegung

TTx l

* '

| STO | |~T

1,2

1 STO 1

Erläuterung 1 ^ Produktspeicher

3,4

0 STO 2

i =0

5

LABEL 0

6

1

Bildung der lfd.

7 8

RCL + 2

des einzugebenden Wertes

KENNZAHL

als Kennzahl Eingabe x .

Schritt-Nr.

Befehl

Nummer

9 10

STOP

11

JUMP 2

12

LABEL 1

13

STO x 1

•TTx. ' i := x.i '77x. ' i

Ik

1

i:

15

STO + 2

16

JUMP 0

17 18

RCL 1

19

a

20

RCL 2

i =n

21

1/x

l/n

22

=

23

STOP

Ausgabe x

2k

JUMP START

Rücksprung zum START

JUMP +-= 1

LABEL 2

Bei Eingabe —> LABEL 1, sonst

—) LABEL 2

= i +1

Sprung nach LABEL 0

/Tx±

(77V1/n

171

1?2

12. Mittelwerte

Das Programm ähnelt dem zur Berechnung des arithmetischen Mittelwertes ( N r . 5 ) mit folgenden Ausnahmen: Im Speicher l werden die Meßwerte multipliziert ( i m Gegensatz zur Addition bei Programm N r . 5 ) · Dazu muß zu Beginn des

Pro-

gramms der Speicher mit dem Inhalt l belegt werden. Wäre der Inhalt wie beim Programm Nr.5 gleich Null, dann würde sich bei der Multiplikation immer wieder Null ergeben,

so daß die

Bil-

dung des Produkts der x . - W e r t e nicht möglich wäre. Die Schritte 17-22 umfassen die Berechnung der zel aus dem gebildeten Produkt. Dieser Programmteil

-ten Wurentspricht

damit der Division der Summe durch die Anzahl der Meßwerte

bei

der Berechnung des arithmetischen M i t t e l s .

Beispiel 5 Gegeben seien 10 Milchproben, von denen die Keimzahlen zu bestimmen sind:

.l, =

5095

x2 = 26870

/- = 60910

D

x

=

2570

x3 =

290

xg =

39^0

x,

200

x

=

2130

XIQ=

8260

=

x5 = 4750

Eingabe- und Ausgabeschema sind wie bei

der Berechnung des

arithmetischen Mittels nach Programm N r . 5 i deshalb wurde hier auf eine gesonderte Angabe verzichtet (siehe dazu S . l 6 l ) . Für den geometrischen

Mittelwert erhält man x„ = 3737,62. Das u arithmetische Mittel lautet 11507,5 5 würde also einen viel zu

hohen Schätzwert

für

den "Durchschnittswert" /u wiedergeben.

Das Produkt der 10 Einzelwerte ist

gleich 5 , 3 2 · 1

. Wäre eine

größere Zahl von Meßwerten gegeben, so könnte man sich vors t e l l e n , daß die Rechnerkapazität von 1099 überschritten würde, obwohl das geometrische M i t t e l den o.g.

W e r t hat.

In

diesem Fall könnte es daher vorteilhafter sein, die Berechnung über die Addition der Logarithmen vorzunehmen. Aus dem mittle-

12.3 ren Logarithmus log

, = 10los G

kann

Ca

Harmonischer M i t t e l w e r t

173

dann über die Beziehung

x

(63)

ermittelt werden.

12.3 Harmonischer Mittelwert Wenn die

Beobachtungen das, was wir mit dem Durchschnitt

ausdrücken wollen, in reziproker Form angeben, also z.B. km/h oder Teilchen/cm

oder g/ml u . a . , dann wird das harmonische

Mittel angewendet. Definition

Das harmonische M i t t e l von n Daten bis

ist

1'

gleich dem Kehrwert des arith-

metischen Mittels aller reziproken W e r t e .

1 X

l

+

1 X

+ ... +

l

2

Das "klassische" Beispiel für die Anwendung des harmonischen Mittels ist

die Berechnung einer m i t t l e r e n Geschwindigkeit aus

einzelnen Teilgeschwindigkeiten. Zur Berechnung kann das Programm N r . 5 ( A r i t h m e t i s c h e r M i t t e l w e r t ) verwendet werden. Es muß dann lediglich zwischen dem LABEL l ( S c h r i t t 13) und dem Befehl STO + l ( S c h r i t t 14) der Befehl

1/x eingefügt werden. Dies kann mit H i l f e der Taste

INSERT geschehen (siehe dazu Abschn. 7·

S.101). Das Ergebnis

stellt dann den Kehrwert des harmonischen M i t t e l s dar.

Durch

anschließendes Drücken der Taste 1/x erhält man dann den W e r t für

Xjj. Der Harmonische Mittelwert hat die E i g e n s c h a f t ,

daß auch

Einzelwerte mit in die Rechnung einbezogen werden können, die selbst den Wert "Unendlich" besitzen. Der Kehrwert 1/x geht

174

12. Mittelwerte

ja bekanntlich für ist

gegen Unendlich gegen Null. Dieser Fall

von Bedeutung, wenn die Zeit die Meßgröße ist.

Soll z . B .

die IJberlebenszeit einer bestimmten Tierart nach Verabreichung eines toxischen S t o f f e s getestet w e r d e n , dann kann es vorkommen, daß einige Tiere überleben, während bei anderen nach einigen Stunden der Tod eintritt. Bildet man j e t z t das harmonische Mittel der Überlebensdauer, dann ist

für diejenigen

Tiere, bei denen die Gifteinwirkung nicht zum Tod führt

für

die Zeit der Wert Unendlich einzusetzen. W e i t e r e s hierzu findet man in dem Buch "Biometrie" von Cavalli-Sforza

Beispiel

( l ).

6

Ein Schnellzug f ä h r t von A nach B. Er hält unterwegs noch dreimal an,

so daß die gesamte Strecke in k Teilstrecken zer-

fällt: I.Halt

2.Halt

3.Halt

A

B

Auf den einzelnen Teil-Abschnitten f ä h r t der Zug mit folgenden Geschwindigkeiten: 1. Abschnitt :

80 km/h

2.

"

:

100 km/h

3-

"

:

80 km/h

4.

"

:

l60 km/h

Die Länge der gesamten Strecke b e t r ä g t 4OO km, die

der einzel-

nen Teilabschnitte

jeweils 100 km.

Frage: Welches ist

die Durchschnittsgeschwindigkeit des Zuges?

Wenn das Ergebnis eine durchschnittliche Geschwindigkeit darstellen soll, dann muß sich bei Einhalten dieser Geschwindigkeit auf der gesamten Strecke die gleiche Reisezeit ergeben als wenn der Zug mit den 4 Teilgeschwindigkeiten f ä h r t .

12.4

Der Zentralwert ( M e d i a n )

175

Durch Einsetzen der Teilgeschwindigkeiten in G1.64 erhält man:

4 100

+

— ~50~

= 9 6 , 9 7 km/h

+

Bei Einhalten der Durchschnittsgeschwindigkeit auf der Gesamt strecke von 400 km benötigt der Zug eine Reisezeit von k Stun den 7 Minuten und 30 Sekunden. Die gleiche Zeit erhält m a n , wenn man die Reisezeiten für die k Teilabschnitte addiert: 100 km Strecke mit

80 km/h

=

l h 15 min

100 km

"

mit

10O "

=

l h

100 km

"

mit

80

"

=

l h 15 min

100 km

"

mit 160

"

=

0 h 37 min 30 sec

=

4 h

400 km

0 min

7 min 30

sec

12.4 Der Zentralwert (Mediän) 12.4.1

Definition

Bei gewissen Fragestellungen

- besonders aus dem Bereich

der Biologie - spielt der Zentralwert oder Mediän eine wesentliche Rolle. Definition

Aus einer Reihe von n Einzelwerten x . bis l n ist der Zentralwert oder Median x derjenige W e r t , welcher die der Größe nach geordneten Einzelwerte mengenmäßig in zwei gleich große Anteile zerlegt.

Ist

die Anzahl n der Meßwerte ungerade, dann ist

der Mediän

der (n + l ) / 2 - te Wert der geordneten Reihe der E i n z e l w e r t e .

176

12. Mittelwerte

Bei einer geraden Anzahl von W e r t e n ist

der Mediän als das

arithmetische Mittel aus den m i t t l e r e n Meßwerten der geordneten Datenreihe d e f i n i e r t . In der Literatur wird der Zentralwert *x

meist mit dem Symbol

bezeichnet.

n

ungerade

n

gerade :

V

(65)

.

n+1

C

1/2

(66)

(n/2) + l

Beispiele: Gegeben sind die geordneten Meßwerte zweier Meßreihen mit einer ungeraden bzw. geraden Anzahl von Einzelwerten.

n

ungerade :

1

3

9

9

12

19

23

29

35

4l

43

Nr.

1

2

3

4

5

_i

7

8

9

10

11

*

n + 1 2

Wert

lfd. ~

n

gerade

g

X

X

19

6

:

Wert

2

5

7

10

17

29

30

33

4l

43

l f d . Nr.

1

2

3

4

5

6

7

8

9

10

n = 10

n 2~

=

5

n + 1 2

= 6

(X 5

+ x 6 ) = 23

Berechnung des Medianwertes Die Berechnung des Medianwertes aus einer Reihe von n ungeordneten Meßwerten z e r f ä l l t in 2 T e i l s c h r i t t e : a)

Ordnen der W e r t e nach aufsteigender Größe

b)

Ermittlung von

*x nach G1.65 oder G1.66

12.4

Der Zentralwert

(Median)

177

Für das Sortieren der Einzelwerte benötigt man einen Rechner mit indirekter Adressierung.

Jeder Einzelwert benötigt

nen Speicherplatz. Da zusätzlich k Speicher für

die

ei-

Durchfüh-

rung des Sortierprogramms erforderlich sind, b e n ö t i g t man n + k

Speicher,

um n vorhandene Einzelwerte der Größe nach zu ordnen. Bei

ei-

nem Rechner mit n vorhandenen, auch indirekt a d r e s s i e r b a r e n , Konstantenspeichern können somit n - k Werte s o r t i e r t werden. Als Beispiel sei das System Compucorp 327 genannt, das über insgesamt 44 Konstantenspeicher v e r f ü g t ,

so daß 40 Zahlen der

Größe nach geordnet werden können.

12.4.2

Sortieren von Daten

Als Rechnermodell wird das System Compucorp 327 zugrunde g e l e g t , das über 44 Konstantenspeicher 00, 01 ... bis 43 verfügt. 1. Schritt: Zunächst werden die D a t e n x. bis mit H i l f e l n der indirekten Adressierung in die Speicher l bis n gebracht, wobei die Einzelwerte in der R e i h e n f o l g e eingegeben w e r d e n ,

in

der sie anfallen, also u n s o r t i e r t . Benutzt man den Speicher 00 als

Indexregister, so könnte das Eingabeprogramm so aussehen: Programm N r . 9

Eingabe von n Einzelwerten in Speicher 01 bis

die

n mit H i l f e der

indirekten Adressierung ( S y s t e m Compucorp 327 S c i e n t i s t ) Speicherbelegung

Indexregister X

X

l

2

n

178

12. Mittelwerte Schritt-Nr.

Erläuterung

Befehl

1

1

^Speicheradresse i

2

STO 00

Jwird gleich 1 gesetzt.

3 k

RCL 00

"[Anzeige von i. = Speicher-

KENNZAHL

Jadresse = l f d . Nummer

5 6 7 8 9 10

LABEL 1

STOP

Eingabe x .

STO IND 00 1

STO + 00 JUMP 1

.

> Speicher

i

li: = i + 1 J

Rücksprung nach LABEL 1

2 . S c h r i t t : Der nächste Schritt besteht darin, die Daten in den Konstantenspeichern so umzuordnen, daß nach dem Sortieren im Speicher 01 der kleinste und im Speicher mit der Adresse n (maximal 40) der größte Wert steht. Der Medianwert ist

dann bei ungeradem n der x-Wert im Speicher mit der

Adresse (n + l ) / 2 . Liegt eine gerade Anzahl von Meßwerten vor, dann ergibt sich der Mediän als das arithmetische

Mittel aus

den Inhalten der Speicher mit den Adressen ( n / 2 ) und ( n / 2 ) + l . Beim Sortieren der Daten geht man im einzelnen so vor: Zunächst wird von allen n Daten der kleinste Wert ermittelt und in den Speicher 01 gebracht. Der ursprünglich im Speicher 01 abgelegte Wert gelangt andererseits in den Speicher, in dem der kleinste Meßwert vorher stand. Die Inhalte des Konstantenspeichers, in dem der kleinste Meßwert steht und des Speichers 01 werden also ausgetauscht.

Anschließend prüft

m a n , welcher

x-Wert in den Speichern 02 bis n der kleinste ist.

Man tauscht

die entsprechenden Speicherinhalte wieder aus, so daß jetzt im Speicher 02 der zweitkleinste Meßwert steht. Der drittkleinste Wert wird dann in den Speichern 03 bis n gesucht usw. Zum Schluß vergleicht man den Speicher n-l mit dem Speicher n. Die zunächst unsortiert vorliegenden Meßwerte befinden sich dann geordnet in den Konstantenspeichern 01 bis

n.

12.k.2

Sortieren von Daten

179

Die Ermittlung des kleinsten W e r t e s bei dem Sortiervorgang geschieht so,

daß die

Inhalte der Speicher 01, 0 2 , 03 usw. mit

den Inhalten der jeweiligen restlichen Speicher verglichen werden. Interessiert z.B. der kleinste W e r t der Speicher 01 bis

n,

so vergleicht man den Inhalt des Speichers 01 mit sämtlichen restlichen Speichern 02 bis n. Bei diesem V e r g l e i c h der Speicher mit

den Adressen k = 2 bis

k = n mit

dem Speicher 01 sind

2 Fälle möglich:

a)

x,

< x.

:

Die Inhalte der Speicher 01 und k werden ausgetauscht.

b)

x

^ x

:

Die Inhalte der Speicher 01 und k bleiben unverändert.

Der erste Vergleich f i n d e t also zwischen den Speichern 02 (k = 2) und dem Speicher 01 s t a t t . Je nachdem, ob die gung a) oder b) z u t r i f f t , tauscht

werden die Speicherinhalte

Bedinausge-

oder bleiben unverändert. Der - im Fall a) veränderte

- Inhalt des Speichers 01 wird j e t z t mit dem Inhalt von Speicher 03 (k = 3) verglichen. Je n a c h d e m , ob Fall a) oder b) eingetreten ist,

werden die Inhalte von Speicher Öl und 03

ausgetauscht oder bleiben unverändert. bis

Man v e r f ä h r t so w e i t e r ,

zum Schluß der Speicher 01 mit dem Speicher n verglichen

wird. Will man den kleinsten Wert der Speicher 02 bis

n ermit-

teln, dann muß entsprechend Speicher 02 mit den Inhalten der Konstantenspeicher 03 bis

n verglichen werden u s w . .

Beispiel 7 In den Speichern 01 bis

05 seien die folgenden W e r t e a b g e l e g t ,

die der Größe nach sortiert werden sollen: X1 = 12, x 2 = 5 , x

= 3 8 , x^ = 14

und x

= 9.

Die Daten sind so zu ordnen, daß der kleinste

Wert x

= 5 im

18ο

12. Mittelwerte

Speicher 01 und der gr Tab.5 l

te Wert χ

= 38 im Speicher 05 steht.

Zu vergleichende Konstantenspeicher und Speicherinhalte

beim Sortieren von Daten

Spe icherbelegung vor dem Sortieren:

Speicherbelegung Vergleich

Entscheid

RCL 02 < RCL 01 ? 5 < 12

?

RCL 03 < RCL 01 ?

38 < 5

?

nach Entscheid

RCL RCL RCL RCL RCL

01 02 03 04 05

= 12 = 5 = 38 = 14 = 9

RCL RCL RCL RCL RCL

01 02 03 04 05

= 5 = 12 = 38 = 14 = 9

RCL RCL RCL RCL RCL

01 02 03 04 05

= 5 = 12 = 38 = 14 = 9

RCL RCL RCL RCL RCL

01 02 03 04 05

= 5 = 12 = 38 = 14 = 9

• •

•

NEIN

φ

• •

NEIN

?

RCL 04 < RCL 02 ? 14 < 12

NEIN

?

RCL 03 < RCL 02 ? 38 < 12

NEIN

?

RCL 05 < RCL 01 ?

9 < 5

RCL 01 Φ RCL 02

?

RCL 04 < RCL 01 ?

14 < 5

JA

vor Entscheid

• • • •

· · · *

•

·

• • •

· · ·

NEIN

12.4.2

Sortieren von Daten

18l

Fortsetzung von Tab.51 Zu vergleichende Konstantenspeicher und Speicherinhalte beim Sortieren von Daten Speicherbelegung Entscheid

Vergleich

RCL 05 < RCL 02 ? 9 < 12

?

JA RCL 02

t RCL 05

RCL 04 < RCL 03 ? 14 < 38

?

JA RCL 03 RCL 04

RCL 05 < RCL 03 ? 12 < 14

?

JA RCL 03 RCL 05

RCL 05 < RCL 04 ?

14 < 38 ?

JA RCL 04 RCL 05

vor Entscheid

nach Entscheid

RCL RCL RCL RCL RCL

01 02 03 04 05

= 5 = 12 = 38 = 14 = 9

RCL RCL RCL RCL RCL

01 02 03 04 05

= 5 = 9 = 38 = 14 = 12

RCL RCL RCL RCL RCL

01 02 03 04 05

= 5 = 9 = 38 = 14 = 12

RCL RCL RCL RCL RCL

01 02 03 04 05

= 5 = 9 = 14 = 38 = 12

RCL RCL RCL RCL RCL

01 02 03 04 05

= 5 = 9 = 14 = 38 = 12

RCL RCL RCL RCL RCL

01 02 03 04 05

= 5 = 9 = 12 = 38 = \k

RCL RCL RCL RCL RCL

01 O2 03 04 05

= 5 = 9 = 12 = 38 = 14

RCL RCL RCL RCL RCL

01 02 03 04 05

= 5 = 9 = 12 = 14 = 38

Bei dem angegebenen S o r t i e r - V e r f a h r e n sind insgesamt

— (n-l)

Vergleiche der Inhalte von Konstantenspeichern d u r c h z u f ü h r e n . In einem entsprechenden Sortier-Programm nimmt somit die Zahl der entsprechenden Programmschleifen mit s t e i g e n d e m n stark zu, was g l e i c h z e i t i g eine steigende

Rechenzeit bedeutet.

Für die Anwendung des folgenden Sortier-Programms ist V o r aussetzung,

daß die zu ordnenden n Einzelwerte b e r e i t s in den

Speichern Öl bis n abgelegt sind ( z . B . mit H i l f e von Programm N r . 9 ) . Die Daten sind also zunächst

"ungeordnet" g e s p e i c h e r t .

182

12. Mittelwerte Programm Nr.10

Sortieren von n Einzelwerten und Ermittlung des Zentralwertes

x*

Speicherbelegung: System Compucorp 32?

Schritt-Nr. 1

1 STO 4l

3 4

(LABEL 2

5 6

RCL + 4l STO 42 (LABEL 3 | RCL IND 4l RCL - IND 42 JUMP -= 4

7 8 9 10 11

12 13

14 15 16 17 18 19

1

20

STO + 42 RCL 42 RCL - 00 JUMP -= 3 1

21

STO + 4l

K

=

Indexregister

K = I + 1

Wenn

x_ ^ xv . dann 1 Λ

Sprung nach LABEL 4, sonst weiter mit Schritt 11

RCL IND 4l EXCH IND 42 STO IND 4l

LABEL 4 1

i

=

Erl uterung

Befehl

2

=

Austausch der Inhalte der Speicher I und K ( I , K = Adresse) η

K: = K + 1 =

Wenn K ·ζ· n , dann Sprung nach LABEL 3, sonst —» S c h r i t t 20

I: = 1 + 1

12.4.2

Sortieren von Daten

183

Fortsetzung von Programm Nr.10 Sortieren von n Einzelwerten und Ermittlung des Zentralwertes

'x

Schritt-Nr.

Befehl

Erläuterung

22

RCL 4l

Wenn I < n, dann Sprung

23 24

RCL - 00

nach LABEL 2 ,

JUMP

sonst

25 26 27

— 2

1

» Schritt 25

Indexregister = 1 = i

STO 43 | LABEL 5 |

28

RCL IND 43

Abrufen des Speichers

29 30

PRINT 1

und Ausdrucken

3l 32

STO + 43

33 34 35 36

1 i:

i

= i +1

RCL 43

Wenn i^ n, dann zurück

RCL - 00

nach LABEL 5 , sonst zu

JUMP -= 5 | LABE L 6

Schritt 35 (LABEL 6)

RCL 00

Prüfung,

37 38

: 2= FRACTION

Wenn n geradzahlig

39 40

JUMP = 7

Sprung nach LABEL 7

4l 42

RCL + 00

ob n gerade oder

ungerade. ist,

1

Bildung von

: 2 = STO 4l

— 2

43 44

RCL IND 4l

Abruf

45 * «^ 46

PRINT DOT LINE PRINT

Ausdruck

47 48

STOP

Ende (Programm hält an)

des f~*t

| LABE L 7

49 50

RCL 00

Bildung von

: 2=

5l

STO 41

n 2

Speichers

=

— ^

.

184

12. Mittelwerte Fortsetzung von Programm Nr.10 Sortieren von n Einzeldaten und Ermittlung des Zentralwertes

Schritt-Nr.

Befehl

52

RCL IND 4l

53

STO 42

54 55

1

x" Erläuterung (/ /t r\2 )\ ~~ ^-* ^~^7

1 \J

&

+

STO + 4l

2~

56 57 58 59 6

RCL IND 4l

X

6l

PRINT

Ausdruck von

62

STOP

Ende (Programm hält an)

(n/2)+l U + V

STO + 42 RCL 42

jx"

= V

= |- (U + V)

: 2 =

PRINT DOT LINE x

Programmablauf: a) Eingabe der ungeordneten n Einzelwerte in die Speicher Öl bis

n mit Programm 9

b) Eintippen bzw. Einlesen von Programm 10 c) Eingabe von n in den Speicher 00 d ) START e) Nachdem die Daten sortiert sind, werden diese in der geordneten Reihenfolge

ausgedruckt.

f ) Anschließend wird eine Punktreihe

gedruckt und

danach der Medianwert ausgegeben. Für das Beispiel von Tab.51 würde der Ausdruck so aussehen: 5 9

12 14 38

""i'z"" = T

12.4.2 Das folgende Fließdiagramm

Sortieren von D a t e n

185

verdeutlicht noch einmal den prin-

zipiellen Ablauf beim Sortieren der W e r t e und der anschliessenden E r m i t t l u n g des Medians:

Abb. 6

Fließdiagramm zu Programm Nr. 10 "Sortieren von n E i n z e l d a t e n und Ermittlung des Z e n t r a l w e r t e s

I Label 5 I Ausdruck der Speicher 1 bis n

Median

7=x^ JAln^gerade)

( n ungerade)"*^' * ,/' v

—i

1 FNDF U-

^

Bei Anwendung des Programms ergeben sich in A b h ä n g i g k e i t von n für

das System Compucorp 32? S c i e n t i s t f o l g e n d e R e c h e n -

zeiten:

10 Rechenzeit ( s e c )

17

20

258

186

12. Mittelwerte

12.4.3 Ist

Eigenschaften und Anwendungen des Medians die Verteilung der Meßwerte symmetrisch bezogen auf

den "wahren" Wert /a der Grundgesamtheit, dann f ä l l t der arithmetische Mittelwert mit dem Medianwert zusammen (theoretisch allerdings nur bei unendlich vielen Meßwerten). Da andererseits der Mediän - im Gegensatz zum arithmetischen Mittelwert ~ ist, als

- unempfindlich gegen abseits liegende Meßwerte

kann man den Mediän bei Serien geringen Umfangs ( n < 1 0 ) eine gute Schätzung für den Wert /u verwenden. Eine Anwen-

dung ist

z.B. in der chemischen Analytik bei Verfahren wie der

EmissionsSpektralanalyse bzw. InfrarotSpektroskopje

gegeben.

Besonders in der Toxikologie und Pharmakologie sind die Begriffe

der "mittleren tödlichen Dosis" bzw. der "mittleren

wirksamen Dosis" von Bedeutung. Bei der Behandlung von pflanzlichen oder tierischen O b j e k t e n mit entsprechenden Präparaten interessiert z . B . , bei welcher Dosis genau 50 % der untersuchten Individuen die gewünschte Wirkung zeigen. Sterben etwa bei einem Versuch 50% der behandelten T i e r e , dann bezeichnet man die zugehörige Dosis des Präparats als Letale Dosis 5° oder abgekürzt LP 50. Sie ist

gleich dem Median x

der "tödlichen

Dosiswerte", die bei der Aufnahme einer Dosis-Wirkungs-Kurve zwischen 0% und 100% Sterblichkeit

untersucht werden.

Nähere Ausführungen zu dieser Problematik (Probitanalyse) findet man bei L.Cavalli-Sforza "Biometrie" ( l

).

13. Streuungsmaße

13.1 Allgemeines Die im vorigen Abschnitt behandelten Durchschnittswerte sind ein

Maß für

die

Lage des

"wahren" Wertes /(JL der Grundge-

samtheit. Aus der Angabe eines M i t t e l w e r t e s ist

aber noch kei-

ne Aussage über die Streuung der Einzelwerte m ö g l i c h . Mittelwerte sagen noch nichts über die Güte eines Meßverfahrens a u s , wie das folgende Beispiel z e i g t : Meßreihe a X

l = _ 2

X

Meßreihe b

60 80 i4o

99,99 100,02 99,98 X 3 = , *k = X l = x_ = 2

3 = 120 k =

x

X

5 = X 6 = X

=

50

•V

—

100,01

5 100,00 X 6 =

150

~x = 100 ,00

100,00

In beiden Fällen erhält man den gleichen a r i t h m e t i s c h e n M i t t e l wert 3c = 100,00. lich größer als

Im Fall a) im Fall b),

werte vom Mittelwert Zur Beurteilung ein Maß für

sind aber die

Streuungen wesent-

d.h. die Abweichungen der Einzel-

sind erheblich

größer als

im Fall b).

der "Qualität" des Meßverfahrens ist

somit auch

die Streuung n o t w e n d i g , da der M i t t e l w e r t alleine

noch nicht aussagekräftig ist:

Der M i t t e l w e r t ist

bei starker

Streuung der Einzelwerte wesentlich unsicherer als bei geringer Abweichung der einzelnen W e r t e vom M i t t e l w e r t !

188

13.

Streuungsmaße

13.2 Die Spannweite

Die Spannweite R einer Meßreihe von n Einzeldaten ist Differenz

zwischen dem kleinsten (x

die

. ) und größten (x ) min max

Wert.

Spannweite R = x

max

- x

. min

(67)

Prinzipiell kann zur Berechnung von R das Programm Nr.10 "Sortieren von Meßwerten und Ermittlung des Z e n t r a l w e r t e s " verwendet werden. Durch Abrufen der Speicher mit den Adressen 01 und n können nach dem Ordnen der W e r t e x

. und x ermittelt min max werden. Die nach G1.67 berechnete D i f f e r e n z ist dann die Spannweite R. Da bei

n vorhandenen Datenspeichern im Rechner aber nur

n - 4 E i n z e l w e r t e sortiert werden können, ist

somit bei den

meisten G e r ä t e n nur eine sehr eng begrenzte Zahl von Daten zu verarbeiten. Um aus einer beliebigen

Anzahl von Meßwerten die

Spannweite bzw. x . und x zu e r m i t t e l n , wählt man ein anmin max deres P r i n z i p , das es g e s t a t t e t , mit H i l f e von nur 6 Speichern die Rechnung durchzuführen: Zunächst werden 2 Konstantenspeicher mit den W e r t e n 98 = 0 und x . = 1 0 b e l e g t . Wir wollen annehmen, daß der max min Speicher l für x . und der Speicher 2 für x reserviert ist. min max x

Für jeden eingegebenen Meßwert wird nun ein Vergleich mit den Inhalten der Speicher l und 2 durchgeführt. kleiner als als Ist

der Inhalt von Speicher

l,

Ist

der Meßwert

dann wird dieser Wert

neuer "x . -Wert" d e f i n i e r t und in den Speicher l gebracht, min der Meßwert dagegen größer als der Inhalt von Speicher 2,

dann wird er als

neuer "x -Wert" definiert und in den Konmax stantenspeicher 2 geschrieben. T r i f f t die dritte Möglichkeit zu - liegt nämlich der Meßwert zwischen den bisherigen "xmin"-

13.2

Die Spannweite

189

und "x

"-Werten - dann bleiben die Inhalte der Speicher l max und 2 unverändert. In diesem Fall s t e l l e n die Speicherinhalte nämlich bereits den kleinsten bzw. größten Wert der überprüften Daten dar. D i e Belegung d e r Speicher m i t d e n "Startwerten" = 0 max 98 und . =1O hat folgende Bedeutung: Beim Beginn des Programms, d . h . vor der Eingabe der D a t e n , sind ja naturgemäß die Speicher l und 2 noch n i c h t mit Meßwerten b e l e g t . Die Inhalte könnten theoretisch beliebig gewählt werden. Damit aber einer der Meßwerte als möglicher "x . "- bzw. "x "-Wert erkannt min max wird, muß er in jedem Fall größer als der Inhalt von Speicher 2 (reserviert für x ) oder kleiner als der Inhalt von Speimax eher l ( r e s e r v i e r t für x . ) sein. Würde man nämlich z . B . den min Speicher l mit dem Wert x = 10 b e l e g e n , und wären die Meßwerte aber al^Le größer als

10, dann würde der Fall

x < Speicher l

nie

e i n t r e t e n , und aus dem Datenvorrat könnte x . nie ermitmin telt werden. Entsprechendes gilt für den größten Meßwert. Aus

diesem Grund erfolgt die Wahl der o . g . "Startwerte". Programm Nr.11

Spannweite und kleinster und größter W e r t einer Meßreihe

Spe icherbelegung:

= x l. Schritt-Nr.

Befehl

Erläuterung -

Startwert für x = 0 max

1

0

2

STO 2

3 4

EXP 98

5 6

LABEL 1

7 8

RCL + 0

KENNZIFFER

Kennzahl i

9

STOP

E ingabe x .

Startwert für x . = 1098 min

STO 1 1

-

lfd.

Nummer

Meßwertes

des

als

190

13. Streuungsma e

Schritt-Nr.

Nachdem

Befehl

Erl uterung

10

STO 3

11

RCL - 1

Wenn χ . 5'10

209

%l

Bei der Erstellung eines entsprechenden Rechenprogramms muß beachtet werden, daß die Konstanten r und a i bis a p vor Programmlauf abgespeichert werden müssen. Besitzt man einen Rechner, der über einen Magnetkartenleser oder eine Bandstation v e r f ü g t ,

dann werden die Konstanten einmal in den ent-

sprechenden Konstantenspeichern abgelegt und auf Band oder Magnetkarte "geschrieben", von wo sie

dann bei Bedarf abgeru-

fen werden können. Hierzu sind die speziellen Anleitungen der Rechner heranzuziehen. Für die sei

Systeme Compucorp 326 und 327

das Prinzip des "Schreibens" auf Magnetband und des

"Lesens" von Band kurz beschrieben: Die Bandkassetten sind in "Segmente" a u f g e t e i l t , von denen jedes 14 Datensätze oder 14 Programme aufnehmen kann. Der Umfang der Datensätze bzw. Programme entspricht dabei der Zahl der auf dem Rechner zur Verfügung stehenden Konstantenspeicher bzw.

Programmspeicherplätze ( 1 2 Konstanten oder 160 Programm-

schritte beim System Compucorp 326 bzw. 44 Konstanten oder 4l6 Programmschritte beim System Compucorp 3 2 7 ) . Zum Schreiben von Konstanten auf Band dient der Befehl n WRITE ON TAPE m. Dabei ist

n die

Nummer des Datensatzes und m die

höchste Adresse des Konstantenspeichers, der auf das Band geschrieben werden soll. Bei dem System Compucorp 327 mit 44 Konstantenspeichern (Adressen 00 bis der Befehl 3 WRITE ON TAPE 5,

43) bedeutet danach z.B.

daß die

Inhalte der

Speicher 00

bis 05 auf den 3. Datensatz des S e g m e n t s , das angesteuert

ist,

geschrieben werden. Entsprechend bewirkt dann der Befehl 3 READ FROM TAPE, daß die

Inhalte der

Speicher 00 bis

05 vom

Band in die Konstantenspeicher OO bis 05 im Rechner übertragen werden. Sollen also z.B. die Konstanten r und a bis a , die in den Speichern 0 bis

5 abgelegt sind, auf den Block l ( I . D a -

tensatz) des Bandanfangs geschrieben werden, dann sind dazu folgende Befehle notwendig: r

STO

O

a

STO

3

a

STO

l

a^

STO

4

a 2 STO

2

a

STO 5

l WRITE ON TAPE 5.

210

13. Streuungsma e Programm Nr.13

Integration der Normalverteilung in den Grenzen -z und +z durch Polynomapproximation

Speicherbelegung:

Schritt-Nr.

Befehl

Erl uterung

1

1

2

KENNZAHL

KENNZAHL 1. Eingabe z

3

STOP

4

STO 6

5 6

RCL χ 0

7 8

1

9 10

1 + r z 1/x

STO 8

13 14

7Γ + = "V '

15 16

STO 7

11 12

r- z

+

l/x

17 18

RCL 6 2

19

:

t = 1/(1 +

1/Τ/27Γ"

X

e

20

2

21

=

22

CHS

23

e

X

-z 2 / 2

rz)

13.3.2

Integration der Normalverteilung

Fortsetzung von Programm Nr.13 Integration der Normalverteilung in den Grenzen -z und +z durch Polynomapproximation Schritt-Nr.

Befehl

Erl uterung

24

STO χ 7

f(z)

25

RCL 8

t

26

RCL χ 5

27

RCL + 4

28

RCL χ 8

t(a4 + a5t)

29

RCL + 3

a3 + t ( a 4 + a ? t )

30

RCL χ 8

t(a3 + tCa^ + a5t)

31

RCL + 2

a2 + t ( a 3 + t ( a 4 + a ^ ) )

32

RCL χ 8

t ( a 2 + t ( a 3 + t(a4

33

RCL + 1

ai + t

34

RCL χ 8

t(a1+t(a2+t(a3+t(a4+a5t))))

35 36

RCL χ 7

37 38

2

39 40

CHS

4l 42

1

43 44 45 46

v *4 + v

U2+

t(a3+

t(

+

a^)))

a4+

P ~

X

=

2 P - 2 P

-H

X

1 - 2 P

100

=

S* = 100 ( 1 - 2P)

STOP

Ausgabe S* ( % )

(%)

JUMP STAR! R cksprung zum START

a 5 t ) ) )

211

212

13. Streuungsmaße

Beispiel Zum Vergleich soll das auf S.207 angeführte Beispiel zum Programm N r . 1 2 (Integration durch Reihenentwicklung) durchgerechnet werden. Programmablauf: a) Belegung der Speicher 0 , 1 , 2 , 3 , 4 und 5 mit den Konstanten r , a.. , a_ ,a über Band bzw.

, a,

und a,, manuell oder

Magnetkarte

b) Einlesen des Programms

c) [JUMP|

ISTART|

[START|

Eingabe z = 2

L

2.0000

{_

95.^500

/

| START |

Ausgabe S Das Ergebnis ist

(%)

identisch mit dem, was mit Programm Nr.12

] er-

halten wurde. Die Berechnung nach Programm Nr.13 kann - im Gegensatz zu der Methode über die Reihenentwicklung - auch mit einem Rechner vorgenommen werden, der nur über eine lineare Programmiermöglichkeit v e r f ü g t ,

d.h.

dem die Möglichkeit

f e h l t , Programm-

schleifen zu durchlaufen. Ansonsten sind beide Rechenverfahren gleichwertig, wie die Gegenüberstellung in Tab.52 zeigt. In der Literatur f i n d e t man zahlreiche weitere Beispiele zur näherungsweisen

Integration der Normalverteilung. Erwähnt

seien insbesondere die

Zusammenstellungen im "Handbook of

M a t h e m a t i c a l Functions" von Abramowitz und Stegun ( 7 ) sowie im Band 2 der Reihe "Distributions in Statistics" von Johnson und Kotz ( 9 ).

Weitere Approximationen werden angegeben von

Burr ( 1 0 ) , Hart ( 1 1 ) , Raab und Green ( 1 2 ) , Gray ( 1 3 ) und Hoyt (14).

13.3.2 Tab.52

Integration der Normalverteilung

213

Vergleich der Genauigkeit bei der Integration der Normalverteilung durch

Reihenentwicklung

und Polynom-Approximation z

0,674490 1,036433 1,644854 1,959964 2,575829 3,290527 3,890592

s

(°/o)

(%)

S (°/o)

S

Theorie

Reihenentwicklg.

Polynom-Approxim.

50,00

50,000015876

50,000030213

70,00

69,999981837

69,999977951

90,00

90,000007695

90 ,000010826

95,00

95 ,000000181

99,00 99,90

98,999999122 99,900000095

95 ,000014179 98,999993240 99,899988296

99,99

99,990000004

99,989996079

Die in den Abbildungen 11 bis

14 s c h r a f f i e r t e n Flächen W

lassen sich wie folgt alle auf die Berechnung der Fläche S ( % ) zwischen

-z und +z

zurückführen ( s i e h e Abb. 10 bzw. 15): Abb. 17 Berechnung von Flächen unter der Normalverteilung W = Fläche zwischen z.

und z„

a) W = 2 [ S ( lz

(%)

(94)

Z 1 > 0 , :, 2 >o, Z j < Z

b) W =

c) W

)]

J )- s*(| z 2 |

=

: 2 + ( 2 H*0

(siehe Abbildung)

W = 50 + | S * ( z a )

b)

-*

z.

(SO

(97)

z^ 0

w = 50 - | s*(|

| ) (%)

(98)

Abb.19 Berechnung von Flächen

/i t

unter der Normalverteilung W = Fläche zwischen z a)

z.> 0

Zj
0, Z 1 < O

W = 100 - S ( z 2 )

z·,

z

(101)

(100)

13.3-2

Integration der Normalverteilung

215

Beispiel a)

Für das auf S.153 beschriebene Beispiel der Längenmessung

von in einem Produktionsprozeß hergestellten Schrauben ergab sich die

in Abb.4 auf S. 155 dargestellte Normalverteilung.

Der M i t t e l w e r t ^ ! betrug dabei 4 9 , 7 5 mm. Aus der genannten graphischen Darstellung läßt sich eine Standardabweichung von etwa 0,5 mm ablesen. Alle Schrauben, die /u um mehr als

den m i t t l e r e n Wert

2% nach oben oder unten ü b e r s c h r e i t e n , werden

als Ausschuß angesehen und aussortiert. Wie groß ist

ihr An-

teil an der Gesamtproduktion? Antwort:

2% von 4 9 , 7 5 = 0 , 9 9 5 mm .

durch die

Standardabweichung ff = 0,5 mm, dann e r g i b t sich

Dividiert man diesen W e r t

z = 1,990. Das Problem entspricht dem in A b b . 2 0 Fall. Mit z mit

= z ergibt das Programm Nr.12

f o l g t aus G1.101: W = 100 - 9 5 , 3 4 = 4 , 6 5 %· Der Ausschuß

b e t r ä g t also 4,65% der Gesamtproduktion, d . h . als

abgebildeten

S*= 9 5 , 3 4 %. So-

jede 20. Schraube ist

etwas weniger

im Sinne der oben g e m a c h t e n Annahme

f e h l e r h a f t und unbrauchbar. Dies gilt allerdings nur, der Herstellungsprozeß

solange

immer unter den gleichen Bedingungen

abläuft. Beispiel 11 b)

Ein Analysenverfahren zur Bestimmung eines Pestizide in

Lebensmitteln hat eine Standardabweichung von l 5 ^ig/kg bei einem tatsächlichen Gehalt von 50 /ag/kg ( W i e d e r f i n d u n g s v e r s u c h ) . Wie groß ist

der Anteil aller "möglichen" - der Grund-

gesamtheit des V e r f a h r e n s entsprechenden - M e ß w e r t e , die den tatsächlichen Gehalt von 50 /ug/kg um nicht mehr als

30% über-

schreiten? A n t w o r t : 3O% von 50 /ug/kg = 15 /ig/kg = 3-fache Standardabweichung (5 / u g / k g ) . Das Problem entspricht hier dem in Abb.18 dargestellten Fall. Mit z.

= 3

5

z l i e f e r t das Programm 12

S = 99,73°/o. Mit G1.97 folgt dann W = 50 + |- ( 9 9 , 7 3 ) = 9 9 , 8 7 % . 99,87% aller Werte liegen also innerhalb des g e f o r d e r t e n Ber e i c h s , u n d nur ca.

l Wert von 770 ü b e r s c h r e i t e t das Limit.

216

13. Streuungsmaße

13·5-3

Schranken der Normalverteilung

Bei den bisherigen Fragestellungen waren bestimmte Grenzen für

die Meßwerte gegeben, und zu ermitteln war die Wahr-

scheinlichkeit, Meßwerte innerhalb der gegebenen Grenzen anzutreffen. Dabei war die entsprechende Fläche unter der Normalverteilung zu berechnen. Fragt man nun umgekehrt, innerhalb welcher Grenzen die W e r t e einer Verteilung liegen, die einen b e s t i m m t e n prozentualen Anteil der Grundgesamtheit ausmachen, dann muß dazu die Gleichung für die Flächenberechnung nach z aufgelöst werden:

e" Z

z = f(S*)

=

/2

dz

(»/„)

(102)

(103)

?

Da man die Gleichung für

S

nicht explizit nach z auflösen

kann, muß eine Näherungslösung herangezogen werden. Nach Hastings ( 15 )

gilt für

den W e r t z bei

gegebener Fläche unter

der Normalverteilung zwischen -z und +z ( i n % ) :

a

= 77

z = 77

o

a

+

a

l

+ 77 (a

+ a 77) —

(105)

j +77

(106)

P

=

i - O?*/IPO)

(107)

13-3.3

Schranken der Normalverteilung

21?

Die Konstanten haben dabei die W e r t e : a Q = 2,515517

b j = 1,432788

= 0,802853

b 2 = 0,189269

= 0,010328

b

a

= 0,001308

Der nach dieser Methode berechnete _ !

z-Wert bei gegebenem S*

beträgt ca. 4 - 1 0

Löst man die Gleichungen 97 bis

101 nach S

a u f , dann

las-

sen sich auch aus den gegebenen Flächen W (= Wahrscheinlichkeiten) die entsprechenden z - W e r t e ermitteln. Bei den in den Gleichungen 94 bis

96 dargestellten Fällen ( s i e h e A b b . 1 7 )

eine Lösung nur m ö g l i c h , wenn eine der beiden Grenzen z z

vorgegeben

ist oder

ist.

Programm N r . l 4 Berechnung der Schranken z der Normalverteilung bei gegebener Fläche Speicherbelegung:

= a Q = 2,515517 = a

= 0 ,802853

= a.

= 0,01O328

= b 1 = l , 432788 = b 2 = 0,189269 = b

Einlesen der Konstanten a ,a ,a , b . ,b 2 ,b ell"

oder über Band bzw. K a s s e t t e .

= 0,001308

und l e n t w e d e r "manu

218

13· Streuungsma e Fortsetzung Programm N r . l 4 Berechnung der Schranken z der Normalverteilung Schritt-Nr.

bei gegebener Fl che

Befehl

Erl uterung

1

1

2

KENNZAHL

KENNZAHL 1.

3 4

STOP

Eingabe S*

5 6

100

7 8

CHS

:

1 - (S*/ 100) 2

+ 1

9

:

10

2

11

=

12

STO 9 2

-

1

"-V · ?

13 Ik

X

15 16 17

In V~"

18

RCL χ 5

19

RCL + k

20

RCL χ 7

21

RCL + 3

22

RCL X 7

23

RCL + 6

24

STO 8

25

RCL 7

??

26

RCL χ 2

7] a 2

27

RCL + 1

28

RCL χ 7

1/x

¥

STO 7

_

7? b 3 b

2

+7

?b3

7?(b 2 H- b 3 7]) b

i +7?Freiheitsgrad f Abb.24 Abhängigkeit der t - W e r t e vom Freiheitsgrad f verschiedene Sicherheiten S ( % )

-0.675 für

242

13- Streuungsmaße

N i c h t nur bei der Berechnung des Vertrauensbereiches auch bei zahlreichen anderen statistischen

sondern

Problemstellungen

werden t-Werte in Abhängigkeit von der Zahl f der Freiheitsgrade und der statistischen Sicherheit S ( % ) benötigt. Man findet daher in praktisch allen statistischen Lehrbüchern

ent-

sprechende tabellarische Zusammenstellungen. In den "Signifikanztabellen statistischer Testverteilungen" von R e i n f e l d t und Tränkle sind die t-Werte von f=l bis Sicherheiten bis

f=200 für

auf 6 Dezimalstellen

verschiedene

angegeben ( 5 ) .

Vertrauensbereich bei einseitiger Fragestellung Fragt man z . B . danach, in welchen Grenzen mit 95% Sicherheit der Wert /u einer Grundgesamtheit l i e g t , wenn

und s aus

n Einzelwerten bestimmt w u r d e , dann werden die Grenzen "rechts" und "links" vom M i t t e l w e r t

umso weiter von

e n t f e r n t liegen,

je kleiner n gewählt wurde. Damit wird der wachsenden Unsicherheit von

und s bei kleiner werdendem n Rechnung getragen.

Manchmal interessiert man sich aber nicht für den Bereich "rechts" und "links" vom M i t t e l w e r t x,

innerhalb dessen der

"wahre" M i t t e l w e r t /u l i e g t , sondern man f r a g t danach, oberhalb bzw. unterhalb welcher Schwelle der Wert /u mit gegebener Sicherheit a n z u t r e f f e n

ist.

Die statistische Sicherheit

ist

dann nicht durch die Fläche unter der t-Verteilung zwischen -t und +t gegeben (ensprechend der Fläche zwischen -z und +z bei der N o r m a l v e r t e i l u n g ) . Es gelten vielmehr folgende Sätze: Wahrscheinlichkeit, den "wahren" W e r t p* unterhalb einer gewissen Schwelle a n z u t r e f f e n

= Fläche unter

der t-Verteilung zwischen - oo und +t. wert

Sind Mittel-

und Standardabweichung s aus n Einzelwerten

e r m i t t e l t worden, und bezeichnet man die Schwelle mit

, dann folgt t durch Auflösen der Beziehung

o =

—

t· s

+ —5=>— yn

Vertrauensbereich bei einseitiger Fragestellung Wahrscheinlichkeit, den "wahren" W e r t / u einer gewissen Schwelle a n z u t r e f f e n

2kj>

oberhalb

= Fläche unter

der t-Verteilung zwischen t und + 0 0 . Bezeichnet man die Schwelle hier mit

, dann folgt der t-Wert

durch Auflösen der Beziehung

Je nachdem, ob die Schwellwerte kleiner oder größer als entsprechenden Mittelwerte

die

sind, können auch die t-Werte

kleiner oder größer als Null sein. In der graphischen Darstellung der t-Verteilung

( A b b . 2 3 ) wird dies deutlich.

Die dargestellte Problematik kann durch Integration der t-Verteilung gelöst werden ( A b s c h n . 13.^.5 ). Ist nun andererseits eine bestimmte Sicherheit vorgegeben, und fragt man nach den oberen bzw. unteren Schwellwerten, dann dürfen die t-Werte nicht den Tabellen für zweiseitige Fragestellung entnommen werden, sondern es müssen die Werte bei einseitiger Fragestellung verwendet werden. Für den Zusammenhang der Flächen unter der t-Verteilung gilt: S%, einseitig = -g ( 1OO + S % , z w e i s e i t i g )

.

(133)

Beispiel Gegeben sei

eine Grundgesamtheit mit dem "wahren" Wert / , aus

der eine Stichprobe von 6 Einzelwerten gezogen wird, welche die Ergebnisse welchen Grenzen liegt /a bei

(Wiederholungswerten) und s liefert. Zwischen

95% Sicherheit? Der entsprechende

t-Wert wird Tab.57 für f = n - l = 6 - l = 5 zu 2 , 5 7 1 entnommen. Wert /u liegt damit nach Gl. 132

yr f^

und u. i na

Der

in den Grenzen

* +-

2 , 5r·—» 7l s

yr

_

Fragt man j e t z t , mit welcher Sicherheit der W e r t / u unterhalb der oberen Schwelle liegt, dann ergibt sich nach G1.133 S%einseitig = 1/2

( 10O + 95%) = 97,5%.

13. Streuungsmaße Will man also z.B. die obere Grenze mit 97,5% absichern, dann muß aus der Tabelle der t-Wert für

95% Sicherheit bei

zwei-

seitiger Fragestellung entnommen werden.

Beispiele zur Anwendung des

Vertrauensbereiches

Um die etwas komplizierte Problematik des Vertrauensbebereiches verständlicher zu machen, zunächst zwei Beispiele: Beispiel 1 a)

Physiologische Kochsalzlösung wird bei

Bluttransfusionen

als

Blutersatz verwendet. Sie hat einen Gehalt von 0 , 9 % N a C l ,

was einer Konzentration von 9g NaCl/1 entspricht (die Dichte wird hier näherungsweise mit lg/1

angenommen). Ist

die Lösung

konzentrierter, dann platzen die roten Blutkörperchen, ist Lösung verdünnter, dann schrumpfen sie.

die

Die Konzentration muß

also möglichst genau eingehalten werden. In einem medizinischen Labor wird eine physiologische Kochsalzlösung verwendet, von der man nicht sicher ist, sie

die Soll-Konzentration von 9g/l

daß

b e s i t z t . Es werden 8 Wie-

derholungsbestimmungen durchgeführt. Der Bereich, in dem die "wahre" Konzentration liegt, soll mit 9 9 , 9 % Sicherheit angegeben werden. Meßwerte

= 2 = 3 = 4 = 1

9 ,3 g/l 9, 9 ,2 I I 9 ,1 I I

= 9 , 2 1 g/l

6

=

7 8

=

9, 4 9, 1 9, 3 9, 2

=

s = 0,113

g/l g/l II II

g/l

Für die Berechnung des Vertrauensbereichs ist

der t - W e r t bei

zweiseitiger Fragestellung für f = n - l = 8 - l = 7 Freiheitsgrade und 9 9 , 9 % Sicherheit zu verwenden. Nach Tab.57 ist ergibt sich für den Vertrauensbereich

t=5,4o8. Somit

der NaCl-Lösung:

Beispiele zur Anwendung des Vertrauensbereichs

Vertrauensbereich ( 9 9 , 9 % ) =

+

245

5 ,40ö-s

yr

= 9|21 +

5 ,408^0,113

yr

= 9 , 2 1 + 0,216

g/l

Untere Vertrauensgrenze

= 9,21 - 0 , 2 l 6 = 8,994

Obere

= 9 , 2 1 + 0 , 2 l 6 = 9 , 4 2 6 g/l

Vertrauensgrenze

g/l

Die "wahre" Konzentration der Kochsalzlösung liegt somit bei 9 9 , 9 % Sicherheit zwischen 8 , 9 9 und 9 , 4 3 g NaCl/1. Das mögliche "Risiko", daß die tatsächliche Konzentration außerhalb des genannten Bereichs liegt, b e t r ä g t nur 0,1% ! Ob die ermittelte Toleranz ausreicht, muß jetzt vom medizinischen Gesichtspunkt aus beurteilt werden. Eine w e i t e r e Beurteilung von der Seite der Statisitk her ist

nicht möglich.

Beispiel 15 b)

Im Rahmen einer Qualitätskontrolle soll Salzsäure auf

Spuren von Eisen untersucht werden. Die Analyse soll zeigen, ob eine obere Schwelle von 0,005% überschritten wird. Diese Fragestellung läuft auf das Problem hinaus, ob die obere Grenze von 0,005% Eisen noch innerhalb des Vertrauensbereichs liegt oder nicht. Hierbei soll eine statistische Sicherheit von 99% genügen. Ein prozentualer Gehalt deutet eine Konzentration von ca.

von 0,005% Eisen be-

50 mg/1. Es werden 6 W i e d e r -

holungsbestimmungen durchgeführt. Meßwerte

= 48,3 mg/l

x,

= 50,1 mg/l

x2 = 4 9 , 7 mg/1

X5 = 4 8 , 9 mg/l

x 3 = 4 9 , 2 mg/l

x6 = 4 9 , 7 mg/l

= 4 9 , 3 2 mg/l

s = 0 , 6 5 mg/l

2 6

13. Streuungsmaße

Da es sich hier um ein Problem mit einseitiger Fragestellung handelt, muß nach G1.133 der t-Wert für S = ( 2 - 9 9 % - 100)= bei zweiseitiger Sicherheit eingesetzt werden. Aus Tabellen findet man für

f=n-l=6-l=5

t = 3,365.

Somit folgt für die obere Vertrauensgrenze:

Einseitige Vertrauensgrenze ( =

49,32

+

£ 50 mg Fe/1)

0^5_ 3,365_0,65

1?

=

=

^^

mg

Bei 99% Sicherheit kann man daher nur garantieren, daß die FeKonzentration

50,21 mg Fe/1 ist

(also

50 mg Fe/1 sein k a n n ) .

Gibt man sich mit 95% Sicherheit zufrieden,

dann ist

t-Wert für 90% Sicherheit bei zweiseitiger Fragestellung zusetzen. In Tabellen findet man für f = n - l = 6 - l = 5

der ein-

und S=90%

t = 2,015. In diesem Fall folgt für die obere Vertrauensgrenze

0

(95%) =

+ ^J?

= ^9,32 +

2,015

0,65

=

^

Q5

Bei nur 95% Sicherheit kann man also garantieren, daß die FeKonzentration in der Salzsäure unterhalb des oberen Grenwertes von 50 mg Fe/1 liegt. Man erkennt, daß das Ergebnis davon abhängt, mit welcher Sicherheit der Vertrauensbereich berechnet wurde.

13.4.3

Berechnung der t-Werte

Um unabhängig von Tabellenwerken zu sein, erscheint es sinnvoll, die t-Werte zu berechnen. Man bezeichnet diese übrigens auch als Signifikanzschranken der t-Verteilung. Da es - wie bei der Normalverteilung - keine Möglichkeit g i b t , die t-Werte explizit als Funktion der Fläche unter der t-Verteilung anzugeben, muß man sich auch hier mit Näherungs-

13-

.3

Berechnung der t-Werte

24?

lösungen begnügen. In der Literatur sind zahlreiche Approximationen für die Berechnung der t-Werte beschrieben. Insbesondere genannt seien hier die Arbeiten von Dawson ( 18), Gardiner u . Bombay ( 1 9 ) , Goldberg ( 2 0 ) , Moss ( 2 1 ) , Veselä ( 2 2 ) sowie Noack u. Reichmuth ( 2 3 ) genannt. Noack u. Reichmuth geben eine Formel a n , mit der man für praktisch alle statistischen Sicherheiten und alle Freiheitgrade (f

= l bis

f = oo )

die Schranken der t-Verteilung ermitteln kann.

t = e ax

+ bx

-f ex

+

d

m.t

= 1/f

Mit Hilfe des Horner-Schemas läßt sich die Gleichung verein2 3 fachen und die Berechnung der Potenzen und in direkter Form umgehen. Es gilt nämlich t

= exp [ d + x(c

+ x(b

+ ax))].

(135)

Je nach der gewählten statistischen Sicherheit sind entsprechende Werte für

die Konstanten a , b , c und d einzusetzen. Mit

H i l f e einer nicht linearen Regressionsrechnung (siehe dazu Abschn. 18.7.2)

sind die Konstanten für verschiedene zweisei-

tige Sicherheiten berechnet worden. Sie sind zusammen mit den maximalen Fehlern, die man bei

Anwendung der Näherungsfunktion

gegenüber den exakten Tabellenwerten für

t m a c h t , in der fol-

genden Tab.58 aufgeführt. Man erkennt daraus, daß mit steigender statistischer Sicherheit der Fehler der Approximation größer w i r d , aber praktisch innerhalb des für die Auswertung von Ergebnissen interessierenden Bereichs bis 9 9 , 9 9 % nicht größer als ca.1% ist. Da mit Sicherheiten unter 50% im allgemeinen nicht g e a r b e i t e t w i r d , wurde hier auf die Berechnung von Schranken für

kleinere

Sicherheiten als 5O% verzichtet. Gegenüber dem angegebenen Algorithmus zur Berechnung der t-Werte haben die von anderen Autoren angegebenen Formeln

ei-

nige Nachteile. Entweder sind sie nur für eine begrenzte Zahl

248

13- Streuungsmaße

von Freiheitsgraden anwendbar, wobei meist für die interessierenden kleinen f-Werte die Fehler am größten sind. Oder aber die entsprechenden Formeln sind zwar für einen größeren Bereich von Freiheitsgraden anwendbar dann aber nur für einige wenige statistische Sicherheiten. Teilweise ist komplizierter

Tab.58

der Rechengang auch

, z.B. bei dem Algorithmus von Dawson ( 1 8 ) .

Konstanten a , b , c und d zur Berechnung der 3 2 t-Werte über die Formel t = exp(ax +bx +c mit

s (%)

= 1/f für

verschiedene

b

a

Sicherheiten

c

50 80

-0,011179

90

-0,056610

95 98

-0,151507

99 99,8

99,9 99,99

-0, 614998 -1,333460 -1,691680 -2,970338

F(%) =

Maximaler relativer Fehler der

-0,019830

-0,376444

0, 040512 0,236570 0,480730 0,822983 1 ,414000 1 ,946116 3,357723 4,011123

6,223448

d

F(°/o)*

0,364396 0,659474

-0,393766

0,00

0, 248065

0,08

0,920875 1,197*23 1,577842 1,875614 2,610177 2,945744 4,149884

0,497789 0,673214

0,06

0,844779 0,946832 1, 128556

0,05 0,08 0,09 0,15

i, 190872

0,32

1,355158

1,20

* berechneten t-Werte ^t„/\

..^^

1 t(berechnet)

- t ( tabelliert ) 1

t( tabelliert)

Programm N r . l 6

Berechnung von t-Werten für vorgegebene statistische Sicherheiten

Das Programm (Compucorp 326) erlaubt die Berechnung von t-Werten bei vorgegebener statistischer Sicherheit.

13. .3

Berechnung der t-Werte

Speicherbelegung:

=

1/f

= a

= b = c = d

Schritt-Nr.

Befehle

Erläuterungen

1

STOP

Eingabe f

2

1/x

1/f

STO 0

x_> STO

3 4

RCL

= 0 ax

1

b + ax

5 6

RCL + 2

7 8

RCL + 3 0

x( c + x(b + a x ) )

9 10

RCL + 4

d + x( c + x ( b + ax) )

11

STOP

Ausgabe t

12

JUMP START

Rücksprung zum Start

RCL RCL e

x(b

0

X

+ ax)

c + x( b + ax)

e x p f d + x( c + x(b

+ ax)))]

Programmablauf: Gemäß Tab.58 w e r d e n zunächst die Konstanten a , b , c , d für diejenige statistische

Sicherheit (= S%) in die Speicher

l bis

4

eingegeben, für welche der t-Wert berechnet werden soll. Als Beispiel seien einige t-Werte für die z w e i s e i t i g e s t a t i s t i s c h e Sicherheit S = 95% zu ermitteln. Dazu sind zunächst die sprechenden Konstanten einzugeben:

-0,151507

STO i

0,822983

STO

2

1,197^23

STO

3

0,67321^

STO 4

ent-

250

13« Streuungsmaße

Durch JUMP START START wird das Programm zum Laufen gebracht. Da der erste Befehl ein STOP ist, Eingabe von f an. Ist

hält das Programm hier zur

der Wert für den Freiheitsgrad f einge-

t i p p t , und drückt man anschließend erneut die START-Taste, dann wird gemäß den Schritten 2 bis

1O der

t-Wert berechnet und bei

dem STOP im Schritt 11 ausgegeben. Für eine weitere Berechnung von t für S% Sicherheit

ist

wieder START zu drücken.

Um die Leistungsfähigkeit des Programms zu zeigen, sind in der folgenden Tabelle einige berechnete t-Werte den entsprechenden Tabellenwerten ( 2 4 ) gegenübergestellt.

Tab.59

Vergleich tabellierter und nach Programm 16 berechneter t-Werte ( z w e i s e i t i g e S i c h e r h e i t )

Sicherheit S ( % ) 90

Freiheitsgrad f

6,314

2,015

2,015 1,812

2

1,812 1,676 1,648 12,706 4,301

5

2,57l

4,303 2,571

10

2,228

2,228

50

2,009

2,009

500

1,965

1,965

1

63,660

63,657

2

9,917

9,925

5 10

50 500

99

tabell.

6,314 2,919

1

2

95

ber .

1

2,920

1,676

1,648 12,706

5

4,034

4,032

10

3,168

50 500

2,678

3,169 2,678 2,586

2,587

13.^.3

Berechnung der t-Werte

Man erkennt, daß für gleiche Freiheitsgrade die

251

t-Werte

mit steigender statistischer Sicherheit immer mehr von den Tabellenwerten abweichen. Für eine bestimmte statistische Sicherheit liegt der größte Fehler etwa bei f = 2. Mit steigenden Freiheitsgraden nähert sich der berechnete Wert immer exakter den Tabellenwerten

an. In allen Fällen r e i c h t aber die Genau-

igkeit der berechneten

t-Werte für die Praxis aus.

Berechnung der t-Werte für beliebige statistische Sicherheiten und Freiheitsgrade Will man bei der E r m i t t l u n g der t - W e r t e die Eingabe der in Tab.58 zusammengestellten Konstanten umgehen und direkt für eine gegebene zweiseitige Sicherheit Freiheitsgrad den entsprechenden dafür

sowie einen gegebenen

t-Wert berechnen,

dann

ist

der folgende vom Autor entwickelte Rechengang anzuwen-

den: Gegeben: Sicherheit S * in

Prozent

Freiheitsgrad f Gesucht:

t-Wert

Die folgenden Schritte sind in der angegebenen Reihenfolge abzuarbeiten.

i.

s = s /loo

2.

q =

3.

7?=\ In —V-

1

Z

S

(136) (137)

(138)

252

13. Streuungsma e

a

4.

z = 77-

+

7? ( a

4- a

7? )

a Q = 2,515517

b t = 1,432788

BJ = 0,802853

b 2 = 0,189269

a 0 = 0,010328 «2

b _ = 0, Ool308 3

5.

d = In z —> STO

6.

t 1= tan

(

(139)

—2-----—--

7Z S 2

(140)

04

)

(141)

2-\r ι , _ S2 t4= 2 M

(143)

- l Γ 2 cos [

In t

arc

- 6 In t ~

cos(l -2S2) ] = J

+

8 In t,

9.

a =

10.

b = 2 In t1 - 4 In t 2 + 2d -

11.

c = l n t

12.

χ = 1/f

13.

t = exp [d + x(c

1

- 3d *

a

- d - a - b

ST

°

01

> STO 02

(145)

) STO 03

(146)

(147) + x(b

Dieser "Universal-Rechengang" Formeln zur Integration

- 1

+ ax))]

ist

unter

(148)

Zuhilfenahme der

der t-Verteilung entwickelt worden.

Eine kurze Herleitung wird im Abschn. 13.4.5 gegeben.

3

Berechnung der t-Werte

253

π V

-μ ON

ι -μ Κ υ -ρ φ

τΗ NO

v

ON ON

fx

ON

ON

CO

NO

in

in 1

ON

O"^

CO

ON

ON TH NO

CO ON LA

-3-

O

CM

TH

TH

CM

LA

TH

CO

α

NO

in

o NO

CM tA 0

fx O

NO

-3CO1

STO 2

t

" ir

STO 3

) STO 3

RCL 2

Prüfung,

ob f = 1

-

Wenn ja

1

Sprung nach LABEL 1.

21

=

Sonst weiter mit

JUMP = 1

S c h r i t t 23.

23

RCL 3 2

25

X

1

-h V

26

1

27

=

28

1/x

29 30

STO 4

-

1 + x2

v —> S T O

4

RCL 2

Berechnung von f/2

:

31 32

2

33

=

-

ist.

( f - 1 = 0 ) , dann

22 24

275

2?6

13. Streuungsma e

Schritt-Nr .

34

Befehle

Erl uterungen

FRACTION

Pr f u n g ,

35

JUMP + 2

36 37 38

1

39 40

ob f gerade oder

ungerade ist. Ist f ungerade ( Fraction=Nachkommateil von f / 2 = 0 . 5 > 0 ) , dann Sprung nach LABEL 2,

sonst Sehr. 36

STO 6

G:= 1

STO 7

R:=

STO 8

K:= 1

BRANCH 3

Sprung zum Unterprogramm:

1

Berechnung von R ' f r gerade Freiheitsgrade "

4l

1

Ί2

RCL - 4

43 44

RCL χ 7

45 46

JUMP 5

·

...

. + χ2 1

Sprung nach LABEL 5

LABEL 1 RCL 3

49

arc tan

50

^^

i.

51

X

52

2

53 54

:

55 56

W V

STO 9

47 48

J "

T! ' Λ η

n

"

. J3 . rj

7Γ = STO 9

57 58

JUMP 5

59 60

RCL 4

2

U =

7Γ

arc tan

χ

f r den Fall f = 1

.

U —> STO 9

LABEL 2 -y—*

TIT

*\ Υ

L·

-|tr

T

,

1+X

6l

STO 5

62

STO 6

G: = w

» STO

6

63

STO 7

R:= w

> STO

7

ν '"'ΤΓί

^

13·4.5

Integration der t-Verteilung

Befehle

Erl uterungen

64

2

K : = 2 —>STO

65 66

STO 8

Schritt-Nr.

BRANCH 3

277

8

Sprung zum Unterprogramm: Berechnung von R f r ungerade Freiheitsgrade

67

1

68

RCL - 4

69 70

V~

7l 72 73 74 75 76 77 78 79 8ο 8l 82 83 84

RCL χ 7 RCL 3 arc tan

•$-»RAD

Λ/1 - v ' R -^/l - v' X

1 arc

tan χ

X

2

:

π =

U= ^. ( R--/l-v' + arc

STO 9

U —>STO 9

JUMP 5

R cksprung nach LABEL 5

LABEL 3

RCL 8 : K

86

RCL + 8

87 88

=

93

1 1 - v V

1 + χ

+

ftr '-'^

89 90 91 92

1

1

RCL χ 4 STO χ 6 RCL 6

K + 1

v-G

— K+l

R: = R + G

STO + 7 2

STO + 8

K: = K + 2

> G

tan x)

2?8

13. Streuungsmaße Schritt-Nr.

Befehle

Erläuterungen

94

RCL 8

95 96

-

Wenn K

(

Fall, wenn K- ( f - 3 )

97 98

RCL 2

dann e r f o l g t Sprung nach

-

LABEL 4.

nach LABEL 3.

101

3 ) =

102

JUMP + 4

Reihenglieder G berechnet

103

JUMP 3

sind.

io4

LABEL 4

105

RETURN

99 100

"Prüfung,

ob K f-3

f-3

ist.

(dies ist

der

0 ist),

Sonst Rücksprung

Die Bedingung K

f-3

ist

dann e r f ü l l t , wenn alle

Rücksprung aus dem Unterprogramm in das Hauptprogramm

106

LABEL 5

107 108

100

RCL

109

STO 0

110

STOP

Ausgabe S* %

JUMP START

Rücksprung zum Programm-

111

S*= 100 · U 9 S

> STO

0

anfang zur erneuten Integration

Das angegebene Programm ist

im mathematischen Sinne keine Nä-

herungslösung, wie etwa die Lösung des Integrals der Normalverteilung durch ein Polynom. Die in T a b . 6 l angegebenen Rechenbeispiele z e i g e n , daß die berechneten

Flächenwerte

um einen

geringen Betrag von den W e r t e n abweichen, die den aus einer Tabelle ( 5 ) entnommenen t-Werten zugrunde liegen. Dies rührt daher, daß diese t-Werte

in der letzten Stelle gerundet sind

und somit auch nur "Näherungen" darstellen. Für die praktische Brauchbarkeit des Integrations-Programme hat dies aber keine Auswirkung.

13-4.5

Integration der t-Verteilung

279

Programmablauf: a) Programm einl sen b ) | JUMP | | START | | START | c)

ΛΖ Eingabe t

2.228139 /

| START ]

Eingabe f

10.000000

| START

95.000001

Ausgabe von S in Prozent

Tab.6l

Rechenbeispiele

7

zum Programm

Integral der t-Verteilung

t

Rechenzeit ( s )

f

S

1

95 ,000000

94,999998

1,5

2,228139

10

95 ,000000

95 ,000001

4,0

1,676551

49

90,000000

90,000002

17,5

2,015048

5

90,000000

89,999995

3,0

1

99 ,900000

99,900000

1,5

4,586894

10

99,900000

99,900000

4,0

3,169273

10

99,000000

99,000001

4,0

1,652508

200

90,000000

89,999998

66,0

12,70620

636,6192

soll

(%)

Cr.

(

°/°>

280

13. Streuungsmaße

Beispiel 17 a)

In einer gegebenen Stahlprobe

ist

der Mangangehalt zu be-

stimmen. Da die Meßwerte erfahrungsgemäß stark streuen, wurden 8 Wiederholungsbestimmungen durchgeführt: x1 = 0,35

%

= 0,29

% Mn

X2 = 0 , 7 4

"

Xg = 0 , 9 4

"

x3 = 0 , 5 3

"

x? = 0 , 5 7

"

= 1,23

"

x

= 0,83

"

x

Frage: Wie groß ist

die statistische Sicherheit d a f ü r ,

"wahre" Gehalt der Probe an Mangan nicht mehr als oben oder unten vom M i t t e l w e r t

daß der

1% rel. nach

der durchgeführten Bestimmun-

gen abweicht ? Mit H i l f e von Programm Nr.15 erhält man für = 0 , 6 8 5 % Mn

und s:

s = 0,314 % Mn

Der wahre Gehalt der Probe liegt im Bereich zwischen -

-

t -s / * VrT

und

-

+

t-s / ' TfrT

,

wobei die statistische Sicherheit durch die Wahl des t-Wertes gegeben ist.

Auf Grund der Fragestellung muß nun gelten:

= 0,01

Daraus folgt dann: r—>

t = 0,01-x S

= 0,01-0,685 — = 0,06l6 0,314

Setzt man t-Wert 0 , 0 6 l 6 und die Zahl der Freiheitsgrade f=n-l =8-1=7 in das Programm N r . l S ein,

dann erhält man S = 4 , 7 4 % .

13. * · 5

Integration der t-Verteilung

28l

Welche Sicherheit kann man grantieren, wenn man annimmt, daß der Gehalt /u der Probe um nicht mehr als unten vom M i t t e l w e r t

abweicht ?

- Vä" t = 0 , 2 - x -!2— = 1,232

Das Programm l i e f e r t

j e t z t mit

20% nach oben oder

In diesem Fall gilt:

.

t = l , 2 3 2 und f= 7

S = 7k, 2%.

Fragt man schließlich nach der Sicherheit für eine Abweichung des Mangangehalts von l mit

t= 3,O8 unf f= 7

50% vom M i t t e l w e r t x, dann erhält man

S*= 9 8 , 2 % .

Ergebnis: Um so größer man den Vertrauensbereich w ä h l t , umso unschärfer her ist

d.h.

die Angabe des M i t t e l w e r t e s M w i r d , desto hö-

die S i c h e r h e i t , mit der man diese Angabe garantieren

kann. Entsprechend hat ein enger Vertrauensbereich eine geringere Sicherheit zur Folge. Welche Sicherheit kann man nun g a r a n t i e r e n , wenn die daten

= 0,685% und s = 0 , 3

%

Kenn-

n i c h t aus 8 sondern aus

80 Wiederholungsmessungen erhalten worden wären ? Für eine maximal 1% ige Mittelwert

Abweichung des

"wahren" Gehalts /u vom

nach oben oder unten würde dann gelten _

t = 0,01-x -

- = 0,1951

.

s

Das Programm würde dann mit

t=0,1951 und f = 8 0 - l = 7 9

liefern

S = 15,4% . Dieser Wert ist

zwar b e r e i t s erheblich höher als die Sicher-

heit bei 8 Einzelwerten.

Um allerdings eine für s t a t i s t i s c h e

Probleme übliche Sicherheit von 95% oder gar 99% f ü r eine maximale Abweichung des Gehalts /u vom M i t t e l w e r t von 1% garantieren zu können, m ü ß t e n ca.

8000 b z w . mehr als

12000 W i e -

derholungsmessungen d u r c h g e f ü h r t w e r d e n . Die Einengung des V e r t r a u e n s b e r e i c h s b z w . die Erhöhung der s t a t i s t i s c h e n Sicherheit d u r c h eine H e r a u f s e t z u n g der Zahl der

282

l 3. Streuungsmaße

Meßwerte erweist sich zwar als prinzipiell möglich, für die Praxis allerdings ist ist

dieses Verfahren sehr u n e f f e k t i v .

Besser

hier, die Streuung zu senken, d . h . die Standardabweichung

kleiner zu machen. Beispiel 18 b) Es sei angenommen, daß der untersuchte Stahl einen Mindestgehalt an Mangan von 0 , 6 % aufweisen muß. Mit welcher statistischen Sicherheit kann man dies garantieren, wenn die

in a)

angegebenen 8 Meßwerte vorliegen ? Da der arithmetische M i t t e l w e r t 0,685% b e t r ä g t , läuft die Lösung des Problems auf die Ermittlung der Sicherheit dafür hinaus, daß der tatsächliche Mangangehalt der Probe um nicht mehr als

0,085% vom M i t t e l w e r t

nach unten hin abweicht. Es

handelt sich hier also um ein Problem mit einseitiger Fragestellung. Zu berechnen ist

daher die Fläche unter der t-Ver-

teilung zwischen -t und + 0 0 . Der t-Wert f o l g t aus - i-l-S. = 0,600 •/n"

zu t = ( x - 0 , 6 0 0 ) —- = 0,766 0,31^

Da die t-Verteilung - genau wie die Normalverteilung - symmetrisch ist,

ergibt sich die gesuchte Fläche aus der über das

Programm N r . l 8 ermittelte Integral zwischen -t und +t : S*(-t bis

+ 00)

Das Programm l i e f e r t S*(-t bis

= 50 +

S ( - t bis

S ( - t bis

+t)

+ t,

= 53,1%. Daraus folgt:

f=7)

(o/o)

+ oo ) = 50 + ^g'1 = 7 6 , 6 % .

Die W a h r s c h e i n l i c h k e i t , daß der vorgeschriebene Mindestgehalt von 0 , 6 % Mn nicht u n t e r s c h r i t t e n w i r d , beträgt somit 76,6%.

13. k. 5

Integration der t-Verteilung

283

Herleitung der Gleichungs Systeme zur Berechnung der t-Wert für beliebige statistische Sicherheiten Nach Noack und Reichmuth ( 2 3 ) lassen sich t - W e r t e aus der Beziehung t = eax

+

*

+ ex +

=1/f

mit

berechnen. Weiterhin lassen sich die entsprechenden Formeln zur Integration der t-Verteilung für die Fälle f = l , f=2 und f=k nach t

auflösen: f = l

Aus G1.163 folgt mit x= -

yr

t(f=l)

= t

= tan

(

f = 2 Der nach G1.16? zu berechnende W e r t für R '

ist

für den

Fall f =2 gleich 1. Daraus ergibt sich

S

= 100 · l T/l - v = 100 l + (

Löst man diese Beziehung nach t a u f , ergibt

t(f=2)

= t2 = 1 2 [

f =k

y

i

(

-s>

~ 100

}

2

-

sich

l]

In diesem Fall ergibt sich für R ' nach G1.16? R»

= l + i v

28

13.Streuungsmaße Die Beziehung für das Integral lautet dann

(170) Durch Umformen ergibt sich daraus eine kubische Gleichung für v: V3 +

3v 2

.

4

+ 4(

Man kann zeigen, daß zur Lösung dieser Gleichung der sog. Casus irreducibilis ( 2 7 ) angewandt werden muß. Die Lösung lautet: arc cos

l

v = 2 cos
Schritt 26

334

15. Zufallsauswahl von Stichproben

Fortsetzung von Programm Nr.23

Randomisierung

Befehle

Erläuterungen

26

1

Zählung der

27

STO +

Schritt-Nr.

1

"gezogenen" Zu-

fallszahlen durch Addition einer 1 im Speicher 4l

28

1

Speichern einer 1 in dem

29

STO IND 00

Konstantenspeicher, dessen Adresse gleich der gezogenen J

Zufallszahl z. .

1+ 1

ist.

Ausdrucken der

30 3l

RCL 43

32

RCL 4l

33 34

RCL - 40

len ausgedruckt worden ?

JUMP = 2

Wenn ja

PRINT

J

Zufallszahl z.

„

1+ 1

Sind schon k = n Zufallszah( ( k - n ) = 0 ),

dann

Sprung nach LABEL 2, sonst Rücksprung nach LABEL 1 LABEL 2

35 36

EXP 99

Programmende durch Anzeige

37

STOP

von 10

Das Programm beruht auf den Gleichungen 211 und 212 mit p = l und q = n. Die entsprechenden z u

= INTEGER

i+l

Formeln lauten dann:

( n - u i + 1 -t- l )

= FRACTION ( 9 9 7 u . ) i

(213) (211)

Beispiel 25 Das Programm N r . 2 3 soll auf die in dem Beispiel von S.321 erwähnte Verteilung der 4 Maissorten auf 16 Teilfelder des Versuchsfeldes angewandt werden.

15.2.6

Randomisierung

335

Programmablauf: a) Löschen aller Konstantenspeicher

=

Mit Inhalt Null belegen

c)

7 16.0000 /

Eingabe U Q , z.B. 0 , 5 2 8 4 l 6 3

d) Ausdruck der

randomisierten

Zahlen von l bis 16:

L 14.0000 9.000O 5.00OO l.0000

4.0000 13.0000 16.0000 11.0000 12.0000 8.0000 2.0000 15.0000 7.0000 6.0000

3.0000 10.0000

7 0.5284163 /

336

15· Zufallsauswahl von Stichproben

Danach sind die 4 verschiedenen Maissorten auf folgenden Teilf e l d e r n anzubauen: Teilfelder

Maissorte a

1 4

b

-

9

- 13

-

5

- 16

-

1

- 11

1 2 - 8 - 2 - 1 5

c

7

d

15.2.7

4

Normalverteilte

-

6

-

3

-

1

0

Zufallszahlen

Für die nach den bisher genannten Verfahren erzeugten Zufallszahlen war c h a r a k t e r i s t i s c h , daß jede "mögliche" Zahl die gleiche Chance h a t t e , ausgewählt zu werden. Die in dem Bereich von p bis

q

möglichen Zufallszahlen gehorchen daher einer sog

R e c h t e c k v e r t e i l u n g , wie die folgende Abbildung zeigt:

Häufigkeit

Abb.28

Rechteckverteilung von Zufallszahlen

Für viele Probleme aus dem Bereich der S t a t i s t i k erscheint es n ü t z l i c h , wenn man künstlich

Meßwerte simulieren kann,

die

einer Normalverteilung mit den P a r a m e t e r n / u und (7 genügen.

15.2.7

Mit dem folgenden Algorithmus ist zu "berechnen",

337

Normalverteilte Zufallszahlen es m ö g l i c h ,

Stichprobenwerte

die einer N o r m a l v e r t e i l u n g mit dem M i t t e l w e r t

/u und der Streuung

U entstammen. Dabei sind - wie noch gezeigt

wird - die aus den Stichprobenwerten

e r m i t t e l t e n Kenndaten

und s um so bessere Schätzwerte für fi und O , je mehr Z u f a l l s zahlen erzeugt werden. Charakterisitisch für die so gewonnenen Zufallszahlen daß die Chance für größer ist, W e i t von

ist,

das A u f t r e t e n einer b e s t i m m t e n Zahl um so

desto näher sie bei dem vorgegebenen Wert /u liegt. e n t f e r n t liegende W e r t e t r e t e n also weniger h ä u f i g

a u f , so wie es für eine Normalverteilung typisch

ist.

Die folgenden Formeln sind in der angegebenen R e i h e n f o l g e abzuarbeiten. Dabei werden paarweise z.

die Zufallszahlen z . und

. erzeugt. Sie entstammen einer Normalverteilung mit den

Parametern /u und CT. Diese Kenndaten sind zu Beginn vorzugeben.

Rekursionsformeln zur Erzeugung n o r m a l v e r t e i l t e r Zufallszahlen mit

den Parametern AI und U

(211)

u

= FRACTION ( 9 9 7 - u ± )

N.

= ( - 2 - l n u±)1/2 cos (2

N ± + 1 = ( - 2 - l n u ± ) 1 / 2 sin

N± +

N

^1

(2 7

±+1)

(215)

(216)

/u

+

(217)

/"

u.

l

Der Algorithmus muß mit einer 7-stelligen ( N a c h k o m m a s t e l l e n ! ) Dezimalzahl beginnen.

Dieses u

muß als

letzte Ziffer

eine

l,

338

15· Zufallsauswahl von Stichproben

3,7 oder 9 haben. Nachdem aus u N . , N. j für u.

und daraus z. und z.

. e r m i t t e l t e Wert als

bzw. u.

und u.

1

die Größen

berechnet wurden, wird der

neues u. wieder in G1.211 einge-

setzt und man berechnet das nächste Paar Zufallszahlen usw. Durch entsprechende Wahl von /u und U te

als

kann man sowohl brei-

auch schmale Verteilungen erzeugen. Da durch ja und U

die Normalverteilung vollständig charakterisiert ist,

besteht

somit die Möglichkeit, mit dem angegebenen Algorithmus im Prinzip

jede Normalverteilung "nachzumachen". Das im folgenden beschriebene und erklärte Programm ermög-

licht es,

für

vorgegebene Parameter yu und U

, eine ebenfalls

vorgegebene Anzahl n von Meßwerten zu simulieren, die der

ent-

sprechenden Normalverteilung genügen. Gleichzeitig wird aus den Stichprobenwerten der arithmetische M i t t e l w e r t net sowie die Streuung s e r m i t t e l t . Damit ist m ö g l i c h , wie gut die

berech-

eine Kontrolle

"berechneten" Meßwerte der angenommenen

Verteilung gehorchen.

Programm N r . 2 4

Simulation von normalverteilten Meßwerten für

gegebenes yu und O

(Compucorp 32?)

Speicherbelegung:

15.2.7

Normalverteilte

Zufallszahlen

339

= k = Z hler f r

Speicherbelegung:

die

erzeugten Me w e r t e = n = Anzahl der

zu

erzeugenden Me werte

Schritt-Nr.

Erl u t e r u n g e n

Befehle -

1

RCL 01

2

X

3

k

997 =

5

FRACTION

FRACTION ( 9 9 7 - u . ) = u i + 1

6

STO 02

u. . x+1

7 8

RCL 01

9 10 11

1

_

> STO 02

J l n u.

In X

"

2 _

-

12

CHS

13

ΛΓ STO 03

14

997-u.

2 In u.

1

- 2 In u.

1

T/- 2 -In u^ -»STO

15 16

RCL 02

17 18

χ 7Γ

19

RAD —> ·£

20

STO Ok

21

cos

cos (27Tu.

22

RCL χ 03

N.

23

STO 05

N . —> STO 05

03

"~

χ 2

2 TTu.

i"1 Bogenma

2 7Γ u .

im Winkelma

_ =

]

\

'"'TO 1

)

= ( -2 In u . )

O ^1

= a - a

RCL Ok 25

sin

26

RCL χ O3

l sin

(2 TTu

)

= b 1/9

N ± + 1 = (-2 In u..)^

- b

340

15« Zufallsauswahl von Stichproben Fortsetzung von Programm N r . 2 4 Simulation von normalverteilten Me werten Schritt-Nr.

Befehle

Erl uterungen

27

STO 06

N ± + 1 —» STO 06

28

RCL 05

29

RCL χ 08

30

RCL + 07

31

PRINT

Ausdruck von z .

32

STO + 09 2

Σ* 2

33

X

34

STO + 10

35 36

RCL 06

37 38

RCL + 07

39 40

STO + 09 2

X

4l

STO + 10

42

2 STO + 1 1 RCL O2 STO 01 RCL 11

43 44

RCL χ 08

±

J Ο

Ν . + AI 1

= Z . 1

z

Zz 2 ICTNi+1 J (T N

+ /u = z i+1 i+l Ausdruck von z .

PRINT

z

2

Z*2 k:

= k + 2 Wenn k=n Me werte erzeugt

45 46

RCL - 12

wurden,

JUMP = 1

Sprung nach LABEL 1 , sonst

47 48

JUMP START

R cksprung zum Start

49

PRINT DOT

50 5l 52

d.h. k-n = 0, dann

LABEL 1

1

LINE

J

RCL 09 RCL : 12

1 J

x - n- Z z

PRINT

Ausdruck von χ

53 54

RCL 10

Z*2

55 56

RCL 09 2

-

X

15.2.7

34l

Normalverteilte Zufallszahlen

Fortsetzung von Programm N r . 2 4

Simulation von

normalverteilten Meßwerten

Schritt-Nr.

Befehle RCL

57 58

: 12

=

Erläuterungen n

2

2.

1 n

2 £·

: (

59 60 6l 62

RCL 12

n - 1

1

63 64

) =

65 66

iT PRINT

67

STOP

s Ausdruck von s Ende des Programms

Zu Beginn des Programms sind die Werte für

U Q , /u und (J

in

die

Speicher 01, 07 und 08 einzugeben.

Beispiel 26 Liegt eine größere Zahl von W e r t e n vor, die einer Normalverteilung genügen, dann kann man überschlagsmäßig die Standardabweichung der Grundgesamtheit aus der Spannweite berechnen. Es gilt dann ( 2k ) :

= R/6

(218)

Um dies zu zeigen sei w e r t / u = 10,00 und der dieser Verteilung

eine N o r m a l v e r t e i l u n g mit dem M i t t e l Standardabweichung (J = 1,00 gegeben. Aus

soll eine Stichprobe von n = 20 Einzelwerten

ermittelt werden. Daraus ist

die Spannweite zu berechnen und

342

15. Zufallsauswahl von Stichproben

die G 1 . 2 1 8 nachzuprüfen.

Programmablauf: a)

0 STO 09

b)

u

= 0.5284163

STO

01

/u

= 10.0000

STO

0?

O

= 1.0000

STO

08

c)

,

STO 10

Nach JUMP START,

,

STO 11 , n

START werden folgende 20 Einzel-

werte und Kenndaten ausgedruckt:

10.550 9.013 9.431

9.783 9.845 11.069 11.557 10.413 10.835 12.382 10.000

8.195 10.375 9.34l 10.581

x

i

X

2

X

3

X

4

X X

STO 12

5 6

X

7 8

X X

9

x

io

X.. ..

11

X

12

X

13 i4

X X

15 l6

9.829 9.871 9.723 9.380

X

X

19

9.379

X

20

10.078

X

0.938

s

X

17 i8

X

15.2.7

343

Normalverteilte Zufallszahlen

Wie man erkennt, geben die Kenndaten gut die P a r a m e t e r / j = 10,0000 und £ 7 =

,

und s schon recht wieder. Aus dem

kleinsten Wert der Reihe x , 2 = 8,195 und dem größten "Meßwert" x? = 11,557 resultiert R = 11,557 - 8,195 = 3,362 und nach G1.218 (7»R/6 = 3,362/6 = 0,560. Die Abweichung von dem vorgegebenen Wert CT = 1,0000 ist

also noch r e l a t i v groß. Werden

dagegen 100 Wert simuliert , dann erhält man bereits mit einer Spannweite von R = 12,382 - 8,195 = 4,187 einen Näherungswert für

die Streuung der Grundgesamtheit von

4,187/6 = 0,6978.

Werden schließlich vom Programm n =1000 W e r t e erzeugt, so gibt sich bei

er-

einer Spannweite von R = 6 , 0 3 2 eine nach G1.218

berechnete Standardabweichung der Verteilung von 1,005. Dieser W e r t bestätigt bereits sehr gut die Richtigkeit der näherungsweisen Berechnung der Streuung G1.218. Der bei

aus der Spannweite nach der

n = 2000 erhaltene Wert von R/6 = 1,152 b e s t ä -

tigt diese Aussage. Die Ergebnisse sind übereinstimmend mit dem Verhalten von realen Meßwerten. Auch hier würde mit steigender Zahl von Einzelwerten die Richtigkeit der G1.218 immer besser bestätigt werden. Auch die Übereinstimmung der aus den erzeugten Einzelwerten berechneten Kenndaten

und s mit den vorgegebenen Pa-

rametern yu und O wird mit steigender Zahl von "Meßwerten" immer besser, wie auch aus der folgenden Tab.68 hervorgeht: Tab.68

Vergleich der Parameter /u und U mit den aus den simulierten Einzelwerten ermittelten Kenndaten und s

n

X

s

4

9,695

0,652

10

10,488

1 ,022

50

10,000

100 500

10,065

0,857 0,873

1000

10,000

0,965 0,996

5000 30000

9,999

1 ,014

10,001

1 ,008

9,997

16. Die Poissonverteilung

Die bisherigen Problemstellungen gingen von einem Datenmaterial aus, das aus Meßwerten kontinuierlicher

Größen be-

stand. Innerhalb gegebener theoretischer oder

experimenteller

Grenzen konnten dabei die Meßwerte im Prinzip

jeden - also

auch einen gebrochenen - Zahlenwert annehmen. Beispiele:

L = 2,013 cm ;

c = 1,045 Mol/l

; I = 3 , 6 ^ 7 A/h

Es gibt nun aber eine Reihe von Fällen, bei denen das Ergebnis der Messung durch Abzählen diskreter Größen erhalten wird, wie z.B. Zählrate eines radioaktiven Präparats Anzahl der e m i t t i e r t e n Elektronen einer beheizten Kathode Anzahl der Druckfehler auf einer Buchseite Anzahl der Blutkörperchen auf den Feldern einer Zählkammer

etc. Die angegebenen Beispiele haben zwei gemeinsame Eigenschaften: Erstens ist

die Anzahl der entsprechenden "Objekte" ( Z ä h l i m -

pulse, Elektronen, Druckfehler, Blutkörperchen) das Ergebnis einer sehr großen Zahl von überhaupt möglichen Ereignissen. Zweitens ist

die Wahrscheinlichkeit

Ereignisses sehr klein.

für das Eintreten eines

16.

Poisson-Verteilung

Unter diesen Voraussetzungen hat die Poisson-Verteilung Gültigkeit. Ist

A. die m i t t l e r e Anzahl der "Ereignisse"

in einer Stich-

probe ( d . h . also die im a r i t h m e t i s c h e n M i t t e l gefundene Zahl von Ereignissen bei einer großen Zahl verschiedener Stichproben) , und ist

P ( x ) die Wahrscheinlichkeit d a f ü r ,

liebig gezogene Stichprobe gerade exakt

daß eine be-

Ereignisse

aufweist,

dann gilt: , x

P(x)

_^

= 100 —-—-

Man erkennt, daß durch die Größe A. die vollständig c h a r a k t e r i s i e r t ist. vollständigen größen^

und

(219)

(%)

Poissonverteilung

Im Gegensatz dazu sind zur

Beschreibung der Normalverteilung die 2 KennU

nötig.

Beispiel 2? Ein Phosphor-32-Präparat mit einer Aktivität

von l Nano-Curie

zeigt im D u r c h s c h n i t t (= a r i t h m e t i s c h e s M i t t e l aus mehreren Einzelmessungen) .eine Anzahl von 12 Meßimpulsen pro M i n u t e . Die Anzahl der zerfallenden P-32-Atome b e t r ä g t ca. 2200/min. Die geringe Zählrate sei hier durch A b s o r p t i o n s e f f e k t e

bedingt.

Wenn man b e r ü c k s i c h t i g t , daß l Nano-Curie P-32 einer Menge von etwa 3,5-10"

g Phosphor-32 und damit ca.

phoratomen e n t s p r i c h t , wird die Gültigkeit

70 Millionen Phosder Poisson-Vertei-

lung deutlich: Die Zahl der " t a t s ä c h l i c h e n " Ereignisse ( Z a h l der Meßimpulse b z w . Zahl der zerfallenden A t o m e ) ist im V e r g l e i c h zu der Anzahl der

gering

"möglichen" Ereignisse ( A n z a h l

der vorhandenen P h o s p h o r - 3 2 - A t o m e ) . Die W a h r s c h e i n l i c h k e i t , daß ein Meßimpuls r e g i s t r i e r t w i r d , b e t r ä g t dementsprechend nur 12/7-10 7 « # 1 , 7 - 1 0

%, bezogen auf ein b e s t i m m t e s P-32-Atom.

Damit sind die o.g. Bedingungen für die G ü l t i g k e i t der Poisson-

346

l6.

Verteilung

Poisson-Verteilung erfüllt.

Mit der Formel 219 kann man nun die Wahrscheinlichkeit

für

das A u f t r e t e n einer beliebigen Zahl von Meßimpulsen berechnen. Wie groß ist

z.B. die Wahrscheinlichkeit d a f ü r ,

daß nur 8 Im-

pulse anstatt der im M i t t e l angenommenen 12 Impulse r e g i s t r i e r t werden ? Antwort: Nach G1.219 gilt: O

P(8)

IQ

12

= 100

e

= 6,55%

8! Einen Überblick über die

zu dem gegebenen A. gehörige gesamte

Verteilung erhält m a n , wenn auch für bzw. kleiner als werden. Für

Impulsraten,

die

größer

A. sind, die Wahrscheinlichkeiten berechnet

A- = 12 wäre etwa der

Bereich von

= O bis

= 20

sinnvoll. Hierzu kann man sich durch folgende Rekursionsformel die Berechnung vereinfachen:

P(x+l) =

^

1

P(x)

(220)

Zunächst ermittelt man die Wahrscheinlichkeit für dafür,

daß gar keine

12° p,

P ( 0 ) = 100

~12

k = 6,14-10"^ %

Über die G1.220 ergibt sich dann:

* 2 — p ( o ) = 3,69-10" 3 %

p(i) =

P(3) =

3

^21

• *

P(12)=

P ( 2 )= · ·

,0

12

= 0,

Impulse gemessen werden. Man erhält:

.

4,42-10~2% · ·

P(ll)=

11,4%

also

16. Poisson-Verteilung Für x-Werte (Impulsraten) kleiner als

34?

12 nimmt die Wahrschein-

lichkeit wieder ab. Für eine Impulsrate von 20 erhält m a n :

P ( 2 0 ) = 0 , 9 7 °/o. Würde man die Wahrscheinlichkeiten gegen die x-Werte 0 , 1 , 2 usw. graphisch a u f t r a g e n , dann ergäbe sich ziemlich genau eine zu dem Mittelwert A = 12 glockenförmige Verteilung. Charakteristisch für die Poisson-Verteilung ist, im Gegensatz zur Normalverteilung schief

ist.

daß sie

Mit größer wer-

dendem A. nähert sich jedoch die Poisson-Verteilung immer mehr einer Gauß-Verteilung an. Im folgenden Diagramm sind für

verschiedene Werte von A die

entsprechenden Verteilungen dargestellt. Man erkennt, daß sich mit steigendem A die

schiefe Form immer besser

einer symme-

trischen Verteilung annähert.

0.1 --

0 1 2 3 I. 5 6 7 8 9 10 11 12 13 U 15 16 17 18 19

*

Abb.29 Poissonverteilungen für verschiedene A-Werte

348

16. Poisson-Verteilung Da die Poisson-Verteilung durch den M i t t e l w e r t

ständig charakterisiert ist,

A

voll-

muß die Standardabweichung eine

Funktion von A. sein. Die Theorie liefert in der Tat eine

der-

artige Beziehung: (221) Für große

A -Werte nähert sich die Poisson-Verteilung

der Normalverteilung

an. Dies bedeutet - da dann die Verteilung

auch symmetrisch wird - eine M ö g l i c h k e i t ,

den prozentualen An-

teil der Grundgesamtheit für b e s t i m m t e Streubereiche angeben zu können, wenn bei einer Meßreihe die Ergebnisse in ganzzahliger ( d i s k r e t e r ) Form anfallen und die sonstigen Bedingungen für die Gültigkeit der Poisson-Verteilung e r f ü l l t

sind. Ana-

log zur Gauß-Verteilung liegen dann 68,27 %

aller "möglichen" Meßwerte im Bereich

± l r(99)

'

x. ist

gilt:

nachweisbar.

s t a t i s t i s c h gesichert oder

s i g n i f i k a n t ein Ausreißer.

>

r(99i9)

:

x. ist s t a t i s t i s c h stark gesichert oder hochsignifikant ein Ausreißer

Liegt r

A

zwischen

r ( 9 5 ) und r ( 9 9 ) 5 dann kann

A.

nur wahr-

scheinlich als Ausreißer angesehen w e r d e n . Ist

als Ausreißer n a c h g e w i e s e n , dann wird dieser W e r t

aus dem Datenvorrat e n t f e r n t . Aus den n-1 R e s t d a t e n b e r e c h n e t man erneut

und s und bildet aus einem eventuell vorhandenen

weiteren ausreißerverdächtigen W e r t erneut die Prüf große r . Ist

auch dieser W e r t ein Ausreißer, dann muß auch er aus dem

vorhandenen Datenvorrat eliminiert werden. Man v e r f ä h r t nach diesem Schema solange, bis reißern

das Datenmaterial f r e i von Aus-

ist.

Die r-Werte können entweder einer Tabelle entnommen werden, und zwar in Abhängigkeit von der Zahl der F r e i h e i t s g r a d e und der statistischen Sicherheit ( 9 5 , 99 oder 9 9 , 9 % ) . Man kann aber auch - analog zu der Berechnung der t - W e r t e

- die Schran-

ken über die Beziehung

r

= e

3 2 ( ax + bx + c x + d )

, mit x=l/f

/on-·, (22 f )

und f=n-2

ermitteln. Diese Approximationsf ormel l i e f e r t r-Werte , deren Abweichung von tabellierten W e r t e n kleiner als 0 , 5 %

ist.

376

17· Statistische Testverfahren

Der zur Berechnung der t-Werte analoge Algorithmus kann hier angewandt werden, da der Zusammenhang zwischen den r-Werten und der Zahl der Freiheitsgrade ähnlich wie bei der t-Verteilung geartet ist,

wie aus der folgenden Abbildung hervorgeht.

3291

10

Abb.32

15

20

25

30

Integralgrenzen der r-Verteilung in Abhängigkeit von der Zahl f der Freiheitsgrade für statistische

verschiedene

Sicherheiten

Die Konstanten a , b , c und d zur Berechnung von r als Funktion des Freiheitsgrades f sind in Tab.70 zusammengestellt. Aus der Abb.32 geht hervor, daß für

eine gegebene Zahl von

Freiheitsgraden der r-Wert umso größer ist, tistische Sicherheit S% ist. die W a h r s c h e i n l i c h k e i t , daß werdendem r

je höher die

sta-

Das bedeutet a n d e r e r s e i t s , daß ein Ausreißer ist,

a n s t e i g t . Hieraus f o l g t w e i t e r h i n ,

mit größer daß für eine

gegebene Menge von n E i n z e l d a t e n (Wiederholungsmessungen)

17-2.3

Tab.70

r - W e r t e als Funktion des Freiheitsgrades f

r

b

a

S %

c

0,673215307

0,213300208 -0,966460915

0,947180450

-2,079990987

1,193343228

0,301780539 -o, 40810324l

99

0,152611296

1 ,90012534l

-0,666830426

dann am größten ist,

schen Mittelwert

d

-0,223957163

95

99,9

377

Ausreißertest nach Nalimov

wenn

möglichst w e i t vom a r i t h m e t i -

e n t f e r n t ist.

Dies ist

für den größten b z w .

den kleinsten W e r t der Meßreihe der Fall. Aus diesem Grund erscheint es sinnvoll, die Daten - ebenso wie beim Test nach Graf und Henning - zunächst einmal der Größe nach zu ordnen. Somit ergibt sich zusammengefaßt folgender Ablauf des Nalimov-Tests: 1.

Sortieren der n Einzelwerte (Programm Nr.10)

2.

Berechnung von

3.

Berechnung der Prüfgröße r sowie mit

4.

aus x, s und n

x. = A max.

Ermittlung der Schranken r ( 9 5 ) , r ( 9 9 ) und r ( 9 9 , 9 ) über G1.227

5.

und s aus allen D a t e n

(f = n - 2)

Entscheidung, ob x A . = x max» ein Ausreißer

ist

( K r i t e r i e n S.375)

6.

Ist

x =x ein A u s r e i ß e r , dann Eliminierung A max. von x aus dem D a t e n v o r r a t , max. Berechnung von x und s aus den R e s t d a t e n . E r m i t t l u n g der Prüfgröße r

mit dem größten W e r t

der R e s t d a t e n .

7.

War x

kein A u s r e i ß e r , dann Berechnung von r max. A mit dem kleinsten W e r t x . War *m±n ein A u s r e i ß e r , muß er aus dem Datensatz e n t f e r n t w e r d e n .

378

l?- Statistische Testverfahren Anschließend wieder Berechnung von Restdaten und Ermittlung von r

und s aus den

mit dem größten

bzw, kleinsten Wert der restlichen Einzelwerte. 8.

Man v e r f ä h r t so w e i t e r , bis das Datenmaterial ausreißerfrei

9.

ist.

Berechnung der Kenndaten

und s aus den ausreißer-

freien Werten.

Beispiel 31 Wir wollen vom Beispiel 30 auf S.370 ausgehen. Das Sortieren der 15 Einzelwerte

0,531 0,532 0,532

sec.

0,535 0,535

M

l i e f e r t folgende Reihenfolge:

0,535 0,536

II II

II

Die Berechnung von

x = 0,5389

sec. II

0,539 0,539 0,5^0

se II

II

0,537 0,538

II II

0,5^1

II

0,539

II

0,575

M

=

X

A

und s aus allen Daten l i e f e r t :

sec.

s = 0,010^

Aus diesen Kenndaten sowie n = 15 und

sec. = 0,575 (größter Wert)

berechnet man die Prüf große r : =

10,575 - 0 ;;538 9 I , 0,0104 V 15-1

=

3,593

Mit den in Tab.70 angegebenen Konstanten a , b , c und d b e r e c h n e t 3 2 man nun über die Beziehung r = e x p ( a x +bx + c x + d ) die Schranken der r-Verteilung für f

= n-2

= 15-2 = 13.

9 5 , 9 9 und 9 9 , 9 % . Dabei gilt

= 1/f und

17-2.3 r(95)

= 1,923

r(99)

= 2,397

Ausreißertest nach Nalimov

379

r ( 9 9 , 9 ) = 2,841 Da r

= 3,593 größer als

r ( 9 9 , 9 ) = 2 , 8 4 l ist,

kann man den

W e r t 0,575 in der Meßreihe s t a t i s t i s c h stark gesichert b z w . hochsignifikant als Ausreißer betrachten. Eliminiert man diesen Wert und berechnet aus den Restdaten erneut

und s,

erhält

man: (ohne 0 , 5 7 5 ) = 0,5363 s (ohne 0 , 5 7 5 ) = 0,0031 Für r

sec. "

ergibt sich j e t z t mit n = l 4 und dem größten Wert 0 , 5 4 l

A ~

lo, 54i - 0,5363! ··\ ~ V 14-1 0,0031

Entsprechend ergeben sich für die Schranken mit f = l 4 - 2 = 1 2 die Werte :

r(95)

= 1,919

r(99)

= 2,383

r(99,9)

= 2,809

Damit ist

r.

kleiner als r ( 9 5 ) , woraus f o l g t , daß

nicht als Ausreißer nachweisbar

= 0,54l

ist.

Führt man schließlich den Test noch mit dem kleinsten W e r t der Reihe O,531 durch, ergibt sich für r : r

_ |0,531 - 0,5363l A ~ 0,0031

Da auch hier r

kleiner als r ( 9 5 ) ist,

kann auch der W e r t 0,531

nicht als Ausreißer nachgewiesen werden. Damit ist

der einzige Ausreißer der Wert 0,575 s e c . , und die

ausreißerfreien Kenndaten lauten:

= 0,5363

und s = 0,OO31.

380

17. Statistische Testverfahren

Das Ergebnis des Nalimov-Tests ist

somit das gleiche wie bei

dem Test nach Graf und Henning. Dies liegt aber hier daran, daß der Wert 0,575 außerordentlich weit von dem arithmetischen M i t t e l der Restdaten entfernt liegt ( nämlich um mehr als Normalerweise urteilt der Nalimov-Test s c h ä r f e r , d.h.

12s).

ein Wert

der mit dem Test nach Graf und Henning noch nicht als Ausreißer identifiziert wird, kann mit dem Test nach Nalimov eventuell als Ausreißer nachgewiesen werden. Ob übrigens ein Meßwert als

Ausreißer erkannt wird, hängt

weitgehend von der Gesamtzahl der Werte ab. Je größer die Zahl der Meßwerte ist,

umso eher ist

die Erkennung eines Ausreißers

möglich.

Beispiel 32 Bei einer 4-fachen Bestimmung der Oberflächenspannung von Wasser erhält man die folgenden Meßwerte: = 72,68 x 2 = 71,^9

dyn/cm "

= 72,32 x^ = 7 2 , 7 6

dyn/cm "

Auf den ersten Blick scheint der Wert x„ ein Ausreißer zu sein. Die Berechnung von Mittelwert und Streuung ergibt: = 72,313 Daraus folgt für

"A Für die

s = 0,58l die Prüfgroße r

mit

= 7 1 , 4 9 und n = k :

171.49 - 72,313 0758l

r-Wert erhält man mit f = 4-2 = 2 :

r ( 9 5 ) = 1 , 6 4 4 ; r ( 9 9 ) = 1,710 ; r ( 9 9 , 9 ) = 1,725

17.2.3 Damit kann der W e r t

A u s r e i ß e r t e s t nach Nalimov

= 7 1 , 4 9 dyn/cm nicht als

nachgewiesen werden, denn r

ist

38l

Ausreißer

kleiner als r ( 9 5 ) · Die vor-

liegenden Daten müssen somit als

"homogen" b e t r a c h t e t w e r d e n ,

obwohl x„ auf den ersten Blick ein Ausreißer zu sein scheint. Die Aussage "nicht als Ausreißer nachweisbar" besagt n u r , daß aus den gegebenen Daten der entsprechende W e r t nicht Ausreißer

statistisch erfaßbar

ist.

als

Eine Aussage darüber, ob

der untersuchte Meßwert tatsächlich ein Ausreißer ist

oder

n i c h t , kann aus dem Testergebnis nicht gemacht werden. Eine schärfere Entscheidung kann man nur t r e f f e n ,

wenn

mehr Meßwerte vorliegen. Zwei w e i t e r e Bestimmungen liefern

die

Werte = 7 2 , 6 7 dyn/cm

und

x.. = 7 2 , 6 9 dyn/cm.

Die daraus berechneten Kenndaten lauten: = 72,435

s = 0,488

Die entsprechende Prüfgroße für

dyn/cm

= 7 1 , 4 9 dyn/cm

hat

dann

den W e r t

r

171,49 - 72,435l *\/

6

A ~

Mit f=n-2=4 erhält man w e i t e r h i n für die Schranken der r - V e r teilung

r(95) Da r

= 1,816

größer als

;

r ( 9 9 ) = 2,057

r ( 9 9 ) ist,

aus dem Datenvorrat

i

r ( 9 9 , 9 ) = 2,185

muß der W e r t

= 7 1 , 4 9 dyn/cm

entfernt w e r d e n , da er s t a t i s t i s c h gesi-

chert b z w . signifikant als Ausreißer nachgewiesen wurde. Aus den ausreißerfreien Meßwerten erhält man nun die Kenndaten = 7 2 , 6 2 4 dyn/cm

s = 0,174

dyn/cm .

382

17· Statistische Testverfahren

Während der Mittelwert

durch den Ausreißer nur geringfügig

be-

einflußt wird, macht die Streuung der Daten ohne den Wert x„ nur knapp ein D r i t t e l des W e r t e s aus, den man unter Einbeziehung des Ausreißers

erhält ( 0 , 1 7 4 gegenüber 0 , 4 8 8 d y n / c m ) .

Mit den Restdaten muß nun erneut ein Test auf

Ausreißer

durchgeführt werden. Zur Erinnerung seien die restlichen Daten noch einmal

aufgeführt:

72.68

dyn/cm

72,32

"

72,76

"

72,67 72.69

"

In dieser Reihe scheint der W e r t 7 2 , 3 2 sein, da er wesentlich weiter als wert

ausreißerverdächtig zu

die anderen Werte vom M i t t e l -

= 7 2 , 6 2 4 dyn/cm entfernt liegt. Mit r

Schranken ( f = n - 2 = 5 - 2 = 3 ) r ( 9 5 ) = 1,758

= 1,953

und den

, r ( 9 9 ) = 1,924 und

r ( 9 9 , 9 ) = 1,987 erweist sich auch der Wert 7 2 , 3 2 dyn/cm

als

Ausreißer. E n t f e r n t man auch diesen W e r t , erhält man schließlich für die Kenndaten: = 72,700

s = 0,04l

Während sich also der Mittelwert

dyn/cm . als praktisch "stabil" gegen

Ausreißer erweist, kann die Streuung durch Entfernen der Werte 71,49 und 7 2 , 3 2 dyn/cm

aus den Ausgangsdaten bis

auf ca. 1%

der ursprünglichen Standardabweichung ( = 0 , 5 8 l d y n / c m )

ge-

senkt werden. Aus den durchgeführten Betrachtungen ergibt sich für

die

Praxis: Ausreißer können umso deutlicher bzw. schärfer erkannt werden,

je mehr Einzelwerte vorliegen.

Weitere Betrachtungen zum Ausreißerproblem findet man bei Graf und Henning ( 8 ) , Gottschalk ( 3 ) , Sachs ( 4 ) , Renner ( 9 ) und Stange ( 1 0 ) .

l ? · 3 T r e n d t e s t nach Neumann

383

17.3 Trendtest nach Neumann Mit H i l f e dieses Tests gilt es zu z e i g e n , ob aufeinanderfolgende Meßwerte in einer Reihe von Wiederholungsmessungen auf Grund eines systematischen Fehlers abhängig voneinander sind, d.h. einen Trend aufweisen. Das b e d e u t e t , daß die Meßwerte mit laufender Nummer entweder systematisch zu- oder abnehmen. Da andererseits selten alle Werte einer Meßreihe immer größer oder immer kleiner als ist

die vorherigen Werte sein w e r d e n ,

der Ausdruck Trend nur so zu v e r s t e h e n , daß die W e r t e die

Tendenz haben, größer bzw. kleiner zu werden, einzelne W e r t e aber aus dieser Reihe herausfallen

können. Die folgende Abbil-

dung verdeutlicht diesen Sachverhalt:

01

1

Abb.33

2 *

3

k

5

6

7

8

9 10 11 12 13 K Laufende Nummer der Messung

Beispiel für einen Trend

bei Meßwerten

384

17· Statistische Testverfahren Zeigt der Test, daß die zunehmende bzw. abnehmende Tendenz

der Meßwerte mit einer bestimmten Sicherheit - z.B.

99% - nach-

gewiesen werden kann, dann müssen die W e r t e als voneinander abhängig betrachtet werden. Sie sind dann mit einem systematischen Fehler b e h a f t e t , und die Kenndaten

und

s,

d.h.

also

M i t t e l w e r t und Standardabweichung ,dürfen nicht berechnet werden,

da man sonst zu einer falschen Interpretation gelangt.

Im Gegensatz zum Ausreißertest werden hierbei alle Meßwerte als

"brauchbar" bzw. "unbrauchbar" nachgewiesen.

Durchführung des Tests Zur Prüfung berechnet man die Testgröße i=n-l (228)

D = -—-5s (n-1)

Die Nullhypothese des Tests - aufeinanderfolgende Meßwerte sind unabhängig voneinander - muß dann abgelehnt werden, wenn der Quotient D die in Tab.71 angegebenen Schranken u n t e r s c h r e i t e t . Dabei kann man zwischen den statistischen Sicherheiten 95%, 99% und 9 9 , 9 % wählen.Eine Entscheidung kann nach den auf S.360 angegebenen Kriterien vorgenommen werden. für

Die o.g. Formel 228 kann v e r e i n f a c h t werden, indem man 2 "~ 2 l v™ 2 s ( n - 1 ) den Ausdruck 2. x · - ~ (2.x · ) e i n s e t z t ( s . S. 2 2 5 ) .

Damit kann die Berechnung der Standardabweichung umgangen wer2 vx . und £_ x . er-

Z

m i t t e l t und in die G1.228 eingesetzt werden. Hierzu sowie auch 2 (x. - x. . ) benutzt man zweckmäßigerweise

Z

rechnende Speicher, in denen man Additionen vornehmen kann (z.B.

3 STO + l = Addition von 3 zum Inhalt von Speicher

Das folgende

1).

Programm ermöglicht die Berechnung der Test-

größe D aus n Einzelwerten. Die Entscheidung für

oder gegen

ei-

1 7 - 3 Trendtest nach Neumann

Tab.71

Kritische Schranken für den Trendtest nach Neumann

n

95°/o

99%

99,9%

k

0,7805

0,6256

0,5898

5 6

o, 8204 0,8902

O,4i6i 0,3634

7 8

0,9359 0,9825

9 10 11

1 ,0244

0,5379 0,5615 0,6l4o 0,6628 0,7088 0,7518

14

l ,0623 1,0965 1,1276 1,1558 1,1816

15 16

1,2053 1,2272

0,9221

17 18

1,2473

19

i ,2834 1,2996 1,3148 1,3290 1,3425 1,3552 1,3671 1,3785 1,3892 1,3994 1,409l l,4i83 1,4270 1,4354 1,4434 1,4511

0,9743 0,9979 1,0199 l ,o4o6 l ,0601 1,0785 1,0958

12

13

20 21 22

23 24 25 26 27 28

29 30 31 32 33 34

1 ,2660

0,7915 0,8280 0,8618 0,893l

0,9491

0,3695 0,4036 0,4420 o,48i6 0,5197 0,5557 0,5898 0,6223 0,6532 0,6826 0,7104 0,7368 0,7617 0,7852

i ,2283

0,8073 0,8283 0,848l 0,8668 0,8846 0,9017 o, 9182 0,934l o ,9496 0,9645 0,9789 0,9925 1,0055

1,2386

1 , 0 1 80

1 , 1122

1,1278 1,1426

1,1567 1,1702 i, 1830

1,1951 i ,2067 1,2177

385

386

17· Statistische Testverfahren

nen Trend der Meßwerte erfolgtdann durch Vergleich der berechneten Prüfgröße D mit den in Tab.71 angegebenen Schranken.

Programm N r . 2 8

Trendtest nach Neumann

Speicherbelegung:

=

RCL

i bzw. n

RCL RCL

Schritt-Nr.

RCL

X.

RCL

X .

l

4 i+l

Erläuterungen

Befehle -

Löschen der Speicher

1

0

2

STO 1

Bildung von

3 k

STO 2

2_ x ·

5 6 7 8 9 10

STO 6

STO 3 .

1

*·

J"(x i - i+1 ) 2 Kennzahl i

RCL + 1

Kennzahl STOP STO 4

11

STO + 2

12

X

13

STO + 3

14 15

1

2

.

Eingabe

.

. —» STO 4 2 .

1

STO + 1

Zxi i:

i

= i + 1

zur

bzw. n , und

17-3

Trendtest nach Neumann

Fortsetzung von Programm N r . 2 8 Trendtest nach Neumann Schritt-Nr.

Befehle

16

LABEL 1

17 18

RCL + 1

19 20 21 22

Erläuterungen

1

Kennzahl i-t-1

KENNZAHL STOP

Eingabe x .

STO 5

Summieren der x-Werte

23

STO + 2 2 x

bzw. Bildung der Summe

24

STO + 3

der Quadrate

25 26

STO + 1

27 28 29

1 RCL 4

= i + 1

Bildung von

RCL - 5 2 x

30

STO + 6

3" 32 33 34

RCL 5

35 36

RCL 6

Ersetzen von x.

1

durch

STO 4

den Wert x.

JUMP 1

Rücksprung nach LABEL 1

LABEL 2

37 38

RCL 3

39

-

40 4l

RCL 2

42

RCL : 1

43 44

)

45 46

i:

*-

X

±

i+l'

(

x

2

£- i

l/v n

*—

i

)2

2

=

D

STOP

Ausgabe

JUMP START

Rücksprung zum Start

D

38?

388

17« Statistische Testverfahren

Beispiel 33 Bei einer flüssigchromatographischen Bestimmung eines Amins in biologischem Material wurden 10 Proben von dem zu untersuchenden S t o f f

a u f g e a r b e i t e t und hintereinander vermessen. D a b e i er-

gaben sich in zeitlicher Reihenfolge die Meßwerte ( i n ng/^ul):

=

2,3

= =

2l1

4,0

x6 = 5,5 ? = 4,5 x ß = 7,4

= 3,4 = 5,2

*9 = 5 , 9 x 10 = 8,9

Programmablauf: a)

| JUMP | | START | | START

LL

b)

Eingabe x. = 2,3

2.3000

| START

Eingabe x„ = 2,1

2.1000

START |

Eingabe

=

8,9

8.90QO 7

START) /ll.

0.6744 y

17-3

Trendtest nach Neumann

389

Für die Testgröße D ergibt sich somit der W e r t O,67^. Er kleiner als

der entsprechende Tabellenwert für

Sicherheit (= 0 , 7 5 1 8 ) .

n = 10 und 99%

Damit kann die Nullhypothese

hängigkeit der Meßwerte mit mehr als

ist

der Unab-

99% Sicherheit abgelehnt

werden. Die Meßwerte haben also mit laufender Nummer die

Ten-

denz anzusteigen. Dies schließt w i e g e s a g t n i c h t aus, daß einzelne W e r t e auch einmal kleiner als gen sind (Meßwerte

,

,,

die vorhergehenden Messun-

und x „ ) .

17.4 Vergleich zweier Varianzen (F-Test)

17.^.1

Durchführung und Voraussetzungen

Mit diesem Test kann g e p r ü f t

w e r d e n , ob sich zwei unter-

schiedlich große Varianzen bzw. Standardabweichungen s s

und

, die aus zwei verschiedenen Meßreihen mit jeweils n. b z w .

n„ Meßwerten stammen, nur z u f ä l l i g (auf Grund der Streuung der W e r t e ) oder aber systematisch u n t e r s c h e i d e n . Ist tischer Unterschied n i c h t n a c h w e i s b a r ,

ein systema-

so läßt sich die Null-

hypothese des Tests - die Standardabweichungen s

und s

ge-

hören der gleichen Grundgesamtheit mit der Streuung U an nicht widerlegen. Im anderen Fall gehören die Meßwerte beider Reihen jeweils einer anderen V e r t e i l u n g an. Voraussetzung für den Test ist,

daß die W e r t e normalver-

teilt und ausreißerfrei sind. Zur Durchführung eines Tests auf Normalverteilung von Werten siehe A b s c h n . l 8 . 6 . Geringe Abweichungen von der Normalverteilung fuhren zwar leicht zu ner falschen T e s t i n t e r p r e t a t i o n . Dies ist

ei-

aber nur dann beson-

ders k r i t i s c h , wenn die Anzahl der Meßwerte in beiden M e ß r e i hen sehr unterschiedlich ist.

Man sollte daher nach M ö g l i c h -

keit Meßreihen mit gleichem Stichprobenumfang wählen bzw. in

390

l?. Statistische Testverfahren

beiden Meßreihen die gleiche Anzahl von Wiederholungsmessungen durchführen. Kann man sicher n a c h w e i s e n , daß eine oder beide Meßreihen nicht normalverteilt sind, dann sind verteilungsunabhängige Testverfahren wie z . B . der Rangdispersionstest Tukey ( 4

von Siegel und

) o.a. anzuwenden.

Die Prüfung auf Ausreißer kann nach dem Verfahren von Graf und Henning oder mit Hilfe des Nalimov-Tests vorgenommen wer-

den.

Zur Durchführung des Tests berechnet man zunächst die Prüfgröße s2

i

F = S

Dabei muß s d.h.

s

2" 2

mit

s

l >

S

(229)

2 ·

die größere der beiden Standardabweichungen sein,

muß aus der Meßreihe mit der größeren Streuung stam-

men. Die beiden Meßreihen u m f a s s e n n

b z w . n„ E i n z e l w e r t e , wo-

bei aus den o.g. Gründen nach Möglichkeit n =n 0 sein sollte. l

Wenn s

stets die größere der beiden Standardabweichungen

sein muß, folgt d a r a u s , daß der Quotient F immer größer als

l

ist. Sind s

und s

die Streuungen aus zwei Stichproben aus nor-

m a l v e r t e i l t e n G r u n d g e s a m t h e i t e n , dann f o l g t die Größe F der sog. F-Verteilung ( n a c h R.A.F_isher) mit den Parametern f = n . - l und f 0 = n -2. Diese Freiheitsgrade f . und f _ bestimmen die Form C-i

-

der V e r t e i l u n g . von F = 0 bis

Die F-Verteilung ist

F = cO . In Abb. 3^ ist

unsymmetrisch und r e i c h t für

einige Werte von f

und f p die Form der F-Verteilung d a r g e s t e l l t . Um zu entscheiden,

ob die beiden Streuungen s

und s

ei-

ner einizigen oder zwei verschiedenen Verteilungen angehören, gibt es zwei M ö g l i c h k e i t e n : a) Man berechnet für

die

gegebenen W e r t e von f

und f

17.

.1

F-Test /

0

Durchführung und Voraussetzungen

1

Abb.34

2

3

Kurvenform der F - V e r t e i l u n g für Freiheitsgrade i\

die

i

391

F

verschiedene

und f _

Fläche unter der

F - V e r t e i l u n g z w i s c h e n O und

dem b e r e c h n e t e n F - W e r t . Dies kommt der

Aufgabe

einer

Integration gleich. b) Man vergleicht den b e r e c h n e t e n F - W e r t mit den Schranken der F-Verteilung für vorgegebene F l ä c h e n werte = s t a t i s t i s c h e

Sicherheiten

Im Fall a) e r h ä l t man direkt die W a h r s c h e i n l i c h k e i t b z w . die s t a t i s t i s c h e Sicherheit d a f ü r , dardabweichungen s

und s

daß sich die beiden Stan-

"statistisch unterscheiden",

also

zwei verschiedenen V e r t e i l u n g e n zugrunde liegen. Im Fall b)

geht man meist so v o r , daß man den b e r e c h n e t e n

F-Wert mit den F - W e r t e n für

die

vorgegebenen W a h r s c h e i n l i c h -

keiten bzw. s t a t i s t i s c h e n S i c h e r h e i t e n 9 5 % , 99% und 9 9 , 9 ° i > gleicht.

ver-

392

17· Statistische Testverfahren Ein F-Wert für

95% statistische Sicherheit bedeutet dann:

Die Fläche unter der F-Verteilung zwischen 0 und F für gebenen Werte von f

und f„ macht genau 95% der

die

ge-

Gesamtfläche

unter der Verteilung (=100%) aus. Entsprechendes gilt für die anderen statistischen Sicherheiten. Manchmal findet sich in der Literatur die Behauptung, der F-Test soll z e i g e n , ob sich die b e i d e n Streuungen s unterscheiden.

Dies ist

falsch

!

und s

In den seltensten Fällen

d ü r f t e n die Streuungen der beiden Meßreihen exakt den gleichen Zahlenwert haben. Für eine E n t s c h e i d u n g , ob sich s unterscheiden, benötigte man keinen Test

und s

! Vielmehr soll der

Test nachweisen, ob die vorhandenen Unterschiede

zufälliger

Natur sind oder aber darauf zurückzuführen sind, daß den beiden Meßreihen unterschiedliche Verteilungen zugrunde liegen. Die Nullhypothese lautet also nicht s = s sondern C7. = O0 2 2 (J = (J . Der F-Test soll nun zeigen, mit wel-

bzw. exakter

cher statistischen Sicherheit man nachweisen kann, daß die

bei-

den Meßreihen zwei Grundgesamtheiten mit unterschiedelicher Standardabweichung

U angehören.

Für den F-Test ist

es übrigens nicht e r f o r d e r l i c h , daß die

M i t t e l w e r t e beider Meßreihen b z w . daraus a b g e l e i t e t die Lage der beiden Verteilungen, die den Meßreihen zugrunde liegen, gleich sind. Wie bereits im Abschn. 13-3

erwähnt wurde,

ändert

sich die Form der Verteilung b z w . die Streuung n i c h t , wenn man die Meßwerte um einen konstanten Betrag erhöht oder erniedrigt. Bezeichnet man die Fläche unter der F-Verteilung mit S(F,f

,f„),

dann gilt nach G o t t s c h a l k ( 3 ) folgendes

-stu-

figes Beurteilungsmaß für den Test:

F < F(95°/o,f1,f2) bzw. S ( F , f 1 , f 2 )

< 95%

Ein Unterschied zwischen 2 2 s und S 0 ist zufallsbel ^ dingt. Eine Unterscheidung zwischen 0° . und (J „ ist s t a t i s t i s c h nicht nachwe isbar.

F-Test /

Durchführung und Voraussetzungen

F(95%,f1,f2) < F < F(99%,f1,f2) bzw.

95% ^ S ( F , f 1 , f 2 ) < 99%

393

Ein Unterschied zwi2 2 sehen ff ^ und ff 2 ist wahrscheinlich

F(99%,f1,f2) < F < F(99,9%, bzw.

99% < s ( F , f 1 , f 2 )

fW

0,

3 k

2

5

FRACTION

Sprung nach LABEL

6

JUMP + 1

FRACTION

dann ist

f

(f

von f /2.

ungerade

RCL 02

9

RCL

01

f

2

1 f -P ί J

10

RCL χ 00

11

=

f2 + f y r

12

1/x

l/(f2

13

RCL χ 02

f2/(f2

14

STO 03

x —»STO 0 3

15 16

RCL 02 STO 07

1 f J

+ fj-F)

—» N

Ist

/ 2 ) = O, w e i t e r

mit S c h r i t t 7

7 8

1.

^

+ iy F) = χ

406

17· Statistische Testverfahren Fortsetzung von Programm N r . 2 9 Integration der F-Verteilung a) f .

l

oder f _

o

geradzahlig

Schritt-Nr.

Befehle

17

RCL 01

18

STO 08

19

1

20

RCL - 03

21

STO 09

22

1

Erläuterungen ]fl_> M

V = 1 - X

23

STO 10

k = 1

24

STO 11

G = 1

25

STO 12

R = 1

26

BRANCH 3

"l Sprung in J zur

27

RCL 03

das Unterprogramm

Berechnung von R -> LABEL 3

X

X

28

a

29

(

30

RCL 02

31

:

32

2

33 34 35 36 37 38 39 40 4l 42

)

_

f 2 /2

xV 2

= RCL

R-xf2/2

12

- R-xf2/2

CHS +

~|

1 X

1 - R-xV2

100 =

S = 100(1 - R . x f 2 / 2 )

STOP

Ausgabe S in Prozent f . = geradzahlig

für

17·4.2

Integration der F-Verteilung

Fortsetzung von Programm N r . 2 9 Integration der F-Verteilung a) f 1 oder f

geradzahlig

Schritt-Nr.

Befehle

43

LABEL 1 RCL 02

44

45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 6l 62

Erl uterungen

-> f

+

2

+

f

lF

RCL 01 RCL χ 00 J

= 1/x

l / ( f 2 + f1

RCL χ 02

f2/(f2

STO 03

χ

RCL 01 STO 07 RCL 02 STO 08 RCL 03 STO 09

F)

+ f j F) = χ

» STO 03

] f —> N J 1 1 f —» M J 2 χ

> v

1

STO 10

k = 1

STO 11

G = 1

STO 12

R = 1

BRANCH 3

Sprung in das Unterprogramm nach LABEL 3 zur von R

63 64 65 66 67 68 69 70 71

1

1 1 - X χ

RCL - 03 a

X

(

RCL 01 :

f/2

2 ) =

( i - x)V2

Berechnung

40?

17· Statistische Testverfahren

Fortsetzung von Programm N r . 2 9 Integration der F-Verteilung a) f.. oder f l

^

geradzahlig

Befehle

Erl uterungen

72

RCL χ 12

R (1 - x ) f l / 2

73 74 75 76

X

Schritt-Nr.

100

=

S = 100 ( 1 - χ ) f l / 2

STOP

Ausgabe S ( f „ geradzahlig)

77

LABEL 3

Unterprogramm zur Berechnung von R

78

RCL 10

Berechnung von k - M/2 .

79 80 8l 82

-

Pr fung , ob k - M/2 gleich

(

Null

RCL 08

Wenn ja,

:

In diesem Fall Sprung nach

83 84

2

LABEL 4.

)

Schritt Nr. 87 ( k ist

85 86

=

kleiner als M / 2 ) .

87 88

dann ist

RCL 10

91 92

2

93 94 95 96

4 +

X

k:=k + 1

2 k - 4

-

RCL 07 :

N H- 2 k -

( 2

99 100

RCL χ 10

101

2

2 k

_

2 k - 2

k = M/2.

Sonst weiter mit

STO + 10

89 90

97 98

ist.

JUMP = 4

1

R

4

dann

17-4.2

409

Integration der F-Verteilung

Fortsetzung von Programm N r . 2 9 Integration der F-Verteilung a) f 1 oder f„ geradzahlig Schritt-Nr. 102

Erläuterungen

Befehle )

2 k - 4 2 k - 2

103 104

RCL

09

105

STO

11

106

RCL 11

107

STO + 12

108

JUMP 3

109

LABEL 4

110

RETURN

2 k - 4

2 k - 2

C G

^

2 k

4 2 k -- 2 vV

k -1

JR: = R

+

->CG k

Gk

Rücksprung in das Hauptprogramm ( S c h r i t t 27 bzw. 6 3 ) .

Programm N r . 2 9

Integration der F-Verteilung aus gegebenen W aus Werten für

F, f

und f

(Compucorp 327) b) f 1 und f„ ungeradzahlig Schritt-Nr.

Befehle

1

RCL 01

2

RCL + 02

3 4

-

5

=

Erläuterungen -

Berechnung von f . + f _

2 _

- 2

410

l?· Statistische Testverfahren Fortsetzung von Programm N r . 2 9 Integration der F-Verteilung b) f

und f _ l

Schritt-Nr.

6

ungeradzahlig

ά

Befehle

Erl uterungen

JUMP = 2

Wenn f.. und f _ dann ist

gleich 1 sind,

f +f -2 gleich Null.

Tritt dieser Fall ein,

dann er-

folgt Sprung nach LABEL 2. Sonst weiter mit Schritt 7ί Sprung nach LABEL 5-

7 8

JUMP 5

9 10 11 12

RCL 00

13

X

14

2

15

:

16 17 18

7Γ

LABEL 2 Berechnung von

*y F

arc tan χ

arc

•3C.-> RAD

Umwandlung des Winkels in das

tan y F

Bogenma

X

100 2 -=- 100

19 20

STOP

arc

tan y F

=S

Ausgabe S in Prozent f r

f t = f„ = i. 2l

LABEL 5

22

RCL 02

Berechnung von f _ f

23

- 1. Wenn

- 1 gleich Null ist,

dann

24

1

25

=

Sprung nach LABEL 6. Wenn nicht,

26

JUMP = 6

weiter mit Schritt 27.

gilt: f

= 1. In diesem Fall

17-4.2

Integration der F-Verteilung

411

Fortsetzung von Programm N r . 2 9 Integration der F-Verteilung b) f

und f„ ungeradzahlig

Schritt-Nr.

Befehle

27 28

RCL 01

29 30 31 32

33 34 35 36 37 38 39 40 4l 42

RCL χ OO

Erl uterungen If -F J α

RCL : 02

i^

STO 03 2

X

+

f

rF/

f

f

2

STO 09

= v

RCL 02 STO 08

Ί J

RCL O9

-1

f2

>

STO 11

G = v 1 / 2 = VT1

43 44

STO 12

R . = v 1 / 2 = /v-

45 46

STO 10

1

BRANCH 7

l-

1

Sprung in das Unterprogramm zur Berechnung von R '

47 48

RCL 09

49

RCL χ 12

50

RCL χ 03

5l 52

RCL 03

53

/" J

r.

l/ y

x-R'

! 1 + x 1,

=

f

JUMP + 9

sem Fall

65 66

. S

^ STO 15

- 1

gr

( = A)

dann ist

f

f.,-1 ist

er Null. In die-

Sprung nach LABEL 9«

Sonst weiter mit Schritt 67. f =1

67 68

i

RCL 15 STOP

Ausgabe S in Prozent f r

f., = 1 und f n gr

69

LABEL 6

Berechnung von S f r und f ί >

70

RCL 01

7l 72

RCL χ 00

73 74 75 76

J

i

1/f j- F

iT

yi/f±-F

X

χ

i / ( i + χ2)

1 =

79

1/x

= χ

> STO 03

-

+

77 78

1 (Fall e )

1 ff .FF

1/x

STO 03 2

er als

_

fp=* ).

1.

17.4.2

Integration der F-Verteilung

413

Fortsetzung von Programm N r . 2 9 Integration der F-Verteilung b) f 1 und f _ ungeradzahlig Schritt-Nr.

Befehle

Erl uterungen

80

STO O9

l / ( l + x 2 ) = v —>STO 09

8l

RCL 01 STO 08 RCL 09

82

83 84 85 86 87 88

iT

-i f J

M

1

" G = v 1/2 = ./v-

STO 11 STO 12 1 STO 10

R _

VV2

]fc :,

_y-

Sprung in das Unterprogramm

89

BRANCH 7

90

RCL 09

-

91 92

RCL χ 12

_ R ' · i/(i + x 2 )

zur Berechnung von R '

-r

X'i\ * i/ ^ i ~t" χ )

93 94

RCL χ 03

95

arc tan χ

arc tan χ

96

•fc-»RAD

Umwandlung von Winkel in

+

Bogenma

97 98

X

99

:

100

7Γ

2

101 102

CHS

103 ιο4

1

105

X

106 107 108

2

1

T*·

1 +x

S = 100 f l - — ( arc tanx + χ R '/vj ΤΪ

100

= STOP

J

Ausgabe S % ( f ?

=1, f 1 > 1 )

kik

17. Statistische Testverfahren Fortsetzung von Programm N r . 2 9 Integration der F-Verteilung b) f 1 und f _

ungeradzahlig

Schritt-Nr.

Befehle

Erl uterungen

109

LABEL 7

Unterprogramm zur Berechnung

von R 1 110

RCL 10

Berechnung von k - ( —·* Ist

111

).

dieser Ausdruck Null (das

112

(

113

RCL 08

ist),

114

-

Sonst weiter mit Schritt 121.

115

1

116

:

117

2

118 119

) =

12O

JUMP = 8

dann Sprung nach LABEL 8.

"1k: = k + 1

121

1

122

STO H-

123

2

124

RCL χ 10

10

J 2 k - 2

125 126

2

127

:

128

(

129

2

130

RCL χ 10

131

-

132

1

133 134 135

)

2 k - 1

=

(2 k - 2) / ( 2 k - 1)

RCL χ 09

(2 k - 2)

v

(2 k - 1)

136

STO χ 11

G

G k K

~

k-1 τ K

(2 k - 2) (2 k - 1)

„

17-4.2

Integration der F-Verteilung

415

Fortsetzung von Programm N r . 2 9 Integration der F-Verteilung b) f

und f„ ungeradzahlig

Schritt-Nr.

Befehle

137

RCL

138 139 ι4ο ι4ι

STO + 1 2

Erl uterungen

11

R:

= R + G

J

JUMP 7 LABEL 8 RETURN

R cksprung

in das Hauptpro-

gramm ( S c h r i t t e 47 oder 90)

142

Berechnung von S, wenn sowohl

LABEL 9

f gr

143 144 145 146 147 148 149 150 151 152 153

1

STO 10

als auch f 2 ungerade und er als

1 sind.

1 k - 1 J

STO i4

Q = l

LABEL 0

RCL 00

-i

-

k - i

.5 =

_J

1/x

1 /( k - | )

RCL χ 10

k /

STO χ 14

( k - 1/2)

Bildung des Produktes Faktoren k /

154 155 156 157 158 159 160 161 162

1

STO + 10 RCL 10 /

k:

der

(k - 1/2)

= k + 1

J

-i

2

Wenn ja, dann ist

k - (f

^

-l)/2

gleich Null. Dann Sprung nach

RCL 02 1

:

LABEL 0,

ebenso wenn k noch

kleiner als ( f „ - l ) / 2 ώ

ist.

416

17· Statistische Testverfahren Fortsetzung von Programm N r . 2 9 Integration der F-Verteilung b) f.. und ΐ- ungerade Schritt-Nr .

Befehle

163

2

164 165 166 167 168 169 170 17l

)

172 173 174 175 176 177 178 179 18ο

Erl uterungen

=

JUMP - = 0 -ι

2

:

7Γ STO χ 14 1

STO STO STO RCL 2 X

ο

2

ΓΤ

~~ 7Γ ir ' /ι

|

k

k - 1/2

k = 1

10 11 13 03

G = 1 R" = 1

ι/(ι+χ 2 )

+ 1 =

18l

1/x

182

RCL χ 03

183

RCL χ 03

184 185 186 187 188 189 190 19l 192 193

STO 09

x2/(l+x2) = v v

STO 09

LABEL -

Berechnung von R"

RCL

Pr fung, ob k = ( f ^ - D / 2

10

ist.

Wenn ja ( k - ( f ^ - D / 2 = 0) , 1 2

JUMP = CHS

dann Sprung nach LABEL CHS. Sonst weiter mit Schritt 194.

17-4.2

Integration der F-Verteilung

417

Fortsetzung von Programm N r . 2 9 Integration der F-Verteilung b ) f\

und f

ungerade

Schritt-Nr.

Befehle

194

1

195

STO + 10

196

2

197 198

RCL χ 10

Erl uterungen

| k: = k + 1

-|

2 k - 3

199 200

+

201

RCL 02

3 f 2 + 2k - 3

202 203

(

2O4

2

205

RCL χ 10

2 k - 1

206 207

1

208

)

209

f 2 + (2 k - 3)

210

RCL χ 09

211

STO χ 11

Γ* G

212

RCL 11 STO + 13

R": = R " + G

213 214

JUMP .

R cksprung nach LABEL ·

215

LABEL CHS

216

RCL 03 2

(2 k - 1) f

217 218

X

+

219

1

220

=

221

1/x

k

P

C

k-l

ι/(ι+χ2)

. . .

V

+ (2k - 3) (2 k - 1)

V

418

17. Statistische Testverfahren Fortsetzung von Programm N r . 2 9 Integration der F-Verteilung b) f.

und f

Schritt-Nr.

ungerade Befehle X

222

a

223

(

22k

1

225

RCL + 02

Erl uterungen -i

1 ( ——Ϊ ) ~^~ 1 + χ

226 22?

2

228

)

229

-1

230

RCL χ 13

R it

/V

i.

231

RCL χ 03

Multiplizieren des in

o 1 + x2

ΐJ

ι

"

Schritt 230 berechneten Ausdrucks mit χ 232

RCL χ 1Ί

233

X

23^

100

Multiplizieren mit Q

1

235

1 + χ

236 237 238

RCL 15

239

STOP

STO 16

B

»STO 16

1A - B

RCL - 16

Ausgabe S in Prozent f r den Fall, da und gr

f ^ und f„ ungerade er als

1 sind.

17.4.2

Integration der F-Verteilung

419

Programmablauf Zu Beginn sind die Werte für F, f.. und f Öl und 02 einzugeben. Danach ist [START)

in die Speicher 00,

die Tastenfolge

|jUMP|

|START|

zu betätigen. Nach Ablauf von einigen Sekunden er-

scheint das Ergebnis, nämlich die Fläche unter der F-Verteilung zwischen 0 und F in der Anzeige. Der Wert wird in

Pro-

zent der Gesamtfläche unter der F-Verteilung angegeben, die gleich l gesetzt wird. Da die Berechnung über Reihenentwicklungen abläuft ( Berechnung von R, R ' f

bzw. f

bzw. R"

abhängig,

und Q ) , ist

die Rechenzeit von

da die Anzahl der Reihenglieder eine

Funktion der Freiheitsgrade ist. sind für einige Werte von F, f

In der folgenden Tabelle 72 und f» die Rechenzeiten

wie die berechneten Flächenwerte angegeben und mit den

soent-

sprechenden Sollwerten verglichen. Bei der Anwendung des Programms muß übrigens vor dem Programmlauf geprüft werden, ob entweder f . oder f _ geradzahlig ist

oder ob beide Freiheitsgrade ungerade sind. Entsprechend

ist

entweder der Programmteil a) oder der Teil b) anzuwenden. Tab.72

Vergleich berechneter und tabellierter Flächenwerte und Angabe der Rechenzeiten

f

l

f

2

F

t( s e c )

S ( b e r ) (°/o)

S( soll)

1

1

161,447

1,5

94,999990

95

1

9

3,36030

5,5

89,999987

90

9

1

59,8575

5,5

89,999993

90

10

9

2,4l631

6,5

89,999943

90

9

10

2,3^730

6,5

89,999936

90

49

49

1,96259

65

98,999987

99

50

50

1,94896

26

98,999980

99

100

100

1,59766

50

98,999925

99

125

125

1,51966

164

98,999922

99

k20

l?. Statistische Testverfahren

Man erkennt, daß für ungerade Freiheitsgrade f . und f„ die Rechenzeiten erheblich größer als für gerade Freiheitsgrade sind. Die Abweichung der berechneten von den tabellierten Flächenwerten ist praktisch vernachlässigbar. Sie rührt u.a. auch daher, daß auch die tabellierten F-Werte nur "Näherungen" sind, da die letzte Stelle stets a u f - oder abgerundet

ist.

Neben der "exakten" Lösung des F-Integrals gibt es - wie bereits erwähnt - eine Reihe von mehr oder weniger genauen Approximationen. Eine relativ einfache Lösung stellt die Näherung von Paulson ( 1 2 ) dar. Danach gilt: +z

S (%)

= 50 + -|—

\

Normalverteilung

(250)

-z

1

mit

z = —_

- 9%} -

(1

-

_2_ ) f.

Das Integral der Normalverteilung kann dabei mit Hilfe von Programm 12 oder 13 gelöst werden. Der Rechenaufwand ist

- wie

man erkennt - erheblich geringer als bei der "direkten" Integration der F-Verteilung über das Programm 29. Ein entscheidender Nachteil ist

aber die geringere Genauigkeit, insbeson-

dere bei kleinen Freiheitsgraden, wie sie in der Praxis sehr oft

vorkommen ( d i e Anzahl der Wiederholungsmessungen muß meist

sowohl aus Kosten- wie auch aus Zeitgründen beschränkt w e r d e n ) . Der Fehler ist

besonders groß, wenn die Fläche

( 9 9 % und mehr) b e t r ä g t . In Tab.73 sind für

nahe 10O %

einige Werte von F,

und f „ die nach den Gleichungen 250 und 251 berechneten Flächen unter der F-Verteilung den theoretischen Werten gegenübergestellt.

17.4.2

Tab. 73

Integration der F-Verteilung

Vergleich approximierter

421

und exakter

Flächenwerte unter der F-Verteilung

f

l

1

f

2

F

S(ber. )

S(soll)

1

161,447

90,9605

95

2

2

19,000

94,1133

95

5

5

5,050

94,8856

95

20

20

2,124

94,9939

100

100

95,0105

95 95

1,392

.

1

10

4,965

95,1790

95

3

50

2,790

95,0733

95

1

1

405284

94,9836

99,9

2

2

999,000

5 20

5 20

29,752

99,1637 99,8262

99,9 99,9

4,290

99,8939

100

100

1,867

99,8989

99,9 99,9

1

10

21,040

99,8936

3

50

6,336

99,8917

Für hohe Freiheitsgrade ( f j und f,, > 10) ist Lösung ohne w e i t e r e s anwendbar. Für kleinere sollte man aber besser auf die

99,9 99,9

die angegebene Freiheitsgrade

"exakte" Lösung nach Programm

N r . 2 9 zurückgreifen.

17.4.3

Signifikanzschranken der F-Verteilung

Die angegebenen Gleichungen 250 und 251 zur approximativen Berechnung der Fläche unter der F-Verteilung kann man auch nach F auflösen und somit auch für sowie beliebige Freiheitsgrade f

eine gegebene Sicherheit S und f,, die zugehörigen F-

Werte ermitteln. Die entsprechenden Gleichungen lauten dann:

422

17. Statistische Testverfahren

(252)

q =

(253)

- s

7]="\/ln -\

(254)

q =

T\-

A = —

B =

a + 77 (a, + a„ 77) -2.-i-i-2-1l + Tl (b 1 + 7 7 ( b 2 + b 3 7] )

(l - - - )

2

(255)

(256)

2(1- - r - ) (l - -— )

(257)

(258)

P = B/A

(259)

r = C/A

(260)

(26D F = U3

Die Gleichungen 252-262 müssen für und f

(262)

gegebene Werte von S%, f .

abgearbeitet werden. Man erhält dann einen Näherungs-

wert für F, so daß die Fläche unter der F-Verteilung zwischen

17.4.3

0 und F dem durch S% gegebenen prozentualen Anteil der fläche

423

Signifikanzschranken der F-Verteilung

Gesamt-

zwischen 0 und Unendlich entspricht.

Die Konstanten a

bis a und b bis b in G1.255 müssen o

Ein Unterschied z w i s c h e n ^ ,

t(99,9%f)

und yu„ kann statistisch stark bzw.

S°/o(TAU,f) > 9 9 , 9 %

gesichert bzw. hochsignifikant nachgewiesen werden. Der vorhandene Unterschied zwischen x. und x 2

ist

stark gesichert auf einen systematischen Einfluß zurückzuführen.

Rechengang A

TAU =

S

d =

( U n t e r s c h i e d zwischen_s

-

X

n

2 n

n

l

l

+

und s2_-"- s i_Zuf all

2 n

(263)

2

(264) n

l

+

n

2 -

(265)

Integral der t-Verteilung = S % ( t = T A U , oder

t

= e

3 2 ax +bx +cx + + dd

mit

= 1/f

f)

= l /n 1 + n 2 -

(siehe Abschnitte 13.4.3 und 13.4.5)

17.5-1

t-Test / Testvoraussetzungen

und Durchführung

Rechengang B (Systematischer Unterschied

zwischen s

433

und s )

(266)

2 S

2 2

.2

n

f

= S

I

2 l

2

+ l

S

f

(

n 2 2 x2

-

(26?)

2

V n

+ l

Der berechnete f - W e r t wird dann gerundet.

Integral der

oder

t = e

t-Verteilung = S % ( t = T A U ,

3 , 2 ax + bx + ex + d

mit

f)

.,

= 1/f

Anschließend an den Rechengang A oder B e r f o l g t der V e r g l e i c h der Prüfgroße TAU mit S = 99%

den b e r e c h n e t e n t-Werten für

und S = 9 9 , 9 % . Oder man berechnet mit

t

S = 95%,

= TAU und dem

berechneten F r e i h e i t s g r a d f über das Programm Nr.18 das Integral der t-Verteilung. Entscheidung wie auf S.431 angegeben. Da für den "kompletten" t-Test auch der F-Test vorab durchg e f ü h r t werden muß, kann man es sich zunutze m a c h e n , daß die t-Verteilung e i g e n t l i c h nur ein Spezialfall der F - V e r t e i l u n g ist.

Einer Fläche unter der t-Verteilung in den Grenzen -t und

+t mit dem Freiheitsgrad f e n t s p r i c h t eine Fläche unter der F2 Verteilung zwischen 0 und F = t und den Freiheutsgraden f = l und f

= f . Zwischen beiden Verteilungen gilt also der Zusam2 menhang: F = t , f = l und f = f.

434

17· Statistische Testverfahren

Eine ausführliche Darstellung des Testablaufs sowie der Testvoraussetzungen findet man bei

Sachs ( 4 ) "Angewandte Sta-

tistik" sowie in dem Buch "Elementare Tests zur Beurteilung von Meßdaten" von R.Kaiser und G.Gottschalk ( 2 0 ) .

Bei dem Vergleich zweier Mittelwerte sind 2 Fälle zu unterscheiden, die einseitige und die zweiseitige Fragestellung.

a) Zweiseitige_Fragestellung In diesem Fall soll geprüft werden, ob sich /u.

und/u„

überhaupt unterscheiden bzw. ob ein systematischer Unterschied zwischen

und

überhaupt vorhanden ist.

also hier nicht, ob ja.. > /&„

Es interessiert

oder umgekehrt yU„ > A1! ist. Die

statistische Sicherheit für diesen "überhaupt" vorhandenen Unterschied zwischen ,u ter

und yu„ ist

gegeben durch die Fläche un-

der t-Verteilung zwischen t = - TAU und t = + TAU.

Die

Abb.37 verdeutlicht dies:

h"

S% (zweiseitig)

-r

Abb.37

=0

t

Fläche unter der t-Verteilung beim t-Test mit zweiseitiger Fragestellung

17.5.1

t-Test / Testvoraussetzungen und Durchführung

435

b ) Einseitige_Fragestellung Falls die Berechnung der Kenndaten ergibt, daß ist,

dann soll diesem Fall g e p r ü f t werden, ob a u c h y u

gilt. Ist umgekehrt x. / x, l

} /u 2

dann soll der t-Test mit einsei-

t

tiger Fragestellung zeigen, ob die Bedingung /u„ ^ ist.

^

/M

erfüllt

Die entsprechende statistische Sicherheit ist hier durch

die Fläche unter der

t-Verteilung zwischen - oo und + TAU ge-

geben, wie in Abb.38 dargestellt

ist:

S%(einseitig)

=0 Abb.38

+r

t

Fläche unter der t-Verteilung beim t-Test mit einseitiger Fragestellung

Bei gegebenem TAU-Wert gilt für

den Zusammenhang zwischen den

Flächen unter der t-Verteilung bei einseitiger und zweiseitiger Fragestellung:

S % ( e i n s e i t i g ) = 50 +

S%(zweiseitig)

(268)

436

17· Statistische Testverfahren

Aus den Abbildungen 37 und 38 geht hervor, daß für

einen gege-

benen TAU-Wert die Fläche unter der t-Verteilung größer

ist,

wenn nicht ein Test mit zweiseitiger Fragestellung sondern ein Problem mit einseitiger Fragestellung vorliegt. Ist z.B. bei zwei vorliegenden Meßreihen dann kann man die

die

Bedingung x_ L > x,,

erfüllt,

entsprechende Prüfhypothese /u^ > pi^ wesent-

lich schärfer testen als die "allgemeine" Testhypothese ja.^ :f:/a2 ( a l s o die These, daß überhaupt ein Unterschied zwischen /u^ und fir, v o r l i e g t ) . Es sollte daher vor Anwendung des t-Tests stets geprüft werden, ob der allgemeine zweiseitige Test nicht durch einen Test mit einseitiger Fragestellung ersetzt werden kann.

Aus den Abbildungen 37 und 38 geht weiterhin hervor, daß die Fläche unter der t-Verteilung mit steigendem TAU-Wert zunimmt. Je größer also TAU ist,

desto größer

ist

auch die an-

gebbare Sicherheit für eine signifikante D i f f e r e n z zwischen x_ L und x,,.

W e r t e t man die Gleichungen 263 und 266 aus, dann erkennt man weiterhin, daß - bei gegebener D i f f e r e n z x^x,, und gegebenen Streuungen s

und s l

der Meßwerte n

- der TAU-Wert mit steigender Zahl £

und n 2 zunimmt. Für die weitere Betrachtung

wollen wir annehmen, daß n.. = n„ = n ist. als die Sicherheit dafür größer, systematisch bedingt ist ansteigt. Dies ist

und nicht nur Zufalls ist,

die

wenn n

auch verständlich, da mit steigendem n auch

die "Zuverlässigkeit" der Mittelwerte werte für

In diesem Fall wird

daß die D i f f e r e n z x1 - x2

"wahren" Werte /u

und

und /a.

als Schätz-

größer wird.

Aus den gemachten Ausführungen ergibt sich die interessante Frage, wieviel Einzelwerte die beiden Meßreihen jeweils aufweisen müssen, um nachweisen zu können, daß eine gegebene Differenz x^ -

nicht nur zufällig sondern durch irgendei-

nen systematischen Unterschied in beiden Meßreihen verursacht wird. Das Problem kann durch systematisches

Suchen gelöst wer-

den. Man berechnet zunächst für eine gegebene Differenz und gegebene Standardabweichungen s

und s„ für

l

-

steigende Werte

17.5-1 von n

t-Test / Testvoraussetzungen und Durchführung

= n_ = n

die

437

entsprechenden Werte von TAU. D e r j e n i g e

- W e r t , für den das Integral der t-Verteilung (Programm N r . l S ) dann größer als 99% ist, werte dar, die

stellt die Mindestzahl der Einzel-

jede Meßreihe aufweisen muß. In Tab.75 sind für

einige Werte von n die berechneten Werte für

TAU und das

ent-

sprechende Integral z u s a m m e n g e s t e l l t , wobei angenommen w i r d , daß die D i f f e r e n z der beiden M i t t e l w e r t e

=

-

die Streuung in jeder Meßreihe 0,3 b e t r ä g t ( s lage der Berechnung ist

= 0,5 und = s ). Grund-

dabei die G1.263.

Abhängigkeit des TAU-Wertes sowie des zuge-

Tab.75

hörigen t-Integrals ( z w e i s e i t i g ) von der A n z a h l der

Meßwerte n

renz s

l =

l S

-

= n

-i = 0,5

= n

bei

gegebener D i f f e -

und gegebenen Streuungen

2 = °'

Fläche S unter der n

=

l

'

2

TAU

=

V e r t e i l u n g in Prozent

3

1,12

67,5

k

1,29

5 6

1,44

75,5 81,2 85,5 94,4 99,4 99,9985 99,999999914

1,58

10

2,04

20

2,89

50

4,56

100

6,45 9,13 14,43

200 500

t-

99,999999997 99,999999997

Man erkennt, daß mit steigender Anzahl der Meßwerte die

sta-

tistische Sicherheit für einen systematischen und nicht z u f ä l ligen Unterschied von

und

gegen 100% geht. Für die Praxis

ergibt sich nun folgende w i c h t i g e R e g e l : Ein geringer Unterschied zweier a r i t h m e t i s c h e r M i t t e l w e r t e kann nur dann als

"statistisch g e s i c h e r t " angesehen w e r d e n ,

438

17- Statistische Testverfahren

wenn die Anzahl der Einzelwerte groß ist. sen,

in beiden Meßreihen hinreichend

Nur dann kann man mit genügender Sicherheit nachwei-

daß der vorhandene geringe Unterschied nicht nur zufalls-

bedingt ist, Einfluß

sondern seine Ursache in einem

systematischen

hat.

Andererseits kann man große Mittelwert-Unterschiede noch mit einem kleinen Stichprobenumfang als

auch

statistisch ge-

sichert nachweisen.

17.5.2

Rechenprogramm zum t-Test

Das folgende Programm b e s t e h t aus k Abschnitten. a)

Eingabe der Einzelwerte beider Meßreihen und Bildung folgender '

Summen:

ZX2 '

'

n

< " 2 '

Berechnung der Kenndaten

c)

2 2 Berechnung der Testgröße F = s /s 2 2 F = s /s

wenn

s

^> s

ist

ei

n

'

b)

l

,

l

, s , s , n. und n_ £

l

= n

- l

l

falls s . > s

^

bzw.

( i m letzten Fall gilt

für die zugehörigen Freiheitsgrade: f f

2

! ! ) . Test-Entscheidung

= n„ - l und

dann nach den auf

S.392 angegebenen Kriterien.

d)

Je nach Ausgang des F-Tests Berechnung der Prüfgröße TAU und des Freiheitsgrades f

über Rechengang A

(Gleichungen 263-265) bzw. Rechengang B (Gleichungen 266+267). Die Test-Entscheidung muß dann über die Integration der Verteilung bzw. die Berechnung der t-Werte

erfolgjen.

t-

17-5-2 Programm Nr.30

Rechenprogramm zum t-Test

Vergleich zweier M i t t e l w e r t e (t-Test) Rechnermodell: Compucorp 327

Speicherbelegung:

R C L1

0

1

--

F f

l

TAU f S

S

Das Programm ist

so a u s g e l e g t ,

welche der beiden Streuungen s

? /n l

2/n2

daß automatisch g e p r ü f t w i r d , und s

größer

ist.

439

44ο

17« Statistische Testverfahren

Schritt-Nr.

Befehle

1

0

2

STO 01

3 4 5 6 7 8 9 10 11 12 13

STO 02

14

Erl uterungen "

L schen der Register f r Bildung von Σχι '

STO 03 STO 04

η

ι

1

·Σ"χο

'

^—

έ.

Σχί »

Σχι

'

""-

die

und

ώ

£i

LABEL 1

1.1

Ausgabe von i.l

RCL + 03 KENNZAHL STOP

i = lfd. Nr. des einzugeben-< den Wertes der 1. Me reihe Eingabe x . der 1. Me reihe

STO + 0 1 x2 STO + 02 1

als Kennzahl

x

2

ΣχΙ

JUMP 1

19

LABEL 2

20

1.2

21

RCL + 06

22

KENNZAHL

den W e r t e s der 2. Me reihe

23

STOP

Eingabe x.

24

STO + 04 x2

1 n : = n

+ 1

STO + 03

27

STO + 05 1

28

STO + 06

29

JUMP 2

26

o

STO 05 STO 06

15 16 17 18

25

n

Ende des Eingabeteils

R cksprung nach LABEL 1

- Ausgabe von i. 2 als Kennzahl

i = lfd. Nr. des einzugeben-

x

1

n

der 2. Me reihe

2

2 : = "2

+ 1

R cksprung nach LABEL 2

17-5-2

Rechenprogramm zum t-Test

Fortsetzung von Programm N r . 3 0 Vergleich zweier M i t t e l w e r t e Schritt-Nr.

Befehle

30

LABEL 3

31

RCL 01

32

RCL : 03

33

STO 07

34 35

RCL : 06

36

STO 08

37 38 39 40

RCL 02

-^—

> STO 07

*^

v errn rt Q

ΓΓ 2

n

v 2 Zxl ~

2

1 n

, τ-x , 2 2. i>

(

RCL 01 2 X

4l

RCL : 03 :

43 44

( RCL 03

45 46

-

47 48

)

n

i ~ *

1 =

49 50

-T"

51 52 53 54

RCL 05

55 56

RCL : 06

59 60 6l

Xj =

RCL 04

42

57 58

Erl uterungen

s1

» STO 09

STO 09 y 2

1

ZX2

n

RCL 04 2 X

: ( RCL 06 1 )

"2 -

1

2

,y ^

,2 X2

441

442

17. Stattistische

Testverfahren

Fortsetzung von Programm Nr.30 Vergleich zweier M i t t e l w e r t e Schritt-Nr. 62

63 64 65 66 67

Erl uterungen

Befehle

= s

—> STO 10

STO 10

~| Berechnung von s

RCL 09 RCL - 10

s

JUMP - 4

dann ist

- s

- s . Wenn

kleiner als Null auch s

< s

ist,

. In

diesem Fall Sprung nach LABEL 4. Tritt die Bedingung nicht ein (s

> s 2 ) , dann weiter mit

Schritt 68

68 69 70

RCL 09 RCL 2

: 10

7l 72

STO

11

RCL 03 1

75 76

STO 12

77

RCL 06

80 8l

82 83 ^-* J 84

ψ

X

73 74

78 79

2 l 2· —»STO 11

s

F =

f

= n

-

1

» STO 12

= * f 2 = n2 -

1 —> STO 13

1 =

STO 13

1 1

JUMP 5 LABEL 4 RCL Ρ Γ ΤJ_< x\v^

··

2

86

X

87

STO

2

1

10 OQ \J y

S

T?

s

11

2

i

-

Λ °ΤΠ

11

17-5.2

Rechenprogramm zum t-Test

Fortsetzung von Programm Nr.30 Vergleich zweier M i t t e l w e r t e Schritt-Nr.

Befehle

88

RCL 06

89

-

90 91 92 93 94 95 96 97 98

1

Erläuterungen

f 1 = n2 - 1

» STO 12

f

> STO 13

STO 12 RCL 03 1

= n

-

1

=

STO 13 LABEL 5

Berechnung der Prüfgrößen TAU und der

Freiheitsgrade f

Rechengang A

RCL 07

99 100

RCL - 08

101

x-ABSOLUT

102

STO 14

103

RCL O3

4 105 106

1

RCL 09 2

109

+

X

110

(

111

RCL 06 , .,·, s

S

und

fi

= n 2 -l = 8 - 1 = 7

l

sowie f

= n -l

= 8 - 1 = 7 .

Die Integration der F-Verteilung l i e f e r t dann S = 6 5 , 0 %. Damit ist

der Unterschied zwischen s

den t-Test ist

und s

rein z u f ä l l i g . Für

also Rechengang A anzuwenden.

Da hier nur g e p r ü f t werden soll, ob

nur zufällig oder

auf Grund irgendeines systematischen Einflusses ist,

größer

als

liegt hier ein Problem mit einseitiger Fragestellung

vor.

Die Anwendung der Gleichungen 263-265 l i e f e r t zunächst: TAU = 4 , 0 3

und f = 14 .

Daraus ergibt sich bei Anwendung von Programm Nr.18 für Fläche unter der

die

t-Verteilung zwischen -TAU und +TAU: 5=99,88%.

l?. Statistische Testverfahren Nach G1.268 gilt für die statistische Sicherheit der Bedingung systematisch größer als

:

S(einseitig) = 50 +

99

Damit ist

^88

= 9 9 , 9 4 %.

eindeutig nachgewiesen, daß der Wassergehalt der

Charge 2 im M i t t e l größer als der Gehalt der Charge l

17«5»5

ist.

Stichprobenumfang beim Vergleich zweier Mittelwerte

Mit Hilfe des t-Tests ist

es - wie bereits erwähnt - mög-

lich, den Einfluß von Parametern auf eine Meßgröße festzustellen. Will man z.B. prüfen, ob die Schwingungsdauer eines Pendels abhängig ist

von dem geographischen O r t , an dem der

Versuch durchgeführt wird (unterschiedlicher Einfluß der Erdbeschleunigung) , dann geht man folgendermaßen vor: An zwei möglichst weit auseinander

liegenden Orten wird die Schwingungs-

dauer jeweils mehrmals gemessen. Mit den so erhaltenen zwei Reihen von E i n z e l w e r t e n führt man zunächst den F-Test

durch.

Dieser wird vermutlich so a u s f a l l e n , daß ein Unterschied in den Streuungen der beiden Meßreihen nicht nachweisbar ist. Man kann den t-Test nach Student (Rechengang A, Gleichungen 263 -265) anwenden. Zeigt sich, daß die beiden Mittelwerte

und

x» sich systematisch unterscheiden, dann liegt irgendein Einfluß vor, der b e w i r k t , daß die Meßwerte der einen Meßreihe systematisch größer bzw. kleiner als die Werte der anderen Reihe sind. Dieser E i n f l u ß könnte z.B. die an verschiedenen Orten tatsächlich unterschiedliche Erdbeschleunigung sein. Da aber andererseits dieser Unterschied zwar meßbar, jedoch nur relativ gering sein d ü r f t e , werden sich wahrscheinlich die beiden M i t t e l w e r t e scheiden.

und

ebenfalls nur wenig unter-

Da man die Streuung des "Meßverfahrens" als bekannt

voraussetzen kann, ergibt sich daher folgende Frage: Wieviele Einzelwerte muß jede Meßreihe aufweisen, damit

17.5-3

Stichprobenumfang beim M i t t e l w e r t - V e r g l e i c h

455

ein gegebener Unterschied|

STO + 8

JZ(^/x ± ) 2

X

1

n:

= n + 1

STO + 0 35 36

37 38 39 40 4l 42 43 44 45 46 47 48 49 50 51 52 53 55 56 57 58 59

JUMP 0 LABEL 1 RCL 1 RCL : 0

R cksprung nach LABEL 0

1 -

A

ι

n

y-_-

£- A

RCL : 0

Ausgabe x.A — 1 V X B n 2. XB

STOP

Ausgabe χπ

STOP RCL 2

RCL 1 RCL - 2

I X A ' XB|

RCL : 0

x-ABSOLUT : ( RCL 8

Σ(Λ*^2

RCL 7 2 X

"[Ζ(ζ/ν]2Λ

RCL : 0 : RCL 0 n - 1 1 ) =

17.7

467

Differenzen-t-Test

Fortsetzung von Programm Nr.32 Differenzen-t-Test Erläuterungen

Befehle

Schritt-Nr. 60

f-

6l

)

62

=

63 64

X

RCL 0

65 66

•T"

67 68

STOP

1 Vi^1 J TAU

=

RCL 0

69 70

-

71 72

=

Ausgabe TAU ~l

f = n - 1

1

STOP

J

Ausgabe f

Beispiel 39 Mit einem Pflanzenschutzmittel behandelte Baumwolle soll auf Rückstände u n t e r s u c h t werden. Da die Analysen aus Zeitgründen nicht sofort nach Erhalt der Probe vorgenommen werden können, soll untersucht w e r d e n , ob die Lagerung bei N o r m a l t e m p e r a t u r bzw.

bei

-20

C einen unterschiedlichen E i n f l u ß auf das Ana-

lysenergebnis hat. Dazu werden 8 erhaltene Proben jeweils halbiert und 8 Teilproben bei Normaltemperatur gelagert (Gruppe A ) sowie die anderen 8 Teilproben bei -20°C

(Gruppe B). N a c h

ei-

ner b e s t i m m t e n Zeit werden die Analysen durchgeführt und lief e r n folgende Ergebnisse ( m g / k g ) ;

X

A1 =

= 0,15 = o,6o A4

X

X

B1=

= 0,14 = 0,85 = 0,30

x A6 = o , o 7= o , 5 i x A8 = 0,19

B5= °' 4 0 x ß6 = 0 , 5 3 X B? = 0 , 5 1 XoO= °, 6 Z l

468

17. Statistische Testverfahren

Programmablauf: a)

|JUMP| ISTARl

7

.. l

b)

Eingabe χ

= O,40

0.4000 /

L.2 =0,45

Eingabe

7 0.4500 /

fcTARTl !.l

=0,15

Eingabe

0.1500

ISTARTJ

7

!.2

= 0,14

Eingabe

0.1400

/

ISTARTl usw. bis alle 8 Wertepaare eingegeben sind.

c) IJUMPI | i | |START| Ausgabe

χ

Ausgabe

χB

Ausgabe

TAU

L

0.318? / 0.4773

/

2.8995

/

[START] Ausgabe

f

L

7.0000

17.7 Durch Integration der

Differenzen-t-Test

469

t-Verteilung (Programm Nr.18) mit f = 7

und t = TAU = 2,8993 erhält man für die Fläche unter der Verteilung zwischen -TAU

und +TAU: S = 9 7 , 7 % . Damit ist

tein

Unterschied zwischen den Mittelwerten der beiden Gruppen immerhin wahrscheinlich,

obwohl die Streuungen der Einzelwerte

innerhalb der beiden Meßreihen wesentlich D i f f e r e n z der beiden Mittelwerte

-

größer sind als

die

= 0,1588.

Führt man nun mit den gleichen Meßreihen einen "normalen" t-Test durch, so erhält man mit H i l f e des Rechengangs A im Programm Nr.30: TAU = 1,5707. Die Integration der t-Verteilung mit

f = nA + n ß - 2 = 14

und t

= TAU = 1,5707 liefert dann:

S = 86,14%. Ein Unterschied der M i t t e l w e r t e

A

und

D

ist al-

so über den "normalen" t-Test aus den gegebenen Daten statistisch nicht nachweisbar. Das Ergebnis lautet demnach, daß die unterschiedliche Lagerung der Analysenproben bei Normaltemperatur und bei

-20 C

wahrscheinlich einen Einfluß auf den Gehalt hat. Denkbar wäre z.B.

( d a der mittlere Gehalt bei Gruppe A kleiner als

bei

Gruppe B i s t ) , daß die Lagerung bei Normaltemperatur zu einer teilweisen Zersetzung der Substanz führt.

17.8

-Test (Attributive Prüfung) Die Anwendbarkeit des t-Tests nach Student bzw. des D i f f e -

renzen- t-Tests ist

- neben anderen bereits dargelegten Voraus-

setzungen - an die Bedingung geknüpft, Größe

daß die

eine Variable darstellt. Dies b e d e u t e t ,

untersuchte daß der Meß-

wert innerhalb bestimmter durch die Theorie bzw. Praxis vorgegebenen Schranken theoretisch jeden beliebigen Wert annehmen kann, insbesondere

also gebrochene Zahlenwerte.

Sehr oft t r i t t aber das Problem a u f , daß das Ergebnis

ei-

ner Messung nur eine Ja-Nein-Entscheidung ausgedrückt werden kann. Das Ergebnis kann also nicht jeden beliebigen Wert annehmen, sondern nur zwei "Werte", etwa die Alternative Nein.

Ja-

17- Statistische

Testverfahren

Beispiele a) Sterben Insekten nach Behandlung mit einem Insektizid ? b) Tritt bei der Anwendung eines blutdrucksenkenden Mittels bei Patienten eine Wirkung ein ?

u. a.m. *7

Es sei

p = ——— die

Wahrscheinlichkeit d a f ü r , daß von N zu

untersuchenden O b j e k t e n Z O b j e k t e ein bestimmtes Merkmal

zei-

gen. Auf die obigen Beispiele bezogen bedeutet dies: a)

Von N mit einem Insektizid behandelten Insekten sterben nach einer bestimmten Zeit genau Z Tiere.

b)

Von N P a t i e n t e n , die zeigt sich bei

ein Medikament eingenommen haben,

genau Z Personen eine Wirkung. Bei den an-

deren ( N - Z ) Patienten ist

das Medikament wirkungslos.

Untersucht man nun 2 Gruppen im Sinne der o.g. so daß also die

I.Gruppe Z

1

von N

1

und die

Beispiele,

2. Gruppe Z 0 von N £

£t

O b j e k t e n mit entsprechender Wirkung a u f w e i s t , dann wird es meist so sein, daß sich die Anteile Z . /N

und Z /N

unterschei-

den. Frage: Sind die Unterschiede der beiden relativen Anteile p =Z /N

und p 2 =Z 2 /N„ nur z u f ä l l i g ,

oder ist

eine

sys-

tematische Beeinflussung die Ursache für den Unterschied ? Dem dargestellten Problem liegt die Binotnialver t eilung zugrunde. Der interessierte Leser kann sich hierüber

ausführ-

lich in dem Buch "Angewandte Statistik" von Lothar Sachs ( k ). informieren.

Man kann diese Binomialverteilung

für das be-

handelte Problem dann durch eine Normalverteilung annähern, wenn die

von Gottschalk ( 3

) genannten folgenden Bedingungen

e r f ü l l t sind:

9

(273)

17· 8

-Test für attributive Prüfung

Zur Entscheidung, ob vorhandene Unterschiede zwischen p p

zufällig oder systematisch bedingt sind, ist

Prüfgröße

A=

und

die f o l g e n d e

. zu bilden:

'

P l 1

~ P2 _ 2' S d

(274)

Dabei gelten folgende Beziehungen:

P

fl l~ N j

(275)

(276)

P=

(277)

q 1 2 = l - P 12

(278) N +N

S

d =

P - 1

(279)

-

Nach Umformung ergibt sich dann für die Prüfgröße

(N N

1N2

(Z

Zur Test-Entscheidung schen - A. und dafür,

2Z1-N1Z2)2

1+Z2) integriert man die Normalverteilung zwi-

+ A. . Man erhält direkt die

Wahrscheinlichkeit

daß sich die beiden Wahrscheinlichkeiten

p. und p

sys-

tematisch unterscheiden und ihre D i f f e r e n z n i c h t nur z u f ä l l i g bedingt ist.

Zur Integration der Normalverteilung können die

Programme Nr.12 bzw. Nr.13 angewandt werden. Treffen die

in G1.273 genannten Bedingungen nicht zu, dann

muß auf den exakten Test von Fisher für

den Vergleich der

Wahr-

472

17. Statistische Testverfahren

scheinlichkeiten zweier Binomialverteilungen auf Grund kleiner Stichprobenumfänge zurückgegriffen werden ( 4 ).

Beispiel 40 An einem Stamm von Trogoderma granarium (Khaprakäfer) werden 2 verschiedene Insektenvernichtungsmittel a und h hinsichtlich ihrer Wirkung überprüft. Einwirkungszeit sowie Temperatur waren bei beiden Mitteln gleich. Dabei wurden folgende Ergebnisse erhalten:

Z = Zahl der benen Tiere

N = Zahl der eingesetzten Tiere

gestor-

Mittel a

28? = N t

59 = Z 1

Mittel b

493 = N 2

127 = Z 2

Für die Mortalitätsraten folgt damit: pa = P j = Z 1 /N 1 = 59/287 = 0,2056 Pb = P 2 = Z 2 /N 2 = 127/493 = 0,2576 Durch Einsetzen der Werte für Z 1 , N 1 , / 2 und N g in G1.280 erhält man A = 1,6445. Das Programm Nr. 12 liefert dann für die unter der Gauß-Verteilung zwischen S = 89,993%. Nach den auf S. 359 f.

. und +

Fläche

den Wert

angegebenen allgemeinen

Kriterien für die Beurteilung von Hyptothesentests ist tematischer Unterschied zwischen den Werten p

und p

ein

sys-

aus den

gegebenen Daten nicht nachweisbar. Eine unterschiedliche Wirkung der beiden angewandten Mittel kann somit nicht nachgewiesen werden. Die Voraussetzungen für die Durchführung des Tests nach G1.273 sind übrigens e r f ü l l t , wie man sich durch Einsetzen der W e r t e von N

M i t t e l a:

l

bzw. N 0 überzeugen kann: Ä

= 0,03

Z x i- d k = Ο

= -

2

0

>

δ-ι

Allgemein erh lt y = a

48l

.x - d

=

x - d

= 0

man f r ein Polynom N - t e n Grades, also f r

+ a χ + aox

2

+

···

f r

+

a

NX

J = °

N die

bis

Bez enun

i

J =N

S en:

(283)

N Durch Einsetzen von y. - f ( χ . ) = y. - (a + a χ + ... + a x ) J i i i l N f r d ergeben sich schlie l i c h die f o l g e n d e n Beziehungen: K.

482

18.

Korrelations- und Regressionsrechnung

Σ < y± -

a 0

- aix -

:N) = 0

(284)

;N) = 0

(285)

i\ \ -^ - a Ar x; N ) = = 0 0 N

(286)

- a x - a x - . . . - a x ) =0

(28?)

2/ 2 {.( Jy. - a - a.x - a„x - ... i i o 1 2

J~x ( y

-a

Daraus resultiert nach Ausklammern und Weglassen der Indizes der

4. Schritt:

A u f s t e l l e n der Bestimmungsgleichungen zur Ermittlung der Konstanten a

a

o

+ +

. n

Γχ1

Q 2_x

r- 2 a o 2_x

y- N

( ^_x

Man erkennt, da Funktion y = a

bis

2 x ++ aa Z Γχ a

+

a

V 3

!2.x

3 X 2^-Γχ

++

aa

+

a

r- N+l + a 1 ^x +

V ^

2-£ X

++

aA

++ aa N

··· '··

"""

Ν

x Γχ 2.

++a

Ν+1 3 J γ 5~χ Na N*-^

+

N •^-X

a

T"

-- 2.T

-κ."χ y V

1

— ^ ΤΓ

V

N+2

r-N+2 r-2N a 2 ^_x + ... + a N ^x

r- N - Z.x 2

man f r ein Polynom N - t e n Grades, also f r die + a.x

+ a_x

+ ...

+ a χ

mungsgleichungen f r die Konstanten a

bis

N-t-1 lineare Bestima

erh lt.

Die Sum-

men stellen dabei die K o e f f i z i e n t e n des Gleichungssystems dar und sind aus den gegebenen n Datenpaaren x/y zu bilden. F r Polynom N - t e n Grades ben tigt man folgende Summen:

ein

18.2

Methode der kleinsten Fehlerquadrate

483

(288) Zweckm

igerweise bildet man im Rechner diese Summen in Kon-

stantenspeichern

ber die im Abschnitt 6 . 2 . 5 beschriebene Spei-

cherarithmetik. Man ben tigt dann f r ein Polynom N - t e n Grades f r die Summen selbst 3N+2 Speicherpl tze und 2 weitere Speicher als

"Hilfsspeicher", wenn man die Summenbildung

Programm vornimmt. Polynome 1. bis

In der folgenden

ber

ein

Zusammenstellung sind f r

3. Grades die zu bildenden Summen, die Anzahl

der Bestimmungsgleichungen zur Ermittlung der Konstanten a bis

a

des Polynoms sowie die Zahl der Konstantenspeicher-

Pl tze auf dem Rechner f r die Summenbildung gegen b e r g e s t e l l t . Tab.?6

Summenbildung bei der Summen

Polynom y = &Ο+Λ^Χ

bedarf

W2 , ^ W^ Λ.

YX-

2

5 (+2)

3

8 (+2)

4

11 ( + 2 )

n

k

y* y y ,y y x fc—

* ·

^"yx

+ a χ

Speicher-

Gleichungen

^>_X , ^ .

^_*

y = a + a.x y l 2

Zahl der

Σχ > Σχ * Z"y £yx ,

y = a + a.x ·* l 2

Fehlerquadratmethode

,

n

^χ,^χ 2 ,Γχ 3 r- Ί

r- 5

r- 6

r

y χ j" χ2

2_x , 2.x , 2. x

v- 3

^_yx ,

n

n = Anzahl der Datenpaare x/y

484

18. Korrelations- und Regressionsrechnung

Programm Nr.33

Summenbildung für

die Erstellung der

Bestimmungsgleichungen zur Ermittlung der Konstanten eines Polynoms 1. 3. Grades

Speicherbelegung:

bis

(Compucorp 327)

= = =

z*2 z*3 z*4 z*5 z*

X. l

Bei der Summenbildung in dem folgenden Programm wurde das Prinzip der "Multiplikation mit einem konstanten Faktor"

aus-

g e n u t z t , das im Abschnitt 5 . 2 . 6 , S.51 beschrieben ist. Außer2 Summe der y -Werte e r m i t t e l t ,

dem wird im Speicher 14 noch die

die man zur Berechnung des Korrelationskoeffizienten b e n ö t i g t . Das Programm ist

so ausgelegt, daß die Eingabe der x-Werte

durch eine l als Kennzahl (links in der A n z e i g e , ohne Nullen nach dem Komma) und die Eingabe

der y-Werte durch eine 2

Kennzahl angezeigt wird. Dadurch wird die Dateneingabe

als

etwas

übersichtlicher. Die Summen werden dann automatisch gebildet.

18.2

Schritt-Nr.

Befehle

Erl uterungen L schen der

1

CLEAR R E G .

2

LABEL 0

3 4

KENNZAHL

Ί

/l.

/

STOP

Eingabe x .

6

STO 11

x.

7 8

2

STO 11

1

(L

KENNZAHL

9 10

STOP

STO 12

y.

11

RCL 11

x.

12

STO + 01

13

x

14

—

15

STO + 02

Eingabe y .

STO 12

Zxi 2

x1 . x

Zi

3 x1

16

ΣχΙ

STO + 03

4

18

X.

1

19

STO + 04

20

=

21

STO + 05

22

—

23

STO + 06

24

RCL 11

χ

ΣΙ χ51

& 6

χ1 . 5χ6 -ι

χ.1.y .I N

25

x

26

RCL 12

27 28

STO + 07

Σ?ί

= STO + 08

χ . ·y . i i 5~x . . y .

29

Speicher

1

5

17

485

Methode der kleinsten Fehlerquadrate

J

j

1

Ι 1

l

1-14

486

18. Korrelations- und Regressionsrechnung Fortsetzung von Programm Nr.33 Summenbildung f r die Ermittlung der Konstanten eines Polynoms Schritt-Nr.

Befehle

Erl uterungen

30

2 χ. y.

31

STO + 09

χ

32

=

33

STO + 10

34

RCL 12

1

J

1

y

Σί i x 3 y. J 1

1

Σ*1 y± i

2

2 y i

35

X

36

STO + 14

37 38

1 STO 4-

39

JUMP 0

£Vi n: = n + 1

13

Je nachdem, ob man ein Polynom 1. Grades ( G e r a d e ) oder Polynom 2. oder 3. Grades sind die entsprechenden

ein

den gegebenen Daten anpassen will,

Summen den b e t r e f f e n d e n

Konstanten-

speichern zu entnehmen. Zu dem Programm ist χ, χ , χ , χ , χ , χ

noch zu bemerken, da

die Ausdr cke

usw. bzw. die entsprechenden Summen ohne

Zuhilfenahme der Potenz-Taste |a |gebildet worden sind. Dies war durch die sowohl Rechenzeit als

auch Programmspeicherplatz

sparende Methode der Multiplikation mit einem konstanten Faktor

5.

m glich.

Schritt: L sung des linearen Gleichungssystems

Die L sung des linearen Gleichungssystems kann nach einem der bekannten Verfahren zur Aufl sung von Gleichungen mit mehreren

18.2

Methode der kleinsten Fehlerquadrate

Unbekannten durchgeführt werden. Insbesondere G a u ß ' s c h e Eliminationsverfahren genannt (

48?

sei hier das

l ).

Auf eine Darstellung des vom Speicherplatzbedarf

und vom

Rechengang her ziemlich aufwendigen Verfahrens soll hier

ver-

z i c h t e t u n d einerseits a u f d i e Spezialliteratur ( 2 , 3 ) s o wie auf f e r t i g e Rechenprogramme von den H e r s t e l l e r n der Geräte verwiesen werden. Da die m e i s t e n Probleme aus der Korrelations- und Regressionsrechnung - eventuell nach Transformation der gegebenen Daten - mit einem Polynom I.Grades ( G e r a d e ) , einer quadratischen Parabel (Polynom 2 . G r a d e s ) oder einem Modell 3.Ordnung (Kubische Parabel)

gelöst werden können, sollen hier nur die

Auflösungen der entsprechenden Gleichungssysteme zur E r m i t t l u n g der Konstanten a , a.

( G e r a d e ) ; a , a., und a

r a b e l ) bzw. a , a . , a O

und a

l

j

(Quadratische Pa-

( K u b i s c h e Parabel)

genannt wer-

den.

Formeln zur Berechnung der Konstanten der polynomen Ausgleichsfunktionen a)

Gerade y = a

a

a

b)

i =

o

=

+ a

!·*2

n

"l , r- J

0,34

0,63 0,03 0,40 0,05

392,9 417,9 434,0 444,4 455,8

0,21 0,11

0,15

der berechneten y-Werte von den gegebenen y-

W e r t e n sind r e l a t i v gering. Eine B e u r t e i l u n g , ob sich die gegebenen Daten dem Funktionsmodell "gut" oder "schlecht" anp a s s e n , ist

aber in jedem Fall s u b j e k t i v .

Wenn das Funktionsmodell n i c h t von vornherein bekannt

ge-

wesen w ä r e , würde sich die Frage stellen, ob man einen funktionellen Zusammenhang zwischen dem Siedepunkt y und dem Druck

in der e r m i t t e l t e n Form als

"gesichert" ansehen kann,

oder ob der Zusammenhang in Form des angenommenen M o d e l l s aus den vorliegenden Daten "nicht nachweisbar" ist.

Dies würde be-

sonders dann schwierig w e r d e n , wenn die A b w e i c h u n g e n der "Meßpunkte" von der Ausgleichskurve w e s e n t l i c h

größer w ä r e n .

Ist

eine durchschnittliche Abweichung von 0 , 1 % oder von 5% noch als

"tragbar" anzusehen? Eine wirklich o b j e k t i v e

ist

durch eine willkürliche F e s t l e g u n g sicher nicht m ö g l i c h .

Beurteilung

Außerdem dürfte es auch von der Problemstellung a b h ä n g e n , wann man einen Zusammenhang in der angenommenen Form als

gesichert

und wann als n i c h t nachweisbar a n s i e h t . Als ein o b j e k t i v e r Maßstab dient der im nächsten behandelte K o r r e l a t i o n s k o e f f i z i e n t .

Abschnitt

l8. Korrelations- und Regressionsrechnung

18.3 Der Korrelationskoeffizient Mit der Ermittlung der Konstanten a Q , a.^

... usw. eines

Polynoms, das einer gegebenen Anzahl von Wertepaaren x/y angepaßt werden soll, ist

das Problem der Regressionsrechnung

gelöst. Bei der Korrelationsrechnung ist

es das Z i e l , überhaupt

erst einmal f e s t z u s t e l l e n , ob ein Zusammenhang zwischen den Größen

und y im Sinne einer angenommenen Modell-Funktion

rechtfertigt ist.

Dafür ist

o b j e k t i v e s Maß. Er ist

der Korrelationskoeffizient r ein

wie f o l g t

definiert:

Varianz der berechneten y-Werte Varianz der gegebenen y-Werte

Varianz = Quadrat der

ge-

(^22)

Standardabweichung

(323)

Dabei gilt:

,A -2 (y - y) J -

y = berechnet

(324)

- l

y = gegeben

n - l

(325)

18.3 Es l

Der K o r r e l a t i o n s k o e f f i z i e n t

t sich m a t h e m a t i s c h z e i g e n , da

495

nach der Methode der

kleinsten Fehlerquadrate, dem die obige D e f i n i t i o n des Korrelationskoeffizienten

zugrunde l i e g t , der M i t t e l w e r t der gege-

benen gleich dem M i t t e l w e r t der b e r e c h n e t e n y-Werte ist. kann in den Gleichungen 32^1 und 325 bei rianzen einheitlich

Daher

der Berechnung der Va-

y , d.h. das M i t t e l der gegebenen y-Werte

verwendet werden. Dies hat den V o r t e i l , da

man den Korrela-

t i o n s k o e f f i z i e n t e n r nur aus den gegebenen Daten und den nach der Methode der Fehlerquadrate e r m i t t e l t e n Konstanten des Ausgleichspolynoms berechnen kann. Das arithmetische M i t t e l der berechneten y-Werte wird dazu nicht ben tigt. Der K o r r e l a t i o n s k o e f f i z i e n t r, der die G te der Anpassung 2 N eines Polynoms y = a + a χ + a _ x + ... + a χ an die gegeben e n M e punkte P ( x / y ) , P ( x / y ) , J . J . - L c-, ε» ει kann b e r e c h n e t werden nach:

/ I

k=n
y) n ( *-

0 ^ r ^ 1

Ist

r = l,

dann ist

die Korrelation p e r f e k t ,

d . h . die angenom-

mene Funktion kann exakt den gegebenen n Datenpunkten angepa t werden. Ist

dagegen r = 0,

so kann ein Zusammenhang der

x- und y-Werte im Sinne der Modellfunktion aus dem gegebenem Datenmaterial nicht nachgewiesen werden. Die Korrelation daher umso besser,

r =

l

:

je n her r bei dem Wert l

ist

liegt.

P e r f e k t e Korrelation zwischen χ und y im Sinne der angenommenen Funktion

r =

0 :

Der Zusammenhang zwischen χ und y l

t sich

durch die angenommene Funktion nicht beschrei-

ben.

18. Korrelations- und Regressionsrechnung Für Polynome 1. bis

3- Grades gelten folgende Formeln zur Be-

rechnung des K o r r e l a t i o n s k o e f f i z i e n t e n :

Polynom

Korrelationskoeffizient

y = ao+

:32?) yJ = a +

Iy2 - ± < (328)

yJ = a + a.x o l

a_x

Liegen die gegebenen Punkte P 1 ( x 1 / y 1 ) , P 2 ( x 2 / y 2 ) exakt auf der Ausgleichskurve, dann ist

...

p

n(

x

n /y n )

die Korrelation im

Sinne des vorgegebenen Funktionsmodells p e r f e k t . Das b e d e u t e t , daß die Streuung der berechneten W e r t e mit der Standardabweichung der vorgegebenen W e r t e identisch ist. natürlich für die Quadrate der Streuungen,

Das gleiche gilt d . h . die nach Gl.

324 bzw. G1.325 berechneten V a r i a n z e n . Daraus f o l g t dann a u c h ,

18.3

Der K o r r e l a t i o n s k o e f f i z i e n t

daß, wie erwähnt, bei strenger Korrelation r den Wert l Eine Beurteilung von r d ü r f t e zwar nicht exakt gleich l ist,

hat.

auch dann einfach sein, wenn r aber diesem W e r t sehr nahe

kommt, also z.B. r = 0 , 9 9 oder r = 0 , 9 9 9 . Schwierig wird die Beurteilung dann, wenn r w e s e n t l i c h kleiner als

l ist.

Es ist

die F r a g e , wie klein r werden d a r f , um trotzdem von einer

"ge-

sicherten" Korrelation" im Sinne der Ausgleichsfunktion sprechen zu können. Um auch hier eine objektive Entscheidung t r e f fen zu können, bildet man die folgende P r ü f g r o ß e :

l TAU = ~\l[n - ( N + l ) j

Dabei ist

l - r

(330)

2

N der Grad des Polynoms,bzw. N + l ist

die

Anzahl der

zu bestimmenden Konstanten der A u s g l e i c h s f u n k t i o n ( G e r a d e : N = l i Quadratische Parabel: N = 2, Kubische P a r a b e l : N = 3 ) . Der Wert n gleich der Anzahl der Meßwertpaare x/y,

ist

aus denen mit H i l f e der

G a u ß ' s e h e n Fehlerquadratmethode die Konstanten der

Ausgleichs-

funktion e r m i t t e l t wurden. Die Testgröße TAU vergleicht man bei f = n - (N+ 1) Freiheitsgraden mit den Schranken der Verteilung

für

t-

S=95%, S=99% und 5 = 9 9 , 9 % . Oder man integriert

die t-Verteilung zwischen -TAU und +TAU . Für die

Entscheidung

gelten dann die in Tab. 77 zusammengefaßten K r i t e r i e n . Die o.g.

Beziehung für die Prüfgröße TAU z e i g t , daß für

einen gegebenen r-Wert die

Größe TAU mit wachsendem n zunimmt.

Da aber hohe TAU-Werte eine hohe statistische Sicherheit bedeuten,

läßt sich eine Korrelation zwischen

und y ( w i e d e r im

Sinne der angenommenen M o d e l l f u n k t i o n ) um so sicherer nachweisen,

je mehr Meßpunkte vorliegen. Dies ist

sehen. Liegen z.B.

auch leicht einzu-

3 Meßpunkte z u f ä l l i g auf einer Geraden, dann

ist die W a h r s c h e i n l i c h k e i t , daß und y t a t s ä c h l i c h linear korreliert sind, w e s e n t l i c h g e r i n g e r , als wenn z.B. 10 Meßpunkte mehr oder weniger exakt durch eine Gerade miteinander

verbun-

den werden können. Die Integration der t - V e r t e i l u n g l i e f e r t übrigens direkt

18. Korrelations- und Regressionsrechnung die Wahrscheinlichkeit

dafür,

daß die Größen

und y im Sinne

der Ausgleichsfunktion korreliert sind.

Tab.77

Kriterien für die Beurteilung des Korrelationsk o e f f i z i e n t e n r über die Prüfgröße TAU

T A U < t ( 9 5 % , f ) bzw.

Keine Korrelation im

S(TAU,f) 99,9%

gleichsfunktion

ist

statistisch stark gesichert bzw. hochsignifikant.

Beispiel 43 Für die Bestimmung des Siedepunktes von Schwefel in Abhängigkeit vom Druck wurden im Beispiel k2 die Konstanten für den funktionalen Zusammenhang zwischen dem Siedepunkt y und dem Druck

berechnet.

Zwischen dem Druck und dem Siedepunkt wurde

18.3 die

Beziehung

y = a

Der

+ a. x +

a

Korrelationskoeffizient ox

a

499

^ s gültig angenommen, und

es war Aufgabe der Regressionsrechnung, die Konstanten a , a. und a„ zu berechnen. Wenn die o . g . Beziehung aber nicht sicher ist,

d . h . nicht bekannt ist, ob der Zusammenhang zwischen y

und

tatsächlich durch eine Parabel beschrieben werden kann,

dann ist

es m ö g l i c h , durch Berechnung des K o r r e l a t i o n s k o e f f i -

zienten r diese Behauptung zu ü b e r p r ü f e n . Die n a c h G1.328 für die Berechnung von r nötigen Größen lauten: a o = 347,7529977 a t = 0,165585251 a, = -0,000050644

U

Z y x } = 1325023j392

k=0

JV

= 3243,4

£V2 = 1325034,0 l ( ^ " y ) 2 = 1314955,445 n

£Vx = 1486724,0

Jyx2 = 968688240,0

** " £ ^

^- 100 7 8,555

Durch Einsetzen in G1.328 erhält man:

- \ / 1 3 2 5 0 2 3 , 3 9 2 - 1314955,445 _ -W 10078,555 " Die Anwendung von G1.330 mit

Q u

'

n = 8 und N = 2 e r g i b t dann:

TAU = " \ / 8 - ( 2 + l ) ] -( 0 ^ 9 9 9 5 ) 2 W l - (0,9995)2

= 68,6

Die Integration der t-Verteilung (Programm N r . l S ) l i e f e r t mit f = n - ( N + l ) = 5:

S = 99,999999%.

Damit ist

der Zusammen-

hang zwischen Siedepunkt y und Druck durch die Beziehung 2 + a + a„x statistisch hochsignifikant gesichert.

y = a

Hierbei ist

allerdings zu b e a c h t e n , daß diese F e s t s t e l l u n g

500

l8.

nur für Ob ein

Korrelations-

und Regressionsrechnung

den mathematischen Zusammenhang zwischen physikalisch

und y gilt.

begründeter Zusammenhang in der

nen Form g e r e c h t f e r t i g t

ist,

angenomme-

kann aus der Korrelationsrechnung

nicht ersehen werden!

3 Punkte zur Bedeutung des 1.

Korrelationskoeffizienten

Der K o r r e l a t i o n s k o e f f i z i e n t

nur ein

Maß für

z.B. für

r

sowie die Testgröße TAU sind

den angenommenen Funktionstyp. Vermutet man

eine Reihe von Meßpunkten einen linearen Zusammenhang

zwischen

und y,

dann kann aus einem r-Wert nahe Null b z w . aus

einem TAU-Wert < t ( 9 5 % , f ) nur geschlossen w e r d e n , daß kein linearer Zusammenhang zwischen nicht,

und y b e s t e h t . Dies heißt aber

daß es gar keine Beziehung zwischen

und y gibt! Viel-

mehr kann nach anderen Funktionstypen durchaus eine Korrelation b e s t e h e n . F a l l s also T A U < t ( 9 5 % , f )

strenge

bzw. S % ( T A U , f )

< 9 5 % g i l t ) dann kann für das Beispiel der linearen Beziehung nur gesagt werden: Eine lineare Korrelation zwischen den Meßwerten y und den Variablen

kann aus den gegebenen Daten

sta-

t i s t i s c h nicht nachgewiesen werden. Als extremes Beispiel kann der Fall d i e n e n , wenn die Meß2 einer quadratischen Parabel (y = a + a + a x )

punkte auf

liegen. Berechnet man für

die in A b b . ^ 3 dargestellten Meßpunk-

te einmal den K o r r e l a t i o n s k o e f f i z i e n t ( G 1 . 3 2 7 ) und zum anderen für

für

das Geradenmodell

das Modell der Parabel

(G1.328),

dann e r h ä l t man: r

(Gerade)

= 0

und

r(Parabel) = l

.

Im allgemeinen werden die Verhältnisse nicht so extrem liegen, man sollte aber den grundsätzlichen Aspekt b e a c h t e n .

2.

Selbst wenn eine strenge K o r r e l a t i o n nachgewiesen werden

kann,

ist

damit noch nicht g e s a g t , daß auch ein kausaler Zu-

18.3

Der K o r r e l a t i o n s k o e f f i z i e n t

501

r(linear)=0 r(Parabel)=1

0

Abb.45

x

Zur A b h ä n g i g k e i t des K o r r o l a t i o n s k o e f f i x i e r t e n vom Funktionsmodell

sammenhang zwischen

und y im Sinne der Modellfunktion

be-

steht (Ursache-Wirkungs-Beziehung). Man muß also die Möglichkeit einer Scheinkorrelation

berücksichtigen. Wenn daher ein

mathematischer Zusammenhang in der

angenommenen Form zwischen

und y nachgewiesen werden kann, b e d e u t e t dies noch n i c h t , daß dieser Zusammenhang auch t h e o r e t i s c h gesichert

ist.

Beispiel Im Jahre 19?6 wurde in Bergenhusen ( S c h l e s w i g - H o l s t e i n ) wohl eine Zunahme der Störche als tet.

so-

auch der G e b u r t e n beobach-

Obwohl hier vielleicht ein kausaler Zusammenhang wün-

schenswert wäre ( e i n f a c h e Methode der G e b u r t e n r e g e l u n g ! ) ,

ist

18. Korrelations- und Regressionsrechnung

502

die Korrelation natürlich nur rein mathematischer Natur. Ein echter Zusammenhang besteht natürlich nicht.

3.

Der Wert r sowie die

Prüfgroße TAU hängen auch von der An-

zahl der Meßwerte a b , aus der sie berechnet wurden. Dabei gilt: Bei gleichem r-Wert,

der aus 2 unterschiedlichen Meßreihen mit

unterschiedlicher Anzahl von Datenpaaren resultiert, ist Korrelation bei großem

-Wert s t a t i s t i s c h gesicherter.

Die Größe des K o r r e l a t i o n s k o e f f i z i e n t e n allein ist kein Maß für

die

die

"Stärke" des im Sinne der

noch

Ausgleichsfunktion

angenommenen Zusammenhangs!

Beispiel kk Um die Linearität eines gaschromatographischen Detektors zu überprüfen, Stoffes bis

wurden steigende Mengen eines charakteristischen

in Form einer Lösung i n j i z i e r t , und zwar 2 0 , ^ 0 , 6 0 . . . .

1000 ng. Die Abhängigkeit der Peakfläche von der dosierten

Menge ist

in Abb.'l'l wiedergegeben.

Peakfläche

100 Abb.kk

H 200 300

1 1 400 500

1600

700 800 900 1000

x(ng)

Abhängigkeit der Peakfläche von der Stoffmenge

18.3

Der K o r r e l a t i o n s k o e f f z i e n t

Im einzelnen ergaben sich folgende

x(ng) = X

2

=

x(ng)

Fläche

°

x3 =

60

1370

x^ =

80

1420

X

7748

x35 = 700

15635

6387

x g = 720

15047

46

°

7915

24 =

48

°

3065

x 4 l = 820

3219

X

8913 5812

x 43 = 860 x 44 = 880 x^5 = 900

14512

X

14477 18597

=

21 =

4

10726

42

10050

°° °

x 22 = 440 X

Fläche

23 =

20

X

= 100

x(ng)

x3? x 38 *39 x^0

X

1953 x6 = 120 1921 x = 140 2838 4514 Xg = 160 x9 = 180 3425 x = 200 3066 x = 22O 9812 x 1 2 = 240 3814 3668 x..,= 260 13 x l 4 = 280 5715 3333 X 15 = 3°° x 6 = 320 3378 *17= 340 5799 x

Meßwerte:

Fläche

x l 8 = 360 x19 = 380

330 550

20 4

x 25 x , x 2? x 28 x 29

= = = = =

500 520 540 560 580

x

=

600

3O x 31 = x 32 =

6393

6315

8010 9080

740 760 780 800

13538 10938

8751 13145

16510

84

42 =

°

92

46 =

8732

9438 8427

°

- = 940

12415

10228

x 49 = 980

8031

x

13633

nach A b b . 4 4 zu urteilen durch die

18912

=1000

-

-

und der Fläche y

Beziehung y = a

dergegeben werden. Um zu überprüfen, nearen Zusammenhangs zwischen

= 960

.

8071 10090

Der Zusammenhang zwischen der Menge

r und die

= = = =

* f

620 640

x 33 = 660 x k = 680

len die Konstanten a

503

ob die Annahme eines

und y g e r e c h t f e r t i g t ist,

wielisol-

und a, sowie der Korrelationskoeffizient l Größe TAU einmal aus den ersten 4 Meßpunkten ( x bis

o

) und zum anderen aus allen 50 Datenpaaren ( x

bis

x-«)

m i t t e l t werden. Dabei erhält man folgende W e r t e : Meßpunkte x

n = 4

f

bis

x.

= 2

Meßpunkte x..

n = 50

a Q = 1027,024

a 1 = 20,450

a

= 0 , 9 4 5 5 TAU = 4 , 0 1

S =94,5%

r

bis

X

50

f = 48

a Q = -105,000

r

könnte

+ a

!= 13,659 = 0 , 8 2 2 ; TAU =

S = 99,999999%

9,98

er-

504

18. Korrelations- und Regressionsrechnung

Ergebnis: Obwohl im ersten Fall (Berechnung aus den ersten 4 Datenpaaren) der Korrelationskoeffizient r größer ist, linearer Zusammenhang zwischen

und y

gewiesen werden, da S = 94,5% STO 20

] J Ausgabe /\ y. Ausgabe

y

+ /7 y.

Ausgabe

y

~/^ Yi.

STOP

RCL - 20

STOP JUMP 3

Rücksprung nach LABEL 3

bewußt sehr ausführlich gestaltet worden, um

bei Vorhandensein eines Rechners, der über mindestens 20 Konstantenspeicherplätze verfügt, eine umfassende Information über die errechnete

Ausgleichsgerade

zu geben.

18.5·2

Rechenprogramm zur linearen Korrelation

523

Besitzt der Rechner nicht - wie in dem Programm vorausgesetzt - mindestens 20 Konstantenspeicher, sind aber wenigstens 6 Speicherplätze vorhanden, dann kann man zumindest die die Berechnung von a, b, r, TAU, ^a, ^b ,

s s

und und

für

y

not-

wendigen Summen

5x.

,

yx.

,

yy . ,

· , ^.y-x-

2-.

und

n

ermitteln. Die Programmausführung für

das Programm N r . 3 4 wird in dem

folgenden Beispiel erläutert.

Beispiel 46 Die Wirkung eines Vitamin-Präparates auf das Wachstum eines bestimmten Bazillus-Typs soll näher untersucht werden. Es besteht die Annahme, daß das Wachstum direkt proportional der Menge des Vitamins ist.

Die Wachstumsrate wird durch "Titra-

tion" des verwendeten Nährbodens mit KOH e r m i t t e l t . Die verbrauchte Menge Kalilauge ist

dann ein Maß für die Zahl der Ba-

zillen in der untersuchten Kultur. Insgesamt wurden 11 Präparate mit Mengen zwischen 0 und -12 5 0 Picogramm Vitamin/ml angesetzt ( l Picogramm = 1 0 g ! ) . Die Menge an verbrauchter KOH wurde nach erfolgtem Wachstum bestimmt und ergab folgende W e r t e : Vitamin

Verbrauch KOH

(pg/ml) x

1

=

0

X

2 = 5 x, = 10 X

4 = 15

x5 = 20 X

6

= 25

(ml)

y^ y2 y3 y4 y5 y6

= 0,75 =2,31 = 2,07 =2,39 = 3,48 = 3,33

Vitamin

Verbrauch KOH

( pg/ml)

(ml) = ^,46

x-, = 30

y

X

y8 = 4 , 3 2

7

8 =

35

7

x 9 = ^0

y9 = 5 , 1 2

x 1 0 = 45

y10=5 , 5 6

x

y t l = 6,60

n=

50

524

18. Korrelations- und Regressionsrechnung

Trägt man die verbrauchte Menge KOH gegen die

eingesetzte Men-

ge an Vitamin a u f , so ergibt sich das in Abb. 50a dargestellte Bild:

t / m / KOH] 7·6 5 · -·

3 -· 2 -1 ··

10

20

(Picogramm Vitamin/ml], 50 x

30

Abb.5Oa Abhängigkeit der Menge an verbrauchter KOH von der eingesetzten Menge Vitamin

Folgende Fragen sollen beantwortet werden: 1.

Ist

Menge

die Annahme eines linearen Zusammenhangs zwischen der an eingesetztem Vitamin und und der verbrauchten Menge

y an KOH g e r e c h t f e r t i g t ? 2.

Wenn j a , wie lauten die Konstanten a und b der

funktion y = ax + b und wie groß ist

Ausgleichs-

der Vertr.auensbereich von

a bzw. b?

3.

Wie groß ist

die "Streuung der Ausgleichsgeraden"?

4.

Wie groß ist

der zu erwartende Verbrauch an KOH bei einem

P r ä p a r a t , das 2pg/ml b z w . 27pg/ml Vitamin enthält? 5.

Wie groß sind die Vertrauensbereiche der in 4. ermittelten

Werte?

18.5.2

Rechenprogramm zur linearen Korrelation

525

Programmausf hrung: a) I JUMP [ | START | | START b)

A. Eingabe x. = 0

Γ

0.0000

7

0.7500

7

PSTART

(L Eingabe y

= 0,75

START

Λ. Eingabe x

= 5

5.0000

= 2,31

2.3100

| START

Eingabe y START

/U

Eingabe X I : L = 50

50.0000

START

7 Eingabe Y 1 1 = 6,60 | START |

/

6.6000 J

526

18. Korrelations- und Regressionsrechnung c ) Berechnung von a, b , r und TAU

Ausgabe r

0.9784

| START | Ausgabe a

0.1022

\ START | Ausgabe b

1.1154

| START |

/

Ausgabe TAU

M i t t = T A U = 14,2289 u n d f = n - 2 = l l - 2

14.2289

=9

Freiheits-

graden e r g i b t das Programm N r . l S (Inegral der t - V e r t e i l u n g ) : S = 99,99998%. Somit f o l g t als Ergebnis zu den Punkten 1. u . 2 . : Die lineare Korrelation zwischen der Vitamin-Menge χ und dem Verbrauch y an KOH ist

statistisch stark (hochsignifikant)

sichert. Die Konstanten a und b der a = 0,1022

und

ge-

Funktion y = ax + b lauten

b = 1,1154 .

Damit lautet die Gleichung f r den Zusammenhang zwischen χ u.y: y = 0,1022 χ

d)

+

1,1154

Berechnung von ZI a ,

.

y-x

| JUMP | [ 2 | [ START | Ausgabe /l a 0.0162

]

0.4808

]

START Ausgabe /7 b

18.5.2

Rechenprogramm zur linearen Korrelation

52?

| START Ausgabe s y _ x

Die Vertrauensbereiche

f

0.5768

/

für die Steigung der Ausgleichsgeraden

bzw. den y-Achsenabschnitt haben demnach die Werte ^a = 0,0162 (

= 15,9% von a) und ^b = 0 , 4 8 8( = 4 3 , 0 % von b ) .

Somit ergibt sich für den B e r e i c h , Konstanten (X und

a

a -

/J

in dem die "wahren"

liegen:

= 0,1022 - 0,0162 = 0,0860

a + ^a = 0,1022 + 0,0162 = 0,1184 b - 2^b = 1,1154 - 0,4808 = 0 , 6 3 4 6 b + ^ / b = 1,1154 + 0,4808 = 1,5962 0,0860 9 9 , 9 % ist,

kann eine Abwei-

chung der Steigung a " der Geraden vom Sollwert a = 1 statiso tisch gesichert (hochsignifikant) nachgewiesen werden. Das bed e u t e t , daß beim V e r f a h r e n a Uberbefunde festgestellt werden, weil die Steigung a ' > l ist.

Aus der Zusammenstellung der Meß-

werte auf S.533 erkannt man auch, daß für die Meßreihe a sämtliche y-Werte größer sind als die entsprechenden x-Werte. Nach dem Verfahren b kann eine Abweichung der Steigung a 1 vom Sollwert 1,000 nicht f e s t g e s t e l l t werden, da hier die der Prüfgroße TAU entsprechende Sicherheit nur 2 7 , 6 % beträgt. Damit arbeitet das V e r f a h r e n b einwandfrei. Es sei

hier noch einmal b e t o n t , daß die Test-Aussage sich

immer nur auf die vorliegenden Daten stützt. Liegen mehr Meßwerte vor,

so kann das Ergebnis des Tests durchaus ein anderes

sein. Das Test-Ergebnis muß also immer in der Form "Aus dem vorliegenden Datenmaterial ergibt s i c h . . . " angegeben werden. Ein Beweis im mathematischen Sinne

ist

nicht möglich.

18.6 Prüfung von Meßwerten auf Normalverteilung Für die Durchführung des t-Tests nach Student sowie für den F-Test war eine Voraussetzung, daß die Meßwerte normalverteilt sind. Liegt eine größere Zahl von Einzelwerten vor, die man in Klassen einteilen kann, dann wendet man für

die Prüfung

der Daten auf Normalverteilung den s o g . Chi-Quadrat-Test an. Diese Prüfmethode ist tistik" von L. Sachs Da bei zelwerte

ausführlich

in dem Buch "Angewandte Sta-

beschrieben.

den m e i s t e n Versuchen aber nur r e l a t i v wenige Ein-

zur Verfügung stehen,

Wahrscheinlichkeitsnetz chen werden

soll hier nur der Test über das

bzw. die

"Hazen" sehe Gerade" bespro-

( 5 ).

Bekanntlich kann die W a h r s c h e i n l i c h k e i t , einen Meßwert innerhalb der Grenzen x. und x

anzutreffen

unter der Normalverteilung zwischen den. Voraussetzung ist

und

durch die Fläche ausgedrückt wer-

n a t ü r l i c h , daß die W e r t e überhaupt

ei-

ner Gauß-Verteilung gehorchen. Es gilt dann: X

P(x 1

^ x ^ x p ) = ---, ^ STO 8

36

X

37 38

2

39 40 4l 42

100

Schritt-Nr.

1

2 P . / 100

= 1 2 P ./100 - 1

43 44 45

x-ABSOLUT

47

1

48 49 50 51 52 53 54

2 P./100 - 1

CHS

1 -

2P./100 - 1

2 q

2

i 2

1/x

^2 1/q*

In

In ( 1/qJ )

X

STO 9

?7 .-» STO 9

55 56

RCL

57

RCL + 1

58

RCL

59 60

RCL + 0

6l 62

(

RCL 9

63

RCL

2

9

^ä 7 ?! a

^i

U

l

ao +

7]±

5

1 "**

vu

a

2 ( i

+ a

27?i)

±(&

+

a27?±)

54l

542

18. Korrelations- und Regressionsrechnung

Fortsetzung von Programm N r . 3 5

Prüfung von

Meßwerten auf Normalverteilung Schritt-Nr.

Befehle

Erläuterungen

64

RCL + 4

b2 + b

65

RCL

9

7

66

RCL + 3

b

67 68 69 70

RCL

?i(b2

l

+ 7

T[ +

±

Mi}

?i ( b 2

+

Mi>

7] i (b 1 + 7] ± (b 2 + *> 3 7? ± ))

9

+ 1

i +7^i(b1 +7]±(b2

}

ao

71

+7?i(.1 +

b37?i))

+

a27|.)

72

STO - 9

c.

73 74 75 76 77 78 79 80 8l 82 83 84

RCL 8

Prüfung,

ob P. ^ 50

-

Dies ist

der F a l l , wenn

50 =

P.

JUMP -= 1 RCL 9

Sonst weiter mit Schritt 78

85 Das Programm ist

CHS

1

- 50 ^

ist.

ist.

Dann er-

folgt Sprung nach LABEL 1.

]

z . = - c. 1

STOP

Ausgabe

z.

JUMP 0

Rücksprung Nach LABEL 0

LABEL 1 RCL 9

STOP JUMP 0

1 J

Z

i = Ci Ausgabe z^

Rücksprung N a c h LABEL 0

b e e n d e t , wenn für i = l bis i = n alle z . -

Werte berechnet sind. Man trägt diese dann gegen die entsprechenden x . - W e r t e in einem Koordinatensystem gegeneinander auf.

18.6

Pr fung von Me werten auf Normalverteilung

543

Beispiel 50 Von 17 M nnern wurde der gemessen. Es soll gepr ft verteilung folgen. χ α = 128

Blutdruck (maximaler A r t e r i e n d r u c k ) werden, ob die Werte einer Normal-

Die Einzelwerte lauten:

Torr

χ

= 132 Torr

x 2 = 122

xg = 127

x_ = HO

x„ = 118

x 13 = 156 Torr x l i t = 137 = 148

15 i6 x1? = 136

x 10 = 139 χ5 = 134 x6 = 151

X

x

il= 129 x 12 = 125

Ordnet man die Werte nach aufsteigender Gr Programm N r . 1 0 ) , dann erh lt χ

= 110 Torr

" "

e ( z . B . ber das

man folgende Reihe:

χ

= 129 Torr

χ

X

=

ΊΊ -v ι4 ~~— Ι 1UU

"

= 134

χ

»

136

X

X 2 = 118

"

χ

= 122

"

i x.

x^ = 125

"

x

χ

= 127

"

x

n=

χ. = 128 b

"

X

12 =

io=

132

= 142 Torr

= 148

16 = x 1? = 156

137

Programmablauf: a) | JUMP | | START | | START |

/o. b)

Eingabe n = 17

/

/

17.0000 /

START

/o. c)

Eingabe i = 1

l START | Ausgabe z

/ /

/ 1.0000 /

1.8899

18. Korrelations- und Regressionsrechnung

544

| START

/o. Eingabe i = 2

2.0000

| START | Ausgabe z,-,

1.3519

START

{L 16.0000 7

Eingabe i = 16 START |

1.3519

Ausgabe z /START |

7

{»L Eingabe i = l?

17.0000

START [ Ausgabe z

1.8899 y

17

F r i = l bis i = 17 ergeben sich somit folgende z^Werte: i

χ1 .

1

110

2

118

3 4

122 125

5 6

127

7 8

129 132

9

134

128

z.

i

1,8899 1,3519 l ,0^91 o ,8206 0,6285 ο,Ί57Ί 0,2988 o, 1476 0,0000

10

1

χ1 .

12

136 137 139

13 14 15 16 17

144 148 15l 156

11

142

z.

1

-0,1476 -0,2988 -0,4574 -0,6285 -0,8206 -l ,049l -1,3519 -1,8899

18.6

545

Prüfung von Meßwerten auf Normalverteilung

Wie man aus der folgenden Abb. 54 e r k e n n t , kann man die Punkte x . / z . recht gut durch eine Gerade verbinden.

Damit

ist

die

Annahme einer Normalverteilung der Meßwerte durchaus gerechtfertigt.

110

V.O

130

150

160

170

j = Blutdruck [Torr] Abb.54

z . - W e r t e als i

Funktion der Meßwerte

i

Man kann den linearen Zusammenhang zwischen x. und z . auch durch eine Korrelationsrechnung

ü b e r p r ü f e n . Unter Anwendung

des Programms Nr.34 erhält man für die l? Wertepaare x . / z . : r = - 0,998 TAU = 6 2 , 4 l f

= l? - 2 = 15

Die Integration der t-Verteilung mit

t = TAU und f = 15 Frei-

heitsgraden l i e f e r t dann S = 9 9 , 9 9 9 9 9 · . % - Damit kann die Annahme einer Normalverteilung der Meßwerte nicht widerlegt werden.

Da die Berechnung der z-Werte nicht ganz exakte Ergebnisse liefert,

ist

das V e r f a h r e n mit einer kleinen " U n s i c h e r h e i t "

behaftet

und im mathematischen Sinne nicht ganz "exakt".

546

18. Korrelations- und Regressionsrechnung

18.7. Nicht lineare Korrelation und Regression Bei vielen Problemstellungen, bei denen man zwischen einer Variablen will, ist

und einer Meßgröße y einen Zusammenhang ermitteln das Modell einer Geraden nicht anwendbar, wie die

folgenden Beispiele zeigen:

Radiaktiver Zerfall von Phosphor-32 y=a-e - bbxx

a=100

b = 0,0i87= In 2/(x.

1/2

y=Prozent Radiaktivität der Ausgangsmenge

0 Abb.55

20

i.0

60

xfTejt] 8

Z e r f a l l eines radioaktiven Präparates

Der Zusammenhang zwischen dem prozentualen Anteil y einer zur Zeit ist

vorhandenen Menge an radioaktiver Substanz und der Zeit gegeben durch die Funktion:

y = a ·e

-bx

(357)

18.7

Nicht lineare Korrelation und Regression

y f Adsorbierte Gasmenge in 10" Mol /cm 2

Adsorption von CO? an Glimmer a= Sättigungsadsorption= A,1510 Mol/cm y=Adsorbierte Gasmenge pro Oberflächeneinheit x= Druck in dyn/cm 2

20

40

Abb.56

100

120

Adsorption von CO

s/mj

20

60

UO

160 x[dyn/cm 2 ]

an Glimmer

Geschwindigkeitsverteilung f ü r Sauerstoff bei 0 C

b=7.036-10~ 6 [s 2 /m 2 ] y=Häufigkeit=Bruchteil der Moleküle, deren Geschwindigkeit zwischen w und w+1 m/s liegt. x=Geschwindigkeit der Moleküle in m/s

10 ··

0

200

Abb.57

400

600

800

1000

x[m/s]

Geschwindigkeitsverteilung von 0 2 ~Molekülen

5*7

18. Korrelations- und Regressionsrechnung Bei der Behandlung nicht linearer Ausgleichsmodelle muß man unterscheiden zwischen linearisierbaren und nicht linearisierbaren

Funktionen.

18.7.1

Linearisierbare Funktionsmodelle

Unter linearisierbaren Funktionsmodellen v e r s t e h t man solche, die sich nach Anwendung einer geeigneten in eine Gerade umwandeln

Transformation

lassen. Mit den transformierten Wer-

ten kann dann eine lineare Korrelations- bzw. Regressionsrechnung durchgeführt werden. Dies ist

wesentlich einfacher

als die direkte Anwendung der "Methode

der kleinsten Fehler-

quadratmethode" auf die eigentlichen

Ausgleichsfunktionen.

Für die folgenden Betrachtungen sei Funktion y = f ( x ) als

Modell gegeben ist

angenommen,

daß eine

und n Wertepaare x/y

vorliegen. Nach einer geeigneten Transformation resultiert als neue Ausgleichsfunktion

die Geradengleichung y ' = a ' x ' + b ' . In

die eigentliche Korrelations- bzw. Regressionsrechnung sind also die durch Transformation entstandenen Wertepaare x ' / y ' einzusetzen. Wir wollen weiter annehmen, daß die Funktion y = f (x) Konstanten a und b e n t h ä l t , also z . B . die Form hat y = a e

die .

Die durch Anwendung einer linearen Korrelations- bzw. Regressionsrechnung a' und b

1

auf die x ' / y ' - W e r t e p a a r e erhaltenen Konstanten

können dann in die eigentlich gesuchten Konstanten

a und b umgerechnet werden. Es ist

allerdings zu beachten,

daß die Methode der Berech-

nung der Konstanten a und b über die Transformation nicht ganz exakt ist.

Bei der direkten Anwendung der Funktion y = f (x)

haben die nach der Methode der kleinsten Fehlerquadrate ermittelten Konstanten a und b gegenüber den "wahren" Of und

Ij

einen geringfügig anderen Fehler als

lung von a und b über die rade y ' = a ' x ' + b »

Parametern

bei

der Ermitt-

durch Transformation erhaltene Ge-

In den meisten Fällen kann aber dieser ge-

18.7-1

Korrelationsrechnung / Linearisierbare Modelle

549

ringe Unterschied vernachlässigt werden. Eine ausführliche Darstellung dieses Problems findet

sich bei H.Späth ( 3 ).

In der folgenden Übersicht sind die w i c h t i g s t e n Modelle y = f ( x , a , b ) , d.h. also Funktionen mit zwei K o n s t a n t e n , sowie die entsprechenden Transformationen und Funktionsbilder zusammengestellt.

Gegeben :

y = f ( x , a, b)

Transformierte Funktion : Funktion

Transformation

yJ = - + b

y = a

y' = a'x'

y'

+ b' Funktionsbild

1/x

a' = a b' = b y=b

y=

y=

b+x

+ b

l —= y

b — a

+

a'

= b/a

b'

=

l — a

i/y

y=a

ax y=._ b+x

l/a

1 1 — = — y a

+

b a

i/y

b1 a'

y=x+b a1 = b1

l/a

= b/a

x=-b

550

18. Korrelations- und Regressionsrechnung

Funktion y=ae

y=ae

bx

b/x

Transformation

y'

In y = In a + bx

In y

a1 =

b

b1 =

In a

In y = In a + —

a' =

b

b1 =

In a

Funktionsbild

b1

In y

y=a

y=e

ax +bx

In; χ

= ax

+ b

In y

bx

a' = a b1 = b

y=a Inx + b y = a(In x) + b a'

= a

b1 = b

In χ

y

18.7.1

Korrelationsrechnung / Linearisierbare Modelle

Funktion

Transformation

bx

a +b χ

y=a-x-e

y= a - χ

2 bx y=ax·e

a' =

b

b' =

In a

lny=ln a + b Inx a' =

b

b' =

In a

In - - = In a + bx

Funktionsbild

y' b(

in* χ

Iny

In·

Inx

b'

a'

b1

b b1 =

In a

= a χ + b

y=ax +bx

a'

= a

1

= b

b

y=x2lax+bi

551

18. Korrelations- und Regressionsrechnung

552

Beispiel 51 Von einem Pflanzenschutzmittel wird eine Abbaureihe b e s t i m m t , d.h.

es wird u n t e r s u c h t , wie groß die Rückstände auf einer be-

stimmten Kultur in bestimmten Zeitabständen nach Anwendung des Mittels sind. Es wird angenommen, daß die Abbaureaktion nach der Beziehung y = a· e

v e r l ä u f t , wobei

b·

die Zeit und y die Konzentration des Mittels

darstellt. Die Rückstände wurden nach 0,

l , 2, 3, 4, 5 i 6, 7, 14 und

21 Tagen nach Ausbringung des Mittels bestimmt und haben

fol-

gende Werte x(Tage)

y(ppm)

x(Tage)

0

12,0

5

1

10,3 9,0 7,8 7,1

6

2 3 4

7 14 2l

y(ppm)

6,4 5,6 4,7 2,0 0,9

Wie man aus der Zusammenstellung der Modellfunktionen

entneh-

men kann, lautet die Transformation: y'

= In y = In a + b ·

Dies b e d e u t e t , daß die y - W e r t e , bevor sie in eine lineare Korrelations- bzw. Regressionsrechnung

eingesetzt werden können,

logarithmiert werden müssen. Dies kann auf dem Rechner in

ein-

facher Weise durch Drücken der ln-Taste erfolgen. Dann kann das Programm Nr.34 angewandt werden. Ist

die Transformation etwas komplizierter, dann

empfiehlt

es s i c h , die entsprechenden Schritte in das Programm einzubauen und zwar zwischen den Eingabe-STOP-Befehl und den Folgeschritt ( a l s o zwischen den Schritten 5 und 6 bzw. 12 und 13).

18.7-1

Korrelationsrechnung/ Linearisierbare Modelle

553

Bei Anwendung des Programms N r . 3 ^ ergibt sich folgender A b l a u f : 1 JUMP | | START] | START |

A. Eingabe χ.

= 0

/

L

0.0000

/

1 START |

/

/2.

Eingabe y

= 12,0

12.0000 /

/

2.48^9

/

]

| START |

Λ.

Eingabe x_ = 1

/

ι

1.0000

/

| START |

/

/2.

Eingabe y

= 10,3

/

10.3000 /

/

2.3321 J

| START |

• ]

/I.

Eingabe X I G = 21

/

21.0000

/

| START | /

/2.

Eingabe y

START

=0,9

/

0.9000

/_

0.1053 /

/

18. Korrelations- und Regressionsrechnung Berechnung von a' , b ' , r , TAU, S%, a und b JUMP | | l |

[ START |

Ausgabe r

/-

0. 9 9 9 4 ]

\ START l Ausgabe a 1

0.1251

[START Ausgabe b '

/

2.4501

/

Ausgabe TAU

/

85. 77 42

/

Wie man erkennt, liegt der K o r r e l a t i o n s k o e f f i z i e n t r sehr nahe bei -1.

Dies b e d e u t e t , daß die x-Werte und die Logarithmen In

der y - W e r t e sehr gut negativ korreliert sind. Mit steigendem x-Wert nehmen also die I n y - W e r t e linear ab. Um diesen Sachverhalt statistisch zu untermauern, berechnet man über das Programm N r . l S die Fläche unter der t-Verteilung zwischen t = + TAU und t = - TAU mit f = n-2

= 10-2 = 8

Freiheitsgraden. Das Programm l i e f e r t S = 99,9999%. Damit der lineare Zusammenhang zwischen In y und

ist

statistisch stark

gesichert ( h o c h s i g n i f i k a n t ) . Nach der auf S.550 angegebenen Übersicht f o l g t für Konstanten a und b der Funktion y = a - e

die

:

= 11,5895 b = a'

= - 0,1231

Damit lautet die Funktion für den Zusammenhang zwischen

y; y = 11,5895 e-°' 1231

und

l8.7-l

Korrelationsrechnung / Linearisierbare Modelle

In Abb.58 ist

555

die Funktion ihrem Verlauf nach graphisch dar-

gestellt :

x(50%) = Zeit, nach der noch 50% der Menge y vorhanden sind. x(50%) Abb.58 Der Wert y den Wert

Verlauf der Funktion

y = a· e

bx

ergibt sich, wenn man in die berechnete = 0 einsetzt. Man erhält: y

Funktion

= 1 1 , 6 ppm.Dieser W e r t

stimmt recht gut mit dem Meßwert y = 12,0 ppm überein. Interessant ist

in diesem Zusammenhang die Frage, wann nur

noch 50% der Anfangskonzentration y

vorhanden sind. Man be-

zeichnet die entsprechende Zeit als Halbwertzeit. Man erhält sie, wenn man in die Gleichung y = 11,5095 e ~ 0 , 1 2 3 1 x für y den Wert 11,5895/2 = 5 , 7 9 4 8 einsetzt und die Gleichung dann nach

auflöst:

5 , 7 9 ^ 8 = 11,5895 e _

In 5 , 7 9 ^ 8 - In 11,5895 -0,1231

_ ~

- 0,6931 - 0,1231

_ ~

Nach 5 , 6 3 Tagen sind also noch 50% der Ausgangskonzentration von 11,6 ppm vorhanden. Hierbei ist gangskonzentration y telte Konzentration Meßwert!

zu b e a c h t e n , daß als Aus-

die über die Ausgleichsrechnung ermitzugrunde gelegt wird und nicht der gegebene

556

l8. Korrelations- und Regressionsrechnung

18.7.2

N i c h t linearisierbare Funktionsmodelle

Ebenso wie man linearisierbare Modelle auf eine Geradengleichung zurückführen kann, lassen sich o f t m a l s auch Funktionen mit mehr als in

ein

2 Konstanten durch geeignete

Polynom der

Form y'

= a

umwandeln. Die entsprechenden

+ a x'

+

,,

Transformation 1

+ ...

+ a x'

Konstanten a , a , a„ usw. kön-

nen dann nach der Methode der kleinsten Fehlerquadrate ermittelt werden. Ein Beispiel ist

die Funktion zur Berechnung der t-Werte:

t = exp (-^r + -

Durch Setzen von y ' = In t

+ ~^- + d)

und

x'

.

= 1/f

erhält man daraus

die Polynomfunktion

y'

= a x ' 5 + b x ' 2 + ex' + d

.

Die entsprechenden Konstanten können dann nach den auf S.487 f angegebenen Gleichungen aus den entsprechenden Summen ermittelt werden. Auf diese Weise sind die auf S.248 in Tab.58 angegebenen Konstanten für die Berechnung der t-Werte für

verschiedene

statistische Sicherheiten gefunden worden. Dabei sind die

für

verschiedene Freiheitsgrade und statistische Sicherheiten tabellierten t - W e r t e ( 6 ) zugrunde gelegt worden.

19. Liste der Programme

Nr.

Programmbezeichnung

Seite

1

Berechnung von n! für n ^ 69

123

2

Berechnung von n! für

125

n > 69 mit der

Stir ling- Formel

3

Berechnung der Gamma-Funktion

128

k

Berechnung von

133

5

Arithmetischer M i t t e l w e r t

159

6

Arithmetischer- M i t t e l w e r t

160

(

)

( v e r e i n f a c h t e s Programm)

7

163

Arithmetisches Mittel für klassierte

Werte

8

Geometrisches M i t t e l

9

Indirekte Speicheradressierung

171

(Eingabe von n E i n z e l w e r t e n in Konstantenspeicher

177 die

1 bis n)

10

Sortieren von Daten /

11

Spannweite /

12

Integration der N o r m a l v e r t e i l u n g

Medianwert

Größter u. kleinster W e r t

( Reihenentwicklung)

182 189 205

558

19- Liste der Programme

Nr.

Programmbezeichnung

Seite

13

Integration der Normalverteilung

210

(Polynomapproximation) 14

Signifikanzschranken der

21?

Normalverte ilung 15

226

Standardabweichung und arithmetisches M i t t e l

16

Berechnung von t-Werten

248

17

Vertrauensbereich

255

des M i t t e l w e r t e s

für beliebige stat. Sicherheiten

18

Integral der t-Verteilung

2?4

19

Vertrauensbereich der Standardabweichung

292

20

Berechnung des Toleranzintervalls

306

21

Stichprobenumfang bei

316

definiertem

Vertrauensbereich 22

Zufallszahlengenerator für

ganze

325

Zahlen zwischen p und q 23

Randomis ierung

332

24

Normalverteilte Zufallszahlen

338

25

Poissonverteilung,

350

Einzelwahrseheinlichke it 26

Poissonverteilung, Zusammengesetzte

353

Wahrscheinlichkeit 2?

Ausreißertest nach Graf und Henning

365

28

Trendtest nach Neumann

386

19-

Liste der Programme

Nr.

Programmbezeichnung

Seite

29

Integration der F-Verteilung

403

f

405

1

f

und f und f

i»

geradzahlig ungeradzahlig

1

409

30

Vergleich zweier Mittelwerte (t-Test)

439

31

Stichprobenumf ang für

455

32

D i f f e r e n z e n - t-Test

464

33

Methode der kleinsten Fehlerquadrate

484

den t-Test

( Summenbildung)

34 35

Lineare Korrelation und Regression

515

Prüfung von Meßwerten auf

539

Normalverteilung (Hazensche Gerade)

559

20. Register der Beispiele

Beispiel

Theorie

Seite

1

Klassieren von Schrauben aus einem Produktionsprozeß

Klassieren von Meßwerten/Häuf igkeitsdiagramm

153

2

Arithmetisches M i t t e l aus 10 Einzelwerten

Arithmetischer

l60

Nr.

3

Mittlerer Durchmesser von roten Blutkörperchen

Mittelwert Arithmetisches

164

M i t t e l aus klassif i z i e r t e n Daten

>i

Eichung einer Analysenwaage

Spezielle Methoden zur Berechnung des arithm. Mittels

166

5

Keimzahl in Milchproben

Geometrisches M i t t e l

172

6

Durchschnittsgeschwindigkeit eines Fahrzeugs

Harmonisches M i t t e l

174

7

Sortieren von 5 W e r t e n

Sortieren von Daten

179

8

Größter und kleinster W e r t einer Datenreihe

Spannweite

191

9

Streuung bei der Blutdruckmessung

Integration der Normalverteilung

207

10

Ausschuß bei einem Produktionsprozeß

M

tl

215

11

Analyse von Lebensmitteln

1!

It

215

auf 12

Pestizid-Rückstände

Eiweißgehalt im Blutserum

Signifikanz schranken der Normalverteilung

219

20.

Nr.

Beispiel

56l

R e g i s t e r der Beispiele Theorie

Seite

13

Wassergehalt von Cyclohexan

Berechnung der S tandardabwe ichung

227

14

K o n z e n t r a t i o n einer physiologischen Kochsalzlösung

Vertrauensbereich des M i t t e l w e r t e s (zweiseitig)

244

15

Qualitätskontrolle von Salzsäure

Vertrauensbereich des M i t t e l w e r t e s (einseitig)

245

16

Qualitätskontrolle eines pharmazeutischen Präparates

Berechnung des Vertrauensbereiches für beliebige s t a t . Sicherheiten

264

17

Mangangehalt einer Stahlprobe

Integration der t-Verteilung (zweiseitig)

280

18

Mangangehalt einer Stahlprobe

Integration der t-Verteilung (einseitig)

282

19

Streuung der Dicke von Aluminiumfolien

Vertrauensbereich der Standardabweichung

296

20

Rückstand eines Pflanzenschutzmittels

Prognoseintervall

301

21

Harnstoffgehalt des Blutes

Toleranzintervall (einseitig)

304

22

Durchmesser von Stahlkugeln

Toleranzintervall (zweiseitig)

3O8

23

Polarographische Bestimmung von Blei in Pflanzen

Stichprobenumfang für d e f i n i e r t e n Vertrauensbereich des M i t t e l w e r t e s ( £7 b e k a n n t )

310

2k

Polarographische Bestimmung von Blei in Pflanzen

Stichprobenumfang für definierten Vertrauensbereich des M i t t e l w e r t e s ( (J unbekannt)

318

562

20.

Register der Beispiele

Nr.

Beispiel

Theorie

25

Randomis ierung Aufteilung verschiedener Getreidesorten auf 16 Teilfelder eines Versuchsfeldes

334

26

Prüfung der Formel

Normalverteilte Zuf auszahlen

34l

= /6

Seite

(R = Spannweite) 27

Aktivität eines P-32Präparates

Poissonverteilung

345

28

Impulsraten eines radioaktiven Präparates

Poissonver te ilung (Einzelwahrscheinlichkeit)

351

29

30 31

1!

Poissonverteilung ( Zusammengesetzte Wahrscheinlichkeit)

M

Bestimmung der Erdbeschleunigung g II

II

Ausreißertest nach Graf und Henning

370

Ausreißertest nach Nalimov

378

32

Oberflächenspannung von Wasser

33

Chromatographische Bestimmung eines Amins

Trendtest nach Neumann

34

Vergleich zweier chromatographischer Trennverfahren

Vergleich zweier Streuungen ( F - T e s t )

35

Vergleich der Dicke zweier Folien

Vergleich zweier Mittelwerte ( t - T e s t )

36

Wassergehalt zweier Hexan-Proben

37

Abhängigkeit der Schwingungsdauer eines Pendels vom geographischen Ort

Stichprobenumf ang beim Vergleich zweier Mittelwerte

457

38

Qualitätskontrolle einer AI-Folie

Vergleich M i t t e l wert - Sollwert

459

II

II

tl

M

380

388 425

446 452

20. Register der Beispiele

563

Nr.

Beispiel

Theorie

Seite

39

Abhängigkeit eines PflanzenschutzmittelRückstandes von der Lagertemperatur der Probe

Dif ferenzen-t-Test

46?

40

Wirkung zweier Insektizide auf Khapra-Käfer

4l

Abhängigkeit des Siedepunktes von Schwefel vom Druck

A- Test

472

Gaußsche Fehlerquadratmethode

477

42

11

II

Bestimmung der Konstanten einer Ausgleichs funk t i on

490

43

II

II

Kor r e la t i on s koef f izient

498

Linear i tätsprüfung eines GC-Detektors

Abhängigkeit des 502 Korrelationskoef f izienten von der Zahl der Meßpunkte

Peakfläche als Funktion der Substanzmenge bei einem Gaschromatographen

Streuung einer Ausgleichsgeraden

46

Wirkung eines Vitaminpräparates auf das Wachstum von Bazillen

Lineare K o r r e l a t i o n und Regression

4?

Peakfläche als Funktion der Substanzmenge bei einem GC-Detektor

529 Vertrauensbereich einzelner Punkte auf der Ausgleichsgeraden

48

Wirkung eines Vitaminpräparats auf Bazillenwachstum

Prüfung des Achsenabschnitts einer Ausgleichgeraden

53l

49

Vergleich zweier U r t i t e r substanzen

Prüfung der Steigung einer Geraden

533

50

Blutdruck von Männern

Prüfung auf Normalverteilung

543

5l

Abbauverhalten eines Pflanzenschutzmittels

Aus gleiche funk t ionen nicht linearer Art ( linear i sie r bar )

552

44

5

508 526

21. Rechnerschlüssel

In der folgenden Übersicht sind für die wichtigsten Problemstellungen beim Rechnen bzw. Programmieren die entsprechenden Tastenbefehle der Modelle "Compucorp 327 Scientist", "Texas Instruments TI 59" und "Hewlett Packard HP 97" gegenübergestellt. Dabei gelten f o l g e n d e Abkürzungen: X

=

x- bzw. Eingaberegister ( A n z e i g e )

=

y-Register

=

Inhalt des

y

=

Inhalt des y-Registers

M

=

Konstantenspeicher ( M e m o r y ) mit

=

Inhalt des

m

n

Eingabe-Registers

Konstantenspeichers

Zur Erinnerung hier noch einmal die den o.g.

der M

Adresse n

n

G e r ä t e n zugrunde

liegenden Logiksysteme:

System Compucorp:

Algebraische Logik ohne Hierarchie Alle k Grundrechenarten sind gleichberechtigt.

System Texas

Algebraische Logik mit Hierarchie

Instruments

Punkt- vor Strichrechnung

:

System H e w l e t t

Umgekehrte Polnische Notation ( U P N )

Packard:

ENTER-Taste, keine Klammern

2l. Rechnerschl ssel

0

(l·

565

Ξ0

ο

(β On

-Ρ •Ρ

φ Η S

H H h -μ n

«

Κ ω Η

Μ

Η.

Ι

0

0 0

0

0

ΙΉ

(β

φ Η

0

ft ίπ Ο

υ

3 ft Ο

0

0

0

CO

Ο] (Λ

C Φ Η Λ

α

Ν

•Η Φ

SI

0 0 ΙΉ 0 0

0

0

,α ο

!π Φ •Η Φ

Β

(8 Ν

•Η 0) -Ρ Η

C Ο

-Ρ ,Ω

w κ c

C Ο C r-

Ν

ο

•Η Ό Ό

0

S Ο Η

(β Ν

•Η

•Η -Ρ

0

0 0

υ

Ε Φ Η

«

Ι

CO

~^| |οκΙ

vH

CJ

Ο Η

Ο Η

Γ~

r—ι 0

C5

Χ ι—ι

Ι

|j| |οκ Ι

f 1

|_]

υ

hj

(Λ

-S"

O

Ο1 Ε-

Ο Η

\\ \\

α

υ

α

X

CO 401 CO

-Ρ

π

0)