216 19 76MB
German Pages 598 [600] Year 1980
Statistische Auswertung von Meß- und Versuchsdaten mit Taschenrechner und Tischcomputer
Siegfried Noack
Statistische Auswertung von Meß- und Versuchsdaten mit Taschenrechner und Tischcomputer Anleitungen und Beispiele aus dem Laborbereich
W DE G Walter de Gruyter · Berlin · New York 1980
Autor Dr. rer. nat. Siegfried Noack Hermsdorfer Straße 99 D-1000 Berlin 26
CIP-Kurztitelaufnahme der Deutschen Bibliothek Noack, Siegfried: Statistische Auswertung von Meß- und Versuchsdaten mit Taschenrechner und Tischcomputer: Anl. u. Beisp. aus dem Laborbereich. Siegfried Noack. - Berlin, New York: de Gruyter, 1980. ISBN 3-11-007263-7
© Copyright 1980 by Walter de Gruyter & Co., vormals G.J. Göschen'sche Verlagshandlung, J. Guttentag, Verlagsbuchhandlung Georg Reimer, Karl J. Trübner, Veit & Comp., Berlin 30. Alle Rechte, insbesondere das Recht der Vervielfältigung und Verbreitung sowie der Übersetzung, vorbehalten. Kein Teil des Werkes darf in irgendeiner Form (durch Photokopie, Mikrofilm oder ein anderes Verfahren) ohne schriftliche Genehmigung des Verlages reproduziert oder unter Verwendung elektronischer Systeme verarbeitet, vervielfältigt oder verbreitet werden. Printed in Germany. Druck Karl Gerike, Berlin; Bindearbeiten: Buchgewerbe GmbH Lüderitz & Bauer, Berlin. Einbandentwurf: Thomas Bonnie, Hamburg
Vorwort
Bei der Planung und Auswertung naturwissenschaftlicher Versuche bedient man sich häufig mathematisch-statistischer Methoden. Die Lösung statistischer Problemstellungen ist
jedoch oft
mit einem erheblichen Rechenaufwand verbunden. Da aber eine "Statistik" nicht Selbstzweck sein soll, sondern als Entscheidungshilfe dazu dient, bei der Beurteilung von Versuchs- und Meßergebnissen das persönliche Empfinden des Einzelnen durch ein objektives Maß zu e r s e t z e n ,
erscheint die Forderung ver-
n ü n f t i g , den zeitlichen Aufwand bei der Auswertung der Daten so gering wie möglich zu halten. Hierbei können elektronische Taschen- bzw. Tischrechner eine wertvolle Unterstützung bieten. V o r t e i l h a f t sind insbesondere programmierbare M o d e l l e , bei denen die erstellten Programme auf Datenträgern - z.B. kleinen Magnetkarten oder Bandkassetten - gespeichert werden können. Die einmal aufgezeichneten Programme stehen dann jederzeit sind Fehler,
zur Verfügung. Dadurch
die bei einem manuellen Eintasten des Programms
entstehen können, weitgehend ausgeschlossen. Durch geschickte Programmierung kann
man sogar erreichen,
daß lediglich die
auszuwertenden Daten eingegeben werden müssen, der Rechner aber alle w e i t e r e n Operationen selbständig
durchführt.
Zu einer optimalen Programmgestaltung gehören jedoch eine gute Kenntnis des entsprechenden Rechners sowie der anzuwenden Algorithmen. Vielfach läßt sich durch eine mathematische Umformung eine kompliziert erscheinende Formel vereinfachen und "computergerecht" umgestalten!
VI
Vorwort Voraussetzung für eine korrekte statistische Datenauswer-
tung ist
aber auch die richtige Interpretation der erhaltenen
Ergebnisse, wobei eine Kenntnis des theoretischen Hintergrundes in gewissem Umfang wünschenswert erscheint. Das vorliegende Buch soll Naturwissenschaftlern und Ingenieuren daher eine Anleitung in zweierlei Hinsicht geben: 1.
wie man den Rechengang bei
der Auswertung mit H i l f e eines
2.
welche Formeln und statistische Methoden wann anzuwenden
Taschen- bzw. Tischrechners
durchführen kann,
sind und welche Aussagen man mit den Ergebnissen
treffen
kann. Schließlich werden auch die wichtigsten theoretischen Gesichtspunkte behandelt, soweit dies für das weitere Verständnis notwendig erschien. Das Buch gibt im Teil A zunächst H i n w e i s e , welche Gesichtspunkte bei der Auswahl eines Rechners für die statistische Datenauswertung maßgeblich sind sowie eine Einführung in die wichtigsten Logik-Systeme. Es folgt eine umfangreiche Darstellung der Rechner-Operationen schen Funktionen. speichern
und der benötigten mathemati-
Ausführlich wird das Rechnen mit Konstanten-
behandelt.
Im Teil B werden die
Berechnung von statistischen Kenn-
größen, die Durchführung von Hypothesentests sowie die Korrelations- und Regressionsrechnung b e s p r o c h e n , Formeln,
Pro-
gramme und allgemeine Rechenhinweise gegeben sowie die Ergebnisse diskutiert. Ein breiter Raum widmet sich der Berechnung von Verteilungsintegralen und Signifikanzschranken, die bei Hypothesentests und der Berechnung von Vertrauensbereichen Damit ist
eine Rolle spielen.
man praktisch unabhängig von Tabellenwerken.
Sowohl Naturwissenschaftler und Ingenieure, die sich in der Praxis mit der statistischen Behandlung von Versuchsergebnissen b e s c h ä f t i g e n müssen, als
auch Studenten der genannten
Fachrichtungen werden hier sicher wertvolle Hinweise und Anregungen finden.
Vorwort
VII
Die in den Rechen- und Programmbeispielen verwendeten Tastensymbole und Programmbefehle orientieren sich an den Modellen "Compucorp 326 Scientist" sowie "Compucorp 327 Scientist". Das Modell 326 ist
ein nicht druckender Tischrechner
mit L e u c h t z i f f e r n a n z e i g e ,
der über 160 Programmspeicherplätze
sowie 12 Konstantenspeicher
v e r f ü g t . Das Gerät
"327" b e s i t z t
4l6 Programmschritte, kk direkt und indirekt adressierbare Konstantenspeicher
und einen Drucker zur Dokumentation der Da-
ten und Ergebnisse. Bei beiden G e r ä t e n können mit Hilfe Bandstation sowohl Programme als
einer
auch Daten gespeichert wer-
den, die bei Bedarf wieder vom Band abrufbar
sind.
Eine Übertragung der Rechenoperationen b z w . Programme auf andere Rechnertypen, die ebenfalls über eine algebraische Logik v e r f ü g e n ,
ist
unter Beachtung der jeweiligen Besonderhei-
ten des Rechners ohne Schwierigkeiten möglich. Das Buch erhebt keinen Anspruch auf V o l l s t ä n d i g k e i t . D i e s ist
wegen der V i e l f a l t der auf dem Markt angebotenen Rechner
einerseits und der zahlreichen statistischen Problemstellunggen andererseits auch kaum m ö g l i c h . Das Literaturverzeichnis erlaubt dem interessierten Leser aber ein v e r t i e f t e s Studium der einzelnen Sachgebiete. Zum Schluß noch ein Hinweis an alle "Experimentatoren": Ein unbefriedigendes
Ergebnis eines Versuchs b z w . einer Mes-
sung aufgrund falscher oder ungenügender Planung kann auch durch eine noch so gute "Statistik" nicht besser werden!
Siegfried Noack
Berlin, November 1979
Inhaltsverzeichnis
Hinweise für den Leser A
XV
Rechnen mit Taschenrechnern und Tischcomputern ....
1. Rechnermodelle und ihre Anwendungsbereiche 2. Rechenschieber, Logarithmentafel
l 3
und Elektronen-
rechner im Vergleich 3. Mathematische Grundlagen
16 20
3.1 Rechnen mit Summen
20
3.2 Rechnen mit Produkten
23
4. Zahlendarstellung auf dem Rechner 4.1 Festkomma
25 25
4.2 Fließkomma
26
4.3 Gleitkomma
29
4.4 Rechengenauigkeit
32
5 . Logiksysteme
33
5.1 Allgemeines
33
5.2 Algebraische Logik
35
5 - 2 . 1 Rechenoperationen
35
5.2.2
Löschen von f a l s c h eingegebenen Zahlen ..
37
5.2.3
Rechnen mit einer Konstanten
38
5.2.4
Kettenrechnungen
40
5.2.5
Rechnen mit Klammern
46
5.2.6
Kurzwegrechentechnik
48
5.3 Umgekehrte Polnische Notation ( U P N )
54
5.3.1
Allgemeines
54
5.3.2
Kettenrechnungen bei der UPN-Logik
57
5.3.3
Kurzwegrechentechnik bei der UPN-Logik .. fc>0
X
Inhalt 5.3·4 Vergleich von UPN mit algebraischer Logik ..
6.
Rechnen mit Speichern
64
6.1 Feste und ver nderbare Speicher
64
6.2 Konstantenspeicher
7.
65
6.2.1 Allgemeines
65
6.2.2 Direkt adressierbare Speicher
66
6 . 2 . 3 Indirekte Adressierung von Speichern
70
6 . 2 . 4 Verkn pfung von Speicherinhalten
7k
6.2.5
77
Speicherarithmetik
Programmierbare Rechner
90
7.1 Allgemeines
90
7.2 Sprungbefehle
7.4
93
7.2.1 Unbedingte Spr nge
93
7 . 2 . 2 Bedingte Spr nge
94
7 - 3 Unterprogramme
8.
6l
ndern von Programmen
97 100
Mathematische Funktionen
102
8. l Allgemeines
102
8.2 Berechnung der Funktionen
103
8.2.1 Die Funktion y = -/χ"" 2 8.2.2 Die Funktion y = χ
103 104
8 . 2 . 3 Die Funktion y = 1/x
105
8.2.4 Die Funktion y = e*
106
8.2.5 Die Funktion y = In χ
107
8.2.6 Die Funktionen y = 10X und y = log χ
1θ8
8.2.7 Die allgemeine Potenzfunktion y = a bzw. z = xy
109
8.2.8 Die trigonometrischen Funktionen und ihre Inversen
114
8.2.9 Die Funktion y = Integer χ
115
8.2.10 Die Funktion y = χ - Absolut
120
8.2.11 Die Funktion y = n! (η-Fakult t)
121
Inhalt B
XI
Statistische Auswertung von Versuchs- und Analysendaten
139
9. Der Durchschnittswert
14l
10. Fehlerarten bei Meßwerten
143
10. l Zufallsfehler
143
10.2 Systematische Fehler
144
10.3 Kombination zufälliger und systematischer Fehler
146
11. Säulendiagramm und Normalverteilung 12. Mittelwerte
152 158
12.1 Arithmetischer Mittelwert
158
12.1.1 Arithmetisches Mittel aus nicht klassifizierten Werten
158
12.1.2 Arithmetisches Mittel aus klassifizierten Werten
162
12.1.3 Spezielle Methoden zur Berechnung von x.. 166 12.2 Geometrischer M i t t e l w e r t
168
12.3 Harmonischer M i t t e l w e r t
173
12.4 Der Zentralwert ( M e d i ä n )
175
12.4.1 Definition
175
12.4.2 Sortieren von Daten
177
12.4.3 E i g e n s c h a f t e n und Anwendung des Medians.. 186 13. Streuungsmaße
187
13. l Allgemeines
187
13.2 Die Spannweite
188
13.3 Die Standardabweichung 13.3.1 Definition
192
und Bedeutung der
Standardabweichung
192
13.3.2 Integration der Normalverteilung
202
13.3.3 Schranken der Normalverteilung
2l6
13.3.4 Berechnung der Standardabweichung
222
13.3.5 Der V a r i a t i o n s k o e f f i z i e n t
232
13.3.6 Streubereiche
233
13.3.7 Standardabweichung des M i t t e l w e r t e s
234
XII
Inhalt 13.4 Vertrauensbereiche
236
13.4.1 Allgemeines
236
13.4.2 Vertrauensbereich des Mittelwertes
238
13.4.3 Berechnung der t-Werte
246
13.4.4 Rechenprogramm zur Ermittlung des Vertrauensbereiches für beliebige statistische Sicherheiten
254
13.4.5 Integration der t-Verteilung
268
13.4.6 Vertrauensbereich der Standardabweichung. 286 13.4.7 Berechnung der Chi-Quadrat-Werte
288
13.4.8 Rechenprogramm zur Ermittlung des Vertrauensbereichs der Standardabweichung für beliebige
Sicherheiten
292
13.5 Das Prognoseintervall
300
13.6 Das Toleranzintervall
302
13.6.1 Toleranzintervall bei einseitiger Fragestellung
303
13.6.2 Toleranzintervall bei zweiseitiger Fragestellung
305
14. Stichprobenumfang
309
14.1 Stichprobenumfang bei bekannter Streuung O 14.2 Stichprobenumfang bei unbekannter Streuung Cf 15. Zufallsauswahl von Stichproben
309 ...
314 320
15. l Allgemeines
320
15.2 Zufallszahlen und deren Anwendung
322
15.2.1 Erzeugung von Zufallszahlen ( Z u f a l l s zahlengenerator)
322
15.2.2 Elektronischer Würfel
326
15.2.3 Münzwerfen
328
15.2.4 Zahlenlotto
329
15.2.5 Elektronisches Roulette
329
15.2.6 Randomisierung
331
15.2.7 Normalverteilte Zufallszahlen
336
Inhalt 6. 17.
XIII
Die Poissonverteilung
344
Statistische Testverfahren
356
17. l Allgemeines
356
17.2 Der Ausreißertest
364
17.2.1 Allgemeine Bemerkungen zum Ausreißerproblem
364
17.2.2 Ausreißertest nach Graf und Henning .... 364 17.2.3 Ausreißertest
nach Nalimov
373
17.3 Trendtest nach Neumann
383
17.4 Vergleich zweier Varianzen ( F - T e s t )
389
17.4.1 Durchführung und Voraussetzungen
389
17.4.2 Integration der F-Verteilung
394
17.4.3 Signifikanzschranken der F-Verteilung .. 421 17.4.4 Rechenbeispiel zum F-Test
425
17.5 Vergleich zweier Mittelwerte ( t - T e s t )
428
1 7 . 5 « 1 Testvoraussetzungen und Durchführung
... 428
17.5.2 Rechenprogramm zum t-Test
438
17.5.3 Stichprobenumfang beim Vergleich zweier M i t t e l w e r t e 17.6 Vergleich Mittelwert-Sollwert 17.7 Differenzen-t-Test 17.8 18.
A- Test (Attributive Prüfung)
Korrelations- und Regressionsrechnung
454 459 462 469 474
18. l Allgemeines
4?4
18.2 Methode der kleinsten Fehlerquadrate
476
18.3 Der K o r r e l a t i o n s k o e f f i z i e n t
494
18.4 Die Standardabweichung der Ausgleichsfunktion.. 505 18.5 Lineare Korrelation und Regression
509
18.5.1 Die Ausgleichsgerade und ihre Kenngrößen
509
18.5.2 Rechenprogramm und Beispiel zur linearen Korrelation
515
18.5.3 Prüfung der Konstanten der Ausgleichsgeraden
530
XIV
Inhalt 18.6
Prüfung von Meßwerten auf Normalverteilung ...
18.7
Nicht lineare Korrelation und Regression
535 5^6
18.7.1 Linearisierbare Funktionsmodelle
5^8
18.7.1 Nicht linearisierbare Funktionsmodelle. 556 19«
Liste der Programme
557
20.
Register der Beispiele
560
21.
Rechnerschlüssel
564
22.
Literaturverzeichnis
570
23.
Sachregister
580
Hinweise für den Leser
Die für- die einzelnen Problemstellungen a u f g e f ü h r t e n Rechenprogramme sind für 327 geschrieben.
die Modelle Compucorp Scientist 326 und
Dies sind G e r ä t e , die eine algebraische Re-
chenlogik und 12 bzw. 44 Konstantenspeicherplätze besitzen sowie über l60 bzw. 4l6 Programmschritte verfügen. Die Modelle wurden - stellvertretend für andere Geräte mit algebraischer Logik - deshalb ausgewählt, weil ihre "Programmiersprache" besonders einfach verständlich ist sprechenden Programm-Befehle für
und die
ent-
die Berechnung mathematischer
Funktionen, das Rechnen mit S p e i c h e r n , die
Speicherarithmetik,
bedingte und unbedingte Sprünge sowie die Durchführung von Unterprogrammen in weitestgehend ähnlicher Form auch auf anderen Rechnersystemen vorhanden sind.
Wegen der schnell f o r t s c h r e i t e n d e n Entwicklung von Taschenund Tischrechnern wurden zum Zeitpunkt der F e r t i g s t e l l u n g des Buches die Modelle Compucorp 326 und 327 nicht mehr h e r g e s t e l l t , sind j e d o c h noch teilweise im Handel e r h ä l t l i c h . Da die
für diese Geräte angegebenen Programme aber vor allen
Dingen den prinzipiellen Ablauf des j e w e i l i g e n Problems auf einem Rechner demonstrieren sollen, wird ihre Anschaulichkeit dadurch nicht gemindert. Vom logischen A u f b a u her sind die Programme daher auch auf andere R e c h e n s y s t e m e anwendbar.
XVI
Hinweise für
den Leser
Mit Hilfe des am Schluß angegebenen "Rechnerschlüssels" ist
es möglich, die entsprechenden Tastenbefehle auf die Mo-
delle TI 59 (Texas Instruments,
algebraische Logik) und HP-97
( H e w l e t t Packard, Umgekehrte Polnische N o t a t i o n ) zu übertragen. Modellbezogene Besonderheiten sind dabei den jeweiligen Handbüchern zu entnehmen. Um den Aufbau der
Programme besser verstehen zu können,
e m p f i e h l t es sich, zunächst den Teil A ("Rechnen mit Taschenrechnern und Tischcomputern") durchzuarbeiten, in dem vor
al-
lem die einzelnen Rechnerfunktionen sowie das Prinzip der
al-
gebraischen und der UPN-Logik erklärt sind. In dem zu jedem Programm angegebenen A b l a u f p l a n , weise in die Rechenbeispiele eingearbeitet ist,
der teil-
werden die Da-
teneingabe und die Ausgabe der Ergebnisse an einem Zahlenbeispiel erläutert. Besonders intensiv sollte man sich im Teil A mit dem Abschnitt 6 "Speicherarithmetik"
beschäftigen,
da hier die
für
statistische Auswertungen unerläßliche Bildung von Summen JTx, ^x j ^ V i j i y
^yx bei der linearen Korrelation)
(z.B.
behandelt
wird. Die im Teil B ( " S t a t i s t i s c h e Auswertung von Versuchs- und Analysendaten") angegebenen Formeln zur Lösung von Verteilungsintegralen bzw. der Berechnung von Signifikanzschranken ( i n t e gralgrenzen) sollen den Benutzer eines Rechners möglichst unabhängig von statistischen Tabellenwerken machen. Man sollte daher einen einmaligen höheren Programmieraufwand nicht scheuen. Sind nämlich die Programme erst einmal auf einem Datenträger ( K a s s e t t e oder Magnetkarte) gespeichert, dann bieten sie den Vorteil einer enormen Zeitersparnis. In den zu den Programmen gehörigen Ablaufplänen ist
ange-
d e u t e t , wie die Zahlen auf der Anzeige des Rechners erscheinen. Der dort angegebene Dezimalpunkt entspricht dem im deutschen Sprachraum üblichen Komma. Bei einem druckenden Rechner kann man zur Dokumentation der Ergebnisse die STOP-Befehle durch eine PRINT-Anweisung ergänzen ( D a t e n e i n g a b e ) bzw. ersetzen (Ausgabe der E r g e b n i s s e ) .
Teil A Rechnen mit Taschenrechnern und Tischcomputern
1. Rechnermodelle und ihre Anwendungsbereiche
Bei der statistischen Auswertung von Meßergebnissen unter Zuhilfenahme von elektronischen Taschen- b z w . Tischrechnern erhebt sich die Frage, welche Modelle hier am geeignetsten sind. Es ist
klar, daß an die zu verwendenden Rechner be-
stimmte Forderungen zu stellen sind. Das Angebot an verschiedenen Typen ist
aber so groß, daß
es zunächst unüberschaubar scheint. Eine gewisse Übersicht erhält man jedoch, wenn man eine Unterteilung nach dem Zweck vornimmt, den die Geräte e r f ü l l e n sollen. Eine Aufteilung in 4 Gruppen schafft
hier etwas Klarheit:
Gruppe l = Grundmodelle Hierunter sollen Geräte verstanden werden, mit denen
le-
diglich die 4 Grundrechenarten durchgeführt werden können. Außer den Tasten für Addition, Subtraktion, Multiplikation und Division verfügen Modelle dieser Art noch über eine Taste zum Löschen von falsch eingegebenen Werten bzw. f e h l e r h a f t durchgeführten Rechenoperationen. Einfache Rechenprobleme, wie z . B . die
"Bilanz" vom Ein-
kaufsbummel oder die Berechnung der Mehrwertsteuer sind durchführbar. Für die statistische
Auswertung d ü r f t e n Rechner die-
ser Kategorie jedoch weniger geeignet sein, da ihnen wichtige Funktionen fehlen. Gruppe 2 = Erweiterte Grundmodelle Zusätzlich zu der Möglichkeit, die Grundrechenarten durchführen
k
1. Rechnermodelle und ihre Anwendungsbereiche
zu können, haben diese Geräte oft
weitere "Funktionen" wie
Prozentautomatik, Tasten zur Berechnung von Quadraten und Wurzeln oder K e h r w e r t e n , sowie teilweise einen Konstantenspeicher, der es erlaubt, ein Ergebnis gewissermaßen im Rechner zu "notieren", um es bei Bedarf wieder abrufen
zu können. Fehlen-
de wichtige mathematische Funktionen (in x,
e
u s w . ) sowie
eine meist zu geringe Speicherkapazität bedingen aber, daß auch diese Gruppe für unsere Zwecke ausscheidet. Gruppe 3 = Kaufmännische Rechner Die Typen dieser Gruppe sind für die Lösung w i r t s c h a f t s bzw. finanzmathematischer Probleme gedacht und kommen daher ebenfalls nicht in Frage. Gruppe 4 = Technisch-Wissenschaftliche Rechner Das Angebot innerhalb dieser Geräteklasse ist
auch wie bei
den anderen Modellen sehr groß. Eine Vielzahl mathematischer Funktionen, mehrere Konstantenspeicher, die Möglichkeit, in den Speichern auch zu rechnen,
sowie eventuell die Programmier-
barkeit zeichnet diese Art von Rechnern aus. Mit ihnen lassen sich im allgemeinen eine Vielzahl von Aufgaben aus Technik und Naturwissenschaft lösen. Bei einigen Modellen ist
es möglich, die Programme auf
kleine Magnetkarten oder Bandkassetten
aufzuzeichnen,
so daß
diese immer abrufbereit sind. Weiterhin verfügen einige Rechner auch über einen Drucker.
Damit können sowohl die eingege-
benen Daten wie auch die Ergebnisse dokumentiert werden. Es sei darauf hingewiesen,
daß auch speziell für
sche Berechnungen Geräte angeboten werden, wie z.B. SR
statisti"Commodore
6l". Eine weitere Möglichkeit der Einteilung der Rechnertypen
ist
die nach der angewendeten Rechenlogik. Hierbei kann man 2
Hauptgruppen unterscheiden: 1.
Rechner mit algebraischer Logik,
2.
Rechner mit der "Umgekehrten Polnischen Notation" ( U P N ) .
1. Rechnermodelle und ihre Anwendungsbereiche Beide Systeme werden in den Kapiteln 5 - 2 und 5.3
5
ausführ-
lich besprochen. Speziel'l bei
der Anwendung von Formeln aus dem Bereich der
Statistik sind Summen oder Produkte bestimmter Ausdrücke zu bilden. Bei der Durchführung einer Regressionsrechnung z . B . 2 2 müssen die Summen für die Ausdrücke , , y, y , und xy für alle Meßwertpaare gebildet werden. Hierbei sind "rechnende Speicher" sehr von Vorteil, die es u.a. erlauben, in den Speichern selbst Zahlenwerte zu addieren oder zu multiplizieren. Man spricht in diesem Zusammenhang auch von "Registerarithmetik" bzw. "Speicherarithmetik" (siehe Kap. 6 ) . Weiterhin sollte die Möglichkeit der Programmierung gegeben sein. Da viele statistische Berechnungen aus immer wiederkehrenden Rechenabläufen bestehen ( w i e z.B. die Bildung von 2 2 x,x , y , y und xy für mehrere Zahlenpaare x / y ) , ist nur eine Eingabe des Rechengangs in den Programmspeicher notwendig. Fürverschiedene Datenpaare läuft dann die Berechnung automatisch ab.
Die Möglichkeit, die Programme und Daten zu speichern, wie die Daten und Ergebnisse
zu drucken, ist
so-
wünschenswert,
aber nicht unbedingt eine Voraussetzung für eine schnelle Auswertung. Rechner für die statistische Auswertung von Versuchsdaten sollten daher folgende Möglichkeiten b e s i t z e n : 1.
4 Grundrechenarten
2.
Mathematische Funktionen, wie z . B . 1/ ,)6
,
, In
INTEGER x, 3. 4.
, log x,
e X , 10X, y X ,
x-ABSOLUT u . a . m .
Mehrere "rechnende Speicher" ( e t w a 8-12) Programmierbarkeit mit der Möglichkeit, logische Entscheidungen vorzunehmen (Schleifenbildung)
5.
Rechnen mit sehr kleinen und sehr großen Zahlen. Dies ist
möglich, wenn im Gleitkomma-Format gerechnet
werden kann. Die meisten "Technisch-Wissenschaftlichen" -99 +99 verfügen über einen Rechenbereich von 10 bis 10
6 6.
1. Rechnermodelle und ihre Anwendungsbereiche Eventuell Drucker sowie eine Möglichkeit zum Speichern von Programmen bzw. Daten (Magnetkarte oder Bandkassette). Es gibt bereits Taschen- bzw. Tischrechner, welche die ge-
forderten Möglichkeiten besitzen. Als Beispiel für einen druckenden Taschenrechner sei das programmierbare Modell HP19 C genannt (Hewlett-Packard), das allerdings keine Möglichkeit b i e t e t , die Programme extern zu speichern. Ein einmal eingetastetes Programm bleibt aber auch nach Abschalten des Geräts im Programmspeicher erhalten, bis es durch ein neues ersetzt wird. Als Beispiel eines für statistische Auswertung geeigneten Tischmodelles sei das System Compucorp 32? und die 392 angeführt.
Bandstation
Dieser programmierbare Rechner verfügt auch
über einen Drucker. Weiterhin besteht die Möglichkeit, die Bandstation über den Rechner zu steuern. Falls der Umfang des Programms größer ist,
als der interne Programmspeicher ( 4 l 6
Speicherplätze) aufnehmen kann, können somit Programmteile vom Band nachträglich ,"eingelesen" werden.
Die folgende Zusammenstellung gibt eine Übersicht dreier Rechnermodelle, die für die statistische Datenauswertung geeignet erscheinen: a)
Compucorp Scientist 326/327 (algebraische Logik ohne Hierarchie)
b)
Texas Instruments TI 59 (algebraische Logik mit
c)
Hierarchie)
Hewlett Packard HP 97 (umgekehrte Polnische N o t a t i o n )
Selbstverständlich sind auch andere Geräte für die Datenauswertung verwendbar, sofern sie über die o.g. verfügen.
Eigenschaften
1. Rechnermodelle und ihre Anwendungsbereiche
a)
Modelle COMPUCORP SCIENTIST 326 und 32?
Bandstation COMPUCORP 392 Modell
326
Uandkasse tte
Modell
32?
8
1. Rechnermodelle und ihre Anwendungsgebiete
Bei den Systemen Compucorp 326 und 327 handelt es sich um zwei programmierbare Tischrechner mit Magnetbandstation (Compucorp 392)
zur Speicherung von Programmen und Daten. Während das Modell 326 über 12 Konstantenspeicher sowie
l60 Programmschritte v e r f ü g t ,
besitzt das Gerät Compucorp 327
kk Konstantenspeicher und 4l6 Programmspeicherplätze und
ist
außerdem mit einem Drucker a u s g e s t a t t e t , so daß eine Dokumentation der Daten und Ergebnisse ermöglicht wird. Rechenlogik Beide Modelle besitzen eine algebraische Logik ohne Hierarchie. In beiden Geräten wird also durch die [ = [ gang abgeschlossen.
- Taste eine Rechen-
Außerdem verfügen beide Systeme über k
Klammerebenen, in denen ebenfalls gerechnet werden kann. Die Nummer dieser Klammerebene wird durch eine entsprechende Z i f fer links in der Anzeige kenntlich gemacht. k
Beispiel:
*
3
l =?
Die Rechenschritte werden also so, wie sie hen,
auf dem Papier
ste-
abgearbeitet.
Funktionen Beide Geräte haben die wichtigsten mathematischen Funktionen festverdrahtet: sin x,
^"^^
,
2
, 1/x,
x! ,
5C
e ,
In x,
"V
10 ,
log x,
cos x, tan x, Arcus-Funktionen und automatische Bildung
von ^"x, ^x sind z.B.
und
n
aus n Einzelwerten. Weitere Funktionen
x-Absolut, Integer x, Fraction x (Vor- und Nachkom-
mateil von
) , M i t t e l w e r t , Standardabweichung.
Konstantenspeicher, Speicherarithmetik Sowohl das System Compucorp 326 als fügen über Speicher, kann z.B. ren.
auch der Rechner 327 ver-
in denen auch gerechnet werden kann. Man
in einem Speicher Zahlen addieren oder multiplizie-
Dies ist
für die Bildung von Summen bzw. Produkten von
entscheidender Bedeutung. Will man z.B. zu dem Inhalt des Speichers
l eine 5 addieren,
dann geschieht das durch den Befehl
1. Rechnermodelle und ihre Anwendungsgebiete
Da der Befehl
STO +
nur einen Programmschritt b e l e g t , spart
man erheblich an Programmschritten ein.
Der ausführliche Be-
fehl lautet
Selbst wenn man berücksichtigt, daß die Befehle RCL l STO l auch nur jeweils l Programmspeicherplatz benötigt man dennoch bei
und
belegen, dann
der "ausführlichen" Addition im Spei-
cher 5 Programmschritte, also 66% mehr! Programmierung Bei beiden Rechnern können die Tastenfolgen zur Lösung eines Problems durch Drücken des LOAD-Schalters in den Programmspeicher "eingelesen" werden. TAPE" auf
Durch Drücken der Taste "WRITE ON
der Kasettenstation kann dann das Programm auf Ma-
gnetband gespeichert werden. Ein großer V o r t e i l der Geräte ist, Rechner,
d.h.
also "per
daß die Bandstation vom
Programm" gesteuert werden kann. Da-
mit können theoretisch beliebig große Programme verarbeitet werden. Zur Programmierung von S c h l e i f e n , Verzweigungen und Unterprogrammen sind entsprechende logische Entscheidungen ebenfalls festverdrahtet! a) Der Inhalt des X-Registers kann gegen Null geprüft werden, d.h. gen
man kann t e s t e n , ob eine der Bedingun-
x = 0, x < 0 ,
f ü l l t ist.
x>0,
Wenn ja,
^ 0,
^ 0,
kann der Sprung zu einer be-
stimmten Programm-Marke ( L a b e l )
erfolgen.
b) Bestimmte Programm-Marken ( L a b e l s ) Befehl
JUMP
^ 0 er-
n (n = Adresse
können durch den
des Labels) ohne eine
Bedingung angesprungen werden. c) Durch
BRANCH
n
kann ein
Unterprogramm erreicht
werden. RETURN bewirkt Rücksprung ins
Hauptprogramm.
10
b)
1. Rechnermodelle und ihre Anwendungsbereiche
Modell TEXAS INSTRUMENTS TI 59
Modell TI 59
sinh χ l coshx
tanh χ
Magnetkarten
Drucker PC-100 A
1. Rechnermodelle und ihre Anwendungsbereiche Das Modell TI 59 von Texas Instruments ist
ein
11
programmier-
barer Taschenrechner mit eingebautem Magnetkartenleser zur Aufzeichnung der Programme. Der Rechner verfügt über einen speziellen Programmspeicher, der es erlaubt Programmspeicherplätze und Konstantenspeicherplätze ineinander umzuwandeln. Es stehen maximal 960 Programmschritte
bzw. höchstens 100 Kon-
stantenspeicher zur Verfügung. Zur Aufzeichnung der Daten, Ergebnisse und Programme kann ein Drucker angeschlossen werden ( M o d e l l PC-100 A oder PC-100 B/C). Rechenlogik Das Gerät b e s i t z t - ebenso wie das System Compucorp - eine
al-
gebraische Rechenlogik. Im Gegensatz zu den Modellen von Compucorp und auch anderen Geräten a r b e i t e t der Rechner "TI 59" mit Hierarchie. Dies b e d e u t e t , daß Punkt- vor Strichrechnung ausgeführt wird, so wie nach den Regeln der Mathematik. Damit e n t f ä l l t teilweise die sonst notwendige Benutzung von Klammern. Nach den Regeln dieser "Algebraischen Hierarchie" wird eine Multiplikation oder Division vor einer Addition bzw. Subtraktion ausgeführt, Reihenfolge
der auszuführenden
Beispiel: Die
wenn nicht durch Klammern eine andere
k +
|-
-
l
=
Schritte f e s t g e l e g t worden
ist.
?
Tastenfolge l a u t e t : ] k \ \ + \ \ 3 \ \ : \ \ 2 \ \ - \ \ l \ \ = \
Dabei wird intern zuerst der Quotient 3/2 berechnet und zur k addiert. Anschließend wird vom Gesamtergebnis l abgezogen. k + 3 5 - l zu lösen, ist das Setzen
Um allerdings die Aufgabe einer Klammer notwendig:
Die Klammer wäre dagegen bei
dem System ohne Hierarchie nicht
erforderlich. Man erkennt, daß -
je nach Problemstellung - sowohl das
algebraische System mit als bzw. Nachteile aufweist.
auch das ohne Hierarchie V o r t e i l e
12
1. Rechnermodelle und ihre Anwendungsbereiche
Funktionen Das Gerät ist
mit den gleichen mathematischen Funktionen
aus-
g e s t a t t e t , die auch für das System Compucorp angegeben sind. Konstantenspeicher, Speicherarithmetik Auch der Rechner "TI 59" verfügt über Konstantenspeicher,
in
denen man addieren, subtrahieren, multiplizieren bzw. dividieren kann. Soll z.B. der Inhalt des Speichers 01 um den Wert 4 erhöht w e r d e n , so ist
dazu die Tastenfolge
erforderlich. Dies entspricht dem Befehl 4 STO + 0 1 bei dem Modell Compucorp 32?. Um eine Multiplikation des Speicherinhalts mit 4 zu erreichen, wäre dagegen die Tastenfolge
notwendig. Weiterhin
ist
auch eine indirekte Adressierung
tenspeicher möglich, wenn zwischen den Tasten|STO| bzw.
|Prd | und der Adresse die Taste
der Konstan|RCLl
|SUM|
|lnd[ b e t ä t i g t wird. Da-
bei bedeutet beispielsweise der Befehl
daß die Zahl, k in demjenigen Speicher abgelegt w i r d , Adresse im Speicher
01 steht. Befindet
dessen
sich also darin z.B.
die
Zahl 10, dann gelangt die "k" durch den obigen Befehl in den Konstantenspeicher
10.
Programmierung Ebenso wie bei
dem System von Compucorp können auch mit dem
"TI 59" Schleifen, Verzweigungen und Unterprogramme programmiert werden. Mit einem Sprungbefehl können bis
zu 72 Labels
(Programm - Marken) angesprungen werden. Dem Befehl
JUMP CHS
beim System Compucorp (Sprung zum Label CHS) entspricht beim "TI 59" der
Befehl GTO CHS (Go T o ) , bzw. SBR CHS, wenn mit
Label CHS ein Unterprogramm beginnt.
1. Rechnermodelle und ihre Anwendungsbereiche c)
Modell HEWLETT PACKARD HP 97
Modell HP 97
P^S ENTt
-22.68
11.88 CALENDAR FUNCTIONS (DT-mm ddyyyy; SUNDAY =O) :
ODT,
DT2
OAOVS 1>AWKS,DYS DT»DOW
Magnetkarte
-17.0S
i4.ee -i5.ee
ENTt 2+ ENTt
J2.es ENTt -9.ee J+ 5.08 ENTt -24.ee, -2.ee -29.88
-9. fit! ES'Tt
-35.00 -21.5? 5.29 Ausdruck
2+ χ #**
**»·
Ik
1. Rechnermodelle und ihre Anwendungsbereiche
Der Rechner "HP 97" ist
- im Gegensatz zu den Modellen von
Compucorp und Texas Instruments - mit einer Rechenlogik ausg e s t a t t e t , die man als
"Umgekehrte Polnische N o t a t i o n " , abge-
kürzt UPN, bezeichnet. Im Gegensatz zu der algebraischen Logik fehlt hier die [=~|- Taste. Dafür ist
hier eine sog. ENTER-Taste vorhanden.
Klammern gibt es bei der UPN-Logik auch nicht. Der Rechner verfügt über 224 Programmspeicherzeilen sowie 26 Konstantenspeicher. Ein eingebauter Magnetkartenleser
er-
möglicht auch hier das Speichern von Programmen und Daten. Ähnlich wie bei
dem Modell Compucorp kann man auch hier mit
dem eingebauten Drucker seine Daten, Ergebnisse und Programme dokumentieren. Rechenlogik Chrakteristisch ist
hier, daß sämtliche Rechengrößen zunächst
in dem sog. Stack-Register
gespeichert werden. Danach erst
wird die Operations-Taste gedrückt, und es e r f o l g t die
ent-
sprechende Berechnung.
Beispiel:
4 x 5 =
?
Die hier anzuwendende Tastenfolge lautet: | 4 | | ENTER | | 5 | |
|
Die Eingabe der Daten erfolgt hier also nicht "wie auf dem Papier". Dafür b e s i t z t die UPN-Technik aber den Vorteil, daß alle Rechnungen nach dem gleichen Schema ablaufen. Funktionen Auch der l—' 7X5
wie
"HP 97" hat 2 „ , x i 1/Xf
die wichtigsten mathematischen Funktionen ., . , In x, sin x, cos x, tan usw.
e ,
f e s t v e r d r a h t e t . Darüberhinaus v e r f ü g t das Gerät über 10 f r e i belegbare Funktionstasten, denen selbstgewählte
Funktionen bzw.
Unterprogramme zugeordnet werden können. Weiterhin hat auch dieser Rechner für die statistische Auswertung wichtige Funktionen wie Integer x und x-Absolut.
1. Rechnermodelle und ihre Anwendungsbereiche
15
Konstantenspeicher, Speicherarithmetik Der "HP 97" verfügt sen 0 bis
über 16 sog. Primärspeicher mit den Adres-
9 und A , B , C , D , E und I.
folgt wie bei
Das Speichern von Zahlen
den Modellen von Compucorp und Texas Instruments
durch Drücken der STO-Taste und anschließend Speicher-Rückruf ist die Speicheradresse le
STO +
er-
entsprechend RCL n
der Adresse. Beim
zu d r ü c k e n , wobei n
darstellt. W e i t e r h i n kann durch die Befeh-
n , STO - n , STO
gerechnet werden, d.h.
n , STO : n
in den Speichern
man kann in den Speichern Zahlen addie-
ren ,multiplizieren usw.. Neben den Primärspeichern
verfügt
der
"HP 97" noch über 10
sog. Sekundär-Speicher, die geschützt sind. Man kann diese Konstantenspeicher n i c h t direkt über die Befehle STO und RCL erreichen. Durch Betätigen einer entsprechenden Taste lassen sich die Inhalte
der Primär- und Sekundärspeicher austauschen.
Programmierung Ähnlich wie bei
dem Modell Compucorp wird beim E i n t a s t e n des
Programms ein sog. Tastencode a n g e z e i g t ,
der zur späteren Kon-
trolle dient. Genauso wie bei
den beiden anderen beschriebenen Geräten
besteht auch hier die M ö g l i c h k e i t , S c h l e i f e n , Verzweigungen und Unterprogramme in das Programm mit einzuarbeiten. Hierzu können im Programm bis
zu 2O Labels ( M a r k e n ) gesetzt werden,
um entsprechende Stellen im Programm erreichen zu können. Dabei
h i l f t die
Taste GTO ( = Go To) g e f o l g t von dem Namen des
Labels. Der Befehl GTO 2 bedeutet also, daß ein Label 2 erfolgen
Sprung zum
soll.
Der Fortgang des Programms kann durch Einbau von logischen Entscheidungen in das Programm von b e s t i m m t e n Bedingungen abhängig gemacht werden. Dabei ist
einmal der Vergleich des X-
Registers mit Null m ö g l i c h , zum anderen können auch die halte von X- und Y-Register verglichen werden. Ist sprechende Bedingung e r f ü l l t die Vergleichsoperation fehl - ausgeführt.
(z.B.
= 0),
die
Inent-
dann wird der auf
folgende Schritt- meist ein Sprungbe-
Ansonsten
Sprung zum nächsten Schritt.
2. Rechenschieber, Logarithmentafel und Elektronenrechner im Vergleich
Bis vor wenigen Jahren waren die einzigen H i l f s m i t t e l , die praktisch jedermann zur Auswertung von Meßergebnissen zur Verfügung standen Rechenschieber und Logarithmentafel. Heute, da man bereits Taschenrechner für erstehen kann, ist
50 DM und weniger
der Rechenschieber weder vom finanziellen
noch vom technischen Standpunkt her eine Konkurrenz für den Elektronenrechner. Eine Reihe von Gesichtspunkten geben nämlich dem elektronischen Taschen- bzw. Tischrechner sowohl gegenüber dem "klassischen" Rechenschieber als
auch gegenüber der Logarith-
m e n t a f e l eindeutig den Vorzug: 1.
Selbst mit den einfachsten Geräten können alle fr Grund-
rechenarten
durchgeführt werden. Man kann also - im Gegen-
satz zum Rechenschieber - auch addieren und subtrahieren! Dies ist
besonders dann von V o r t e i l , wenn Summen oder
Diffe-
renzen bestimmter Ausdrücke zu bilden sind. 2.
Mit einem Rechner, der über eine Gleitkommadarstellung
fügt (siehe Kap. 4 . 3 ) , können Zahlen im Bereich zwischen 10 und 1O+ 99 verarbeitet werden, ohne das beim Rechenschieber
ver- 99
häufig notwendige Ausklammern von Zehnerpotenzen; die Möglichkeit eines dabei a u f t r e t e n d e n 3.
Fehlers ist
somit ausgeschlossen.
Manche Rechenschieber verfügen zwar auch über eine Expo-
nentialskala (e-Funktion) bzw. über trigonometrische Skalen. Die Genauigkeit ist eines Rechners.
aber überhaupt nicht vergleichbar mit der
2. Rechenschieber und Elektronenrechner k.
im Vergleich
17
Das Argument, man könne ja - wenn die Genauigkeit eines
Rechenschiebers entsprechend
nicht ausreicht - eine Logarithmentafel mit
hoher Stellenzahl verwenden, ist
auch nicht
haltbar. Auch mit Hilfe einer L o g a r i t h m e n t a f e l können keine Additionen und Subtraktionen durchgeführt werden! Das Ablesen der Mantissen in den Spalten der Tafeln kann oft
zu Ablese-
fehlern führen. Ferner müssen Aufgaben über die Logarithmengesetze erst umgeformt w e r d e n , was u.a.
auch einen erhöhten
Zeitaufwand b e d e u t e t . 5.
Weder beim Rechenschieber noch bei der Logarithmentafel
hat man die Möglichkeit,
Zwischen- oder Endergebnisse zu spei-
chern, falls diese bei späteren Berechnungen benötigt werden. 6.
Die Ablesegenauigkeit
Die 3· bzw. k.
beim Rechenschieber ist
nur begrenzt
signifikante Stelle kann im allgemeinen nur ge-
schätzt werden. Daher können D i f f e r e n z e n von f a s t gleich großen Zahlen, wie sie bei statistischen Berechnungen h ä u f i g a u f t r e t e n , nur mit einem relativ großen Fehler e r m i t t e l t werden. Beispiel
l
Zu berechnen sei der Ausdruck
=]/
-1.4
. Der "wahre" Wert
für -j/T beträgt 1.4142 . . . , woraus für die D i f f e r e n z f o l g t : =f2
- 1.4l
= 0.0042 . Liest man auf dem Rechenschieber einen
Wert von 1.412 für ~f2 =·/2~* - 1.4l
a b , dann erhält man für
= 1.412 - 1.4l
die
Differenz:
= O.OO2 . Der Fehler b e t r ä g t ge-
genüber dem korrekten Ergebnis mehr als
50% !
Bei sehr kleinen D i f f e r e n z e n kann der Fehler sogar noch erheblich größer werden, wie das folgende Beispiel aus der Statistik z e i g t : Aus den Einzelwerten X 1 = 40.4l x2 = 40.05 x 3 = 40.39 einer Messung soll die Standardabweichung s nach der Formel
18
2. Rechenschieber und Elektronenrechner
im Vergleich
(D
n - l
berechnet werden. Die folgende Tabelle zeigt eine Gegenüberstellung der mit einem Rechner ermittelten "exakten" Werte und den Ergebnissen, Tab. l
die mit einem Rechenschieber erhalten wurden.
Vergleich der Genauigkeit von Rechenschieber und Rechner
= 40.
= 40.05 ,
, = 40.39
Berechneter
Rechen-
Taschen-
Ausdruck
schieber
rechner
2 l
1630
1632.968l
X
2 2
1610
1604.0025
X
2 3
1628
1631.3521
4868
4868.3227
14600
14604.7225
4865
4868.2408
3
0.0818
1.225
0.202
X
Z*2
= s,
(Z-) 2 f (Z-) 2 = s 2 S
l -
S
2
s
Das mit dem Rechenschieber erhaltene Ergebnis ist
um ca. 600%
größer als der W e r t , den man mit einem Rechner e r m i t t e l t ! Der große Fehler, den man bei bers meist m a c h t , ist
Anwendung des Rechenschie-
die zu grobe Rundung von Zwischen- bzw.
Endergebnissen, wie aus dem obigen Beispiel hervorgeht. Ebenso erhält man aber falsche Ergebnisse, wenn auch der Rechner
2. Rechenschieber und Elektronenrechner im Vergleich über eine zu geringe Stellenzahl verfügt.
19
Man sollte bei dem
für die statistische Auswertung zu verwendenden Rechner darauf achten, daß er über 8 - 1 0 oder mehr D e z i m a l s t e l l e n verfügt. Da es für
den Rechner keine Zeitersparnis b e d e u t e t ,
mit
weniger Stellen zu rechnen, sollte man eine gegebene Aufgabe auch stets mit der vollen zur Verfügung stehenden Stellenzahl zu Ende führen und erst am Schluß der Auswertung das Ergebnis - dann allerdings sinnvoll - auf- bzw. abrunden. Eine etwa vorhandene "Rundungsautomatik" sollte daher nur für
das End-
ergebnis einer Berechnung benutzt werden. Hinweise auf die Rundungsfehler der einzelnen Rechnertypen finden sich in den entsprechenden Handbüchern. Einen allgemeinen Überblick über die Problematik gibt J . M . Smith ( 1 ) .
3. Mathematische Grundlagen
3.1 Rechnen mit Summen
Gegeben sei eine Menge von Daten χ. , x„ , x _ , ... x . Die j— ^ η _Summe dieser Daten wird durch den griechischen Buchstaben 2= Sigma dargestellt. Man definiert:
i=n
x
+ x
+ x
)
+ ...
+ x
n
=
J~x. ±=1
(2)
l
und spricht: "Summe aller x i von i=l bis
i=n". In verallge-
meinerter Form kann man auch schreiben:
i=n k
k+1
k+2
"""
n ~ .£-, i i=k
was bedeutet: "Summe aller x i von i=k bis
, '
( J> 3)
i=n". Dabei kann
k jeden beliebigen ganzzahligen Wert annehmen. Zur Vereinfachung l
t man f r den Fall, da
i von l bis n
l u f t , sowohl die Grenzen am Summenzeichen als auch den Index i weg. Es gilt also:
(4)
Multiplikation mit einer Konstanten Werden alle Glieder einer Summe mit einem konstanten Faktor m u l t i p l i z i e r t , so gilt:
c ·χ. + c ·χ2 + c ·χ_ + ...
+ c .χ
= ^"c-χ
= c s x .
(5)
3.1 Rechnen mit Summen
21
Eine Konstante vor den Gliedern einer Summe darf vor das Summenzeichen gezogen werden, sofern sie als Faktor bei allen Gliedern auftritt. Addition von Teilsummen Gegeben seien zwei Datengruppen mit Xj
+ x2 + x 3 + ... H- xn
+
YI
+ y2
+
y3
+
jeweils n Gliedern: ... yn .
Für die Summe dieser beiden Reihen gilt dann:
(6)
...
+
(x n + y n )
Somit f o l g t :
y) .
(7)
Spezialfälle Sind die Glieder einer Summe alle i d e n t i s c h , gilt also : ll dann f o l g t : X
2
3
"
n
(8)
Weitere Fälle:
y)
y) =
C
2y
(9)
(10)
22
3. Mathematische Grundlagen
Doppelsummen Den Ausdruck j=m
i=n
5 bezeichnet
man als Doppelsumme. Seine Bedeutung ist
Zunächst durchläuft j=l
ist.
folgende:
der Index i alle Werte von l bis n, wobei
Die Summe der entsprechenden Werte ist
die 1. Teil-
summe. Anschließend durchläuft i für j=2 alle Werte von l bis n. Die Addition der entsprechenden Werte ergibt die 2. Teilsumme. Man verfährt so w e i t e r , bis
für
alle j von j=l bis j=m
alle m Teilsummen gebildet sind. Die Doppelsumme ( =Ge s amtsumme ) ergibt sich dann durch Summieren der einzelnen Teilsummen. Es gilt also: j=m
i=n
Z^ij
±
bzw.
j=m
=
.
0
JUMP
kleiner Null
< 0
JUMP
größer/gleich Null
^0
JUMP
kleiner/gleich Null
JUMP
JUMP
JUMP
+
+
n
größer/kleiner Null
^0
(ungleich Null)
Will man den Inhalt des X-Registers nicht mit Null sondern mit einer Zahl y vergleichen, also die Bedingungen x > y , x< y , = y
usw. ü b e r p r ü f e n , dann muß zunächst die D i f f e r e n z
- y
gebildet und diese dann mit Null verglichen werden. Soll also z.B. ist
getestet werden, ob die Bedingung x>-y dies möglich, indem man die Forderung
e r f ü l l t ist, - y^O prüft.
dann In
Tab. 39 sind die verschiedenen Möglichkeiten zusammengefaßt.
96
7. Programmierbare Rechner
Tab. 39
Befehlsfolgen
f r den Vergleich
zweier Zahlen χ und y ( S y s t e m Compucorp) Testbedingung
Tastenfolge
χ = y
χ - y= 0
χ > y
—> χ - y> 0
JUMP
χ< y
—> χ - y< 0
JUMP
χ ^ y
—> χ -
x^ y
—> χ - y^ 0
•D * Ξ
JUMP
JUMP
χ -5 y Ist
die g e t e s t e t e Bedingung erf llt,
Sprung zum LABEL
dann erfolgt ein
n.
Bei einigen Ger ten
( z . B . HP 19 C und HP 97) ist
gleich von χ und y d i r e k t m g l i c h , so da
die
ein Ver-
Bildung der
D i f f e r e n z χ - y dann entfallen kann. Zus tzlich zu den genannten Testbedingungen kann man bei dem System Compucorp pr f e n ,
ob nach einem STOP-Befehl das
X-Register b e l e g t worden ist
oder nicht. Damit kann f e s t g e -
stellt w e r d e n , ob eine Eingabe s t a t t g e f u n d e n hat. sprechende T e s t b e f e h l
lautet |JUMP| | + | f~] [~=1 l t .
mit diesem Test gepr f t , gr
n
Der ent-
Es wird
also
ob der Inhalt des E i n g a b e r e g i s t e r s
e r , kleiner oder gleich Null
ist.
7.3
Ist
eine Eingabe e r f o l g t ,
Unterprogramme
so wird ein Sprung zum LABEL n
97
aus-
geführt.
7.3 Unterprogramme O f t m a l s kommen in einem Programm Teile v o r , die sich wiederholen. Ist
z.B.
eine b e s t i m m t e Funktion für verschiedene
Variable zu berechnen,
so könnte man dabei folgendermaßen
vor-
gehen: Die im Laufe des Programms a n f a l l e n d e n verschiedenen Werte für
die Variable werden immer in dem gleichen Konstan-
tenspeicher abgelegt. Die Funktion wird dann jeweils gesondert in einem Unterprogramm b e r e c h n e t . Unterprogramme können an einer beliebigen Stelle im Programm aufgerufen
werden. Für die Erstellung eines solchen Un-
terprogramms ( e n g l . Subroutine) gelten folgende a)
Regeln:
Das Unterprogramm b e g i n n t mit einer symbolischen Adresse.
Diese ist entweder eine Schrittnummer
oder eine "Marke" b z w . ein LABEL im Programm. b)
Das Unterprogramm e n d e t m e i s t mit dem Befehl RETURN
oder einer entsprechenden
Taste.
Dadurch wird der Rücksprung zu der Stelle im Hauptprogramm b e w i r k t , von wo aus der Sprung
in
das Unterprogramm e r f o l g t e . c)
Das Unterprogramm kann von einer beliebigen S t o l l e des Hauptprogramms aus a u f g e r u f e n werden. Der Rechner "merkt" sich jeweils die Rücksprungadresse. Dies ist
die Stelle, von wo aus der
Sprung in das Unterprogramm ausging. d)
Bei einigen G e r ä t e n können mehrere Unterprogramme ineinander g e s c h a c h t e l t w e r d e n , d . h .
ein Unter-
programm kann ein w e i t e r e s Unterprogramm a u f r u f e n
usw.
98
7· Programmierbare Rechner e)
Der Aufruf
der Unterprogramme e r f o l g t durch
spezielle Befehle wie BRANCH n
(engl. to branch = verzweigen, Compucorp Scientist 326 u. 327)
SBR
n
(engl. subroutine = Unterprogramm, Texas Instruments TI58/59)
GSB
n
(engl. g_o to subroutine = gehe zum Unterprogramm, Hewlett Packard HP 97)
Beispiel zur Unterprogrammtechnik (Beispiel 9) Es sei
die Funktion
„
i
=
3 (x3 + 3x2 +5 4) (y + 3y2 + 4) S 3 (z· + 3z + k)
zu berechnen. Man kann dabei so vorgehen, daß man eine Teil3 2 funktion u = k + 3k + 4 d e f i n i e r t und nacheinander für k = x,
k = y und für
k = z in einem Unterprogramm den
jewei-
ligen Wert für u e r m i t t e l t . Dazu müssen die verschiedenen Variablen x, y und z vor dem Sprung in das Unterprogramm immer in einem bestimmten Konstantenspeicher abgelegt werden. Die allgemeine Variable k in dem o . g . Ausdruck für
u wird dann
durch den entsprechenden Inhalt des Konstantenspeichers (x, y oder z) dargestellt. Das Unterprogramm, in dem die Funktion u = k 3 + 3k 2 + k berechnet wird, enthält gewissermaßen allgemeine Vorschrift
die
für die Berechnung von u. Das "Schema"
zur Berechnung von u ist
ja unabhängig von dem W e r t , den die
Variable k annimmt. Die obige Formel für mein formuliert werden als F = u(k=x) · u(k=y)
/ u(k=z)
F kann somit allge-
7-3
Wir wollen annehmen, da
Unterprogramme
99
die Variablen x, y und z im Speicher
l abgelegt werden und das Unterprogramm mit dem LABEL l beginnen soll. Ein Programm zur Berechnung von F unter Anwendung der Unterprogrammtechnik k nnte f r den Rechner Compucorp 326 Scientist z.B. so aussehen: Tab. ΊΟ
Rechenbeispiel zur
Tasten
Kommentar
STOP
Eingabe χ k = χ
u(k
Kommentar
Tasten
Unterprogramm
-A
BRANCH
Unterprogrammtechnik
= x)
1
LABEL RCL
1
Eingabe y
STOP
k = y
.STO 5
STO | | 5 u(k
RCL
= y)
| 1
+
Eingabe z
3 A· l·
STO
Li
u(k
Ϊ
k + 3
= z)
u(k =x)
k u(k
= y)
+
3k
k 3 + 3k2 + k R cksprung
RCL
u(k
= z)
zum
Hauptprogramm F
100
7- Programmierbare Rechner
Man erkennt, daß in allen 3 Fällen, in denen das Unterprogramm aufgerufen w i r d ,
der RETURN-Befehl immer den Rück-
sprung zu der Stelle im Hauptprogramm b e w i r k t , von der aus der Sprung in das Unterprogramm e r f o l g t ist.
Die in den 3 Fällen
im Unterprogramm berechneten Teilfunktionen u ( k = x ) , u ( k = y ) und u ( k = z ) werden nach dem Rücksprung in das Hauptprogramm in den Speichern 2,
3 bzw. k abgelegt. Mit diesen abgespei-
cherten Werten wird dann am Schluß des Programms die Funktion F berechnet. Mit Hilfe der Unterprogrammtechnik kann man eine große Zahl von Programmspeicherplätzen einsparen. Dies ist
insbe-
sondere dann von V o r t e i l , wenn die Unterprogramme selbst sehr umfangreich sind und mehrmals vom Hauptprogramm aus
aufgerufen
werden. Wird dagegen ein Programmteil nur einmal b e n ö t i g t , so
ist
es nicht sinnvoll, diesen Programmabschnitt als Unterprogramm zu schreiben, da durch den Sprungbefehl und das RETURN 2 zusätzliche Schritte verbraucht werden gegenüber einer Verarbeitung des Programmteils
im Hauptprogramm. Dies gilt auch für
den Fall, daß das Unterprogramm nur aus 2 Schritten b e s t e h t . In diesem Fall werden durch den Sprungbefehl z.B.
beim Modell
Compucorp auch 2 Schritte b e n ö t i g t . Das wiederholte Aufrufen des Unterprogramms erfordert also in diesem speziellen Fall genausoviele Programmspeicherplätze
wie die Wiederholung der
Schritte im Hauptprogramm.
7.4 Ändern von Programmen Nur selten ist
das erstellte Programm f r e i von Fehlern.
Es gibt 3 M ö g l i c h k e i t e n , die zu einem falschen Programm führen können: a)
Es wurde eine falsche Instruktion "geladen".
b)
Es wurde eine Instruktion zuviel geladen.
c)
Es wurde eine Instruktion vergessen.
7.^
Um die
Ändern von Programmen
101
entsprechende Stelle im Programm, die verändert wer-
den muß bzw. eingefügt werden muß, zu e r r e i c h e n ,
besitzen
ei-
nige Rechner die Tasten FORWARD
bzw.
Ein einmaliges Betätigen dieser Tasten im LEARN- oder LOADModus hat
zur F o l g e , daß das Programm um einen Schritt vor-
wärts bzw. rückwärts geht. Dabei wird das Programm zunächst weder verändert noch
ausgeführt.
Befinden sich im Programm Sprungadressen ( L A B E L s ) , so kann man durch JUMP n oder GO TO n (n= Nummer des
LABELs b z w .
Schrittnummer) im RUN-Modus der f e h l e r h a f t e n Stelle oft kommen. Dieses Vorgehen ist
näher-
besonders bei umfangreichen Pro-
grammen zu empfehlen. Die 3 möglichen Fehler können folgendermaßen korrigiert werden: zu
a)
Man geht mit FORWARD oder BACKSPACE im Programm im LOAD- b z w . LEARN-Modus soweit vor oder zurück, bis die f e h l e r h a f t e r e i c h t ist.
Stelle er-
Dann wird der richtige Befehl
e i n g e t a s t e t , wobei die f e h l e r h a f t e
Instruk-
tion automatisch überschrieben wird. zu
b)
Man geht mit
FORWARD oder BACKSPACE zu dem
entsprechenden Programmschritt. M i t | R E M O V E | ( b e i manchen Rechnern: DELETE) wird der zuviel geladene Programmbefehl e n t f e r n t . zu
c)
Man geht mit FORWARD oder BACKSPACE bis
zu
dem Programmschritt, der dem einzufügenden Befehl folgen soll. Mit der Taste |lNSERT| wird ein freier Programmplatz erzeugt. Anschließend wird der f e h l e n d e Schritt eingetastet.
8. Mathematische Funktionen
8.1 Allgemeines
Ein Rechner für die statistische Datenauswertung sollte - wie im Abschnitt
l bereits erwähnt - neben den Grundrechen-
arten auch eine Reihe von mathematischen Funktionen in "festverdrahteter" Form besitzen. Hierzu gehören insbesondere Funktionen wie y=\/x"' , y=x , y = l / x , y = e , y=ln x und y=a funktion).
(Potenz-
Für spezielle Problemstellungen, wie z . B . die Lö-
sung von Verteilungsintegralen oder die Simulation von normalv e r t e i l t e n Meßwerten, benötigt man auch die Funktionen y=sin x , y=cos x, y=tan
trigonometrischen
sowie deren Umkehrfunk-
tionen ( A r c u s - F u n k t i o n e n ) . Die w i s s e n s c h a f t l i c h - t e c h n i s c h e n Taschen- bzw. Tischrechner
sind mit den entsprechenden Tasten
ausgerüstet. Durch Reihenentwicklung oder auf iterativem Wege lassen sich zwar auch die m e i s t e n Funktionen nur unter Anwendung der Grundrechenarten darstellen. Die entsprechenden Algorithmen sind aber meist so kompliziert,
daß sie mehr oder weniger nur
akademisches Interesse haben. Es sei
aber darauf hingewiesen,
daß intern die Berechnung der Funktionen auf diesem Wege folgt. Da die Ergebnisse
er-
somit nur Näherungslösungen sind -
die Reihentwicklung muß ja bei unendlichen Reihen nach einer bestimmten Anzahl von Gliedern abgebrochen werden - sind die über die Funktionstasten
e r m i t t e l t e n Werte s t e t s mit einem ge-
ringen Fehler b e h a f t e t . Dieser ist
aber im allgemeinen so
klein, daß er entweder vernachlässigt werden kann oder intern durch Rundung sogar beseitigt w i r d : Der berechnete Wert V§T = 8 , 9 9 9 9 9 9 . . . wird automatisch auf 9,0000...
aufgerundetl
8.1
Allerdings ist
M a t h e m a t i s c h e Funktionen,
Allgemeines
103
dieser "Komfort" n i c h t bei allen Geräten gege-
ben. Speziell im Bereich der S t a t i s t i k und der
Wahrscheinlich-
keitsrechnung sind w e i t e r h i n die Funktionen y = x-Absolut = |x| y = x-Fakultät = und
, ! ,
y = Integer
von Bedeutung. Da viele Rechner diese Funktionen noch n i c h t
in
f e s t v e r d r a h t e t e r Form b e s i t z e n , wird auf deren Berechnung hier besonders
eingegangen.
8.2 Berechnung der Funktionen Die E r m i t t l u n g der e n t s p r e c h e n d e n Funktionswerte so, daß zunächst das Argument
geschieht
in das E i n g a b e r e g i s t e r ( A n z e i -
g e ) gebracht werden muß. Dies kann entweder durch Eingabe von geschehen,
oder
aber das A r g u m e n t
Berechnung. Nach dem Drücken der
ist
das Ergebnis einer
F u n k t i o n s t a s t e wird der Funk-
tionswert berechnet und in die Anzeige gebracht. Das A r b e i t s bzw. Y-Register
wird dabei n i c h t b e e i n f l u ß t mit Ausnahme der }£ P o t e n z f u n k t i o n y=a .
8.2.1
Die Funktion y =
Drückt man auf
einem Rechner die
so b e d e u t e t d i e s , daß aus dem W e r t x,
Taste mit
dem Symbol
der in der Anzeige b z w .
im X-Register s t e h t , die Quadratwurzel gezogen w i r d . Da ein Taschen-
oder Tischrechner
zumindest auf d i r e k t e m
Wege keine imaginären b z w . komplexen Zahlen v e r a r b e i t e n k a n n , e r f o l g t bei
dem V e r s u c h , aus einer negativen Zahl eine W u r z e l
4
5. Mathematische Funktionen
zu ziehen, eine Fehlermeldung. Besitzt der Rechner keine Taste zur Berechnung von ~yx , so kann man nach Newton auf iterativem Wege die
Lösung e r m i t t e l n .
Es gilt
a.
a .) = a. i i+l
(22)
Man beginnt mit a , einem Näherungswert, der liegen soll. Den erhaltenen W e r t für
a.
in der Nähe von = a„
. = a.
setzt man wieder in die linke Seite der Gleichung ein und erhält den Wert a _ . Das Verfahren wird solange f o r t g e s e t z t , sich a. und a.
bis
nur noch um einen geringen, vorgegebenen Be-
trag unterscheiden. Der Wert a.
ist
dann eine Näherung für"^x
.
Eine ausführliche Darstellung des Verfahrens findet man bei
3.2.2
Die Funktion y = kann eine gegebene Zahl
Mit H i l f e der Taste
driert werden. Das Ergebnis ist ob
qua-
immer positiv, gleichgültig,
selbst positiv oder negativ war. Ist
die Quadrier-Taste nicht vorhanden,
drat der Zahl
so kann das Qua-
"explizit" durch Multiplikation von
mit sich
selbst erhalten werden. Beispiel
y = (6,43)'
Algebraische Logik:
6
•
4
3
X
UPN-Logik:
6
-
4
3
ENTER
=
41.3499
X
41.3499
Bei einem R e c h n e r mit Gleitkomma-Darstellung und einem Zahlenbereich von 10-99 bis 10+99 können nur x-Werte quadriert -49 +49 werden, die zwischen 10 und 10 liegen.
5.2.3
8.2.3
Die Funktion y = 1/x
105
Die Funktion y = 1/x
Die "Reziproktaste"
1/x
Berechnung von Brüchen, bei
ist
besonders n ü t z l i c h bei der
denen im Nenner ein zusammenge-
setzter Ausdruck s t e h t und dieser zuerst e r m i t t e l t werden m u ß . Beispiel Es soll der Ausdruck
a =
berechnet werden.
Y3(4,9 + 2,5) Die entsprechende Tastenfolge
unter Verwendung der Funktions-
taste |l/x[ lautet: Tab. kl
Rechenbeispiel Funktionstaste
Tastenfolge
X-Register
zur Anwendung der 1/x Y-Register
Operation
4.9 4.9
2.5
4.9
7-4
7.4
4,9 + 2,5 = 7,4
7.4 22.2
7.4
4.7328
7.4
O.2112
7.4
3
7,4 = 2 2 , 2
22,2
:,732i
= 4,7328 = 0,2112
W e i t e r e Möglichkeiten den obigen Ausdruck zu berechnen w ä r e n durch Anwendung von K l a m m e r t a s t e n bzw. Verwendung eines Konstantenspeichers gegeben. Hierbei sind aber in jedem Fall mehr
106
8. Mathematische Funktionen
Tastenschritte notwendig als unter Verwendung der Reziproktaste .
8.2.4
Die Funktion y = e X
Die e-Funktion hat
in vielen Formeln aus dem Bereich der
Naturwissenschaften eine grundlegende Bedeutung und ist deshalb praktisch auf jedem wissenschaftlich-technischen Rechner in festverdrahteter Form vorhanden. Die Funktion y = e ^£ stellt eine Potenzfunktion dem Exponenten
dar mit
und der Basis
e = 2,71828182846
Die Zahl e ist
(23)
bekanntlich eine irrationale Zahl, d.h. der
"exakte" Zahlenwert
ist
nicht explizit angebbar.
Da aber auf dem Rechner naturgemäß nur endlich viele Stellen zur Verfügung s t e h e n , kann jede irrationale Zahl auch nur als "quasi-rationale" Zahl mit endlicher Stellenzahl behandelt werden. Auf praktische Ergebnisse von Berechnungen hat das aber keinen Einfluß. Der Exponent kann bei einem Rechner mit einem Zahlen-99 +99 bereich zwischen 10 " und 1O " (Gleitkomma) jeden Wert zwischen -22? und + 229 einschließlich Null annehmen, denn es gilt: =
2,6-10-"
e +229 = 2 , 8 - 1 0+ "
Bei einigen Rechnern kann es vorkommen, daß in der Nähe dieser
"Grenzwerte" f e h l e r h a f t e Ergebnisse zustande kommen. Man -98 sollte daher sicherheitshalber den Bereich zwischen 10 und + 98 10 nicht überschreiten (x zwischen - 2 2 5 , 6 und + 2 2 5 , 6 ) . Die e-Funktion kann auch durch eine Reihenentwicklung dargestellt werden:
Die Funktion y = e
e
Mit x°= l
χ
und
χ 2!
= 1 + χ +
0! = l
10?
(24)
3!
sowie
χ
,n=oo
= χ
und
l!
= l
folgt:
n
-ΣΙ- r
(25)
n=0
Weiterhin kann die Zahl e auch als ( l + l/n)
Grenzwert des Ausdrucks
f r n gegen Unendlich d a r g e s t e l l t werden:
(26)
e = lim ( l + - )" n n-» oo
Die genannten Beziehungen haben aber f r praktische Berechnungen nur geringe Bedeutung und sind hier nur der Vollst ndigkeit halber angef
hrt.
Wer sich genauer informieren will: Im "Handbook of Mathematical Functions" von Abramowitz und Stegun f hrliche
Zum Schlu
noch zwei w i c h t i g e S p e z i a l f a l l e :
e° = l
8.2.5
(3) sind aus-
Abhandlungen nachzulesen!
und
(2?)
Die Funktion y = In χ
Die Funktion y = In χ ist e-Funktion. Dies bedeutet, da
die
Umkehrfunktion zu der o.g.
In χ f r ein gegebenes χ den-
jenigen Zahlenwert d a r s t e l l t , mit
dem man e potenzieren mu ,
um χ zu erhalten. Die Funktion y = In χ ist
somit eine Loga-
rithmusfunktion und zwar mit der Basis e. Die Logarithmen von
108
8. Mathematische Funktionen
Zahlen zur Basis e bezeichnet
man auch als
"natürliche Loga-
rithmen". Sie stellen diejenigen Werte dar, mit denen man die Zahl e potenzieren muß, um einen gegebenen Zahlenwert zu
er-
halten. Beispiele e 2 ' 3 0 2 5 = 10
In 10 = 2,3025 In
0,6931
2 = 0,6931
usw.
Entsprechend den bei der e-Funktion genannten Beziehungen e
= 1
und e
= e
gilt:
In l = 0 Versucht man, für
und
(28)
In e = l
den Wert 0 oder einen negativen Zahlenwert
durch Drücken der Taste
|In
| den natürlichen Logarithmus zu
berechnen, so erfolgt eine Fehlermeldung! Dies rührt d a h e r , v
daß die
Funktion y = e
nur positive Zahlenwerte annehmen
kann und somit Logarithmen nur von positiven Zahlen berechnet werden können. Ähnlich wie die e-Funktion, kann auch zur Berechnung von In
eine Reihenentwicklung angegeben werden:
c-
*
11= OO
In
= 2
2n + 1
+ 1
n=0
8.2.6
Die Funktionen y = 10
1
(29)
und y = log
Diese Funktionen sind ähnlich wie die e-Funktion bzw. die natürliche Logarithmus-Funktion zu behandeln. Basis die Zahl 10. Die Funktion y = log
Nur ist
hier die
gibt also die Zah-
lenwerte an, mit der man die Zahl 10 potenzieren muß, um eine
5.2.6
Die Funktionen y = 10
und y = log
109
vorgegebene Zahl x zu erhalten. Sind die entsprechenden Funktionstasten nicht vorhanden, so kann man die Funktionswerte über die folgenden Beziehungen ermitteln:
10X = e x log
=
ln
10
(30)
In x In 10
In 10 = 2,302585. Ferner gelten ähnlich wie bei
y = e
und y = In
die
Spe-
zialfälle: 10° = l
10
= 10
(3D
•
log 1 = 0
8.2.7
log 10=
l
Die allgemeine Potenzfunktion y = a
X
bzw. z =
V
Mit Hilfe dieser Funktionstaste kann für einen b e l i e b i g e n Exponenten
und eine beliebige Basis a ( b z w . einen Exponenten y und eine Basis x) die Potenz a x bzw. v ·' b e r e c h n e t w e r d e n , sofern die Potenzgesetze eingehalten werden. Der E i n f a c h h e i t halber soll die Funktion im folgenden als
y = a
bezeichnet
werden. Es gelten folgende Regeln: a positiv
> x positiv, n e g a t i v oder Null
a negativ
> x ganzzahlig p o s i t i v , ganzzahlig negativ oder N u l l
a Null
> x positiv
Diese Bedingungen gelten für das System Compucorp. Für andere Rechnersysteme sind weitere Einschränkungen m e i s t dadurch gegeben, daß negative Exponenten bei negativer Basis zu einer
8. Mathematische Funktionen
110
Fehlermeldung führen. Dies ist
eigentlich nur dann mathema-
tisch nicht zulässig, wenn der Exponent gebrochen ist. sem Fall würde man versuchen, die Wurzel aus einer Zahl zu ziehen, was nicht erlaubt
In
die-
negativen
ist.
Die folgende Tabelle gibt den Rechengang für die Berechnung von Potenzen für einen Rechner mit algebraischer Logik (System Compucorp) und ein Gerät mit UPN-Logik (HP 97) wieder: Tab. 42
Berechnung der allgemeinen Potenzfunktion mit algebraischer und UPN-Logik(a
Algebraische Logik
UPN Logik
Tastenfolge
X
Tastenfolge
Eingabe a
a
Eingabe
a
X
Eingabe
a
=
a
a a
X
a a
X
a a
X
X
X
X
y
y
X
X
Y
y
ENTER Eingabe
bzw. y )
y
y
y
X
y
X
Man erkennt, daß bei beiden Logik-Systemen die Basis in das y-Register und der Exponent
in das Eingaberegister
( A n z e i g e ) gelangt. Bei der algebraischen Logik b e d e u t e t dies, daß z.B. mit der Tastenfolge
auf einfache Weise die Potenzen 3", 3 ^ , 3 ' , 3 werden können. Für einen UPN-Rechner wäre die
usw. berechnet entsprechende
Tastenfolge:
LLJLf
m
r* 11 yx
Bei der algebraischen Logik wird also nach Eingabe der
i.2.7
Die allgemeine Potenzfunktion y=a
Basis a die Potenztaste gedrückt,
bzw.
z=x
anschließend
eingegeben und zur Berechnung der Potenz a^
v
111
der Exponent
die Gleich-Taste
betätigt. Bei UPN-Geräten gibt man zunächst - durch ENTER getrennt - Basis und Exponent ein.
Anschließend wird durch
Drücken der Potenztaste die Berechnung durchgeführt. Will man die Basis a nicht in die x-te zahligem
- erheben, sondern die n-te
Potenz - bei ganz-
Wurzel z i e h e n ,
dies der Aufgabe gleich, den Ausdruck a kann man mit Hilfe der Reziproktaste tun.
zu berechnen. Dies Soll z . B . die 3.
Wurzel aus der Zahl 2 gezogen w e r d e n , so ist Tastenfolge
so kommt
dafür folgende
anzuwenden:
n Tab. 43
Berechnung des Ausdrucks y =
jAa '
am Beispiel y = UPN-Logik
Algebraische Logik Tastenfolge
Y
2
2
a
X
X
3
DZ3 =
Tastenfolge
X
m
2
Y
2
2 aX
ENTER
2
2
3
2 aX
3
3
2
1/3
2 aX
1/x
1/3
2
V
2 ax
y
VT
2
X
Die Reziproktaste nach Eingabe des Wurzelexponenten bewirkt, daß die n-te
Wurzel aus der zuerst eingegebenen Zahl errech-
net wird. Ist
der Exponent der Potenz selbst ein zusammengesetzter
Ausdruck, so muß dieser bei einem algebraischen Rechner in Klammern gesetzt werden, oder aber der Exponent muß zuerst berechnet und dann in einem Konstantenspeicher abgelegt werden.
112
8. M a t h e m a t i s c h e Funktionen
Bei der Berechnung von Potenzen .sind folgende Sonderfälle zu beachten: a° = l
0 = 0
ox = o
> 0
1° = l 1 = 1
Die f o l g e n d e n Beispiele sollen die Möglichkeiten a u f z e i g e n ,
die
bei der Anwendung der Potenziertaste gegeben sind (Beispiel 10). Tab.
44
Beispiele zur Anwendung der v a (System Compucorp)
1
Zu berechnender
Tas t e n f o 1,?e
Ergebnis
Ausdruck
35
3
(-3)5
CH S
3 o,7
(-3
3 5
a
X
a
3 a
1=
5
X
X
3
CH s
3
11
5
1.
0
CH S
243.0000
a
-243.0000
=
7
:=
X
C HS
5
X
3
a
2.1577 =
-0.004l
5
.
(_3)3,5
ERROR =
^ s (-3) ^
CH s
-
3 5
1
a
X
C HS
3 ERROR
5.2.7
Die allgemeine Potenzfunktion y=a
Fortsetzung von Tab. 44
113
B e i s p i e l e zur Anwendung ( S y s t e m Compucorp)
der Potenziertaste Zu berechnender
b z w . z=y
Ergebnis
Tastenfolge
Ausdruck
2
5
2
a
0
1.27.10 30
0
CHS
-,-300
(1,01)
1.5838
a
10000
4.91-10 -9l
m turn 1
0
0 l
1.64-10 43 0
0
EXP
l
l
2
EXP
2.71828..
n = 10 12
,do 9 8 )
0
EXP
do' 20 )
EXP
(ΙΟ* )
EXP
,(2+ln3)
1.0000
a
CHS
a
A
l
l
/
(
2
χ
, .. l
1.0000
0
8.5659
114
8. M a t h e m a t i s c h e Funktionen
Man erkennt, daß sowohl die Basis als
auch der Exponent
praktisch jede Größe annehmen können, sofern die Potenzgesetze eingehalten und keine unerlaubten mathematischen Operationen vorgenommen werden. Ferner darf das Ergebnis die Kapazität des _ GO
Rechners (10
i QQ
bis
( - 2 ) 0 ' 5 = Vr2"'
10
) nicht überschreiten. Die Ausdrücke
und 2100° = 10301
können daher auf einem
Rechner nicht direkt e r m i t t e l t werden: Bei einem Versuch würde eine Fehlermeldung erscheinen! Verfügt der Rechner nicht über eine spezielle Taste a oder y
•^
x
zur Berechnung einer P o t e n z , sind jedoch die Funkl
l
l
tionstasten [ e [ und [In vorhanden, so ist eine Bereche nung von a für positive a-Werte nach folgender Beziehung möglich: a
8.2.8
= e
x · _Ln
***^ ~ a .> ,
-
69 den Ausdruck l o g ( n ! ) zu berechnen g e s t a t t e t :
log(n! ) -
1nf
' "
In 10 l n < n · )
l n ( n ! ) = In /""( n+ 1 )
= In
In 1 /~z = ( z - -5·) In z
- z
1
N +
1
1 360 z 3
12 z
(44)
(z = n + 1)
ln(2 7
)
+
R
1
1
1260 z5
1680 z 7
Den entsprechenden Wert für n! selbst erhält man aus dem Ergebnis mit n! = I 0 1 0 g ( n ! ) Diese Gleichung kann 69 ist.
Für größere
(45)
benutzt w e r d e n , wenn n nicht größer -Werte ist
als
dann nur der Logarithmus von
n! angebbar. Insgesamt gesehen kann die obige Formel für nq£
Werte von 0 ( 0 ! = 1 ) bis
ca.
1CT
q£
c
( 107 ! a#10
qA
mit
c »# 107 )
mit einer ausgezeichneten Genauigkeit angewandt w e r d e n , wie die folgende Zusammenstellung von Rechenbeispielen zeigt. Dabei sind für
ganzzahlige n die Werte für n! aus Gl. 37 (Stir-
lingsche F o r m e l ) , Gl.
44 bzw. 45 ( U n i v e r s a l f o r m e l ) und aus der
5.2.11
Die Funktion y = n!
Definitionsgleichung n ! = 1
2
3
( -Fakultät)
...
131
gegenüberge-
stellt. Tab.48
Berechnung von n! nach verschiedenen
n
n! ( D e f in. )
Methoden
n! ( Stirling)
F %
n! ( Universal)
F %
0,03
0
1
0,9221
7,8
0,99969254873
1
1
0,9595
4,1
0,99999889987
w-1*
2
2
1,9454
2,7
1,99999993063
4-10' 6
3
6
5,8765
2,1
5,99999998302
3 ·10~ 7
6
720
711,4851
1,2
719,999999985
2 ·10~9
10
3628800
3601420,4591
0,8
3628799.99993
l.io-9
50
3,041 -10
0,2
3,04l · 10
,,
(.L
3,036-io b q
Man erkennt, daß die Abweichungen
der mit Hilfe
64
4-10
der
9q
"Univer-
salformel" ermittelten Ergebnisse nur um ganz geringe Beträge von den nach der Definitionsgleichung berechneten Werten abweichen. Dies gilt auch für gebrochene
- W e r t e , wenn man diese
mit nach G1.42 berechneten Werten vergleicht.
Der Ausdruck
(
k
)
= n über k
Eng verwandt mit dem Begriff
der Fakultät ist
der Ausdruck
( " ) , gesprochen "n über k". Es gilt
< k) =
(46) k! (n - k ) !
132
8. Mathematische
Funktionen
Für die Berechnung von "n über k" gelten folgende
n = k
n < k
=
Regeln:
l
= 0
n > k
) = l
Ist
n größer als
69, so führt die direkte Berechnung von ( . )
nach Gl. 46 zu einer Fehlermeldung, da bereits beim Berechnen von n! im Zähler des Ausdrucks die schritten wird. Es gibt aber F ä l l e , 69 ist,
Kapazität des Geräts überin denen n zwar größer
als
der Ausdruck (, ) selbst aber die Kapazität von 10 K.
noch nicht überschreitet. In diesem Fall muß ( ,
) auf andere
Weise errechnet werden. Nach einer entsprechenden Umformung von Gl.
46 erhält man:
LABEL 2
X
STO 3
RCL χ 3 STO + 1 1
f
J
J
Γχ
1 j: = j + l
f
j *
STO + 4
1 (Z^M.·d f j ) /Z f j = ~ J Ausgabe
χ
163
164
12. Mittelwerte
In den Schritten l bis 5 erfolgt die Löschung der Speicher 2 , 3 und 4. Die fortlaufende
Nummer
der Klasse, für
l,
die die
Werte XM und f eingegeben werden sollen, wird in den Schritten 7 bis
9 gebildet und als
Kennzahl bei
Befehl ( S c h r i t t 10) angezeigt.
dem nachfolgenden STOP-
Nach Eingabe der Klassenmitte
der j-ten Klasse und anschließendem START erfolgt ein Sprung nach LABEL l , u n d der eingegebene W e r t wird im Speicher 3 abgelegt. Beim nächsten STOP-Befehl ( i n der Anzeige erscheint der eingegebene Wert x^ ) erfolgt die Eingabe der
Häufigkeit
f i in der j-ten Klasse. J Nach erneutem START wird zunächst im Schritt 16 der eingegebene f .-Wert zu dem bisherigen Inhalt U von Speicher 2 addiert.In den Schritten l? und 18 erfolgt dann die Bildung des Produkts halt des Speichers
· f . und seine Addition zu dem In-
1. Schließlich wird in den Schritten 19 und
20 die Klassennummer j um l erhöht. Anschließend erfolgt
ein
Rücksprung zum LABEL 0. Wird nach Eingabe aller Daten nach dem STOP-Befehl bei
Schritt 10 einfach
ein Wert eingegeben w u r d e , dann ist
"START" gedrückt, ohne daß die Bedingung für den
Sprung nach LABEL l in Schritt 11 nicht erfüllt, gramm wird bei
LABEL 2 mit
(Schritte 23 bis
25)
und das Pro-
der Berechnung und Anzeige von
~x
fortgeführt.
Beispiel 3 In einem Laborversuch wurde von 2000 roten Blutkörperchen der Durchmesser bestimmt. Die Werte lagen zwischen 5,6 und 9,2 /um. Der Datenvorrat wurde in 10 Klassen e i n g e t e i l t , wobei folgende Häufigkeiten resultierten: Klassennummer
j
X
M. J (*im)
1
5,6
2
6,0
3 4
6,4 6,8
5
7,2
f . J
Klassennummer
j
*M. J
f . J
(/um)
5 78 144 479 542
6
7 8 9 10
7,6 8,0 8,4 8,8 9,2
358 279 99 15 1
12.1.2
Arithm. Mittel aus klassierten Werten
165
Progratnmablauf (System Compucorp 3 2 6 ) : a)
Programm eintippen bzw. einlesen (Band o.
b)
|JUMP][START] [START]
c)
Kassette)
Anzeige
7 Γ
Eingabe x_
Eingabe f
5.6000 j
.6000
/
5.0000
7
/a. Eingabe
Eingabe
/
/
6.0000 /
[_
6.0000 /
/
78.0000 /
7
/10.
/
Eingabe x_
9.2000
10
9.2000
/
166
12. Mittelwerte
Eingabe f
1.0000
10
/ll.
7.2500 /
Ausgabe |RCL| | 2 |
= Ausgabe n
2000.0000
/
Durch Abrufen des Speichers 2 nach Ausgabe des Mittelwertes wird der Wert n als
die Summe der eingegebenen f .-Werte in die J eine zusätzliche Kontrolle der
Anzeige gebracht. Dadurch ist Rechnung möglich.
12.1.3
Spezielle Methoden zur Berechnung von
Oftmals unterscheiden sich bei der Ermittlung des arithmetischen Mittels die Einzelwerte nur in den l e t z t e n Stellen. Beispiel: Eichung einer Analysenwaage (Beispiel 4) Auf einer Analysenwaage wird ein 50g ~ Gewicht a u f g e l e g t , und es werden 8 wiederholte Ablesungen gemacht. Es ist
das arith-
metische Mittel der 8 Einzelwerte zu berechnen.
Nr.
x± ( g )
Nr.
x± ( g )
1
49,96898
2
49,96909
5 6
3 k
49,96909
49,96905 49,96912 49,96898 .49,96904
49,96908
7 8
Bei der Berechnung von
müßten für
ersten S t e i l e n 4 9 , 9 6 . . .
jeweils erneut eingegeben werden,
wenn man die
alle 8 Einzelwerte die
"direkte" Methode z.B. nach Programm 5 anwendet.
12.1.3
Spezielle Methoden zur Berechnung von
1&7
Folgende Überlegung f ü h r t hier zu einer V e r e i n f a c h u n g : Subtrahiert man von den Meßwerten x.
eine f e s t e Größe a, so
erhält man für das arithmetische M i t t e l von y. = x. - a : i i a = Mit
x
= —s x.
x
= a +
Für das o.g.
n
-2.(xi-a)=^-2.xi-
„-
n
-a
(54)
f o l g t dann nach Umformung:
i- jr y±
(55)
Beispiel wählt man zweckmäßig a = 49,96000. Es
müssen dann lediglich die Zahlenwerte 0,00898 ; 0,00909 usw. eingetastet werden. Um auch das Eingeben der führenden Nullen zu vermeiden, multipliziert man die y . - W e r t e zunächst mit
ei-
nem entsprechenden Faktor c :
c ·x = c ·a
+
— c £ y.
= c·a
+
(56)
— ^~c · y .
Nach Umformung folgt daraus:
*
=a
+
(57)
-±- IWi
Multipliziert man die
y . - W e r t e im Beispiel mit
sind lediglich die letzten 3 Z i f f e r n
c = 10 , dann
der Meßwerte
einzugeben:
898, 909, 909, 908 usw. Die entsprechende Summe wird dann durch den Faktor c - n
dividiert; zu dem Ergebnis addiert man
den Wert a und erhält den gewünschten M i t t e l w e r t x. Durch diese Berechnungsweise spart man zahlreiche Tastenschritte. Während mit der "direkten" Methode für die Eingabe jedes Meßwertes 8 Tasten (einschließlich Dezimalpunkt) gedrückt werden müssen, sind mit der v e r e i n f a c h t e n Methode nach Gleichung 57 nur 3 Z i f f e r n t a s t e n
je Meßwert zu b e t ä t i g e n . Dies
bedeutet insbesondere bei sehr langen Meßreihen eine erhebliche Zeitersparnis. Ein entsprechendes Rechenprogramm sollte so aussehen, daß man vor Eingabe der Meßwerte in der vereinfachten Form die
168
12. Mittelwerte
Größen a und c eingibt. Anschließend werden für
alle Meßwerte
die Produkte c . y . eingetippt und automatisch summiert. Die Anzahl der Einzeldaten wird m i t g e z ä h l t .
Nach Eingabe aller Ein-
zelwerte e r f o l g t dann die Berechnung von
aus a,
c, n und
^c.y. . Lohnt sich die Vereinfachung der Daten nicht (weil die W e r t e zu stark s t r e u e n ) , dann gibt man einfach für
a und
c die Werte Null bzw. Eins ein. In der Praxis kann man aber auch so vorgehen, daß man zunächst mit den "normalen" Programmen 5 oder 6 den Mittelwert c.y.
berechnet
und
aus dem Ergebnis dann "manuell"
m i t t e l t : Dividieren von c - y .
er-
durch c und anschließende Addi-
tion von a. Wegen dieser einfachen, aber ebenso
zeitsparenden
Arbeitsweise wurde auf die Angabe eines speziellen Rechenprogramms hier v e r z i c h t e t .
12.2 Geometrischer Mittelwert Zahlreichen Problemen der Naturwissenschaften liegt nicht die bereits erwähnte symmetrische Normalverteilung zugrunde, sondern die schiefe logarithmische Normalverteilung, deren Form in der folgenden Abbildung dargestellt
ist:
•D O
X
• Meflwert Abb.5
Logarithmische Normalverteilung
12.2
Geometrischer M i t t e l w e r t
169
Eine logarithmische Normalverteilung kann insbesondere in folgenden Fällen angenommen werden: 1.
Die Meßergebnisse erstrecken
sich über einen großen
Bereich von mehreren Zehnerpotenzen wie z . B . bei der Keimzahlbestimmung in Lebensmitteln oder bei der spektrochemischen Bestimmung von Metallspuren. 2.
Die Ergebnisse liegen nahe bei dem Wert Null. Bei einer
chemischen Analyse bedeutet dies, daß der "wahre" W e r t in der Nähe des Kontroll- bzw. Blindwertes l i e g t , z . B . bei Konzentrationsmessungen im Spurenbereich. Der "wahre" Wert bzw. das "richtige" Ergebnis wird hier nicht durch das arithmetische M i t t e l der Einzelwerte x . , sondern durch den arithmetischen M i t t e l w e r t der Logarithmen wiedergegeben bzw. - bei einer in der Praxis immer nur endlichen Zahl von Messungen - g e s c h ä t z t . Es gilt daher: __ log
= — ( l o g x^^ + log x 2 + ...
Man d e f i n i e r t log
+ log x f i )
(58)
weiterhin: (59)
= log XG
Dabei stellt x„ den "Durchschnittswert" aller x . - W e r t e dar, (a
d.h.
l
es repräsentiert den "wahren" W e r t / u . Formt man G1.58 nach den Logarithmengesetzen u m , so e r h ä l t
man
die
Beziehung
log x = log x^ = log (
Entlogarithmieren f ü h r t
xfi = ( X . x x
G
...
1·
2
...
x^) ,1/n
(60)
schließlich zu der Gleichung
x)1/n =
= Geometrischer M i t t e l w e r t
. , ...
x ·
(6l)
170
12. Mittelwerte
Somit gilt folgender Satz: Der geometrische Mittelwert x_ von n Einzelwerten u
ist
gleich der
- t e n Wurzel aus dem Produkt aller
n Einzelwerte x. bis l Dabei ist
n
.
zu beachten, daß keiner der Werte gleich Null sein
darf, da dann das gesamte Produkt auch gleich Null wird. Zwischem dem arithmetischen und dem geometrischen Mittel einer gegebenen Reihe von Einzelwerten besteht die Beziehung
(62) Berechnet man von einer Datenreihe fälschlicherweise den arithmetischen Mittelwert,
obwohl das geometrische Mittel we-
gen der logarithmischen Verteilung der Einzelwerte richtig wäre, so erhält man s t e t s einen zu großen Schätzwert für das "richtige" Ergebnis /u.
Berechnung des geometrischen Mittelwertes Die Berechnung von Einzelwerte ist
durch Addition der Logarithmen der
zwar prinzipiell möglich und auch richtig aber
unzweckmäßig, da auf dem Rechner noch die |log| - Taste gedrückt werden muß. Einfacher ist
das Multiplizieren der n W e r t e , wo-
bei dann aus dem Produkt die n-te Wurzel zu ziehen ist. Dabei ist
- wie erwähnt - zu beachten, daß kein Meßwert gleich Null
oder kleiner als Null ist, da dann die n-te Wurzel nicht definiert ist Lediglich
und auf dem Rechner eine Fehlermeldung erscheint.
in den Fällen, in denen die Einzelwerte sehr große
Zahlen darstellen, ist
es günstiger, das geometrische Mittel
über die Addition der Logarihmen nach G1.5Ö zu berechnen. Denkbar wäre nämlich, daß durch bestimmte extrem große Einzelwerte bereits ein so großes Teilprodukt gebildet wird, daß
12.2
Geometrischer M i t t e l w e r t
die Rechnerkapazität überschritten w i r d , obwohl das Produkt 99 aller Einzelwerte ein Ergebnis l i e f e r t , das kleiner als 10 (größter möglicher Zahlenwert auf einem Rechner mit Gleitkommadarstellung)
ist.
Programm Nr.8
Geometrischer M i t t e l w e r t
Speicherbelegung
TTx l
* '
| STO | |~T
1,2
1 STO 1
Erläuterung 1 ^ Produktspeicher
3,4
0 STO 2
i =0
5
LABEL 0
6
1
Bildung der lfd.
7 8
RCL + 2
des einzugebenden Wertes
KENNZAHL
als Kennzahl Eingabe x .
Schritt-Nr.
Befehl
Nummer
9 10
STOP
11
JUMP 2
12
LABEL 1
13
STO x 1
•TTx. ' i := x.i '77x. ' i
Ik
1
i:
15
STO + 2
16
JUMP 0
17 18
RCL 1
19
a
20
RCL 2
i =n
21
1/x
l/n
22
=
23
STOP
Ausgabe x
2k
JUMP START
Rücksprung zum START
JUMP +-= 1
LABEL 2
Bei Eingabe —> LABEL 1, sonst
—) LABEL 2
= i +1
Sprung nach LABEL 0
/Tx±
(77V1/n
171
1?2
12. Mittelwerte
Das Programm ähnelt dem zur Berechnung des arithmetischen Mittelwertes ( N r . 5 ) mit folgenden Ausnahmen: Im Speicher l werden die Meßwerte multipliziert ( i m Gegensatz zur Addition bei Programm N r . 5 ) · Dazu muß zu Beginn des
Pro-
gramms der Speicher mit dem Inhalt l belegt werden. Wäre der Inhalt wie beim Programm Nr.5 gleich Null, dann würde sich bei der Multiplikation immer wieder Null ergeben,
so daß die
Bil-
dung des Produkts der x . - W e r t e nicht möglich wäre. Die Schritte 17-22 umfassen die Berechnung der zel aus dem gebildeten Produkt. Dieser Programmteil
-ten Wurentspricht
damit der Division der Summe durch die Anzahl der Meßwerte
bei
der Berechnung des arithmetischen M i t t e l s .
Beispiel 5 Gegeben seien 10 Milchproben, von denen die Keimzahlen zu bestimmen sind:
.l, =
5095
x2 = 26870
/- = 60910
D
x
=
2570
x3 =
290
xg =
39^0
x,
200
x
=
2130
XIQ=
8260
=
x5 = 4750
Eingabe- und Ausgabeschema sind wie bei
der Berechnung des
arithmetischen Mittels nach Programm N r . 5 i deshalb wurde hier auf eine gesonderte Angabe verzichtet (siehe dazu S . l 6 l ) . Für den geometrischen
Mittelwert erhält man x„ = 3737,62. Das u arithmetische Mittel lautet 11507,5 5 würde also einen viel zu
hohen Schätzwert
für
den "Durchschnittswert" /u wiedergeben.
Das Produkt der 10 Einzelwerte ist
gleich 5 , 3 2 · 1
. Wäre eine
größere Zahl von Meßwerten gegeben, so könnte man sich vors t e l l e n , daß die Rechnerkapazität von 1099 überschritten würde, obwohl das geometrische M i t t e l den o.g.
W e r t hat.
In
diesem Fall könnte es daher vorteilhafter sein, die Berechnung über die Addition der Logarithmen vorzunehmen. Aus dem mittle-
12.3 ren Logarithmus log
, = 10los G
kann
Ca
Harmonischer M i t t e l w e r t
173
dann über die Beziehung
x
(63)
ermittelt werden.
12.3 Harmonischer Mittelwert Wenn die
Beobachtungen das, was wir mit dem Durchschnitt
ausdrücken wollen, in reziproker Form angeben, also z.B. km/h oder Teilchen/cm
oder g/ml u . a . , dann wird das harmonische
Mittel angewendet. Definition
Das harmonische M i t t e l von n Daten bis
ist
1'
gleich dem Kehrwert des arith-
metischen Mittels aller reziproken W e r t e .
1 X
l
+
1 X
+ ... +
l
2
Das "klassische" Beispiel für die Anwendung des harmonischen Mittels ist
die Berechnung einer m i t t l e r e n Geschwindigkeit aus
einzelnen Teilgeschwindigkeiten. Zur Berechnung kann das Programm N r . 5 ( A r i t h m e t i s c h e r M i t t e l w e r t ) verwendet werden. Es muß dann lediglich zwischen dem LABEL l ( S c h r i t t 13) und dem Befehl STO + l ( S c h r i t t 14) der Befehl
1/x eingefügt werden. Dies kann mit H i l f e der Taste
INSERT geschehen (siehe dazu Abschn. 7·
S.101). Das Ergebnis
stellt dann den Kehrwert des harmonischen M i t t e l s dar.
Durch
anschließendes Drücken der Taste 1/x erhält man dann den W e r t für
Xjj. Der Harmonische Mittelwert hat die E i g e n s c h a f t ,
daß auch
Einzelwerte mit in die Rechnung einbezogen werden können, die selbst den Wert "Unendlich" besitzen. Der Kehrwert 1/x geht
174
12. Mittelwerte
ja bekanntlich für ist
gegen Unendlich gegen Null. Dieser Fall
von Bedeutung, wenn die Zeit die Meßgröße ist.
Soll z . B .
die IJberlebenszeit einer bestimmten Tierart nach Verabreichung eines toxischen S t o f f e s getestet w e r d e n , dann kann es vorkommen, daß einige Tiere überleben, während bei anderen nach einigen Stunden der Tod eintritt. Bildet man j e t z t das harmonische Mittel der Überlebensdauer, dann ist
für diejenigen
Tiere, bei denen die Gifteinwirkung nicht zum Tod führt
für
die Zeit der Wert Unendlich einzusetzen. W e i t e r e s hierzu findet man in dem Buch "Biometrie" von Cavalli-Sforza
Beispiel
( l ).
6
Ein Schnellzug f ä h r t von A nach B. Er hält unterwegs noch dreimal an,
so daß die gesamte Strecke in k Teilstrecken zer-
fällt: I.Halt
2.Halt
3.Halt
A
B
Auf den einzelnen Teil-Abschnitten f ä h r t der Zug mit folgenden Geschwindigkeiten: 1. Abschnitt :
80 km/h
2.
"
:
100 km/h
3-
"
:
80 km/h
4.
"
:
l60 km/h
Die Länge der gesamten Strecke b e t r ä g t 4OO km, die
der einzel-
nen Teilabschnitte
jeweils 100 km.
Frage: Welches ist
die Durchschnittsgeschwindigkeit des Zuges?
Wenn das Ergebnis eine durchschnittliche Geschwindigkeit darstellen soll, dann muß sich bei Einhalten dieser Geschwindigkeit auf der gesamten Strecke die gleiche Reisezeit ergeben als wenn der Zug mit den 4 Teilgeschwindigkeiten f ä h r t .
12.4
Der Zentralwert ( M e d i a n )
175
Durch Einsetzen der Teilgeschwindigkeiten in G1.64 erhält man:
4 100
+
— ~50~
= 9 6 , 9 7 km/h
+
Bei Einhalten der Durchschnittsgeschwindigkeit auf der Gesamt strecke von 400 km benötigt der Zug eine Reisezeit von k Stun den 7 Minuten und 30 Sekunden. Die gleiche Zeit erhält m a n , wenn man die Reisezeiten für die k Teilabschnitte addiert: 100 km Strecke mit
80 km/h
=
l h 15 min
100 km
"
mit
10O "
=
l h
100 km
"
mit
80
"
=
l h 15 min
100 km
"
mit 160
"
=
0 h 37 min 30 sec
=
4 h
400 km
0 min
7 min 30
sec
12.4 Der Zentralwert (Mediän) 12.4.1
Definition
Bei gewissen Fragestellungen
- besonders aus dem Bereich
der Biologie - spielt der Zentralwert oder Mediän eine wesentliche Rolle. Definition
Aus einer Reihe von n Einzelwerten x . bis l n ist der Zentralwert oder Median x derjenige W e r t , welcher die der Größe nach geordneten Einzelwerte mengenmäßig in zwei gleich große Anteile zerlegt.
Ist
die Anzahl n der Meßwerte ungerade, dann ist
der Mediän
der (n + l ) / 2 - te Wert der geordneten Reihe der E i n z e l w e r t e .
176
12. Mittelwerte
Bei einer geraden Anzahl von W e r t e n ist
der Mediän als das
arithmetische Mittel aus den m i t t l e r e n Meßwerten der geordneten Datenreihe d e f i n i e r t . In der Literatur wird der Zentralwert *x
meist mit dem Symbol
bezeichnet.
n
ungerade
n
gerade :
V
(65)
.
n+1
C
1/2
(66)
(n/2) + l
Beispiele: Gegeben sind die geordneten Meßwerte zweier Meßreihen mit einer ungeraden bzw. geraden Anzahl von Einzelwerten.
n
ungerade :
1
3
9
9
12
19
23
29
35
4l
43
Nr.
1
2
3
4
5
_i
7
8
9
10
11
*
n + 1 2
Wert
lfd. ~
n
gerade
g
X
X
19
6
:
Wert
2
5
7
10
17
29
30
33
4l
43
l f d . Nr.
1
2
3
4
5
6
7
8
9
10
n = 10
n 2~
=
5
n + 1 2
= 6
(X 5
+ x 6 ) = 23
Berechnung des Medianwertes Die Berechnung des Medianwertes aus einer Reihe von n ungeordneten Meßwerten z e r f ä l l t in 2 T e i l s c h r i t t e : a)
Ordnen der W e r t e nach aufsteigender Größe
b)
Ermittlung von
*x nach G1.65 oder G1.66
12.4
Der Zentralwert
(Median)
177
Für das Sortieren der Einzelwerte benötigt man einen Rechner mit indirekter Adressierung.
Jeder Einzelwert benötigt
nen Speicherplatz. Da zusätzlich k Speicher für
die
ei-
Durchfüh-
rung des Sortierprogramms erforderlich sind, b e n ö t i g t man n + k
Speicher,
um n vorhandene Einzelwerte der Größe nach zu ordnen. Bei
ei-
nem Rechner mit n vorhandenen, auch indirekt a d r e s s i e r b a r e n , Konstantenspeichern können somit n - k Werte s o r t i e r t werden. Als Beispiel sei das System Compucorp 327 genannt, das über insgesamt 44 Konstantenspeicher v e r f ü g t ,
so daß 40 Zahlen der
Größe nach geordnet werden können.
12.4.2
Sortieren von Daten
Als Rechnermodell wird das System Compucorp 327 zugrunde g e l e g t , das über 44 Konstantenspeicher 00, 01 ... bis 43 verfügt. 1. Schritt: Zunächst werden die D a t e n x. bis mit H i l f e l n der indirekten Adressierung in die Speicher l bis n gebracht, wobei die Einzelwerte in der R e i h e n f o l g e eingegeben w e r d e n ,
in
der sie anfallen, also u n s o r t i e r t . Benutzt man den Speicher 00 als
Indexregister, so könnte das Eingabeprogramm so aussehen: Programm N r . 9
Eingabe von n Einzelwerten in Speicher 01 bis
die
n mit H i l f e der
indirekten Adressierung ( S y s t e m Compucorp 327 S c i e n t i s t ) Speicherbelegung
Indexregister X
X
l
2
n
178
12. Mittelwerte Schritt-Nr.
Erläuterung
Befehl
1
1
^Speicheradresse i
2
STO 00
Jwird gleich 1 gesetzt.
3 k
RCL 00
"[Anzeige von i. = Speicher-
KENNZAHL
Jadresse = l f d . Nummer
5 6 7 8 9 10
LABEL 1
STOP
Eingabe x .
STO IND 00 1
STO + 00 JUMP 1
.
> Speicher
i
li: = i + 1 J
Rücksprung nach LABEL 1
2 . S c h r i t t : Der nächste Schritt besteht darin, die Daten in den Konstantenspeichern so umzuordnen, daß nach dem Sortieren im Speicher 01 der kleinste und im Speicher mit der Adresse n (maximal 40) der größte Wert steht. Der Medianwert ist
dann bei ungeradem n der x-Wert im Speicher mit der
Adresse (n + l ) / 2 . Liegt eine gerade Anzahl von Meßwerten vor, dann ergibt sich der Mediän als das arithmetische
Mittel aus
den Inhalten der Speicher mit den Adressen ( n / 2 ) und ( n / 2 ) + l . Beim Sortieren der Daten geht man im einzelnen so vor: Zunächst wird von allen n Daten der kleinste Wert ermittelt und in den Speicher 01 gebracht. Der ursprünglich im Speicher 01 abgelegte Wert gelangt andererseits in den Speicher, in dem der kleinste Meßwert vorher stand. Die Inhalte des Konstantenspeichers, in dem der kleinste Meßwert steht und des Speichers 01 werden also ausgetauscht.
Anschließend prüft
m a n , welcher
x-Wert in den Speichern 02 bis n der kleinste ist.
Man tauscht
die entsprechenden Speicherinhalte wieder aus, so daß jetzt im Speicher 02 der zweitkleinste Meßwert steht. Der drittkleinste Wert wird dann in den Speichern 03 bis n gesucht usw. Zum Schluß vergleicht man den Speicher n-l mit dem Speicher n. Die zunächst unsortiert vorliegenden Meßwerte befinden sich dann geordnet in den Konstantenspeichern 01 bis
n.
12.k.2
Sortieren von Daten
179
Die Ermittlung des kleinsten W e r t e s bei dem Sortiervorgang geschieht so,
daß die
Inhalte der Speicher 01, 0 2 , 03 usw. mit
den Inhalten der jeweiligen restlichen Speicher verglichen werden. Interessiert z.B. der kleinste W e r t der Speicher 01 bis
n,
so vergleicht man den Inhalt des Speichers 01 mit sämtlichen restlichen Speichern 02 bis n. Bei diesem V e r g l e i c h der Speicher mit
den Adressen k = 2 bis
k = n mit
dem Speicher 01 sind
2 Fälle möglich:
a)
x,
< x.
:
Die Inhalte der Speicher 01 und k werden ausgetauscht.
b)
x
^ x
:
Die Inhalte der Speicher 01 und k bleiben unverändert.
Der erste Vergleich f i n d e t also zwischen den Speichern 02 (k = 2) und dem Speicher 01 s t a t t . Je nachdem, ob die gung a) oder b) z u t r i f f t , tauscht
werden die Speicherinhalte
Bedinausge-
oder bleiben unverändert. Der - im Fall a) veränderte
- Inhalt des Speichers 01 wird j e t z t mit dem Inhalt von Speicher 03 (k = 3) verglichen. Je n a c h d e m , ob Fall a) oder b) eingetreten ist,
werden die Inhalte von Speicher Öl und 03
ausgetauscht oder bleiben unverändert. bis
Man v e r f ä h r t so w e i t e r ,
zum Schluß der Speicher 01 mit dem Speicher n verglichen
wird. Will man den kleinsten Wert der Speicher 02 bis
n ermit-
teln, dann muß entsprechend Speicher 02 mit den Inhalten der Konstantenspeicher 03 bis
n verglichen werden u s w . .
Beispiel 7 In den Speichern 01 bis
05 seien die folgenden W e r t e a b g e l e g t ,
die der Größe nach sortiert werden sollen: X1 = 12, x 2 = 5 , x
= 3 8 , x^ = 14
und x
= 9.
Die Daten sind so zu ordnen, daß der kleinste
Wert x
= 5 im
18ο
12. Mittelwerte
Speicher 01 und der gr Tab.5 l
te Wert χ
= 38 im Speicher 05 steht.
Zu vergleichende Konstantenspeicher und Speicherinhalte
beim Sortieren von Daten
Spe icherbelegung vor dem Sortieren:
Speicherbelegung Vergleich
Entscheid
RCL 02 < RCL 01 ? 5 < 12
?
RCL 03 < RCL 01 ?
38 < 5
?
nach Entscheid
RCL RCL RCL RCL RCL
01 02 03 04 05
= 12 = 5 = 38 = 14 = 9
RCL RCL RCL RCL RCL
01 02 03 04 05
= 5 = 12 = 38 = 14 = 9
RCL RCL RCL RCL RCL
01 02 03 04 05
= 5 = 12 = 38 = 14 = 9
RCL RCL RCL RCL RCL
01 02 03 04 05
= 5 = 12 = 38 = 14 = 9
• •
•
NEIN
φ
• •
NEIN
?
RCL 04 < RCL 02 ? 14 < 12
NEIN
?
RCL 03 < RCL 02 ? 38 < 12
NEIN
?
RCL 05 < RCL 01 ?
9 < 5
RCL 01 Φ RCL 02
?
RCL 04 < RCL 01 ?
14 < 5
JA
vor Entscheid
• • • •
· · · *
•
·
• • •
· · ·
NEIN
12.4.2
Sortieren von Daten
18l
Fortsetzung von Tab.51 Zu vergleichende Konstantenspeicher und Speicherinhalte beim Sortieren von Daten Speicherbelegung Entscheid
Vergleich
RCL 05 < RCL 02 ? 9 < 12
?
JA RCL 02
t RCL 05
RCL 04 < RCL 03 ? 14 < 38
?
JA RCL 03 RCL 04
RCL 05 < RCL 03 ? 12 < 14
?
JA RCL 03 RCL 05
RCL 05 < RCL 04 ?
14 < 38 ?
JA RCL 04 RCL 05
vor Entscheid
nach Entscheid
RCL RCL RCL RCL RCL
01 02 03 04 05
= 5 = 12 = 38 = 14 = 9
RCL RCL RCL RCL RCL
01 02 03 04 05
= 5 = 9 = 38 = 14 = 12
RCL RCL RCL RCL RCL
01 02 03 04 05
= 5 = 9 = 38 = 14 = 12
RCL RCL RCL RCL RCL
01 02 03 04 05
= 5 = 9 = 14 = 38 = 12
RCL RCL RCL RCL RCL
01 02 03 04 05
= 5 = 9 = 14 = 38 = 12
RCL RCL RCL RCL RCL
01 02 03 04 05
= 5 = 9 = 12 = 38 = \k
RCL RCL RCL RCL RCL
01 O2 03 04 05
= 5 = 9 = 12 = 38 = 14
RCL RCL RCL RCL RCL
01 02 03 04 05
= 5 = 9 = 12 = 14 = 38
Bei dem angegebenen S o r t i e r - V e r f a h r e n sind insgesamt
— (n-l)
Vergleiche der Inhalte von Konstantenspeichern d u r c h z u f ü h r e n . In einem entsprechenden Sortier-Programm nimmt somit die Zahl der entsprechenden Programmschleifen mit s t e i g e n d e m n stark zu, was g l e i c h z e i t i g eine steigende
Rechenzeit bedeutet.
Für die Anwendung des folgenden Sortier-Programms ist V o r aussetzung,
daß die zu ordnenden n Einzelwerte b e r e i t s in den
Speichern Öl bis n abgelegt sind ( z . B . mit H i l f e von Programm N r . 9 ) . Die Daten sind also zunächst
"ungeordnet" g e s p e i c h e r t .
182
12. Mittelwerte Programm Nr.10
Sortieren von n Einzelwerten und Ermittlung des Zentralwertes
x*
Speicherbelegung: System Compucorp 32?
Schritt-Nr. 1
1 STO 4l
3 4
(LABEL 2
5 6
RCL + 4l STO 42 (LABEL 3 | RCL IND 4l RCL - IND 42 JUMP -= 4
7 8 9 10 11
12 13
14 15 16 17 18 19
1
20
STO + 42 RCL 42 RCL - 00 JUMP -= 3 1
21
STO + 4l
K
=
Indexregister
K = I + 1
Wenn
x_ ^ xv . dann 1 Λ
Sprung nach LABEL 4, sonst weiter mit Schritt 11
RCL IND 4l EXCH IND 42 STO IND 4l
LABEL 4 1
i
=
Erl uterung
Befehl
2
=
Austausch der Inhalte der Speicher I und K ( I , K = Adresse) η
K: = K + 1 =
Wenn K ·ζ· n , dann Sprung nach LABEL 3, sonst —» S c h r i t t 20
I: = 1 + 1
12.4.2
Sortieren von Daten
183
Fortsetzung von Programm Nr.10 Sortieren von n Einzelwerten und Ermittlung des Zentralwertes
'x
Schritt-Nr.
Befehl
Erläuterung
22
RCL 4l
Wenn I < n, dann Sprung
23 24
RCL - 00
nach LABEL 2 ,
JUMP
sonst
25 26 27
— 2
1
» Schritt 25
Indexregister = 1 = i
STO 43 | LABEL 5 |
28
RCL IND 43
Abrufen des Speichers
29 30
PRINT 1
und Ausdrucken
3l 32
STO + 43
33 34 35 36
1 i:
i
= i +1
RCL 43
Wenn i^ n, dann zurück
RCL - 00
nach LABEL 5 , sonst zu
JUMP -= 5 | LABE L 6
Schritt 35 (LABEL 6)
RCL 00
Prüfung,
37 38
: 2= FRACTION
Wenn n geradzahlig
39 40
JUMP = 7
Sprung nach LABEL 7
4l 42
RCL + 00
ob n gerade oder
ungerade. ist,
1
Bildung von
: 2 = STO 4l
— 2
43 44
RCL IND 4l
Abruf
45 * «^ 46
PRINT DOT LINE PRINT
Ausdruck
47 48
STOP
Ende (Programm hält an)
des f~*t
| LABE L 7
49 50
RCL 00
Bildung von
: 2=
5l
STO 41
n 2
Speichers
=
— ^
.
184
12. Mittelwerte Fortsetzung von Programm Nr.10 Sortieren von n Einzeldaten und Ermittlung des Zentralwertes
Schritt-Nr.
Befehl
52
RCL IND 4l
53
STO 42
54 55
1
x" Erläuterung (/ /t r\2 )\ ~~ ^-* ^~^7
1 \J
&
+
STO + 4l
2~
56 57 58 59 6
RCL IND 4l
X
6l
PRINT
Ausdruck von
62
STOP
Ende (Programm hält an)
(n/2)+l U + V
STO + 42 RCL 42
jx"
= V
= |- (U + V)
: 2 =
PRINT DOT LINE x
Programmablauf: a) Eingabe der ungeordneten n Einzelwerte in die Speicher Öl bis
n mit Programm 9
b) Eintippen bzw. Einlesen von Programm 10 c) Eingabe von n in den Speicher 00 d ) START e) Nachdem die Daten sortiert sind, werden diese in der geordneten Reihenfolge
ausgedruckt.
f ) Anschließend wird eine Punktreihe
gedruckt und
danach der Medianwert ausgegeben. Für das Beispiel von Tab.51 würde der Ausdruck so aussehen: 5 9
12 14 38
""i'z"" = T
12.4.2 Das folgende Fließdiagramm
Sortieren von D a t e n
185
verdeutlicht noch einmal den prin-
zipiellen Ablauf beim Sortieren der W e r t e und der anschliessenden E r m i t t l u n g des Medians:
Abb. 6
Fließdiagramm zu Programm Nr. 10 "Sortieren von n E i n z e l d a t e n und Ermittlung des Z e n t r a l w e r t e s
I Label 5 I Ausdruck der Speicher 1 bis n
Median
7=x^ JAln^gerade)
( n ungerade)"*^' * ,/' v
—i
1 FNDF U-
^
Bei Anwendung des Programms ergeben sich in A b h ä n g i g k e i t von n für
das System Compucorp 32? S c i e n t i s t f o l g e n d e R e c h e n -
zeiten:
10 Rechenzeit ( s e c )
17
20
258
186
12. Mittelwerte
12.4.3 Ist
Eigenschaften und Anwendungen des Medians die Verteilung der Meßwerte symmetrisch bezogen auf
den "wahren" Wert /a der Grundgesamtheit, dann f ä l l t der arithmetische Mittelwert mit dem Medianwert zusammen (theoretisch allerdings nur bei unendlich vielen Meßwerten). Da andererseits der Mediän - im Gegensatz zum arithmetischen Mittelwert ~ ist, als
- unempfindlich gegen abseits liegende Meßwerte
kann man den Mediän bei Serien geringen Umfangs ( n < 1 0 ) eine gute Schätzung für den Wert /u verwenden. Eine Anwen-
dung ist
z.B. in der chemischen Analytik bei Verfahren wie der
EmissionsSpektralanalyse bzw. InfrarotSpektroskopje
gegeben.
Besonders in der Toxikologie und Pharmakologie sind die Begriffe
der "mittleren tödlichen Dosis" bzw. der "mittleren
wirksamen Dosis" von Bedeutung. Bei der Behandlung von pflanzlichen oder tierischen O b j e k t e n mit entsprechenden Präparaten interessiert z . B . , bei welcher Dosis genau 50 % der untersuchten Individuen die gewünschte Wirkung zeigen. Sterben etwa bei einem Versuch 50% der behandelten T i e r e , dann bezeichnet man die zugehörige Dosis des Präparats als Letale Dosis 5° oder abgekürzt LP 50. Sie ist
gleich dem Median x
der "tödlichen
Dosiswerte", die bei der Aufnahme einer Dosis-Wirkungs-Kurve zwischen 0% und 100% Sterblichkeit
untersucht werden.
Nähere Ausführungen zu dieser Problematik (Probitanalyse) findet man bei L.Cavalli-Sforza "Biometrie" ( l
).
13. Streuungsmaße
13.1 Allgemeines Die im vorigen Abschnitt behandelten Durchschnittswerte sind ein
Maß für
die
Lage des
"wahren" Wertes /(JL der Grundge-
samtheit. Aus der Angabe eines M i t t e l w e r t e s ist
aber noch kei-
ne Aussage über die Streuung der Einzelwerte m ö g l i c h . Mittelwerte sagen noch nichts über die Güte eines Meßverfahrens a u s , wie das folgende Beispiel z e i g t : Meßreihe a X
l = _ 2
X
Meßreihe b
60 80 i4o
99,99 100,02 99,98 X 3 = , *k = X l = x_ = 2
3 = 120 k =
x
X
5 = X 6 = X
=
50
•V
—
100,01
5 100,00 X 6 =
150
~x = 100 ,00
100,00
In beiden Fällen erhält man den gleichen a r i t h m e t i s c h e n M i t t e l wert 3c = 100,00. lich größer als
Im Fall a) im Fall b),
werte vom Mittelwert Zur Beurteilung ein Maß für
sind aber die
Streuungen wesent-
d.h. die Abweichungen der Einzel-
sind erheblich
größer als
im Fall b).
der "Qualität" des Meßverfahrens ist
somit auch
die Streuung n o t w e n d i g , da der M i t t e l w e r t alleine
noch nicht aussagekräftig ist:
Der M i t t e l w e r t ist
bei starker
Streuung der Einzelwerte wesentlich unsicherer als bei geringer Abweichung der einzelnen W e r t e vom M i t t e l w e r t !
188
13.
Streuungsmaße
13.2 Die Spannweite
Die Spannweite R einer Meßreihe von n Einzeldaten ist Differenz
zwischen dem kleinsten (x
die
. ) und größten (x ) min max
Wert.
Spannweite R = x
max
- x
. min
(67)
Prinzipiell kann zur Berechnung von R das Programm Nr.10 "Sortieren von Meßwerten und Ermittlung des Z e n t r a l w e r t e s " verwendet werden. Durch Abrufen der Speicher mit den Adressen 01 und n können nach dem Ordnen der W e r t e x
. und x ermittelt min max werden. Die nach G1.67 berechnete D i f f e r e n z ist dann die Spannweite R. Da bei
n vorhandenen Datenspeichern im Rechner aber nur
n - 4 E i n z e l w e r t e sortiert werden können, ist
somit bei den
meisten G e r ä t e n nur eine sehr eng begrenzte Zahl von Daten zu verarbeiten. Um aus einer beliebigen
Anzahl von Meßwerten die
Spannweite bzw. x . und x zu e r m i t t e l n , wählt man ein anmin max deres P r i n z i p , das es g e s t a t t e t , mit H i l f e von nur 6 Speichern die Rechnung durchzuführen: Zunächst werden 2 Konstantenspeicher mit den W e r t e n 98 = 0 und x . = 1 0 b e l e g t . Wir wollen annehmen, daß der max min Speicher l für x . und der Speicher 2 für x reserviert ist. min max x
Für jeden eingegebenen Meßwert wird nun ein Vergleich mit den Inhalten der Speicher l und 2 durchgeführt. kleiner als als Ist
der Inhalt von Speicher
l,
Ist
der Meßwert
dann wird dieser Wert
neuer "x . -Wert" d e f i n i e r t und in den Speicher l gebracht, min der Meßwert dagegen größer als der Inhalt von Speicher 2,
dann wird er als
neuer "x -Wert" definiert und in den Konmax stantenspeicher 2 geschrieben. T r i f f t die dritte Möglichkeit zu - liegt nämlich der Meßwert zwischen den bisherigen "xmin"-
13.2
Die Spannweite
189
und "x
"-Werten - dann bleiben die Inhalte der Speicher l max und 2 unverändert. In diesem Fall s t e l l e n die Speicherinhalte nämlich bereits den kleinsten bzw. größten Wert der überprüften Daten dar. D i e Belegung d e r Speicher m i t d e n "Startwerten" = 0 max 98 und . =1O hat folgende Bedeutung: Beim Beginn des Programms, d . h . vor der Eingabe der D a t e n , sind ja naturgemäß die Speicher l und 2 noch n i c h t mit Meßwerten b e l e g t . Die Inhalte könnten theoretisch beliebig gewählt werden. Damit aber einer der Meßwerte als möglicher "x . "- bzw. "x "-Wert erkannt min max wird, muß er in jedem Fall größer als der Inhalt von Speicher 2 (reserviert für x ) oder kleiner als der Inhalt von Speimax eher l ( r e s e r v i e r t für x . ) sein. Würde man nämlich z . B . den min Speicher l mit dem Wert x = 10 b e l e g e n , und wären die Meßwerte aber al^Le größer als
10, dann würde der Fall
x < Speicher l
nie
e i n t r e t e n , und aus dem Datenvorrat könnte x . nie ermitmin telt werden. Entsprechendes gilt für den größten Meßwert. Aus
diesem Grund erfolgt die Wahl der o . g . "Startwerte". Programm Nr.11
Spannweite und kleinster und größter W e r t einer Meßreihe
Spe icherbelegung:
= x l. Schritt-Nr.
Befehl
Erläuterung -
Startwert für x = 0 max
1
0
2
STO 2
3 4
EXP 98
5 6
LABEL 1
7 8
RCL + 0
KENNZIFFER
Kennzahl i
9
STOP
E ingabe x .
Startwert für x . = 1098 min
STO 1 1
-
lfd.
Nummer
Meßwertes
des
als
190
13. Streuungsma e
Schritt-Nr.
Nachdem
Befehl
Erl uterung
10
STO 3
11
RCL - 1
Wenn χ . 5'10
209
%l
Bei der Erstellung eines entsprechenden Rechenprogramms muß beachtet werden, daß die Konstanten r und a i bis a p vor Programmlauf abgespeichert werden müssen. Besitzt man einen Rechner, der über einen Magnetkartenleser oder eine Bandstation v e r f ü g t ,
dann werden die Konstanten einmal in den ent-
sprechenden Konstantenspeichern abgelegt und auf Band oder Magnetkarte "geschrieben", von wo sie
dann bei Bedarf abgeru-
fen werden können. Hierzu sind die speziellen Anleitungen der Rechner heranzuziehen. Für die sei
Systeme Compucorp 326 und 327
das Prinzip des "Schreibens" auf Magnetband und des
"Lesens" von Band kurz beschrieben: Die Bandkassetten sind in "Segmente" a u f g e t e i l t , von denen jedes 14 Datensätze oder 14 Programme aufnehmen kann. Der Umfang der Datensätze bzw. Programme entspricht dabei der Zahl der auf dem Rechner zur Verfügung stehenden Konstantenspeicher bzw.
Programmspeicherplätze ( 1 2 Konstanten oder 160 Programm-
schritte beim System Compucorp 326 bzw. 44 Konstanten oder 4l6 Programmschritte beim System Compucorp 3 2 7 ) . Zum Schreiben von Konstanten auf Band dient der Befehl n WRITE ON TAPE m. Dabei ist
n die
Nummer des Datensatzes und m die
höchste Adresse des Konstantenspeichers, der auf das Band geschrieben werden soll. Bei dem System Compucorp 327 mit 44 Konstantenspeichern (Adressen 00 bis der Befehl 3 WRITE ON TAPE 5,
43) bedeutet danach z.B.
daß die
Inhalte der
Speicher 00
bis 05 auf den 3. Datensatz des S e g m e n t s , das angesteuert
ist,
geschrieben werden. Entsprechend bewirkt dann der Befehl 3 READ FROM TAPE, daß die
Inhalte der
Speicher 00 bis
05 vom
Band in die Konstantenspeicher OO bis 05 im Rechner übertragen werden. Sollen also z.B. die Konstanten r und a bis a , die in den Speichern 0 bis
5 abgelegt sind, auf den Block l ( I . D a -
tensatz) des Bandanfangs geschrieben werden, dann sind dazu folgende Befehle notwendig: r
STO
O
a
STO
3
a
STO
l
a^
STO
4
a 2 STO
2
a
STO 5
l WRITE ON TAPE 5.
210
13. Streuungsma e Programm Nr.13
Integration der Normalverteilung in den Grenzen -z und +z durch Polynomapproximation
Speicherbelegung:
Schritt-Nr.
Befehl
Erl uterung
1
1
2
KENNZAHL
KENNZAHL 1. Eingabe z
3
STOP
4
STO 6
5 6
RCL χ 0
7 8
1
9 10
1 + r z 1/x
STO 8
13 14
7Γ + = "V '
15 16
STO 7
11 12
r- z
+
l/x
17 18
RCL 6 2
19
:
t = 1/(1 +
1/Τ/27Γ"
X
e
20
2
21
=
22
CHS
23
e
X
-z 2 / 2
rz)
13.3.2
Integration der Normalverteilung
Fortsetzung von Programm Nr.13 Integration der Normalverteilung in den Grenzen -z und +z durch Polynomapproximation Schritt-Nr.
Befehl
Erl uterung
24
STO χ 7
f(z)
25
RCL 8
t
26
RCL χ 5
27
RCL + 4
28
RCL χ 8
t(a4 + a5t)
29
RCL + 3
a3 + t ( a 4 + a ? t )
30
RCL χ 8
t(a3 + tCa^ + a5t)
31
RCL + 2
a2 + t ( a 3 + t ( a 4 + a ^ ) )
32
RCL χ 8
t ( a 2 + t ( a 3 + t(a4
33
RCL + 1
ai + t
34
RCL χ 8
t(a1+t(a2+t(a3+t(a4+a5t))))
35 36
RCL χ 7
37 38
2
39 40
CHS
4l 42
1
43 44 45 46
v *4 + v
U2+
t(a3+
t(
+
a^)))
a4+
P ~
X
=
2 P - 2 P
-H
X
1 - 2 P
100
=
S* = 100 ( 1 - 2P)
STOP
Ausgabe S* ( % )
(%)
JUMP STAR! R cksprung zum START
a 5 t ) ) )
211
212
13. Streuungsmaße
Beispiel Zum Vergleich soll das auf S.207 angeführte Beispiel zum Programm N r . 1 2 (Integration durch Reihenentwicklung) durchgerechnet werden. Programmablauf: a) Belegung der Speicher 0 , 1 , 2 , 3 , 4 und 5 mit den Konstanten r , a.. , a_ ,a über Band bzw.
, a,
und a,, manuell oder
Magnetkarte
b) Einlesen des Programms
c) [JUMP|
ISTART|
[START|
Eingabe z = 2
L
2.0000
{_
95.^500
/
| START |
Ausgabe S Das Ergebnis ist
(%)
identisch mit dem, was mit Programm Nr.12
] er-
halten wurde. Die Berechnung nach Programm Nr.13 kann - im Gegensatz zu der Methode über die Reihenentwicklung - auch mit einem Rechner vorgenommen werden, der nur über eine lineare Programmiermöglichkeit v e r f ü g t ,
d.h.
dem die Möglichkeit
f e h l t , Programm-
schleifen zu durchlaufen. Ansonsten sind beide Rechenverfahren gleichwertig, wie die Gegenüberstellung in Tab.52 zeigt. In der Literatur f i n d e t man zahlreiche weitere Beispiele zur näherungsweisen
Integration der Normalverteilung. Erwähnt
seien insbesondere die
Zusammenstellungen im "Handbook of
M a t h e m a t i c a l Functions" von Abramowitz und Stegun ( 7 ) sowie im Band 2 der Reihe "Distributions in Statistics" von Johnson und Kotz ( 9 ).
Weitere Approximationen werden angegeben von
Burr ( 1 0 ) , Hart ( 1 1 ) , Raab und Green ( 1 2 ) , Gray ( 1 3 ) und Hoyt (14).
13.3.2 Tab.52
Integration der Normalverteilung
213
Vergleich der Genauigkeit bei der Integration der Normalverteilung durch
Reihenentwicklung
und Polynom-Approximation z
0,674490 1,036433 1,644854 1,959964 2,575829 3,290527 3,890592
s
(°/o)
(%)
S (°/o)
S
Theorie
Reihenentwicklg.
Polynom-Approxim.
50,00
50,000015876
50,000030213
70,00
69,999981837
69,999977951
90,00
90,000007695
90 ,000010826
95,00
95 ,000000181
99,00 99,90
98,999999122 99,900000095
95 ,000014179 98,999993240 99,899988296
99,99
99,990000004
99,989996079
Die in den Abbildungen 11 bis
14 s c h r a f f i e r t e n Flächen W
lassen sich wie folgt alle auf die Berechnung der Fläche S ( % ) zwischen
-z und +z
zurückführen ( s i e h e Abb. 10 bzw. 15): Abb. 17 Berechnung von Flächen unter der Normalverteilung W = Fläche zwischen z.
und z„
a) W = 2 [ S ( lz
(%)
(94)
Z 1 > 0 , :, 2 >o, Z j < Z
b) W =
c) W
)]
J )- s*(| z 2 |
=
: 2 + ( 2 H*0
(siehe Abbildung)
W = 50 + | S * ( z a )
b)
-*
z.
(SO
(97)
z^ 0
w = 50 - | s*(|
| ) (%)
(98)
Abb.19 Berechnung von Flächen
/i t
unter der Normalverteilung W = Fläche zwischen z a)
z.> 0
Zj
0, Z 1 < O
W = 100 - S ( z 2 )
z·,
z
(101)
(100)
13.3-2
Integration der Normalverteilung
215
Beispiel a)
Für das auf S.153 beschriebene Beispiel der Längenmessung
von in einem Produktionsprozeß hergestellten Schrauben ergab sich die
in Abb.4 auf S. 155 dargestellte Normalverteilung.
Der M i t t e l w e r t ^ ! betrug dabei 4 9 , 7 5 mm. Aus der genannten graphischen Darstellung läßt sich eine Standardabweichung von etwa 0,5 mm ablesen. Alle Schrauben, die /u um mehr als
den m i t t l e r e n Wert
2% nach oben oder unten ü b e r s c h r e i t e n , werden
als Ausschuß angesehen und aussortiert. Wie groß ist
ihr An-
teil an der Gesamtproduktion? Antwort:
2% von 4 9 , 7 5 = 0 , 9 9 5 mm .
durch die
Standardabweichung ff = 0,5 mm, dann e r g i b t sich
Dividiert man diesen W e r t
z = 1,990. Das Problem entspricht dem in A b b . 2 0 Fall. Mit z mit
= z ergibt das Programm Nr.12
f o l g t aus G1.101: W = 100 - 9 5 , 3 4 = 4 , 6 5 %· Der Ausschuß
b e t r ä g t also 4,65% der Gesamtproduktion, d . h . als
abgebildeten
S*= 9 5 , 3 4 %. So-
jede 20. Schraube ist
etwas weniger
im Sinne der oben g e m a c h t e n Annahme
f e h l e r h a f t und unbrauchbar. Dies gilt allerdings nur, der Herstellungsprozeß
solange
immer unter den gleichen Bedingungen
abläuft. Beispiel 11 b)
Ein Analysenverfahren zur Bestimmung eines Pestizide in
Lebensmitteln hat eine Standardabweichung von l 5 ^ig/kg bei einem tatsächlichen Gehalt von 50 /ag/kg ( W i e d e r f i n d u n g s v e r s u c h ) . Wie groß ist
der Anteil aller "möglichen" - der Grund-
gesamtheit des V e r f a h r e n s entsprechenden - M e ß w e r t e , die den tatsächlichen Gehalt von 50 /ug/kg um nicht mehr als
30% über-
schreiten? A n t w o r t : 3O% von 50 /ug/kg = 15 /ig/kg = 3-fache Standardabweichung (5 / u g / k g ) . Das Problem entspricht hier dem in Abb.18 dargestellten Fall. Mit z.
= 3
5
z l i e f e r t das Programm 12
S = 99,73°/o. Mit G1.97 folgt dann W = 50 + |- ( 9 9 , 7 3 ) = 9 9 , 8 7 % . 99,87% aller Werte liegen also innerhalb des g e f o r d e r t e n Ber e i c h s , u n d nur ca.
l Wert von 770 ü b e r s c h r e i t e t das Limit.
216
13. Streuungsmaße
13·5-3
Schranken der Normalverteilung
Bei den bisherigen Fragestellungen waren bestimmte Grenzen für
die Meßwerte gegeben, und zu ermitteln war die Wahr-
scheinlichkeit, Meßwerte innerhalb der gegebenen Grenzen anzutreffen. Dabei war die entsprechende Fläche unter der Normalverteilung zu berechnen. Fragt man nun umgekehrt, innerhalb welcher Grenzen die W e r t e einer Verteilung liegen, die einen b e s t i m m t e n prozentualen Anteil der Grundgesamtheit ausmachen, dann muß dazu die Gleichung für die Flächenberechnung nach z aufgelöst werden:
e" Z
z = f(S*)
=
/2
dz
(»/„)
(102)
(103)
?
Da man die Gleichung für
S
nicht explizit nach z auflösen
kann, muß eine Näherungslösung herangezogen werden. Nach Hastings ( 15 )
gilt für
den W e r t z bei
gegebener Fläche unter
der Normalverteilung zwischen -z und +z ( i n % ) :
a
= 77
z = 77
o
a
+
a
l
+ 77 (a
+ a 77) —
(105)
j +77
(106)
P
=
i - O?*/IPO)
(107)
13-3.3
Schranken der Normalverteilung
21?
Die Konstanten haben dabei die W e r t e : a Q = 2,515517
b j = 1,432788
= 0,802853
b 2 = 0,189269
= 0,010328
b
a
= 0,001308
Der nach dieser Methode berechnete _ !
z-Wert bei gegebenem S*
beträgt ca. 4 - 1 0
Löst man die Gleichungen 97 bis
101 nach S
a u f , dann
las-
sen sich auch aus den gegebenen Flächen W (= Wahrscheinlichkeiten) die entsprechenden z - W e r t e ermitteln. Bei den in den Gleichungen 94 bis
96 dargestellten Fällen ( s i e h e A b b . 1 7 )
eine Lösung nur m ö g l i c h , wenn eine der beiden Grenzen z z
vorgegeben
ist oder
ist.
Programm N r . l 4 Berechnung der Schranken z der Normalverteilung bei gegebener Fläche Speicherbelegung:
= a Q = 2,515517 = a
= 0 ,802853
= a.
= 0,01O328
= b 1 = l , 432788 = b 2 = 0,189269 = b
Einlesen der Konstanten a ,a ,a , b . ,b 2 ,b ell"
oder über Band bzw. K a s s e t t e .
= 0,001308
und l e n t w e d e r "manu
218
13· Streuungsma e Fortsetzung Programm N r . l 4 Berechnung der Schranken z der Normalverteilung Schritt-Nr.
bei gegebener Fl che
Befehl
Erl uterung
1
1
2
KENNZAHL
KENNZAHL 1.
3 4
STOP
Eingabe S*
5 6
100
7 8
CHS
:
1 - (S*/ 100) 2
+ 1
9
:
10
2
11
=
12
STO 9 2
-
1
"-V · ?
13 Ik
X
15 16 17
In V~"
18
RCL χ 5
19
RCL + k
20
RCL χ 7
21
RCL + 3
22
RCL X 7
23
RCL + 6
24
STO 8
25
RCL 7
??
26
RCL χ 2
7] a 2
27
RCL + 1
28
RCL χ 7
1/x
¥
STO 7
_
7? b 3 b
2
+7
?b3
7?(b 2 H- b 3 7]) b
i +7?Freiheitsgrad f Abb.24 Abhängigkeit der t - W e r t e vom Freiheitsgrad f verschiedene Sicherheiten S ( % )
-0.675 für
242
13- Streuungsmaße
N i c h t nur bei der Berechnung des Vertrauensbereiches auch bei zahlreichen anderen statistischen
sondern
Problemstellungen
werden t-Werte in Abhängigkeit von der Zahl f der Freiheitsgrade und der statistischen Sicherheit S ( % ) benötigt. Man findet daher in praktisch allen statistischen Lehrbüchern
ent-
sprechende tabellarische Zusammenstellungen. In den "Signifikanztabellen statistischer Testverteilungen" von R e i n f e l d t und Tränkle sind die t-Werte von f=l bis Sicherheiten bis
f=200 für
auf 6 Dezimalstellen
verschiedene
angegeben ( 5 ) .
Vertrauensbereich bei einseitiger Fragestellung Fragt man z . B . danach, in welchen Grenzen mit 95% Sicherheit der Wert /u einer Grundgesamtheit l i e g t , wenn
und s aus
n Einzelwerten bestimmt w u r d e , dann werden die Grenzen "rechts" und "links" vom M i t t e l w e r t
umso weiter von
e n t f e r n t liegen,
je kleiner n gewählt wurde. Damit wird der wachsenden Unsicherheit von
und s bei kleiner werdendem n Rechnung getragen.
Manchmal interessiert man sich aber nicht für den Bereich "rechts" und "links" vom M i t t e l w e r t x,
innerhalb dessen der
"wahre" M i t t e l w e r t /u l i e g t , sondern man f r a g t danach, oberhalb bzw. unterhalb welcher Schwelle der Wert /u mit gegebener Sicherheit a n z u t r e f f e n
ist.
Die statistische Sicherheit
ist
dann nicht durch die Fläche unter der t-Verteilung zwischen -t und +t gegeben (ensprechend der Fläche zwischen -z und +z bei der N o r m a l v e r t e i l u n g ) . Es gelten vielmehr folgende Sätze: Wahrscheinlichkeit, den "wahren" W e r t p* unterhalb einer gewissen Schwelle a n z u t r e f f e n
= Fläche unter
der t-Verteilung zwischen - oo und +t. wert
Sind Mittel-
und Standardabweichung s aus n Einzelwerten
e r m i t t e l t worden, und bezeichnet man die Schwelle mit
, dann folgt t durch Auflösen der Beziehung
o =
—
t· s
+ —5=>— yn
Vertrauensbereich bei einseitiger Fragestellung Wahrscheinlichkeit, den "wahren" W e r t / u einer gewissen Schwelle a n z u t r e f f e n
2kj>
oberhalb
= Fläche unter
der t-Verteilung zwischen t und + 0 0 . Bezeichnet man die Schwelle hier mit
, dann folgt der t-Wert
durch Auflösen der Beziehung
Je nachdem, ob die Schwellwerte kleiner oder größer als entsprechenden Mittelwerte
die
sind, können auch die t-Werte
kleiner oder größer als Null sein. In der graphischen Darstellung der t-Verteilung
( A b b . 2 3 ) wird dies deutlich.
Die dargestellte Problematik kann durch Integration der t-Verteilung gelöst werden ( A b s c h n . 13.^.5 ). Ist nun andererseits eine bestimmte Sicherheit vorgegeben, und fragt man nach den oberen bzw. unteren Schwellwerten, dann dürfen die t-Werte nicht den Tabellen für zweiseitige Fragestellung entnommen werden, sondern es müssen die Werte bei einseitiger Fragestellung verwendet werden. Für den Zusammenhang der Flächen unter der t-Verteilung gilt: S%, einseitig = -g ( 1OO + S % , z w e i s e i t i g )
.
(133)
Beispiel Gegeben sei
eine Grundgesamtheit mit dem "wahren" Wert / , aus
der eine Stichprobe von 6 Einzelwerten gezogen wird, welche die Ergebnisse welchen Grenzen liegt /a bei
(Wiederholungswerten) und s liefert. Zwischen
95% Sicherheit? Der entsprechende
t-Wert wird Tab.57 für f = n - l = 6 - l = 5 zu 2 , 5 7 1 entnommen. Wert /u liegt damit nach Gl. 132
yr f^
und u. i na
Der
in den Grenzen
* +-
2 , 5r·—» 7l s
yr
_
Fragt man j e t z t , mit welcher Sicherheit der W e r t / u unterhalb der oberen Schwelle liegt, dann ergibt sich nach G1.133 S%einseitig = 1/2
( 10O + 95%) = 97,5%.
13. Streuungsmaße Will man also z.B. die obere Grenze mit 97,5% absichern, dann muß aus der Tabelle der t-Wert für
95% Sicherheit bei
zwei-
seitiger Fragestellung entnommen werden.
Beispiele zur Anwendung des
Vertrauensbereiches
Um die etwas komplizierte Problematik des Vertrauensbebereiches verständlicher zu machen, zunächst zwei Beispiele: Beispiel 1 a)
Physiologische Kochsalzlösung wird bei
Bluttransfusionen
als
Blutersatz verwendet. Sie hat einen Gehalt von 0 , 9 % N a C l ,
was einer Konzentration von 9g NaCl/1 entspricht (die Dichte wird hier näherungsweise mit lg/1
angenommen). Ist
die Lösung
konzentrierter, dann platzen die roten Blutkörperchen, ist Lösung verdünnter, dann schrumpfen sie.
die
Die Konzentration muß
also möglichst genau eingehalten werden. In einem medizinischen Labor wird eine physiologische Kochsalzlösung verwendet, von der man nicht sicher ist, sie
die Soll-Konzentration von 9g/l
daß
b e s i t z t . Es werden 8 Wie-
derholungsbestimmungen durchgeführt. Der Bereich, in dem die "wahre" Konzentration liegt, soll mit 9 9 , 9 % Sicherheit angegeben werden. Meßwerte
= 2 = 3 = 4 = 1
9 ,3 g/l 9, 9 ,2 I I 9 ,1 I I
= 9 , 2 1 g/l
6
=
7 8
=
9, 4 9, 1 9, 3 9, 2
=
s = 0,113
g/l g/l II II
g/l
Für die Berechnung des Vertrauensbereichs ist
der t - W e r t bei
zweiseitiger Fragestellung für f = n - l = 8 - l = 7 Freiheitsgrade und 9 9 , 9 % Sicherheit zu verwenden. Nach Tab.57 ist ergibt sich für den Vertrauensbereich
t=5,4o8. Somit
der NaCl-Lösung:
Beispiele zur Anwendung des Vertrauensbereichs
Vertrauensbereich ( 9 9 , 9 % ) =
+
245
5 ,40ö-s
yr
= 9|21 +
5 ,408^0,113
yr
= 9 , 2 1 + 0,216
g/l
Untere Vertrauensgrenze
= 9,21 - 0 , 2 l 6 = 8,994
Obere
= 9 , 2 1 + 0 , 2 l 6 = 9 , 4 2 6 g/l
Vertrauensgrenze
g/l
Die "wahre" Konzentration der Kochsalzlösung liegt somit bei 9 9 , 9 % Sicherheit zwischen 8 , 9 9 und 9 , 4 3 g NaCl/1. Das mögliche "Risiko", daß die tatsächliche Konzentration außerhalb des genannten Bereichs liegt, b e t r ä g t nur 0,1% ! Ob die ermittelte Toleranz ausreicht, muß jetzt vom medizinischen Gesichtspunkt aus beurteilt werden. Eine w e i t e r e Beurteilung von der Seite der Statisitk her ist
nicht möglich.
Beispiel 15 b)
Im Rahmen einer Qualitätskontrolle soll Salzsäure auf
Spuren von Eisen untersucht werden. Die Analyse soll zeigen, ob eine obere Schwelle von 0,005% überschritten wird. Diese Fragestellung läuft auf das Problem hinaus, ob die obere Grenze von 0,005% Eisen noch innerhalb des Vertrauensbereichs liegt oder nicht. Hierbei soll eine statistische Sicherheit von 99% genügen. Ein prozentualer Gehalt deutet eine Konzentration von ca.
von 0,005% Eisen be-
50 mg/1. Es werden 6 W i e d e r -
holungsbestimmungen durchgeführt. Meßwerte
= 48,3 mg/l
x,
= 50,1 mg/l
x2 = 4 9 , 7 mg/1
X5 = 4 8 , 9 mg/l
x 3 = 4 9 , 2 mg/l
x6 = 4 9 , 7 mg/l
= 4 9 , 3 2 mg/l
s = 0 , 6 5 mg/l
2 6
13. Streuungsmaße
Da es sich hier um ein Problem mit einseitiger Fragestellung handelt, muß nach G1.133 der t-Wert für S = ( 2 - 9 9 % - 100)= bei zweiseitiger Sicherheit eingesetzt werden. Aus Tabellen findet man für
f=n-l=6-l=5
t = 3,365.
Somit folgt für die obere Vertrauensgrenze:
Einseitige Vertrauensgrenze ( =
49,32
+
£ 50 mg Fe/1)
0^5_ 3,365_0,65
1?
=
=
^^
mg
Bei 99% Sicherheit kann man daher nur garantieren, daß die FeKonzentration
50,21 mg Fe/1 ist
(also
50 mg Fe/1 sein k a n n ) .
Gibt man sich mit 95% Sicherheit zufrieden,
dann ist
t-Wert für 90% Sicherheit bei zweiseitiger Fragestellung zusetzen. In Tabellen findet man für f = n - l = 6 - l = 5
der ein-
und S=90%
t = 2,015. In diesem Fall folgt für die obere Vertrauensgrenze
0
(95%) =
+ ^J?
= ^9,32 +
2,015
0,65
=
^
Q5
Bei nur 95% Sicherheit kann man also garantieren, daß die FeKonzentration in der Salzsäure unterhalb des oberen Grenwertes von 50 mg Fe/1 liegt. Man erkennt, daß das Ergebnis davon abhängt, mit welcher Sicherheit der Vertrauensbereich berechnet wurde.
13.4.3
Berechnung der t-Werte
Um unabhängig von Tabellenwerken zu sein, erscheint es sinnvoll, die t-Werte zu berechnen. Man bezeichnet diese übrigens auch als Signifikanzschranken der t-Verteilung. Da es - wie bei der Normalverteilung - keine Möglichkeit g i b t , die t-Werte explizit als Funktion der Fläche unter der t-Verteilung anzugeben, muß man sich auch hier mit Näherungs-
13-
.3
Berechnung der t-Werte
24?
lösungen begnügen. In der Literatur sind zahlreiche Approximationen für die Berechnung der t-Werte beschrieben. Insbesondere genannt seien hier die Arbeiten von Dawson ( 18), Gardiner u . Bombay ( 1 9 ) , Goldberg ( 2 0 ) , Moss ( 2 1 ) , Veselä ( 2 2 ) sowie Noack u. Reichmuth ( 2 3 ) genannt. Noack u. Reichmuth geben eine Formel a n , mit der man für praktisch alle statistischen Sicherheiten und alle Freiheitgrade (f
= l bis
f = oo )
die Schranken der t-Verteilung ermitteln kann.
t = e ax
+ bx
-f ex
+
d
m.t
= 1/f
Mit Hilfe des Horner-Schemas läßt sich die Gleichung verein2 3 fachen und die Berechnung der Potenzen und in direkter Form umgehen. Es gilt nämlich t
= exp [ d + x(c
+ x(b
+ ax))].
(135)
Je nach der gewählten statistischen Sicherheit sind entsprechende Werte für
die Konstanten a , b , c und d einzusetzen. Mit
H i l f e einer nicht linearen Regressionsrechnung (siehe dazu Abschn. 18.7.2)
sind die Konstanten für verschiedene zweisei-
tige Sicherheiten berechnet worden. Sie sind zusammen mit den maximalen Fehlern, die man bei
Anwendung der Näherungsfunktion
gegenüber den exakten Tabellenwerten für
t m a c h t , in der fol-
genden Tab.58 aufgeführt. Man erkennt daraus, daß mit steigender statistischer Sicherheit der Fehler der Approximation größer w i r d , aber praktisch innerhalb des für die Auswertung von Ergebnissen interessierenden Bereichs bis 9 9 , 9 9 % nicht größer als ca.1% ist. Da mit Sicherheiten unter 50% im allgemeinen nicht g e a r b e i t e t w i r d , wurde hier auf die Berechnung von Schranken für
kleinere
Sicherheiten als 5O% verzichtet. Gegenüber dem angegebenen Algorithmus zur Berechnung der t-Werte haben die von anderen Autoren angegebenen Formeln
ei-
nige Nachteile. Entweder sind sie nur für eine begrenzte Zahl
248
13- Streuungsmaße
von Freiheitsgraden anwendbar, wobei meist für die interessierenden kleinen f-Werte die Fehler am größten sind. Oder aber die entsprechenden Formeln sind zwar für einen größeren Bereich von Freiheitsgraden anwendbar dann aber nur für einige wenige statistische Sicherheiten. Teilweise ist komplizierter
Tab.58
der Rechengang auch
, z.B. bei dem Algorithmus von Dawson ( 1 8 ) .
Konstanten a , b , c und d zur Berechnung der 3 2 t-Werte über die Formel t = exp(ax +bx +c mit
s (%)
= 1/f für
verschiedene
b
a
Sicherheiten
c
50 80
-0,011179
90
-0,056610
95 98
-0,151507
99 99,8
99,9 99,99
-0, 614998 -1,333460 -1,691680 -2,970338
F(%) =
Maximaler relativer Fehler der
-0,019830
-0,376444
0, 040512 0,236570 0,480730 0,822983 1 ,414000 1 ,946116 3,357723 4,011123
6,223448
d
F(°/o)*
0,364396 0,659474
-0,393766
0,00
0, 248065
0,08
0,920875 1,197*23 1,577842 1,875614 2,610177 2,945744 4,149884
0,497789 0,673214
0,06
0,844779 0,946832 1, 128556
0,05 0,08 0,09 0,15
i, 190872
0,32
1,355158
1,20
* berechneten t-Werte ^t„/\
..^^
1 t(berechnet)
- t ( tabelliert ) 1
t( tabelliert)
Programm N r . l 6
Berechnung von t-Werten für vorgegebene statistische Sicherheiten
Das Programm (Compucorp 326) erlaubt die Berechnung von t-Werten bei vorgegebener statistischer Sicherheit.
13. .3
Berechnung der t-Werte
Speicherbelegung:
=
1/f
= a
= b = c = d
Schritt-Nr.
Befehle
Erläuterungen
1
STOP
Eingabe f
2
1/x
1/f
STO 0
x_> STO
3 4
RCL
= 0 ax
1
b + ax
5 6
RCL + 2
7 8
RCL + 3 0
x( c + x(b + a x ) )
9 10
RCL + 4
d + x( c + x ( b + ax) )
11
STOP
Ausgabe t
12
JUMP START
Rücksprung zum Start
RCL RCL e
x(b
0
X
+ ax)
c + x( b + ax)
e x p f d + x( c + x(b
+ ax)))]
Programmablauf: Gemäß Tab.58 w e r d e n zunächst die Konstanten a , b , c , d für diejenige statistische
Sicherheit (= S%) in die Speicher
l bis
4
eingegeben, für welche der t-Wert berechnet werden soll. Als Beispiel seien einige t-Werte für die z w e i s e i t i g e s t a t i s t i s c h e Sicherheit S = 95% zu ermitteln. Dazu sind zunächst die sprechenden Konstanten einzugeben:
-0,151507
STO i
0,822983
STO
2
1,197^23
STO
3
0,67321^
STO 4
ent-
250
13« Streuungsmaße
Durch JUMP START START wird das Programm zum Laufen gebracht. Da der erste Befehl ein STOP ist, Eingabe von f an. Ist
hält das Programm hier zur
der Wert für den Freiheitsgrad f einge-
t i p p t , und drückt man anschließend erneut die START-Taste, dann wird gemäß den Schritten 2 bis
1O der
t-Wert berechnet und bei
dem STOP im Schritt 11 ausgegeben. Für eine weitere Berechnung von t für S% Sicherheit
ist
wieder START zu drücken.
Um die Leistungsfähigkeit des Programms zu zeigen, sind in der folgenden Tabelle einige berechnete t-Werte den entsprechenden Tabellenwerten ( 2 4 ) gegenübergestellt.
Tab.59
Vergleich tabellierter und nach Programm 16 berechneter t-Werte ( z w e i s e i t i g e S i c h e r h e i t )
Sicherheit S ( % ) 90
Freiheitsgrad f
6,314
2,015
2,015 1,812
2
1,812 1,676 1,648 12,706 4,301
5
2,57l
4,303 2,571
10
2,228
2,228
50
2,009
2,009
500
1,965
1,965
1
63,660
63,657
2
9,917
9,925
5 10
50 500
99
tabell.
6,314 2,919
1
2
95
ber .
1
2,920
1,676
1,648 12,706
5
4,034
4,032
10
3,168
50 500
2,678
3,169 2,678 2,586
2,587
13.^.3
Berechnung der t-Werte
Man erkennt, daß für gleiche Freiheitsgrade die
251
t-Werte
mit steigender statistischer Sicherheit immer mehr von den Tabellenwerten abweichen. Für eine bestimmte statistische Sicherheit liegt der größte Fehler etwa bei f = 2. Mit steigenden Freiheitsgraden nähert sich der berechnete Wert immer exakter den Tabellenwerten
an. In allen Fällen r e i c h t aber die Genau-
igkeit der berechneten
t-Werte für die Praxis aus.
Berechnung der t-Werte für beliebige statistische Sicherheiten und Freiheitsgrade Will man bei der E r m i t t l u n g der t - W e r t e die Eingabe der in Tab.58 zusammengestellten Konstanten umgehen und direkt für eine gegebene zweiseitige Sicherheit Freiheitsgrad den entsprechenden dafür
sowie einen gegebenen
t-Wert berechnen,
dann
ist
der folgende vom Autor entwickelte Rechengang anzuwen-
den: Gegeben: Sicherheit S * in
Prozent
Freiheitsgrad f Gesucht:
t-Wert
Die folgenden Schritte sind in der angegebenen Reihenfolge abzuarbeiten.
i.
s = s /loo
2.
q =
3.
7?=\ In —V-
1
Z
S
(136) (137)
(138)
252
13. Streuungsma e
a
4.
z = 77-
+
7? ( a
4- a
7? )
a Q = 2,515517
b t = 1,432788
BJ = 0,802853
b 2 = 0,189269
a 0 = 0,010328 «2
b _ = 0, Ool308 3
5.
d = In z —> STO
6.
t 1= tan
(
(139)
—2-----—--
7Z S 2
(140)
04
)
(141)
2-\r ι , _ S2 t4= 2 M
(143)
- l Γ 2 cos [
In t
arc
- 6 In t ~
cos(l -2S2) ] = J
+
8 In t,
9.
a =
10.
b = 2 In t1 - 4 In t 2 + 2d -
11.
c = l n t
12.
χ = 1/f
13.
t = exp [d + x(c
1
- 3d *
a
- d - a - b
ST
°
01
> STO 02
(145)
) STO 03
(146)
(147) + x(b
Dieser "Universal-Rechengang" Formeln zur Integration
- 1
+ ax))]
ist
unter
(148)
Zuhilfenahme der
der t-Verteilung entwickelt worden.
Eine kurze Herleitung wird im Abschn. 13.4.5 gegeben.
3
Berechnung der t-Werte
253
π V
-μ ON
ι -μ Κ υ -ρ φ
τΗ NO
v
ON ON
fx
ON
ON
CO
NO
in
in 1
ON
O"^
CO
ON
ON TH NO
CO ON LA
-3-
O
CM
TH
TH
CM
LA
TH
CO
α
NO
in
o NO
CM tA 0
fx O
NO
-3CO1
STO 2
t
" ir
STO 3
) STO 3
RCL 2
Prüfung,
ob f = 1
-
Wenn ja
1
Sprung nach LABEL 1.
21
=
Sonst weiter mit
JUMP = 1
S c h r i t t 23.
23
RCL 3 2
25
X
1
-h V
26
1
27
=
28
1/x
29 30
STO 4
-
1 + x2
v —> S T O
4
RCL 2
Berechnung von f/2
:
31 32
2
33
=
-
ist.
( f - 1 = 0 ) , dann
22 24
275
2?6
13. Streuungsma e
Schritt-Nr .
34
Befehle
Erl uterungen
FRACTION
Pr f u n g ,
35
JUMP + 2
36 37 38
1
39 40
ob f gerade oder
ungerade ist. Ist f ungerade ( Fraction=Nachkommateil von f / 2 = 0 . 5 > 0 ) , dann Sprung nach LABEL 2,
sonst Sehr. 36
STO 6
G:= 1
STO 7
R:=
STO 8
K:= 1
BRANCH 3
Sprung zum Unterprogramm:
1
Berechnung von R ' f r gerade Freiheitsgrade "
4l
1
Ί2
RCL - 4
43 44
RCL χ 7
45 46
JUMP 5
·
...
. + χ2 1
Sprung nach LABEL 5
LABEL 1 RCL 3
49
arc tan
50
^^
i.
51
X
52
2
53 54
:
55 56
W V
STO 9
47 48
J "
T! ' Λ η
n
"
. J3 . rj
7Γ = STO 9
57 58
JUMP 5
59 60
RCL 4
2
U =
7Γ
arc tan
χ
f r den Fall f = 1
.
U —> STO 9
LABEL 2 -y—*
TIT
*\ Υ
L·
-|tr
T
,
1+X
6l
STO 5
62
STO 6
G: = w
» STO
6
63
STO 7
R:= w
> STO
7
ν '"'ΤΓί
^
13·4.5
Integration der t-Verteilung
Befehle
Erl uterungen
64
2
K : = 2 —>STO
65 66
STO 8
Schritt-Nr.
BRANCH 3
277
8
Sprung zum Unterprogramm: Berechnung von R f r ungerade Freiheitsgrade
67
1
68
RCL - 4
69 70
V~
7l 72 73 74 75 76 77 78 79 8ο 8l 82 83 84
RCL χ 7 RCL 3 arc tan
•$-»RAD
Λ/1 - v ' R -^/l - v' X
1 arc
tan χ
X
2
:
π =
U= ^. ( R--/l-v' + arc
STO 9
U —>STO 9
JUMP 5
R cksprung nach LABEL 5
LABEL 3
RCL 8 : K
86
RCL + 8
87 88
=
93
1 1 - v V
1 + χ
+
ftr '-'^
89 90 91 92
1
1
RCL χ 4 STO χ 6 RCL 6
K + 1
v-G
— K+l
R: = R + G
STO + 7 2
STO + 8
K: = K + 2
> G
tan x)
2?8
13. Streuungsmaße Schritt-Nr.
Befehle
Erläuterungen
94
RCL 8
95 96
-
Wenn K
(
Fall, wenn K- ( f - 3 )
97 98
RCL 2
dann e r f o l g t Sprung nach
-
LABEL 4.
nach LABEL 3.
101
3 ) =
102
JUMP + 4
Reihenglieder G berechnet
103
JUMP 3
sind.
io4
LABEL 4
105
RETURN
99 100
"Prüfung,
ob K f-3
f-3
ist.
(dies ist
der
0 ist),
Sonst Rücksprung
Die Bedingung K
f-3
ist
dann e r f ü l l t , wenn alle
Rücksprung aus dem Unterprogramm in das Hauptprogramm
106
LABEL 5
107 108
100
RCL
109
STO 0
110
STOP
Ausgabe S* %
JUMP START
Rücksprung zum Programm-
111
S*= 100 · U 9 S
> STO
0
anfang zur erneuten Integration
Das angegebene Programm ist
im mathematischen Sinne keine Nä-
herungslösung, wie etwa die Lösung des Integrals der Normalverteilung durch ein Polynom. Die in T a b . 6 l angegebenen Rechenbeispiele z e i g e n , daß die berechneten
Flächenwerte
um einen
geringen Betrag von den W e r t e n abweichen, die den aus einer Tabelle ( 5 ) entnommenen t-Werten zugrunde liegen. Dies rührt daher, daß diese t-Werte
in der letzten Stelle gerundet sind
und somit auch nur "Näherungen" darstellen. Für die praktische Brauchbarkeit des Integrations-Programme hat dies aber keine Auswirkung.
13-4.5
Integration der t-Verteilung
279
Programmablauf: a) Programm einl sen b ) | JUMP | | START | | START | c)
ΛΖ Eingabe t
2.228139 /
| START ]
Eingabe f
10.000000
| START
95.000001
Ausgabe von S in Prozent
Tab.6l
Rechenbeispiele
7
zum Programm
Integral der t-Verteilung
t
Rechenzeit ( s )
f
S
1
95 ,000000
94,999998
1,5
2,228139
10
95 ,000000
95 ,000001
4,0
1,676551
49
90,000000
90,000002
17,5
2,015048
5
90,000000
89,999995
3,0
1
99 ,900000
99,900000
1,5
4,586894
10
99,900000
99,900000
4,0
3,169273
10
99,000000
99,000001
4,0
1,652508
200
90,000000
89,999998
66,0
12,70620
636,6192
soll
(%)
Cr.
(
°/°>
280
13. Streuungsmaße
Beispiel 17 a)
In einer gegebenen Stahlprobe
ist
der Mangangehalt zu be-
stimmen. Da die Meßwerte erfahrungsgemäß stark streuen, wurden 8 Wiederholungsbestimmungen durchgeführt: x1 = 0,35
%
= 0,29
% Mn
X2 = 0 , 7 4
"
Xg = 0 , 9 4
"
x3 = 0 , 5 3
"
x? = 0 , 5 7
"
= 1,23
"
x
= 0,83
"
x
Frage: Wie groß ist
die statistische Sicherheit d a f ü r ,
"wahre" Gehalt der Probe an Mangan nicht mehr als oben oder unten vom M i t t e l w e r t
daß der
1% rel. nach
der durchgeführten Bestimmun-
gen abweicht ? Mit H i l f e von Programm Nr.15 erhält man für = 0 , 6 8 5 % Mn
und s:
s = 0,314 % Mn
Der wahre Gehalt der Probe liegt im Bereich zwischen -
-
t -s / * VrT
und
-
+
t-s / ' TfrT
,
wobei die statistische Sicherheit durch die Wahl des t-Wertes gegeben ist.
Auf Grund der Fragestellung muß nun gelten:
= 0,01
Daraus folgt dann: r—>
t = 0,01-x S
= 0,01-0,685 — = 0,06l6 0,314
Setzt man t-Wert 0 , 0 6 l 6 und die Zahl der Freiheitsgrade f=n-l =8-1=7 in das Programm N r . l S ein,
dann erhält man S = 4 , 7 4 % .
13. * · 5
Integration der t-Verteilung
28l
Welche Sicherheit kann man grantieren, wenn man annimmt, daß der Gehalt /u der Probe um nicht mehr als unten vom M i t t e l w e r t
abweicht ?
- Vä" t = 0 , 2 - x -!2— = 1,232
Das Programm l i e f e r t
j e t z t mit
20% nach oben oder
In diesem Fall gilt:
.
t = l , 2 3 2 und f= 7
S = 7k, 2%.
Fragt man schließlich nach der Sicherheit für eine Abweichung des Mangangehalts von l mit
t= 3,O8 unf f= 7
50% vom M i t t e l w e r t x, dann erhält man
S*= 9 8 , 2 % .
Ergebnis: Um so größer man den Vertrauensbereich w ä h l t , umso unschärfer her ist
d.h.
die Angabe des M i t t e l w e r t e s M w i r d , desto hö-
die S i c h e r h e i t , mit der man diese Angabe garantieren
kann. Entsprechend hat ein enger Vertrauensbereich eine geringere Sicherheit zur Folge. Welche Sicherheit kann man nun g a r a n t i e r e n , wenn die daten
= 0,685% und s = 0 , 3
%
Kenn-
n i c h t aus 8 sondern aus
80 Wiederholungsmessungen erhalten worden wären ? Für eine maximal 1% ige Mittelwert
Abweichung des
"wahren" Gehalts /u vom
nach oben oder unten würde dann gelten _
t = 0,01-x -
- = 0,1951
.
s
Das Programm würde dann mit
t=0,1951 und f = 8 0 - l = 7 9
liefern
S = 15,4% . Dieser Wert ist
zwar b e r e i t s erheblich höher als die Sicher-
heit bei 8 Einzelwerten.
Um allerdings eine für s t a t i s t i s c h e
Probleme übliche Sicherheit von 95% oder gar 99% f ü r eine maximale Abweichung des Gehalts /u vom M i t t e l w e r t von 1% garantieren zu können, m ü ß t e n ca.
8000 b z w . mehr als
12000 W i e -
derholungsmessungen d u r c h g e f ü h r t w e r d e n . Die Einengung des V e r t r a u e n s b e r e i c h s b z w . die Erhöhung der s t a t i s t i s c h e n Sicherheit d u r c h eine H e r a u f s e t z u n g der Zahl der
282
l 3. Streuungsmaße
Meßwerte erweist sich zwar als prinzipiell möglich, für die Praxis allerdings ist ist
dieses Verfahren sehr u n e f f e k t i v .
Besser
hier, die Streuung zu senken, d . h . die Standardabweichung
kleiner zu machen. Beispiel 18 b) Es sei angenommen, daß der untersuchte Stahl einen Mindestgehalt an Mangan von 0 , 6 % aufweisen muß. Mit welcher statistischen Sicherheit kann man dies garantieren, wenn die
in a)
angegebenen 8 Meßwerte vorliegen ? Da der arithmetische M i t t e l w e r t 0,685% b e t r ä g t , läuft die Lösung des Problems auf die Ermittlung der Sicherheit dafür hinaus, daß der tatsächliche Mangangehalt der Probe um nicht mehr als
0,085% vom M i t t e l w e r t
nach unten hin abweicht. Es
handelt sich hier also um ein Problem mit einseitiger Fragestellung. Zu berechnen ist
daher die Fläche unter der t-Ver-
teilung zwischen -t und + 0 0 . Der t-Wert f o l g t aus - i-l-S. = 0,600 •/n"
zu t = ( x - 0 , 6 0 0 ) —- = 0,766 0,31^
Da die t-Verteilung - genau wie die Normalverteilung - symmetrisch ist,
ergibt sich die gesuchte Fläche aus der über das
Programm N r . l 8 ermittelte Integral zwischen -t und +t : S*(-t bis
+ 00)
Das Programm l i e f e r t S*(-t bis
= 50 +
S ( - t bis
S ( - t bis
+t)
+ t,
= 53,1%. Daraus folgt:
f=7)
(o/o)
+ oo ) = 50 + ^g'1 = 7 6 , 6 % .
Die W a h r s c h e i n l i c h k e i t , daß der vorgeschriebene Mindestgehalt von 0 , 6 % Mn nicht u n t e r s c h r i t t e n w i r d , beträgt somit 76,6%.
13. k. 5
Integration der t-Verteilung
283
Herleitung der Gleichungs Systeme zur Berechnung der t-Wert für beliebige statistische Sicherheiten Nach Noack und Reichmuth ( 2 3 ) lassen sich t - W e r t e aus der Beziehung t = eax
+
*
+ ex +
=1/f
mit
berechnen. Weiterhin lassen sich die entsprechenden Formeln zur Integration der t-Verteilung für die Fälle f = l , f=2 und f=k nach t
auflösen: f = l
Aus G1.163 folgt mit x= -
yr
t(f=l)
= t
= tan
(
f = 2 Der nach G1.16? zu berechnende W e r t für R '
ist
für den
Fall f =2 gleich 1. Daraus ergibt sich
S
= 100 · l T/l - v = 100 l + (
Löst man diese Beziehung nach t a u f , ergibt
t(f=2)
= t2 = 1 2 [
f =k
y
i
(
-s>
~ 100
}
2
-
sich
l]
In diesem Fall ergibt sich für R ' nach G1.16? R»
= l + i v
28
13.Streuungsmaße Die Beziehung für das Integral lautet dann
(170) Durch Umformen ergibt sich daraus eine kubische Gleichung für v: V3 +
3v 2
.
4
+ 4(
Man kann zeigen, daß zur Lösung dieser Gleichung der sog. Casus irreducibilis ( 2 7 ) angewandt werden muß. Die Lösung lautet: arc cos
l
v = 2 cos
Schritt 26
334
15. Zufallsauswahl von Stichproben
Fortsetzung von Programm Nr.23
Randomisierung
Befehle
Erläuterungen
26
1
Zählung der
27
STO +
Schritt-Nr.
1
"gezogenen" Zu-
fallszahlen durch Addition einer 1 im Speicher 4l
28
1
Speichern einer 1 in dem
29
STO IND 00
Konstantenspeicher, dessen Adresse gleich der gezogenen J
Zufallszahl z. .
1+ 1
ist.
Ausdrucken der
30 3l
RCL 43
32
RCL 4l
33 34
RCL - 40
len ausgedruckt worden ?
JUMP = 2
Wenn ja
PRINT
J
Zufallszahl z.
„
1+ 1
Sind schon k = n Zufallszah( ( k - n ) = 0 ),
dann
Sprung nach LABEL 2, sonst Rücksprung nach LABEL 1 LABEL 2
35 36
EXP 99
Programmende durch Anzeige
37
STOP
von 10
Das Programm beruht auf den Gleichungen 211 und 212 mit p = l und q = n. Die entsprechenden z u
= INTEGER
i+l
Formeln lauten dann:
( n - u i + 1 -t- l )
= FRACTION ( 9 9 7 u . ) i
(213) (211)
Beispiel 25 Das Programm N r . 2 3 soll auf die in dem Beispiel von S.321 erwähnte Verteilung der 4 Maissorten auf 16 Teilfelder des Versuchsfeldes angewandt werden.
15.2.6
Randomisierung
335
Programmablauf: a) Löschen aller Konstantenspeicher
=
Mit Inhalt Null belegen
c)
7 16.0000 /
Eingabe U Q , z.B. 0 , 5 2 8 4 l 6 3
d) Ausdruck der
randomisierten
Zahlen von l bis 16:
L 14.0000 9.000O 5.00OO l.0000
4.0000 13.0000 16.0000 11.0000 12.0000 8.0000 2.0000 15.0000 7.0000 6.0000
3.0000 10.0000
7 0.5284163 /
336
15· Zufallsauswahl von Stichproben
Danach sind die 4 verschiedenen Maissorten auf folgenden Teilf e l d e r n anzubauen: Teilfelder
Maissorte a
1 4
b
-
9
- 13
-
5
- 16
-
1
- 11
1 2 - 8 - 2 - 1 5
c
7
d
15.2.7
4
Normalverteilte
-
6
-
3
-
1
0
Zufallszahlen
Für die nach den bisher genannten Verfahren erzeugten Zufallszahlen war c h a r a k t e r i s t i s c h , daß jede "mögliche" Zahl die gleiche Chance h a t t e , ausgewählt zu werden. Die in dem Bereich von p bis
q
möglichen Zufallszahlen gehorchen daher einer sog
R e c h t e c k v e r t e i l u n g , wie die folgende Abbildung zeigt:
Häufigkeit
Abb.28
Rechteckverteilung von Zufallszahlen
Für viele Probleme aus dem Bereich der S t a t i s t i k erscheint es n ü t z l i c h , wenn man künstlich
Meßwerte simulieren kann,
die
einer Normalverteilung mit den P a r a m e t e r n / u und (7 genügen.
15.2.7
Mit dem folgenden Algorithmus ist zu "berechnen",
337
Normalverteilte Zufallszahlen es m ö g l i c h ,
Stichprobenwerte
die einer N o r m a l v e r t e i l u n g mit dem M i t t e l w e r t
/u und der Streuung
U entstammen. Dabei sind - wie noch gezeigt
wird - die aus den Stichprobenwerten
e r m i t t e l t e n Kenndaten
und s um so bessere Schätzwerte für fi und O , je mehr Z u f a l l s zahlen erzeugt werden. Charakterisitisch für die so gewonnenen Zufallszahlen daß die Chance für größer ist, W e i t von
ist,
das A u f t r e t e n einer b e s t i m m t e n Zahl um so
desto näher sie bei dem vorgegebenen Wert /u liegt. e n t f e r n t liegende W e r t e t r e t e n also weniger h ä u f i g
a u f , so wie es für eine Normalverteilung typisch
ist.
Die folgenden Formeln sind in der angegebenen R e i h e n f o l g e abzuarbeiten. Dabei werden paarweise z.
die Zufallszahlen z . und
. erzeugt. Sie entstammen einer Normalverteilung mit den
Parametern /u und CT. Diese Kenndaten sind zu Beginn vorzugeben.
Rekursionsformeln zur Erzeugung n o r m a l v e r t e i l t e r Zufallszahlen mit
den Parametern AI und U
(211)
u
= FRACTION ( 9 9 7 - u ± )
N.
= ( - 2 - l n u±)1/2 cos (2
N ± + 1 = ( - 2 - l n u ± ) 1 / 2 sin
N± +
N
^1
(2 7
±+1)
(215)
(216)
/u
+
(217)
/"
u.
l
Der Algorithmus muß mit einer 7-stelligen ( N a c h k o m m a s t e l l e n ! ) Dezimalzahl beginnen.
Dieses u
muß als
letzte Ziffer
eine
l,
338
15· Zufallsauswahl von Stichproben
3,7 oder 9 haben. Nachdem aus u N . , N. j für u.
und daraus z. und z.
. e r m i t t e l t e Wert als
bzw. u.
und u.
1
die Größen
berechnet wurden, wird der
neues u. wieder in G1.211 einge-
setzt und man berechnet das nächste Paar Zufallszahlen usw. Durch entsprechende Wahl von /u und U te
als
kann man sowohl brei-
auch schmale Verteilungen erzeugen. Da durch ja und U
die Normalverteilung vollständig charakterisiert ist,
besteht
somit die Möglichkeit, mit dem angegebenen Algorithmus im Prinzip
jede Normalverteilung "nachzumachen". Das im folgenden beschriebene und erklärte Programm ermög-
licht es,
für
vorgegebene Parameter yu und U
, eine ebenfalls
vorgegebene Anzahl n von Meßwerten zu simulieren, die der
ent-
sprechenden Normalverteilung genügen. Gleichzeitig wird aus den Stichprobenwerten der arithmetische M i t t e l w e r t net sowie die Streuung s e r m i t t e l t . Damit ist m ö g l i c h , wie gut die
berech-
eine Kontrolle
"berechneten" Meßwerte der angenommenen
Verteilung gehorchen.
Programm N r . 2 4
Simulation von normalverteilten Meßwerten für
gegebenes yu und O
(Compucorp 32?)
Speicherbelegung:
15.2.7
Normalverteilte
Zufallszahlen
339
= k = Z hler f r
Speicherbelegung:
die
erzeugten Me w e r t e = n = Anzahl der
zu
erzeugenden Me werte
Schritt-Nr.
Erl u t e r u n g e n
Befehle -
1
RCL 01
2
X
3
k
997 =
5
FRACTION
FRACTION ( 9 9 7 - u . ) = u i + 1
6
STO 02
u. . x+1
7 8
RCL 01
9 10 11
1
_
> STO 02
J l n u.
In X
"
2 _
-
12
CHS
13
ΛΓ STO 03
14
997-u.
2 In u.
1
- 2 In u.
1
T/- 2 -In u^ -»STO
15 16
RCL 02
17 18
χ 7Γ
19
RAD —> ·£
20
STO Ok
21
cos
cos (27Tu.
22
RCL χ 03
N.
23
STO 05
N . —> STO 05
03
"~
χ 2
2 TTu.
i"1 Bogenma
2 7Γ u .
im Winkelma
_ =
]
\
'"'TO 1
)
= ( -2 In u . )
O ^1
= a - a
RCL Ok 25
sin
26
RCL χ O3
l sin
(2 TTu
)
= b 1/9
N ± + 1 = (-2 In u..)^
- b
340
15« Zufallsauswahl von Stichproben Fortsetzung von Programm N r . 2 4 Simulation von normalverteilten Me werten Schritt-Nr.
Befehle
Erl uterungen
27
STO 06
N ± + 1 —» STO 06
28
RCL 05
29
RCL χ 08
30
RCL + 07
31
PRINT
Ausdruck von z .
32
STO + 09 2
Σ* 2
33
X
34
STO + 10
35 36
RCL 06
37 38
RCL + 07
39 40
STO + 09 2
X
4l
STO + 10
42
2 STO + 1 1 RCL O2 STO 01 RCL 11
43 44
RCL χ 08
±
J Ο
Ν . + AI 1
= Z . 1
z
Zz 2 ICTNi+1 J (T N
+ /u = z i+1 i+l Ausdruck von z .
PRINT
z
2
Z*2 k:
= k + 2 Wenn k=n Me werte erzeugt
45 46
RCL - 12
wurden,
JUMP = 1
Sprung nach LABEL 1 , sonst
47 48
JUMP START
R cksprung zum Start
49
PRINT DOT
50 5l 52
d.h. k-n = 0, dann
LABEL 1
1
LINE
J
RCL 09 RCL : 12
1 J
x - n- Z z
PRINT
Ausdruck von χ
53 54
RCL 10
Z*2
55 56
RCL 09 2
-
X
15.2.7
34l
Normalverteilte Zufallszahlen
Fortsetzung von Programm N r . 2 4
Simulation von
normalverteilten Meßwerten
Schritt-Nr.
Befehle RCL
57 58
: 12
=
Erläuterungen n
2
2.
1 n
2 £·
: (
59 60 6l 62
RCL 12
n - 1
1
63 64
) =
65 66
iT PRINT
67
STOP
s Ausdruck von s Ende des Programms
Zu Beginn des Programms sind die Werte für
U Q , /u und (J
in
die
Speicher 01, 07 und 08 einzugeben.
Beispiel 26 Liegt eine größere Zahl von W e r t e n vor, die einer Normalverteilung genügen, dann kann man überschlagsmäßig die Standardabweichung der Grundgesamtheit aus der Spannweite berechnen. Es gilt dann ( 2k ) :
= R/6
(218)
Um dies zu zeigen sei w e r t / u = 10,00 und der dieser Verteilung
eine N o r m a l v e r t e i l u n g mit dem M i t t e l Standardabweichung (J = 1,00 gegeben. Aus
soll eine Stichprobe von n = 20 Einzelwerten
ermittelt werden. Daraus ist
die Spannweite zu berechnen und
342
15. Zufallsauswahl von Stichproben
die G 1 . 2 1 8 nachzuprüfen.
Programmablauf: a)
0 STO 09
b)
u
= 0.5284163
STO
01
/u
= 10.0000
STO
0?
O
= 1.0000
STO
08
c)
,
STO 10
Nach JUMP START,
,
STO 11 , n
START werden folgende 20 Einzel-
werte und Kenndaten ausgedruckt:
10.550 9.013 9.431
9.783 9.845 11.069 11.557 10.413 10.835 12.382 10.000
8.195 10.375 9.34l 10.581
x
i
X
2
X
3
X
4
X X
STO 12
5 6
X
7 8
X X
9
x
io
X.. ..
11
X
12
X
13 i4
X X
15 l6
9.829 9.871 9.723 9.380
X
X
19
9.379
X
20
10.078
X
0.938
s
X
17 i8
X
15.2.7
343
Normalverteilte Zufallszahlen
Wie man erkennt, geben die Kenndaten gut die P a r a m e t e r / j = 10,0000 und £ 7 =
,
und s schon recht wieder. Aus dem
kleinsten Wert der Reihe x , 2 = 8,195 und dem größten "Meßwert" x? = 11,557 resultiert R = 11,557 - 8,195 = 3,362 und nach G1.218 (7»R/6 = 3,362/6 = 0,560. Die Abweichung von dem vorgegebenen Wert CT = 1,0000 ist
also noch r e l a t i v groß. Werden
dagegen 100 Wert simuliert , dann erhält man bereits mit einer Spannweite von R = 12,382 - 8,195 = 4,187 einen Näherungswert für
die Streuung der Grundgesamtheit von
4,187/6 = 0,6978.
Werden schließlich vom Programm n =1000 W e r t e erzeugt, so gibt sich bei
er-
einer Spannweite von R = 6 , 0 3 2 eine nach G1.218
berechnete Standardabweichung der Verteilung von 1,005. Dieser W e r t bestätigt bereits sehr gut die Richtigkeit der näherungsweisen Berechnung der Streuung G1.218. Der bei
aus der Spannweite nach der
n = 2000 erhaltene Wert von R/6 = 1,152 b e s t ä -
tigt diese Aussage. Die Ergebnisse sind übereinstimmend mit dem Verhalten von realen Meßwerten. Auch hier würde mit steigender Zahl von Einzelwerten die Richtigkeit der G1.218 immer besser bestätigt werden. Auch die Übereinstimmung der aus den erzeugten Einzelwerten berechneten Kenndaten
und s mit den vorgegebenen Pa-
rametern yu und O wird mit steigender Zahl von "Meßwerten" immer besser, wie auch aus der folgenden Tab.68 hervorgeht: Tab.68
Vergleich der Parameter /u und U mit den aus den simulierten Einzelwerten ermittelten Kenndaten und s
n
X
s
4
9,695
0,652
10
10,488
1 ,022
50
10,000
100 500
10,065
0,857 0,873
1000
10,000
0,965 0,996
5000 30000
9,999
1 ,014
10,001
1 ,008
9,997
16. Die Poissonverteilung
Die bisherigen Problemstellungen gingen von einem Datenmaterial aus, das aus Meßwerten kontinuierlicher
Größen be-
stand. Innerhalb gegebener theoretischer oder
experimenteller
Grenzen konnten dabei die Meßwerte im Prinzip
jeden - also
auch einen gebrochenen - Zahlenwert annehmen. Beispiele:
L = 2,013 cm ;
c = 1,045 Mol/l
; I = 3 , 6 ^ 7 A/h
Es gibt nun aber eine Reihe von Fällen, bei denen das Ergebnis der Messung durch Abzählen diskreter Größen erhalten wird, wie z.B. Zählrate eines radioaktiven Präparats Anzahl der e m i t t i e r t e n Elektronen einer beheizten Kathode Anzahl der Druckfehler auf einer Buchseite Anzahl der Blutkörperchen auf den Feldern einer Zählkammer
etc. Die angegebenen Beispiele haben zwei gemeinsame Eigenschaften: Erstens ist
die Anzahl der entsprechenden "Objekte" ( Z ä h l i m -
pulse, Elektronen, Druckfehler, Blutkörperchen) das Ergebnis einer sehr großen Zahl von überhaupt möglichen Ereignissen. Zweitens ist
die Wahrscheinlichkeit
Ereignisses sehr klein.
für das Eintreten eines
16.
Poisson-Verteilung
Unter diesen Voraussetzungen hat die Poisson-Verteilung Gültigkeit. Ist
A. die m i t t l e r e Anzahl der "Ereignisse"
in einer Stich-
probe ( d . h . also die im a r i t h m e t i s c h e n M i t t e l gefundene Zahl von Ereignissen bei einer großen Zahl verschiedener Stichproben) , und ist
P ( x ) die Wahrscheinlichkeit d a f ü r ,
liebig gezogene Stichprobe gerade exakt
daß eine be-
Ereignisse
aufweist,
dann gilt: , x
P(x)
_^
= 100 —-—-
Man erkennt, daß durch die Größe A. die vollständig c h a r a k t e r i s i e r t ist. vollständigen größen^
und
(219)
(%)
Poissonverteilung
Im Gegensatz dazu sind zur
Beschreibung der Normalverteilung die 2 KennU
nötig.
Beispiel 2? Ein Phosphor-32-Präparat mit einer Aktivität
von l Nano-Curie
zeigt im D u r c h s c h n i t t (= a r i t h m e t i s c h e s M i t t e l aus mehreren Einzelmessungen) .eine Anzahl von 12 Meßimpulsen pro M i n u t e . Die Anzahl der zerfallenden P-32-Atome b e t r ä g t ca. 2200/min. Die geringe Zählrate sei hier durch A b s o r p t i o n s e f f e k t e
bedingt.
Wenn man b e r ü c k s i c h t i g t , daß l Nano-Curie P-32 einer Menge von etwa 3,5-10"
g Phosphor-32 und damit ca.
phoratomen e n t s p r i c h t , wird die Gültigkeit
70 Millionen Phosder Poisson-Vertei-
lung deutlich: Die Zahl der " t a t s ä c h l i c h e n " Ereignisse ( Z a h l der Meßimpulse b z w . Zahl der zerfallenden A t o m e ) ist im V e r g l e i c h zu der Anzahl der
gering
"möglichen" Ereignisse ( A n z a h l
der vorhandenen P h o s p h o r - 3 2 - A t o m e ) . Die W a h r s c h e i n l i c h k e i t , daß ein Meßimpuls r e g i s t r i e r t w i r d , b e t r ä g t dementsprechend nur 12/7-10 7 « # 1 , 7 - 1 0
%, bezogen auf ein b e s t i m m t e s P-32-Atom.
Damit sind die o.g. Bedingungen für die G ü l t i g k e i t der Poisson-
346
l6.
Verteilung
Poisson-Verteilung erfüllt.
Mit der Formel 219 kann man nun die Wahrscheinlichkeit
für
das A u f t r e t e n einer beliebigen Zahl von Meßimpulsen berechnen. Wie groß ist
z.B. die Wahrscheinlichkeit d a f ü r ,
daß nur 8 Im-
pulse anstatt der im M i t t e l angenommenen 12 Impulse r e g i s t r i e r t werden ? Antwort: Nach G1.219 gilt: O
P(8)
IQ
12
= 100
e
= 6,55%
8! Einen Überblick über die
zu dem gegebenen A. gehörige gesamte
Verteilung erhält m a n , wenn auch für bzw. kleiner als werden. Für
Impulsraten,
die
größer
A. sind, die Wahrscheinlichkeiten berechnet
A- = 12 wäre etwa der
Bereich von
= O bis
= 20
sinnvoll. Hierzu kann man sich durch folgende Rekursionsformel die Berechnung vereinfachen:
P(x+l) =
^
1
P(x)
(220)
Zunächst ermittelt man die Wahrscheinlichkeit für dafür,
daß gar keine
12° p,
P ( 0 ) = 100
~12
k = 6,14-10"^ %
Über die G1.220 ergibt sich dann:
* 2 — p ( o ) = 3,69-10" 3 %
p(i) =
P(3) =
3
^21
• *
P(12)=
P ( 2 )= · ·
,0
12
= 0,
Impulse gemessen werden. Man erhält:
.
4,42-10~2% · ·
P(ll)=
11,4%
also
16. Poisson-Verteilung Für x-Werte (Impulsraten) kleiner als
34?
12 nimmt die Wahrschein-
lichkeit wieder ab. Für eine Impulsrate von 20 erhält m a n :
P ( 2 0 ) = 0 , 9 7 °/o. Würde man die Wahrscheinlichkeiten gegen die x-Werte 0 , 1 , 2 usw. graphisch a u f t r a g e n , dann ergäbe sich ziemlich genau eine zu dem Mittelwert A = 12 glockenförmige Verteilung. Charakteristisch für die Poisson-Verteilung ist, im Gegensatz zur Normalverteilung schief
ist.
daß sie
Mit größer wer-
dendem A. nähert sich jedoch die Poisson-Verteilung immer mehr einer Gauß-Verteilung an. Im folgenden Diagramm sind für
verschiedene Werte von A die
entsprechenden Verteilungen dargestellt. Man erkennt, daß sich mit steigendem A die
schiefe Form immer besser
einer symme-
trischen Verteilung annähert.
0.1 --
0 1 2 3 I. 5 6 7 8 9 10 11 12 13 U 15 16 17 18 19
*
Abb.29 Poissonverteilungen für verschiedene A-Werte
348
16. Poisson-Verteilung Da die Poisson-Verteilung durch den M i t t e l w e r t
ständig charakterisiert ist,
A
voll-
muß die Standardabweichung eine
Funktion von A. sein. Die Theorie liefert in der Tat eine
der-
artige Beziehung: (221) Für große
A -Werte nähert sich die Poisson-Verteilung
der Normalverteilung
an. Dies bedeutet - da dann die Verteilung
auch symmetrisch wird - eine M ö g l i c h k e i t ,
den prozentualen An-
teil der Grundgesamtheit für b e s t i m m t e Streubereiche angeben zu können, wenn bei einer Meßreihe die Ergebnisse in ganzzahliger ( d i s k r e t e r ) Form anfallen und die sonstigen Bedingungen für die Gültigkeit der Poisson-Verteilung e r f ü l l t
sind. Ana-
log zur Gauß-Verteilung liegen dann 68,27 %
aller "möglichen" Meßwerte im Bereich
± l r(99)
'
x. ist
gilt:
nachweisbar.
s t a t i s t i s c h gesichert oder
s i g n i f i k a n t ein Ausreißer.
>
r(99i9)
:
x. ist s t a t i s t i s c h stark gesichert oder hochsignifikant ein Ausreißer
Liegt r
A
zwischen
r ( 9 5 ) und r ( 9 9 ) 5 dann kann
A.
nur wahr-
scheinlich als Ausreißer angesehen w e r d e n . Ist
als Ausreißer n a c h g e w i e s e n , dann wird dieser W e r t
aus dem Datenvorrat e n t f e r n t . Aus den n-1 R e s t d a t e n b e r e c h n e t man erneut
und s und bildet aus einem eventuell vorhandenen
weiteren ausreißerverdächtigen W e r t erneut die Prüf große r . Ist
auch dieser W e r t ein Ausreißer, dann muß auch er aus dem
vorhandenen Datenvorrat eliminiert werden. Man v e r f ä h r t nach diesem Schema solange, bis reißern
das Datenmaterial f r e i von Aus-
ist.
Die r-Werte können entweder einer Tabelle entnommen werden, und zwar in Abhängigkeit von der Zahl der F r e i h e i t s g r a d e und der statistischen Sicherheit ( 9 5 , 99 oder 9 9 , 9 % ) . Man kann aber auch - analog zu der Berechnung der t - W e r t e
- die Schran-
ken über die Beziehung
r
= e
3 2 ( ax + bx + c x + d )
, mit x=l/f
/on-·, (22 f )
und f=n-2
ermitteln. Diese Approximationsf ormel l i e f e r t r-Werte , deren Abweichung von tabellierten W e r t e n kleiner als 0 , 5 %
ist.
376
17· Statistische Testverfahren
Der zur Berechnung der t-Werte analoge Algorithmus kann hier angewandt werden, da der Zusammenhang zwischen den r-Werten und der Zahl der Freiheitsgrade ähnlich wie bei der t-Verteilung geartet ist,
wie aus der folgenden Abbildung hervorgeht.
3291
10
Abb.32
15
20
25
30
Integralgrenzen der r-Verteilung in Abhängigkeit von der Zahl f der Freiheitsgrade für statistische
verschiedene
Sicherheiten
Die Konstanten a , b , c und d zur Berechnung von r als Funktion des Freiheitsgrades f sind in Tab.70 zusammengestellt. Aus der Abb.32 geht hervor, daß für
eine gegebene Zahl von
Freiheitsgraden der r-Wert umso größer ist, tistische Sicherheit S% ist. die W a h r s c h e i n l i c h k e i t , daß werdendem r
je höher die
sta-
Das bedeutet a n d e r e r s e i t s , daß ein Ausreißer ist,
a n s t e i g t . Hieraus f o l g t w e i t e r h i n ,
mit größer daß für eine
gegebene Menge von n E i n z e l d a t e n (Wiederholungsmessungen)
17-2.3
Tab.70
r - W e r t e als Funktion des Freiheitsgrades f
r
b
a
S %
c
0,673215307
0,213300208 -0,966460915
0,947180450
-2,079990987
1,193343228
0,301780539 -o, 40810324l
99
0,152611296
1 ,90012534l
-0,666830426
dann am größten ist,
schen Mittelwert
d
-0,223957163
95
99,9
377
Ausreißertest nach Nalimov
wenn
möglichst w e i t vom a r i t h m e t i -
e n t f e r n t ist.
Dies ist
für den größten b z w .
den kleinsten W e r t der Meßreihe der Fall. Aus diesem Grund erscheint es sinnvoll, die Daten - ebenso wie beim Test nach Graf und Henning - zunächst einmal der Größe nach zu ordnen. Somit ergibt sich zusammengefaßt folgender Ablauf des Nalimov-Tests: 1.
Sortieren der n Einzelwerte (Programm Nr.10)
2.
Berechnung von
3.
Berechnung der Prüfgröße r sowie mit
4.
aus x, s und n
x. = A max.
Ermittlung der Schranken r ( 9 5 ) , r ( 9 9 ) und r ( 9 9 , 9 ) über G1.227
5.
und s aus allen D a t e n
(f = n - 2)
Entscheidung, ob x A . = x max» ein Ausreißer
ist
( K r i t e r i e n S.375)
6.
Ist
x =x ein A u s r e i ß e r , dann Eliminierung A max. von x aus dem D a t e n v o r r a t , max. Berechnung von x und s aus den R e s t d a t e n . E r m i t t l u n g der Prüfgröße r
mit dem größten W e r t
der R e s t d a t e n .
7.
War x
kein A u s r e i ß e r , dann Berechnung von r max. A mit dem kleinsten W e r t x . War *m±n ein A u s r e i ß e r , muß er aus dem Datensatz e n t f e r n t w e r d e n .
378
l?- Statistische Testverfahren Anschließend wieder Berechnung von Restdaten und Ermittlung von r
und s aus den
mit dem größten
bzw, kleinsten Wert der restlichen Einzelwerte. 8.
Man v e r f ä h r t so w e i t e r , bis das Datenmaterial ausreißerfrei
9.
ist.
Berechnung der Kenndaten
und s aus den ausreißer-
freien Werten.
Beispiel 31 Wir wollen vom Beispiel 30 auf S.370 ausgehen. Das Sortieren der 15 Einzelwerte
0,531 0,532 0,532
sec.
0,535 0,535
M
l i e f e r t folgende Reihenfolge:
0,535 0,536
II II
II
Die Berechnung von
x = 0,5389
sec. II
0,539 0,539 0,5^0
se II
II
0,537 0,538
II II
0,5^1
II
0,539
II
0,575
M
=
X
A
und s aus allen Daten l i e f e r t :
sec.
s = 0,010^
Aus diesen Kenndaten sowie n = 15 und
sec. = 0,575 (größter Wert)
berechnet man die Prüf große r : =
10,575 - 0 ;;538 9 I , 0,0104 V 15-1
=
3,593
Mit den in Tab.70 angegebenen Konstanten a , b , c und d b e r e c h n e t 3 2 man nun über die Beziehung r = e x p ( a x +bx + c x + d ) die Schranken der r-Verteilung für f
= n-2
= 15-2 = 13.
9 5 , 9 9 und 9 9 , 9 % . Dabei gilt
= 1/f und
17-2.3 r(95)
= 1,923
r(99)
= 2,397
Ausreißertest nach Nalimov
379
r ( 9 9 , 9 ) = 2,841 Da r
= 3,593 größer als
r ( 9 9 , 9 ) = 2 , 8 4 l ist,
kann man den
W e r t 0,575 in der Meßreihe s t a t i s t i s c h stark gesichert b z w . hochsignifikant als Ausreißer betrachten. Eliminiert man diesen Wert und berechnet aus den Restdaten erneut
und s,
erhält
man: (ohne 0 , 5 7 5 ) = 0,5363 s (ohne 0 , 5 7 5 ) = 0,0031 Für r
sec. "
ergibt sich j e t z t mit n = l 4 und dem größten Wert 0 , 5 4 l
A ~
lo, 54i - 0,5363! ··\ ~ V 14-1 0,0031
Entsprechend ergeben sich für die Schranken mit f = l 4 - 2 = 1 2 die Werte :
r(95)
= 1,919
r(99)
= 2,383
r(99,9)
= 2,809
Damit ist
r.
kleiner als r ( 9 5 ) , woraus f o l g t , daß
nicht als Ausreißer nachweisbar
= 0,54l
ist.
Führt man schließlich den Test noch mit dem kleinsten W e r t der Reihe O,531 durch, ergibt sich für r : r
_ |0,531 - 0,5363l A ~ 0,0031
Da auch hier r
kleiner als r ( 9 5 ) ist,
kann auch der W e r t 0,531
nicht als Ausreißer nachgewiesen werden. Damit ist
der einzige Ausreißer der Wert 0,575 s e c . , und die
ausreißerfreien Kenndaten lauten:
= 0,5363
und s = 0,OO31.
380
17. Statistische Testverfahren
Das Ergebnis des Nalimov-Tests ist
somit das gleiche wie bei
dem Test nach Graf und Henning. Dies liegt aber hier daran, daß der Wert 0,575 außerordentlich weit von dem arithmetischen M i t t e l der Restdaten entfernt liegt ( nämlich um mehr als Normalerweise urteilt der Nalimov-Test s c h ä r f e r , d.h.
12s).
ein Wert
der mit dem Test nach Graf und Henning noch nicht als Ausreißer identifiziert wird, kann mit dem Test nach Nalimov eventuell als Ausreißer nachgewiesen werden. Ob übrigens ein Meßwert als
Ausreißer erkannt wird, hängt
weitgehend von der Gesamtzahl der Werte ab. Je größer die Zahl der Meßwerte ist,
umso eher ist
die Erkennung eines Ausreißers
möglich.
Beispiel 32 Bei einer 4-fachen Bestimmung der Oberflächenspannung von Wasser erhält man die folgenden Meßwerte: = 72,68 x 2 = 71,^9
dyn/cm "
= 72,32 x^ = 7 2 , 7 6
dyn/cm "
Auf den ersten Blick scheint der Wert x„ ein Ausreißer zu sein. Die Berechnung von Mittelwert und Streuung ergibt: = 72,313 Daraus folgt für
"A Für die
s = 0,58l die Prüfgroße r
mit
= 7 1 , 4 9 und n = k :
171.49 - 72,313 0758l
r-Wert erhält man mit f = 4-2 = 2 :
r ( 9 5 ) = 1 , 6 4 4 ; r ( 9 9 ) = 1,710 ; r ( 9 9 , 9 ) = 1,725
17.2.3 Damit kann der W e r t
A u s r e i ß e r t e s t nach Nalimov
= 7 1 , 4 9 dyn/cm nicht als
nachgewiesen werden, denn r
ist
38l
Ausreißer
kleiner als r ( 9 5 ) · Die vor-
liegenden Daten müssen somit als
"homogen" b e t r a c h t e t w e r d e n ,
obwohl x„ auf den ersten Blick ein Ausreißer zu sein scheint. Die Aussage "nicht als Ausreißer nachweisbar" besagt n u r , daß aus den gegebenen Daten der entsprechende W e r t nicht Ausreißer
statistisch erfaßbar
ist.
als
Eine Aussage darüber, ob
der untersuchte Meßwert tatsächlich ein Ausreißer ist
oder
n i c h t , kann aus dem Testergebnis nicht gemacht werden. Eine schärfere Entscheidung kann man nur t r e f f e n ,
wenn
mehr Meßwerte vorliegen. Zwei w e i t e r e Bestimmungen liefern
die
Werte = 7 2 , 6 7 dyn/cm
und
x.. = 7 2 , 6 9 dyn/cm.
Die daraus berechneten Kenndaten lauten: = 72,435
s = 0,488
Die entsprechende Prüfgroße für
dyn/cm
= 7 1 , 4 9 dyn/cm
hat
dann
den W e r t
r
171,49 - 72,435l *\/
6
A ~
Mit f=n-2=4 erhält man w e i t e r h i n für die Schranken der r - V e r teilung
r(95) Da r
= 1,816
größer als
;
r ( 9 9 ) = 2,057
r ( 9 9 ) ist,
aus dem Datenvorrat
i
r ( 9 9 , 9 ) = 2,185
muß der W e r t
= 7 1 , 4 9 dyn/cm
entfernt w e r d e n , da er s t a t i s t i s c h gesi-
chert b z w . signifikant als Ausreißer nachgewiesen wurde. Aus den ausreißerfreien Meßwerten erhält man nun die Kenndaten = 7 2 , 6 2 4 dyn/cm
s = 0,174
dyn/cm .
382
17· Statistische Testverfahren
Während der Mittelwert
durch den Ausreißer nur geringfügig
be-
einflußt wird, macht die Streuung der Daten ohne den Wert x„ nur knapp ein D r i t t e l des W e r t e s aus, den man unter Einbeziehung des Ausreißers
erhält ( 0 , 1 7 4 gegenüber 0 , 4 8 8 d y n / c m ) .
Mit den Restdaten muß nun erneut ein Test auf
Ausreißer
durchgeführt werden. Zur Erinnerung seien die restlichen Daten noch einmal
aufgeführt:
72.68
dyn/cm
72,32
"
72,76
"
72,67 72.69
"
In dieser Reihe scheint der W e r t 7 2 , 3 2 sein, da er wesentlich weiter als wert
ausreißerverdächtig zu
die anderen Werte vom M i t t e l -
= 7 2 , 6 2 4 dyn/cm entfernt liegt. Mit r
Schranken ( f = n - 2 = 5 - 2 = 3 ) r ( 9 5 ) = 1,758
= 1,953
und den
, r ( 9 9 ) = 1,924 und
r ( 9 9 , 9 ) = 1,987 erweist sich auch der Wert 7 2 , 3 2 dyn/cm
als
Ausreißer. E n t f e r n t man auch diesen W e r t , erhält man schließlich für die Kenndaten: = 72,700
s = 0,04l
Während sich also der Mittelwert
dyn/cm . als praktisch "stabil" gegen
Ausreißer erweist, kann die Streuung durch Entfernen der Werte 71,49 und 7 2 , 3 2 dyn/cm
aus den Ausgangsdaten bis
auf ca. 1%
der ursprünglichen Standardabweichung ( = 0 , 5 8 l d y n / c m )
ge-
senkt werden. Aus den durchgeführten Betrachtungen ergibt sich für
die
Praxis: Ausreißer können umso deutlicher bzw. schärfer erkannt werden,
je mehr Einzelwerte vorliegen.
Weitere Betrachtungen zum Ausreißerproblem findet man bei Graf und Henning ( 8 ) , Gottschalk ( 3 ) , Sachs ( 4 ) , Renner ( 9 ) und Stange ( 1 0 ) .
l ? · 3 T r e n d t e s t nach Neumann
383
17.3 Trendtest nach Neumann Mit H i l f e dieses Tests gilt es zu z e i g e n , ob aufeinanderfolgende Meßwerte in einer Reihe von Wiederholungsmessungen auf Grund eines systematischen Fehlers abhängig voneinander sind, d.h. einen Trend aufweisen. Das b e d e u t e t , daß die Meßwerte mit laufender Nummer entweder systematisch zu- oder abnehmen. Da andererseits selten alle Werte einer Meßreihe immer größer oder immer kleiner als ist
die vorherigen Werte sein w e r d e n ,
der Ausdruck Trend nur so zu v e r s t e h e n , daß die W e r t e die
Tendenz haben, größer bzw. kleiner zu werden, einzelne W e r t e aber aus dieser Reihe herausfallen
können. Die folgende Abbil-
dung verdeutlicht diesen Sachverhalt:
01
1
Abb.33
2 *
3
k
5
6
7
8
9 10 11 12 13 K Laufende Nummer der Messung
Beispiel für einen Trend
bei Meßwerten
384
17· Statistische Testverfahren Zeigt der Test, daß die zunehmende bzw. abnehmende Tendenz
der Meßwerte mit einer bestimmten Sicherheit - z.B.
99% - nach-
gewiesen werden kann, dann müssen die W e r t e als voneinander abhängig betrachtet werden. Sie sind dann mit einem systematischen Fehler b e h a f t e t , und die Kenndaten
und
s,
d.h.
also
M i t t e l w e r t und Standardabweichung ,dürfen nicht berechnet werden,
da man sonst zu einer falschen Interpretation gelangt.
Im Gegensatz zum Ausreißertest werden hierbei alle Meßwerte als
"brauchbar" bzw. "unbrauchbar" nachgewiesen.
Durchführung des Tests Zur Prüfung berechnet man die Testgröße i=n-l (228)
D = -—-5s (n-1)
Die Nullhypothese des Tests - aufeinanderfolgende Meßwerte sind unabhängig voneinander - muß dann abgelehnt werden, wenn der Quotient D die in Tab.71 angegebenen Schranken u n t e r s c h r e i t e t . Dabei kann man zwischen den statistischen Sicherheiten 95%, 99% und 9 9 , 9 % wählen.Eine Entscheidung kann nach den auf S.360 angegebenen Kriterien vorgenommen werden. für
Die o.g. Formel 228 kann v e r e i n f a c h t werden, indem man 2 "~ 2 l v™ 2 s ( n - 1 ) den Ausdruck 2. x · - ~ (2.x · ) e i n s e t z t ( s . S. 2 2 5 ) .
Damit kann die Berechnung der Standardabweichung umgangen wer2 vx . und £_ x . er-
Z
m i t t e l t und in die G1.228 eingesetzt werden. Hierzu sowie auch 2 (x. - x. . ) benutzt man zweckmäßigerweise
Z
rechnende Speicher, in denen man Additionen vornehmen kann (z.B.
3 STO + l = Addition von 3 zum Inhalt von Speicher
Das folgende
1).
Programm ermöglicht die Berechnung der Test-
größe D aus n Einzelwerten. Die Entscheidung für
oder gegen
ei-
1 7 - 3 Trendtest nach Neumann
Tab.71
Kritische Schranken für den Trendtest nach Neumann
n
95°/o
99%
99,9%
k
0,7805
0,6256
0,5898
5 6
o, 8204 0,8902
O,4i6i 0,3634
7 8
0,9359 0,9825
9 10 11
1 ,0244
0,5379 0,5615 0,6l4o 0,6628 0,7088 0,7518
14
l ,0623 1,0965 1,1276 1,1558 1,1816
15 16
1,2053 1,2272
0,9221
17 18
1,2473
19
i ,2834 1,2996 1,3148 1,3290 1,3425 1,3552 1,3671 1,3785 1,3892 1,3994 1,409l l,4i83 1,4270 1,4354 1,4434 1,4511
0,9743 0,9979 1,0199 l ,o4o6 l ,0601 1,0785 1,0958
12
13
20 21 22
23 24 25 26 27 28
29 30 31 32 33 34
1 ,2660
0,7915 0,8280 0,8618 0,893l
0,9491
0,3695 0,4036 0,4420 o,48i6 0,5197 0,5557 0,5898 0,6223 0,6532 0,6826 0,7104 0,7368 0,7617 0,7852
i ,2283
0,8073 0,8283 0,848l 0,8668 0,8846 0,9017 o, 9182 0,934l o ,9496 0,9645 0,9789 0,9925 1,0055
1,2386
1 , 0 1 80
1 , 1122
1,1278 1,1426
1,1567 1,1702 i, 1830
1,1951 i ,2067 1,2177
385
386
17· Statistische Testverfahren
nen Trend der Meßwerte erfolgtdann durch Vergleich der berechneten Prüfgröße D mit den in Tab.71 angegebenen Schranken.
Programm N r . 2 8
Trendtest nach Neumann
Speicherbelegung:
=
RCL
i bzw. n
RCL RCL
Schritt-Nr.
RCL
X.
RCL
X .
l
4 i+l
Erläuterungen
Befehle -
Löschen der Speicher
1
0
2
STO 1
Bildung von
3 k
STO 2
2_ x ·
5 6 7 8 9 10
STO 6
STO 3 .
1
*·
J"(x i - i+1 ) 2 Kennzahl i
RCL + 1
Kennzahl STOP STO 4
11
STO + 2
12
X
13
STO + 3
14 15
1
2
.
Eingabe
.
. —» STO 4 2 .
1
STO + 1
Zxi i:
i
= i + 1
zur
bzw. n , und
17-3
Trendtest nach Neumann
Fortsetzung von Programm N r . 2 8 Trendtest nach Neumann Schritt-Nr.
Befehle
16
LABEL 1
17 18
RCL + 1
19 20 21 22
Erläuterungen
1
Kennzahl i-t-1
KENNZAHL STOP
Eingabe x .
STO 5
Summieren der x-Werte
23
STO + 2 2 x
bzw. Bildung der Summe
24
STO + 3
der Quadrate
25 26
STO + 1
27 28 29
1 RCL 4
= i + 1
Bildung von
RCL - 5 2 x
30
STO + 6
3" 32 33 34
RCL 5
35 36
RCL 6
Ersetzen von x.
1
durch
STO 4
den Wert x.
JUMP 1
Rücksprung nach LABEL 1
LABEL 2
37 38
RCL 3
39
-
40 4l
RCL 2
42
RCL : 1
43 44
)
45 46
i:
*-
X
±
i+l'
(
x
2
£- i
l/v n
*—
i
)2
2
=
D
STOP
Ausgabe
JUMP START
Rücksprung zum Start
D
38?
388
17« Statistische Testverfahren
Beispiel 33 Bei einer flüssigchromatographischen Bestimmung eines Amins in biologischem Material wurden 10 Proben von dem zu untersuchenden S t o f f
a u f g e a r b e i t e t und hintereinander vermessen. D a b e i er-
gaben sich in zeitlicher Reihenfolge die Meßwerte ( i n ng/^ul):
=
2,3
= =
2l1
4,0
x6 = 5,5 ? = 4,5 x ß = 7,4
= 3,4 = 5,2
*9 = 5 , 9 x 10 = 8,9
Programmablauf: a)
| JUMP | | START | | START
LL
b)
Eingabe x. = 2,3
2.3000
| START
Eingabe x„ = 2,1
2.1000
START |
Eingabe
=
8,9
8.90QO 7
START) /ll.
0.6744 y
17-3
Trendtest nach Neumann
389
Für die Testgröße D ergibt sich somit der W e r t O,67^. Er kleiner als
der entsprechende Tabellenwert für
Sicherheit (= 0 , 7 5 1 8 ) .
n = 10 und 99%
Damit kann die Nullhypothese
hängigkeit der Meßwerte mit mehr als
ist
der Unab-
99% Sicherheit abgelehnt
werden. Die Meßwerte haben also mit laufender Nummer die
Ten-
denz anzusteigen. Dies schließt w i e g e s a g t n i c h t aus, daß einzelne W e r t e auch einmal kleiner als gen sind (Meßwerte
,
,,
die vorhergehenden Messun-
und x „ ) .
17.4 Vergleich zweier Varianzen (F-Test)
17.^.1
Durchführung und Voraussetzungen
Mit diesem Test kann g e p r ü f t
w e r d e n , ob sich zwei unter-
schiedlich große Varianzen bzw. Standardabweichungen s s
und
, die aus zwei verschiedenen Meßreihen mit jeweils n. b z w .
n„ Meßwerten stammen, nur z u f ä l l i g (auf Grund der Streuung der W e r t e ) oder aber systematisch u n t e r s c h e i d e n . Ist tischer Unterschied n i c h t n a c h w e i s b a r ,
ein systema-
so läßt sich die Null-
hypothese des Tests - die Standardabweichungen s
und s
ge-
hören der gleichen Grundgesamtheit mit der Streuung U an nicht widerlegen. Im anderen Fall gehören die Meßwerte beider Reihen jeweils einer anderen V e r t e i l u n g an. Voraussetzung für den Test ist,
daß die W e r t e normalver-
teilt und ausreißerfrei sind. Zur Durchführung eines Tests auf Normalverteilung von Werten siehe A b s c h n . l 8 . 6 . Geringe Abweichungen von der Normalverteilung fuhren zwar leicht zu ner falschen T e s t i n t e r p r e t a t i o n . Dies ist
ei-
aber nur dann beson-
ders k r i t i s c h , wenn die Anzahl der Meßwerte in beiden M e ß r e i hen sehr unterschiedlich ist.
Man sollte daher nach M ö g l i c h -
keit Meßreihen mit gleichem Stichprobenumfang wählen bzw. in
390
l?. Statistische Testverfahren
beiden Meßreihen die gleiche Anzahl von Wiederholungsmessungen durchführen. Kann man sicher n a c h w e i s e n , daß eine oder beide Meßreihen nicht normalverteilt sind, dann sind verteilungsunabhängige Testverfahren wie z . B . der Rangdispersionstest Tukey ( 4
von Siegel und
) o.a. anzuwenden.
Die Prüfung auf Ausreißer kann nach dem Verfahren von Graf und Henning oder mit Hilfe des Nalimov-Tests vorgenommen wer-
den.
Zur Durchführung des Tests berechnet man zunächst die Prüfgröße s2
i
F = S
Dabei muß s d.h.
s
2" 2
mit
s
l >
S
(229)
2 ·
die größere der beiden Standardabweichungen sein,
muß aus der Meßreihe mit der größeren Streuung stam-
men. Die beiden Meßreihen u m f a s s e n n
b z w . n„ E i n z e l w e r t e , wo-
bei aus den o.g. Gründen nach Möglichkeit n =n 0 sein sollte. l
Wenn s
stets die größere der beiden Standardabweichungen
sein muß, folgt d a r a u s , daß der Quotient F immer größer als
l
ist. Sind s
und s
die Streuungen aus zwei Stichproben aus nor-
m a l v e r t e i l t e n G r u n d g e s a m t h e i t e n , dann f o l g t die Größe F der sog. F-Verteilung ( n a c h R.A.F_isher) mit den Parametern f = n . - l und f 0 = n -2. Diese Freiheitsgrade f . und f _ bestimmen die Form C-i
-
der V e r t e i l u n g . von F = 0 bis
Die F-Verteilung ist
F = cO . In Abb. 3^ ist
unsymmetrisch und r e i c h t für
einige Werte von f
und f p die Form der F-Verteilung d a r g e s t e l l t . Um zu entscheiden,
ob die beiden Streuungen s
und s
ei-
ner einizigen oder zwei verschiedenen Verteilungen angehören, gibt es zwei M ö g l i c h k e i t e n : a) Man berechnet für
die
gegebenen W e r t e von f
und f
17.
.1
F-Test /
0
Durchführung und Voraussetzungen
1
Abb.34
2
3
Kurvenform der F - V e r t e i l u n g für Freiheitsgrade i\
die
i
391
F
verschiedene
und f _
Fläche unter der
F - V e r t e i l u n g z w i s c h e n O und
dem b e r e c h n e t e n F - W e r t . Dies kommt der
Aufgabe
einer
Integration gleich. b) Man vergleicht den b e r e c h n e t e n F - W e r t mit den Schranken der F-Verteilung für vorgegebene F l ä c h e n werte = s t a t i s t i s c h e
Sicherheiten
Im Fall a) e r h ä l t man direkt die W a h r s c h e i n l i c h k e i t b z w . die s t a t i s t i s c h e Sicherheit d a f ü r , dardabweichungen s
und s
daß sich die beiden Stan-
"statistisch unterscheiden",
also
zwei verschiedenen V e r t e i l u n g e n zugrunde liegen. Im Fall b)
geht man meist so v o r , daß man den b e r e c h n e t e n
F-Wert mit den F - W e r t e n für
die
vorgegebenen W a h r s c h e i n l i c h -
keiten bzw. s t a t i s t i s c h e n S i c h e r h e i t e n 9 5 % , 99% und 9 9 , 9 ° i > gleicht.
ver-
392
17· Statistische Testverfahren Ein F-Wert für
95% statistische Sicherheit bedeutet dann:
Die Fläche unter der F-Verteilung zwischen 0 und F für gebenen Werte von f
und f„ macht genau 95% der
die
ge-
Gesamtfläche
unter der Verteilung (=100%) aus. Entsprechendes gilt für die anderen statistischen Sicherheiten. Manchmal findet sich in der Literatur die Behauptung, der F-Test soll z e i g e n , ob sich die b e i d e n Streuungen s unterscheiden.
Dies ist
falsch
!
und s
In den seltensten Fällen
d ü r f t e n die Streuungen der beiden Meßreihen exakt den gleichen Zahlenwert haben. Für eine E n t s c h e i d u n g , ob sich s unterscheiden, benötigte man keinen Test
und s
! Vielmehr soll der
Test nachweisen, ob die vorhandenen Unterschiede
zufälliger
Natur sind oder aber darauf zurückzuführen sind, daß den beiden Meßreihen unterschiedliche Verteilungen zugrunde liegen. Die Nullhypothese lautet also nicht s = s sondern C7. = O0 2 2 (J = (J . Der F-Test soll nun zeigen, mit wel-
bzw. exakter
cher statistischen Sicherheit man nachweisen kann, daß die
bei-
den Meßreihen zwei Grundgesamtheiten mit unterschiedelicher Standardabweichung
U angehören.
Für den F-Test ist
es übrigens nicht e r f o r d e r l i c h , daß die
M i t t e l w e r t e beider Meßreihen b z w . daraus a b g e l e i t e t die Lage der beiden Verteilungen, die den Meßreihen zugrunde liegen, gleich sind. Wie bereits im Abschn. 13-3
erwähnt wurde,
ändert
sich die Form der Verteilung b z w . die Streuung n i c h t , wenn man die Meßwerte um einen konstanten Betrag erhöht oder erniedrigt. Bezeichnet man die Fläche unter der F-Verteilung mit S(F,f
,f„),
dann gilt nach G o t t s c h a l k ( 3 ) folgendes
-stu-
figes Beurteilungsmaß für den Test:
F < F(95°/o,f1,f2) bzw. S ( F , f 1 , f 2 )
< 95%
Ein Unterschied zwischen 2 2 s und S 0 ist zufallsbel ^ dingt. Eine Unterscheidung zwischen 0° . und (J „ ist s t a t i s t i s c h nicht nachwe isbar.
F-Test /
Durchführung und Voraussetzungen
F(95%,f1,f2) < F < F(99%,f1,f2) bzw.
95% ^ S ( F , f 1 , f 2 ) < 99%
393
Ein Unterschied zwi2 2 sehen ff ^ und ff 2 ist wahrscheinlich
F(99%,f1,f2) < F < F(99,9%, bzw.
99% < s ( F , f 1 , f 2 )
fW
0,
3 k
2
5
FRACTION
Sprung nach LABEL
6
JUMP + 1
FRACTION
dann ist
f
(f
von f /2.
ungerade
RCL 02
9
RCL
01
f
2
1 f -P ί J
10
RCL χ 00
11
=
f2 + f y r
12
1/x
l/(f2
13
RCL χ 02
f2/(f2
14
STO 03
x —»STO 0 3
15 16
RCL 02 STO 07
1 f J
+ fj-F)
—» N
Ist
/ 2 ) = O, w e i t e r
mit S c h r i t t 7
7 8
1.
^
+ iy F) = χ
406
17· Statistische Testverfahren Fortsetzung von Programm N r . 2 9 Integration der F-Verteilung a) f .
l
oder f _
o
geradzahlig
Schritt-Nr.
Befehle
17
RCL 01
18
STO 08
19
1
20
RCL - 03
21
STO 09
22
1
Erläuterungen ]fl_> M
V = 1 - X
23
STO 10
k = 1
24
STO 11
G = 1
25
STO 12
R = 1
26
BRANCH 3
"l Sprung in J zur
27
RCL 03
das Unterprogramm
Berechnung von R -> LABEL 3
X
X
28
a
29
(
30
RCL 02
31
:
32
2
33 34 35 36 37 38 39 40 4l 42
)
_
f 2 /2
xV 2
= RCL
R-xf2/2
12
- R-xf2/2
CHS +
~|
1 X
1 - R-xV2
100 =
S = 100(1 - R . x f 2 / 2 )
STOP
Ausgabe S in Prozent f . = geradzahlig
für
17·4.2
Integration der F-Verteilung
Fortsetzung von Programm N r . 2 9 Integration der F-Verteilung a) f 1 oder f
geradzahlig
Schritt-Nr.
Befehle
43
LABEL 1 RCL 02
44
45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 6l 62
Erl uterungen
-> f
+
2
+
f
lF
RCL 01 RCL χ 00 J
= 1/x
l / ( f 2 + f1
RCL χ 02
f2/(f2
STO 03
χ
RCL 01 STO 07 RCL 02 STO 08 RCL 03 STO 09
F)
+ f j F) = χ
» STO 03
] f —> N J 1 1 f —» M J 2 χ
> v
1
STO 10
k = 1
STO 11
G = 1
STO 12
R = 1
BRANCH 3
Sprung in das Unterprogramm nach LABEL 3 zur von R
63 64 65 66 67 68 69 70 71
1
1 1 - X χ
RCL - 03 a
X
(
RCL 01 :
f/2
2 ) =
( i - x)V2
Berechnung
40?
17· Statistische Testverfahren
Fortsetzung von Programm N r . 2 9 Integration der F-Verteilung a) f.. oder f l
^
geradzahlig
Befehle
Erl uterungen
72
RCL χ 12
R (1 - x ) f l / 2
73 74 75 76
X
Schritt-Nr.
100
=
S = 100 ( 1 - χ ) f l / 2
STOP
Ausgabe S ( f „ geradzahlig)
77
LABEL 3
Unterprogramm zur Berechnung von R
78
RCL 10
Berechnung von k - M/2 .
79 80 8l 82
-
Pr fung , ob k - M/2 gleich
(
Null
RCL 08
Wenn ja,
:
In diesem Fall Sprung nach
83 84
2
LABEL 4.
)
Schritt Nr. 87 ( k ist
85 86
=
kleiner als M / 2 ) .
87 88
dann ist
RCL 10
91 92
2
93 94 95 96
4 +
X
k:=k + 1
2 k - 4
-
RCL 07 :
N H- 2 k -
( 2
99 100
RCL χ 10
101
2
2 k
_
2 k - 2
k = M/2.
Sonst weiter mit
STO + 10
89 90
97 98
ist.
JUMP = 4
1
R
4
dann
17-4.2
409
Integration der F-Verteilung
Fortsetzung von Programm N r . 2 9 Integration der F-Verteilung a) f 1 oder f„ geradzahlig Schritt-Nr. 102
Erläuterungen
Befehle )
2 k - 4 2 k - 2
103 104
RCL
09
105
STO
11
106
RCL 11
107
STO + 12
108
JUMP 3
109
LABEL 4
110
RETURN
2 k - 4
2 k - 2
C G
^
2 k
4 2 k -- 2 vV
k -1
JR: = R
+
->CG k
Gk
Rücksprung in das Hauptprogramm ( S c h r i t t 27 bzw. 6 3 ) .
Programm N r . 2 9
Integration der F-Verteilung aus gegebenen W aus Werten für
F, f
und f
(Compucorp 327) b) f 1 und f„ ungeradzahlig Schritt-Nr.
Befehle
1
RCL 01
2
RCL + 02
3 4
-
5
=
Erläuterungen -
Berechnung von f . + f _
2 _
- 2
410
l?· Statistische Testverfahren Fortsetzung von Programm N r . 2 9 Integration der F-Verteilung b) f
und f _ l
Schritt-Nr.
6
ungeradzahlig
ά
Befehle
Erl uterungen
JUMP = 2
Wenn f.. und f _ dann ist
gleich 1 sind,
f +f -2 gleich Null.
Tritt dieser Fall ein,
dann er-
folgt Sprung nach LABEL 2. Sonst weiter mit Schritt 7ί Sprung nach LABEL 5-
7 8
JUMP 5
9 10 11 12
RCL 00
13
X
14
2
15
:
16 17 18
7Γ
LABEL 2 Berechnung von
*y F
arc tan χ
arc
•3C.-> RAD
Umwandlung des Winkels in das
tan y F
Bogenma
X
100 2 -=- 100
19 20
STOP
arc
tan y F
=S
Ausgabe S in Prozent f r
f t = f„ = i. 2l
LABEL 5
22
RCL 02
Berechnung von f _ f
23
- 1. Wenn
- 1 gleich Null ist,
dann
24
1
25
=
Sprung nach LABEL 6. Wenn nicht,
26
JUMP = 6
weiter mit Schritt 27.
gilt: f
= 1. In diesem Fall
17-4.2
Integration der F-Verteilung
411
Fortsetzung von Programm N r . 2 9 Integration der F-Verteilung b) f
und f„ ungeradzahlig
Schritt-Nr.
Befehle
27 28
RCL 01
29 30 31 32
33 34 35 36 37 38 39 40 4l 42
RCL χ OO
Erl uterungen If -F J α
RCL : 02
i^
STO 03 2
X
+
f
rF/
f
f
2
STO 09
= v
RCL 02 STO 08
Ί J
RCL O9
-1
f2
>
STO 11
G = v 1 / 2 = VT1
43 44
STO 12
R . = v 1 / 2 = /v-
45 46
STO 10
1
BRANCH 7
l-
1
Sprung in das Unterprogramm zur Berechnung von R '
47 48
RCL 09
49
RCL χ 12
50
RCL χ 03
5l 52
RCL 03
53
/" J
r.
l/ y
x-R'
! 1 + x 1,
=
f
JUMP + 9
sem Fall
65 66
. S
^ STO 15
- 1
gr
( = A)
dann ist
f
f.,-1 ist
er Null. In die-
Sprung nach LABEL 9«
Sonst weiter mit Schritt 67. f =1
67 68
i
RCL 15 STOP
Ausgabe S in Prozent f r
f., = 1 und f n gr
69
LABEL 6
Berechnung von S f r und f ί >
70
RCL 01
7l 72
RCL χ 00
73 74 75 76
J
i
1/f j- F
iT
yi/f±-F
X
χ
i / ( i + χ2)
1 =
79
1/x
= χ
> STO 03
-
+
77 78
1 (Fall e )
1 ff .FF
1/x
STO 03 2
er als
_
fp=* ).
1.
17.4.2
Integration der F-Verteilung
413
Fortsetzung von Programm N r . 2 9 Integration der F-Verteilung b) f 1 und f _ ungeradzahlig Schritt-Nr.
Befehle
Erl uterungen
80
STO O9
l / ( l + x 2 ) = v —>STO 09
8l
RCL 01 STO 08 RCL 09
82
83 84 85 86 87 88
iT
-i f J
M
1
" G = v 1/2 = ./v-
STO 11 STO 12 1 STO 10
R _
VV2
]fc :,
_y-
Sprung in das Unterprogramm
89
BRANCH 7
90
RCL 09
-
91 92
RCL χ 12
_ R ' · i/(i + x 2 )
zur Berechnung von R '
-r
X'i\ * i/ ^ i ~t" χ )
93 94
RCL χ 03
95
arc tan χ
arc tan χ
96
•fc-»RAD
Umwandlung von Winkel in
+
Bogenma
97 98
X
99
:
100
7Γ
2
101 102
CHS
103 ιο4
1
105
X
106 107 108
2
1
T*·
1 +x
S = 100 f l - — ( arc tanx + χ R '/vj ΤΪ
100
= STOP
J
Ausgabe S % ( f ?
=1, f 1 > 1 )
kik
17. Statistische Testverfahren Fortsetzung von Programm N r . 2 9 Integration der F-Verteilung b) f 1 und f _
ungeradzahlig
Schritt-Nr.
Befehle
Erl uterungen
109
LABEL 7
Unterprogramm zur Berechnung
von R 1 110
RCL 10
Berechnung von k - ( —·* Ist
111
).
dieser Ausdruck Null (das
112
(
113
RCL 08
ist),
114
-
Sonst weiter mit Schritt 121.
115
1
116
:
117
2
118 119
) =
12O
JUMP = 8
dann Sprung nach LABEL 8.
"1k: = k + 1
121
1
122
STO H-
123
2
124
RCL χ 10
10
J 2 k - 2
125 126
2
127
:
128
(
129
2
130
RCL χ 10
131
-
132
1
133 134 135
)
2 k - 1
=
(2 k - 2) / ( 2 k - 1)
RCL χ 09
(2 k - 2)
v
(2 k - 1)
136
STO χ 11
G
G k K
~
k-1 τ K
(2 k - 2) (2 k - 1)
„
17-4.2
Integration der F-Verteilung
415
Fortsetzung von Programm N r . 2 9 Integration der F-Verteilung b) f
und f„ ungeradzahlig
Schritt-Nr.
Befehle
137
RCL
138 139 ι4ο ι4ι
STO + 1 2
Erl uterungen
11
R:
= R + G
J
JUMP 7 LABEL 8 RETURN
R cksprung
in das Hauptpro-
gramm ( S c h r i t t e 47 oder 90)
142
Berechnung von S, wenn sowohl
LABEL 9
f gr
143 144 145 146 147 148 149 150 151 152 153
1
STO 10
als auch f 2 ungerade und er als
1 sind.
1 k - 1 J
STO i4
Q = l
LABEL 0
RCL 00
-i
-
k - i
.5 =
_J
1/x
1 /( k - | )
RCL χ 10
k /
STO χ 14
( k - 1/2)
Bildung des Produktes Faktoren k /
154 155 156 157 158 159 160 161 162
1
STO + 10 RCL 10 /
k:
der
(k - 1/2)
= k + 1
J
-i
2
Wenn ja, dann ist
k - (f
^
-l)/2
gleich Null. Dann Sprung nach
RCL 02 1
:
LABEL 0,
ebenso wenn k noch
kleiner als ( f „ - l ) / 2 ώ
ist.
416
17· Statistische Testverfahren Fortsetzung von Programm N r . 2 9 Integration der F-Verteilung b) f.. und ΐ- ungerade Schritt-Nr .
Befehle
163
2
164 165 166 167 168 169 170 17l
)
172 173 174 175 176 177 178 179 18ο
Erl uterungen
=
JUMP - = 0 -ι
2
:
7Γ STO χ 14 1
STO STO STO RCL 2 X
ο
2
ΓΤ
~~ 7Γ ir ' /ι
|
k
k - 1/2
k = 1
10 11 13 03
G = 1 R" = 1
ι/(ι+χ 2 )
+ 1 =
18l
1/x
182
RCL χ 03
183
RCL χ 03
184 185 186 187 188 189 190 19l 192 193
STO 09
x2/(l+x2) = v v
STO 09
LABEL -
Berechnung von R"
RCL
Pr fung, ob k = ( f ^ - D / 2
10
ist.
Wenn ja ( k - ( f ^ - D / 2 = 0) , 1 2
JUMP = CHS
dann Sprung nach LABEL CHS. Sonst weiter mit Schritt 194.
17-4.2
Integration der F-Verteilung
417
Fortsetzung von Programm N r . 2 9 Integration der F-Verteilung b ) f\
und f
ungerade
Schritt-Nr.
Befehle
194
1
195
STO + 10
196
2
197 198
RCL χ 10
Erl uterungen
| k: = k + 1
-|
2 k - 3
199 200
+
201
RCL 02
3 f 2 + 2k - 3
202 203
(
2O4
2
205
RCL χ 10
2 k - 1
206 207
1
208
)
209
f 2 + (2 k - 3)
210
RCL χ 09
211
STO χ 11
Γ* G
212
RCL 11 STO + 13
R": = R " + G
213 214
JUMP .
R cksprung nach LABEL ·
215
LABEL CHS
216
RCL 03 2
(2 k - 1) f
217 218
X
+
219
1
220
=
221
1/x
k
P
C
k-l
ι/(ι+χ2)
. . .
V
+ (2k - 3) (2 k - 1)
V
418
17. Statistische Testverfahren Fortsetzung von Programm N r . 2 9 Integration der F-Verteilung b) f.
und f
Schritt-Nr.
ungerade Befehle X
222
a
223
(
22k
1
225
RCL + 02
Erl uterungen -i
1 ( ——Ϊ ) ~^~ 1 + χ
226 22?
2
228
)
229
-1
230
RCL χ 13
R it
/V
i.
231
RCL χ 03
Multiplizieren des in
o 1 + x2
ΐJ
ι
"
Schritt 230 berechneten Ausdrucks mit χ 232
RCL χ 1Ί
233
X
23^
100
Multiplizieren mit Q
1
235
1 + χ
236 237 238
RCL 15
239
STOP
STO 16
B
»STO 16
1A - B
RCL - 16
Ausgabe S in Prozent f r den Fall, da und gr
f ^ und f„ ungerade er als
1 sind.
17.4.2
Integration der F-Verteilung
419
Programmablauf Zu Beginn sind die Werte für F, f.. und f Öl und 02 einzugeben. Danach ist [START)
in die Speicher 00,
die Tastenfolge
|jUMP|
|START|
zu betätigen. Nach Ablauf von einigen Sekunden er-
scheint das Ergebnis, nämlich die Fläche unter der F-Verteilung zwischen 0 und F in der Anzeige. Der Wert wird in
Pro-
zent der Gesamtfläche unter der F-Verteilung angegeben, die gleich l gesetzt wird. Da die Berechnung über Reihenentwicklungen abläuft ( Berechnung von R, R ' f
bzw. f
bzw. R"
abhängig,
und Q ) , ist
die Rechenzeit von
da die Anzahl der Reihenglieder eine
Funktion der Freiheitsgrade ist. sind für einige Werte von F, f
In der folgenden Tabelle 72 und f» die Rechenzeiten
wie die berechneten Flächenwerte angegeben und mit den
soent-
sprechenden Sollwerten verglichen. Bei der Anwendung des Programms muß übrigens vor dem Programmlauf geprüft werden, ob entweder f . oder f _ geradzahlig ist
oder ob beide Freiheitsgrade ungerade sind. Entsprechend
ist
entweder der Programmteil a) oder der Teil b) anzuwenden. Tab.72
Vergleich berechneter und tabellierter Flächenwerte und Angabe der Rechenzeiten
f
l
f
2
F
t( s e c )
S ( b e r ) (°/o)
S( soll)
1
1
161,447
1,5
94,999990
95
1
9
3,36030
5,5
89,999987
90
9
1
59,8575
5,5
89,999993
90
10
9
2,4l631
6,5
89,999943
90
9
10
2,3^730
6,5
89,999936
90
49
49
1,96259
65
98,999987
99
50
50
1,94896
26
98,999980
99
100
100
1,59766
50
98,999925
99
125
125
1,51966
164
98,999922
99
k20
l?. Statistische Testverfahren
Man erkennt, daß für ungerade Freiheitsgrade f . und f„ die Rechenzeiten erheblich größer als für gerade Freiheitsgrade sind. Die Abweichung der berechneten von den tabellierten Flächenwerten ist praktisch vernachlässigbar. Sie rührt u.a. auch daher, daß auch die tabellierten F-Werte nur "Näherungen" sind, da die letzte Stelle stets a u f - oder abgerundet
ist.
Neben der "exakten" Lösung des F-Integrals gibt es - wie bereits erwähnt - eine Reihe von mehr oder weniger genauen Approximationen. Eine relativ einfache Lösung stellt die Näherung von Paulson ( 1 2 ) dar. Danach gilt: +z
S (%)
= 50 + -|—
\
Normalverteilung
(250)
-z
1
mit
z = —_
- 9%} -
(1
-
_2_ ) f.
Das Integral der Normalverteilung kann dabei mit Hilfe von Programm 12 oder 13 gelöst werden. Der Rechenaufwand ist
- wie
man erkennt - erheblich geringer als bei der "direkten" Integration der F-Verteilung über das Programm 29. Ein entscheidender Nachteil ist
aber die geringere Genauigkeit, insbeson-
dere bei kleinen Freiheitsgraden, wie sie in der Praxis sehr oft
vorkommen ( d i e Anzahl der Wiederholungsmessungen muß meist
sowohl aus Kosten- wie auch aus Zeitgründen beschränkt w e r d e n ) . Der Fehler ist
besonders groß, wenn die Fläche
( 9 9 % und mehr) b e t r ä g t . In Tab.73 sind für
nahe 10O %
einige Werte von F,
und f „ die nach den Gleichungen 250 und 251 berechneten Flächen unter der F-Verteilung den theoretischen Werten gegenübergestellt.
17.4.2
Tab. 73
Integration der F-Verteilung
Vergleich approximierter
421
und exakter
Flächenwerte unter der F-Verteilung
f
l
1
f
2
F
S(ber. )
S(soll)
1
161,447
90,9605
95
2
2
19,000
94,1133
95
5
5
5,050
94,8856
95
20
20
2,124
94,9939
100
100
95,0105
95 95
1,392
.
1
10
4,965
95,1790
95
3
50
2,790
95,0733
95
1
1
405284
94,9836
99,9
2
2
999,000
5 20
5 20
29,752
99,1637 99,8262
99,9 99,9
4,290
99,8939
100
100
1,867
99,8989
99,9 99,9
1
10
21,040
99,8936
3
50
6,336
99,8917
Für hohe Freiheitsgrade ( f j und f,, > 10) ist Lösung ohne w e i t e r e s anwendbar. Für kleinere sollte man aber besser auf die
99,9 99,9
die angegebene Freiheitsgrade
"exakte" Lösung nach Programm
N r . 2 9 zurückgreifen.
17.4.3
Signifikanzschranken der F-Verteilung
Die angegebenen Gleichungen 250 und 251 zur approximativen Berechnung der Fläche unter der F-Verteilung kann man auch nach F auflösen und somit auch für sowie beliebige Freiheitsgrade f
eine gegebene Sicherheit S und f,, die zugehörigen F-
Werte ermitteln. Die entsprechenden Gleichungen lauten dann:
422
17. Statistische Testverfahren
(252)
q =
(253)
- s
7]="\/ln -\
(254)
q =
T\-
A = —
B =
a + 77 (a, + a„ 77) -2.-i-i-2-1l + Tl (b 1 + 7 7 ( b 2 + b 3 7] )
(l - - - )
2
(255)
(256)
2(1- - r - ) (l - -— )
(257)
(258)
P = B/A
(259)
r = C/A
(260)
(26D F = U3
Die Gleichungen 252-262 müssen für und f
(262)
gegebene Werte von S%, f .
abgearbeitet werden. Man erhält dann einen Näherungs-
wert für F, so daß die Fläche unter der F-Verteilung zwischen
17.4.3
0 und F dem durch S% gegebenen prozentualen Anteil der fläche
423
Signifikanzschranken der F-Verteilung
Gesamt-
zwischen 0 und Unendlich entspricht.
Die Konstanten a
bis a und b bis b in G1.255 müssen o
Ein Unterschied z w i s c h e n ^ ,
t(99,9%f)
und yu„ kann statistisch stark bzw.
S°/o(TAU,f) > 9 9 , 9 %
gesichert bzw. hochsignifikant nachgewiesen werden. Der vorhandene Unterschied zwischen x. und x 2
ist
stark gesichert auf einen systematischen Einfluß zurückzuführen.
Rechengang A
TAU =
S
d =
( U n t e r s c h i e d zwischen_s
-
X
n
2 n
n
l
l
+
und s2_-"- s i_Zuf all
2 n
(263)
2
(264) n
l
+
n
2 -
(265)
Integral der t-Verteilung = S % ( t = T A U , oder
t
= e
3 2 ax +bx +cx + + dd
mit
= 1/f
f)
= l /n 1 + n 2 -
(siehe Abschnitte 13.4.3 und 13.4.5)
17.5-1
t-Test / Testvoraussetzungen
und Durchführung
Rechengang B (Systematischer Unterschied
zwischen s
433
und s )
(266)
2 S
2 2
.2
n
f
= S
I
2 l
2
+ l
S
f
(
n 2 2 x2
-
(26?)
2
V n
+ l
Der berechnete f - W e r t wird dann gerundet.
Integral der
oder
t = e
t-Verteilung = S % ( t = T A U ,
3 , 2 ax + bx + ex + d
mit
f)
.,
= 1/f
Anschließend an den Rechengang A oder B e r f o l g t der V e r g l e i c h der Prüfgroße TAU mit S = 99%
den b e r e c h n e t e n t-Werten für
und S = 9 9 , 9 % . Oder man berechnet mit
t
S = 95%,
= TAU und dem
berechneten F r e i h e i t s g r a d f über das Programm Nr.18 das Integral der t-Verteilung. Entscheidung wie auf S.431 angegeben. Da für den "kompletten" t-Test auch der F-Test vorab durchg e f ü h r t werden muß, kann man es sich zunutze m a c h e n , daß die t-Verteilung e i g e n t l i c h nur ein Spezialfall der F - V e r t e i l u n g ist.
Einer Fläche unter der t-Verteilung in den Grenzen -t und
+t mit dem Freiheitsgrad f e n t s p r i c h t eine Fläche unter der F2 Verteilung zwischen 0 und F = t und den Freiheutsgraden f = l und f
= f . Zwischen beiden Verteilungen gilt also der Zusam2 menhang: F = t , f = l und f = f.
434
17· Statistische Testverfahren
Eine ausführliche Darstellung des Testablaufs sowie der Testvoraussetzungen findet man bei
Sachs ( 4 ) "Angewandte Sta-
tistik" sowie in dem Buch "Elementare Tests zur Beurteilung von Meßdaten" von R.Kaiser und G.Gottschalk ( 2 0 ) .
Bei dem Vergleich zweier Mittelwerte sind 2 Fälle zu unterscheiden, die einseitige und die zweiseitige Fragestellung.
a) Zweiseitige_Fragestellung In diesem Fall soll geprüft werden, ob sich /u.
und/u„
überhaupt unterscheiden bzw. ob ein systematischer Unterschied zwischen
und
überhaupt vorhanden ist.
also hier nicht, ob ja.. > /&„
Es interessiert
oder umgekehrt yU„ > A1! ist. Die
statistische Sicherheit für diesen "überhaupt" vorhandenen Unterschied zwischen ,u ter
und yu„ ist
gegeben durch die Fläche un-
der t-Verteilung zwischen t = - TAU und t = + TAU.
Die
Abb.37 verdeutlicht dies:
h"
S% (zweiseitig)
-r
Abb.37
=0
t
Fläche unter der t-Verteilung beim t-Test mit zweiseitiger Fragestellung
17.5.1
t-Test / Testvoraussetzungen und Durchführung
435
b ) Einseitige_Fragestellung Falls die Berechnung der Kenndaten ergibt, daß ist,
dann soll diesem Fall g e p r ü f t werden, ob a u c h y u
gilt. Ist umgekehrt x. / x, l
} /u 2
dann soll der t-Test mit einsei-
t
tiger Fragestellung zeigen, ob die Bedingung /u„ ^ ist.
^
/M
erfüllt
Die entsprechende statistische Sicherheit ist hier durch
die Fläche unter der
t-Verteilung zwischen - oo und + TAU ge-
geben, wie in Abb.38 dargestellt
ist:
S%(einseitig)
=0 Abb.38
+r
t
Fläche unter der t-Verteilung beim t-Test mit einseitiger Fragestellung
Bei gegebenem TAU-Wert gilt für
den Zusammenhang zwischen den
Flächen unter der t-Verteilung bei einseitiger und zweiseitiger Fragestellung:
S % ( e i n s e i t i g ) = 50 +
S%(zweiseitig)
(268)
436
17· Statistische Testverfahren
Aus den Abbildungen 37 und 38 geht hervor, daß für
einen gege-
benen TAU-Wert die Fläche unter der t-Verteilung größer
ist,
wenn nicht ein Test mit zweiseitiger Fragestellung sondern ein Problem mit einseitiger Fragestellung vorliegt. Ist z.B. bei zwei vorliegenden Meßreihen dann kann man die
die
Bedingung x_ L > x,,
erfüllt,
entsprechende Prüfhypothese /u^ > pi^ wesent-
lich schärfer testen als die "allgemeine" Testhypothese ja.^ :f:/a2 ( a l s o die These, daß überhaupt ein Unterschied zwischen /u^ und fir, v o r l i e g t ) . Es sollte daher vor Anwendung des t-Tests stets geprüft werden, ob der allgemeine zweiseitige Test nicht durch einen Test mit einseitiger Fragestellung ersetzt werden kann.
Aus den Abbildungen 37 und 38 geht weiterhin hervor, daß die Fläche unter der t-Verteilung mit steigendem TAU-Wert zunimmt. Je größer also TAU ist,
desto größer
ist
auch die an-
gebbare Sicherheit für eine signifikante D i f f e r e n z zwischen x_ L und x,,.
W e r t e t man die Gleichungen 263 und 266 aus, dann erkennt man weiterhin, daß - bei gegebener D i f f e r e n z x^x,, und gegebenen Streuungen s
und s l
der Meßwerte n
- der TAU-Wert mit steigender Zahl £
und n 2 zunimmt. Für die weitere Betrachtung
wollen wir annehmen, daß n.. = n„ = n ist. als die Sicherheit dafür größer, systematisch bedingt ist ansteigt. Dies ist
und nicht nur Zufalls ist,
die
wenn n
auch verständlich, da mit steigendem n auch
die "Zuverlässigkeit" der Mittelwerte werte für
In diesem Fall wird
daß die D i f f e r e n z x1 - x2
"wahren" Werte /u
und
und /a.
als Schätz-
größer wird.
Aus den gemachten Ausführungen ergibt sich die interessante Frage, wieviel Einzelwerte die beiden Meßreihen jeweils aufweisen müssen, um nachweisen zu können, daß eine gegebene Differenz x^ -
nicht nur zufällig sondern durch irgendei-
nen systematischen Unterschied in beiden Meßreihen verursacht wird. Das Problem kann durch systematisches
Suchen gelöst wer-
den. Man berechnet zunächst für eine gegebene Differenz und gegebene Standardabweichungen s
und s„ für
l
-
steigende Werte
17.5-1 von n
t-Test / Testvoraussetzungen und Durchführung
= n_ = n
die
437
entsprechenden Werte von TAU. D e r j e n i g e
- W e r t , für den das Integral der t-Verteilung (Programm N r . l S ) dann größer als 99% ist, werte dar, die
stellt die Mindestzahl der Einzel-
jede Meßreihe aufweisen muß. In Tab.75 sind für
einige Werte von n die berechneten Werte für
TAU und das
ent-
sprechende Integral z u s a m m e n g e s t e l l t , wobei angenommen w i r d , daß die D i f f e r e n z der beiden M i t t e l w e r t e
=
-
die Streuung in jeder Meßreihe 0,3 b e t r ä g t ( s lage der Berechnung ist
= 0,5 und = s ). Grund-
dabei die G1.263.
Abhängigkeit des TAU-Wertes sowie des zuge-
Tab.75
hörigen t-Integrals ( z w e i s e i t i g ) von der A n z a h l der
Meßwerte n
renz s
l =
l S
-
= n
-i = 0,5
= n
bei
gegebener D i f f e -
und gegebenen Streuungen
2 = °'
Fläche S unter der n
=
l
'
2
TAU
=
V e r t e i l u n g in Prozent
3
1,12
67,5
k
1,29
5 6
1,44
75,5 81,2 85,5 94,4 99,4 99,9985 99,999999914
1,58
10
2,04
20
2,89
50
4,56
100
6,45 9,13 14,43
200 500
t-
99,999999997 99,999999997
Man erkennt, daß mit steigender Anzahl der Meßwerte die
sta-
tistische Sicherheit für einen systematischen und nicht z u f ä l ligen Unterschied von
und
gegen 100% geht. Für die Praxis
ergibt sich nun folgende w i c h t i g e R e g e l : Ein geringer Unterschied zweier a r i t h m e t i s c h e r M i t t e l w e r t e kann nur dann als
"statistisch g e s i c h e r t " angesehen w e r d e n ,
438
17- Statistische Testverfahren
wenn die Anzahl der Einzelwerte groß ist. sen,
in beiden Meßreihen hinreichend
Nur dann kann man mit genügender Sicherheit nachwei-
daß der vorhandene geringe Unterschied nicht nur zufalls-
bedingt ist, Einfluß
sondern seine Ursache in einem
systematischen
hat.
Andererseits kann man große Mittelwert-Unterschiede noch mit einem kleinen Stichprobenumfang als
auch
statistisch ge-
sichert nachweisen.
17.5.2
Rechenprogramm zum t-Test
Das folgende Programm b e s t e h t aus k Abschnitten. a)
Eingabe der Einzelwerte beider Meßreihen und Bildung folgender '
Summen:
ZX2 '
'
n
< " 2 '
Berechnung der Kenndaten
c)
2 2 Berechnung der Testgröße F = s /s 2 2 F = s /s
wenn
s
^> s
ist
ei
n
'
b)
l
,
l
, s , s , n. und n_ £
l
= n
- l
l
falls s . > s
^
bzw.
( i m letzten Fall gilt
für die zugehörigen Freiheitsgrade: f f
2
! ! ) . Test-Entscheidung
= n„ - l und
dann nach den auf
S.392 angegebenen Kriterien.
d)
Je nach Ausgang des F-Tests Berechnung der Prüfgröße TAU und des Freiheitsgrades f
über Rechengang A
(Gleichungen 263-265) bzw. Rechengang B (Gleichungen 266+267). Die Test-Entscheidung muß dann über die Integration der Verteilung bzw. die Berechnung der t-Werte
erfolgjen.
t-
17-5-2 Programm Nr.30
Rechenprogramm zum t-Test
Vergleich zweier M i t t e l w e r t e (t-Test) Rechnermodell: Compucorp 327
Speicherbelegung:
R C L1
0
1
--
F f
l
TAU f S
S
Das Programm ist
so a u s g e l e g t ,
welche der beiden Streuungen s
? /n l
2/n2
daß automatisch g e p r ü f t w i r d , und s
größer
ist.
439
44ο
17« Statistische Testverfahren
Schritt-Nr.
Befehle
1
0
2
STO 01
3 4 5 6 7 8 9 10 11 12 13
STO 02
14
Erl uterungen "
L schen der Register f r Bildung von Σχι '
STO 03 STO 04
η
ι
1
·Σ"χο
'
^—
έ.
Σχί »
Σχι
'
""-
die
und
ώ
£i
LABEL 1
1.1
Ausgabe von i.l
RCL + 03 KENNZAHL STOP
i = lfd. Nr. des einzugeben-< den Wertes der 1. Me reihe Eingabe x . der 1. Me reihe
STO + 0 1 x2 STO + 02 1
als Kennzahl
x
2
ΣχΙ
JUMP 1
19
LABEL 2
20
1.2
21
RCL + 06
22
KENNZAHL
den W e r t e s der 2. Me reihe
23
STOP
Eingabe x.
24
STO + 04 x2
1 n : = n
+ 1
STO + 03
27
STO + 05 1
28
STO + 06
29
JUMP 2
26
o
STO 05 STO 06
15 16 17 18
25
n
Ende des Eingabeteils
R cksprung nach LABEL 1
- Ausgabe von i. 2 als Kennzahl
i = lfd. Nr. des einzugeben-
x
1
n
der 2. Me reihe
2
2 : = "2
+ 1
R cksprung nach LABEL 2
17-5-2
Rechenprogramm zum t-Test
Fortsetzung von Programm N r . 3 0 Vergleich zweier M i t t e l w e r t e Schritt-Nr.
Befehle
30
LABEL 3
31
RCL 01
32
RCL : 03
33
STO 07
34 35
RCL : 06
36
STO 08
37 38 39 40
RCL 02
-^—
> STO 07
*^
v errn rt Q
ΓΓ 2
n
v 2 Zxl ~
2
1 n
, τ-x , 2 2. i>
(
RCL 01 2 X
4l
RCL : 03 :
43 44
( RCL 03
45 46
-
47 48
)
n
i ~ *
1 =
49 50
-T"
51 52 53 54
RCL 05
55 56
RCL : 06
59 60 6l
Xj =
RCL 04
42
57 58
Erl uterungen
s1
» STO 09
STO 09 y 2
1
ZX2
n
RCL 04 2 X
: ( RCL 06 1 )
"2 -
1
2
,y ^
,2 X2
441
442
17. Stattistische
Testverfahren
Fortsetzung von Programm Nr.30 Vergleich zweier M i t t e l w e r t e Schritt-Nr. 62
63 64 65 66 67
Erl uterungen
Befehle
= s
—> STO 10
STO 10
~| Berechnung von s
RCL 09 RCL - 10
s
JUMP - 4
dann ist
- s
- s . Wenn
kleiner als Null auch s
< s
ist,
. In
diesem Fall Sprung nach LABEL 4. Tritt die Bedingung nicht ein (s
> s 2 ) , dann weiter mit
Schritt 68
68 69 70
RCL 09 RCL 2
: 10
7l 72
STO
11
RCL 03 1
75 76
STO 12
77
RCL 06
80 8l
82 83 ^-* J 84
ψ
X
73 74
78 79
2 l 2· —»STO 11
s
F =
f
= n
-
1
» STO 12
= * f 2 = n2 -
1 —> STO 13
1 =
STO 13
1 1
JUMP 5 LABEL 4 RCL Ρ Γ ΤJ_< x\v^
··
2
86
X
87
STO
2
1
10 OQ \J y
S
T?
s
11
2
i
-
Λ °ΤΠ
11
17-5.2
Rechenprogramm zum t-Test
Fortsetzung von Programm Nr.30 Vergleich zweier M i t t e l w e r t e Schritt-Nr.
Befehle
88
RCL 06
89
-
90 91 92 93 94 95 96 97 98
1
Erläuterungen
f 1 = n2 - 1
» STO 12
f
> STO 13
STO 12 RCL 03 1
= n
-
1
=
STO 13 LABEL 5
Berechnung der Prüfgrößen TAU und der
Freiheitsgrade f
Rechengang A
RCL 07
99 100
RCL - 08
101
x-ABSOLUT
102
STO 14
103
RCL O3
4 105 106
1
RCL 09 2
109
+
X
110
(
111
RCL 06 , .,·, s
S
und
fi
= n 2 -l = 8 - 1 = 7
l
sowie f
= n -l
= 8 - 1 = 7 .
Die Integration der F-Verteilung l i e f e r t dann S = 6 5 , 0 %. Damit ist
der Unterschied zwischen s
den t-Test ist
und s
rein z u f ä l l i g . Für
also Rechengang A anzuwenden.
Da hier nur g e p r ü f t werden soll, ob
nur zufällig oder
auf Grund irgendeines systematischen Einflusses ist,
größer
als
liegt hier ein Problem mit einseitiger Fragestellung
vor.
Die Anwendung der Gleichungen 263-265 l i e f e r t zunächst: TAU = 4 , 0 3
und f = 14 .
Daraus ergibt sich bei Anwendung von Programm Nr.18 für Fläche unter der
die
t-Verteilung zwischen -TAU und +TAU: 5=99,88%.
l?. Statistische Testverfahren Nach G1.268 gilt für die statistische Sicherheit der Bedingung systematisch größer als
:
S(einseitig) = 50 +
99
Damit ist
^88
= 9 9 , 9 4 %.
eindeutig nachgewiesen, daß der Wassergehalt der
Charge 2 im M i t t e l größer als der Gehalt der Charge l
17«5»5
ist.
Stichprobenumfang beim Vergleich zweier Mittelwerte
Mit Hilfe des t-Tests ist
es - wie bereits erwähnt - mög-
lich, den Einfluß von Parametern auf eine Meßgröße festzustellen. Will man z.B. prüfen, ob die Schwingungsdauer eines Pendels abhängig ist
von dem geographischen O r t , an dem der
Versuch durchgeführt wird (unterschiedlicher Einfluß der Erdbeschleunigung) , dann geht man folgendermaßen vor: An zwei möglichst weit auseinander
liegenden Orten wird die Schwingungs-
dauer jeweils mehrmals gemessen. Mit den so erhaltenen zwei Reihen von E i n z e l w e r t e n führt man zunächst den F-Test
durch.
Dieser wird vermutlich so a u s f a l l e n , daß ein Unterschied in den Streuungen der beiden Meßreihen nicht nachweisbar ist. Man kann den t-Test nach Student (Rechengang A, Gleichungen 263 -265) anwenden. Zeigt sich, daß die beiden Mittelwerte
und
x» sich systematisch unterscheiden, dann liegt irgendein Einfluß vor, der b e w i r k t , daß die Meßwerte der einen Meßreihe systematisch größer bzw. kleiner als die Werte der anderen Reihe sind. Dieser E i n f l u ß könnte z.B. die an verschiedenen Orten tatsächlich unterschiedliche Erdbeschleunigung sein. Da aber andererseits dieser Unterschied zwar meßbar, jedoch nur relativ gering sein d ü r f t e , werden sich wahrscheinlich die beiden M i t t e l w e r t e scheiden.
und
ebenfalls nur wenig unter-
Da man die Streuung des "Meßverfahrens" als bekannt
voraussetzen kann, ergibt sich daher folgende Frage: Wieviele Einzelwerte muß jede Meßreihe aufweisen, damit
17.5-3
Stichprobenumfang beim M i t t e l w e r t - V e r g l e i c h
455
ein gegebener Unterschied|
STO + 8
JZ(^/x ± ) 2
X
1
n:
= n + 1
STO + 0 35 36
37 38 39 40 4l 42 43 44 45 46 47 48 49 50 51 52 53 55 56 57 58 59
JUMP 0 LABEL 1 RCL 1 RCL : 0
R cksprung nach LABEL 0
1 -
A
ι
n
y-_-
£- A
RCL : 0
Ausgabe x.A — 1 V X B n 2. XB
STOP
Ausgabe χπ
STOP RCL 2
RCL 1 RCL - 2
I X A ' XB|
RCL : 0
x-ABSOLUT : ( RCL 8
Σ(Λ*^2
RCL 7 2 X
"[Ζ(ζ/ν]2Λ
RCL : 0 : RCL 0 n - 1 1 ) =
17.7
467
Differenzen-t-Test
Fortsetzung von Programm Nr.32 Differenzen-t-Test Erläuterungen
Befehle
Schritt-Nr. 60
f-
6l
)
62
=
63 64
X
RCL 0
65 66
•T"
67 68
STOP
1 Vi^1 J TAU
=
RCL 0
69 70
-
71 72
=
Ausgabe TAU ~l
f = n - 1
1
STOP
J
Ausgabe f
Beispiel 39 Mit einem Pflanzenschutzmittel behandelte Baumwolle soll auf Rückstände u n t e r s u c h t werden. Da die Analysen aus Zeitgründen nicht sofort nach Erhalt der Probe vorgenommen werden können, soll untersucht w e r d e n , ob die Lagerung bei N o r m a l t e m p e r a t u r bzw.
bei
-20
C einen unterschiedlichen E i n f l u ß auf das Ana-
lysenergebnis hat. Dazu werden 8 erhaltene Proben jeweils halbiert und 8 Teilproben bei Normaltemperatur gelagert (Gruppe A ) sowie die anderen 8 Teilproben bei -20°C
(Gruppe B). N a c h
ei-
ner b e s t i m m t e n Zeit werden die Analysen durchgeführt und lief e r n folgende Ergebnisse ( m g / k g ) ;
X
A1 =
= 0,15 = o,6o A4
X
X
B1=
= 0,14 = 0,85 = 0,30
x A6 = o , o 7= o , 5 i x A8 = 0,19
B5= °' 4 0 x ß6 = 0 , 5 3 X B? = 0 , 5 1 XoO= °, 6 Z l
468
17. Statistische Testverfahren
Programmablauf: a)
|JUMP| ISTARl
7
.. l
b)
Eingabe χ
= O,40
0.4000 /
L.2 =0,45
Eingabe
7 0.4500 /
fcTARTl !.l
=0,15
Eingabe
0.1500
ISTARTJ
7
!.2
= 0,14
Eingabe
0.1400
/
ISTARTl usw. bis alle 8 Wertepaare eingegeben sind.
c) IJUMPI | i | |START| Ausgabe
χ
Ausgabe
χB
Ausgabe
TAU
L
0.318? / 0.4773
/
2.8995
/
[START] Ausgabe
f
L
7.0000
17.7 Durch Integration der
Differenzen-t-Test
469
t-Verteilung (Programm Nr.18) mit f = 7
und t = TAU = 2,8993 erhält man für die Fläche unter der Verteilung zwischen -TAU
und +TAU: S = 9 7 , 7 % . Damit ist
tein
Unterschied zwischen den Mittelwerten der beiden Gruppen immerhin wahrscheinlich,
obwohl die Streuungen der Einzelwerte
innerhalb der beiden Meßreihen wesentlich D i f f e r e n z der beiden Mittelwerte
-
größer sind als
die
= 0,1588.
Führt man nun mit den gleichen Meßreihen einen "normalen" t-Test durch, so erhält man mit H i l f e des Rechengangs A im Programm Nr.30: TAU = 1,5707. Die Integration der t-Verteilung mit
f = nA + n ß - 2 = 14
und t
= TAU = 1,5707 liefert dann:
S = 86,14%. Ein Unterschied der M i t t e l w e r t e
A
und
D
ist al-
so über den "normalen" t-Test aus den gegebenen Daten statistisch nicht nachweisbar. Das Ergebnis lautet demnach, daß die unterschiedliche Lagerung der Analysenproben bei Normaltemperatur und bei
-20 C
wahrscheinlich einen Einfluß auf den Gehalt hat. Denkbar wäre z.B.
( d a der mittlere Gehalt bei Gruppe A kleiner als
bei
Gruppe B i s t ) , daß die Lagerung bei Normaltemperatur zu einer teilweisen Zersetzung der Substanz führt.
17.8
-Test (Attributive Prüfung) Die Anwendbarkeit des t-Tests nach Student bzw. des D i f f e -
renzen- t-Tests ist
- neben anderen bereits dargelegten Voraus-
setzungen - an die Bedingung geknüpft, Größe
daß die
eine Variable darstellt. Dies b e d e u t e t ,
untersuchte daß der Meß-
wert innerhalb bestimmter durch die Theorie bzw. Praxis vorgegebenen Schranken theoretisch jeden beliebigen Wert annehmen kann, insbesondere
also gebrochene Zahlenwerte.
Sehr oft t r i t t aber das Problem a u f , daß das Ergebnis
ei-
ner Messung nur eine Ja-Nein-Entscheidung ausgedrückt werden kann. Das Ergebnis kann also nicht jeden beliebigen Wert annehmen, sondern nur zwei "Werte", etwa die Alternative Nein.
Ja-
17- Statistische
Testverfahren
Beispiele a) Sterben Insekten nach Behandlung mit einem Insektizid ? b) Tritt bei der Anwendung eines blutdrucksenkenden Mittels bei Patienten eine Wirkung ein ?
u. a.m. *7
Es sei
p = ——— die
Wahrscheinlichkeit d a f ü r , daß von N zu
untersuchenden O b j e k t e n Z O b j e k t e ein bestimmtes Merkmal
zei-
gen. Auf die obigen Beispiele bezogen bedeutet dies: a)
Von N mit einem Insektizid behandelten Insekten sterben nach einer bestimmten Zeit genau Z Tiere.
b)
Von N P a t i e n t e n , die zeigt sich bei
ein Medikament eingenommen haben,
genau Z Personen eine Wirkung. Bei den an-
deren ( N - Z ) Patienten ist
das Medikament wirkungslos.
Untersucht man nun 2 Gruppen im Sinne der o.g. so daß also die
I.Gruppe Z
1
von N
1
und die
Beispiele,
2. Gruppe Z 0 von N £
£t
O b j e k t e n mit entsprechender Wirkung a u f w e i s t , dann wird es meist so sein, daß sich die Anteile Z . /N
und Z /N
unterschei-
den. Frage: Sind die Unterschiede der beiden relativen Anteile p =Z /N
und p 2 =Z 2 /N„ nur z u f ä l l i g ,
oder ist
eine
sys-
tematische Beeinflussung die Ursache für den Unterschied ? Dem dargestellten Problem liegt die Binotnialver t eilung zugrunde. Der interessierte Leser kann sich hierüber
ausführ-
lich in dem Buch "Angewandte Statistik" von Lothar Sachs ( k ). informieren.
Man kann diese Binomialverteilung
für das be-
handelte Problem dann durch eine Normalverteilung annähern, wenn die
von Gottschalk ( 3
) genannten folgenden Bedingungen
e r f ü l l t sind:
9
(273)
17· 8
-Test für attributive Prüfung
Zur Entscheidung, ob vorhandene Unterschiede zwischen p p
zufällig oder systematisch bedingt sind, ist
Prüfgröße
A=
und
die f o l g e n d e
. zu bilden:
'
P l 1
~ P2 _ 2' S d
(274)
Dabei gelten folgende Beziehungen:
P
fl l~ N j
(275)
(276)
P=
(277)
q 1 2 = l - P 12
(278) N +N
S
d =
P - 1
(279)
-
Nach Umformung ergibt sich dann für die Prüfgröße
(N N
1N2
(Z
Zur Test-Entscheidung schen - A. und dafür,
2Z1-N1Z2)2
1+Z2) integriert man die Normalverteilung zwi-
+ A. . Man erhält direkt die
Wahrscheinlichkeit
daß sich die beiden Wahrscheinlichkeiten
p. und p
sys-
tematisch unterscheiden und ihre D i f f e r e n z n i c h t nur z u f ä l l i g bedingt ist.
Zur Integration der Normalverteilung können die
Programme Nr.12 bzw. Nr.13 angewandt werden. Treffen die
in G1.273 genannten Bedingungen nicht zu, dann
muß auf den exakten Test von Fisher für
den Vergleich der
Wahr-
472
17. Statistische Testverfahren
scheinlichkeiten zweier Binomialverteilungen auf Grund kleiner Stichprobenumfänge zurückgegriffen werden ( 4 ).
Beispiel 40 An einem Stamm von Trogoderma granarium (Khaprakäfer) werden 2 verschiedene Insektenvernichtungsmittel a und h hinsichtlich ihrer Wirkung überprüft. Einwirkungszeit sowie Temperatur waren bei beiden Mitteln gleich. Dabei wurden folgende Ergebnisse erhalten:
Z = Zahl der benen Tiere
N = Zahl der eingesetzten Tiere
gestor-
Mittel a
28? = N t
59 = Z 1
Mittel b
493 = N 2
127 = Z 2
Für die Mortalitätsraten folgt damit: pa = P j = Z 1 /N 1 = 59/287 = 0,2056 Pb = P 2 = Z 2 /N 2 = 127/493 = 0,2576 Durch Einsetzen der Werte für Z 1 , N 1 , / 2 und N g in G1.280 erhält man A = 1,6445. Das Programm Nr. 12 liefert dann für die unter der Gauß-Verteilung zwischen S = 89,993%. Nach den auf S. 359 f.
. und +
Fläche
den Wert
angegebenen allgemeinen
Kriterien für die Beurteilung von Hyptothesentests ist tematischer Unterschied zwischen den Werten p
und p
ein
sys-
aus den
gegebenen Daten nicht nachweisbar. Eine unterschiedliche Wirkung der beiden angewandten Mittel kann somit nicht nachgewiesen werden. Die Voraussetzungen für die Durchführung des Tests nach G1.273 sind übrigens e r f ü l l t , wie man sich durch Einsetzen der W e r t e von N
M i t t e l a:
l
bzw. N 0 überzeugen kann: Ä
= 0,03
Z x i- d k = Ο
= -
2
0
>
δ-ι
Allgemein erh lt y = a
48l
.x - d
=
x - d
= 0
man f r ein Polynom N - t e n Grades, also f r
+ a χ + aox
2
+
···
f r
+
a
NX
J = °
N die
bis
Bez enun
i
J =N
S en:
(283)
N Durch Einsetzen von y. - f ( χ . ) = y. - (a + a χ + ... + a x ) J i i i l N f r d ergeben sich schlie l i c h die f o l g e n d e n Beziehungen: K.
482
18.
Korrelations- und Regressionsrechnung
Σ < y± -
a 0
- aix -
:N) = 0
(284)
;N) = 0
(285)
i\ \ -^ - a Ar x; N ) = = 0 0 N
(286)
- a x - a x - . . . - a x ) =0
(28?)
2/ 2 {.( Jy. - a - a.x - a„x - ... i i o 1 2
J~x ( y
-a
Daraus resultiert nach Ausklammern und Weglassen der Indizes der
4. Schritt:
A u f s t e l l e n der Bestimmungsgleichungen zur Ermittlung der Konstanten a
a
o
+ +
. n
Γχ1
Q 2_x
r- 2 a o 2_x
y- N
( ^_x
Man erkennt, da Funktion y = a
bis
2 x ++ aa Z Γχ a
+
a
V 3
!2.x
3 X 2^-Γχ
++
aa
+
a
r- N+l + a 1 ^x +
V ^
2-£ X
++
aA
++ aa N
··· '··
"""
Ν
x Γχ 2.
++a
Ν+1 3 J γ 5~χ Na N*-^
+
N •^-X
a
T"
-- 2.T
-κ."χ y V
1
— ^ ΤΓ
V
N+2
r-N+2 r-2N a 2 ^_x + ... + a N ^x
r- N - Z.x 2
man f r ein Polynom N - t e n Grades, also f r die + a.x
+ a_x
+ ...
+ a χ
mungsgleichungen f r die Konstanten a
bis
N-t-1 lineare Bestima
erh lt.
Die Sum-
men stellen dabei die K o e f f i z i e n t e n des Gleichungssystems dar und sind aus den gegebenen n Datenpaaren x/y zu bilden. F r Polynom N - t e n Grades ben tigt man folgende Summen:
ein
18.2
Methode der kleinsten Fehlerquadrate
483
(288) Zweckm
igerweise bildet man im Rechner diese Summen in Kon-
stantenspeichern
ber die im Abschnitt 6 . 2 . 5 beschriebene Spei-
cherarithmetik. Man ben tigt dann f r ein Polynom N - t e n Grades f r die Summen selbst 3N+2 Speicherpl tze und 2 weitere Speicher als
"Hilfsspeicher", wenn man die Summenbildung
Programm vornimmt. Polynome 1. bis
In der folgenden
ber
ein
Zusammenstellung sind f r
3. Grades die zu bildenden Summen, die Anzahl
der Bestimmungsgleichungen zur Ermittlung der Konstanten a bis
a
des Polynoms sowie die Zahl der Konstantenspeicher-
Pl tze auf dem Rechner f r die Summenbildung gegen b e r g e s t e l l t . Tab.?6
Summenbildung bei der Summen
Polynom y = &Ο+Λ^Χ
bedarf
W2 , ^ W^ Λ.
YX-
2
5 (+2)
3
8 (+2)
4
11 ( + 2 )
n
k
y* y y ,y y x fc—
* ·
^"yx
+ a χ
Speicher-
Gleichungen
^>_X , ^ .
^_*
y = a + a.x y l 2
Zahl der
Σχ > Σχ * Z"y £yx ,
y = a + a.x ·* l 2
Fehlerquadratmethode
,
n
^χ,^χ 2 ,Γχ 3 r- Ί
r- 5
r- 6
r
y χ j" χ2
2_x , 2.x , 2. x
v- 3
^_yx ,
n
n = Anzahl der Datenpaare x/y
484
18. Korrelations- und Regressionsrechnung
Programm Nr.33
Summenbildung für
die Erstellung der
Bestimmungsgleichungen zur Ermittlung der Konstanten eines Polynoms 1. 3. Grades
Speicherbelegung:
bis
(Compucorp 327)
= = =
z*2 z*3 z*4 z*5 z*
X. l
Bei der Summenbildung in dem folgenden Programm wurde das Prinzip der "Multiplikation mit einem konstanten Faktor"
aus-
g e n u t z t , das im Abschnitt 5 . 2 . 6 , S.51 beschrieben ist. Außer2 Summe der y -Werte e r m i t t e l t ,
dem wird im Speicher 14 noch die
die man zur Berechnung des Korrelationskoeffizienten b e n ö t i g t . Das Programm ist
so ausgelegt, daß die Eingabe der x-Werte
durch eine l als Kennzahl (links in der A n z e i g e , ohne Nullen nach dem Komma) und die Eingabe
der y-Werte durch eine 2
Kennzahl angezeigt wird. Dadurch wird die Dateneingabe
als
etwas
übersichtlicher. Die Summen werden dann automatisch gebildet.
18.2
Schritt-Nr.
Befehle
Erl uterungen L schen der
1
CLEAR R E G .
2
LABEL 0
3 4
KENNZAHL
Ί
/l.
/
STOP
Eingabe x .
6
STO 11
x.
7 8
2
STO 11
1
(L
KENNZAHL
9 10
STOP
STO 12
y.
11
RCL 11
x.
12
STO + 01
13
x
14
—
15
STO + 02
Eingabe y .
STO 12
Zxi 2
x1 . x
Zi
3 x1
16
ΣχΙ
STO + 03
4
18
X.
1
19
STO + 04
20
=
21
STO + 05
22
—
23
STO + 06
24
RCL 11
χ
ΣΙ χ51
& 6
χ1 . 5χ6 -ι
χ.1.y .I N
25
x
26
RCL 12
27 28
STO + 07
Σ?ί
= STO + 08
χ . ·y . i i 5~x . . y .
29
Speicher
1
5
17
485
Methode der kleinsten Fehlerquadrate
J
j
1
Ι 1
l
1-14
486
18. Korrelations- und Regressionsrechnung Fortsetzung von Programm Nr.33 Summenbildung f r die Ermittlung der Konstanten eines Polynoms Schritt-Nr.
Befehle
Erl uterungen
30
2 χ. y.
31
STO + 09
χ
32
=
33
STO + 10
34
RCL 12
1
J
1
y
Σί i x 3 y. J 1
1
Σ*1 y± i
2
2 y i
35
X
36
STO + 14
37 38
1 STO 4-
39
JUMP 0
£Vi n: = n + 1
13
Je nachdem, ob man ein Polynom 1. Grades ( G e r a d e ) oder Polynom 2. oder 3. Grades sind die entsprechenden
ein
den gegebenen Daten anpassen will,
Summen den b e t r e f f e n d e n
Konstanten-
speichern zu entnehmen. Zu dem Programm ist χ, χ , χ , χ , χ , χ
noch zu bemerken, da
die Ausdr cke
usw. bzw. die entsprechenden Summen ohne
Zuhilfenahme der Potenz-Taste |a |gebildet worden sind. Dies war durch die sowohl Rechenzeit als
auch Programmspeicherplatz
sparende Methode der Multiplikation mit einem konstanten Faktor
5.
m glich.
Schritt: L sung des linearen Gleichungssystems
Die L sung des linearen Gleichungssystems kann nach einem der bekannten Verfahren zur Aufl sung von Gleichungen mit mehreren
18.2
Methode der kleinsten Fehlerquadrate
Unbekannten durchgeführt werden. Insbesondere G a u ß ' s c h e Eliminationsverfahren genannt (
48?
sei hier das
l ).
Auf eine Darstellung des vom Speicherplatzbedarf
und vom
Rechengang her ziemlich aufwendigen Verfahrens soll hier
ver-
z i c h t e t u n d einerseits a u f d i e Spezialliteratur ( 2 , 3 ) s o wie auf f e r t i g e Rechenprogramme von den H e r s t e l l e r n der Geräte verwiesen werden. Da die m e i s t e n Probleme aus der Korrelations- und Regressionsrechnung - eventuell nach Transformation der gegebenen Daten - mit einem Polynom I.Grades ( G e r a d e ) , einer quadratischen Parabel (Polynom 2 . G r a d e s ) oder einem Modell 3.Ordnung (Kubische Parabel)
gelöst werden können, sollen hier nur die
Auflösungen der entsprechenden Gleichungssysteme zur E r m i t t l u n g der Konstanten a , a.
( G e r a d e ) ; a , a., und a
r a b e l ) bzw. a , a . , a O
und a
l
j
(Quadratische Pa-
( K u b i s c h e Parabel)
genannt wer-
den.
Formeln zur Berechnung der Konstanten der polynomen Ausgleichsfunktionen a)
Gerade y = a
a
a
b)
i =
o
=
+ a
!·*2
n
"l , r- J
0,34
0,63 0,03 0,40 0,05
392,9 417,9 434,0 444,4 455,8
0,21 0,11
0,15
der berechneten y-Werte von den gegebenen y-
W e r t e n sind r e l a t i v gering. Eine B e u r t e i l u n g , ob sich die gegebenen Daten dem Funktionsmodell "gut" oder "schlecht" anp a s s e n , ist
aber in jedem Fall s u b j e k t i v .
Wenn das Funktionsmodell n i c h t von vornherein bekannt
ge-
wesen w ä r e , würde sich die Frage stellen, ob man einen funktionellen Zusammenhang zwischen dem Siedepunkt y und dem Druck
in der e r m i t t e l t e n Form als
"gesichert" ansehen kann,
oder ob der Zusammenhang in Form des angenommenen M o d e l l s aus den vorliegenden Daten "nicht nachweisbar" ist.
Dies würde be-
sonders dann schwierig w e r d e n , wenn die A b w e i c h u n g e n der "Meßpunkte" von der Ausgleichskurve w e s e n t l i c h
größer w ä r e n .
Ist
eine durchschnittliche Abweichung von 0 , 1 % oder von 5% noch als
"tragbar" anzusehen? Eine wirklich o b j e k t i v e
ist
durch eine willkürliche F e s t l e g u n g sicher nicht m ö g l i c h .
Beurteilung
Außerdem dürfte es auch von der Problemstellung a b h ä n g e n , wann man einen Zusammenhang in der angenommenen Form als
gesichert
und wann als n i c h t nachweisbar a n s i e h t . Als ein o b j e k t i v e r Maßstab dient der im nächsten behandelte K o r r e l a t i o n s k o e f f i z i e n t .
Abschnitt
l8. Korrelations- und Regressionsrechnung
18.3 Der Korrelationskoeffizient Mit der Ermittlung der Konstanten a Q , a.^
... usw. eines
Polynoms, das einer gegebenen Anzahl von Wertepaaren x/y angepaßt werden soll, ist
das Problem der Regressionsrechnung
gelöst. Bei der Korrelationsrechnung ist
es das Z i e l , überhaupt
erst einmal f e s t z u s t e l l e n , ob ein Zusammenhang zwischen den Größen
und y im Sinne einer angenommenen Modell-Funktion
rechtfertigt ist.
Dafür ist
o b j e k t i v e s Maß. Er ist
der Korrelationskoeffizient r ein
wie f o l g t
definiert:
Varianz der berechneten y-Werte Varianz der gegebenen y-Werte
Varianz = Quadrat der
ge-
(^22)
Standardabweichung
(323)
Dabei gilt:
,A -2 (y - y) J -
y = berechnet
(324)
- l
y = gegeben
n - l
(325)
18.3 Es l
Der K o r r e l a t i o n s k o e f f i z i e n t
t sich m a t h e m a t i s c h z e i g e n , da
495
nach der Methode der
kleinsten Fehlerquadrate, dem die obige D e f i n i t i o n des Korrelationskoeffizienten
zugrunde l i e g t , der M i t t e l w e r t der gege-
benen gleich dem M i t t e l w e r t der b e r e c h n e t e n y-Werte ist. kann in den Gleichungen 32^1 und 325 bei rianzen einheitlich
Daher
der Berechnung der Va-
y , d.h. das M i t t e l der gegebenen y-Werte
verwendet werden. Dies hat den V o r t e i l , da
man den Korrela-
t i o n s k o e f f i z i e n t e n r nur aus den gegebenen Daten und den nach der Methode der Fehlerquadrate e r m i t t e l t e n Konstanten des Ausgleichspolynoms berechnen kann. Das arithmetische M i t t e l der berechneten y-Werte wird dazu nicht ben tigt. Der K o r r e l a t i o n s k o e f f i z i e n t r, der die G te der Anpassung 2 N eines Polynoms y = a + a χ + a _ x + ... + a χ an die gegeben e n M e punkte P ( x / y ) , P ( x / y ) , J . J . - L c-, ε» ει kann b e r e c h n e t werden nach:
/ I
k=n
y) n ( *-
0 ^ r ^ 1
Ist
r = l,
dann ist
die Korrelation p e r f e k t ,
d . h . die angenom-
mene Funktion kann exakt den gegebenen n Datenpunkten angepa t werden. Ist
dagegen r = 0,
so kann ein Zusammenhang der
x- und y-Werte im Sinne der Modellfunktion aus dem gegebenem Datenmaterial nicht nachgewiesen werden. Die Korrelation daher umso besser,
r =
l
:
je n her r bei dem Wert l
ist
liegt.
P e r f e k t e Korrelation zwischen χ und y im Sinne der angenommenen Funktion
r =
0 :
Der Zusammenhang zwischen χ und y l
t sich
durch die angenommene Funktion nicht beschrei-
ben.
18. Korrelations- und Regressionsrechnung Für Polynome 1. bis
3- Grades gelten folgende Formeln zur Be-
rechnung des K o r r e l a t i o n s k o e f f i z i e n t e n :
Polynom
Korrelationskoeffizient
y = ao+
:32?) yJ = a +
Iy2 - ± < (328)
yJ = a + a.x o l
a_x
Liegen die gegebenen Punkte P 1 ( x 1 / y 1 ) , P 2 ( x 2 / y 2 ) exakt auf der Ausgleichskurve, dann ist
...
p
n(
x
n /y n )
die Korrelation im
Sinne des vorgegebenen Funktionsmodells p e r f e k t . Das b e d e u t e t , daß die Streuung der berechneten W e r t e mit der Standardabweichung der vorgegebenen W e r t e identisch ist. natürlich für die Quadrate der Streuungen,
Das gleiche gilt d . h . die nach Gl.
324 bzw. G1.325 berechneten V a r i a n z e n . Daraus f o l g t dann a u c h ,
18.3
Der K o r r e l a t i o n s k o e f f i z i e n t
daß, wie erwähnt, bei strenger Korrelation r den Wert l Eine Beurteilung von r d ü r f t e zwar nicht exakt gleich l ist,
hat.
auch dann einfach sein, wenn r aber diesem W e r t sehr nahe
kommt, also z.B. r = 0 , 9 9 oder r = 0 , 9 9 9 . Schwierig wird die Beurteilung dann, wenn r w e s e n t l i c h kleiner als
l ist.
Es ist
die F r a g e , wie klein r werden d a r f , um trotzdem von einer
"ge-
sicherten" Korrelation" im Sinne der Ausgleichsfunktion sprechen zu können. Um auch hier eine objektive Entscheidung t r e f fen zu können, bildet man die folgende P r ü f g r o ß e :
l TAU = ~\l[n - ( N + l ) j
Dabei ist
l - r
(330)
2
N der Grad des Polynoms,bzw. N + l ist
die
Anzahl der
zu bestimmenden Konstanten der A u s g l e i c h s f u n k t i o n ( G e r a d e : N = l i Quadratische Parabel: N = 2, Kubische P a r a b e l : N = 3 ) . Der Wert n gleich der Anzahl der Meßwertpaare x/y,
ist
aus denen mit H i l f e der
G a u ß ' s e h e n Fehlerquadratmethode die Konstanten der
Ausgleichs-
funktion e r m i t t e l t wurden. Die Testgröße TAU vergleicht man bei f = n - (N+ 1) Freiheitsgraden mit den Schranken der Verteilung
für
t-
S=95%, S=99% und 5 = 9 9 , 9 % . Oder man integriert
die t-Verteilung zwischen -TAU und +TAU . Für die
Entscheidung
gelten dann die in Tab. 77 zusammengefaßten K r i t e r i e n . Die o.g.
Beziehung für die Prüfgröße TAU z e i g t , daß für
einen gegebenen r-Wert die
Größe TAU mit wachsendem n zunimmt.
Da aber hohe TAU-Werte eine hohe statistische Sicherheit bedeuten,
läßt sich eine Korrelation zwischen
und y ( w i e d e r im
Sinne der angenommenen M o d e l l f u n k t i o n ) um so sicherer nachweisen,
je mehr Meßpunkte vorliegen. Dies ist
sehen. Liegen z.B.
auch leicht einzu-
3 Meßpunkte z u f ä l l i g auf einer Geraden, dann
ist die W a h r s c h e i n l i c h k e i t , daß und y t a t s ä c h l i c h linear korreliert sind, w e s e n t l i c h g e r i n g e r , als wenn z.B. 10 Meßpunkte mehr oder weniger exakt durch eine Gerade miteinander
verbun-
den werden können. Die Integration der t - V e r t e i l u n g l i e f e r t übrigens direkt
18. Korrelations- und Regressionsrechnung die Wahrscheinlichkeit
dafür,
daß die Größen
und y im Sinne
der Ausgleichsfunktion korreliert sind.
Tab.77
Kriterien für die Beurteilung des Korrelationsk o e f f i z i e n t e n r über die Prüfgröße TAU
T A U < t ( 9 5 % , f ) bzw.
Keine Korrelation im
S(TAU,f) 99,9%
gleichsfunktion
ist
statistisch stark gesichert bzw. hochsignifikant.
Beispiel 43 Für die Bestimmung des Siedepunktes von Schwefel in Abhängigkeit vom Druck wurden im Beispiel k2 die Konstanten für den funktionalen Zusammenhang zwischen dem Siedepunkt y und dem Druck
berechnet.
Zwischen dem Druck und dem Siedepunkt wurde
18.3 die
Beziehung
y = a
Der
+ a. x +
a
Korrelationskoeffizient ox
a
499
^ s gültig angenommen, und
es war Aufgabe der Regressionsrechnung, die Konstanten a , a. und a„ zu berechnen. Wenn die o . g . Beziehung aber nicht sicher ist,
d . h . nicht bekannt ist, ob der Zusammenhang zwischen y
und
tatsächlich durch eine Parabel beschrieben werden kann,
dann ist
es m ö g l i c h , durch Berechnung des K o r r e l a t i o n s k o e f f i -
zienten r diese Behauptung zu ü b e r p r ü f e n . Die n a c h G1.328 für die Berechnung von r nötigen Größen lauten: a o = 347,7529977 a t = 0,165585251 a, = -0,000050644
U
Z y x } = 1325023j392
k=0
JV
= 3243,4
£V2 = 1325034,0 l ( ^ " y ) 2 = 1314955,445 n
£Vx = 1486724,0
Jyx2 = 968688240,0
** " £ ^
^- 100 7 8,555
Durch Einsetzen in G1.328 erhält man:
- \ / 1 3 2 5 0 2 3 , 3 9 2 - 1314955,445 _ -W 10078,555 " Die Anwendung von G1.330 mit
Q u
'
n = 8 und N = 2 e r g i b t dann:
TAU = " \ / 8 - ( 2 + l ) ] -( 0 ^ 9 9 9 5 ) 2 W l - (0,9995)2
= 68,6
Die Integration der t-Verteilung (Programm N r . l S ) l i e f e r t mit f = n - ( N + l ) = 5:
S = 99,999999%.
Damit ist
der Zusammen-
hang zwischen Siedepunkt y und Druck durch die Beziehung 2 + a + a„x statistisch hochsignifikant gesichert.
y = a
Hierbei ist
allerdings zu b e a c h t e n , daß diese F e s t s t e l l u n g
500
l8.
nur für Ob ein
Korrelations-
und Regressionsrechnung
den mathematischen Zusammenhang zwischen physikalisch
und y gilt.
begründeter Zusammenhang in der
nen Form g e r e c h t f e r t i g t
ist,
angenomme-
kann aus der Korrelationsrechnung
nicht ersehen werden!
3 Punkte zur Bedeutung des 1.
Korrelationskoeffizienten
Der K o r r e l a t i o n s k o e f f i z i e n t
nur ein
Maß für
z.B. für
r
sowie die Testgröße TAU sind
den angenommenen Funktionstyp. Vermutet man
eine Reihe von Meßpunkten einen linearen Zusammenhang
zwischen
und y,
dann kann aus einem r-Wert nahe Null b z w . aus
einem TAU-Wert < t ( 9 5 % , f ) nur geschlossen w e r d e n , daß kein linearer Zusammenhang zwischen nicht,
und y b e s t e h t . Dies heißt aber
daß es gar keine Beziehung zwischen
und y gibt! Viel-
mehr kann nach anderen Funktionstypen durchaus eine Korrelation b e s t e h e n . F a l l s also T A U < t ( 9 5 % , f )
strenge
bzw. S % ( T A U , f )
< 9 5 % g i l t ) dann kann für das Beispiel der linearen Beziehung nur gesagt werden: Eine lineare Korrelation zwischen den Meßwerten y und den Variablen
kann aus den gegebenen Daten
sta-
t i s t i s c h nicht nachgewiesen werden. Als extremes Beispiel kann der Fall d i e n e n , wenn die Meß2 einer quadratischen Parabel (y = a + a + a x )
punkte auf
liegen. Berechnet man für
die in A b b . ^ 3 dargestellten Meßpunk-
te einmal den K o r r e l a t i o n s k o e f f i z i e n t ( G 1 . 3 2 7 ) und zum anderen für
für
das Geradenmodell
das Modell der Parabel
(G1.328),
dann e r h ä l t man: r
(Gerade)
= 0
und
r(Parabel) = l
.
Im allgemeinen werden die Verhältnisse nicht so extrem liegen, man sollte aber den grundsätzlichen Aspekt b e a c h t e n .
2.
Selbst wenn eine strenge K o r r e l a t i o n nachgewiesen werden
kann,
ist
damit noch nicht g e s a g t , daß auch ein kausaler Zu-
18.3
Der K o r r e l a t i o n s k o e f f i z i e n t
501
r(linear)=0 r(Parabel)=1
0
Abb.45
x
Zur A b h ä n g i g k e i t des K o r r o l a t i o n s k o e f f i x i e r t e n vom Funktionsmodell
sammenhang zwischen
und y im Sinne der Modellfunktion
be-
steht (Ursache-Wirkungs-Beziehung). Man muß also die Möglichkeit einer Scheinkorrelation
berücksichtigen. Wenn daher ein
mathematischer Zusammenhang in der
angenommenen Form zwischen
und y nachgewiesen werden kann, b e d e u t e t dies noch n i c h t , daß dieser Zusammenhang auch t h e o r e t i s c h gesichert
ist.
Beispiel Im Jahre 19?6 wurde in Bergenhusen ( S c h l e s w i g - H o l s t e i n ) wohl eine Zunahme der Störche als tet.
so-
auch der G e b u r t e n beobach-
Obwohl hier vielleicht ein kausaler Zusammenhang wün-
schenswert wäre ( e i n f a c h e Methode der G e b u r t e n r e g e l u n g ! ) ,
ist
18. Korrelations- und Regressionsrechnung
502
die Korrelation natürlich nur rein mathematischer Natur. Ein echter Zusammenhang besteht natürlich nicht.
3.
Der Wert r sowie die
Prüfgroße TAU hängen auch von der An-
zahl der Meßwerte a b , aus der sie berechnet wurden. Dabei gilt: Bei gleichem r-Wert,
der aus 2 unterschiedlichen Meßreihen mit
unterschiedlicher Anzahl von Datenpaaren resultiert, ist Korrelation bei großem
-Wert s t a t i s t i s c h gesicherter.
Die Größe des K o r r e l a t i o n s k o e f f i z i e n t e n allein ist kein Maß für
die
die
"Stärke" des im Sinne der
noch
Ausgleichsfunktion
angenommenen Zusammenhangs!
Beispiel kk Um die Linearität eines gaschromatographischen Detektors zu überprüfen, Stoffes bis
wurden steigende Mengen eines charakteristischen
in Form einer Lösung i n j i z i e r t , und zwar 2 0 , ^ 0 , 6 0 . . . .
1000 ng. Die Abhängigkeit der Peakfläche von der dosierten
Menge ist
in Abb.'l'l wiedergegeben.
Peakfläche
100 Abb.kk
H 200 300
1 1 400 500
1600
700 800 900 1000
x(ng)
Abhängigkeit der Peakfläche von der Stoffmenge
18.3
Der K o r r e l a t i o n s k o e f f z i e n t
Im einzelnen ergaben sich folgende
x(ng) = X
2
=
x(ng)
Fläche
°
x3 =
60
1370
x^ =
80
1420
X
7748
x35 = 700
15635
6387
x g = 720
15047
46
°
7915
24 =
48
°
3065
x 4 l = 820
3219
X
8913 5812
x 43 = 860 x 44 = 880 x^5 = 900
14512
X
14477 18597
=
21 =
4
10726
42
10050
°° °
x 22 = 440 X
Fläche
23 =
20
X
= 100
x(ng)
x3? x 38 *39 x^0
X
1953 x6 = 120 1921 x = 140 2838 4514 Xg = 160 x9 = 180 3425 x = 200 3066 x = 22O 9812 x 1 2 = 240 3814 3668 x..,= 260 13 x l 4 = 280 5715 3333 X 15 = 3°° x 6 = 320 3378 *17= 340 5799 x
Meßwerte:
Fläche
x l 8 = 360 x19 = 380
330 550
20 4
x 25 x , x 2? x 28 x 29
= = = = =
500 520 540 560 580
x
=
600
3O x 31 = x 32 =
6393
6315
8010 9080
740 760 780 800
13538 10938
8751 13145
16510
84
42 =
°
92
46 =
8732
9438 8427
°
- = 940
12415
10228
x 49 = 980
8031
x
13633
nach A b b . 4 4 zu urteilen durch die
18912
=1000
-
-
und der Fläche y
Beziehung y = a
dergegeben werden. Um zu überprüfen, nearen Zusammenhangs zwischen
= 960
.
8071 10090
Der Zusammenhang zwischen der Menge
r und die
= = = =
* f
620 640
x 33 = 660 x k = 680
len die Konstanten a
503
ob die Annahme eines
und y g e r e c h t f e r t i g t ist,
wielisol-
und a, sowie der Korrelationskoeffizient l Größe TAU einmal aus den ersten 4 Meßpunkten ( x bis
o
) und zum anderen aus allen 50 Datenpaaren ( x
bis
x-«)
m i t t e l t werden. Dabei erhält man folgende W e r t e : Meßpunkte x
n = 4
f
bis
x.
= 2
Meßpunkte x..
n = 50
a Q = 1027,024
a 1 = 20,450
a
= 0 , 9 4 5 5 TAU = 4 , 0 1
S =94,5%
r
bis
X
50
f = 48
a Q = -105,000
r
könnte
+ a
!= 13,659 = 0 , 8 2 2 ; TAU =
S = 99,999999%
9,98
er-
504
18. Korrelations- und Regressionsrechnung
Ergebnis: Obwohl im ersten Fall (Berechnung aus den ersten 4 Datenpaaren) der Korrelationskoeffizient r größer ist, linearer Zusammenhang zwischen
und y
gewiesen werden, da S = 94,5% STO 20
] J Ausgabe /\ y. Ausgabe
y
+ /7 y.
Ausgabe
y
~/^ Yi.
STOP
RCL - 20
STOP JUMP 3
Rücksprung nach LABEL 3
bewußt sehr ausführlich gestaltet worden, um
bei Vorhandensein eines Rechners, der über mindestens 20 Konstantenspeicherplätze verfügt, eine umfassende Information über die errechnete
Ausgleichsgerade
zu geben.
18.5·2
Rechenprogramm zur linearen Korrelation
523
Besitzt der Rechner nicht - wie in dem Programm vorausgesetzt - mindestens 20 Konstantenspeicher, sind aber wenigstens 6 Speicherplätze vorhanden, dann kann man zumindest die die Berechnung von a, b, r, TAU, ^a, ^b ,
s s
und und
für
y
not-
wendigen Summen
5x.
,
yx.
,
yy . ,
· , ^.y-x-
2-.
und
n
ermitteln. Die Programmausführung für
das Programm N r . 3 4 wird in dem
folgenden Beispiel erläutert.
Beispiel 46 Die Wirkung eines Vitamin-Präparates auf das Wachstum eines bestimmten Bazillus-Typs soll näher untersucht werden. Es besteht die Annahme, daß das Wachstum direkt proportional der Menge des Vitamins ist.
Die Wachstumsrate wird durch "Titra-
tion" des verwendeten Nährbodens mit KOH e r m i t t e l t . Die verbrauchte Menge Kalilauge ist
dann ein Maß für die Zahl der Ba-
zillen in der untersuchten Kultur. Insgesamt wurden 11 Präparate mit Mengen zwischen 0 und -12 5 0 Picogramm Vitamin/ml angesetzt ( l Picogramm = 1 0 g ! ) . Die Menge an verbrauchter KOH wurde nach erfolgtem Wachstum bestimmt und ergab folgende W e r t e : Vitamin
Verbrauch KOH
(pg/ml) x
1
=
0
X
2 = 5 x, = 10 X
4 = 15
x5 = 20 X
6
= 25
(ml)
y^ y2 y3 y4 y5 y6
= 0,75 =2,31 = 2,07 =2,39 = 3,48 = 3,33
Vitamin
Verbrauch KOH
( pg/ml)
(ml) = ^,46
x-, = 30
y
X
y8 = 4 , 3 2
7
8 =
35
7
x 9 = ^0
y9 = 5 , 1 2
x 1 0 = 45
y10=5 , 5 6
x
y t l = 6,60
n=
50
524
18. Korrelations- und Regressionsrechnung
Trägt man die verbrauchte Menge KOH gegen die
eingesetzte Men-
ge an Vitamin a u f , so ergibt sich das in Abb. 50a dargestellte Bild:
t / m / KOH] 7·6 5 · -·
3 -· 2 -1 ··
10
20
(Picogramm Vitamin/ml], 50 x
30
Abb.5Oa Abhängigkeit der Menge an verbrauchter KOH von der eingesetzten Menge Vitamin
Folgende Fragen sollen beantwortet werden: 1.
Ist
Menge
die Annahme eines linearen Zusammenhangs zwischen der an eingesetztem Vitamin und und der verbrauchten Menge
y an KOH g e r e c h t f e r t i g t ? 2.
Wenn j a , wie lauten die Konstanten a und b der
funktion y = ax + b und wie groß ist
Ausgleichs-
der Vertr.auensbereich von
a bzw. b?
3.
Wie groß ist
die "Streuung der Ausgleichsgeraden"?
4.
Wie groß ist
der zu erwartende Verbrauch an KOH bei einem
P r ä p a r a t , das 2pg/ml b z w . 27pg/ml Vitamin enthält? 5.
Wie groß sind die Vertrauensbereiche der in 4. ermittelten
Werte?
18.5.2
Rechenprogramm zur linearen Korrelation
525
Programmausf hrung: a) I JUMP [ | START | | START b)
A. Eingabe x. = 0
Γ
0.0000
7
0.7500
7
PSTART
(L Eingabe y
= 0,75
START
Λ. Eingabe x
= 5
5.0000
= 2,31
2.3100
| START
Eingabe y START
/U
Eingabe X I : L = 50
50.0000
START
7 Eingabe Y 1 1 = 6,60 | START |
/
6.6000 J
526
18. Korrelations- und Regressionsrechnung c ) Berechnung von a, b , r und TAU
Ausgabe r
0.9784
| START | Ausgabe a
0.1022
\ START | Ausgabe b
1.1154
| START |
/
Ausgabe TAU
M i t t = T A U = 14,2289 u n d f = n - 2 = l l - 2
14.2289
=9
Freiheits-
graden e r g i b t das Programm N r . l S (Inegral der t - V e r t e i l u n g ) : S = 99,99998%. Somit f o l g t als Ergebnis zu den Punkten 1. u . 2 . : Die lineare Korrelation zwischen der Vitamin-Menge χ und dem Verbrauch y an KOH ist
statistisch stark (hochsignifikant)
sichert. Die Konstanten a und b der a = 0,1022
und
ge-
Funktion y = ax + b lauten
b = 1,1154 .
Damit lautet die Gleichung f r den Zusammenhang zwischen χ u.y: y = 0,1022 χ
d)
+
1,1154
Berechnung von ZI a ,
.
y-x
| JUMP | [ 2 | [ START | Ausgabe /l a 0.0162
]
0.4808
]
START Ausgabe /7 b
18.5.2
Rechenprogramm zur linearen Korrelation
52?
| START Ausgabe s y _ x
Die Vertrauensbereiche
f
0.5768
/
für die Steigung der Ausgleichsgeraden
bzw. den y-Achsenabschnitt haben demnach die Werte ^a = 0,0162 (
= 15,9% von a) und ^b = 0 , 4 8 8( = 4 3 , 0 % von b ) .
Somit ergibt sich für den B e r e i c h , Konstanten (X und
a
a -
/J
in dem die "wahren"
liegen:
= 0,1022 - 0,0162 = 0,0860
a + ^a = 0,1022 + 0,0162 = 0,1184 b - 2^b = 1,1154 - 0,4808 = 0 , 6 3 4 6 b + ^ / b = 1,1154 + 0,4808 = 1,5962 0,0860 9 9 , 9 % ist,
kann eine Abwei-
chung der Steigung a " der Geraden vom Sollwert a = 1 statiso tisch gesichert (hochsignifikant) nachgewiesen werden. Das bed e u t e t , daß beim V e r f a h r e n a Uberbefunde festgestellt werden, weil die Steigung a ' > l ist.
Aus der Zusammenstellung der Meß-
werte auf S.533 erkannt man auch, daß für die Meßreihe a sämtliche y-Werte größer sind als die entsprechenden x-Werte. Nach dem Verfahren b kann eine Abweichung der Steigung a 1 vom Sollwert 1,000 nicht f e s t g e s t e l l t werden, da hier die der Prüfgroße TAU entsprechende Sicherheit nur 2 7 , 6 % beträgt. Damit arbeitet das V e r f a h r e n b einwandfrei. Es sei
hier noch einmal b e t o n t , daß die Test-Aussage sich
immer nur auf die vorliegenden Daten stützt. Liegen mehr Meßwerte vor,
so kann das Ergebnis des Tests durchaus ein anderes
sein. Das Test-Ergebnis muß also immer in der Form "Aus dem vorliegenden Datenmaterial ergibt s i c h . . . " angegeben werden. Ein Beweis im mathematischen Sinne
ist
nicht möglich.
18.6 Prüfung von Meßwerten auf Normalverteilung Für die Durchführung des t-Tests nach Student sowie für den F-Test war eine Voraussetzung, daß die Meßwerte normalverteilt sind. Liegt eine größere Zahl von Einzelwerten vor, die man in Klassen einteilen kann, dann wendet man für
die Prüfung
der Daten auf Normalverteilung den s o g . Chi-Quadrat-Test an. Diese Prüfmethode ist tistik" von L. Sachs Da bei zelwerte
ausführlich
in dem Buch "Angewandte Sta-
beschrieben.
den m e i s t e n Versuchen aber nur r e l a t i v wenige Ein-
zur Verfügung stehen,
Wahrscheinlichkeitsnetz chen werden
soll hier nur der Test über das
bzw. die
"Hazen" sehe Gerade" bespro-
( 5 ).
Bekanntlich kann die W a h r s c h e i n l i c h k e i t , einen Meßwert innerhalb der Grenzen x. und x
anzutreffen
unter der Normalverteilung zwischen den. Voraussetzung ist
und
durch die Fläche ausgedrückt wer-
n a t ü r l i c h , daß die W e r t e überhaupt
ei-
ner Gauß-Verteilung gehorchen. Es gilt dann: X
P(x 1
^ x ^ x p ) = ---, ^ STO 8
36
X
37 38
2
39 40 4l 42
100
Schritt-Nr.
1
2 P . / 100
= 1 2 P ./100 - 1
43 44 45
x-ABSOLUT
47
1
48 49 50 51 52 53 54
2 P./100 - 1
CHS
1 -
2P./100 - 1
2 q
2
i 2
1/x
^2 1/q*
In
In ( 1/qJ )
X
STO 9
?7 .-» STO 9
55 56
RCL
57
RCL + 1
58
RCL
59 60
RCL + 0
6l 62
(
RCL 9
63
RCL
2
9
^ä 7 ?! a
^i
U
l
ao +
7]±
5
1 "**
vu
a
2 ( i
+ a
27?i)
±(&
+
a27?±)
54l
542
18. Korrelations- und Regressionsrechnung
Fortsetzung von Programm N r . 3 5
Prüfung von
Meßwerten auf Normalverteilung Schritt-Nr.
Befehle
Erläuterungen
64
RCL + 4
b2 + b
65
RCL
9
7
66
RCL + 3
b
67 68 69 70
RCL
?i(b2
l
+ 7
T[ +
±
Mi}
?i ( b 2
+
Mi>
7] i (b 1 + 7] ± (b 2 + *> 3 7? ± ))
9
+ 1
i +7^i(b1 +7]±(b2
}
ao
71
+7?i(.1 +
b37?i))
+
a27|.)
72
STO - 9
c.
73 74 75 76 77 78 79 80 8l 82 83 84
RCL 8
Prüfung,
ob P. ^ 50
-
Dies ist
der F a l l , wenn
50 =
P.
JUMP -= 1 RCL 9
Sonst weiter mit Schritt 78
85 Das Programm ist
CHS
1
- 50 ^
ist.
ist.
Dann er-
folgt Sprung nach LABEL 1.
]
z . = - c. 1
STOP
Ausgabe
z.
JUMP 0
Rücksprung Nach LABEL 0
LABEL 1 RCL 9
STOP JUMP 0
1 J
Z
i = Ci Ausgabe z^
Rücksprung N a c h LABEL 0
b e e n d e t , wenn für i = l bis i = n alle z . -
Werte berechnet sind. Man trägt diese dann gegen die entsprechenden x . - W e r t e in einem Koordinatensystem gegeneinander auf.
18.6
Pr fung von Me werten auf Normalverteilung
543
Beispiel 50 Von 17 M nnern wurde der gemessen. Es soll gepr ft verteilung folgen. χ α = 128
Blutdruck (maximaler A r t e r i e n d r u c k ) werden, ob die Werte einer Normal-
Die Einzelwerte lauten:
Torr
χ
= 132 Torr
x 2 = 122
xg = 127
x_ = HO
x„ = 118
x 13 = 156 Torr x l i t = 137 = 148
15 i6 x1? = 136
x 10 = 139 χ5 = 134 x6 = 151
X
x
il= 129 x 12 = 125
Ordnet man die Werte nach aufsteigender Gr Programm N r . 1 0 ) , dann erh lt χ
= 110 Torr
" "
e ( z . B . ber das
man folgende Reihe:
χ
= 129 Torr
χ
X
=
ΊΊ -v ι4 ~~— Ι 1UU
"
= 134
χ
»
136
X
X 2 = 118
"
χ
= 122
"
i x.
x^ = 125
"
x
χ
= 127
"
x
n=
χ. = 128 b
"
X
12 =
io=
132
= 142 Torr
= 148
16 = x 1? = 156
137
Programmablauf: a) | JUMP | | START | | START |
/o. b)
Eingabe n = 17
/
/
17.0000 /
START
/o. c)
Eingabe i = 1
l START | Ausgabe z
/ /
/ 1.0000 /
1.8899
18. Korrelations- und Regressionsrechnung
544
| START
/o. Eingabe i = 2
2.0000
| START | Ausgabe z,-,
1.3519
START
{L 16.0000 7
Eingabe i = 16 START |
1.3519
Ausgabe z /START |
7
{»L Eingabe i = l?
17.0000
START [ Ausgabe z
1.8899 y
17
F r i = l bis i = 17 ergeben sich somit folgende z^Werte: i
χ1 .
1
110
2
118
3 4
122 125
5 6
127
7 8
129 132
9
134
128
z.
i
1,8899 1,3519 l ,0^91 o ,8206 0,6285 ο,Ί57Ί 0,2988 o, 1476 0,0000
10
1
χ1 .
12
136 137 139
13 14 15 16 17
144 148 15l 156
11
142
z.
1
-0,1476 -0,2988 -0,4574 -0,6285 -0,8206 -l ,049l -1,3519 -1,8899
18.6
545
Prüfung von Meßwerten auf Normalverteilung
Wie man aus der folgenden Abb. 54 e r k e n n t , kann man die Punkte x . / z . recht gut durch eine Gerade verbinden.
Damit
ist
die
Annahme einer Normalverteilung der Meßwerte durchaus gerechtfertigt.
110
V.O
130
150
160
170
j = Blutdruck [Torr] Abb.54
z . - W e r t e als i
Funktion der Meßwerte
i
Man kann den linearen Zusammenhang zwischen x. und z . auch durch eine Korrelationsrechnung
ü b e r p r ü f e n . Unter Anwendung
des Programms Nr.34 erhält man für die l? Wertepaare x . / z . : r = - 0,998 TAU = 6 2 , 4 l f
= l? - 2 = 15
Die Integration der t-Verteilung mit
t = TAU und f = 15 Frei-
heitsgraden l i e f e r t dann S = 9 9 , 9 9 9 9 9 · . % - Damit kann die Annahme einer Normalverteilung der Meßwerte nicht widerlegt werden.
Da die Berechnung der z-Werte nicht ganz exakte Ergebnisse liefert,
ist
das V e r f a h r e n mit einer kleinen " U n s i c h e r h e i t "
behaftet
und im mathematischen Sinne nicht ganz "exakt".
546
18. Korrelations- und Regressionsrechnung
18.7. Nicht lineare Korrelation und Regression Bei vielen Problemstellungen, bei denen man zwischen einer Variablen will, ist
und einer Meßgröße y einen Zusammenhang ermitteln das Modell einer Geraden nicht anwendbar, wie die
folgenden Beispiele zeigen:
Radiaktiver Zerfall von Phosphor-32 y=a-e - bbxx
a=100
b = 0,0i87= In 2/(x.
1/2
y=Prozent Radiaktivität der Ausgangsmenge
0 Abb.55
20
i.0
60
xfTejt] 8
Z e r f a l l eines radioaktiven Präparates
Der Zusammenhang zwischen dem prozentualen Anteil y einer zur Zeit ist
vorhandenen Menge an radioaktiver Substanz und der Zeit gegeben durch die Funktion:
y = a ·e
-bx
(357)
18.7
Nicht lineare Korrelation und Regression
y f Adsorbierte Gasmenge in 10" Mol /cm 2
Adsorption von CO? an Glimmer a= Sättigungsadsorption= A,1510 Mol/cm y=Adsorbierte Gasmenge pro Oberflächeneinheit x= Druck in dyn/cm 2
20
40
Abb.56
100
120
Adsorption von CO
s/mj
20
60
UO
160 x[dyn/cm 2 ]
an Glimmer
Geschwindigkeitsverteilung f ü r Sauerstoff bei 0 C
b=7.036-10~ 6 [s 2 /m 2 ] y=Häufigkeit=Bruchteil der Moleküle, deren Geschwindigkeit zwischen w und w+1 m/s liegt. x=Geschwindigkeit der Moleküle in m/s
10 ··
0
200
Abb.57
400
600
800
1000
x[m/s]
Geschwindigkeitsverteilung von 0 2 ~Molekülen
5*7
18. Korrelations- und Regressionsrechnung Bei der Behandlung nicht linearer Ausgleichsmodelle muß man unterscheiden zwischen linearisierbaren und nicht linearisierbaren
Funktionen.
18.7.1
Linearisierbare Funktionsmodelle
Unter linearisierbaren Funktionsmodellen v e r s t e h t man solche, die sich nach Anwendung einer geeigneten in eine Gerade umwandeln
Transformation
lassen. Mit den transformierten Wer-
ten kann dann eine lineare Korrelations- bzw. Regressionsrechnung durchgeführt werden. Dies ist
wesentlich einfacher
als die direkte Anwendung der "Methode
der kleinsten Fehler-
quadratmethode" auf die eigentlichen
Ausgleichsfunktionen.
Für die folgenden Betrachtungen sei Funktion y = f ( x ) als
Modell gegeben ist
angenommen,
daß eine
und n Wertepaare x/y
vorliegen. Nach einer geeigneten Transformation resultiert als neue Ausgleichsfunktion
die Geradengleichung y ' = a ' x ' + b ' . In
die eigentliche Korrelations- bzw. Regressionsrechnung sind also die durch Transformation entstandenen Wertepaare x ' / y ' einzusetzen. Wir wollen weiter annehmen, daß die Funktion y = f (x) Konstanten a und b e n t h ä l t , also z . B . die Form hat y = a e
die .
Die durch Anwendung einer linearen Korrelations- bzw. Regressionsrechnung a' und b
1
auf die x ' / y ' - W e r t e p a a r e erhaltenen Konstanten
können dann in die eigentlich gesuchten Konstanten
a und b umgerechnet werden. Es ist
allerdings zu beachten,
daß die Methode der Berech-
nung der Konstanten a und b über die Transformation nicht ganz exakt ist.
Bei der direkten Anwendung der Funktion y = f (x)
haben die nach der Methode der kleinsten Fehlerquadrate ermittelten Konstanten a und b gegenüber den "wahren" Of und
Ij
einen geringfügig anderen Fehler als
lung von a und b über die rade y ' = a ' x ' + b »
Parametern
bei
der Ermitt-
durch Transformation erhaltene Ge-
In den meisten Fällen kann aber dieser ge-
18.7-1
Korrelationsrechnung / Linearisierbare Modelle
549
ringe Unterschied vernachlässigt werden. Eine ausführliche Darstellung dieses Problems findet
sich bei H.Späth ( 3 ).
In der folgenden Übersicht sind die w i c h t i g s t e n Modelle y = f ( x , a , b ) , d.h. also Funktionen mit zwei K o n s t a n t e n , sowie die entsprechenden Transformationen und Funktionsbilder zusammengestellt.
Gegeben :
y = f ( x , a, b)
Transformierte Funktion : Funktion
Transformation
yJ = - + b
y = a
y' = a'x'
y'
+ b' Funktionsbild
1/x
a' = a b' = b y=b
y=
y=
b+x
+ b
l —= y
b — a
+
a'
= b/a
b'
=
l — a
i/y
y=a
ax y=._ b+x
l/a
1 1 — = — y a
+
b a
i/y
b1 a'
y=x+b a1 = b1
l/a
= b/a
x=-b
550
18. Korrelations- und Regressionsrechnung
Funktion y=ae
y=ae
bx
b/x
Transformation
y'
In y = In a + bx
In y
a1 =
b
b1 =
In a
In y = In a + —
a' =
b
b1 =
In a
Funktionsbild
b1
In y
y=a
y=e
ax +bx
In; χ
= ax
+ b
In y
bx
a' = a b1 = b
y=a Inx + b y = a(In x) + b a'
= a
b1 = b
In χ
y
18.7.1
Korrelationsrechnung / Linearisierbare Modelle
Funktion
Transformation
bx
a +b χ
y=a-x-e
y= a - χ
2 bx y=ax·e
a' =
b
b' =
In a
lny=ln a + b Inx a' =
b
b' =
In a
In - - = In a + bx
Funktionsbild
y' b(
in* χ
Iny
In·
Inx
b'
a'
b1
b b1 =
In a
= a χ + b
y=ax +bx
a'
= a
1
= b
b
y=x2lax+bi
551
18. Korrelations- und Regressionsrechnung
552
Beispiel 51 Von einem Pflanzenschutzmittel wird eine Abbaureihe b e s t i m m t , d.h.
es wird u n t e r s u c h t , wie groß die Rückstände auf einer be-
stimmten Kultur in bestimmten Zeitabständen nach Anwendung des Mittels sind. Es wird angenommen, daß die Abbaureaktion nach der Beziehung y = a· e
v e r l ä u f t , wobei
b·
die Zeit und y die Konzentration des Mittels
darstellt. Die Rückstände wurden nach 0,
l , 2, 3, 4, 5 i 6, 7, 14 und
21 Tagen nach Ausbringung des Mittels bestimmt und haben
fol-
gende Werte x(Tage)
y(ppm)
x(Tage)
0
12,0
5
1
10,3 9,0 7,8 7,1
6
2 3 4
7 14 2l
y(ppm)
6,4 5,6 4,7 2,0 0,9
Wie man aus der Zusammenstellung der Modellfunktionen
entneh-
men kann, lautet die Transformation: y'
= In y = In a + b ·
Dies b e d e u t e t , daß die y - W e r t e , bevor sie in eine lineare Korrelations- bzw. Regressionsrechnung
eingesetzt werden können,
logarithmiert werden müssen. Dies kann auf dem Rechner in
ein-
facher Weise durch Drücken der ln-Taste erfolgen. Dann kann das Programm Nr.34 angewandt werden. Ist
die Transformation etwas komplizierter, dann
empfiehlt
es s i c h , die entsprechenden Schritte in das Programm einzubauen und zwar zwischen den Eingabe-STOP-Befehl und den Folgeschritt ( a l s o zwischen den Schritten 5 und 6 bzw. 12 und 13).
18.7-1
Korrelationsrechnung/ Linearisierbare Modelle
553
Bei Anwendung des Programms N r . 3 ^ ergibt sich folgender A b l a u f : 1 JUMP | | START] | START |
A. Eingabe χ.
= 0
/
L
0.0000
/
1 START |
/
/2.
Eingabe y
= 12,0
12.0000 /
/
2.48^9
/
]
| START |
Λ.
Eingabe x_ = 1
/
ι
1.0000
/
| START |
/
/2.
Eingabe y
= 10,3
/
10.3000 /
/
2.3321 J
| START |
• ]
/I.
Eingabe X I G = 21
/
21.0000
/
| START | /
/2.
Eingabe y
START
=0,9
/
0.9000
/_
0.1053 /
/
18. Korrelations- und Regressionsrechnung Berechnung von a' , b ' , r , TAU, S%, a und b JUMP | | l |
[ START |
Ausgabe r
/-
0. 9 9 9 4 ]
\ START l Ausgabe a 1
0.1251
[START Ausgabe b '
/
2.4501
/
Ausgabe TAU
/
85. 77 42
/
Wie man erkennt, liegt der K o r r e l a t i o n s k o e f f i z i e n t r sehr nahe bei -1.
Dies b e d e u t e t , daß die x-Werte und die Logarithmen In
der y - W e r t e sehr gut negativ korreliert sind. Mit steigendem x-Wert nehmen also die I n y - W e r t e linear ab. Um diesen Sachverhalt statistisch zu untermauern, berechnet man über das Programm N r . l S die Fläche unter der t-Verteilung zwischen t = + TAU und t = - TAU mit f = n-2
= 10-2 = 8
Freiheitsgraden. Das Programm l i e f e r t S = 99,9999%. Damit der lineare Zusammenhang zwischen In y und
ist
statistisch stark
gesichert ( h o c h s i g n i f i k a n t ) . Nach der auf S.550 angegebenen Übersicht f o l g t für Konstanten a und b der Funktion y = a - e
die
:
= 11,5895 b = a'
= - 0,1231
Damit lautet die Funktion für den Zusammenhang zwischen
y; y = 11,5895 e-°' 1231
und
l8.7-l
Korrelationsrechnung / Linearisierbare Modelle
In Abb.58 ist
555
die Funktion ihrem Verlauf nach graphisch dar-
gestellt :
x(50%) = Zeit, nach der noch 50% der Menge y vorhanden sind. x(50%) Abb.58 Der Wert y den Wert
Verlauf der Funktion
y = a· e
bx
ergibt sich, wenn man in die berechnete = 0 einsetzt. Man erhält: y
Funktion
= 1 1 , 6 ppm.Dieser W e r t
stimmt recht gut mit dem Meßwert y = 12,0 ppm überein. Interessant ist
in diesem Zusammenhang die Frage, wann nur
noch 50% der Anfangskonzentration y
vorhanden sind. Man be-
zeichnet die entsprechende Zeit als Halbwertzeit. Man erhält sie, wenn man in die Gleichung y = 11,5095 e ~ 0 , 1 2 3 1 x für y den Wert 11,5895/2 = 5 , 7 9 4 8 einsetzt und die Gleichung dann nach
auflöst:
5 , 7 9 ^ 8 = 11,5895 e _
In 5 , 7 9 ^ 8 - In 11,5895 -0,1231
_ ~
- 0,6931 - 0,1231
_ ~
Nach 5 , 6 3 Tagen sind also noch 50% der Ausgangskonzentration von 11,6 ppm vorhanden. Hierbei ist gangskonzentration y telte Konzentration Meßwert!
zu b e a c h t e n , daß als Aus-
die über die Ausgleichsrechnung ermitzugrunde gelegt wird und nicht der gegebene
556
l8. Korrelations- und Regressionsrechnung
18.7.2
N i c h t linearisierbare Funktionsmodelle
Ebenso wie man linearisierbare Modelle auf eine Geradengleichung zurückführen kann, lassen sich o f t m a l s auch Funktionen mit mehr als in
ein
2 Konstanten durch geeignete
Polynom der
Form y'
= a
umwandeln. Die entsprechenden
+ a x'
+
,,
Transformation 1
+ ...
+ a x'
Konstanten a , a , a„ usw. kön-
nen dann nach der Methode der kleinsten Fehlerquadrate ermittelt werden. Ein Beispiel ist
die Funktion zur Berechnung der t-Werte:
t = exp (-^r + -
Durch Setzen von y ' = In t
+ ~^- + d)
und
x'
.
= 1/f
erhält man daraus
die Polynomfunktion
y'
= a x ' 5 + b x ' 2 + ex' + d
.
Die entsprechenden Konstanten können dann nach den auf S.487 f angegebenen Gleichungen aus den entsprechenden Summen ermittelt werden. Auf diese Weise sind die auf S.248 in Tab.58 angegebenen Konstanten für die Berechnung der t-Werte für
verschiedene
statistische Sicherheiten gefunden worden. Dabei sind die
für
verschiedene Freiheitsgrade und statistische Sicherheiten tabellierten t - W e r t e ( 6 ) zugrunde gelegt worden.
19. Liste der Programme
Nr.
Programmbezeichnung
Seite
1
Berechnung von n! für n ^ 69
123
2
Berechnung von n! für
125
n > 69 mit der
Stir ling- Formel
3
Berechnung der Gamma-Funktion
128
k
Berechnung von
133
5
Arithmetischer M i t t e l w e r t
159
6
Arithmetischer- M i t t e l w e r t
160
(
)
( v e r e i n f a c h t e s Programm)
7
163
Arithmetisches Mittel für klassierte
Werte
8
Geometrisches M i t t e l
9
Indirekte Speicheradressierung
171
(Eingabe von n E i n z e l w e r t e n in Konstantenspeicher
177 die
1 bis n)
10
Sortieren von Daten /
11
Spannweite /
12
Integration der N o r m a l v e r t e i l u n g
Medianwert
Größter u. kleinster W e r t
( Reihenentwicklung)
182 189 205
558
19- Liste der Programme
Nr.
Programmbezeichnung
Seite
13
Integration der Normalverteilung
210
(Polynomapproximation) 14
Signifikanzschranken der
21?
Normalverte ilung 15
226
Standardabweichung und arithmetisches M i t t e l
16
Berechnung von t-Werten
248
17
Vertrauensbereich
255
des M i t t e l w e r t e s
für beliebige stat. Sicherheiten
18
Integral der t-Verteilung
2?4
19
Vertrauensbereich der Standardabweichung
292
20
Berechnung des Toleranzintervalls
306
21
Stichprobenumfang bei
316
definiertem
Vertrauensbereich 22
Zufallszahlengenerator für
ganze
325
Zahlen zwischen p und q 23
Randomis ierung
332
24
Normalverteilte Zufallszahlen
338
25
Poissonverteilung,
350
Einzelwahrseheinlichke it 26
Poissonverteilung, Zusammengesetzte
353
Wahrscheinlichkeit 2?
Ausreißertest nach Graf und Henning
365
28
Trendtest nach Neumann
386
19-
Liste der Programme
Nr.
Programmbezeichnung
Seite
29
Integration der F-Verteilung
403
f
405
1
f
und f und f
i»
geradzahlig ungeradzahlig
1
409
30
Vergleich zweier Mittelwerte (t-Test)
439
31
Stichprobenumf ang für
455
32
D i f f e r e n z e n - t-Test
464
33
Methode der kleinsten Fehlerquadrate
484
den t-Test
( Summenbildung)
34 35
Lineare Korrelation und Regression
515
Prüfung von Meßwerten auf
539
Normalverteilung (Hazensche Gerade)
559
20. Register der Beispiele
Beispiel
Theorie
Seite
1
Klassieren von Schrauben aus einem Produktionsprozeß
Klassieren von Meßwerten/Häuf igkeitsdiagramm
153
2
Arithmetisches M i t t e l aus 10 Einzelwerten
Arithmetischer
l60
Nr.
3
Mittlerer Durchmesser von roten Blutkörperchen
Mittelwert Arithmetisches
164
M i t t e l aus klassif i z i e r t e n Daten
>i
Eichung einer Analysenwaage
Spezielle Methoden zur Berechnung des arithm. Mittels
166
5
Keimzahl in Milchproben
Geometrisches M i t t e l
172
6
Durchschnittsgeschwindigkeit eines Fahrzeugs
Harmonisches M i t t e l
174
7
Sortieren von 5 W e r t e n
Sortieren von Daten
179
8
Größter und kleinster W e r t einer Datenreihe
Spannweite
191
9
Streuung bei der Blutdruckmessung
Integration der Normalverteilung
207
10
Ausschuß bei einem Produktionsprozeß
M
tl
215
11
Analyse von Lebensmitteln
1!
It
215
auf 12
Pestizid-Rückstände
Eiweißgehalt im Blutserum
Signifikanz schranken der Normalverteilung
219
20.
Nr.
Beispiel
56l
R e g i s t e r der Beispiele Theorie
Seite
13
Wassergehalt von Cyclohexan
Berechnung der S tandardabwe ichung
227
14
K o n z e n t r a t i o n einer physiologischen Kochsalzlösung
Vertrauensbereich des M i t t e l w e r t e s (zweiseitig)
244
15
Qualitätskontrolle von Salzsäure
Vertrauensbereich des M i t t e l w e r t e s (einseitig)
245
16
Qualitätskontrolle eines pharmazeutischen Präparates
Berechnung des Vertrauensbereiches für beliebige s t a t . Sicherheiten
264
17
Mangangehalt einer Stahlprobe
Integration der t-Verteilung (zweiseitig)
280
18
Mangangehalt einer Stahlprobe
Integration der t-Verteilung (einseitig)
282
19
Streuung der Dicke von Aluminiumfolien
Vertrauensbereich der Standardabweichung
296
20
Rückstand eines Pflanzenschutzmittels
Prognoseintervall
301
21
Harnstoffgehalt des Blutes
Toleranzintervall (einseitig)
304
22
Durchmesser von Stahlkugeln
Toleranzintervall (zweiseitig)
3O8
23
Polarographische Bestimmung von Blei in Pflanzen
Stichprobenumfang für d e f i n i e r t e n Vertrauensbereich des M i t t e l w e r t e s ( £7 b e k a n n t )
310
2k
Polarographische Bestimmung von Blei in Pflanzen
Stichprobenumfang für definierten Vertrauensbereich des M i t t e l w e r t e s ( (J unbekannt)
318
562
20.
Register der Beispiele
Nr.
Beispiel
Theorie
25
Randomis ierung Aufteilung verschiedener Getreidesorten auf 16 Teilfelder eines Versuchsfeldes
334
26
Prüfung der Formel
Normalverteilte Zuf auszahlen
34l
= /6
Seite
(R = Spannweite) 27
Aktivität eines P-32Präparates
Poissonverteilung
345
28
Impulsraten eines radioaktiven Präparates
Poissonver te ilung (Einzelwahrscheinlichkeit)
351
29
30 31
1!
Poissonverteilung ( Zusammengesetzte Wahrscheinlichkeit)
M
Bestimmung der Erdbeschleunigung g II
II
Ausreißertest nach Graf und Henning
370
Ausreißertest nach Nalimov
378
32
Oberflächenspannung von Wasser
33
Chromatographische Bestimmung eines Amins
Trendtest nach Neumann
34
Vergleich zweier chromatographischer Trennverfahren
Vergleich zweier Streuungen ( F - T e s t )
35
Vergleich der Dicke zweier Folien
Vergleich zweier Mittelwerte ( t - T e s t )
36
Wassergehalt zweier Hexan-Proben
37
Abhängigkeit der Schwingungsdauer eines Pendels vom geographischen Ort
Stichprobenumf ang beim Vergleich zweier Mittelwerte
457
38
Qualitätskontrolle einer AI-Folie
Vergleich M i t t e l wert - Sollwert
459
II
II
tl
M
380
388 425
446 452
20. Register der Beispiele
563
Nr.
Beispiel
Theorie
Seite
39
Abhängigkeit eines PflanzenschutzmittelRückstandes von der Lagertemperatur der Probe
Dif ferenzen-t-Test
46?
40
Wirkung zweier Insektizide auf Khapra-Käfer
4l
Abhängigkeit des Siedepunktes von Schwefel vom Druck
A- Test
472
Gaußsche Fehlerquadratmethode
477
42
11
II
Bestimmung der Konstanten einer Ausgleichs funk t i on
490
43
II
II
Kor r e la t i on s koef f izient
498
Linear i tätsprüfung eines GC-Detektors
Abhängigkeit des 502 Korrelationskoef f izienten von der Zahl der Meßpunkte
Peakfläche als Funktion der Substanzmenge bei einem Gaschromatographen
Streuung einer Ausgleichsgeraden
46
Wirkung eines Vitaminpräparates auf das Wachstum von Bazillen
Lineare K o r r e l a t i o n und Regression
4?
Peakfläche als Funktion der Substanzmenge bei einem GC-Detektor
529 Vertrauensbereich einzelner Punkte auf der Ausgleichsgeraden
48
Wirkung eines Vitaminpräparats auf Bazillenwachstum
Prüfung des Achsenabschnitts einer Ausgleichgeraden
53l
49
Vergleich zweier U r t i t e r substanzen
Prüfung der Steigung einer Geraden
533
50
Blutdruck von Männern
Prüfung auf Normalverteilung
543
5l
Abbauverhalten eines Pflanzenschutzmittels
Aus gleiche funk t ionen nicht linearer Art ( linear i sie r bar )
552
44
5
508 526
21. Rechnerschlüssel
In der folgenden Übersicht sind für die wichtigsten Problemstellungen beim Rechnen bzw. Programmieren die entsprechenden Tastenbefehle der Modelle "Compucorp 327 Scientist", "Texas Instruments TI 59" und "Hewlett Packard HP 97" gegenübergestellt. Dabei gelten f o l g e n d e Abkürzungen: X
=
x- bzw. Eingaberegister ( A n z e i g e )
=
y-Register
=
Inhalt des
y
=
Inhalt des y-Registers
M
=
Konstantenspeicher ( M e m o r y ) mit
=
Inhalt des
m
n
Eingabe-Registers
Konstantenspeichers
Zur Erinnerung hier noch einmal die den o.g.
der M
Adresse n
n
G e r ä t e n zugrunde
liegenden Logiksysteme:
System Compucorp:
Algebraische Logik ohne Hierarchie Alle k Grundrechenarten sind gleichberechtigt.
System Texas
Algebraische Logik mit Hierarchie
Instruments
Punkt- vor Strichrechnung
:
System H e w l e t t
Umgekehrte Polnische Notation ( U P N )
Packard:
ENTER-Taste, keine Klammern
2l. Rechnerschl ssel
0
(l·
565
Ξ0
ο
(β On
-Ρ •Ρ
φ Η S
H H h -μ n
«
Κ ω Η
Μ
Η.
Ι
0
0 0
0
0
ΙΉ
(β
φ Η
0
ft ίπ Ο
υ
3 ft Ο
0
0
0
CO
Ο] (Λ
C Φ Η Λ
α
Ν
•Η Φ
SI
0 0 ΙΉ 0 0
0
0
,α ο
!π Φ •Η Φ
Β
(8 Ν
•Η 0) -Ρ Η
C Ο
-Ρ ,Ω
w κ c
C Ο C r-
Ν
ο
•Η Ό Ό
0
S Ο Η
(β Ν
•Η
•Η -Ρ
0
0 0
υ
Ε Φ Η
«
Ι
CO
~^| |οκΙ
vH
CJ
Ο Η
Ο Η
Γ~
r—ι 0
C5
Χ ι—ι
Ι
|j| |οκ Ι
f 1
|_]
υ
hj
(Λ
-S"
O
Ο1 Ε-
Ο Η
\\ \\
α
υ
α
X
CO 401 CO
-Ρ
π
0)