179 94 26MB
German Pages 260 [264] Year 1998
Lehr- und Handbücher der Statistik Herausgegeben von Universitätsprofessor Dr. Rainer Schlittgen Bisher erschienene Werke: Böhning, Allgemeine Epidemiologie Caspary/Wichmann, Lineare Modelle Chatteijee/Price (Übers. Lorenzen), Praxis der Regressionsanalyse, 2. Auflage Degen/Lorscheid, Statistik-Aufgabensammlung, 3. Auflage Harvey (Übers. Untiedt), Ökonometrische Analyse von Zeitreihen, 2. Auflage Harvey (Übers. Untiedt), Zeitreihenmodelle, 2. Auflage Heiler/Michels, Deskriptive und Explorative Datenanalyse Miller (Übers. Schlittgen), Grundlagen der Angewandten Statistik Naeve, Stochastik für Informatik Oerthel/Tuschl, Statistische Datenanalyse mit dem Programmpaket SAS Pokropp, Lineare Regression und Varianzanalyse Rasch • Herrendörfer u.a., Verfahrensbibliothek, Band I Rinne, Wirtschafts- und Bevölkerungsstatistik, 2. Auflage Rüger, Induktive Statistik, 3. Auflage Schlittgen, Statistik, 8. Auflage Schlittgen, Statistische Inferenz Schlittgen/Streitberg, Zeitreihenanalyse, 7. Auflage
Fachgebiet Biometrie Herausgegeben von Dr. Rolf Lorenz Bisher erschienen: Bock, Bestimmung des Stichprobenumfangs
Allgemeine Epidemiologie und ihre methodischen Grundlagen Von Privatdozent
Dr. Dankmar Böhning
R. Oldenbourg Verlag München Wien
Für meine Eltern
Die Deutsche Bibliothek - CIP-Einheitsaufnahme Böhning, Dankmar: Allgemeine Epidemiologie und ihre methodischen Grundlagen / von Dankmar Böhning. - München ; Wien : Oldenbourg, 1998 ISBN 3-486-24708-5
© 1998 R. Oldenbourg Verlag Rosenheimer Straße 145, D-81671 München Telefon: (089) 45051-0, Internet: http://www.oldenbourg.de Das Werk einschließlich aller Abbildungen ist urheberrechtlich geschützt. Jede Verwertung außerhalb der Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulässig und strafbar. Das gilt insbesondere filr Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Bearbeitung in elektronischen Systemen. Gedruckt auf säure- und chlorfreiem Papier Gesamtherstellung: R. Oldenbourg Graphische Betriebe GmbH, München ISBN 3-486-24708-5
Inhalt Vorwort des Autors
6
Ein Vorwort von Gerhard Arminger
8
1.Was ist Allgemeine Epidemiologie?
12
1.1 Krankheiten und ihre Verteilungen in Populationen
12
1.2 Kränkheitsentstehung, Expositionen und Risiko/Präventivfaktoren
15
2. Epidemiologische Grundlagen
21
2.1 Epidemiologische Studientypen und epidemiologische Studienplanung
21
2.2 Die epidemiologischen Maßzahlen: Prävalenz, kumulative Inzidenz und die Inzidenzdichte 2.3 Epidemiologische Stichprobenmodelle: Binomial- und Poissonverteilung
26 32
2.4 Epidemiologische Diagnostik: Sensitivität und Spezifität eines diagnostischen Tests, Bias-Korrektur der Prävalenzschätzung Übungsaufgaben
42 46
3. Das Kohortenmodell
47
3.1 Das Design der Kohortenstudie und das Relative Risiko
47
3.2 Konfidenzintervalle und Tests für das Relative Risiko
50
3.3 Kohortenstudien vom Inzidenzdichte-Typ
55
3.4 Stichprobengröße
58
3.5 Konfounderprobleme
66
3.6 Adjustierung des Relativen Risikos
70
3.7 Mantel-Haenszel-Schätzung des Relativen Risikos
73
3.8 Software zur Risikoberechnung bei Kohortenstudien
78
Übungsaufgaben
81
4
Inhaltsverzeichnis
4. Das Modell der FaU-KontrolIstudie
83
4.1 Krebsepidemiologie und die Fall-Kontrollstudie
83
4.2 Das Design der Fall-Kontrollstudie und die Nicht-Schätzbarkeit des Relativen Risikos
85
4.3 Das Odds-Ratio und das Fundamentaltheorem der Epidemiologie
89
4.4 Tests und Konfidenzintervalle
94
4.5 Wahl der Stichprobengröße
97
4.6 Konfounderprobleme und Mantel-Haenszel Schätzung des Odds-Ratio
101
4.7 Software zu Fallkontrollstudien
108
4.8 Zur direkten Schätzung des Relativen Risikos durch den Odds-Ratio: Die Fall-Referenzstudie
110
Übungsaufgaben
116
5. Das Modell der Fall-Kontrollstndie mit Paarbildung
118
5.1 Das Prinzip der Paarbildung und sein „Für-und- Wider"
118
5.2 Der Odds-Ratio und seine Schätzung
124
5.3 Zwei Versionen von McNemar's Test
127
5.4 Konfidenzintervalle
131
5.5 Wahl der Stichprobengröße
132
5.6 Software zu gepaarten Fall-Kontrollstudien
135
5.7 1-K Matching
137
Übungsaufgaben
140
6. Logistische Regression
142
6.1 Eine Einfuhrung
143
6.2 Das Modell mit mehreren Expositionen
145
6.3 Mantel-Haenszel-Analyse als Logistische Regression: Homogenität (Konfounding) und Interaktion (Effektmodifikation)
149
6.4 Das Modell mit quantitativer Exposition
158
6.5 Maximum Likelihood Schätzung und Likelihood-Ratio Test
167
6.6 Software zur Logistischen Regression
173
6.7 Anwendung auf Fall-Kontrollstudien
178
Übungsaufgaben
183
Inhaltsverzeichnis
5
7. Epidemiologische Standardisierung
185
7.1 Zur Notwendigkeit der Standardisierung
185
7.2 Die direkte Methode und ihre Anwendung auf die Mortalität: die komparative Mortalitätszahl (CMF)
188
7.3 Die indirekte Methode und ihre Anwendung auf die Mortalität: das standardisierte Mortalitätsverhältnis (SMR)
199
7.4 Allgemeine Prinzipien der Standardisierung
213
7.5 Software zur Standardisierung
217
Übungsaufgaben
221
Anbang
222
A. 1 Ausflug zu den statistischen Werkzeugen: Die 8-Methode
223
A.2 Ausflug zu den statistischen Werkzeugen: Minimierung der Varianz
223
A.3 Profillikelihood für einfaches Kohortendesign
224
A.4 Profillikelihood für die einfache Fall-Kontrollstudie
226
A.5 Verknüpfung monotoner Funktionen
228
A.6 Ausflug zu den statistischen Werkzeugen: Maximum Likelihood Schätzung in der Logistischen Regression
229
Lösungen der Übungsaufgaben
234
Literatur
250
Sachverzeichnis
254
Liste der Symbole und Abkürzungen
260
Vorwort des Autors Dieses Buch ist aus einer Reihe von Vorlesungen entstanden, die ich während mehrerer Aufenthalte am Department of Biostatistics, Faculty of Public Health, Mahidol University in Bangkok (Thailand) in den Jahren 1991-1995 in englischer Sprache gehalten habe. Diese Gastdozenturen wurden in großzügiger Weise vom Deutschen Akademischen Austauschdienst (DAAD) unterstützt. Es sei auch an dieser Stelle hierfür ganz ausdrücklich gedankt, namentlich und stellvertretend dem Leiter der Vermittlungsstelle des DAAD für Thailand, Herrn Dr. Rüdiger Stahl. Ohne die Förderung durch meine thailändischen Freunde und Kollegen wären sie jedoch nicht möglich gewesen. Ebenso ihnen gilt mein Dank. Es sind stellvertretend zu nennen: Frau Prof. Dr. Rampai Suksawasdi na Ayuthya, Prof. Dr. Thavatchai Vorpongthorn, Prof. Chukiat Viwatwongkasem, Frau Natkamol Chansatitporn und Frau Prof. Raviwan Rojanavipart. Die vielen Studenten, die mich mit großer Ausdauer und unnachgiebiger Geduld über 5 Jahre mit ihrem Interesse begleitet und fortwährend motiviert haben, sind gleichfalls daran beteiligt, daß dieser Text entstanden ist. Hier möchte ich auch nur wieder stellvertretend Frau Walailuck Asawakul und Frau Ammarin Thakkinstian nennen. Es mag für die thailändische akademische Welt zunächst bedauerlich erscheinen, daß dieser Text nicht in englischer Sprache erscheint, so eine solche Version aber geplant ist. Für die deutsche Epidemiologie ist es jedoch von großem Wert, daß das Buch in der nun vorliegenden Version erscheint und mag auf diese indirekte Weise die vielfältige Nützlichkeit internationaler Programme, wie sie seit langem u.a. vom DAAD vertreten werden, unterstreichen. Bei der endgültigen Fertigstellung des Buches waren Dr. Ekkehart Dietz und Dr. Peter Schlattmann durch vielfältige Diskussionen hilfreich. Frau Annekathrin Pöpel und Frau Christiane König haben das Manuskript mehrfach sorgfältig Korrektur gelesen. Herr Dr. Uwe Malzahn hat schließlich noch die Lösungen der Übungsaufgaben in bewährt sorgfältiger Weise angefertigt. Ihnen gilt mein Dank.
Vorwort
1
Es bleibt meinem langjährigen Freund Prof. Dr. Gerhard Arminger zu danken, der mich überhaupt dazu angeregt hat, die vorhandenen „Lecture Notes" zu ordnen, zu ergänzen, zu korrigieren, letztlich als eigenständiges Werk herauszubringen.
Letztlich gilt mein Dank dem Oldenbourg Verlag für die sichere, zügige und einvernehmliche Zusammenarbeit.
Berlin
Dankmar Böhning
Vorwort von Gerhard Arminger Das Fachgebiet der Public Health hat in den letzten Jahren in Deutschland breites Interesse gewonnen. Ein Beleg dafür sind die Studiengänge für Public Health, die an der Technischen Universität Berlin am Fachbereich Gesundheitswissenschaften und an der Universität Bielefeld an der Fakultät für Gesundheitswissenschaften eingerichtet wurden. Als eines der zentralen Wissensgebiete der Public Health nimmt die Epidemiologie mit ihren methodischen Instrumenten eine Schlüsselposition ein, da sie der Krankheits- und Gesundheitsforschung im Bevölkerungsbezug dient. Ihr Erkenntnisinteresse ist die Analyse der Verbreitung von Krankheiten und ihren Ursachen sowie die Erprobung und Bewertung von Präventionsmaßnahmen. Die Epidemiologie ist ein Querschnittsfach mit vielfältigen Beziehungen zu anderen medizinischen Fachdisziplinen. Aber auch in viele benachbarten Wissenschaften wie Soziologie, Demographie, oder Psychologie haben epidemiologische Denk- und Vorgehensweisen Eingang gefunden. Daher ist es erforderlich, daß eine breite und solide
Kenntnis der methodischen Grundlagen der Epidemiologie als
Standard der epidemiologischen Ausbildung vermittelt wird. Dankmar Böhning legt nun ein Werk vor, das in die zentralen methodischen Elemente der Epidemiologie sowohl technisch einwandfrei als auch didaktisch hervorragend einführt und damit das erforderliche methodische Wissen bereit stellt.
Besonders fällt bei diesem Buch der technisch solide und sichere methodische Umgang mit der Materie ins Auge. Häufig findet sich in Einführungsbüchern der Epidemiologie eine Ansammlung von formelhaften Verfahren, deren Ableitung dem Laien, selbst bei größter Motivation, unzugänglich bleiben. Oft wird in Lehrbüchern auch nur das dargestellt, was dem jeweiligen Autor gefällt und was leicht herzuleiten
Vorwort
9
ist. Schwieriges wird ausgelassen, umgangen oder der Leser wird auf weiterfuhrende Lehrbücher verwiesen, die dann wieder auf andere Literaturstellen verweisen. Zusätzlich birgt dieses leider häufig anzutreffende Verfahren auch die Gefahr, daß sich falsche Sachverhalte über Jahre in der Literatur halten. In diesem Punkt stellt das vorliegende Werk eine erfreuliche Ausnahme dar. Zwar werden keine neuen epidemiologischen Gebiete vorgestellt, aber es wird eine solide Einfuhrung in die Basiselemente der Epidemiologie gegeben. Insofern ist dieses Buch im deutschen Sprachraum einzigartig.
Die Darstellung überzeugt in vielfältiger Weise. Es werden die wichtigsten epidemiologischen Studientypen erläutert, nämlich die Querschnittsstudie, die Kohorten- und die Fallkontrollstudie, letztere noch einmal getrennt nach dem Kriterium der Paarung. Dies macht auch die Gliederungsstruktur des Buches aus. Nach dem Einfuhrungskapitel folgt ein Grundlagenkapitel, in dem neben den zentralen epidemiologischen Maßzahlen (Prävalenz, kumulative Inzidenz und Inzidenzdichte) auch die für die Epidemiologie zentralen Stichprobenmodelle der Binomialverteilung (für Prävalenz- und kumulative Inzidenzuntersuchungen) und der Poissonverteilung (für Untersuchungen, die die Inzidenzdichte und die Standardisierte Mortalitätsrate zur Grundlage haben) dargestellt werden. Es folgt ein Kapitel über die Kohortenstudien, dann über Fall-Kontrollstudien mit und ohne Paarung. Hier wird eine ausfuhrliche Diskussion des Fundamentaltheorems der Epidemiologie gegeben, das die Schätzbarkeit des Odds-Ratios in Fall-Kontrollstudien und seine Approximation des Relativen Risikos beinhaltet und unter der üblichen Annahme einer geringen Krankheitsprävalenz nachweist. An dieser Stelle wird eine der Stärken des Buches besonders deutlich, indem nicht nur der Fundamentalsatz nachgewiesen, sondern darüber hinaus auch noch untersucht wird, was denn „geringe" Krankheitsprävalenz bedeutet und wie sich dies auf die Approximation des Relativen Risikos durch das Odds Ratio auswirkt.
10
Vorwort
In Anbetracht ihrer zentralen Bedeutung, nicht nur im Hinblick auf die Einbeziehung von Kovariaten oder ihrer Schätzbarkeit in Fallkontrollstudien, wird der logistischen Regression im Kapitel 6 breiter Raum eingeräumt. Es wird herausgearbeitet, daß es eine zentrale Eigenschaft der logit-Linkfunktion ist, auch bei Fallkontrollstudien schätzbar zu sein - bis auf einen nicht interpretierbaren Achsenabschnittsparametern. Aus diesem Grund ist sie für die Epidemiologie nicht eine unter vielen möglichen Link Funktionen wie die Probit- oder komplementäre Log-logLinkfunktion, sondern nimmt eine herausragende Stellung ein. Den Abschluß bietet ein Kapitel über Verfahren der direkten und indirekten Standardisierung. Es wird klar herausgearbeitet, daß unstandardisierte epidemiologische Maßzahlen zu erheblichen epidemiologischen Artefakten führen können und daß bei allen epidemiologischen Maßzahlen nur entsprechend standardisierte Maßzahlen sinnvoll interpretierbar sind. Den Abschluß des Buches bilden verschiedene Anhänge, in denen sich Elemente der Darstellung befinden, die aus Gründen einer leichten Lesbarkeit aus dem Haupttext herusgenommen wurden. Neben Werkzeugen, die dem Fachmann durchaus bekannt sind wie der Delta-Methode zur Gewinnung von Standardfehlern von Maximum-Likelihood-Schätzern, finden sich hier durchaus auch für den Fachmann interessante Ableitungen, die selten so klar und transparent in der epidemiologischquantitativen Literatur zu finden sind. Ein herausragendes Beispiel ist die Ableitung des Mantel-Haenszel-Schätzers als Maximum-Profil-Likelihood-Schätzer.
Ein wesentlicher Vorteil dieses Buchs ist es, die verschiedenen Typen epidemiologischer Studien immer im Zusammenhang mit den Inferenzprinzipien darzustellen, so daß nicht getrennt wird, was eigentlich zusammen gehört, nämlich die Planung und die Auswertung epidemiologischer Studien. Jedes Kapitel ist nach einem ähnlichen Schema aufgebaut: Die inhaltliche Fragestellung bestimmt den Studientyp, der Studientyp die epidemiologisch-statistische Inferenz, und Diskussion der Problematik der Verzerrung der Ergebnisse (Bias) durch Konfounding. Schließlich wird für jeden Studientyp die Frage des Studienumfanges diskutiert und das Kapitel mit Erläuterungen zur geeigneten epidemiologischen Software abgeschlossen.
Vorwort
11
Es stellt sich die Frage, wie sich das Buch in der vorhandenen Lehrbuchliteratur einordnet. Während es in der englischsprachigen Literatur eine durchaus breite Palette von Epidemiologie-Lehrbüchern gibt (vgl. auch hierzu die Literaturhinweise des Buchautors), gibt es nur wenige deutschsprachige Lehrbücher. Hier ist zunächst das ältere Buch von Pflanz (1973) zu nennen, das allerdings neuere methodische Entwicklungen der Epidemiologie nicht mehr abdeckt. Aktuell ist sicherlich das Buch von Kreienbrock und Schach (1995), das durch das vorliegende Werk von Böhning in vielfacher Hinsicht ergänzt und erweitert wird. Es ist das Markenzeichen und das Qualitätsmerkmal einer Wissenschaft, daß an vielen Stellen und in unterschiedlichen Richtungen die vielfältigen Zweige der Disziplin - mitunter auch unter kontroversen Diskussionen - weiterentwickelt und vorangetrieben werden. In diesem Sinne ist es nur wünschenswert, daß sich die begonnene Entwicklung der Epidemiologie in Deutschland weiter fortsetzt und möglichst viele Zentren entstehen, an denen auch methodische epidemiologische Forschung gepflegt wird. Hierzu hat der Autor ohne jeden Zweifel einen wichtigen Beitrag geleistet.
Ich habe das Buch des Autors mit großem Interesse gelesen und bin zu der Überzeugung gekommen, daß dieses Buch in der Handbibliothek des Epidemiologen, des Sozial- bzw. Präventivmediziners, des Medizinstatistikers, und eigentlich eines jeden, der im Bereich Public Health arbeitet, nicht fehlen sollte. Dieses Buch verdient eine große Leserschaft.
Wuppertal
Gerhard Arminger
1. Was ist Allgemeine Epidemiologie?1 1.1 Krankheiten und ihre Verteilungen in Populationen Die Epidemiologie beschäftigt sich mit der Verbreitung von Krankheiten in der Bevölkerung und Faktoren, die mit ihrer Verbreitung in Verbindung stehen. Dazu wird ihre Verbreitung gemessen und das Resultat dieser Messung, ihre Verteilung untersucht. Zum Beispiel kann von Interesse sein, wieviele Frauen im Jahre 1992 in der Bundesrepublik Deutschland an Lungenkrebs erkrankt sind. Diese grundlegenden epidemiologischen Informationen sind sicherlich in vielen Zusammenhängen wichtig, beispielsweise kann es für Planungsaufgaben im Gesundheitswesen wichtig sein, zu wissen, mit wievielen AIDS-Fällen man im Jahre 1999 zu rechnen haben wird. Schon diese recht elementare Fragestellung macht deutlich, daß eine solche Prognose nicht nur in der Angabe einer konkreten Zahl bestehen kann, sondern mindestens einen Bereich ausweisen müßte, mit wievielen Fällen günstigstenfalls und mit wievielen Fällen schlimmstenfalls zu rechnen ist.2 Dieses Beispiel macht deutlich, daß die Erarbeitung schon einfacher epidemiologischer Kenntnisse die Berücksichtigung des Zufalls unbedingt erfordert. Die Wissenschaft, die sich mit der Rolle des Zufalls und seiner Kontrolle beschäftigt, ist die Statistik, und in dem Maße, wie sie sich mit medizinischen Fragestellungen befaßt, die medizinische Statistik und Biometrie. Diese Tatsache hat oft den Eindruck hervorgerufen, daß die Allgemeine Epidemiologie quasi Teil der Medizinischen Statistik ist. Dies ist ohne Zweifel nicht so, da letztere formal auf die Entwicklung des Methodenapparates wie z.B. geeignete MeßinstruDas Wort hat die drei griechischen Stämme: epi = über, demos = das Volk, logos = Lehre, bedeutet also wörtlich übersetzt: „die Lehre über das Volk" und weist auf den engen Bezug zu einer anderen Lehre, die den demos-Stamm enthält: die Demographie.
1. Was ist Allgemeine Epidemiologie ?
13
mente, diagnostische und statistische Tests o.ä. ausgerichtet ist bzw. substantiell auch empirische Untersuchungsformen enthalten, die primär nicht der Epidemiologie zuzurechnen sind wie die randomisierte klinische Therapiestudie. Auf der anderen Seite wird oft der Versuch unternommen, methodisch-statistische Konzepte aus der Epidemiologie zu verbannen, oft unter dem Deckmantel einer deutschen Version der medizinischen Epidemiologie.3 Legt man internationale Maßstäbe zugrunde, und hier dient als Meßlatte oft immer noch der anglo-amerikanische Raum,4 so findet man, daß stochastische Konzepte aus der Epidemiologie nicht wegzudenken sind (Ahlboom und Norell 1991; Breslow und Day 1980). Nach Auffassung des Autors sind die Grenzen zwischen Allgemeiner Epidemiologie und Medizinischer Statistik fließend, wobei je nach wissenschaftlichem Standpunkt die eine oder andere Seite nuancierter Gewichtung bekommt. Man kann sich beide Gebiete in einem Schaubild vielleicht so vorstellen, wobei sich der schraffierte Teil in einer besonders lebhaften Entwicklung befindet, wie das ja häufig bei wissenschaftlichen Grenzgebieten der Fall ist.
Abb. 1.1: Abgrenzung der Gebiete Epidemiologie und Medizinische Statistik
Nach Aufassung des Autors sollte die Einheit des wissenschaftlichen Standpunktes und Vorgehens Betonung finden, der das Gemeinsame und Verbindende der wissenschaftlichen Idee hervorherhebt und Grenzen zu überwinden sucht. So kann, um ein Beispiel zu geben, ein Epidemiologe sich nicht erfolgreich um die Entwicklung eines 2 Man nennt eine solches Intervall auch Prädiktionsintervall. Trotz dieser an sich naheliegenden Forderung mit einem Prädiktionsintervall bei Prognosen zu arbeiten, ist es oft erschreckend zu sehen, wie gerne und hemmungslos an eine konkrete Zahl geglaubt wird. 3 Dies wird gar oft so weit getrieben, von dem Endziel einer Ent-Statistisierung der Epidemiologie zu reden. 4 Die Übergänge beginnen jedoch fließender zu werden. So warten viele südostasiatische Universitäten mit Studiengängen auf, die man von Deutschland aus nur mit Respekt betrachten kann.
14
l.Was ist Allgemeine
Epidemiologie?
geeigneten Studientypes zur Beantwortung epidemiologischer Fragen bemühen, ohne dabei gleichzeitig die Frage zu betrachten, wie im Rahmen der Studie epidemiologische Maßzahlen, wie. z.B. das Relative Risiko, richtig geschätzt werden können. Unter diesen Vorzeichen ist das vorliegende Buch entstanden, der ausgehend von typischen epidemiologischen Fragestellungen, über die jeweiligen Studientypen auf die jeweils typische statistische-epidemiologische Inferenz fuhrt. Dies soll unter Allgemeiner Epidemiologie verstanden werden, im Gegensatz etwa zu den Einzeldisziplinen der Epidemiologie wie die Epidemiologie der Herzkreislauferkrankungen, der Krebsepidemiologie, der Epidemiologie der Erkrankungen des Bewegungsapparates, der Epidemiologie der Geschlechtskrankheiten und HIV-Infektionen, der Epidemiologie der Verkehrsunfälle usw.. Für eine kurzübersichtliche Einfuhrung in diese Einzeldisziplinen sei auf das jüngst erschienene Lehrbuch von Brennecke und Schelp (1993) verwiesen. Häufig wird noch in deskriptive und analytische Epidemiologie unterschieden. Diese Unterscheidung zielt meist auf ein unterschiedliches methodisches Vorgehen bei der Behandlung eines bestimmten Themas ab (Pflanz 1973: 2). Trotz fließender Übergänge hat die deskriptive Epidemiologie mehr die Beschreibung der Verteilung von Krankheiten in Populationen im Auge, während sich die analytische Epidemiologie mehr mit der Untersuchung von gezielten Hypothesen zu Zusammenhängen von Krankheiten und deren möglicher Determinanten beschäftigt.
1. Was ist Allgemeine
Epidemiologie?
15
1.2 Krankheitsentstehung, Expositionen und Risiko/Präventivfaktoren Damit ist der Übergang zu der zweiten, vielleicht interessanteren und wichtigeren Seite der Epidemiologie erreicht. Diese wendet sich der Frage zu, welche Faktoren die Krankheitsentstehung beeinflussen. Das epidemiologische Forschen nach Krankheitsursachen hat eine lange Tradition und war zu Beginn der epidemiologischen Wissenschaft hauptsächlich auf Infektionskrankheiten ausgerichtet. Berühmt ist
®
Brunnen
• Cholerafälte
• 5 Fälle
Abb. 4. Der Ausbruch der Cholera im Golden-Square-Gebiet von London, August und September 1854 (nach MacMAHON u. PUCH aus: SNOW, }.: Snow on cholera. Hafner, New York 1965).
Abb. 1.2: Der Ausbruch der Cholera im Golden-Square-Gebiet von London im August und September 1854 (nach Pflanz 1973: 134)
16
l.Was ist Allgemeine
Epidemiologie?
Snow's Studie 1855 zur Cholera in London5 und die dazugehörige Karte (vgl. dazu Pflanz 1973: 134), in der neben den Krankheitsfällen die verschiedenen Trinkwasserbrunnen im Golden-Square-Distrikt von London eingezeichnet sind. Es ist eine deutliche Klumpung der Cholera-Fälle um den kontaminierten Brunnen zu erkennen, der zwischen Brauerei und Armenhaus gelegen ist. Die Epidemiologie war in ihrer frühen Phase dominiert von der Untersuchung der Infektionskrankheiten, also der Lehre von den Epidemien. Man stellte fest, daß die Verbreitung hochansteckender Infektionskrankheiten in auffälliger Weise variierte, ja sogar manchmal zyklischen Verläufen zu gleichen schien, mit drastischen Maximalwerten, den Epidemien. Es wurde erkannt, daß Menschen die Kontakt zu Erkrankten hatten, oft selbst erkrankten, und daß die wieder Gesundeten selten wieder erkrankten. Epidemien hatten in Europa gewaltige Ausmaße angenommen und die Bevölkerungen teilweise drastisch dezimiert. Die Angst der Bevölkerung vor ihnen spiegelt sich häufig in Malerei und Prosa wider. So waltet in Thomas Mann's Der Tod in Venedig die Cholera als gewaltige Macht des Grauens im Hintergrund. Im Laufe des medizinischen Fortschritts konnten viele Infektionskrankheiten erfolgreich bekämpft werden. Ein große Rolle spielte hierbei das Modell von Koch über das Zusammenspiel von Wirt, Agens und Umwelt, auch als das Kochsche Dreieck bekannt.6 Es besagt, daß es nur dann zu einer Erkrankung kommen kann, wenn alle drei Bedingungen zur gleichen Zeit am gleichen Ort zusammenkommen. Etwa bei der Cholera muß das Vorhandensein des Agens, des Bakterium Vibrio cholerae mit der Beschaffenheit der Umwelt, etwa der Möglichkeit zur Kontaminierung des Trinkwassers, mit einem entsprechenden Zustandes des Wirtes, etwa einer geschwächten Immunitätslage des Menschen zusammenkommen. Daraus ergeben sich wichtige Erkenntnisse über die Bekämpfung der Krankheitsausbreitung. So kann i.A. an allen drei Ecken des Kochschen Dreiecks angesetzt werden. So können, um beim Beispiel der Cholera zu bleiben, als prophylaktisch wirksame Maßnahmen sowohl die Aufbereitung des Trinkwassers als auch die fachgerechte Entsorgung der Fäkalien als auch die Verbesserung der körperlichen
5
6
Sie gilt heute auch als eine der historischen Wurzeln der kartographischen Epidemiologie, die mit Hilfe von Krankheitskarten Risikoquellen auf die Spur kommen will. Manchmal muß es noch durch eine vierte Ecke (den Vektor) ergänzt werden, wie etwa bei der Malaria.
1. Was ist Allgemeine Epidemiologie ?
17
Verfassung der Bevölkerung angesehen werden. Die allgemeinen Theorien über die Ausbreitung von infektiösen Krankheiten und ihre Bekämpfung beinhalten theoretische Modelle, die in ihren elaboriertesten Formen nicht ganz leicht zu verstehen sind. In den Industrienationen ist aufgrund eines relativ hohen Standards hinsichtlich Prophylaxe und Therapie die Bedeutung infektiöser Erkrankungen zurückgegangen. Teilweise hatte man sogar die Hoffnung, daß es gelingen würde, manche Infektionskrankheiten ganz von der Erde zu verbannen, was sich in vielen Fällen als nicht möglich gezeigt hat, wie etwa bei der Malaria. Im Jahre 1994 trat eine Epidemie7 von Lungenpest in Indien auf, die von großem öffentlichem Interesse und teilweise emotionalen, panischen Überreaktionen begleitet war, das sich auch in einem entsprechenden Medieninteresse niederschlug. Darüberhinaus sind neue Infektionskrankheiten wie AIDS hinzu gekommen, so daß Kenntnisse über die Allgemeine Epidemiologie infektiöser Erkrankungen weiterhin zu einem wichtigen Bestandteil epidemiologischen Wissens gehören.8 In den letzten Jahrzehnten richtete sich das Interesse zunehmend auf die Epidemiologie nicht-infektiöser Erkrankungen, wie die der malignen Erkrankungen. So konnte die Bedeutung des Rauchens bei der Entstehung des Lungenkrebses gefunden werden. Andere Studien wiesen auf die Bedeutung ionisierender Strahlen oder chemischer Substanzen bei der Enstehung mancher Krebsarten hin. Ein weiteres großes Anwendungsgebiet der Epidemiologie sind die kardiovaskulären Erkrankungen. Der Herzinfarkt ist zu einer der fuhrenden Todesursachen in den Industrienationen geworden. In der Epidemiologie wird nun untersucht, welche Faktoren oder Expositionen mit der jeweiligen Erkrankung zusammenhängen. Häufig ist nicht nur ein Faktor relevant, sondern ein ganzes Spektrum von Faktoren, man spricht auch von einer multifaktoriellen Erkrankungsursache. Für die kardiovaskulären Erkrankungen ist dies das Spektrum „Lebensstil", hinter dem sich Faktoren wie Streß, geringe körper-
7
8
Allerdings wurde von offiziellen Stellen immer wieder darauf verwiesen, daß es sich um keine eigentliche „Epidemie" handele - geprägt von dem Wunsch der Gesundheitsbehörden die auftretenden Panikreaktionen zu dämpfen. Um so bedauerlich ist es, daß dieses Gebiet hierzulande wenig gepflegt wird. Die Arbeitsgruppe um Professor Dietz in Tübingen ist eher die Ausnahme.
18
1. Was ist Allgemeine
Epidemiologie?
liehe Aktivität, hohe Kalorienzufuhr und hoher Anteil gesättigter Fettsäuren in der Nahrung verbergen (Ahlbohm und Norell 1991: 9).
DEADLY SPEED f Why Plague Is So Feared
Plague moves quickly. The bacterium Yersinia pestis is spread among rats by fleas. As the rodents die off, the insects turn to humans, From a hue on the skin the bacteria move through a person's circulatory system to cause BUBONIC PLAGUE, After a week, the •-•ictim turns gravely III, experiencing a sudden fever of 40'C., vomiting, muscle pain and delirium. The body's lymph nodes, especially at the groir., armpits and neck, become swollen and painful. Known as buboes, they give the disease its name. In 60%-90% of cases, an untreated victim dies within a few days.
When plague bacteria reach the lungs, they are spread through the air in the droplets of a victim's cough. This is known as PNEUMONIC PIAGUE, more contagious and more deadly. Once inhaled it progresses rapidly. If not treated within fifteen hours of symptoms, it kills within three days — in virtually all cases.
Plague has a terrible HISTORY. A 6th Century epidemic in Europe and Asia is thought to have killed 100 million people. The notorious Black Death of the 14th Century wiped out some 75 million people in Europe, or up to half the continent's population. It was known as the Black Death for good reason. Bubonic plague creates dark blotches from bleeding m into the skin. Pneumonic plague turns the victim's complexion the color of slate.
i m ,
m
But TREATMENT is straightforward. For both types, the antibiotics tetracycline, streptomycin, kanamycin snd cholamphenicol are effective if used early enough.
Abb. 1.3: Breites öffentliches Interesse an Infektionsepidemiologie nach einer 1994 in Indien aufgetretenen Epidemie von Lungenpest (nach Asiaweek Oktober 1994)
Faktoren oder Expositionen, bei deren Vorhandensein die Erkrankungswahrscheinlichkeit erhöht ist, werden Risikofaktoren genannt. Ein wichtiges Ziel epidemiologischen Vorgehens ist das Auffinden solcher Risikofaktoren. Die Kenntnis solcher Risikofaktoren ermöglicht erst die sinnvolle Ausarbeitung präventivmedizinischer Konzepte. Oft wird die Epidemiologie als die Basismethode der Sozialmedizin, jedenfalls dort, wo sie sich als Präventivmedizin versteht, bezeichnet (Keil 1986). Unter Präventivmedizin versteht man nach Keil (1986) alle medizinischen und sozialen Anstrengungen, die Gesundheit zu fordern und Krankheit und Unfälle sowie deren Folgen zu verhüten. In ähnlicher Intention definieren Brennecke und Schelp (1993: 9) das Ziel der Sozialmedizin die „effektive und effiziente Vermeidung oder Bewältigung gesundheitlicher Probleme und deren soziale Folgen bei Einzelnen und in der
1. Was ist Allgemeine Epidemiologie?
19
Bevölkerung". Ähnlich räumen sie der Epidemiologie die Bedeutung der Methode der Sozialmedizin ein. Man kann sich dies schematisch so vorstellen:
Sozialmedizin
&
Epidemiologie
Abb. 1.4: Abgrenzung der Gebiete Sozialmedizin und Epidemiologie
Präventivmedizinische Konzepte haben in viele Bereiche unseres gesellschaftlichen Lebens Eingang gefunden. Es seien die Trinkwasserfluoridierung, die Warnungen vor dem Zigarettenrauchen, die Elimination von kanzerogenen Stoffen am Arbeitsplatz, die Geschwindigkeitsbegrenzungen im Straßenverkehr oder die Einführung von Krankheitsfrüherkennungsuntersuchungen erwähnt. Aber nicht nur bei der Etablierung eines Risikofaktors (der sog. Epidemiologischen Beweisfiihrung und ihrer verschiedenen Stadien) spielen epidemiologische Methoden eine große Rolle, auch bei der Begleitung präventiv-medizinischer Maßnahmen übernimmt die Epidemiologie eine wichtige Funktion. Dies trifft nicht nur für nicht-infektiöse Erkrankungen zu, bei denen man in der Regel durch geeignete Vergleichsgruppen recht zuverlässige Effektschätzungen erhalten kann, sondern insbesondere auch für Interventionsprogramme wie Impfungen zur Bekämpfung infektiöser Erkrankungen. Hier hat man in der Regel keine geographisch und zeitlich verfügbare Vergleichsgruppe, in der man der Epidemie „freien Lauf' gelassen hat. Diese Situation stellt hohe Anforderungen an die Modellbildung in der Epidemiologie, da es auch gerade hier auf eine Effektivitätsanalyse ankommt. Allein aus einem etwaigen Rückgang der Neuerkranksraten auf einen Erfolg des Präventionsprogrammes zu schließen, ist angesichts des zyklischen Verlaufes vieler Epidemien auch bei keinerlei Intervention äußerst bedenklich. In der Prävention wird die primäre von der sekundären und tertiären unterschieden. Unter der primären Prävention versteht man „die Förderung der Gesundheit und die Verhütung von Krankheit durch Beseitigung eines oder mehrerer ursächlicher
20
1- Waj ist Allgemeine Epidemiologie?
Faktoren, Erhöhung der Resistenz von Individuen und Veränderung von Umweltfaktoren, die ursächlich oder als Überträger an der Krankheitsentstehung beteiligt sind" (Keil 1986: 89). Unter sekundärer Prävention versteht man Krankheitsfrüherkennung und nachfolgende Behandlung, während die tertiäre Prävention die Aufgabe hat, bei eingetretener Krankheit ein Fortschreiten bzw. Rezidivbildung zu verhüten. Bei der primären Prävention wird weiterhin zwischen Maßnahmen spezifischer und unspezifischer Art unterschieden. Unspezifische Maßnahmen der primären Prävention dienen allgemein der Gesundheit des Einzelnen und der Bevölkerung, ohne daß sie auf die Prävention einer spezifischen Krankheit ausgerichtet sind. Zu solchen Maßnahmen zählen etwa gute Ernährung, adäquate Wohnverhältnisse oder Kleidung, ausreichender Erholungsurlaub, o.ä. Zu den spezifischen präventiven Maßnahmen zählen etwa Impfungen (gegen Masern, Pocken, Poliomyelitis, Tetanus, usw.). Die weltweite Ausrottung der Pocken ist als großer Erfolg spezifischer, primärer Prävention zu nennen. Bei den nicht-infektiösen Krankheiten können als Beispiele primäre Prävention alle die Maßnahmen genannt werden, die zu einer Senkung des Risikofaktors bzw. der Exposition bis hin zur Nicht-Exposition fuhren, wie etwa das Einstellen des Rauchens (Reduktion des Lungekrebsrisikos), die Reduktion des Alkoholkonsums (Reduktion des Risikos für Leberzirrhose) oder das Anlegen des Sicherheitsgurtes im Straßenverkehrs (Dämpfung der Verletzungsfolgen aufgrund eines Verkehrsunfalles). Diese Beispiele mögen genügen, um auf die enge Verknüpfung von epidemiologischen Modellen der Krankheitsentstehung (Risikofaktormodell) und Krankheitsprävention zu verweisen.9
9
In diesem Zusammenhang wird in der Literatur an manchen Stellen darauf hingewiesen, daß es wenig Sinn macht, unveränderliche Faktoren wie das Geschlecht oder die Hautfarbe als Riskofaktoren zu bezeichnen, da sie ja nicht verändert werden können. Dieser Ansicht soll sich hier nicht angeschlossen werden, da es durchaus einen präventivmedizinischen Sinn macht, etwa hellhäutige Menschen vor einer direkten Sonneneinstrahlung zu warnen, um hier Hautkrebsrisiko zu senken (wie auch die unangenehmen Folgen des Sonnenbrandes).
2. Epidemiologische Grundlagen 2.1 Epidemiologische Studientypen und epidemiologische Studienplanung Die Wahl des Studientyps ist der Kern einer geplanten epidemiologischen Studie. Diese Wahl hängt von vielerlei Gesichtspunkten ab, insbesondere der Art der Fragestellung und der Qualität der zu untersuchenden Hypothesen, so daß im Einzelnen zu prüfen ist, welcher Studientyp bei der gegebenen Fragestellung angemessen und auch durchführbar ist. Im folgenden sollen nun einige Prototypen epidemiologischer Studientypen vorgestellt werden. Bei Querschnittsstudien wird zu einem bestimmten Zeitpunkt bzw. in einer bestimmten Zeitspanne die Population oder Teile davon, im Idealfalle mit einer repräsentativen Stichprobe untersucht. Dabei bedeutet repräsentativ, daß die Verteilung der relevanten Merkmale der Stichprobe mit denen der Population übereinstimmt. Eine häufige Methode der Herstellung einer repräsentativen Stichprobe ist die Zufallsstichprobe, deren wesentliches Kennzeichen ist, daß jedes Element der Grundgesamtheit die gleiche Wahrscheinlichkeit besitzt, in die Stichprobe aufgenommen zu werden, und das die Auswahl unterschiedlicher Stichprobenelemente unabhängig voneinander geschieht.10 Die Querschnittsstudie wird häufig in der Epidemiologie zur Schätzung der Prävalenz verwendet. Die Prävalenz bezeichnet die Anzahl der Erkrankungsfalle zu einem bestimmten Zeitpunkt (Punktprävalenz) bzw. in einem bestimmten Zeitabschnitt (Periodenprävalenz)11 bezogen auf die betrachtete Grundgesamtheit. Querschnittsstudien erlauben auch zu einem gewissen Maß die Untersuchung von Zusammenhängen von Expositionen und Erkrankungen. Die aus solchen
'1
Häufig liegt der Zufallsstichprobe die Vorstellung des Urnenprinzips zugrunde. Alle Mitglieder einer Population werden durchnumeriert und die entsprechenden Zahlen in eine Urne gelegt, aus der dann sooft gezogen wird, wie der Umfang der Stichprobe erfordert. Nach jeder Ziehung ist zur Herstellung gleicher Chancen sorgfältig zu mischen. Heute bieten fast alle statistischen Programmpakete wie SPSS oder Minitab Möglichkeiten zur Realisierung solcher Zufallsstichproben. Welche Form der Prävalenz man wählen wird, hängt von der Form der betrachteten Erkrankung ab: bei chronischen, langdauemden Erkrankungen wird man eher die Punktprävalenz, bei akuten, kurzzeitigen Erkrankungen eher die Periodenprävalenz wählen.
22
2.Epidemiologische
Grundlagen
Untersuchungen hervorgehenden Schätzungen des Relativen Risikos werden auch Prävalenz-Relatives-Risiko bzw. Prävalenz-Odds-Ratio (vgl. Kapitel 3 und 4) genannt. Es ist jedoch oft nicht möglich, in dieser Form von Studientyp eine zeitliche Abfolge von Exposition und Erkrankung zu rekonstruieren; bei den meisten Erkrankungen spielt darüber hinaus die Dauer der Exposition eine zentrale Rolle, die mit diesem Studientyp nur unzureichend analysiert werden kann. Die Vorteile dieser Studie liegen in ihrer leichten Praktikabilität, Durchführbarkeit, und logistischen Handhabbarkeit. Bei der Kohorten- (oder prospektiven) Studie werden Gruppen bzw. Stichproben aus der nicht-erkrankten Population betrachtet, die sich im allgemeinen hinsichtlich verschiedener Expositionen unterscheiden, und man stellt dann fest, wieviele der Personen unter Risiko12 im Studienzeitraum (z.B. 12 Monate, 5 Jahre usw.) an der interessierenden Erkrankung erkranken. Die epidemiologische Maßzahl wird hier oft die Inzidenz (vgl. auch den nächsten Abschnitt 2.2) sein. Am Ende der Kohortenstudie steht die Möglichkeit, das Erkrankungsrisiko in allen Kohorten direkt zu schätzen und miteinander in Beziehung zu setzen. Von allen epidemiologischen Studientypen wird diesem die höchste Überzeugungskraft zugeschrieben. Sie hat jedoch auch eine Reihe von Nachteilen, die in dem oft langen Studienzeitraum (z.B. gibt es Kohortenstudien mit einem Studienzeitraum von einem halben Jahrhundert) und dem komplexen Studienverlauf (Mobilität der Teilnehmer, „Drop-Out"-Problematik, Wechseln der Exposition, usw.) zu sehen sind. Häufig versterben auch die mit der Durchfuhrung betrauten Arbeitsgruppen. Die Kosten und die Aufwendungen von Kohortenstudien sind im allgemeinen hoch. Fall-Kontrollstudien beginnen mit erkrankten Personen, die nachträglich auf das Vorliegen einer interessierenden Exposition untersucht werden. Dies wird in einem zweiten Schritt an einer Gruppe oder Stichprobe von Kontrollpersonen in analoger Weise durchgeführt. Es gehört zu den bemerkenswerten Resultaten der Epidemiologie, daß auch mit diesem Studientyp das relative Erkrankungsrisiko (zumindest approximativ) geschätzt werden kann (vgl. Kapitel 4). Der Vorteil dieses Studienty-
12
Dies sind die Personen, die zu Beginn der Kohortenstudie vorhanden waren.
2.Epidemiologische Grundlagen
23
pes (insbesondere im Vergleich zur Kohortenstudie) liegt in der kurzen Studiendauer, in der Eignung für Erkrankungen mit langer Latenzzeit und geringer Inzidenz, dem kleinen personellen und finanziellen Aufwand. Das häufige Problem der FallKontrollstudien ist die fehlende Repräsentativität der Kontrollstichprobe, da oft auf Krankenhauspatienten als Kontrollpopulation zurückgegriffen wird. Man unterscheidet noch, ob die Fall-Kontrollstdudie unter Paarbildung durchgeführt wird. Beide Prinzipien haben Vor- und Nachteile wie in Kapitel 5 ausgeführt werden wird. Wie auch immer entschieden wird, mit oder ohne Paarbildung die Studie durchzufuhren, es muß beim weiteren methodischen Vorgehen berücksichtigt werden. Ein weiterer Studientyp, der häufig in der Epidemiologie Verwendung findet, ist die ökologische Studie. Hier dient als statistische Einheit nicht die Person, sondern ganze Gruppen von Personen bilden die Basis, auf die sich die Informationen beziehen. Häufig werden eine ganze Reihe von Daten auf der Basis bestimmter Aggregierungen gesammelt. So stehen oft Informationen auf Kreis oder Regierungsbezirksebene in der Bundesrepublik zur Verfügung oder werden von den Statistischen Ämtern zur Verfugung gestellt. So kann auf Kreisebene nicht nur die Rate der Lungenkrebstodesfälle sondern auch der Raucheranteil, der durchschnittliche Alkoholkonsum, die durchschnittliche Luftverschmutzung im TSP (total suspended particle), Jahresmittel o.ä. ermittelt werden. Es liegt nun nahe, diese aggregierten Daten weiter zu analysieren. Dabei wird immer wieder vor dem ökologischen Fehlschluß gewarnt. Dieser wird in der Abbildung 2.1 verdeutlicht.
24
2.Epidemiologische
5
Drundlagen
Effektmaß
J
4
3
2
0
2
3
4
5
Exposition Abb. 2.1: Möglicher Fehlschluß in der ökologischen Studie
Während in den Individualdaten ein positiver Effekt mit der Exposition zu erkennen ist, kehrt sich dieser ins negative um, wenn man nur Expositionsmittelwerte betrachtet. Trotzdem erfreut sich dieser Ansatz großer Beliebtheit, weil er wenig aufwendig und mit relativ elementaren Mitteln zu verwirklichen ist. Man sollte ökologische Studien nicht von vorneherein aus dem Repertoire epidemiologischer Studientypen ausschließen, da sie durchaus eine wichtige Funktion bei der Untersuchung und Generierung epidemiologischer Hypothesen übernehmen können. Gefundene Zusammenhänge müssen jedoch mit der gerade hier gebotenen Zurückhaltung interpretiert werden. Nach Bestimmung des Studientyps sollte der Studienplan gewählt werden. Hier wird die Studienpopulation definiert, sowie Ort und Zeit der Durchführung der Studie. Die Beobachtungseinheiten (z.B. Patienten, Probanden,
Haushalte, Kliniken
oder Regionen) werden festgelegt und die Ein- und Ausschlußkriterien angegeben. Es soll möglichst präzise definiert werden, welche Krankheit mit welchen diagnostischen Kriterien untersucht wird. Es sind die Zielvariablen (z.B. Auftreten von Lippenkrebs), die zu untersuchenden Einflußfaktoren (z.B. Sonnenexposition) wie auch mögliche Störgrößen (z.B. Rauchen, Alter,...) anzugeben bzw. zu definieren. Für alle
2. Epidemiologische
Grundlagen
25
zu betrachtenden Variablen müssen die Meßmethoden genannt werden. Die Entwicklung von geeigneten Meßmethoden ist ein eigenes Gebiet, das vom jeweils zu untersuchenden Gegendstandsbereich her angegangen werden sollte. Zu ihm gehören Fragebogen- und Interviewverfahren unter Umständen zur Konstruktion quantitativer Skalen, medizinische Untersuchungen, Laboruntersuchungen, Screening-Verfahren, diagnostische Verfahren. Es ist darauf zu achten, das die Meßmethoden standardisiert angewendet werden, also z.B. muß eine Schulung von Interviewern erfolgen, insbesondere wenn die Studie an verschiedenen Orten durchgeführt wird. Es müssen geeignete Programme zur Datenerfassung, -eingäbe, -editierung, und -haltung herangezogen werden und Schulungsprogramme des Personals für die sachgerechte Bedienung dieser Verfahren sind in vielen Fällen unumgänglich. Es ist darauf zu achten, daß die eingesetzte Software zur Datenerfassung und -haltung hinreichend flexibel ist, um verschiedene Datenquellen zusammenzufuhren und danach den Einsatz von Software zur statistisch-epidemiologischen Auswertung zu gestatten. Kontrollstichproben zur Abschätzung der Datenfehler sind oft ratsam. Diese erwähnten Details (zusätzlich noch der zu diskutierend statistisch-epidemiologischen Verfahren nebst Angabe der Art angestrebten Stichprobenziehung und ihres Umfangs) werden in einem Studienprotokoll vor Beginn und Durchführung der Studie festgelegt, in die auch die organisatorischen Fragen, die Erklärung über Verantwortlichkeiten (insbesondere wenn es zu Abweichungen vom Studienprotokoll kommt), Rechte über die erhobenen Daten und der sich daraus ergebenen Publikationsmöglichkeiten aufgenommen werden sollten. Ein hilfreicher Leitfaden zur Abfassung von Studienanträgen mit allgemeinen Überlegungen für die Planung und Durchführung epidemiologischer Studien ist von Wichmann und Lehmacher (1991) zusammengestellt worden.
26
2.Epidemiologische Grundlagen
2.2 Die epidemiologischen Maßzahlen: Prävalenz, kumulative Inzidenz und die Inzidenzdichte Mit der Prävalenz, oder genauer der Prävalenzrate versucht man den Anteil der Personen, die in einem bestimmten Zeitraum und einem gegebenen Gebiet an einer spezifischen Erkrankung erkrankt sind, zu charakterisieren. Präzise definiert man die
, Anzahl der erkrankten Personen Prävalenzrate p = A n Z ahl der Personen unter Risiko
(2 !)
'
Im Nenner von (2.1) taucht der Begriff Personen unter Risiko auf. Darunter sind die Personen zu verstehen, die prinzipiell die Erkrankung erhalten können. Beispiel. In einem waldreichen Gebiet im nordöstlichen Thailand ist Malaria prävalent. Auf 1000 Personen findet man 50 Malariafälle in einem Jahr (Daten sind fiktiv). Daraus ergibt sich eine Prävalenzrate von Malaria p = 50/1.000 = 0,05. Beispiel. In einer Studie im Zusammenhang mit AIDS findet man in einer Hochrisikogruppe von 1.000 Männern 200 HIV-positiv. Man berechnet die Prävalenzrate von HIV+ als p = 200/1.000 = 0,20. Für die Aufgaben der Epidemiologie, insbesondere zur Erkennung von substantiellen Veränderungen im Krankheitsgeschehen, ist häufig noch ein anderes Maß von Interesse: die inzidenz. Mit diesem Maß versucht man die Neuerkrankungsrate zu charakterisieren, insbesondere ist hier die kumulative Inzidenzrate CIR von Interesse. Sie ist definiert als
_
Anzahl der Neuerkrankungen im Studienzeitraum Anzahl der Personen unter Risiko zu Beginn der Studie
"'
Die Bildung der kumulativen Inzidenzrate wird in Abbildung 2.2 veranschaulicht. Fünf Personen befinden sich in den Studienzeitraum, allerdings ist die vierte Person schon zu Studienbeginn erkrankt. Zwei Personen erkranken innerhalb des Studien-
2.Epidemiologische Grundlagen
27
Zeitraumes, daher CIR = 2/4. Man beachte, daß hier die Prävalenz bezogen auf den Studienzeitraum als 2/5 berechnet würde. 13
6
Fünf Personen
5 4 3 2 ^
Krankheitsfall
1 ^
o
0
1
Krankheitsfall
3
5
Studienzeitraum
Abb. 2.2: Veranschaulichung der Neuerkrankungsrate, hier CIR=2/4
Man beachte, daß es nicht nötig ist, den Beginn des Studienzeitpunktes für alle Personen als identisch zu fordern. Dies veranschaulicht die Abbildung 2.3, in der eine Erkrankung eines Neugeborenen innerhalb der ersten 12 Lebensmonate betrachtet wird. Dann rechnet der Studienzeitraum von dem Geburtszeitpunkt an bis zur Vollendung des ersten Lebensjahres. Dann läßt sich die kumulative Inzidenzrate für eine spezifische Erkrankung etwa aller im Jahre 1994 geborener Kinder betrachten.
13
Manchmal wird zwischen der Punktprävalenz, die sich auf einen einzigen Zeitpunkt bezieht, und der Intervallprävalenz unterschieden. Letztere bezieht sich auf einen ganzen Zeitraum und ist hier gemeint.
28
2. Epidemiologische
6
Grundlagen
Fünf Neugeborene
5 4 3
2
*
Krankheitsfall
1
0 0
1
2
3
4
5
6
7
8
9
1 0 11 1 2 1 3 1 4 1 5 1 6 17 1 8 19 2 0
Studienzeitraum (in Monaten)
Abb. 2.3: Veranschaulichung der Neuerkrankungsrate mit flexiblen Studienbeginn am Beispiel einer Infektionserkrankung bei Neugeborenen innerhalb der ersten 12 Monate, CIR=l/5
Ein anderes, ganz wichtiges Maß für die Morbiditätsbeschreibung ist die Inzidenzdichte. Bei der Bildung dieser Maßzahl versucht man der Tatsache Rechnung zu tragen, daß verschiedene Personen unterschiedlich lange im Studienzeitraum unter Risiko stehen. Beispielsweise sind Arbeiter in einem Betrieb ganz unterschiedlich lange beschäftigt und daher auch ganz unterschiedlich lange unter Risiko, die betreffende Krankheit, z.B. eine Erkrankung der Atemwege, zu erlangen. Dies veranschaulicht die Abbildung 2.4. Hier werden fünf Fabrikarbeiter dargestellt, wobei der erste 12 Monate, der zweite 2 Monate (mit anschließendem Krankheitsfall), der dritte 6 Monate, der vierte 12 Monate und der fünfte 5 Monate unter Risiko stand. Bei der Bildung der Inzidenzdichte ID relativiert man nun die Anzahl der aufgetretenen Krankheitsfälle an der Gescimtpersonenzeit unter Risiko, das ist die Zeitensumme, in der als Einzelsummanden die Risikozeiten der einzelnen Personen eingehen.
2.Epidemiologische
Grundlagen
29
Fünf Fabrikarbeiter
6 5 4 3 2 1
0 0
1
2
3
4
5
6
7
8
9
10 11 12 13 14 15 16 17 18 19 20
Studienzeitraum (in Monaten)
Abb. 2.4: Veranschaulichung der Inzidenzdichte am Beispiel von fünf Arbeitern mit verschiedenen Beschäftigungszeiten, ID = 1/37
Im obigen Beispiel sind dies 12+2+6+12+5 = 37 Monate. Ist Tj die Zeit unter Risiko der i-ten Person in der Studie, dann ist die Inzidenzdichte definiert als
., , Anzahl der Krankheitsfälle im Studienzeitraum T Inzidenzdichte ID = 7; — r—7—^rr^—— Gesamtpersonenzeit unter Risiko T
, „, '
v(2.3)
wobei die Gesamtpersonenzeit unter Risiko T = T1+T2+...+Tn bei einer Gesamtzahl von n Personen gegeben ist. Im obigen Beispiel ist die Inzidenzdichte ID = 1/37. Zur weiteren Diskussion
dieser
Begriffe vergleiche man Ahlbohm
und Norell
(1991: 13-16). Während die Prävalenz und kumulative Inzidenz als Raten Anteilswerte darstellen und damit als Risiken interpretierbar sind, ist die Inzidenzdichte keine Rate in dem Sinne, daß der Zähler ein Teil des Nenners wäre. Sie ist als Morbiditätskraft interpretierbar.
30
2.Epidemiologische
Grundlagen
Neben diesen grundlegenden Maßzahlen gibt es eine Reihe weiterer Maßzahlen, die zum Fundament epidemiologischen Vorgehens gehören. Da sich das epidemiologische Interesse oft auf die vulnerablen gesellschaftlichen Gruppen richtet (und dies sind oft die ganz jungen und ganz alten Menschen), können diese weiteren Maßzahlen nach geburtsbezogenen und todesfallbezogenen unterschieden werden.14 Es werden nun einige dieser Maßzahlen angegeben und für eine tiefere Diskussion wird auf Rimm u.a. (1980: 282) verwiesen. Geburtsbezogen:15 , _ , Anzahl der Geburten rohe Geburtsrate = A n z a h l der Gesamtpopulation
, „„„ °
x
100
, , , . . Anzahl der Geburten Fruchtbarkeitsrate* = Anzahl der Frauen zwischen 15 und 44 Jahren x
1 000
,,..,. Anzahl der Todesfälle unter einem Jahr Säughngssterblichkeitsrate = A n z a h l d e r Geburten in der Population x
1 000
perinatale Sterblichkeitsrate ~
Anzahl der Totgeburten und Todesfälle in den ersten 7 Lebenstagen Anzahl der Geburten und Totgeburten in der Population
, „ Anzahl der Todesfälle unter 28 Lebenstagen neonatale Sterblichkeitsrate = A n z a h ] d e r G e b u r t e n j n d e r P o p u l a t i o n x 1.000 Todesfallbezogen: , ^ . Anzahl der Todesfälle rohe Sterberate = A n z a h l der Gesamtpopulation
x
,
1000
proportionale Sterberate = Anzahl der Todesfälle aufgrund einer spezifischen Erkrankung Anzahl aller Todesfälle
x
100
Müttersterblichkeitsrate = Anzahl der T o d e s f ä lle von Frauen an den Folg. von Komplik. der Schwangersch. — — x 100.000 Anzahl der Geburten in der Population
14
Zur Vermeidung führender Nullen nach dem Komma werden diese Raten oft mit einer geeigneten Zahl (häufig 1.000) multipliziert. Es sei darauf hingewiesen, daß es sich bei einigen der folgenden Maßzahlen um keine Raten in dem strengen Sinne handelt, daß der Zähler ein Teil des Nenners ist. Diese werden mit einem * gekennzeichnet.
2.Epidemiologische
Grundlagen
31
Oft werden diese Raten zur Diagnostik zeitlicher Trends graphisch veranschaulicht. Die Entwicklung der Müttersterblichkeit in der Bundesrepublik Deutschland wird in der Abbildung 2.5 dargestellt (Abbildungskonstruktion nach Pschyrembel Klinisches Wörterbuch 1990: 1087).
160
Gestorbene Mütter auf 100.000 Geburten
0
i
1956
1960
1964
1968
1972
1976
1980
Jahre
Abb. 2.5: Entwicklung der Müttersterblichkeit in den alten Bundesländern, 1956-1980, nach Pschyrembel (1980)
Zwei Tendenzen werden sichtbar. Zunächst gibt es eine allgemeine, lineare Verbesserung mit einem abflachenden Knick im Jahre 1966. Von 1956 bis 1966 senkt sich die Müttersterblichkeitsrate von 140 auf 65 Todesfälle auf 100.000 Geburten pro Jahr, das sind 7,5 Todesfälle weniger, dann von 1966 mit 65 bis 1980 mit 20 Todesfällen auf 100.000 Geburten pro Jahr, das sind 3,2 Todesfälle pro Jahr weniger. Für eine weitere Diskussion dieser und anderer bevölkerungsrelevanter Maßzahlen sei auf Mueller (1993) verwiesen.
32
2.Epidemiologische
Grundlagen
2.3 Epidemiologische Stichprobenmodelle: Binomial- und Poissonverteilung Zunächst soll auf die Binomialverteilung eingegangen werden, die für Raten ein „natürliches" Stichprobenmodell darstellt. Um beispielsweise eine unbekannte Prävalenzrate p zu schätzen, wird eine Stichprobe16 betrachtet: X,, X2,...,X„, d.h. man hat n Personen, die entweder gesund (X=0) oder erkrankt (X=l) sein können. Man erhält Tab. 2.1: Veranschaulichung der Entstehung der Binomialverteilung Stichprobengröße n
1
2
3
Anzahl der Erkrank- mögliche Stichpro-
Wahrscheinlichkeit
Wahrscheinlichkeit
ten = k
ben
0
0
1-p
1-P
1
1
P
P
0
00
(1-P) 2
(1-P) 2
1
01
(1-P)P
2(l-p)p
10
P(l-P)
2
11
P
0
000
(1-P) 3
(1-P) 3
1
001
(1"P)2P
3(l-p) 2 p
010 100 2 011 101 110
von k
2
P
2
(1"P)2P (1"P)2P
( i W
3(l-p)p 2
(1"P)P2 (1"P)P2
4
3
3
111
P
0
0000
(1-P)'
Hiermit ist eine zufällige Auswahl von Personen aus einer Population gemeint.
P
3
(1-P)"
2.Epidemiologische
Grundlagen
33
aus der Stichprobe als Schätzung p für die Prävalenz in der Population die Anzahl der Erkrankten in der Stichprobe K
A
1
= P = X = -
.
1 "
(X,+X2...+XB) = -
,
£ XJ . F ü r i=l
n
die statistische Inferenz 17 ist daher die Verteilung von X X j , also der Anzahl der Eri=l
krankten in der Stichprobe von Interesse. In der Tabelle 2.1 ist die Verteilung der Variablen Anzahl der Erkrankten für verschiedene Stichprobengrößen n aufgeführt. Man sieht sofort, daß für den Fall der Stichprobengröße n=l nur zwei Realisationen möglich sind: die Person ist erkrankt (X,=l) oder nicht (X,=0). Diese beiden Ereignisse haben die Wahrscheinlichkeit 18 Pr{X|=l} = p bzw. Pr{X,=0} = 1-p. Für n=2 sind vier unterschiedliche Stichproben möglich: 00, 01, 10, 11. Die Wahrscheinlichkeit jedes einzelnen Ergebnisses erhält man als Produkt der Einzelwahrscheinlichkeiten für 0 oder 1, z.B. Pr{01} = Pr{X,=0}x Pr{X,=l} = (l-p)p. Von Interesse ist ja das Ereignis Anzahl der Erkrankten =k, z. B. Anzahl der Erkrankten = 1. Dieses Ereignis liegt genau dann vor, wenn die Stichprobe 01 oder 10 aufgetreten ist. Man erhält: Pr{Anzahl der Erkrankten = 1} = Pr {01 oder 10} = Pr{01} + Pr{10} 19 = 2p(lp). Man erkennt nun leicht aus der Tabelle 2.1, nach welchem Prinzip die Verteilung der Anzahl der Erkrankten entsteht. Offenbar ist im allgemeinen Fall der Stichprobengröße n jede Stichprobe durch eine Folge bestehend aus Nullen und Einsen, etwa 01100...1, gegeben. Jedes dieser Folgen hat die Wahrscheinlichkeit p k (l-p)" '. Daraus ergibt sich, daß die Wahrscheinlichkeit, daß die Anzahl der Erkrankten = k ist, gegeben ist durch pk( 1 -p) nk multipliziert mit der Anzahl der Folgen mit genau k Einsen und n-k Nullen. Ist z.B. n=4 und man fragt nach der Wahrscheinlichkeit, daß die Anzahl der Erkrankten = 2 ist, so stellt man fest, daß es genau sechs Folgen der Länge 4 mit genau 2 Einsen und 2 Nullen gibt, nämlich 1100, 1001, 0011, 1010, 0110, 0101.
Dies meint die siatistischen Verfahren, die mit der Einschätzung der Zufallsvariabilität des Schätzers einhergehen, also beispielsweise Konfidenzintervalle oder statistische Tests. ^ Für den Begriff der Wahrscheinlichkeit wird hier das Symbol „Pr" (von „probability") verwendet. 19 Dies folgt aus dem Additionssatz fiir einander ausschließende Ereignisse A und B: Die Wahrscheinlichkeit, daß A oder B eintritt, ergibt sich als die Summe der Einzelwahrscheinlichkeiten: Pr{A oder B} = Pr{A} + Pr{B}. 1
34
2.Epidemiologische
Grundlagen
Daher ist bei n=4 die Wahrscheinlichkeit Pr{Anzahl der Erkrankten = 2} = 6p 2 (l-p) 2 . Allgemein ist diese Wahrscheinlichkeit
Pr{Anzahl der Erkrankten =k } = b(k,n) pk(l-p)""k
(2.4)
wobei mit b(k,n) die Anzahl der Folgen mit genau k Einsen und n-k Nullen beschrien! ben wird. Dieser Koeffizient heißt Binomialkoeffizient
und wird mit
berechnet und mit Q bezeichnet. Man schreibt (2.4) daher als ?\{Anzahl der Erkrankten =k }= (£} pk(l-prk und nennt sie die Binomialverteilung.
Abbildung 2.6 und Abbildung 2.7 zeigt die
Binomialverteilung für einige ausgewählte Werte für n und p. Zunächst ist sie in Abbildung 2.6 für n=10 und p=0,l und p=0,5 zu sehen, im zweiten Fall ist die Sym-
0.5
• p = 0,10 M p = 0,50
0.4
0.3
0.2
0.1
0
1
2
3
4
5
7
Anzahl der Erkrankten
Abb. 2.6: Binomialverteilung für n=10, p=0,10 und p=0,50
8
9
10
2.Epidemiologische
Grundlagen
35
0.14
0.12
0.1
0.08
,) VpKl-pO/n + poil-poVn
(312)
angesehen werden. Zur Gewinnung von (3.12) wurde nur benutzt, daß Var( p ) = p(l-p)/n ist, also Var(p, - p0) = p,(l-p,)/n + p0(l-p0)/n, da die beiden Kohorten als statistisch unabhängig angesehen werden. Nach dem zentralen Grenzwertsatz ist (3.12) annähernd Standard normal verteilt (vgl. Abschnitt 2.3). Der statistische Test auf der Basis von (3.12) wird nun so konstruiert, daß zunächst eine Wahrscheinlichkeit a fUr den Fehler 1. Art37 fixiert wird, z.B. a=0,05,
37
Dies ist die Wahrscheinlichkeit der (Fehl-)Entscheidung fiir H h wenn Ho Gültigkeit hat.
60
3. Das Kohortenmodell
und dann das (l-a/2)-Quantil der Standardnormalverteilung Z1ki/2 gefunden wird. 38 Man beachte, daß W bei Gültigkeit der Nullhypothese 5=p,-p 0 =0 die Gestalt z
(p
' ~Pn) Vpi(l-p,)/n + p0(l-p0)/n
annimmt. Ist nun -z^a
(3 13a)
so entscheidet der Test für H 0 andernfalls für H^
Mit dieser Konstruktion wird erreicht, daß Prl-Zj.,^ < Z < z1_ct/2»l Ho} als 1-ct eingehalten wird. 39 Man kann den Annahmebereich des Testes, - z
< Z oder Zz,_a/2,}= - . t
(Pi ~ Pn) ~ (Pi ~ Pn) Vp,(l-p,yn + p0(l-p0)/n
1 a/2
"
Pi ~ Pn , Vp.il-pO/n + Poil-PoVn 1
=Pr{W>Z|^-Vp[(1_p;n7;(i,po)/n}
(3,4)
Da W eine standardnormalverteilte Variable ist, kann die Wahrscheinlichkeit leicht einer entsprechenden Tabelle entnommen werden. Ist z.B. n=100 und P) = 0,60, Po = 0,50, so erhält man z , ^ -
. „ ~ P " ,, v = 1,96 - 1,4286 = 0,5324, Vpi(l-pi)/n + Po(l-Po)/n
und die entsprechende Wahrscheinlichkeit Pr{W>0,5314} = 0,2976. Die zweite A
Wahrscheinlichkeit ergibt sich als Pr{Z V P l (l- P l )/n + p 0 (l-po)/n
für die obigen Daten von n=100, p, =0,60, p 0 =0,50, ergibt sich Pr{W < - 1 , 9 6 1,4286} = Pr{W < -3,3886} = 0,0004 und kann vernachlässigt werden.
3. Das Kohortenmodell
6 3
Stichprobengröße n Abb. 3.5: Macht des Tests in Abhängigkeit von der Stichprobengröße
Den Zusammenhang zwischen Stichprobengröße n und Macht des Tests zeigt die Abb. 3.5. Im Prinzip könnte so vorgegangen werden, daß man zu einer vorgegebenen Macht (1-ß) die entsprechende Stichprobengröße aus der Abb. 3.5 abliest. Ist z.B. (1-ß) = 0,80 erwünscht, findet man ca. n=380 auf der Abzisse. Ein strengeres, analytisches Vorgehen ist wie folgt: Da einerseits nach (3.14) die Stichprobengröße n so gewählt werden soll, daß Pr {W > z•_ a / 2 -
, „
f'""^,,
} = 1 - ß ist, an-
dererseits, da das ß-Quantil der Standardnormalverteilung so bestimmt wird, daß Pr{W>zp} = 1-ß, können beide Gleichungen nur erfüllt sein, wenn
Z
' - a / 2 _ Vp.d-p.yn^pod-poyn
=Zl
"ß
(3>15)
Wird (3.15) nach n aufgelöst, ergibt sich
n = (zi.o/2 - zß)2[p,( 1 -Pi)+Po(l -Po)]/(Pi-Po)2
(3.16)
64
3. Das Kohortenmodell
Beispiel. Ist a=0,05 und soll, bei Populationswerten in beiden Kohorten von p0=0,50 und p!=0,60, eine Macht von (l-ß)=0,80 erreicht werden, so ist zunächst z l v 2 = 1,96 und Zp = -0,8416. Werden nun die Werte von p, und p0 in (3.16) eingesetzt, findet man eine Stichprobengröße von n=385, die in jeder der beiden Kohorten zugrunde gelegt werden sollte, um eine vorhandene Effektdifferenz von 0,10 mit einer Macht von 80% zu entdecken.
Eine Abschwächung der Voraussetzungen. Gegenüber der Anwendung von Formel (3.16) äußern Praktiker oft Vorbehalte, da für ihre Benutzung Werte für p, und p0 bekannt sein müssen, welche aber gerade in der Studie erst geschätzt werden sollen. Die übliche Empfehlung des Methodenberaters ist, eine Schätzung von p 0 aus anderen Studien zu benutzen und p, = p0 +8 zu wählen, wobei 8 die Risikodifferenz ist, die mindestens entdeckt werden soll. Für den Fall, daß es jedoch nicht möglich ist, eine sinnvolle Schätzung von p0 zu erhalten, ist es hilfreich, daß man eine leichte Abschätzung nach oben finden kann, die nicht mehr von den Werten p! und p0 abhängt. Diese Abschätzung basiert auf der Tatsache, daß für alle möglichen Werte x gilt: x(lx)< %, unabhängig von x. Daher kann (3.16) durch
n
6 = (Zl-a/2 -
Z ß ) 2 [ V* + H ] / 8 2 = 14 ( z , ^ 2 - Z ß ) 2 / 8 2
(3.17)
nach oben abgeschätzt werden. n8 erreicht mindestens die gewünschte Macht. Die Formel (3.17) erfordert nur noch die Spezifizierung einer Effektdifferenz 8. Darüberhinaus ist diese Effektdifferenz eine minimal zu entdeckende. Dies bedeutet folgendes: Faßt man n 6 in (3.17) als Funktion von 8 auf, so sieht man leicht, daß n 5 eine monoton fallende Funktion von 8 ist. Man vergleiche auch die Abbildung 3.6. Dies bedeutet, daß mit einer Stichprobengröße n5- für eine gewählte Effektdifferenz 8' auch alle größeren Effektdifferenzen mit mindestens der Macht (1-ß) entdeckt werden, da jede größere Effektdifferenz 8>8' zu einem geringeren Stichprobenumfang n8 Z1hj/2, oder |log( OR )| > z1
+
M
wobei das Resultat (4.5) benutzt wurde.
Oft wird noch zwischen der beidseitigen Alternativhypothese OR*() wie hier unterschieden und der einseitgen Alternative OR>l (oder OR OR i k i (i, ( m o < ' ) -ko(i)) - OR (m,(0 -k,fl>) k^)}, i=l 1 mit Wl (7t> Vi) testen. In diesen Fällen ist die Nullhypothese nur abzulehnen, wenn Zx bzw. Z 2 größer als der kritische Wert ausfällt. Die Quadrate dieser Teststatistiken sind hier nicht zu benutzen.
130
5. Das Modell der Fall-Kontrollstudie mit Paarbildung
Der exakte Test. Häufig wird heute der Anspruch erhoben, sog. exakte Verfahren bei der statistischen Inferenz zu benutzen. Damit ist gemeint, nicht auf approximative, auf der Normalverteilung basierende Verfahren auszuweichen, sondern die ursprüngliche Verteilung, hier die Binomialverteilung zu benutzen. Obwohl nach Auffassung des Autors sich nicht hier die entscheidenden methodischen Fehler einschleichen, die dazu fuhren, daß die Ergebnisse der statistisch-epidemiologischen Inferenz in der Dimension falsch sind, soll an dieser Stelle einmal ausgeführt werden, wie bei einem exakten Test verfahren wird. Wenn B die Variable bezeichnet Anzahl der Paare mit „Fall exponiert, Kontrolle nicht-exponiert", so wurde oben ausgeführt, daß fb+c") b Pr(Y=b\Paar diskordant)= \ ^ I TI (l-7t) ist. Testet man nun die Nullhypothese H0: 7t= Vz (OR=l) gegen die einseitige Alternative, so erhält man leicht den exakten PWert58 als
b + c /
\
.
.
Pr(Y>b) = £ ( b + cj7 t i(l-7 t ) c+b -' i= b
1
b + c /
=
\
c + b - i
£ ( b + cj i = b
1
Beispiel. Diese Betrachtungen sollen an einigen Daten veranschaulicht werden. Dazu wird die Tabelle 5.5 herangezogen, die eine Untersuchung zum Zusammenhang vom systolischen Blutdruck und dem Herzinfarkt darstellt.
Tab. 5.5: Gepaarte Fall-Kontrollstudie zum Zusammenhang vom systolischen Blutdruck und Herzinfarkt (Fall,Kontrolle)
Kontrolle (>140)
Kontrolle (S 140)
Fall (>140)
17
13
Fall (< 140)
11
15
Man berechnet leicht den Odds Ratio-Schätzer als O R ^ = 13/11 = 1,18. Der P-Wert aufgrund der Binomialverteilung ergibt sich als
58
Der P-Wert ist die Wahrscheinlichkeit, daß dies Teststatistik einen Wert gleich oder größer dem in der Stichprobe vorgefundenen Wert annimmt.
5.Das Modell der Fall-Kontrollstudie
i=b
1
131
mit Paarbildung
1
i=13
Für Zy (Z2) erhält man den Wert 0,4082 (0,4096), der einem P-Wert von 0,34 entspricht. Für keine der betrachteten Teststatistiken ist der Odds-Ratio-Schätzer signifikant.
5.4 Konfidenzintervalle Bei der Konstruktion eines geeigneten Konfidenzintervalls kann wieder auf die Binomialverteilung zurückgegriffen werden. In Kapitel 2 wurde für den Anteilswert p A
mit Formel (2.6) ein (l-a)100-%iges Konfidenzintervall angegeben: p ± z,_a/2
V
A
A
A
A
p (1- p )/n . Ersetzt man nun p durch 7t =b/(b+c) sowie n durch (b+c), erhält man
ein entsprechendes Konfidenzintervall für 7t: Vn(l-it)/(b+c)
(5.7)
7t Ein Konfidenzintervall für OR wird durch die Transformation OR =":— erreicht: l-7t
£±z,^-s/ää^y(b+c)
(5g)
\-(n±zUa/2^n(\-n)/(b+c)) Im Kapitel 2 (Abschnitt 2.3) wurde auch die verbesserte Konfidenzintervallformel A
2
/
A
A
p + z /2n ± z \ / p (1- p )/n +
Z2
,
/ (1+z /n) für einen Anteilswert oder eine Rate p
erwähnt. Dieses Konfidenzintervall hat vor allem bessere Überdeckungswahrscheinlichkeiten, d.h. es ist näher am anzustrebenden Niveau 1-a, z steht hier abgekürzt für
132
5.Das Modell der Fall-Kontrollstudie mit Paarbildung
z,_a/2. Auch diese Formel läßt sich ohne weiteres auf den hier vorliegenden Fall A
A
übertragen, indem p durch n =b/(b+c) sowie n durch (b+c) ersetzt werden:
7i + z 2 /2(b+c) ±z -\jn(l-£)/(b+c)
+ 4 ( b + c ) 2 / (l+z 2 /(b+c))
(5.9)
Bezeichnet man die mit Ausdruck (5.9) erhaltenen zwei Grenzen des Konfidenzintervalls mit ti l für die linke und 7tR für die rechte Intervallgrenze, so kann wiederum 7t mit der Transformation OR = ~— ein Konfidenzintervall für die Odds Ratio erhalten 1-71 werden:
A O R
l
,
r
7tl D = — ^ 1 - nL,R
(5.10)
Beispiel. Für die Daten der Tabelle 5.5 ist b=13, c = l l , b+c=24. ORpMr = 1,18 mit einem 95%igen Konfidenzintervall (z=l,96) nach (5.8) von (0,52, 2,86) bzw. nach (5.10) von (0,73,4,57).
5.5 Wahl der Stichprobengröße Bei der Wahl der Stichprobengröße m = b+c = Anzahl der diskordanten Paare wird man sich wieder an der Macht eines geeigneten statistischen Tests der Hypothesen
H 0 : OR = 1 oder n = 'A
gegen H,: O R > 1 oder 7t > Vi
5. Das Modell der Fall-Kontrollstudie mit Paarbildung
orientieren. Nach den Ausführungen im Kapitel 2 ist
Z = yjm ^ ^
133
2
^
approximativ Standard normalverteilt, so daß der Test ablehnt, wenn Z > z , ^ . Hier ist definiert als i>( z , ^ ) = 1 - a , z.B. a=0,025 fuhrt auf z , ^ = 1,96. Die Macht des Tests ist definiert als Pr { Z > z , ^ . / n gültig }. Letztere, als Funktion cp von 7i aufgefaßt, cp(7i) = Pr { Z > z ^ . / 7t gültig }, heißt die Gütefunktion des Tests. A
Die Berechnung der Macht geschieht wie folgt: z,_ a }
A
A
vV m
I
V7t(l-7t)
nun Standard normal verteilt ist. Die Gütefunktion ist für m=50 und
m=500 in der Abbildung 5.2 zu sehen. Offenbar wird bei festem n mit zunehmenden m die Macht größer.
Abb. 5.2: Gütefimktion cp für m=50 und m=500
Die Idee ist nun einfach. Man fixiert die Macht auf einen bestimmtenWert 1-ß (z.B. 80%) und löst nach m auf. Es ist:
134
5.Das Modell der Fall-Kontrollstudie
^
-
1—
14 — TT
mit Paarbildung
.
.
„
oder z,_a
f , , * = ^"'(ß) = Zß•y/it( 1-TI)
Man erhält die Stichprobengröße der Anzahl der diskordanten Paare m als
(z,_„- zf 0 ; 7t(l-7t)
(5.11)
Beispiel. In einer gepaarten Fall-Kontrollstudie mit Signifikanzniveau 2,5% und einer Macht von 80% (also z,_a = 1,96 und Zp.= - 0,85) soll eine minimal auffindbare Odds Ratio von OR = 2 zugrunde gelegt werden. Wegen der Monotonie der Gütefunktion (siehe auch Abb. 5.2) ist dann auch jeder größere Effekt mit mindestens dieser Macht auffindbar. Mit der Transformation n = OR/(l+OR) erhält man als minimal auffind(1.96+0.85V 2/3 x 1/3 bares n = 2/(1+2) = 2/3. Daher ist nach (5.11) m = 1 = 63.1689, y _ 2/3y d.h. man müßte 64 diskordante Paare als Stichprobengröße zugrunde legen. Dieses Beispiel weist auf ein Problem hin. In der Praxis wird man nur die Anzahl n der Paare wählen können, nicht jedoch die Anzahl m der diskordanten Paare. Insofern muß die Wahrscheinlichkeit n D für das Auftreten eines diskordanten Paares berücksichtigt werden: m ist dann der Erwartungswert m = E{Anzahl der diskordanten Paare59) = n7iD. Löst man nach n auf:
59
Man kann diese Variable als binomial verteilte Variable Y = X]+...+X n ansehen, wobei X, den Wert 1 annimmt, wenn das Paar diskordant ist, den Wert 0, wenn das Paar konkordant ist. Nach Kapitel 2 ist dann der Erwartungswert durch n x 7tD gegeben.
5. Das Modell der Fall-Kontrollstudie
mit Paarbildung
n = m/7tD
135 (5.12)
Ist im Beispiel 7iD = 1/4, ist als Stichprobengröße n=64IV* = 256 Paare zu wählen. Ist 7iD unbekannt, so kann sein Wert durch den Erwartungswert bzgl. einer sog. nicht-informativen a-priori Verteilung, die uniforme Verteilung, auf dem Intervall [0,1] ersetzt werden.
1
1 Vi Abb. 5.3: Uniforme Verteilung auf [0,1 ] 0
1 Dieser Erwartungswert ist elementar zu berechnen als fnD d7iD = Vi, so daß man die 0 Stichprobenumfangsformel n =2m erhält. Schließlich geht ein weiterer Ansatz von der unkonditionalen Macht
Spm und infolgedessen den ORj auferlegt sind.
1 50
6.Logistische Regression
Das Modell der Homogenität sieht nun vor, daß die Odds-Ratios über die Strata identisch sind, d.h.
OR, = OR2 = ... Ork oder log (OR,) = logit p, (1) - logit p0(1) = ß, = log (OR2) = logit p, (2) - logit p0(2) = ß 2 log (ORk) = logit p , w - logit p0(k) = ßk
Mit anderen Worten kann das Homogenitätsmodell als ein spezifisches logit-Modell
logit px(i) = a ( i ) + ß x
(6.4)
geschrieben werden mit stratumsunabhängigen Expositionseffekt ß (x=l Exposition vorhanden, x=0 Exposition nicht vorhanden) bzw. mit gemeinsamer Odds Ratio eß. Die stratumsspezifischen a und ßj+ß = ß-b
l b J 7tb(^"7C)C' w °bei n =Pr{(Fall exponiert,Kontrolle nicht exponiert)/Paar ist dis-
kordant }. In Kapitel 5 wurde gezeigt, daß %= OR/(l+OR). Im Logit Modell ist die Odds Ratio durch OR = eP gegeben, also 7t= eß/(l+ eß). Daher wird der vom Parameter abhängige Teil des Likelihoods durch expit(ß)b(l-expit(ß))c = expit(ß)bexpit(-ß)c dargestellt. Im allgemeinen ist der Likelihood gegeben durch
n n T T FI exp(Xi* ß)/{l + exp(X|* ß)} = n expit(Xj*Tß)} , i=l i=l
77
(6.22)
Das Probit-Modell ist durch p , - (a+ßTx) gegeben, wobei die kumulative Normalverteilung bezeichnet.
182
6.Logistische Regression
wobei Xj*= x1FaM-x,Kontrollt die Differenz des Expositionsvektors des i-ten Paares bezeichnet.
Tab. 6.11: Logistische Regression für gepaarte Fall-Kontrollstudie bei einfacher Exposition x Anzahl
xF'"
xKM"ro,fc
x» = xF'"-xKooK",e
y™
a b c d
1 1 0 0
1 0 1 0
0 1 -1 0
1 1 1 1
yKo"
y .=/"'- y
0 0 0
K
°"
1 1 1 1
0
Der Likelihood (6.22) wird daher ('/4)a+d expit(ß) b expit(-ß) c . Daher ist der Likelihood nach (6.22) identisch mit dem vom Parameter abhängigen Teil des binomialen Likelihoods des Kapitels 5. Technisch gesehen, können Logistische Regressionsanalysen leicht mit Standardsoftware durchgeführt werden. Dazu definiert mit y* als der Differenz zwischen der Erkrankungsvariable y bei Fällen, y=l, und der Erkrankungsvan expit(X|*Tß)}
riablen y bei Kontrollen, y=0, die Konstante mit Wert 1, so daß i=l T
( 1 - expit(x,* ß)
1
- v* identisch mit (6.22) wird. Es ist nur noch y* als die abhängige
Variable in den entsprechenden Programmpaketen zu spezifizieren, nebst den Expositionsdifferenzen x*, und die Konstante a=ß 0 auf Null zu fixieren.
6.Logistische Regression
183
Übungsaufgaben 6.1 In zwei Kliniken werden zwei unterschiedliche Operationstechniken verwendet. Es bezeichne x, die Klinik, x2 die Operationstechnik, p, ist die Sterbewahrscheinlichkeit bei der Expositionskombination x^xj.xj). Folgende Daten wurden innerhalb eines Studienzeitraumes beobachtet, wobei die 1. Spalte x1( die zweite Spalte x2, die dritte Spalte y („1" verstorben/ „0" nicht verstorben), und die vierte Spalte die Häufigkeit, in der diese Konfiguration aufgetreten ist:
'0 0 0 176' 0
0
1
12
1 0 0 197 1 0 1 34 0 1 0 293 0
1
1
16
1 1 0 23 J 1 1 4,
Welche substantielle Bedeutung habe die folgenden vier Logistischen Regressionsmodelle: i) logit p,= a + ß,x, ii) logit p x = a + ß2x2 iii) logit p x = a + ß,x, + ß2x2 iv) logit p x = a + ß,x, + ß2x2 + ßi2X!X2 Bitte identifizieren Sie insbesondere das Homogenitätsmodell (mit Klinik als potentiellem Konfounder) sowie das Modell der Effektmodifikation! 6.2 Benutzen Sie ein Programmpaket Ihrer Wahl zur Analyse der Modell i)-iv). Welches Modell wird durch die Daten am besten gestützt? 6.3 Bitte berechnen Sie OR22 unter allen vier Modellen!
184
6. Logistische Regression
6.4 Betrachten Sie das Regressionsmodell (6.7). Wie lautet das Modell für log(OR 212 )? Welche Log Odds Ratio stellt ß,+ß 2 +ßl2 dar? 6.5 In einer Fall-Kontrollstudie zum Zusammenhang des Verzehrs von Chilipfeffer und dem Auftreten von Magenkrebs in Mexiko (Lopez-Carrillo u.a. 1994) wurden die Daten der Tabelle 6.12 zusammengestellt:
Tab. 6.12: Zusammenhang von Chilipfefferverzehr und Magenkrebs (nach Löpez-Carrillo u.a. 1994) Chilipfeffer
Kontrollen
Fälle
Verbrauch Nullverbrauch
145
9
l.Tertile ( x =0.47)
220
68
204
82
170
59
2.Tertile ( x =1.11) 3.Tertile ( x =2.01)
Untersuchen Sie, ob ein einfaches Geradenmodell der Logistischen Regression logit px = a+ßx, mit x als quantitativer Exposition des Verbrauchs von Chilipfeffer den Daten gerecht wird! Untersuchen Sie auch das Modell, das zusätzlich noch einen quadratischen Term enthält, also logitp x = a+ß]X + ß 2 x 2 !
7. Epidemiologische Standardisierung 7.1 Zur Notwendigkeit der Standardisierung Standardisierungsverfahren sind ein methodischer Grundlagenbereich der Epidemiologie. Häufig werden sie für Raten und Anteilswerte entwickelt, dargestellt und angewendet. Sie sind jedoch gleichermaßen für andere Maßzahlen entwickelbar. Wie viele methodische Verfahren der Epidemiologie hat auch die Standardisierung das Ziel, eine Vergleichbarkeit unterschiedlicher Populationen herzustellen, um so die Gefahr eines wissenschaftlichen Artefaktes zu vermeiden. Häufig wird eine Vergleichbarkeit einer interessierenden epidemiologischen Maßzahl zunächst hinsichtlich des Alters angestrebt. Wird dann eine Standardisierung hinsichtlich des Alters durchgeführt, spricht man auch von Altersstandardisierung. Ist die interessierende epidemiologische Maßzahl die Sterberate, so wird von der altersstandardisierten Sterberate gesprochen. Zunächst jedoch soll ein Beispiel eines wissenschaftlichepidemiologischen Artefaktes78 diskutiert werden. Die Tabelle 7.1 zeigt die Todesfälle mit Todesursache Lungenkrebs bei Männern im Jahre 1960 und 1989 für den Westteil der Stadt Berlin.
Tab.7.1: Anzahl der Todesfälle mit Todesursache Lungenkrebs (ICD 162) im Jahre 1960 und 1989 nach Altersgruppe mit der jeweils in der Altersgruppe unter Risiko stehenden Personen, nur Männer, Berlin (West) Altersgruppe 35-39
Todesfälle 1989 3
Unter Risiko 78.862
Todesfälle 1960 2
Unter Risiko 44.454
40-44
15
74.485
5
38.932
45-49
49
96.516
24
66.595
50-54
64
78.693
63
83.553
55-59
88
48.942
145
83.353
60-64
83
38.789
202
65.947
78
Mit Artefakt bezeichnet man eine künstliche Erscheinung, die verschwindet, wenn die ihr zugrunde liegenden Gesetzmäßigkeiten aufgedeckt werden.
186
7.Epidemiologische Standardisierung
65-69
125
29.128
181
50.805
70-74
86
19.168
160
40.282
75-79
126
25.109
114
25.545
80-84
113
17.417
43
12.431
54
8.821
9
4.183
806
515.930
948
516.080
85Zusammen
Wird nun die rohe Sterberate für 1960 und die rohe Sterberate für 1989 betrachtet, d.h. die Gesamtzahl der Todesfälle, das sind für das Jahr 1960 948 (für das Jahr 1989 806), dividiert durch der Gesamtzahl der in diesem Jahr unter Risiko stehenden Personen, das sind für das Jahr 1960 516.080 Männer (für das Jahr 1989 515.930 Männer): „ , „ , „ Gesamtzahl der Todesfälle . Rohe Sterberate X = G e s a m t z a h l der Personen unter R.siko * 1 0 0 0 7 9
,„, +Y,(2) bzw. n, = n^'H-n/2' die Summe der Todesfalle bzw. Personen unter Risiko im i-ten Stratum über beide Studienpopulationen angibt. Auf der anderen Seite ist die Mantel-Haenszel-Test-Statistik (Breslow und Day 1980) durch
( Z Y ^ - E Y / " )2 2 _Jzl X MH ~ k
i
(7.17)
(l)
Z var (Y, ) i=l
gegeben, die unter der Hypothese, daß kein Unterschied zwischen beiden Studienpopulationen besteht, x 2 -verteilt ist, bei einem Freiheitsgrad. Erwartungswert und Varianz werden auch unter dieser Hypothese berechnet. Für den Erwartungswert E(Yi f(y). g heißt monoton steigend, wenn aus x < y folgt, daß g(x) < g(y). Sind f und g differenzierbar, d.h. existieren die Ableitungen von f und g, so kann die Modg notonie durch das Vorzeichen der Ableitung erkannt werden. Ist ^ (x) > 0 für alle x, df so ist g monoton steigend. Ist ^ (x) < 0 für alle x, so ist f monoton fallend. Es wird die folgende Aussage benötigt: Ist f(x) monoton fallend und g(x) monoton steigend, dann ist f(g(x)) monoton fallend. Beweis. Es sei x < y. Dann folgt g(x) f(g(y)).
Anhang
229
A.6 Maximum-Likelihood-Schätzung in der Logistischen Regression Die Maximum Likelihood Schätzung ist eine weit verbreitete und gut fundierte Schätzmethode in der Statistik. Sie basiert auf der Likelihoodfunktion, die für eine Beobachtung die Gestalt p y (l-p) l y hat, für y = 0 oder 1, also die Wahrscheinlichkeit für Erkrankung Pr(Y=l)=p, für Nichterkrankung Pr(Y=0)=l-p. Aus Gründen einer besseren mathematischen Handhabung94 wird die Log-Likelihoodfiinktion /(p)= y log(p) + (1-y) log(l-p) betrachtet. Nun wird noch die Verbindung zu den Expositionen x,,...,xr eingearbeitet. Es ist ja logit p, = ß0 + ß1x,+...+ßrxr) oder völlig äquivalent, px = expit (ßo + PiX,+...+ßrxr) =
exp(ß ft + ßiXi+...+ßrXr) ^ f t ß o + P ^ ] + . . ; ^ r ) • Somit wird der Log-
1+e
Likelihood eine Funktion der Parameter:
/(ßo,ß.,-,ßr) = y log( expit (ßo + ß.x.+.-.+ßA)) + (1-y) log( l-expit(ß 0 + ß,x,+...+ß r x r )) Man kann den r\\ Ausdruck
(A.7)
ß0 + ß,X!+...+ßrxr noch abkürzend in der Form ßTx =
95 (ßo.ß.,....,ßr) X2 , als ein Skalarprodukt der Vektoren ß und x, wobei nun die erste
Vxr7 Komponente des Expositionsvektors die Konstante XQ = 1 enthält. Daher schreibt sich (A.7) auch kürzer als /(ß0,ß„...,ßr) = y log( expit(ß T x))+ (1-y) log( l ^ x p i t ( ß T x)).
(A.8)
= y ßTx - log(l+exp(ßTx))
95
Mit Summen ist besser zu arbeiten als mit Produkten. Für den in Vektorrechnung ungeübten Leser ist es völlig hinreichend a + ß T x als a + ß,x,+...+ß r x r anzusehen.
230
Anhang
(A.8) ist die Log-Likelihoodfanktion für eine Beobachtung. Hat man nun eine Zufallsstichprobe vom Umfang n, also unabhängige Beobachtungen, so wird der Gesamtlikelihood ein Produkt aus den Likelihoodausdrücken der Form p y (l-p) l
y
und
der Gesamt-Log-Likelihood eine Summe der Log-Likelihoods der Einzelbeobachtungen:
(A.9)
/(ßo,ß„...,ßr) = S y, log p, + (l-y,) iog(i-p¡) i=l n = X y¡ log expit( i=l wobei
(y¡,Xj)
ßTXj)
+ (l-y,) log(l- expit( ßTXi))
die Daten der i-ten Personen darstellen.
Ein weiteres wichtiges Element der Likelihoodtheorie ist der Score. Er ergibt sich als die 1. partiellen Ableitungen96 nach den Parametern ßo jß^.-.ßr. Zunächst wird auch wieder nur der Score bzgl. einer Beobachtung betrachtet. Es ist leicht zu sehen, daß nach (A.8)
dl exp(ßTx) , y X X d$r > - l+exp(ß T x) X J = ( y "
ex
. -r _ Plt(ß X) } Ößo
Der Vektor der (r+1) partiellen Ableitungen V/ (ß) =
aß,
heißt der Score. Den
dl
V9P.7 Score der gesamten Stichprobe erhält man nun einfach dadurch, daß man die Scores der Einzelbeobachtungen aufaddiert:
96
Partielle Ableitung bedeutet nur, daß man die Ableitung nach e i n e m Parameter betrachtet, w ä h r e n d die a n d e r e n konstant gehalten w e r d e n . Z. B. ist die 1. Ableitung nach d e m Parameter x der F u n k t i o n f(x,y)= 2\ - 4 y x durch 4x - 4 y gegeben.
Anhang
231
dl
^ ¡ r = X (y, - ex P it(ß T X|)) Xj, Pj i=i
wobei wie gehabt yj den Erkrankungsstatus der i-ten Person, x, den Expositionsvektor der i-ten Person, Xj; die j-Exposition der i-ten Person bezeichnet. Zur Gewinnung der Maximum-Likelihood-Schätzer
ß 0 , ß b ..., ßr wird nun die
Kombination der Parameter a , ßi,...,ßr gesucht, für die die Log-Likelihoodfiinktion den größten Wert annimmt. Äquivalent ausgedrückt, es werden Lösungen der ScoreGleichung (man beachte, daß es r+1 Gleichungen sind)
V / ( $ ) = 0.
(A.10)
Die Lösung der Score-Gleichung (A.10) kann im allgemeinen nicht mehr in geschlossener Form angegeben werden. Es werden Algorithmen eingesetzt, die die Lösung schrittweise konstruieren. Häufig findet das Newton-Raphson-Verfahren Anwendung. Das Newton-Raphson-Verfahren kann wie folgt motiviert werden. Man wählt einen Startwert ß 0 . Dann wird eine Taylorreihenannäherung 2 Ordnung um dieses Startwert gewählt:
/ (ß )«/(Po) + V/ (ß0)Th + V4 h V / ( ß 0 ) h
(A. 11)
A
Der Korrekturterm h kann als Approximation der Lösung ß » ß 0 +h angesehen werden. V 2 /(ß 0 ) ist die sog. ¿/me-Matrix der (r+1)2 zweiten partiellen Ableitungen. Bezieht sich die Hesse-Matrix auf eine Log-Likelihoodfiinktion wie in dem vorliegenden Fall, wird sie auch (beobachtete) Informationsmatrix genannt.
232
Anhang
r &i
\
3ß 0 aß0'"öß 0 öß r V 2 /(ß 0 ,...,ß r ) = Vaß^ßo-öß^ßy
Iexpit(ß i=l
T
T
Xi)(l-expit(ß
• X A(ß) X, X =
T
^XQjXoi Xo,Xu ... XfljXn XliXoi XijXij ... X|iXri
x,))
(A.12)
^ xnxOi x ri x li ••• xrixri ' ' 1 x„ ...x r l > 1 x12 ... xr2 Vi x l n ... x r n y
mit A(ß) bestehend aus lauter Nullen außer den Diagonalelementen, die die binomialen Varianzen p x (l-p x ) enthalten. Es sei zu (A.l 1) zurückgekehrt. Eine Maximierung der rechte Seite von (A.l 1) fuhrt auf die Lösung h = -V 2 /(ß 0 )~ 1 V/ (ß 0 ) = [XT A(ß0) X)"' X t ( Y - p ), wobei Y der Vektor der Werte der abhängiggen Variablen darstellt, A
bestehend aus Nullen und Einsen, während p den Vektor bezeichnet, dessen j-tes Element expit (ß0TXj) ist. Gerade diese Darstellung bringt die Lösung h in die Nähe einer gewichtete kleinsten Quadrate Lösung. Das Newton-Raphson-Verfahren wählt als nächstes Element ß, = ß 0 -V 2 /(ß 0 )" 1 V/ (ß 0 ) = [XT A(ß 0 ) X]"1 X T (Y - p ), dann wird ßi als ß0 gesetzt, eine neue Lösung h berechnet, usw. Dieser Prozeß - man spricht auch von Iteration - wird solange fortgeführt, bis Konvergenz erreicht ist. Dabei ist festzulegen, was unter Konvergenz verstanden werden will. Häufig wird die Iteration beendet, wenn zwei aufeinanderfolgende Log-Likelihood-Werte |/(ßj+i) /(ßj)| in ihrer absoluten Differenz ein kleines e (z.B. 0,0001) unterschreiten. Man kann sich allerdings auch an den 1. partiellen Ableitungen orientieren. Es gibt eine Reihe weiterer und alternativer Verfahren zum Newton-RaphsonAlgorithmus. Ein Vorteil des Newton-Raphson-Verfahrens ist jedoch, daß es Schätzungen der Varianzen der Parameter - quasi als ein Nebenprodukt - mitliefert (vgl. Abschnitt 6.5). Ein weiteres Problem dieses (und auch aller anderen) Verfahrens ist
Anhang
233
die Wahl des Startwerts ß0. Die Konvergenz des Newton-Raphson-Algorithmus ist im allgemeinen nur in einer Umgebung der Lösung gesichert, und es lassen sich einfache Beispiele in der Logistischen Regression angeben, in denen das NewtonRaphson Verfahren nicht konvergiert. Im Gegensatz zu manchen Empfehlungen in der Literatur ist es günstig, bei der Logistischen Regression das Newton-Raphson Verfahren am Nullpunkt zu starten, also ß0=0, da mit diesem Startwert das NewtonRaphson-Verfahren in einen monotonen Konvergenzbereich gerät. Für eine intensivere Diskussion diesen Aspektes wird auf Böhning (1993) verwiesen.
Lösungen der Übungsaufgaben
Aufgabe 2.1 Wegen ( n n k ) = (£) gilt Bn,p(k)=Bn,p(n-k) g.d.w. pk(l-p)n"k=pn"k(l-p)k b.z.w. (l-p) n 2k = pn"2k. Dies soll fur alle k aus {0,1
n} gelten, das heißt, es
muß p=l-p sein und damit p=0.5. Aufgabe 2.2 Q p 2 ( l - p ) 3 = 1 0 p 2 ( l - p ) 3 für p=l/2 : 10(l/2 5 ) =10/32= 0.3125. Aufgabe 2.3 p =12/100=0.12. Approximatives 95%-Konfidenzintervall:
P ± Zi-a/2V P (1- P )/n = 0.12± 1.96^0.12 0.88/100 = (0.0563,0.1837). Aufgabe 2.4 p' =0.2 , a=0.99 , ß=0.95 p = (p -(1-ß)) / (a-(l-ß)) = (0.2-0.05)/(0.99-0.05) = 0.1596. Var(p ) = Var(p' )/[a-(l-ß)] 2 « ( £ (l-p> )/n)/[a-(l-ß)] 2 = 0.00016x1.1317 = 0.00018. Ein approximatives 95%-Konfidenzintervall ergibt sich zu: p±Zi. a / 2 V Vàr ( p )
=(0.1736,0.2264).
Aufgabe 3.1 ko=69, n 0 =l1635, k,=43, n,=1518 Po = W n o =0.0059, p, =k!/n, =0.0283,
Lösungen der Übungsaufgaben
R k = p, / p 0 =4.8011, log(I&)=1.5688 Vàr {log(Rk )} = 1/k, - 1/n, + 1/ko - l/n« = 0.037. Das approximatives 95%-Konfidenzintervall ist: log(Rk )±z,. a/2 V Var {log( Rk ) = (1.1917 , 1.9459), und damit für Ftk : (3.2927 , 6.9999). Aufgabe 3.2 RR = A., / X0, log(RR)= log(X,)-log(X0) H0: log(RR)=0
H,: log(RR)*0.
Unter H 0 ist Z0=
^ ) approximativ standard"\/Var(log( RR))
normalverteilt. Die Entscheidung lautet wie folgt: Man verwerfe H0 wenn | log(Rk ) | > z . ^ V Var (log( Ftk ))
Wir betrachten die Schätzer
\^ar{log(F(k)}=-^— A01 o
=
/ T, i=0,l , und erhalten
^-l 11
= (1/Y0) + (1/Y,) = 1/28 + 1/206. Nun ist I & = Ä, /
= 0 0072 / 0.0049 = 1.4682.
235
2 3 6
Lösungen
der
Übungsaufgaben
log(FÖl )=0.3840 < 0.3948 = z 0 9 7 5 V V a r (log( R k ) ) Zum Niveau von 0.05 kann die Hypothese H 0 nicht verworfen werden.
Aufgabe 3.3 a=0.05, z 1kx/2 =1.96, l-ß=0.9, z ß =-1.28,8=0.1. n 5 = ( l ^ X z , . ^ - z p f / 5 2 = 524.88 » 525.
Aufgabe 3.4 8=0.01,
pi)
p0^o z ^ V a r {log(dk )}] 1/2 = 1.96x0.4363 = 0.8551. Es ergibt sich | log((5k ) | = 0.9628 > 0.8551, also wird H 0 verworfen.
Aufgabe 4.5 Unstratifizierte Betrachtung : ko=16 > m 0 =29,k 1 =75,m 1 =93,
=
=3.3854.
Stratifizierung Stratum 1: Sonne ko(1) = 6 , m 0 ( 1 ) = 1 4 , k 1 ( 1 ) = 5 1 , m 1 ( 1 ) = 6 6 Stratum 2: Keine Sonne kg(2) =10, m 0 (2) =15, k / 2 ) =24, m / 2 ) =27 i=1 2
' -
^
=4
"5333 ' ^
= 4.0.
Lösungen der Übungsaufgaben
241
Der Risikofaktor 'Rauchen' wird durch die unstratifizierte Betrachtungsweise in seiner Wirkung abgemildert geschätzt. Die Sonnenexposition stellt einen Konfounder des Zusammenhanges Lippenkrebs und Rauchen dar. Aufgabe 4.6 q0 =0.85, OR=1.5, ct=0.05, l-ß=0.8, zl 1/N4 = 1.4510"7 kann die Approximation V à r {log(Rk^ )} « 1/Yj + 1/Y5 verwendet werden. Es bezeichne KI,, i=l, ,4 das approximative 95%-Konfidenzintervall fur FÜR, KI, = (0.8285 , 1.0588), KI2 = (3.3422,4.1186), KI3 = (3.1677 , 3.9225), KI4 = (1.0017,1.3341).
242
Lösungen der
Übungsaufgaben
Aufgabe 5.2 a=39, b=l 13, c=15, d=150, k, =152, m, =317, ko =54, nio =317 Damit folgt: Ö k ^ = b/c = 113/15 = 7.5333 ( f a . * ! (m n -ko) _ 152 263 _ ~ ko (rtij -k] ) ~~ 54165 ~ 4 - 4 8 6 6 Wie man sieht, unterscheiden sich (5kpaar und d k deutlich! Aufgabe 5.3 Z, = (b-c)/Vb+c = 9 8 / ^ 1 2 8 =8.6621, Z 2 = (b-c^/b+c / 2 \ j b c = 98^128 /2Vl695 = 13.4653. Es gilt somit Z 2 > Z,. Dies ist verträglich mit der Vermutung, daß zum Testen v o n H 0 : O R = l gegen H^OR >1 der Test unter Verwendung von Z 2 eine größere Macht hat, also sich häufiger für die Alternative OR >1 entscheidet, wenn diese tatsächlich vorliegt.
Aufgabe 5.4 b=l 13, c=15,
K = b / (b+c) = 0.8828, a=0.05, z,. a / 2 =1.96.
Damit ergibt sich als approximatives 95%-Konfidenzintervall nach (5.8): (4.7837 , 15.2602) sowie nach (5.10): (6.6453 , 12.5870). Zur Aufgabe 5.6 studiere man noch einmal die entsprechende Passage im Text!
Lösungen der Übungsaufgaben
243
Aufgabe 5.7 a=0.05, z,_a =1.645, l-ß=0.8, z p = -0.85, OR= 1.5 . Damit ergibt sich 7t =
= 0.6, m = (z,. a -zß)2 7i(l-7t) / (n-1/2) 2 = 149.4 « 150.
In der Praxis wird man jedoch nicht m, sondern n: die Gesa/nianzahl der Paare wählen können. Diese notwendige Gesamtanzahl läßt sich aus der Beziehung m= n'7tD, also n= m / 7tD berechnen. Mit 7tD = 1/3 ist n= 150/(1/3) = 450.
Aufgabe 6.1 Exposition Xi = 1 falls Patient aus Klinik 2 und 0 sonst x2 = 1 falls Patient unter OP-Technik 2 operiert und 0 sonst. Bezeichnungen für die Sterbewahrscheinlichkeiten für die Aufgaben 6.1, 6.3: p 1 0 : Klinik 2 , OP-Technik 1 p01 : Klinik 1 , OP-Technik 2 p00 : Klinik 1 , OP-Technik 1 p,, : Klinik 2 , OP-Technik 2. Substantielle Bedeutung der 4 Modelle i) Die Sterbewahrscheinlichkeit (SWK) p hängt nur von der 'Exposition Klinik' ab. Die OP-Technik beeinflußt p nicht.
244
Lösungen der
Übungsaufgaben
ii) Siehe Modell i) mit vertauschten Rollen der potentiellen Effekte Klinik und OP-Technik. iii) Modell mit zwei Expositionen. Dieses Modell kann auch so interpretiert werden, daß es statt 2 nun 4 Expositionsstufen gibt: Stufe 1: Klinik 1, OPTechnik 1 u.s.w., p hängt von beiden Expositionen ab, wobei sich der OddsRatio als Summe der Effektparameter ß! und ß 2 darstellen läßt. Ein Homogenitätsmodell mit 'Klinik' als potentiellen Konfounder hätte folgende Gestalt: logit p x s = a + ßx2 + a , S j ,
S! = 1 für Klinik 1 und 0 sonst.
Das heißt, der Effekt der OP-Technik ist in beiden Kliniken gleich, wobei in beiden Kliniken möglicherweise unterschiedliche Niveauhöhen bestehen. iv) Zweifaktormodell mit Interaktion. Im Vergleich zu Modell iii) tritt ein zusätzlicher Effekt auf. Sind beide Expositionen vorhanden (wobei ein Rollentausch der beiden Kliniken und OP-Techniken möglich ist) ist bei der Berechnung der SWK der zusätzliche Term ß 12 x,x 2 zu berücksichtigen. ß 12 ist der zur neuen 'Expositionsstufe Klinik 2 und OP-Technik 2' gehörige Effektparameter, x,x 2 ist der Interaktionsterm. Aufgabe 6.3
OR 22 =
\ (zu den Bezeichnungen siehe Aufgabe 6.1). Poo ' V1 "Poo )
Modell i) Die Exposition 'OP-Technik' besitzt keinen Effekt. Pio ^ n =Pi »Poi =Poo ^Po wobei p 0 die Sterbewahrscheinlichkeit in Klinik 1 und p, die Sterbewahrscheinlichkeit in Klinik 2 bezeichnet. Hier ergibt sich d k 2 2 = (38x469) / (28x220) =2.8932.
Lösungen der Übungsaufgaben
245
Modell ii) Die Exposition 'Klinik' besitzt keinen Effekt. Poo =Pio =Po > Poi
1 ^Pi- Es bezeichnet nun p 0 die SWK bei der OP-
Technik 1 und p, die SWK bei der OP-Technik 2. Mit no =419, ko =46, n, =336, k, = 20 ergibt sich hier Ö k 2 2 = ( 2 0 3 7 3 ) / ( 4 6 3 1 6 ) = 0.5132. Modell iii) Es gilt in diesem Modell log(OR 22 ) = ßi + ß 2 , wobei ß; der zur Exposition i gehörige Effektparameter ist. o _1noPin/(l~Pin) ß, 10g Poo/(l-Poo)
D _wPni/(l-Pm ) , w Poo /(1-Poo) b - Z " W -
'
OR 22 = exp(ß,)exp(ß 2 ) = ORi 2 xOR 21 , wobei OR12 den Odds-Ratio für 'Klinik 2, OP-Technik 1' gegen 'Klinik 1, OP-Technik 1' bezeichnet, und OR 21 den Odds-Ratio 'Klinik 1, OP-Technik 2' gegen 'Klinik 1, OP-Technik 1'. (-fo °Rl
2
=
k i n ("no -ho) koo(n,o-k,o)
'
ffh 0 R
»
=
k
^
ni (%> -*%)) (n,, -ko,)
^a* heißt 'dasheißt
0^1,2 =(34x176)/(12x197) = 2.5313, Ök 2 1 = (16x176) / (12x293) = 0.8009 und damit d k 2 2 = d k 1 2 x d k 2 1 =2.0273. Modell iv)
dk22 Aufgabe 6.4
= (4x176)/(12x23) =2.5507.
246
Lösungen der
Übungsaufgaben
OR212: Gemäß der Tabelle 6.9 haben die einzelnen Expositionen folgenden Status: Exposition 1: nicht exponiert Exposition 2: exponiert Exposition 3: exponiert Das heißt, im Modell 6.7 entfallen alle Terme, in denen die Expositionsvariable X| enthalten ist: logit p x = a + ß 2 x 2 + ß 3 x 3 + ß 23 x 2 x 3 , das heißt log(OR 212 ) = logit p 01 , - logit Pooo = ß 2 + ß 3 + ßz3 • Weiterhin ist ß, + ß 2 + ß 12 gleichbedeutend damit, daß in (6.7) nun x 3 =0 gesetzt wird. Das heißt, die dritte Exposition ist nicht vorhanden. ß, + ß 2 + ß 12 = logit p, 10 - logit pooo = log(OR221). Aufgabe 6.5 Für i=0,1,2,3 bezeichne p, die Wahrscheinlichkeit an Magenkrebs zu erkranken unter der Bedingung, daß der Proband in der Expositionsgruppe i ist und in die Stichprobe aufgenommen wurde (siehe Abschnitt 6.7). p, =k, /n, bezeichne die entsprechende Schätzung. 1) Modell logit pxi = a + ßxj
i=0,...,3
b.z.w. äquivalent
E{Yj | X, =x,, S=1} = Pr (Yj =1 | X; =xf ,S=1) = exp(a+ßxj) / (1 + exp(a+ßx,)). Es ergibt sich für x 0 =0.0, x, =0.47, x2 =1.11, x3 =2.01 : logit po = -2.7803 , logit p, =-1.1742, logit p 2 = -0.9115, logit p 3 =-1.0585 Die Kleinste-Quadrate-Schätzung im linearen Regressionsmodell mit
Lösungen der Übungsaufgaben
247
y, = logit p xj als abhängiger Variablen liefert oi =-2.1237, ß =0.716 2) Modell
logitp xj = a + ß1xi + ß 2 x i 2 .
Dieses Modell wird angepaßt mit den Parameterwerten oi =-2.6442, ft = 2.9938, & =-1.1096. Wie die Residualplots zeigen (Analyse zum Beispiel unter SPSS), wird ein einfaches Geradenmodell den Daten nicht gerecht. Das Modell mit dem zusätzlichen quadratischen Term zeigt eine sehr deutliche Verbesserung in der Anpassimg.
Aufgabe 7.1 Da die Sterberaten im allgemeinen mit dem Alter zunehmen, sind die Altersverteilungen so zu wählen, daß in der Population A den älteren Altersgruppen ein größeres Gewicht gegeben wird als in der Population B. Dadurch kommt es in der Population A zu einer stärkeren Gewichtung der hohen altersspezifischen Sterberaten. Für den zweiten Schritt sind die Rollen der Populationen A und B zu vertauschen. Aufgabe 7.2 Schätzung der direkt standadisierten Mortalitätsraten :
248
Lösungen der Übungsaufgaben
1 im (eu) £DS
(60)
=I ^ T ^ r
=1-50941
j=l
W89) =
= 1-71363. j=l
Aufgabe 7.3 Für jedes Stratum j bezeichne der Parameter
den Anteil der Todesfalle unter
den Personen unter Risiko und pj die unter (7.1) definierte rohe Sterberate, also Aj = pjxlOOO. Wegen X} = pj xlOOO, ^ =pj xlOOO , pj = Yj /nj und Var{pj }= pj (1-pj )/nj gilt V a r { ^ }=
(1000-A-j )/nj und Var
}= ^ (1000-^ )/nj ;
V 6 0 := Vkr {^Ds,eu n l • ^-DS.eu ^^DS.eu Die Teststatistik Z = ( i
D S
J^ - U ™
) / (V^ar {£ D S ,J 8 9 ) i D S , e u ( 6 0 ) })' /2
ist unter H 0 approximativ standardnormalverteilt. Daher trifft man die Entscheidung wie folgt: Hq wird abgelehnt, falls I Z | > z 1