119 38 16MB
German Pages 177 Year 1997
REINER P. HELLBRÜCK
Qualität und Ausgaben in der medizinischen Versorgung
Volkswirtschaftliche Schriften Begründet von Prof. Dr. Dr. h. c. J. Broermann t
Heft 473
Qualität und Ausgaben in der medizinischen Versorgung Von Qualitätssicherung und Kosteneffizienz zu Konkurrenz im Gesundheitswesen?
Von
Reiner P. HeUbrück
Duncker & Humblot · Berlin
Die Deutsche Bibliothek - CIP-Einheitsaufnahme
HeUbruck, Reiner P.:
Qualität und Ausgaben in der medizinischen Versorgung : von Qualitätssicherung und Kosteneffizienz zu Konkurrenz im Gesundheitswesen? I von Reiner P. Hellbrück. - Berlin : Duncker und Humblot, 1997 (Volkswirtschaftliche Schriften; H. 473) ISBN 3-428-09059-4
Alle Rechte vorbehalten © 1997 Duncker & Humblot GmbH, Berlin Fotoprint: Berliner Buchdruckerei Union GmbH, Berlin Printed in Germany ISSN 0505-9372 ISBN 3-428-09059-4
e
Gedruckt auf alterungsbeständigem (säurefreiem) Papier entsprechend ISO 9706
Danksagung Die Arbeit entstand am Institut für medizinische Informatik und Systemforschung der GSF (GSF-medis) in Oberschleißheim. Durch die interdisziplinäre Ausrichtung des Instituts ergaben sich vielfältige Anregungen. Aus diesem Grund möchte ich Herrn Prof. Dr. Wilhelm van Eimeren, dem Leiter des Instituts, an dieser Stelle meinen Dank aussprechen. Teile der Arbeit konnte ich an der Albert-Ludwigs-Universität in Freiburg i. Br. und am Max-Planck-Institut zur Erforschung von Wirtschaftssystemen, Abteilung Evolutionsökonomik in Jena vortragen und diskutieren, wofür ich den Herren Prof. Dr. Bernhard Külp, Prof. Dr. Günter Knieps, Prof. Dr. Ulrich Witt und Prof. Dr. Victor Vanberg recht herzlich danken möchte. Aus der Zusammenarbeit mit den Herren Dr. RolfEngelbrecht und Wolfgang Moser (Gsf-medis) konnte ich viele nützliche Einsichten gewinnen, die mit der Implementation medizinischer Richtlinien verknüpft sind. Mit Herrn Dr. Roland Bantle (Universität der Bundeswehr in München) und Dr. Olaf Winkelhake (Gsf-medis) diskutierte ich Probleme der Anwendung von Evaluationsstudien, die in Abhängigkeit des Zeitpunktes im Verlauf eines Produktlebenszyklus auftreten. Herr Prof. Dr. Reiner Leidl (Universität Ulm) gab hilfreiche Hinweise zum Bereich ökonomischer Evaluation. Mit Herrn Dr. Detlef Schoder (Albert-Ludwigs-Universität in Freiburg im Breisgau) arbeitete ich in benachbarten Gebieten, wobei manche Einsicht Eingang in die vorliegende Arbeit gefunden hat. Das Ergebnis der Zusammenarbeit mit Dr. Ralph Strauß, Dr. Detlef Schoder, und Dr. Thomas Hummel (alle Albert-Ludwigs-Universität in Freiburg i. Br.) im Bereich Organizational Learning fand auch in der vorliegenden Arbeit ihren Niederschlag. Die Zusammenarbeit mit Herrn Dr. Walter Satzinger (Gsf-medis) und Herrn Prof. Dr. Christian Ohmann (Universität Düsseldorf) machte mich mit einigen Problemen der Qualitätssicherung, insbesondere hinsichtlich der Probleme bei der Messung von Qualität, bekannt. Durch Frau Prof. Dr. Christa Altenstätter (City University of New York, New York, USA) erhielt ich einige nützliche Informationen über neueste Entwicklungen des US-amerikanischen Gesundheitswesens. Herr Dr. Georg von Wangenheim, Universität Hamburg, unterstützte mich bei der Literaturauswahl aus dem Bereich Public Choice und Herr Prof. Dr. Hans Troidl (Universität zu Köln) versorgte mich freundlicherweise mit nützlicher medizinischer Literatur. Den Großteil der Literaturbeschaffung hat Frau Marlies Olberz (Gsf-medis) mit großer Umsicht übernommen und die Literatur-
6
Danksagung
ablage und -verwaltung wäre ohne tatkräftige Unterstützung von Frau Siegrid Feldt (Gsf-medis) mit großer Sicherheit sehr schwierig gewesen. Die Korrekturlesung des Manuskriptes hat freundlicherweise Weise Herr Thomas Krämer übernommen. Ihnen allen gilt mein Dank. Die Verantwortung für verbliebene Unzulänglichkeiten gehen selbstverständlich allein zu meinen Lasten.
Reiner P. Hellbrück
Inhaltsverzeichnis
A. Einführung ................................................................................................................ 15 I. Problemstellung ..................................................................................................... 15
11. Aufbau der Arbeit. ................................................................................................ 19 B. Qualitätssicherung ..................................................................................................... 22 I. Problem .................................................................................................................. 22 11. Struktur-, Prozeß-, und Outcomequalität ............................................................. 22 III. Qualitätssicherung in Deutschland ...................................................................... 24 1. Qualitätssicherung per Gesetz ........................................................................ 25 2. St. Vincent Declaration und Umsetzung ........................................................ 27 3. Beurteilung .................................................................................................... 29 IV. Schlußfolgerung .................................................................................................. 31 C. Entwicklung expliziter Standards .............................................................................. 34 I. Beurteilungskriterien ............................................................................................. 34
11. Medizinische und epidemiologische Studien ...................................................... 35 111. Ökonomische Studien ......................................................................................... 37 IV. Erstellung einer Guideline .................................................................................. 39 V. Schlußfolgerung ................................................................................................... 42 D. Durchsetzung von Standards ..................................................................................... 44 I. Problem .................................................................................................................. 44
11. Compliance .................................................................................................... ....... 46 111. Erklärungsansätze ................................................................................................ 47 IV. Peer Review, Medical Audit, Qualitätszirkel... ................................................... 51
8
Inhaltsverzeichnis V. Obduktionen und Todeskonferenzen .................................................................... 54 VI. Total Quality Management ................................................................................. 56 VII. Externe Kontrolle .............................................................................................. 58
l. Peer Review Organization ............................................................................. 58 2. Gewährleistungshaftung ................................................................................ 59 VIII. Health Telematics ............................................................................................. 61 IX. Schlußfolgerung .................................................................................................. 62 E. Die Qual der Wahl: Welcher Standard? ..................................................................... 65 I. Problem .................................................................................................................. 65 11. Behandlungsintensität .......................................................................................... 66 111. Public Health ....................................................................................................... 68 IV. Kostenerstattungsprinzip ..................................................................................... 72 V. Prospektives Entgeltsystem .................................................................................. 73 VI. Schlußfolgerung .................................................................................................. 74 F. Ökonomische Evaluation und Versorgungsqualität.. ................................................. 76 I. Problem .................................................................................................................. 76 11. Etablierte Verfahren ............................................................................................. 76 I. Ökonomische Effizienz .................................................................................. 76 2. Verbesserung der technischen Effizienz ........................................................ 77 3. Verbesserung der allokativen Effizienz ......................................................... 79 111. Neuerungen ......................................................................................................... 82
l. Verbesserung der technischen Effizienz ........................................................ 82 2. Verbesserung der "allokativen Effizienz........................................................ 85 IV. Schlußfolgerung .................................................................................................. 86 G. Managed Competition und Versorgungsqualität.. ..................................................... 89 I. Beurteilungskriterien ............................................................................................. 89 11. Selektive Verträge ................................................................................................ 90
Inhaltsverzeichnis
9
IH. Prospektive Entgeltsysteme ................................................................................. 92 IV. Schlußfolgerung .................................................................................................. 95 H. Handlungsspielräume zur Bestimmung der Gesundheitsausgaben ............................ 97 I. Problem ............................... :.................................................................................. 97 H. Beitragssatzstabilität ............................................................................................. 99 IH. Gleichheit. .......................................................................................................... 100 IV. Paternalismus ..................................................................................................... 101 V. Handlungsspielräume .......................................................................................... 102 VI. Schlußfolgerung ........................................... :.................................................... 105 I.
Handlungsspielräume zur Bestimmung der Struktur medizinischer Dienstleistungen ..................................................................................................... 109 I. Problem ................................................................................................................ 109 H. Ausgangslage ...................................................................................................... 110 IH. Neuerungen ........................................................................................................ 112 IV. Etablierte Verfahren .......................................................................................... 114 V. Handlungsspielräume .......................................................................................... 115 VI. Schlußfolgerung ................................................................................................ 120
J. Handlungsspielräume zur Verbesserung der Qualität medizinischer Leistungen ...... 123 I. Problem ................................................................................................................ 123 11. Handlungsspielräume .......................................................................................... 125 IH. Qualitätskonkurrenz ........................................................................................... 126 IV. Schlußfolgerung ................................................................................................ 127 K. Technische Aspekte: Datengenerierung und Datenbereitstellung ............................ 132
I. Problem ................................................................................................................ 132 H. Beurteilungskriterien ........................................................................................... 132 IH. Merkmalsträger .................................................................................................. 134 IV. Merkmalsauswahl und Datenquelle ................................................................... 135
10
Inhaltsverzeichnis V. Datenbereitstellung ............................................................................................. 139
VI. Schlußfolgerung ................................................................................................ 141 L. Ergebnis ................................................................................................................... 143 I. Darstellung ........................................................................................................... 143
11. Konsequenzen ..................................................................................................... 149 Anhang ......................................................................................................................... 152
Literaturverzeichnis ...................................................................................................... 154 Sachwortverzeichnis ..................................................................................................... 173
Tabellen- und Abbildungsverzeichnis Tabelle I
Entscheidungsmatrix
48
Tabelle 2
Beispiel
70
Abbildung I:
Individuelle Gesundheit, kein dominanter Produktionsprozeß
67
Abbildung 2:
Individuelle Gesundheit versus Public Health, kein dominanter Produktionsprozeß
70
Abbildung 3: Individuelle Gesundheit versus Public Health, ein dominanter Produktionsprozeß
71
Abkürzungsverzeichnis Ressourceneinsatz zur Erhöhung der Behandlungsintensität eine über a2' hinausgehender Ressourceneinsatz von a2 führt zu keiner Erhöhung der Compliance Ressourceneinsatz zur Erhöhung der Compliance AJPH
American Journal of Public Health
B
Benefit
b,c
Parameter
BMJ
British Medical Journal
Cov
Kovarianz
DOK
Die Ortskrankenkasse
DRG
Diagnose Related Groups
EBM
Einheitlicher Bewertungsmaßstab
G
Gewinn
h
Durchschnittskosten
HMO
Health Maintenance Organization
P
Preis
PORT
Patient Outcome Research Team
PRO
Peer Review Organization
R
Krankenhauseinkünfte Krankenhauskapazität Zeitpunkt
TQM
Total Quality Management
Abkürzungsverzeichnis
U
Nutzen
Var
Varianz
y
Anzahl an behandelten Personen
13
A. Einführung I. Problemstellung Wie kann die Qualität der medizinischen Dienstleistung verbessert werden? Dies ist die Leitfrage der vorliegenden Arbeit. Im Vordergrund steht das Gesundheitsssystem. Andere Bereiche, deren Gestaltung ebenfalls einen Einfluß auf die Gesundheit haben (wie Verkehrswesen, Umwelt), werden nicht betrachtet. Unter medizinischer Dienstleistung wird hier die Prävention und Kuration chronischer oder akuter Krankheit verstanden. Hierunter fallen Dienstleistungen niedergelassener Ärzte sowie Leistungen von Heilpraktikern und von Krankenhäusern. Die Ausführungen könnten möglicherweise auch auf andere Bereiche (Rehabilitation, Altenpflege, Psychiatrie) angepaßt werden, doch wird dieser mögliche Ansatz hier nicht weiter verfolgt. Einer der Hauptgründe für die weltweit zu beobachtende starke Regulierung nationaler Gesundheitssysteme ist die Prämisse, daß die Behandlung Kranker nicht von ihrer Zahlungsfahigkeit abhängen soll. Der Einfluß des Preises auf die individuelle Nachfrage ist um so geringer, je höher der Versicherungsgrad ist und je geringer die Patientenzuzahlungen bei gegebenem Versicherungsgrad sind (zu letzterem Aspekt siehe Schulenburg (1987». Angesichts des hohen Versicherungsgrades (in Deutschland sind etwa 90 Prozent in der gesetzlichen Krankenversicherung) und der vergleichsweise geringen Patientenzuzahlungen, spielen Preise bei der Nachfrage nach Gesundheitsleistungen Kranker in Deutschland allenfalls eine untergeordnete Rolle. In Deutschland ist die Inanspruchnahme des Hausarztes kostenlos, während irgendeine stationäre Krankenhausbehandlung mit einer Zuzahlung des Patienten von täglich 12 DM für längstens 14 Tage, d.h. jährlich maximal 164 DM verbunden ist (SGB V (1992), § 39 Abs. 4). Direkte finanzielle Anreize spielen allenfalls bei der Entscheidung eines Patienten zur Inanspruchnahme eines niedergelassenen Arztes im Vergleich zu einer stationären Krankenhausbehandlung eine Rolle. Sie sind dagegen für die Auswahl eines niedergelassenen Arztes oder für die Auswahl eines Krankenhauses zur stationären Behandlung weitgehend bedeutungslos. Der Ausschluß von Preisen als Selektionskriterium löst ein Problem, gleichzeitig bleiben andere Probleme bestehen und werden neue Probleme aufgeworfen .. Aus Erfahrung wissen wir, daß Wettbewerb zu niedrigeren Preisen (für Gesundheitsmärkte siehe Haas-Wilson (1990» und zu höherer Qualität führt (Hayek (1978». Andererseits ist die Regulierung des deutschen Gesundheitssy-
16
A. Einführung
sterns durch einen Zustand gekennzeichnet, in dem es keinen offenen, direkten Leistungswettbewerb zwischen den Anbietern (weder zwischen niedergelassenen Ärzten, zwischen Krankenhäusern noch zwischen niedergelassenen Ärzten und Krankenhäusern) gibt. Weder niedergelassene Ärzte noch Krankenhäuser führen eine detaillierte Statistik über Erfolge und Mißerfolge ihrer Tätigkeit. Es existieren nur unzureichende Rückkopplungsmechanismen zur Aufdeckung von Schwachstellen in der Versorgung. Trotzdem ist eine dem allgemein anerkannten Stand der medizinischen Erkenntnisse entsprechende Versorgung der Versicherten durch die Krankenkassen und Leistungserbringer sicherzustellen (§ 70, Absatz 1, SGBV (1992)). Nachfrager wünschen eine qualitativ hochwertige medizinische Versorgung. Diese Kluft zwischen Anspruch und Wirklichkeit ist seit geraumer Zeit erkannt und anerkannt. Zur Verbesserung der medizinischen Versorgung werden Qualitätssicherungsprogramme diskutiert und erprobt. Wie der Ausdruck Qualitätssicherungsprogramm zu recht suggeriert, wird vor allem die Absicherung erreichbarer Qualität angestrebt. Die zur Verbesserung der medizinischen Versorgungsqualität verwendeten Ansätze sind einem Wandel unterworfen. Dies drückt sich auch in den verwendeten Ausdrücken aus. So spricht man in der angelsächsischen Literatur heute meist nicht mehr von Qualitätssicherung, sondern von Outcome Research (oder Efficiency-Research) und Total Quality Management. Trotzdem wird hier der etwas veraltete Ausdruck Qualitätssicherung gebraucht, da vornehmlich Handlungsoptionen für das deutsche Gesundheitssystem aufgezeigt werden sollen und der Ausdruck Qualitätssicherung Eingang in die deutsche Gesetzgebung gefunden hat. Die Auffassung darüber, was Qualität ist, beeinflußt in beträchtlichem Maße die gesundheitspolitischen Empfehlungen. Exemplarisch werden hier vier verschiedene Begriffsbestimmungen vorgestellt: a) Qualität ist gemäß Donabedian (1968), S. 182 eine Entscheidung darüber, was eine gute und was eine schlechte Behandlung ist und beinhaltet somit ein Werturteil. b) Lohr (1990) (zitiert nach Iezzoni (1993), S. 112) definiert: 'Qualität der medizinischen Versorgung ist das Ausmaß, in dem medizinische Dienstleistungen für Individuen und Populationen die Wahrscheinlichkeit des Eintritts erwünschter Outcomes erhöht und umfaßt solche Art an medizinischer Versorgung, die mit dem gegenwärtigen medizinischen Wissen konsistent ist.' c) Nach Hauke (1991), S. 11 gibt es eine "pragmatische" Definition von Qualität: Qualität sei die Differenz zwischen dem, was bei der Patientenbehandlung tatsächlich erreicht werden kann, zu dem, was tatsächlich erreicht worden ist. Qualität sei so gesehen ein Zielerreichungsgrad, je höher die Zielerreichung, desto höher ist die Qualität. d) Eichhorn (1991), S. 30 definiert Qualität als die Gesamtheit der Merkmale, die ein Produkt oder eine Dienstleistung zur Erfüllung vorgegebener Forderungen geeignet macht und ist damit identisch mit der Definition von Qualität nach DIN.
I. Problemstellung
17
Qualitätsbeurteilung besteht dann in der Erkennung, Feststellung und Erfassung einer Abweichung zwischen Soll- und Ist-Ausprägung. Aus den ersten bei den Definitionen ergibt sich die Frage, wer die Entscheidung darüber, was eine gute und was eine schlechte Qualität der medizinischen Versorgung ist, treffen sollte. Im Rahmen von Qualitätssicherungsprogrammen sind dies meist Leistungserbringer, doch in jüngster Zeit ist man bestrebt, auch Patienten in die Qualitätsmessung einzubinden (Hopkins (1993), Carson/Home/Massi-Benedetti/PiwernetzNaughan (1992), S. 145). Die letzten bei den Definitionen haben gemeinsam, daß es einen Standard gibt, mit dem der Ist-Zustand verglichen werden kann und dieser Standard ist gemäß der zweiten Definition durch das gegenwärtige medizinische Wissen gegeben. Diese Vorstellung mündete in der gesundheitspolitischen Empfehlung zur Aufstellung (meist) professioneller Standards und einer Abgleichung des Ist-Zustandes mit diesen Standards. Ein weiteres Problem des Ausschlusses von Preisen als Selektionskriterium ist bei gegebenem Leistungsspektrum die Ausgabenentwicklung im Gesundheitswesen. So stieg in Deutschland der durchschnittliche Beitragssatz für die gesetzliche Krankenversicherung von 8,2 Prozent in den Jahren 1970-1975 auf 13,2 Prozent im Jahr 1994 an (Der Bundesminister für Gesundheit (1995), S. 298). Nach Dafürhalten von Gesundheitsökonomen (Neubauer (1988), Schulenburg (1988), Oberender (1988), S. 97, Sachverständigenrat für die Konzertierte Aktion im Gesundheitswesen (1994)) sind im deutschen Gesundheitswesen die ökonomischen Anreize für die Anbieter von Gesundheitsdienstleistungen falsch gesetzt. Ärzte verschreiben medizinische Behandlungen für Patienten, ohne daß Patienten direkt dafür zahlen. Patienten zahlen zwar indirekt über die Versicherungsbeiträge, doch die Inanspruchnahme medizinischer Leistungen durch den Einzelnen, bewirkt eine zu vernachlässigende Erhöhung der eigenen Versicherungsbeiträge. Aus diesem Grund erscheint eine Ausweitung der Inanspruchnahme medizinischer Leistungen für den Patienten rational. Andererseits zahlen Krankenkassen, ohne über die Leistung zu bestimmen. Es hat den Anschein, daß die Krankenversicherten die gesetzlichen Krankenkassen in unzulänglicher Weise kontrollieren (können). Konsequenz dieser falschen Anreize sind die steigenden Ausgaben im Gesundheitswesen. Mehrere Reformen wurden durchgeführt, ohne jedoch die ökonomischen Anreize entscheidend zu ändern. Aus diesem Grund blieb das Problem steigender Ausgaben weiterhin auf der Tagesordnung. Das Problem der Ausgabensteigerung ist in der Vergangenheit nicht nur in Deutschland aufgetreten. In einer Vielzahl von Ländern hat die "Kostenexplosion" im Gesundheitswesen Reformen oder zumindest Reformbemühungen unterschiedlichster Art in Gang gesetzt. In den USA stiegen die Gesundheitsausgaben stärker als das Sozialprodukt, obwohl ein beträchtlicher Teil der Bevöl2 Hellbrilck
18
A. Einführung
kerung nicht krankenversichert ist (Bradford (1993». Steigende Kosten und eine als ungenügend beklagte Effizienz des britischen Gesundheitssystems führten zur Einführung marktwirtschaftlicher Elemente (System des Contracting) (Ratcliffe (1993), S. 170). Im Bestreben Kosten zu senken, werden Aufgaben verstärkt dezentralisiert (GrosslBenbassatlNireVCohen (1992». Es wird nicht ernstlich bestritten, daß der Arzt über Art und Umfang medizinischer Behandlung weitgehend selbst entscheiden kann (Arnold (1988), S. 21, Cooper (1982». Durch ökonomische Anreize kann die Art und das Ausmaß der medizinischen Behandlung beeinflußt werden. Erfolgt die Entlohnung medizinischer Behandlung über Pauschalen, so wird der Arzt die medizinische Behandlung im Vergleich zu einer profitablen Einzelleistungsvergütung tendenziell einschränken. Die Einführung von Selbstbeteiligung kann zu einer Senkung der Nachfrage (Schulenburg (1987» und damit zu Ausgabensenkungen führen. Wer vermag jedoch zu sagen, ob eine Einzelleistungsvergütung, eine Vergütung nach Pauschalen oder die Einführung von Selbstbeteiligung zu einer medizinischen Behandlung führt, die Patienten wünschen und zu bezahlen bereit sind? Bei der Diskussion um die "Ausgabenexplosion" im Gesundheitswesen ist zwar von effizientem Ressourceneinsatz die Rede, ohne jedoch die Eigenheiten der produzierten Güter zu beachten. Bei Gesundheitsgütern handelt es sich um Dienstleistungen. Dienstleistungen sind nicht lagerbar, sie werden im Zusammenspiel zwischen Anbieter und Kunden erbracht. Die Qualität von Dienstleistungen ergibt sich aus diesem Zusammenspiel. Angebotscharakteristiken wie Nachfragecharakteristiken beeinflussen "das" Gut. So hat die medizinisch-technische Ausrüstung, der Kenntnisstand und die Motivation des Arztes ebenso wie der Gesundheitszustand, das medizinische Wissen und die Motivation des Patienten einen Einfluß auf die "Produktion von Gesundheit", d.h. die Verbesserung des Gesundheitszustandes und/oder der Lebensqualität des Patienten. Die Qualität von Dienstleistungen ist nicht gegeben, die sonst übliche Annahme "gegebener Güter" ist nicht haltbar. Die hier präsentierte Definition von Qualität der medizinischen Versorgung unterscheidet sich mithin grundlegend von den oben zitierten Begriffsbestimmungen. Zur Ergänzung von Qualitätssicherung werden hier gesundheitspolitische Handlungsspielräume aufgezeigt. Die Grundidee besteht darin, durch Bildung mehrerer Selektionsstufen eine verbesserte Anpassung von Versorgungsstruktur und Nachfragepräferenzen zu erreichen. Die Entscheidung über das Ausmaß von Krankenversicherungsschutz bildet die erste Selektionsstufe. Indem von einer in klinisch relevanten Bereichen einheitlichen Definition des Leistungskataloges der gesetzlichen Krankenversicherung abgegangen wird, entsteht für Versicherte die Möglichkeit, das Ausmaß ihres Versicherungsschutzes und die Höhe ihrer Gesundheitsausgaben selbst
11. Aufbau der Arbeit
19
zu bestimmen. Die zweite Selektionsstufe bildet das Verhältnis von Krankenversicherungen zu Leistungserbringern. Krankenkassen können in Kooperation mit den Leistungserbringern durch Organisationsreformen neue Versorgungsstrukturen schaffen. Als dritte Selektionsstufe bietet sich eine Neugestaltung des Verhältnisses zwischen den Leistungserbringern an. Es wird untersucht, ob durch Qualitätskonkurrenz zwischen Leistungserbringern das bestehende Gesundheitssystem im Hinblick auf die Qualität medizinischer Leistungen, als Dienstleistung verstanden, verbessert werden kann. Anstatt, wie in Qualitätssicherungsprogrammen, eine wie auch immer definierte erreichbare Qualität abzusichern, werden durch Qualitätskonkurrenz Informationen erzeugt und Anreize gesetzt, wodurch sich Angebot und Nachfrage einander anpassen können: Qualität wird generiert und gestaltet, ohne daß es zu einer ,,Ausgabenexplosion" im Gesundheitswesen kommen muß. Es wird diskutiert, welche Anreize schon jetzt bestehen oder welche Anreize gesetzt werden können, damit durch ein Zusammenspiel von Nachfrager und Leistungserbringer Qualität generiert und gestaltet wird. Hierbei ist es nicht ausgeschlossen, daß sich bei geeigneter Regulierung Qualitätskonkurrenz selbstorganisatorisch, ohne Einflußnahme des Staates durchsetzt.
11. Aufbau der Arbeit Die Arbeit kann in drei große Blöcke unterteilt werden. Im ersten Teil werden Anstrengungen zur Verbesserung der Qualität vorgestellt und beurteilt. Im zweiten Teil werden Maßnahmen im Hinblick auf ihre Wirkung auf die Versorgungsqualität diskutiert, die primär zu einer Verringerung des Anstiegs der Gesundheitsausgaben beitragen sollen. Die Ergebnisse dieser Analyse münden in einen wirtschaftspolitischen Vorschlag, der darauf abzielt, die Qualität der medizinischen Versorgung unter Beachtung der damit verbundenen Gesundheitsausgaben zu erhöhen. In Kapitel B wird ein kurzer Überblick über Qualitätssicherung im allgemeinen und Ansätze zur Qualitätssicherung in Deutschland im besonderen gegeben. Im Vergleich zu Deutschland sind Qualitätssicherungsmaßnahmen beispielsweise in den USA viel weiter fortgeschritten. Aus diesem Grund wird in Kapitel C und Kapitel D auf internationale Erfahrungen zurückgegriffen. Zentraler Bestandteil moderner Qualitätssicherung sind explizite Standards. Eine Diskussion der Entwicklung solcher Standards erfolgt in Kapitel C. Zur Beurteilung werden jene Kriterien genutzt, die von Personen, die in den Prozeß der Entwicklung expliziter Standards eingebunden sind, aufgestellt wurden. Es 2'
20
A. Einführung
zeigt sich, daß die Entwicklung expliziter Standards, gemessen an diesen Kriterien, Schwächen aufweist, die innerhalb der Qualitätssicherung nicht durch ein anderes Vorgehen behoben werden können. Unter rein pragmatischen Gesichtspunkten ist allein entscheidend, ob durch die Verwendung impliziter oder expliziter Standards eine Verbesserung der medizinischen Versorgung erreicht werden kann. Zur Erreichung dieses Ziels müssen a) die expliziten Standards genutzt und b) die Verwendung von Standards zu einer Verbesserung der Lebensqualität führen. In Kapitel D werden Belege zusammengetragen, woraus sich ergibt, daß die Befolgung medizinischer Standards gering ist. Anschließend werden verschiedene Erklärungsansätze für die niedrige Compliance skizziert. Die zur Implementation expliziter Standards und/oder zur Verbesserung der Compliance verwendeten Strategien werden im Hinblick auf die mit Qualitätssicherung verfolgten Ziele, sowie hinsichtlich der skizzierten Erklärungsansätze für die niedrige Compliance diskutiert. Diese Maßnahmen werden als nicht sehr wirksam eingestuft. In den USA, Großbritannien, den Niederlanden und Deutschland, um nur einige Staaten zu nennen, sind Bestrebungen im Gange, nationale Guidelines zu entwickeln. Zwecks Einsparung von Kosten, wird internationaler Erfahrungsaustausch und gegebenenfalls die Adoption der Guidelines anderer Staaten angestrebt. In Kapitel E wird untersucht, unter weIchen Bedingungen Guidelines anderer Staaten adoptiert werden können, ohne Gefahr zu laufen, daß die heimische Versorgungsqualität vermindert wird. Es zeigt sich, daß die Befolgung medizinischer Standards, die unter anderen Rahmenbedingungen entwickelt wurden, nicht ohne weiteres adoptiert werden können. Guidelines, die unter optimalen Bedingungen entwickelt wurden, können angesichts knapper Ressourcen zu suboptimalen Ergebnissen führen. In Kapitel F und Kapitel G werden Maßnahmen diskutiert, die primär auf eine Senkung der Gesundheitsausgaben ausgerichtet sind. Im besonderen wird in Kapitel F das Potential ökonomischer Evaluationsstudien zur Reduktion von Gesundheitsausgaben und zur Verbesserung der Versorgungsqualität diskutiert. Ökonomische Evaluationsstudien sind jedoch unzureichend instititutionell verankert und deshalb weitgehend ohne Einfluß. In der Gesundheitspolitik wird die ökonomische Evaluation zunehmend zur Bewertung von Neuerungen empfohlen und eingesetzt. Es zeigt sich jedoch, daß es keinen optimalen Zeitpunkt zur Bewertung von Innovationen gibt und mit einer frühzeitige Bewertung von Neuerungen Wohlfahrtsverluste verbunden sein können. In Kapitel G werden internationale Erfahrungen zum Zusammenhang zwischen Managed Competition und Versorgungsqualität zusammengetragen und gesundheitspolitische Vorschläge vorgestellt und diskutiert. Managed Competition wurde in den USA als Möglichkeit angesehen, das Wachstum der Gesund-
11. Aufbau der Arbeit
21
heitsausgaben zu verringern und die Qualität der medizinischen Versorgung zu verbessern. Es zeigt sich, daß Managed Competition vor allem auf eine Begrenzung des Anstiegs der Gesundheitsausgaben abzielt. Der Qualitätssicherung fällt die Aufgabe zu, drohenden Qualitätsminderungen entgegenzuwirken. Auf Grund dieser Analyse werden in den nachfolgenden Kapiteln Handlungsspielräume aufgezeigt. Grundlage dieser Analyse ist die gegenwärtige Regulierung des deutschen Gesundheitssystems. In Kapitel H wird eine Möglichkeit vorgestellt, wie Gesundheitsausgaben durch eine geeignete Vertragspolitik der Versicherungen wirksam begrenzt werden und gleichzeitig unterschiedlichen Versichertenpräferenzen entsprochen werden kann. Der Aufgabenbereich medizinischer Dienstleistung hat sich im Zuge des medizinischen Wandels geändert. Die Hauptaufgabe der medizinischen Versorgung bestand in der Vergangenheit vor allem darin, die Lebenserwartung zu erhöhen. In jüngster Zeit zielen dagegen eine Vielzahl medizinischer Eingriffe auf eine Erhöhung der Lebensqualität ab. Diese Änderung in der AufgabensteIlung führt dazu, daß zur Beurteilung medizinischer Verfahren persönliche Präferenzen verstärkt berücksichtigt werden sollten. Wie Versichertenpräferenzen berücksichtigt und wie die Versicherten Einfluß auf die Versorgungsstruktur nehmen können, wird in Kapitel I diskutiert. Die Überprüfung medizinischer Verfahren durch klinische Studien erscheint notwendig, doch wirksame Verfahren können in der medizinischen Versorgung in inadäquater Weise angewendet werden. Auf letzteres Problem zielt Qualitätssicherung ab. Es ist unklar, ob Qualitätssicherung in der Lage ist, die Qualität der medizinischen Versorgung kosteneffizient zu verbessern. Aus diesem Grund wird in Kapitel J untersucht, ob durch Qualitätskonkurrenz zwischen Leistungserbringern die Ziele, die durch Qualitätssicherung angestrebt werden, erreicht werden können. Die Diskussion der Qualitätskonkurrenz bleibt in Kapitel J notgedrungen sehr abstrakt. In Kapitel K werden deshalb technische Fragen, die mit einer Implementation von Qualitätskonkurrenz verbunden sind, behandelt. Die wichtigsten Ergebnisse sind in Kapitel L zusammengestellt.
B. Qualitätssicherung I. Problem Sorgfältige Auswahl alternativer Diagnose- oder Behandlungsstrategien, Abschätzung der Risiken und der zu erwartetenden Folgen, sowie Vergleich der Behandlungsstrategien gemäß dieser Folgen ist angesichts der Komplexität medizinischer Dienstleistungen häufig nicht möglich (Eddy (1982». Vielmehr ist die medizinische Entscheidungsfindung durch die Anwendung von Routinen gekennzeichnet. Die Entwicklung und Einführung neuer Diagnose- und Behandlungsverfahren in der klinischen Forschung geht auch mit zufälliger Bestimmung über Häufigkeit und Intensität von Handlungsabläufen einher, die sich durch Imitation verbreiten und sich zu einem stabilen Verhaltensmuster, einer Routine, verfestigen. Dem Arzt steht eine Menge an Routinen zur Verfügung und seine Entscheidung beschränkt sich (im wesentlichen) darauf, weIche Routine im konkreten Fall angewandt werden soll. Dies soll nicht bedeuten, daß gänzlich auf eine Entscheidungsfindung gemäß dem Rationalprinzip verzichtet wird, doch rationale Entscheidung ist wegen Komplexität und dem damit verbundenem mangelnden Wissen und Zeitdruck häufig nicht möglich und nicht unproblematisch. So kann die subjektive Abschätzung von Risiken auf Grund des Patientengutes in der eigenen Praxis wegen geringer Fallzahl und mangels Einsatz statistischer Verfahren leicht zu Fehleinschätzungen führen. Anstrengungen zur Verbesserungen der medizinischen Versorgung erfolgten primär über die medizinisch-wissenschaftliche Forschung, doch die Übertragung wissenschaftlicher Erkenntnisse in die alltägliche medizinische Praxis wurde vernachlässigt (Eddy (1982». Qualitätssicherung ist ein Instrument, um diese Lücke zu schließen.
11. Struktur-, Prozeß-, und Outcomequalität Die Aktualität der Qualitätssicherung geht unter anderem auf eine Initiative der WHO aus dem Jahre 1984 zurück. In ihrem Programm 'Gesundheit 2000'
11. Struktur-, Prozeß-, und Outcomequalität
23
empfahl sie in Ziel 31, daß es bis zum Jahr 1990 in jedem Mitgliedsstaat effektive Verfahren der Qualitätssicherung in der Patientenversorgung geben soll (Weltgesundheitsorganisation (1993». In Deutschland ist seit dem 1. Januar 1989 in (SGB V (1992), §§ 135-139) die Durchführung von Qualitätssicherungsmaßnahmen festgeschrieben. Es gibt jedoch keine allgemein akzeptierte Definition von Qualitätssicherung (Welch-Grover (1991), S. AS8) und die Bemühungen zur Etablierung von Qualitätssicherung haben in Deutschland erst begonnen (Lubecki (1994), Beske (1992». Die in Qualitätssicherungsprogrammen üblicherweise verwendeten Begriffe 'Strukturqualität' , 'Prozeßqualität' und 'Outcomequalität' lassen sich leicht charakterisieren, wenn die medizinische Versorgung als durch eine Produktionsfunktion beschreibbarer Prozeß aufgefaßt wird. Eine Produktionsfunktion beschreibt einen systematischen Zusammenhang zwischen Inputs und Outputs. Die konkrete Beziehung zwischen beiden Größen ergibt sich durch den Produktionsprozeß. Wenn eine effiziente Produktion unterstellt wird, so kann der Prozeß der medizinischen Versorgung gesichert oder verbessert werden, indem die Qualität der Inputs gesichert bzw. verbessert wird. Dies ist der Ansatzpunkt sogenannter Programme zur Sicherung der Strukturqualität. Eine Verbesserung der Strukturqualität soll zum Beispiel durch eine bessere Ausstattung mit medizinischtechnischem Gerät und höher qualifizierten Leistungserbringern erreicht werden. Gemäß Harteloh-Verheggen (1994) wird Qualität im traditionellen Verständnis als eine Eigenschaft medizinischer Versorgung aufgefaßt. Die Beziehung zwischen Input und Output ergibt sich durch den Stand der medizini~ schen Wissenschaft und ihrer Technologie zu einem bestimmten Zeitpunkt (Donabedian (1980), S. 80). Maßnahmen zur Sicherstellung der Prozeßqualität zielen darauf ab, implizite oder explizite medizinische Standards, zu entwickeln und darauf hinzuwirken, daß diese Standards eingehalten werden. Bei Verwendung impliziter Standards wird davon ausgegangen, daß sich die Beziehung zwischen Input und Output in der Arbeit der führenden Forscher der Wissenschaft und Technologie widerspiegelt. Die Veröffentlichungen, die Lehre und die praktische Tätigkeit, so die Vorstellung, führt zu technischen Normen guter medizinischer Versorgung. Die Normen, die die persönliche Beziehung zwischen Leistungsanbieter und Patient regeln, ergeben sich aus den Werten und den ethischen Prinzipien, die in der Gesellschaft vorherrschen. Implizit wird davon ausgegangen, daß die wissenschaftlich beste medizinische Versorgung von dem Wissenschaftsbereich in die alltägliche medizinische Praxis diffundiert und daß die ethischen Prinzipien der Gesellschaft auch in der zwischenmenschlichen Beziehung zwischen Leistungserbringer und Patient angewendet werden.
24
B. Qualitätssicherung
Dieser Zusammenhang zwischen medizinischer (wie auch medizinisch-technischer) Forschung und medizinischer Praxis wird jedoch mangels Effizienz zunehmend in Frage gestellt (Eichhorn (1991), S. 37). Aus diesem Grund wird in jüngerer Zeit von einer Vielzahl von Autoren Qualitätssicherung als ein kontinuierlicher Prozeß angesehen (Vrmeij (1991), S. 155-157, Beske (1993», wodurch der Diffusionsprozeß der wissenschaftlich fundierten, bestmöglichen medizinischen Praxis verbessert werden soll. Hierbei wird die Erstellung expliziter Standards als wichtiger Zwischenschritt angesehen. Explizite Standards werden in einem Dokument niedergelegt, man spricht dann auch von Guidelines oder von klinischen Protokollen. Guidelines sind systematisch entwickelte Aussagen, die die an der medizinischen Versorgung Beteiligten (wie beispielsweise Ärzte, Pflegepersonal, aber auch Patienten) in ihrer Entscheidung über eine angemessene Versorgung unterstützen sollen (Field-Lohr (1990». Es kann sich hierbei um einen nationalen expliziten Standard oder um einen ausschließlich in einer medizinischen Einrichtung genutzten expliziten Standard handeln. So schlägt der Sachverständigenrat für die Konzertierte Aktion im Gesundheitswesen (1994), S. 34 vor, zur Qualitätssicherung von Diagnose und Therapie Standards zu bilden, die per Konsensbildung von Wissenschaft und korporativen Organisationen gefördert werden soll. Outcomequalität zielt auf eine Sicherung der Ergebnisse medizinischer Versorgung ab. Outcome bezieht sich auf den gegenwärtigen und künftigen Gesundheitszustand, insoweit er einem vorhergehenden medizinischen Eingriff zugerechnet werden kann (Cleary-McNeil (1988), S. 26). Hierbei ist zu beachten, daß bei einer prozeßorientierten Sichtweise die Trennung in Input und Output (oder in anderen Worten, die Definition der betrachteten Krankheitsepisode) mit Problemen behaftet ist. Denn das Ergebnis eines medizinischen Eingriffes wird gegebenenfalls das Ergebnis eines nachfolgenden medizinischen Eingriffs beeinflussen. In den meisten Ansätzen zur Qualitätssicherung wird die Sicherung von Strukturqualität, Prozeßqualität und Outcomequalität angestrebt, wobei sich die verschiedenen Ansätze vor allem in der Gewichtung dieser Elemente und ihrem Zweck voneinander unterscheiden (Ovretveit (1994». In der Vergangenheit bestand Qualitätssicherung vor allem in der Sicherung von Strukturqualität (Der Bundesminister für Gesundheit (1994), S. 124), doch seit 1989 sind in Deutschland auch Maßnahmen zur Sicherung von Prozeß- und Outcomequalität gesetzlich vorgeschrieben.
111. Qualitätssicherung in Deutschland Es ist nicht beabsichtigt, einen umfassenden Überblick über gegenwärtige Qualitätssicherungsmaßnahmen in Deutschland zu geben. Die Beschreibung ei-
III. Qualitätssicherung in Deutschland
25
niger aktueller Aktivitäten sollte ausreichen, um eine erste Beurteilung vornehmen zu können.
1. Qualitätssicherung per Gesetz Seit 1989 ist Qualitätssicherung gesetzlich vorgeschrieben. Gemäß SGB V (1992), §§ 135-139 hat Qualitätssicherung im ambulanten und stationären Bereich zu erfolgen, wobei vergleichende Prüfungen möglich sein sollen. Aus dem Gesetzestext geht jedoch nicht hervor, was von wem miteinander verglichen werden soll. Die nachfolgende Beschreibung konzentriert sich auf die stationäre Versorgung. Krankenhäuser, die einen Versorgungsvertrag haben, müssen sich an Qualitätssicherungsmaßnahmen beteiligen. Die Anstrengungen haben sich auf Struktur-, Prozeß- und Outcomequalität zu beziehen. Die Konkretisierung des gesetzlichen Auftrags obliegt den korporativen Organisationen (wie Krankenhausgesellschaft, Bundesärztekammeretc., §137, SGB V (1992». Ein Pilotprojekt wurde durchgeführt, um erste Erfahrungen mit externer Qualitätssicherung zu sammeln (Niemann-Beske (1992». Unter externer Qualitätssicherung versteht man den Vergleich von Anbietern durch externe Personen. Bemühungen zur Qualitätsverbesserung innerhalb einer Versorgungseinrichtung bezeichnet man als interne Qualitätssicherung. Es besteht die Vorstellung, daß interne Qualitätssicherung durch externe Qualitätssicherung angeregt wird. Eine Arbeitsgruppe, bestehend aus Krankenhausrepräsentanten, wurde für jedes relevante medizinische Fachgebiet gebildet und die medizinische, routinemäßige Versorgung wurde unter Verwendung standardisierter Kriterien beobachtet. Die Arbeitsgruppe identifizierte Qualitätsprobleme und beurteilte sie. Letzteres erfolgte, indem die Bedeutung des Problems, die Lösbarkeit des Problems und die mit letzerem verbundenen Kosten von jedem Mitglied der Arbeitsgruppe eingeschätzt und subjektiv gewichtet wurde. Nach Diskussion der so gefundenen Ergebnisse, korrigierte jeder Teilnehmer gegebenenfalls seine Bewertung. Die Priorität eines Problems wurde durch Summation aller individuellen Gewichte eines Problems ermittelt. In der Chirurgie und der Gynäkologie fand ein anderes Bewertungsverfahren statt. Die Einschätzung der Bedeutung der Probleme erfolgte in einer Konsensuskonferenz mit offener Diskussion. In beiden Fällen wurden jedoch die drei wichtigsten Probleme als Handlungsfelder für Qualitätssicherungsmaßnahmen angesehen. In diesem Pilotprojekt und einer nachfolgenden Routineanwendung wurden die Prioritäten ausschließlich durch Vertreter der medizinischen Professionen gesetzt (NiemanlEversmann/GrandtJBeske (1993), S. 18).
26
B. Qualitätssicherung
Anfangs wurde die Qualität eines Krankenhauses durch einen Vergleich des Ist-Zustandes mit der bestmöglichen medizinischen Praxis beurteilt. Dann wurde Benchmarking, ein im Bereich des sogenannten 'Total Quality Management' - Konzeptes wohlbekanntes Instrument, angewandt. Im Benchmarking wird jedem Teilnehmer der augenblickliche Stand seiner Versorgungsqualität im Vergleich zu den anonym bleibenden anderen Teilnehmern übermittelt (Piwernetz-Brundobler (1995». Diese Vergleiche erfolgen mit Hilfe von Qualitätsindikatoren. Ein Qualitätsindikator ist eine meßbare Variable, mit deren Hilfe die Qualität medizinischer Versorgung gemessen werden kann. Hierbei kann es sich um Variablen zur Messung von Struktur-, Prozeß-, oder Outcomequalität handeln. So wird beispielsweise die Prozeßqualität durch den Anteil vollständig dokumentierter Untersuchungsergebnisse an der Gesamtzahl aller Untersuchungen eines Krankenhauses mit der entsprechenden Kennziffer anderer Krankenhäuser verglichen. Sofern sich solche Vergleiche auf Prozeßqualität beziehen, wird hierbei ermittelt, in wieviel Prozent der Fälle ein bestimmter Standard von einem Krankenhaus eingehalten wurde und diese Kenngröße wird mit der entsprechenden Kennziffer anderer Krankenhäuser verglichen. Falls Qualitätsprobleme ersichtlich werden, sollen Qualitätszirkel initiiert werden, um den entdeckten Problemen zu begegnen. Qualitätszirkel bestehen aus einer Gruppe von Personen (verschiedene Fachärzte, Pflegepersonal), die die Ursachen dieser Qualitätsprobleme untersuchen und Maßnahmen zu ihrer Beseitigung vorschlagen und implementieren sollen. Inzwischen wurde zwischen der Deutschen Krankenhausgesellschaft und den verschiedenen Kassenverbänden unter Beteiligung der Bundesärztekammer eine Rahmenvereinbarung über die Durchführung von Qualitätssicherungsmaßnahmen getroffen (DKG-Vorstandsbeschluß (1992». Diese Rahmenvereinbarung bildet die Grundlage zum Abschluß von Verträgen zur Qualitätssicherung auf Länderebene. Gemäß der Rahmenvereinbarung sollen die Verträge auf Landesebene externe Qualitätssicherungsmaßnahmen ermöglichen und Qualitätsindikatoren entwickelt werden. Qualitätssicherungsmaßnahmen sind in gegenseitigem Einverständnis aller Beteiligten zu entwickeln, zu realisieren und zu evaluieren. Ausschließlich den Chefärzten und den Oberschwestern werden Informationen der externen Vergleiche übermittelt. Diese können diese Informationen an weiteres Krankenhauspersonal weitergegeben, falls dies angezeigt erscheint. Ein 'Lenkungsausschuß' initiiert bei dem Auftreten statistischer Abweichungen in gegenseitigem Einverständnis erforderliche Maßnahmen. Damit verfügt Deutschland nun über eine Zentralstelle für Qualitätssicherung, wie sie von der WHO vorgeschlagen wurde (Selbmann (1986».
III. Qualitätssicherung in Deutschland
27
2. St. Vincent DecIaration und Umsetzung Ein weiteres Beispiel für die Initiierung von Qualitätssicherungsmaßnahmen bildet die sogenannte St. Vincent Dec1aration und deren Umsetzung. Die St. Vincent Dec1aration zielt auf eine Verbesserung der Versorgung von Diabetikern ab. Die Versorgung von Diabetikern wird als unzureichend angesehen. In der europäischen WHO-Region mit etwa 850 Millionen Einwohnern gibt es etwa 30 Millionen Diabetiker (Weltgesundheitsorganisation (1994), S. 1), das entspricht einem Anteil von 0,035), während circa 10 Millionen Menschen von Diabetes bedroht sind (KranslPorta/Keen (1992), S. 7). 1989 trafen sich in St. Vincent, Italien, Regierungsvertreter, Diabetologen und Repräsentanten von Patientenvereinigungen aus ganz Europa und verabschiedeten Empfehlungen zur Verbesserung der Diabetikerversorgung: die sogenannte St. Vincent Declaration. In dieser Declaration werden konkrete Ziele vorgegeben, die innerhalb von fünf Jahren erreicht werden sollen. Zum einen werden in quantifizierter Form Vorgaben zur Verringerung von Folgekrankheiten des Diabetes gemacht. So sollen alle Spätfolgen von Diabetes um ein Drittel gesenkt werden. Zum anderen werden Handlungsanleitungen zur Verbesserung der medizinischen Versorgung zwecks Erreichung der Ziele angegeben. Insbesondere soll die Qualität der medizinischen Versorgung unter Zuhilfenahme modernster Informationstechnik gemessen und Maßnahmen zur Sicherung der Qualität ergriffen werden (KranslPorta/Keen (1992). Ein St. Vincent Steering Committee und Arbeitsgruppen haben sich gebildet, um die St. Vincent Declaration umzusetzen. Im Rahmen von AlM (Advanced Informatics in Medicine) wurden und werden verschiedene Projektvorhaben von der EU gefördert (wie beispielsweise das DIABCARD-Projekt - Improved Communication in Diabetes Care based on ChipCard Technology). Die Arbeitsgruppe EURODIABETA, ebenfalls von der EU gesponsort, beschäftigte sich mit der ModeIIierung des Gesundheitsversorgungsprozesses, insbesondere mit der Entwicklung eines Datensatzes zur Beschreibung der medizinischen Versorgung. Die Gruppe DO IT, was für Diabetes care Optimisation through Information Technology steht, beschäftigt sich mit praktischen telematischen Umsetzungsfragen. DiabCare ist bestrebt, eine organisatorische Plattform aufzubauen, um eine reibungslose Zusammenarbeit der Beteiligten zu erreichen (PiwernetzIMassi-BenedettilStaehr-Iohansen (1993)). Zwischenzeitlich liegt ein Qualitätsstandard zur Behandlung von Typ I Diabetes (European IDDM Policy Group (1993)) und ein Standard zur Behandlung von Typ 11 Diabetes (European NIDDM Policy Group (1993)) vor. Auf diesen Grundlagen wurde ein sogenannter Diabetes-Paß entwickelt. Es wurde ein Konsens über einen DiabCare-Datensatz erzielt und getestet
28
B. Qualitätssicherung
(Pi wernetz/Massi-BendedettilKrankslMicheillStaehr-Johansen (1993)). Dieser Datensatz enthält jene Merkmale, mit deren Hilfe die medizinische Versorgung der Diabetiker beschrieben werden soll. Ziel der Diabetikerversorgung ist gemäß der St. Vincent Declaration eine Verringerung der Spätfolgen von Diabetes. Hierzu zählen in erster Linie: Erblindung, Beinampuationen, Nierenversagen im Endstadium, Herzinfarkt und Hirnschlag, sowie die Erzielung eines Outcomes bei den Geburten von Diabetikerinnen, die der von Nichtdiabetikerinnen gleichkommt. Diese Qualitätsindikatoren werden von der DiabCare Working Group (Piwernetz, et al. (1995)) als 'wahre' Qualitätsindikatoren bezeichnet. Nachteil dieser 'wahren' Qualitätsindikatoren ist, daß sie vergleichsweise spät eine Änderung in der Qualität der medizinischen Versorgung anzeigen. Aus diesem Grund werden auch Indikatoren zur Messung von Zwischenergebnissen gebildet (wie z.B. Retinopathie für Erblindung und das Vorliegen von Geschwüren für den Fall der Fußamputation). In solchen Versorgungssystemen, in denen die Patientendaten fragmentiert sind, weil verschiedene Leistungserbringer in die Versorgung eingebunden und verantwortlich sind, sind häufig auch die Indikatoren zur Messung von Zwischenergebnissen nicht ermittelbar. Deshalb werden auch Indikatoren der Prozeßqualität (wie zum Beispiel das Ausmaß der Dokumentation von Untersuchungsergebnissen oder Fragen zu den getroffenen Maßnahmen, die bei Diagnose von Rethinopatie ergriffen worden sind) zur Beurteilung der Versorgungsqualität herangezogen. Die Einbindung von Patienten bei der Qualitätsmessung der Diabetikerbehandlung ist vorgesehen, bislang gibt es jedoch noch keine ausgearbeiteten Qualitätsindikatoren, die zur Messung der Qualität der Diabetikerversorgung aus der Sicht des Diabetikers geeignet sind (siehe PiwernetziStaehr-Johansen/Krans (1995), S. 15). Damit sind die Grundlagen zu einem Qualitätsmanagement gelegt, das mit Hilfe des Benchmarking und dem Einsatz von Qualitätszirkeln erfolgen soll (Piwernetz, et al. (1995)). Vergleiche sollen auf regionaler und nationaler Ebene möglich sein, aber auch Vergleiche mit den Versorgungsdaten anderer Länder werden angestrebt. Hierdurch, so hofft man, können Qualitätsprobleme in der Versorgung entdeckt werden. Die Teilnahme an diesen Qualitätssicherungsbemühungen erfolgt auf freiwilliger Basis. Es wird daran gedacht, die Teilnahme an diesem Programm als eine Vorbedingung zur Verleihung des Gütesiegels 'center of excellence' zu machen (Piwernetz/Massi-BendedettilKrankslMicheillStaehr-Johansen (1993), S. 309). Diesen Centers of Excellence wird die Rolle von Multiplikatoren zugeschrieben, um die Diffusion der bestmöglichen medizinischen Versorgung im öffentlichen Gesundheitswesen voranzutreiben.
III. Qualitätssicherung in Deutschland
29
3. Beurteilung Im Rahmen der St. Vincent Initiative nehmen die Krankenhäuser freiwillig an Qualitätssicherungsmaßnahmen teil, gleichzeitig sind deutsche Krankenhäuser zur Durchführung von gesetzlich nicht näher bestimmten Qualitätssicherungsmaßnahmen verpflichtet. Im ersten Fall sind Adverse Selection Probleme und im zweiten Fall sind Moral Hazard Probleme zu erwarten. Die Teilnahme von Krankenhäusern an externen Qualitätssicherungsmaßnahmen beinhaltet die Gefahr, bei zu gering eingestufter Qualität zur Rechenschaft gezogen zu werden. Jene Krankenhäuser, die sich wegen mangelnder Qualität an Qualitätssicherungsmaßnahmen beteiligen sollten, haben dann einen Anreiz nicht teilzunehmen, damit die mangelnde Qualität nicht publik wird: Adverse Selektion ist von Bedeutung. Diese Hypothese kann nicht mit 'harten' empirischen Befunden belegt werden, doch gibt es Hinweise, die diese Hypothese stützen. So hat in freiwilligen Qualitätssicherungsmaßnahmen ein beträchtlicher Teil von Krankenhäusern nicht teilgenommen. EversmannlNiemannlBeske (1993), S. 43 beispielsweise berichten, daß alle Krankenhäuser Nordrhein-Westfalens im Jahr 1982 an einer Qualitätssicherungsmaßnahme teilnehmen konnten, doch nur 181 von 410 nahmen tatsächlich teil. Qualitätssicherungsaktivitäten in der Perinatalversorgung gehen auf das Jahr 1975 zurück und sind nun in der gesamten Bundesrepublik anzutreffen. Insgesamt werden neunzig Prozent aller Geburten (eintausend Krankenhäuser) im Jahr 1992 abgedeckt (Der Bundesminister für Gesundheit (1994), S. I 18). Einschränkend ist jedoch hinzuzufügen, daß keine Informationen vorliegen, ob es sich bei den nichtteilnehmenden Krankenhäusern um Krankenhäuser mit geringer Versorgungsqualität handelt. Wegen des Adverse Selection Problems erscheint es sinnvoll, Qualitätssicherung zwingend vorzuschreiben. In der Literatur (siehe z.B. PiwernetVMassi-BenedettilKrankslMicheilIStaehr-Johansen (1993)) wird gefordert, daß bei Krankenhausvergleichen die Daten über Konkurrenten anonymisiert werden, um auszuschließen, daß einem Teilnehmer aus seiner Teilnahme Nachteile erwachsen. Mit anderen Worten sollen hierdurch Moral Hazard Probleme vermieden werden. Krankenhäuser, die um die geringe Qualität ihrer Versorgung wissen, haben ansonsten einen Anreiz, ihre Daten in für sie vorteilhafter Weise zu ändern. Doch selbst bei solchen Krankenhäusern, die freiwillig an Qualitätssicherungsmaßnahmen teilnehmen, können Datenprobleme entstehen. EversmannlNiemannlBeske (1993), S. 41 berichten über die Nutzung zweier Methoden zur Datensammlung in einer freiwilligen Qualitätssicherungsmaßnahme: a) Datensammlung durch das Krankenhauspersonal und b) durch externe Experten. In letzterem Fall handelte es sich nicht um eine primäre Datenerhebung, sondern die medizinischen Berichte des Krankenhauspersonals wurden genutzt. Der Vergleich der beiden Datenerhebungsmethoden ergab, daß die Differenz zwischen beiden Datenerhebungs-
30
B. Qualitätssicherung
methoden in einigen Krankenhäusern erheblich war. Wiederum muß jedoch eingeräumt werden, daß nicht bekannt ist, ob es sich bei den Krankenhäusern mit großem Unterschied in den beiden Datensätzen auch um Krankenhäuser mit geringer Versorgungsqualität handelt. Moral Hazard kann dazu führen, daß das Konzept der Qualitätssicherung von dem Krankenhauspersonal nicht akzeptiert wird. Mögliche Folge ist, daß das Krankenhauspersonal sein Verhalten im Falle einer Differenz zwischen Ist- und Soll-Zustand nicht ändert. Interne Qualitätssicherungsmaßnahmen sind ineffizient oder aber werden erst gar nicht ergriffen. Letzteres ist möglich, da interne Qualitätssicherung auch weiterhin freiwillig ist und Informationen über die Qualität einzelner Krankenhäuser nur dem Krankenhauspersonal bekannt gemacht werden. Patienten werden über mangelnde Qualität eines Krankenhauses nicht unterrichtet, ihre Information über die Krankenhausqualität ist rudimentär. 'Abstimmung mit den Füßen' durch die Patienten wird nur bei sehr gravierenden, sichtbaren Qualitätsmängeln stattfinden. Diese potentielle Gefahr wiederum verstärkt den Anreiz von Krankenhäusern, die eine geringe VersorgungsquaIität aufweisen, Daten, die Auskunft über die Qualität des Krankenhauses geben, zu schönen. Es wird zwar versucht, Adverse Selection und Moral Hazard zu vermeiden, doch es gibt guten Grund, an einem Erfolg zu zweifeln. Obwohl Krankenhäuser seit 1989 zur Durchführung von Qualitätssicherung gesetzlich verpflichtet sind, existierte in einigen Bundesländern selbst im Jahr 1993 kein auf der Rahmenempfehlung basierender Rahmenvertrag (Der Bundesminister für Gesundheit (1994), S. I 30). Im Jahr 1995 faxte ich zu allen Landeskrankenhausgesellschaften um in Erfahrung zu bringen, ob nun in allen Bundesländern Rahmenverträge abgeschlossen sind. Seit Beginn der gesetzlichen Verpflichtung zogen sieben Jahre ins Land und es gibt noch immer Bundesländer, in denen auf Länderebene kein Rahmenvertrag abgeschlossen ist. Die Rahmenvereinbarung zwischen der Deutschen Krankenhausgesellschaft und den Spitzenverbänden der Krankenkassen enthält eine Regelung, die in Streitfällen die Bewahrung des Status Quo zur Folge hat. Denn alle Maßnahmen bedürfen der einvernehmlichen Einwilligung der Beteiligten. Sollte die Praxis des Lenkungsausschusses nicht in der Bewahrung des Status Quo bestehen, so verschärft sich das Moral Hazard Problem. Denn Krankenhäuser sind zur Teilnahme an externen Qualitätssicherungsmaßnahmen per Rahmenvereinbarung verpflichtet. Da der Lenkungsausschuß bei signifikanten Abweichungen zwischen Soll und Ist-Zustand einvernehmlich Maßnahmen beschließen kann, verschärft sich dann das Moral Hazard Problem. Wesentliches Ziel von Qualitätssicherungsmaßnahmen ist die Schaffung von Vertrauen der Patienten in die Leistungserbringer (Dörr (1995)). Sinnfällig wird
IV. Schlußfolgerung
31
dieses Ziel durch das Projekt 'Vertrauen durch Qualität' (Satzinger (1992» der städtischen Krankenhäuser Münchens. Da alle Krankenhäuser zu Qualitätssicherungsmaßnahmen verpflichtet sind und den Versicherten keine Information über die Einhaltung von Qualitätsstandards zugänglich sind, ist es für Nachfrager auch weiterhin unmöglich, zwischen Leistungserbringern gemäß ihrer Leistung zu differenzieren. Sofern Qualitätssiegel, wie geplant (persönliche Mitteilung), lediglich die Teilnahme an Qualitätssicherungsmaßnahmen signalisieren, wird sich an der mangelnden Transparenz des medizinischen Versorgungsangebotes auch weiterhin nichts ändern. In die gleiche Richtung argumentiert die gesetzliche Krankenversicherung, die Deutsche Krankenhausgesellschaft und die Bundesärztekammer (Ohne Autor (1996», demgemäß eine Zertifizierung nach DIN/ISO als unzweckmäßig angesehen wird. Qualitätssicherung ist durch Paternalismus geprägt, wenn auch durch Zufriedenheitsbefragungen der Patienten eine stärkere Kundenorientierung bei den Leistungserbringern geweckt werden soll.
IV. Schlußfolgerung Bemühungen zur Verbesserung der Qualität der medizinischen Versorgung gibt es nicht erst in jüngster Zeit. Eher traditionelle Ansätze der Qualitätssicherung beschränken die ergriffenen Maßnahmen jedoch auf die Sicherung der Qualität innerhalb einer Einrichtung oder einer kleineren Zahl medizinischer Versorgungseinrichtungen. Im Gegensatz zu modernen Ansätzen, wo die Aktivitäten auf eine permanente Installation von Qualitätssicherungsbemühungen ausgerichtet sind (insbesondere routinemäßiges Monitoring), erfolgen bei traditionellen Ansätzen die Qualitätssicherungsbemühungen nachdem sich im Routinebetrieb Qualitätsprobleme eingestellt haben (wie beispielsweise das Zusammentreten von Gremien nach dem Auftreten von Infektionen oder dem Bekanntwerden von Differenzen zwischen klinischer Diagnose und Obduktionsbefunden etc.). Traditionelle Qualitätssicherungsmaßnahmen zielen auf Verbesserungen vor Ort, wogegen moderne Qualitätssicherungsprogramme (tendenziell) auf eine Verbesserung der nationalen Gesundheitsversorgung abzielen. Kennzeichen einer Vielzahl moderner Ansätze zur Qualitätssicherung ist die öffentliche Förderung von Forschungsprogrammen zur Datenerschließung und Durchführung von Pilotprojekten. In den USA, den Niederlanden und Deutschland werden zunehmend von Versicherungen und durch staatliche Regulierung permanente Qualitätssicherungsbemühungen für Krankenhäuser eingefordert (Bornhof/Arends/Beek (1993». Diese Ansätze stützen sich häufig auf routinemäßig anfallende Krankenhausdaten, die auf mögliche Qualitätsprobleme hin untersucht werden. Das Auftreten unüblicher Komplikationen, gemessen an
32
B. Qualitätssicherung
'dem' medizinischen Standard, wird hierbei als Indikator für Qualitätsprobleme verwendet. Der Zwang zur Teilnahme an solchen Qualitätssicherungsbemühungen läßt jedoch Moral Hazard Probleme entstehen, mit der Folge, daß die Verläßlichkeit von Krankenhausdaten, als Indikator der Versorgungsqualität, als gering einzuschätzen ist. Die freiwillige Teilnahme an Qualitätssicherungsmaßnahmen führt andererseits zu Adverser Selektion: jene Leistungserbringer, die sich wegen unzureichender Qualität an Qualitätssicherungsprograrnmen beteiligen sollten, tun dies nicht, um zu vermeiden, daß sie wegen unzulänglicher Qualität gemaßregelt werden. Die folgenden Elemente scheinen notwendigerweise mit Qualitätssicherung verbunden zu sein: a) die Verwendung von Standards zur Beurteilung der medizinischen Versorgung, b) das Bestreben, eine Verbesserung der medizinischen Versorgung durch eine Verringerung zwischen Ist-Zustand und der bestmöglichen medizinischen Versorgung, dem Standard, zu erreichen und c) die Messung VOn Versorgungsqualität zur Bestimmung des Ist-Zustandes. Maßnahmen zur Sicherung der Prozeßqualität sollen sicherstellen, daß auf der Produktionsfunktion und nicht unterhalb der Produktionsfunktion produziert wird. Qualitätssicherung dient mit anderen Worten dazu, daß die in der medizinischen Praxis existierende Menge an (Behandlungs-)Routinen durch superiore Routinen ersetzt werden. Eine Produktionsfunktion wird durch medizinische Standards definiert. Ein Standard ist eine Sollensvorschrift, es handelt es sich um eine explizit in einem Dokument niedergelegte oder eine implizite normative Vorgabe medizinischen Praktizierens. Eine medizinische Behandlung wird bei der Setzung expliziter Standards nicht als Dienstleistung, sondern vielmehr als eine Aneinanderreihung einzelner Behandlungsschriue angesehen (Knox (1982), S. 57). Qualitätssicherungsprogramme setzen an der Angebotsseite an. Qualitätsmessung, Entwicklung von Standards und Maßnahmen zur Verhaltensänderung von Leistungserbringern werden als alleinige Aufgabe der Angebotsseite betrachtet. Der Einfluß VOn Patienten ist beschränkt, sie dienen als eine mögliche Informationsquelle. So sollen im Rahmen der Umsetzung der St. Vincent Declaration Patienten als Informationsquelle genutzt werden. In den Niederlanden werden in jüngster Zeit zur Entwicklung expliziter Standards auch Patientenvertreter zugelassen (Klazinga (1994)). Im Zuge der Entwicklung neuer telematischer Anwendungen zur Verbesserung der medizinischen Versorgung legt die EU zwar Wert auf eine Nutzerorientierung, doch Anspruch und Wirklichkeit liegen immer noch weit auseinander (siehe beispielsweise den Bericht von Barahona (1994)). Die medizinische Versorgung ist eine Dienstleistung. Williamson (1992), S. 23ff unterscheidet zwischen klinischer und nicht-klinischer Versorgung. Klinische Versorgung ist ein meist impliziter Vertrag zwischen Patient und Lei-
IV. Schlußfolgerung
33
stungserbringer, in dem der Leistungserbringer sich verpflichtet, wenn gewünscht, beratend tätig zu werden. Nicht-klinische Versorgung betrifft die Versorgung außerhalb der klinischen Versorgung, wie zum Beispiel Organisationsfragen, die in keiner direkten Verbindung zu Diagnostizierung und medizinischer Behandlung stehen. Die Grenzen zwischen beiden Begriffen sind jedoch häufig fließend. Qualitätssicherungsprogramme vernachlässigen häufig einen wichtigen Aspekt der Dienstleistung medizinische Versorgung: die nicht-klinische Versorgung. Vor allem Mißstände in der nicht-klinischen Versorgung waren in der Vergangenheit häufig Anlaß zur Gründung von Interessenverbänden zur Wahrnehmung "der" Patienteninteressen. Williamson (1992) gibt Beispiele an, in denen Interessenverbände erfolgreich interveniert haben. Qualitätssicherungsmaßnahmen werden krankheitsspezifisch durchgeführt (unter Verwendung sogenannter 'Tracer Diagnosen'). Diese krankheitsspezifische Betrachtung ist notwendig, weil bei der Messung der Qualität der medizinischen Versorgung in Abhängigkeit der Krankheit sehr verschiedene Merkmale von Bedeutung sind. Zudem müssen, angesichts knapper Ressourcen, Schwerpunkte gesetzt werden. Die Schwerpunktsetzung erfolgt häufig, wie beispielsweise bei der St. Vincent Initiative, unter Hinweis auf ein Public-Health Problem, d.h. das Vorliegen einer hohen Prävalenz und/oder Inzidenz einerseits und dem Hinweis auf eine ungenügende medizinische Versorgung der betrachteten Population. Es ist festzuhalten, daß in der St. Vincent Declaration zwischen Ziel und Mittel zur Zielerreichung kein Bezug erkennbar ist: es gibt keinen erkennbaren systematischen Zusammenhang, der dazu führt, daß die Ziele auch erreicht werden können.
3 HellbrUck
c.
Entwicklung expliziter Standards I. Beurteilungskriterien
Viele Vorschläge zur Qualitätssicherung, die in der jüngsten Zeit gemacht wurden, sind dem Paradigma verhaftet, daß Qualitätssicherung einer wissenschaftlichen Basis bedarf (Beske (1992)). Aus diesem Grund werden in diesem Kapitel Guidelines daraufhin untersucht, ob sie wissenschaftlichen Standards genügen. In Anlehnung an Field-Lohr (1990), S. 10, werden die nachfolgend aufgeführten Kriterien zur Beurteilung des wissenschaftlichen Gehaltes von Guidelines herangezogen. C.l Validität: Guidelines sind valide, wenn bei Befolgung die in Aussicht gestellten Folgen bezüglich Outcome und Kosten auch eintreten. C.2 Reliabilität: Medizinische Standards sind reliabel, wenn a) bei Vorliegen der gleichen wissenschaftlichen Evidenz und bei Anwendung der gleichen Verfahren zur Entwicklung von Standards, ganz gleich welche Experten die Entscheidung treffen, sich im wesentlichen der gleiche medizinische Standard ergeben würde. b) Es muß gewährleistet sein, daß der medizinische Standard widerspruchsfrei interpretiert und angewandt wird. C.3 Klinische Anwendbarkeit: Guidelines sollten nur für solche Populationen erstellt werden, für die ausreichend gesicherte wissenschaftliche Erkenntnisse vorliegen. C.4 Klarheit: Guidelines sollen unmißverständlich formuliert sein. C.5 Revision: Guidelines sollen auf Grund neuer klinischer Evidenz oder wegen geändertem Konsens innerhalb der medizinischen Profession geändert werden. Diese Beurteilungskriterien wurden von Personen aufgestellt, die selbst in den Prozeß der Guidelineentwicklung eingebunden sind. Guidelines sind Handlungsempfehlungen. Sie werden unter Berücksichtigung existierender wissenschaftlicher Erkenntnisse entwickelt. Die Entwicklung von Guidelines folgt keinem festen Schema (Klazinga (1994)), doch kann der Entwicklungsprozeß in die Phase a) der Generierung wissenschaftlicher Erkenntnisse und b) die Entscheidung über Handlungsempfehlungen unterteilt werden.
11. Medizinische und epidemiologische Studien
35
Die Ergebnisse medizinischer, epidemiologischer und ökonomischer Studien bilden die wissenschaftliche Basis von Standards.
11. Medizinische und epidemiologische Studien Im Rahmen medizinischer Forschung wird insbesondere den randomisierten Kontrollstudien eine große Bedeutung beigemessen. Alle Bestrebungen sind darauf ausgerichtet, daß die Studie unter einem kontrollierten Experiment vergleichbaren Bedingungen abläuft. In randomisierten Kontrollstudien werden die Patienten zufällig zwei verschiedenen Diagnose- oder Behandlungsarten zugeführt, um sicherzustellen, daß die Patientenpopulationen nicht nach einem für die Diagnose oder Behandlung relevanten Merkmal vorselektiert sind. Je mehr Randbedingungen kontrolliert werden, desto eher ist man in der Lage, Ursache-Wirkungs beziehungen zu entdecken (Behney (1982), S. 67). In anderen Worten: kontrollierte Studien dienen zur Erzielung neuer Einsichten. Sie dienen zur Beurteilung, ob aus der Sicht des Mediziners neue medizinische Behandlungsmethoden Eingang in die medizinische Praxis finden sollten. Kontrollierte klinische Studien können zur Einschätzung der Effektivität (Efficacy) und Sicherheit medizinischer Technologien in der kurzen Frist bei gegebenen Anwendungsbedingungen beitragen. Aus diesem Grund nennt man klinische Studien auch Efficacy-Studien (siehe Hopkins (1993». Klinische Studien sind nicht immer durchführbar. Randomisierte Studien sind nur dann gerechtfertigt, wenn davon ausgegangen werden kann, daß der Patient die gleiche apriori-Wahrscheinlichkeit eines Behandlungserfolges unabhängig von der Art der Behandlung hat (Andreasen (1982), S. 103f). Dies ist eine allgemein akzeptierte grundlegende ethische Voraussetzung zur Anwendung kontrollierter klinischer Studien. Dominiert in den Augen der Patienten eine Behandlungsmethode alle anderen, so lassen sich aus ethischen Gründen kontrollierte Studien nicht mehr durchführen, da zu wenig Patienten zu einer zufälligen Aufteilung auf verschiedene Behandlungsmethoden bereit sind (siehe auch Eypasch, et al. (1992), S. 484, NeugebauerfTroidVSpangenbergerlDietrich (1991». Sofern Efficacy-Studien zustandekommen, kann die Teilnahme an Efficacy-Studien zur Verbesserung der Leistung der beteiligten Leistungserbringer führen (Hawthorne-Effekt), was zu verzerrten Ergebnissen von Efficacy-Studien führt (Campbell/MaxeylWatson (1995». Es wird festgestellt, daß vormals akzeptierte Standards zur Durchführung klinischer Studien nicht eingehalten werden. So wird die Veröffentlichung euphorischer Einzelfallberichte ohne Daten, unkontrollierte Ergebnisse und subjektive Qualitätskontrolle statt kontrollierter Studien beklagt (Herfarth/Schumpe3"
36
c. Entwicklung expliziter Standards
licklSiewert (1993)). Solche Entwicklungen sind kein Einzelfall (siehe z.B. Knappe (1988), S. 81). Gemäß PoweffurnerlMaklan/Ersek (1994) fanden sich in mehreren Meta-Studien verschiedener PORTs nur sehr wenige Studien mit Kontroll- oder Vergleichsgruppe. Die Übertragung der Untersuchungsergebnisse von Efficacy-Studien auf die alltägliche medizinische Praxis ist wegen fehlender Repräsentativität der Ergebnisse meist nicht ohne weiteres möglich. Es ist zudem denkbar, daß die Ergebnisse von Studien über unterschiedliche Aspekte einer Behandlung nicht ohne weiteres kombinierbar sind. In Efficacy-Studien werden meist sehr homogene Patientenpopulationen betrachtet. Untersucht wird die Wirkung einer bestimmten Diagnose- oder Behandlungstechnik auf einige wenige, meist klinische Outcomes (häufig Mortalität). Der Untersuchungszeitraum ist meistens vergleichsweise kurz, häufig wird nur die Zeit während des Klinikaufenthaltes betrachtet. Die Kontrollgruppe wird gelegentlich mit Placebos, behandelt. Placebos stellen jedoch nicht immer die beste alternative Behandlungsmöglichkeit dar. Wegen der häufig mangelnden Übertragbarkeit von Efficacy-Studien auf die medizinische Praxis, werden die Forschungsanstrengungen zunehmend auf die Ergebnisse in der alltäglichen medizinischen Praxis konzentriert und nicht auf Ergebnisse, die unter klinisch optimalen Bedingungen erzielbar sind (MaklanlGreene/Cummings (1994), S. JS 14). Diesen Ansatz verfolgen beispielsweise die sogenannten PORTs. PORT ist eine Abkürzung für Patient Outcome Research Team. Studien dieser Art nennt man Efficieny-Studien. Die PORTs verfolgen mehrere Ziele, die sich teilweise gegenseitig bedingen. So wird die durch die Agency for Health Care Policy and Research die Entwicklung klinischer Standards unterstützt (PoweffurnerlMaklanJErsek (1994)). Eine weitere wichtige Aufgabe der PORTs ist die Verbreitung ihrer Forschungsergebnisse zur Verbesserung der medizinischen Versorgung (Greenfield, et al. (1994)), wobei die Entwicklung und Weiterentwicklung von Standards als wichtiges Mittel zur Erreichung dieses Zieles angesehen wird. Efficiency-Studien versuchen die Nachteile von Efficacy-Studien zu vermeiden. Der Untersuchungs zeitraum kann sich bei Efficieny-Studien, wie im Falle einiger PORTs, über mehrere Jahre erstrecken. Die Länge des Untersuchungszeitraums ist krankheitsabhängig und wird durch die Möglichkeit des Auftretens von Komplikationen bestimmt, die auf eine vorangegangene Behandlung zurückgeführt werden kann (Mitchell, et al. (1994)). Da Efficiency-Studien nicht unter einem naturwissenschaftlichen Experiment vergleichbaren kontrollierten Bedingungen abläuft, können die Ergebnisse solcher Studien, im Gegensatz zu Efficacy-Studien, streng genommen nicht kausal interpretiert werden.
III. Ökonomische Studien
37
In epidemiologischen Studien werden im Gegensatz zu kontrollierten Studien größere, heterogenere Populationen betrachtet. Typischerweise wird als Endpunkt der Betrachtung die Morbidität und Mortalität in Abhängigkeit verschiedener vermuteter Ursachen untersucht. Zum Beispiel wird das Risiko, einen Herzinfarkt zu erleiden und/oder an einem Herzinfarkt zu sterben, in Abhängigkeit von Rauchen, Eßgewohnheiten, medizinischer Behandlung etc. untersucht. Epidemiologische Studien dienen der Bestandsaufnahme von Krankheit. Die Prävalenz gibt Auskunft über die Verbreitung einer Krankheit, Inzidenzraten geben Aufschluß über die zu erwartende Entwicklung einer Krankheit. Ferner führen epidemiologische Studien zu einem besseren Verständnis über den Krankheitsverlauf und über solche Risikofaktoren, die den Krankheitsverlauf beeinflussen. Nutzen- und Kostenüberlegungen spielen hier keine Rolle. Das Kriterium der Validität bezieht Kosten und Outcomes mit ein. In medizinischen wie epidemiologischen Studien werden jedoch keine Kosten betrachtet. Ein medizinisches Diagnose- oder Behandlungsverfahren, das in EfficacyStudien als wirksam eingestuft wurde, muß nicht automatisch zu hoher Qualität in der medizinischen Versorgung führen. Die Anwendung expliziter Standards (Kriterium C.3 Klinische Anwendbarkeit), die auf Efficacy- oder EfficiencyStudien basieren, ist, wenn auch aus verschiedenen Gründen, beschränkt.
111. Ökonomische Studien Mit dem Ausdruck 'ökonomische Evaluation' werden verschiedene Instrumente verbunden. Die wichtigsten Instrumente sind Cost-Effectiveness-Studien, Cost-Utility-Studien und Cost-Benefit-Studien. In Cost-Effectiveness-Studien werden die Kosten und die Outcomes der untersuchten Alternativen erhoben. Ein sehr gängiger Outcome sind die life years saved. Die Outcomes werden jedoch nicht bewertet. Deshalb können Cost-Effectiveness-Studien nicht angewandt werden, wenn die kostengünstigere Alternative schlechtere Outcomes aufweist als die kostenträchtigere Alternative (ScottJShielllFarnworth (1993), S. 88f) oder wenn sich die zu bewertenden Maßnahmen in der Art des Outcomes qualitativ unterscheiden. Cost-Utility-Studien unterscheiden sich von Cost-Effectiveness-Studien in der Messung des Outputs. In der ersteren wird der Output in quantitativer und qualitativer Hinsicht bewertet. Gängige Größen zur Messung des Outcomes sind in Cost-Utility-Studien quality-adjusted life years (QALYs). Die Cost-Benefit-Analyse unterscheidet sich von der Cost-Utility-Analyse dadurch, daß in der ersteren die Kosten und Benefits in der gleichen Einheit angegeben werden.
38
C. Entwicklung expliziter Standards
Keines der drei Konzepte ökonomischer Evaluation gibt eine definitive Handlungsanweisung vor, vielmehr bilden sie je einen Handlungsrahmen, der durch Entscheidungen des Anwenders ausgefüllt werden muß. Evaluationen können aus der Perspektive einer Gesellschaft, eines Versicherungsunternehmens, eines Leistungserbringers oder eines Patienten erfolgen. Je nach Perspektive sind andere Kosten- und Nutzen zu berücksichtigen. Deshalb ist nicht sichergestellt, daß zwei Anwender des gleichen Evaluationsstudientyps bei der Bearbeitung des gleichen Entscheidungsproblems zu dem gleichen Ergebnis gelangen. Es ist folglich nicht sichergestellt, daß Guidelines, die auf ökonomischen Studien aufbauen, reliabel sind (Beurteilungskriterium C.2 Reliabilität). Sollen die Ergebnisse ökonomischer Evaluationsstudien innerhalb eines Landes als Entscheidungsgrundlage zur Ressourcenallokation dienen, wie dies z.B. für Großbritannien angedacht wird, so wäre zur Vermeidung dieser Probleme ein einheitliches Vorgehen, eine Standardisierung ökonomischer Evaluation nötig (Gerard (1993), S. 115, Jefferson-Demicheli (1995)). Zur Durchführung von Evaluationsstudien müssen die möglichen Outcomes des Krankheitsverlaufs, die sogenannten Endpunkte, bei Anwendung einer bestimmten Therapie bekannt sein. Diese Endpunkte und damit verbundene Messungen können Efficacy-, Efficiency-Studien oder epidemiologischen Studien entnommen werden. Die Validität und Reliabilität der Evaluationsstudien hängt somit entscheidend von der Validität und Reliabilität klinischer und epidemiologischer Studien ab. Die Ergebnisse von Efficacy- und Efficiency-Studien können sich jedoch unterscheiden (Brook (ohne Jahr)). Damit stellt sich das Problem, welches Studiendesign, Efficacy- oder Efficiency-Studien, als Grundlage für ökonomische Evaluation gewählt wird. Die Ergebnisse klinischer Studien sind nicht selten zu Gunsten eines neuen Medikamentes, eines neuen medizinisch-technischen Gerätes oder Behandlungsart verzerrt (Götzsehe (1994)). Dieser Bias kann auf den Interessenkonflikt des klinischen Forschers zurückgeführt werden, der einerseits eine wissenschaftlichen Grundsätzen genügende Arbeit vorlegen will, andererseits aber seinem Auftraggeber, den Hersteller des Medikamentes oder des medizinisch-technischen Gerätes, nicht verprellen will. Die Ergebnisse klinischer Studien werden meist "unkritisch" von Ökonomen übernommen (FreemantIe-Maynard (1994)). Von Ökonomen andererseits zu verlangen, daß sie die Validität und Realibilität der Ergebnisse klinischer Studien überprüfen, kann leicht zu einer Überforderung der Ökonomen führen. Auch aus diesem Grund ist die Reliabilität ökonomischer Studien schwerlich gewährleistet (Beurteilungskriterium C.2 Reliabilität).
IV. Erstellung einer Guideline
39
IV. Erstellung einer Guideline Die Selektion zwischen verschiedenen möglichen medizinischen Produktionsprozessen erfolgt bei der Entwicklung expliziter Standards in Konsensuskonferenzen. Ziel der Konsensuskonferenzen ist die Verabschiedung expliziter Standards, deren Implementierung zu einer Wohlstandssteigerung führt. In dem in Kapitel B beschriebenen Pilotprojekt, erfolgte die Aggregation individueller Präferenzen über eine Abbildungsvorschrift. Aus rein logischen Gründen ist die Reliabilität medizinischer Standards in Frage zu stellen. Gemäß Arrow's Unmöglichkeitstheorem (Mueller (1989), S. 384ff., Sen (1982)) ist unter schwachen Annahmen eine rationale kollektive Entscheidung über den Nutzen gegebener Alternativen nicht möglich, ohne mindestens eine der Voraussetzungen des Theorems zu verletzen. Die fünf Annahmen sind: a) Zulassung von Pareto-Verbesserungen, b) Vermeidung diktatorischer Entscheidungen, c) Transitivität der Präferenzen, d) keine Restriktion individueller Präferenzordnungen und e) der Vergleich zweier Alternativen ist unabhängig von anderen existierenden Alternativen. Zur Vermeidung diktatorischer Entscheidungen könnte beispielsweise auf die Transitivität der sozialen Präferenzfunktion der Konsensusteilnehmer verzichtet werden. Damit wird jedoch die Bestimmung der besten Alternative(n) unmöglich gemacht. Auch empirische Belege deuten darauf hin, daß die Reliabilität medizinischer Standards (Beurteilungskriterium C.2 Reliabilität) nicht gewährleistet ist. Unerwünschte gruppendynamische Prozesse sind bedeutsam. So kommt insbesondere dem Leiter der Konsensuskonferenz eine entscheidende Rolle zu (Klazinga (1994), S. 56, siehe auch NewtonlHutchinsoniSteenlRussellHaimes (1992)). Leiter solcher Konsensuskonferenzen sind häufig anerkannte Experten. In empirischen Studien hat sich gezeigt, daß Experten in der Einschätzung gleicher Sachverhalte weniger stark übereinstimmten als andere Leistungserbringer (Götzsche (1994)). Das Wissen der Teilnehmer, deren Präferenzen und der Abstimmungsmodus entscheiden über die Annahme eines Standards. Die Gewichtung gegebener Benefits und Risiken einer Behandlung sind personenabhängig. Es gibt Hinweise, daß Ärzte die Wirksamkeit von Behandlungen systematisch falsch einschätzen: die Risiken medizinischer Eingriffe scheinen systematisch unterbewertet zu sein (Hicks (1994)). Ernstzunehmende empirische Ergebnisse weisen darauf hin, daß die Zusammensetzung der Teilnehmer einer Konsensuskonferenz einen Einfluß auf das Ergebnis hat. Obwohl von amerikanischen und britischen Ärzten die gleichen Probleme untersucht wurden, ergaben sich beispielsweise beträchtliche Abweichungen in der Beurteilung der Angemessenheit der betrachteten Behandlungsarten (siehe die Hinweise in Hicks (1994)). Die Reliabilität medizinischer Guidelines ist auch wegen der Gefahr von Übernutzung und unqualifizierter Nutzung einer medizinischen Technologie
40
C. Entwicklung expliziter Standards
(Andreasen (1982), S. 103) nicht gewährleistet. Denn die Angebotspopulationen unterscheiden sich voneinander: im Zuge der Diffusion einer Behandlungstechnik wird sie auch von Medizinern angewandt, die weniger stark spezialisiert und folglich im Vergleich zum Wissenschaftsbereich eine andere Qualifikation aufweisen, doch idiosynkratisches Wissen der Anbieter medizinischer Dienstleistungen zählt. Die unterschiedlichen Fähigkeiten der behandelnden Ärzte und der pflegenden Personen im Wissenschaftsbereich im Vergleich zu dem praktischen medizinischen Bereich werden in Kontroll- und darauf aufbauenden Evaluationsstudien nicht berücksichtigt. Das Patientengut kontrollierter Studien kann sich von der Population, die bei einer breiten Anwendung der neuen Technologie mit eben dieser behandelt würde, erheblich unterscheiden. Neben Experten werden auch Patienten als potentielle Anwender von Guidelines aufgefaßt (Field-Lohr (1992». Um den unterschiedlichen Informationsbedürfnissen gerecht zu werden, werden die Guidelines an die Informationsbedürfnisse verschiedener Zielgruppen angepaßt. Innerhalb der Gruppe von Experten und Patienten bestehen Informationsunterschiede. Da vorhandene Informationen und vermutete Ursache-Wirkungszusammenhänge wesentlich die Interpretation medizinischer Standards beeinflussen, ist unklar, ob Kriterium C.2 Reliabilität erfüllt wird (siehe auch Goldberg, et al. (1994». Ganz gleich welche Art von wissenschaftlicher Studie zur Entwicklung expliziter Standards angewandt wird, die zu Grunde gelegten wissenschaftlichen Untersuchungen sind meist sehr heterogen im Hinblick auf die Datenbasis, die verwendete Methode, die einbezogenen Variablen, den Zeithorizont der Untersuchung und den Untersuchungsgegenstand (wie zum Beispiel: Untersuchungsgegenstand unter optimalen klinischen Bedingungen versus Untersuchungsgegenstand unter Alltagsbedingungen). Deshalb ist zu befürchten, daß Untersuchungsergebnisse verglichen werden, deren Vergleich jeglicher Basis entbehrt. Dies ist beispielsweise dann der Fall, wenn ökonomische Evaluationsstudien, die in anderen Ländern mit anderen Kostenrelationen durchgeführt worden sind, unbesehen auf die heimischen Verhältnisse angewandt werden. Entsprechendes gilt, wenn heimische ökonomische Evaluationsstudien zur Guidelineentwicklung herangezogen werden, obwohl sich zwischenzeitlich die Kostenrelationen geändert haben. Meta-Analysen, das sind quantitativ-statistische Analysen bisheriger empirischer Untersuchungen, sind im beschränkten Maße hilfreich. Rein qualitativ ausgerichtete Analysen vermögen zwar eher den Unterschieden der untersuchten Studien Rechnung zu tragen, doch besteht Raum für persönliche Wertungen. Quantitativ-statistische Untersuchungen sind andererseits in Meta-Analysen nur für hinreichend häufig verwendete Variablen möglich und sind deshalb häufig nur in einer beschränkten Anzahl von Fällen durchführbar (Freemantle-Maynard (1994».
IV. Erstellung einer Guideline
41
Die Wirkung auf den Outcome der medizinischen Versorgung bei Befolgung medizinischer Standards ist neben dem Grad ihrer Befolgung ein weiteres wichtiges Kriterium zur Beurteilung expliziter (offizieller) Standards (siehe Kriterium C.1 Validität). Die empirische Überprüfung einer bestehenden UrsacheWirkungsbeziehung zwischen der Anwendung eines Standards und dem Outcome im Vergleich zu alternativer medizinischer Versorgung und zugehörigem Outcome ist nicht zweifelsfrei durchführbar. Eine Vielzahl von Störgrößen (wie z.B. medizinisch-technischer Fortschritt, der sich indirekt in unterschiedlicher Weise auf verschiedene Behandlungsverfahren auswirkt) können den Vergleich beeinflussen. Es gibt zwar statistische Verfahren, womit mögliche Störgrößen berücksichtigt werden können (siehe Grimshaw-Russell (1993», das Grundproblem jedoch bleibt. Medizinisch-technischer Fortschritt beruht teils auf der Hervorbringung neuer Medizintechnik durch innovative Unternehmen, die sich auf den Bereich Medizintechnik spezialisiert haben und zum anderen auf den Bemühungen wissenschaftlich arbeitender Mediziner, die oft mit Hilfe neuer Medizintechnik versuchen, neue bessere Behandlungsverfahren zu entwickeln oder neue Anwendungen für eine neue Medizintechnik zu finden. Von besonderer Bedeutung ist in vorliegendem Zusammenhang, daß Neuerungen im Zuge ihrer Diffusion meist verändert werden: negativ bewertete Eigenschaften werden zurückgedrängt, positive verbessert, neue Anwendungsmöglichkeiten werden erschlossen und neue Kombinationen mit bisherigen medizinischen Diagnoseverfahren und Eingriffen werden erprobt. Komplementäre Güter, die für die effektive Nutzung einer Innovation entscheidend sind, werden entwickelt. Die Diffusion von Neuerungen ist eine notwendige Voraussetzung, damit die Neuerung den Anforderungen angepaßt und komplementäre Güter entwickelt werden können, ohne jedoch sicherstellen zu können, daß eine Neuerung mehr Nutzen als Schaden stiftet. Eine frühe Evaluation kann all diese möglichen Änderungen und Einflüsse nicht vorwegnehmen. Guidelines sind allenfalls begrenzt valide (siehe Kriterium C.1 Validität). Ergebnisse von Evaluationsstudien münden in der Empfehlung, bestimmte Maßnahmen durchzuführen und andere zu unterlassen. Dabei wird implizit unterstellt, daß die während der empirischen Untersuchung geltenden superioren Verhaltensroutinen auch nach der Empfehlung Bestand haben. Die Empfehlungen sollen zwar nur die inferioren Verhaltensmuster ändern, aus Erfahrung wissen wir jedoch, daß Empfehlungen im Zuge ihrer Diffusion zu einer Änderung erwünschter Verhaltensroutinen führen kann. So führte die Empfehlung, beim Autofahren Sicherheitsgurte zu nutzen, zu einer Senkung schwerer Verletzungen bei gleichzeitigem Ansteigen leichter Unfälle, weil das Gefühl der größeren Sicherheit zu riskanterem Fahren verleitet. Aus diesem Grund ist die Validität von Guidelines beschränkt (Kriterium C.l Validität).
42
C. Entwicklung expliziter Standards
v.
Schlußfolgerung
Die Untersuchung der verschiedenen Phasen in der Entwicklung von Guidelines zeigt, daß Guidelines jenen wissenschaftlichen Ansprüchen nicht genügen, die von den Personen, die in die Entwicklung von Guidelines eingebunden sind, aufgestellt werden. Guidelines sollen valide, reliabel, klinisch anwendbar sein und auf Grund eines geänderten Konsenses oder neuer wissenschaftlicher Evidenz revidiert werden. Die Erfüllung der ersten beiden Kriterien bereitet Schwierigkeiten. Die Validität medizinischer Guidelines ist aus mehreren Gründen fraglich. Häufig liegen keine klinischen Studien zur Efficacy medizinischer Verfahren vor und/oder Standards zur Durchführung klinischer Studien werden nicht eingehalten. Die Übertragbarkeit der Ergebnisse klinischer Studien ist wegen mangelnder Repräsentativität häufig nicht möglich. Lange Untersuchungszeiträume der Efficiency-Studien erhöhen die Gefahr der Irrelevanz der Ergebnisse zur Beurteilung der gegenwärtigen Versorgungsqualität. Durch Guidelines sollen zwar nur inferiore Verhaltensweisen geändert werden, es ist jedoch nicht ausgeschlossen, daß, ohne dies zu wollen, andere, superiore Routinen durch die Verbreitung von Standards zurückgedrängt werden. Grundlage von Guidelines sind die Ergebnisse medizinischer oder gesundheitsökonomischer Studien, deren Übertragbarkeit in den medizinischen Alltag fraglich ist. Auch vor diesem Hintergrund ist nicht sichergestellt, daß die prognostizierten Outcomes mit den tatsächlich erzielbaren Outcomes bei Befolgung von Guidelines übereinstimmen. (Hicks (1994» schlägt deshalb vor, randomisierte Versuche zur Überprüfung der Frage durchzuführen, ob die Befolgung von Guidelines zu einern besseren Outcome führt. Infolge technischen Fortschritts werden auch die Ergebnisse dieser Studien veralten, weshalb solche Prüfungen regelmäßig erfolgen sollten. Hierdurch würde gleichzeitig der Zeitpunkt ermittelt, wann Guidelines notwendigerweise revidiert werden müssen. Die Definition der Validität von Guidelines (siehe Kriterium C.1 Validität) ist unvollständig. Eine Guideline ist valide wenn Prognose und Outcomes bei Befolgung einer Guideline übereinstimmen. Dies ist beispielsweise der Fall, wenn die prognostizierte Mortalitätsrate mit der tatsächlichen Mortalitätsrate übereinstimmt. Mortalität ist jedoch häufig kein geeignetes Kriterium, um zwischen verschiedenen Behandlungsarten zu diskriminieren. Entscheidend ist somit auch, welche Outcomes zur Beurteilung von Behandlungsverfahren herangezogen und wie qualitativ unterschiedliche Outcomes bewertet werden sollen. Somit bereitet nicht nur die Gewichtung der Merkmalsausprägungen gegebener Outcomes Probleme, die Auswahl geeigneter Outcomes ist bereits ein Entscheidungsproblem.
V. Schlußfolgerung
43
Die Reliabilität medizinischer Guidelines ist ebenfalls unklar. Dem Gesundheitsökonomen verbleibt bei der Durchführung ökonomischer Evaluation ein beträchtlicher Entscheidungsspielraum. Deshalb ist es möglich, daß zwei Gesundheitsökonomen, bei gleicher Fragestellung und Verwendung der gleichen Datengrundlagen zu anderen Ergebnissen kommen. Bei der Erstellung von Guidelines auftretende gruppendynamische Prozesse und unterschiedliche Präferenzen der Konsensusteilnehmer lassen Zweifel an der Reliabilität von Guidelines aufkommen. Die Aggregation individueller Präferenzen bereitet Probleme. Die Kosten randomisierter Studien (Brook, et al. (1986), S. 54) und der Entwicklung von Guidelines sind beträchtlich (Brook (1989), S. 3030). Dies führt zu Bemühungen, Guidelines durch internationale Konsortien zu entwickeln. Solche Bemühungen werden durch die Forschungspolitik der EU unterstützt. Internationale Konsortien, so die Vorstellung, können Grundlagen von Guidelines schaffen, die dann an die nationalen Verhältnisse angepaßt werden können (oder müssen). Einerseits werden über die Bildung internationaler Konsortien die Entwicklung von Guidelines für kleine Länder überhaupt erst erschwinglich, doch dies wird durch die Adoption eines komplizierten Abstimmungsprozesses erkauft. Ob die entwickelten Guidelines tatsächlich den nationalen Gegebenheiten angepaßt werden (können) und im Vergleich zu bisherigem medizinischem Praktizieren zu einer Verbesserung der Versorgung führen, bleibt ohne Evaluation der damit verbundenen Outcomes offen, da Guidelines indirekt, vermittels Verbesserung von Prozeßqualität, auf eine Verbesserung der Outcomequalität abzielen.
D. Durchsetzung von Standards I. Problem Es gibt eine Vielzahl empirischer Untersuchungen, in denen eine hohe Varianz (bei gleichzeitiger Kontrolle der Krankheitsschwere und/oder dem Vorliegen von Komorbidität der Patienten) in der Ressourcennutzung bei der Behandlung gleicher Diagnosen festgestellt wurde. Zumindest zum Teil wird diese Varianz auf eine nicht angemessene, d.h. nicht inzidierte und/oder nicht dem Stand der medizinischen Wissenschaft entsprechende, medizinische Versorgung zurückgeführt (siehe Clark (1990) und die dort angegebene Literatur) oder aber es wird ein beachtliches Ausmaß an unangemessener medizinischer Versorgung beklagt. So kommen beispielsweise Chassin, et al. (1987) bei der Untersuchung dreier Diagnosen zu dem Schluß, daß selbst bei der verwendeten konservativen Schätzung in zwei Fällen ein Fünftel und in einem Fall ein Drittel der untersuchten Fällen unangemessen medizinisch behandelt wurden. Mit anderen Worten haben sich in der medizinischen Praxis eine Vielzahl von Routinen, teils auf Grund rationaler Entscheidung, teils durch Zufälligkeiten, herausgebildet. Die Varianz in der Ressourcennutzung ist ein Indiz für Unterschiede in der Versorgungsqualität. Da es ohne ersichtlichen Grund große Unterschiede in der Ressourcennutzung gibt, stellt die Varianz im medizinischen Praktizieren für Mediziner ein bislang ungelöstes Problem dar. Durch eine Änderung bestehender Routinen hin zu einer angemessenen medizinischen Versorgung erhofft man sich eine Verbesserung der Versorgungsqualität und gelegentlich auch Ausgabensenkungen. Guidelines sind ein mögliches Instrument, das zur Reduzierung der Variabilität medizinischen Praktizierens beitragen kann (Johansen (1992), Grilli-Lomas (1994), Zanstra-Beckers (1995)). Die Anwendung von Guidelines muß andererseits nicht notwendigerweise zu einer Verbesserung des Outcomes führen. Guidelines können zur Verbreitung inferiorer Verhaltensmuster beitragen, wenn sie nicht dem (wie auch immer definierten) Stand wissenschaftlicher Forschung genügen. Änderungen der relativen Preise können die Ergebnisse ökonomischer Evaluation, die eine Basis von Guidelines darstellen, zunichte machen. Es ist möglich, daß die medizinischtechnische Ausstattung und/oder die Qualifikation der Anwender nicht ausreichen, um die von Guidelines prognostizierten Ergebnisse zu erzielen. Guidelines sollen zwar leicht verständlich und sprachlich eindeutig sein, trotzdem sind Mißverständnisse und falsche Anwendungen von Guidelines nicht
I. Problem
45
ausgeschlossen, wodurch im Vergleich zur medizinischen Versorgung ohne Guidelines systematisch schlechtere Ergebnisse erzielt werden könnten. Im wesentlichen beschränken sich (zumindest in Deutschland) die bisherigen Anstrengungen zur Qualitätssicherung bei Einführung neuer medizinischer Methoden auf die Sicherung der Strukturqualität, indem allein den Ärzten die Anwendung bestimmter Methoden gestattet wird. Es besteht die Vorstellung, daß die neuesten Ergebnisse medizinischer Forschung über Lehre und Veröffentlichung einem breiten Publikum bekannt wird (impliziter Standard). Das Wissen ist dann über viele verschiedene Medien verstreut und wird an nachkommende Mediziner im Laufe ihrer Ausbildung weitergegeben. Hierdurch ergeben sich Probleme im Hinblick auf die Wissensinhalte und auf die Diffusionsgeschwindigkeit neuen Wissens. Die Ausbildung, d.h. die Themenwahl und Präsentation und die sich daran anschließenden Prüfungen, werden stark von den Lehrbeauftragten geprägt. Infolge des Zugeständnisses wissenschaftlicher Freiheit, werden somit die Themenwahl, die Präsentation und die Prüfungsgegenstände von den Präferenzen der Lehrbeauftragten bestimmt. Die Präferenzen der Lehrbeauftragten entsprechen jedoch in den seltensten Fällen den Versorgungsanforderungen. Folglich ist die Qualifikationsstruktur der Ärzte nicht deckungsgleich mit der Nachfragestruktur (Ollenschläger (1993), S. 101). Informationsaufnahme und -verarbeitung von in einer Vielzahl von Medien verstreuten Wissens bereitet Schwierigkeiten. Die Diffusion neuen Wissens über die Ausbildung neuer Mediziner erfolgt im Zeitraum mehrerer Dekaden. Aus diesem Grund ist die Diffusionsgeschwindigkeit gering. Klinische Studien und ökonomische Evaluationsstudien dienen vor allem zur Bewertung von Neuerungen. Die Entstehungsgeschichte von Neuerungen läßt sich zeitlich in den Bereich der F&E-Anstrengungen ohne Markteinführung, die F&E-Tätigkeit im engeren Sinne, und einen Zeitabschnitt der Markteinführung mit fortlaufenden Entwicklungsanstrengungen, die Phase der Produktdiffusion, gliedern. Evaluationsstudien und klinische Studien sollten der Markteinführung vorgelagert sein, doch dies ist, abgesehen von dem Zulassungsverfahren pharmazeutischer Produkte (Herxheimer (1996», eher die Ausnahme: neue, bedeutende medizinisch-technische Methoden kamen auf den Markt, ohne wissenschaftlich bewertet zu sein. Viele der heute gängigen Therapieverfahren hielten Einzug in die medizinische Praxis, ohne daß kontrollierte Studien über ihre Wirksamkeit vorlagen. Obwohl die Wirksamkeit mancher Therapie bis heute nicht durch kontrollierte Studien nachgewiesen werden konnte, werden sie weiterhin angewandt (Heyll (1993), S. 23f). Es wird geschätzt, daß, gemessen an wissenschaftlich anerkannten Veröffentlichungen, achtzig Prozent moderner medizinischer Praktiken
46
D. Durchsetzung von Standards
keine wissenschaftliche Basis haben (Goldberg-Cummings (1994), S. JS1, Banta (1982), S. 26). Wenn auch EllisJMulliganIRowe/Sackelt (1995) für ausgewählte Bereiche einen weit geringeren Prozentsatz ermitteln, das Problem besteht weiterhin. Umgekehrt muß auch nicht automatisch in der alltäglichen medizinischen Praxis zur Anwendung kommen, was sich wissenschaftlich als nützlich erwiesen hat (einige Beispiele gibt Banta (1982), S. 34ft). Durch die Verwendung expliziter Standards erhofft man sich die Diffusion neuen medizinischen Wissens zu erhöhen. Mit Qualitätssicherung sollen demgemäß die folgenden Ziele erreicht werden: D.l Verringerung der Varianz: die Varianz in der medizinischen Diagnostik und Behandlung soll verringert werden, D.2 Verbesserung der Outcomes: die Outcomes medizinischer Eingriffe sollen verbessert werden und D.3 Erhöhung der Diffusionsgeschwindigkeit: die Diffusion der besten medizinischen Praxis soll erhöht werden. Es wird diskutiert, ob Qualitätssicherung diesen Ansprüchen gerecht wird oder werden kann.
11. Compliance Die Entwicklung expliziter (nicht notwendigerweise nationaler) Standards basiert auf der Vorstellung, daß diese Standards der bestmöglichen medizinischen Versorgung in der alltäglichen medizinischen Praxis zur Kenntnis genommen und umgesetzt werden. Die vorhandene empirische Evidenz stützt diese Voraussetzung nur bedingt (Guadagnoli-McNeil (1994), S. 16, Donaldson-Mooney (1993), S. 21). Grilli, et al. (1991) berichten über ein nationales Programm zur Entwicklung und Verbreitung papierner Guidelines. Demgemäß ist der Verbreitungsgrad der betrachteten Guidelines gering und die untersuchten Leistungserbringer stimmten häufig nicht mit der Guideline überein. Zwischen Verbreitung der Guidelines und Evaluation der Verbreitung und Akzeptanz vergingen in dieser Studie mehrere Jahre. In einer anderen Studie, die kurz nach der Verbreitung der betrachteten Guideline einsetzte, fand sich jedoch ebenfalls keine wesentliche Änderung im Verhalten der Leistungserbringer, das auf die Verbreitung der Guideline zurückgeführt werden konnte (Kosecoff/KanouselBrook (1990)).
III. Erklärungsansätze
47
In einer Meta-Analyse zur Compliance mit medizinischen Guidelines wurde festgestellt, daß in 55 von 59 Studien eine Erhöhung der Prozeßqualität erfolgte und in 9 von 11 Studien fanden sich Hinweise auf eine Verbesserung des Outcomes (Grimshaw-Russell (1993». Entscheidend ist allerdings nicht alleine, ob eine signifikante Änderung eingetreten ist oder nicht, sondern auch, ob Qualitätssicherung unter Einsatz vori Guidelines kosteneffektiv ist, wozu meines Wissens bislang keine Studie vorliegt. Ein wichtiger Hinweis für die Effektivität ist zudem, innerhalb welchen Zeitraums eine wünschenswerte Verhaltensänderung erreicht wird. Lomas, et al. (1989) erhalten beispielsweise mit ihren Daten und unter der Voraussetzung, daß die Rate unverändert bleibt, mit der sich das Verhalten der Ärzte ändert, einen Zeitraum von 30 Jahren, um in Kanada pro 100 Frauen den gleichen Prozentsatz an Kaiserschnitt zu erzielen wie in England. Zudem ist die absolute Höhe der Compliance häufig gering. In einer von GrilliLomas (1994) durchgeführten Meta-Analyse war die Compliance im Mittel aller betrachteten Untersuchungen etwa 55 Prozent.
111. Erklärungsansätze Die niedrige Compliance mit offiziellen Standards wirft die Frage nach den Ursachen auf. Es gibt keine allgemein akzeptierte Ursache für die niedrige Compliance. Erklärungsansätze können an den Interaktionen der Akteure, der Aktualität, der Relevanz und den Eigenschaften (Komplexität, 'triabillity' und Beobachtbarkeit) von Guidelines, sowie an der Einbindung von Leistungserbringern in die Entwicklung offizieller Guidelines und der Notwendigkeit organisatorischer Änderungen ansetzen. Interaktion der Akteure: Offizielle Standards konkurrieren in der alltäglichen medizinischen Praxis mit Verhaltensroutinen der Leistungserbringer. Die gegenwärtigen Verhaltensroutinen der Leistungserbringer sind, sofern ein temporäres Gleichgewicht erreicht worden ist, selbst Ergebnis eines Selektionsprozesses. Zumindest unter den Rahmenbedingungen und Präferenzen der Leistungserbringer haben sich die gegenwärtigen Verhaltensroutinen als (lokal) superior erwiesen. Offizielle Standards konkurrieren jedoch nicht nur mit den temporären, lokal superioren Verhaltensroutinen, sondern auch mit sonstigen, den Leistungserbringern zur Verfügung stehenden Verhaltensroutinen und müssen sich als superior erweisen. Qualitätssicherungsprogramme können als Veranstaltung zur Adoption eines medizinischen Standards interpretiert werden, wobei jeder Teilnehmer den anderen beeinflußt. Nachfrager sind von diesem Prozeß ausgeschlossen. Der Einfachheit wegen wird nur zwischen zwei Alternativen unterschieden, der bisherigen Verhaltensroutine und einem gegebenen Standard.
48
D. Durchsetzung von Standards Tabelle 1
Entscheidungsmatrix
~
I. Medizinischen Standard befolgen
2. Bisherige Verhaltensroutine beibehalten
LI
3
I. Medizinischen Standard befolgen 3
2. Bisherige Verhaltensroutine beibehalten
a b
b a
3 3
Formal läßt sich dann Qualitätssicherung als Koordinationsspiel auffassen. Treffen zwei Leistungserbringer aufeinander, die die gleiche Verhaltensoption, d.h. (1,1) oder (2,2) (siehe Tabelle 1), gewählt haben, so werden beide in ihrem Verhalten bestätigt und erzielen jeweils einen Nutzen in Höhe von 3 Einheiten. Wenn zwei Leistungserbringer mit unterschiedlichem Verhalten aufeinandertreffen, d.h. (1,2) oder (2,1), so wird die Entscheidung beider durch die Entscheidung des anderen in Frage gestellt. Es entsteht eine kognitive Dissonanz und Verhalten 1 ergibt einen Nutzen von a (a A' effizient ist, ist die Nutzung von Produktionsprozeß 11 im Bereich (Xl < A" auf Populationsehene effizient. Im vorangegangenen Beispiel wurde unterstellt, daß bei beiden Produktionsprozessen der gleiche Zusammenhang zwischen Behandlungsintensität und An-
E. Die Qual der Wahl: Welcher Standard?
70
Diagramm 2
Diagramm 1 B
B
y
y
y y"
a 2 =. a'2 = const.
A'
y
I
A" A
al
---------_.~--
y
al
Diagramm 3
Diagramm 4
Abbildung 2: Individuelle Gesundheit versus Public HeaIth, kein dominanter Produktionsprozeß
Tabelle 2 Beispiel Anzahl an Patienten, y
Behandlungsintensität
Produktionsprozeß I
Produktionsprozeß 11
6
12
2
3
6
3
2
4
4
1,5
3
5
1,2
2,4
6
2
71
111. Public Health
Diagramm 1
Diagramm 2 B
B
Bd(y)
~=a'2
= const.
B" B' y
y'" y" y'
Y
A al
y
- - - - - - - - - - - - - - y(G* 2'.II--"""::>O-.:;::----i- - - - - - - - =--""'---1
y Diagramm 3
A" al Diagramm 4
Abbildung 3: Individuelle Gesundheit versus Public Health, ein dominanter Produktionsprozeß
zahl an behandelten Patienten gilt. Produktionsprozesse können sich aber auch im Hinblick auf die nötigen Inputs unterscheiden. Der Einfachheit halber wird ein limitationaler Produktionsprozeß vorausgesetzt. Im Falle von Produktionsprozeß I seien zwei Ärzte und in Produktionsprozeß 11 seien ein Arzt und zwei Krankenschwestern nötig, um die Behandlungsintensität um eine Einheit zu erhöhen. Zusätzlich wird angenommen, daß der Lohn der Ärzte doppelt so hoch ist wie der von Krankenschwestern oder Pflegern. Folglich sind die (marginalen) Kosten der beiden Produktionsprozesse gleich. Um die Behandlungsintensität eines Patienten zu erhöhen, muß die Behandlungsintensität eines anderen um eine Einheit verringert werden. Wenn alle Patienten mit der gleichen Behandlungsintensität versorgt werden und die Krankenhausressourcen knapp sind (zum Beispiel, 24 Krankenschwester oder Pfleger und 12 Ärzte), dann unterscheiden sich die beiden Produktionsprozesse in der Anzahl an Patienten, die mit den knappen Ressourcen medizinisch betreut werden können. Ein solches Beispiel ist in Tabelle 2 wiedergegeben.
72
E. Die Qual der Wahl: Welcher Standard?
In Abbildung 3 ist eine solche Situation in Diagramm 4 abgebildet. Hierbei wird angenommen, daß Produktionsprozeß I bei jedweder Behandlungsintensität im Vergleich zu Produktionsprozeß 11 in einer geringeren Anzahl an behandelten Patienten mündet. In Diagramm 1 sind zwei Produktionsprozesse abgebildet, wobei Produktionsprozeß I den anderen Produktionsprozeß dominiert. Diese Dominanz findet sich jedoch auf Populationsebene nicht wieder. In Abbildung 3, Diagramm 2 ist in dem Bereich y'" , y' Produktionsprozeß 11 effizienter als Produktionsprozeß I.
IV. Kostenerstattungsprinzip Falls das Kostenerstattungsprinzip gilt, so ist der Krankenhausgewinn gleich Null (5)
R bezeichnet die Krankenhauseinkünfte, PI ist der Preis pro Behandlungsintensität und P2 ist der Preis für Investitionen in Humankapital und medizinischtechnische Ausrüstung, d.h. interne Qualitätssicherung. Gleichung 5 gilt, wenn alle Patienten in der gleichen Weise behandelt werden. Es wird angenommen, daß Patienten Arztentscheidungen akzeptieren. Ellis-McGuire (1986) nehmen an, daß bei Geltung des Kostenerstattungsprinzips die Behandlungsintensität so lange gesteigert wird, bis der damit verbundene marginale Benefit gleich Null ist. Wenn diese Annahme zutrifft, so ist es doch verwunderlich, warum so oft Klage über die hohe Varianz medizinischen Praktizierens geführt wird. Einerseits könnte dies daran liegen, daß unterschiedliche Produktionsprozesse genutzt werden (qualitativer Aspekt von Compliance) oder aber daran, daß die Behandlungsintensität zu gering ist (quantitativer Aspekt von Compliance). Im folgenden wird der Schwerpunkt auf dem quantitativen Aspekt von Compliance liegen. Es wird angenommen, daß der Nutzen eines Arztes von dem Benefit des Patienten, B, und von der Anzahl an behandelten Patienten, y, abhängt (siehe auch Newhouse (1970)) (6)
. dU dU U=U(B,y)=U(al'Y)' mIt -;-~O, -~O. oB dy
Wenn der Nutzen von der Anzahl an Patienten unabhängig ist, so ist das Arztverhalten identisch mit dem Arztverhalten in Ellis-McGuire (1986). Hängt der Nutzen eines Arztes auch von der Anzahl an behandelten Patienten ab, so wird die Entscheidung in Diagramm 2 gefällt. Da y nur auf Kosten
V. Prospektives Entgeltsystem
73
der Behandlungsintensität erhöht werden kann, ist es möglich, daß Ärzte bewußt von einem medizinischen Standard abweichen. Dieses Verhalten ist beispielsweise in Kriegszeiten wohl bekannt. Eine effektive Durchsetzung medizinischer Standards kann folglich ärztliche Bemühungen, Angebot und Nachfrage in Einklang zu bringen, vereiteln.
V. Prospektives Entgeltsystem In einem prospektiven Entgeltsystem wird die Entgelthöhe im voraus (prospektiv) festgesetzt und Krankenhäuser können Gewinne oder Verluste machen. Beispiele für prospektive Entgeltsysteme sind Kopf- und Fallpauschalen. Die Variable R in Gleichung 6 ist dann durch py zu ersetzen. P repräsentiert hierbei die Fallpauschale. Krankenhäuser können als zwei voneinander verschiedene Organisationseinheiten aufgefaßt werden: eine Organisationseinheit bilden die Ärzte und die andere die Administration (Harris (1977». Die Administration, die an Gewinnausweitung interessiert ist, strebt eine Ausweitung der Krankenhausfälle und eine Minderung der Behandlungsintensität an, da der Grenzerlös bei gegebener Kapazität gleich p ist (der Einfachheit wegen wird a'2 =konst. gesetzt). In ihrem Bestreben den Gewinn durch Senkung der Behandlungsintensität zu erhöhen, wird die Administration per Gesetz (Gewährleistungshaftung), Peer Review Organisationen und Krankenhauskonkurrenz beschränkt. Hierdurch wird eine Mindestqualität bestimmt (siehe 3), wodurch gleichzeitig der maximale Gewinn, Gmax • determiniert ist. Es ist möglich, daß gemeinnützige Firmen die Versorgungsqualität höher schätzen als gewerbliche Firmen, weshalb erstere einen geringeren Profit, G*< Gmax , anstreben. Gemeinnützige Firmen können als Multi-Produktfirmen erwirtschaftete Gewinne einer Sparte in einer anderen Sparte einsetzen, um die Qualität in letzteren zu erhöhen, doch der Gesamtgewinn kann Null sein (Rogerson (1994». Aus diesen Gründen wird im folgenden davon ausgegangen, daß G* zwischen Krankenhäusern variieren kann. In einem prospektiven Entgeltsystem sind Ärzte nicht nur an Benefit und Anzahl an behandelten Patienten interessiert. Sie streben danach ihren Nutzen unter der Nebenbedingung zu erhöhen, daß der von der Administration gewünschte Gewinn G* erzielt wird. Sofern durch ärztliche Entscheidungen ein Gewinn G>G* erwirtschaftet wird, wird sich gegenüber dem Kostenerstattungsprinzip nichts ändern.
74
E. Die Qual der Wahl: WeIcher Standard?
Falls jedoch der erwirtschaftete Gewinn geringer ist als der erwünschte, G