166 33 35MB
German Pages 341 [344] Year 1990
Scientia Nova
Herausgegeben von Rainer Hegselmann, Hans Lenk, Siegwart Lindenberg, Werner Raub, Thomas Voss
Bisher erschienen u. a.: Robert Axelrod, Die Evolution der Kooperation Karl H. Borch, Wirtschaftliches Verhalten bei Unsicherheit Churchman/ Ackojfj Amoff, Operations Research Morton D. Davis, Spieltheorie für Nichtmathematiker Bruno de Finetti, Wahrscheinlichkeitstheorie Richard C. Jeffrey, Logik der Entscheidungen Mathematische Methoden in der Politikwissenschaft Oskar Morgenstern, Spieltheorie und Wirtschaftswissenschaft Nagel/Newman, Der Gödelsche Beweis John von Neumann, Die Rechenmaschine und das Gehirn Erhard Oeser, Wissenschaft und Information Howard Raiffa, Einfuhrung in die Entscheidungstheorie Erwin Schrödinger, Was ist ein Naturgesetz? Shannon/ Weaver, Mathematische Grundlagen der Informationstheorie Hermann Weyl, Philosophie der Mathematik und Naturwissenschaft
Erklären und Verstehen in der Wissenschaft Herausgegeben von Gerhard Schurz Mit Beiträgen von Bas van Fraassen, Peter Gärdenfors, Raimo Tuomela, Michael Friedman, Philip Kitcher, Gerhard Schurz, Karel Lambert
R.Oldenbourg Verlag München 1988
Die englischsprachigen Beiträge wurden vom Herausgeber übersetzt.
CIP-Kurztitelaufnahme der Deutschen Bibliothek Erklären und Verstehen in der Wissenschaft / hrsg. von Gerhard Schurz. Mit Beitr. von Bas van Fraassen ... - München : Oldenbourg, 1988 (Scientia Nova) ISBN 3-486-53911-6 NE: Schurz, Gerhard [Hrsg.]; Fraassen, Bas van [Mitverf.]
© 1988 R. Oldenbourg Verlag GmbH, München Das Werk und seine Teile sind urheberrechtlich geschützt. Jede Verwendung in anderen als den gesetzlich zugelassenen Fällen bedarf deshalb der vorherigen schriftlichen Einwilligung des Verlages. Umschlaggestaltung: Dieter Vollendorf Gesamtherstellung: R. Oldenbourg Graphische Betriebe GmbH ISBN 3-486-53911-6
Inhalt Vorwort Gerhard Schurz Einleitung: 40 Jahre nach Hempel-Oppenheim 1. Zur Intention und Gliederung des Bandes, 11. 2. Der Ausgangspunkt: Hempels D-N- und I-S-Modell der Erklärung, 14. 3. 40 Jahre danach - eine Problemsichtung, 20. Literatur, 29. Bas van Fraassen Die Pragmatik des Erklärens Warum-Fragen und ihre Antworten Teil I: Einführung: Was ist eine Theorie der Erklärung? 1.1. Die Sprache der Erklärung, 33. 1.2. Zurückweisungen und Asymmetrien von Erklärung, 36. 1.2.1. Hempel: gute Glaubensgründe, 36. 1.2.2. Salmons frühe Theorie: statistisch relevante Faktoren, 41. 1.2.3. Klassifikation der Schwierigkeiten, 44. 1.3 Schritte in Richtung einer adäquaten Theorie, 45. I.3.1. Erklärung und Kausalstruktur, 45. 1.3.2. Erklärung und die Theorie der Fragen, 50. 1.3.3. Ausarbeitung der Schlüsselbegriffe, 53. Teil II: Eine neue Theorie der Erklärung II.l. Kontexte und Propositionen, 57. II.2. Fragen, 60. II.3. Eine Theorie der Warum-Fragen, 65. II.4. Die Bewertung der Antworten, 71. II.5. Ausarbeitung von Präsupposition und Relevanz, 80. II.6. Schlußfolgerung, 83. Literatur, 87. Peter Gärdenfors Die Epistemologie von Erklärungen Z u r Dynamik und Pragmatik epistemischer Zustände .. 1. Programm, 91. 2. Hintergrund, 93. 3. Probabilistische Modelle zweiter Ordnung für epistemische Zustände, 96. 4. Eine Analyse von Erklärungen, 103. 5. Anwendungen der Analyse, 110. 6. Einige Konsequenzen dr Analyse, 116. 7. Schlußwort, 120. Raimo Tuomela Eine pragmatisch-nomologische Theorie des wissenschaftlichen Erklärens und Verstehens 1. Einleitung, 125. 2. Wissenschaftliche Erklärung als kommunikative Handlung, 128. 3. Die logische Natur von Fragen und
6
Inhalt
ihren Präsuppositionen, 132. 4. Die logische und wissenschaftstheoretische Natur von Erklärungsantworten, 135. 5. Die Definition von wissenschaftlichen Erklärungsantworten, 140. 6. Die Definition wissenschaftlichen Fragens und Erklärens, 142. 7. Deduktive und induktive Erklärungsargumente, 146. 7.1. Deduktiv-nomologische Erklärungsargumente, 147. 7.2. Nomologisch-induktive Erklärungsargumente, 152. 8. Das Problem der Betonung. Klassen relevanter Alternativen, 156. 9. Die Definition wissenschaftlichen Verstehens, 160. 10. Hintergrundparadigmen, 163. 11. Intentionale Handlungserklärung - ein Beispiel für Paradigmenabhängigkeit, 166. Literatur, 168. Michael
Friedman
Erklärung und wissenschaftliches Verstehen Die Vereinheitlichung der Gesetze 1. Problemstellung, 171. 2. Drei traditionelle Ansätze der wissenschaftlichen Erklärung, 173. 2.1. Das D-N-Modell der Erklärung, 173. 2.2. Erklärung als Zurückführung auf das Vertraute, 177. 2.3. Erklärung als Zurückführung auf historisch variable Verstehensideale, 180. 3. Drei Anforderungen an eine Erklärungstheorie, 182. 4. Verstehen durch Vereinheitlichung der Gesetze, 184. 5. Ein Definitionsvorschlag für Vereinheitlichung, 186. 6. Die globale Natur wissenschaftlichen Verstehens, 189. Literatur, 190.
171
Philip Kitcher
Erklärung durch Vereinheitlichung Die Rolle der Argumentmuster 1. Niedergang und Fall des Covering Law Modells, 193. 2. Erklärung: Einige pragmatische Probleme, 196. 3. Ein Newtonisches Programm, 202. 4. Die Rezeption von Darwins Evolutionstheorie, 204. 5. Argumentmuster, 206. 6. Erklärung als Vereinheitlichung, 211. 7. Asymmetrie, Irrelevanz und akzidentelle Generalisierung, 216. 8. Unechte Vereinheitlichung, 222. 9. Schlußbemerkung, 227. Literatur, 228. Erklärung durch Vereinheitlichung - Nachwort 1986...
193
231
Gerhard Schurz
Was ist wissenschaftliches Verstehen? Eine Theorie verstehensbewirkender Erklärungsepisoden Teil 1: Programm einer allgemeinen Theorie des Verstehens und Erklärens 1.1. Der Modellrahmen: Frage-Antwort-Episoden und Wissensdynamik, 235. 1.2. Die Symmetrie zwischen Erklären und
235
Inhalt
7
Verstehen. Das dynamische und das statische Modell, 243. 1.3. Arten des Verstehens und Erklärens, 245.1.3.1. Konzeptuelles Verstehen und Bedeutungserklärung, 245. 1.3.2. WarumVerstehen und Warum-Erklärung, 246. 1.3.3. Zweckverstehen und Zweckerklärung, 255. 1.4. Vier allgemeine Thesen, 256. I.5. Der Intuitionskonflikt bei probabilistischen Erklärungen. Van Fraassen versus Salmon, 260. 1.6. Probabilistische Erklärung von Einzelereignissen via Stichproben, 264. Teil II: Formale Durchführung des Programms f ü r Warum-Erklärungen II.l. Probabilistische und deduktive Trägererklärungen, 268. II. 1.1. Probabilistisch-nomologische Ereigniserklärungen, 268. II. 1.2. Deduktiv-nomologische Ereignis- und Gesetzeserklärungen, 275. II.2. Revision von Hintergrundsystemen, 281. II.3. Maße für den Vereinheitlichungsgrad von W. Das abschließende dynamische Modell, 283. Literatur, 295. Karel Lambert Prolegomenon zu einer Theorie des wissenschaftlichen Verstehens 1. Verstehen und Erklären, 299. 2. Ist wissenschaftliches Verstehen ein Erkennungsmerkmal für wissenschaftliche Erklärungen?, 308. 3. Auswirkungen auf den Erklärungsbegriff. Konsequenzen und Probleme, 313. Nachwort, 318. Literatur, 319. Verzeichnis einheitlich verwendeter Symbole Liste problematischer Beispiele Die Autoren der Beiträge Quellenhinweise Sachregister Personenregister
268
299
320 322 323 326 328 339
Vorwort
Es gibt eine Reihe bedeutender neuer Theorieentwicklungen auf dem Gebiet des Erklärens und wissenschaftlichen Verstehens, die bisher nur in englischer Sprache erschienen und im deutschen Sprachraum relativ unbekannt sind. Der Herausgeber hofft, mit diesem Band hier eine Lücke füllen zu können. Die Beiträge von van Fraassen, Tuomela, Friedman, Kitcher und Lambert wurden vom Herausgeber erstmals ins Deutsche übersetzt. Dabei handelt es sich bei van Fraassens Einführung, Kitchers Nachwort und Lamberts Artikel um Originalbeiträge, bei den restlichen Beiträgen dieser Autoren um Quellen jüngeren Datums. Darüberhinaus enthält der Band einen Beitrag von Gärdenfors, der eine Weiterführung der durch Stegmüller (1983) rezipierten Arbeit von Gärdenfors (1980) darstellt, sowie einen Beitrag des Herausgebers. Die Beiträge dieses Bandes folgen zwei miteinander zusammenhängenden Leitlinien: Zum einen handelt es sich um pragmatisch-epistemische Erklärungsmodelle, deren größere Problemlösungsressourcen viele Schwierigkeiten traditioneller Erklärungstheorien zu beheben imstande sind. Und zum zweiten wird der Begriff des Versiehens als zentrales Moment von Erklärung wissenschaftstheoretisch etabliert. Zusammengenommen wird damit in gewisser Weise ein neues Paradigma der Erklärung geschaffen. Dementsprechend strebt der Band an, mehr zu sein als eine bloße Aufsatzsammlung: die Beiträge sind aufeinander aufgebaut und dicht miteinander vernetzt, sodaß so etwas wie ein einheitliches - wenn auch streckenweise noch loses Ganzes zum Vorschein kommen soll. Mehr zur Gliederung findet sich im Abschnitt 1 der Einleitung. Obwohl das Buch den Leser an den gegenwärtigen Forschungsstand auf dem Gebiet der Wissenschaftstheorie der Erklärung heranführen möchte, werden nirgendwo größere Vorkenntnisse vorausgesetzt. In der Einleitung des Herausgebers wird ein Grundwissen vermittelt, in der Einführung von van Fraassen wird es vertieft, und alle in den weiteren Texten neu eingeführten Begriffe werden erläutert - in den seltenen Fällen,
10
Vorwort
wo dies durch den Autor nicht geschehen ist, wurde es durch den Herausgeber an kenntlich gemachten Stellen ergänzt. Als Hilfestellung und Richtlinie können dem Leser ferner die Register am Ende des Bandes dienen. Zunächst das Sachregister: gleichbedeutende Termini verschiedener Autoren wurden hier jeweils zusammen angeführt, sodaß die für ein Sachwort angeführten Seitenzahlen gleichzeitig einen Überblick über die Behandlung charakteristischer Erklärungsprobleme in den verschiedenen Beiträgen vermitteln. Neben dem Personenregister ist schließlich noch die Liste problematischer Beispiele hervorzuheben: die Erklärungsdiskussion kreist nämlich um eine Reihe charakteristischer problematischer Beispiele, und man könnte die Adäquatheit einer Erklärungstheorie fast damit definieren, daß sie alle diese Beispiele zufriedenstellend löst und zugleich die Paradigmen erfolgreicher wissenschaftlicher Erklärungen erfaßt. Die Liste problematischer Beispiele gibt eine Übersicht über diese charakteristischen Problemfälle und ihre Behandlung in den verschiedenen Beiträgen. Ferner sei auf das Verzeichnis einheitlich verwendeter Symbole, auf die Angaben zu den Autoren der Beiträge sowie auf die Quellenhinweise verwiesen. Der Herausgeber dankt allen Autoren für die gemeinsame Arbeit an diesem Band und dem Oldenbourg-Verlag für die gute Zusammenarbeit. Bleibt nur noch zu hoffen, daß der Band die Mühe seiner Autoren in der Bereicherung seiner Leser lohne. Salzburg, im April 1987
Gerhard Schurz
Gerhard Schurz Einleitung: 40 Jahre nach HempelOppenheim 1. Zur Intention und Gliederung des Bandes Oft entwickelt sich ein wissenschaftlicher Forschungsbereich so: In einer ersten Phase wird von einem ,Gründervater' (oder von mehreren) ein Problem entdeckt und hierfür eine Theorie vorgeschlagen - so etwas wie ein Paradigma bildet sich aus. In der darauffolgenden Phase wird dieses Paradigma weitbekannt, aber auch von allen Seiten attackiert und von Anomalien mehr und mehr durchlöchert. In der dritten Phase setzt eine gewisse Resignation ein; das Paradigma verliert an Popularität, doch eine Minderheit von Spezialisten arbeitet entschlossen weiter. Unter der Oberfläche entsteht etwas Neues; und oftmals noch in der Zeit, wo die Mehrheit an die alte Theorie und ihre Mängel fixiert ist, sind Ansätze einer neuen Theorie und in gewissem Sinn eines neuen Paradigmas erkennbar, welches auf den ersten Anschein zwar ungewohnt und etwas komplexer als das alte anmutet, jedoch die Probleme in vielen Hinsichten zufriedenstellender zu lösen imstande ist. Mit der Theorie der Erklärung war es so. Nach Hempels großartigem Entwurf in den 40er Jahren folgte in den 50ern und 60ern überwältigende Kritik, und in den 70ern wurde es etwas stiller um Erklärung. Doch schon in dieser Zeit und in den 80ern entstanden eine ganze Reihe neuer und fortgeschrittener Ansätze, deren Summe so etwas wie eine neue Theorie oder ein neues Paradigma ausmacht. Viele dieser Ansätze liegen bislang nicht in deutscher Sprache vor und sind im deutschen Sprachraum noch wenig bekannt. Der vorliegende Band versucht, eine zusammenhängende Darstellung dieser neuen Entwicklungen zu liefern. Das neue .Paradigma' speist sich aus zwei zusammenhängenden Entwicklungen, die in diesem Buch ihren Niederschlag finden. Die eine Entwicklung ist die Hinwendung zu pragmatischen und epistemischen Modellen, als Reaktion auf die gravierenden Mängel und ,Blindstellen' rein syntaktischer und se-
12
Gerhard Schurz
mantischer Modellbildungen. Hintergrundwissen und Modelle epistemischer Zustände, Wissensdynamik und Frage- und Antwortanalysen, kommunikationstheoretische Bedingungen und vieles mehr sind die neu hinzukommenden Elemente solcher pragmatisch-epistemischer Modelle, welche insgesamt wesentlich größere Problemlösungsressourcen besitzen als die rein syntaktisch-semantischen Modellbildungen. Dabei beanspruchen diese Modelle - weit von einem Subjektivismus' entfernt - natürlich, bestimmte Objektivitätskriterien zu erfüllen, wie Rationalität, Überprüfbarkeit und Intersubjektivität des Wissens, usw. Die andere Entwicklung ist die wissenschaftstheoretische Etablierung des Verstehensbegriffs: die Erkenntnis, daß das zentrale Moment wissenschaftlicher Erklärungen eigentlich das Bewirken von wissenschaftlichem Verstehen sei. Damit erfährt die traditionsreiche Erklärens- Verstehens-Kontroverse eine interessante Wendung: Nachdem im 19. und Anfang des 20. Jahrhunderts der Verstehensbegriff als geisteswissenschaftliches' Konzept in striktem Gegensatz zu naturwissenschaftlichem' Erklären gesetzt worden war, und nachdem Mitte des 20. Jahrhunderts von Hempel (u. a.) dann alles an Verstehen, was über gesetzesmäßige Erwartbarkeit bzw. Prognostizierbarkeit hinausgeht bzw. davon abweicht, ins Subjektive und Nichtwissenschaftliche verwiesen worden war, wird nun, in den 70ern und 80ern, der Verstehensbegriff vom Erklärungsbegriff sozusagen ,zu Hilfe gerufen'. Der alte Streit sollte heute daher als endgültig beseitigt erscheinen: es gibt keinen wirklichen Gegensatz zwischen Verstehen und Erklären, die beiden Konzepte sind ,intim verbunden', und Verstehen ist nicht länger »Outsider' der Wissenschaftstheorie. Freilich ist vieles an der neuen Theorie noch kontrovers. Zunächst gibt es neben der pragmatisch-epistemischen Richtung, die die Autoren dieses Bandes mehr oder minder stark teilen, noch jene Richtung, die die ,Objektivität' des Erklärungsbegriffs (im Sinn des Realismus) forciert und pragmatisch-epistemische Faktoren möglichst ausklammern möchte - ζ. B. jene Autoren, die die Rolle der Kausalität als ,nichtpragmatisches' oder,kontextfreies' Moment der Erklärung besonders betonen. Mit diesen Alternativströmungen, insbesondere Salmon (1984), setzen sich die Beiträge dieses Bandes durchweg kritisch
Einleitung: 40 Jahre nach Hempel-Oppenheim
13
auseinander, und die Meinungsverschiedenheiten sind oft weit weniger groß, als man annehmen möchte. Auch zwischen den Beiträgen gibt es viele kritische Punkte der Nichtübereinstimmung; und die Autoren nehmen durchgehend aufeinander Bezug und tragen viele problematische Diskussionspunkte aus: ζ. B. die Frage, wie stark die pragmatischen (resp. kontextabhängigen) neben den objektiven (resp. kontextfreien) Komponenten der Erklärung sein sollen, wie direkt Erklären und Verstehen konzeptuell miteinander verknüpfbar sind, in welchem Verhältnis lokale zu globalen Komponenten der Erklärung stehen, worin die Natur probabilistischer Erklärung besteht, usw. Voralledem aber haben die Beiträge die Eigenschaft, die jedes ,gute' neue Paradigma haben sollte: sie nehmen durchweg auf die klassischen Probleme des Erklärungsbegriffs in ihrer ganzen Bandbreite Bezug und lösen viele Rätsel des alten Paradigmas (statt sie, wie in einer bestimmten Lesart des Kuhnschen Paradigmenbegriffs, ,wegzudefinieren'). Die Beiträge des Bandes gliedern sich in zwei Gruppen. Die erste Gruppe beginnt mit dieser Einleitung, welche die Ausgangspunkte der Debatte bei Hempel rekonstruiert und eine Übersicht über die Problemvielfalt bietet. Dann folgt van Fraassens Einführung, der Teil I seines Beitrags, welche die klassischen Probleme weiter vertieft und den Leser zu pragmatisch-epistemischer Modellbildung hinführt. Im Teil II seines Beitrags präsentiert van Fraassen seine neue und durchweg originelle Erklärungstheorie, welche unter allen Beiträgen dieses Bandes in gewisser Weise am stärksten pragmatisch ist: es geht in ihr um Fragekontexte, Kontrastklassen, Hintergrundkontexte, explanative Relevanzrelationen, Zurückweisungen von Erklärungen und vieles mehr. Gärdenfors' Beitrag zeigt in bestechender Weise, wie ein Teil des pragmatischen Spektrums, nämlich der epistemische Hintergrundkontext, im Rahmen einer präzisen Modellanalyse explizierbar und zur Lösung diverser Probleme anwendbar ist. Der Beitrag von Tuomela nimmt eine besondere Stellung ein: Erstens bettet er traditionelle Erklärungsmodelle vom ,Hempelschen' Typ in einen pragmatischen Kontext ein, widmet sich zweitens aber dennoch in gewisser Hinsicht am ausführlichsten den pragmatischen, nämlich kommunikationstheoretisch-illokutiven Aspekten der Erklä-
14
Gerhard Schurz
rung, und präsentiert drittens auch eine explizite Analyse des wissenschaftlichen Verstehensbegriffs, womit er zur zweiten Gruppe von Beiträgen überleitet. Diese zweite Gruppe beschäftigt sich durchweg mit Verstehen und seiner Relation zu Erklären. Zunächst folgt Friedmans im englischen Sprachraum weitbekannter und gewissermaßen bahnbrechender Aufsatz über wissenschaftliches Verstehen durch globale Vereinheitlichung von Gesetzesphänomenen. Kitchers Aufsatz liegt auf derselben Grundlinie, doch Kitcher zufolge kommt Erklärung und das damit bewirkte Verstehen durch die Vereinheitlichung von Argumentmustern zustande - eine neue Idee, die, wie Kitcher zeigt, für wissenschaftsgeschichtliche Rekonstruktionen gut anwendbar ist. Mein eigener Beitrag versucht, einen Theorierahmen zu entwerfen, der viele Aspekte der anderen Beiträge zu einem Ganzen verbinden soll. Im ersten Teil wird das Programm einer allgemeinen Theorie des Verstehens und Erklärens skizziert, welches nicht nur Warum-Erklärungen, sondern auch alle anderen relevanten Arten des Verstehens und Erklärens zu erfassen trachtet. Im zweiten Teil wird dieses Programm für Warum-Erklärungen durchgeführt, wobei ein deduktives und probabilistisches Erklärungsmodell in einen wissensdynamischen Rahmen eingebettet wird und einige Maße für Wissensvereinheitlichung vorgeschlagen und in Anwendung gebracht werden. Im abschließenden Beitrag nimmt Lambert, in der Art eines Meisters, Verstehen als expliziten Gegenstand wissenschaftstheoretischen Studiums auf, entwirft eine allgemeine Rahmentheorie des Verstehens und diskutiert dann kritisch das Verhältnis von Verstehen und Erklären. 2. Der Ausgangspunkt:
Hempels D-N- und I-S-Modell Erklärung
der
Hempels Theorie der Erklärung, Paradigma der logisch-empiristischen Wissenschaftstheorie, entstand - wie in vielen Fällen - ursprünglich aus der Beschäftigung mit einem,Nebenzweck'. Der Titel von Hempels erstem Aufsatz „The Function of General Laws in History" (1942) verrät es. Gegenüber den .geisteswissenschaftlichen' Strömungen, die immer wieder die Unvereinbarkeit der naturwissenschaftlichen' Methode des Erklä-
Einleitung: 40 Jahre nach Hempel-Oppenheim
15
rens mit der geisteswissenschaftlichen' Methode des Verstehens hervorhoben, ging es Hempel hier darum, aufzuzeigen, daß die logische Struktur der Erklärungsmethode für alle Wissenschaften Geltung habe. Wesentlich dabei war, daß Hempel dies mit präzisen logischen Methoden nachzuweisen versuchte, was ihn zur Explikation jener bereits von John Stuart Mill u. a. lax formulierten Idee der Erklärung als Herleitung aus Naturgesetzen in einer begrifflichen Schärfe führte, die entscheidende Innovationen ermöglichte. Das in (1942) vorgeschlagene Modell wurde von Hempel in seiner berühmten Arbeit zusammen mit Oppenheim (1948) logisch weiter ausgearbeitet. In diesem Aufsatz wurde zum ersten Mal die Explikation des Erklärungsbegriffs zur zentralen Problemstellung; und hier wurden auch bereits die ersten ,Anomalien' sichtbar, mit welchen dann die wissenschaftstheoretische Erklärungsdebatte im engeren Sinn begann. Hempels deduktiv-nomologische Modell, kurz D-NModell der Erklärung - auch covering /aw-Modell (oder Subsumtionsmodell) genannt - besagt, die Erklärung einer singulären Tatsache bestünde in ihrer logischen Ableitung aus anderen Tatsachen und übergeordneten Naturgesetzen, also genauer gesagt aus einem Argument folgender Form Tlt...,T„
Gesetze bzw. Theorien
Antecedens
Beispiel: Gesetze der Schwerkraft, des Auftriebs, der Kräfteaddition, plus Brückenprinzip „x schwimmt auf Flüss. y g.d.w. die Gesamtkraft auf χ senkr. zur y-Oberfläche null ist", und: Dichte (Holz) < Dichte (Wasser). Dieses Objekt ist aus Holz und wurde ins Wasser gegeben.
}Explanandum
Daher schwimmt dieses Objekt auf dem Wasser.
Explanans A1,...,Am Ε
welches die folgenden Bedingungen erfüllt: (1) Die Tt (1 GX), Fa Λ Hb/Ga Λ Hb", und das berühmte Beispiel „VJc(Fx-*Gx), (Fa A~\ Ga) Ν Hai Ha", welches deshalb nicht akzeptabel ist, weil - gegeben die Wahrheit von Τ — Ε hier nicht unabhängig von Α als wahr erweisbar ist (s. Hempel 1948, S. 277). Hempel nahm in sein abschließendes Modell daher zusätzliche Bedingungen auf, um diese Fälle auszuschließen, doch Eberle/Kaplan/Montague (1961) zeigten, daß auch diese zur Eliminierung von Pseudoerklärungen nicht hinreichten, und darauf folgte eine lang anhaltende Debatte, in der verbesserte D-N-Modelle vorgeschlagen wurden, welche dann durch neue Pseudoerklärungsbeispiele erneut widerlegt wurden, usf. (Für eine Übersicht siehe Stegmüller 1969, S. 708-774 und Schurz 1983, S. 225-253). Obzwar die Debatte zeigte, daß mit logischen Zusatzbedingungen sicher kein hinreichendes Modell der D-N-Erklärung geliefert werden kann, da sich eine Reihe von Pseudoerklärungsbeispielen als hinter-
Einleitung: 40 Jahre nach Hempel-Oppenheim
21
grundwissensabhängig herausstellten (vgl. Schurz 1983, S. 254-287), so kann man doch sagen, daß die Debatte bezüglich des Problems der Eliminierung von Fällen logischer Irrelevanz, nach anfanglichem Scheitern, zu gewissen Erfolgen gelangt ist. Zwei D-N-Modelle, die die bisher diskutierten Probleme in der D-N-Debatte auf ihre Weise lösen, finden sich in diesem Band: das DE-Modell von Tuomela (7.1) und die DE1- und DE2-Modelle von Schurz (II.1.2). 2. Das Problem der maximalen Bestimmtheit: Obwohl die Idee der maximalen Bestimmtheit probabilistischer Erklärungen klar ist, liegt das Problem in ihrer richtigen Formulierung. Hempel gab eine erste Formulierung in (1965, S. 399 f), die daraufhin etlichen Einwänden ausgesetzt war (Übersicht s. Stegmüller 1969, S. 689-702 und Hempel 1968). Er schlug in (1968) eine verbesserte und in (1977, S. 112) weiter veränderte Fassung vor. Hempels Begriff der maximalen Bestimmtheit entspricht in Salmons Modell übrigens dem Begriff der Homogenität einer Antecedensklasse (s. Salmon 1971, S. 40-50; 1984, S. 36f. Grob gesprochen: Α ist homogen bzgl. Ε g.d.w. keine nomologische Subklasse von Α existiert, die die bedingte Wahrscheinlichkeit von Ε verändert. Freilich hat Salmon statt einem epistemischen ein,objektives' Hintergrundsystem, die Menge aller Tatsachen, im Auge - s. u.). Zwei weiterentwickelte Formulierungen der maximalen Bestimmtheitsforderung finden sich im IE-Modell von Tuomela (7.2, Bed. (ν)) und im PE-Modell von Schurz (II.1.1). Auch Gärdenfors' Modell enthält ein Analogon zur maximalen Bestimmtheitsforderung (vgl. seine Definition EFW der Einzelfallwahrscheinlichkeit in 4). Allerdings wird in Gärdenfors' Modell die bedingte Wahrscheinlichkeit von Ε nicht, so wie in Hempels I-S-Modell, durch ein explizites covering law p(Ex/Ax) = r festgelegt, das Antecedens und Explanandum verbindet, sondern Gärdenfors nimmt eine Wahrscheinlichkeitsfunktion 2. Ordnung (Glaubensfunktion) im Hintergrundwissen W an, welche den Propositionen gewisse apriori-Wahrscheinlichkeiten zuordnet, und bestimmt dann die Wahrscheinlichkeit von Ε durch Übergang zum kontrahierten System W£ - i.e. die minimale Kontraktion von W, die Ε nicht mehr enthält. (Vgl. hierzu auch van Fraassens Beitrag II.4, Anm. 23.)
22
Gerhard Schurz
3. Das Problem der Relevanz von probabilistischen (und deterministischen) Gesetzen: Bereits (1971) wies Salmon darauf hin, daß ein Antecedensfaktor Α für das Explanandum Ε nur dann als erklärend anzusehen ist, wenn er Wahrscheinlichkeit von Ε tatsächlich beeinflußt - die bloße Höhe der Wahrscheinlichkeit von E, gegeben A, genügt nicht. (Das Problem betrifft sowohl probabilistische wie deterministische Gesetze.) Beispielsweise gilt sicherlich: „Alle Männer (M), die regelmäßig Antibabypillen nehmen (A), werden nicht schwanger (—ι S), d.h. ρ( ι Sx/Ax Λ MX) = 1, doch es gilt auch p(—ι Sx,Mx) = 1, d.h. die Einnahme von Antibabypillen ist bei Männern für ihr Nicht-Schwangerwerden völlig irrelevant (s. Salmon 1971, S. 34). Salmon schlug daher vor, es sei als Antecedensklasse einer probabilistischen Erklärung nicht bloß eine homogene (i.e. maximal bestimmte), sondern die breiteste homogene Bezugsklasse zu wählen (i.e., im Hempelschen Sinn, das schwächste maximal bestimmte Antecendesprädikat). Hempel zeigte in (1977, S. 109) jedoch, daß diese Forderung für Disjunktionen zu Problemen führt. Eine knappe Diskussion dieses Relevanzproblems findet sich in Schurz' Beitrag (II. 1.1, Bed. (5)) sowie bei Gärdenfors (Abschn. 5). Einen interessanten Ansatz zur Elimination von Irrelevanzen durch die Vereinheitlichungsbedingung macht Kitcher (Abschn. 7). 4. Das Problem der Gesetzeserklärung: Fast wichtiger als die Erklärung von Einzelereignissen in den Wissenschaften ist die Erklärung von Gesetzen. In unserem Beispiel zum D-N-Modell würde der Wissenschaftler ζ. B. mit dem Explanans nicht bloß erklären, warum dieses Stück Holz auf dem Wasser schwimmt, sondern warum (alles) Holz auf dem Wasser schwimmt. Friedman macht insbesondere auf die Bedeutung von Gesetzeserklärungen aufmerksam und gibt mit seiner Vereinheitlichungsdefinition einen Weg an, um gewisse Irrelevanzprobleme bei Gesetzeserklärungen zu lösen. Ebenso beschäftigt sich Kitcher damit (s. Abschn. 8), und in den Beiträgen von Tuomela und Schurz findet sich jeweils ein Modellvorschlag für deduktive Gesetzeserklärungen (7.1 resp. II.1.2). 5. Alltagserklärungen, historische Erklärungen und Handlungserklärungen: Immer wieder wurde gegen Hempels covering law-Modell eingewandt, daß diese Erklärungen scheinbar
Einleitung: 40 Jahre nach Hempel-Oppenheim
23
ohne Gesetze auskämen. Hempel nannte Erklärungen, wo die Gesetze weggelassen werden, ,elliptische' Erklärungen (1965, S. 415). Gärdenfors zeigt in seinem Beitrag (Abschn. 4), wie das Phänomen elliptischer Erklärungen im Rahmen eines dynamischen Erklärungsmodells befriedigend behandelbar ist; ebenso Tuomela (Abschn. 5, (9)), Schurz (1.3.2.2). Eine Anwendung des jeweiligen Modells auf Handlungserklärungen findet sich in Tuomela (Abschn. 11) und Schurz (Abschn. 1.3.2.3). 6. Das Problem der Gesetzesartigkeit: Daß nicht jeder Allsatz als Gesetz in Frage kommt, zeigte bereits Hempel ( - im Anschluß an Nelson Goodman; s. Hempel 1948, S. 264-270). Ζ. B. ist die Tatsache, daß alle Mitglieder der Schulbehörde von Greenbury glatzköpfig sind, kein Gesetz, sondern ein sogenannter ,akzidenteller' (zufallig wahrer) Allsatz (s. Hempel 1965, S. 339). Auch in der maximalen Bestimmtheitsforderung für I-S-Erklärungen dürfen nur ,nomologische Prädikate' zugelassen werden (s. Hempel 1968: Prädikate wie „Ax ν χ = α" müssen ζ. Β. eliminiert werden). Einen interessanten Versuch zur Gesetzesartigkeit über die Vereinheitlichungsbedingung macht Kitcher (Abschn. 7); Bemerkungen dazu finden sich auch in van Fraassen (1.2.1) und Schurz (II.1.1, Bed. (2)). 7. Erklärungsasymmetrie: Es gibt viele Äquivalenzgesetze, die sich nur in der einen Richtung als Erklärung, in der anderen Richtung höchstens als Voraussage oder Begründung verwenden lassen - obwohl die jeweiligen Argumente strukturell völlig gleich sind. Dies zeigen die bekannten Beispiele von Bromberger, Grünbaum und Hempel: das Fahnenmastbeispiel, das Barometerbeispiel, das Beispiel der Rotverschiebung u. a., auf die van Fraassen in Abschn. 1.2.1 und 1.2.3 ausführlich eingeht, sowie das Pendelbeispiel, das in Kitcher (Abschn. 7) diskutiert wird. Zunächst zeigen diese Beispiele, daß die eine Teilthese der Hempelschen strukturellen Gleichartigkeitsthese von Erklärung und Voraussage nicht haltbar ist: nicht jede Voraussage ist auch als Erklärung geeignet. Ζ. B. können wir mit dem Fallen des Barometerstandes den nahenden Sturm voraussagen, doch das ist nicht die Erklärung für den Sturm. Zweitens zeigt dieses Problem (als eines unter vielen) die Kontextbezogenheit von Erklärungen auf: wenn zwei Argumente strukturell gleich sind, so kann der Grund, warum nur eines als Erklärung akzeptier-
24
Gerhard Schurz
bar ist, offenbar nicht im Argument selbst liegen, sondern muß mit einem Hintergrundkontext zu tun haben. Das Barometerbeispiel hat offenbar mit Kausalität - genauer gesagt, mit einer im Hintergrund, versteckten' Kausalvariablen - zu tun: der Fall des Barometerstandes ist nicht Ursache für den Sturm, sondern beide sind korrelierte Wirkungen einer gemeinsamen Ursache, nämlich des Druckabfalls in der Atmosphäre. Im probabilistischen Fall gibt es zur Dedektion solcher versteckter gemeinsamer Ursachen das auf Reichenbach (1956, Kap. 19) zurückgehende Kriterium der Abschirmung. Angenommen, p(A/B)>p(A). Dann schirmt C Β von Α ab g.d.w. p(A/B λ C ) = p(A/C), p(A/B a~iC = p(A/~iQ, ρ (B/Q > ρ (B) und ρ (A/C) > /> (Λ) - d. h. ß ist nur,Scheinursache' für A, tatsächlich sind Α und Β gemeinsame Wirkung von C. 3 Näheres zur Abschirmungsbedingung s. van Fraassen (Abschn. II.4). - Doch nicht alle Asymmetriebeispiele sind derartig auf Kausalität zurückführbar: ζ. B. sind Pendellänge und Pendelfrequenz nicht zeitlich aufeinanderfolgende, sondern simultane Zustände, dennoch besteht auch hier eine Asymmetrie. Van Fraassens Lösung des Asymmetrieproblems beruht insbesondere auf der Einführung einer kontextuell gegebenen explanativen Relevanzrelation (s. 1.3 und II.3-5). Kitcher versucht eine Lösung des Asymmetrieproblems mit der Vereinheitlichungsbedingung (Abschn. 7). Schurz unterscheidet zwischen Ursachen- und Grunderklärungen und führt unterschiedliche Bedingungen an (1.3.2.1 und II.l.l Bed. (6), II.1.2 Bed. (6), u. a.). Tuomela faßt Ursachenerklärungen als Spezialfall von Gründe-liefernden Erklärungen auf (4, u. a.). 8. Kausalität: Salmon (1984) zufolge sind Erklärungen in ihrem Wesen kausaler Natur: sie informieren über die Menge aller Ursachen und Kausalmechanismen. Van Fraassen setzt sich damit (in 1.3.1) kritisch auseinander. Salmon versteht unter Kausalität im wesentlichen das Kausalkonzept der relativistischen 3
Reichenbachs Bedingung lautet: p(A λ B/C) = p(A/C)p(B/C), p(A λ Bj~ι C ) = p(A/~\ C)p(B/~i C), p{AjC) >p(A/—\ C), p(B/C)>p(B/—iC). Doch unter der Annahme p(B/C) > 0,p(B/—\ C) > 0 ist dies (im elementaren Wahrscheinlichkeitskalkül) nachweislich äquivalent mit obiger Formulierung; überdies folgt daraus p(A/B)>p(A).
Einleitung: 40 Jahre nach Hempel-Oppenheim
25
Mechanik; wie van Fraassen aber argumentiert, sind viele Erklärungen der Quantenmechanik in dieser Perspektive akausal. Generell ist Kausalität etwas vom Stand wissenschaftlicher Theorien abhängiges. Darüberhinaus verstehen wir, wie van Fraassen argumentiert, unter den Ursachen nie alle, sondern nur die herausragenden Faktoren des kausalen Netzes (1.3.1), und diese sind sehr stark kontextabhängig. Van Fraassen zeigt jedenfalls, daß die Familie der Kausalerklärungen nur eine Erklärungsart unter vielen ist; ebenso wird in Schurz (1.3) argumentiert. Auch Lambert diskutiert mehrere Verstehensarten, eine davon die kausale (Abschn. 1). Mit der Frage, ob Kausalität auf Erklärung zurückführbar ist, oder umgekehrt, beschäftigt sich Kitcher in seinem Nachwort. 9. Hintergrundabhängigkeit: Eine Vielzahl von Argumenten zeigen, daß Erklärungen von gewissen Faktoren des Hintergrundkontextes, ζ. B. Hintergrundwissen, Fragekontext, u.a.m., abhängig sind. Dies betrifft nicht nur probabilistische Erklärungen (hier drängt sich die Hintergrundabhängigkeit schon wegen der maximalen Bestimmtheitsforderung auf), sondern auch deduktive (vgl. Schurz II.1.2, ebenso Tuomela 7.1, Friedman und Kitcher. Für Gärdenfors und van Fraassen sind deduktive Erklärungen ein Grenzfall probabilistischer Erklärungen.) - In allen Beiträgen werden derartige Hintergrundfaktoren angenommen. Diese Hintergrundfaktoren sind pragmatisch-epistemischer Natur. Insbesondere Gärdenfors' Beitrag legt eine differenzierte Analyse epistemischer Hintergrundsysteme vor. Dennoch sind diese Modelle vom ,objektiven' Modell Salmons durchaus nicht so weit entfernt. Ζ. B. nimmt auch Salmon einen Fragekontext (der ζ. B. die Referenzklasse determiniert; 1984, S. 35), und statt auf ein epistemisches Hintergrundwissen bezieht er seine Homogenitätsforderung auf die Menge aller,Tatsachen' (oder sprachlich gewendet, die Menge aller wahren Sätze; vgl. dazu Hempels Kritik 1977, S. 117). Dies ist freilich ein ,ideal-platonisches' Konzept - die Menge aller Tatsachen ist uns in der realen Erkenntnispraxis nie gegeben, sondern immer nur ein mehr oder weniger begrenztes und fehlbares Wissen darüber. Ferner verwendet Salmon in seinem Modell nur eine statistische Wahrscheinlichkeit; also keine Glaubensfunktion. Zur Frage der,Objektivität' der induktiven bzw.
26
Gerhard Schurz
subjektiven Wahrscheinlichkeit s. die Diskussion in Schurz II. 1, zu Bedingung (3). 10. Erklärungen ohne prognostische Funktion: Scrivens berühmtes Beispiel der progressiven Paralyse zeigte, daß es auch Beispiele von Erklärungen gibt, die keine prognostische Funktion haben. Es handelt sich dabei um die Erklärung von etwas Niedrigwahrscheinlichem. Gärdenfors (in Abschn. 5) diskutiert dieses Beispiel intensiv; er zeigt, wie dieses Beispiel nur in einem dynamischen Modell adäquat behandelbar ist, welches das Vorwissen des Erklärungssuchenden mitberücksichtigt. Vgl. ebenso van Fraassen (1.2.1, 1.3.2 u.a.); auch in Lambert (Anm. 1) und Schurz (II.3) wird darauf eingegangen. 11. Die ,Höhe' der bedingten Wahrscheinlichkeit des Explanandums: Gärdenfors schlägt als Minimalbedingung vor, die Wahrscheinlichkeit des Explanandums müsse zumindest erhöht werden gegenüber dem Vorwissen; van Fraassen fordert, die Favorisierung des Explanandums sei zu erhöhen (II.4). Tuomela dagegen verlangt - als Minimalbedingung für rationale Erwartbarkeit bzw. Prognostizierbarkeit - die Wahrscheinlichkeit müsse größer als 0,5 (bzw. größer als die der Negation des Explanandums) sein (s. 7.2). Salmon dagegen meint, auch Argumente, die die Wahrscheinlichkeit des Explanandums senken, sind dann als erklärend anzusehen, wenn sie eine vollständige Kausalinformation liefern. Siehe hierzu van Fraassen (1.2.2), Gärdenfors (2.), die sich dort mit Salmon auseinandersetzen, sowie Schurz (1.5,1.6), wo Salmons Argumenten Rechnung getragen und ein via Stichproben-Modell vorgeschlagen wird, welches für den Status niedrigwahrscheinlicher Erklärungen neuartige Konsequenzen besitzt. 12. Betonung und Kontrastklassen: In betonten Warum-Fragen, ζ. B. „Warum aß John den Apfel?" im Vergleich zu „Warum aß John den ApfelT\ wird das Explanandum auf jeweils eine andere Menge von Alternativen (sog. ,Kontrastklassen') bezogen, und die Antwort muß jeweils anders aussehen. Van Fraassen geht in seinem Beitrag intensiv darauf ein (1.3.2, II. 2 - 5 ) und entwickelt eine originelle Theorie der Favorisierung (II .4). Es gibt hier neuartige Effekte gegenüber einfachen Warum-Fragen (mit,trivialer' Kontrastklasse {E, —\ E}). Beispielsweise kann eine Antwort die Favorisierung von Ε gegen-
Einleitung: 40 Jahre nach Hempel-Oppenheim
11
über seinen Rivalen erhöhen und dennoch die Wahrscheinlichkeit von Ε senken (s. van Fraassen II.4). Tuomela schlägt eine andere Lösung des Betonungsproblems vor (Abschn. 8). Vgl. auch Gärdenfors' Beitrag sowie Schurz (II.3.1). 13. Zurückweisungen von Erklärungsforderungen: Der Erklärungsanspruch gewisser Warum-Fragen wie „warum verharren kräftefreie Körper in gleichförmiger Bewegung?" wird von der Wissenschaft zurückgewiesen. Auf dieses interessante Problem gehen insbesondere van Fraassen (1.2.2-1.2.3, II.2 u. a.) und Lambert (Abschn. 2) ein. 14. Dynamik des Hintergrundwissens: Eine Reihe von Problemen sind erst in einem dynamischen Modell adäquat behandelbar, welches Erklärung als Relation zwischen zwei (oder mehreren) Hintergrundsystemen betrachtet - insbesondere das Hintergrundsystem vor und das nach Erhalt der Erklärungsantwort. In den Beiträgen von Gärdenfors und Schurz (1.1 - 2 , II.3) wird ausführlich darauf eingegangen, s. aber auch die anderen Beiträge. 15. Erklärungen als Frage-Antwort-Episoden: Die linguistische Form, in die sich derartig dynamisch betrachtete Erklärungen kleiden, sind Frage-Antwort-Episoden. Also ist es naheliegend, die logische und pragmatische Struktur solcher Frage-Antwort-Episoden zunächst einmal allgemein zu analysieren. Van Fraassen (II.1-3) geht darauf in bestechend klarer Weise ein, ebenso Tuomela (Abschn. 3-4); vgl. auch Schurz (1.1, 1.3). 16. Erklärungen als kommunikative Handlungen: Ein pragmatisch weitergehender Schritt ist es, die den Erklärungsakten zugrundeliegende intentionale und performative Handlungsstruktur zu erhellen. Dieser Aufgabe widmet sich insbesondere Tuomela (Abschn. 1-6), mit originellen Ergebnissen über die spreckakttheoretische Natur von Erklärungen. 17. Wie bewirken Erklärungen Verstehen und worin besteht Verstehen? Diese Frage stellt Friedman in seinem Beitrag. Ihm zufolge ist das Bewirken von Verstehen eine zentrale Eigenschaft von Erklärung, und jede Erklärungstheorie sollte darauf eine Antwort geben. Auch Kitcher, Tuomela (Abschn. 1) und Schurz (1.4 u. a.) sind dieser Ansicht. Die schwierige Frage ist jedoch, zu präzisieren, worin Verstehen besteht. Zunächst ist
28
Gerhard Schurz
hierbei, wie insbesondere Friedman erhellend betont, Verstehen im objektiven und wissenschaftlichen Sinne gemeint. Friedman entwickelt, nach einer Diskussion traditioneller Ansätze, die These, daß Verstehen in der Vereinheitlichung bzw. Reduktion unabhängiger Gesetzesphänomene besteht, und ebendies wird durch Erklärungen geleistet. Kitcher entwickelt eine originelle Variante: Erklären und Verstehen bestehen ihm zufolge in der Vereinheitlichung von Argumentmustern. Eine Reihe spannender Probleme sind involviert in die Definition eines adäquaten Vereinheitlichungsbegriffs und Argumentmusterbegriffs. Lambert entwickelt eine noch weiter ausholende Rahmentheorie für Verstehen: Verstehen eines Phänomens bedeutet ihm zufolge, dieses in die gegebene Hintergrundtheorie adäquat einzufügen, wobei es verschiedene Methoden des Einfügens gibt, die ihm zufolge nicht alle durch Erklärungen bewerkstelligt werden. In Schurz' Beitrag wird eine allgemeine Verstehenstheorie entworfen, derzufolge Verstehen auf gewissen Vereinheitlichungsmechanismen beruht. Hier wird die These der Symmetrie von Erklären und Verstehen verteidigt. Tuomela gibt in Abschn. 9 eine Definition wissenschaftlichen Verstehens. 18. In welchem Verhältnis stehen Erklären und Verstehen zueinander? Bewirkt jede Erklärung Verstehen?, und umgekehrt, wird jedes Verstehen durch eine Erklärung bewirkt? Friedman, Kitcher, Tuomela und Schurz vertreten einen Standpunkt, der eine Symmetrie von Erklären und Verstehen impliziert (zumindest eine positive Antwort auf die erste Frage scheint bei all diesen Autoren vorhanden zu sein). Lambert bringt Einwände gegen beide Richtungen dieser Symmetriethese. Schurz verteidigt beide Richtungen gegen einige Einwände. 19. Präzisierung des Vereinheitlichungsbegriffs: Dies ist für Friedmans und Kitchers Ansatz ein wichtiges und facettenreiches Problem. In beiden Beiträgen sowie in Schurz (II.3) werden Definitionen bzw. Maße für Vereinheitlichung vorgeschlagen. 20. Lokaler versus globaler Erklärungsbegriff: Friedman und Kitcher zufolge ist Erklärung ein globales Phänomen, während die Beiträge von van Fraassen, Gärdenfors, Tuomela und Lambert Erklärung als lokales Phänomen interpretieren, i.e. sie haben den Begriff der Erklärung einer gegebenen einzelnen Tatsa-
Einleitung: 40 Jahre nach Hempel-Oppenheim
29
che im Auge, und nicht den Erklärungsvorrat eines Hintergrundwissens, so wie ζ. B. Kitcher. Über das Verhältnis lokaler und globaler Erklärungsansätze s. Lambert (Abschn. 3), sowie Schurz (1.4, II.3), wo in ein lokales Modell eine globale Bedingung eingebaut wird. 21. Probleme eines umfassenden Erklärens- und Verstehensbegriffs: Der Großteil der Ausführungen kreist um die zentrale Erklärungsart in den Wissenschaften: die Warum-Erklärung. Es gibt jedoch noch andere Arten des Erklärens und Verstehens wie Zweckerklärungen und Zweckverstehen oder Bedeutungserklärungen und Bedeutungsverstehen. Van Fraassen schließt in sein Modell auch finale Erklärungen ein. Lamberts Verstehenskonzept ist als umfassendes intendiert. In Schurz' Beitrag wird eine Liste verschiedener Erklärungs- und Verstehensarten gegeben und Erklärung bzw. Verstehen als Begriffsfamilie analysiert (1.3). Literatur Eberle, R./Kaplan, D./Montague, R. (1961): „Hempel and Oppenheim on Explanation", Philosophy of Science 28, S. 418 -428. Hempel, C.G. (1942): „The Function of General Laws in History", Journal of Philosophy 39, S. 35-48; wiederabgedruckt (leicht modifiziert) in Hempel (1965), S. 231-243 (Seitenangaben beziehen sich darauf). Hempel, C. G./Oppenheim, R (1948): „Studies in the Logic of Explanation", Philosophy of Science 15, S. 135-175; wiederabgedruckt (leicht modifiziert) in Hempel (1965), S. 245-290 (Seitenangaben beziehen sich darauf). Hempel, C. G. (1962): „Deductive-Nomological versus Statistical Explanation", in: Feigl, H./Maxwell, G. (Hrsg.), Minnesota Studies in the Philosophy of Science. Bd. III, University of Minnesota Press, Minneapolis, S. 98-169. Hempel, C.G. (1965): Aspects of Scientific Explanantion and Other Essays in the Philosophy of Science, The Free Press, New York. Hempel, C. G. (1968): „Maximal Specifity and Lawlikeness in Probabilistic Explanation", Philosophy of Science 35, S. 116-133. Hempel, C. G. (1977): „Nachwort 1976: Neuere Ideen zu den Problemen der statistischen Erklärung", in: Hempel, C. G., Aspekte wissenschaftlicher Erklärung (dt. Übersetzung von Hempel 1965 inkl. Nachwort), W. de Gruyter, Berlin, S.98-123.
30
Gerhard Schurz
Reichenbach, H. (1956): The Direction of Time, Univ. of California Press, Berkeley. Salmon, W. C. (1971): Statistical Explanation and Statistical Relevance. With Contributions by R. C. Jeffrey and J. G. Greeno, Univ. of Pittsburgh Press, London. Salmon, W. C. (1984): Scientific Explanation and the Causal Structure of the World, Princeton Univ. Press, Princeton. Schurz, G. (1983): Wissenschaftliche Erklärung. Ansätze zu einer logisch-pragmatischen Wissenschaftstheorie, dbv-Verlag für die TU Graz, Graz. Stegmüller, W. (1969): Wissenschaftliche Erklärung und Begründung, Probleme und Resultate der Wissenschaftstheorie und Analytischen Philosophie, Band I (2. erweiterte Auflage 1983), Springer, Berlin. Stegmüller W. (1973): Personelle und Statistische Wahrscheinlichkeit, Probleme und Resultate der Wissenschaftstheorie und Analytischen Philosophie, Band IV, 2. Teilband (Studienausgabe Teil E), Springer, Berlin.
Bas C. van Fraassen Die Pragmatik des Erklärens Warum-Fragen und ihre Antworten Teil I: Einführung: Was ist eine Theorie der Erklärung? * Pierre Duhem hatte Erklärungen von Beschreibungen unterschieden. Die ersteren seien Aufgabe der Metaphysik, die letzteren der Wissenschaft. Sein Argument hierfür war einfach und klar: nach Erklärungen zu fragen bedeute, nach etwas zu fragen, das uns Wissenschaft weder geben kann noch zu geben versucht. Spätere Philosophen haben seiner Schlußfolgerung widersprochen: Erklärungen seien doch eine jener Errungenschaften, die wir uns von Wissenschaften erwarten. Daß eine wissenschaftliche Theorie diese oder jene Tatsache erklärt, sei eine ihrer Tugenden und ein Grund, sie anzunehmen; und wenn sie andererseits einige Tatsachen nicht zu erklären imstande ist, so könne dies ein schwerwiegender Einwand gegen sie sein. Dieser Widerspruch zu Duhem kann offenbar in zwei Formen auftreten. Die erste besteht darin, Duhems Kriterien für Erklärung als zu streng zu bezeichnen; jede Wissenschaft, die gut genug beschreibt, würde α fortiori erklären. Die zweite Form des Widerspruchs besteht darin, (mit Duhem) darauf zu insistieren, daß Erklärung in der Tat etwas Besonderes, über Beschreibungen Hinausgehendes wäre, das jedoch (im Gegen* Es ist mir Freude und Ehre, zur deutschen Übersetzung von Kap. 5, Abschnitt 4 und 5 meines Buches The Scientific Image eine Einführung zu schreiben. Dank sagen möchte ich dem Herausgeber und Übersetzer des Buches, Dr. Gerhard Schurz, weiters der National Science Foundation für ihre Unterstützung, sowie schließlich all jenen Philosophen, die mit mir seit der Erscheinung meines Buches über Erklärung diskutiert haben, in erster Linie Clark Glymour, Philip Kitcher, Karel Lambert und Wesley Salmon. Weitere Diskussionen finden sich indem im Journal of Philosophy 2,1985, S. 632-654 abgedruckten Bericht über das Symposium der American Philosophical Association zu Wesley Salmons neuem Buch Scientific Explanation and the Causal Structure of the World (1984) (s. hierzu auch Anm. 9) sowie in Churchland/Hooker (Hg., 1985).
32
Bas van Fraassen
satz zu Duhem) von der Wissenschaft durchaus geleistet werden kann. Dabei ist es für unsere Zwecke nicht nötig, Duhems Kriterien für Erklärungen exakt zu rekonstruieren; es genügt, klar das Dilemma zu sehen, vor das er uns stellt. Eine Theorie der Erklärung soll darstellen, was unter einer Erklärung zu verstehen ist und wie man Erklärungen bewerten soll. Wenn die Theorie hinreichende Tragfähigkeit besitzt, so muß sie auf dieses Dilemma eine Antwort liefern. Grob betrachtet muß sie hierzu eine von folgenden zwei Möglichkeiten wählen: Sie kann die These enthalten, daß Erklärung tatsächlich bloß eine Art von Beschreibung ist, und daß es für eine gute Beschreibung ausreicht, jene Tatsachen zu beschreiben, die die Wissenschaft beschreibt. Oder sie kann dagegen behaupten, daß es immer möglich ist, die Aufgabe der Beschreibung vollständig zu erfüllen, ohne daß noch irgendwelche wissenschaftlichen Erklärungen vorlägen. Beide Alternativen scheinen aber schwer akzeptabel zu sein. Die erste Alternative wird der Komplexität des „warum?" und des „weil" - die Kodewörter für Erklärungen sicherlich nicht gerecht. Und die zweite Alternative scheint Wissenschaft genau in der von Duhem verworfenen Weise metaphysisch zu machen und im Widerspruch zu sehr verbreiteten empiristischen Ansichten zu stehen. Beide Alternativen werde ich im folgenden kritisieren. Das Dilemma muß, meiner Meinung nach, umgangen werden. Erklärung ist nicht Beschreibung, nicht einmal Beschreibung einer besonderen Art. Und dennoch ist jede einzelne Erklärung nur eine Beschreibung, und sie enthält nichts von dem, was Empiristen ablehnen. Diese Kombination ist logisch möglich; und zwar, wenn eine Erklärung etwas in gewisser Hinsicht Relatives ist (historisch relativ, bzw. kontext-abhängig). Eine logische Analogie hierfür wäre folgendes: eine Frau zu sein ist sicherlich etwas anderes als eine Tochter zu sein; dennoch ist jede Frau eine Tochter und umgekehrt jede Tochter eine Frau (falls Sie Bedenken wegen Eva haben, schränken Sie dieses Beispiel entsprechend ein, dies macht keinen Verlust). Diese Sichtweise macht Erklärungen zu einem Gegenstand der Pragmatik, denn historische und kontextuelle Faktoren liegen außerhalb des syntaktischen und semantischen Bereichs. Duhems Dilemma erfolgreich gegenüberzutreten ist natür-
Die Pragmatik
des Erklärens
33
lieh nicht die einzige Anforderung an eine Theorie der Erklärung. In der folgenden kritischen Diskussion anderer Ansätze werde ich eine ganze Reihe von Schwierigkeiten und Anomalien darstellen, die mit dem Erklärungsproblem verbunden sind. Sie lassen sich hauptsächlich zusammenfassen als Asymmetrien (die Erklärungsrelation stellt sich als nicht invariant heraus gegenüber Äquivalenzbeziehungen, die von der Wissenschaft als gleichwertig angesehen werden) und Zurückweisungen (gewisse Erklärungsansprüche werden zurückgewiesen, weil hier keine Erklärung möglich ist, aus bestimmten Gründen, die adäquat zu beschreiben sind). Wie ich im folgenden zu zeigen versuche, lassen sich diese Probleme der Asymmetrien und Zurückweisungen in einem pragmatischen Erklärungsansatz in befriedigender Weise behandeln. Darüberhinausgehend gibt es die Probleme der Bewertung von Erklärung: aus welchen Gründen bewerten wir genuine Erklärungen als gut, besser oder am besten? Diese Frage betrachte ich als unabhängig von den Hauptschwierigkeiten und kann hierzu nur teilweise allgemeine Kriterien vorschlagen. Hinsichtlich des Problems der Bewertung von Erklärungen qua Erklärungen betrachte ich daher meinen Ansatz (ebenso wie alle anderen Ansätze) noch als beträchtlich unvollständig. /./. Die Sprache der Erklärung Einleitend müssen wir das, was unsere Erklärungstheorie erfassen soll, präzise eingrenzen. Man sagt, daß Newton die Gezeiten erklärt habe, daß Newtons Theorie der Gravitation die Gezeiten erkläre, daß die Gravitation die Gezeiten erkläre, usw. Wir müssen, um unseren Sprachgebrauch zu regeln, eine Wahl unter diesen Sprechweisen treffen. Ich schlage die folgende vor: eine Theorie erklärt eine Tatsache Ε genau dann, wenn es eine Tatsache F gibt, die Ε in oder relativ zu dieser Theorie erklärt. Beispielsweise erklärt die Physik, warum Ε - mit Ε wie folgt: Wenn Wasser von elektrischem Strom durchflossen wird, wird Wasserstoff und Sauerstoff freigesetzt. Wenn wir fragen, welche Erklärung uns die Physik hierfür gibt, erhalten wir als Antwort F- mit F wie folgt: Wasser ist eine chemische Verbindung von Wasserstoff und Sauerstoff. Wenn wir nach einer näheren Be-
34
Bas van Fraassen
gründung von „ F weil F " fragen, wird die Antwort die hierfür relevanten Teile physikalischer Theorie anführen. So können wir also sagen, daß die Erklärung von Ε durch F i n oder relativ zu dieser Theorie stattfindet, und daß die Theorie ihrerseits Ε genau dann erklärt, wenn eine solche Tatsache Fangeführt werden kann. Man könnte eventuell behaupten, daß eine derartige Sprechweise Äquivokationen und/oder Ellipsen1 beinhaltet. Aber wie auch immer ein Erklärungsansatz dazu steht, in jedem Fall muß er in der Lage sein, die oben gewählte Sprechweise in einem klaren Sinn zu rekonstruieren, denn es ist die natürliche sprachliche Form von unzähligen Erklärungsbeispielen. Eine weitere logische Frage muß aufgeworfen werden: was wird, wenn man von einer Erklärung spricht, vorausgesetzt? Sowohl wenn wir behaupten, wie wenn wir veraeinen, daß eine Theorie eine Tatsache Ε erklärt, setzen wir offenbar voraus, daß die Tatsache Ε auch wirklich stattfand - wir setzen also die Wahrheit der Behauptung „ F " voraus. Noch wichtiger ist es zu fragen, was von der erklärenden Theorie vorausgesetzt wird. Betrachten wir das folgende Argument: Ziel der Wissenschaft ist es, Erklärungen zu finden. Nichts ist eine Erklärung, solange die zugrundeliegende Theorie nicht wahr ist. Daher: Ziel der Wissenschaft ist es, wahre Theorien zu finden. Dieses scheinbar harmlose Argument hört auf, harmlos zu sein, wenn wir uns die Debatte über wissenschaftlichen Realismus in Erinnerung rufen. Denn es sind ja genau die wissenschaftlichen Realisten, die die Konklusion des Arguments akzeptieren. Ihre Opponenten - Empiristen und Antirealisten verschiedenster Art - charakterisieren dagegen die Ziele der Wissenschaft anders, nämlich als die Suche nach Theorien mit gewissen Leistungen, welche nur in einigen abgeschwächten Hinsichten Wahrheitsforderungen enthalten - ζ. B. empirische Adä1
Mit „Ellipsen" ist gemäß Hempel (1965, S.415) die Verwendung von „F erklärt Ε" als Kurzform für „Zusammen mit (der stillschweigend angenommenen Theorie) Τ erklärt F E" gemeint.
Die Pragmatik des Erklärens
35
quatheit, Wahrheit über das Beobachtbare, oder sogar noch weniger. Duhem wies natürlich die erste Prämisse des Arguments zurück. Wenn wir der verbreiteten Ablehnung seiner Meinung zustimmen, d. h. die erste Prämisse akzeptieren, so müssen w i r nachdem wir dem empiristischen Standpunkt zugeneigt sind die zweite Prämisse zurückweisen. Dies ist nicht so problematisch, denn der faktische Sprachgebrauch (im Unterschied zu manchen philosophischen Explikationen) stützt die zweite Prämisse keineswegs. Wir behaupten ohne Umschweife, daß Newtons Theorie die Gezeiten erklärt, und fügen hinzu, daß sie jedoch viele von der Einsteinschen Theorie erklärten Tatsachen nicht erklärt, ja nicht einmal mit sich vereinbaren kann. Wenn wir aber, eben aus dem letzteren Grund, Newtons Theorie nicht für wahr halten (was wir vernünftigerweise auch tun), so würde diese Behauptung überhaupt keinen Sinn machen, sofern wir nicht annehmen, daß eine Theorie, auch ohne wahr zu sein, etwas erklären kann. Natürlich würde man nicht behaupten, daß jemand eine Erklärung hat, wenn man nicht auch glaubt, daß er eine akzeptierbare Theorie hat, die etwas erklärt. Doch dies zeigt uns nur die unterschiedliche Bedeutung des Ausdrucks „eine Erklärung haben". Wenn ich verneine, daß jemand eine Erklärung hat, so kann ich das aus zwei Arten von Gründen tun: weil er nur Theorien hat, die nicht erklären, oder weil er keine Theorien hat, die ich als akzeptierbar betrachte. Zu einem analogen Argument führt auch eine andere, damit zusammenhängende philosophische Frage. Einer typischen Behauptung der philosophischen Realisten zufolge gibt uns das Ausmaß, in dem eine Theorie Dinge zu erklären vermag, zugleich auch solche Gründe für die Akzeptierung der Theorie zu Hand, welche über den bloß deskriptiven und prognostischen Erfolg der Theorie hinausgehen. Der Erklärungserfolg einer Theorie kann allerdings nur dann als ein solcher Grund für ihre Akzeptierung anerkannt werden, wenn dieser Erklärungserfolg feststellbar ist, ohne daß dabei die Akzeptierung der Theorie und somit α fortiori ein Urteil über die Wahrheit der Theorie vorausgesetzt wurde. Daher ist es hier ebenfalls erforderlich, daß die Behauptung „Theorie Τ erklärt is" nicht schon impliziert bzw. voraussetzt, daß Τ wahr ist.
36
Bas van Fraassen
Schließlich wird unser Argument auch durch die Art und Weise gestützt, in der Wissenschaftler in faktischen Diskursen die Vor- und Nachteile ihrer Theorien betrachten. So sagte ζ. B. Lavoisier über die Phlogiston-Theorie (welche seiner Ansicht nach falsch war), daß sie zu vage war und daher: „s'adapte ä toutes les explications dans lesquelles on veut le faire entrer" 2 (Lavoisier 1862, S. 640).3 Und Darwin schrieb: „It can hardly be supposed that a false theory would explain, in so satisfactory manner as does the theory of natural selection, the several large classes of facts above specified" 4 (Darwin, 1962, 6. Aufl., S. 476). Diese Argumente ergeben nur Sinn, wenn es als zumindest logisch möglich angesehen wird, daß auch eine falsche Theorie erklären kann. 1.2. Zurückweisungen und Asymmetrien von Erklärung Die jüngere Geschichte unseres Themas begann 1948 mit Hempel und Oppenheims „Studies in the Logic of Explanation" (Hempel/Oppenheim 1948). In den seither vergangenen 4 Jahrzehnten suchten die früheren Ansätze zunächst nach einer einfachen Gleichsetzung von Erklärungen mit irgendeiner Art von Beschreibungen. Wichtiger als diese Versuche selbst sind jedoch die Beispiele, die gegen sie vorgebracht wurden. Sie bringen nämlich sehr klar gewisse logische Charakteristika zum Ausdruck, denen jede Theorie der Erklärung gerecht werden muß. 1.2.1. Hempel: gute Glaubensgründe 5 1966 gab Hempel einen kurzen Überblick über seine Erklä-
2
3
4
5
[Übers, d. Hrsg.:] „Sie paßt sich allen Erklärungen an, in die man sie einbringen möchte" (d. h., mit ihr läßt sich alles erklären). Ich verdanke diesen und andere historische Hinweise meinem früheren Studenten Paul Thagard. [Übers, d. Hrsg.:] „Es kann kaum angenommen werden, daß eine falsche Theorie die oben angeführten umfangreichen Tatbestände in so befriedigender Weise erklären könnte, wie dies bei der Theorie der natürlichen Auslese der Fall ist. [Anm. d. Hrsg.:] Mit „Glauben" ist hier - dem englischen Ausdruck „belief entsprechend - nur Glauben im kognitiv-rationalen Sinn gemeint, d. h. die Akzeptierung einer Proposition als (mehr oder minder) wahrscheinlich (vgl. auch Anm. 1 zum Aufsatz von Gärdenfors).
Die Pragmatik des Erklärens
37
rungstheorie, in dem er folgende beiden Kriterien in den Mittelpunkt stellte:6 1. erklärende Relevanz: „Die als Erklärung angeführte Information muß gute Gründe für unseren Glauben liefern, daß das (zu erklärende) Phänomen tatsächlich eingetreten ist bzw. eintritt." 2. Überprüfbarkeit: „Die Aussagen, aus denen eine wissenschaftliche Erklärung besteht, müssen empirisch überprüfbar sein." Wie aus dem ersten Kriterium klar folgt, besteht eine Erklärung in der Bereitstellung einer gewissen Information - und zwar einer relevanten Information, wobei das Kriterium angibt, was als relevante Information anzusehen ist. Das zweite Kriterium führt eine weitere Eigenschaft an, die diese Information haben muß, nämlich ihre empirische Überprüfbarkeit. Ein Wissen von der Wahrheit dieser Information wird also nicht vorausgesetzt. Vielmehr wird „Information" hier in einer Bedeutung gebraucht, die nicht impliziert, daß eine Information wahr sein muß. Ein drittes, 1966 nicht explizit angeführtes Kriterium, das aber Hempel-Lesern vielleicht noch bekannter sein dürfte als die beiden ersten, ist folgendes: 3. Berufung auf Gesetze: die angeführte Information muß (mutmaßliche) Naturgesetze enthalten. Dieses Kriterium setzt voraus, daß die Wissenschaft mutmaßliche Naturgesetze enthält bzw. beschreibt - sofern es Erklärungen gibt, die ausschließlich wissenschaftlich fundiert sind. Sicher gibt es in der Wissenschaft Prinzipien, die gemeinhin als „Gesetze" bezeichnet werden, und Kriterium 3 setzt in der Praxis nicht unbedingt eine philosophische Theorie von Gesetzen voraus. Hempel selbst hat in seiner Arbeit von 1966 daraufhingewiesen, daß sein Modell weder hinreichende noch notwendige Bedingungen für Erklärung liefert. Die Gründe für dieses Zugeständnis sind in einer Reihe von verwirrenden Beispielen zu 6
C. G. Hempel (1966), S. 48 f.; für einige der Gegenbeispiele vgl. S. Bromberger (1966).
38
Bas van Fraassen
suchen, insbesondere jenen, die von Michael Scriven und Sylvain Bromberger stammen und zu jener Zeit bereits zum philosophischen Allgemeingut gehörten. Erstens wird mit dem Anführen guter Glaubensgründe nicht jedesmal auch etwas erklärt. Am deutlichsten wird das in den Beispielen der Erklärungsasymmetrie. Dabei handelt es sich um Fälle, in denen zwei Propositionen (relativ zu einer akzeptierten Hintergrundtheorie) strikt äquivalent sind und man mithilfe der einen erklären kann, warum die andere der Fall ist, aber nicht umgekehrt. Bereits bei Aristoteles finden sich solche Beispiele {Zweite Analytik, Buch I, Kap. 13). Hempel erwähnt als Beispiel das Phänomen der Rotverschiebung: nach der gängigen Physik entfernen sich die Galaxien von uns genau dann, wenn das von ihnen zu uns gesandte Licht zum roten Ende des Spektrums hin verschoben ist. Nun kann man zwar die Tatsache, daß sich die Galaxien von uns entfernen, als den Erklärungsgrund für die Rotverschiebung anführen, es wäre aber kaum sinnvoll zu sagen, die Rotverschiebung sei der Erklärungsgrund dafür, daß sich die Galaxien von uns entfernen. Ein etwas einfacheres Beispiel liefert uns das Barometer: wenn wir uns der vereinfachten Hypothese anschließen, daß der Barometerstand genau dann fallt, wenn ein Sturm aufzieht, so kann das Fallen des Barometerstandes deshalb doch noch nicht die Tatsache erklären, daß ein Sturm aufzieht (sondern umgekehrt: das Aufkommen des Sturms ist die Erklärung für das Fallen des Barometerstandes). In beiden Beispielen aber liefert jede der beiden äquivalenten Aussagen jeweils gute Gründe für die andere. Das Fahnenmast-Beispiel ist vielleicht das bekannteste Beispiel für eine Asymmetrie: nehmen wir an, ein 100 Fuß hoher Fahnenmast wirft einen 75 Fuß langen Schatten. Warum der Schatten gerade so lang ist, können wir erklären, indem wir den Höhenwinkel der Sonne feststellen und uns auf die anerkannte Theorie von der geradlinigen Ausbreitung des Lichts berufen. Denn ist dieser Winkel und die Höhe des Mastes gegeben, so können wir mithilfe trigonometrischer Berechnungen die Basislänge des rechtwinkeligen Dreiecks ableiten, das der Fahnenmast mit dem Lichtstrahl und dem Schatten bildet. Ebenso können wir aber auch die Länge des Mastes aus der Länge des Schattens und dem Höhenwinkel ableiten. Wenn uns jedoch jemand fragt,
Die Pragmatik des Erklärens
39
warum der Mast 100 Fuß hoch sei, so könnten wir diese Tatsache nicht dadurch erklären, daß wir antworten: „Weil er einen Schatten von 75 Fuß Länge wirft." Mit dieser Antwort könnten wir höchstens erklären, wie wir zu der Behauptung gelangten, daß der Fahnenmast 100 Fuß hoch sei, bzw. wie wir diese Behauptung verifizieren könnten. Zweitens werden nicht bei jeder Erklärung auch gute Gründe angeführt. Das berühmte Beispiel dafür ist das Beispiel der progressiven Paralyse. Nur wer unbehandelte latente Syphilis hatte, kann an progressiver Paralyse erkranken. Würde jemand, der progressive Paralyse hat, seinen Arzt nach einer Erklärung für diese Krankheit fragen, so würde der Arzt sicherlich antworten: „Weil sie latente Syphilis hatten, die nicht behandelt wurde." Doch tatsächlich führt nur ein sehr geringer Prozentsatz der Fälle von unbehandelter latenter Syphilis zu progressiver Paralyse. Wenn man also vermutet, daß eine Person Syphilis hat, so wäre es zwar vernünftig, sie davor zu warnen, daß unbehandelte Syphilis möglicherweise progressive Paralyse zur Folge hat; nicht vernünftig wäre es aber, schon zu erwarten, daß diese Person tatsächlich an Syphilis erkranken wird. Denn die Bedingung der hohen Wahrscheinlichkeit - welche in Hempels Kriterium der guten Glaubensgründe verlangt wird - ist hier nicht erfüllt. Es könnte erwidert werden, daß der Arzt in diesem Fall lediglich eine partielle Erklärung gegeben hatte und daß es weitere relevante Faktoren für progressive Paralyse gibt, die die Medizin möglicherweise noch entdecken wird. Diese Erwiderung basiert auf dem Glauben, daß die Welt, zumindest im makroskopischen Bereich, deterministisch oder wenigstens fast deterministisch ist. Dasselbe Argument kann jedoch auch mit Beispielen gestützt werden, in denen wir nicht annehmen, daß es noch zusätzliche bisher unbekannte Erklärungsgründe gibt - nicht einmal prinzipiell. Ein Beispiel: Die Halbwertszeit von Uran 2 3 8 beträgt 4,5.10 9 Jahre. Folglich ist die Wahrscheinlichkeit, daß eine hinreichend kleine Probe von Uran innerhalb eines bestimmten kleinen Zeitintervalls radioaktive Strahlen emittiert, sehr gering. Angenommen aber, es geschieht doch. Dann halten wir trotzdem daran fest, daß die Atomphysik eine Erklärung dafür liefern kann, indem sie nämlich anführt, daß es sich bei
40
Bas van Fraassen
dieser Substanz um Uran handelte und daß Uran aufgrund seiner charakteristischen Atomstruktur spontan zerfallen kann. Tatsächlich gibt es in der Atomphysik viele Ereignisse mit sehr niedriger Wahrscheinlichkeit, die durch Bezug auf die Struktur der beteiligten Atome erklärt werden. Und obwohl es Philosophen und Physiker gibt (unter ihnen Einstein mit seinem Diktum „Gott würfelt nicht"), die die derzeitige Physik aus diesem Grund für unvollständig halten, so ist doch die Frage, ob die Welt letztlich deterministisch sei oder nicht, nach vorherrschender Meinung kontingent. Was das dritte Kriterium betrifft, so kann man seine Notwendigkeit nicht so leicht in Frage stellen, ohne über eine Theorie zu verfügen, die uns sagt, was Naturgesetze sind. Eine empiristische Theorie der Wissenschaft könnte implizieren, daß die Wissenschaft überhaupt keine mutmaßlichen Gesetze enthält und dies ζ. B. damit begründen, daß Gesetze Notwendigkeiten behaupten, die Wissenschaft jedoch niemals Notwendigkeiten der Natur beschreibt, sondern nur, was wirklich der Fall ist. Diesem umfangreichen Thema können wir uns hier nicht widmen. Es gibt jedoch ein bekanntes und von dieser Debatte unabhängiges Beispiel, das auf Hilary Putnam zurückgeht und die Unzulänglichkeit des dritten Kriteriums klar belegt. Stellen Sie sich vor: Um Mitternacht war im Mädchenschlafzimmer der Professor für Moralphilosophie - Warum? Die Antwort ist, daß er um χ Mikrosekunden vor Mitternacht dort war (Anfangsbedingung) und sich nichts schneller fortbewegen kann als Licht (Gesetz), wobei χ so klein ist, daß nichts, das um x vor Mitternacht in dem Raum war, den Raum bis Mitternacht hätte verlassen können, ohne sich schneller als das Licht fortzubewegen. Dieses schon etwas betagte Beispiel mag vielleicht altmodisch klingen, es zeigt aber sehr deutlich, daß bloßes Vorkommen und relevanter Gebrauch von Gesetzen nicht notwendigerweise schon eine Erklärung ergeben.
Die Pragmatik des Erklärens
41
1.2.2. Salmons frühe Theorie: statistisch relevante Faktoren Wesley Salmon betonte ein ganz anderes Problem der Hempelschen Theorie: Die Explikation von „relevant" ist nicht einmal logisch zufriedenstellend. Eine Information, die gute Glaubensgründe liefert, kann nämlich auch deshalb nicht erklärend sein, weil sie nicht in der richtigen Weise relevant ist. Angenommen, man versucht, Jones rasche Genesung von einer gewöhnlichen Erkältung durch die Tatsache zu erklären, daß er hohe Dosen von Vitamin C eingenommen hat. Wir können die Erklärung ergänzen, indem wir die wahre Theorie anführen, daß die meisten Personen, die an Erkältung leiden und Vitamin C einnehmen, innerhalb einer Woche genesen. Nach Salmon ist das deshalb keine (gute) Erklärung, weil auch die meisten Personen, die an Erkältung leiden und kein Vitamin C einnehmen, innerhalb einer Woche genesen. Wie Salmon deutlich macht, ist das Einnehmen von Vitamin C kein statistisch relevanter Faktor: die Wahrscheinlichkeit zu genesen unter der Bedingung der Einnahme von Vitamin C ist die gleiche wie die, überhaupt zu genesen (s. Salmon 1971, S.33f). Demgemäß hat Salmon damals folgende Alternative zu Hempels Modell vorgeschlagen: Eine Erklärung ist eine Aufzählung statistisch relevanter Faktoren. Einige der Vorzüge dieser ersten Salmonschen Theorie der Erklärung sind leicht zu erkennen. Theorien können darin differieren, welche Faktoren als statistisch relevant angesehen werden, und folglich ist es sinnvoll zu sagen, eine Tatsache erkläre eine andere relativ zu einer bestimmten Theorie. Die Bewertung von Erklärungen ergibt sich direkt: es ist besser, eine vollständigere Aufzählung von statistisch relevanten Faktoren zu liefern, und sobald alle statistisch relevanten Faktoren aufgezählt sind, ist die Erklärung so vollständig, wie sie nur sein kann. Deskriptive Adäquatheit wird in der Tat gefordert, jedoch nicht notwendigerweise eine vollständige Beschreibung des vorliegenden Phänomens, sondern lediglich eine Beschreibung jener Faktoren, die für die zu erklärende Tatsache genuin relevant sind. Schließlich hat die statistische Relevanz auch Gradabstufungen: wir können nach dem Grad der Korrelation zwischen dem erklärten Faktor und dem erklärenden Faktor fragen. Vermutlich trägt
42
Bas van Fraassen
ein höherer Grad an Korrelation zu einer besseren Erklärung bei. Man beachte jedoch, daß Salmon nicht positive Korrelation verlangt: die angeführte Information muß die zu erklärende Tatsache nicht wahrscheinlich machen, nicht einmal wahrscheinlicher, als sie es zuvor war. Salmon fordert lediglich, daß sich die Wahrscheinlichkeit der zu erklärenden Tatsache ändert. Daß wir von einer Erklärung nicht verlangen dürfen, daß sie etwas wahrscheinlich macht, haben wir schon an dem Beispiel der progressiven Paralyse gesehen. Hier aber macht die Vorgeschichte latenter unbehandelter Syphilis progressive Paralyse wahrscheinlicher als sonst - soll nicht einmal das verlangt werden? Salmon sagte nein, aufgrund des folgenden Beispiels: Die Zerfallswahrscheinlichkeit von Polonium 214 ist wesentlich höher als die von Uran 2 3 8 . Angenommen nun, ein mengengleiches Gemisch von Uran 2 3 8 - und Polonium 214 -Atomen bringt den Geigerzähler im Zeitintervall [t, t + m] zum Klicken. Das bedeutet, daß eines der Atome zerfallen ist. Warum ist das geschehen? Angeommen es war ein Uran 2 3 8 -Atom. Dann lautet die korrekte Antwort: weil es ein Uran 2 3 8 -Atom war - obwohl die Zerfallswahrscheinlichkeit relativ zu dem vorgängigen Wissen, daß das Atom zu dem Gemisch gehörte, viel höher war als relativ zu dem nunmehrigen Wissen, daß es ein Uran 2 3 8 -Atom ist. Das Problem bei diesem Salmonschen Argument ist jedoch folgendes: wir können nach Salmons Kriterium nicht nur erklären, warum ein Zerfall stattgefunden hat, sondern auch warum er, sagen wir exakt in der Mitte zwischen t und t + m stattgefunden hat. Denn die Information der Antwort ist für dieses Ereignis statistisch relevant. Doch würden wir nicht sagen, daß die Atomphysik gerade diese Art Tatsachen unerklärt läßt? Hinter diesem Einwand steckt folgende Idee: die in der Antwort Α angeführte Information ist zwar statistisch relevant für das Eintreten des Ereignisses um t + (m/2), sie favorisiert diesen Zeitpunkt jedoch nicht gegenüber den anderen Zeitpunkten des fraglichen Intervalls. Sei Ex — (ein Zerfall hat zu variabler Zeit i stattgefunden) und E t = (ein Zerfall hat zum Zeitpunkt 1 stattgefunden). Dann sollen wir nach Salmon Prob (Εx) mit Prob (Ε JA) vergleichen (mit „Prob" für „Wahrscheinlichkeit" bzw. „probability"). Unserer Intuition folgend vergleichen
Die Pragmatik des Erklärens
43
wir jedoch auch Prob (EJA) für andere Zeitpunkte i mit Prob(E1/A). Dies legt nahe, daß bloße statistische Relevanz für Erklärung nicht genug ist. Nancy Cartwright (1979) hat eine Reihe von Beispielen vorgebracht, um zu zeigen, daß Salmons Kriterium der statistischen Relevanz weder notwendige noch hinreichende Bedingungen für Erklärung liefert. Zunächst zu den hinreichenden Bedingungen: Angenommen, ich besprühe Giftsumach (ein Anarkadiengewächs) mit einem Entlaubungsmittel, das zu 90 Prozent wirksam ist. Dann kann die Frage „Warum ist diese Giftsumachpflanze jetzt tot?" korrekt so beantwortet werden: „Weil sie mit einem Entlaubungsmittel besprüht worden ist." Etwa 10 Prozent der Pflanzen sind aber noch am Leben, und auch für sie gilt (ebenso wie für die toten Pflanzen), daß die (unbedingte) Wahrscheinlichkeit, noch am Leben zu sein, nicht die gleiche ist, wie die Wahrscheinlichkeit, noch am Leben zu sein, unter der Bedingung, daß sie besprüht wurden. (Salmons Bedingung ist also erfüllt.) Dennoch kann die Frage „Warum ist diese Pflanze noch am Leben?" nicht korrekt dadurch beantwortet werden, daß gesagt wird: „Weil sie mit einem Entlaubungsmittel besprüht worden ist." Auch ist Salmons Bedingung nicht notwendig. Nehmen wir an, als eine medizinische Fiktion, daß progressive Paralyse entweder eine Folge von Syphilis oder von Epilepsie ist, jedoch von nichts anderem, und sei die Wahrscheinlichkeit von progressiver Paralyse, gegeben entweder Syphilis oder Epilepsie, gleich 0,1. Nehmen wir außerdem an, daß Jones Mitglied einer Familie ist, in der jeder entweder Syphilis oder Epilepsie hat (glücklicherweise aber keiner beides), und daß Jones progressive Paralyse hat. Warum bekam er diese Krankheit? Sicher ist die beste Antwort darauf entweder „Weil er Syphilis hatte" oder „Weil er Epilepsie hatte" - je nachdem, welche der beiden Aussagen wahr ist. Doch aufgrund der uns zuvor bekannten Informationen steht die Wahrscheinlichkeit dafür, daß Jones progressive Paralyse bekommt, bereits mit 0,1 fest, und sie ändert sich nicht, wenn wir angenommen zusätzlich erfahren, daß Jones Syphilis hatte. Dieses Beispiel ist dem Beispiel von den Uranund Polonium-Atomen ziemlich ähnlich, außer daß die Wahrscheinlichkeiten hier gleich geblieben sind (Salmons Bedingung
44
Bas van Fraassen
ist also nicht erfüllt). Und dennoch würden wir doch sagen, daß in diesem Fall die Erklärung der progressiven Paralyse die Tatsache der Syphilis ist. 1.2.3. Klassifikation der Schwierigkeiten Sowohl Hempels als auch Salmons frühe Erklärungstheorie scheiterten an einer Reihe widerspenstiger Beispiele, die zusammengenommen wichtige und verwirrende logische Charakteristika von Erklärung erkennen lassen. Zuallererst müssen wir die Berechtigung der Zurückweisung von Forderungen nach Erklärung akzeptieren. Aus keiner Erklärungstheorie darf folgen, daß eine solche Zurückweisung stets deskriptive Inadäquatheit oder Unvollständigkeit enthüllt. Es gibt mehrere und verschiedene Falltypen, die das zeigen. Den ersten habe ich in dem Abschnitt über Salmon erwähnt: jeder Faktor, der statistisch relevant für den Zerfall eines Atoms ist, ist automatisch statistisch relevant für den Zerfall dieses Atoms innerhalb eines bestimmten Zeitintervalls. Aber unserer intuitiven Einstellung zur Quantenmechanik zufolge können wir aufgrund der Atomstruktur zwar erklären, warum ein Atom bestimmter Sorte zerfallt, nicht aber, warum es früher oder später zerfällt. (Es gibt Spannungen in diesem Beispiel, die nicht gelöst werden können, bevor wir nicht den Begriff der Kontrastklasse eingeführt haben.) Dennoch bedeutet das nicht, daß wir die Theorie der Quantenmechanik deshalb unvollständig nennen. Ein anderes Beispiel für Zurückweisung wurde wiederholt von Adolf Grünbaum hervorgehoben: die Frage der Aristoteliker, warum ein kräftefreier Körper seine Geschwindigkeit beibehält, wird von der modernen Wissenschaft legitimerweise zurückgewiesen. Thomas Kuhn schließlich hat diese Art von Beispielen vervielfacht: wie er im Detail zeigte, gibt es eine thematisch umfassende Beispielsmenge für Erklärungen, die zu einem historischen Zeitpunkt legitimerweise zurückgewiesen wurden, zu einem anderen jedoch nicht (s. Kuhn 1970, S. 107 ff). Eine zweite und ganz andere Art von Schwierigkeit liegt in den Asymmetrien der Erklärung, wie wir sie in den Beispielen des Barometers, der Rotverschiebung und des Fahnenmastes illustriert haben. Es ist sogar möglich, Zurückweisung und
Die Pragmatik des Erklärens
45
Asymmetrie in einem einzigen Beispiel zu kombinieren. Zum Beispiel: Die charakteristische Atomstruktur und das charakteristische Spektrum (des bei der Anregung chemischer Elemente emittierten Lichts) stehen in einer exakten eins-zu-eins Beziehung. Die Frage, warum ζ. B. Wasserstoff das und das charakteristische Spektrum hat, kann durch die Beschreibung seiner Atomstruktur beantwortet werden. Doch die Frage, warum Wasserstoff diese Atomstruktur hat, ist sinnlos. Sie wird mehr oder weniger auf die gleiche Art zurückgewiesen, wie weiter oben die ähnliche Frage über kräftefreie Bewegung. Zurückweisungen und Asymmetrien werden durch verwirrende und paradox wirkende Beispiele illustriert. Dies ist ein sicheres Zeichen dafür, daß wir einige logische oder sogar grammatikalische Aspekte unseres sprachlichen Gebrauchs von Erkärungen nicht begreifen oder nicht beachten. Irgend etwas muß an der bloßen Form der Modelle, die wir betrachtet haben, falsch sein, wenn sie bereits auf dieser elementaren Stufe in Schwierigkeiten geraten. 1.3. Schritte in Richtung einer adäquaten Theorie Es gibt zwei Zugänge zum Erklärungsbegriff, die - obwohl keiner von ihnen an sich adäquat ist - uns doch den entscheidenden Anhaltspunkt liefern, um mit der Konstruktion einer adäquaten Theorie zu beginnen: der Zugang über den Kausalitätsbegriff und der Zugang über die Logik der Warum-Fragen. Ich versuche, dies zu zeigen, indem ich die beiden Zugänge zunächst kritisch vorstelle, um dann aufzuzeigen, wie bestimmte ihrer Charakteristika mit den Hauptschwierigkeiten von Erklärung verknüpft sind. 1.3.1. Erklärung und Kausalstruktur Seine frühere Theorie, wonach Erklärung lediglich eine Aufzählung statistisch relevanter Faktoren sei, hat Wesley Salmon mit den folgenden Worten aufgegeben: Was bietet eine Erklärung über die Folgerungskapazität von Voraussage und Retrodiktion hinaus... ? Sie liefert Wissen über den Mechanismus der Erzeugung und Ausbreitung von Strukturen in der Welt. Das geht um einiges über das bloße
46
Bas van -Fraassen
Erkennen von Regelmäßigkeiten und der Möglichkeit, einzelne Phänomene darunter zu subsumieren, hinaus. (Salmon 1978, S. 29 f - Übers, d. Hrsg.). Seit damals hat Salmon seine neue Theorie zu einem Buch ausgearbeitet, Scientific Explanation and the Causal Structure of the World (1984), welches erst kürzlich Thema eines Symposiums war. 7 Salmons neue Theorie der Erklärung besagt folgendes: (a) die Wissenschaft liefert uns Verständnis für ein Phänomen genau in dem Ausmaß, in dem sie uns eine Erklärung dafür liefert, und (b) die Wissenschaft liefert uns eine Erklärung genau in dem Ausmaß, in dem sie das zu erklärende Phänomen in eine erkennbare Struktur von Kausalbeziehungen einordnet. Ich glaube, daß sich weder (a) noch (b) aufrechterhalten lassen. Was (a) betrifft, so müssen wir auf legitime Zurückweisungen hinweisen. Wenn wir verstanden haben, daß keine vis inertiae8 oder irgend etwas anderes dieser Art notwendig ist, damit ein gleichförmig bewegter Körper im kräftefreien Zustand seine Bewegung beibehält, so stellt dies eine Verbesserung unseres Verständnisses dar. Doch dieses Verständnis kommt nicht dadurch zustande, daß man die Frage Warum behält ein solcher Körper seine Geschwindigkeit bei? beantwortet hat. Diese Frage wurde nämlich zurückgewiesen - und dennoch haben wir das Phänomen besser verstanden, sobald wir nämlich erkannt haben, daß es in ein Newtonsches Modell paßt, welches keine Antwort auf diese Frage liefert.9 Was (b) betrifft, so besteht die wissenschaftliche Erklärung eines Phänomens nicht annähernd immer darin, das Phänomen in eine Kausalstruktur einzuordnen. Beispielsweise erklären wir das spezifische Verhalten der Elektronen, wie es durch Paulis Ausschließungsprinzip beschrieben wird, nicht durch die Annahme von Kräften, die ein Elektron vom Zustand jedes anderen fernhalten oder von jedem bereits besetzten Zustand abstoßen. (Ähnlich wie im Fall der vis inertiae hatte man hier ursprünglich sogenannte Pauli-Kräfte 7
8
Die Beiträge, die auf diesem Symposium der American Philosophical Association von Philip Kitcher und mir vorgetragen und von Salmon kommentiert wurden, erschienen im Journal of Philosophy 2, 1985, S. 632-654. [Anm. d. Hrsg.:] vis inertiae- Beharrungsvermögen, Trägheitskraft. Zur Entwicklungsgeschichte dieses Begriffs vgl. Jammer (1964), S.61-89.
Die Pragmatik des Erklärens
47
vermutet, die dies bewirken sollten, während später, im Zuge eines besseren Verständnisses der Theorie, die Hypothese von den Pauli-Kräften fallengelassen wurde.) In diesem zweiten Argument habe ich angenommen, daß wir unter den wissenschaftlichen Theorien über die Erfahrungswelt die kausalen Ansätze, welche kausale Modelle liefern, von solchen unterscheiden können, die das nicht tun. Wenn Salmon mit „Struktur von Kausalbeziehungen" einfach jede beliebige von der Wissenschaft beschriebene Struktur meinen würde, so wäre seine Bedingung (b) leer. Das meint er aber nicht, sondern nimmt an, daß es zumindest Minimalbedingungen gibt, die jedes kausale Modell erfüllen muß. Diese Kriterien beziehen sich auf kontinuierliche Ausbreitung in Raum und Zeit und auf probabilistische Abschirmungsrelationen jener Art, wie sie sich ursprünglich in Reichenbachs Theorie der gemeinsamen Ursache finden. Erklärungen durch Koexistenzgesetze und/oder durch Symmetrieprinzipien sind (diesen Minimalbedingungen zufolge) keine kausale Erklärungen. Schlimmer noch: in der Quantenmechanik läßt sich zeigen, daß einige ihrer Modelle der Phänomene in kein kausales Modell eingebettet werden können, das sogar noch minimalere Kriterien als die Salmons erfüllt. 10 Doch kausale Modelle, oder zumindest Modelle, die den obigen Kriterien genügen, sind im Ganzen gesehen in der Wissenschaft vorherrschend; es ist von Vorteil, sie zu haben, sofern das möglich ist; und für die moderne Wissenschaft vor Beginn unseres Jahrhunderts waren sie tatsächlich paradigmatisch. Wir brauchen daher keineswegs zu leugnen, daß die Wissenschaft oftmals das tut, wonach Salmon verlangt. Überdies kann die Frage, warum ein bestimmtes Phänomen auftritt, durchaus als Forderung nach einem kausalen Modell gemeint sein. Auch wenn solch eine Forderung möglicherweise zurückgewiesen werden muß, so drückt sie doch an sich keinen illegitimen Wunsch aus. Wir werfen Salmons Theorie also nicht vor, daß sie falsch ist, sondern lediglich, daß sie unvollständig ist, weil sie die Gesamtheit der Erklärungen durch einen Teil ersetzt. 9
10
Diskussionen mit Karel Lambert haben mir besonders geholfen, die beiden Gesichtspunkte des Erklärens und Verstehens voneinander zu trennen. Vgl. meine Arbeit (1982) sowie meinen Beitrag zu dem in Anm. 7 erwähnten Symposium.
48
Bas van Fraassen
Wenn wir nun kausale Erklärungen selber betrachten, so stellen wir jedoch fest, daß Salmon in beträchtlichem Ausmaß bestimmte Aspekte ignoriert hat, die mehr mit der Tätigkeit des Erklärens selbst zu tun haben, als mit der Wissenschaft, von der diese Tätigkeit Gebrauch macht. Fassen wir zusammen, wie die Dinge stünden, wenn Salmons Theorie sowohl korrekt als auch vollständig wäre: (1) Ereignisse sind eingefangen in ein Netz von kausalen Relationen. (2) Was die Wissenschaft beschreibt, ist dieses kausale Netz. (3) Die Erklärung eines Ereignisses besteht darin, die herausragenden Faktoren in jenem Teilstück des kausalen Netzes aufzuzeigen, welches von den Linien gebildet wird, die zu diesem Ereignis hinführen. (4) Das, was gewöhnlich als die Ursache(n) dieses Ereignisses bezeichnet wird (werden), besteht aus jenen herausragenden Faktoren, die bei einer Erklärung angeführt werden. Den Terminus „herausragend" (im Englischen „salient" - d. Hrsg.) übernehme ich von David Lewis. Die herausragenden Faktoren sind solche, die besonders auffallig sind bzw. die Aufmerksamkeit auf sich lenken. Diese Verbesserung von Salmons Theorie ist notwendig, weil eine Erklärung niemals in der Beschreibung all dessen besteht, was zu dem fraglichen Ereignis geführt hat. Beachten wir nun, daß wir uns vorrangig auf (1) und (2) konzentrieren müssen, wenn wir primär an Verursachung interessiert sind, dagegen auf (3) und (4), falls wir uns für Erklärungen interessieren. Dies sei durch folgendes Beispiel illustriert: Stellen Sie sich vor, Sie fragen mich, warum die Klinge des Messers rostig ist, und ich antworte, daß sie aus Stahl besteht. Sicher habe ich damit (in Salmons Worten) einen Teil des kausalen Netzes beschrieben, in dem das zu erklärende Ereignis lokalisiert ist. Aber höchstwahrscheinlich habe ich mit dieser Antwort eine schlechte Wahl getroffen - schlecht nicht aus der Perspektive der Verursachungsfrage, sondern schlecht in bezug auf den Zweck der geforderten Erklärung. Um also zu verstehen, was eine Erklärung ist, müssen wir wissen, wie eine angemessene Auswahl (unter allen Faktoren des kausalen Netzes) zu treffen ist. In dem obigen Beispiel
Die Pragmatik des Erklärens
49
könnte erwidert werden „Das weiß ich schon!" Folglich sollte die Auswahl so getroffen werden, daß man dem Fragesteller neue Informationen über den kausalen Prozeß liefert. Doch auch nicht jede neue Information wird akzeptabel sein - die neue Information muß beim Fragesteller ,die Lücken' schließen, die in seinem eigenen und von ihm als unvollständig empfundenen Modell des Ereignisses vorhanden sind. Aber wiederum nicht jede beliebige Lücke - der Fragesteller wird sich damit zufrieden geben, daß sein eigenes Wissen über das Ereignis in sogar vielen kausal relevanten Hinsichten unvollständig bleibt. So könnte er sich ζ. B. mit der Antwort „Weil das Messer im Regen liegen geblieben ist" zufrieden geben und keine Geduld aufbringen für eine vollständigere Antwort über Geistesabwesenheit oder Zerstreutheit, die dazu führten, daß das Messer draußen vergessen wurde. Dies könnte zur Vermutung Anlaß geben, daß „herausragend" auf einer im Prinzip einfachen Klassifikation beruht, deren differentia spezifica wir bloß entdecken müssen. Tatsächlich haben frühere Autoren beim Versuch, unter den vielen kausal relevanten Faktoren die Ursache auszusondern, hierfür einfache Charakteristika ausgewählt. Nach Lewis White Beck etwa sondern wir als die Ursache jenen Faktor aus, über den wir am meisten Kontrolle haben. Nagel dagegen argumentierte, daß es im Gegenteil oft gerade der Faktor ist, den wir nicht unter Kontrolle haben; für Braithwaite ist es der unbekannte Faktor und für David Böhm schließlich der veränderlichste. 11 Aber keine dieser einfachen Vorstellungen über herausragende Faktoren bewährt sich. Der Grund dafür wurde, wie ich glaube, bereits in Norwood Russell Hansons Diskussion der Verursachung aufgezeigt - am berühmten Beispiel der Ursache eines tödlichen Autounfalls. Hanson schreibt: Es gibt ebenso viele Ursachen von χ wie Erklärungen von x. Man bedenke, wie die Todesursache vom Arzt als ,multiple Blutung', vom Rechtsanwalt als ,Fahrlässigkeit seitens des
11
Diese Zusammenstellung findet sich in Zwart (1967), S. 135, Anm. 19; die Quellen sind: die Aufsätze von Beck und Nagel in Feigl/Brodbeck (Hrsg., 1953), S. 374 und 689; Braithwaite (1953), S. 320 und Böhm (1957), passim.
50
Bas van Fraassen
Lenkers', vom Automechaniker als .Defekt in der Bremsvorrichtung' oder vom Stadtplaner als »Vorhandensein großer Sträucher an dieser Abzweigung' ausgegeben wird (s. N. R. Hanson 1958, S. 54 - Übers, d. Hrsg). Es ist nicht möglich, diese unterschiedlichen Auswahlen zu kombinieren, da sie rivalisierenden Interessen entspringen. Der Stadtplaner etwa nimmt solche Merkmale wie den mechanischen Zustand des Wagens einfach als konstant an und zieht einen Faktor in Betracht, der ausschlaggebend gewesen sein könnte, selbst wenn die Bremsen tatsächlich defekt waren. Der Mechaniker hingegen hält gerade diese Faktoren als konstant fest und konzentriert sich auf mechanische Merkmale, die selbst unter der Bedingung, daß die Sicht an dieser Abzweigung begrenzt war, von entscheidender Relevanz waren. Welcher Faktor der herausragende ist, variiert also, wie man sieht, sehr stark von Kontext zu Kontext. Es läßt sich sogar verallgemeinernd sagen: Nicht einmal der Wunsch, etwas über kausal relevante Faktoren zu erfahren der allen Personen in Hansons Beispiel gemeinsam ist - stellt ein universelles Merkmal von Forderungen nach Erklärung dar. Doch jede solche Forderung, von einer bestimmten Person in einem bestimmten historischen Kontext gestellt, ist mit einem stillschweigenden Begriff von Relevanz verbunden, welcher bestimmt, was als Kandidat für eine gute Antwort überhaupt in Frage kommt. Diese kontextabhängige Relevanzbeziehung muß ein essentieller, wenn auch gewöhnlich stillschweigend vorausgesetzter Bestandteil jeder Forderung nach Erklärung sein. Daß es Erklärungstheorien gibt, denen zufolge jede Erklärung Informationen über einen spezifischen Aspekt liefern muß - wie ζ. B. Salmons Theorie, die Informationen über kausale Prozesse verlangt - resultiert m. E. daraus, daß ihre Vertreter sich nur auf einen spezifischen Typ von Kontext konzentrieren, in dem Erklärungsforderungen gestellt werden. 1.3.2. Erklärung und die Theorie der Fragen Im vorangegangenen Abschnitt gelangten wir zu dem Begriff des Kontextes einer Erklärungsforderung, dessen Beschaffenheit zum Teil bestimmt, was als erklärungsrelevante Informa-
Die Pragmatik des Erklärens
51
tion zählt. Wir wenden uns nun einem anderen Zugang zu Erklärungen zu, der uns einen zweiten kontextuellen Faktor liefern wird. Dieser Zugang, der auf Sylvain Bromberger (1965) zurückgeht, identifiziert Erklärungen mit Antworten auf Warum-Fragen. Genauer gesagt, ist es diesem Ansatz zufolge keine bloß nebensächliche Eigenschaft von Erklärungen, als angemessene Antworten auf gewisse Fragen zu fungieren. Vielmehr bedeutet hier eine Erklärung zu sein nichts anderes, als eine Antwort auf eine bestimmte Art von Frage zu sein. Eine Frage ist eine Forderung nach einer bestimmten Art von Information. Wir können jedoch diese beiden Punkte nicht kombinieren und sagen, eine Erklärung zu sein bedeute, eine bestimmte Art von Information zu sein. (Erinnern wir uns hier an die eingangs gegebene Analogie: notwendigerweise ist jede Tochter eine Frau ist und vice versa, doch eine Tochter zu sein bedeutet nicht, eine Frau zu sein.) Tatsächlich kann die Art der geforderten Information mit der Frage und dem Kontext der Frage variieren. Definitiv für eine Erklärung ist daher nicht eine bestimmte Art von Information. Definitiv ist nur, daß es sich bei der angeführten Art von Information um jene handelt, nach der in einer jeweiligen Warum-Frage verlangt wurde. Sylvain Bromberger beschrieb die logische Form einer Warum-Frage einfach als „Warum ST oder „Warum ist es der Fall, daß ST, wobei „ 5 " für einen deklarativen Satz steht (1966, S. 86-108). Er wies zugleich daraufhin, daß jede solche Frage eine Präsupposition hat, nämlich daß es tatsächlich der Fall ist, daß S. Es ist daher auch möglich, eine Frage (bzw. eine Erklärungsforderung) durch die Behauptung, daß S nicht der Fall ist, zurückzuweisen. Beispielsweise wird die Frage „Warum ist Phlogiston leichter als Luft?" nicht beantwortet, sondern zurückgewiesen, wenn wir darauf erwidern, daß es Phlogiston gar nicht gibt, sodaß sich diese Frage also gar nicht stellt. Dies ist ein wichtiger Schritt in Richtung einer Explikation der (berechtigten) Zurückweisung von Erklärungsforderungen. Leider führt er nicht sehr weit, denn die wichtigen Beispiele von Zurückweisung fallen nicht unter diesen Typ von Präsupposition. Doch es ist über Bromberger hinausgehend möglich, mithilfe eines breiteren Präsuppositionsbegriffs ein generelles Kon-
52
Bas van Fraassen
zept von berechtigter Zurückweisung zu explizieren (wie wir später sehen werden). Ein Hauptkritikpunkt an Brombergers Theorie wurde meines Wissens erstmals von Bengt Hansson (1974) vorgebracht. 12 Betrachten wir die Frage: Warum aß Adam den Apfel? Im Gegensatz zu Bromberger hat diese Frage drei mögliche logische Formen, die man so darstellen kann (und zwar einmal grammatikalisch, und dann durch Betonung): (a) Warum war es Adam, der den Apfel aß? bzw.: Warum aß Adam den Apfel? (b) Warum war es der Apfel, den Adam aß? bzw.: Warum aß Adam den Apfel? (c) Warum war es die Handlung des Essens, die Adam in bezug auf den Apfel ausführte? bzw.: Warum aß Adam den Apfel? Offenbar wird sich das, was als eine befriedigende Antwort zählt, in den drei Fällen voneinander unterscheiden. Denn die gleiche Tatsache wird in den drei Fragen drei verschiedenen Arten von Alternativen gegenübergestellt. Von der jeweiligen Antwort erwarten wir etwas, das für die Tatsache im Kontrast zu den angedeuteten Alternativen spricht. Diese sogenannte Kontrastklasse von Alternativen, die üblicherweise stillschweigend aus dem Kontext heraus verstanden wird, ist ein zweiter kontextueller Faktor, der dazu beiträgt, den exakten Inhalt einer individuellen Erklärungsforderung zu bestimmen. Hier stoßen wir wieder auf eine Art von Zurückweisung von Fragen. Die Spannungen, die wir in dem Beispiel der Syphilis und der progressiven Paralyse fühlten, können nun als das Fehlen einer Sensitivität für Kontexte erklärt werden. Wenn eine Mutter fragt, warum ihr ältester Sohn progressive Paralyse hat, dann kann es eine befriedigende medizinische Antwort geben 12
Unabhängig von Bengt Hansson wurde diese Idee auch von Jon Dorling in einem 1976 verbreiteten Artikel entwickelt, worüber in Garfinkel (1981) berichtet wird. Ich möchte mich hier bei Bengt Hansson für die Diskussion und Korrespondenz im Herbst 1975 bedanken, welche mir zu einer bedeutenden Klärung dieser Problematik verhalf.
Die Pragmatik des Erklärens
53
oder auch nicht - ganz abhängig davon, wie diese Frage ,im Mund der Mutter' gemeint war. Wenn die Mutter fragen wollte, warum unter allen ihren Söhnen gerade ihr ältester Sohn, der Bürgermeister der Stadt, progressive Paralyse hat, dann beruft sich die Antwort des Arztes zurecht auf die Syphilis-Vorgeschichte ihres ältesten Sohnes (welche diesen von den anderen Söhnen unterscheidet). Wenn die Mutter aber wissen will, warum ihr Sohn, im Gegensatz zu allen anderen syphilitischen Mitgliedern seines Sportvereins progressive Paralyse hat, dann wird ihr der Arzt sagen, daß die Medizin keine Antwort daraufhat. Und analog, wenn wir wissen wollen, warum ein Radiumatom zerfallen ist, liefert uns seine Atomstruktur, die sich von der stabilerer Elemente unterscheidet, die Antwort. Wenn wir jedoch wissen wollen, warum dieses bestimmte Radiumatom, im Unterschied zu anderen Radiumatomen, zerfallen ist, oder warum es gerade jetzt und nicht zu irgendeinem anderen Zeitpunkt zerfallen ist, so hat die Physik darauf keine Antwort und weist die Frage zurück. Und diese Wissenschaft ist deshalb nicht notwendigerweise unvollständig, sondern sie erkennt nur richtig, daß die Welt indeterministisch ist. 1.3.3. Ausarbeitung der Schlüsselbegriffe Eine adäquate Theorie der Erklärung muß klarmachen, wie es zu Asymmetrien und legitimen Zurückweisungen von Erklärung kommen kann. Sehen wir, wie dies durch die nun gewonnenen Schlüsselbegriffe - die beiden kontextuellen Faktoren der Relevanzbeziehung und der Kontrastklasse - geleistet werden kann. Man könnte vermuten, daß wissenschaftliche Erklärungen adäquate Antworten auf solche Warum-Fragen sind, bei denen die Relevanzrelation und/oder die Kontrastklasse durch spezifisch wissenschaftliche Interessen bestimmt ist. Ich neige dazu, dies zu bezweifeln und glaube stattdessen, daß wissenschaftliche Erklärungen Antworten auf jede beliebige Art von WarumFragen sind, vorausgesetzt, sie machen in entscheidenden Teilen der in ihnen angeführten Information von der Wissenschaft Gebrauch. Wir könnten uns vorstellen, daß in Hansons Beispiel der Mediziner und der Mechaniker den Unfall einmal als Tod eines menschlichen Organismus und einmal als mechanischen
54
Bas van Fraassen
Verlauf eines Autounfalls erklären. Die Kontrastklassen sind hier ganz verschieden, obwohl die Relevanzrelation hier wohl die gleiche ist (jene nämlich, die grob durch die Forderung nach kausalen Faktoren bzw. Faktoren, die zum Zustandekommen des Ereignisses beigetragen haben, grob charakterisiert werden kann). Wie wir aber schon gesehen haben, ist diese Konzentration auf kausale Faktoren nicht für jede wissenschaftliche Erklärung charakteristisch. Wenn gewisse Aspekte der Atomstruktur durch das Paulische Ausschließungsprinzip oder noch fundamentaler, durch das Symmetrieprinzip der Zustandsinvarianz unter Permutation erklärt werden, dann ist diese Erklärung zwar wissenschaftlich, aber nicht kausal. Um dieses Argument in einer unangreifbaren Weise vorzubringen (vor der Entwicklung der Quantenmechanik war es vielleicht noch möglich, jede wissenschaftliche Theorie in ein umfangreicheres kausales Modell einzubetten), müßten wir allerdings wesentlich detailierter auf die Quantenmechanik eingehen, als wir das in diesem Rahmen tun können. Wir können jedoch die kontextuelle Varianz der Kontrastklasse und der Relevanzrelation auch mit ganz .gewöhnlichen' Beispielen illustrieren. Alan Garfinkel etwa brachte das Beispiel vom Gefangenen, der vom Gefangniskaplan gefragt wird, warum er Banken ausgeraubt habe. Darauf der Gefangene: Weil das der Ort ist, wo es das Geld gibt. Was das Beispiel so belustigend macht, ist unsere Überzeugung, daß der Kaplan eine andere Kontrastklasse im Sinn hatte. In diesem Kontext ist die Antwort unangemessen, was sie vielleicht nicht wäre, hätte dieselbe Frage nicht der Kaplan, sondern ein (etwas dummer) Mitgefangener gestellt. Bereits Aristoteles führte ein Beispiel dafür an, wie die Relevanzrelation - in Gegenüberstellung zur Kontrastklasse - kontextuell variieren kann (das Laternen-Beispiel aus der Zweiten Analytik II, 11). In modernem Gewand sieht das Beispiel so aus: Angenommen, ein Vater fragt seinen 16-jährigen Sohn: „Warum brennt das Licht auf der Veranda?" und der Sohn antwortet: „Der Lichtschalter auf der Veranda ist an und der Strom fließt durch den Schalter bis zur Glühbirne." Sie werden jetzt höchstwahrscheinlich finden, daß dieser Sohn ziemlich unverschämt ist, denn sie werden höchstwahrscheinlich anneh-
Die Pragmatik des Erklärens
55
men, daß die Art von Antwort, nach der der Vater verlangte, etwa folgende war: „Weil wir noch Besuch erwarten." Man kann sich aber leicht einen etwas weniger naheliegenden Fragekontext vorstellen, in dem sich der Vater nicht für Erwartungen und Wünsche interessiert, die zum Drücken des Schalters führten, sodaß die Antwort des Sohnes hier als angemessen erscheint: man nehme beispielsweise an, Vater und Sohn verkabeln das Haus und der Vater stellt fest, daß unerwarteterweise das Verandalicht brennt und befürchtet, einen Kurzschluß verursacht zu haben, der den Verandaschalter überbrückt hat. Was uns unglücklicherweise fehlt, ist eine aufschlußreiche Klassifikation von Relevanzbeziehungen. Wir könnten Aristoteles Typologie der vier Ursachen als Ausgangspunkt für solch eine Klassifikation wählen. Angenommen, wir fragen, warum die australische Jacht das Rennen gewonnen hat und erhalten folgende Antworten: Weil sie den Wind sehr gut ausgenutzt hat. Weil sie aus einer leichteren Holzart bestand. Weil ihr Kiel besonders geformt war. Wir erkennen hier Wirkursache, Materialursache und Formursache, um in Aristoteles' Terminologie zu bleiben. Ersteres entspricht sehr gut dem, was wir kausale Faktoren nennen (oder dem, was Salmon damit gemeint hat), doch bereits Hansons Beispiel vom Autounfall hat gezeigt, daß auch hier Untergliederungen nötig werden. (Beispiele von Relevanzbeziehungen, die formal dem vierten Aristotelischen Ursachetyp der Zweckursache entsprechen - ohne freilich seine ontologischen Implikationen zu teilen - finden sich in Abschn. II.3.) Nehmen wir nun an, daß Α und Β relativ zu einer gegebenen Theorie oder relativ zur gesamten anerkannten Wissenschaft äquivalente Aussagen sind, daß Α jedoch einen Faktor der einen und Β einen Faktor einer anderen Art beschreibt. Angenommen weiter, daß die Frage „Warum...?" in einem bestimmten Kontext als Forderung nach Faktoren der Art verstanden wird, wie Α sie beschreibt. (D. h. die Intention hinter der Frage macht diese Art von Faktoren relevant.) In diesem Fall gelangen wir unmittelbar zu einer Asymmetrie: Die Ant-
56
Bas van Fraassen
wort „Weil A" auf „Warum BT' erfüllt die Relevanzbedingung, die Antwort „Weil i?" auf „Warum AT' hingegen nicht. Möglicherweise impliziert eine adäquate Klassifikation von Relevanzbedingungen, daß bei der Bildung vernünftiger Warum-Fragen gewisse Faktoren niemals als relevant anzusehen sind. Salmon und Kitcher haben das behauptet, und ich kann nicht leugnen, daß es möglich ist. Aber keines ihrer Beispiele hat mich überzeugt - vielleicht deshalb, weil es in der Praxis schwierig ist, zwischen einer Warum-Frage zu unterscheiden, die auf irgendeine Weise logisch defekt ist, und einer solchen WarumFrage, auf die es unserem Gefühl nach mit Sicherheit keine gute Antwort gibt. So würde ich ζ. B. nicht behaupten, daß an sich irgendetwas Falsches daran ist, nach statistisch relevanten astrologischen Faktoren zu fragen. Ich würde diese Frage nicht deshalb zurückweisen, weil sie logisch unzulässig oder selbstwidersprüchlich ist, sondern weil es faktisch, aus rein empirischen Gründen, keine guten Antworten auf sie gibt. Dies führt mich zum letzten Element, das in jeder adäquaten Erklärungstheorie benötigt wird: Ein Schema, um Erklärungen allgemein als gut, besser oder am besten zu bewerten. Alles bisher Gesagte hat sich mit der Beschreibung der Menge von Antworten beschäftigt, d. h. mit möglichen Erklärungen - seien sie gut, schlecht oder indifferent. Ihre Bewertung ist unabhängig davon. Meiner Meinung nach haben frühere Erklärungstheorien unvorteilhafterweise diese beiden Themen oft nicht getrennt. In Abschnitt II.4 werde ich Bewertungskriterien aufstellen, die in gewissem Ausmaß Salmons Theorie entnommen sind, und von denen ich glaube, daß sie allen Bewertungen von Erklärung gemeinsam sind. Doch ich schlage sie nur sehr zögernd vor. Und gerade wegen ihrer Allgemeinheit bin ich beinahe sicher, daß sie in jedem Einzelfall keine hinreichenden Bedingungen dafür ergeben, was eine gute oder eine bessere Antwort ist. Glücklicherweise haben wir die hauptsächlichen Hindernisse für eine Erklärungstheorie, die Probleme der Asymmetrie und der Zurückweisung von Erklärungen bereits behandelt, bevor wir die Kriterien für Bewertung bestimmen müssen.
Die Pragmatik des Erklärens
57
Teil II: Eine neue Theorie der Erklärung Ich möchte im folgenden eine neue Theorie der Erklärung vorschlagen. Eine Erklärung ist nicht dasselbe wie eine Proposition, oder ein Argument, oder eine Liste von Propositionen; sie ist eine Antwort. (Analog wie eine Tochter nicht dasselbe wie eine Frau ist, auch wenn jede Tochter eine Frau und jede Frau eine Tochter ist.) Eine Erklärung ist eine Antwort auf eine Warum-Frage. Daher muß eine Theorie der Erklärung eine Theorie der Warum-Fragen sein. Um diese Theorie zu entwickeln, deren Elemente alle aus dem vorangegangenen Teil in mehr oder weniger direkter Weise zusammengetragen werden können, müssen wir zunächst mehr über einige Themen der formalen Pragmatik (welche sich mit Kontextabhängigkeit beschäftigt) und der Fragelogik sagen. Beide Gebiete sind zwar erst seit jüngerer Zeit aktive Disziplinen der logischen Forschung, doch über die Basisaspekte, auf die ich die folgende Diskussion beschränken werde, gibt es allgemeine Übereinstimmung. II.l. Kontexte und Propositionen13 Die Logiker haben eine Reihe von Modellen unserer Sprache entwickelt, von zunehmender Komplexität und Spitzfindigkeit. Die empirischen Phänomene, auf die sich ihre Modelle stützen und die sie zugleich zu erfassen suchen, sind die Oberflächengrammatik unserer Behauptungen und die Schlußmechanismen, die sich in unseren Argumenten entdecken lassen. (Die Grenzziehung zwischen Logik und theoretischer Linguistik be-
13
A m Ende meiner Arbeit „The Only Necessity is Verbal Necessity" (1977) (welche selbst eine Anwendung formaler Pragmatik auf ein philosophisches Problem ist) findet sich eine kurze Übersicht über die Entwicklung der formalen Pragmatik, mit Hinweisen auf die Literatur. Der dort unter „im Erscheinen" angeführte Aufsatz „Demonstratives" von David Kaplan wurde im Frühling 1977 vervollständigt und in mimeographierter Form verbreitet; er ist wohl die wichtigste Quelle der Konzepte und Anwendungen formaler Pragmatik. Allerdings ist die Form, in der Kaplan seine Theorie hier entwickelt, in einigen Aspekten noch immer kontroversiell.
58
Bas van Fraassen
ginnt gegenwärtig, vage zu werden; freilich konzentrieren sich die Interessen der Logiker mehr auf spezielle logische Aspekte unserer Sprache und weniger auf die Anpassung an deren Oberflächengrammatik - in jedem Fall ist ihr Interesse an der Sprache auf einer hochtheoretischen Ebene angesiedelt.) Die theoretischen Entitäten, die die Logiker in ihre Sprachmodelle (welche auch ,formale Sprachen' genannt werden) einführten, umfassen Bereiche des Diskurses (Gegenstandsbereiche bzw. -universen), mögliche Welten, Erreichbarkeitsrelationen (bzw. Relationen der ,relativen Möglichkeit' zwischen möglichen Welten), Tatsachen und Propositionen, Wahrheitswerte, und - zuguterletzt, wenn auch ein bißchen verspätet - Kontexte. Wie man erraten wird, gehe ich aufgrund meiner empiristischen Einstellung davon aus, daß die Adäquatheit dieser Modelle nicht impliziert, daß alle ihre Elemente auch ein Gegenstück in der Realität besitzen. Es genügt für ihre Adäquatheit, daß sie in ihren Konsequenzen jenen Phänomenen gerecht werden, die sie zu erfassen suchen. In elementaren Logikkursen wird man nur in die einfachsten Modelle eingeführt, in die Sprache der Aussagenlogik und der Quantorenlogik (Prädikatenlogik), welche, eben weil sie die einfachsten sind, natürlich auch die am wenigsten adäquaten sind. Obzwar die meisten Logiklehrer diese Art von Einführungskursen eher verteidigen würden, so gehen aus ihnen doch viele Logikstudenten und andere Philosophen mit dem Eindruck heraus, daß diese einfachsten Modelle aufgrund ihrer Übervereinfachung eigentlich nutzlos sind. Andere wiederum sind von jenen Anwendungen, die die elementare Logik tatsächlich hat (wie ζ. B. die Aufhellung der klassischen Mathematik), beeindruckt und schließen daraus, daß man die natürliche Sprache nur verstehen kann, wenn man sieht, wie sie sich so umorganisieren läßt, daß sie auf jenes einfache Modell der Pfeile und Wahrheitstafeln paßt. In der elementaren Logik korrespondiert jeder Satz genau einer Proposition, und der Wahrheitswert dieses Satzes hängt davon ab, ob diese Proposition in der wirklichen Welt wahr ist. Das trifft auch auf solche Extensionen elementarer Logik zu wie die freie Logik (worin nicht alle Terme eine Referenz in der wirklichen Welt besitzen müssen), die normale Modallogik
Die Pragmatik des Erklärens
59
(welche nicht wahrheitsfunktionale Konnektive enthält), sowie überhaupt fast alle logischen Systeme, die bis vor kurzem entwickelt wurden. Nun sind aber die Sätze unserer natürlichen Sprache typischerweise kontextabhängig; das heißt, welche Proposition ein gegebener Satz ausdrückt, variiert mit dem Kontext und dem Geschehen, in dem dieser Satz verwendet wird. Auf dieses Faktum hatte schon sehr früh Strawson aufmerksam gemacht, und es gibt dafür eine Vielzahl von Beispielen: „Ich bin jetzt glücklich" ist wahr in Kontext χ genau dann, wenn der Sprecher im Kontext χ zur Zeit des Kontextes χ glücklich ist, wobei ein Verwendungskontext ein reales Geschehen ist, das zu einer bestimmten Zeit an einem bestimmten Ort stattfand, und in welchem die Identität des Sprechers (der Referent von „ich"), des Angesprochenen (der Referent von „du"), der Person, über die gesprochen wurde (der Referent von „er"), usw., bestimmt ist. Natürlich sind die so betrachteten Kontexte Idealisierungen von realen Kontexten, doch der Grad an Idealisierung kann je nach Forschungsinteresse in verschiedenen Hinsichten verringert werden, auf Kosten einer größeren Komplexität des konstruierten Modells. Was muß in einem solchen Kontext festgelegt werden? Die Antwort hängt von dem Satz ab, der analysiert werden soll. [ . . . ] Wenn ein Satz so wie oben indexikalische Terme (wie „ich", „jetzt", „hier", „dies" etc.) enthält, so muß der Kontext (zumindest) die Referenten seiner indexikalischen Terme festlegen. Komplexere Modelle enthalten Mengen möglicher Welten und Mengen von Kontexten, die möglichen Welten als Teile zugeordnet sind. Wir wollen uns damit nicht beschäftigen, sondern uns den spezifischen Kontexten zuwenden, die in Fragen involviert sind. Dabei wollen wir, wenn wir im folgenden von Propositionen sprechen, von der vereinfachenden Annahme ausgehen, daß Propositionen sich mit den Mengen möglicher Welten, in denen sie wahr sind, identifizieren lassen. 14 14
[Anm. d. Hrsg.:] Die Seiten 135 unten, vorletzter Absatz bis 137, §4.2 von van Fraassens The Scientific Image wurden an der mit [... ] gekennzeichne-
60
Bas van Fraassen
II.2. Fragen Wir müssen uns nun die allgemeine Logik der Fragen, kurz Fragelogik, näher ansehen. Es gibt hier natürlich eine Menge von Ansätzen; ich werde im folgenden hauptsächlich dem von Nuel Belnap folgen, ohne mich allerdings den Details seiner Theorie zu widmen. 15 Eine Theorie der Fragen muß sich auf eine Theorie der Propositionen gründen, welche ich hier als gegeben voraussetze. Eine Frage ist eine abstrakte Entität, die durch einen Fragesatz (ein gewisses Stück unserer Sprache) ausgedrückt wird - ebenso, wie eine Proposition durch einen Aussagesatz ausgedrückt wird. Fast alles kann in dieser oder jener Situation als angemessene Erwiderung auf eine Frage fungieren; beispielsweise war „Peccavi" („Ich bekenne mich schuldig!") die Antwort, die ein britischer Kommandant in Indien auf die Frage, wie die Schlacht voranginge, telegraphisch übermittelte (er wurde ausgesandt, um die Provinz Sind anzugreifen). 16 Aber nicht jede Erwiderung ist genau genommen auch eine Antwort. Natürlich gibt es Grade: eine Erwiderung kann mehr oder weniger eine Antwort sein als eine andere. Die erste Aufgabe einer Theorie der Fragen ist es, eine Typologie ihrer Antworten zu liefern. Betrachten wir hierzu folgendes Beispiel einer Frage mit einer ganzen Reihe von Antworten: Kann man sowohl mit der Fähre wie mit dem Flugzeug nach Viktoria gelangen? (a) Ja. (b) Man kann sowohl mit der Fähre wie mit dem Flugzeug nach Viktoria gelangen.
15
16
ten Stelle ausgelassen, da sie sich mit allgemeinen Aspekten der formalen Pragmatik beschäftigen, die für das folgende nicht Voraussetzung sind. Die zwischen [ . . . ] und Anmerkung 14 stehende Überleitung, die das wichtigste an der ausgelassenen Stelle Stehende kurz zusammenfaßt, wurde vom Herausgeber hinzugefügt. Belnaps Theorie wurde erstmals in Belnap (1963) veröffentlicht, und durch das Werk Belnap/Steel (1976) einem breiteren Publikum zugänglich gemacht. Ich erfuhr dieses Beispiel von meinem früheren Studenten Gerald Charlwood. Ian Hacking und J. J. C. Smart berichteten mir, daß es sich bei dem Kommandanten um Sir Charles Napier handelte.
Die Pragmatik des Erklärens
61
(c) Man kann mit der Fähre nach Viktoria gelangen. (d) Man kann sowohl mit der Fähre wie mit dem Flugzeug nach Viktoria gelangen, aber die Reise mit der Fähre sollten Sie nicht verpassen. (e) Sicherlich kann man mit der Fähre nach Viktoria gelangen, und das ist etwas, was Sie nicht verpassen sollten. (b) ist offenbar das,reinste' Exemplar einer Antwort: (b) gibt hinreichend Information, um die Frage vollständig zu beantworten, aber nicht mehr. Daher nennt man (b) eine direkte Antwort. Das Wort „Ja" (a) ist ein Kode für diese Antwort. Die Erwiderungen (c) und (d) weichen von dieser direkten Antwort in entgegengesetzter Richtung ab: (c) sagt weniger als (b), und wird durch (b) impliziert, während (d) mehr sagt als (b), und (b) impliziert (mit „impliziert" ist hier immer „logisch impliziert" gemeint). Eine Proposition, die von einer direkten Antwort impliziert wird, heißt partielle Antwort; eine, die eine direkte Antwort impliziert, heißt vollständige Antwort. Wir müssen allerdings der Versuchung widerstehen, generell jede Kombination einer beliebigen partiellen Antwort mit einer zusätzlichen Information als Antwort anzusehen, denn dann wäre jede Proposition auf jede Frage eine Antwort. Wir lassen daher (e) in obigem Beispiel unklassifiziert und behalten lediglich im Auge, daß (e) jedenfalls in größerem Grade eine Antwort ist als etwa „Gorilla!" (was seinerseits als Erwiderung auf diverse Fragen im Film Ich bin ein Elefant, Madame fungiert, und insofern vermutlich immer noch mehr Antwort ist, als einige andere denkbare Erwiderungen). [ . . . ] Das soweit entwickelte Basiskonzept ist das der direkten Antwort. Gemäß einer auf Hamblin (1958) zurückgehenden These lassen sich Fragen mit den Mengen ihrer (möglichen) direkten Antworten formal identifizieren (d. h. diesen Mengen eineindeutig zuordnen). Wir wollen diese These als vorläufige vereinfachende Annahme akzeptieren (analog, wie wir Propositionen vereinfacht mit Mengen möglicher Welten formal identifiziert haben). 17 Mit dem Konzept der direkten Antwort kön17
[Anm. d. Hrsg.:] An der mit [... ] kenntlich gemachten Stelle wurde 26 Zeilen (von S. 138 unten bis 139 Mitte) von van Fraassens The Scientific Image ausgelassen, weil sie für das folgende nicht Voraussetzung sind. Die zwi-
62
Bas van Fraassen
nen wir nun eine Reihe weiterer Basiskonzepte definieren. Wir sagen: eine Frage Q (vom engl, „question") enthält eine andere Q', wenn Q' beantwortet wird sobald Q beantwortet wird d. h., wenn jede vollständige Antwort auf Q auch eine vollständige Antwort auf Q' ist. Eine Frage heißt leer, wenn alle ihre direkten Antworten notwendigerweise wahr sind, und sie heißt dumm (foolish), wenn keine ihrer direkten Antworten auch nur möglicherweise wahr ist. Ein Spezialfall der dummen ist die doofe (dumb) Frage, welche überhaupt keine direkte Antwort hat. Hier einige Beispiele: 1. Hattest du gestern den weißen Hut auf oder den schwarzen? 2. Hattest du einen Hut auf, der sowohl schwarz wie nicht schwarz war, oder einen, der sowohl weiß wie nicht weiß war? 3. Welches sind die drei verschiedenen Primzahlen, die unter folgenden Zahlen vorkommen: 3,5? 3 ist offensichtlich doof und 2 dumm. Nennen wir in Entsprechung eine notwendigerweise falsche Aussage ebenfalls dumm, so erhalten wir folgendes Theorem: Stelle eine dumme Frage und du erhältst eine dumme Antwort. Dieses Theorem wurde erstmals von Belnap bewiesen (von ihm aber einem jungen indischen Philosophen als Urheber zugewiesen, der in Plutarchs „Leben" erwähnt wird und zusätzlich die Eigenschaft besaß, ein früher Nudist gewesen zu sein). Man beachte, daß eine dumme Frage jede Frage enthält, und eine leere Frage in jeder enthalten ist. Die obige Frage 1 haben wir nicht nur verwendet, um die Frageform von 2 einzuführen, sondern um das wichtigste semantische Konzept der Fragelogik nach dem der direkten Antwort einzuführen, nämlich das der Präsupposition. Von den beiden direkten Antworten auf 1 („Ich hatte den schwarzen Hut a u f und „Ich hatte den weißen a u f ) könnten ja offenbar auch beide falsch sein. In diesem Fall würde der Antwortende vermutlich „Keinen von beiden" sagen, was eine Antwort ist, sehen [... ] und Anm. 17 stehende Überleitung, die das in der ausgelassenen Stelle Stehende kurz zusammenfaßt, stammt vom Herausgeber.
Die Pragmatik des Erklärens
63
die von unserer bisherigen Typologie noch nicht erfaßt wird. Wir wollen hier Belnap folgen, der dieses Problem vollständig geklärt hat, und die folgenden hierfür relevanten Konzepte einführen: Eine Präsupposition18 einer Frage Q ist jede Proposition, die von allen direkten Antworten auf Q impliziert wird. Eine Korrektur (oder korrektive Antwort) auf Q ist jede Verneinung irgendeiner Präsupposition von Q. Die (Basis)präsupposition von Q ist jene Proposition, die genau dann wahr ist, wenn irgendeine direkte Antwort auf Q wahr ist. In der letzten Definition setze ich die vereinfachende Annahme voraus, daß Propositionen mit den Mengen möglicher Welten, in denen sie wahr sind, identifiziert werden können; akzeptiert man diese Annahme nicht, so muß eine komplexere Definition gegeben werden. Im Fall unseres obigen Fragebeispiels 1 ist ,die' Präsupposition offensichtlich die Proposition, daß der Befragte gestern entweder den schwarzen oder den weißen Hut getragen hatte. Tatsächlich ist immer dann, wenn die Zahl der direkten Antworten auf eine Frage endlich ist, ,die' Präsupposition dieser Frage die Disjunktion ihrer direkten Antworten. 1 9 Kehren wir nun kurz zum Problem der Typologie der Antworten zurück. Eine wichtige Familie von Antworten ist die der partiellen Antworten (welche, als Spezialfall, auch direkte und vollständige Antworten enthält). Eine zweite wichtige Familie ist die der korrektiven Antworten. Aber es gibt noch weitere. Nehmen wir an, der in Frage 1 Befragte antwortet mit „Ich hatte nicht den weißen Hut an". Aufgrund unserer Definition ist dies nicht einmal eine partielle Antwort: sie wird von keiner direkten Antwort impliziert, denn der Angesprochene könnte
18
19
Das Definiens ist hier äquivalent m i t , jede Proposition, die wahr ist, wenn irgendeine direkte Antwort auf Q wahr ist". Darunter fallen natürlich auch Propositionen, die man normalerweise mittels ,metalinguistischer' Sätze ausdrücken würde - eine sprachabhängige und insofern unwichtige Unterscheidung. [Anm. d. Hrsg.:] Die Basispräsupposition, auch vollständige Präsupposition genannt, ist somit die logisch stärkste unter allen Präsuppositionen; sie impliziert jede Präsupposition.
64
Bas van Fraassen
gestern ja auch sowohl den weißen wie den schwarzen Hut getragen haben, etwa den einen am Nachmittag und den anderen am Abend. Nachdem aber der Fragende voraussetzt, daß der Befragte zumindest einen von beiden Hüten getragen hat, ist diese Antwort für den Fragenden dennoch eine vollständige Antwort. Denn die gegebene Antwort plus die Präsupposition implizieren zusammen die direkte Antwort, daß der Befragte einen schwarzen Hut getragen hat. Wir fügen daher hinzu: Eine relativ vollständige Antwort auf Q ist jede Proposition, die zusammen mit der Präsupposition von Q eine direkte Antwort auf Q impliziert. Wir können diese Definition noch weiter verallgemeinern: eine vollständige Antwort auf Q, relativ zur Theorie T, ist eine Proposition, die zusammen mit Τ eine direkte Antwort auf Q impliziert - und so fort. Es ist jedenfalls, wie ich meine, wichtig, die bisher eingeführte Typologie von Antworten als offen zu betrachten, um sie nötigenfalls zu erweitern, wenn spezifische Arten von Fragen betrachtet werden. Abschließend wollen wir uns noch überlegen, welche Frage von einem gegebenen Fragesatz ausgedrückt wird. Das ist in hohem Maße kontextabhängig, zum Teil deshalb, weil in Fragesätzen zumeist viele der üblichen indexikalischen Terme auftreten. Wenn etwa gefragt wird „Welchen willst du?", so bestimmt der Kontext einen Bereich von Objekten, auf den sich das „welchen" bezieht - ζ. B. die Menge der Äpfel in dem Korb an meinem Arm. Unter der oben angeführten vereinfachenden Annahme (wonach Fragen mit den Mengen ihrer direkten Antworten formal identifiziert werden können) liegt die hauptsächliche Aufgabe des Kontextes darin, die Menge der direkten Antworten zu definieren. Bei den,elementaren Fragen' von Belnaps Theorie (nämlich ,Ob-Fragen' und ,Welche(r,s)-Fragen') wird die Menge der direkten Antworten durch zwei Faktoren bestimmt: durch eine Menge von Alternativen (welche auch Subjekt der Frage genannt wird) und eine Forderung nach einer Auswahl unter diesen Alternativen und möglicherweise auch nach gewisser Information über diese Auswahl (,Distinktheitsund Vollständigkeitsbehauptungen'). Worin diese Faktoren bestehen, braucht in der Formulierung des Fragesatzes nicht ent-
Die Pragmatik des Erklärens
65
halten sein; es muß jedoch vom Kontext festgelegt werden, jedenfalls genau dann, wenn eine eindeutige Interpretation der Formulierung möglich bzw. die vom Fragesatz ausgedrückte Frage eindeutig sein soll. II.3. Eine Theorie der Warum-Fragert Warum-Fragen führen in die Theorie der Fragen in mehrfacher Hinsicht genuin neue Elemente ein. 20 Konzentrieren wir uns zuerst darauf, zu bestimmen, welche Frage exakt gefragt wird, d. h. konzentrieren wir uns auf die kontextuelle Bestimmung der Faktoren, die nötig sind, um einen Warum-Fragesatz zu verstehen. Nachdem wir das getan haben (eine Aufgabe, die mit der Beschreibung der Menge aller direkten Antworten enden wird), müssen wir uns einem davon unabhängigen Unterfangen zuwenden, nämlich dem Problem der Bewertung dieser Antworten als gut oder besser. Diese Bewertung vollzieht sich mit Bezug auf jenen Teil der Wissenschaft, der in dem gegebenen Kontext als ,Hintergrundtheorie' akzeptiert wird. Betrachten wir als Beispiel die Frage „Warum ist die Stromleitung verbogen?" Der Fragesteller impliziert, daß die Leitung verbogen ist und fragt nach dem Grund dafür. Nennen wir zunächst die Proposition, daß die Leitung verbogen ist, das Thema der Frage (topic of the question - im Anschluß an Henry Leonards Terminus „topic of concern"). Weiters hat die Frage, wie wir in Teil I gesehen haben, eine Kontrastklasse, d. i. eine Menge von Alternativen. Wir fassen diese Kontrastklasse ( nennen wir sie X - ) formal als eine Menge von Propositionen auf, die (unter anderem) das Thema enthält. Für unseren beispielhaften Fragesatz könnte die Kontrastklasse etwa darin bestehen, daß es diese Leitung war und nicht jene, die sich verbog, oder daß sich die Leitung verbogen hat, anstatt ihre Gestalt beizubehalten. Oder wenn es sich um die Frage „Warum brennt 20
Belnap/Steel (1976) haben Brombergers Theorie der Warum-Fragen in der allgemeinen Form elementarer Fragen entworfen. - Ich glaube, daß Bromberger deshalb zu seinem Konzept des .abnormen Gesetzes' gelangte [ . . . Weglassung einer Nebenbemerkung - d. Hrsg.], weil er das stillschweigende anstatt (i. e. die Kontrastklasse) in Warum-Fragesätzen übersah und diesen Mangel dann in seiner Theorie der Antworten ausgleichen mußte.
66
Bas van Fraassen
dieses Material mit gelber Flamme?" handelt, dann könnte die Kontrastklasse dazu ζ. B. die Menge folgender Propositionen sein: Dieses Material brennt mit einer Flamme der Farbe x. Schließlich gibt es, wie wir ebenfalls in Teil I sahen, eine spezifische Hinsicht,-in-der nach einem Grund gefragt wird, und die bestimmt, was als möglicher erklärender Faktor in Frage kommt: die Relation der erklärenden Relevanz. Die erstere der zwei obigen Fragen könnte etwa die Forderung enthalten, Ereignisse, die zu dem Verbiegen der Leitung führten, anzuführen. Als erklärungsrelevante Antworten kämen in diesem Fall ζ. B. Hinweise auf menschliches Versagen, auf das Schließen von Schaltern, auf Feuchtigkeit, die in diesen Schaltern kondensierte, ja sogar auf Verwünschungen durch Hexen in Betracht (die Bewertung von Erklärungen erfolgt ja erst später). Andererseits könnten die Ereignisse, die zum Verbiegen der Leitung führten, auch bereits bekannt sein. In diesem Fall dürfte die Frage wahrscheinlich die Forderung enthalten, die Randbedingungen anzuführen, welche es ermöglichten, daß diese Ereignisse zum Verbiegen der Leitung führten: ζ. B. die Anwesenheit eines magnetischen Feldes bestimmter Stärke, usw. Aber auch die genaue Art und Weise, wie es zum Verbiegen der Leitung kam, könnte entweder bereits bekannt sein, oder als unwesentlich betrachtet werden; und stattdessen könnte in der Frage (möglicherweise aufgrund eines Mißverständnisses) danach gefragt worden sein, welche genaue Funktion die Verbiegung dieser Leitung im Gesamtgetriebe des elektrischen Kraftwerks erfüllt. Man vergleiche hierzu die folgenden zwei Antworten auf die Frage „Warum zirkuliert das Blut im Körper?": (1) „Weil das Herz das Blut durch die Aterien pumpt", und (2) „Um jeden Teil unseres Körpergewebes mit Sauerstoff zu versorgen". Es ist denkbar, daß mehrere Fragen, die innerhalb eines gegebenen Kontextes in ihrem Thema übereinstimmen, sich jedoch in ihren Kontrastklassen unterscheiden (oder umgekehrt), darüberhinaus darin differieren, was als erklärungsrelevant zählt. Wir dürfen daher, um genau zu sein, nicht einfach fragen, was für dieses Thema, oder für diese Kontrastklasse, relevant ist. Vielmehr können wir von einer gegebenen Proposition nur sagen, daß sie (in diesem Kontext) für dieses Thema in bezug auf jene Kontrastklasse entweder relevant ist oder nicht relevant ist.
Die Pragmatik des Erklärens
67
Zum Beispiel könnte jemand in demselben Kontext zugleich wissen wollen, warum Adam den Apfel aß, anstatt die Birne (Eva bot ihm einen Apfel an), sowie welche Motive Adam dazu bewogen, den Apfel zu essen, anstatt Evas Angebot zurückzuweisen. Man kann daher das, was jeweils ,konstant gehalten' bzw. ,als gegeben angenommen' wird (daß Adam die Frucht aß; daß Adams Verhalten sich auf den Apfel bezog), d. h. die Kontrastklasse, nicht vollständig ablösen von der Hinsicht-in-der wir nach einem Grund fragen. Fassen wir zusammen: Eine Warum-Frage Q, durch einen Fragesatz in einem gegebenen Kontext ausgedrückt, wird durch folgende drei Faktoren bestimmt: Das Thema Pk Die Kontrastklasse X = { Pt,..., Die Relevanzrelation R
Pk,...}
Wir können daher eine abstrakte Warum-Frage mit einem Tripel identifizieren, das aus diesen drei Elementen besteht: Q = < Pk, X, R> Eine Proposition Α nennen wir genau dann relevant für Q, wenn Α zu dem Paar in der Relation R steht. Wir müssen nun definieren, was die direkten Antworten auf eine Warum-Frage sind. Untersuchen wir zunächst die sprachliche Form, in der eine solche Antwort ausgedrückt wird, nämlich: (*) Pk im Kontrast zu (allen anderen Elementen von) X, weil A Dieser Satz muß eine Proposition ausdrücken. Welche Proposition das aber ist, hängt von demselben Kontext ab, der auch Q als jene Proposition auswählte, die durch den korrespondierenden Fragesatz („Warum PkTl) ausgedrückt wurde. Daher sollten einige von eben diesen kontextuellen Faktoren, und insbesondere R, auch in der Determination der von (*) ausgedrückten Proposition aufscheinen. Was wird in der Antwort (*) behauptet? Zuallererst, daß Pk wahr ist. Zweitens wird in (*) auch behauptet, daß kein anderes Element der Kontrastklasse wahr ist. Das bis jetzt angeführte wird allerdings bereits durch die Frage selbst vermittelt - es
68
Bas van Fraassen
macht keinen Sinn, zu fragen, warum Peter und nicht Paul progressive Paralyse hat, wenn alle beide progressive Paralyse haben. Drittens besagt (*), daß Α wahr ist. Und schließlich ist da noch das Wort „weil": (*) besagt, daß Α ein Grund ist. Diesen vierten Punkt haben wir mit angehaltenem Atem erwartet. Ist es nicht genau diese Stelle, wo das unentwirrbare modale oder kontrafaktische Element hereinkommt? Keineswegs: meiner Meinung nach zeigt das Wort „weil" hier lediglich an, daß Α in ebendiesem Kontext für ebendiese Frage relevant ist. Was hier daher behaupet wird, ist lediglich, daß Α in der Relation R zu < Pk, X > steht. Ein Beispiel: Angenommen Sie fragen mich, warum ich heute morgen um 7 h aufgestanden bin und ich antworte: „Weil mich das Geklapper des Milchmanns aufgeweckt hat." In diesem Fall habe ich ihre Frage so interpretiert: Sie fragen mich nach einem Grund, der zumindest einige der Ereignisse einschließt, die dazu geführt haben, daß ich aufgestanden bin; und mein Wort „weil" zeigt an, daß das Geklapper des Milchmanns diese Art von Grund war, d. h. eines der Ereignisse innerhalb dessen, was Salmon den kausalen Prozeß nennt. Vergleichen wir das mit dem Fall, in dem ich Ihre Frage als spezifisch nach einem Motiv ausgerichtet auffasse. In diesem Fall hätte ich geantwortet: „Es gibt wirklich keinen Grund. Ich hätte ohne weiteres im Bett bleiben können, weil ich für heute nichts Bestimmtes vorhabe. Aber das Geklapper des Milchmanns hat mich aufgeweckt und vermutlich bin ich dann aus reiner Gewohnheit aufgestanden." In diesem Fall sage ich nicht „weil", da das Geklapper des Milchmanns nicht in den relevanten Bereich von Ereignissen fällt, so wie ich Ihre Frage verstehe. Man könnte einwenden, daß „weil A" nicht nur anzeigt, daß Α ein Grund ist, sondern daß es der Grund, oder wenigstens ein guter Grund ist. Diesem Punkt kann man m. E. auf zwei Arten gerecht werden. Zum einen kann die Relevanzrelation, die bestimmt, welche Art von Antwort gefordert wird, ganz stark konstruiert werden: „Liefern Sie mir ein Motiv, das stark genug ist, um einen Mord zu erklären", „Nennen Sie mir ein statistisch relevantes vorhergehendes Ereignis, das durch kein anderes Ereignis abgeschirmt wird", „Nennen Sie mir eine gemeinsame Ursache" usw. In diesem Fall wird mit der Behauptung, daß die durch Α ausgedrückte Proposition in den relevanten
Die Pragmatik des Erklärens
69
Bereich fallt, zugleich bereits behauptet, daß Α ein guter bzw. aufschlußreicher Grund ist. Doch ich glaube, daß die Forderung nicht so stark konstruiert zu werden braucht; der springende Punkt scheint mir eher darin zu liegen, daß jeder, der eine Frage beantwortet, in gewissem Sinn auch stillschweigend behauptet, eine gute Antwort zu geben. In beiden Fällen aber muß die Bestimmung einer Antwort als gut, aufschlußreich, oder besser als andere mögliche Antworten, noch durchgeführt werden, und ich werde dieses Problem unter der Überschrift „Bewertung" besprechen. Als Festsetzung schlage ich vor, (*) nur dann als eine direkte Antwort zu werten, wenn Α relevant ist. 21 In diesem Fall müssen wir die Behauptung, daß Α relevant ist, nicht als expliziten Teil der Antwort auffassen, sondern können das Wort „weil" lediglich als sprachliches Signal dafür betrachten, daß der geäußerte Antwortsatz dazu intendiert war, eine Antwort auf die gerade gestellte Warum-Frage zu liefern. (Die stillschweigende Behauptung des Antwortenden, daß er eine gute und folglich relevante Antwort gab, ist natürlich immer vorhanden - es geht bloß darum, daß wir diese Behauptung nicht zu einem Teil der Antwort zu machen brauchen.) Unsere Definition lautet damit wie folgt: ist eine direkte Antwort auf die Frage Q = < Pk, X, R> g.d.w. es eine Proposition Α gibt, für die gilt: Α steht in Relation R zu und Β ist jene Proposition, die wahr ist g.d.w. (Pk; und für alle i φ k, nicht P{, und A) wahr ist Β
wobei wie zuvor X = { P l r . . . , Pk,...} gilt. Wie lauten nun, gegeben diese Definition, die Präsuppositionen einer Warum-Frage? Mithilfe von Belnaps allgemeiner Definition können wir ableiten:
21
Ich nenne dies eine Festsetzung, weil die Theorie an dieser Stelle natürlich auch anders weiterentwickelt werden könnte, indem nämlich die Behauptung der Relevanz als explizites Konjunktionsglied in die Antwort eingebaut wird. Das Resultat wäre eine alternative Theorie der Warum-Fragen, die, wie ich glaube, den Phänomenen der Erklärung bzw. der Warum-Fragen und ihren Antworten ebenso gut gerecht werden würde.
70
Bas van Fraassen
Eine Warum-Frage präsupponiert genau, daß (a) ihr Thema wahr ist (b) ihr Thema das einzige wahre Element ihrer Kontrastklasse ist (c) mindestens eine der Propositionen, die zu ihrem Thema und ihrer Kontrastklasse in ihrer Relevanzrelation stehen, wahr ist. Auch wenn alle diese drei Präsuppositionen wahr sind, ist es, wie wir sehen werden, trotzdem möglich, daß die Frage keine gute oder aufschlußreiche Antwort besitzt. Bevor wir uns der Bewertung von Antworten zuwenden, müssen wir uns jedoch noch einem benachbarten Thema widmen: wann stellt sich eine Warum-Frage? In der allgemeinen Theorie der Fragen wurde folgendes miteinander gleichgesetzt: die Frage Q stellt sich und alle Präsuppositionen von Q sind wahr. Ersteres bedeutet, daß Q nicht als fehlerhaft zurückgewiesen werden kann und letzteres, daß es eine wahre Antwort auf Q gibt. Im Fall von Warum-Fragen bewerten wir Antworten im Lichte akzeptierter Hintergrundtheorien (und Hintergrundinformationen); und mir scheint, daß dies einen Keil zwischen die beiden oben gleichgesetzten Begriffe treibt. Natürlich weisen wir manchmal eine Warum-Frage deshalb zurück, weil wir glauben, daß es keine wahre Antwort auf sie gibt. Doch solange wir das nicht glauben, stellt sich die Frage und ist nicht fehlerhaft - unabhängig von dem, was wahr ist. Um dies zu präzisieren und die weitere Diskussion zu vereinfachen, führen wir zwei weitere Spezialbegriffe ein. In der obigen Definition von „direkter Antwort" wollen wir die Proposition Α den Kern der Antwort Β nennen (da die Antwort zu „Weil A" abgekürzt werden kann), und die Proposition, daß (Pk und für alle i # k, nicht Pt) die zentrale Präsupposition der Frage Q. Schließlich nennen wir die Proposition A, wenn sie relevant für < Pk, X> ist, auch relevant für Q. Der Kontext, in dem die Frage gestellt wird, enthält ein gewisses System Ä'von akzeptierter Hintergrundtheorie und Tatsacheninformation. Dieser Hintergrund Κ ist deshalb ein Faktor des Kontextes, weil er davon abhängt, wer der Fragesteller
Die Pragmatik des Erklärens
71
und wer der Befragte ist. Und es ist eben dieser Hintergrund, welcher bestimmt, ob sich die Frage stellt oder nicht. Folglich kann sich eine Frage in einem Kontext stellen (oder umgekehrt, zurecht zurückgewiesen werden) und in einem anderen nicht. Erstens: Ob sich eine Frage genuin stellt oder nicht, hängt davon ab, ob Κ ihre zentrale Präsupposition impliziert oder nicht. Solange die zentrale Präsupposition nicht Teil dessen ist, was im gegebenen Kontext akzeptiert wird bzw. worüber Übereinstimmung herrscht, stellt sich die Warum-Frage überhaupt nicht. Zweitens präsupponiert Q zusätzlich, daß zumindest eine unter den Propositionen A, die für ihr Thema und ihre Kontrastklasse relevant sind, wahr ist. Möglicherweise wird das von Κ nicht impliziert. In diesem Fall stellt sich die Frage jedoch immer noch, vorausgesetzt Κ impliziert nicht, daß alle diese Propositionen falsch sind. Ich schlage also vor, daß wir der Phrase „die Frage stellt sich in diesem Kontext" genau folgende Bedeutung geben: impliziert die zentrale Präsupposition und Κ impliziert nicht die Negation irgendeiner Präsupposition. Man beachte, daß das etwas ganz anderes besagt als „alle Präsuppositionen sind wahr", und wir können diesen Unterschied durch die Betonung von „stellt sich im Kontext" hervorheben. Wir müssen diese Unterscheidung treffen, denn es kann sein, daß Κ uns nicht sagt, welche der möglichen Antworten wahr ist und ob es überhaupt eine wahre gibt; doch durch diese Lücke in Κ wird die Frage selber natürlich nicht eliminiert. II.4. Die Bewertung der Antworten Die Hauptprobleme der philosophischen Erklärungstheorie bestehen darin, die Phänomene der berechtigten Zurückweisung von Erklärungsforderungen und der Asymmetrie der Erklärung befriedigend zu explizieren. Diese Probleme werden m. E. durch unsere Theorie der Warum-Fragen, so wie sie bis jetzt entwickelt worden ist, erfolgreich gelöst. Doch unsere Theorie ist noch nicht vollständig, da sie uns nichts darüber sagt, wie Antworten als aufschlußreich, gut oder besser bewertet werden. Ich werde versuchen, auch dafür ein
72
Bas van Fraassen
Modell zu liefern und dabei zugleich zeigen, daß viel von der Arbeit früherer Autoren über Erklärung am besten als auf eben dieses Problem bezogen aufgefaßt wird. Ich muß jedoch erstens betonen, daß dieser Abschnitt nicht als Hilfe zur Lösung der traditionellen Probleme der Erklärung intendiert ist, und zweitens, daß ich die Theorie der Warum-Fragen, so weit sie bisher entwickelt worden ist, für grundsätzlich korrekt halte, dagegen wesentlich weniger Vertrauen in das habe, was nun folgt. Angenommen wir befinden uns in einem Kontext mit Hintergrund AT von akzeptierter Theorie plus faktischer Information, in dem sich die Frage Q stellt. Q habe das Thema Β und die Kontrastklasse X ={B, C,..., N}. Wie gut ist die Antwort Weil Al Es gibt mindestens drei Arten, auf die diese Antwort bewertet wird. Die erste betrifft die Bewertung von Α selber - als akzeptabel oder als wahrscheinlich wahr. Die zweite betrifft das Ausmaß, in dem Α das Thema Β gegenüber den anderen Elementen der Kontrastklasse favorisiert. (Dies ist der Ort, wo Hempels Kriterium des Lieferns von Erwartungsgründen und Salmons Kriterium der statistischen Relevanz ihre Anwendung finden könnten.) Die dritte Bewertungsart betrifft den Vergleich von Weil Α mit anderen möglichen Antworten auf dieselbe Frage; und sie hat wiederum drei Aspekte: Der erste Aspekt betrifft die Frage, ob Α (gegeben K) wahrscheinlicher ist als andere mögliche Antworten; der zweite, ob Α das Thema in größerem Ausmaß favorisiert; und der dritte, ob Α durch andere Antworten, die gegeben werden könnten, gänzlich oder teilweise irrelevant gemacht wird. (Auf diesen dritten Aspekt lassen sich Salmons Überlegungen über Abschirmung anwenden.) Jede dieser drei Hauptarten der Bewertung muß nun weiter präzisiert werden. Die erste Bewertungsart ist natürlich die einfachste: falls Κ die Negation von Α impliziert, schließen wir Weil Α völlig aus; andernfalls fragen wir nach der Wahrscheinlichkeit, die Κ A verleiht. Dann vergleichen wir diese Wahrscheinlichkeit mit den Wahrscheinlichkeiten, die Κ den Kernen anderer möglicher Antworten verleiht. Danach wenden wir uns der Frage der Favorisierung zu. Wenn sich die Frage, warum Β und nicht C , . . . , Ν der Fall ist, stellt, so muß Κ sowohl Β wie die Falschheit von C,..., Ν impli-
Die Pragmatik des Erklärens
73
zieren. Dennoch ist es genau diese Information, daß das Thema wahr ist und die Alternativen nicht, welche irrelevant ist für die Frage, in welchem Grad die Antwort das Thema favorisiert. Denn die Bewertung benutzt nur jenen Teil der Hintergrundinformation, der die generelle Theorie über die der Frage zugrundeliegenden Phänomene ausmacht, plus gewisse , Hilfstatsachen', welche zwar gewußt werden, aber nicht die zu erklärende Tatsache selber schon implizieren. Dieser Punkt trifft auf alle bisher besprochenen Erklärungsansätze zu, auch wenn es nicht immer extra betont wird. So erklärt beispielsweise in Salmons erstem Ansatz Α Β nur dann, wenn die Wahrscheinlichkeit von B, gegeben A, nicht gleich der Wahrscheinlichkeit von Β simpliciter ist. Wenn ich nun jedoch weiß, daß Α und daß Β (so wie es oft der Fall ist, wenn ich behaupte, daß Β weil A), dann ist meine personelle Wahrscheinlichkeit (das ist die Wahrscheinlichkeit gegeben alle Information, die ich habe) von Α gleich der von Β sowie gleich der von B, gegeben A, nämlich 1. Daher ist die Wahrscheinlichkeit, die ich bei der Bewertung von Antworten benutze, keinesfalls die Wahrscheinlichkeit gegeben meine gesamte Hintergrundinformation, sondern vielmehr die Wahrscheinlichkeit gegeben einige der von mir akzeptierten generellen Theorien plus eine selektive Auswahl aus meiner Fakteninformation. 22 Die Bewertung der Antwort Weil Α auf Frage Q erfolgt also immer nur mit Bezug auf einen gewissen Teil K(Q) von K. Wie dieser Teil ausgewählt wird, ist für alle von mir besprochenen Erklärungstheorien von gleichermaßen hoher Bedeutung. Doch weder die anderen Autoren noch ich können 22
Ich erwähnte hier Salmon, weil er dieses Problem explizit diskutiert. Er nennt es das Problem der Referenzklasse. Für Salmon ist dies Problem mit der (statistischen) Interpretation der Wahrscheinlichkeit verbunden. Doch das Problem ist wesentlich allgemeiner. In deterministischen, nichtstatistischen Erklärungen (welche Hempel deduktiv-nomologische Erklärungen nannte), wird die zu erklärende Tatsache von der als erklärend angeführten Information impliziert. Diese Implikation ist relativ zu unseren Hintergrundannahmen, falls diese nicht selber Teil der angeführten Information sind. Doch klarerweise muß auch in diesem Fall unsere Information, daß die zu erklärende Tatsache tatsächlich stattfand, gewissenhaft aus diesen Hintergrundannahmen ausgeschlossen werden, um den Erklärungsbegriff nicht völlig zu trivialisieren. Mutatis mutandis gilt dies für statistische Erklärungen gemäß dem Bayesianischen Ansatz, was in Glymour (1980) besonders hervorgehoben wird.
74
Bas van Fraassen
viel darüber sagen. Daher muß die Auswahl des Teils K(Q) von K, der der Bewertung von Α zugrunde liegt, als ein weiterer kontextueller Faktor angesehen werden. 23 Wenn K(Q) und Α zusammen Β implizieren, und die Falschheit von C , . . . , Ν implizieren, dann erhält die Antwort Α für ihre Favorisierung des Themas Β die höchste Bewertung. Falls dies auf Α nicht zutrifft, so müssen wir Α hinsichtlich des Ausmaßes bewerten, in dem Α die Wahrscheinlichkeiten auf der Kontrastklasse zugunsten einer Favorisierung von Β gegenüber seinen Alternativen umverteilt. Nennen wir (im jeweils gegebenen Kontext) die Wahrscheinlichkeit, gegeben K(Q) alleine, die Ausgangswahrscheinlichkeit (prior probability) und die Wahrscheinlichkeit, gegeben K(Q) plus Α die Endwahrscheinlichkeit (posterior probability). Dann ist die Bewertung von A maximal, wenn die Endwahrscheinlichkeit von Β 1 ist (und die der Alternativen 0). Aber auch wenn dies nicht auf Α zutrifft, so kann Α dennoch eine hohe Bewertung erzielen, sofern nämlich Α die Wahrscheinlichkeitsverteilung auf der Kontrastklasse zugunsten einer Anhäufung über dem Thema Β verschiebt: beispielsweise dann, wenn Α die Wahrscheinlichkeit von Β erhöht und gleichzeitig die von C,...,N senkt; oder auch dann, wenn Α die Wahrscheinlichkeit von Β nicht senkt, jedoch die Wahrscheinlichkeit einiger der nächsten Konkurrenten von B. 23
Ich habe bewußt die Notation K(Q) gewählt, um den Bezug zu Modellen des rationalen Glaubens, der Konditionalsätze und des hypothetischen Schließens anzudeuten, so wie sie ζ. B. von William Harper diskutiert wurden. Es gibt hierfür ζ. B. den sogenannten Ramsey-Test: um herauszufinden, ob eine Person mit dem Gesamtsystem an Hintergrundannahmen Κ das Konditional wenn A, dann Β akzeptiert, müssen wir prüfen, ob K(A) Β impliziert, wobei K(A) die ,minimale Revision' von Κ ist, die Α impliziert. Um umgekehrt Α in Frage zu stellen, muß eine Person in ähnlicher Weise ihr Hintergrundwissen von Κ zu K?A verschieben, mit K?A als der ,minimalen Revision' von K, die mit Α konsistent ist. Man kann vermuten, daß K(A) mit (K?A) Λ Α identisch ist. Was ich oben K(Q) genannt habe, könnte in ähnlicher Weise als die minimale Revision von Κ angesehen werden, welche mit jedem Element der Kontrastklasse von Q sowie auch mit der Negation von Q kompatibel ist. Ich bin mir zwar nicht sicher, ob dieses Modell der minimalen Revision das richtige ist, doch die aufgezeigten suggestiven Ähnlichkeiten deuten zumindest auf wichtige Zusammenhänge hin; es scheint jedenfalls zweifellos der Fall zu sein, daß Erklärungen hypothetisches Schließen involvieren. Für die erwähnte Literatur vgl. Harper (1976) sowie (1977).
Die Pragmatik
des Erklärens
75
Ich werde hier keine präzise Funktion für das Ausmaß vorschlagen, in dem die Endwahrscheinlichkeitsverteilung, verglichen zur Ausgangswahrscheinlichkeitsverteilung, Β gegenüber seinen Alternativen favorisiert. Zwei Dinge zählen jedenfalls hierbei: die Minima der Wahrscheinlichkeitsvorsprünge von Β gegenüber C , . . . , Ν (in anderen Worten: die Höhe der Wahrscheinlichkeitsvorsprünge von Β gegenüber seinen nächsten Konkurrenten in C , . . . , N), und die Anzahl jener Alternativen in C,...,N, denen gegenüber Β diese minimalen Wahrscheinlichkeitsvorsprünge besitzt (mit anderen Worten: die Anzahl der nächsten Konkurrenten von B). Ersteres sollte ansteigen, letzteres sollte abnehmen. Ein solcher Zuwachs der Favorisierung des Themas ist durchaus vereinbar mit einer Abnahme der Wahrscheinlichkeit des Themas. Man denke sich hierzu eine Kurve, die die Wahrscheinlichkeitsverteilung über der Kontrastklasse darstellt: man kann sich dann leicht eine Verschiebung der Kurve vorstellen, die zu einem Gipfel über dem Thema führt - wie ein aus dem Wald herausragender einzelner Baum - obwohl der so entstandene Vorsprung nur ein relativer ist. Das folgende schematische Beispiel soll dies illustrieren (mit Prob = Wahrscheinlichkeit; = = bis auf angegebene Stellenzahl gleich). Frage: Warum Ex und nicht E2,...,£1000? Antwort: Weil A. Ausgangswahrscheinlichkeiten: Prob(E1) = ... = Prob(E10) = 99/1000 = 0,099 Prob(Ell) = ... = Prob(E1000) = 1/99.000 = 0,00001 Endwahrscheinlichkeiten: Prob(EJA) = 90/1000 = 0,090 Prob(E2/A) = ... = Prob(E1000/A) = 910/999.000 = 0,001 Vor der Antwort war hier E^ zwar ein guter Kandidat, aber gegenüber neun Alternativen E2,...,El0'm keiner Weise favorisiert. Nach der Antwort ragt El unter allen Alternativen deutlich ,mit Kopf und Schultern' heraus, hat aber eine geringere Wahrscheinlichkeit als zuvor. Ich denke, daß dadurch einige der Verwirrungen beseitigt werden, die sich in Abschnitt I im Zusammenhang mit Salmons
76
Bas van Fraassen
Beispielen von Erklärungen, die die Wahrscheinlichkeit des zu Erklärenden erniedrigen, ergeben haben. In Nancy Cartwrights Beispiel vom Giftsumach („Warum lebt diese Pflanze?") ist die Antwort („Sie wurde mit Entlaubungsmittel besprüht") zwar statistisch relevant, aber sie verteilt die Wahrscheinlichkeiten nicht auf eine solche Weise um, daß dadurch das Thema favorisiert wird. Die bloße Tatsache, daß die Wahrscheinlichkeit gesenkt wurde, ist jedoch nicht genug, um eine Antwort als aufschlußreich oder gut zu qualifizieren. Es gibt noch eine weitere Spielart, in der Α Informationen zur Verfügung stellen kann, die das Thema favorisieren. Diese Spielart hat mit dem sogenannten Simpsonschen Paradox zu tun; und es war wieder Nancy Cartwright, die die Bedeutung dieses Problems für die Theorie der Erklärung hervorgehoben hat (vgl. Cartwright 1979). Sie benutzte folgendes Beispiel, um das Problem zu illustrieren: Stehe Η für „Tom hat ein Herzleiden", R für „Tom ist Raucher" und S für „Tom macht Sportübungen", und nehmen wir folgende Wahrscheinlichkeiten an:
fι I I
t
I I I I I I I 5! I I I I I I
Ϊ.
Die schraffierten Gebiete repräsentieren die Fälle, in denen Η wahr ist; die angeführten Zahlen geben die Wahrscheinlichkei-
Die Pragmatik des Erklärens
77
ten wieder. Aufgrund elementarer Kalkulation ergeben sich die bedingten Wahrscheinlichkeiten wie folgt: Prob(H/R) Prob (H\R Prob(H/S) Prob(H/R Prob(H/~ι
= Prob(H) a S ) = Λ S)
=
j
= i
i ι S) =
= 1 |
Obwohl in diesem Beispiel die Wahrscheinlichkeit von Η gegeben R gleich der Ausgangswahrscheinlichkeit von Η ist, favorisiert die Antwort „Weil Tom raucht" hier dennoch das Thema „Tom hat ein Herzleiden", in einer unmittelbar einleuchtenden, obwohl abgeleiteten Weise. Denn wir würden anhand dieser Wahrscheinlichkeiten argumentieren, daß die Wahrscheinlichkeit des Herzleidens durch das Rauchen sowohl im Fall, daß Tom Sportübungen macht, wie auch in dem Fall, daß er keine Sportübungen macht, ansteigt - und eine der beiden Fälle muß auf Tom zutreffen. 24 Daher müssen wir zu unserer bisherigen Charakterisierung der Bedeutung von „ Α favorisiert Β gegenüber C , . . . , JV" folgendes hinzufügen: wenn Ζ = { Z x , . . . , Z„} eine logische Partition 25 von erklärungsrelevanten Alternativen ist, und wenn die Hinzufügung jedes beliebigen Elements von Ζ zu unserer Hintergrundinformation zur Folge hat, daß Α Β gegenüber C , . . . , Ν favorisiert, dann favorisiert Α Β gegenüber C,...,N. Wir haben nun zwei Arten der Bewertung besprochen: wie wahrscheinlich ist Α selber?, und, wie stark favorisiert Α Β gegenüber C,...,N1 Dies sind zwei voneinander unabhängige Fragen. Bei der zweiten Bewertungsart wissen wir zwar, welche Aspekte wir zu betrachten haben, doch wir verfügen über keine präzise Formel, die diese Aspekte quantitativ ,aufaddiert'. Wir 24
25
[Anm. d. Hrsg.:] Dieser Fall entspricht dem, was von Stegmüller (1983, S. 617f) im Anschluß an Wolfgang Spohn versteckte Ursache genannt wurde. [Anm. d. Hrsg.:] Eine logische Partition ist eine Menge von Ereignistypen resp. komplexen Prädikaten, die sich gegenseitig ausschließen und von denen aus logischen Gründen eines (auf ein gegebenes Individuum) zutrifft. Ζ. B. sind {Fx,~Ι Fx} oder {FJC Λ Gx,~t Fx A GX, Fx Λ —Ι Gx, ι Fx Λ ι Gx] Partitionen.
78
Bas van Fraassen
verfügen auch über keine präzise Formel, die die Bedeutung der Antwortwahrscheinlichkeit gegenüber der Bedeutung des Favorisierungsausmaßes gewichtet. Doch ich zweifle an dem Wert eines Versuches, all diese Aspekte zu einem einparametrigen Maß zu kombinieren. In jedem Fall aber sind wir noch nicht fertig. Denn es gibt Beziehungen zwischen Antworten, die über ihren Vergleich hinsichtlich der bisher entwickelten Bewertungskriterien hinausgehen. Ein bekanntes Beispiel, das mit dem Simpsonschen Paradox zusammenhängt und ebenfalls in Cartwrights Aufsatz (1979) diskutiert wird, ist folgendes: An einer bestimmten Universität in den USA fand man heraus, daß die Aufnahmerate für Frauen niedriger war als für Männer. Es scheint hier also zunächst, daß beispielsweise die Aussage „Janet ist eine Frau" eher für „Janet wurde nicht aufgenommen" als für „Janet wurde aufgenommen" spricht. Dennoch hatte der Fall nichts mit einer geschlechtsspezifischen Tendenz zu tun. Denn die Aufnahmeraten waren in jeder einzelnen Fachabteilung der Universität für Frauen und Männer annähernd gleich. Der statistische Trend kam nur dadurch zustande, weil Frauen zur Bewerbung in solchen Fächern tendierten, die generell geringere Aufnahmeraten hatten. Angenommen, in unserem Beispiel bewarb sich Janet für die Aufnahme im Fach Geschichte: dann wird die Aussage „Janet ist eine Frau" durch die Aussage „Janet bewarb sich für Geschichte" vom Thema „Janet wurde nicht aufgenommen" abgeschirmt (im Reichenbach-Salmonschen Sinn von „Abschirmung": Ρ schirmt Α von Β ab g.d.w. die Wahrscheinlichkeit von Β gegeben Ρ und Α gleich ist wie die Wahrscheinlichkeit von B, gegeben Ρ allein). Offensichtlich ist die Information, daß Janet sich im Fach Geschichte (oder welchem auch immer) bewarb, eine wesentlich aufschlußreichere Antwort als die frühere Erwiderung (wonach sie eine Frau sei), denn sie erweist diese frühere Erwiderung als irrelevant. 26
26
[Anm. d. Hrsg.:] Gilt Prob(AIB) > Prob(A) und schirmt Ρ Β von Α ab, d. h. gilt Prob (Α! Β Λ Ρ) = Prob(AfP), so nennt Stegmüller (1983, S. 607f und 612f) im Anschluß an Suppes (1970, S.21f und 2 8 0 Β im Falle, daß Ρ zeitlich vor Β zeitlich vor Α liegt, auch Scheinursache für Α und im Falle, daß Β zeitlich vor Ρ zeitlich vor Α liegt, auch indirekte Ursache für A.
Die Pragmatik des Erklärens
79
Wir müssen bei der Anwendung dieses Kriteriums jedoch vorsichtig sein. Erstens ist es ohne Belang, wenn Α von Β durch eine Proposition Ρ abgeschirmt wird, die nicht Kern einer Antwort auf die Frage ist. Wenn etwa die Warum-Frage eine Forderung nach Information über die mechanischen Prozesse, die zu dem Ereignis führten, enthält, so wird die gegebene Antwort nicht schlechter, wenn sie durch andere Arten von Information abgeschirmt wird. Beispielsweise können wir die Frage „Warum starb Peter?" mit „Aufgrund eines schweren Schlages auf den K o p f sehr gut beantworten, auch wenn wir dabei schon wissen, daß Peter in irgendeiner Weise von Paul ermordet wurde. Zweitens kann eine abgeschirmte Antwort auch gut, aber bloß partiell sein - sie muß nicht immer irrelevant sein. (In demselben Beispiel wissen wir etwa auch, daß es eine wahre Aussage der Form „Peter erhielt einen Schlag auf den Kopf mit Impuls χ " gibt, aber dies disqualifiziert die gegebene Antwort nicht, es zeigt nur, daß eine noch informativere Antwort möglich ist.) Im Fall eines deterministischen Prozesses schließlich, wo ein Zustand Ai+l strikt auf Zustand At und nur auf diesen folgt, können die besten Antworten auf die Frage „Warum ist das System zur Zeit t„ im Zustand Α„Ί" alle die Form „Weil das System zur Zeit tt im Zustand At war" haben, obwohl jede unter diesen gleich guten Antworten durch jede andere vom Thema abgeschirmt wird. - Die angemessenste Schlußfolgerung aus all dem ist wohl nicht mehr als folgende: wenn eine Antwort von einer zweiten abgeschirmt wird, und nicht umgekehrt, dann ist die zweite in irgendeiner Hinsicht besser. Der Ansatz, den ich für die Bewertung von Erklärungen anbieten kann, ist weder so vollständig noch so präzise, wie es sich manche wohl wünschen würden. Er teilt jedoch seine Mängel mit den anderen mir bekannten philosophischen Theorien der Erklärung (denn ich habe diese anderen Theorien schamlos verwendet, als es darum ging, Bewertungskriterien für Antworten anzuführen). Und die traditionellen Hauptprobleme der Theorie der Erklärung werden nicht durch Überlegungen, wie diese Kriterien am besten lauten sollten, gelöst, sondern durch die allgemeine Theorie von Erklärungen als Antworten auf Warum-Fragen, die ihrerseits in verschiedenen Hinsichten kontextuell determiniert sind.
80
Bas van Fraassen
II.5. Ausarbeitung von Präsupposition und Relevanz Betrachten wir die Frage „Warum emittiert das Wasserstoffatom Photonen mit den Frequenzen der allgemeinen BalmerSerie?" Diese Frage präsupponiert, daß das Wasserstoffatom tatsächlich Photonen mit diesen Frequenzen emittiert. Wie kann ich diese Frage also überhaupt stellen, ohne zu glauben, daß diese theoretische Präsupposition wahr ist? Macht meine Theorie der Warum-Fragen nicht automatisch aus uns allen wissenschaftliche Realisten? Doch erinnern wir uns an das am Ende von Abschnitt 1.1 Gesagte: Wir müssen sorgfaltig unterscheiden zwischen dem, was eine Theorie besagt und dem, was wir glauben, wenn wir diese Theorie akzeptieren (bzw. wenn wir uns auf sie zu einem gewissen Zweck stützen, etwa um das Wetter vorauszusagen oder eine Brücke zu bauen). Wie ich argumentierte, ist das epistemische Zugeständnis, das mit dem Akzeptieren einer wissenschaftlichen Theorie verbunden ist, nicht der Glaube, daß sie wahr ist, sondern lediglich der schwächere Glaube, daß sie empirisch adäquat ist. In genau der selben Weise müssen wir das, was eine Frage sagt (d. h. präsupponiert) von dem unterscheiden, was wir glauben, wenn wir die Frage stellen. Das oben angeführte Beispiel ist eine Frage, die sich in jedem Kontext stellt (so wie ich den Begriff definiert habe), in dem diese Hypothesen über Wasserstoff und die fragliche Atomtheorie akzeptiert werden. Wenn ich diese Frage nun stelle - vorausgesetzt, ich stelle sie ernsthaft und in eigener Person - dann impliziere ich dabei meinen Glauben daran, daß sich die Frage tatsächlich stellt. Doch dies bedeutet lediglich, daß das im Stellen meiner Frage involvierte bzw. dadurch zum Ausdruck gebrachte epistemische Zugeständnis genau jenes epistemische Zugeständnis ist, das ich durch das Akzeptieren der fraglichen Theorien eingehe - nicht mehr und nicht weniger. Freilich sind in einem Kontext, in dem diese Theorien akzeptiert werden, die Gesprächsteilnehmer dem Weltbild dieser Theorien konzeptuell verhaftet. Sie sprechen die Sprache dieser Theorie. Die phänomenologische Unterscheidung zwischen dem Objektiven oder Realen, und dem Nichtobjektiven oder Nichtrealen, ist eine Unterscheidung zwischen dem Existieren-
Die Pragmatik des Erklärens
81
den und dem Nichtexistierenden, welche innerhalb dieses theoretischen Bildes gezogen wird. Daher werden die Fragen, die gestellt werden, innerhalb der theoretischen Sprache gestellt wie könnte es anders sein? Doch die epistemischen Zugeständnisse, die die Gesprächsteilnehmer eingehen, lassen sich nicht an ihrem Sprachgebrauch ablesen. Die Relevanz - vielleicht die zweite Haupteigenart von Warum-Fragen - wirft ein anderes kniffliges Problem auf, und zwar für die zugrundeliegende Logik. Angenommen, ich stelle eine Frage über eine aus Natrium bestehende Substanz, und meine Hintergrundtheorie schließt die gegenwärtige Atomphysik ein. Dann wird die Antwort auf diese Frage wohl etwa folgende sein: weil diese Substanz die und die Atomstruktur hat. Erinnern wir uns, daß diese Antwort in einem der in Teil I angeführten Hauptbeispiele zur Illustration der Erklärungsasymmetrie vorkam: wie wir dort sahen, ist relativ zur gegebenen Hintergrundtheorie die in dieser Antwort ausgedrückte Proposition notwendigerweise äquivalent zu folgender Proposition: weil diese Substanz das und das charakteristische Spektrum hat. Denn das charakteristische Spektrum ist eindeutig - es identifiziert die Atomstruktur einer Substanz. Und dennoch liegt Asymmetrie vor: ich kann die Frage nicht gut mit dem Hinweis auf das charakteristische Spektrum der Substanz beantworten. Die beiden Propositionen, eine davon relevant und die andere nicht, sind äquivalent relativ zur Theorie. Daher sind sie in genau denselben von der Theorie zugelassenen möglichen Welten wahr (oder weniger metaphysisch: in genau denselben Modellen der Theorie wahr). An dieser Stelle kommen wir daher in Konflikt mit der in der formalen Semantik üblichen vereinfachenden Hypothese, derzufolge Propositionen, die in genau denselben möglichen Welten wahr sind, miteinander identisch sind. Denn wenn eine Proposition relevant ist und die andere nicht, dann können beide nicht identisch sein. Wir könnten diesen Konflikt vermeiden, indem wir uns auf mögliche Welten berufen, die von der Theorie nicht zugelassen werden. Dies würde bedeuten, daß wir deshalb im gegebenen Kontext die erste Proposition als relevant und die zweite als nicht relevant und daher von der ersten verschieden ansehen,
82
Bas van Fraassen
weil wir teilweise im Lichte von möglichen Welten (bzw. Modellen) urteilen, die im gegebenen Kontext unmöglich sind. Obwohl ich keinen völlig überzeugenden Einwand gegen diese Lösung habe, bin ich doch dazu geneigt, zu einem anderen semantischen Modell der Sprache überzugehen und die vereinfachende Hypothese zu verwerfen. Glücklicherweise gibt es eine Reihe von anderen Arten formaler Sprachmodelle - die übrigens nicht überraschend in Erwiderung auf andere Reflexionen über Relevanz entstanden sind - , in welchen Propositionen differenzierter individuiert werden können. Eine spezielle Modellart, welche eine Sematik für Anderson und Belnaps Logik des tautologischen Entailments (1975) liefert, basiert auf dem Begriff der Tatsache (fact, vgl. hierzu meine Arbeit 1969). In diesem Modell können die beiden Propositionen Entweder es regnet gerade oder es regnet nicht Entweder es schneit gerade oder es schneit nicht obwohl in genau denselben möglichen Situationen wahr (nämlich in allen), voneinander unterschieden werden aufgrund der Überlegung, daß - beispielsweise heute - die erste Proposition durch die Tatsache, daß es gerade regnet, wahr gemacht wird, während die zweite Proposition durch eine ganz andere Tatsache wahr gemacht wird, nämlich, daß es gerade nicht schneit. In einer anderen Modellart, die von Alasdair Urquhart entwickelt wurde, wird diese Individuierungsfunktion nicht von Tatsachen, sondern von Informationssystemen übernommen. 27 Darüberhinaus stehen noch weitere, nicht unbedingt mit Logiken der Anderson-Belnapschen Art verknüpfte Ansätze zur Verfügung. In jedem dieser Modelle leitet sich in der Folge die Relevanzrelation zwischen Propositionen von einer tieferen Relevanzrelation ab. Wenn wir beispielsweise das Modell der Tatsachen benutzen, so wird sich die Relation R von der Forderung ableiten, die Antwort solle Propositionen anführen, welche Tatsachen einer gewissen Art beschreiben (bzw. von ihnen wahr ge-
27
Für diesen und andere Ansätze zur Semantik der Relevanz vgl. Anderson/Belnap (1975).
Die Pragmatik des Erklärens
83
macht werden): ζ. B. Tatsachen über Atomstrukturen, oder Tatsachen über die medizinische und physische Vorgeschichte dieser Person, oder wie auch immer. II. 6. Schlußfolgerung Machen wir eine Bestandsaufnahme. Traditionellerweise sagt man, daß Theorien in zwei Arten von Relationen zu den beobachtbaren Phänomenen stehen: Beschreibung und Erklärung. Eine Beschreibung kann mehr oder weniger genau sein, und mehr oder weniger informativ; Minimalforderung für die Beschreibung ist, daß die Tatsachen von der Theorie „zugelassen" werden müssen (in einige ihrer Modelle passen müssen), und das Maximum ist erreicht, wenn die Theorie die in Frage stehenden Fakten tatsächlich impliziert. Doch zusätzlich zu einer (mehr oder weniger informativen) Beschreibung kann die Theorie Erklärungen liefern. Dies sei etwas über Beschreibung Hinausgehendes: beispielsweise beschreibt Boyles Gesetz zwar die Beziehung zwischen Druck, Temperatur und Volumen eines abgeschlossenen Gases, aber es erklärt diese Beziehung nicht nur die kinetische Theorie erklärt sie. Man zog daraus den, wie ich glaube korrekten, Schluß, daß sogar zwei empirisch strikt äquivalente Theorien sich darin unterscheiden können, daß die eine gewisse erklärungssuchende Fragen beantworten kann, die andere jedoch nicht. Viele Bemühungen wurden unternommen, um diese ,Erklärungskraft' allein mithilfe jener Eigenschaften und Fähigkeiten von Theorien darzustellen, welche die Theorie informativ machen (d. h., welche es ihr ermöglichen, bessere Beschreibungen zu liefern). So ist Hempel der Ansicht, daß auch das Boylesche Gesetz die empirischen Fakten über das Verhalten von Gasen erklärt, wenn auch nur in minimaler Weise. Die kinetische Gastheorie ist möglicherweise als Erklärung besser, einfach weil sie wesentlich mehr Information über das Gasverhalten liefert, weil sie die drei fraglichen Größen mit anderen beobachtbaren Größen verknüpft, weil sie eine wunderbare Einfachheit besitzt und unser theoretisches Weltbild vereinheitlicht, usw. Auch die Verwendungen von raffinierteren statistischen Beziehungen bei Wesley Salmon und James Greeno (sowie I. J. Good, dessen
84
Bas van Fraassen
Theorie über solche Begriffe wie Bestätigungsgrad, Bewährung, Erklärungskraft, etc., mehr philosophische Beachtung verdient) sind allesamt Bemühungen, die auf dieser Linie liegen. 28 Wären diese Bemühungen erfolgreich gewesen, so könnte sich ein Empirist mit dem Stand der Dinge um das Erklärungsproblem zufrieden geben und sich auf dem Erreichten ausruhen. Doch diese Bemühungen haben in scheinbar unüberwindbare Schwierigkeiten geführt. Die Überzeugung wuchs, Erklärungskraft sei etwas Irreduzibles, eine spezielle Eigenschaft, von anderem Typ als empirische Adäquatheit und empirische Aussagekraft. Die Untersuchung von Beispielen widersteht allen Versuchen, die Fähigkeit zur Erklärung mit irgendeinem Komplex jener vertrauten und bodenständigen Leistungen zu identifizieren, welche zur Bewertung einer Theorie als Beschreibung herangezogen werden. Gleichzeitig wurde argumentiert, wonach die Wissenschaft wirklich trachte, sei Verstehen, und dieses bestünde in der Fähigkeit, Erklärungen zu geben; daher ginge das, wonach Wissenschaft wirklich trachtet, wesentlich über empirische Adäquatheit und Aussagekraft hinaus. Und schließlich, nachdem die Fähigkeit einer Theorie zur Erklärung ein klarer Grund für ihre Akzeptierung darstellt, argumentierte man, daß Erklärungskraft Evidenz für die Wahrheit einer Theorie sei, und zwar eine spezielle Evidenz, die über jegliche Evidenz für die empirische Adäquatheit einer Theorie hinausginge. Um die Jahrhundertwende hatte bereits Pierre Duhem diese Sichtweise von Wissenschaft durch das Argument zu entlarven versucht, Erklärung sei kein Ziel der Wissenschaft. Zurückblikkend betrachtet hat er den Erklärungs-Mystizismus, den er attackierte, begünstigt. Denn er bemühte sich, nachzuweisen, daß Erklärungskraft nicht aus Beschreibungsressourcen besteht. Er argumentierte, daß nur metaphysische Theorien erklären würden, und Metaphysik sei ein der Wissenschaft ganz fremdes Unterfangen. Doch fünfzig Jahre später, als Quine behauptete, es gäbe keine Grenzziehung zwischen Wissenschaft und Philosophie, und als die Schwierigkeiten der antimetaphysischen
28
Vgl. Good (1960), (1960/61/62). Für eine Diskussion vgl. Salmon (1980).
Die Pragmatik des Erklär ens
85
Haltung positivistisch orientierter Philosophien eine Rückkehr zu metaphysischen Bemühungen hervorriefen, da bemerkte man, daß die Tätigkeit der Wissenschaften doch Erklärung involviert, und schnell wurde Duhems Argument zurückgedrängt. Sobald man entscheidet, Erklärung sei etwas Irreduzibles und Besonderes, ist die Tür offen für die Erarbeitung von weiteren hierher gehörenden Konzepten, allesamt ebenfalls irreduzibel und von besonderer Art: Die Prämissen einer Erklärung müssen gesetzesartige Aussagen enthalten; eine Aussage ist gesetzesartig g.d.w. sie einige nichttriviale kontrafaktische Aussagen impliziert; doch das kann sie nur, wenn sie Beziehungen der Notwendigkeit in der Natur behauptet. Nicht alle Klassen korrespondieren genuinen Eigenschaften; (genuine) Eigenschaften und Propensitäten treten in Erklärungen auf. Nicht jeder hat sich dieser Rückkehr zum Essentialismus und neo-Aristotelischen Realismus angeschlossen, doch einige berühmte Realisten haben diesen Standpunkt in allseits bekannter Weise erforscht oder vertreten. Sogar gemäßigtere Ausarbeitungen des Erklärungsbegriffs treffen mysteriöse Unterscheidungen. Nicht jede Erklärung ist eine wissenschaftliche Erklärung. Also gut, dann tritt jene irreduzible Erklärungsbeziehung in verschiedenen distinkten Typen auf, einer darunter der wissenschaftliche Typ. Eine wissenschaftliche Erklärung hat eine besondere Form, und führt, um zu erklären, nur eine besondere Art von Information an - nämlich Information über kausale Beziehungen und kausale Prozesse. Eine kausale Beziehung ist natürlich das, was das Wort „weil" bezeichnen muß; und nachdem das Summum bonum der Wissenschaft Erklärung ist, muß Wissenschaft sich um die Beschreibung von etwas hinter den beobachtbaren Phänomenen Liegendem bemühen - nämlich kausalen Beziehungen und Prozesse. Diese beiden letzten Absätze stellen jene Fantasieflüge dar, welche zweckdienlich werden, wenn Erklärung als Relation sui generis zwischen Theorien und Tatsachen aufgefaßt wird. Doch dafür gibt es überhaupt keine unmittelbare Evidenz. Denn wenn Sie einen Wissenschaftler bitten, Ihnen etwas zu erklären, so wird die Information, die er Ihnen hierfür gibt, in ihrer Art
86
Bas van Fraassen
keineswegs anders sein (und auch nicht anders klingen oder aussehen) als jene Information, die er Ihnen gibt, wenn Sie ihn um eine Beschreibung bitten. Und ganz ähnlich ist es in,alltäglichen' Erklärungen: so ist etwa die Information, die ich anführe, um das Steigen des Ölpreises zu erklären, identisch mit jener Information, die ich auf eine Batterie von nach Beschreibungen ausgerichteten Fragen über öllieferungen, Ölproduzenten und Ölkonsumenten gegeben hätte. Eine Erklärung wissenschaftlich zu nennen bedeutet nicht, etwas über ihre Form oder die Art der von ihr angeführten Information zu sagen, sondern lediglich zu behaupten, daß die Erklärung von der Wissenschaft Gebrauch macht, um diese Information zu gewinnen, sowie noch wichtiger, daß die Kriterien für die Bewertung der Erklärung zum Gebrauch einer wissenschaftlichen Theorie angewandt werden (in der in Abschnitt II.4 skizzierten Weise). Die Diskussion über den Erklärungsbegriff ging von Anfang an in die falsche Richtung, als Erklärung als eine der Beschreibung gleichartige Beziehung aufgefaßt wurde: als eine Beziehung zwischen Theorie und Tatsache. In Wirklichkeit ist Erklärung eine dreistellige Relation, zwischen Theorie, Tatsache und Kontext. Kein Wunder, daß keine einzelne Relation zwischen Theorie und Tatsache jemals in der Lage war, mehr als einige wenige Beispiele zu erfassen! Eine Erklärung zu sein ist etwas essentiell Relatives, denn eine Erklärung ist eine Antwort. (Im selben Sinn, wie eine Tochter zu sein etwas Relatives ist: jede Frau ist eine Tochter und jede Tochter eine Frau; dennoch ist eine Tochter zu sein nicht dasselbe wie eine Frau zu sein.) Da eine Erklärung eine Antwort ist, wird sie gegenüber einer Frage bewertet, die eine Forderung nach Information enthält. Welche Information genau jedoch in einer Frage der Form „Warum ist es der Fall, daß P " gefordert wird, differiert von Kontext zu Kontext. Darüberhinaus sind die Hintergrundtheorie und die Daten, aufgrund derer eine Frage als sich stellend oder sich nicht stellend bewertet wird, vom Kontext abhängig. Und sogar jener Teil der Hintergrundinformation, welcher zur Bewertung einer Antwort als mehr oder weniger gute Antwort auf die gegebene Frage herangezogen wird, ist ein kontextuell determinierter Faktor. Die Behauptung, eine gegebene Theorie könne zur Erklärung gewisser Tatsachen gebraucht werden, ist also immer
Die Pragmatik des Erklärens
87
eine elliptische Wendung für folgende Behauptung: es gibt eine Proposition, welche eine aufschlußreiche bzw. gute Antwort ist, relativ zu dieser Theorie und zu dieser Forderung nach Information über gewisse Tatsachen (jene, welche für diese Frage als relevant zählen), die von Bedeutung sind für den Vergleich der faktisch eingetretenen Tatsache mit gewissen (kontextuell spezifizierten) Alternativen, die nicht eingetreten sind. Wissenschaftliche Erklärung ist also nicht (reine) Wissenschaft, sondern eine Anwendung von Wissenschaft. Sie ist ein Gebrauch von Wissenschaft, um bestimmte Wünsche von uns zu befriedigen. Es sind dies sehr spezifische Wünsche in einem spezifischen Kontext, doch es sind immer Wünsche nach deskriptiver Information. (Man erinnere sich: jede Tochter ist eine Frau...). Der genaue Gehalt eines solchen Wunsches, und die Bewertung, wie gut er befriedigt wurde, variieren von Kontext zu Kontext. Es handelt sich nicht um einen einzelnen Wunsch, um einen in allen Fällen gleichen Wunsch nach einer speziellen Sache, sondern vielmehr in jedem Fall um einen anderen Wunsch nach einer durchaus vertrauten Sache. Daher kann es nach Erklärungskraft als solcher überhaupt keine (sinnvolle) Frage geben (ebenso wie es dumm wäre, nach der ,Kontrollkraft' einer Theorie zu fragen, obwohl wir uns freilich auf Theorien stützen, um Kontrolle über die Natur und über die äußeren Umstände zu gewinnen). Ebenso kann es keine Frage nach Erklärungsfortschritt geben als einer Art von Evidenz für die Wahrheit einer Theorie, welche über jegliche Evidenz für die Adäquatheit ihrer Beschreibungen hinausgeht. Denn in jedem einzelnen Fall ist ein Erklärungsfortschritt ein Fortschritt in adäquater und informativer Beschreibung. Und während es wahr ist, daß wir nach Erklärungen suchen, so liegt der Wert dieser Suche für die Wissenschaft doch darin, daß die Suche nach Erklärung ipso facto eine Suche nach empirisch adäquaten und gehaltvollen Theorien ist.
Literatur Anderson, A. R./Belnap, N. D. Jr. (1975): Entailment, Princeton Univ. Press, Princeton. Belnap, Ν. D. Jr. (1963): An Analysis of Questions: Preliminary Report,
88
Bas van Fraassen
System Development Cooperation, technical memorandum 7-12871000/00, Santa Monica, Kalifornien. Belnap, N. D. Jr./Steel, J. B. Jr. (1976): The Logic of Question^ and Answers, Yale University Press, New Haven. Böhm, D. (1957): Causality and Chance in modern Physics, Routledge & Kegan Paul, London. Braithwaite, R. B. (1953): Scientific Explanation. Cambridge University Press, Cambridge. Bromberger, S. (1965): „An Approach to Explanation", in: Butler, R. J. (Hrsg.), Analytical Philosophy, Second Series, Basil Blackwell, Oxford, S. 72-105. Bromberger, S. (1966): „Why-Questions", in: Colodny, R. G. (Hrsg.) S. 86-108. Cartwright, N. (1979): „Causal Laws and Effective Strategies", Nous 13, S. 419-437. Churchland, P. H./Hooker, C. A. (Hrsg., 1985), Images of Science: Essays on Realism and Empiricism. With a Replyfrom Bas C. van Fraassen, Univ. of Chicago Press, Chicago. Colodny, R. G. (Hrsg., 1966): Mind and Cosmos, Univ. of Pittsburgh Press, Pittsburgh. Darwin, C. (1962): On the Origin of the Species. 6. Aufl., Collier, New York, S. 467. Feigl, H./Brodbeck, M. (Hrsg., 1953): Readings in the Philosophy of Science. Appleton-Century-Crofts, New York. Garfinkel, A. (1981): Forms of Explanation: Rethinking the Question of Social Theory, Yale Univ. Press, New Haven. Glymour, C. (1980): Theory and Evidence, Princeton University Press, Princeton. Good, I. J. (1960): „Weight of Evidence, Corroboration, Explanatory Power, and the Utility of Experiments", Journal of the Royal Statistical Society, series B, 22, S. 319-331. Good, I. J.: (1960/61/62): „A Causal Calculus", British Journalfor the Philosophy of Science 11, 1960/61, S. 305-318 und 12, 1961/62, S. 43-51. Hamblin, C. L. (1958): „Questions", Australasian Journal of Philosophy 36, S. 159-168. Hannson, B. (1974): „Explanations-of-What?", vervielfältigtes Manuskript, Stanford University. Hanson, N. R. (1958): Patterns of Discovery, Cambridge University Press, Cambridge. Harper, W. (1976): „Ramsey Test Conditionals and Iterated Belief Change", in: Harper/Hooker (Hrsg.), S. 117-135.
Die Pragmatik
des Erklärens
89
Harper, W. (1977): „Rational Conceptual Change", in: Suppe/Asquith (Hrsg.). Harper, W./Hooker, C.A. (Hrsg., 1976): Foundations of Probability Theory, Statistical Inference and Statistical Theories of Science, Reidel, Dordrecht. Hempel, C. G. (1965): Aspects of Scientific Explanation and Other Essays, The Free Press, New York. Hempel, C. G. (1966): Philosophy of Natural Science, Englewood Cliffs, New Jersey. Hempel, C. G./Oppenheim, R (1948): „Studies in the Logic of Explanation", Philosophy of Science 15, S. 135-175. Jammer, M. (1964): Der Begriff der Masse in der Physik, Wissenschaftliche Buchgesellschaft, Darmstadt. Kuhn, T. (1970): The Structure of Scientific Revolutions, University of Chicago Press, Chicago. Lavoisier, A. (1862): (Euvres. Imp. Imperiale, Paris, Bd. II, S.640. Munitz, M. (Hrsg., 1973): Logic and Ontology, New York University Press, New York. Salmon, W. C. (1971): Statistical Explanation and Statistical Relevance, University of Pittsburgh Press, Pittsburgh. Salmon, W. C. (1978): „Why ask ,Why'?", Proceedings and Addresses of the American Philosophical Association 51, S. 683-705. Salmon, W. C. (1980): „Probabilistic Causality", Pacific Philosophical Quarterly 61, S. 50-74. Salmon, W. C. (1984): Scientific Explanation and the Causal Structure of the World, University of Pittsburgh Press, Pittsburgh. Stegmüller, W. (1983): Erklärung - Begründung - Kausalität, Probleme und Resultate der Wissenschaftstheorie und Analytischen Philosophie, Band 1, zweite, verbesserte und erweiterte Auflage, SpringerVerlag, Berlin-Heidelberg-New York. Suppe, F./Asquith, P. (Hrsg., 1977): PSA 1976, Philosophy of Science Association, East Lansing. Suppes, P. (1970): A Probabilistic Theory of Causality, North Holland Publ. Company, Amsterdam. Van Fraassen, B. (1969): „Facts and Tautological Entailment", Journal of Philosophy 66, S. 477-487. Reprinted in Anderson/Belnap (1975) and Munitz (1973). Van Fraassen, B. (1977): „The Only Necessity is Verbal Necessity", Journal of Philosophy 74, S. 71-85. Van Fraassen, B. (1982): „The Charybdis of Realism: Epistemological Implications of Bell's Inequalities", Synthese 52, S. 25-28. Zwart, P.J. (1967): Causaliteit, van Gorcum, Assen.
Peter Gärdenfors Die Epistemologie von Erklärungen Zur Dynamik und Pragmatik epistemischer Zustände /. Programm In diesem Aufsatz wenden wir uns der Dynamik des Wissens und (rationalen) Glaubens zu, welche in Erklärungen involviert ist. Unser Ziel ist es, eine Epistemologie von Erklärungen zu entwickeln und einige ihrer pragmatischen Eigenschaften zu klären. [Bemerkung des Herausgebers:,Glauben' - im Englischen ,belief - wird im folgenden im kognitiv-epistemischen Sinn verstanden, d.h. ,Glaubensannahipen' oder ,Glaubenssysteme' etc. sind Mengen von Propositionen, die von einer gegebenen Person als wahrscheinlich geglaubt werden. Mit, Wissen' ist jener Grenzfall dieses Glaubens gemeint, wo eine Proposition als wahr bzw. 1-wahrscheinlich geglaubt wird - jedoch nicht notwendigerweise wahr sein muß. 1 ] Gemäß einer bekannten Tradition ist Erklärung eine Art von Folgerungsbeziehung zwischen den Explananssätzen und dem Explanandum. Hempel (1965) betrachtete sowohl deduktivnomologische wie induktiv-statistische Erklärungen in dieser Weise. Die Konzentration auf logische Methoden als Hauptmittel der Analyse, so wie sie in dieser Tradition erfolgt, ist ein Symptom dessen, was Stegmüller (1983) „das dritte Dogma des Empirismus" nannte: Die Mittel der Logik seien hinreichend für die Explikation aller fundamentalen Begriffe, die für die Wissenschaftstheorie und Wissenschaftsphilosophie von Bedeutung sind.
1
[Anm. d. Hrsg.:] Dem englischen Ausdruck „belief entspricht leider nichts direkt aus dem Deutschen; der deutsche Ausdruck „Glaube" ist eher mit weltanschaulichen und nichtkognitiven Komponenten belastet, während der Ausdruck „Wissen" zu sehr mit Wahrheit oder zumindest Sicherheit verknüpft wird. Daher haben wir im Titel den von Gärdenfors eingeführten Terminus „epistemischer Zustand" bevorzugt.
92
Bas van Fraassen
Im Gegensatz zu diesem Dogma werden wir hier argumentieren, daß es nicht hinreichend ist, bloß die Sätze des Explanans und Explanandums sowie ihre Folgerungsbeziehung zu betrachten, wenn man herausfinden will, ob etwas eine Erklärung bildet. Vielmehr sind auch die epistemischen Umstände von großer Bedeutung. Voralledem sind die Glaubensannahmen der erklärenden (und erklärungssuchenden) Personen entscheidend für die Beurteilung einer angeblichen Erklärung. Unser Ziel ist es, eine Theorie der Erklärung zu präsentieren, in der die Beziehung zwischen den Explananssätzen und dem Explanandum immer relativ zu einem epistemischen Zustand bewertet werden wird. Gemäß der hier gegebenen Analyse ist es die charakteristische Rolle des Explanans-Teiles einer Erklärung (also jener Sätze, die als erklärend angeführt werden), eine Information über das Explanandum (d. h. die zu erklärende Tatsache) mitzuteilen. Auf den ersten Blick scheint dies merkwürdig, denn wenn eine Person nach der Erklärung einer Tatsache Ε verlangt, so weiß sie normalerweise bereits, daß Ε wahr ist. Die vom Explanans mitgeteilte Information verändert also im gegenwärtigen epistemischen Zustand der Person, nennen wir diesen K, nicht den Grad ihres Glaubens an E. Andererseits ist natürlich klar, daß die Tatsache Ε mehr oder weniger überraschend bzw. unerwartet sein kann, und der grundlegende Effekt eines erfolgreichen Explanans besteht darin, diesen Überraschungscharakter von Ε zu vermindern. Wie wir unten sehen werden, schließt dies nicht aus, daß wir auch Tatsachen erklären können, mit denen wir bereits sehr vertraut sind und die uns keineswegs überraschen. Allerdings stellen wir uns, wenn wir nach einer Erklärung für eine solche wohlbekannte Tatsache Ε fragen, in gewisser Weise eine Situation vor, in der Ε überraschend ist. Wie soll nun der Überraschungswert eines Satzes Ε gemessen werden? Mein Vorschlag ist es, daß man hierfür statt des gegenwärtigen epistemischen Zustandes Κ vielmehr einen damit korrespondierenden epistemischen Zustand zu Rate ziehen soll, im folgenden die Kontraktion von Κ hinsichtlich Ε genannt, worin Ε nicht gewußt wird, welcher jedoch ansonsten Κ so ähnlich wie möglich ist. Dieser Zustand soll mit Kj[ bezeichnet werden. Wenn Ε gerade eingetreten ist, so korrespondiert K£ normaler-
Die Epistemologie
von Erklärungen
93
weise dem epistemischen Zustand, den die Person hatte, bevor sie von Ε erfuhr. Über die Eigenschaften vbn K^ werde ich unten mehr sagen. Der Überraschungswert von Ε ist nun invers mit dem Glaubensgrad verknüpft, den Ε in KE besitzt. Die zentrale Bedingung für Erklärungen in der hier gegebenen Analyse besagt, daß das Explanans den Überraschungswert des Explanandums in einer nichttrivialen Weise vermindern muß. Glaubensgrade, epistemische Zustände und Kontraktionen von epistemischen Zuständen werden so also die zentralen Begriffe unserer Analyse sein. Um diese Begriffe zu präzisieren, werde ich ein probabilistisches Modell epistemischer Zustände einführen. Meine Modelle epistemischer Zustände werden komplizierter sein als jene, die von Hempel und anderen vorgeschlagen wurden. Im wesentlichen werden meine Modelle aus Wahrscheinlichkeitsmaßen (erster Ordnung) bestehen, die über Eigenschaften definiert sind, und Wahrscheinlichkeitsmaßen (zweiter Ordnung) für die Glaubensgrade von Propositionen. Ich glaube, daß der höhere Komplexitätsgrad meiner Modelle durch die reichhaltigere Repräsentation epistemischer Zustände ausgeglichen wird. Mit Hilfe dieser epistemischen Zustandsmodelle werde ich meine Analyse des Erklärungsbegriffs formulieren. Sie wird sowohl statistische wie deduktive Erklärungen erfassen. Ich werde meine Analyse mit einigen anderen Erklärungsansätzen vergleichen und dann auf einige der Beispiele anwenden, die in der Literatur über unser Thema aufgeworfen worden sind. 2. Hintergrund Bevor die Analyse im näheren Detail durchgeführt wird, möchte ich ihre wichtigsten Eigenschaften mit einigen anderen Erklärungstheorien vergleichen. Ohne hier den Hintergrund vollständig darstellen zu können, soll dieser Vergleich jedoch einige Motivation für das Folgende liefern. In allen seinen Schriften über Erklärung nimmt Hempel an, Erklärungen seien potentielle Voraussagen. Hinsichtlich deduktiver Erklärungen wirft diese Annahme keine Probleme auf; handelt es sich jedoch um statistische Erklärungen, so führt
94
Peter Gärdenfors
diese Annahme zum Resultat, daß nur solche Explananssätze akzeptierbar sind, die das Explanandum hochwahrscheinlich machen. Coffa (1974) und Salmon (1971) haben behauptet, diese Hempelsche Annahme würde von einer impliziten Festlegung auf einen Determinismus herrühren. Wie immer dies auch sei - Hempel glaubt jedenfalls, daß in dem Ausmaß, in dem es möglich ist, eine Tatsache zu erklären, diese Tatsache durch gewisse wahre Sätze hochwahrscheinlich gemacht wird. Ein charakteristischer Unterschied zwischen Hempels Theorie und der meinigen liegt darin, daß Hempel zufolge das Explanans zeigen soll, daß das im Explanandum beschriebene Phänomen zu erwarten war, während ich lediglich fordere, das Explanans müsse das Explanandum weniger überraschend machen. Ein klassisches Gegenbeispiel gegen das Postulat, Erklärungen seien potentielle Prognosen, ist Scrivens Beispiel der progressiven Paralyse (Scriven 1959). Mithilfe der in den folgenden Kapiteln entwickelten Mitteln werde ich in Abschnitt 5 Scrivens Beispiel und Hempels Erwiderung detailliert analysieren. Salmons Theorie der Erklärung (1971) stimmt mit meiner darin überein, vom Explanans nicht zu verlangen, es müsse das Explanandum hochwahrscheinlich machen. Auf der anderen Seite fordert Salmon nicht, daß das Explanans die Wahrscheinlichkeit des Explanandums erhöhen müsse - Salmon ist zufrieden, sobald das Explanans die Wahrscheinlichkeit des Explanandums verändert. Ein Argument, das die Wahrscheinlichkeit des Explanandums verringert, eine Erklärung zu nennen, scheint mir jedem vernünftigen Konzept von Erklärung völlig zuwiderzulaufen. Wenn man nach einer Erklärung fragt, warum ein bestimmtes Phänomen auftrat, und die Antwort macht das Auftreten des Phänomens sogar noch unwahrscheinlicher, dann würde man sich hinters Licht geführt fühlen und noch stärker nach einer Erklärung des Auftretens dieses Phänomens verlangen. Um dies in der Terminologie einer anderen Tradition auszudrücken: Eine Person, die nach der Erklärung eines Phänomens fragt, drückt eine ,kognitive Dissonanz' zwischen dem Explanandum und dem Rest ihrer Glaubensannahmen aus. Die primäre Rolle des Explanans ist es dann, diese kognitive Dissonanz zu eliminieren oder reduzieren (vgl. Sintonen 1984). Die
Die Epistemologie von Erklärungen
95
kognitive Dissonanz wird hier durch den Überraschungswert des Explanandums gemessen, und der Grad der .kognitiven Entspannung' korrespondiert der vom Explanans bewirkten Reduktion dieses Überraschungswertes. Salmons Theorie zufolge könnte jedoch eine akzeptierbare Erklärung zu einer Erhöhung dieser kognitiven Dissonanz führen. Es gibt allerdings noch grundlegendere Unterschiede zwischen den Theorien von Hempel und Salmon und der meinigen. Voralledem sind meine Modelle epistemischer Zustände elaborierter als ihre. Zur Rechtfertigung meiner Modelle werde ich (unter anderem) später zeigen, daß der explanative Status jener Beispiele, die Salmon als Gegenbeispiele zu Hempels Theorie anführt, nicht so eindeutig ist, wie es Salmon behauptet, sondern in großem Ausmaß davon abhängt, welche Hintergrundannahmen akzeptiert werden. Eine andere Arbeit, die dem „dritten Dogma des Empirismus" widerspricht, d. h. gegen die Auffassung von Erklärungen als Folgerungsbeziehungen verstößt, ist die von Hansson (1975). Wie er zeigt, kann ein Explanandum mehreren erklärungssuchenden Warum-Fragen entsprechen. So entsprechen beispielsweise die Fragen „Warum erkrankte unter allen meinen Freunden gerade John an Krebs?" und „Warum erkrankte unter allen schweren Rauchern gerade John an Krebs?" demselben Explanandum, nämlich „John erkrankte an Krebs". Hansson zeigt, daß die Angemessenheit verschiedener Explananssätze von der Art der gestellten Warum-Frage abhängen kann. Eine mögliche Antwort auf die erste Frage ist etwa „Weil John jeden Tag zwei Packungen Zigaretten rauchte", wogegen diese Antwort für die zweite Frage ungeeignet zu sein scheint. Die Phrasen „unter allen schweren Rauchern" und „unter allen meinen Freunden" demarkieren hier sogenannte Referenzklassen. Hansson zeigt, daß die Referenzklasse ein wichtiger Teil einer erklärungssuchenden Warum-Frage ist, und er charakterisiert Erklärungen mithilfe von Wahrscheinlichkeiten in Referenzklassen. Gemäß meiner Analyse ist die in einer Warum-Frage angeführte Referenzklasse ein Hinweis auf die Wissens- und Glaubensannahmen, die man zum Zeitpunkt der Fragestellung besitzt. Ich werde zeigen, wie meine Analyse epistemischer Zustände zur Auffindung der einer Erklärung ange-
96
Peter Gärdenfors
messenen Referenzklasse verwendet werden kann. Die Behauptungen in diesem Teil der Hanssonschen Theorie werden somit Konsequenzen der hier dargestellten Theorie sein. Die Theorie der Erklärung, welche der meinigen am nächsten kommt, ist van Fraassens Theorie (1977 und 1980). Er betont ebenfalls diverse pragmatische Faktoren der Erklärung, und voralledem ihre Abhängigkeit von kontextuellen Faktoren. Er entwickelt jedoch keine Theorie der Struktur von epistemischen Zuständen, welche die grundlegenden kontextuellen Elemente bilden. 3. Probabilistische Modelle zweiter Ordnung für epistemische Zustände Ich wende mich nun der Behandlung jener Modelle von epistemischen Zuständen zu, welche für meine Analyse von Erklärungen grundlegend sind. Die ontologische Basis dieser Modelle sollen Mengen möglicher Welten sein, und die Semantik der Objektsprache wird durch Bezug zu solchen Mengen definiert. Unsere Modelle werden allerdings entwickelter sein als die üblicherweise in der philosophischen Logik verwendeten möglicheWelten-Modelle. Die Objektsprache soll eine Sprache erster Stufe sein. Um technische Komplikationen zu vermeiden, werde ich eine Objektsprache benutzen, die so wenig Komponenten wie möglich enthält. Es gibt in ihr nur zwei Satztypen: singuläre Sätze und Wahrscheinlichkeitssätze. Atomsätze werden aus Prädikaten und Individuenkonstanten gebildet. Einfachheitshalber nehme ich alle Prädikate als einstellig an. Prädikate bezeichnen wir mit Q, R, S usw.; Individuenkonstanten mit a, b, c etc. Singuläre Sätze sind als Atomsätze oder wahrheitsfunktionale (i. e. aussagenlogische) Kombinationen solcher definiert. Wahrscheinlichkeitssätze haben die Form ,,p(A/B) ^ r". Dabei bestehen Α und Β aus Prädikaten plus darauffolgender Individuenvariable „x" oder aus wahrheitsfunktionalen Kombinationen solcher Ausdrücke, und r ist eine reelle Zahl zwischen 0 und 1. Wahrheitsfunktionale Kombinationen von Wahrscheinlichkeitssätzen werden ebenfalls Wahrscheinlichkeitssätze genannt. Dem intendierten Gebrauch dieser verschiedenen Satzarten zufolge
Die Epistemologie
von Erklärungen
97
sollen die singulären Sätze ,Tatsachen' ausdrücken, während die Wahrscheinlichkeitssätze,generelles Wissen' und,induktive Glaubensannahmen' ausdrücken. Absichtlich vermeide ich es, quantifizierte Sätze in die Sprache einzuschließen, und zwar lediglich, um die Diskussion zu vereinfachen. Quantifizierte Sätze sind bekannte Bestandteile von Erklärungen. Ihre Rolle wird hier durch Sätze der Form „p(Qx/Rx) = 1" übernommen. Ich glaube nicht, daß die Beschränkung auf Erklärungen, die in dieser einfachen Objektsprache formulierbar sind, irgendeine der zentralen Eigenschaften von Erklärungen ausschließt, und ich denke, daß meine Analyse sehr leicht auf kompliziertere Objektsprachen ausgedehnt werden kann. Bevor ich mich den Modellen epistemischer Zustände zuwende, die ich zur Explikation von Erklärungen verwende, möchte ich einige Worte über die Methode sagen, die Hempel zur Modellierung von Wissen und Glauben verwendet. Was deduktive Erklärungen betrifft, so ist Hempel der Ansicht, daß sie aus einer logischen Relation zwischen dem Explanans und dem Explanandum bestehen, und daß diese Relation unabhängig vom Hintergrundwissen ist. Im Fall der sogenannten induktiv-statistischen Erklärungen ist Hempel jedoch dazu gezwungen, Erklärungen mit Bezug auf ein angenommenes Hintergrundwissen auszuwerten, um seine , Forderung der maximalen Bestimmtheit' formulieren zu können (näheres zu dieser Forderung später). Hempels Modelle des Hintergrundwissens sind sehr einfach - er beschreibt sie als konsistente und unter logischer Deduktion abgeschlossene Satzmengen. Diese Methode der Modellierung des Hintergrundwissens gibt jedoch ein recht einseitiges Bild, denn es ist darin unmöglich, zu entscheiden, ob die nicht in dieser Menge enthaltenen Sätze wahrscheinlich oder unwahrscheinlich sind, bzw. allgemeiner gesprochen, welchen Sicherheitsgrad man ihnen zuschreiben würde. Wie gleich gezeigt werden wird, ist dies jedoch wichtig für die Bewertung von angeblichen Erklärungen probabilistischen Charakters. Die erste Komponente unserer Modelle epistemischer Zustände ist eine Menge W von möglichen Welten (oder möglichen Weltzuständen - die beiden Begriffe werden im folgenden gleichbedeutend verwendet). Individuelle mögliche Welten wer-
98
Peter Gärdenfors
den mit u, v, w, etc. bezeichnet. Wie ich betonen möchte, bin ich mit Bezug auf mögliche Welten in keiner Weise ein Realist, sondern fasse sie lediglich als nützliche Heuristik auf. Die Hauptfunktion der Menge W ist die Einführung eines konzeptuellen Rahmenwerkes für die Modelle epistemischer Zustände. Die Menge W soll so interpretiert werden, daß das, was in einem gegebenen epistemischen Zustand als Wissen akzeptiert wird, genau das ist, was in allen Welten aus Wwahr ist. In einem gewissen Sinn ist dieser Gebrauch von möglichen Welten eine Methode, das zu beschreiben, was wir nicht wissen. Je mehr man lernt bzw. weiß, desto weniger Weltzustände sind mit dem, was man weiß, verträglich. Zwei mögliche Welten können sich in vielen Hinsichten voneinander unterscheiden. Ein Individuum kann in verschiedenen Welten verschiedene Eigenschaften besitzen. Da ich die Augenfarbe der Person, die mich gerade telephonisch anrief, nicht kenne, kann ich mir Weltzustände vorstellen, in denen sie blaue Augen hat, und andere Weltzustände, in denen sie braune Augen besitzt. Allgemeiner betrachtet können sich zwei Weltzustände dadurch unterscheiden, daß die Häufigkeiten von Individuen, die eine bestimmte Eigenschaft besitzen, in ihnen verschieden sind. Ich kenne ζ. B. nicht die tatsächliche Häufigkeit von Albinismus unter Kaninchen. Ich weiß, daß die Wahrscheinlichkeit eines Kaninchens, ein Albino zu sein, größer 0 ist, und ich glaube, daß sie kleiner 0,2 ist - alles, was ich weiß, ist, daß sie irgendwo dazwischen liegt. Eine andere Weise, dies auszudrücken, ist zu sagen, daß mit meinem Wissen verschiedene mögliche Weltzustände verträglich sind, die verschiedene Häufigkeitsanteile weißer Kaninchen besitzen. Diesen Aspekt eines epistemischen Zustandes nehmen wir als eine zweite Komponente in unser Modell auf, indem wir für jede mögliche Welt w in W ein Wahrscheinlichkeitsmaß Pw annehmen, das über alle Untermengen der Menge von Individuen in w definiert ist. Einfachheitshalber nehme ich an, daß in allen möglichen Welten dieselbe Menge von Individuen existiert. Ist S eine Untermenge der Individuenmenge von w, so bezeichnet PW(S) die Wahrscheinlichkeit, daß ein Individuum in der Welt w zur Menge S gehört. Ich nehme eine fixe Interpretation I der Objektsprache an,
Die Epistemologie von Erklärungen
99
welche uns für jede gegebene mögliche Welt, jede Individuenkonstante und jedes Prädikatsymbol sagt, welches Individuum durch die Individuenkonstante und welche Eigenschaft durch das Prädikatsymbol in der gegebenen Welt bezeichnet wird. Ist Q ein Prädikat, so soll Qw = I{Q,w) gelten, d. h. Qw ist die Menge jener Individuen in w, die die Eigenschaft Q haben, und analog soll aw = I(a,w) das Individuum sein, das in w durch die Individuenkonstante α bezeichnet wird. Ein Satz der Form „ g a " i s t wahr in w g.d.w. aw e Qw. Ein Satz der Form „p(Qx/Rx) ^ r" ist wahr in w g.d.w. PW(QW/RW) ^ r. Die Wahrheitsbedingungen für aussagenlogische Konnektive sind die üblichen (klassischen). Ein Satz Α werde in einem epistemischen Zustand Κ als Wissen akzeptiert g.d.w. Α in allen Welten der Menge f f wahr ist, die zu AT gehört. Diese Definitionen erzeugen eine Interpretationsfunktion I von Sätzen nach Mengen möglicher Welten. Die Menge der Welten, in denen ein Satz Α wahr ist, wird mit 1(A) bezeichnet. Man beachte, daß die Wahrheitsbedingungen in diesen Definitionen nur als heuristische Werkzeuge fungieren, und nichts über die Beziehungen mit der ,wirklichen' Welt implizieren. Der Schlüsselbegriff ist die Akzeptierbarkeitsbedingung. In der Regel besitzen verschiedene Welten verschiedene Wahrscheinlichkeitsmaße. In vielen Fällen jedoch gibt es Prädikate Q (oder wahrheitsfunktionale Kombinationen solcher Prädikate), für die Pw(Qw) = PU(QU) für alle möglichen Welten w und u in W gilt. In diesen Fällen sagen wir, daß die Wahrscheinlichkeit des Prädikats Q im gegebenen epistemischen Zustand gewußt wird, denn in allen mit dem akzeptierten Wissen vereinbaren möglichen Welten ist die Häufigkeit der Individuen, die die durch Q bezeichnete Eigenschaft besitzen, dieselbe. Ich weiß beispielsweise, daß die Wahrscheinlichkeit, in der Schwedischen Staatslotterie einen Geldbetrag zu gewinnen, 1 /6 beträgt. Bei den meisten Eigenschaften sind wir allerdings unsicher über ihre Wahrscheinlichkeiten, und das Wahrscheinlichkeitsmaß für die korrespondierenden Individuenmengen kann hier daher unter verschiedenen möglichen Welten beträchtlich variieren. Die in einem bestimmten epistemischen Zustand möglichen Welten sind nicht alle gleichwahrscheinlich. Wenn ich beispiels-
100
Peter
Gärdenfors
weise in diesem Moment meinen Freund anzurufen versuche, so halte ich es für wahrscheinlicher, daß er gerade in der Arbeit ist, als daß er sich zu Hause aufhält. Gemäß meiner Glaubensannahmen ist es daher wahrscheinlicher, daß sich die wirkliche Welt unter jenen Welten befindet, in denen mein Freund jetzt gerade arbeitet, als unter jenen, in denen er gerade zu Hause ist. Um die Wahrscheinlichkeit verschiedener Weltzustände zu messen, führe ich als dritte Komponente eines epistemischen Zustandes ein weiteres Wahrscheinlichkeitsmaß Β ein, welches auf der Menge von Untermengen von W definiert ist. Ist U eine Untermenge von W, so ist B(U) das Wahrscheinlichkeitsmaß dafür, daß die wirkliche Welt unter den Welten in U ist. In der philosophischen Literatur werden Propositionen oft als Mengen möglicher Welten definiert, nämlich als Mengen jener Weltzustände, in denen die Proposition wahr ist. Das Maß Β kann daher als Glaubensfunktion bezeichnet werden, da es den Grad des Glaubens an Propositionen mißt. Wie wir sahen, kann die Wahrscheinlichkeit einer Eigenschaft Q in verschiedenen möglichen Welten verschieden sein. Mithilfe der Glaubensfunktion ist es möglich, die Wahrscheinlichkeit zu bestimmen, mit der in einem gegebenen epistemischen Zustand eine gewisse Eigenschaft eine gewisse Wahrscheinlichkeit hat. Auf diese Weise erhält man aus dem Wahrscheinlichkeitsmaß Pw zusammen mit dem Maß Β eine Wahrscheinlichkeitsverteilung zweiter Ordnung für Sachverhalte, in denen einem Individuum eine gewisse Eigenschaft zugeschrieben wird. Bei einigen Eigenschaften kennen wir die Wahrscheinlichkeitsverteilung fast mit Sicherheit - beispielsweise wird eine reguläre Münze in 50% der Würfe Kopf zeigen. Bei anderen Eigenschaften jedoch können wir uns bezüglich ihrer Wahrscheinlichkeiten in extremer Unsicherheit befinden - in meinem gegenwärtigen Wissenszustand weiß ich beispielsweise sehr wenig über die Wahrscheinlichkeit einer Stute, Fohlenzwillinge zu bekommen, und daher weisen die möglichen Welten aus meiner Wissensperspektive für ein solches Ereignis weit auseinanderliegende Wahrscheinlichkeiten auf. Auch wenn man sehr wenig über die Wahrscheinlichkeit einer bestimmten Eigenschaft weiß, so macht man manchmal eine Schätzung. Eine solche Schätzung beruht dann auf einer Wahr-
Die Epistemologie
von Erklärungen
101
scheinlichkeit erster Ordnung, die eine Mischung von Wahrscheinlichkeiten zweiter Ordnung ist. Eine besonders einfache Methode, solche Mischungen zu definieren, ist die folgende Einführung eines Wahrscheinlichkeitsmaßes Pv für jede Untermenge V von W: (Def Py)
Py(Q) = - i - · Σ Λ Λ 0 . B{V)
weK
vorausgesetzt 5 ( F ) # 0. Für unendliche Mengen Fmuß die Summe durch ein Integral ersetzt werden. Ich nenne Pv (Q) die Erwartungswahrscheinlichkeit dafür, daß ein beliebiges Individuum zu der durch Q bezeichneten Menge, d. h. zu Qw gehört, gegeben daß Κ die Menge der möglicher Welten ist. Pw werde ich einfachheitshalber durch Ρ abkürzen. Es ist zu bemerken, daß die Konstruktion der Erwartungswahrscheinlichkeit nur eine unter vielen Möglichkeiten der Mischung von Verteilungen zweiter Ordnung ist. Damit sind wir mit der Beschreibung unserer Modelle epistemischer Zustände am Ende. Zusammengefaßt enthält ein epistemischer Zustand K: (i) einer Menge ^möglicher Welten mit einer fixierten Individuenmenge, (ii) für jede Welt ein Wahrscheinlichkeitsmaß Pw, das über Individuenmengen in w definiert ist, und (iii) eine Glaubensfunktion B, die die Wahrscheinlichkeit von Mengen möglicher Welten mißt. Die P w -Maße liefern zusammen mit Β eine Wahrscheinlichkeitsverteilung zweiter Ordnung für Eigenschaften, und mithilfe dieser habe ich das Maß erster Ordnung für die Erwartungswahrscheinlichkeit definiert. Es ist vielleicht von Interesse, darauf hinzuweisen, daß die mit den epistemischen Zuständen verbundene Objektsprache nicht reichhaltig genug ist, um alle Unterscheidungen auszudrücken, die in epistemischen Zuständen gemacht werden können. Insbesondere fungieren die Wahrscheinlichkeitsverteilungen zweiter Ordnung im Verhältnis zur Sprache als ,versteckte Variablen'. Mithilfe der so eingeführten Modelle epistemischer Zustände ist es einfach, Expansionen von Glaubenssystemen zu beschreiben. Gegeben ein Zustand K, bestehend aus einer Menge IF von Welten, einer Menge von Wahrscheinlichkeitsmaßen Pw und
102
Peter Gärdenfors
einer Glaubensfunktion Β. D.h. Κ = < W, Pw : w e W, Β >. Wir wollen nun zu Κ den Gehalt eines Satzes Α und seiner Konsequenzen hinzufügen. Wenn Α als Wissen akzeptiert wird, so kommen nur mehr jene Welten als möglich, i. e. mit dem akzeptierten Wissen verträglich in Frage, in denen Α wahr ist. 2 Ich bezeichne diese Menge mit W%. Für alle w in WX wird das Wahrscheinlichkeitsmaß Pw im expandierten System unverändert erhalten bleiben. Die neue Glaubensfunktion ΒX ist aus der alten mithilfe der Gleichung BX (V) = B(V/Wj) definierbar, für alle Untermengen V von WX. Der Glaubensgrad für eine Menge V möglicher Weltzustände im expandierten epistemischen Zustand ist also derselbe wie der Glaubensgrad für V gegeben Α im alten Zustand. Damit haben wir den expandierten Zustand KX als das Tripel < WX,PW: weWX,BX > definiert. Es ist eine essentielle Eigenschaft der vorliegenden Modelle epistemischer Zustände, daß in ihnen für jede Kombination von Prädikaten ein Wahrscheinlichkeitsmaß existiert. Natürlich können die Maße Pw für verschiedene Welten differieren; das interessante und nützliche Maß aber ist die Erwartungswahrscheinlichkeit. Obwohl es für jede Kombination von Prädikaten eine Erwartungswahrscheinlichkeit gibt, ist es nicht nötig, den epistemischen Zustand jedesmal zu revidieren, wenn man ihm einen neuen Wahrscheinlichkeitssatz hinzufügen möchte, der mit der bisherigen Erwartungswahrscheinlichkeit in Widerspruch steht. Was passieren wird, ist lediglich, daß jene Welten, in denen dieser Wahrscheinlichkeitssatz falsch ist, nicht länger möglich sind, und sich die Wahrscheinlichkeitsverteilung zweiter Ordnung so von einer ausgedehnten zu einer auf einen bestimmten Wert konzentrierten Form hin ändert. Auch wenn ich beispielsweise schätzen würde, daß die Wahrscheinlichkeit für eine Stu2
[Anm. d. Hrsg.:] Bei solchen Expansionen wird vorausgesetzt, daß Α mit dem bisherigen Wissen logisch verträglich ist, d. h. nicht Wf = 0 gilt (s. u.). Andernfalls spricht man von Revisionen' (s. auch Abschn. 4) - für die Definition solcher s. ζ. B. Gärdenfors (1986) und (1987). Einer gebräuchlichen Methode zufolge läßt sich die Revision von Κ durch A, K*, auf folgende Aufeinanderfolge einer Kontraktion und einer Expansion zurückzuführen: Κ*λ = (κ-Α)Α+.
Die Epistemologie von Erklärungen
103
te, Fohlenzwillinge zu kriegen, 10% beträgt (d. h., dies ist meine Erwartungswahrscheinlichkeit für diesen Ereignistyp), so würde ich es doch nicht als Widerspruch zu meinen Glaubensannahmen auffassen, wenn mir jemand mitteilt, daß die Wahrscheinlichkeit tatsächlich nur 1,5% beträgt. Ich war über den Wert 10% in Unsicherheit, und er kam lediglich als eine Art von Mittelwert der von mir als möglich vermuteten Wahrscheinlichkeiten zustande. Ein Vorteil dieser Art von Modellen epistemischer Zustände gegenüber Hempels Methode, Wissen als eine Satzmenge zu beschreiben, liegt darin, daß in ihnen sowohl eine einfache Methode der Modellierung von Glaubensexpansionen wie eine wohldefinierte Erwartungswahrscheinlichkeit für jede Kombination von Prädikaten zur Verfügung steht. Wenn ein epistemischer Zustand einfach als Satzmenge beschrieben wird, dann wird es schwierig, anzugeben, wie sich diese Satzmenge ändert, wenn weitere Sätze hinzugefügt werden. Wenn man beispielsweise einen Wahrscheinlichkeitssatz hinzufügen möchte, der mit den bisherigen in Konflikt steht, so scheint es schwierig zu entscheiden, wie der neue Wahrscheinlichkeitssatz den epistemischen Status der bisherigen Wahrscheinlichkeitssätze verändert. 4. Eine Analyse von Erklärungen Mithilfe der vorgeschlagenen Modelle epistemischer Zustände ist nun die Charakterisierung von Erklärungen in Reichweite. Wir werden die Analyse auf den einfachsten Situationstyp beschränken, in denen das Explanandum ein singulärer Satz ist. Ich werde einige notwendigen Bedingungen für Erklärungen formulieren. Die zentrale Idee hierbei wird sein, daß das Explanans den Glaubensgrad des Explanandums in nichttrivialer Weise erhöhen sollte. Der Glaubensgrad eines Satzes wird mithilfe eines bestimmten epistemischen Zustande definiert. Dieser Zustand ist nicht jener, in dem nach einer Erklärung verlangt wurde, sondern vielmehr die Kontraktion dieses Zustandes hinsichtlich des Explanandumsatzes. Die Definition des Glaubensgrades eines Satzes wird auf dem Prinzip basieren, daß bei der Definition von Einzelfallwahrscheinlichkeiten von der ,totalen
104
Peter Gärdenfors
Evidenz' Gebrauch zu machen ist. Ich werde auch die Beziehung zwischen dieser Definition des Glaubensgrades und Hempels Forderung der ,maximalen Bestimmtheit' diskutieren. Erklärungen werden oft als Antworten auf Warum-Fragen betrachtet. Die primäre Funktion von Fragen ist es, anzuzeigen, daß die fragende Person die Antwort auf ihre Frage nicht weiß und daß sie diese wissen möchte. Es gibt natürlich Fragen, die eine von beiden Funktionen oder beide nicht besitzen, wie beispielsweise die Fragen des Lehrers, oder rhetorische Fragen, doch solche Fragen werden nicht in der normalen Weise gebraucht. Mein Ziel ist es, zu klären, welche Art von Information man zu erhalten wünscht, wenn man eine erklärungssuchende Warum-Frage stellt. Wenn man eine Frage des Typs „Warum ET1 stellt, so hat man Ε üblicherweise bereits als Wissen akzeptiert. Der Grund, warum man fragt, ist, daß man Ε ursprünglich nicht erwartet hatte (oder zumindest vorgibt, Ε nicht erwartet zu haben). Wäre es möglich gewesen, aus dem,restlichen Teil' unseres Wissens zu schließen, daß Ε wahr ist (oder wahr werden wird), dann wäre der Erklärungsbedarf nicht aufgetreten. Wir können in Verbindung mit der Erklärung eines Satzes Ε nun zwischen zwei epistemischen Zuständen unterscheiden. Im ersten Zustand, den wir mit Κ bezeichnen, akzeptieren wir Ε als wahr, wissen jedoch nicht, warum Ε wahr ist. Im zweiten Zustand nehmen wir an, wir wüßten nicht, ob Ε wahr ist oder nicht, doch ansonsten sind unsere Glaubensannahmen denen in Κ so ähnlich wie möglich. Diesen zweiten epistemischen Zustand nennen wir die Kontraktion von Κ bezüglich Ε und bezeichnen ihn mit K£. Ein typischer Fall ist es, daß K£ jenen epistemischen Zustand darstellt, in dem wir waren, bevor wir Ε entdeckten, und wir danach unseren Zustand zu Κ expandierten. Ich behaupte, daß die Bewertung einer angeführten Erklärung in Relation zum epistemischen Zustand K^ erfolgen sollte, und nicht in Relation zu K. In anderen Schriften (vgl. Alchourrön/Gärdenfors/Makinson 1985, Gärdenfors 1982, 1984 und 1987) habe ich die logischen Eigenschaften von Kontraktionen analysiert und ein System von Postulaten für Kontraktionsprozesse entwickelt. KE ist natürlich eine Untermenge von K, doch die Hauptforderung
Die Epistemologie
von Erklärungen
105
besteht darin, daß KE die minimale Veränderung von AT sein soll, die man benötigt, um Ε zu widerrufen. Ein anderes Postulat für Kontraktionen, welches in unserem Kontext eine Rolle spielt, besagt, daß wenn zuerst Κ bezüglich Ε kontrahiert und dann um Ε expandiert wird, der resultierende epistemische Zustand wieder Κ sein muß. Etwas technischer kann dies mithilfe der Gleichung (K£) E = Κ formuliert werden. Die Beurteilung einer Erklärung von Ε geht also von einem epistemischen Zustand aus, in dem Ε nicht als gewußt akzeptiert wird. Ein natürliches Maß für den Grad der Erwartung eines Satzes Ε im epistemischen Zustand Κ ist Β (/(£)), wo 1(E) die Menge der Welten ist, in denen Ε wahr ist. Nachdem wir uns auf KE beziehen, ist ein zentrales Problem nun die Frage, wie wir den Wert von B^(I(E)) bestimmen, wobei BE die Glaubensfunktion in K£ ist. Da wir Ε als singulären Satz angenommen haben, dessen Glaubensgrad von den in Κ akzeptierten Wahrscheinlichkeitssätzen abhängt, ist unser Problem im Grunde das klassische Problem der Bestimmung von ,Einzelfallwahrscheinlichkeiten', übersetzt in den Begriffsrahmen unserer epistemischen Zustände. Ich werde hier eine tentative Lösung dieses Problems präsentieren, die auf Reichenbachs Prinzip der ,engsten Referenzklasse' beruht. Statt in Form eines ,objektiven' Wahrscheinlichkeitsmaßes wird dieses Prinzip jedoch mithilfe des ,subjektiven' Maßes der Erwartungswahrscheinlichkeit Ρ formuliert, welche für jeden epistemischen Zustand definiert ist. Um die Einzelfallwahrscheinlichkeit eines Explanandumsatzes der Form „ ß a " zu bestimmen, treffen wir für die Beziehung zwischen dem Maß der Erwartungswahrscheinlichkeit Ρ und der Glaubensfunktion Β mit Bezug auf „Qa" folgende Vereinbarung: (EFW) Sei Κ ein epistemischer Zustand mit möglichen Welten W, Glaubensfunktion Β und einem definierten Maß Ρ der Erwartungswahrscheinlichkeit. Sei R das stärkste Prädikat, für welches in Κ „Ra" als wahr akzeptiert ist, d. h. für welches I(Ra) = f f gilt. Wenn nichts anderes für „Qa" Relevantes über α gewußt wird, dann gelte B(I(Qa)) = P(Q/R).
106
Peter Gärdenfors
Diese Vereinbarung besagt, daß die Häufigkeit der Welten, in denen „Qa" wahr ist, d. h. B(I(Qa)), tatsächlich das Ausmaß darstellt, in dem von einem Individuum α mit der Eigenschaft R erwartet werden kann, daß es die Eigenschaft Q hat. R wird dabei als die engste Referenzklasse angenommen, für die gewußt wird, daß ihr α angehört. Wenn man beispielsweise bereits weiß, daß Qa, so wird Rw immer eine Unterklasse von Qw sein, woraus B(I(Qa)) = P(Q/R) = 1 folgt, was der korrekte Glaubensgrad für diesen Fall ist. Es ist ebenfalls leicht nachprüfbar, daß die Vereinbarung (EFW) nicht der Forderung widerspricht, daß Β ein Wahrscheinlichkeitsmaß über der Menge möglicher Welten darstellt. Wir nennen B(I(Qa)) den Glaubensgrad des Satzes „Qa" in K. Um terminologische Komplikationen zu vermeiden, werden Ausdrücke der Form ,,5(/(ßa))" im Rest dieses Kapitels durch „B(Qa)il abgekürzt, sofern kein terminologisches Verwechslungsrisiko besteht. Man beachte, daß die Bedingung (EFW) relativ schwach ist, und aufgrund der Klausel „wenn nichts anderes für „Qa" Relevantes über α gewußt wird" in gewissem Ausmaß unbestimmt ist. Es könnte beispielsweise sein, daß der Sachverhalt, daß α die Eigenschaft S hat, nicht völlig akzeptiert ist, also der Glaubensgrad von „Sa" kleiner 1 ist, es aber dennoch sehr wahrscheinlich ist, daß Sa der Fall ist; und dies könnte unsere Beurteilung von B(Qa) beeinflussen. Um die Bedingung präziser zu machen, benötigt man hier eine Analyse von,Relevanz'. Der traditionellen Definition zufolge ist Sa relevant für Qa g.d.w. B(Qa) Φ B(Qa/Sa). Für eine Kritik dieser Definition und eine alternative Analyse vgl. Gärdenfors (1978). Die Bedingung (EFW) ist auf einen Explanandumsatz Ε im kontrahierten epistemischen Zustand KE anzuwenden. Wenn man sich im Zustand KE befindet, in dem der Glaubensgrad von Ε kleiner 1 ist, und man dann entdeckt, daß Zswahr ist (d. h. in den Zustand Κ übergeht), so tritt Ε in gewissem Ausmaß als Überraschung auf, und zwar als eine umso größere, je kleiner der Glaubensgrad ist, den Ε in K£ hatte, und auf diese Weise entsteht ein Erklärungsbedarf. Es sind genau diese Situationen, in denen die Frage „Warum £ ? " die übliche Funktion einer erklärungssuchenden Warum-Frage besitzt. Eine adäquate Antwort auf solch eine Frage, d. h. eine Erklärung, die ihres
Die Epistemologie
von Erklärungen
107
Namens würdig ist, sollte den epistemischen Zustand so verändern, daß sich der Glaubensgrad des Explanandums erhöht. Allerdings ist es, um etwas als Erklärung zu akzeptieren, nicht nötig, daß der Glaubensgrad des Explanandums sehr groß wird (nahe bei 1), so wie dies Hempel fordert, sondern es genügt, daß er höher ist als er es war, bevor man die in den Explananssätzen enthaltene Information hatte. Um Erklärungen des Typs „E, weil £"' zu vermeiden, welche freilich den Glaubensgrad von Ε erhöhen, jedoch in einer trivialen und nichtinformativen Weise, fordere ich, daß das Explanans Information liefern soll, die für den epistemischen Ausgangszustand K, in dem Ε gewußt wird, von Relevanz ist. Formal läuft dies auf die Forderung hinaus, daß das Explanans nicht aus den akzeptierten Sätzen in Κ ableitbar sein darf. Diese Überlegungen führen uns zu folgenden notwendigen Bedingungen für Erklärung: (ERK) Eine Erklärung eines singulären Satzes Ε relativ zum epistemischen Zustand Κ (wobei E e K ) besteht aus (i) einer Konjunktion Τ einer endlichen Menge von Wahrscheinlichkeitssätzen, und (ii) einer Konjunktion C einer endlichen Menge von singulären Sätzen, sodaß (iii) B^(E/T λ Q > B^{E) gilt, wobei BE die Glaubensfunktion im epistemischen Zustand K£ ist, und (iv) Τ λ C$K gilt. In weniger formaler Weise läßt sich (ERK) folgendermaßen rephrasieren: Für einen gegebenen epistemischen Zustand Ε zu erklären läuft darauf hinaus, eine Antwort auf folgende Frage zu finden: „Wenn ich is nicht wüßte, welche akzeptierbaren Sätze Τ oder C könnte ich dann verwenden, um die Wahrscheinlichkeit von Ε zu erhöhen (bzw. den Überraschungswert von Ε zu senken), ohne dabei das Erfragte (i. e. E) vorauszusetzen?" Diese Formulierung weist auf einen Zusammenhang zwischen kontrafaktischen Konditionalen, Erklärungen und Wissensdynamik hin. In (ERK) können wir zwischen drei verschiedenen epistemischen Zuständen unterscheiden, nämlich K, K£ und (Ke)tacK£ ist der Zustand, relativ zu dem der Glaubensgrad des Explanandums, bevor es als wahr gewußt wird, bestimmt wird
108
Peter Gärdenfors
(mithilfe von (EFW)). ist jener epistemische Zustand, welcher aus ΚE"~ durch die Hinzufügung des Explanans Τ Λ C entsteht. In der zentralen Bedingung (iii) von (ERK) wird der Glaubensgrad von Ε in diesem letzteren Zustand mit dem Glaubensgrad von is in KE verglichen. Sofern es sich bei Τ Λ C nicht um eine deduktive Erklärung handelt, wird der Satz Ε in (A^")/λ c n icht als gewußt akzeptiert. Es ist für die folgende Diskussion wichtig, sich die Unterscheidung zwischen diesen drei epistemischen Zuständen in Erinnerung zu behalten. Es sollte auch beachtet werden, daß es sich sowohl bei wie bei um (KE)TAC hypothetische epistemische Zustände handelt, die lediglich zur Auswertung der Bedingung (iii) von (ERK) benötigt werden. Es ist daher nicht sinnvoll, zu sagen, daß einer dieser drei Zustände Κ zeitlich vorausginge. (Dies wurde von Küttner 1984 angenommen. Ich glaube, daß aus diesem Grund seine Hauptkritik an meiner Theorie nicht gültig ist.) Tatsächlich gibt es noch einen vierten epistemischen Zustand, der von Bedeutung ist, nämlich die Expansion bzw. Revision von Κ durch die neue Information Τ λ C, was jenen Zustand darstellt, den die Person einnimmt, wenn sie die Erklärung Τ Λ C akzeptiert. Normalerweise ist Τ Λ C mit Κ konsistent, und dieser vierte Zustand fällt dann einfach mit K j h C zusammen. Bedingung (ERK) schließt jedoch auch jenen Fall nicht aus, in dem Τ λ C einigen akzeptierten Sätzen in Κ widerspricht; in diesem Fall führt die Erklärung zu einer genuinen Revision des epistemischen Ausgangszustandes K. 3 (Dies beantwortet eine Frage von Stegmüller 1983, S. 1000.) Auch Levi (1986) hat eine epistemisch relativierte Analyse von Erklärungen mithilfe von Kontraktionen und Revisionen vorgeschlagen. In seiner Analyse gibt es jedoch nichts, was der Bedingung (iii) von (ERK) korrespondiert, da er mit einem anderen Begriff der ,Akzeptierbarkeit' arbeitet als wir in unseren Modellen epistemischer Zustände. Ich fordere nicht, daß die Konjunktion Τ von Wahrscheinlichkeitssätzen oder die Konjunktion C von singulären Sätzen 3
[Anm. d. Hrsg.:] In diesem Fall muß auch der dritte epistemische Zustand (Κ£)ί Λ c durch die Revision von durch Τ Λ C ersetzt werden. Vgl. auch Anm. 2.
Die Epistemologie
von Erklärungen
109
nichtleer sein muß. Es ist also möglich, daß ein Explanans nur aus einem singulären Satz besteht. Der Wahrscheinlichkeitssatz, der für die Änderung des Glaubensgrades des Explanandums im Prinzip natürlich erforderlich ist, kann ein Satz sein, der bereits im epistemischen Zustand Κ gewußt wird. Wenn ich mich beispielsweise wundere, warum Fräulein Julie braungebrannt ist, obwohl wir gerade Winter haben, dann wird die Antwort, daß sie kürzlich eine Woche auf den Kanarischen Inseln im Urlaub war, für mich eine befriedigende Erklärung sein, da ich bereits weiß, daß fast alle Leute, die auf die Kanarischen Inseln fahren, braungebrannt zurückkehren. Analog ist es möglich, daß das Explanans nur aus einem Wahrscheinlichkeitssatz besteht, nämlich in jenen Fällen, wo der erforderliche Singulärsatz bereits im epistemischen Zustand AT enthalten ist. Wenn ich frage, warum Herr Johansson, den ich sehr gut kenne, an Lungenkrebs erkrankte, dann ist es für mich eine befriedigende Erklärung, wenn ich erfahre, daß ein hoher Prozentsatz jener Personen, die mit Asbest arbeiten, an Lungenkrebs erkrankt, da ich bereits weiß, daß Herr Johansson seit 25 Jahren an der Herstellung von Asbestpappen arbeitet. Es ist wohlbekannt, daß Alltagserklärungen häufig nur aus einem einzigen Satz bestehen - einem Wahrscheinlichkeitssatz (einem universellen Satz) oder einem singulären Satz. In früheren Theorien wurden solche Erklärungen als elliptisch bezeichnet und man hielt es für nötig, sie durch weitere Sätze zu ergänzen. Da ich einen zugrundeliegenden epistemischen Zustand annehme, zeigt meine Charakterisierung von Erklärungen, in Übereinstimmung mit der Praxis, daß auch ein nur aus einem einzigen Satz bestehendes Explanans als vollkommen befriedigend akzeptiert werden kann. Es scheint, als gäbe es Erklärungsfalle, wo die Explananssätze, also Τ λ C, bereits in AT enthalten sind, und dadurch Bedingung (iv) verletzt wird. Für die Beantwortung der Frage „Warum verließ Viktoria Oskar?" ist beispielsweise die Erklärung „Weil er so dick geworden ist" vollkommen akzeptabel, obwohl es bereits gewußt wird, daß Oskar unlängst sehr dick geworden ist. (Ich bin Hans Rott für den Hinweis auf diesen Punkt sowie für das Beispiel zu Dank verpflichtet.) Doch auch wenn die Antwort „Weil er so dick geworden ist" das ist, was als Erklä-
110
Peter Gärdenfors
rung geäußert wurde, so liegt die verborgene Konsequenz doch darin, daß Viktorias Abscheu vor Oskars Beleibtheit das eigentliche Explanans ist, und diese Tatsache ist nicht in Κ enthalten, und widerspricht daher nicht der Bedingung (iv). Dies ist nur ein Beispiel davon, wie die primäre Funktion von Sprechakten in der Anführung einer unausgesprochenen Präsupposition liegen kann. Diese Funktion ist nichts für Erklärungen Spezifisches, sondern taucht in diversen Arten kommunikativer Kontexte auf. 5. Anwendungen der Analyse In diesem Abschnitt werde ich den in Abschnitten 3 und 4 eingeführten Begriffsapparat benutzen, um einige der bekanntesten Beispiele aus der Literatur zu behandeln. Ich werde auch einige Probleme diskutieren, die im Zusammenhang verschiedener Erklärungstheorien entstanden sind. Als paradigmatisches Beispiel habe ich Scrivens berühmtes Beispiel der progressiven Paralyse gewählt. Meine Analyse dieses Beispiels wird auf großen Strecken derjenigen Hanssons (1975) parallel sein. Seine Argumente basieren jedoch auf einer Analyse von Warum-Fragen, während die Trittbretter meiner Analyse epistemische Zustände sind. Scrivens Beispiel beruht auf der Tatsache, daß nur solche Personen, die lange Zeit Syphilis hatten, progressive Paralyse bekommen können, jedoch nur ein geringer Prozentsatz dieser Syphiliskranken jemals an progressiver Paralyse erkrankt. Darüberhinaus gibt es keinen bekannten Faktor, der für die Entstehung von progressiver Paralyse relevant ist. Scriven behauptet nun, sehr im Gegensatz zu Hempels Theorie, daß die Tatsache, daß eine bestimmte Person lange Zeit Syphilis hatte, zusammen mit obigem allgemeinen Satz erkläre, warum sie progressive Paralyse bekam. Die allgemeinere Regel, die Scriven hier verwendet, besagt: wenn eine Eigenschaft R die einzige bekannte Ursache einer Eigenschaft Q ist, dann kann man mithilfe der Feststellung, daß ein bestimmtes Individuum die Eigenschaft R besitzt, erklären, warum es die Eigenschaft Q besitzt, und zwar unabhängig davon, wie wahrscheinlich Q gegeben R ist. Hempel (1965, S. 369 f) verteidigt seine Theorie durch ein Ge-
Die Epistemologie von Erklärungen
111
genbeispiel, von der er behauptet, es hätte dieselbe logische Struktur wie das Beispiel der progressiven Paralyse: Niemand kann den ersten Preis in der Irischen Pferderennlotterie machen, ohne ein Lotterielos gekauft zu haben, doch nur ein kleiner Prozentsatz jener Personen, die ein Lotterielos gekauft haben (in der Tat nur eine), gewinnt den ersten Preis. Hempel argumentiert, durch die bloße Feststellung, daß jemand ein Lotterielos gekauft hätte, sei es nicht möglich, zu erklären, warum er den ersten Preis gewann. Um die Unterschiede zwischen diesen beiden Beispielen zu zeigen und klar zu machen, daß Scrivens Beispiel dennoch eine Erklärung ist, während Hempels Beispiel keine ist, müssen wir versuchen, die akzeptierten Hintergrundannahmen aufzudekken, die in diesen Beispielen vorausgesetzt werden. Ich stelle mir vor, daß es in dem stillschweigenden epistemischen Zustand Κ von Scrivens Beispiel keine Eigenschaft gibt, von der erwartet wird, daß sie für progressive Paralyse relevant ist. Die Wahrscheinlichkeit, progressive Paralyse zu bekommen, wird in diesem Zustand sehr niedrig eingeschätzt, sagen wir bei 0,0001. Wenn hier nach einer Erklärung für Nietzsches Erkrankung an progressiver Paralyse verlangt wird, so ist über ihn also nichts bekannt, was für die Tatsache von Relevanz sein könnte, daß er - als einer unter allen Personen - progressive Paralyse bekam. Sei R die engste Referenzklasse, von der bekannt ist, daß ihr Nietzsche zugehört (natürlich ausgenommen die Tatsache, daß Nietzsche zur Klasse der an progressiver Paralyse Erkrankten gehört), und sei Q die Eigenschaft, an progressiver Paralyse zu leiden. Das Explanandum ist also „ ß a " , wobei α eine Individuenkonstante ist, die Nietzsche bezeichnet. In KQ„ gilt dann also P(Q/R) = P{Q) = 0,0001, woraus aufgrund (EFW) BQSQO) = 0,0001 folgt. Sei S nun die Eigenschaft, lange Zeit Syphilis gehabt zu haben. Die von Scriven nun vorgeschlagene Erklärung besteht aus den Wahrscheinlichkeitssätzen „p(Qx/Sx) = 0,1" und „p{Qxj—\ Sx) = O", deren Konjunktion das Τ von (ERK) bildet, sowie - falls dies nicht bereits in KQ„ gewußt wird dem singulären Satz „Sa", welcher unser C bildet. Wenn wir nun (EFW) erneut anwenden, so erhalten wir BQ a (Qa/Tλ C) = 0,1, was bedeutet, daß die Wahrscheinlich-
112
Peter Gärdenfors
keit in Übereinstimmung mit (iii) von (ERK) angestiegen ist. (Genau genommen ist der Satz „p(Qx/~\ Sx)" für diese Herleitung nicht nötig.) Damit ist Scrivens Beispiel als Erklärung gemäß (ERK) bestätigt. In Hempels Beispiel liegen die Dinge jedoch ein wenig anders. Bezeichne Q die Eigenschaft, den ersten Preis in der Irischen Pferderennlotterie gewonnen zu haben, und S die Eigenschaft, ein Lotterielos gekauft zu haben. Wenn wir erklären wollen, warum Qa, wobei α der Gewinner des ersten Preises ist, so ist es ganz natürlich, anzunehmen, daß es im Wissen des epistemischen Zustande KQ„ bereits enthalten ist, daß nur Personen, die ein Lotterielos gekauft haben, gewinnen können. Wenn man erfahrt, daß eine Person α den ersten Preis gewann, so weiß man normalerweise nichts über a, was für die Tatsache, daß α den ersten Preis gewann, von Relevanz ist, außer jedoch der Tatsache, daß α ein Los gekauft hat. Ist R die engste Referenzklasse, von der gewußt wird, daß ihr α angehört, so gilt im epistemischen Zustand K£a also P(Q) = P(Q/R) = P(Q/R Λ S), und mithilfe von (EFW) erhalten wir BQJQÜ) = BQa(Qa/Sa). Die Feststellung, daß α ein Los gekauft hat, wird hier daher keine befriedigende Erklärung für das Explanandum „Qa" sein, da sie seinen Glaubensgrad nicht erhöht. Aus diesem Grund stimme ich mit Hempel darin überein, daß die einzige bekannte Ursache eines Ereignisses nicht unbedingt schon eine Erklärung des Ereignisses sein muß. Doch ich fasse Hempels Beispiel eben nicht als parallel zu Scrivens Beispiel auf. Der Unterschied liegt in dem, was in dem der Erklärung entsprechenden epistemischen Zustand akzeptiert wird. Damit Scrivens Beispiel eine Erklärung ist, muß angenommen werden, daß man von dem Gesetz, demzufolge nur an Syphilis Erkrankte progressive Paralyse bekommen können, noch nichts weiß. Dieses Gesetz ist dann ein unverzichtbarer Teil der Erklärung. Wenn man jedoch den epistemischen Zustand rekonstruiert, der Hempels Beispiel zugrundeliegt, so ist es die naheliegendste Annahme, daß sich hier die Tatsache, daß nur jene Personen, die ein Los gekauft haben, gewinnen können, bereits unter den akzeptierten Wissensannahmen befindet. Werden die Annahmen über das zugrundeliegende Wissen dahingehend geändert, daß man bereits weiß, daß der progres-
Die Epistemologie
von Erklärungen
113
siven Paralyse notwendigerweise Syphilis vorausgeht, so ist die Information, daß Nietzsche Syphilis hatte, keine Erklärung mehr für seine Erkrankung an progressiver Paralyse. Unter diesen Annahmen über das Hintergrundwissen wären Hempels und Scrivens Beispiel tatsächlich parallel und keines von beiden wäre dann als Erklärung akzeptierbar - doch dies ist nicht das Beispiel, das Scriven im Kopf hatte. Die Tatsache, daß unterschiedliches Hintergrundwissen für Scrivens Beispiel einen entscheidenden Effekt hat, kann auch durch Analyse der in diesen beiden Situationen angemessenen Warum-Fragen gezeigt werden. Diese Strategie benutzt Hansson (1975). Im ersten epistemischen Zustand, wo man nicht weiß, daß Syphilis notwendige Bedingung für progressive Paralyse ist, muß die angemessene Frage lauten: „Warum hat unter allen Personen gerade Nietzsche progressive Paralyse bekommen?" Im zweiten epistemischen Zustand, wo man weiß, daß Syphilis notwendige Bedingung für progressive Paralyse ist, fragt man stattdessen: „Warum hat unter allen Syphiliskranken gerade Nietzsche progressive Paralyse bekommen?" Die Phrasen „unter allen Personen" und „unter allen Syphiliskranken" geben die Referenzklasse an, der das Individuum zugeordnet wird. In Hanssons Theorie ist diese Referenzklasse ein wichtiger Bestandteil einer Warum-Frage, der für die Frage, welche Explananssätze für das erfragte Explanandum möglich sind, eine entscheidende Rolle spielt. Stellt man eine Frage der Form „Warum hat α unter allen R's die Eigenschaft QT\ so hat die Anführung von R genau den Zweck, herauszustreichen, daß man bereits weiß, daß α die Eigenschaft R hat, und daß man sonst nichts über α weiß, das für die Tatsache, daß α die Eigenschaft Q besitzt, von Relevanz ist (abgesehen von Dingen, von denen man voraussetzen kann, daß sie jedermann bekannt sind). In unserer Theorie der Erklärung besteht keine explizite Notwendigkeit, die in der Warum-Frage erwähnte Referenzklasse zu betrachten, denn hier wird angenommen, daß das vorausgesetzte Wissen, welche Eigenschaften Individuen haben, bereits in den epistemischen Zuständen verankert ist. Stegmüller (1983, S. 952) meint, „verschiedene Arten von Warum-Fragen sind, unter diesem Gesichtspunkt betrachtet, nichts anderes als sprachliche Manifestationen verschiedener Arten von Wis-
114
Peter
Gärdenfors
senssituationen, in denen sich die Personen befinden, welche Erklärung heischende Warum-Fragen stellen". Für eine Analyse der Pragmatik von Warum-Fragen vgl. Sintonen (1984). In Verbindung mit dieser Diskussion der Funktion von Referenzklassen möchte ich einige Bemerkungen zu Hempels Forderung der ,maximalen Bestimmtheit' anfügen. Die in (EFW) formulierte Bedingung für die Glaubensfunktion Β ist eine Spezifikation der Idee, daß bei der Bestimmung der Wahrscheinlichkeit eines Einzelereignisses die ,totale Evidenz' in Betracht gezogen werden sollte. Hempel sagt, daß seine Forderung der maximalen Bestimmtheit nicht, so wie er früher dachte, bloß „ein grobes Substitut der Forderung der totalen Evidenz" sei. Der Grund hierfür ist, daß „bei dieser Art von Überlegung zwei Fragen miteinander verwechselt werden. Die eine betrifft die Stärke der Evidenz für die Behauptung, daß das Explanandumereignis auftrat; die andere betrifft die Wahrscheinlichkeit, die mit einer I-S-Erklärung, warum das Explanandumereignis auftrat, verbunden ist." (Hempel 1968, S. 121 - Übers, d. Hrsg.). Im ersten Fall, so Hempel, sei die Forderung der totalen Evidenz anwendbar. Im zweiten Fall jedoch, so fahrt er fort, sei sie nicht anwendbar. Denn wenn man nach einer Erklärung von Ε sucht, ist Ε normalerweise bereits in dem, was man weiß, enthalten, sodaß die Wahrscheinlichkeit von Ε aufgrund des gegebenen Wissens 1 beträgt. Doch in den meisten Fällen von Erklärung verleiht das Explanans dem Explanandum eine Wahrscheinlichkeit kleiner 1, sodaß die Forderung der totalen Evidenz daher auf diese Situation nicht angewandt werden kann. Hempel diskutiert hier nur jenen epistemischen Zustand, der vorliegt, wenn man erfahrt, daß das Explanandum wahr ist, also das AT von (ERK). Gemäß meiner Analyse sollte ein Explanans jedoch in bezug auf K£ bewertet werden, welches normalerweise den epistemischen Zustand darstellt, den man einnahm, bevor man Ε akzeptiert hat. Und auf diesen Zustand ist die Forderung der totalen Evidenz anwendbar (so wie sie in (EFW) formuliert wurde). Daher sehe ich Hempels ursprüngliche Rechtfertigung seiner ,Forderung der maximalen Bestimmtheit' als die richtige an, und seine spätere als irreführend, weil er hier nicht zwischen den zwei relevanten epistemischen Zuständen unterscheidet, näm-
Die Epistemologie von Erklärungen
115
lieh zwischen Κ und Κ£. Stegmüller hat argumentiert (1983, S. 958 f), daß dies für Hempel zu ernsthaften Problemen führe. Die Formulierung von (EFW), welche Hempels Forderung der maximalen Bestimmtheit entspricht, ist freilich von Hempels Formulierung verschieden, da ich zur Beschreibung epistemischer Zustände andere Mittel verwende. Ich wende mich nun einer Beispielsklasse zu, die gemäß Salmon (1971) zeigt, daß Hempels Erklärungstheorie unbefriedigend ist. Eines dieser Beispiele ist das folgende: „John Jones konnte verhindern, im letzten Jahr schwanger zu werden, denn er nahm regelmäßig die Antibabypillen seiner Frau, und jeder Mann, der regelmäßig Antibabypillen nimmt, bleibt von einer Schwangerschaft verschont." (Salmon 1971, S. 34 - Übers, d. Hrsg.). Salmon behauptet, dies keine Erklärung: „Männer werden nicht schwanger, ob sie Antibabypillen nehmen oder nicht, daher ist der Faktor der Einnahme von Antibabypillen nicht nötig, um diese Tatsache im Fall von John Jones zu erklären (wenngleich dieser Faktor für die Frage der Schwangerschaft von John Jones' Frau beträchtliche Erklärungskraft haben mag)" (S. 34 - Übers, d. Hrsg.). Später faßt er diese Beispielsgruppe in folgender Weise zusammen: „Alle diese Explanandumereignisse haben eine hohe Ausgangswahrscheinlichkeit, ganz unabhängig von den erklärenden [d. h. hier, als erklärend angeführten - d. Hrsg.] Tatsachen, und die Wahrscheinlichkeit des Explanandumereignisses relativ zu den erklärenden Tatsachen ist hier gleich wie seine Ausgangswahrscheinlichkeit. In diesem Sinn sind die erklärenden Tatsachen für das Explanandumereignis irrelevant." (S. 36 - Übers, d. Hrsg.) Der Grund, warum uns Salmons Beispiel nicht als Erklärung erscheint, ist, daß wir bereits wissen, daß Männer niemals schwanger werden. Wie Salmon betont, erhöht sich nicht der Glaubensgrad der Tatsache, daß John Jones nicht schwanger wurde, wenn wir erfahren, daß er Antibabypillen einnahm. Wenn jemand dieses elementare Wissen über die Funktionsweise des menschlichen Körpers nicht hätte, ζ. B. ein Kind oder ein
116
Peter Gärdenfors
außerirdisches Wesen, dann könnte die Information, daß John Jones Antibabypillen einnahm, zusammen mit dem Gesetz, daß niemand, der Antibabypillen einnimmt, schwanger wird, eine Erklärung für John Jones' Nichtschwangerschaft liefern, die für dieses Wesen akzeptabel ist. Salmons Beispiel scheint uns daher nicht deshalb keine Erklärung zu sein, weil mit der logischen Struktur seiner Explananssätze etwas nicht in Ordnung wäre, sondern weil wir über ein allgemein bekanntes Hintergrundwissen verfügen, das den Explananssätzen informationell überlegen ist.
6. Einige Konsequenzen der Analyse Bedingung (iii) von (ERK), derzufolge der Glaubensgrad des Explanandums steigen soll, hat zur Konsequenz, daß Erklärungen nicht bloß richtig oder falsch sind, sondern daß es Grade der Erklärung gibt. Je mehr eine Erklärung den Glaubensgrad des Explanandums erhöht, desto besser ist sie. Von zwei Erklärungen desselben Explanandums kann eine dessen Glaubensgrad weit mehr erhöhen als eine andere. In einem solchen Fall besteht die Tendenz, die weniger informative Erklärung zurückzuweisen und sie nicht länger als Erklärung zu bezeichnen. Wäre die informativere Erklärung jedoch nicht zur Verfügung gestanden, so hätte die andere durchaus akzeptiert werden können. Deduktive Erklärungen sind insofern die besten, als sie den Glaubensgrad des Explanandums auf den Maximalwert erhöhen. Der Grund, warum man deduktive Erklärungen als definitiv betrachtet, liegt darin, daß es hier nicht mehr möglich ist, daß zusätzliches Wissen den Glaubensgrad des Explanandums noch weiter erhöhen kann. Bedingung (iii) von (ERK) gibt uns auch ein natürliches Maß der Erklärungskraft eines Explanans Τ A C für ein Explanandum Ε in einem epistemischen Zustand . Je größer die Differenz zwischen B£(EJT Λ C) und BE (E), desto größer die Erklärungskraft von Γ Λ C für E, und umso informativer die Erklärung. (ERK) läßt verschiedene Erklärungen eines Satzes Ε zu. Mithilfe des Ausdrucks B£(E/T λ C)-BE(E) als Maß für
Die Epistemologie
von Erklärungen
117
die Erklärungskraft haben wir eine Methode, die beste unter den möglichen Erklärungen für Ε zu bestimmen. Aus Bedingung (iii) von (ERK) folgt nicht, daß die Wahrscheinlichkeit von 2s nach Erhalt der Information Τ Λ C größer als 0,5 (oder irgendeine andere Untergrenze) sein sollte, sondern nur, daß das Explanans die Wahrscheinlichkeit des Explanandums erhöhen sollte. Diese Eigenschaft von (ERK) wurde von Schurz (1983, S. 190) kritisiert (vgl. auch Stegmüller 1983, S. 971-973). Um das Beispiel von Schurz zu verwenden: Wenn ich erklären möchte, warum Peter den ersten Preis in einer Lotterie mit einer Million Losen gewonnen hat, so ist es nicht sehr befriedigend, hierfür auf die Tatsache hinzuweisen, daß Peter 10 Lose gekauft hat, auch wenn dies die Wahrscheinlichkeit von 0,000001 auf0,00001 erhöht. Und wenn wir das oben angeführte Maß der Erklärungskraft anwenden, so sehen wir, daß diese ,Erklärung' in der Tat einen niedrigen Erklärungswert hat. Auch wenn der Erklärungswert in diesem Beispiel unter die Grenze dessen fällt, was von einer Erklärung erwartet werden kann, so halte ich es allgemein gesehen dennoch nicht für möglich, irgendeine untere Grenze für den Erklärungswert bzw. den Glaubensgrad des Explanandums nach Erhalt des Explanans einzuführen. Insbesondere ist - wie das Beispiel der progressiven Paralyse zeigt - meiner Ansicht nach nicht zu verlangen, daß die Wahrscheinlichkeit des Explanandums nach Erhalt der Explanansinformation größer als 0,5 sein sollte. In Zusammenhang damit kann erwähnt werden, daß es, wie einige Autoren betont haben, zwei Arten von Erklärungen gibt - die sogenannten ,wie-möglich'- und die ,warum-notwendig'Erklärungen (vgl. Dray 1957). Meiner Ansicht nach gibt es keinen essentiellen Unterschied zwischen diesen beiden Erklärungsarten, und sie werden beide durch meinen Ansatz erfaßt. Wenn man erklären will, warum ein Ereignis notwendigerweise geschah, dann geht man von einem Explanandum mit einem Glaubensgrad kleiner 1 aus (wie immer), und erhöht dann den Glaubensgrad des Explanandums auf den Maximalwert 1. Wenn wir erklären wollen, warum es möglich war, daß ein Ereignis auftrat, so gehen wir von einem Glaubensgrad nahe bei 0 oder sogar 0 aus. Das Explanans erhöht dann den Glaubensgrad des Explanandums, aber nicht immer auf einen Wert nahe
118
Peter Gärdenfors
bei 1, wie es Hempel behauptete (1965, S. 428, Anm. 5). In jenen Fällen, wo das Explanandum den im epistemischen Zustand Κ akzeptierten Sätzen widerspricht, wird das Explanans eine Revision von .K bewirken (vgl. Stegmüller 1983, S.999f). Die Tatsache, daß Erklärungen immer in Relation zu einem epistemischen Zustand bewertet werden, hat auch folgende Konsequenz: Es kann sein, daß ein Explanans Τ λ C, welches im Zustand Κ als Erklärung von Ε akzeptiert wurde, in einem Zustand K', der mehr Wissen enthält als K, nicht länger als Erklärung für Ε akzeptierbar ist. Beispielsweise bin ich möglicherweise von der Tatsache überrascht, daß Fräulein Julie im Monat Februar braungebrannt ist. Wenn ich nach einer Erklärung frage und die Antwort erhalte, daß Fräulein Julie unlängst eine Woche auf den Kanarischen Inseln verbracht hat, so akzeptiere ich dies als Erklärung, da ich weiß, daß die meisten Personen von einer Reise auf die Kanarischen Inseln braungebrannt zurückkehren. Wenn ich jedoch später erfahre, daß es auf den Kanarischen Inseln gerade geregnet hat, als Fräulein Julie dort war, dann ist die frühere Erklärung nicht länger befriedigend für mich, und mir fehlt erneut eine Information, welche mir sagt, warum Fräulein Julie braungebrannt ist. Dies ist ein Beispiel dessen, was Rott (1984) und Stegmüller (1983, S. 1011) eine ,Scheinerklärung' nennen. Es scheint, als hätte Hempel angenommen, die logische Analyse der in einer Erklärung enthaltenen Sätze sei ausreichend, zumindest was deduktive Erklärungen betrifft. Er vergleicht seine Analyse mit der metamathematischen Beweistheorie, deren Untersuchungsobjekt nicht dem Beweisbegriff in seiner Alltagsbedeutung, sondern einer idealisierten Form des Beweisbegriffs entspricht. Er sagt, daß seine Erklärungsmodelle „nicht bezwecken zu beschreiben, wie praktisch arbeitende Wissenschaftler ihre Erklärungen tatsächlich formulieren. Ihr Zweck ist vielmehr, in hinreichend präzisen Begriffen die logische Struktur und den rationalen Sinn der diversen Weisen anzugeben, in denen die empirische Wissenschaft erklärungssuchende Warum-Fragen beantwortet. Die Konstruktion unserer Modelle involviert daher ein gewisses Ausmaß an Abstraktion und logischer Schematisierung." (1965, S.412 - Übers, d. Hrsg.).
Die Epistemologie
von Erklärungen
119
Ich hoffe, die Analyse dieses Kapitels hat gezeigt, daß Hempels Idealisierung einige essentielle Eigenschaften von Erklärungen nicht erfaßt (vgl. auch die Diskussion in Sintonen 1984). Bevor Hempel statistische Erklärungen zu analysieren begann, glaubte man, diese Erklärungen würden sich als Verallgemeinerung jener deduktiv-nomologischen Erklärungen ergeben, die von Hempel und Oppenheim in scheinbar erfolgreicher Weise analysiert worden waren. Hauptsächlich aufgrund dessen, was Hempel ,die Ambiguität induktiv-statistischer Erklärungen' nannte, stellt sich dann jedoch heraus, daß es unmöglich ist, solche Erklärungen allein aufgrund von Relationen zwischen den Explananssätzen und dem Explanandum zu charakterisieren. Hempel sah sich daher gezwungen, statistische Erklärungen relativ zu einer Wissenssituation zu analysieren. Eine erhellende Darstellung der Gründe für Hempels Abweichung von jener Art der Analyse, die er für deduktive Erklärungen verwendete, wurde von Coffa (1974) erbracht. Ist man in einem epistemischen Zustand, in dem man mit Sicherheit oder Fast-Sicherheit voraussagen kann, daß Ε auftreten wird, und Ε tritt dann tatsächlich auf, so wird man für diese Tatsache keine Erklärung mehr benötigen. Doch es muß zugegeben werden, daß man auch in diesen Situationen von ,der Erklärung' von Ε sprechen kann. Der Grund hierfür ist, daß wir uns eine Kontraktion K£ unseres gegenwärtigen epistemischen Zustandes vorstellen können, in welchem Ε nicht enthalten ist, und dann fragen, was relativ zu diesem Zustand eine Erklärung wäre. Ein typisches Beispiel dieses Phänomens liegt vor, wenn ein Lehrer einen Schüler nach der Erklärung einer Tatsache Ε fragt, obwohl des Lehrers Glaubensgrad für Ε in seinem gegenwärtigen Zustand bereits sehr hoch ist. In einer solchen Situation gibt der Lehrer vor, er wäre in einem epistemischen Zustand, worin is einen relativ geringen Glaubensgrad besitzt. Der arme Schüler muß nun erstens herausfinden, von welchem epistemischen Zustand der Lehrer vorgibt, sich in ihm zu befinden, und zweitens, welche Elemente des epistemischen Zustande, in dem sich der Lehrer tatsächlich befindet, eine Erklärung für Ε relativ zu seinem vorgetäuschten epistemischen Zustand liefern. In Sintonen (1984) werden einige weitere Aspekte von Erklärungen als kommunikativen Akten dargestellt.
120
Peter Gärdenfors
In analoger Weise können verschiedene Personen über ,die Erklärung' einer Tatsache, mit der sie bereits vertraut sind, übereinstimmen, weil sie sie beim Versuch, sich in einen epistemischen Zustand zu versetzen, in dem das Explanandum nicht gewußt wird (i. e. ein kontrahierter Zustand), zu ähnlichen epistemischen Zuständen gelangen, und daher dieselben Sätze für sie als Explanans funktionieren. Obwohl solche Übereinstimmungen in der Selektion des kontrahierten epistemischen Zustandes recht häufig sind, ist es nicht möglich, darauf eine allgemeine Theorie der Erklärung aufzubauen. Ein Grund dafür ist eben, daß verschiedene Personen ihre epistemischen Zustände in verschiedener Weise kontrahieren können. Auch wenn sie vom selben epistemischen Zustand ausgehen, werden sie bei verschiedenen Kontraktionen Κ^ landen, in bezug zu welchen eine Erklärung gefunden werden soll. Dies zeigt, daß Erklärungen in hohem Maße kontextabhängig sind. Auch van Fraassen (1980, Kap. 5) betont diesen Sachverhalt. Und in dem noch offensichtlicheren Fall, wo die Personen von verschiedenen epistemischen Zuständen ausgehen, ist es nicht überraschend, daß es verschiedene Explananssätze mit jeweils variierendem Erklärungswert geben wird. Tatsächlich gibt es viele Situationen, in denen die Ansichten über ,die Erklärung' einer gegebenen Tatsache auseinandergehen. Bei der Erklärung eines vorliegenden Autounfalles mag eine Person zufrieden sein, wenn sie erfahrt, daß die Reifen des Wagens bereits abgenutzt waren; eine andere Person, der der Zustand des Wagens bereits bekannt ist, mag die Tatsache, daß es stark geregnet hat, als die Erklärung ansehen; und eine dritte Person schließlich könnte sich durch die Information erhellt fühlen, daß wenn immer ein Wagen mit großer Geschwindigkeit auf nasser Fahrbahn fahrt, die Reibungskraft beträchtlich verringert ist (dieses Beispiel geht auf Carnap 1966, S. 191-192 zurück). 7. Schlußwort Was in diesem Aufsatz versucht wurde, ist die Skizzierung der Basis für eine vereinheitlichte Theorie der Erklärung. Die Hauptidee war etwas, das völlig trivial erscheinen könnte -
Die Epistemologie
von Erklärungen
121
nämlich daß eine Erklärung relevante Information über das zu Erklärende liefern soll, sodaß es dadurch weniger überraschend wird. Wenn die von einer Erklärung gelieferte Information jedoch relativ zu verschiedenen epistemischen Situationen bewertet wird, so hat diese Idee, wie wir gezeigt haben, weitreichende Konsequenzen. Die hier präsentierte Analyse ist epistemologisch, da die Konzentration auf verschiedene epistemische Situationen beim Studium von Erklärungen als einer Form des Informationsaustausches zwischen Personen wesentliche Einsichten vermittelt. Und die Analyse ist pragmatisch, da sie mehr enthält als eine bloße Analyse der im Explanans und dem Explanandum auftretenden Sätze, und weil sie klarmacht, warum viele Argumente der alltäglichen Kommunikation als Erklärungen akzeptierbar sind, während andere Theorien diese als elliptische Erklärungen betrachten. Der Einfachheit der Darstellung wegen habe ich eine Reihe von Annahmen getroffen, die in einer allgemeineren Theorie abgeschwächt oder fallengelassen werden müssen. Erstens habe ich mich auf die Erklärung von singulären Sätzen beschränkt, und dabei alle Probleme ausgeklammert, die die Gesetzesartigkeit oder die verschiedenen Ebenen des Gehaltreichtums von Sätzen betreffen. Zweitens behaupte ich nicht, daß meine Bedingungen hinreichend für Erklärungen sind, nicht einmal für die in der einfachen Objektsprache dieses Aufsatzes beschreibbaren Erklärungen. Beispielsweise habe ich keinen Versuch gemacht, um redundante Elemente in den Explananssätzen zu eliminieren (für einen solchen Versuch in Verbindung mit deduktiven Erklärungen s. Gärdenfors 1976). Zuguterletzt - und dies ist vielleicht am wichtigsten - sind meine Wissens- und Glaubensmodelle rudimentär und lediglich als heuristische Konstruktionen aufzufassen. Um tiefere Theorien der Erklärung zu gewinnen, die auch als Theorien des Verstehens dienen können, müssen meiner Ansicht nach verfeinerte und psychologisch realistischere Modelle von epistemischen Zuständen und ihrer Dynamik entwickelt werden.
122
Peter Gärdenfors
Danksagung Dieser Aufsatz ist als Weiterführung und Revision meiner Arbeit (1980) entstanden. Für hilfreiche Diskussionen über die Erklärungsproblematik möchte ich Bengt Hansson, Michael Küttner, Isaac Levi, Hans Rott, Gerhard Schurz, Matti Sintonen, Wolfgang Spohn, Wolfgang Stegmüller und Bas van Fraassen danken. Literatur Aichourron, C. E./Gärdenfors, P./Makinson, D. (1985): „On the Logic of Theory Change: Partial Meet Functions for Contraction and Revision", Journal of Symbolic Logic 50, S. 510-530. Carnap, R. (1966): Philosophical Foundations of Physics, Basis Books, New York. Coffa, J. A. (1974): „Hempel's Ambiguity", Synthese 28, S. 141-163. Dray, W. (1957): Laws and Explanation in History, Oxford Univ. Press, Oxford. Gärdenfors, P. (1976): „Relevance and Redundancy in Deductive Explanations", Philosophy of Science 43, S. 420-431. Gärdenfors, P. (1978): „On the Logic of Relevance", Synthese 37, S. 351-367. Gärdenfors, P. (1980): „A Pragmatic Approach to Explanation", Philosophy of Science 47, S. 404-423. Gärdenfors, P. (1982): „Rules for Rational Changes of Belief, in: Pauli, Τ. (Hrsg.), < 320311 > : Philosophical Essays Dedicated to Lennart Aqvist on his Fiftieth Birthday, Philosophical Studies publ. by the Phil. Society and the Dept. of Philosophy, Uppsala University, No. 34, Uppsala. Gärdenfors, P. (1984): „Epistemic Importance and Minimal Changes of Belief', Australian Journal of Philosophy 62, S. 136-157. Gärdenfors, P. (1986): „The Dynamics of Belief: Contractions and Revisions of Probability Functions", Topoi 5, S. 29-37. Gärdenfors, P. (1987): Knowledge in Flux, Bradford Books, MIT Press, Cambridge, Mass. Hansson, B. (1975): „Explanations - Of What?", vervielfältigtes Manuskript, Stanford University. Hempel, C. G. (1965): Aspects of Scientific Explanation and Other Essays, Free Press, New York. Hempel, C. G. (1968): „Maximal Specifity and Lawlikeness in Probabilistic Explanation", Philosophy of Science 35, S. 116-134.
Die Epistemologie
von Erklärungen
123
Levi, I. (1986): „Four Themes in Statistical Explanation", Manuskript, Columbia University, New York. Küttner, Μ. (1984): „Glaube, Wissen und die Pragmatik des Erklärens: Zur Kritik des Ansatzes von Gärdenfors und Stegmüller", in: Gombocz, W. L. (Hrsg.), Religionsphilosophie, Akten des 8. Internationalen Wittgenstein Symposiums, Teil 2, Hölder-Pichler-Tempsky, Wien, S. 102-107. Niiniluoto, I. (1976): „Inductive Explanation, Propensity and Action", in: Manninen, J./Tuomela, R. (Hrsg.), Essays on Explanation and Understanding, Reidel, Dordrecht. Rott, Η. D. (1984): Epistemische Interpretationen von wenn-dann- und weil-Sätzen nach Kratzer, Gärdenfors und Spohn, Magisterarbeit, Ludwig-Maximilians-Universität, München. Salmon, W. C. (1971): Statistical Explanation and Statistical Relevance, Univ. of Pittsburgh Press, Pittsburgh. Schurz, G. (1983): Wissenschaftliche Erklärung. Ansätze zu einer logisch-pragmatischen Wissenschaftstheorie, Dissertationen der KarlFranzens-Universität Graz, dbv-Verlag für die TU Graz, Graz. Scriven, M.J. (1959): „Explanation and Prediction in Evolutionary Theory", Science 130, Nr. 3374, S. 477-482. Sintonen, M. (1984): The Pragmatics of Explanation, Acta Philosophica Fennica 37, Helsinki. Stegmüller, W. (1980): „Two Successor Concepts of the Notion of Statistical Explanation", in: Fl0stad, G./von Wright, G. H. (Hrsg.), Logic and Philosophy, The Hague, S. 37-52. Stegmüller, W. (1983): Erklärung-Begründung - Kausalität. Probleme und Resultate der Wissenschaftstheorie und Analytischen Philosophie, Band 1, zweite, verbesserte und erweiterte Auflage, SpringerVerlag, Berlin/Heidelberg/New York. Van Fraassen, B. (1977): „The Pragmatics of Explanation", American Philosophical Quarterly 14, S. 143-150. Van Fraassen, B. (1980): The Scientific Image, Clarendon Press, Oxford.
Raimo Tuomela Eine pragmatisch-nomologische Theorie des wissenschaftlichen Erklärens und Verstehens 1. Einleitung Wissenschaftliche Erklärungen können aus der Perspektive des Fragens und Antwortens betrachtet werden. So können sie als soziale Handlungen mit einem Fragenden (Explanand) und einem Antwortenden (Explanator) als Handlungsträger angesehen werden. Solche soziale Handlungen finden in einem bestimmten wissenschaftlich-sozialen Kontext statt, wie wir bald sehen werden. Im folgenden werden wir eine pragmatisch-nomologische Theorie der wissenschaftlichen Erklärung skizzieren, welche deduktive und induktive (nicht-deduktive), strikte und approximative Erklärungen abdeckt, die Erklärung singulärer Ereignisse (oder Tatsachen) wie auch genereller Gesetze. Unsere Theorie ist pragmatisch in dem Sinn, daß sie sich ausdrücklich auf die Handlungen des Fragens und Erklärens von Wissenschaftlern bezieht, von denen angenommen wird, daß sie zu einer wissenschaftlichen Gemeinschaft (scientific community) gehören und ein bestimmtes (Kuhnsches) Paradigma teilen (eine bestimmte Konstellation von Gruppen-Verbindlichkeiten). Wir können auch sagen, daß diese Theorie ein deduktiv-resp. induktiv-nomologisches Modell der Erklärung in einen pragmatischen Kontext einbettet. Gemäß unserer Analyse wird eine Erklärungssituation folgendes beinhalten: einen Fragesteller (oder Explananden), einen Antwortenden (oder Explanator), einen Fragesatz und einen Antwortsatz. Der Fragesteller erfragt mittels einer Äußerung oder einem anderen sprachlichen Zeichengebilde (nicht notwendigerweise verbal), warum (oder wie, wann, etc.) etwas der Fall ist oder war. Aus diesem sprachlichen Zeichengebilde wird der Fragesatz in unserem Sinn gewonnen, indem man es in seine logische Form übersetzt. Ähnlich gibt der Antwortende eine Erklärungsantwort, indem er ein sprachliches Zeichen erzeugt, welches wir paraphrasieren, indem wir es ebenfalls in
126
Raimo Tuomela
seine logische Form übersetzen. Wir nehmen damit optimistischerweise an, daß diese Übersetzung geleistet werden kann (obwohl das natürlich nicht ganz unproblematisch ist). Halten wir uns wissenschaftliche Fragen und Antworten im allgemeinen vor Augen, so wird klar, daß sowohl die Fragen als auch die Antworten von den pragmatischen Hintergrundannahmen abhängen, welche Explanator und Explanand teilen, sowie auch von der konkreten pragmatischen Situation (dem Kontext), in dem diese illokutiven Handlungen des Fragens und Erklärens vorkommen. (Zur näheren Charakterisierung von Sprechakten als ,illokutiv' usw. siehe Abschn. 2 unten.) Wir werden auf dieses Problem noch zurückkommen. Allgemein gesprochen ist es eine zentrale Eigenschaft wissenschaftlicher und anderer Erklärungen, ein Verständnis darüber zu vermitteln, warum (oder wie, wann, etc.) etwas der Fall ist oder war. Es ist in der Tat eine begriffliche Wahrheit, daß Handlungen des Erklärens Versuche sind, solch relevantes Verstehen zu bewirken. Ein solcher Versuch muß allerdings, was den Explananden betrifft, nicht immer erfolgreich sein. Trotzdem müssen wir sagen, daß eine Erklärung gemäß den Standards des zugrundeliegenden Paradigmas Verständnis vermitteln soll, und daß sie einem geeigneten (möglichen oder aktuellen) Explananden dies Verständnis tatsächlich vermittelt, relativ zu jenem epistemischen Zustand, in dem er dieses Verständnis noch nicht hatte. (Es genügt vorzugeben, d. h. hypothetisch anzunehmen, daß der Explanand in einem solchen früheren Zustand der Unwissenheit gewesen ist.) Erklären als soziale Handlung wird hier als kommunikative illokutive Handlung des Fragens und Antwortens mit zwei Handelnden Α und Β betrachtet, wobei B's Handlungs-Komponente darin besteht, eine (erklärungssuchende) Frage an Α zu richten und A's Handlungs-Komponente darin, Β eine Erklärungsantwort zu geben, mit der ,illokutiven' Absicht, Β zum Verstehen zu bringen, warum die erfragte Tatsache der Fall ist. Unsere spätere Analyse kann zum Teil als Versuch gesehen werden, zu präzisieren, was in diese soziale Handlung des Fragens und Antwortens alles involviert ist (siehe insbesonders Abschnitt 6 weiter unten). Nehmen wir nun an, eine Person Β fragt, warum etwas der
Eine pragmatisch-nomologische
Theorie
127
Fall ist - ζ. B. warum Wasser bei 100 °C kocht. Bezeichnen wir die logische Form dieser indirekten Frage mit q. Diese logische Form besteht aus einem deskriptiven (deklarativen) Satz, etwa p, auf den ein (sogenannter single-example-) Warum-FrageOperator, etwa ?, angewendet wird, und eine Frage ?p zu formen (siehe Belnap/Steel 1976, S. 86). Für unseren gegenwärtigen Zweck ist unerheblich, ob ρ ein Satz der Prädikatenlogik erster oder zweiter Stufe (oder irgendeiner anderer Sprache) ist. Außerdem werden wir im folgenden normalerweise annehmen, daß q die vollständige Warum-Frage ist, die mit Β 's Frage verbunden ist (oder zumindest, daß ?p die logische Form einer vollständigen Warum-Frage in bezug auf unser zugrundeliegendes q ist). Den Begriff der vollständigen Frage werden wir später noch klären. Ein Explanator Α erzeugt ein passendes sprachliches SatzZeichengebilde u (i.e. ein konkretes Zeichengebilde vom Typ eines Satzes) mit einer bestimmten logischen Form, um q zu beantworten. Mit der Erzeugung von u intendiert er, Β zum (wissenschaftlichen) Verstehen von q zu bringen. Natürlich sollte die Erzeugung von u Β 's Verständnis in der intendierten Weise bewirken - dies blockiert die sogenannten „wayward generative chains" (wie sie von z.B. Goldman 1970, S.60-63, Tuomela 1977, S. 255-258 und Tuomela 1984, Kap. 3 und 4 diskutiert werden). Die Phrase „in der intendierten Weise" - wenn geeignet analysiert - soll also verhindern, daß Β q als Resultat von etwas anderem als Λ'β Intention oder ,Plan' versteht, vorausgesetzt, daß Β q vor der Erzeugung von u noch nicht verstanden hat. Demzufolge beinhaltet ^ ' s Intention in dieser Situation ganz dem Ansatz von Grice entsprechend - folgendes: die Erzeugung von u soll, als Antwort auf q betrachtet, auf natürliche' Weise Β 's Verstehen von q bewirken, und zwar so, daß Β diese Intention von Α dabei bemerkt. Β 's Registrierung der Tatsache, daß A u erzeugt hat, ist somit also der Grund oder zumindest ein Teil des Grundes dafür, daß Β zum Glauben gelangt, daß u eine (wissenschaftliche) Erklärungsantwort auf q ist, und daß A eben dies - nämlich daß Β zu diesem Glauben gelangte - intendiert hat (vgl. Bach/Harnish 1979 sowie Anm. 3 und 7 weiter unten zu dieser Art von ,illokutiven' Absichten).
128
Raimo Tuomela
2. Wissenschaftliches Erklären als kommunikative Handlung Bezeichnen wir nun die konkrete Frage-Erklärungs-Situation mit C und benutzen wir P, um die Tatsache auszudrücken, daß Α und Β zu einer wissenschaftlichen Gemeinschaft gehören, die ein bestimmtes Paradigma teilt (welches wir ebenfalls Ρ nennen). 1 Nennen wir ferner eine Erklärungshandlung bloß potentiell, wenn die darin involvierten Glaubensannahmen von A und Β bloß möglich sind; im Gegensatz zur aktuellen Erklärungshandlung, wo diese auch korrekt bzw. wahr sein müssen (vgl. hierzu auch Anm. 5). Dann schlagen wir folgende Analyse potentieller (partieller oder vollständiger - s. unten (8), (9)) Erklärungshandlungen vor: (1) Definition: Α erklärt Β wissenschaftlich q- in Situation C und gegeben Ρ - durch Erzeugung eines sprachlichen Zeichens u g.d.w. gilt: (a) A's Glauben ist dahingehend, daß u - in Situation C und gegeben Ρ - eine wissenschaftliche Erklärungsantwort auf q ist (oder repräsentiert); (b) Α erzeugt u mit einer dahingehenden Intention, daß die Erzeugung von u in der (auf der Basis von (a)) intendierten Weise folgendes bewirkt: in Situation C und gegeben Ρ versteht Β wissenschaftlich q, und zwar (teilweise) dadurch, daß diese Erzeugung von u in der intendierten Weise Β 's Glauben hervorruft, daß 1
Wir nehmen hier und im folgenden also an, daß alle wissenschaftlichen Erklärungen von einem solchen C und Ρ abhängig gemacht werden. Wie wir in Abschnitt 10 sehen werden, sind Paradigmen nicht leicht präzise zu charakterisieren. Jedenfalls aber scheint das Verstehen von Paradigmen im Sinne Kuhnscher Konstellationen von Gruppenverbindlichkeiten (grob ausgedrückt) es fast zu einer konzeptuellen Wahrheit zu machen, daß wissenschaftliche Erklärungen paradigmenabhängig sind (für Illustrationen vgl. Abschnitt 11). Paradigmen und Kontexte können als einschränkende Bedingungen an Erklärungen aufgefaßt werden. (Falls nötig, könnte man sie mithilfe von Erlaubnis- und Gebotsregeln analysieren und verdeutlichen, deren Erfüllung dann in unseren Definitionen zu fordern wäre.) Man beachte, daß ein bestimmter Wissenschaftler de facto ein Mitglied verschiedener wissenschaftlicher Gemeinschaften sein kann, die verschiedene Paradigmen besitzen. Unsere Analyse behauptet nur, daß die Korrektheit einer Erklärung von einem solchen Paradigma-Kontext-Paar abhängt.
Eine pragmatisch-nomologische Theorie
129
- i n Situation Cund gegeben P- u eine wissenschaftliche Erklärungsantwort auf q ist (oder repräsentiert). Allgemein gesprochen steht Definition (1) für alles, was Α tut und tun muß, um seine Erklärungsbotschaft Β zu übermitteln (auch wenn nicht gefordert wird, daß Β tatsächlich zum Verständnis von q gelangt). Man beachte, daß im Definiens resp. Analysans die Phrase „dahingehend" verwendet wird, weil es natürlich nicht vernünftig ist, zu verlangen, daß Α über solch technische Begriffe wie den einer wissenschaftlichen Erklärungsantwort verfügt. In Definition (1) gibt es mehrere Schlüsselbegriffe, die einer weiteren Klärung bedürfen, und wir werden den Großteil dieses Aufsatzes darauf verwenden. 2 Erstens beachte man, daß Definition (1) die Möglichkeit stärkerer und schwächerer (kontext- und paradigmen-abhängiger) wissenschaftlicher Erklärungsantworten widerspiegelt, weil u eine wissenschaftliche Erklärungsantwort auch lediglich repräsentieren' kann (vgl. (8) und (9) weiter unten sowie die ihnen vorangehende Diskussion). So könnte u ζ. B. eine vollständige (und maximal starke) wissenschaftliche Erklärungsantwort sein oder repräsentieren (vgl. (8)). Zweitens kann manchmal sogar das Zeigen mit dem Finger (was zwar etwas Nonverbales, aber trotzdem in einem weiteren Sinn Sprachliches ist) als u verwendet werden (man beachte „repräsentiert"). Dann kann Β u, obwohl es selbst keine wissenschaftliche Erklärungsantwort auf q ist, als ,Abkürzung' einer solchen Antwort auffassen. Angesichts der Analyse in (1) können wir fragen, worauf Erklären hinausläuft, wenn es als Sprechakt im Sinne der Lin2
Faktisch können wir unten nicht alle Probleme diskutieren, die für (1) von Bedeutung sind. Eines dieser Probleme ist, wie man nichtintentionale Erklärungen genau darstellen sollte, gegeben daß Definition (1) intentionale (oder besser, intendierte) Erklärungen expliziert. Ein anderes Problem ist die Frage, wie weit der Begriff der Intention in (1) verstanden werden soll. Es scheint, daß hier wie im folgenden etwa der weitere Begriff des Ziels (im Gegensatz ζ. B. zum Wunsch) an seiner Stelle verwendet werden kann. Ein weiteres relevantes Problem betrifft die Frage, wie der Begriff des Glaubens in (1) zu analysieren ist. Es ist beispielsweise eine Frage, ob der Glaube, daß ein bestimmtes u eine wissenschaftliche Erklärungsantwort darstellt, so aufgefaßt werden sollte, daß er den in Bedingungen (a) und (b) unserer Definition (9) von wissenschaftlichen Erklärungsantworten enthaltenen Glauben impliziert.
130
Raimo Tuomela
guistik angesehen wird. Nun, da einige zentrale Eigenschaften schon hervorgekehrt worden sind, wollen wir etwas tiefer gehen. Zuerst bemerken wir, daß Erklären als eine kommunikative illokutive Handlung betrachtet werden kann. Das trifft zumindest dann zu, wenn Erklären aus der Perspektive des Fragens und Antwortens betrachtet wird, da diese Handlungen ohne Zweifel kommunikative illokutive Handlungen sind (vgl. Bach/ Harnish 1979, besonders S.43). Betrachten wir nun kurz die Komponenten eines Sprechakts. Es sei Α der Sprecher (Explanator in unserem Beispiel), Β der Hörer (Explanand), u ein Ausdruck der Sprache und C der Kontext der Äußerung. Als Hauptbestandteile von Λ's Sprechakt können dann die folgenden angesehen werden: eine Äußerungshandlung, eine lokutive Handlung, eine illokutive Handlung und eine perlokutive Handlung (vgl. ζ. B. Searle 1969 und Bach/Harnish 1979 zur Erhellung dieser auf Austin zurückgehenden Klassifikation). Die Äußerungshandlung ist A's Äußerung von u gegenüber Β im Kontext C. Die lokutive Handung ist A's (mit dieser Äußerung verbundene) Aussage im Kontext C, daß das-und-das der Fall ist. Die illokutive Handlung hat A's damit verbundenes So-und-so-Tun zum Inhalt (sie betrifft voralledem Ä s Intentionen). Die perlokutive Handlung besteht im Einwirken von Α auf Β in einer bestimmten Art. Sei q = Warum hat sich dieses Stück Kupfer ausgedehnt?, und sei u verbaler Natur. Dann können wir diese Klassifikation wie folgt auf Definition (1) beziehen: v4's Erzeugen von u ist dann die Äußerungshandlung. Die lokutive Handlung besteht darin, daß Α mittels u Β eine Aussage mitgeteilt hat - in unserem Beispiel, daß dieses Stück Kupfer erhitzt worden ist und daß Kupfer sich ausdehnt, wenn es erhitzt wird. Die fragliche illokutive Handung ist A's wissenschaftliches Erklären, also seine wissenschaftliche Beantwortung von Β 's Frage q. Diese Antworthandlung besteht darin, daß Α in der intendierten Weise folgendes zum Ausdruck bringt: (i) seinen Glauben, daß u eine geeignete wissenschaftliche Erklärungsantwort auf q darstellt, und (ii) seine Intention, daß Β aufgrund (i) ebenfalls zu diesem Glauben kommt und in diesem Sinn q versteht. Die,intendierte Weise' beinhaltet hierbei A's reflexive Intention, daß seine Äußerung von u einen von Β 's Gründen konstituiert für Β 's An-
Eine pragmatisch-nomologische
Theorie
131
sieht, d a ß Α d e n g e n a n n t e n G l a u b e n h a t , w o b e i Β z u g l e i c h erk e n n e n soll, d a ß Α e b e n d a s intendierte. D i e s e ,sich selbst e i n b e z i e h e n d e ' I n t e n t i o n v o n Α k a n n e i n e illokutive
Intention
ge-
n a n n t w e r d e n . Ü b e r ihre R e f l e x i v i t ä t h i n a u s h a t d i e s e I n t e n t i o n d a s b e s o n d e r e M e r k m a l , d a ß ihre E r f ü l l u n g i n i h r e m E r k a n n t werden (durch B) besteht.3 I m K o n t e x t v o n D e f i n i t i o n (1) k ö n n e n m e h r e r e p e r l o k u t i v e H a n d l u n g e n m i t e i n b e z o g e n sein. Z u m B e i s p i e l k a n n Α t a t s ä c h lich erreichen, d a ß Β w i s s e n s c h a f t l i c h q v e r s t e h t - a u c h w e n n d i e s e E r f o l g s b e d i n g u n g n i c h t in (1) e i n g e b a u t ist, d a w i r Erklären l e d i g l i c h a l s i l l o k u t i v e H a n d l u n g der e x p l i z i e r t e n A r t b e trachten. A n d i e s e r Stelle k ö n n t e m a n b e m e r k e n , d a ß D e f i n i t i o n (1) a n s c h e i n e n d n i c h t s v o n Β 's Seite erfordert. D o c h d a s ist v ö l l i g unrichtig. D e n n erstens w i r d v o r a u s g e s e t z t , d a ß Β q g e f r a g t h a t . Weiters g i b t e s v e r s c h i e d e n e z u g r u n d e l i e g e n d e
gemeinsame
Glaubensinhalte, die jede illokutive H a n d l u n g voraussetzt. Wir
3
Im vorliegenden Situationstyp (vgl. (1)) richtet sich die reflexive illokutionäre Intention von Α darauf, daß Β sich von etwas bewußt wird, sagen wir ρ (in diesem Fall, daß Α eine bestimmte Intention hat). Repräsentieren wir „A intendiert..." mit ,,/ A ..." und „B ist sich ... bewußt" bzw. „B glaubt, daß ..." durch „BB ...", so haben wir es also mit Aussagen des Typs IA (Bb (p)) zu tun. Die Reflexivität impliziert hier dann die rationalisierende Iterierbarkeit der in IA(ßB(p)) ausgedrückten Schleife (was zu Aussagen wie z.B. IA (BB (IA (BB (P)))) führt). Die derart resultierenden Schleifenhierarchien, von denen gefordert wird, daß sie wechselseitig von Α und Β geglaubt werden, lassen sich im endlichen Fall interpretativ auf die bloße Tatsache zurückzuführen, daß die Handelnden die Disposition besitzen, solche dispositionellen Intentionen erwerben zu können. Diese erweiterten Schleifen können für die Rechtfertigung bzw. Rationalisierung der Schleifen niederer Ordnung verwendet werden; doch in typischen Kommunikationssituationen brauchen wir ihre Existenz nicht zu fordern. Eine schwächere Möglichkeit der Explikation von rationalisierender Reflexivität, die von Bennet (1976, S. 127) vorgeschlagen wurde, wäre, lediglich zu verlangen, daß Α nicht intendiert, daß Β nicht glaubt... - und zwar für jede Stufe. Wir hätten in diesem Fall IA 5 s -Schleifen bis zu gewissen Ebenen, und von da a n I A — \ S B -Schleifen, wodurch eine infinite Menge {IA(ßB(p)), ^ IA(N
ΒΒ(ΙΑΒΒ(Ρ)))),
- ι IA(ι
BB(1A(BB(IA(BB(p)))))),...}
entstehen
würde, von deren allen Elementen zu fordern ist, daß sie wahr sind. Doch diese Lösung, obwohl fast korrekt, erfordert immer noch weitere Modifikationen, um die Rationalisierungen richtig darzustellen (für diese vgl. Kemmerling 1980). Wie oben bereits erwähnt, müssen wir jedoch nicht die psychologische Existenz von IABB - oder — \ I a — \ B b - Schleifen verlangen, die über die Schleifen niederster Stufe hinausgehen (vgl. Kemmerling 1983).
132
Raimo Tuomela
haben diese gemeinsamen Glaubensinhalte nicht explizit in (1) angegeben - eben deshalb, weil sie jeder illokutiven Handlung zugrundeliegen. Bach/Harnish (1979, S. 5-12) folgend können wir vier verschiedene Annahmen über sie formulieren. Erstens die Annahme, daß Sprecher und Hörer gemeinsame Glaubensinhalte bezüglich der herausragenden Merkmale der Situation bzw. des Kontextes C teilen. Das hilft zum Beispiel dem Hörer B, Äußerungen von Α wie etwa „Ich ging zur Bank" zu desambiguieren, indem es ihn in die Lage versetzt, zu erkennen, was A zu sagen beabsichtigte. Zweitens haben wir den generellen gemeinsamen Glauben, daß die Mitglieder der Sprachgemeinschaft, zu der Α und Β gehören, eine Sprache L teilen, zu der unser obiges Zeichengebilde u gehört, und daß wannimmer irgendein Angehöriger dieser Sprachgemeinschaft ein Zeichengebilde ν gegenüber einem anderen Angehörigen äußert, letzterer identifizieren kann, was ersterer ausdrückt, sofern letzterer die Bedeutung von ν in L kennt und über die geeigneten Hintergrundinformationen verfügt. Wir nehmen drittens den weiteren gemeinsamen Glaubensinhalt dieser Sprachgemeinschaft an, daß wannimmer ein Mitglied in L etwas zu einem anderen sagt, dieses Mitglied das mit einer erkennbaren illokutiven Intention tut (vgl. Anm. 3). Im Kontext wörtlich gemeinter illokutiver Handlungen, zu welchen wir wissenschaftliche Erklärungen zählen müssen, benötigen wir noch eine vierte Annahme. Sie verlangt den gemeinsamen Glaubensinhalt der betreifenden Sprachgemeinschaft, daß wannimmer ein Mitglied ein Zeichengebilde ν gegenüber einem anderen äußert, der erstere ν wörtlich meint, sofern er unter diesen Umständen ν wörtlich meinen könnte. Wir werden diese vier gemeinsamen Glaubensinhalte hier nicht weiter diskutieren, weil unsere Behandlung der Erklärung nicht spezifisch von ihnen abhängt, und können daher unseren kurzen Exkurs in die Theorie der Sprechakte hier beenden. 3. Die logische Natur von Fragen und ihren Präsuppositionen Unser Definiens von (1) beinhaltet den Schlüsselbegriif der wissenschaftlichen Erklärungsantwort (kurz WE-Antwort), den wir in den folgenden Abschnitten klären wollen.
Eine pragmatisch-nomologische
Theorie
133
Wir beginnen unsere Untersuchung mit einer Charakterisierung des Begriffs der Präsupposition einer W-Frage (Warum-, Was-, Welche-, etc. Frage). Als erstes charakterisieren wir in Anlehnung an die Fragelogik (erotetische Logik) von Belnap/Steel (1976, S. 5) gewöhnliche sprachliche Präsuppositionen (etwa PräsuppositionenJ über ihre Wahrheitsbedingungen. (2) Definition: Ein Deklarativsatz s ist eine Präsupposition x eines Fragesatzes g.d.w. die Wahrheit von s eine logisch notwendige Bedingung dafür ist, daß es eine wahre Antwort auf den Fragesatz gibt. Diese Charakterisierung ist intuitiv klar, obwohl eine auf ihr aufbauende Definition von Antwort selbstverständlich zirkulär wäre. Wir werden später sehen (vgl. (8)), daß Definition (2) auf eine Weise approximiert werden kann, die nicht so eng mit dem (vorsystematischen) Begriff einer Antwort verknüpft ist. Das „logisch" in Definition 2 muß grob so verstanden werden, daß es sich über gewöhnliche logische Wahrheiten hinaus auch auf begriffliche Wahrheiten bezieht. Zur Illustration von Definition (2) führen wir einige Präsuppositionen1 von „Warum hat Tom aufgehört, seine Frau zu schlagen?" an: „Tom hat eine Frau", „Tom hat seine Frau geschlagen", „Tom hat seine Frau mehr als einmal geschlagen", „Tom hat aufgehört, seine Frau zu schlagen", etc. Als nächstes definieren wir: (3) Definition: Ein Deklarativ-Satz s ist eine vollständige Präsupposition1 eines Fragesatzes g.d.w. gilt: s ist mit der Gesamtheit aller Präsuppositionen x des Fragesatzes logisch äquivalent. Wie zuvor nehmen wir auch hier die Verfügbarkeit einer wohldefinierten formalen Sprache an, die um passende W-Frageoperatoren (wie auch um epistemische Operatoren) erweitert wurde. Andernfalls würde den vorangegangenen und den noch folgenden Definitionen eine klare Bedeutung fehlen. Ein Beispiel für Definition (3): Die vollständige Präsupposition! von „Warum hat Tom aufgehört, seine Frau zu schlagen?" ist fol-
134
Raimo Tuomela
gender Satz (bzw. eine damit äquivalente logische Form): „Tom hat aus irgendeinem Grund aufgehört, seine Frau zu schlagen." Unsere Theorie der wissenschaftlichen Erklärung benötigt einen noch stärkeren Begriff der Präsupposition - einen, der über den in Linguistik und erotetischer Logik (bis dato) verwendeten hinausgeht. Dieser Begriff ist auf die zugrundeliegenden Hintergrundüberzeugungen und Werte einer wissenschaftlichen Gemeinschaft bezogen und nicht leicht exakt charakterisierbar. Dennoch kann dieser pragmatische Begriff der Präsupposition kurz und bündig als ein solcher beschrieben werden, der all das abdeckt, was ein Kontext C und ein Paradigma Ρ erfordern, damit es eine wahre Antwort auf einen Fragesatz gibt. Unsere spätere Behandlung des Problems der Betonung bringt einige Beispiele dafür, wie ein Kontext C den Begriff der Antwort einschränkt, indem er zum Beispiel den sogenannten Klassen relevanter Alternativen Restriktionen auferlegt. Ein Paradigma Ρ kann ζ. B. die Arten von Gründen beschränken, welche als Antwort auf Warum-Fragen wie ζ. B. „Warum hat Tom aufgehört, seine Frau zu schlagen?" zugelassen sind. Zum Beispiel würde ein Neo-Wittgensteinianer nicht zulassen, daß mentale Ursachen als Handlungsgründe angeführt werden (vgl. Abschnitt 11). Für den Fall der Naturwissenschaften schließen instrumentalische Paradigmen beispielsweise den Gebrauch von Mikrostrukturen und atomistischen Entitäten in der Erklärung des beobachtbaren Verhaltens physikalischer Objekte und Systeme aus. Wir definieren daher: (4) Definition: Ein Deklarativsatz s ist relativ zu C und Ρ eine Präsupposition2 eines Fragesatzes g.d.w. gilt: (a) s ist eine Präsupposition! des Fragesatzes; und (b) die Wahrheit von s ist eine notwendige Bedingung dafür, daß es relativ zum Kontext C und den Sätzen, die aus dem Paradigma Ρ folgen (oder von ihm als wahr verlangt werden), eine wahre Antwort auf den Fragesatz gibt. Die Definition des Begriffs der vollständigen Präsupposition 2 erfolgt dann in strikter Analogie zu Definition (3).
Eine pragmatisch-nomologische
Theorie
135
4. Die logische und wissenschaftstheoretische Natur von Erklärungsantworten Wir schreiten nun zu einer Charakterisierung des Begriffs der Antwort fort. Wie wir aus Definition (2) ersehen, scheint vom semantischen Gesichtspunkt aus eine unüberwindliche begriffliche Abhängigkeit zwischen den Begriffen der Präsupposition und der Antwort zu bestehen. Trotzdem sind es vom logischen oder formalen Gesichtspunkt aus eindeutig verschiedene Begriffe. Betrachten wir eine W-Frage. Dabei nehmen wir normalerweise im folgenden an, daß es sich um eine W-Frage der standardisierten logischen Form ?p handelt, wobei ρ ein wohlgeformter Deklarativsatz ist. Generell kann gesagt werden, daß ein (single-example-)Frage-Operator eine Variable in die vollständige Präsupposition des Fragesatzes einführt. Wenn wir ζ. B. fragen „Wer ist diese Person?", dann führen wir eine Variable über dem Bereich der Personen ein. Wenn wir fragen (5) Warum hat Tom aufgehört, seine Frau zu schlagen? dann führen wir eine Variable über dem Bereich der Gründe ein (in einem weiten, nicht auf die Gründe des Handlungsträgers beschränkten Sinn).4 Wir können daher die vollständige Präsupposition der Frage in (5) in semiformaler Notation folgendermaßen anschreiben: (6) (3f) (Tom hat aus dem Grund/aufgehört, seine Frau zu schlagen) oder (7) (3ρ) (Tom hat wegen ρ aufgehört, seine Frau zu schlagen). In Satz (6) tritt die Variable / auf, die über den Bereich der Gründe im weiten Sinne läuft (bzw. solche variablen Gründe ausdrückt), also insbesondere auch Ursachen umfaßt. In Satz 4
In einer detaillierteren Studie müßten wir uns mit der Quantiiikation über so seltsame Entitäten wie Gründe (im erwähnten breiten Sinn des Wortes) näher beschäftigen. Unsere Analyse setzt jedoch Erklärungsgründe mit Prämissenkonjunktionen geeigneter (nomologischer) Argumente gleich, was in jedem Fall geeignet sein sollte, die Bedeutung und Identität dieser Entitäten klar zu machen (vgl. Tuomela 1973, Kap. VII, und 1976a).
136
Raimo Tuomela
(7) reicht die Variable ρ über Sätze (oder logische Aussageformen, würden wir einen vollständig formalisierten Diskurs verwenden). Wir werden die Sätze (6) und (7) vom Standpunkt des Fragens und Antwortens aus als äquivalent betrachten. Im folgenden werden wir uns hauptsächlich mit Warum-Fragen beschäftigen und da auch nur mit solchen, die Sätze wie (6) oder (7) als vollständige Präsuppositionen besitzen. Im allgemeinen hat eine Präsupposition,· (i = 1,2) folgende syntaktische Form: ( 3 / J . . . (3/„) (s(f u . . . ,fn)), wobei s eine Deklarativsatzform (eine Matrix) ist, welche die Variablen f j (J = 1,...,«) enthält, welche den Faktoren entsprechen, die die Frage für ihre Antwort erlaubt. Wie schon gesagt, werden wir uns auf Fragen konzentrieren, die nur einen Faktor / in ihre vollständige Präsupposition einführen, d. h. deren vollständige Präsupposition die Form ( 3 f ) ( s ( f ) ) besitzt. Es ist vorläufig nicht nötig, die Konstanten, welche / syntaktisch ersetzen, irgendwie zu beschränken. Es können Sätze, Individuenkonstanten, Prädikatkonstanten usw. sein. Es gibt noch einen umfassenderen Sachverhalt, der im Zusammenhang mit der logischen Form von Präsuppositionen erwähnt werden muß. Er besteht darin, daß die Hintergrundannahmen eines Paradigmas Ρ eine bestimmte Form von den ursprünglichen Fragen und insbesondere von ihren vollständigen Präsuppositionen 2 verlangen können. Eine Änderung des Paradigmas ändert daher nicht nur die Menge der Werte von / , sie kann sogar die gesamte Natur und Form der vollständigen Präsupposition ändern. Wir werden gegen Ende des Aufsatzes ein psychologisches Beispiel diskutieren, das für diesen Sachverhalt relevant ist; wir haben jedoch nichts anzubieten, was einer Theorie des ,paradigmatischen Paraphrasierens' von Fragen und Präsuppositionen nahekommt. Jedenfalls müssen wir im Gedächtnis behalten, daß solch eine Paraphrase zum Zweck der Anpassung an ein P-Muster (wie wir es nennen könnten) in wissenschaftlichen Kontexten im allgemeinen erforderlich ist. Betrachten wir nun die Antworten. Wir können Frage (5) beantworten, indem wir sagen: „Tom hat aus folgendem Grund aufgehört, seine Frau zu schlagen: ", wobei die Leerstelle durch Sätze wie „Es wurde ihm langweilig", „Er kam zu Verstand", usw. aufgefüllt wird. Das müssen natürlich keine
Eine pragmatisch-nomologische
Theorie
137
wissenschaftlichen Erklärungsantworten sein. Dafür ist mehr erforderlich. Wenn f0 ein Wert der Variablen / in (3/) (s(f)) ist, dann ist s(f0) nur dann eine WE-Antwort (wissenschaftliche Erklärungsantwort), wenn sie für den Explananden verständlich ist. Das Verstehen, von dem hier die Rede ist, ist (wissenschaftliches) Verstehen entsprechend dem Paradigma P. Tatsächlich könnte jedes Mitglied der wissenschaftlichen Gemeinschaft mit dem gemeinsamen Paradigma Ρ unser Explanand sein, und wir werden daher in unserer folgenden Charakterisierung lediglich abstrakt von P-Verständlichkeit sprechen. Man beachte, daß wir hierzu nicht verlangen müssen, daß eine WE-Antwort ein Verstehen des in der Frage q Erfragten bewirkt, obzwar dies von der Antwort intendiert ist (vgl. Definition (1)). Obwohl wir später mehr über Verstehen sagen werden, sind einige Bemerkungen schon hier angebracht. Betrachten wir das folgende einfache Beispiel eines Gegenstandes a, der sich plötzlich ausdehnt. Wir beantworten die Frage „Warum hat er sich ausgedehnt?", indem wir technisch die vollständige zugrundeliegende Frage ( ? f ) (α dehnte sich aus dem Grund/aus), also q, beantworten. Das tun wir, indem wir folgendes Argument konstruieren: (i) α ist ein Kupferstück, (ii) α ist erhitzt worden und (iii) alle Kupferstücke dehnen sich aus, wenn sie erhitzt werden (oder wenn man will: Kupfer dehnt sich aus, wenn es erhitzt wird); daher (iv) α hat sich ausgedehnt. Der Satz „(iv) aus dem Grund, daß (i) Λ (ii) Λ (iii)" (oder kürzer: „(iv) aus dem Grund /o") ist nun eine potentielle vollständige WE-Antwort ( - wobei von den in ihn involvierten Idealisierungen und Vereinfachungen abgesehen wird. Das „potentiell" bezieht sich wieder darauf, daß von (i)-(iv) hier nicht Wahrheit verlangt wird - s. Anm. 5). Daß diese Antwort vollständig ist, kann zum Teil so verstanden werden, daß sie der vollständigen Präsupposition 2 der Frage q entspricht, und zwar in dem starken Sinn, daß aus ihr alle Präsuppositionen von q folgen. Man beachte, daß wir die Frage auch beantworten können, indem wir nur sagen, α sei erhitzt worden, und die Prämissen (i) und (iii) lediglich implizit annehmen. Was bedeutet es nun, zu sagen, daß diese vollständige Ant-
138
Raimo Tuomela
wort verständlich ist? Es ist schwierig, eine vollständige Analyse dieses Problems zu geben. Doch wenn wir die in Abschnitt 2 erwähnten gemeinsamen sprachlichen Glaubensannahmen illustrieren, die eine illokutive Handlung involviert, können wir zumindest das folgende sagen: Die Mitglieder unserer P-Gemeinschaft müssen die Antwort zumindest bis zu einem gewissen Grad begrifflich beherrschen. Da diese Antwort ein sprachliches Zeichengebilde ist, müssen sie in der Lage sein, den zugrundeliegenden Sprechakttyp zu verstehen und die Antwort auf die richtige Art in Worte und Sätze zu kleiden. Sie müssen in irgendeiner Weise die logische Form des Arguments verstehen, und sie müssen ein hinreichend gutes begriffliches Verständnis der darin verwendeten deskriptiven Ausdrücke besitzen. So müssen sie wissen, was Kupfer ist, was erhitzen ist und was ausdehnen ist. Sie müssen natürlich auch wissen (oder verstehen), was das Objekt α ist und was es bedeutet, daß es die angeführten Eigenschaften hat. Schließlich müssen sie verstehen, daß der allgemeine Satz (iii) ein Kausalgesetz ausdrückt, das hier durch (i), (ii) und (iv) instanziiert wurde (zum Verstehen von Kausalzusammenhängen und Begründungszusammenhängen im allgemeinen s. Abschn. 9). Wenn wir behaupten, daß unsere Antwort eine (potentielle) WE-Antwort ist, dann meinen wir dabei mit „Erklärungsantwort", daß die Variable u in Definition (1) durch „(iv) aus dem Grund / 0 " ersetzt werden kann. Daß eine Antwort wissenschaftlich ist, bedeutet mehreres. Am wichtigsten hierfür ist ihr nomologischer Charakter. Das heißt: eine WE-Antwort muß explizit oder implizit Gesetze - irgendeiner Art von deskriptiven Gesetzen - beinhalten (und eine vollständige WE-Antwort muß sich explizit auf solche Gesetze beziehen). Es ist eine vieldiskutierte Frage, ob wissenschaftliche Erklärungen (sogar wenn sie wie in diesem Kapitel als epistemische Argumente betrachtet werden), unabdingbar Gesetze enthalten sollen (s. Hempel 1965, S. 354-364 für eine Diskussion dieser Frage). Ich möchte hier nur das folgende zur Unterstützung meiner epistemischnomologischen Auffassung von Erklärung sagen. Wissenschaft sucht nach allgemeinen Strukturen (Invarianzen oder andere Strukturen bzw. Mechanismen) in der Welt. Sie befaßt sich daher auch mit dem Auffinden stabiler Zusammen-
Eine pragmatisch-nomologische
Theorie
139
hänge zwischen Universalien (ζ. B. Eigenschaften) und insbesondere mit der Auffindung der nomologischen Tendenzen bzw. Propensitäten der untersuchten Systeme. ([Bern. d. Hrsg.:] Dabei ist „Propensität" im engeren Sinne eine - in jüngerer Zeit von Popper u. a. vorgeschlagene - objektive Interpretation des Wahrscheinlichkeitsbegriffs, derzufolge als Propensität die gesetzesartige Disposition eines Systems verstanden wird, Ereignisfolgen mit bestimmtem Häufigkeitsgrenzwert zu produzieren.) Solche nomologischen Zusammenhänge und Propensitäten können ζ. B. kausal oder entwicklungsbedingt (genetisch) sein. Diese Zusammenhänge können auch die nomische ( = gesetzesmäßige) Koexistenz bestimmter Eigenschaften betreffen. Einzeltatsachen und (einzelne) Ereignisse sind - zumindest für die reine Wissenschaft - per se nicht von Interesse. Alles Interesse an ihnen ist letztlich Interesse daran, daß sie Einsetzungsinstanzen einer bestimmten universellen Eigenschaft oder eines universellen Mechanismus sind, und nicht einer(s) anderen, oder daran, daß sie einen bestimmten Wert eines quantitativen Parameters anstatt einen anderen darstellen - denn in der Tat gibt es ja keine ,reinen' Einzeldinge. Dementsprechend müssen sich letztendlich auch singuläre Erklärungen (im Sinn von epistemischen Argumenten, die über die bloße Anführung der zu dem Ereignis führenden Umstände hinausgehen) - zumindest in ihrer Rechtfertigung - auf Gesetze oder gesetzesartige Tendenzen beziehen bzw. sie beinhalten. Ebenso sind in singulären Verursachungsbeziehungen - um einen besonders zentralen Fall zu erwähnen - nomische Prozesse involviert (s. hierzu die Diskussion in Tuomela 1976a). Dies kann auch aus der Tatsache ersehen werden, daß die Wahrheit singulärer Kausalaussagen nicht von sozusagen kleinen, aber den Ereignistyp bewahrenden Modifikationen von Ursache und Wirkung affiziert wird (ζ. B. könnte das Reiben dieses Zündholzes, welches das Feuer verursacht hat, ein wenig anders passiert sein, ohne damit die Kausalitätsbehauptung zu affizieren). Während ich somit von Erklärungen die Bezugnahme auf gesetzesmäßige Prozesse verlange, bin ich bereit zuzugeben, daß es ohne den Gebrauch idealisierender Annahmen - d. h. von Annahmen, von denen man weiß, daß sie für tatsächliche Systeme falsch sind - sogar im Prinzip unmöglich sein kann, die
140
Raimo Tuomela
Gesetzesaussagen zu formulieren, welche diese Prozesse repräsentieren. Dies ist verbunden mit der Auffassung, daß man für die Formulierung von Gesetzen, welche das Verhalten eines offenen Systems beschreiben, möglicherweise zu idealisierenden Annahmen Zuflucht nehmen muß, um das System abzuschließen'. Lassen sie mich dennoch betonen, daß nomologische Erklärungen Gründe-liefernde Argumente sind, und nicht etwa Beschreibungen. Etwas zu erklären heißt, epistemische Gründe (für den Glauben) zu geben, warum es vorkommt oder der Fall ist. Wie im vorigen Abschnitt argumentiert, können und müssen diese Gründe letztlich nomologische sein. Daß eine Erklärung ein Argument ist, hängt auch klar mit ihrer Fähigkeit zusammen, Verstehen hervorzurufen, denn dieses Verstehen ist ein Teil dessen, was das Liefern von nomologischen Gründen beinhaltet. 5. Die Definition von wissenschaftlichen Erklärungsantworten Angesichts der obigen Betrachtungen kann nun die folgende Analyse des Begriffs der vollständigen (potentiellen) WE-Antwort auf eine vollständige Frage q (siehe 16) vorgeschlagen werden (wenn die Frage nicht vollständig ist, kann sie immer durch eine vollständige ersetzt werden): (8) Definition: Ein sprachliches Satz-Zeichengebilde u ist, in Situation C und gegeben P, eine vollständige wissenschaftliche Erklärungsantwort auf (die Warum-Frage) q g.d.w. gilt: (a) Sei ( ? / > ( / ) die q entsprechende direkte Frageform, und (3 f ) s { f ) somit die vollständige Präsupposition 2 (relativ zu C und Ρ) von q. Dann entsteht u aus dieser vollständigen Präsupposition 2 dadurch, daß der Existenzquantor weggelassen und für/eine Konstante - etwa/ 0 substituiert wird; (b) u ist im Kontext C P-verständlich; und (c) u bildet im Kontext C ein Ε-Argument für q derart, daß / 0 die Konjunktion seiner Prämissen ist. (a) und (b) brauchen wir nicht mehr weiter zu erklären. Es soll
Eine pragmatisch-nomologische
Theorie
141
bemerkt werden, daß Bedingung (a) alleine, wenn in ihr „Presupposition^' statt „vollständige Präsupposition 2 " verwendet wird, als Explikat eines vorsystematischen Begriffs der Antwort betrachtet werden kann, wie er beispielsweise in (2), (4) und (24) vorkommt. Bedingung (c) verwendet den technischen Begriff des E-Arguments, i.e. des potentiellen Erklärungsarguments, für q.5 Wir werden in Abschnitt 7 eine Explikation des Begriffs des E-Arguments geben, welche sowohl deduktive wie induktive Erklärungsargumente umfaßt. Hier und in Abschnitt 6 wollen wir diese Explikation vorläufig voraussetzen. Ein E-Argument für q zu sein bedeutet dann folgendes. Sei (?/)(s(/)) die direkte Frageform der Warum-Frage q (vgl. Bedingung (a)). Sei se der Deklarativsatz, der aus der Matrix s { f ) entsteht, wenn in ihr die Phrase „aus dem Grund / " , oder eine stattdessen verwendete Paraphrase, weggelassen wird. Dann sagen wir, daß ein gegebenes Ε-Argument ein Ε-Argument für (?/) (s ( f ) ) oder für q ist g.d.w. dieses E-Argument den Satz se als Konklusion besitzt. In unserer semiformalen Notation nennen wir - am Beispiel unseres obigen E-Arguments - die vollständige Frage „(?/) (α dehnte sich aus dem Grund/aus)" das Explanandum und sagen, daß zu diesem Explanandum der Explanandumgehalt se gehört. (Deklarative Sätze, wie se, sind somit nur in diesem abgeleiteten Sinn Objekte der Erklärung). Für viele Zwecke, ζ. B. zur Charakterisierung von singulären Erklärungen ohne expliziten Bezug auf spezifische Gesetze, ist der folgende weitere Begriff der Antwort nützlich:
5
Wir nennen ein Erklärungsargument aktuell nur dann, wenn es ein potentielles ist und seine Prämissen und seine Konklusion wahr oder approximativ wahr sind. (Approximative Wahrheit könnte man ζ. B. benötigen, wenn ein offenes reales System aufgrund gewisser Idealisierungsannahmen hypothetisch geschlossen' wird.) Es gibt noch weitere Forderungen, die an aktuelle Erklärungen zu stellen sind. Eine davon ist, daß die als Prämissen verwendeten Gesetze praktisch funktionierende Gesetze' sein müssen, d. h. Gesetze, die sich auf die vorliegende Erklärungssituation wirklich anwenden lassen. Was Definition (1) betrifft, so müssen in einem aktuellen Erklärungsakt die Glaubensannahmen von Α und B, auf die sich das Definiens von (1) bezieht, korrekt sein.
142
Raimo Tuomela
(9) Definition: Ein sprachliches Satz-Zeichengebilde ν ist - in der Situation C und gegeben Ρ - eine wissenschaftliche Erklärungsantwort auf q g.d.w. es einen Satz u gibt derart, daß gilt: (a) u ist - in C und gegeben Ρ - eine vollständige wissenschaftliche Erklärungsantwort auf q; und (b) ν ist identisch mit einer (oder mehreren) Prämissen bzw. konjunktiven Prämissenkomponenten des E-Arguments, welches u konstituiert; oder ν ist ein Satz, der mit der Konklusion dieses Ε-Arguments beginnt und durch die Phrase „aus dem Grund, d a ß . . . " oder „weil..." oder einer Paraphrase davon fortgesetzt wird, wobei anstelle der Punkte ... eine oder mehrere Prämissen des E-Arguments (bzw. konjunktive Komponenten davon) stehen. Definition (9) umfaßt (neben einer variableren Formulierungsmöglichkeit der Antwort) auch partielle Erklärungen. Ihr zufolge ist es also möglich, Erklärungen ν zu geben, die explizit ζ. B. nur eine Prämisse enthalten, welche einen singulären Kausalfaktor erwähnen, obwohl die entsprechende vollständige WE-Antwort, von der nur postuliert wird, daß sie existiert, eine Gesetzesaussage enthält. Einen stärkeren Begriff von wissenschaftlicher Erklärungsantwort erhält man, wenn man zusätzlich verlangt: (c) Jeder beliebige Explanand (in P) kann (zumindest im Idealfall) auf der Basis von ν eine vollständige WE-Antwort (in C und gegeben P) konstruieren. Wir werden im folgenden die Bedingung (c) nicht verlangen, da sie zu restriktiv erscheint. Trotzdem kann sie als eine Art Desideratum betrachtet werden, denn die in (c) geforderte Fähigkeit ist sicher eng damit verknüpft, daß der Explanand q versteht. 6. Die Definition wissenschaftlichen Fragens und Erklärens Die Handlungen des Fragens und Antwortens sind illokutive Handlungen mit einem bestimmten propositionalem Gehalt
Eine pragmatisch-nomologische
Theorie
143
(Aussagegehalt). Beispielsweise repräsentiert das sprachliche Zeichengebilde u von Definition (1) einen Teil des propositionalen Gehalts der Erklärungshandlung. Wenn u eine vollständige WE-Antwort ist, dann folgen aus ihr alle Präsuppositionen 2 der Frage q. Man wird naheliegenderweise annehmen, daß ein solches u den vollständigen propositionalen Gehalt der in Frage stehenden Antworthandlung repräsentiert. Da wir im Endeffekt Erklärungshandlungen mit geeigneten Antworthandlungen identifiziert haben, ist die Konsequenz nahezu zwingend, daß eine vollständige WE-Antwort u (welche der Erklärungshandlung gemäß (1) korrespondiert) den vollständigen propositionalen Gehalt dieser wissenschaftlichen Erklärungshandlung darstellt. Entsprechend können wir sagen, daß eine WEAntwort v, welche zu solch einer vollständigen WE-Antwort u gemäß Definition (9) in Beziehung steht, ein mit dieser Erklärungshandlung assoziierter Antwortsatz ist. Fragehandlungen lassen sich ganz analog zu Erklärungshandlungen analysieren. Betrachten wir einen Fragesteller B, der zu einer wissenschaftlichen Gemeinschaft gehört, die das Paradigma Ρ internalisiert hat, d. h. einer /"-Gemeinschaft. Dann schlagen wir folgendes vor: (10) Definition: Β fragt wissenschaftlich q (oder führt einen Akt des wissenschaftlichen Fragens durch mit Gehalt q) durch Erzeugung eines sprachlichen Zeichengebildes r in der Situation C und gegeben Ρ g.d.w. gilt: (a) Β erzeugt r mit einer dahingehenden Intention (resp. Ziel), daß seine Erzeugung von r in der intendierten Weise das von Β gewünschte Resultat bewirkt, nämlich daß ein Mitglied Α der P-Gemeinschaft - in Situation C und gegeben Ρ - Β q wissenschaftlich erklärt (und zwar durch Erzeugung eines sprachlichen Zeichengebildes u); (b) q ist eine mit der gegebenen Fragehandlung assoziierte vollständige Frage; und (c) q impliziert logisch r. Die Bedingung (a) von Definition (10) sollte aufgrund unserer Diskussion von Definition (1) klar genug sein. In Bedingung
144
Raimo Tuomela
(b) fordern wir im Effekt, daß q den gesamten propositionalen Gehalt der Fragehandlung repräsentiert. Wir werden den Begriff der vollständigen Frage im folgenden noch detaillierter klären. Bedingung (c) setzt einen Begriff der logischen Implikation zwischen Fragen voraus. Wir müssen dabei zumindest annehmen, daß q und r den Fragemodus teilen, also ζ. B. beides Warum-Fragen sind. Betrachten wir die folgenden beiden Fragen: (11) Warum hat Tom das Fenster um Mitternacht geöffnet? (12) Warum hat Tom das Fenster geöffnet? Betrachten wir weiters die folgenden beiden Präsuppositionen von (11) und (12), respektive, - in unserer halbformalen Notation ausgedrückt: (13) (3/) (Tom hat aus dem Grund / um Mitternacht das Fenster geöffnet) (14) (3/) (Tom hat aus dem Grund / das Fenster geöffnet) In dieser Schreibweise wird aus den Fragen (11) und (12): (11') (?/)(Tom hat aus dem Grund / um Mitternacht das Fenster geöffnet) (12') (?/)(Tom hat aus dem Grund / das Fenster geöffnet) Wir nehmen an, daß (11') den vollständigen propositionalen Gehalt der Frage angibt. Nehmen wir darüberhinaus an, daß (12') (und nicht 11') die logische Form von r - den Fragesatz, den Β benutzt, um seine Frage vorzubringen - darstellt. Wenn wir Adverbien so wie Davidson mithilfe von Konjunktionen analysieren, können wir sagen, daß (11') (welches q entspricht) (12') logisch impliziert. Diese (etwas problematische) Explikation der logischen Implikation zwischen Fragen als Implikationsbeziehung zwischen den in den Fragen enthaltenen Matrizen muß für unseren gegenwärtigen Zweck genügen. (Falls das zur Frage gehörige Zeichengebilde nicht-verbal ist, ζ. B. das Zeigen mit dem Finger, so wollen wir ebenfalls annehmen, daß seine sprachliche logische Form durch r repräsentiert wird.) Was ist eine vollständige Frage? Im obigen Beispiel ist (11') die mit der Fragehandlung assoziierte vollständige Frage, und (11') haben wir im Effekt aus Satz (13) gewonnen, der als eine
Eine pragmatisch-nomologische
Theorie
145
vollständige Präsupposition 2 angenommen wurde. Wir wollen sagen, daß ein (Frage-)Satz r eine Frage stellt, in Gestalt einer Fragehandlung Q, g.d.w. r so ein Satz ist, wie ihn (10) charakterisiert. Dann können wir den Begriff der vollständigen Frage wie folgt explizieren: (15) Definition: q ist eine vollständige Frage (in direkter Frageform), die mit einer wissenschaftlichen Fragehandlung Q in C und gegeben Ρ assoziiert ist g.d.w. es ein sprachliches Zeichengebilde r gibt, sodaß gilt: (a) In der Fragehandlung Q wird mithilfe r eine Frage gestellt (in C und gegeben P); und (b) q hat die Form (?/) (s (/)), wobei (3/) (s (/)) eine vollständige Präsupposition 2 von r relativ zu C und Ρ ist. Wir sind nun in der Lage, exakt zu definieren, was eine wissenschaftliche Erklärung ist. Eine (aktual existierende) Erklärung ist einfach eine WE-Antwort auf eine Frage q, welche in einer geeigneten Erklärungshandlung (vgl. Definition (1)) als adäquate Erwiderung auf eine wissenschaftliche Fragehandlung Q - in C und gegeben Ρ - gegeben wird. Ausführlicher können wir das wie folgt ausdrücken: (16) Definition: u ist eine wissenschaftliche Erklärung g.d.w. ein Fragesatz q, Personen Α und B, ein singulärer Situationskontext C, ein Paradigma Ρ und Handlungen EH und Q existieren, für die gilt: (a) u ist ein sprachliches Zeichengebilde, das - in C und gegeben Ρ - eine wissenschaftliche Erklärungsantwort auf q ist (oder repräsentiert); (b) q ist eine mit Q assoziierte vollständige Frage - in C und gegeben P; (c) Q ist eine wissenschaftliche Fragehandlung, in welcher B, ein Mitglied der P-Gemeinschaft, durch Erzeugung eines geeigneten sprachlichen Zeichengebildes (wie r in Def. (10)) q wissenschaftlich fragt - in C und gegeben P; und
146
Raimo Tuomela (d) E H ist eine Erklärungshandlung, in welcher Α, ein Mitglied der P-Gemeinschaft, (als Reaktion auf die Frage-Handlung Q) Β wissenschaftlich q erklärt - in Situation C und gegeben P.6
Die obigen Bedingungen benützen nur schon früher definierte Begriffe, außer daß (d) verlangt, daß E H eine,Reaktion' auf Q ist. Daraus folgt natürlich, daß EH Bedingung (a) aus Definition (10) erfüllen muß. Erinnern wir uns hier, daß sich unsere Analyse von Erklärung auf der Grundlage von Fragen und Antworten vollzieht, wir jedoch nicht diese letzteren Begriffe wegreduzieren wollen. In gewissem Sinn sind Fragen und Antworten zwar interdefinierbar, zumindest aber können sie sicher nicht beide weganalysiert werden. - Aus Definition (16) erhalten wir einen Begriff der potentiell existierenden wissenschaftlichen Erklärung, wenn wir in der einleitenden Phrase des Definiens potentielle statt aktuelle Existenz fordern - ζ. B. darin „existieren könnte" statt „existiert" verwenden. ([Bern. d. Hrsg.:] Man verwechsle diese Unterscheidung von „aktual existierend" und „potentiell existierend" nicht mit der von „aktueller" und „potentieller" Erklärung im Sinn von Anm. 5.) Schließlich sei noch bemerkt, daß - insofern u ein E-Argument konstituiert - Definition (16) indirekt auch definiert, was es bedeutet, wenn man sagt, ein E-Argument sei eine wissenschaftliche Erklärung. 7. Deduktive und induktive Erklärungsargumente Wir haben in den beiden vorigen Abschnitten des öfteren über Ε-Argumente gesprochen. Das Ziel dieses Kapitels ist es, sie kurz zu charakterisieren. Wir werden uns dabei hauptsächlich auf Tuomela (1977) stützen. In dieser Arbeit werden E-Argumente in ε-Argumente und ρ-Argumente eingeteilt. ε-Argumen6
Man beachte, daß es Definition (16) zufolge möglich ist, daß zwei logisch unverträgliche wissenschaftliche Erklärungen u und u' existieren. Falls das zurückgewiesen wird, kann dieser Mangel durch die Relativierung einer wissenschaftlichen Erklärung (d. h. des Definiendums von (16)) auf q, A,B,C, P, EH und Q beseitigt werden (anstatt daß über diese Entitäten im Definiens existentiell quantifiziert wird).
Eine pragmatisch-nomologische
Theorie
147
te repräsentieren deduktiv-nomologische Erklärungsargumente und /?-Argumente induktive oder nicht-deduktive. Die Eigenschaften eines ε-Arguments werden durch das sogenannte DEModell formuliert, die des /»-Arguments durch das sogenannte IE-Modell. ε-Argumente können - aus offensichtlichen Gründen - beweisend genannt werden und p- Argumente nichtbeweisend (siehe Tuomela 1977, Kapitel 9 und 11). Bevor wir uns diesen Modellen zuwenden, möchte ich hervorheben, daß die Ausführungen in diesem Aufsatz lediglich irgendeine geeignete Theorie der deduktiven und induktiven Erklärungsargumente voraussetzen. Was nun folgt, ist mein spezifischer Vorschlag für eine solche Theorie. 7.1. Deduktiv-nomologische Erklärungsargumente Wir beginnen mit einer kurze Zusammenfassung des DE-Modells für (potentielle) wissenschaftliche Erklärung (dieses Modell wurde erstmals in Tuomela 1972 veröffentlicht, in Tuomela 1973 erweitert und in Tuomela 1976b revidiert; siehe ferner Tuomela 1977). Hier werden nur die logischen Aspekte der Theorie zusammengefaßt (für andere Aspekte siehe die oben genannten Arbeiten). Zu Beginn benötigen wir einige technische Begriffe. Wir sagen, daß zwei Komponenten oder Sätze Ρ und Q unvergleichbar sind g.d.w. weder \- Ρ Q noch I-Q -*• P. Um den Begriff der Komponente zu klären, definieren wir zwei weitere Begriffe. Eine Folge von wohlgeformten Satzformeln < , . . . , Wn) einer wissenschaftlichen Sprache L ist eine Folge von wahrheitsfunktionalen (aussagenlogischen) Komponenten eines Explanans T(rist hier eine Theorie zusammen mit Anfangsbedingungen, aufgefaßt als Menge oder Konjunktion) g.d.w. Τ derart aus dieser Folge durch Formregeln von L aufgebaut werden kann, daß dabei aufjedes Glied der Folge genau einmal eine der Formregeln angewandt wird. Die Wt müssen somit als Zeichengebilde (tokens) konstruiert werden. Die jeweiligen Formregeln von L müssen natürlich spezifiziert sein, um die genaue Bedeutung des Begriffs einer Folge von wahrheitsfunktionalen Komponenten einer durch den Satz Γ endlich axiomatisierten Theorie angeben zu können. Eine Menge von kleinsten Konjunkten
148
Raimo Tuomela
Tc eines Satzes Τ ist eine Menge, deren Elemente die wohlgeformten Formeln einer maximal langen Folge < W^,..., Wn} von wahrheitsfunktionalen Komponenten von Τ sind, für die I- Γ IV1 λ ... λ Wn gilt. Ist Teine Menge von Sätzen, so ist die Menge Tc der kleinsten Konjunkte von Τ die Vereinigung der Mengen der kleinsten Konjunkte jedes einzelnen Elements von T. Wir werden im folgenden mit Τ immer eine Menge Tc assoziieren. Wir definieren eine Erklärungs-Relation s{E,Tc) (bzw. korrespondierend ε(Ε, Τ)), welche die (minimale) Gründe-liefernde deduktive Erklärung eines singulären oder generellen Explanandum-Deklarativsatzes (oder Explanandum-Inhaltes) Ε durch das Explanans Τ repräsentiert. Τ wird in einer Sprache L(ji υ λ) formuliert sein, wobei λ die Menge der Beobachtungsprädikate und μ die der theoretischen (deskriptiven) Prädikate repräsentiert. Γ kann somit ,neue', erklärende, eben μ-Prädikate enthalten. Von Ε nehmen wir an, daß es nur λPrädikate enthält, d. h. ,alte' oder Beobachtungs-Prädikate. (17) Definition der deduktiven Erklärung - DE-Modell: Die Relation e(E,Tc) erfüllt die logisch-deduktiven Adäquatheitsbedingungen für eine (potentielle) deduktive Gründe-liefernde Erklärung g.d.w. gilt: (i) {E, Tc} ist konsistent. (ii) TchE (iii) Tc enthält mindestens eine universelle gesetzesartige Aussage (und keine nicht gesetzesartige generelle Aussage). (iv) Für jedes beliebige Element Tct aus der größten Menge von wahrheitsfunktionalen Komponenten von Τ gilt: Tct und Ε sind unvergleichbar. (v) Es ist ohne Widerspruch zu den Bedingungen (i)-(iv) nicht möglich, Sätze SI,...,SF(R> 0) anzugeben, von denen zumindest einige wesentlich universell sind, sodaß für einige Tcs,..., Tc„ (n > 0) gilt: (a) TcjA...ATc„^,SiA...ASr (b) nicht ST A ... Λ SRh Tc} A ... Λ TC„ (c) Tcs\-E wobei Tcs das Resultat der Ersetzung von
Eine pragmatisch-nomologische Theorie
149
Tcj,..., Tc„ durch Sh... ,Sr in Tc ist und „f^" gleichbedeutend ist mit „prädikatenlogisch herleitbar ohne Zunahme der Quantifikationstiefe und nicht ausschließlich durch universelle oder existentielle Einsetzung". Die Bedingung (v) ist so, wie sie steht, nicht ganz unzweideutig. Der Leser sei für eine Klärung dieses Punktes sowie eine alternative Interpretation von h auf Tuomela (1976b) verwiesen (er beachte insbesondere die Bedingungen (V) und (Q) in diesem Aufsatz). Für eine detaillierte Diskussion der formalen Eigenschaften dieses Modells siehe Tuomela (1972) (insbesondere der Struktur der Erklärungshierarchien, die es erzeugt). [.Ergänzung des Hrsg., bis Absatzende:] Zur näheren Charakterisierung von (i)-(v): (i)-(iii) sind klar. Bedingungen (iv) und (v) dienen zur Eliminierung der aus der D-N-Debatte her bekannten unerwünschten bzw.,paradoxen' deduktiv-nomologischen Argumente, (iv) eliminiert ζ. B. die bereits in Hempel (1965, S.275) erwähnten partiellen Selbsterklärungen, z.B. „ix (Fx -> Gx), Fa Λ Ha/Ga Λ Ha" (s. auch Tuomela 1972, S. 376). Das Explanandum £ist hier Ga Λ Ha, das Explanans Τ ist hier die Menge { V x ( F X -> Gx), Fa Λ Ha}, bestehend aus Gesetz 'ix (Fx Gx) und Antecedens Fa Λ Ha. Die größte Menge wahrheitsfunktionaler Komponenten von Γ ist {Vx(/lx -> Gx), Fa, Ha) und enthält das Element Tci = Ha, welches nicht mit Ε unvergleichbar ist und somit (iv) verletzt. Voralledem schließt (iv) auch triviale Gesetzeserklärungen der Form „G1 Λ G1/Glii aus (G 1 ,G 2 Gesetze), wo 2s als Konjunktionsglied im Explanans enthalten ist (vgl. hierzu schon Hempel 1965, S. 273, Anm. 33 sowie Tuomela 1972, S. 374). - Die Klausel „ohne Widerspruch zu den Bedingungen (i)-(iv)" in Bedingung (v) ist auf die Relation ε(Ε, Tcs) zu beziehen, (v) bewirkt damit, daß das Explanans Τ nur die minimale gerade noch erklärende Information für Ε enthält (s. auch unten). Das ist ζ. B. wichtig, um überflüssige bzw. redundante Komponenten im Explanans zu eliminieren. Dadurch werden aber auch Erklärungen mit irrelevanten Disjunktionsgliedern in Ε der Form „Vx (Fx -> Gx), Fa/ Ga ν Ha" eliminiert (s. Tuomela 1972, S.379). Tc lautet hier nämlich {Vx(Fx ->• Gx), Fa}. Man setze nun Tct =
150
Raimo Tuomela
und Si = Vx(Fx (Gx ν Hx)), und bilde gemäß Klausel in (ν) die ersetzte Menge Tcs = {Vx(Fx -»· (Gx ν Hx)), Fa}. Dann erfüllt auch die Relation ε(Ε, Tcs) die Bedingungen (i)-(iv), ferner gilt (a) Tc1 l·- S1 (diese Deduktion erfüllt die Klausel für h am Ende von (v)), (b) 'ix (Fx
Gx)
nicht S j h Tc1 und (c) Tcs E. Bedingung (v) (welche ein solches Tcs ausschließt) ist somit verletzt. - Das Modell (DE) entspricht Tuomela (1976b), welches eine entscheidende Verbesserung von Tuomela (1972) darstellt: Letzteres war nämlich zu stark und eliminierte auch unerwünschte Fälle, sogar den Standardfall, während in (1976b) diese Nachteile behoben sind. (Der Stegmüller-Leser beachte, daß sich die Kritik von Stegmüller (1983, S. 943 ff) an Tuomela auf die alte Version 1972 bezieht, statt auf die neue in 1976b.) Die Verbesserungen in (1976b) (sowie auch 1977) betreffen Bedingungen (iv) und (v). Beispielsweise schließt (iv) auch die Abschwächung von „Vx(Fx
-> Gx), Fa/Ga"
z u „Vx(Fx
-> Gx), Fa ν VxGx/Ga"
als
erklärend aus, was ansonsten den Standardfall aufgrund (v) unterlaufen würde (darauf beruhte der Einwand gegen 1972; s. 1976, S. 532). Für weitere Motivierung der Klausel für I- s. P 1976b). Im Fall der Erklärung von Gesetzen (generellen Sätzen) können die folgenden weiteren Bedingungen an ε(Ε,Τό) gestellt werden: (vi) wenn E'*E \-E
= Η (μ) υ Ο ( / 1 ) υ ί ( μ υ λ), so gibt es ein (wobei EeO(sl), E'eO'(X)), sodaß nicht -> E' gilt und ε (ΕTc') für ein Tc' (eines T') gilt, mit
Cn(Tc')
Cn(Tc)
= Η'{μ)νΟ'(λ)νσ(μνλ)
und
Η cz Η'\
außerdem gelte nicht { £ } u ( H ' - H ) k j ( 0 ' - 0 ) u ( C ' -
C)\~
H;
(vii) wenn Η(μ) eine bewährte Kerntheorie ist und es ein Ε gibt mit ε(Ε, Tc) und Cn{Tc) = Ητ{μ)νΟ(λ)νΟμνλ), dann ist Η - Hr = 0 (wobei Hr das Craigsche Redukt von Cn(Tc), i.e. der allein in μ formulierbare rekursiv axiomatisierbare Teil von Cn(Tc), ist). Diese Bedingungen, welche (7.6) und (7.7) aus Tuomela
Eine pragmatisch-nomologische
Theorie
151
(1973) entsprechen, bedürfen einer Erläuterung. ,Cn' steht für die Konsequenz-Operation. Die Mengen Η (μ), 0(λ), C(ß * löst sich in Wasser auf)" oder ,yx((x ist eine Salzprobe und χ = χ) -> χ löst sich in Wasser auf)"· Ich würde diese Fälle etwas anders behandeln. Würde man den Erklärungsvorrat dieses Abweichlers so wie unseren vereinheitlichen, dann würde er unseren Argumenten korrespondierende Argumente enthalten, in denen systematisch ein redundantes Konjunktionsglied auftritt, und ich denke, es wäre plausibel, hier ein Einfachheitskriterium heranzuziehen, um den Verzicht auf dieses Konjunktionsglied zu begründen.
Erklärung durch Vereinheitlichung
221
könnte nun annehmen, es ließen sich Herleitungen der Größendimensionen von Körpern aus ihren dispositionellen Perioden konstruieren, die ebenso allgemein anwendbar wären wie jene, die in Ursprungs- und Entwicklungserklärungen instanziiert sind. Doch diese Annahme geht fehl. Es gibt einige Objekte wie die Erde oder der Krebsnebel - die kein Pendel sein könnten, und für die der Begriff der dispositionellen Periode keinen Sinn macht. Daher kann das vorgeschlagene Argumentmuster nicht völlig unsere Ursprungs- und Entwicklungsherleitungen ersetzen, und seine Akzeptierung würde folglich nicht die beste Vereinheitlichung unseres akzeptierten Wissens ergeben. Das durch akzidentelle Generalisierungen aufgeworfene Problem kann in paralleler Weise behandelt werden. Wir verfügen über ein allgemeines, auf physiologischen Prinzipien basierendes Argumentmuster, welches wir anwenden, um Fälle von Glatzköpfigkeit zu erklären. Dieses Muster ist allgemein anwendbar, während jenes Muster, das die Zuschreibung von Glatzköpfigkeit mithilfe des Prinzips herleitet, daß alle Mitglieder der Schulbehörde von Greenbury glatzköpfig sind, nicht allgemein anwendbar ist. Wie in den anderen Beispielen werden daher Argumentmengen, die diese unerwünschte Herleitung enthalten, durch eine der beiden Bedingungen (A) oder (B) ausgeschlossen. Dies zeigt natürlich nicht, daß ein nach meinen Vorschlägen ausgerichteter Erklärungsansatz nur solche Herleitungen billigen würde, die die vom covering law Modell aufgestellten Bedingungen erfüllen. Denn ich habe nicht behauptet, daß eine erklärende Herleitung irgendeinen Satz universeller Form enthalten muß. Was tatsächlich aus dem Ansatz von Erklärung als Vereinheitlichung zu folgen scheint, ist, daß erklärende Argumente keine akzidentellen Generalisierungen enthalten dürfen, und in dieser Hinsicht scheint der neue Ansatz eine wichtige Einsicht des covering law Modells zu unterstreichen und zu verallgemeinern. Darüberhinaus deutet unser Erfolg bei den Problemen der Asymmetrie und Irrelevanz darauf hin, daß sogar ohne eine detaillierte Darstellung des Begriffs der Stringenz und der Methode, wie die Allgemeinheit der Konsequenzenmenge gegenüber der möglichst geringen Anzahl und der Stringenz der Muster in der Basis abzuwägen ist - die Auflas-
222
Philip
Kitcher
sung von Erklärung als Vereinheitlichung die Fähigkeit besitzt, einige traditionelle Probleme von Erklärungstheorien zu lösen. 8. Unechte Vereinheitlichung Unglücklicherweise schwimmt da ein Haar in der Suppe. Eines der gravierendsten Probleme für das covering law Modell war seine Unfähigkeit, gewisse Typen der Selbsterklärung auszuschließen. (Eine klassische Quelle für diese Schwierigkeiten findet sich in Eberle/Kaplan/Montague 1961.) So wie die Dinge liegen, scheint der Ansatz der Erklärung als Vereinheitlichung an diesem Punkt sogar noch verwundbarer zu sein. Das Problem leitet sich von einem Phänomen ab, das ich unechte Vereinheitlichung nennen möchte. Betrachten wir zunächst eine Schwierigkeit, die Hempel und Oppenheim in ihrem grundlegenden Aufsatz von 1948 (wiederabgedruckt in Hempel 1965, Kap. 10) bemerkten. Angenommen, wir fügen zwei Gesetze zu einer Konjunktion zusammen. Dann können wir je eines der beiden Gesetze aus dieser Konjunktion herleiten, und die Herleitung erfüllt die Bedingungen des covering law Modells (natürlich sofern nicht das Modell auf die Erklärung singulärer Sätze eingeschränkt wird; in der Tat haben Hempel und Oppenheim diese Einschränkung gemacht). Um Hempel und Oppenheim zu zitieren: Der Kern der Schwierigkeit kann durch ein Beispiel kurz angedeutet werden: Keplers Gesetze, K, können mit Boyles Gesetz, B, zu dem stärkeren Gesetz Κ Α Β konjungiert werden; doch die Herleitung von Κ aus dem letzteren würde man nicht als Erklärung der in Κ behaupteten Regelmäßigkeiten betrachten; man würde sie vielmehr als eine im Effekt witzlose ,Erklärung' der Keplerschen Gesetze durch sich selbst ansehen. (Hempel 1965, S. 273, Anm. 33). Das Problem verstärkt sich für unseren Ansatz. Denn warum können wir nicht einfach die Menge der von uns akzeptierten Sätze vollständig vereinheitlichen, indem wir sie mithilfe von Argumenten ableiten, die das folgende einzige Muster instanziieren?
Erklärung durch Vereinheitlichung
223
[„α" ist durch jeden beliebigen, von uns akzeptierten Satz zu ersetzen] Oder, um die Dinge sogar noch einfacher zu machen, warum sollten wir die Menge der von uns akzeptierten Sätze nicht durch das trivialste Muster der Selbstherleitung vereinheitlichen: α [„α" ist durch jeden beliebigen, von uns akzeptierten Satz zu ersetzen] α
Es gibt eine offensichtliche Erwiderung. Die gerade erwähnten Muster mögen zwar unsere Kriterien der Verwendung möglichst weniger Argumentmuster zur Gewinnung möglichst vieler akzeptierter Sätze in bewundernswerter Weise erfüllen, doch hinsichtlich des Kriteriums der Stringenz scheitern sie schmählich. Erinnern wir uns, daß die Stringenz eines Musters über einen Kompromiß von zwei Bedingungen beurteilt wird: stringente Muster müssen nicht nur Instanziierungen mit ähnlicher logischer Struktur besitzen; ihre Instanziierungen müssen auch ähnliches nichtlogisches Vokabular an ähnlichen Stellen besitzen. Nun sind die beiden obigen Argumente darin sehr lax, weil sie jedem beliebigen Vokabular gestatten, an die Stelle von „a" zu treten. Wir können daher argumentieren, daß sie aufgrund unseres intuitiven Konzepts der Stringenz als nichtstringent ausgeschlossen werden sollten. Obwohl diese Erwiderung erfolgversprechend ist, bezwingt sie den Einwand nicht völlig. Ein Verteidiger dieser unerwünschten Argumente könnte künstlich Bedingungen einführen, um das Muster stringenter zu machen. Wenn angenommen eines unserer favorisierten Muster (wie ζ. B. das weiter oben entwickelte Newtonische Muster) zu Herleitungen von Konklusionen verwendet wird, die alle eine gewisse Bedingung C erfüllen, so könnte der Verteidiger der eben erwähnten Muster vorschlagen, daß „a" nicht durch jeden beliebigen Satz, sondern nur durch einen die Bedingung C erfüllenden Satz ersetzt werden soll. Dann kann er berechtigterweise argumentieren, sein neu erfundenes Muster sei nun ebenso stringent wie unser favorisiertes Muster. Inspiriert durch diesen Teilerfolg könnte er nun eine generelle Strategie entwickeln. Wo immer wir ein Argumentmuster zur Gewinnung eines bestimmten Konklu-
224
Philip
Kitcher
sionstyps verwenden, könnte er ein Argumentmuster verwenden, das Selbsterklärung involviert, bei dem jedoch den Sätzen, die für die Schemabuchstaben zu substituieren sind, geeignete Restriktionen auferlegt werden. Auf diese Weise kann er jede von uns erreichte Vereinheitlichung imitieren. Seine »Vereinheitlichung' ist offensichtlich unecht. Wie können wir sie verhindern? Zu einer Antwort darauf gelangen wir, wenn wir den Weg betrachten, auf dem die Stringenz des unerwünschten Musters erzeugt wurde. Jede einschränkende Bedingung an die Substitution von Sätzen für Schemabuchstaben hätte hier denselben Erfolg, wenn sie nur Restriktionen auferlegt, die vergleichbar stark sind wie die Restriktionen, die durch unsere akzeptierten Muster auferlegt werden. Die Stringenz des restringierten Musters scheint also für das Muster zufalliger Natur zu sein. Diese zufallige Natur wird aufgedeckt, wenn wir bedenken, daß wir hier die Ausfüllungsinstruktionen bei gleichzeitiger Beibehaltung der logischen Struktur variieren können, und dadurch eine Unzahl anderer Argumentmuster mit gleich vielen Instanziierungen erhalten. Im Gegensatz dazu können die Restriktionen an die Substitution des nonlogischen Vokabulars, die (beispielsweise) dem Newtonischen Muster auferlegt sind, nicht abgeändert werden, ohne dadurch die Stringenz des Musters zu zerstören oder es seiner Fähigkeit zu berauben, uns viele Instanziierungen zu liefern. Die dem Newtonischen Muster auferlegten Restriktionen sind daher essentiell für sein Funktionieren; jene dem unerwünschten Argument auferlegten sind es nicht. Formulieren wir diese Idee als eine explizite Forderung. Wenn die mit Muster Ρ assoziierten Ausfüllungsinstruktionen durch andere Ausfüllungsinstruktionen, welche die Substitution einer Klasse von Ausdrücken derselben syntaktischen Kategorie zulassen, derart ersetzt werden könnten, daß dies zu einem Muster P' führen würde, welches die Herleitung jedes Satzes erlaubt, dann ist die durch Ρ bewirkte Vereinheitlichung unecht. Betrachten wir irgendeines der Muster, die wir auszuschließen suchten, in dieser Perspektive. In jedem Beispiel können wir die Ausfüllungsinstruktionen in der genannten Weise variieren, um damit ein sogar noch erfolgreicheres' Muster zu erhalten. Für das Muster:
Erklärung durch Vereinheitlichung
α
225
[„α" ist durch jeden Bedingung C erfüllenden Satz zu ersetzen]
können wir die Ausfüllungsinstruktionen so verallgemeinern, daß wir α
[„α" ist durch jeden Satz zu ersetzen]
erhalten. Die durch das erstere Argument bewirkte Vereinheitlichung ist aufgrund unserer neuen Forderung somit unecht. Ich werde gleich zu zeigen versuchen, wie diese Forderung motiviert werden kann, wobei ich sowohl an die Intuitionen appellieren, die der Auffassung von Erklärung als Vereinheitlichung zugrundeliegen, wie die Rolle betrachten werde, die ein Analogon zu meiner Forderung in der Wissenschaftsgeschichte gespielt hat. Zuvor möchte ich eine etwas andere Beispielsart betrachten, die meinen Ansatz auf den ersten Blick zu bedrohen scheint. Stellen wir uns vor, eine Gruppe religiöser Fanatiker möchte die Erklärungskraft einiger religiöser Doktrinen durch die Behauptung begründen, daß diese Doktrinen ihr Wissen über die Welt vereinheitlichen. Sie argumentieren, daß ihr Wissen durch Verwendung folgenden Argumentmusters systematisiert werden kann: Gott will, daß α der Fall ist. Alles, von dem Gott will, daß es der Fall ist, ist der Fall.
[„α" ist durch jeden beliebigen akzeptierten Satz zu ersetzen, der die physikalische Welt beschreibt]
α Die neue Forderung identifiziert auch dieses Muster als unecht, und schließt dadurch die Behauptung aus, daß die theologischen Doktrinen, denen zufolge Gott existiert und die Fähigkeit besitzt, alle seine Wünsche zu realisieren, Erklärungskraft besitzen. Denn, wie leicht zu erkennen ist, können wir die Ausfüllungsinstruktionen so modifizieren, daß wir daraus ein Muster erhalten, das jeden beliebigen Satz herleitet. Warum sollten Argumentmuster, deren Ausfüllungsinstruktionen so modifizierbar sind, daß damit jeder Satz gewonnen werden kann, suspekt sein? Die Antwort darauf lautet, daß in solchen Mustern das verbleibende nonlogische Vokabular
226
Philip
Kitcher
überflüssig ist. Die Anwesenheit dieses nonlogischen Vokabulars legt den Ausdrücken, die für die Schemabuchstaben substituiert werden können, keinerlei einschränkende Bedingungen auf, sodaß die mithilfe der Ausfüllungsinstruktionen von uns auferlegte Struktur - über die Forderung, eine bestimmte Stelle mit einer bestimmten syntaktischen Kategorie auszufüllen, hinausgehend - ganz nebensächlich ist. Das fragliche Muster spiegelt also nicht wirklich den Gehalt unserer akzeptierten Wissensannahmen wider. Der Erklärungsvorrat sollte die Ordnung der natürlichen Phänomene repräsentieren, so wie sie durch jene Sätze, die wir zu wissen glauben, dargestellt wird. Um dies zu leisten, muß er Verbindungen zwischen unseren Überzeugungen aufzeigen, die über jene hinausgehen, welche zwischen beliebigen Sätzen gefunden werden können. Die Selbstherleitungsmuster und das im Beispiel der theologischen Sekte exemplifizierte Muster liefern lediglich triviale und überall anzutreffende Verbindungen; daher ist die von ihnen bewirkte Vereinheitlichung unecht. Meine Forderung hat offenbar eine gewisse Verwandtschaft mit der Forderung, die in Erklärungen angeführten Prinzipien (Prämissen) sollten überprüfbar sein. So wie frühere Autoren betont haben, genuin erklärende Theorien sollten nicht jeder möglichen Evidenz (bzw. empirischen Datenbasis) entsprechen können, so verlange ich, genuin vereinheitlichende Muster sollten nicht jede Konklusion erfassen können. Die von mir vorgeschlagene Forderung stimmt gut mit einigen Sachverhalten überein, die Wissenschaftler in ihrer Diskussion der Erklärungsvorzüge gewisser Theorien angesprochen haben. So haben etliche Gegner Darwins reklamiert, daß die für die Evolutionstheorie im Frühstadium behaupteten Erklärungsvorzüge illusorisch seien, weil der hier vorgeschlagene Argumentationstyp für jede Konklusion verwendet werden könnte. (Für eine besonders scharfe Version dieser Beschuldigung vgl. den Review von Fleeming Jenkin, abgedruckt in Hull 1974, insbesondere S. 342.) In ähnlicher Weise bestritt Lavoisier, daß die Erklärungskraft der Phlogistontheorie genuin sei, indem er der Theorie die Verwendung eines Argumenttyps vorwarf, mit der sie an jede Konklusion angepaßt werden könnte (Lavoisier 1862, Band II, S. 233). Ich meine also, daß einige Probleme der
Erklärung durch Vereinheitlichung
III
unechten Vereinheitlichung in der von mir angezeigten Weise gelöst werden können, und daß diese Lösung sowohl mit unseren Intuitionen über erklärende Vereinheitlichung wie mit den in wissenschaftlichen Debatten verwendeten Überlegungen in Einklang steht. Ich möchte allerdings nicht behaupten, daß meine Forderung alle Typen der unechten Vereinheitlichung zu eliminieren imstande ist. Möglicherweise lassen sich andere unerwünschte Muster finden, die meine Forderung umgehen. Eine vollständige Charakterisierung des Begriffs des stringenten Argumentmusters sollte ein Kriterium für die Ausschließung unerwünschter Muster abgeben. Und zwar dadurch - das ist die Behauptung dieses Abschnitts - , daß eine Vereinheitlichung dann als unecht bezeichnet wird, wenn sie durch Argumentmuster bewirkt wurde, welche auf jede Konklusion passen oder welche zufallige Restriktionen solcher universell anpaßbarer Argumentmuster darstellen. Und ich habe auch zu zeigen versucht, wie diese Behauptung so weiterentwickelt werden kann, daß damit die offensichtlichsten Fälle unechter Vereinheitlichung ausgeschlossen werden können.
9.
Schlußbemerkung
Ich habe eine Theorie von Erklärung als Vereinheitlichung skizziert und dabei zu zeigen versucht, daß eine solche Theorie die Fähigkeit besitzt, Einsichten in Episoden der Wissenschaftsgeschichte zu liefern und einige traditionelle Probleme des covering law Modells zu überwinden. Lassen Sie mich abschließend kurz andeuten, was aus meiner Auffassung von Erklärung als Vereinheitlichung für die Frage zu schließen ist, auf welche Weise eine wissenschaftliche Erklärung Verstehen bewirkt. Indem wir einige wenige Argumentmuster für die Herleitung vieler von uns akzeptierter Sätze verwenden, minimieren wir die Anzahl der Typen von Prämissen, die wir als nicht abgeleitet akzeptieren müssen. D. h., wir reduzieren soweit als möglich die Anzahl der Typen von Tatsachen, die wir als unerklärt bzw. ,unhintergehbar' akzeptieren müssen. Damit können wir eine Auffassung bestätigen, die Friedmans Auffassung über die Leistungen
228
Philip Kitcher
von erklärender Vereinheitlichung nahe steht (s. Friedman 1974, S. 180· Evidentermaßen habe ich nur eine Erklärungstheorie skizziert. Für präzisere Analysen der von mir eingeführten Begriffe muß der hier dargestellte Basisansatz von Erklärung anhand konkreter Beispiele aus der wissenschaftlichen Praxis verfeinert werden. Was getan werden muß, ist, die von Wissenschaftlern favorisierten Argumentmuster genauer zu betrachten, und zu verstehen versuchen, welche Charakteristika sie miteinander teilen. Wenn ich recht habe, so wird die wissenschaftliche Forschung von einer Maxime gelenkt, welche einst Ε. M. Forster kurz und bündig formuliert hat: D u brauchst bloß zu verbinden.
Literatur Achinstein, P. (1971): Law and Explanation, Oxford Univ. Press, Oxford. Achinstein, P. (1977): „What is an Explanation?", American Philosophical Quarterly 14, S. 1-15. Belnap, Ν./Steel, T.B. (1976): The Logic of Questions and Answers, Yale Univ. Press, New Haven. Boscovich, R. J. (1966): A Theory of Natural Philosophy (übersetzt von J. M. Child), M.I.T. Press, Cambridge. Bromberger, S. (1962): „An Approach to Explanation", in: Butler, R. J. (Hrsg.), Analytical Philosophy (First Series), Basil Blackwell, Oxford. Bromberger, S. (1966): „Why-Questions", in: Colodny, R. (Hrsg.), Mind and Cosmos, Univ. of Pittsburgh Press, Pittsburgh. Cohen, I. B. (1956): Franklin and Newton, American Philosophical Society, Philadelphia. Darwin, C. (1964): On the Origin of Species, Faksimile der ersten Auflage von 1859, hrsg. von Mayr, E., Harvard Univ. Press, CambridgeDarwin, F. (1887): The Life and Letters of Charles Darwin, John Murray, London. Eberle, R./Kaplan, D./Montague, R. (1961): „Hempel and Oppenheim on Explanation", Philosophy of Science 28, S. 418-428. Feigl, H. (1970): „The ,Orthodox' View of Theories: Remarks in Defense as well as in Critique", in: Radner, M./Winokur, S. (Hrsg.),
Erklärung durch Vereinheitlichung
229
Minnesota Studies in the Philosophy of Science, Band IV, Univ. of Minnesota Press, Minneapolis. Friedman, Μ. (1974): „Explanation and Scientific Understanding", Journal of Philosophy LXXI, S. 5-19. Heimann, P./McGuire, J. E. (1971): „Newtonian Forces and Lockean Powers", Historical Studies in the Physical Sciences 3, S. 233-306. Hempel, C. G. (1962): „Deductive-Nomological vs. Statistical Explanation", in: Feigl, H./Maxwell, G. (Hrsg.), Minnesota Studies in the Philosophy of Science, Band III, Univ. of Minnesota Press, Minneapolis. Hempel, C. G. (1965): Aspects of Scientific Explanation and Other Essays, The Free Press, New York. Hempel, C. G. (1966): Philosophy of Natural Science, Prentice-Hall, Englewood Cliffs. Hull, D. (Hrsg., 1974): Darwin and his Critics, Harvard Univ. Press, Cambridge. Jeffrey, R. (1970): „Statistical Explanation vs. Statistical Inference", in: Rescher, N. (Hrsg.), Essays in Honor of C. G. Hempel, D. Reidel, Dordrecht. Kitcher, P.S. (1976): „Explanation, Conjunction and Unification", Journal of Philosophy LXXIII, S. 207-212. Lavoisier, A. (1862): Oeuvres, Paris. Newton, I. (1952): Opticks (l. engl. Ausg. 1704), Dover, New York. Newton, I. (1962): The Mathematical Principles of Natural Philosophy (1. lat. Ausg. 1687; übersetzt von Motte, Α. und Cajori, F.), Univ. of California Press, Berkeley. Railton, P. (1978): „A Deductive-Nomological Model for Probabilistic Explanation", Philosophy of Science 45, S. 206-226. Salmon, W. (1970): „Statistical Explanation", in: Colodny, R. (Hrsg.), The Nature and Function of Scientific Theories, Univ. of Pittsburgh Press, Pittsburgh. Schofield, R. E. (1969): Mechanism and Materialism, Princeton Univ. Press, Princeton. Teller, P. (1974): „On Why-Questions", Noüs VIII, S. 371-380. Van Fraassen, B. (1977): „The Pragmatics of Explanation", American Philosophical Quarterly 14, S. 143-150. Whyte, L. (Hrsg., 1961): Roger Joseph Boscovich, Allen and Unwin, London.
Philip
Kitcher
Erklärung durch Vereinheitlichung Nachwort 1986
In den fünf Jahren seit der Publikation von „Explanatory Unification" hat sich meine Auffassung über wissenschaftliche Erklärung in drei Hauptrichtungen weiterentwickelt. Erstens scheint mir, daß der 1981 von mir vorgeschlagene Ansatz durch eine eingehendere Behandlung der Erklärungspragmaii'A: vertieft werden würde. Zweitens meine ich, daß die Diskussion der Erklärungsasymmetrien explizit mit dem Begriff der Kausalität verbunden werden sollte. Und drittens habe ich in einer Reihe von nachfolgenden Studien zu zeigen versucht, daß der Begriff des Argumentmusters für die Rekonstruktion von Theorien aus diversen Gebieten der Wissenschaft von Nutzen ist. Im Kapitel 5 seiner Arbeit (1980) entwickelt Bas van Fraassen eine Theorie der Pragmatik von Erklärung und stellt die provokative Behauptung auf, alle Probleme der Erklärungstheorie lösen sich auf, sobald die pragmatischen Faktoren der Erklärung richtig verstanden werden. Wesley Salmon und ich haben in Kitcher/Salmon (1987) argumentiert, daß van Fraassens Pragmatik der Erklärung zwar eine erhellende Ergänzung zu jeder Erklärungstheorie darstellt, jedoch nicht das Ganze einer Erklärungstheorie ausmacht. Unserer Auffassung nach ist van Fraassen dazu gezwungen, viel zu viel als erklärend anzuerkennen, weil er keine Methode angibt, mit der genuin explanative Relevanzrelationen gekennzeichnet werden könnten. Der nicht-pragmatische Teil einer Erklärungstheorie müßte in einer Explikation jener Bedingungen liegen, die eine Proposition erfüllen muß, um für das Thema einer erklärungssuchenden Warum-Frage objektiv relevant zu sein. Wenn ich „Explanatory Unification" heute nochmals schreiben würde, so würde ich van Fraassens Behandlung der Pragmatik übernehmen und die im ursprünglichen Aufsatz angegebenen Bedingungen nun als Mittel anbieten, den Begriff einer objektiven Relevanzrelation einzufangen. Grob gesprochen sind die objektiven Relevanzre-
232
Philip
Kitcher
lationen - relativ zu einer Menge akzeptierter Hintergrundsätze Κ - jene, die zwischen den Prämissen und Konklusionen von Argumenten bestehen, die zum Erklärungsvorrat über Κ gehören. Wesley Salmons neuere Theorie der Erklärung, die er in seinem grundlegenden Werk (1984) entwickelt hat, bietet für den Begriff der Relevanzrelation eine andere Perspektive an. Salmons Auffassung zufolge bezeugen die Probleme der Asymmetrie und Irrelevanz die Vernachlässigung kausaler Begriffe in traditionellen Ansätzen der wissenschaftlichen Erklärung. Hume folgend sah es die logisch-empiristische Tradition natürlich als wichtig an, in der Theorie der Erklärung jeglichen Bezug zu Kausalität zu vermeiden. Insofern der kausale Diskurs gerechtfertigt werden sollte, sollte er mithilfe des bereits explizierten Erklärungsbegriffs gerechtfertigt werden (für einen klassischen Vertreter dieser Position s. Hempel 1965). Es ist Salmons Verdienst, daß er die Kosten der Einführung von Kausalbegriffen für die Behandlung der Asymmetrie- und Relevanzprobleme erkennt und zu zeigen versucht, warum die Kausalbegriffe, auf die er sich stützt, epistemologisch unproblematisch sind. Dennoch scheint Salmons versuchte Lösung der Probleme, wie ich knapp in (1985a) argumentiert habe, nicht erfolgreich zu sein. Mein eigener Ansatz versucht der Hempelschen Leitlinie zu entsprechen, derzufolge der kausale Diskurs vom erklärenden Diskurs abhängig zu machen ist. In „Explanatory Unification" habe ich daher gezeigt, wie die Asymmetrie- und Irrelevanzprobleme angepackt werden können, ohne sich dabei auf kausale Begriffe zu stützen. Heute scheint es mir, daß die zentrale Frage von Erklärungstheorien darin liegt, welche Aussichten zwei Hauptwege der Beantwortung der Asymmetrie- und Irrelevanzprobleme besitzen. Sollten wir für die Lösung dieser Probleme kausale Begriffe verwenden, und uns damit verpflichten, eine epistemologische Theorie dieser Begriffe zu liefern, die diese als unproblematisch erweist? Oder können wir das in „Explanatory Unification" von mir skizzierte Programm durchführen und so die empiristische Leitlinie beibehalten, derzufolge Kausalität als Projektion von Erklärungsabhängigkeiten auf die Natur anzusehen ist? (Eine detailliertere Darstellung dieser
Erklärung durch Vereinheitlichung
233
Frage findet sich in meiner Arbeit 1985a; eine Skizze, wie explanative Begriffe mit kausalen Begriffen in Bezug zu setzen wären, gebe ich in meiner Arbeit 1986.) Klarerweise müßte viel mehr dazu gesagt werden, und obwohl ich optimistisch bin, daß das von mir favorisierte Programm im Detail ausgearbeitet werden kann, wird die Kontroverse durch das bisher von mir Gesagte wohl kaum entschieden werden. Unabhängig ihrer Erfolgschancen bezüglich dieser Hauptfrage sind die Ideen von „Explanatory Unification", wie ich glaube, für die Behandlung von Problemen nützlich, die beim Versuch entstehen, die Struktur wissenschaftlicher Theorien zu verstehen (voralledem in der Biologie, Geologie und den Sozialwissenschaften), sowie für die Ergründung intertheoretischer Relationen und für das Verständnis jener Gründe, die sich für größeren wissenschaftlichen Wandel als maßgeblich erwiesen haben. In (1984) versuche ich zu zeigen, wie die Auffassung der klassischen Genetik als eine Menge von Mustern, welche bestimmte Typen von erklärungssuchenden Fragen beantworten, eine Klärung der Struktur der klassischen Genetik ermöglicht. Dies führt mich dann zu einer Sichtweise der Beziehungen zwischen klassischer Genetik und Molekulargenetik, die sowohl die Einsichten jener, welche auf die Unmöglichkeit der Reduktion ersterer auf letzterer bestehen, als auch die korrekte Behauptung erfassen soll, daß die Molekularbiologie für die klassische Genetik etwas sehr Wichtiges geleistet hat. In ähnlicher Weise liefere ich in (1985b) eine Rekonstruktion der von Darwin in The Origin of Species eingeführten Theorie (oder genauer, Theorien). Ich behaupte, daß Darwins Theorie (Theorien) mit gewissen zur Beantwortung erklärungssuchender Warum-Fragen verwendeter Muster identifiziert werden kann, und daß der Kern der Darwinschen Revolution in der These liegt, daß sein neuer Zugang zur Entwicklungsgeschichte des Lebens in der Lage ist, Fragen zu beantworten, die bisher außerhalb des Bereichs der Naturwissenschaften lagen. Schließlich verwende ich in (1985c) den Begriff des Argumentmusters, um die Struktur verschiedener Versionen der Soziobiologie zu charakterisieren und die Beziehungen zwischen diesen Versionen und der zeitgenössischen Evolutionstheorie zu untersuchen. Also sogar dann, wenn mein Lösungsversuch für die
234
Philip Kitcher
Asymmetrie- und Relevanzprobleme, welche ich als Kern der gegenwärtigen Erklärungskontroversen betrachte, nicht in der Lage wäre, die erforderlichen Unterscheidungen mithilfe des Vereinheitlichungsbegriffs allein zu leisten, so wird sich jedenfalls, wie ich hoffe, einiges der konzeptuellen Maschinerie, die ich in meinen Bemühungen um die Klärung des Vereinheitlichungsbegriffs eingeführt habe, in der Bewältigung anderer Probleme der Wissenschaftstheorie und Wissenschaftsphilosophie als nützlich erweisen. Literatur Hempel, C. G. (1965): „Aspects of Scientific Explanation", in: Aspects of Scientific Explanation and Other Essays, The Free Press, New York, S. 333-488. Kitcher, P.S. (1984): „1953 And All That. A Tale of Two Sciences", Philosophical Review 93, S. 335-373. Kitcher, P.S. (1985a): „Two Approaches to Explanation", Journal of Philosophy 82, S. 632-639. Kitcher, P.S. (1985b): „Darwin's Achievement", in: Rescher, N. (Hrsg.), Reason and Rationality in Science, Univ. Press of America, Washington D. C. Kitcher, P. S. (1985c): Vaulting Ambition: Sociobiology And The Quest For Human Nature, MIT Press, Cambridge MA. Kitcher, P.S. (1986): „Projecting The Order of Nature", in: Butts, R. E. (Hrsg.), Kant's Philosophy Of Physical Science, D. Reidel, Dordrecht. Kitcher, P. S./Salmon, W. C. (1987): „Van Fraassen On Explanation", Journal of Philosophy 84, S. 315-330. Salmon, W.C. (1984): Scientific Explanation and the Causal Structure of the World, Princeton Univ. Press, Princeton NJ. Van Fraassen, B. (1980): The Scientific Image, Clarendon Press, Oxford.
Gerhard Schurz Was ist wissenschaftliches Verstehen? Eine Theorie verstehensbewirkender Erklärungsepisoden Der folgende Beitrag gliedert sich in zwei Teile. In Teil I werde ich eine Reihe allgemeiner Thesen vertreten, die für alle Arten des Verstehens und Erklärens Geltung haben. Damit versuche ich, ein Programm für eine allgemeine Verstehens- und Erklärungstheorie zu entwerfen. In Teil II führe ich dieses Programm dann für Warum-Verstehen und Warum-Erklärungen im formalen Detail durch.
I. Programm einer allgemeinen Theorie des Verstehens und Erklärens I.l. Der Modellrahmen: Frage-Antwort-Episoden und Wissensdynamik Erklärungen sind gewisse Antworten auf gewisse Fragen - so lautet eine entscheidende Explikationsthese innerhalb der jüngeren pragmatisch-epistemischen Erklärungstheorien. Illustrieren wir dies zunächst am Beispiel von Warum-Erklärungen. Warum-Erklärungen sind Antworten auf Warum-Fragen der Form „Warum ist es der Fall, daß ET' (mit Ε als Explanandum). Die Aufgabe von Adäquatheitsbedingungen für Erklärungen besteht in dieser Perspektive darin, zu explizieren, wann eine Antwort Α auf eine Frage „Warum ET' eine erklärende Antwort ist. Dies hat offenbar mit der Beziehung zwischen zwei Wissenssystemen zu tun: dem Hintergrundwissen W des Fragestellers vor Erhalt der Antwort, in dem sich die Frage „Warum ET' stellt, und dem Hintergrundwissen W* des Fragestellers nach Erhalt der Antwort. Dabei geht W* in einer noch zu besprechenden Weise aus W und Α hervor (falls Α mit W vereinbar ist, einfach als Vereinigung; andernfalls wird die Sache komplizierter). Die Antwort Α ist, grob gesprochen, dann
236
Gerhard Schurz
als erklärend anzusehen, wenn der in W vorhandene Erklärungsbedarf bzgl. Ε in W* befriedigt ist. Diese Feststellung ist nicht trivial: sie besagt, daß es sich bei der Explikation dieser Bedingung (s. II.3) um eine gewisse Relation zwischen W und W*, also um eine wissensdynamische Relation handeln muß. In allen Frage-Antwort-orientierten Erklärungsmodellen gehen diese zwei Wissenssysteme, explizit oder implizit, ein - was auf den ersten Blick nicht immer sichtbar wird. 1 Ein zweites wichtiges Motiv für den Zugang zu Erklärungen über dynamische Modelle wurde von van Fraassen erwähnt (s. Abschn. I seines Beitrages): das hartnäckige Scheitern der Hempel- und Salmon-artigen Versuche, Erklärungen als Argumente resp. Propositionen bestimmter Art zu explizieren, aufgrund von pragmatischen Kontextphänomenen wie Asymmetrien, Zurückweisungen, dem Betonungsproblem, usw. Ein dritter Grund liegt schließlich in jener wichtigen jüngeren Strömung, derzufolge das spezifische Kennzeichen einer Erklärung das Bewirken von Verstehen ist. 2 Auch in dieser Perspektive bietet sich die dynamische Betrachtungsweise unmittelbar an: sagt man, daß eine Erklärung von Ε Verstehen von Ε bewirkt, so sind darin offenbar ebenfalls zwei Wissenssysteme involviert: eines, in dem Ε noch nicht verstanden wurde ( = fV), und eines, in dem Ε verstanden wurde ( = W*). Zunächst eine grobe Charakterisierung der Struktur von Wissenssystemen wie W bzw. W*. Im einfachsten Fall besteht 1
2
Gärdenfors, der sehr intensiv den Übergang zwischen Wissenssystemen diskutiert, fuhrt in seinem Beitrag vier Wissenssysteme ein: Κ (entspricht W), K j Λ c (entspricht W*\ K^ und (K^ )•/, c , wobei die beiden letzten, wie er ausführt (s. Abschn. 4 seines Beitrags), hypothetische Wissenssysteme sind, die der probabilistischen Bewertung von £ bzgl. des Restwissens dienen. Wir benötigen diese sogenannten .kontrahierten' Systeme aus in II. 1 erläuterten Gründen nicht. Van Fraassen und Tuomela konstruieren W* nicht explizit aus W und A, fordern aber, daß Α Sätze bzw. Informationen enthält, die in W noch nicht enthalten sind (für van Fraassen s. Abschnitt II.4; würde Α in K(Q) enthalten sein, könnte es nicht die Favorisierung erhöhen; und für Tuomela vgl. Abschnitt 1; er setzt voraus, daß der Fragesteller vor Erhalt der Antwort noch nicht über eine Erklärung von Ε verfügt). Diese Auffassung vertreten ζ. B. Achinstein (1983, S. 16), Bromberger (1965, S. 80), Scriven (1975, S.107), Essler (1975, S. 132), Friedman, Kitcher und Tuomela (vgl. ihre Beiträge in diesem Band) - um nur einige Autoren zu nennen. Auf die Gegenargumente von van Fraassen und Lambert gehen wir noch ein.
Was ist wissenschaftliches
Verstehen?
237
ein solches Hintergrundwissen aus der Menge jener Aussagen (resp. Propositionen), die von einem idealisierten epistemischen Subjekt - etwa einer Gemeinschaft von Wissenschaftlern (im Sinne von Kuhns scientific community'), oder auch nur einer einzelnen Person - in einem bestimmten (wissensstabilen) Zeitintervall aus rationalen Gründen als wahr angenommen werden, oder kurz: rational akzeptiert werden. Die minimalen Rationalitätsbedingungen, denen ein solches Hintergrundwissen W genügen soll, sollen sein: (1.) W muß konsistent sein, (2.) die in W enthaltenen Beobachtungssätze müssen intersubjektiv überprüfbar sein, und (3.) die in W enthaltenen Gesetze und Theorien müssen (sofern nicht rein logischer oder definitorischer Natur) durch Beobachtungssätze gut bestätigt sein. Wir werden jedoch - im Gegensatz zu Gärdenfors' „epistemic states" (resp. „knowledge situations") - weder voraussetzen, daß ^deduktiv abgeschlossen ist, noch, daß alle in W rational akzeptierten Sätze mit einer subjektiven Wahrscheinlichkeit 1 belegt werden. Ersteres nicht, weil uns niemals alle logischen Konsequenzen unserer Annahmen bekannt sind. Dies zu fordern wäre mit menschlichen Wissenssystemen unvereinbar; ferner könnte man unter dieser Annahme gewisse Erklärungsarten wie ζ. B. argumentativ innovative Erklärungen (s. 1.3.2.2.) nicht erfassen. Zweiteres fordern wir nicht, weil das dem Fallibilismus widersprechen würde: jene in W akzeptierten Aussagen, die nicht logisch wahr sind, sollen zwar eine (mehr oder weniger) hohe Wahrscheinlichkeit haben, aber nicht 1, denn dann könnten sie nicht mehr revidiert werden. 3 Ferner wird von den Sätzen in W natürlich nicht verlangt, daß sie wahr sind - d. h. bei W handelt es sich um einen epistemisch-pragmatischen Begriff rational akzeptierten Wissens resp. Glaubens, und nicht um einen realistisch-semantischen Begriff. Aus diesem Grund werden wir im folgenden (zumeist) statt von Wissenssystemen neutral von Hintergrundsystemen sprechen (denn im klassischen Wissensbegriff ist Wahrheit involviert, und wir wollen terminologische 3
Aus dem elementaren Wahrscheinlichkeitskalkül folgt: wenn w(A) = l,dann w(A/B) = w(A) für jede beliebige neue Information Β (mit w(B) > 0). Eine subjektive w-Funktion mit 0 < w(Ä) < 1 für jedes kontingente Α einer endlichen Partition nennt man auch undogmatisch (s. Kutschera 1972, S. 66).
238
Gerhard Schurz
Konfusionen vermeiden). Freilich schließen wir nicht aus, daß mehr oder weniger viele Aussagen in W auch wahr sind - es wird bloß nicht apriorisch verlangt. Dies steht in Einklang mit der Wissenschaftspraxis ( - vgl. hierzu auch van Fraassens Ausführungen in Abschnitt 1.1). Natürlich hat ein Hintergrundsystem W in Wirklichkeit eine wesentlich komplexere Struktur. Es umfaßt: 1.) Eine Sprache L, welche mindestens die Sprache der Prädikatenlogik 1. Stufe und der Mengenlehre enthalten soll - wobei wir nicht nur im engen Sinn formalisierte, sondern auch ,informelle' Aussagen zulassen (im Sinne des ,neuen Strukturalismus'; s. Stegmüller 1986, S. 21, sowie Schurz 1987b). 2.) Eine Logik L, welche mindestens die klassische Prädikatenlogik 1. Stufe enthalten soll. 3.) Ein mathematisches Aussagensystem M, welches die Axiome und Begriffsbildungen (Definitionen) der Standardmathematik enthalten soll. 4.) Eine Menge D von Definitionen (im Sinn von ,harmlosen' auf Explizitkonventionen beruhenden Bedeutungspostulaten). 5.) Eine Menge von Aussagen mit empirischem Gehalt, welche sich in vier disjunkte Mengen unterteilt: Β - die Beobachtungssätze, S - singuläre Hypothesen, G empirische (deterministische oder statistische) Gesetze und Τ Theorien. 6.) Eine Menge Bew, welche die in W bekannten Beweisgänge enthält und sozusagen das logische Schlußwissen von W repräsentiert. 4 Bew ist insofern wichtig, als sich viele für Erklärung relevante Probleme nur mit diesem Parameter adäquat behandeln lassen. In den wenigsten Modellierungen von Wissenssystemen ist dieser Parameter bisher berücksichtigt worden. Als Rationalitätsbedingung ist hier zu fordern: wenn χ e Bew, Pr{x) (= die nichtlogische Prämissenmenge von x) c M u D u B y j S U G O T , dann Concl(x) (= die Konklusion von x ) e M v D u B < u S K j G v T . Man kann ferner noch 7.) eine subjektive Wahrscheinlichkeitsfunktion w sowie evtl. auch 8.) eine Menge Ν normativer Sätze in W annehmen (vgl. hierzu Weingartner 1980). 4
Die Elemente χ e Bew sind also Folgen von Aussagen aus L, deren letztes Glied die Konklusion ist und für deren alle Glieder gilt; sie sind entweder logische Axiome (aus L), oder nichtlogische Prämissen, oder folgen aus vorhergehenden Gliedern mithilfe einer Regel von L.
Was ist wissenschaftliches
Verstehen?
239
Für die folgende Diskussion können wir uns jedoch (zumeist) auf lediglich zwei Elemente beschränken: die Menge Ρ der in W akzeptierten nichtlogisch wahren Aussagen (Propositionen), und die Menge EB jener in W bekannten Beweisgänge, welche deduktiven oder probabilistischen Erklärungen entsprechen, d.h. eine deduktive oder probabilistische Relation zwischen Prämissen und Konklusion einer Erklärung beweisen (nur diese Beweisgänge sind für uns wesentlich). Daß in Wferner L und L enthalten sind, setzen wir einfach ständig voraus; und nur wenn nötig werden wir die Menge Ρ in M, D, B, S, G bzw. Τ spezifizieren. Eine subjektive resp. induktive Wahrscheinlichkeitsfunktion benötigen wir aus in Abschn. II. 1 angegebenen Gründen nicht. Ein Vier-Tupel χ = (F, A, W, W* ), mit f a l s erklärungssuchender bzw. verstehensverlangender Frage, Α als Antwort, W als dem Hintergrundsystem des Fragestellers vor und W* nach Erhalt der Antwort nennen wir im folgenden (in Anlehnung an Bromberger 1965, S. 76) eine Erklärungsepisode. (Wir wählen „A" für „Antwort", weil „A" für „Antecedens" reserviert ist.) Ist Α erklärend bzw. verstehensbewirkend, so nennen wir JC explanativ erfolgreich oder kurz erfolgreich. Natürlich gehen in reale Erklärungsepisoden eine große Anzahl pragmatischer Bedingungen ein, über die ζ. B. Tuomela (s. sein Beitrag) in subtiler Weise Aufschluß gibt. Beispielsweise sind zumindest zwei Personen, eine fragende und eine antwortende, involviert. Damit von einer Erklärungsepisode gesprochen werden kann, muß die antwortende Person tatsächlich die Intention haben, erklären zu wollen, und die fragende Person die Intention, eine Erklärung zu erhalten. Ferner müssen die beiden Personen über ein gemeinsames Hintergrundwissen bzw. -paradigma verfügen; ansonsten könnten sie sich nicht verständigen (vgl. hierzu Tuomela in seinem Beitrag - Abschn. 2 und 6). Wir wollen diese Bedingungen jedoch in unser Modell nicht aufnehmen, sondern sie schlicht voraussetzen resp. im formalen Modell von ihnen abstrahieren - und zwar deshalb, weil es sich hier um kommunikationstheoretische Bedingungen handelt, die mehr oder weniger für alle Arten von Frage-Antwort-Episoden typisch sind, während uns nur jene pragmatischen Bedingungen interessieren sollen, die für die spezifischen wissenschaftstheoretischen
240
Gerhard Schurz
Erklärungsprobleme von Relevanz sind. Hierfür scheint es völlig hinreichend zu sein, für die Beschreibung von Erklärungsepisoden nur die vier abstrakten Elemente F, A, W und W* anzunehmen - alles für Erklärung Spezifische wird damit erfaßt. Es ist auch nicht nötig (obwohl man es ergänzenderweise tun kann 5 ), als drittes Hintergrundsystem das der antwortenden Person einzuführen und zu verlangen, die Antwort müsse auch von der antwortenden Person als Erklärung rational akzeptierbar sein. Auch das können wir im folgenden einfach voraussetzen, ohne es als extra Bedingung anzuschreiben. Denn, was es heißt, daß eine Erklärung für ein Hintergrundsystem rational akzeptierbar ist, muß - als notwendige aber nicht hinreichende Bedingung - auch in den Begriff einer erfolgreichen Erklärungsepisode Eingang finden, welche nur über W und W* spricht; überdies kann man dann durch gewisse Abstraktionsoperationen vom dynamischen Begriff einer erfolgreichen Erklärungsepisode zum statischen Begriff einer rational akzeptierbaren Erklärung bzgl. eines gegebenen W übergehen (s. I.2.). Kurz gesagt, im dynamischen Modellrahmen (F, A, W, W* > scheint uns alles im engeren Sinn Relevante enthalten zu sein. Der Modellrahmen (MR) für erfolgreiche Erklärungsepisoden, den wir im folgenden vorschlagen, enthält folgende noch näher zu explizierende Bedingungen: (MR) χ ist eine erfolgreiche Erklärungsepisode g.d.w. ein F, A, Wund W* existiert mit χ = (F, A, W, W* >, sodaß gilt: (1) F ist gleichbedeutend mit einer erklärungssuchenden Frage (aus der in 1.3. angegebenen Liste), und das in F Erfragte ist in W enthalten. (2) Α ist gleichbedeutend mit einer Antwort auf F, welche aus der vollständigen Präsupposition von F durch Ersetzung der gebundenen Variable durch Λ AK entsteht (bei Streichung des Quantors + gebundene Variable), wobei AKAQT Antwortkern (eine strukturierte Aussagenmenge, s. 1.3.2.2.) und /\ AK DIE Konjunk5
In Schurz (1983a, S. 460-490) und (1984) wird dieses dritte Wissenssystem eingeführt.
Was ist wissenschaftliches
(3) (4) (5)
Verstehen?
241
tion seiner Elemente ist, und die Elemente von AK nicht in W enthalten sind. W* geht aus W und AK hervor. Die χ zugrundeliegende Trägererklärung ist rational akzeptierbar bzgl. W*. Das in F Erfragte muß in W* insofern besser verstanden sein als in W, als W* gegenüber W durch AK vereinheitlicht wurde.
Ich werde im folgenden die These vertreten, daß dieser Modellrahmen für alle Arten von Erklärung bzw. Verstehen zutrifft. Einiges zur Erläuterung: Bedingung (1) bezieht sich auf die in 1.3 angegebene Übersicht von Arten des Erklärens und Verstehens. Bedingung (2) ist gemäß den fragelogischen Methoden zu explieren, auf die in van Fraassens Beitrag (II.2-II.3) und Tuomelas Beitrag (Abschn. 3-4) ausführlich eingegangen wird. Allgemein gesprochen muß man, um die zu gewissen Fragearten gehörenden Antwortarten zu definieren, die vollständigen Präsuppositionen der Fragen herausfinden. Die vollständige Präsupposition einer Frage impliziert, grob gesprochen, daß es mindestens eine Antwort auf die Frage gibt. Im Fall einer Warum-Frage „Warum ist es der Fall, daß £ ? " lautet die vollständige Präsupposition ζ. B. „Es gibt einen Grund/eine Ursache dafür, daß Alle Arten von Fragen lassen sich letztlich auf Was-Fragen zurückführen; Warum-Fragen ζ. B. auf „Was ist der Grund/die Ursache von ET'. Eine Antwort auf eine Frage ist nun immer eine Proposition, die aus der Präsupposition durch Streichung des Existenzquantors plus gebundene Variable und Ersetzung der gebundenen Variablen in der Matrix durch eine Konstante entsteht. Ζ. B. ist eine Antwort auf „Warum ist es der Fall, daß El" eine Proposition mit der Bedeutung „E ist der Fall, weil Λ AK' - mit Λ AK für die Konjunktion jener Aussagen, die den Antwortkern bilden (im Sinne van Fraassens, s. sein Beitrag Abschn. II.3) und intuitiv als Prämissen der Erklärung fungieren. Freilich gibt es in der natürlichen Sprache verschiedene Formulierungsmöglichkeiten - daher die Wendung „gleichbedeutend mit" in Bedingungen (1) und (2). Bei Warum-Fragen mit Kontrastklassen muß statt „E" dann „E im Kontrast zu AT" (mit Κ als Kontrastklasse im Sinne van
242
Gerhard Schurz
Fraassens) gesetzt werden - ansonsten ändert sich nichts. - Bedingungen (3)-(5) müssen noch näher definiert werden, was wesentliches Anliegen unseres Teils II ist. Bedingungen (4) und (5) sind die explanativen Kernbedingungen und bedürfen einer näheren Begründung. In (4) wird von der zugrundeliegenden Trägererklärung gesprochen, die man wiederum aus den oben angegebenen fragelogischen Methoden erhält. Im Falle einer Warum-Erklärung ist Λ AK die Konjunktion jener Prämissen des Trägerarguments, die in W noch nicht gewußt werden - die restlichen brauchen in der Antwort nicht angeführt zu werden (vgl. Gärdenfors' Beitrag, Abschn. 4 - 5 , wo dies besonders betont wird), und das in F erfragte Explanandum Ε ist die Konklusion. Diese Trägererklärung muß, so fordert (4), natürlich eine relativ zu W* rational akzeptierbare Erklärung sein. Genau dies ist der Punkt, wo unser dynamisches Modell an die Hempel-Salmon-Tradition anknüpft. Wir glauben, daß in die Explikation eines rationalen Erklärungs- bzw. Verstehensbegriffs ein derartiges Konzept von rational akzeptierbaren Erklärungsargumenten resp. -systematisierungen unbedingt Eingang finden muß. (Zwar werden die von uns in II.l vorgeschlagenen Modelle stark von denen Hempels und Salmons abweichen - dennoch liegen sie ,in derselben Tradition'.) Der springende Punkt, der das dynamische Modell sozusagen ,interessant' macht, ist, daß diese Bedingung (4) zur Explikation von explanativ erfolgreichen, d.h. verstehensbewirkenden Erklärungsepisoden zwar notwendig, aber nicht hinreichend ist.6 Dies werde ich in Abschn. II.3 durch eine Reihe von Beispielen zu belegen suchen. Das, was hier zusätzlich erforderlich ist, wird durch den ersten Teil von Bedingung (5) intuitiv ausgedrückt: Ε (das in F Erfragte) muß in W* besser verstanden sein als in W. Man beachte, daß diese graduelle Bedingung als Spezialfall den Fall der Sprungentwicklung enthält, wo is in ^ ü b e r haupt nicht verstanden wird, d. h. wo für Ε in W überhaupt
6
Auch Tuomela ζ. B. nimmt in Abschn. 5 seines Beitrags eine derartige pragmatische Einbettung der von ihm entwickelten, ebenfalls ,Hempel-Salmonartigen' Erklärungsmodelle vor - allerdings gibt es in seinem Modell nichts, was unserer Bedingung (5) entspricht.
Was ist wissenschaftliches Verstehen?
243
keine Erklärung vorliegt.7 Man stellt jedoch „Warum ETiFragen oft auch dann, wenn man bereits eine Erklärung für Ε weiß, jedoch nach einer besseren Erklärung sucht (ζ. B. einer theoretisch tiefergehenden, oder einer informativ vollständigeren). Daher ist die graduelle Bedingung die allgemeinere. Unsere These lautet, daß dieser ,Verstehenszuwachs' auf einer Erhöhung der Einheitlichkeit von W* gegenüber PF beruht. Wie wir in II.3 sehen werden, muß man sich hierfür über lokale Erklärungseffekte hinaus globalen Effekten (im Sinne von Friedman und Kitcher) zuwenden. 1.2. Die Symmetrie zwischen Erklären und Verstehen. Das dynamische und das statische Modell Wir wollen nun den dem skizzierten dynamischen Modellrahmen adäquaten Sprachgebrauch für die Begriffe des Erklärens und Verstehens festlegen und damit gleichzeitig unsere These von der Symmetrie zwischen Erklären und Verstehen explizieren. Wir sagen: Der dynamische Verstehens-/Erklärungsbegriff: Α erklärt Ε ( = d a s in F Erfragte) aufgrund
W-^+W*
( = durch den durch Α bewirkten Übergang von W zu W*) g.d.w. Α bewirkt Verstehen von Ε aufgrund W-^* W* g.d.w. P{E) und van Fraassens Bedingung der Erhöhung der Favorisierung gegenüber dem Vorwissen wurden der Einfachheit halber weggelassen.
276
Gerhard Schurz
zogen zu explizieren. Dennoch lassen sich deduktive Erklärungen nicht adäquat als Grenzfall probabilistischer Erklärungen begreifen, aus drei Gründen: (1.) Deterministische Gesetze V χ (Fx -> Gx) sind stärker als 1-probabilistische Gesetze ρ {GIF) = 1; denn p(G/F) = 1 läßt im infiniten Fall endlich viele Fälle Fa Λ —Ι Ga zu; V χ (Fx -» Gx) verbietet jeden solchen Fall. (2.) Für deduktive Erklärungen müssen viel feinere deduktive Relevanzbedingungen herangezogen werden, weil aus deterministischen Gesetzen mehr ableitbar ist als aus statistischen. (3.) Der deduktive Erklärungsfall muß auch Gesetzeserklärungen umfassen. - Wir schlagen folgende Modelle der Ereigniserklärung und Gesetzeserklärung vor: 23 (DE1) χ ist eine relativ zum Hintergrundsystem W rational akzeptierbare deduktiv-nomologische Ereigniserklärung g.d.w. ein Τ, Α und Ε existiert mit χ = (Τ,Α,Ε} sodaß gilt: (1) (Formbedingung): Τ ist eine nichtleere Menge deterministischer Gesetze, d. h. essentiell genereller Aussagen (plus evtl. mathematischer Axiome und Definitionen), A ist eine nichtleere Menge singulärer Sätze, Ε ist ein singulärer Satz, und Τ a W, A • E(x)) hinausgehen. Dies ist m. E. ein Vorteil gegenüber Tuomelas DE-Modell, welches aufgrund seiner starken Bedingungen (4) und (5) nur Minimalgesetzerklärungen zuläßt (s. sein Beitrag, Abschn. 7.1). Genaueres zur deduktiven Relevanzbedingungen in Schurz (1983a), (1988a), (1988b); näheres zu ihren formalen Eigenschaften sowie zu ihren über Erklärung weit hinausgehenden Anwendungsmöglichkeiten in Schurz (1983b), Weingartner/Schurz (1986) und Schurz/Weingartner (1987). Ad (5) DE1: Diese Bedingung ist analog zu (5) (i) von PE; sie eliminiert irrelevante Gesetze wie „Alle Männer, die Antibabypillen nehmen, werden nicht schwanger" (das bekannte Beispiel, s. Gärdenfors' Beitrag, Abschn. 5). Sie ist aufgrund ihrer Formulierung jedoch auch auf Gesetze anwendbar, die nicht diese einfache Implikationsform besitzen. Ad (6) DE1: (a) Für Ursachenerklärungen ist syntaktisch zu fordern, daß Α und Ε logisch voneinander vollkommen unabhängig sind, also keine Atomsätze als irgendwelche Subformeln gemeinsam haben - denn Kausalbeziehungen können nur zwischen logisch voneinander unabhängigen Ereignissen resp. Ereignissenbündeln bestehen. Auch die zeitliche Vorwärtsgerichtetheit muß gewährleistet sein. Die Elemente von Τ müssen wirklich als Naturgesetze akzeptabel sein. Ferner muß man sich, zur Eliminierung etwaiger Fälle von Abschirmung oder Scheinursachen usw., auf das vollständigste theoretische Modell über Α und E,M{A, Ε), in W beziehen - welches möglichst vollständig alle Faktoren auflistet, die auf Α und Ε und alles raumzeitlich Dazwischenliegende einen kausalen Einfluß besitzen. Näheres zur Bedingung (i) und (iii) in Schurz (1988b), (1988a); zur Bedingung (ii) Schurz (1983a, S. 404-450). (b) Für Begründungen bzw. Erklärungen im Begründungssinn ist dies alles nicht zu verlangen, dafür aber muß das Argument potentiell prognostische Funktion besitzen - und dies bedeutet, daß Α im Hintergrundsystem W unabhängig von Ε bestätigbar sein muß. (s. Schurz 1982). An Ursachenerklärungen hingegen ist diese Bedingung nicht zu stellen, aufgrund der Akzeptabili-
280
Gerhard Schurz
tat von selbstbestätigenden Erklärungen wie „Im von anderen Galaxien emittierten Licht findet sich eine Rotverschiebung, weil das Universum expandiert" (s. Schurz 1988b). Ad (l)-(5) DE2: Diese Bedingungen dürften klar sein. A kann bei Gesetzeserklärungen auch leer sein (muß aber nicht). Dieselbe deduktive Relevanzbedingung kann auch zur Elimination von Pseudogesetzeserklärungen verwendet werden. Ad (6) DE2: Die Unterscheidung zwischen Kausalerklärungen und Begründungen ist hier nicht mehr sinnvoll, denn der Kausalitätsbegriff ist strenggenommen nur auf Ereignisbeziehungen anwendbar. Jedoch ist hier zu fordern, daß Γ gegenüber Ε theoretisch übergeordnet ist, d. h. kein Element von Γ darf aus Ε folgen, und einige müssen globaler als £ sein, wobei die Kriterien für Globalität an den Kontext des Hintergrundsystems gebunden sind (Kriterien für Theorienglobalität finden sich in Schurz 1983, S. 309 ff). Abschließend zwei Ergänzungen: (1.) Man kann mit diesem DE-Modell auch Warum-Fragen mit nichttrivialen Kontrastklassen erfassen, indem man die Präsupposition V AT, (mindestens ein Element der Kontrastklasse ist wahr) entweder in die Prämissenmenge der Erklärung mit aufnimmt, oder dem Explanandum die Implikationsform V Ε gibt (was gleichwertig ist). Daß dies zu einer befriedigenden Behandlung betonter Warum-Fragen im deduktiven Fall führt, wird in Schurz (1984) zu zeigen versucht. (2.) Approximative deduktive Erklärungen lassen sich in das DE-Modell leicht einbetten. Approximative Erklärungen können aufgrund Meßungenauigkeiten auftreten 25 (A ist dann eine Intervallaussage; Vergibt sich aufgrund Τ und Α über Fehlerfortpflanzungsrechnung) oder aufgrund systematischer Fehler (vereinfachender Annahmen) in der Theorie. In beiden Fällen gibt es ein aus Tund Α deduziertes Ε und ein tatsächlich gemessenes E', und die Erklärung ist als approximative akzeptierbar, wenn E E ' hinreichend genau approximiert (für solche quantitative Approximationsmaße vgl. ζ. B. Niiniluoto 1984).
25
Für eine genauere Behandlung dieses Typs approximativer Erklärungen vgl. Forge (1980).
Was ist wissenschaftliches
Verstehen?
281
II.1.3. Zum Schluß eine wichtige Ergänzung: in den Modellen PE, DE1 und DE2 ist noch nicht der Beweisaspekt von Erklärungen berücksichtigt, dem wir, wie in 1.1 und 1.3.2.2 angeführt, auch Rechnung tragen wollen. Hierzu muß zusätzlich folgendes gefordert werden: Zusatz zu PE, DE1 und DE2. Ein ist nur dann eine rational akzeptierbare Erklärung bzgl. W =