148 97 6MB
German Pages 194 [196] Year 1998
Hans Reichenbach Philosophie im Umkreis der Physik Herausgegeben von Hans Poser und Ulrich Dirks
Hans Reichenbach Philosophie im Umkreis der Physik Herausgegeben von Hans Poser und Ulrich Dirks
mit Beiträgen von Lutz Danneberg, Evelyn Dölling, Bas C. van Fraassen, Max Jammer, Andreas Kamiah, Hubert Laitko, Ilkka Niiniluoto, Hans Poser, Ulrich Röseberg (f), LadislavTondl, Jan Woleriski
Akademie Verlag
Die Deutsche Bibliothek - CIP-Einheitsaufnahme Hans Reichenbach, Philosophie im Umkreis der Physik / hrsg. von Hans Poser und Ulrich Dirks. - Berlin : Akad. Verl., 1998 ISBN 3-05-003280-4
© Akademie Verlag GmbH, Berlin 1998 Der Akademie Verlag ist ein Unternehmen der R. Oldenbourg-Gruppe. Das eingesetzte Papier ist alterungsbeständig nach DIN/ISO 9706. Alle Rechte, insbesondere die der Übersetzung in andere Sprachen, vorbehalten. Kein Teil dieses Buches darf ohne schriftliche Genehmigung des Verlages in irgendeiner Form - durch Photokopie, Mikroverfilmung oder irgendein anderes Verfahren - reproduziert oder in eine von Maschinen, insbesondere von Datenverarbeitungsmaschinen, verwendbare Sprache übertragen oder übersetzt werden. Druck: GAM MEDIA, Berlin Bindung: Druckhaus „Thomas Müntzer", Bad Langensalza Printed in the Federal Republic of Germany
Vorwort
Die Vorgeschichte der hier versammelten Beiträge einer Tagung über Hans Reichenbach ist geradeso langwierig wie die Nachgeschichte - nur bezeichnender. Im Jahre 1991 galt es, des 100. Geburtstags Hans Reichenbachs, eines der Großen im Kreise der Empiristen, zu gedenken. Doch drei Jahre zuvor schon stellte sich die Frage, wie und wo das geschehen sollte. Jene Universität, die Reichenbach 1933, gezwungen von den Nationalsozialisten, verlassen mußte, die Humboldt-Universität in der DDR, würde hierzu wohl kaum von sich aus die Initiative ergreifen; so lag es nahe, die Vorbereitungen an der Hochschule aufzunehmen, die lange schon vor Reichenbachs durch Einstein erwirkte Berufung nach Berlin positivistisches Gedankengut gepflegt hatte - die jetzige TU Berlin und vormalige Technische Hochschule Charlottenburg: An ihr hatten J. Petzoldt ebenso wie W. Dubislav gewirkt, und beide hatten mit Reichenbach die Berliner Gruppe, ein offenes interdisziplinäres Forum als Pendant zum Wiener Kreis, gegründet und mit Leben erfüllt. Doch zugleich sollten die beiden anderen Berliner Universitäten mit eingebunden werden. So traf es sich gut, daß David Pears an der FU ähnliche Überlegungen angestellt hatte und daß Begegnungen mit DDR-Wissenschaftsphilosophen, insbesondere mit Karl-Friedrich Wessel, im österreichischen Deutschlandsberg die Möglichkeit boten, eine gemeinsame internationale Tagung zu konzipieren: Reichenbach als von den Nazis Verfolgter und als Kritiker des Positivismus sollte es möglich machen, an der Humboldt-Universität in der DDR eine Art Wiedergutmachungs-Tagung auszurichten, getragen von allen drei Berliner Universitäten und finanziert mit Zuschüssen aus der Bundesrepublik. Doch als die Pläne Gestalt annahmen, fiel die Mauer. Die erste Diktatur, der Reichenbach hatte entfliehen müssen, geradeso wie die zweite stalinistischer Prägung, die sein Werk nicht recht hatte zur Kenntnis nehmen wollen, waren endgültig vergangen. In dieser Lage, nach dem Kollaps eines Staatwesens von innen heraus, war auch Philosophie gefragt - keine parteiliche, keine besserwisserische, sondern eine nüchtern-analytische mit Realitätssinn und ohne falsches Pathos, eine, die in einer wissenschaftlich-technischen Welt die Sprache der Naturwissenschaften aufnimmt, ohne doch bei ihnen stehen zu bleiben kurz, eine Philosophie von der Art Hans Reichenbachs. So kam es dank der Unterstützung der Humboldt-Universität und der Fritz-ThyssenStiftung im Sommer 1991 zu einer im Rückblick ebenso erfolgreichen wie ungewöhnlichen Tagung: Die Eröffnung fand in Gegenwart von Frau Professor Maria Reichenbach im festlichen Rahmen des Senatssitzungssaales jener Universität statt, die ihrem Manne die Tür gewiesen hatte. Die Begrüßung übernahm als Rektor Professor H. Fink, dem später politische Vorwürfe bezüglich seiner DDR-Vergangenheit gemacht werden sollten, und die Tagung selbst fand in Gosen in einer der Humboldt-Universität zur Nutzung überlassenen einstigen
6
Vorwort
Stasi-Schulungseinrichtung statt, während eine Führung zu den Wirkungsstätten Reichenbachs ihren Weg durch das nun wiedervereinigte Berlin nehmen konnte. Weniger dramatisch sind die Gründe für das verzögerte Erscheinen der Tagungsbeiträge. Zum Teil war dies bedingt durch den Umstrukturierungswirbel, der die Berliner Hochschulen nach der Wiedervereinigung erfaßte und der in hohem Maße Kräfte band; doch vor allem wurde der zeitliche Abstand von allen, die Beiträge geliefert haben, zu einer völligen Überarbeitung kurz vor der endgültigen Drucklegung genutzt. Ihnen und Frau Reichenbach, den Mitorganisatoren der Tagung, der Humboldt-Universität und der Fritz-ThyssenStiftung sei an dieser Stelle noch einmal Dank gesagt. Die Herausgeber
Geleitwort Maria Reichenbach
Anläßlich des hundertsten Geburtstages meines verstorbenen Mannes, Hans Reichenbach, hat vom 4. - 6. Juli 1991 die Reichenbach-Tagung Berlin unter der wissenschaftlichen Leitung von Herrn Prof. Dr. Hans Poser, Institut für Philosophie, Wissenschaftstheorie, Wissenschafts- und Technikgeschichte, Technische Universität Berlin, in Verbindung mit PD Dr. David Pears, Institut für Philosophie, Freie Universität Berlin, und Herrn Prof. Dr. K.-F. Wessel, Interdisziplinäres Institut für Wissenschaftsphilosophie und Humanontogenese, Humboldt-Universität Berlin, stattgefunden. Ich möchte allen Herren herzlich für die Organisation dieser Konferenz und für meine Einladung dazu danken. Die Vorträge waren alle sehr interessant, und ich habe selbst viel dabei gelernt. Was mich besonders beeindruckt hat, war die Detektivarbeit, die geleistet worden ist, um das Leben, Wirken und die Werke aus der Berliner Zeit meines Mannes von 1926 - 33 wieder lebendig zu machen. Vieles davon war mir neu. Speziell gefreut hat mich, daß wir im Anschluß und in Anlehnung an die damalige „Gesellschaft für empirische Philosophie" die „Gesellschaft für Wissenschaften und Philosophie" neu gründen konnten. Mein Dank geht auch an Herrn Prof. D. Hoffmann, der uns in dem Teil von Berlin, der die ehemalige Wirkungsstätte meines Mannes gewesen ist, herumgeführt hat. Meine Anerkennung gilt ebenfalls der Fritz-Thyssen-Stiftung Bonn, die die Tagung unterstützt hat. Das reiche Forschungsmaterial, das in den Vorträgen geboten wurde, hat mich davon überzeugt, daß die wissenschaftliche Philosophie nicht nur aufgestiegen ist, sondern heute in vieler Weise floriert. Dabei denke ich sowohl an die Ansätze zur Lösung philosophischer Probleme, die sich in den Werken meines Mannes finden und kritische Weiterentwicklung erfahren haben, als auch an die historischen Forschungen. Die Sekundärliteratur ist schon sehr reich, und es scheint, daß u.a. das Reichenbach-Archiv in Pittsburgh, Pa., eine gute Quelle bietet. Ich sehe der Weiterentwicklung dieser Tendenzen sehr optimistisch entgegen. Es freut mich, daß die für den Druck überarbeiteten Beiträge beim Akademie Verlag in Berlin erscheinen. Prof. Dr. Maria
Reichenbach
Inhalt Vorwort
5
Geleitwort von Maria Reichenbach
7
Max Jammer Hans Reichenbach und der Begriff der Gleichzeitigkeit
11
Ulrich Röseberg (t) Reichenbachs Philosophie der Physik und die Physiker
25
Andreas Kamiah Die Analyse der Kausalrelation, Reichenbachs zweites philosophisches Hauptproblem
33
Bas C. van Fraassen Frequency and the myth of probability
55
Ilkka Niiniluoto Truth, probability, and simplicity Comments on Hans Reichenbach's probabilistic empiricism
69
Jan Woleriski Reichenbach's probability logic and the Lvov-Warsaw School
89
Ladislav Tondl The direction of time, the philosophy of technology and technology assessment
97
Evelyn Dölling Reichenbach on existence
109
Lutz Danneberg Der Logische Empirismus der zwanziger und dreißiger Jahre. Rezeption und Ausstrahlung
119
Hubert Laitko Wissenschaft in Berlin um 1930
139
Hans Poser Glanz und Elend des Empirismus. Hans Reichenbachs Theorie der Erkenntnis
157
Hinweise zu den Autoren und Herausgebern
179
Personenregister
183
Sachregister
189
Hans Reichenbach und der Begriff der Gleichzeitigkeit Max Jammer
Der bekannte holländische Physiker und langjährige Mitarbeiter von Niels Bohr, Hendrik Anthony Kramers, hat einmal gesagt: „In the world of human thought generally, and in physical science particularly, the most important and most fruitful concepts are those to which it is impossible to attach a well defined meaning."1
Selbst wenn diese, wohl von der Bohrschen Komplementaritätsphilosophie beeinflußte, Unmöglichkeits-Aussage berechtigt sein sollte, so wird dennoch das philosophische Denken niemals auf möglichst klare und eindeutige Definitionen der wissenschaftlichen Grundbegriffe verzichten. Das gilt im besonderen für den Begriff der Zeit, dessen Wesensbestimmung schon immer eines der Hauptprobleme in Philosophie und Wissenschaft war und der bekanntlich in der modernen Physik weitgehende Veränderungen erfahren hat. Es ist das Verdienst Hans Reichenbachs, entscheidend zum Verständnis des modernen Zeitbegriffes beigetragen zu haben. Insbesondere haben seine Untersuchungen über die Frage, welche Rolle Erfahrung, Konvention und andere außer-physikalische Gesichtspunkte bei der Definition dieses Begriffes spielen, zu einem tieferen Verständnis geführt. Im Gegensatz zu Kant, der in der Transzendentalen Ästhetik seiner Kritik der reinen Vernunft Beharrlichkeit, Folge und Zugleichsein als Modi der Zeit 2 und letztere als eine a priori gegebene Anschauung auffaßte, 3 strukturiert sich der moderne Zeitbegriff auf ganz andere Weise. Wie schon Leibniz in seiner Abhandlung Initia Rerum Mathematicarum Metaphysica (1715) 4 , dem Vorbild aller modernen kausalen Zeittheorien, vorgeschlagen hatte, basiert diese Struktur auf dem operativ definierbaren Gleichzeitigkeitsbegriff. Mit Hilfe dieses Begriffes, der als Abwesenheit gegenseitiger Einwirkungen aufgefaßt wird, werden die Relationen .früher' und .später' definiert und erst dann der Begriff der Zeit (tempus) eingeführt. Auch Einstein begann seine erste Arbeit zur Relativitätstheorie (1905) mit einer Definition der Gleichzeitigkeit, die ihm in Verbindung mit dem Relativitätsprinzip und dem Lichtpostulat einen widerspruchsfreien deduktiven Aufbau der Relativitätstheorie ermöglichte. Die Schlüsselrolle, die der Gleichzeitigkeitsbegriff in der Entwicklung der modernen Wissenschaft spielte, ist heute allgemein anerkannt. So erklärten der Philosoph Graham Neriich: 1 2 3 4
M. Dresden, H.A. Kramers, New York 1987, S. 539. B 219. B 46. G.W. Leibniz, Mathematische Schriften, hg. v. C.I. Gerhard, Bd. VII, Halle 1863, Hildesheim 1971, S. 17-29.
12
Max Jammer "It is hard to overestimate the impact of Einstein's definition of simultaneity on the philosophy of this Century"5,
und der theoretische Physiker Julian B. Barbour: "Einstein's definition of simultaneity opened the door into a world as unexpected as the one inadvertently discovered by Copernicus when trying to save uniformity of motion in the heavens." 6
Der erste, der die wissenschaftstheoretische Bedeutung dieses Begriffes der Gleichzeitigkeit räumlich getrennter Ereignisse klar erkannte und ihn in seine empirisch gegebenen und konventionell hinzugefügten Anteile zerlegen zu können behauptete, war Hans Reichenbach. Die Begründung und Verteidigung der Ergebnisse dieser Untersuchungen war eines der Hauptthemen seiner in Berlin verfaßten Schriften. In den späteren Jahren seines Lebens, die er in Kalifornien verbrachte, interessierten ihn nicht so sehr die metrischen als vielmehr die topologischen und dynamischen Aspekte des Zeitbegriffes. Seine in Los Angeles geschriebene Abhandlung zu diesen Problemen wurde 1956, drei Jahre nach seinem Tod, von Frau Maria Reichenbach unter dem Titel The Direction of Time als Buch veröffentlicht. Diese späteren Arbeiten brauchen hier nicht berücksichtigt zu werden, da sie für das Hauptthema unserer Ausführungen, nämlich die Frage, in welchem Sinne, wenn überhaupt, Reichenbachs These von der Konventionalität der Gleichzeitigkeit noch heute Anspruch auf Geltung besitzt, nicht relevant sind. Doch bevor wir auf diesen Fragenkomplex näher eingehen, wollen wir seinen intellektuellen Hintergrund mittels einiger biographischer Bemerkungen kurz besprechen. Hans Reichenbach wurde am 26. September 1891 in Hamburg geboren. Seine akademische Laufbahn begann er als Student an der Technischen Hochschule in Stuttgart, an der er später von 1920 bis 1926 als Dozent für Physik und Philosophie tätig war. Daß gerade in Berlin die Gedenkfeier anläßlich der hundertjährigen Wiederkehr seines Geburtstages stattfindet, hätte er, wäre er noch heute unter den Lebenden, wohl als besonders bedeutungsvoll angesehen. Denn es war die Berliner Friedrich-Wilhelms-Universität, wie die jetzige Humboldt-Universität vor 1945 genannt wurde, wo er in Deutschland seine letzte Vorlesung hielt, bevor er kraft des am 7. April 1933 verkündeten Gesetzes zur Wiederherstellung des Berufsbeamtentums seiner Stellung enthoben und zur Emigration gezwungen wurde. Reichenbach liebte das Berlin der Zwanziger Jahre, das in Kunst, Literatur und Musik, aber mit Planck, Einstein und von Laue auch in der Physik eine führende Rolle spielte. Als Reichenbach vor Ende des Ersten Weltkrieges vom aktiven Dienst an der russischen Front entlassen wurde, wählte er Berlin zu seinem Wohnsitz, wo er sich als Radiotechniker beruflich und als Teilnehmer an Einsteins Seminar über die Relativitätstheorie wissenschaftlich betätigen konnte. Als er nach der schon erwähnten Stuttgarter Dozentur auf Plancks Empfehlung in Berlin zum außerordentlichen Professor der Naturphilosophie ernannt wurde, begann f ü r ihn seine vielleicht fruchtbarste Periode, die aber im Frühjahr 1933 ein jähes Ende nahm. Eine seiner letzten Berliner Vorlesungen war dem Thema Kant und die moderne Naturwissenschaft gewidmet. Ein unter dem gleichen Titel in der Zeitschrift Die Naturwissenschaften erschienener Aufsatz war der letzte, den er in einer in Deutschland verlegten wis5 6
G. Nerlich, Simultaneity and convention in special relativity, in: R. McLaughlin (Hg.), What? When? Why?, Dordrecht 1982, S. 130. J. B. Barbour, Absolute or Relative Motion?, Bd. 1, Cambridge 1989, S. 676.
Where?
Hans Reichenbach und der Begriff der
Gleichzeitigkeit
13
senschaftlichen Zeitschrift veröffentlichte. Der letzte Satz dieser Arbeit bezeichnet nicht nur seinen Abschied von Deutschland, sondern auch den endgültigen Abschluß eines intellektuellen Prozesses, der 1920 begonnen hatte, und zwar seine Wendung vom Neukantianismus zum logischen Empirismus. Er lautet: „Sein [Kants] System besitzt für uns keine Geltung mehr, seine Lehre gehört ebenso der Vergangenheit an wie das naturwissenschaftliche Weltbild des 18. Jahrhunderts - aber ganz gewiß ist er einer der wenigen, deren philosophische Arbeit den Weg geschaffen hat, auf dem die heutige Philosophie der Naturwissenschaft weiterschreitet."7
Wie man aus dem Manuskript zu diesem Aufsatz, das sich in Reichenbachs Nachlass im Pittsburgher Archive for Scientific Philosophy in the 20th Century befindet, ersehen kann, hatte Reichenbach ursprünglich seine Absage an Kant mit noch viel schärferen Worten formuliert. Wie er wiederholt betonte, war sein Anti-Kantianismus das Ergebnis seines erkenntnistheoretischen Studiums der Relativitätstheorie, das er mit seinem ersten Berliner Aufenthalt begonnen hatte. Im Gegensatz zu den klassischen Philosophen wie Descartes oder Kant, die in der Philosophie die Grundlage physikalischer Erkenntnis sahen oder zu sehen glaubten, war Reichenbach der Meinung, daß „die Philosophie sehr viel von der Physik, die Physik sehr viel weniger von der Philosophie, lernen kann", wie er es einmal in einem Beitrag zum Handbuch der Physik formulierte. 8 Da die Relativitätstheorie die klassische Auffassung von Raum und Zeit einer radikalen Revision unterzieht, war es nur natürlich, daß Reichenbach sich von 1920 ab eingehend mit der wissenschaftstheoretischen Analyse dieser Begriffe beschäftigte. Die erste seiner Abhandlungen zu diesem Thema war sein 1920 erschienenes Buch Relativitätstheorie und Erkenntnis apriori, in dem er das Verhältnis der Relativitätstheorie zur Kantischen Philosophie erörtete. Zu diesem Zweck analysierte er die Voraussetzungen und Erfahrungsresultate, auf denen die Relativitätstheorie ihre Behauptungen basiert, sowie die Voraussetzungen, die der Kantischen Erkenntnistheorie zugrunde liegen, und kam zu dem Ergebnis, daß der Begriff des Apriori verändert werden muß, damit die Kantische Philosophie von der Erfahrung nicht widerlegt werden kann und mit der Relativitätstheorie nicht in Widerspruch gerät. Was insbesondere die Zeit- und Gleichzeitigkeits-Begriffe betrifft, akzeptierte er schon hier Einsteins „tiefen Gedanken", wie er ihn nannte, daß „eine Zeitdefinition ohne eine physikalische Hypothese über bestimmte Ausbreitungsgeschwindigkeiten unmöglich ist."9 Auch betonte er schon hier die Rolle der Zuordnungsdefinitionen, wobei er Moritz Schlick folgte, der in seinem Aufsatz über Die philosophische Bedeutung des Relativitätsprinzips erklärt hatte: „Die Gesamtheit unserer naturwissenschaftlichen Sätze in Wort und Formel [ ] ist nichts als ein Zeichensystem, das den Tatsachen der Wirklichkeit zugeordnet ist; und das ist gleich sicher, mag man nun die Wirklichkeit für ein transzendentes Sein erklären oder nur für den Inbegriff und Zusammenhang des unmittelbar .Gegebenen'. Das Zeichensystem heißt aber ,wahr', wenn die Zuordnung vollständig eindeutig ist."10 7
H. Reichenbach, Kant und die Naturwissenschaft, in: Die Naturwissenschaften, 21 (1933) S. 601-606 u. 624-626. 8 Ders., Ziele und Wege der physikalischen Erkenntnis, in: H. Geiger, K. Scheel (Hgs.), Handbuch der Physik, Bd. 4, Berlin 1929, S. 1-80. 9 Ders., Relativitätstheorie und Erkenntnis apriori, Berlin 1920, S. 9. 10 M. Schlick, Die philosophische Bedeutung des Relativitätsprinzips, in: Zeitschrift für Philosophie und philosophische Kritik, 159 (1915) S. 129.
14
Max Jammer
Um 1920, nachdem die beiden britischen Expeditionen die von der allgemeinen Relativitätstheorie vorausgesagte Lichtablenkung durch die Raumkrümmung bestätigt hatten, was Einstein großen Ruhm einbrachte, wurde bekanntlich die Relativitätstheorie Gegenstand heftiger Auseinandersetzungen, in denen zwar politisch-ideologische Motive vorherrschten, aber auch philosophisch-sachliche Argumente eine Rolle spielten. Auch Reichenbach wurde in diesen „Relativitätsrummel", wie Sommerfeld es nannte, hineingezogen und veröffentlichte 1921 in der Zeitschrift Logos einen 62 Seiten langen Aufsatz Der gegenwärtige Stand der Relativitätsdiskussion.11 In ihm verteidigte er die Relativitätstheorie gegen die Einwände der Fiktionalisten der Vaihingerschen ,Als-Ob'-Philosophie, gegen die Kritiken der Machschen oder Petzoldtschen Positivisten, als auch gegen die Versuche der Neu-Kantianer, den Kantianismus gegenüber der Relativitätstheorie entweder zu immunisieren (Ilse Schneider) oder zu modifizieren (Ernst Cassirer). In diesem Zusammenhang wies Reichenbach auf das in der Physikalischen Zeitschrift erschienene Autoreferat über seine Axiomatik der relativistischen Raum-Zeit-Lehre12 hin, eine Axiomatik, zu deren Ausarbeitung er sich schon 1920 entschlossen hatte, um die Theorie in ihre empirisch überprüfbaren und definitorisch-konventionellen Komponenten in durchsichtiger Weise zu zergliedern. Wie er im Autoreferat betonte, postulieren die Axiome ausschließlich erfahrbare Tatsachen, während die Definitionen bloße Zuordnungsdefinitionen sind, also gewissen mathematischen Begriffen oder Symbolen empirische Realitäten oder operative Vorschriften zuordnen. Weder Axiome noch Definitionen können daher als Fiktionen angesehen werden. Als Musterbeispiel solcher Definitionen nannte Reichenbach Einsteins Gleichzeitigkeitsdefinition, die eine Vorschrift ist, unter welchen Bedingungen räumlich getrennte Ereignisse mit derselben Zeitzahl zu beziffern sind. Die (gleich zu besprechende) Einsteinsche Definition, wie jede ihrer Alternativen, erhebt nach Reichenbach keinen Anspruch, wahr oder falsch zu sein; sie besitzt nur den Vorteil einer deskriptiven Einfachheit, weil sie - im Gegensatz zu Alternativen - eine symmetrische und transitive Relation darstellt. In der endgültigen Formulierung seiner Axiomatik, die in Buchform unter dem Titel Axiomatik der relativistischen Raum-Zeit-Lehren erschienen ist, wird der Begriff der Gleichzeitigkeit schon in der Einleitung diskutiert und ausführlich im Kapitel über die Axiome des Zeitvergleichs erörtert. Aus später ersichtlichen Gründen soll hier kurz die Einsteinsche Gleichzeitigkeitsdefinition zitiert werden, die ihm in seiner berühmten Arbeit Zur Elektrodynamik bewegter Körper als Ausgangspunkt zum Aufbau der speziellen Relativitätstheorie diente. In den Punkten A und B sollen sich gleiche (d.h. isochrone, also gleich schnell laufende, aber noch nicht synchronisierte) Uhren befinden. Die Uhr UA in A zeigt eine ,A-Zeit', die Uhr UB in B eine ,B-Zeit' an, womit aber noch keine gemeinsame ,Zeit' definiert ist. „Die letztere Zeit kann nun definiert werden, indem man durch Definition festsetzt, daß die .Zeit', welche das Licht braucht, um von A nach B zu gelangen, gleich ist der ,Zeit', welche es braucht, um von B nach A zu gelangen. Es gehe nämlich ein Lichtstrahl zur ,A-Zeit' t A von A nach B ab, werde zur ,B-Zeit' t B in B gegen A zu reflektiert und gelange zur ,A-Zeit' t' A nach A zurück. Die beiden Uhren laufen definitionsgemäß synchron, wenn 11 H. Reichenbach, Der gegenwärtige Stand der Relativitätsdiskussion, in: Logos, 10 (1921) S. 316ff. 12 Ders., Bericht über eine Axiomatik der Einsteinschen Raum-Zeit-Lehre, in: Physikalische Zeitschrift, 22 (1921) S. 683-687. 13 Ders., Axiomatik der relativistischen Raum-Zeit-Lehre, Braunschweig 1924.
Hans Reichenbach und der Begriff der t
Gleichzeitigkeit
15
B"tA = t'A-tB
Wir nehmen an, daß diese Definition des Synchronismus in widerspruchsfreier Weise möglich ist, und zwar für beliebig viele Punkte [.. .]"14,
wobei sich diese Annahme darauf bezieht, daß die Gleichzeitigkeitsrelation symmetrisch und transitiv ist. Nach Reichenbachs Interpretation, wie sie in seiner Axiomatik dargelegt ist, hat Einstein in diesen Sätzen nicht nur zum ersten Mal den konventionellen Charakter der Gleichzeitigkeitsrelation erkannt, sondern mit seiner Annahme ihrer Symmetrie und Transitivität als Erfahrungstatsache den prinzipiellen Unterschied zwischen den konventionellen und empirischen Komponenten physikalischer Theorien betont. „Diese wichtige Unterscheidung," erklärt Reichenbach, „geht also auf ihn zurück." 15 Ob Reichenbachs Behauptungen gerechtfertigt sind, kann fraglich sein, da Einsteins Äußerungen in bezug auf die Konventionalität der Gleichzeitigkeit, wenigstens bis 1928, nicht immer eindeutig waren. Reichenbach auf jeden Fall behauptete schon in seiner Axiomatik, daß obige Einsteinsche Definitionsgleichung, die natürlich auch in folgender Form geschrieben werden kann:
ZU
mit
Ocecl
verallgemeinert werden kann. Da die Wahl des Synchronisationsparameters e bis auf die Bedingung 0 < e < 1 willkürlich ist, gibt es nach Reichenbach unendlich viele Definitionen für die Gleichzeitigkeit räumlich getrennter Ereignisse, von denen keine durch die Erfahrung widerlegt werden kann und keine den Anspruch auf alleinige Gültigkeit erheben kann. Reichenbach sträubte sich, diese Willkür eine „Konvention" zu nennen; denn wie er in seinem Logos-Artikel ausführte,wäre dies eine Überbetonung der willkürlichen Elemente in den Prinzipien der Erkenntnis, da die Kombination dieser Elemente nicht mehr willkürlich ist. Dennoch ist es üblich geworden, die Reichenbachsche Behauptung, jede willkürliche Wahl des Wertes für e zwischen 0 und 1 führe nie zu einem Konflikt mit der Erfahrung, als die „Konventionalitätsthese der Gleichzeitigkeitsdefinition" zu bezeichnen. Im Gegensatz und in Analogie - zu dem Ausdruck „physikalische Relativität der Gleichzeitigkeit", der in der Relativitätstheorie die Abhängigkeit der Gleichzeitigkeitsrelation von der Wahl des physikalischen Bezugssystems (Inertialsystems) bezeichnet, nannte Reichenbach die Willkür in der Wahl des Synchronisationsparameters „die erkenntnistheoretische Relativität" dieser Relation, um die Abhängigkeit der Relation von der Wahl des Definitionssystems zu betonen. Wie wir später sehen werden, hat diese terminologische Analogie eine viel tiefergehende sachliche Berechtigung, deren Reichenbach sich aber zeitlebens nicht bewußt wurde. Ein14 A. Einstein, Zur Elektrodynamik bewegter Körper, in: Annalen der Physik, 17 (1905) S. 891. 15 Reichenbach, Axiomatik der relativistischen Raum-Zeit-Lehre, S. 34.
16
Max Jammer
steins physikalische' Relativisierung der Gleichzeitigkeit definiert die Gleichzeitigkeit zweier räumlich getrennter Ereignisse als eine dreistellige Relation, deren Geltung sowohl von den beiden Ereignissen wie auch dem gewählten Inertialsystem, als dritte Variable, abhängt, womit der klassische, vor-relativistische Begriff der absoluten oder universellen Gleichzeitigkeit jeden physikalischen Sinn verlor. Reichenbachs .erkenntnistheoretische' Relativisierung erklärt ihre Geltung zusätzlich noch als von der Wahl des Synchronisationsparameters abhängig, definiert sie also als eine vierstellige Relation. Bekanntlich wurde, besonders in den Zwanziger Jahren, Einsteins .physikalische' Relativisierung, hauptsächlich wegen ihres kontra-intuitiven Charakters, von Philosophen, wie z.B. von Henri Bergson in seinem Durée et Simultanéité,16 als Fehlschluß kritisiert. Auch Reichenbachs .erkenntnistheoretische' Relativisierung hat, wie wir später sehen werden, zahlreiche philosophische und physikalische Kontroversen ausgelöst. Doch zuvor sollen kurz die Argumente besprochen werden, mit denen Reichenbach seine These begründete. Wie schon erwähnt, war er in seiner Studienzeit vom Neu-Kantianismus beeinflußt und daher auch mit der Kantischen Kausaltheorie der Zeit gut vertraut. Obwohl er die Kantische Lehre von der Apriorität der Zeit als reine Anschauung ausdrücklich ablehnte, da er sie durch die neuere erkenntnistheoretische Entwicklung als widerlegt ansah, übernahm er den Gedanken, daß „die Realität aus Kausalreihen aufgebaut ist"17, deren Strukturbeziehungen zu erforschen es die Aufgabe der Raum-Zeit-Lehre ist. In der Analyse des Zeitbegriffs spielen eine besondere Rolle gewisse topologisch ausgezeichnete Kausalreihen, mit denen Information übermittelt werden kann und die Reichenbach als „Signale" bezeichnete. In Analogie mit der oben erwähnten Einsteinschen Analyse des Gleichzeitigkeitsbegriffes betrachtete nun Reichenbach den Fall, daß ein Signal von A abgeht, wenn die Uhr in A die Zeit tA anzeigt, in B sofort nach A zurückreflektiert wird, und in A zur lokalen Zeit t' A ankommt (kurz „Signal ABA" genannt). Die Uhr in A kann die Umlaufsdauer At A = t ' A - t A des Signals ABA ohne jegliche Benutzung des Begriffes der Geschwindigkeit messen und verschiedenartige Signale in bezug auf ihre Umlaufsdauer vergleichen. Ein Signal, für welches At A minimal ist, nannte er ein „Erstsignal". Reichenbach betonte nun, daß die relativistische Zeitlehre sich von der absoluten dadurch unterscheidet, daß in ihr folgende Bedingung erfüllt ist: „Ist ABA ein Signal, welches in A zur Zeit t A abgeht, so gibt es ein t A > t A derart, daß jedes in t A abgehende Signal ABA später als t A nach A zurückkehrt."18
Durch dieses Axiom wird die von der klassischen Physik angenommene Existenz .unendlich schneller' Signale oder Kausalwechselwirkungen verneint und es wird gezeigt, daß auch das von B reflektierte Erstsignal nicht innerhalb des offenen Zeitintervalls zwischen t A und t' A 16 H. Bergson, Durée et Simultanéité, Paris 1922. 17 Reichenbach, Axiomatik der relativistischen Raum-Zeit-Lehre, S . l l . 18 Ebd., S. 27.
Hans Reichenbach und der Begriff der
Gleichzeitigkeit
17
ankommen kann. Das Signal-Ankunftsereignis in B kann also mit keinem der in A innerhalb dieses Zeitintervalls stattfindenden Ereignisse in kausaler Verbindung stehen. Da nun nach Reichenbach der Begriff der Gleichzeitigkeit die .Ausgeschaltetheit des Wirkungszusammenhanges' beinhaltet, konnte er seine obige e-Gleichung logisch aus den vorhergehenden Annahmen ableiten, und er konnte zeigen, daß die Einschränkung 0 < e < 1 die Forderung ausdrückt, daß die zeitliche Ordnung der drei Ereignisse (Abgang, Ankunft und Rückkehr des Signals) mit der Kausalordnung derselben übereinstimmt. Vorstehende Darstellung gibt der Kürze halber, unter Vernachlässigung zahlreicher technischer Einzelheiten, nur einen Überblick über Reichenbachs Begründung seiner Konventionalitätsthese der Gleichzeitigkeit. Seine Axiomatik behandelt eingehend auch die Raum-Zeit-Lehre der allgemeinen Relativitätstheorie und stellt ziemlich hohe Anforderungen an den Leser. Mit ihren logischen, erkenntnistheoretischen und physikalischen Erörterungen war sie wohl nur wenigen verständlich. Kein Wunder, daß Hermann Weyl in seiner Rezension derselben, die in der Deutschen Literaturzeitung19 erschien, zwar den „erkenntnistheoretischen Hintergrund" dieser Arbeit lobte, sie aber vom mathematischen Gesichtspunkte aus „als wenig befriedigend, zu umständlich und undurchsichtig" kritisierte. Es ist daher auch nicht verwunderlich, daß Reichenbach, nach seiner Übersiedelung nach Berlin, eine mehr allgemeinverständliche Ausarbeitung dieser Axiomatik verfaßte, die er 1928 als Buch unter dem Titel Philosophie der Raum-Zeit-Lehre20 veröffentlichte. Rudolf Carnap nannte es „ein Muster wissenschaftlichen Denkens in der Philosophie", und Wesley C. Salmon bezeichnete es als „das größte Werk der Wissenschaftstheorie des zwanzigsten Jahrhunderts". Auch über dieses Buch erschien in der Deutschen Literaturzeitung eine Rezension, diesmal von Einstein geschrieben, in der es heißt: „Die [...] dem Zeitbegriff gewidmeten Abschnitte behandeln ausführlich, aber in leicht lesbarer Form, des Verfassers Axiomatik der speziellen Relativitätstheorie. Dabei ist besonders darauf Wert gelegt, klar herauszuschälen, was an der relativistischen Gleichzeitigkeitsdefinition logisch willkürliche Festsetzung ist, was an ihr Hypothese, d.h. Voraussetzung über die Beschaffenheit der Natur ist." 21
Aus diesem Zitat scheint man wohl folgern zu können, daß Einstein die Reichenbachsche Interpretation des Gleichzeitigkeitsbegriffes akzeptierte. In seiner Philosophie der Raum-Zeit-Lehre zeigt Reichenbach, daß der physikalische Zeitbegriff drei metrische Zuordnungsdefinitionen erfordert, die erste für die Einheit der Zeit, die zweite für die Kongruenz von Zeitintervallen oder Gleichförmigkeit der Zeit und die dritte für die Gleichzeitigkeit an verschieden Orten. Die Notwendigkeit dieser Zuordnungsdefinitionen nachgewiesen zu haben, wo man früher Erkenntnisse gesucht hatte, sei nach Reichenbach das große philosophische Verdienst der Relativitätstheorie. Diese Zuordnungsdefinitionen erfüllen die beiden für sie charakteristischen Bedingungen, nämlich sich auf etwas empirisch Unverifizierbares zu beziehen und eine gewisse Willkür zuzulassen. Nach der ersten Bedingung, auf den Gleichzeitigkeitsbegriff angewandt, darf es nicht möglich sein, die Geschwindigkeit eines Signals in einer Richtung zu kennen, ohne vorher Gleichzeitigkeit definiert zu haben; denn wäre dies möglich, dann könnte man mit Hilfe ei19 H. Weyl, Rezension, in: Deutsche Literaturzeitung 1924, S. 2122. 20 H. Reichenbach, Philosophie der Raum-Zeit-Lehre, Berlin 1928, Nachdruck Braunschweig 1977. 21 A. Einstein, Rezension, in: Deutsche Literaturzeitung 1928, S. 19.
Max Jammer
18
nes Signals bekannter Einwegsgeschwindigkeit v, das also das Zeitintervall T = AB/v braucht, um von A entlang der Strecke AB nach B zu gelangen, eine Uhr in B mit einer Uhr in A synchronisieren; wenn nämlich letztere bei Abgang des Signals tA anzeigt, braucht man nur die Uhr in B bei Ankunft des Signals auf tß = tA + T einzustellen. Mit so synchronisierten Uhren wäre dann aber Gleichzeitigkeit verifizierbar. Reichenbach formulierte diese gegenseitige Abhängigkeit der Begriffe „Geschwindigkeit" (im Sinne von Einwegsgeschwindigkeit, z.B. von A nach B) und „Gleichzeitigkeit" (z.B. in A und B) mit den Worten: „Um die Gleichzeitigkeit entfernter Ereignisse festzustellen, brauchen wir die Kenntnis einer Geschwindigkeit; um eine Geschwindigkeit zu messen, brauchen wir die Kenntnis der Gleichzeitigkeit entfernter Ereignisse.
..22
Er wies darauf hin, daß dieses Zirkelargument mit den bekannten Messungen der Lichtgeschwindigkeit c, wie sie von Fizeau, Foucault, Michelson und anderen ausgeführt worden sind, nicht in Widerspruch steht; denn in diesen wurden nicht die einzelnen Einwegsgeschwindigkeiten c (von A nach B) oder c (von B nach A), sondern die mittlere Hin-und-Zurück-Geschwindigkeit c = (2 c c ) / ( c + c) gemessen (wie man leicht nachrechnen kann, da ja in all diesen Messungen das Lichtsignal mittels Spiegeln zum Abgangspunkte zurückreflektiert wurde). Daß auch die zweite charakteristische Bedingung der Zuordnungsdefinition bei der Gleichzeitigkeitsdefinition, nämlich die Einräumung einer gewissen Willkür erfüllt ist, folgt nach Reichenbach ohne weiteres aus der Freiheit in der Wahl des Synchronisationsparameters. Gegen Reichenbachs eben erwähntes Zirkelargument oder seine Behauptung, eine Einwegsgeschwindigkeit könne nie gemessen werden, ohne vorher Gleichzeitigkeit definiert zu haben, wurden von Philosophen und Physikern Einwände erhoben. Wir können hier nicht auf die zahlreichen, oft sehr spitzfindig ausgedachten Gedankenexperimente eingehen, mit denen man behauptete, eine konventionsfreie Einwegsgeschwindigkeit messen zu können. Jeder dieser Versuche hat sich entweder als eine petitio principii oder als physikalisch unhaltbar erwiesen. Es soll nur kurz erwähnt werden, daß auch Olaf Roemers berühmte erste Messung der Lichtgeschwindigkeit (1676) von einigen Physikern, wie G. Burniston Brown (1967), Louis Essen (1971) und E. Feenberg (1974), als Gegenbeispiel zitiert wurde, da ja in dieser Einwegsgeschwindigkeit des Lichtes vom Jupitersatelliten zur Erde nur eine einzige Uhr (auf der Erde) benutzt wurde und daher die Notwendigkeit einer vorherigen Gleichzeitigkeitsdefinition entfiel. Reichenbach antizipierte diesen Einwand in seinem Aufsatz Planetenuhr und Einsteinsche Gleichzeitigkeit, der 1925 in der Zeitschrift für Physik erschienen ist und in dem er diesen Einwand entkräftet zu haben behauptete. Er schien aber nicht erkannt zu haben, daß der logisch einfachste Gegenbeweis wohl folgender ist: die Roemersche Methode zur Messung der Einwegsgeschwindigkeit des Lichtes c, vom Jupiter-Satelliten zur Erde, ist im Prinzip lediglich nur eine Anwendung des Dopplerschen Prinzips, in dessen mathematischer Formulierung die Kenntnis einer anderen Einwegsgeschwindigkeit, nämlich die der Erde im Sonnensystem, vorausgesetzt wird; das Zirkelargument kann also durch Roemers Messungsmethode nicht widerlegt werden. Um einen Begriff zu bekommen, in 22 Reichenbach, Philosophie der Raum-Zeit-Lehre, S. 150. 23 Ders., Planetenuhr und Einsteinsche Gleichzeitigkeit, in: Zeitschrift für Physik, 33 (1925) S. 6 2 8 - 6 3 4 .
Hans Reichenbach und der Begriff der
19
Gleichzeitigkeit
welchem Umfang die Kontroverse um Reichenbachs These ausgefochten wurde, braucht man nur die Juli-1967-Ausgabe des Physics Bulletin24 zu lesen, in welcher der Herausgeber mitteilt, daß er sich wegen der zu großen Anzahl der ihm eingesandten Aufsätze pro und contra G. B. Browns Einwand weigern muß, diese Arbeiten zu veröffentlichen. Und dabei handelte es sich lediglich um nur einen speziellen Punkt in der Diskussion um die Reichenbachschen Thesen, die erst in den sechziger Jahren, also nach Reichenbachs Tod im Jahre 1953, und fast vier Jahrzehnte nach Veröffentlichung seiner Philosophie der Raum-Zeit-Lehre allgemeines Interesse erweckten. Diese Verzögerung in der Reaktion auf Reichenbachs Schriften hat ihren Grund darin, daß wegen der politischen Lage in Deutschland und der Folgen des Zweiten Weltkrieges Reichenbachs Werk ziemlich unbekannt blieb. Zum Beweis, daß es tatsächlich fast unbeachtet blieb, sollen folgende Tatsachen angeführt werden. Der Münchener Philosoph und Wissenschaftstheoretiker Hugo Dingler, der wegen seiner Forderung eines konstruktiv-axiomatischen Aufbaus der Physik oft als Begründer der Protophysik angesehen wird, schrieb 1921 eine kritische Analyse der Fundamente der Relativitätstheorie, die er als eine seinem wissenschaftstheoretischen Programm widersprechende Theorie betrachtete. Besonders scharf kritisierte er in diesen Zusammenhang die Einsteinsche Gleichzeitigkeitsdefinition, die er mit folgenden Worten zitierte: „Herr Einstein sagt: ,wir haben bisher keine für A und B gemeinsame Zeit definiert'. Er fährt fort: ,Die letztere kann nur definiert werden, indem man durch Definition festsetzt, daß die .Zeit', welche das Licht braucht, um von A nach B zu gelangen, gleich ist der ,Zeit', welche es braucht, um von B nach A zu gelangen.' Das Wörtchen ,kann nur' beweist, daß Herrn Einstein die natürliche Definition der Gleichzeitigkeit tatsächlich unbekannt war." 25
Wie ein Vergleich mit dem schon oben zitierten Einsteinschen Originaltext zeigt, hat Dingler anstatt „nun" das Wort „nur" gesetzt und mit der Veränderung lediglich eines einzigen Buchstabens unberechtigterweise eine hinreichende Bedingung in eine notwendige verwandelt. Nach Dingler würde Einstein nur die Standard-Synchronisation ( e = 1/2) als zulässig anerkennen, und Reichenbachs Legitimierung alternativer Nicht-Standard-Gleichzeitigkeiten ( e * 1/2) würden der Relativitätstheorie widersprechen. Jeder, der Reichenbachs Schriften auch nur oberflächlich gelesen hat, müßte beim Lesen des Dinglerschen Buches den Fehler bemerkt haben, auch ohne den Einsteinschen Originaltext vor sich zu haben. Die Tatsache, daß Dinglers Physik und Hypothese in den Zwanziger und Dreißiger Jahren unter den deutschen Wissenschaftstheoretikern weit verbreitet war, bezeugt also, daß die Reichenbachschen Arbeiten bei ihnen keine Beachtung fanden. Interessanterweise geschah etwas ähnliches in der englischen Wissenschaftsliteratur. Einsteins Arbeit (1905) sowie Aufsätze von Lorentz, Minkowski und Weyl wurden von Wilfrid Perrett und George Berker Jeffery ins Englische übersetzt und 1923 unter dem Titel The Principie of Relativity veröffentlicht. Obgleich es höchst unwahrscheinlich ist, daß Perrett und Jeffery Dingler gelesen haben, vertauschten auch sie Einsteins hinreichende Bedingung mit einer notwendigen, denn sie übersetzten die fragliche Stelle wie folgt: 2 4 Physics Bulletin, 18 (1967) S. 231. 25 H. Dingler, Physik
und Hypothese.
Analyse der Fundamente
Versuch einer induktiven
der Relativitätstheorie,
Wissenschaftslehre
Berlin 1921, S. 162.
nebst einer
kritischen
20
Max Jammer "We have so far defined only an 'A time' and a 'B time'. We have not defined a common 'time' for A and B, for the latter cannot be defined at all unless we establish by definition that the 'time' required by light to travel from A to B equals the 'time' it requires to travel from B to A."26
Hier wird das Einsteinsche „nun" mit „unless" übersetzt, was mit der Dinglerschen Substitution von „nun" durch „nur" vollkommen übereinstimmt. Da die Perrett-Jeffery-Übersetzung, besonders in ihrer Dover-Ausgabe, eines der verbreitetsten Bücher Uber die Relativitätstheorie, für den englischen Leser fast die einzige Quelle war, Einsteins grundlegende Arbeit (1905) genauer zu studieren, hat ihre Fehlinterpretation, nach der nur die StandardGleichzeitigkeit zulässig ist, beträchtlichen Schaden verursacht. Daß über ihre Fehlübersetzung erst 1963, im American Journal of Physics, berichtet wurde, bezeugt wieder, wie wenig Reichenbachs Werk bekannt war. Als im Jahre 1944 ein englischer Physiker die Möglichkeit einer Nicht-StandardGleichzeitigkeit entdeckte, wußte er nicht, daß schon zwei Jahrzehnte vorher Reichenbach in seinen Schriften diese Möglichkeit eingehend erforscht hatte. Es handelt sich um Paul Arne Scott-Iversens Introductory Notes on a Reformulation of the Special Theory of Relativity, die nach dem Tod von Scott-Iversen im Band 35 des Philosophical Magazine von Herbert Dingle veröffentlicht wurde und mit folgenden Worten beginnt: „A reformulation [...] of special relativity in which, between any two inertial frames of reference, [...] simultaneity is absolute. The requirements of the Lorentz transformation are met by an appropriate choice of simultaneity for events at different places."27
Die Scott-Iversen-Theorie basiert auf der Annahme, daß die Einwegsgeschwindigkeit des Lichtes Cm in einer Richtung, die einen Winkel co mit einer im Raum festliegenden Geraden bildet, durch 5 Cto = T1 -— ecosco
gegeben ist, wo c die meßbare Hin-und-Zurückgeschwindigkeit des Lichtes und e die Exzentrizität des in Polarkoordinaten definierten Ellipsoids ist. Hätte Scott-Iversen Reichenbachs Arbeiten gekannt, dann würde er sicher erkannt haben, daß seine Theorie nur eine Formulierung der speziellen Relativitätstheorie in Nicht-Standard-Synchronie ist, in der der Reichenbachsche richtungsabhängige Parameter e^ durch e
co
=-(l-ecos B )
2.
(A>B)3(A>B).(A>C)
3.
(A v B 3- C) => (A > C). (B 3- C). (A.B 3- C)
4.
(A>BVC)D(A>B)V(A>C)
5.
(A>B)D(A.C>B)
6.
(A>B).(A>C)d(A>B.C)
7.
(A>C).(B>C)D(AVB>C)
8.
(A > B) v (A 3- C) => (A > B v C)
9.
(A > B). (B 3- C) => (A > C)
10. (A > B). (B 3 C) 3 (A > C) Der Leser versuche mit der oben angegebenen Interpretation für (A > B) diese Axiome zu lesen und sich zu überlegen, ob sie dabei wahr werden! Er wird damit seine Probleme haben. Man versteht sie allenfalls, wenn man dabei (A > B) intuitiv als ,A hat auf B einen statistischen Einfluß' deutet. Wir dürfen hier aber Reichenbachs Intuition nicht zu schnell verwerfen. Schließlich steuert er hier eines der schwierigsten Probleme der Naturphilosophie an: Was unterscheidet die Wahrscheinlichkeitsbeziehung eines vergangenen Ereignisses zu einem zukünftigen von der eines zukünftigen zu einem vergangenen? Offenbar kann an einem einzigen Ort Information über die gesamte Vergangenheit der Welt gespeichert sein, so daß vom physikalischen Zustand an diesem Ort Rückschlüsse auf viele Einzelheiten an anderen Orten zu früheren Zeiten mit großer Wahrscheinlichkeit möglich sind. So erfahren wir aus einem Spektrogramm etwas über die Temperatur und die chemische Zusammensetzung ferner Sterne vor vielen Jahren. Um aber etwas über die Zukunft des Wetters auf unserer Erde zu erfahren, müssen wir den Zustand der Atmosphäre nebst Außeneinwirkungen überall, auf der ganzen Erde, genau kennen. Daran führt kein Weg vorbei. Daß es sich so verhält, ist eigenartig, und mir ist absolut nicht klar, ob der zweite Hauptsatz der Thermodynamik, der stets zitiert wird, wenn vom Unterschied von Vergangenheit und Zukunft die Rede ist, dazu ausreicht, diese Verschiedenheit der beiden Zeitrichtungen physikalisch abzuleiten. Reichenbach diskutiert den Unterschied zwischen zwei Fällen:
47 Lewin an Reichenbach am 24.1.24, NHR 16-36-13.
47
Die Analyse der Kausalrelation
1. Fall, die Spitzgabel: zwei Ereignisse A und B wirken auf ein späteres Ereignis C ein. 2. Fall, die Sattelgabel: ein Ereignis C wirkt auf zwei verschiedene Ereignisse A und B ein. Beide Fälle sind keine zeitlichen Spiegelbilder voneinander. Im Falle der Spitzgabel gilt A.B > C ,
A > C,
B>C.
Nur beide Ereignisse A und B zusammen erlauben einen Wahrscheinlichkeitsschluß auf C. Das wäre etwa der Fall der Wettervorhersage, wenn wir A und B durch die große Menge aller Ereignisse der Atmosphäre zu einer Zeit und C durch ein späteres Gewitter ersetzen. Im Falle der Sattelgabel gilt A>C,
B>C,
d.h. sowohl aus A als auch aus B kann auf C geschlossen werden. So kann aus einem Spektrogramm in Zürich und einem in Los Angeles unabhängig voneinander der gleiche Schluß auf die Temperatur des Sirius gezogen werden und nicht erst aus beiden Daten zusammen. Reichenbachs Gabeln werfen eine große Zahl von Fragen auf. Zunächst, was sind Ereignisse? Handelt es sich dabei um die jeweiligen Gesamtgeschehnisse in kleinen Gebieten der Raumzeit? Oder handelt es sich generell um Eigenschaften von Raum-Zeit-Punkten? Spielt es für die Gabeln eine Rolle, daß die gleichzeitigen Ereignisse A und B (siehe Abb. 5) voneinander räumlich getrennt sind?
Spitzgabel
X5-S
Sattelgabel
AVBB-C
C
B-A.B
AS-C
C 3-A
A
B-B
A B-C
C 3-A
A
B-B
B B-C
C B-B
B
3-A
B B-C
C B-B
B
B-A
P{C,A.B)
= P{C,A)
•
P(C,B)
Abb. 5: Die Spitz- und die Sattelgabel. Im Raum-Zeit-Diagramm sind jeweils drei Ereignisse A, B , C aufgetragen, die durch Kausalverknüpfungen miteinander verbunden sind. Die Figuren sind Zeitspiegelungen voneinander. Aber das Zusammenwirken der Kausalverknüpfungen ist jedesmal anders.
48
Andreas
Kamiah
In The Direction of Time nahm Reichenbach seine Untersuchungen wieder auf, die er in der Akademieabhandlung begonnen hatte. Die etwas unklare Relation a > b ersetzte er bereits in der Wahrscheinlichkeitslehre (1935)48 durch die der bedingten Wahrscheinlichkeit a > p b oder in konventioneller Notation W(a, b) = p. Ich kann natürlich nicht auf alles eingehen, was Reichenbach in seinem letzten Buch behandelt hat. Ich will mich auf das Phänomen der gemeinsamen Ursache beschränken. Reichenbach stellt es wie folgt dar: Eine gemeinsame Ursache C liegt für A und B vor, wenn sowohl A als auch B mit bestimmter Wahrscheinlichkeit unabhängig voneinander von C bewirkt werden:49 P(C, A.B) = P(C, A). P(C,B) Reichenbach schreibt dazu dann noch die weitere Gleichung, die wohl nur in Spezialfällen gilt: P(C,A.B) = P(C,A).P(C,B) Das heißt, daß, was für C gilt, hier auch für C gelten soll. Das ist aber nicht so leicht einsichtig zu machen. Er muß dann noch einige weitere Annahmen machen wie die, daß A (und auch B) auf Grund der Ursache C wahrscheinlicher ist als auf Grund von C: P(C,A)>P(A)>P(C,A)
; P(C,B)>P(B)>P(C,B)
Damit sind mindestens Ausdrücke hingeschrieben, mit denen man Rechnungen durchführen kann. Er beweist damit, daß die Wahrscheinlichkeit P(A.B) für das gemeinsame Auftreten von A und B größer sein muß als das Produkt P(A).P(B) der Wahrscheinlichkeiten für ihr einzelnes Auftreten. A und B gehören eben zusammen:50 P( A. B) > P( A). P(B) . Die gemeinsame Ursache C bedingt eben mit erhöhter Wahrscheinlichkeit ein gemeinsames Auftreten der Wirkungen A und B. Doch die Notation ist immer noch nicht ganz klar. Was ist das Ereignis A und was ist A ? Handelt es sich hier um die Beschaffenheiten eines bestimmten Raumgebiets? Eine ganz andere Frage ist die nach der Natur der Wahrscheinlichkeiten P(C, A), P(C, B). Handelt es sich hier um naturgesetzliche Wahrscheinlichkeit oder um solche bei bestimmten konkreten Randbedingungen, wie die von Ereignissen in einer elektronischen Schaltung, wo die Anordnung der Schaltelemente zu den Randbedingungen gehört? Reichenbachs Beispiele entsprechen häufig mehr der zweiten Möglichkeit. Aber trotz der Schwierigkeiten läßt sich nicht bestreiten, daß an der Verschiedenheit zwischen Spitz- und Sattelgabel etwas dran ist. Das Phänomen ist dann die merkwürdige Tatsache, daß zwei Ereignisse A und B von dem gleichen Ereignis C abhängen können, ohne voneinander abhängig zu sein. Zwei Zeigerstän48 H. Reichenbach, Wahrscheinlichkeitslehre, Leyden 1935, ab S. 40; ders., Ges. Werke 7, S. 41. 49 Ders., The Direction ofTime, S. 159. 50 Ebd., S. 158.
Die Analyse der Kausalrelation
49
de verschiedener Barometer hängen beide vom örtlichen Luftdruck ab, ohne untereinander in irgendeiner statistischen Beziehung zu stehen, wenn der Luftdruck erst einmal gegeben ist. So etwas kommt vor. Dagegen gibt es nicht so etwas wie eine gemeinsame Ausrichtung auf die Zukunft; derartige Phänomene existieren nur scheinbar. Wenn einige Zehntausende von Menschen zu einer Demonstration auf einen großen Platz strömen, dann liegt das letztlich auch wieder an einer gemeinsamen Ursache. Es ist nicht die Wirkung, die Demonstration, als solche, die den Aufbruch vieler Menschen veranlaßt. Denn sie können auch dann aufbrechen, wenn sie durch eine Autopanne daran gehindert werden, an der Demonstration teilzunehmen. Gehen die Leute aber anschließend wieder nach Hause und strömen sternförmig vom Demonstrationsplatz in alle Himmelsrichtungen, dann ist die gewesene Demonstration die gemeinsame Ursache dieses Verhaltens. Teleologisches Verhalten ist also kein zeitumgekehrtes kausales. (Andernfalls gäbe es tatsächlich das zeitumgekehrte Pendant zur Sattelgabel.) Dies läßt sich gut durch ein Diagramm deutlich machen (Abb. 6). Im Falle der kausalen Wirkung gibt es Wirkungslinien, die irgendwo aufhören. Ist die
Kausale Beziehung
Teleologische Beziehung
Ursachen
Abb. 6: Kausale und teleologische Wirkungszusammenhänge. Die Raum-Zeit-Diagramme von kausalen Wirkungslinien sind für teleologische Beziehungen deutlich anders als für kausale.
gemeinsame Ursache das Schreiben eines Buches, so mögen die Wirkungen, die gedruckten Exemplare, noch lange existieren. Doch irgendwann enden die Weltlinien eines jeden der Auflage. Die Spuren verlöschen. Bei Prozessen, die ein Ziel haben, ist das - zeitumgekehrt ganz anders. Auch hier enden Weltlinien, aber die auf das Ziel gerichteten, so daß nur einige das Ziel erreichen. Nur wenige Brieftauben erreichen vielleicht wieder ihren Taubenschlag. Im Raumzeitdiagramm führt das zu ganz verschiedenen Graphen. Abgesehen davon haben wir natürlich beim gemeinsam angestrebten Ziel noch die gemeinsame Ursache unterschlagen, den Beschluß des Brieftaubenzüchtervereins, einen Sternflug zu veranstalten, oder den Aufruf einer politischen Gruppe zu einer Demonstration. Reichenbachs Akademieabhandlung blieb, rein philosophiehistorisch gesehen, ganz ohne Wirkung. Das liegt daran, daß seine Gedanken darin noch nicht ganz ausgereift waren. Man hat zwar das unbestimmte Gefühl, daß Reichenbach, dessen Stärke ja manchmal mehr die Intuition als die formale Analyse von Problemlösungen war, hier zu tiefen Problemen durchgedrungen ist. Andererseits bleibt im Unklaren, was es eigentlich heißen soll, daß zwischen zwei Ereignissen A und B die Relation A 3- B nicht besteht, wenn nicht damit gemeint ist, daß B auf Grund von A zu 100% oder 0% wahrscheinlich ist.
50
Andreas
Kamiah
Man muß Reichenbachs Aussage ernst nehmen. Er spürte wohl, auf der Spur zur Lösung eines ganz fundamentalen Problems zu sein. Und daß es sich um ein schwieriges Problem handelte, empfand er wohl auch, denn er hob es sich bis fast ans Ende seines Lebens auf, um es dann in The Direction of Time erneut zu bearbeiten. Natürlich ist es völlig falsch, den statistischen Einfluß von A auf B als 0 < W ( A , B) < 1 darzustellen, wie Reichenbach das zuerst tat. Man braucht dazu eine Explikation des Relevanzbegriffes, wie sie in den letzten Jahrzehnten mit gewissem Erfolg formuliert worden ist. Reichenbachs Explikation in seinem letzten Buch kommt dem schon viel näher. 51 Reichenbachs Stärke war seine naturwissenschaftliche Intuition. Hierin unterschied er sich beträchtlich von Carnap, der zu den Naturwissenschaften ein abstrakteres Verhältnis hatte. Diese Intuition orientierte sich an Beispielen, und davon gibt es in Reichenbachs Büchern viele. Das ist natürlich auch der Weg, auf dem Naturwissenschaftler zu allgemeinen Erkenntnissen kommen. Man muß nur einmal Darwins Entstehung der Arten52 lesen, um zu sehen, wie ein genialer Naturforscher an zahllosen Beispielen seine Theorie entstehen läßt. Bereits auf einem Quadratmeter Rasen findet Darwin Material für seine Evolutionstheorie. Aber die Methode der Verallgemeinerung an Beispielen hat nur einen heuristischen Wert. Was als Beispiel fungiert, ist zunächst das Spektakuläre, und die Verallgemeinerungen müssen sich an den unscheinbaren und scheinbar bedeutungslosen Fällen genau so gut bewähren. Wenden wir diese Ermahnung auf Reichenbachs Beispiele von gemeinsamen Ursachen an, auf Geysire, die gleichzeitig sprudeln, auf Barometer, die den gleichen Luftdruck anzeigen, 53 weil er nun einmal in der ganzen Ortschaft gleich ist, dann müssen wir aufpassen, ob nicht gerade diese spektakulären Beispiele etwas Besonderes gemeinsam haben, das vielleicht für das Phänomen der gemeinsamen Ursachen wesentlich ist. Wir sollten versuchen, diese Beispiele, so gut es geht, zu durchschauen. Dazu sollten wir sie physikalisch mit den herkömmlichen Mitteln beschreiben. Irgendwo in der theoretischen Beschreibung muß ja dann das Prinzip stecken, das für das Auftreten gemeinsamer Ursachen verantwortlich ist. Die interessante Frage dabei ist, ob die bekannten Grundlegungen der Irreversibilität zur Erklärung ausreichen, oder ob noch etwas dazukommen muß. Reichenbach scheint zunächst das erstere zu meinen, die Zeitrichtung werde durch den zweiten Hauptsatz definiert, wonach die wichtigste Größe der Thermodynamik, die Entropie S, höchstens zu- aber niemals abnehmen darf, oder besser durch ein modifiziertes ^ > 0 dt das auch noch Fluktuationen zuläßt - er spricht von der „Verzweigungshypothese", 54 - so daß lokal für nach außen vorübergehend abgeschlossene Systeme auch einmal für die Entropie
51 52 53 54
Ebd., S. 20Iff. C. Darwin, On the Origin of Species, Chicago / London / Toronto / Geneva 1952. Reichenbach, The Direction of Time, S. 158. Ebd., S. 135ff.
Die Analyse der
Kausalrelation
51
sein kann. An anderer Stelle wird aber klar, daß er eigentlich etwas anderes meint. Die Entropie versteht er von vornherein als statistische Größe, nicht als physikalische Größe der phänomenologischen Thermodynamik. Er denkt dabei immer gleich an den Logarithmus der Wahrscheinlichkeit eines physikalischen Zustands: „Das Prinzip der gemeinsamen Ursache wiederholt [...] das entscheidende Prinzip, welches den Kern der Hypothese der Verzweigungsstruktur ausmacht."55
Auch das Prinzip der gemeinsamen Ursache geht für Reichenbach auf den Grundsatz zurück: „In der überwiegenden Mehrzahl aller Fälle entsteht aus dem Unwahrscheinlichen das Wahrscheinlichere und daher muß etwas Unwahrscheinliches stets durch etwas noch Unwahrscheinlicheres erklärt werden."
So wäre damit das allem zugrunde liegende Prinzip gefunden, das die Irreversibilität der Naturprozesse erklärt. Dies ist aber eigentlich keine befriedigende Lösung. Der eben genannte allgemeine Grundsatz krankt nämlich daran, daß der verwendete Wahrscheinlichkeitsbegriff und auch andere hier verwendete Bezeichnungen nicht ganz klar sind. Vielleicht wäre Reichenbach noch zu größerer Präzision gelangt, wenn es ihm vergönnt gewesen wäre, seine Gedanken mit seinen Freunden durchdiskutieren zu können, und er nicht vor Beendigung des Buches gestorben wäre. Dennoch sollte man das Nachdenken über die Irreversibilität der Naturprozesse nicht aufgeben. Vermutlich - darin können wir Reichenbach folgen - sind die Prinzipien, mit denen wir das Prinzip der gemeinsamen Ursache begründen können, dieselben, aus denen wir auch auf den zweiten Hauptsatz schließen. Sehen wir uns an, wie die Irreversibilität begründet wird, so nehmen wir meist an, daß für einen Anfangszeitpunkt in einem Vielteilchensystem, etwa in einem Gas, keine statistischen Korrelationen vorhanden sind. Die Wahrscheinlichkeit, daß ein Gasatom eine bestimmte Geschwindigkeit hat, ist von der für andere Gasatome ganz unabhängig. Nachdem die Atome einander gestoßen haben, sieht die Sache aber ganz anders aus. Dann hängt die Wahrscheinlichkeitsdichte f(v) für eine bestimmte Geschwindigkeit v des einen Atoms durchaus von der Geschwindigkeit des anderen ab, mit dem es zusammengestoßen ist. Das bedeutet eine statistische Korrelation. Wir beschreiben also das Gas mit einem Anfangszustand ohne Korrelationen und einem Endzustand mit Korrelationen und finden das ganz selbstverständlich. Das läßt sich recht gut an L. Boltzmanns berühmter Ableitung des H-Theorems zeigen, welches ja nur eine Formulierung des 2. Hauptsatzes für ein ideales Gas ist.56 Boltzmann denkt sich ein Gas, in dem Stöße zwischen den einzelnen Molekülen stattfinden. Er berechnet, wie sich die Wahrscheinlichkeitsverteilung in den Geschwindigkeiten der Moleküle (und in den Orten, was ich hier übergehe) durch diese Stöße ändert. Dann zeigt er, daß eine bestimmte Größe H = X J f(v.)lnf(v.)dv.
55 Ebd., S. 167. 56 R. Becker, Theorie der Wärme, Berlin 1955, §26.
52
Andreas Kamiah
mit wachsender Zeit nur kleiner werden kann. Diese H-Funktion ist die negative Entropie: H = -S Damit ist dann die Irreversibilität der Vorgänge in einem Gas bewiesen. Doch die Gleichungen der Mechanik, die Boltzmann verwendet, sind reversibel und zeichnen keine Zeitrichtung aus. An welcher Stelle, so wird man daher fragen, geht eine Prämisse in Boltzmanns Argumentation ein, die die Irreversibilität zur Folge hat? Boltzmann nimmt an, daß im Anfangszustand die Geschwindigkeitsverteilung für jedes einzelne Gasatom durch eine Poisson-Verteilung (siehe Abb. 7) dargestellt wird.
Abb. 7
Diese Funktion ist dann auch die Wahrscheinlichkeitsverteilung f(vO für einzelne Teilchen. Die Verteilung für N Teilchen ist dann durch
gegeben. Diesem Ausdruck sieht man sofort an, daß diese Verteilung frei von Korrelationen ist. Die Teilchen sind voneinander ganz unabhängig. Jedoch nachdem einige Teilchen gestoßen haben, treten Korrelationen auf. Man vernachlässigt diese jedoch für die folgenden Stöße und rechnet für den nächsten Zeitabschnitt wieder mit einer Funktion ohne Korrelationen. Erst durch diese Wahl der Randbedingungen für unser Gas erhalten wir dann das berühmte Boltzmannsche H-Theorem, das Irreversibilität ausdrückt. Würden wir fordern, daß in einem bestimmten späteren Zustand keine Korrelationen auftreten, in einem früheren allerdings durchaus, dann sähe die ganze Sache völlig anders aus. Wir würden zu einem zeitlich umgedrehten Verhalten kommen, und statt eines Prinzips der gemeinsamen Ursache erhielten wir ein Prinzip der gemeinsamen Wirkung. Dennoch muß noch eines hinzukommen, damit zwei Wirkungen aus einer gemeinsamen Ursache stammen können, die Möglichkeit der Existenz lokalisierter niederenergetischer Zustände, die sich gegenseitig nicht beeinflussen. Man denke an Fußstapfen im Sand! Ein Mensch läuft über den Sand - das ist die gemeinsame Ursache - und hinterläßt Fußstapfen.57 Die Ursache 57 Reichenbach. The Direction of Time, S. 150.
Die Analyse der
Kausalrelation
53
ist ein Vorgang mit relativ viel Energie. Wenn nun kein Wind kommt, der schließlich auch viel Energie hat, bleiben die Fußstapfen erhalten. Sie beeinflussen sich ja nicht gegenseitig. Die Möglichkeit der Existenz stabiler (oder metastabiler) lokalisierter niederenergetischer Zustände ist keine zeitasymmetrische Tatsache. Dennoch ist sie entscheidend dafür, daß es Spuren von Vorgängen höherer Energie in der Welt gibt. Dazu gehören natürlich auch alle schriftlichen und Tonband-Aufzeichnungen. Erst beide Tatsachen zusammen, die Zulässigkeit eines korrelationsfreien Ansatzes im Anfangszustand unserer statistischen Vorgänge und die Existenz räumlich isolierter stabiler oder metastabiler Vorgänge, führen zu den Phänomenen, die vom Prinzip der gemeinsamen Ursache beschreiben werden. So, glaube ich, ist es nicht ganz aussichtslos, die Richtung der Zeit erforschen zu wollen. Wir können diesen Gedankengang nicht weiterentwickeln. Reichenbach ist am Ende seines Lebens zu den schwierigsten Fragen der Naturphilosophie vorgestoßen. Seine Ausführungen in dem genannten Akademieaufsatz und auch in seinem letzten Buch The Direction of Time sind zum Teil schwer verständlich und zum Teil fehlerhaft. Die Fragestellung jedoch bleibt, die mich immer aufs äußerste fasziniert hat und die auch Reichenbach nicht mehr hat lösen können. Vielleicht gelingt es noch einmal einem klugen Kopf in diesem oder dem nächsten Jahrhundert, genau zu sagen, was abgesehen vom zweiten Hauptsatz die Richtung der Zeit charakterisiert. Am Schluß möchte ich noch die Frage aufwerfen, in welche philosophische Schublade Erörterungen über die Zeitrichtung hineingehören. Hier handelt es sich nicht mehr um Rekonstruktion von Begriffen, sondern um Prinzipienforschung, ein wenig anders, als Aristoteles sich das vorgestellt hat. Es wird untersucht, auf welchen allgemeinen Prinzipien die Physik beruht. Dazu muß die Physik als Wissenschaft rational nachkonstruiert werden. 58 Reichenbach nannte so etwas Naturphilosophie. Er hat sich selbst als „Naturphilosophen" verstanden und dieses Etikett gegenüber O. Neurath verteidigt, der am liebsten nur noch von „wissenschaftlicher Weltauffassung" reden mochte.59 Für Reichenbach aber galt im Unterschied zu Neurath L. Wittgensteins Verdammung der Philosophie nicht. Die spätere Entwicklung der Wissenschaftstheorie gab ihm in gewissem Sinne recht.
58 Reichenbach, Ges. Werke 4, S. 2f. 59 NHR 14-12-04.
Frequency and the myth of probability Bas C. van Fraassen
Hans Reichenbach interpreted probability judgements as straightforward empirical statements concerning actual relative frequency. In addition he constructed a theory of probability, which was in effect a theory of conditional relative frequencies in infinite sequences. It appears therefore that he thought of this theory as applicable to actual probability assessment and reasoning in the way, familiar in science, simplified and idealized models are applied to the study of real physical things and the prediction of their behavior. To take the example Reichenbach himself cherished: judgements about how things move are empirical, but in assessing such judgements we use geometry and kinematics, which are mathematical theories, furnishing mathematical models of locomotion. It seems to me that, accordingly, we may be able to understand Reichenbach's approach to probability by looking for analogies with his earlier treatment of the problem of physical geometry.1
1. The paradigm of physical geometry Up until a certain point, there was no difference between geometry and physical geometry: geometry was the study of physical space - and there was no difference between space and physical space either. Once non-Euclidean geometry was conceived, however, the distinction was forced. On the conceptual or mathematical level, there are many spaces, and correspondingly many geometries; but there is only one physical space, the space we live in, and correspondingly at most one physical geometry. Or so it seemed, anyway, to begin. Reichenbach's realism was of the robust - and not the Scholastic - variety. In the physical world there are only physical things, like lightrays, material bodies, and the events these physical things are involved in. The only sense in which there can be such a thing as physical space, therefore, is the sense of some aspect of the structure of the totality of physical things and events. But "aspect" denotes a selection; the question of what physical space is like, i.e. which mathematical geometry describes it correctly, requires us to first specify just what aspect we are focusing on. This we can do by saying what we choose as physical correlates of 1
In an earlier publication (B. C. van Fraassen, Foundations of Probability: A Modal Frequency Interpretation, in: G. Toraldo di Francia (ed.), Problems in the Foundations of Physics, Amsterdam 1979, pp. 344394) I have discussed technical aspects of Reichenbach's theory; accordingly the present study is intended to be less technical and somewhat more directed to general questions.
56
Bas C. van Fraassen
the geometric objects - for example, the choice of the lightray as the physical correlate of the straight line.2 This does not mean a definition. For aren't there straight lines in the dark as well? Of course there are, so Reichenbach was not misled by the fata morgana of operational definitions. What then is the relation between the concrete and the abstract? The simplest answer would appear to be this: that physical space is Euclidean means that the physical structure can be embedded in a Euclidean space in such a way that the physical correlates are sent into the corresponding geometric objects. This answer is somewhat too simple, as our paradigm example already shows, for even very thin lightrays are thicker than lines in the sense of geometry. A somewhat more precise answer can go like this: a physical theory implies - relative to the given assignment of physical correlates - that space is Euclidean exactly if its models are each constructed from or upon a Euclidean space, with locations and trajectories assigned to the events and objects so as to satisfy the physical correlate relation. 3 The question of what the physical geometry is, is therefore first of all elliptical unless we specify our choice of physical correlates for the relevant abstract objects. But even then, the answer is not unique. There is in fact the usual problem of underdetermination. Suppose we have two theories which, relative to the same specification of physical correlates, imply respectively that space is Euclidean and that it is not Euclidean. If the assignment of physical correlates is not very extensive, if the requirements for satisfying the specified physical correlate relation are not very strict, and if the conditions functioning as physical correlates are not very prevalent in the actual world, then the two theories might easily do equally well. Unfortunately, our antecedent is all too likely to be true, to a significant extent. The problem is one of principle; Reichenbach broached it under several headings. One of these was the hypothesis of 'universal forces'; another was causality. In both cases, the idea was that we can introduce a methodological rule which will cut down on the underdetermination: we can specify something like normality for models, and ask what structure is implied for space by acceptable theories which have only normal models. Given that my main focus is going to be probability, I think the idea of a normal system being one without causal anomalies is the more interesting here. I can illustrate this quickly as follows: suppose I build an unbroken circular wall around myself, and that ten minutes later I am outside that wall. What has happened? It is not theoretically impossible to embed the whole process in a two-dimensional model. In that model, however, a causal anomaly occurs: I move in a way which is not a rigid motion, nor a continuous path. To put it differently, there was a sort of miracle, at least from the point of view of anyone who believes that all action is action by contact. In a three dimensional model, no such miracle is needed: I stepped or climbed over the wall. This way of ruling out 2
3
Since I think of Reichenbach's use of the notion of physical correlate as much more sophisticated than other early twentieth century empiricist attempts to link mathematics, physics, and the observable phenomena, I shall discuss this here in a relatively uncritical vein. However, I do not ultimately endorse it (or even endorse as well-posed the exact problem for which these attempts were meant to be solutions). Let me illustrate this with an example for space-time rather than space: an emission and absorption of a photon might be events which in a given model each occupy a finite space-time region. If lightray paths are specified as the physical correlate for zero space-time separation, the given physical correlate relation might then be satisfied provided in each such case, the two regions include respectively certain points x and y with the space-time interval between x and y equal to zero.
Frequency and the myth of probability
57
models on the basis of causal anomalies seems clearly indebted to Helmholtz' singling out of rigid motions among the isometric transformations, and Brouwer's treatment of dimensionality; both of these had contributed substantially to the foundations of geometry within living memory when Reichenbach was writing. It is, I think, a very neat idea. If the specification of physical correlates is made totally definite, and only models without such causal anomalies are allowed, then is physical geometry unique? Or is there still underdetermination? I think there is, but it is only the usual underdetermination of theory by phenomena - the conceptual questions about space and its structure have been satisfyingly illuminated. This is a wonderful chapter in the history of the philosophy of science, to which Reichenbach made signal contributions, and I think he was entirely right to treat it as a paradigm example of philosophical analysis.
2. An analogy for physical probability? Reichenbach witnessed two great revolutions in physics, the advent of relativity and that of quantum mechanics. The conceptual status of physical geometry was crucial to the first, and that of physical probability is crucial to the second. Reichenbach approached the second with the lessons of the first fresh in hand. Later there was going to be a good deal of Scholastic reification of such things as objective chance, propensities, and the like. For Reichenbach there was only on the one side the structure formed by the occurrences of material events, and on the other, the statistical models of physical theory. What does it mean to say that Boltzmann's statistical mechanics is correct? That question is elliptical unless we specify physical correlates for the relevant abstract objects. As lightray is the standard physical correlate for straight line, so relative frequency of occurrence is for probability. The quest for physical geometry should indeed be begun as Gauss did, by proposing the measurement of angles in a triangle made by lightrays - in just the same way, the correctness of a statistical model is to be checked in the first instance by comparing its probabilities with found relative frequencies. Again it cannot be a matter of definition. That the coin has a certain probability of coming up heads when tossed, may be true also for coins which are never tossed, just like there can be straight lines in the dark. This analogy should be taken seriously in several ways. Straight lines are not among the concrete physical objects of this world - neither is probability. The specification of physical correlates tells us what aspect of real physical structure we are focusing on when we ask the question: what is the right model or theory? This implies quite clearly that it is not unequivocally correct to say that Reichenbach interpreted probability judgements as empirical judgements of relative frequency. It is correct in the same sense, which needs to be properly understood, as that in which he regarded the statement that space is Euclidean as an empirical statement. On the view of what Reichenbach was doing, which I have now outlined, the theory of probability is related to empirical relative frequencies like physical geometry to material events and processes. It was therefore entirely appropriate for Reichenbach to write the theory of probability as a theory of relative frequencies in infinite sequences, though those never or hardly ever occur in nature - it is exactly like the familiar phenomenon of a theory of space written as a theory of extensionless points, infinitely thin lines and planes, etcetera. To say that it was appropriate, of
58
Bas C. van Fraassen
course, is not to say that it was the only or the best thing for him to do at this point; to this we'll come back later. The analogy can be continued as follows: once we ask only for models built on, say, Boltzmann's statistics, some of those may include very strange structures while fitting the actual frequencies very well. To allow the question of what is the correct model - what is the physical world really like - to approach a bit closer to uniqueness, Reichenbach introduced here too the idea of normality, as the exclusion of causal anomalies. Let me again make up a simple illustration. Suppose I am inside that circular wall and you are outside it, and we are taking the same examination. To each question we write down more or less the same answer - there is in other words a strong correlation between our answers. If we make up a model of this, the 'answer events' may be individually determined in the model, in the sense of having a high or even 100% probability given preceding events. Reichenbach does not require that for normality: indeterminism must be allowed for. But the correlation also may or may not be determined in the model, given preceding factors. That is, there may be a factor E such that you and I both have E, and this having E determines that there will be a correlation in our answers. This factor could just be our study of the same textbook. Whatever this factor is, it is the common cause which explains the correlation of our answers: PROB(I give answer X)
is much lower than
PROB(I give answer X, given that you give answer X), but E screens off these two factors from one another: PROB(I give answer X given that I have E) is just the same as PROB(I give answer X, given that I have E and you give answer X) If a system is normal, according to Reichenbach, each correlation must be thus traceable back to a common cause. Violation of this 'Principle of the Common Cause' means mysterious, indeed miraculous correlations - true causal anomalies even in an indeterministic world. I have presented this as a way of sharpening the sense of the question: what is the physical world really like (what is its statistical structure)? It is clear at least that Reichenbach thought of this Common Cause Principle as a methodological rule, freely chosen by scientists for the construction of theory: the rule to make up models which are free from causal anomalies in this sense too. It is perhaps arguable that Reichenbach had still more in mind here; that he was telling us that in reality, in the real world, correlations always must have common causes in this sense (which would have put him quite squarely in the scientific realist camp, since common causes often are not to be found among the observable phenomena). I don't read him that way; in any case, it seems to me that we now know that in quantum mechanics history has been at odds even with the methodological rule.4
4
See further B. C. van Fraassen, Quantum Mechanics. An Empiristic View, Oxford 1991, Chapters 4 and 10. For background on the Common Cause Principle see van Fraassen, Rational Belief and the Common Cause Principle, in: R. McLaughlin (ed.), What? Where? When? Why? Essays in Honour of Wesley Salmon, Dordrecht 1982, pp. 193-209.
Frequency and the myth of probability
59
However that may be, I shall hereafter focus on the centerpiece of Reichenbach's reconstruction of statistical theories in physics: the intimate relationship he asserted between frequency and probability.
3. Nuances in the idea of physical correlate What I have offered here is a way to understand Reichenbach's approach to probability. We must also keep in mind that he began his work well before Kolmogorov had standardized the subject as an application of measure theory, and that in any case, the adequacy of that standardization has remained a topic of contention among philosophers. The analogy with the philosophy of geometry should also serve, I think, as a reason to dispose us sympathetically to Reichenbach's work in this area. For the problems are to some extent undoubtedly parallel, so it is worthwhile to explore parallel solutions. The notion of physical correlate, however, is not entirely clear in itself, and secondly, the analogy may not be perfect. If we already know how to test whether or not something travels in a straight line, then it is an empirical postulate if we assert that light in vacuo travels along such a line. But before we have 'anchored' the abstract geometric notions to something empirical, the question of testing this does not make sense. If we do so anchor it by listing lightray paths in vacuo as the physical correlate of straight lines, then we make the assertion true by convention - this is how we can partially determine the meaning of empirical assertions in which those words occur. This is a general pattern. Before we can test whether a physical object or process has geometric character G, we need at least some part of the truth conditions of "X has character G". Whatever we stipulate to get us off the ground is then itself analytic. This may be a contextual matter: the stipulation may well be something which in another context would have a different status - e.g. the status of something testable in that context. This could be so because some other part of the truth conditions of statements of this sort has been stipulated or agreed on there. This fact does not alter the main point, for the main point is not that the distinction is absolute, unalterable, or an a priori part of human knowledge in general. The point is simply that it makes no sense to ask for a test of "X has character G" unless some part of the truth conditions of such statements has [in the context in which this request is made] a status that puts it beyond testing - the same request does not arise for it there. In the present imagined scenario, the request can be made to test whether a given set of lightrays forms a Euclidean triangle, but only because some assertions (like "light rays follow straight lines") are not subject to the same request. The correlation of light rays to straight lines is of course not really enough; we need also some notion that metric geometry has and affine geometry lacks. For example, we can choose a standard type of clock, and a convention about simultaneity, after which we can measure distance in terms of light-seconds and light-years. After all that, we can test the assertion that space is Euclidean in the way Gauss proposed, with a triangle of lightrays. Suppose our physical theory entails that those rays are subject to distorting influences, affecting their paths - how shall we understand that? This supposition must be correctly understood. The theory is written in geometric language. Each
60
Bas C. van Fraassen
model is, say, a Euclidean space with various extra-geometric attributes, relations, and quantities defined on it. One of these models is our triangle as it would be in vacuo; another is our triangle as it would be with certain forces acting on it. The conventions determine not how we work with the theory when we are theorizing. Instead, they let us describe the data in such a way that it makes sense to ask whether the data fit the theory. They allow us to say: the sum of the internal angles in our physical trilateral structure equalled such and such. The next step is then to see whether this structure, so described, fits into one of the models supplied by the theory. This does presuppose that we have a way of describing those data structures which does not already avail itself of geometric language. The Ur-description, so to speak, is entirely in terms of clock-reading, light-emission, light-absorption, etcetera: events and their physical relations. It may be a bit of a letdown that those may have to include some suspiciously geometric sounding relations. Coincidence of a clock-reading and a light-emission, for example, may here be counted as a primitive physical relation between the two events in question. But again, we do not require the distinction geometric / physical language to be one which is absolute, unalterable, a priori or even entirely context-independent. We require only that there be a distinction. Looked at this way, we have two differently described sorts of structures - one physical, one mathematical - and the conventions specify what we have in mind with the word "mapping" or "embedding" when we ask: "Can the physical structure in question be mapped / embedded in one of those mathematical structures?" 5 Let us now look at frequency and probability again. At this point our subject seems almost made to order for the physical correlate approach. For the terminology we already have about frequencies parallels probability talk very closely. Let me introduce here the notation "relf(A/s)" to stand for the relative frequency of class A in sequence s. Later I shall refer to the precise definition for infinite sequences, but here let's talk for a little while about the special case in which s is a finite sequence whose members make up the set D s . Physical structures being modelled, even mass phenomena, will after all typically, and perhaps even always, be finite. Then the relative frequency is just the proportion of members of A in s, i.e. the ratio of two cardinalities: relf( A/s) = #(A/D S ) = #(A n DS)/#DS We can use it to define various notions that are the frequency parallels of statistical notions such as correlation in a straightforward way. The logic of the two notions is so similar, that theorems tend to just carry over from probability theory, at least in this special case: Let K be fixed, and define #A = #(A/K). Then: #K= 1 #i, O2. . > and the probable hypotheses describe objects that are partially analogous to x (i.e., share with x some of the properties 2 , 0 3 , 3>4). Hence, a probable hypothesis is compatible with the truth w. This interpretation of Kaila's framework leads to a theory of inductive analogy - comparable to the Basic System that Carnap developed in detail in the early 1960s.29 But also another interpretation would be possible as well. Let w be the true state of affairs, known or unknown to us. Allow that a hypothesis h may have a partial positive analogy with w, but also some negative analogy. Then h is false, but its similarity to the truth w, i.e., its 'verisimilitude' Tr(h, w), is proportional to the Ähnlichkeit between h and w. This idea leads directly to the similarity account of truthlikeness.30 Here the maximum degree of truthlikeness (1, by suitable normalization) is obtained by the complete truth w: (5)
Tr(h, w) = 1 if and only if H h = w .
This concept satisfies the Popperian demand that uninformative true sentences (e.g., tautologies) are not highly truthlike. As a variant of this condition, which requires that a truthlike hypothesis has to be informative about truth, a hypothesis h may be said to be almost true or approximately true if h is entailed by a state of affairs which is close to the truth w.31 In other words, if A(v,w) measures the distance between states of affairs v and w, the degree of truth, or 'degree of approximate truth', of h is defined by (6)
AT(h,w) = l-minA(v, w) vi-h
Hence, truth (= 1) is the limiting case of degree of truth: (7)
AT(h, w) = 1 if and only if h is true.
When a distance measure A(v,w) between states of affairs and an epistemic probability measure P(v/e) for states of affairs are available, it is easy to define the concepts of probable approximate truth and probable truthlikeness.12 If Tr(h , w) is treated as an unknown quantity, then it can also be estimated by its expected value 29 See I. Niiniluoto, Analogy and Similarity in Scientific Reasoning, in: D. Helman (ed.), Analogical Reasoning, Dordrecht 1988, pp. 271-298. 30 See Niiniluoto, Truthlikeness. 31 See ibid., pp. 176, 279. 32 See ibid., pp. 278-280; and I. Niiniluoto, Corroboration, Verisimilitude, and the Success of Science, in: K. Gavroglu et al. (eds.), Imre Lakatos and Theories of Scientific Change, Dordrecht 1989, pp. 229-243.
75
Truth, probability, and simplicity (8)
ver(h/e) = £ P ( v / e ) T r ( h , v ) V
.33
While epistemic probability is a tool for a 'weak fallibilist' (the truth of scientific knowledge is always more or less uncertain), truthlikeness and approximate truth are appropriate concepts for a 'strong fallibilist' (scientific knowledge is never strictly correct, but may be close or approach to the truth).34 These observations give an interesting point of comparison with Reichenbach, who often used phrases characteristic of strong fallibilism. In Experience and Prediction he said that knowledge is "an approximate system which is never 'true'". 35 In Metaphysik und Naturwissenschaft (1925) he used comparative notions like "better or truer description of reality".36 In Ziele und Wege der physikalischen Erkenntnis (1929) he asserted that the acquisition of knowledge employs a "method of approximation" where truth (or "absolute truth") is "merely the limiting case that correctness approaches, though without ever reaching it".37 The same idea is repeated in Der physikalische Wahrheitsbegriff (1931).38 It would be tempting to expect here that Reichenbach is looking for some notion of verisimilitude or approximate truth which satisfies principle (5). But, instead, he concludes that we have to "replace the concept of truth with the concept of probability", so that "absolute truth is only the limiting case in which the probability equals l". 39 In this sense, truth is only "a special case of the concept of probability".40 Reichenbach came to this conclusion through a criticism of the correspondence theory which he took to demand a "univocal coordination from concept to object". But his claim that we will never be able "to determine the concept earth so precisely that it will correspond completely to the object earth"41 is not convincing: truth should be assigned to sentences rather than to concepts, and true statements about a state of affairs are possible without knowing exactly the whole object.42 Further he argued that this account would join "the concept of truth to determinism".43 This claim presupposes the doctrine that "the propositions of physics are predictions" - and univocal prediction is possible only in a deterministic world.44 Reichenbach's criticism of the correspondence theory of truth is thus connected, in a confusing way, with his view that scientific laws are always probability implications of the form 33 34 35 36 37 38 39 40 41 42
See Niiniluoto, Truthlikeness, p. 279. See Niiniluoto, Is Science Progressive?, p. 43. See Reichenbach, Experience and Prediction, p. vi. See Reichenbach, Sei. Writings 1, p. 288. See Reichenbach, Sei. Writings 2, p. 156. See Reichenbach, Sei. Writings 1, art. 36. See Reichenbach, Sei. Writings 2, p. 155. See Reichenbach, Sei. Writings 1, p. 355. See Reichenbach, Sei. Writings 2, p. 154. E.g., 'The earth is a planet' is true, despite our incomplete knowledge about the secrets of the earth. The British Hegelian F. H. Bradley based his doctrine that all sentences are partly false upon a confusion between partial and whole truth. See Niiniluoto, Truthlikeness, pp. 172-174.
43 See Reichenbach, Sei. Writings 1, p. 314. 44 See ibid., p. 319: "Declaring a law to be true is intended to assert only one point: that the law permits inferences concerning future perceptions."
Ilkka Niiniluoto
76 (9)
(A3pB)
(10)
(x)(xeA3pxeB)
or
In a deterministic world, the laws are ultimately reducible to probability implications (10) with p = 1. But if probability is an objective feature of the physical world, as Reichenbach himself urged, then a law of the form (10) should be true when p is the correct value of such probability. However, in Das Kausalproblem in der Physik (1931), he says: "We cannot requite that probability propositions be true or false, but we can require that they be more or less probable."45
This seems to involve a confusion between the probability 'p' in a sentence (A 3p B) or P(B/A) = p and the truth value of this sentence. In Wahrscheinlichkeitslehre (§70) Reichenbach made the situation clearer by giving an example of the attribution of a "Wahrheitsgrad" to an "Einzelaussage" - a case of "individual verifiability" in the 1949 edition. A marksman says, "I shall hit the center". If the distance of his shot from the center is r, then the 'degree of truth' of his statement is 1/(1+r).46 This concept of a continuous truth value satisfies the principle (7) for approximate truth. But it is also clear that in this example the degrees of truth of individual statements, with strict truth as a limiting case (r=0), are not probabilities on any interpretation.47 Reichenbach knew this: an individual singular statement does not have a probability in his framework, but a weight can be associated to such a 'single case', if its relative frequency is known in a suitable reference class.48 Reichenbach's probability logic concerns cases of 'nonindividual verifiability', i.e., laws and theories expressed as probability implications of the form (10). Moreover, it has to distinguish the frequency in which sentences belonging to the theory are correct (i.e., P(B,A) = p) and the higher-order probability that the first-order probability of the theory has a certain value.49 Thus, probability logic is interested in expressions of the form (11)
P[q-8 < P(h) < q+5] = w
where h is a theory (e.g., quantum mechanics). The construal of probability as a truth-frequency implies the principle 'truth equals probability 1' in a peculiar way. First, the first-level probability P(B/A) = 1 iff 45 See ibid., p. 339. 46 Kaila's personal copy of Wahrscheinlichkeitslehre contains here a big question mark. 47 M. Bunge, Treatise on Basic Philosophy, vol. 2, Semantics II: Interpretation and Truth, Dordrecht 1974, has attempted, without much success, to define degrees of partial truth which behave like probabilities. Cf. Niiniluoto, Truthlikeness, p. 181. 48 See Reichenbach, Experience and Prediction. 49 See Reichenbach's reply (Reichenbach, Set. Writings 2, art. 57) to Popper's criticism (cf. Popper, The Logic of Scientific Discovery, Section 80 and Appendix *i).
Truth, probability, and simplicity
77
(x) ( x e A j j X e B ) iff all (or almost all) predictions xe B from the condition xe A are true. Secondly, following the suggestion of Salmon,50 the second-order probability P[h is true], or the weight of the theory h, is defined as the relative frequency of true theories among the theories similar to h. Hence, the frequentist weight of h is 1 iff all hypotheses like h, and thereby h in particular, are true. The frequentist probability logic is certainly an ingenious and important construction. But as an analysis of the probability of scientific hypotheses it is - to quote Savage's criticism of R. A. Fisher - "an attempt to make a Bayesian omelette without Bayesian eggs". First, the idea of truth-frequencies can be fruitfully applied to modes of probabilistic inference (explanation and prediction), as Charles Peirce showed in detail already in 1883.51 Reichenbach's concept of weight says something about the long-run "predictional value" of a statement.52 But this 'predictionist' view is problematic in the genuine single case which concerns one unique event. Further, if scientific laws are not directives, but genuine statements, as Reichenbach argued against Schlick, then we should be interested in appraising the law itself as an assertion about the world, not merely as a predictive device. Secondly, the epistemic interpretation immediately allows the assignment of genuine probabilities to singular and general statements. Bayes' Theorem shows how prior degrees of belief are transformed to posterior degrees of belief. It is not a crime against empiricism to assume that our prior beliefs may be influenced by many different factors - including subjective bias, the language used, the relevant analogies, background theories, etc. But it is essential to require that empirical evidence is at least asymptotically effective in determining the posterior probabilities.53 Thirdly, the frequentist definition of the antecedent probability (weight) of a theory seems to be artificial, unapplicable in practice, and circular in principle.54 What really is the class of theories similar to a given theory h? How could we know which theories in this class are true? Why should this value indicate a rational probability for theory h? And is this definition compatible with Reichenbach's own assertion that "a theory of truth can be given only through a theory of probability"?55 Fourthly, to do justice to the fallibilist idea that truth is a limit we try to approach, it is possible to define, for all kinds of individual statements (including singular and general sentences, de50 See Salmon, The Foundations of Scientific Inference-, and Salmon, The Philosophy of Hans Reichenbach. For the proposal that the frequentist view is a special case of the Bayesian approach, where prior probabilities are estimated by "the frequenties with which certian kinds of hypotheses succeed", see W. Salmon, Rationality and Objectivity in Science or Tom Kuhn meets Tom Bayes, in: C. W. Savage (ed.), Scientific Theories, Minneapolis 1990, pp. 175-204. 51 See C.S. Peirce, A Theory of Probable Inference [1883], reprinted in: Peirce, Collected Papers 2, ed. by C. Hartshorne and P. Weiss, Cambridge Mass. 1932, paragraphs 694-754. 52 Cf. Reichenbach, Experience and Prediction, p. 314. 53 Cf. Niiniluoto, Analogy and Similarity in Scientific Reasoning. 54 Cf. Popper, The Logic of Scientific Discovery, E. Nagel, Principles of the Theory of Probability, International Encyclopedia of Unified Science, Chicago 1939; von Wright, The Logical Problem of Induction', F. J. Clendinnen, Inference, Practice, and Theory, in: Synthese, 34 (1977) p. 89-132; and B. Rogers, The Probabilities of Theories as Frequencies, in: Synthese, 34 (1977) pp. 167-184. 55 See Reichenbach, Sel. Writings 1, p. 348.
78
Ilkka Niiniluoto
terministic and probabilistic laws), concepts of truthlikeness and approximate truth satisfying (5) and (7) - and the related concepts of probable approximate truth and expected truthlikeness.
3. The justification of induction Reichenbach's system of probabilistic induction has two basic elements. First, in the case of "primitive knowledge", "anticipative posits" are made by a Rule of Induction: (12)
If the relative frequency of an attribute is f n in an initial section of n elements of a sequence x, we posit that the relative frequency f; (i > n) will approach a limit within f n ± 5 when the sequence is continued.56
For 8 = 0, (12) reduces to the so called Straight Rule, which uses the observed relative frequency f n as an anticipation of the limiting frequency. Secondly, in the case of 'advanced knowledge', the results of earlier inductions are used for further posits, relying on Bayes' Theorem. Hence, all forms of inductive inferences are reduced to enumerative induction. I have already expressed doubts about the frequentist definition of the antecedent probability of a scientific hypothesis. But, from a Bayesian viewpoint, this is perhaps not a very serious problem. If you want to be an 'objective' rather than a 'subjective' Bayesian, it does not matter too much how you fix your priors - as long as they are not dogmatic and probabilities are revised by the same likelihood function." So the more fundamental issue concerns the rule (12) for statistical generalization. Reichenbach's famous "pragmatic justification" - or "vindication" in Feigl's terms - claims that his rule is "justified as an instrument of positing", because "we know that if it is possible to make statements about the future we shall find them by means of this method".58 Reichenbach's justification has been criticized in many ways.59 It has been argued that he only succeeds to show a triviality: a limit exists, if a limit exists. But this is not quite fair. As Reichenbach intentionally refuses to appeal to any synthetic statements, and therefore relies only upon tautologies, his justification amounts to a weak claim: if a limit exists, there is a sequence f n converging to it. But this is sufficient to show the superiority of enumerative induction to predictive devices (such as crystal balls) without such a guarantee of convergence. However, the task of showing that the Straight Rule (f n ) is the best among all converging sequences (f n + c n , where cn—>0 when n-> is known to be highly problematic. 56 See Reichenbach, The Theory of Probability, p. 446. 57 Cf. de Finetti's convergence results in B. de Finetti, Foresight: Its Logical Laws, Its Subjective Sources [1937], in: Kyburg, Smokier (eds.), Studies in Subjective Probability, pp. 93-158. 58 See Reichenbach, The Theory of Probability, p. 475. Cf. Reichenbach, Experience and Prediction, § 39; and Salmon, Hans Reichenbach's Vindication of Induction. 59 See J. Lenz, Reichenbach's Defense of Induction, in: M. Foster, M. Martin (eds.), Probability, Confirmation, and Simplicity, New York 1966, pp. 4 3 5 ^ 4 0 ; and L. Laudan, Peirce and the Trivialization of the Self-Corrective Thesis, in: R. N. Giere, R. S. Westfall (eds.), Foundations of Scientific Method: The Nineteenth Century, Bloomington 1973, pp. 275-306. For short-run and single-case problems, see Reichenbach, The Theory of Probability, § 72, and Salmon, The Philosophy of Hans Reichenbach.
Truth, probability, and simplicity
79
One important argument against the general validity of Reichenbach's rule arises from the axiomatic treatment of inductive probability measures. Formally the Straight Rule is a special case of Carnap's ^-continuum (X=0), and all probabilities in this continuum give the prior probability zero to universal generalizations on unlimited domains. Here Reichenbach agrees with both Carnap and Popper.60 However, it should be not acceptable to a strict empiricist to assign prior probabilities (or weights) 0 and 1 to synthetic statements. Jaakko Hintikka showed in 1964 how a system of inductive logic can assign non-zero probabilities to universal generalizations.61 Reichenbach also criticizes Peirce's defense of the self-corrective nature induction by Bernoulli's theorem, since "the justification of induction must be given before the use of probability considerations".62 But here Reichenbach appears to overlook the fact that his own justification has a conditional form: If . . . t h e n . . . . While he chooses a very weak assumption in the antecedent (i.e., a limit exists), and obtains a weak conclusion (i.e., f„ converges to the limit), we can equally well try to find conditional justification with stronger premises and conclusions. Simple examples - to be viewed as extensions of Reichenbach's vindication - can be obtained from theorems of probability theory.63 Let U be an urn containing white (W) and blue (B) balls, in a unknown proportion r of white ones ( 0 < r < 1). Suppose we are able to draw a sample of balls from U with replacement. If the sampling is biased, the relative frequency w„/n for white balls may fail to converge at all or approach a limit Zr. But if the sampling is random, so that the physical probability of picking a white ball is r on each trial, then Borel's theorem - a special case of the Strong Law of Large Numbers, proved in 1909 as a strengthening of Bernoulli's theorem says that the relative frequencies converge 'almost surely' (i.e., with probability 1) to the limit r:
60 See Reichenbach, The Theory of Probability, p. 438. He proposes that all-statements (x) (f(x) 3] g(x)) should admit some inexactness in the value '1'. 61 See Hintikka, A Two-Dimensional Continuum of Inductive Methods', and Niiniluoto, On a K-Dimensional System of Inductive Logic. 62 See Reichenbach, The Theory of Probability, p. 446. For Reichenbach's relations to Peirce, see Reichenbach, Dewey's Theory of Science, in: P. A. Schilpp (ed.), The Philosophy of John Dewey, La Salle 111. 1939, pp. 159-192. Levi argues that Peirce was a forerunner of Neyman and Pearson, not of Reichenbach; I. Levi, Induction as Self-Corrective According to Peirce, in: D. H. Mellor (ed.), Science, Belief and Behaviour, Cambridge 1980, pp. 127-140 . 63 Salmon, Hans Reichenbach's Vindication of Induction, has recently acknowledged the possibility that the rule of induction can be applied in the context of discovery by making a hypothetical probabilistic assumption that can then be subjected to tests in the context of justification. Another way of extending Reichenbach's approach is suggested by K. Kelly, Reichenbach, Induction, and Discovery, in: Erkenntnis, 35 (1991) pp. 123-150. His account of "learning theory" - "the formal study of the reliable solvability of inductive problems" - aims at theorems concerning "decidability in the limit". Such convergence results are not probabilistic like (13) below.
80
Ilkka (13)
p | ^ L _ _ ^
r
/
r
Niiniluoto
] =l
Hence, if the factual assumption about the randomness holds, then the relative frequencies satisfy the convergence condition (13). Convergence is here not necessary, but occurs among all possible infinite sequences in a set of measure one. The frequency theory of probability can be criticized for the fact that it, as it were, forgets this higher-order probability in (13).64 A critical realist may formulate the theorem (13) in a way different from Reichenbachian posits: the statements 'r=w n /n' constitute a sequence of hypotheses which converges to the truth with probability 1. Alternatively, using Bernoulli's theorem (14)
^ - r n
1
we may infer that, for sufficiently large n, the probability that statement 'r = w n /n' is approximately true is high - and tends to 1 with increasing n. These results, if interpreted as guarantees of asymptotical approach to truth about the urn U, are valid only on the factual assumption that the sampling from urn U is random. This suggests that the best justification of induction is always 'local' or 'contextual', relative to synthetic background assumptions.65 Another illustration of this feature of scientific inference is the measurement of some unknown quantity r. Assuming that we are able to make measurements x 1 ; x 2 ,... which are normally distributed N(r,a 2 ) around the true value r, the mean x n of n measurements is normally distributed N ( r , a 2 / n ) . Again, the sequence of hypotheses 'r= x n \ n = 1,2,..., converges to the truth with probability 1. Further, at least for a large class of flat prior probabilities of r, the posterior distribution of r is approximately normal N ( x „ , a 2 / n ) , and the probable approximate truth of ' r = x„' converges to 1, i.e., for each 8 > 0 , (15)
P(|r-xn| 0 . In other cases, the class F may be determined by reasons of simplicity and economy - e.g., for practical reasons, F may be restricted to linear functions f ( x ) = c x + b . This choice of F may involve a deliberate idealization, i.e., a counterfactual assumption, and there need not be grounds any more for believing that the true curve is included in class F. Given a choice of F in a problem situation, we are interested in finding its element with maximal validity with respect to our evidence E. In other words, (23)
Select the element f of F which minimizes the distance Ap(f ,E).
In the special case p = 2 , rule (23) yields the traditional method of Least Square Difference:. (24)
For p = oo, we have
Because of the choice of F, this maximally valid function f need not be true. But, to the extent that the observations in E are correct, the chosen f can be claimed to be the least false or the most truthlike - element of F. The first philosopher who studied the problem of simplicity along these lines was Carnap's student John Kemeny in 1953.78 Given a distance A(h,e n ) between a hypothesis and evidence e n , Kemeny first formulates a rule for selecting on e n that h which minimizes A(h, e n ). In enumerative induction, this leads to Reichenbach's Straight Rule. But Kemeny wants to modify this rule so that it allows observational errors and yet will select the true hypothesis with a high probability. For this purpose, he defines a hypothesis h to be compatible with e n if, given the truth of h, the probability of an observed deviation larger than A(h, e n ) = d n is at least 0.01.79 In other words, h is compatible with e n if
77 See W. Patryas, The Sense of Empirical Testing, in: Poznan Studies in the Philosophy of the Sciences and Humanities, 3 (1977) pp. 180-198; and W. Krajewski, Correspondence Principle and the Growth of Knowledge, Dordrecht 1977. 78 See Kemeny, The Use of Simplicity in Induction. 79 This means that h belongs to an 99% confidence interval determined by e n .
Truth, probability, (26)
and simplicity
P(A(h, e n ) < d n /h) < 0.99
85 .
Then he assumes that, for sufficiently large values of n, the interval of compatibility defined by (26) will be so small that, if the true h lies in it, no simpler hypothesis lies in it. It follows that the rule (27)
Select the simplest hypothesis compatible with the observed values
will give 99 per cent certainty of selecting the true hypothesis. Kemeny's treatment admits the deviation between theory and observation in an interesting way, but in the end it relies too heavily on a peculiar special assumption directly tailored to be save the Principle of Inductive Simplicity (i.e., the simplest hypothesis compatible with observations is almost certainly true). Therefore, I think that a more promising way of associating probability and simplicity would be the following: assume a distribution for observational error conditional on the hypothesis f in F, where probability density decreases with the distance of observation from f; choose a prior probability density on the class F (i.e., on the free parameters in the characterization of the elements of F); then use Bayes' Theorem to obtain a posterior distribution on F; and finally calculate the degree of probable approximate truth for the curve selected by (27). If this degree is small, there are good reasons for extending F to cover a wider class of curves. So far we have made the simplifying assumption that there is a functional law connecting quantities y and x, i.e., y depends lawfully only upon the values of x. This need not be true, since y may depend on other factors as well. To handle this type of cases, the Poznan School (Leszek Nowak, Wladyslaw Krajewski) has developed in the 1970s the method of idealization and concretization.80 Suppose that we express the dependence of quantity y on quantities Xi,..., x k by the hypothetical equation F k (y, Xj,..., x k )=0. Concretization means then that new factors x k + 1 ,..., x k + m are introduced, and a new law is expressed by a new equation F k + m (y, x!,..., x k , x k + 1 ; . . . , x k + m ). The Principle of Correspondence - formulated by Niels Bohr in 1922 - requires that the old F k should be obtained as a limiting case of F k + m , when the new factors x k+1 ,..., x k + m are counterfactually assumed to be 0. In other words, (28)
F k + m ( y , x 1 , . . . , x k , x k + 1 , . . . , x k + m ) - » F k ( y , x 1 , . . . , x k ) when x k+1 - » 0 , . . . ,
The standard illustration is the step from the ideal gas law (29)
F3(p,v,T) = ^ - T = 0 R
to van der Waals' law
80 See L. Nowak, The Structure of Idealization, Dordrecht 1980; Krajewski, Correspondence Principle and the Growth of Knowledge ', and Niiniluoto, Theories, Approximations, Idealizations.
86
Ilkka
(30)
Niiniluoto
F5(P)v,T,a,b) = i P + ^ - ] ^ - ^ - T = 0 V
Condition (28) is satisfied, since F 5 (p,V,T,0,0) = F 3 (p,V,T). It is a remarkable proof of Reichenbach's genius that he discussed the process of concretization in a paper, Die Kausalbehauptung und die Möglichkeit ihrer empirischen Nachprüfung, written already in 1923 and published in 1932.81 He characterizes it as "the procedure that the physicist uses in order to establish an individual law". If the observed points
in class M deviate too much from the surface defined by F k (y, Xj,..., x k ) = 0, additional parameters x k+1 ,...,x k + m are introduced and a new equation
is formed Fk'+m is called the function governing the class M if it satisfies three further conditions: (a)
The surface should lie in the space of parameters y , X [ , . . . , x k + m in such a way that the observed points p* lie sufficiently close to the surface. This approximation permits great deviation in individual points (i.e., closeness may be measured by A 1 ).
(b) The function F ' tion (a). (c)
should be the simplest among all functions satisfying condi-
The function F^ +m should be justified in the sense that the additional parameters x k+i >-">xk+m c a n be inferred from experimental data.
Reichenbach does not mention the correspondence condition (25),82 but he presents van der Waals' law (30) and Einstein's orbital equation as examples of governing functions. The simplicity condition (b) is Reichenbach's solution to the problem that the new function is not uniquely determined, even when (a) or (28) are required. The law is tested by new observed points p*. If M' is the extended set of observations (M c M') , we may ask whether F^ +m is still the governing function for M ' or a new function F^' +m+n is required. In this way, two types of 'governing sequences' may be obtained:
81 See Reichenbach, Sel. Writings 2, art. 56. 82 Reichenbach refers to Ernst Cassirer in his discussion of theory changes in 1929 (Reichenbach, Sel. Writings 2, p. 168). Kaila discussed the correspondence principle in 1926.
87
Truth, probability, and simplicity Type I:
F'k+m F'k+m
;k ' p k+m' ' Type II: F.,F.
pk+m+n "
k+m+n+--+w
In science it cannot be known with certainty which type is realized. Type I corresponds to the case, where 'causality exists'. If a continuous causal law exists, it can be obtained by always choosing the simplest governing function to cover the observations. This early argument for inductive simplicity seems to me much more interesting than the one Reichenbach gave 15 years later in Experience and Prediction. It is a pity that he or anyone else 83 - did not try to elaborate it further. Here only one remark has to suffice. It seems to me that a governing sequence for observations M c M ' c M" c - • • may happen to be of Type I for the reason that the introduction of new relevant factors has an existing but so small influence that it remains below our capacities of observational discrimination. In such a case the sequence does not terminate with a true causal law with a finite number of arguments: the quantity y may depend on an unlimited number of other quantities X[, x 2> ... .84 But in this case one can still argue, in a similar way as above, that the terminating function of this Type I sequence has a relatively high degree of probable approximate truth.
83 Reichenbach's governing functions have been discussed briefly by C. Glymour, Theory and Evidence, Princeton 1980. 84 To assert that in reality every quantity depends only on a finite number of other factors is an instance of Keynes' Principle of Limited Variety; see J. M. Keynes, A Treatise on Probability.
Reichenbach's probability logic and the Lvov-Warsaw School Jan Woleriski
If a logical idea is presented in most textbooks of logic, it certainly belongs to the 'logical folklore'. Reichenbach's probability logic is, as far as I know, discussed only in one textbook of logic.1 Although this fact does not suffice to recognize Reichenbach's probability logic as a component of the logical folklore, it provides a testimony that Reichenbach's logical ideas were well-known and much respected in Poland, especially in the Lvov-Warsaw School, perhaps much more than in any other country.2 My aim in the present paper is to describe some reactions of Polish logicians and philosophers to Reichenbach's proposals how to link logic and probability. Reichenbach's probability logic has many dimensions. I restrict here myself however only to something which can be considered as Reichenbach's probability logic in the strict sense by which I mean his proposal how to embed probability into manyvalued logic. Thus, I omit here Reichenbach's logic of quantum mechanics, his general approach to the problem of induction, and his frequency theory of probability. I shall also limit myself to a minimum technicalities of probability logic. Looking historically at the contemporary views concerning the relation between logic and probability, one can distinguish two streams. One, originated with John Maynard Keynes and then continued by Rudolf Carnap and his school, consists in considering logical probability of a proposition as the degree of entailment of this proposition relatively to a given empirical evidence. The second approach, mainly due to Reichenbach, regards logical probabilities of propositions as their degrees of truth. Both approaches explicitly connect probability and logic in a way but it is common to speak about the Carnapian approach (inductive logic) and the Reichenbachian approach (probability logic). Both differ to a considerable extent because inductive logic generalizes the concept of entailment (or logical consequence) 1
T. Czezowski, Logika Podrecznik dla studiujacych nauki filozoficzne (Logic. A Textbook for PhilosophyStudents), Panstwowe Zaktady Wydawnictw Szkolnych, Warszawa 1949, sec. ed. Paiistwowe Wydawnictwo Naukowe, Warszawa 1968; Reichenbach's ideas are discussed in Part 6, Chapter III (Probability and many-valued logics), pp. 203-212 (I refer to the second edition). It is perhaps interesting that Reichenbach himself did not include any chapter on probability logic in H. Reichenbach, Elements of Symbolic Logic, New York 1947. Tadeusz Czezowski (1889-1981) was a student of Kazimierz Twardowski and professor of philosophy in Vilna (before 1939) and Torun (after World War II).
2
An extensive treatment of the Lvov-Warsaw School gives my book J. Wolenski, Logic and Philosophy in the Lvov-Warsaw School, Dordrecht 1989. Max Jammer in his talk delivered at Reichenbach Tagung asserted that the reception of Reichenbach's ideas was in general very slow and limited (cf. M. Jammer's contribution published in this book). However, this evaluation does not concern Poland where several of Reichenbach's philosophical ideas (except probability logic, one can mention his ideas on time and causality) were very quickly welcomed as extremely original contributions to philosophy.
90
Jan Wolenski
whereas probability logic extends the concept of truth. This difference results then with twovalueness of the former and many-valueness of the latter. Although any theory of logical probability is very controversial, probability logic is at present almost entirely forgotten contrary to inductive logic which considerably attracts many logicians. Reichenbach himself also offers a geography of probability logic. 3 He distinguishes (so called by him) the disparity theory and the identity theory. The problem consists in how are related two concepts of probability, namely that which is applied to sentences and that which is applied to events. On the identity conception, the frequency theory of probability is applicable to all concepts of probability: 'sentential' probability theory is just isomorphic to 'evential' theory of probability; Reichenbach defends the identity theory. According to Carnap, we have the abstract theory of probability which subjected either to statistical interpretation or to logical one. The frequency interpretation is proper only with respect to statistical probability whereas logical probability is organized by the concept of partial entailment. Thus Carnap's inductive logic is an example of the disparity theory. 4 Problems of probability always inspired people thinking on many-valueness of propositions. 5 However, it was Jan Lukasiewicz who began serious considerations on the probabilistic interpretation of many-valued logic. 6 Lukasiewicz adopts real numbers from the interval [0, 1] as logical values of propositions. Then, he defines (the symbol v(P) denotes the logical value of a given proposition P) v(-.P)=l-v(P); v(P=>Q)= 1 for v(P) Q) = 1 - (v(P) + v(Q)) for v(P)> v(Q); P v Q is defined as ( P = > Q ) = > Q .
and
Lukasiewicz writes: "if 0 is interpreted as falsehood, 1 as truth, and other numbers in the interval 0 - 1 as the degrees of probability corresponding to various possibilities, a many-valued logic is obtained which is expansion of threevalued logic and differs from the latter in certain details."7
For Lukasiewicz, the probabilistic interpretation of many-valueness was thus a heuristic device in his way to infinite many-valued logic. Lukasiewicz later became more sceptical with respect to the probabilistic interpretation of many-valueness: 3 4
See H. Reichenbach, Experience and Prediction, Chicago 1938, pp. 302-312. For Carnap's reply to Reichenbach, see R. Carnap, Logical Foundations of Probability, Chicago 1950, pp. 176-177. Carnap argues that if Reichenbach's concept of weight of a sentence (this concept is a counterpart of Carnap's concept of logical probability) were identified with the estimate of relative frequency (instead, as Reichenbach proposes, the relative frequency itself) both "conceptions would agree in all fundamental points" (p. 176).
5 6
See N. Rescher, Many-valued Logic, New York 1969, Chap. 1. See J. Lukasiewicz, Interpretacja liczbowa teorii zdan (A numerical interpretation of the theory of propositions), in: Ruch Filozoficzny, 7 (1922/23) pp. 92-93; Eng. tr. (by O. Wojtasiewicz) in: J. Lukasiewicz, Selected Works, Amsterdam 1970, pp. 129-130. Let me note that J. Lukasiewicz, Die logischen Grundlagen der Wahrscheinlichkeitsrechnung, Polska Akademia Umiejftnosci, Krak