190 37 28MB
English Pages 573 [576] Year 1997
Analyomen 2
Perspektiven der Analytischen Philosophie Perspectives in Analytical Philosophy Herausgegeben von Georg Meggle und Julian Nida-Rümelin
Band 16
w DE
G Walter de Gruyter · Berlin · New York 1997
άναλύωμεν Analyomen 2 Proceedings of the 2nd Conference Perspectives in Analytical Philosophy" Volume I: Logic Epistemology Philosophy of Science Edited by Georg Meggle assisted by Andreas Mündt
w DE
G Walter de Gruyter · Berlin · New York 1997
© Printed on acid-free paper which falls within the guidelines of the ANSI to ensure permanence and durability. Library of Congress Cataloging-in-Publication
Data
Analyömen 2 = Analyomen 2 : proceedings of the 2nd conference "Perspectives in analytical philosophy" / edited by Georg Meggle : assisted by Andreas Mündt. p. cm. — (Perspektiven der analytischen Philosophie = Perspectives in analytical philosophy ; Bd. 1 6 - 1 8 ) English and German. This conference was organised by Gesellschaft für Analytische Philosophie (GAP) and held at the University of Leipzig, 7 — 10 Sept. 1994. Includes bibliographical references and index. Contents: v. 1. Logic, epistemology, philosophy of science — v. 2. Philosophy of language, metaphysics - v. 3. Philosophy of mind, practical philosophy, miscellanea. ISBN 3-11-015253-3 (v. 1). - ISBN 3-11-015254-1 (v. 2). ISBN 3-11-015257-6 (v. 3) 1. Analysis (Philosophy) — Congresses. I. Meggle, Georg. II. Mündt, Andreas. III. Gesellschaft für Analytische Philosophie. IV. Series: Perspectives in analytical philosophy ; Bd. 16-18. B808.5.A492 1997 146' , 4 - d c 2 1 97-28700 CIP
Die Deutsche Bibliothek -
CIP-Einheitsaufnahme
Analyömen : proceedings of the 2nd Conference "Perspectives in Analytical Philosophy" = Analyomen 2 / ed. by Georg Meggle. Assisted by Andreas Mündt. - Berlin ; New York : de Gruyter Vol. 1. Logic, epistemology, philosophy of science. — 1997 (Perspektiven der analytischen Philosophie ; Bd. 16) ISBN 3-11-015253-3
© Copyright 1997 by Walter de Gruyter & Co., D-10785 Berlin All rights reserved, including those of translation into foreign languages. No part of this book may be reproduced or transmitted in any form or by any means, electronic or mechanical, including photocopy, recording, or any information storage and retrieval system, without permission in writing from the publisher. Printed in Germany Typesetting: Thomas Fehige, Münster Printing: Arthur Collignon GmbH, Berlin Binding: Lüderitz & Bauer, Berlin Cover design: Rudolf Hübler, Berlin
General Preface
ANALYOMEN 2 - Perspectives in Analytical Philosophy was the title of the second conference organised by the Gesellschaft fur Analytische Philosophie (GAP), which was founded in Berlin in 1990. ANALYOMEN 2 was held at the University of Leipzig, 7-10 September 1994. ANALYOMEN2 followed on from ANALYOMEN 1 (held in Saarbrücken in 1991) and encompassed the section METAPHYSICS, as well as the sections previously covered in ANALYOMEN 1. It also included a workshop, at which some of the world's top experts presented and debated the subject of NEGATION. The Proceedings of this workshop were edited by Heinrich Wansing and published as a separate volume in this series. GAP's General Meeting, where the previous and coming year's activities were discussed and the committee elected, was also held at ANALYOMEN 2. The President's report delivered at the meeting appears at the end of this volume. ANALYOMEN2 mirrored the development of GAP. The number of participants increased from some 300 at ANALYOMEN 1 to over 500 attending ANALYOMEN2. Moreover, whereas 175 papers were presented at ANALYOMEN 1, this figure increased to 210 at ANALYOMEN 2, despite preliminary assessment of submissions which rejected about 20%. This growth is also reflected in the size of the Proceedings: the single volume required for ANALYOMEN 1 (excluding the workshop) has increased to three volumes for ANALYOMEN 2. Two thirds of the submissions to ANALYOMEN 2 were in German, the remainder being in English. ANALYOMEN 2 actually featured more papers than appear in these Proceedings. This is purely because some of the papers have already been or will be published elsewhere. ANALYOMEN2 hosted the first event jointly organised by GAP and the European Society for Analytical Philosophy (ESAP), namely the "round table" discussion on the position of analytical philosophy in Europe, with special reference to Central and Eastern Europe. Leipzig lived up to its claim to be a venue of flourishing East-West dialogue. ANALYOMEN 2 provided an opportunity for numerous thoughtexperiments (though what else could be expected of analytical philosophers?), including the first of its kind in the world of art. GEDANKEN-
VI
General Preface
EXPERIMENT '94 was the title of an exhibition of works of art around which scholars were able to meet before, during and after lectures. The prize-winning work even had an apt name: GEDANKE II. ANALYOMEN2 got underway with a large opening ceremony in the Gewandhaus in Leipzig, one of the highlights of which was the inaugural presentation of the Wolfgang Stegmüller Award for the promotion of budding talents in analytical philosophy. As ANALYOMEN 2 was the first conference to be held by a large philosophy society in eastern Germany, it is only natural that the opening addresses included in the Proceedings deal with this angle. Once again, ANALYOMEN 2 was planned, organised and executed by GAP's founding president, who on this occasion was assisted by committee member Peter Steinacker. Although the experience gained during ANALYOMEN 1 proved useful when it came to organising ANALYOMEN2, work was somewhat hampered by the fact that Leipzig in 1994 (including the University) was more or less one huge building site, a factor which was a constant source of unforeseen circumstances. There is no need to go into detail here; suffice it to say that fortunately everything went smoothly in the end. *
This good fortune was not down to chance but thanks to the support of numerous individuals and institutions, to whom we again express our deep gratitude (as well as on behalf of GAP) both in sensu composito and in sensu diviso. These include: Kurt Biedenkopf, the Prime Minister of the Free State of Saxony, who generously acted as the patron of ANALYOMEN 2 and the conference's sponsors, namely: - The German Research Association (Deutsche Forschungsgemeinschaft DFG) - The Saxony Ministry of Science and the Arts - The University of Leipzig - The Patrons and Friends Association of the University of Leipzig - The Centre of Higher Studies, University of Leipzig - The Department of Philosophy, University of Leipzig - The Department of Logic and Theory of Science, University of Leipzig - The Curator of the University of Leipzig - De Gruyter's publishing house, Berlin/New York - Bayerische Vereinsbank, Leipzig - Stadt- und Kreissparkasse, Leipzig - Margret Stegmüller, Munich
General Preface
vii
The conferences opening speeches were delivered by Hans Joachim Meyer (the Saxon Minister of Science and the Arts), Cornelius Weiss (Rector of the University of Leipzig), Peter Simons (President of the European Society for Analytical Philosophy), and Klaus Puhl (General Secretary of the Austrian Ludwig Wittgenstein Society, who spoke on behalf of the society's President, Rudolf Haller). The opening lecture was given by Dagfinn Follesdal. The main speakers in each section were as follows: LOGIC - Michael Dummett; EPISTEMOLOGY - Wolfgang Spohn; PHILOSOPHY OF SCIENCE - Ilkka Niiniluoto; PHILOSOPHY OF LANGUAGE - Pirmin Stekeler-Weithofer; METAPHYSICS - Peter Simons; PHILOSOPHY OF MIND - Andreas Kemmerling; PRACTICAL PHILOSOPHY - Elijah Millgram; MISCELLANIA - Hans Poser; and WORKSHOP NEGATION - Michael Dunn. The various sections were coordinated by the following: LOGIC - Siegfried Gottwald; EPISTEMOLOGY - Rainer Hegselmann; PHILOSOPHY OF SCIENCE - Andreas Kamlah; PHILOSOPHY OF LANGUAGE - Carl Friedrich Gethmann; METAPHYSICS - Rainer Stuhlmann-Laeisz; PHILOSOPHY OF MIND - Rosemarie Rheinwald; PRACTICAL PHILOSOPHY Julian Nida-Rümelin; MISCELLANEA - Christoph Hubig; and WORKSHOP NEGATION - Heinrich Wansing. Their work was supported by a total 45 chairpersons. Rainer Behrends, Curator of the University of Leipzig's art collection, was the spiritus rector of the exhibition GEDANKEN-EXPERIMENT '94. He also gave the presentation speech in honour of Harald Bauer, winner of the GAP art award GEDANKEN-EXPERIMENT '94. The other artists were Torsten Decker, Dieter Dietze, Markus Gläser, Frieder Heinze, Günter Huniat, Irene Marquardt, Gerhard Kurt Müller, Klaus Schwabe, Jürgen Strege and Olaf Wegewitz. Frank Eilenberger was ever-present at ANALYOMEN2 - for it was he who designed the posters, conference logos and programmes etc. Meggies and Steinackers main decisions regarding the organisation of ANALYOMEN2 were made in conjunction with GAP's committee. One of these decisions was to grant them maximum latitude in their own decisionmaking, which gave them plenty of scope in countless respects. And whenever they needed help, Carlos Ulises Moulines, Hans Julius Schneider and Henning Kniesche were always on hand to lend their unreserved assistance. Ulla Wessels, chief coordinator at ANALYOMEN 1, together with Andrea Busch, Gabriele Förster and Doris Simon ran the conference office again. During the preparatory period, Christoph Fehige was as before involved in almost everything. We were backed up by our Leipzig colleagues Hans-Jürgen Engfer,
Vlll
General Preface
Christoph Hubig and Pirmin Stekeler-Weithofer. Almost all members of the Leipzig Department of Philosophy and the Department of Logic and Theory of Science worked dedicatedly on the project, especially Ho Ngoc Due, Peter Fischer, Claudia Henning, Christoph Jäger, Andreas Luckner, Geert-Lueke Lueken, Matthias Proft, Richard Raatzsch and Markus Vogt. Moreover, nothing would have been possible without Karin Thorn's invaluable support. The following worked very hard to produce these Proceedings in cooperation with the editor: Hans-Robert Cram from de Gruyter publishers, and at the pit-face Christoph Jäger, Alexandra Popp, Peter Steinacker, Andreas Woijek, Henning Tegtmeyer and Benno Zabel. Special thanks go to Thomas Fehige and Andreas Mündt, the former being responsible for transforming all the different inputs into the final layout, and the latter assisting the editor in resolving all the editorial details. Finally, I would like to thank all those others who helped make ANALYOMEN 2 a great success - including everyone who participated in ANALYOMEN2. Georg Meggle
Preface to Volume I This is the first volume ofANALY0MEN2—Proceedings of the 2nd Conference "Perspectives in Analytical Philosophy", the other two being ANALYOMEN 2 - Volume II: Philosophy of Language and Metaphysics ANALYOMEN 2 - Volume III: Philosophy of Mind, Practical Philosophy, and Miscellanea The tables of contents of all three volumes are contained in each volume. The list of contributors is divided, with each volume only listing details of the featured contributors. The whole index of names and subjects is given at the end of each volume, with the various volumes being specified by Roman numerals (I, II and III). For more information about ANALYOMEN2, please see the General Preface contained in this volume.
Contents of Volume I General Preface Preface to Volume I
ν ix
Contents of Volume I Contents of Volume II Contents of Volume III
xi xvi xxi
List of Contributors
xxvii
Opening Addresses CORNELIUS WEISS
3
H A N S JOACHIM MEYER
5
RUDOLF HALLER
10
Opening Lecture DAGFINN F0LLESDAL
Was ist Analytische Philosophie?
15
I. Logic BERND W .
BULDT
Anmerkungen zum Beweis des zweiten Gödelschen Unvollständigkeitssarzes
31
MICHAEL DUMMETT
Existence, Possibility and Time
43
A N D R £ FUHRMANN
Everything in Flux: Dynamic Ontologies
68
SIEGFRIED GOTTWALD
Fuzzy-Logik und approximatives Schließen - ein kurzer Überblick
78
VOLKER HALBACH
Classical Symmetrie Truth
87
XLL H o
Contents of Volume I NGOC
D u e
On a Dilemma of Conditional Obligation
93
BERTRAM KIENZLE
„Es wird der Fall sein, daß"
101
K A R L - H E I N Z KRAMPITZ
Negation und negative Existenzaussagen
109
HERBERT KÜSTNER
Dreiwertige Logik und dynamische Semantik
116
UWE MEIXNER
Ontologically Minimal Semantics for Intuitionistic Logic ULRICH
METSCHL
What is a Logical Constant? A Topological Suggestion HANS
124 131
ROTT
Vom Primat der praktischen Vernunft. Logische Regeln als Regeln rationaler "Wahl
138
M A R K SIEBEL
Bolzanos Ableitbarkeit und Tarskis Logische Folgerung
148
HERMANN WEIDEMANN
Eine durch Abstraktion gewonnene Definition der Zeit HORST
157
WESSEL
Wider den Mythos intensionaler Kontexte
163
KLAUS W U T T I C H
Intensional genannte Kontexte
174
ERNST ZIMMERMANN
Rationalitätsgrade in schwachen Glaubenslogiken
183
II. Epistemology T H O M A S BARTELBORTH
Ist der frühe Carnap ein geeigneter Gegenspieler fur Quine?
197
ELKE BRENDEL
Was können wir über das Wissen wissen? Erkenntnistheoretische Betrachtungen aus semantischer Perspektive
205
Contents of Volume I WOLFGANG
xiii
DEPPERT
Hierarchische und ganzheitliche Begriffssysteme
214
BERNWARD GESANG
Austin contra Frege. Ein Versuch zur Klärung der Korrespondenztheorie THOMAS
226
GRUNDMANN
Die Bedingungen des Verstehens als Bedingungen der Gegenstände des Verstehens
232
REINHARD KLEINKNECHT
"Wissen, Glauben und Wünschen KURT
246
KOLEZNIK
Meinungszirkel, epistemisches Prinzip und Supervenienz
257
VERENA MAYER
Logischer Holismus: Zur Erkenntnistheorie des Tractatus Ν. M .
L.
265
NATHAN
Stoics and Sceptics
278
ALEXANDER ROESLER
Kritik der Searleschen Wahrnehmungstheorie WOLFGANG
283
SPOHN
Uber die Gegenstände des Glaubens
291
RENATE WAHSNER
Über die Berechtigung des analytischen Vorgehens in der Philosophie NICHOLAS
322
WHITE
Widerlegt sich der protagoreische Relativismus selbt?
329
III. Philosophy of Science WOLFGANG
BALZER
Referenz in wissenschaftlichen Theorien
335
A N D R E A S BARTELS
Bedeutungsketten. Ein Modell der Begriffsbildung in gegenwärtigen physikalischen Theorien
342
XIV
Contents o f Volume I
THOMAS BONK
Vollständige Theorien
350
ULRICH GÄHDE
Theorien-Netze und konsistente Modellbildung
358
MICHAELA HAASE
Der Begriff Pragmatischer Idealisierung
366
STEPHAN H A R T M A N N
Verfolgt die Elementarteilchenphysik ein reduktionistisches Programm? 374 REINER HEDRICH
Fand eine „Revolution des Komplexen" statt?
381
KAY H E R R M A N N
Zur Raum-Zeit Konzeption der modernen Physik
390
PAUL H O Y N I N G E N - H U E N E
Die neuzeitliche Naturerkenntnis zerstört die Natur. Zu Georg Pichts Theorie der modernen Naturwissenschaften
399
M A X KISTLER
Zur Transfer-Theorie der Kausalität
405
BERNHARD LAUTH
c-Komplexität und exakte Identifikation
414
A G N I E S Z K A LEKKA-KOWALIK
Popper, Kuhn and Laudan on the Rationality of Science: A Shared View
421
THOMAS MORMANN
Repräsentation, Struktur, Quasianalyse. Formale Aspekte einer Carnapianischen Konstitutionstheorie
431
ILKKA N I I N I L U O T O
Theoretical Reference and Truthlikeness
439
A R N E SCHIRRMACHER
Submikroskopische Vorstellungen von Raum und Zeit - eine Herausforderung fur die (analytische) Philosophie?
453
CHRISTINA SCHNEIDER
Häufigkeitsauffassung der Wahrscheinlichkeit - insignifikant ohne ein „metaphysisches Konzept"
462
Contents of Volume I
XV
DANIEL SCHOCH
Ein topologisches Einfachheitskriterium zur rationalen Theorienwahl
471
GERHARD SCHURZ
Unification and Understanding
481
GERHARD TERTON
Beispiele in der methodologischen Erklärungsdiskussion
495
MAX URCHS
Der Bruch der starken Kausalität
502
Appendix GEORG MEGGLE
Erweiterter Bericht des Präsidenten vor der 2. Mitgliederversammlung der Gesellschaft für Analytische Philosophie (GAP) am 9.9.1994 in Leipzig
513
Indices Index of Names Index of Subjects
523 531
Contents of Volume II Preface
ν
Contents of Volume II Contents of Volume I Contents of Volume III
vii xii xvii
List of Contributors
xxiii
IV. Philosophy of Language GÜNTER ABEL
Interpretationstheorie der Referenz MARTIN
ANDUSCHUS
Die pragmatische Erklärung CLAUS-PETER
JOHANNES L .
22
BRANDL
Die Assoziationstheorie der Bedeutung und ein Versuch ihrer Widerlegung MANUEL
13
BECKE
Ostensive Teaching from a Phenomenological Point of View
29
BREMER
Radikale Interpretation fuhrt zu Analytizität ANDR£
3
39
CHAPUIS
Alternative Revision Theories of Truth
47
ELENA CHERNAYA
The Cogito in the Semantics of the "Illocutionary Impossible" Worlds . . 56 GREGG ALAN
DAVIA
Truth in Discourse Representation Theory BERNHARD
61
DEBATIN
Die Rationalität der Metapher. Zum Projekt einer synthetischen Metapherntheorie
70
Contents of Volume II
XVLL
RENATE D Ü R R
Referenz und Bedeutung als Interpretationskonstrukte
79
W I N F R I E D FRANZEN
Der Abbe und die Zeichen. Uber Condillacs Sprachphilosophie und ihr Verhältnis zu heutigen Theorien
86
KATHRIN G L Ü E R
Teufel und Beelzebub - Überlegungen zur analytisch-synthetisch Unterscheidung im Kontext der Fodorschen Polemik gegen einen bedeutungstheoretischen Holismus
94
D I R K GREIMANN
Hat Frege die Sätze als spezielle Namen konzipiert?
104
EDWARD H A R C O U R T
Frege on Indexicals. Α Problem from the "Logic" of 1897
112
STEFFI H O B U S S
„Mit Zungen reden" - Zu einer schwer verständlichen Anmerkung Wittgensteins in „Philosophische Untersuchungen" 528
118
CHRISTOPH H Ö R L
Sense, Reference, and Truth-Value Links
125
FRANK HOFMANN
Definition, Konvention, Analytizität
131
CHRISTOPH JÄGER
Drei Interpretationen der Rede von „Kommunikationskonstanten"
...
142
THOMAS JÜNGLING
Drücken Sätze mit unvollständigen Kennzeichnungen singuläre Propositionen aus?
149
W U L F KELLERWESSEL
Referenz, Logik und Ethik
155
M A X KÖLBEL
Expressivism and the Geach Objection
164
Η . WILHELM KRÜGER
Wie kann man einer Regel folgen? Zu einem ungelösten Problem in Wittgensteins Sprachphilosophie in der Zeit von 1929 bis 1933
171
RUTH MANOR
Only the Bald are Bald
178
XVlii GEORG
Contents of Volume II MEGGLE
Implikaturen. Erste Definitionsvorschläge
185
OLAF MÜLLER
Zur Synonymie. Uber einen Irrtum bei Quine
192
ALBERT NEWEN
Bedeutungstheorie für Indikatoren: Ein Dilemma AUDUN
200
0FSTI
"a thinks (asserts) ρ " - On Kant-Wittgensteinian Dualism and the Double Double-Structure of Speech and Action
209
JAROSLAV PEREGRIN
When Meaning Goes by the Board, what about Philosophy?
216
J O S E F G . F. R O T H H A U P T
Wittgensteins „Bemerkungen über die Farben": Ein komponiertes Werk oder Flickschusterei?
223
CLEMENS SEDMAK
Rien ne vas plus? Anything goes! Radikale Partizipation
232
H E L E N A SMIRNOVA
"Scaffolding" of the World and Logic. Logical-semantical Analysis of Wittgensteins "Tractatus" SINAIDA A .
241
SOKULER
The Image of Science and the Understanding of Philosophy in the "Tractatus Logico-Philosophicus"
247
CHRISTIAN STEIN
Grammatische Regeln und empirische Sätze PIRMIN
253
STEKELER-WEITHOFER
Analogie als semantisches Prinzip
262
KARSTEN STÜBER
Holism and Radical Interpretation: The Limitations of a Formal Theory of Meaning
290
MARK TEXTOR
Sachverhalte als Konstanten der Kommunikation
299
Contents of Volume II
xix
HEIKE WIESE
„Nellie Einhorn" ist kein wohlgeformter Satz des Deutschen. Zum Ausdruck von Begriff und Gegenstand durch Nominalkonstruktionen natürlicher Sprachen ULRICH
WINKO
Frege über Indexikalität UWE
308
321
WIRTH
Abduktives Schlußfolgern bei Peirce und Davidson WOJCIECH
329
ZELANIEC
In Defense of an Old Dogma
337
V. Metaphysics NORBERT
CAMPAGNA
Wittgensteins Kritik an fehlgeleiteten Therapieversuchen
345
BRIGITTE FALKENBURG
Die Vollständigkeit in der Erfahrung - Variationen über ein Thema von Kant HEINZ-DIETER
352
HECKMANN
Inkarnationsmodelle
361
LUDGER JANSEN
Are Aristoteles energeiai States or Events? CHRISTIAN
KANZIAN
Die Individuation von Ereignissen HANS
369 376
KRAML
Ontologische Freiheiten und Restriktionen VINCENT C .
MÜLLER
Real Vagueness MARTINE
390
NIDA-RÜMELIN
Eine Supervenienzthese für den Begriff personaler Identität LORENZ B .
383
396
PUNTEL
Ontologische Kategorien: die Frage nach dem Ansatz
405
XX
Contents o f Volume II
S A U R A B H SANATANI
Metaphysics and Physics - a Plea for a Division of Labour
413
PETER SIMONS
Merkwürdige Sachen und die Beziehung der Ontologie zur Sprache ACHIM STEPHAN
Lehnstuhlargumente gegen den Emergentismus
. . 418 439
RAINER STUHLMANN-LAEISZ
„Im Reich des Sinnes besteht keine Verschiedenheit." Überlegungen zu Freges Theorie der Identitätsurteile über Gedanken 447 HOLM TETENS
Warum werden wir die Metaphysik nicht los?
455
MARTA UJVÄRI
Omniscience and Essential Indexicals
466
Indices Index of Names Index of Subjects
477 485
Contents of Volume III Preface
ν
Contents of Volume III Contents of Volume I Contents of Volume II
vii xiii xviii
List of Contributors
xxiii
VI. Philosophy of Mind FRANZISKA ALLWEYER
Intentionalität: Paradigmatische Erklärungs-(Vermeidungs-) Strategien . . 3 SVEN
BERNECKER
On Knowing One's Own Mind MARCUS
BIRKE
Alltagspsychologie: Eliminativer Materialismus ohne Dogma FILIP
14 20
BUEKENS
Sensations and Attempts: Intermediate Entities in Empiricism and Philosophy of Action
29
MARTIN FRANCISCO FRICKE
Das Wissen, das Selbstbewußtsein ist GERHARD
HELM
Die Computermetapher: Versuch einer Autopsie ANDREAS
59
LEIBER
Biophysiologie, Kognitionen und funktionalistischer Emergentismus: Bemerkungen zu Aristoteles' naturphilosophischer Psychologie KLAUS
50
KEMMERLING
Uberzeugungen fur Naturalisten THEODOR
42
84
MAINZER
Computer, Kognition und Gehirn. Neue Forschungsperspektiven und die Aufgabe der Philosophie
94
xxii
Contents of Volume III
THOMAS
METZINGER
Perspektivische Fakten? Die Naturalisierung des „Blick von Nirgendwo" GEORG
103
NORTHOFF
Mental States in Phenomenological and Analytic Philosophy A Comparison between Μ. Merleau-Ponty a n d T . Nagel
Ill
F A B R I C E PATAUT
Holism of Content Ascription and Holism of Belief Content KLAUS
PUHL
Gegenstandsabhängigkeit und die Autorität der ersten Person MARTIN
124
RECHENAUER
Effektive Strategien und die kausale Wirksamkeit von Geisteszuständen LOUISE
118
131
RÖSKA-HARDY
Zuchreibungen und die Ontologie des Mentalen
137
K A T H R I N VON SIVERS
Objektivität und Selbstbewußtsein - eine Argumentation gegen den Dualismusvorwurf in der Kantischen Synthesislehre
144
. DIETER TEICHERT
Sind Erinnerungstheorien personaler Identität zirkulär?
156
KÄTHE TRETTIN
Kausalität und das Mentale: Eine verfahrene Geschichte
164
RAIMO TUOMELA
Gemeinsame Absichten
171
ALBERTO VOLTOLINI
Is Narrow Content the Same as Content of Mental State Types Opaquely Taxonomized?
179
HENRIK WALTER
Proper Functions in der Klemme? Zur Kritik teleologischer Bedeutungstheorien MARC-DENIS
186
WEITZE
Searle, Edelman und die Evolution des Bewußtseins. Mit neurophysiologischen Argumenten gegen den Epiphänomemalismus? . 194
Contents of Volume III
xxiii
VII. Practical Philosophy CARSTEN
BREDANGER
Abwanderung, Widerspruch und Kooperation im freiwillig iterierten Prisoner s-Dilemma-Game unter Annahme vollkommener Anonymität
203
C H R I S T I N E CHWASZCZA
Anmerkungen zur vertragstheoretischen Begründung globaler Gerechtigkeit
212
ANTONELLA CORRADINI
Präferenzutilitarismus und Goldene Regel: Einige methodologische Schwierigkeiten WOLFGANG
GERENT
Ethik und Willensfreiheit MICHAEL
243
KOLLER
Die Struktur von Rechten CHRISTOPH
251
LUMER
Kognitive Handlungstheorie - der methodische Ansatz KARL
235
HEUER
Zum Begriff der moralischen Motivation PETER
227
GRONEBERG
Das Problem der Unvorsichtigkeit. Bemerkungen zu Freiheit und Verantwortung ULRIKE
220
263
MERTENS
Handeln und Können. Ansätze zu einer Bestimmung des Handelns im Anschluß an Gilbert Ryle
271
ELIJAH MILLGRAM
Varieties of Practical Reasoning WALTER
280
PFANNKUCHE
Supererogation als Element moralischer Verantwortung
295
D I E T M A R VON DER P F O R D T E N
Die fünf Strukturmerkmale normativ-ethischer Theorien
306
KLAUS PETER RIPPE
Liberalismus, Neutralität und Umweltschutz
316
Contents of Volume III
XXIV
NEIL
ROUGHLEY
Welcher Stellenwert kommt dem Integritätsbegriff im praktischen Uberlegen zu?
324
PETER SCHABER
Konsequentialismus und der persönliche Standpunkt THOMAS
SCHMIDT
Uber die praktische Signifikanz von Rationalitätsprinzipien JAN-R.
332
339
SIECKMANN
Zur Analyse von Normkonflikten und Normabwägungen
349
RALF STOECKER
Handlung und Verantwortung. Mackies Rule Put Straight
357
CHRISTIANE VOSS
Spricht die Ambivalenz von Affekten gegen ihren Urteilscharakter?
. . . 365
ULLA WESSELS
Ex-post-Präferenzen - eine moralische Richtschnur?
378
ANDREAS W I L D T
Psychologische und rationale Moralbegründung
387
JEAN-CLAUDE W O L F
Unparteilichkeit oder Freundschaft?
396
THOMAS ZOGLAUER
Normenkonflikte. Zum Problem deontischer Widersprüche in Normensystemen
403
VIII. Miscellanea PETER BAUMANN
Das Wissen von den eigenen Wünschen und Präferenzen
413
JACQUELINE BRUNNING
C. S. Peirce on Future Contingents
419
KLAUS ERLACH
Die Herstellung von Zeit
429
SUSANNE H A H N
Überlegungsgleichgewicht(e). Unterscheidungen und Fragen
437
Contents of Volume III
XXV
A N T H O N Y HATZIMOYSIS
Minimalism about Truth and Ethical Cognitivism
446
JOSEF INGENERF
The Need for Suitable Characterizations of Terminological Knowledge
452
ANDREAS KAMLAH
Wie kann ein analytischer Philosoph Texte der philosophischen Tradition verstehen? MATTHIAS KETTNER, AUDUN
460
0FSTI
„Intersubjektivität" - einige Analyseschritte
468
PETER KLEIN
Daseinsanalytik als empirische Wissenschaft
478
WINFRIED LÖFFLER
Bolzano über die Glaubwürdigkeit von Wunderberichten
490
GEERT-LUEKE LUEKEN
Inkommensurabilität, radikale Interpretation und das principle of charity
500
THOMAS MEYER
Sind Bewegungen Handlungen? ULRICH
510
MÜLLER-KOLCK
Nosologische Grundstrukturen in medizinischen Argumentationen . . . 518 JESUS
PADILLA-GALVEZ
Die Rolle der Induktion und die Uniformität des Wahrheitsprädikats . 529 HANS
POSER
Ist eine wissenschaftliche Weltanschauung möglich?
538
RICHARD RAATZSCH
On there being a Chapter on Philosophy in Philosophical
Investigations
KLAUS REHKAMPER
Ist die Perspektive eine Konvention?
557 564
ANDREAS ROSER
„Tennis ohne Ball" - eine Provokation Wittgensteins
573
HARALD WOHLRAPP
Einige grundsätzliche Bemerkungen zur Rolle der Logik im Argumentieren
582
xxvi
Contents of Volume III
Indices Index of Names Index of Subjects
593 601
List of Contributors
Prof. Dr. Wolfgang Balzer, Universität München, Institut für Philosophie, Logik und Wissenschaftstheorie, Ludwigstr. 31/1, D - 8 0 5 3 9 München Prof. Dr. Thomas Bartelborth, Universität Leipzig, Institut für Logik und Wissenschaftstheorie, Augustusplatz 9, D - 0 4 1 0 9 Leipzig PD Dr. Andreas Bartels, Justus-Liebig-Universität, Zentrum für Philosophie, OttoBehaghel-Str. 10/C, D-35394 Gießen Dr. Thomas Bonk, University of Pittsburgh, Center for Philosophy of Science, 817 Cathedral of Learning, Pittsburgh, PA 15260, USA Dr. Elke Brendel, Freie Universität Berlin, Institut fur Philosophie, Habelschwerdter Allee 30, D - 1 4 1 9 5 Berlin Dr. Bernd W. Buldt, Universität Konstanz, FG Philosophie, PF 5560 D 21, D - 7 8 4 3 4 Konstanz Prof. Dr. Wolfgang Deppert, Philosophisches Seminar der Universität Kiel, Leibnizstr. 6, D - 2 4 1 1 6 Kiel Prof. Dr. Michael Dummett, 54 Park Town, Oxford OX2 6S, England Dr. Andri Fuhrmann, Universität Konstanz, Institut für Philosophie, PF 5560, D - 7 8 4 3 4 Konstanz Prof. Dr. Dagfinn Follesdal, University of Oslo, Department of Philosophy, P O Box 1024, Blindem, N - 0 3 1 5 Oslo, Norway Prof. Dr. Ulrich Gähde, Universität Bayreuth, Institut fur Philosophie, D - 9 5 4 4 0 Bayreuth Dr. Bernward Gesang, Möhnestr. 86 a, D-59755 Arnsberg Prof. Dr. Siegfried Gottwald, Universität Leipzig, Institut fur Logik und Wissenschaftstheorie, Augustusplatz 9, D-04109 Leipzig Dr. Thomas Grundmann, Universität Tübingen, Philosophisches Seminar, Bursagasse 1, D-72070 Tübingen Dr. Michaela Haase, Institut ftir Allgemeine Betriebswirtschaftslehre, Fachrichtung Wissenschaftstheorie, Garystr. 6, D-14195 Berlin
xxviii
List of Contributors
Volker Halbach, Ochsenfelderstr. 12, D - 8 5 0 7 2 Eichstädt Dr. Stephan Hartmann, Universität München, Sektion Physik, Theresienstr. 37, D - 8 0 3 3 3 München P D Dr. Reiner Hedrich, Zentrum für Philosophie und Grundlagen der Wissenschaft der Justus-Liebig-Universität Gießen, Otto-Behaghel-Str. 10 C II, D - 3 5 3 9 4 Gießen Dr. Kay Herrmann, Friedrich-Schiller-Universität Jena, Institut fur Philosophie, Zwätzengass e 9, D - 0 7 7 4 3 Jena Ho Ngoc Due M.A., Universität Leipzig, Institut fur Logik und Wissenschaftstheorie, Postfach 920, D - 0 4 0 0 9 Leipzig Prof. Dr. Paul Hoyningen-Huene, Universität Konstanz, Philosophische Fakultät, F G Philosophie, PF 5560, D 12, D - 7 8 4 3 4 Konstanz Prof. Dr. Bertram Kienzle, Ladenburger Str. 80, D - 6 9 1 2 0 Heidelberg Dr. Max Kistler, University Blaise Pascal, Departement de Philosophie, 29, Boulevard Gergovia, F - 6 3 0 3 9 Clermont-Ferraud, Cedex Prof. Dr. Reinhard Kleinknecht, Universität Innsbruck, Institut für Philosophie, Innrain 52, A - 6 0 2 0 Innsbruck Kurt Koleznik, Universität Innsbruck, Institut für Philosophie, Innrain 52, A - 6 0 2 0 Innsbruck Dr. Karl-Heinz Krampitz, Trachtenbrodtstr. 22, D - 1 0 4 0 9 Berlin Dr. Herbert Küstner, Humboldt-Universität zu Berlin, Philosophische Fakultät II, Computerlinguistik, Jägerstr. 10-11, D - 1 0 1 1 7 Berlin P D Dr. Bernhard Lauth, Universität München, Institut fur Philosophie, Logik und Wissenschaftstheorie, Ludwigstr. 31, D - 8 0 5 3 9 München Dr. Agnieszka Lekka-Kowalik, Universite de Neuchätel, Seminaire de Philosophie, Faculte des Lettres, 1 Esp. Louis Agassiz, C H - 2 0 0 0 Neuchätel Dr. Verena Mayer, Ludwig-Maximilians-Universität München, Institut fur Philosophie, Logik und Wissenschaftstheorie, Ludwigstr. 31, D - 8 0 5 3 9 München P D Dr. Uwe Meixner, Universitätsstr. 31, D - 9 3 0 5 3 Regensburg Dr. Ulrich Metsehl, Ludwig-Maximilians-Universität München, Lehrstuhl für Philosophie I, Geschwister-Scholl-Platz 1, D - 8 0 5 3 9 München P D Dr. Thomas Mormann, Universität München, Institut fiir Philosophie, Logik und Wissenschaftstheorie, Ludwigstr. 31, D - 8 0 5 3 9 München
List of Contributors
XXIX
Dr. Ν. M. L. Nathan, University of Liverpool, Department of Philosophy, 7 Abercromby Square, PO Box 147, Liverpool L 69 3 BX, Great Britain Prof. Dr. Ilkka Niiniluoto, University of Helsiniki, Department of Philosophy, P.O. Box 24 (Unioninkatu 40), FIN-00014 Helsinki Alexander Roesler M.A., Gneisenaustr. 20, D-10961 Berlin Dr. Hans Rott, Universität Konstanz, Fachgruppe Philosophie, Postfach 5560, D - 7 8 4 3 4 Konstanz Dr. Arne Schirrmacher, Deutsches Museum - Forschungsinstitut, Museumsinsel 1, D - 8 0 5 3 8 München Dr. Christina Schneider, Universität München, Institut fur Statistik, Ludwigstr. 33/1, D - 8 0 5 3 9 München Dr. Daniel Schoch, Adolf-Mieschstr. 36, D-60528 Frankfurt Prof. Dr. Gerhard Schurz, Universität Salzburg, Institut fiir Philosophie, Franziskanergasse 1, A-5020 Salzburg Mark Siebel, Universität Hamburg, Philosophisches Seminar, Von-Melle-Park 6, D - 2 0 1 4 6 Hamburg Prof. Dr. Wolfgang Spohn, Universität Konstanz, FG Philosophie, PF 5560, D - 7 8 4 3 4 Konstanz Prof. Dr. Gerhard Terton, Universität Leipzig, Institut für Logik und Wissenschaftstheorie, Augustusplatz 9, D - 0 4 1 0 9 Leipzig Prof. Dr. Max Urchs, Nicolaus Copernicus University, Chair of Logic, Fosa Staromiejska 3, PL-87-100 Torun Prof. Dr. Renate Wahsner, MPI fiir Wissenschaftsgeschichte, Wilhelmstr. 44, D - 1 0 1 1 7 Berlin Prof. Dr. Hermann Weidemann, Auf dem Weiler 4, D-53125 Bonn Prof. Dr. Horst Wessel, Humboldt-Universität zu Berlin, Institut fiir Philosophie, Unter den Linden 6, D-10117 Berlin Prof. Dr. Nicholas White, University of Utah, Department of Philosophy, 338 O.S.H., Salt Lake City U T 84112 Ann Arbor, U.S.A. Dr. Klaus Wuttich, Schröderstr. 2, D-10115 Berlin Ernst Zimmermann, Universität Tübingen, Philosophisches Seminar, Bursagasse 1, D - 7 2 0 7 0 Tübingen
Opening Addresses
CORNELIUS
WEISS
Rektor der Universität Leipzig
Es ist mir Ehre und Vergnügen zugleich, Sie im Namen des Akademischen Senats der Universität zum 2. Kongreß der Gesellschaft fur Analytische Philosophie sehr herzlich in Leipzig, der Wirkungsstätte von Christian Thomasius, Johann Christoph Gottsched, Theodor Litt und Hans-Georg Gadamer begrüßen zu dürfen. Ihre Gesellschaft ist jung. Vor vier Jahren in Berlin gegründet, hat sie sich zum Ziel gestellt, jene Richtung der Philosophie zu fördern und zu vermitteln, die einen nüchternen ideologiefreien Denkstil pflegt. Sie werden mir, dem Vertreter einer mindestens ebenso nüchternen weil stark praxisorientierten Wissenschaftsdisziplin - der Chemie - nachsehen, daß ich nicht versuche, hier einen tiefgründig-geistreichen Diskurs über die Philosophie im Allgemeinen und Analytische Philosophie im Besonderen zu führen. Dies hieße wahrlich, Eulen nach Athen zu tragen. Aber als Mensch, der 4 0 Jahre lang mit einer Mischung von Zorn, Abscheu und Belustigung beobachtete, wie eine große und wichtige Wissenschaftsdisziplin die Philosophie, die Mutter der Wissenschaften - systematisch ideologisiert, trivialisiert und mißbraucht wurde, darf ich Ihnen sagen, daß ich mich sehr freue, daß die Universität Leipzig endlich wieder Gastgeberin für einen bedeutenden Philosophie-Kongreß sein kann. Ich tue dies aus zwei Gründen. Erstens: Wir alle stimmen zweifellos überein, daß die ostdeutschen Universitäten nach Jahrzehnten der Beherrschung durch eine ebenso verbohrte wie zynische Politbürokratie und nach vielen Jahren einer fast perfekten Abschottung von der internationalen wissenschaftlichen Kommunikation und der daraus resultierenden Provinzialität und Kleingeisterei dringend einer umfassenden Erneuerung an Kopf und Gliedern bedurften. Seit 1933 hatte hier in Ostdeutschland die Macht über den Geist geherrscht; nun wollten wir endlich wieder die Freiheit von Forschung und Lehre durchsetzen, wollten wir unsere Universität zu echten Hohen Schulen machen, zu Geburtsstätten neuer Gedanken und Ideen, zu Orten kritischer Reflexion. Natürlich ließ sich das nicht per Dekret erledigen.
Die erforderliche strukturelle, perso-
nelle und geistige Erneuerung der ostdeutschen Hochschulen war vielmehr ein langwieriger, komplizierter und häufig genug schmerzlicher Prozeß, der
4
Opening Addresses
alle, die seit 1990 in den ostdeutschen Universitäten oder für die ostdeutschen Universitäten Verantwortung übernommen hatten, bis auf das Letzte forderte. Die Tatsache, daß Analyomen 2 in Leipzig stattfindet, verstehe ich als Würdigung dieser Anstrengungen, als Zeichen, daß der erneuerten Universität Leipzig in der wissenschaftlichen Welt wieder Vertrauen und Respekt entgegengebracht wird. Zweitens: Mit einigem Erstaunen und großer Sorge konstatiere ich, daß heute, unmittelbar nach dem fast lautlosen Scheitern des Marxismus-Leninismus, in der Gesellschaft, aber auch in der Wissenschaft, verstärkt andere Irrationalismen, Mythen und Legenden kursieren und gedeihen. Ich könnte dies an vielen Beispielen festmachen, etwa am Umgang mit unserer jüngeren Geschichte (zum Beispiel der des Widerstandes im 3. Reich), an unserem Verhältnis zur DDR-Vergangenheit, an der Behandlung des Umweltproblems oder an der Technikfolgendiskussion. Unsere Erfahrungen mit Ideologie und ideologisierter Wissenschaft sollten uns eigentlich warnen: So werden wir nicht weit kommen, so wird kein einziges aktuelles Problem gelöst werden. Ihr Kongreß wird sicher ein deutliches Signal für eine rationale Wissenschaft setzen, und ich freue mich, daß dieses Signal gerade von Leipzig ausgehen wird, der Stadt also, die wie keine andere zum Aufbruch des Herbstes '89 und damit zur deutschen Wiedervereinigung beigetragen hat und die sich trotz der Zerstörung durch Kriegs- und Nachkriegszeit ihren ganz eigenen, wenn auch spröden Charme bewahrt hat.
HANS JOACHIM MEYER
Sächsischer Staatsminister fur Wissenschaft und Kunst
Wer fünf Jahre nach den revolutionären Herbstereignissen des Jahres 1989 in Leipzig zu einem Philosophiekongreß zusammenkommt, wird diesen Tagungsort nicht als einen unter vielen betrachten wollen. Vielmehr wirft dieser Ort und seine jüngste Geschichte die Frage nach dem Verhältnis von Philosophie und Politik auf, von Geist und Macht. Die Philosophie, die in den Jahrzehnten vor der Wende an dieser Universität betrieben und geboten wurde, war mit dem Anspruch angetreten, als einzige von allen philosophischen Richtungen Wissenschaft zu sein und darum auch zur politischen Macht werden zu wollen. Der alte Traum, daß die Herrschenden Philosophen sein und die Philosophen herrschen müßten, war eine Tradition, die bis zuletzt zitiert wurde. In Wahrheit freilich war die Philosophie längst zur Magd der Macht herabgesunken, wenn auch mit dem Privileg des öffentlichen Monopols. Ein struktureller und personeller Neuanfang war darum nach der Wende dringend geboten und unerläßlich. Und doch: Niemand kann ernsthaft glauben, eine Philosophie, deren Wurzeln tief in die Geschichte hinabreichen, wäre deshalb tot, weil ein Traum zum Albtraum wurde. Die Häme des Siegers ist kein philosophisches Argument. Und der Zusammenbruch des Herrschaftssystems ersetzt nicht die gedankliche Auseinandersetzung, auch wenn sich der Marxismus-Leninismus einer solchen Auseinandersetzung mit den Mitteln der Macht entzog und damit über das politische und wirtschaftliche Scheitern hinaus seinen intellektuellen Niedergang selbst verschuldete. Auch wenn es der Politik nicht zukommt, Aufgaben für die Philosophie zu formulieren - schon die bloße Vorstellung beschwört makabre Erinnerungen herauf- so ist doch wohl der Gedanke erlaubt, daß gerade die analytische Herangehensweise dazu befähigen mag, die Trümmer der Vergangenheit kritisch, aber nicht polemisch zu mustern und die Instrumente unserer gegenwärtigen gedanklichen Bemühungen zu säubern und zu schärfen. Wer die kontroversen und häufig stürmischen Debatten in und nach der Wende mit dem nötigen Abstand - und damit doch nicht ohne innere Anteilnahme - kritisch betrachtet, kommt schwerlich an der Einsicht vorbei: Hier wurde im Augenblick der Auseinandersetzung um den rechten Ausdruck gerungen. Und wenn auch für viele der Bruch mit den unerträglichen sprachlichen Ritualen der überwunde-
6
Opening Addresses
nen Zeit ein zwingendes Bedürfnis war, so bedeutete doch ehrliches Bemühen und frischer Mut nicht notwendigerweise Treffsicherheit und Klarheit. Freilich: Wer da gleichzeitig aus westlicher Himmelsrichtung mit selbstsicherer Routine und selbstbewußter Begrifflichkeit auf die neue Wirklichkeit zuging, mußte darum nicht klarer und treffsicherer sein. Es sah häufig nur so aus. Ein weites Feld also und eine Fülle von Aufgaben fur philosophische Bemühung. In einem gewissen Sinne kann man - und dem Nichtphilosophen möge diese kühne Aussage gestattet sein - die analytische Philosophie geradezu als ein Kontrastprogramm zum System des Marxismus-Leninismus ansehen. Und zwar nicht nur in dem Sinne, daß sie als bürgerlich bzw. idealistisch bezeichnet wurde - eine Charakterisierung, die sie bekanntlich mit sehr vielen philosophischen Richtungen teilen mußte - sondern auch deshalb, weil sie dem philosophischen Arbeiten Felder eröffnete, die dem MarxismusLeninismus gar nicht oder nur im mühevollen Nachgang zugänglich waren, die aber zugleich, bedingt durch die Entwicklung in anderen Wissenschaftsdisziplinen, nicht ignoriert werden konnten. So entstand das kuriose Phänomen, daß die analytische Philosophie die einzige nicht marxistische Philosophie war, die im Wissenschaftsbetrieb der D D R überhaupt zu einer gewissen Bedeutung gelangte, und zwar nicht bzw. nicht nur als Gegenstand kritischer Betrachtung, sondern auch als begriffliches und analytisches Arbeitsmittel. Zwar galt das m. W. kaum für die Philosophie selbst, sondern so gut wie ausschließlich für die Logik und Linguistik, doch hieße es, die Gefahr des ideologischen Zugriffs auf grundsätzlich alle geisteswissenschaftlichen Disziplinen völlig zu verkennen, wollte man dies geringschätzen. Ein Blick auf die Antistrukturalismuskampagne der S E D Anfang der siebziger Jahre zeigt, welche verheerenden Konsequenzen solche ideologischen Attacken haben konnten. Denn diese waren immer Attacken der politischen Macht. Auch wären mir die Leistungen der kommunikativen oder der handlungsorientierten Linguistik in der D D R ohne die Fernwirkungen der analytischen Philosophie nicht vorstellbar. Daß diese Leistungen durch die Umstrukturierung der Hochschul- und Forschungslandschaft oft ihre Basis verloren haben, ohne hinreichend neu verankert zu werden, und deshalb in Gefahr stehen, westdeutscher Nichtachtung zu verfallen, gehört zweifellos zu den Fehlleistungen nach der Wende. Jedenfalls wäre es unzutreffend, für diesen Einfluß der analytischen Philosophie in der D D R das ohnehin inflationär entwertete Bild der Nische zu gebrauchen. Schließlich spricht die Tatsache, daß die Gesellschaft für Analytische Philosophie schon im Mai 1990 im Rahmen der Tagung „Analytische Philosophie in der D D R " gegründet werden konnte, dafür, daß das Feld hier bereitet wurde, und zwar durch eigenständige Arbeit und unter schwierigen Bedingungen.
Hans Joachim Meyer
7
Nun ist die Zeit der Wende und des Neuanfangs nicht schlechthin die Stunde der analytischen Philosophie, sondern die der Freiheit des philosophischen Denkens überhaupt. Freiheit verwirklicht sich im gesitteten Streit. Das gilt auch fur den Streit der Philosophen, der solange in diesem Teil Deutschlands nicht stattfinden konnte und der doch ein unverzichtbarer Beweger philosophischen Denkens ist. Er wehrt auch der Gefahr der Ideologisierung, in der nun einmal jedes geistige, insbesondere jedes geisteswissenschaftliche Bemühen steht, in der Fülle der Erscheinungen, Möglichkeiten und Methoden den Punkt zu fassen, von dem aus eine systematische Ordnung erkannt oder ein analytischer Zugang gefunden werden kann. Ich verkenne nicht die größere Nähe des Systems zur Ideologie im Vergleich zur Analyse, doch hilft gegen Ideologieanfälligkeit - wie auch sonst gegen gedankliche und andere menschliche Versuchungen — am ehesten noch ein altes Bibelwort: Wer da steht, sehe zu, daß er nicht falle. Und die Volksweisheit: Hochmut kommt vor dem Fall. Gleichwohl ist der Beitrag der analytischen Philosophie für den gegenwärtigen gesellschaftlichen Diskurs fraglos von besonderem Wert. Die freiheitliche Demokratie bedarf des selbstdenkenden und sich nach vorweisbaren Gesichtspunkten entscheidenden Bürgers. In einer modernen Gesellschaft ist dieser Bürger schon durch die Konsequenzen der im üblichen Geschwindschritt dahineilenden Entwicklung vor immer neue Entscheidungen gestellt ethisch-moralische Grundsatzfragen, die zwar in den politischen Tagesfragen meist zu kurz kommen, sich aber dennoch mit steigender Intensität aufdrängen, wie an der wachsenden Sensibilisierung für die Belastung der Umwelt exemplifiziert werden kann. Die Analytische Philosophie hat sich der Erörterung solcher Grundsatzfragen angenommen und wesentliche Anstöße zur Umweltethik, zur Medizinethik und zu einer rationalen Bewertung der Technikfolgen gegeben. Das entspricht ihrem Selbstverständnis als Fortsetzerin der Aufklärung mit den Mitteln der Logik und Sprachkritik. Freilich: Die Welt nach der Wende ist nicht mehr nur die sich scheinbar unaufhaltsam entwickelnde Gesellschaft, die in der Selbstsicherheit des Fortschritts ihren freien Bürgern wachsende Erfüllung versprechen kann, ohne sie allzusehr an ihre Verpflichtungen gegenüber der Gemeinschaft zu erinnern. Die Wende hat nicht nur Mauern niedergerissen, die der Freiheit entgegenstanden. Das Scheitern eines großen, aber, wie die Geschichte gelehrt hat, wirklichkeitsfremden Anspruchs hat auch ein Gebäude zusammenstürzen lassen, dessen Baumaterial unter anderem aus einem Steinbruch gewonnen wurde, der die Uberschrift „Aufklärung" trug. Deren den Menschen befreiende Wirkung war allerdings von ihrem Anspruch auf Menschheitsverbesserung aufgefressen worden. Auch das ist eine Facette des Versuchs, Geist als Macht zu etablieren.
8
Opening Addresses
Nach dieser Erfahrung muß man jedenfalls auf sehr festem aufklärerischen Grunde stehen, um all den Gespenstern ins Gesicht zu sehen und entgegenzutreten, die aus den Abgründen dieser Ruine hervorkriechen, einer Ruine, die sich vor noch gar nicht langer Zeit als das Gebäude der endgültigen Menschheitsvollendung präsentierte. In aller Deutlichkeit erfahren wir die Freiheit als Einheit von Chance und Risiko. Gegen Nebel und Gespenster sind Klarheit und Sachlichkeit, für die die analytische Philosophie steht, wirkungsvolle Waffen. Analytische Deutlichkeit ist ein unverzichtbares Instrument in den mitunter wirren und jetzt nicht selten auch ratlosen Debatten unserer Zeit. Und angesichts brachialer Gewalt ist jedes Mühen um vorzeigbare gedankliche Argumentation eine humane Tat. Jedenfalls hilft sie zum Dialog und eröffnet Wege im Dialog. Dennoch bleibt dieser schwierig genug und letztlich eine sich immer wieder setzende Aufgabe im unaufhebbaren Spannungsfeld zwischen unterschiedlichen Werten und Entscheidungen, zu denen sich Menschen in Freiheit entschließen und bekennen. Diese Freiheit ist unaufhebbar und ihre elementare Kraft ist weder als Einsicht in die Notwendigkeit domestizierbar noch als entideologisierte Vorurteilslosigkeit. Zum Glück ist die Spannung der Freiheit, in der menschlicher Dialog und menschliches Handeln stattfinden, ein weites Feld, um es mit Fontane zu sagen. Und ein weites Feld ist ein vorzüglicher Platz für praktische Schritte. Wer wäre besser als die analytische Philosophie dazu bestimmt, zu praktischen Ergebnissen zu kommen statt sich in prinzipiellen Verhärtungen zu versteifen oder - fernab vom alltäglichen und politischen Treiben - bei der Erörterung von Grundfragen zu verharren. Ein solches praktisches Engagement der Philosophen im öffentlichen Diskurs und im politischen Geschäft könnte den auf Herrschaftssysteme orientierten Gegensatz zwischen dem zur Macht strebenden Geist und dem sich von der Macht fernhaltenden Geist auflösen und zum partnerschaftlichen Angebot für die Bürger in der freiheitlichen Demokratie werden, genauer gesagt fur jene Bürger, die ihre Verantwortung für das gemeinschaftlichen Wohl akzeptieren und als solche am öffentlichen Diskurs teilnehmen, die einen konkreten Dienst in der Verantwortung zu übernehmen auch wirklich bereit sind. Von dieser Bereitschaft lebt Demokratie. Und deshalb ist es ein Grund zur Freude und zur Hoffnung, daß sich zu diesem Kongreß eine so große Zahl von Philosophinnen und Philosophen aus Ost und West in Leipzig versammelt haben, darunter eine große Zahl junger Menschen. Leipzig ist ein guter Ort, um über die Probleme dieser Zeit nachzudenken. Es ist ein Ort großer Geschichte, und es ist eine Stadt im stürmischen Wandel. Sie zeigt die Herausforderungen des Aufbruchs zur Freiheit wie in einem Brennglas. Und so sollte diese Stadt und diese Universität Ihnen nicht
Hans Joachim Meyer
9
nur ein zeitgemäßer Kontext oder gar nur eine Reverenz an die Zeitgeschichte sein, sondern ein sperriger Wirklichkeitstest flir die Praktikabilität und Rationalität Ihrer Überlegungen. In diesem Sinne heiße ich Sie im Namen der Sächsischen Staatsregierung herzlich willkommen, überbringe Ihnen die Grüße des Schirmherrn Ihres Kongresses, unseres Ministerpräsidenten Prof. Kurt Biedenkopf, und wünsche Ihnen anregende und inhaltsreiche Tage in Leipzig.
RUDOLF
HALLER
Präsident der Osterreichischen Ludwig Wittgenstein Gesellschaft
ANALYOMEN 2 ist eine Fortsetzung des erfolgreichen und inzwischen auch durch die Publikation dokumentierten ersten Kongresses der Gesellschaft für Analytische Philosophie. Darüberhinaus ist es ein Schritt der Einholung und Heimholung von Saarbrücken nach Leipzig und, wie man wohl auch sagen wird dürfen: eine Einholung der philosophischen Welt in der Perspektive der analytischen Philosophie nach Leipzig. Eine große Aufgabe und - lassen Sie es mich aussprechen - wesentlich das Werk eines kraftvollen Denkers, das Werk von Georg Meggle. Ihm zuerst ist zu danken. Die analytische Philosophie ist keine inhaltlich bestimmte Lehre mit festen Grundsätzen, sie ist nicht einmal durch die Anerkennung einer Methode zu charakterisieren. Unter ihrem Namen finden sich verschiedene, natürlich auch einander opponierende Lager und Schulen vereint. Selbst unter den Interpreten Wittgensteins finden wir solche, die nur dem Programm des Traktats Wert und Fruchtbarkeit zuschreiben, andere, die bloß in der späten Phase seines Philosophierens ein neues Paradigma erblicken und wieder andere, die einzig dem Bogen des ganzen Wittgenstein den Wert eines wahren Wegweisers zumessen. Wenn schon in der Auseinandersetzung mit einem Denker, in der Kritik und Fortsetzung der Arbeit eines Philosophen die Gemeinde unserer Freunde so wenig einem einheitlichen Bilde sich fügt, wie sollte es anders sein in dem Gewimmel der vielen herausragenden und der zahllosen übrigen Arbeiter im Weinberg der analytischen Philosophie? Was also verbindet uns? Ich glaube, was uns verbindet, was die Diskussion zwischen verschiedenen analytischen Philosophen und Philosophinnen möglich, fruchtbar und erfolgverheißend macht, ist das praktizierte Bekenntnis zu einem Denkstil, wie Ludwig Fleck vielleicht gesagt hätte. So, wie sich in der Scholastik die einander bekämpfenden Schulen, trotz ihrer verschiedenen Gegensätze und Ziele, in der Diskussion jedenfalls verständigen konnten, weil jedenfalls verständlich war, was gesagt wurde und gemeint war, so scheinen mir auch in der Streitkultur der analytischen Lager der Wille und das Bemühen, sich klar auszudrücken, verstanden werden zu wollen, Argumente und Beweisführung anzuerkennen, unübersehbare Charakteristika. Und natürlich wird ein Denkstil auch durch Vorbilder geprägt, seien diese Frege oder Carnap, Russell oder Moore, Wittgenstein oder Schlick, Quine, Ryle, Strawson, Putnam, Dummett oder Krip-
Rudolf Haller
11
ke: Genug der Namen. Nur ein Vergleich mit anderen Schulen macht uns deutlich, warum so Verschiedenes unter dem Regenschirmbegriff der analytischen Philosophie Platz hat: Wir verstehen die Worte und Texte analytischer Philosophen, weil ihre Sprache dem Denkstil rationalen Argumentierens und Erläuterns, den wir gelernt haben und praktizieren, entsprechen. Aber wir verstehen die Worte und Texte der anderen privateren Sprachen, die man erst einüben muß und die uns keine logische und keine empirische Uberprüfung ihrer Behauptungen erlauben, nicht, wenn wir nicht willig sind, über unseren Schatten zu springen. Und es gibt nicht oft gute Gründe, um über den Schatten springen zu wollen und keine, um darüber springen zu müssen. Das ist der Unterschied. Ich wünsche dem 2. Kongreß der Gesellschaft für analytische Philosophie im Namen der österreichischen Kolleginnen und Kollegen, im Namen der Osterreichischen Wittgenstein-Gesellschaft und in meinem eigenen Namen allen Erfolg, einen Erfolg, den sich Leipzig, Meggle und sein Team wahrlich verdient haben.
Opening Lecture
DAGFINN
F0LLESDAL
Was ist analytische Philosophie?*
Was ist analytische Philosophie? Und warum eine Gesellschaft und ein Kongreß für analytische Philosophie? Auf Analyomen 1, dem ersten deutschen Kongreß für analytische Philosophie, der 1991 in Saarbrücken stattfand, hat Georg Henrik von Wright in seinem Eröffnungsvortrag einen historischen Überblick über die analytische Bewegung gegeben. Ich werde mich mit denselben Philosophen und philosophischen Texten beschäftigen wie von Wright damals, aber unter einem anderen Gesichtspunkt. Meine Betrachtungen sind eher systematisch denn historisch. Ich frage mich: Was ist diese Philosophie, die wir analytisch nennen? Warum sollte man sie betreiben? Und wie verhält sie sich zu anderen Hauptströmungen der Gegenwartsphilosophie? Antagonistisch und unvereinbar? Oder konziliant und vereinbar? Obwohl von Wright und ich einander philosophisch sehr nahe stehen, werde ich mich mit einigen seiner Gesichtspunkte kritisch auseinandersetzen. Die Frage „Was ist analytische Philosophie?" ist nicht nur eine Wortfrage, die Frage nach einer passenden Definition für ein Wörterbuch. Diese Definitionsfrage dürfte wichtig genug sein für die Aktivitäten und Ziele einer Gesellschaft für analytische Philosophie: worin unterscheidet sich eine solche Ge* Margret Stegmüller hat uns auf diesem Kongreß bei der erstmaligen Verleihung des WolfgangStegmüller-Preises davon berichtet, wie sehr Wolfgang Stegmüller sich über diesen Kongreß gefreut hätte. Vor seinem Tode habe ich Stegmüller einige Male im Krankenhaus besucht. Er hat sich damals, in seiner typischen Bescheidenheit, darüber beklagt, daß er während seiner Lebensjahre so wenig zur Philosophie beigetragen habe. Ich habe ihn daraufhin an seine vielen Beiträge in verschiedenen Bereichen der Philosophie erinnert und auch an die große Bedeutung, die seine Arbeit für die Philosophie in Deutschland gehabt hat. Dies hat an seiner zurückhaltenden Selbsteinschätzung allerdings nichts geändert. Dieser Kongreß jedoch, mit seinen vielen Teilnehmern und seinen mannigfaltigen Vorträgen, wie auch die beiden Gesellschaften GAP (Gesellschaft für Analytische Philosphie) und ESAP (European Society for Analytic Philosophy) mit ihren vielen Mitgliedern, sind das beste Zeugnis dafür, daß Wolfgang Stegmüller sich in diesem einen Punkt, bei dem es um seine eigene Bedeutung für die Philosophie und insbesondere für die analytische Philosophie in Europa geht, gründlich geirrt hat. Ich danke Georg Meggle und den anderen Veranstaltern von Analyomen 2 für die Einladung, diesen Vortrag zu halten. Herzlichen Dank auch an Andreas Luckner und Christian Beyer, die das Manuskript meines Vortrags durchgelesen und viele Verbesserungen vorgeschlagen haben.
16
Opening Lecture
sellschaft von den allgemeinen philosophischen Gesellschaften? Kombiniert mit meiner zweiten Frage „Warum sollte man analytische Philosophie betreiben?" wird aber die Frage „Was ist analytische Philosophie?" eine Frage nach der Natur der philosophischen Tätigkeit: „Wie sollte man Philosophie betreiben?" Wenn man Ubersichten über die Gegenwartsphilosophie gibt, so teilt man sie gewöhnlich in zwei Hauptteile: die analytische und die kontinentale Richtung. Die analytische Philosophie wird dann wieder in zwei Hauptströmungen unterteilt: die eher logisch orientierte, in der Bolzano, Frege und Russell frühe Hauptfiguren sind, und die alltagssprachlich orientierte, in der G. E. Moore, der späte Wittgenstein und J. L. Austin zentral gewesen sind. Die Kontinentalphilosophie umfaßt Strömungen wie Phänomenologie, Existentialismus, Strukturalismus, Dekonstruktivismus, Hermeneutik, NeuThomismus, Neu-Kantianismus, Neu-Marxismus, und verschiedene andere „Neu-ismen". Obwohl diese Einteilung allgemein üblich ist, finde ich sie recht unbefriedigend. Ich werde versuchen zu zeigen, daß sie mit fundamentalen Schwierigkeiten behaftet ist, ähnlich wie die folgende Klassifikation in „einer gewissen chinesischen Enzyklopädie", von der Jorge Luis Borges berichtet, und die Sie vielleicht auch von Foucault her kennen: „Die Tiere [gruppieren] sich wie folgt [...]: a) Tiere, die dem Kaiser gehören, b) einbalsamierte Tiere, c) gezähmte, d) Milchschweine, e) Sirenen, f) Fabelliere, g) herrenlose Hunde, h) in diese Gruppierung gehörige, i) die sich wie Tolle gebärden, k) die mit einem ganz feinen Pinsel aus Kamelhaar gezeichnet sind, 1) und so weiter, m) die den Wasserkrug zerbrochen haben, n) die von weitem wie Fliegen aussehen." (Borges 1966,212)
Das Problem mit dieser chinesischen Enzyklopädie ist: Es fehlt ein Klassifikationsprinzip, oder mindestens scheint es so fur Menschen aus unserem Kulturkreis. Die Einteilung der philosophischen Strömungen ist mit zwei Problemen behaftet: Erstens fehlt ein Klassifikätionsprinzip; zweitens ist es, ganz unabhängig von der Klassifikation, unklar, welche die verschiedenen Richtungen sind, die klassifiziert werden sollen - wie kann man sie definieren oder zumindest grob charakterisieren? Dies betrifft besonders unser Hauptanliegen auf diesem Kongreß, die analytische Philosophie. Was ist sie? Moore spricht schon 1905 von der ,Analyse philosophischer Begriffe", und Russell schreibt 1914, in Our Knowledge of the External World, von der „logisch-analytischen Methode", ohne aber viel über die Eigenart dieser Methode zu sagen. Wie von Wright in seinem Eröffnungsvortrag aufAnalyomen 1 bemerkte, scheint Friedrich Waismann der erste gewesen zu sein, der von der „analytischen Philoso-
Dagfinn Fellesdal: Was ist analytische Philosophie?
17
phie" gesprochen hat, namentlich in seinem Aufsatz „Was ist logische Analyse?" in dem letzten Jahrgang der Zeitschrift Erkenntnis, der vor dem Kriege erschien. Analytisches Philosophieren besteht Waismann zufolge in der Analyse philosophischer Begriffe und Gedanken. „Analyse" bedeutet hier Zerlegung des betreffenden Gedankens in seine letzten logischen Elemente, „wie der Chemiker eine Substanz analysiert", sagt Waismann. Dies dürfte wohl auf G. E. Moore zutreffen, der beispielsweise den Begriff „gut" so zerlegen wollte, wie man ein Pferd anatomisch zerlegt. Waismanns Charakteristik paßt aber nur auf wenige zeitgenössische analytische Philosophen. Was ist zum Beispiel mit Quine, der bestreitet, daß es so etwas wie Begriffe gibt? Er ist doch bestimmt ein analytischer Philosoph. Eine Charakterisierung der analytischen Philosophie im Rekurs auf eine spezifische begriffsanalytische Methode erscheint daher nicht sonderlich vielversprechend. Einige Strömungen, wie etwa die Phänomenologie, sind wesentlich durch ihre Gesichtspunkte oder Doktrinen charakterisiert. Ein Phänomenologe ist jemand, der gewisse Ansichten hat über Intentionalität und andere verwandte Themen. Auch Neu-Thomismus, Neu-Kantianismus, Neu-Marxismus usw. sind durch ihre Ansichten charakterisiert. Dies trifft jedoch nicht auf die Hermeneutik zu, die eher durch ihr Problemgebiet definiert ist. Die Hermeneutik befaßt sich mit Fragen des Verstehens und der Interpretation von Texten und anderen Manifestationen des menschlichen Geistes, um mit Dilthey zu sprechen. Mit den vielen anderen Problemen der Philosophie ist sie nur insofern befaßt, als diese mit Verstehen und Interpretation verbunden sind. Was aber ihre Ansichten betrifft, so sind die einzelnen Hermeneutiker sehr unterschiedlich einzuordnen. Wir haben also schon hier eine Vermengung zweier verschiedener Klassifikationsprinzipien: Doktrinen und Problemgebiete, die in der Klassifikation der philosophischen Hauptströmungen vermischt sind. Die Hauptströmung, die uns hier auf diesem Kongreß beschäftigen soll, die analytische Philosophie, läßt sich nun aber weder durch Doktrinen noch durch Problemgebiete charakterisieren. Analytische Philosophen bearbeiten vielerlei philosophische Probleme, und sie haben ganz verschiedene Ansichten über diese Probleme. Ich kenne keine philosophische Ansicht, die von allen oder auch nur den meisten analytischen Philosophen geteilt würde - zumindest keine Ansicht, die nicht ganz trivial ist. Die analytische Philosophie scheint mir vielmehr durch ihre Zugriffsweise auf philosophische Probleme gekennzeichnet, die, wie wir gesehen haben, nicht mit einer spezifischen Methode der Zerlegung philosophischer Begriffe identifiziert werden darf. Doch worin besteht diese Zugriffsweise? Das ist die Frage, die uns jetzt beschäftigen soll. Und sie ist keine einfache Frage.
18
Opening Lecture
Bevor wir uns ihr zuwenden, lassen Sie mich aber zuerst bemerken, daß wir mittlerweile drei verschiedene Klassifikationsprinzipien haben: nach Doktrinen, nach Problemen und nach Zugriffsweisen. Wir springen von dem einen zum zweiten und dritten, so wie in der chinesischen Enzyklopädie, und haben kein einheitliches Klassifikationsprinzip. Dies ist eine heikle Sache für jede Klassifikation. Bevor wir eine Charakterisierung der analytischen Philosophie in Angriff nehmen, sollten wir darum zunächst ein alternatives Einteilungsprinzip betrachten, das Ihnen vielleicht schon aufgefallen ist: die Klassifikation der philosophischen Hauptströmungen sollte vielleicht besser als eine genetische Klassifikation betrachtet werden, eine Klassifikation von philosophischen Traditionen, von Schulen von Philosophen, die Lehrer und Studenten sind, miteinander diskutieren und auf die gleichen Ursprungsphilosophen zurückgehen. Dies läßt sich recht gut mit einigen Haupströmungen durchführen: der Phänomenologie, dem Neu-Thomismus und den verschiedenen anderen „Neu-ismen". Es funktioniert aber nicht so gut bei der Hermeneutik; schon im Altertum, im Mittelalter und in der Neuzeit findet man hermeneutische Bestrebungen, die ohne Verbindung miteinander oder Wissen voneinander entstanden sind, aber doch das gemeinsam haben, daß sie zum philosophischen Verständnis des Bereichs „Verstehen und Interpretation" beigetragen haben. Ähnlich ist es mit dem Existentialismus, wo man frühe existentialistische Einzelgänger, wie ζ. B. Augustinus, findet. Man hat versucht, die analytische Philosophie in ein solches genetisches Schema der philosophischen Schulrichtungen hineinzubringen. So wird zum Beispiel oft behauptet, daß die analytische Philosophie mit Frege und Russell (der logische Zweig) und mit G. E. Moore (der alltagssprachliche Teil) beginnt. Es ist sogar behauptet worden, daß 1903 als das Geburtsjahr der analytischen Philosophie betrachtet werden kann, mit der gleichzeitigen Veröffentlichung von Russells Principles of Mathematics und Moores Refutation of Idealism. Dies wird aber nicht ganz im Ernst gesagt - man räumt schnell ein, daß Frege mehr als 20 Jahre früher bereits analytische Philosophie betrieben hat. Frege schafft: jedoch keine Probleme für die genetische Klassifikation der philosophischen Hauptströmungen. Seine Schriften wurden ja von Russell sehr gründlich studiert, und Russell und Whitehead schreiben in den Principia Mathematica, daß sie sich „in allen Fragen der logischen Analyse gegenüber Frege zu großem Dank verpflichtet fühlen". Um Frege in die analytische Philosophie einzuordnen, muß man nur deren Geburtstag vorverlegen, nämlich von 1903 auf 1879, das Jahr, in dem die Begriffsschrift erschienen ist. Die Konzeption der Hauptströmungen der Philosophie als philosophische ScA^/richtungen ist aber trotzdem nicht befriedigend. Ich habe schon die Pro-
Dagfinn Follesdal: Was ist analytische Philosophie?
19
bleme mit der Hermeneutik und dem Existentialismus erwähnt. Man gruppiert da Philosophen zusammen, nicht weil sie Lehrer und Schüler sind, sondern weil sie an denselben Problemen arbeiten. Die analytische Philosophie schafft meiner Meinung nach noch größere Probleme als die Hermeneutik und der Existentialismus für die Konzeption der Haupströmungen der Philosophie als SfAw/richtungen. Nehmen wir als Beispiel Bernard Bolzano. Bolzano ist meiner Ansicht nach ein hervorragender analytischer Philosoph. 1781 geboren, hat er schon Anfang des neunzehnten Jahrhunderts viele zentrale Ideen von Frege, Carnap, Tarski, Quine und anderen vorweggenommen und in mustergültiger Weise ausgearbeitet. Mit gutem Grund beginnt Anders Wedberg den letzten Band seiner Philosophiegeschichte, die Darstellung der zeitgenössischen Philosophie, mit einem Kapitel über Bolzano. Danach folgen Frege, Russell und die anderen Hauptphilosophen unseres Jahrhunderts. Bolzano ist meines Erachtens ein ausgezeichneter und typischer analytischer Philosoph. Damit kann nicht gemeint sein, daß Frege, Russell, Moore und die anderen analytischen Philosophen Schüler von Bolzano sind. Frege erwähnt Bolzano nicht und scheint ihn überhaupt nicht zu kennen. Es ist nicht unwahrscheinlich, daß einige Impulse von Bolzano ihn über Vermittler erreicht haben. Zur Unterstützung der genetischen These, daß Bolzano einen entscheidenden Einfluß auf Frege ausübte, bleibt indes nur Seelenwanderung: Frege wurde in Bolzanos Todesjahr 1848 geboren. (Bolzano starb allerdings erst sechs Wochen nach der Geburt Freges...) Auch Russell scheint Bolzano nicht gelesen zu haben, obwohl Bolzano sich nicht nur ausgiebig mit der Philosophie der Logik und der Philosophie der Sprache beschäftigt hatte, sondern auch mit anderen Themen, an denen Russell arbeitete, wie etwa der Philosophie von Leibniz. Bolzano ist überhaupt bis zu den Arbeiten von Heinrich Scholz und von Wedberg und seinen Schülern sehr wenig bekannt gewesen. Zum Beispiel gab es bis vor kurzem keinen Artikel über Bolzano in der Encyclopedia Britannica. Nur Husserl hat Bolzano Aufmerksamkeit gewidmet, er dankt ihm nachdrücklich in den Logischen Untersuchungen und in anderen Werken. Falls die Hauptströmungen der Philosophie Schulrichtungen sind, wo Lehrer/Schüler-Verhältnisse, Studium und Einfluß das Entscheidende sind, so ist Bolzano als Phänomenologe zu betrachten. Das ist er aber wohl weniger, denn man findet bei ihm nur zu einem geringen Ausmaß die Ansichten über Intentionalität und verwandte Themen, die für die Phänomenologie charakteristisch sind. Alle, die sich mit Bolzano beschäftigt haben, finden vielmehr, daß er ein typischer analytischer Philosoph ist. „Urgroßvater der analytischen Philosophie" hat ihn Michael Dummett genannt, ohne damit eine genetische Verbindung zu behaupten, nur eine systematische.
20
Opening Lecture
Geben wir deshalb lieber die Idee auf, daß die Klassifikation der philosophischen Hauptströmungen eine genetische Klassifikation, eine Klassifikation von philosophischen Sc/w/richtungen ist. Das mag auf den Neu-Thomismus, den Neu-Kantianismus, den Neu-Marxismus und so weiter zutreffen, aber kaum auf andere Strömungen. Einige Strömungen, etwa die Phänomenologie, sind durch gewisse Ansichten oder Thesen gekennzeichnet; andere wiederum, wie die Hermeneutik, durch ihr besonderes Problemgebiet. Wir haben hier ein Mischmasch diverser Kriterien, aber keine gemeinsame Basis der Einteilung, beinahe wie bei der chinesischen Enzyklopädie. Die analytische Philosophie muß uns jedoch noch weiter beschäftigen. Wir haben noch nicht herausgefunden, was sie ist. Wir haben einige negative Antworten: Die analytische Philosophie ist keine Schulrichtung, man kann, so wie Bolzano, analytischer Philosoph sein, ohne andere analytische Philosophen studiert zu haben und auch ohne später von anderen analytischen Philosophen studiert zu werden. Auch gibt es keine philosophische Ansicht oder begriffsanalytische Methode, die alle oder die meisten analytischen Philosophen teilen. Was können wir aber positiv über die analytische Philosophie sagen? Wir haben schon erwähnt, daß die analytische Philosophie durch ihre Zugrißsweise auf philosophische Probleme gekennzeichnet zu sein scheint. Wir stellen nun wiederum die Frage: wodurch ist diese Zugriffsweise charakterisiert? Wir haben aber schon bemerkt, daß die Charakterisierung der analytischen Philosophie als eine Art Begriffsanalyse auf viele analytische Philosophen, wie etwa Quine, gar nicht zutrifft. Es ist wahr, daß analytische Philosophen sich gern mit der Sprache beschäftigen. Aber Sprachphilosophie ist nur ein Teil der analytischen Philosophie. Man findet analytische Philosophen innerhalb aller Gebiete der Philosophie, zum Beispiel in der Erkenntnistheorie, der Ethik, der Ästhetik und auch der Bewußtseinsphilosophie und der Metaphysik. Typische Moralphilosophen, wie Rawls, äußern sich nur selten über Sprache und Sprachphilosophie. Und doch sind sie analytische Philosophen. Die Antwort auf unsere Frage ist, glaube ich, daß man sich in der analytischen Philosophie sehr stark um Argumentation und Begründung kümmert. Wenn man einen philosophischen Standpunkt vorbringt und bewertet, dann fragt man: welche Gründe gibt es, diesen Standpunkt zu akzeptieren oder zu verwerfen? Diese Frage macht es nötig zu untersuchen, was aus dem betreffenden Standpunkt folgt und aus welchen weiteren Standpunkten er seinerseits folgt. Wie kann man den Standpunkt bestärken oder entkräften? Dies meint man gewöhnlich, wenn man fragt: was genau ist mit diesem Standpunkt gemeint? Oft entdeckt man, daß ganz kleine Unterschiede in der Formulierung
Dagfinn Fallesdal: Was ist analytische Philosophie?
21
dafür entscheidend sind, ob der Standpunkt akzeptabel oder zu verwerfen ist. Dies ist, glaube ich, ein Grund, weshalb analytische Philosophen sich so viel mit Sprachanalyse beschäftigen. Die Sprachanalyse ist notwendig, um Vieldeutigkeiten und Unklarheiten zu vermeiden, die für die Stichhaltigkeit der Argumentation ausschlaggebend sein können. Gewiß gibt es analytische Philosophen, die behaupten, daß erfolgreiche Sprachanalyse oder Begriffsanalyse das einzige Ziel der Philosophie ist. G. E. Moore ist dieser Ansicht gewesen, und auch Wittgenstein, der frühe und der späte. Bei den Philosophen, die von Moore und Wittgenstein beeinflußt wurden, begegnet man oft diesem Gedanken. Zum Beispiel schreibt Moritz Schlick in seinem bekannten Aufsatz „Die Wende der Philosophie", der den ersten Band der Zeitschrift Erkenntnis einleitet und den von Wright 1991 in seinem EröfFnungsvortrag zu dem ersten deutschen Kongreß fur analytische Philosophie zitierte: „Durch die Philosophie werden Sätze geklärt, durch die Wissenschaften verifiziert. Bei diesen handelt es sich um die Wahrheit von Aussagen, bei jener aber darum, was die Aussagen eigentlich meinen."
Diese Gegenüberstellung von Wissenschaft und Philosophie findet man auch bei Friedrich Waismann, in dem schon erwähnten Aufsatz „Was ist logische Analyse?": „Philosophie und Wissenschaft sind zwei grundverschiedene Typen menschlicher Geisteshaltung. - Der wissenschaftliche Geist sucht nach Erkenntnis, d. h. nach Sätzen, die wahr sind, die mit der Wirklichkeit übereinstimmen. Auf einer höheren Stufe erhebt er sich zur Bildung von Theorien. - Was man durch die Philosophie gewinnen kann, ist ein Zuwachs innerer Klarheit. Das Resultat einer philosophischen Überlegung sind nicht Sätze, sondern das Klarwerden von Sätzen." (Waismann 1 9 3 9 / 4 0 , 4 )
Andere analytische Philosophen, und die sind bestimmt in der großen Mehrzahl, sind der Ansicht, daß sich die Philosophie mit der Wahrheit beschäftigt. Viele denken auch, daß sie den Wissenschaften ähnlich ist. So schreibt zum Beispiel Bertrand Russell in den 20er Jahren in dem Aufsatz The New Philosophy: „Die Philosophie ist im Wesentlichen eins mit der Wissenschaft, sie unterscheidet sich von den Spezialwissenschaften nur durch die Generalität ihrer Probleme." (Russell 1928, 6) Ähnliche Ansichten findet man von Mach bis Quine. In ähnlicher Weise schreibt auch Frege, daß seine Bemühungen, die Sprache zu klären, nicht sein eigentliches Anliegen darstellen. Er hat nie geglaubt, daß philosophische Probleme durch Sprachanalyse gelöst werden können, sondern lediglich, daß die Sprachanalyse uns helfen kann, die Probleme
22
Opening Lecture
besser zu sehen. Er würde bestimmt nicht Wittgensteins Ansicht teilen, daß Sprachanalyse die philosophischen Probleme verschwinden macht, wie es im Vorwort zum Tractatus heißt, oder daß die Sprache der Grund der Probleme ist, wie wir in § 109 der Philosophischen Untersuchungen lesen. Wir haben hier eine gute Illustration meiner Behauptung, daß die analytische Philosophie nicht durch eine Sammlung gemeinsamer Thesen bestimmt werden kann. Selbst wenn es sich um eine derart grundlegende Frage handelt wie die Frage „Was ist Philosophie?", geben analytische Philosophen ganz verschiedene Antworten. Und doch kann niemand im Ernst daran zweifeln, daß alle diese Philosophen: Moore, Wittgenstein, Schlick, Waismann, Russell und Frege, analytische Philosophen sind. Die Betonung von Argumentation und Begründung scheint mir darum charakteristischer für die analytische Philosophie zu sein als die Beschäftigung mit Begriffsanalyse, die nur ein Teil davon ist. Meine These, daß die analytische Philosophie nicht durch bestimmte philosophische Doktrinen charakterisiert ist, auch nicht durch bestimmte Probleme, sondern durch Betonung von Argumentation und Begründung, läßt sich leicht überprüfen. Man braucht, um diese These zu widerlegen, nur Philosophen zu finden, die wir als analytisch betrachten, die sich aber wenig um Argumentation und Begründung kümmern. Wittgenstein und seine Nachfolger kommen einem sofort in den Sinn. Findet man bei diesen Philosophen Argumentation und Begründung? Oder sind sie vielleicht überhaupt keine analytischen Philosophen? Von Wright, ein hervorragender Wittgenstein-Kenner, hat das letztere angedeutet und darauf hingewiesen, daß die Spätphilosophie Wittgensteins „der typischen analytisch-philosophischen Denkweise fremd und feindselig gegenübersteht". So betrachtet etwa der späte Bertrand Russell den Einfluß Wittgensteins auf die nachfolgende Entwicklung der Philosophie als ein Unglück. In einer Besprechung in Mind von J. O. Urmson's Buch Philosophical Analysis: Its Development Between the Two World Wars, drückt Russell seine Aversion so aus: „Der späte Wittgenstein [...] scheint vom ernsten Denken m ü d e geworden zu sein und eine Lehre herausgefunden zu haben, die solch eine Aktivität unnötig macht. Ich glaube nicht einen Augenblick, daß die Lehre, die diese faule Konsequenz hat, wahr ist. Ich räume aber ein, daß ich eine überwältigende starke Befangenheit dagegen habe; denn falls sie wahr wäre, so wäre die Philosophie bestenfalls eine geringe Hilfe für Lexikografen u n d schlimmstenfalls eine müßige Teetisch-Unterhaltung." (Russell 1959)
Dagfinn Fallesdal: Was ist analytische Philosophie?
23
Wie ich am Ende meines Vortrages erörtern will, betrachte ich Argumentation und Begründung als sehr wichtige Elemente der philosophischen Tätigkeit, und wo ich sie nicht finde, werde ich skeptisch. Ich habe aber eine weite Konzeption von dem, was ich „Argumentation" und „Begründung" nenne. Wie wir alle wissen, ist Argumentation in der Philosophie und in anderen Gebieten sehr viel mehr als deduktive Argumentation. Die Theorie der deduktiven Argumentation ist sehr gut ausgebaut, und Vertrautheit mit deduktiver Argumentation ist wichtig, um andere Argumentationstypen recht zu verstehen und anzuwenden. Die Argumentationstypen, denen wir in der Philosophie und in vielen anderen Gebieten begegnen, sind gewöhnlich Varianten der nicht-monotonen Argumentation, bei der das Einfügen neuer Prämissen die früheren Konklusionen ins Wanken bringt. Philosophie besteht auch aus mühseligen Beschreibungen von Gefühlen und von menschlichen Verhaltungen, wie etwa Wahrnehmungen, wobei wir uns bemühen, Beschreibungsweisen und Distinktionen zu finden, die dem Material angepaßt sind und zugleich Übersichtlichkeit und Zusammenhang schaffen. Ubersicht und Zusammenhang sind Schlüsselbegriffe in der Philosophie. Vielleicht noch mehr als in den Einzelwissenschaften wünscht man in der Philosophie zu sehen, „wie alles sich zum Ganzen webt, eins in dem andern wirkt und lebt." Man muß sich in der Philosophie, wie in anderen Wissenschaften, hin und her bewegen zwischen der Betrachtung genereller Zusammenhänge und detaillierten Studien. Die generellen Zusammenhänge müssen mit den Details zusammenstimmen, und die Details müssen in den generellen Zusammenhängen einen Platz finden. Durch das Überlegungsgleichgewicht das „reflective equilibrium" - , das dadurch gesucht wird, entsteht die Begründung unserer philosophischen Einsichten, sowohl der generellen Einsichten als auch der detaillierten, speziellen. Goodman und Rawls haben diese Idee in die gegenwärtige Diskussion eingeführt, und wir werden auf diesem Kongreß später noch einen Vortrag von Susanne Hahn über diese Konzeption der Begründung hören. Die Frage, was gute Argumentation und Begründung ist, ist selbst eine Frage innerhalb der analytischen Philosophie, eine wichtige Frage. Und auch hier gibt es verschiedene Ansichten. Husserl hat schon zu Beginn unseres Jahrhunderts eine ähnliche Konzeption der Begründung vorgelegt wie Goodman und Rawls. Er schreibt, daß die begründende Verknüpfung zwischen den verschiedenen Aussagen einer Abhandlung oder Theorie diesen Aussagen Geltung verleiht. Er betont in diesem Zusammenhang auch, daß „die vorlogischen Geltungen begründend sind für die logischen". Was ich besonders jnteressant an Husserl finde, ist, daß er, mehr noch als Goodman und Rawls, darüber reflektiert hat, warum diese Art
24
Opening Lecture
von Zusammenhang Begründung stiftet. Der Grund hierfür ist seines Erachtens, daß die „Auffassungen", auf die wir am Ende zurückgreifen, nicht thematisiert sind und in den meisten Fällen niemals thematisiert worden sind. Jeder Anspruch auf Geltung und Wahrheit ist fundiert in dieser Lebenswelt von nicht-thematisierten „Auffassungen", über die wir nie geurteilt haben. M a n möchte meinen, daß dies die Sache noch schlimmer macht. Nicht nur greifen wir auf etwas Ungewisses zurück, sondern auch auf etwas, woran wir nie gedacht haben und das wir folglich keiner bewußten Prüfung ausgesetzt haben. Husserl behauptet nun aber, daß gerade die nicht-thematische Natur jener „Auffassungen" diese zur letzten Begründungsinstanz macht. „Akzeptieren" und „Glauben" sind in seinen Augen keineswegs Einstellungen, die wir aufgrund einer judikativen Entscheidung besitzen. Das, was wir akzeptieren, und das Phänomen des Akzeptierens selbst, sind eingegliedert in unsere Lebenswelt, und es gibt nach Husserl keine Möglichkeit, sich diesem nie thematisierten Akzeptieren zu entziehen. Ich zitiere: „es ist uns unmöglich, hier auszuweichen durch einen von Kant oder Hegel, von Aristoteles und T h o m a s sich nährenden Betrieb mit Aporien und Argumentationen" ( K r i s i s , § 34e, Husserliana VI, 134.35-37 = Carr, 132). Ich halte diese Idee von Husserl für einen anregenden Beitrag zu unserer gegenwärtigen Diskussion über Letztbegründung und zur Theorie des Uberlegungsgleichgewichts. Überlegungsgleichgewicht ist, meine ich, das, was dem am nächsten kommt, was ich in meiner Diskussion der analytischen Philosophie Argumentation und Begründung genannt habe. Diese Idee liefert uns eine offene, aber gleichwohl nicht inhaltsleere Konzeption der analytischen Philosophie. Die großen Helden der analytischen Philosophie, etwa Bolzano, Frege und Russell, passen sich hier gut ein. Durch das große Gewicht, das sie auf logische Argumentation legten, haben sie mit Einsichten in mancherlei generelle Zusammenhänge zum philosophischen Unternehmen beigetragen, ebenso wie mit detaillierten Studien und Distinktionen. Doch auch Moore und Wittgenstein haben Wertvolles beigetragen. Ihnen fehlen oft die generellen Zusammenhänge, aber sie haben Beschreibungen gegeben und Distinktionen vollzogen und haben zudem Schwierigkeiten gesehen, die alle systematisch-philosophischen Versuche in Betracht ziehen müssen. Schwierigkeiten zu sehen ist auch ein wichtiger Beitrag zur Philosophie, ein sehr wichtiger Beitrag. Meine Charakterisierung der analytischen Philosophie mit Hilfe der Begriffe „Argumentation" und „Begründung" könnte allzu offen und weit erscheinen. Gibt es überhaupt Philosophen, die gemäß dieser Charakterisierung keine analytischen Philosophen sind? Ich finde, um Philosophen aus unserer Zeit als Exempel zu nehmen, daß
D a g f i n n Follesdal: Was ist analytische Philosophie?
25
meine Charakterisierung der analytischen Philosophie auf Heidegger und Derrida nicht zutrifft. Anstelle von Argumentation und Begründung finde ich bei ihnen überwiegend Rhetorik; man begegnet in ihren Werken sehr vielen der traditionellen rhetorischen Figuren. Husserl hat in sein Handexemplar von Sein und Zeit geschrieben: „Was da gesagt ist, ist meine eigene Lehre, nur ohne ihre tiefere Begründung." Ahnliches gilt für Derrida. Typisch finde ich seine „Diskussion" mit John Searle. Searle wehrt sich gegen Derridas Kritik seiner Positionen und sagt, daß Derrida ihn nicht verstanden und auch falsch zitiert habe. Statt diese Einwände zu diskutieren, beginnt Derrida Searle als SARL anzusprechen (Societe anonyme de responsabilite limitee), um anzudeuten, daß Searle nicht bereit sei, flir seine Standpunkte Verantwortung zu tragen. Die Zuhörer haben Derrida zugejubelt, aber analytische Philosophie ist dies nicht. Das besagt keineswegs, daß Heidegger, und vielleicht auch Derrida, nicht auch philosophische Einsichten haben können. Um diese freizulegen, muß man die entsprechenden Ansichten aber klar formulieren und versuchen herauszufinden, was jeweils für und gegen diese Ansichten angeführt werden kann. Das Fehlen von Argumenten und Begründungen stellt eine solche Rekonstruktion vor ein besonderes Problem. Argumente und Begründungen tragen ja zur Klärung des jeweils Gemeinten bei; wenn sie fehlen, wird es schwierig mit der Interpretation. In seinem Eröffnungsvortrag zum ersten deutschen Kongreß für analytische Philosophie hat von Wright behauptet, daß die Hermeneutik mit der analytischen Philosophie unvereinbar ist. Da bin ich nun ganz anderer Ansicht. Von Wright gibt zwei Hauptgründe für seine These. Erstens: die Hermeneutik hebt den Unterschied zwischen den Kultur- und Geisteswissenschaften einerseits und den Naturwissenschaften andererseits hervor. Die Betonung dieses Unterschiedes widerstreitet der Auffassung von der Einheit der Wissenschaften. Zweitens handelt es sich von Wright zufolge bei analytischen Philosophen, die sich mit Fragen der Interpretation und des Verstehens beschäftigen, wie beispielsweise Quine, Seilars und Davidson, um Naturalisten, während die Hermeneutiker seiner Meinung nach bestrebt sind, den Menschen als geschichtlich-gesellschaftliches Wesen zu erfassen. Das Problem mit den beiden Argumenten von Wrights ist aber, daß sowohl analytische Philosophen als auch Hermeneutiker, wie bereits erwähnt, ganz verschiedene philosophische Auffassungen haben. Nicht alle analytischen Philosophen vertreten die Idee der Einheit der Wissenschaft. Vieles hängt davon ab, wie diese Einheit verstanden werden soll. Niemand ist der Ansicht, daß man in den Kultur- und Geisteswissenschaften nach Art der
26
Opening Lecture
Naturwissenschaften Experimente betreibt. Nur sehr wenige behaupten, daß man es in den Kultur- und Geisteswissenschaften mit lückenlosen Gesetzen zu tun hat, so wie in den Naturwissenschaften. (Auch in den Naturwissenschaften ist diese Idee von Gesetzmäßigkeit beinahe ausgestorben - und damit auch die nomologisch-AcAuVxhc Methode.) Unter hypothetisch-AcAukuvcr Methode verstehen manche von uns jedoch etwas ganz anderes: die Hypothesen brauchen dabei nicht den Status von Gesetzen zu besitzen, sondern eher den von Annahmen, die dann über ihre deduktiven Verknüpfungen mit anderen Sätzen im Netz einer umfassenden Theorie geprüft werden müssen. Wolfgang Stegmüller hat darüber in seinen hermeneutischen Betrachtungen über Walter von der Vogelweide geschrieben. Dieser Aufsatz und auch andere Beiträge von Philosophen, die hier an Analyomen 2 teilnehmen, exemplifizieren das, was ich als analytisch-\itTmtneuüsc\\e Studien betrachte. Was von Wrights zweiten Grund für seine These von der Unvereinbarkeit von Hermeneutik einerseits und analytischer Philosophie andererseits betrifft, nämlich den nicht-naturalistischen Charakter der Hermeneutik, so will ich nur das folgende entgegnen. Erstens wird der Quine-Sellars-Davidsonsche Naturalismus nur von einigen analytischen Philosophen geteilt, wahrscheinlich sogar nur von einer Minderheit. Zweitens ist es ganz und gar nicht offensichtlich, daß Hermeneutik mit Naturalismus unvereinbar ist. Wir haben es hier mit einem schwierigen philosophischen Problem zu tun, das nur durch gründliche Argumentation geklärt werden kann. Quine und Davidson behaupten beide, wenngleich auf je verschiedene Weise, daß Verstehen und Interpretation naturalistisch erklärt werden können. (Davidsons diesbezügliche Bemühungen haben, im Vorbeigehen gesagt, ein gewisses Interesse bei Literaturwissenschaftlern gefunden, von dem das kürzlich erschienene Buch Literary Theory after Davidson Zeugnis abgibt. Mir scheint, daß die Literaturwissenschaftler zur Zeit auf der Suche nach einer philosophischen Fundierung ihrer Theorien sind. Derrida hat ihnen da etwas angeboten, was einige der Literaturwissenschaftler attraktiv gefunden haben. Analytische Philosophen haben in dieser Hinsicht bislang sehr wenig angeboten. Hier stellt sich uns eine wichtige Herausforderung.) Ein Fazit, das wir aus meinen Betrachtungen in diesem Vortrag ziehen können, ist, daß analytische Philosophen nicht durch Bezugnahme auf bestimmte philosophische Auffassungen oder Probleme oder auf spezifische Methoden der Begriffsanalyse definiert werden kann, sondern daß sie sich vielmehr durch eine bestimmte Zugriffsweise auf philosophische Probleme auszeichnet, in der Argumente und Begründungen eine entscheidende Rolle spielen. Nur in dieser Hinsicht unterscheidet sich die analytische Philosophie von anderen „Richtungen" der Philosophie.
Dagfinn Follesdal: Was ist analytische Philosophie?
27
Unsere ursprüngliche Einteilung der Gegenwartsphilosophie, mit analytischer Philosophie als eine Richtung neben anderen, ist daher irreführend. Man sollte lieber sagen, daß die analytisch/nicht-analytisch Einteilung quer zu den anderen Einteilungen steht. Man kann analytischer Philosoph sein, und zugleich Phänomenologe, Existentialist, Hermeneutiker, Thomist usw. Ob man analytischer Philosoph ist, hängt davon ab, wie viel Gewicht man auf Argumentation und Begründung legt. Es gibt ζ. B. Phänomenologen, die mehr analytisch sind, und andere, die dies weniger sind. Entsprechend können Philosophen aus allen Epochen der Philosophiegeschichte klassifiziert werden. So ist ζ. B. Thomas von Aquin einer der analytischsten Thomisten. Und Aristoteles, Descartes und wohl alle wirklich großen Philosophen sind analytische Philosophen. (So, wie ich analytische Philosophie definiert habe, ist dies für mich beinahe eine Tautologie.) Lassen Sie mich jedoch noch ein letztes Fazit ziehen. Wir sollten analytische Philosophie nicht nur deswegen betreiben, weil sie gute Philosophie ist, sondern auch aus individual- und sozialethischen Gründen. Wenn wir versuchen, unsere Mitmenschen dazu zu bringen, unsere eigenen Standpunkte einzunehmen, sollten wir dies nicht durch Zwang tun, und auch nicht durch rhetorische Überredung. Stattdessen sollten wir versuchen, die andere Person dazu zu bringen, den betreffenden Standpunkt durch eigenes Nachdenken einzunehmen oder auch zu verwerfen. Nur durch rationale Argumentation, bei der die andere Person als autonomes und vernünftiges Wesen anerkannt wird, ist diese letztere Möglichkeit zu verwirklichen: nur auf diesem Wege kann man im Verlaufe eines gemeinsamen Dialogs vielleicht davon überzeugt werden, daß der eigene Standpunkt aufgegeben werden muß. Dies ist nicht nur individualethisch, sondern auch sozialethisch wichtig. In unseren philosophischen Schriften und in unserer Lehrtätigkeit sollten wir bestrebt sein, unsere Leser bzw. Studenten daran zu gewöhnen, daß Argumente und Begründungen hinsichtlich der Frage, ob man einen Standpunkt akzeptieren soll oder nicht, das Entscheidende sein müssen. Auf diese Weise macht man ζ. B. denjenigen Politikern und sozialen und religiösen Fanatikern das Leben schwer, die Botschaften aussenden, welche keiner kritischen Überprüfung standhalten können, und die gleichwohl leider allzu häufig in der Lage sind, große Massen zu Intoleranz und Gewalt zu verführen. Wie der Herr Wissenschaftsminister in seiner Ansprache hervorgehoben hat, sind solch rationale Argumentation und rationaler Dialog von höchster Bedeutung für eine gut funktionierende Demokratie. In dieser Art von Erziehung des Menschen liegt vielleicht die wichtigste Herausforderung der analytischen Philosophie.
28
Opening Lecture
Literatur Die analytische Sprache John Wilkins'. In: ders., Das Eine und die Vielen. Essays zur Literatur, München 1966. H U S S E R L , E D M U N D : Die Krisis der europäischen Wissenschaften und die transzendentale Phänomenologie, Husserliana Band VI, Den Haag 1954. R U S S E L L , B E R T R A N D : Sceptical Essays, New York 1928. R U S S E L L , B E R T R A N D : Philosophical Analysis. In: ders, My Philosophical Development, New York 1959,216-217. W A I S M A N N , F R I E D R I C H : Was ist logische Analyse? Erkenntnis 8 ( 1 9 3 9 / 4 0 ) , 2 6 5 - 2 8 9 . VON W R I G H T , G E O R G H E N R I K : Analytische Philosophie - eine historisch-kritische Betrachtung. In: Analyomen 1 - Proceedings of the 1st Conference „Perspectives in Analytical Philosophy", hrsg. Georg Meggle/Ulla Wessels, Berlin 1994, 3 - 3 0 . BORGES, JORGE LUIS:
Section I Logic
BERND BULDT
Anmerkungen zum Beweis des zweiten Gödelschen Unvollständigkeitssatzes*
Abstract:
T h e fulfillment of the four so-called derivability conditions, D C l ^ , is crucial for the
validity of Gödel's second incompleteness theorem, G 2 . In 1973, Jeroslov showed h o w to dispense w i t h o n e of these conditions, namely D C 2 , asserting provable closure u n d e r m o d u s p o n e n s . O u r aim is to show w h y it is n o t wise to d o so. Topics to be t o u c h e d on: validity and range of G 2 ; intensional aspects of provable Σι completeness and of G 2 ; the very f u n c t i o n of provable closure u n d e r m o d u s ponens; a n d hereditary properties of provability predicates. 0.
Vorbemerkung
1.
Einleitung
2.
D i e dritte Ableitbarkeitsforderung D C 3
3.
D i e zweite Ableitbarkeitsforderung
4.
Schluß
5.
Literatur
0. Vorbemerkung Zumindest seit den Tagen der Zusammenarbeit von Philosophen und Geometern in Piatons Akademie gilt die Mathematik vielen als paradigmatisches Feld für epistemologische Hypothesenbildung und -prüfung. Hilbert war unbescheiden genug, diese Fragen in die Kompetenz der Mathematik selbst stellen und durch seine Beweistheorie beantworten zu wollen. Wie immer man dies auch beurteilen mag, so scheint sicher, daß der modernen Logik eine zentrale Stellung innerhalb solcher erkenntnistheoretischer Untersuchungen beigemessen werden muß, und daß dabei den Gödelschen Sätzen zweifelsohne eine Schlüsselrolle zukommt. Doch entgegen diesem relativ unbestrittenen Sachverhalt ist die philosophische Analyse dieser Sätze noch immer ein Sorgenkind. Dies liegt ζ. T. schlicht darin begründet, daß rein technische Aspekte, insbesondere bezüglich des zweiten Gödelschen Satzes, noch nicht hinreichend verstanden sind, so daß sich weitergehende Versuche beinahe zwangsläufig auf arg unsicherem Boden bewegen. Die nachfolgenden Ausführungen I gratefully acknowledge the hospitality of the 'University d u Lac' in general a n d that of M i chael Detlefsen in particular and would like to t h a n k the Alexander von H u m b o l d t - S t i f t u n g (Bonn, F R G ) for the fellowship that m a d e possible some of the research b e h i n d this paper.
32
Section 1: Logic
sind daher Teil einer umfassenderen Anstrengung, durch Rückgang auf die technische Ebene ein besseres philosophisches Verständis vorzubereiten helfen. 1
1.
Einleitung
Wie bekannt, skizzierte Gödel in seiner '31 er Abhandlung zwar ein Argument flir seinen sogenannten zweiten Unvollständigkeitssatz über die Unbeweisbarkeit der Widerspruchsfreiheit, nachfolgend kurz: G2, er publizierte aber nie den entsprechenden Beweis.2 Den ersten - und wie man feststellen muß, zugleich letzten - hinreichend ausführlichen Beweis gab Bernays acht Jahre später im zweiten Band von Hilbert/Bernays' Grundlagen der Mathematik? Eine ganze Weile lebte man dann im .naiven Glauben' an den G2, bis Mitte der 50er Jahre zunehmend deutlich wurde, daß der G2 ,formulierungssensitiv' ist: Denn werden deviant konstruierte formale Ableitbarkeitsprädikate verwandt, so kann eine formale Widerspruchsfreiheitsaussage ableitbar werden. Ende der 50er Jahre analysierte Feferman diesen Sachverhalt im ersten Teil seiner Dissertation und kam zu dem Ergebnis,^ daß der G2 — und dies in scharfem Gegensatz zum ersten Gödelschen Unvollständigkeitssatz G l - eine wesentlich intensionale Aussage darstellt: In ihr sind (unter der Annahme von Widerspruchsfreiheit) extensional gleiche Ableitbarkeitsprädikate nicht salva veritate substituierbar. 5 Durch die Arbeiten von Bernays und Löb einerseits,6 von Feferman andererseits, ist aber klar, daß der G2 zumindest unter folgenden Bedingungen, den sogenannten ,Z)erivability Conditions', gilt: 7 Repräsentation oder DC1: 1
2 3
4
6 7
Vcpt-φ
hPrCV1);
Genauer gesagt ist, was unten folgt, Teil einer Ausarbeitung von F u ß n o t e 8 aus Buldt 1993. Eine Darstellung des Hintergrundes, den die folgenden Bemerkungen ζ. T. voraussetzen müssen o h n e immer explizieren zu können, findet der interessierte Leser in Buldt 1993; 1997. Vgl. Gödel 1931, 192ff. Vgl. Hilbert/Bernays 1939, 2 8 3 - 3 2 4 ; 2 1 9 7 0 , 2 9 3 - 3 2 7 . Vgl. aber auch Galvan 1983, 5 8 1 613. Beweisskizzen finden sich u. a. bei Shoenfield 1967, 212f.; M o n k 1976, 305ff.; Smorynski 1977, 839f.; 1985, 43f.; Boolos 1993, 4 6 - 4 9 . Vgl. Feferman 1960. In dieser Formulierung allerdings zuerst Lorenzen 1962; 2 1 9 8 0 , 133. Vgl. Hilbert/Bernays, op. cit.; Löb 1955. Metasprachliche Operatoren sind durch Fettdruck gekennzeichnet; siehe auch A n m . 11.
Β. Buldt: Anmerkungen zum Beweis des zweiten Gödelschen Unvollständigkeitssatzes
33
Distribuierbarkeit des Ableitbarkeitsprädikates oder DC2:
V Ργ(γψί);
ableitbare Σι -Vollständigkeit oder DC3:
V(p G Σ j l· φ
Pr(r(pn);
Fixpunktsatz bzw. Diagonalisierungslemma oder DC4:
3 5 l· δ ο
Pr(r-'5~l).
War damit der Geltungsrahmen für den G2 formal auch hinreichend abgezirkelt, so verblieben doch Fragen; ich nenne zwei. Erstens, wenn es anerkanntermaßen deviante Konstruktionen gibt, die den G2 verletzen, wie steht es dann um Aussagen wie: „Kein widerspruchsfreies und hinreichend starkes formale System kann seine eigene Widerspruchsfreiheit beweisen" ? - eine ^//quantifizierte Formulierung, auf deren Gültigkeit allenthalben in der mathematischen Logik selbst wie auch in philosophischen Diskussionen Bezug genommen wird. Zweitens, da die Bedingungen D C 1+4, die einen G l Beweis erlauben, trivialerweise, so möchte man sagen, erfüllt sind, will man wissen: „Welche der verbleibenden Bedingungen DC2+3 ist die entscheidende?" , welche schließt deviante Ableitbarkeitsprädikate aus und setzt so den G2 in Kraft. Ist es DC2? Oder DC3? Oder sind es beide? In Bezug auf die erste Frage ist festzuhalten, daß bis auf den heutigen Tag und dies entgegen der Auffassung, die die Textbücher suggerieren - Folgerungen, wie die oben erwähnte, nicht unangefochten behauptet werden können. Was man sicher weiß ist, daß unter gewissen Bedingungen (ζ. B. D C 1 4) gewisse formale Widerspruchfreiheitsaussagen nicht ableitbar sind. Aber noch führt keine allgemein konsensfähige und stringente Argumentation von diesem sehr speziellen Unableitbarkeitsresultat zu den vollmundigeren' Proklamationen der „Unbeweisbarkeit der Widerspruchsfreiheit", einer „Unmöglichkeit finiter Widerspruchsfreiheitsbeweise" etc. 8 Sicherlich haben wir, um im Jargon des Krimis zu reden, vielerlei Indizien und auch einen Haupttatverdächtigen; aber es reicht noch nicht zu einer Festnahme, denn kein unabhängiges Gericht würde die vorgelegten Beweise als zwingend genug anerkennen. In Bezug auf die zweite Frage konnte Jeroslov (1973) zeigen, daß im G2-Beweis selbst eine explizite Bezugnahme auf DC2 vermieden werden kann. Damit stand D C 3 oder ableitbare Σι -Vollständigkeit als die entscheidene Bedingung 8
Vgl. Detlefsen 1986, insbesondere ch. IV; Buldt 1993; 1997.
34
Section 1: Logic
fest. Nachfolgend möchte ich versuchen, entgegen der vorherrschenden Auffassung post-Jeroslov, DC2 wieder in seine verlorengegangen Rechte einzusetzen. Meine Gründe dafür werde ich aus einer Analyse der Beweise ziehen, die DC2+3 etablieren.9 Mein Motiv dies zu tun ist, daß ich hoffe durch solche Detailuntersuchungen eines Tages genügend Material zusammengetragen zu haben, um auch die erste Frage abschließend beantworten zu können.
2.
Die dritte Ableitbarkeitsforderung DC3
Beginnen wir mit einem ersten, orientierenden Blick auf den Beweis, der D C 3 etabliert. Die Behauptung ableitbarer Σ]-Vollständigkeit10: Vcp G Σ? l· φ -> Pr( V ) , sieht bei .einfacher Vergrößerung' so aus: Ν Ψ E Δ° I- 3χψ(χ) - > Ρ Γ ( γ 3 Χ Ψ ( Χ ) Π ) ,
was prädikatenlogisch äquivalent ist zu: νψ e AQ l· νχ[ψ(χ) ->· Ρΐ"(Γ3χψ(χ)π)]. Wegen der Deduktionsgleichheit von \/χψ(χ) und ψ(υ) kann man dies umschreiben zu: νψ€Δ0!-ψ(ιι) ^ΡΓ(Γ3χψ(χ)π).η 9
Der beweistheoretische Ansatz innerhalb der mathematischen Logik wurde von seinen Gründungsvätern Frege (vollformalisierte Prädikatenlogik) und Hilbert (moderne Axiomatik) eigens für den Zweck konzipiert, einerseits alle Prämissen einer Behauptung sichtbar zu machen und sie andererseits in ihren Binnenverhältnissen zu beleuchten. Will man folglich Fragen wie „In welcher Allgemeinheit und warum gelten die Gödelschen Sätze" beantworten, wird man tunlichst einen beweistheoretischen Ansatz als Ausgangspunkt nehmen. Dies ist der Grund, warum wir unsere diesbezüglichen Analysen bei den vier Ableitbarkeitsforderungen D C 1 - 4 beginnen lassen. Das Verhältnis zu arithmetischen, rekursions- und modelltheoretischen Aspekten, die, um ein umfassendes Bild der involvierten Phänomene zu gewinnen, natürlich berücksichtigt gehören, kann hier nicht diskutiert werden; für eine Zusammenstellung dieser Ergebnisse vgl. Buldt 1997.
10
Grob gesprochen sind Δο-Ausdrücke quantorenfreie arithmetische Ausdrücke und Σ] Ausdrücke solche, die in Pränexnormalform zusätzlich einen Existenzquantor haben.
11
Eine Formulierung, die augenfällig macht, daß die Variable χ in ΡΓ( Γ 3χψ(χ)" 1 ) für gewöhnliche prädikatenlogische Mittel .verloren' ist, da sie bloß noch als Zahlenwert kodiert tief in der Gödelnummer von 3χψ(χ) vorkommt. Dieser Punkt muß erwähnt werden, da eine technisch saubere Behandlung dieser Variablen einen umfangreichen Beweis- und Notationsaufwand erfordert, der hier und im Folgenden durchgehend unterdrückt wird — für Neugierige: Statt ,,ΡΓ( Γ 3χψ(χ)~')" müßte entweder in Fefermanscher .Punkt'-Notation ,,Pr( r 3x*|/(x) n )"
Β. Buldt: Anmerkungen zum Beweis des zweiten Gödelschen Unvollständigkeitssatzes 3 5
So wie die (einfache) Σι -Vollständigkeit: V
Pr(r3xy(x)~l)
3-Einführung
Folglich läßt sich die Frage nach ableitbarer Σι-Vollständigkeit reduzieren auf ableitbare Δο-Vollständigkeit plus Distribuierbarkeit des verwendeten Ableitbarkeitsprädikats, also DC2. „Wie beweist man ableitbare ΔοVollständigkeit?" lautet demnach die Anschlußfrage. Auch wenn die genaue Antwort von der jeweiligen Binnenstruktur der Δο-Ausdrücke im jeweiligen formalen System J abhängt und so von Fall zu Fall verschieden ausfallen kann, läßt sich sagen, daß die Entscheidung in jedem Fall auf der Termebene fällt. Es ist beispielsweise zu zeigen - und dies kann als ein paradigmatischer Unterfall des gesamten auszuführenden Induktionsbeweises gelten - daß gilt: w
I- f t i . . .tn = η
P r ( r f t , . . .tn = n"·).
oder in Bernays'scher .Schweif -Notation ,,Pr{3x\|/(x)}" stehen, beides notationelle Kurzformen für ,,Pr(sub( r 3xy(x) n ,x,x))", wobei die Substitutionsfunktion sub so definiert ist, daß gilt: sub(gn(3χψ(χ)),χ, ή) =£«(3χψ(η)) generell gilt, daß nur soviel technisches Detail explizit gemacht wird, wie für den Hauptgedanken nötig scheint (für Einzelheiten vgl. Buldt i.V.). Folgende notationelle Konventionen werden verwendet (s.o. Anm. 7): Mit ,sans serifs'-Zeichen geschrieben sind nur formale Ausdrücke, während ihre informellen Gegenstücke in normaler Schriftart bzw. in ,math-italic erscheinen; ein fettes ,n' bezeichnet das der natürlichen Zahl η im formalen System korrespondiernde Numeral ,0SS.. .n - mal.. .SS'; gn(vf) bezeichnet die Gödelnummer des formalen Ausdruckes φ außerhalb und Γ φ Ί das dieser Zahl g»( Pr( r (p n )
(1)
zu beweisen, zeigt man zunächst hilfsweise: (2a)
h φ->· Ρΐ"( Γ ψ, Ί )
(2b)
μφ^ΡΓ(ΓΨ2π),
Ι-φ-> ΡΓ(γψι"')ΛΡΓ(γΨ2Ί) ergibt; und zwar etabliert man dies für solche ψι ,ψ2, für die gilt: h ψι Λψ 2
(5) 12
L· Ρ γ ( Γ Ψ ι
Ί
) Λ Ργ(ΓΨ2Π)
φ,
ΡΓ(ΓφΠ).
Mehr noch, man kann zeigen, daß dieser Umstand in einem gewissen Sinne (primitiv-)rekursiv unlösbar ist.
Β. Buldt: Anmerkungen zum Beweis des zweiten Gödelschen Unvollständigkeitssatzes
37
Mit Kettenschluß folgt aus (3) und (5) dann das gewünschte Resultat, die Zeile(l). Werden Terme behandelt, so wählt man als Zeile (4) in der Regel einen Ausdruck über die Transitivität der Gleichheit von Termen: (4Xerm)
| - r = S A S = t - > r = t,
was für Zeile (5) zu:
(5
T
erm)
^
Ρ Γ (
Γ
Γ
=
3
Π
) Λ Ρ Γ (
Γ
3
=
f )
Ρ Γ (
Γ
Γ
Ρ )
=
führt. Bewegt man sich auf der Ebene der Ausdrücke, läßt man Zeile (4) eine Tautologie sein, ζ. B.: (^Ausdruck)
Ψΐ ° Ψ 2
ψΐ ° ψ 2 , für ο £
{a,v},
was mit D C 1 + 2 zu einer geeigneten ,Tarski-Klausel' in Zeile (5) führt: Ausdruck)
1" Ρ Γ (
Γ
Ψ
Γ )
Ο Ρ Γ (
Γ
Ψ 2
Π
)
Ρ Γ (
Γ
Ψ
1
Ο Ψ
2
^ ) .
Die Rolle von D C 2 wird damit klarer: Die Extensionalität, die hinter (5) steht, sei es die Transitivität gleicher Terme, seien es die ,Tarski-Klauseln' für Ausdrücke, wird mittels D C 2 aus Zeile (4) gewonnen und so auf der Ebene des Ableitbarkeitsprädikates verfügbar gemacht. Und da es - mit etwas Geschick - jeweils gelingt, Wunschzeile (1) in passende wie herleitbare intermediäre Zeilen (2a,b) aufzuspalten, ermöglicht D C 2 so mit dem intensionalen Aspekt im DC3-Beweis fertig zu werden. Damit ist die Distribuierbarkeit von P r ( r . . , n ) zweimal prominent hervorgetreten, und zwar beide Male ganz entscheidend: Einmal, um von ableitbarer Δο- zu ableitbarer Σι -Vollständigkeit zu kommen und ein andermal, um erstere selbst herzuleiten. Bevor wir uns ausführlicher D C 2 zuwenden, ein kurzes Resümee: -
Vermutlich weil es keinen zugänglichen Beweis für D C 3 gibt, der die oben aufgewiesene Abhängigkeit von D C 2 deutlich machte, geriet aus dem Blick, daß D C 2 für den G2-Beweis trotz Jeroslovs Reduktion gebraucht wird. Zwar braucht D C 2 danach nicht länger explizit in der Herleitung des G 2 selbst vorzukommen, wohl aber wird D C 2 implizit mit der Annahme von D C 3 vorausgesetzt, denn allein D C 2 sichert
38
Section 1: Logic
die für den DC3-Beweis benötigte Distribuierbarkeit des verwandten Ableitbarkeitsprädikates. Plakativ: Ohne D C 2 keine DC3! 1 3 Insoweit die Rolle von D C 2 überhaupt thematisiert wird, heißt es gewöhlich, dies sichere die „intensionale Korrekheit" von Pr( r .. , n ) 1 4 bzw. zeige, daß das formale System „korrekt bzgl. freier Variable"15 sein muß. Die Triftigkeit beider Interpretationen für den Augenblick dahingestellt, treffen sie m. E. doch nicht das Wesentliche: D C 2 hilft die dem D C 3 inhärierende Intensionalität in extensionalen Gewässern zu umschiffen.
-
3.
Die zweite Ableitbarkeitsforderung
DC2
Die Jeroslovsche Reduktion (s. o.) legt den Schluß nahe, daß manche Ableitbarkeitsprädikate D C 3 nicht erfüllen. Im Anschluß daran soll zwei Fragen nachgegangen werden: Erstens, wie genau soll es funktionieren, daß D C 3 deviante Ableitbarkeitsprädikate ausschließt? Zweitens, läßt sich eine allgemeine Charakterisierung treffen, hinsichtlich derer voraussagbar ist, ob ein Ableitbarkeitsprädikat D C 3 erfüllt oder nicht? Sollte sich unsere Hypothese „Ohne D C 2 keine DC3" bewahrheiten, so steht von daher zu vermuten, daß in 13
Da D C 3 letztlich eine allquantifizierte Aussage ist (s. o.), allquantifizierte Aussagen im Bereich der Arithmetik in der Regel aber nur mittels Induktion bewiesen werden können, Induktionsbeweise wiederum eine Schlußregel wie den modus ponens zur Abtrennung der Induktionsbehauptung benötigen (dazu s. unten), stand ein solches Ergebnis eigentlich zu erwarten. Bezüglich der .Gegenbeispiele' von Kreisel/Takeuti (1974) liegt u . E . eine ganz analoge Situation vor. Dort ist das betrachtete formale System CFA zwar ,fast schnittfrei' (vgl. ebenda, 16) und erlaubt daher keinen .eigenen' Beweis fur D C 2 (bzw. DC2*, s. u.), wohl aber wird auch hier D C 2 benutzt um D C 3 herzuleiten, nur wird dies dadurch verdeckt, daß die entscheidene Herleitung in Hilbert/Bemays' System Ζ gefuhrt (vgl. ebenda, 24f.) und erst anschließend das Ergebnis nach CFA transferiert wird. Auch benötigt der einzige mir bekannte Beweis für DC3, der nicht beweistheoretisch verfährt, sondern modelltheoretisch, D C 2 (vgl. Kikuchi/Tanaka 1994). Von selbst verstehen sollte sich, daß keine Exklusivstellung von D C 2 behauptet werden soll; so reicht vielfach die schwächere Behauptung einer entsprechenden Monotonieregel: h φ -> ψ -+ l· ΡΓ( Γ φ π )
14 15
PrCV)
und es mag ganz andere Wege geben, der intensionalen Problemstellung im DC3-Beweis zu begegnen. Angesichts der Solovayschen Vollständigkeitssätze erwarte ich jedoch zumindest im gewählten Kontext der Ableitbarkeitsbedingungen nichts grundsätzlich Neues (was, zusammen mit der Ausführung von Anm. 9, erklärt, warum ich den hier gemachten Überlegungen eine gewisse Allgemeinheit beizulegen geneigt bin). Vgl. Macintyre/Simmons 1973, 166. Vgl. Smorynski 1977, 839.
Β. Buldt: Anmerkungen zum Beweis des zweiten Gödelschen Unvollständigkeitssatzes
39
Wirklichkeit auch DC2 den Ausschluß devianter Ableitbarkeitsprädikate besorgt, der DC3 dann nur fälschlicherweise zugeschrieben würde. Und in der Tat, ich meine genau dies läßt sich zeigen. Wegen der Äquivalenz von DC2 mit: DC2*:
ν < ρ , ΐ | ^ Ρ Γ ( ν ) Λ Ρ Γ ( Γ φ ^ ψ Π ) -4. Ρ Γ ( Γ ψ π ),
kann man DC2 auffassen als ableitbaren Abschluß unter modus ponens, kurz: mp, und auch so beweisen; und zwar wie folgt. Eine Anwendung von mp ist letztlich die Konkatenation einer Herleitung für φ: (αι,α 2 ,...α„_ι,φ) mit einer Herleitung für φ
ψ: ) . 3)" is a theorem in the calculus of tense-logic; and, when the unit of time is a day, the principle that ρ is true-at-ί iff "one-day-ago p" is true-at-ί + 1 is embodied in tense-logical semantics. The most natural way to formulate this is that p, uttered at t, is true iff "one-day-ago />", uttered at t + 1, is true. Here the unqualified expression "is true" does not mean "is true-now", but "is, was or will be true-at-the-time-of-utterance": the truth-value links make truth-atthe-time-of utterance a more plausible candidate for absolute truth than truthnow; and an ascription of truth in this sense is in the tense of timelessness. Tense-logical semantics, as formulated by Prior, is silent about time of utterance. Yet the truth-value links are immediately derivable from it, a fact that in part explains why Prior felt able to ignore utterances made at times other than the present. The truth-value links are what prompts us to adopt the notion, common to Frege and to many other philosophers, of propositions with immutable truth-values. Any speaker of the language must grasp those links; on his grasp of them depends his ability to store information acquired at one time and later expressible in a different way. The links are not ignored by tense-logic, but only formulated differently; but it is not the weight of philosophical tradition that causes the formulation in terms of variable truth-value to irk us with a feeling of the unnatural. It is, rather, the unreflective tendency of our thought. The tense-logical formulation asks us to regard different propositions as linked by truth-values-at-distinct times; but the links are easier to explain if we suppose that we are not really dealing with different propositions. Hence, if propositions are to be identified by the conditions for them to be absolutely true, this identification of absolute truth with truth at the time of utterance leads immediately to propositions whose truth-values cannot vary. type sentence 'It was formerly the case that X' is straightforwardly a function of the semantic value of X. T h e notions of absolute truth and falsity, which attach to particular utterances, are not the semantic values fundamental to the semantic theory. W i t h i n the theory, they are defined in terms of the semantic values of type sentences, just as they are in T2; an account of how we arrive at an understanding of those semantic values is not part of the theory, but a preliminary to it.
Michael Dummett: Existence, Possibility and Time
57
Are we still discussing semantics? If so, is what is at issue merely how convenient, or how natural, one formulation is as against another? We have been brought to the verge of metaphysics; and what has brought us there is the word "proposition". Metaphysics is concerned with the nature of reality. Reality is determined by what facts there are; and, despite much disagreement about what propositions are, there is widespread agreement among philosophers that facts are true propositions. Tense-logic does not, of course, deny the reality of the past, nor need it deny that of the future: there are plenty of true propositions - propositions that are true-now - in the past and future tenses. According to it, however, propositions change in truth-value; different propositions are true at the present time from those that were true recently and from those that will soon be true. And so reality itself changes; there is even constant change in what objects it contains. Well, that is true, even obviously true, isn't it? Just that is surely what constitutes time. Is not tense-logic faithful, in this regard, to how things indisputably are? The conception of propositions as timelessly true or false yields a different picture. To say that true propositions are timelessly true is to say that the facts obtain timelessly: reality is in itself immutable. For the proponent of this picture, our impression that reality changes is merely the effect of our shifting perspective upon it. As we travel across country, we may successively say, "It is very hilly" and "It is very flat", without thereby contradicting ourselves, because the propositions we express depend upon where we are at the time of expressing them; and in the same way, it is argued, the propositions we express at different times depend upon when we express them. Once we have grasped the meanings of the past and future tenses, the proponent of an immutable reality maintains, we can no longer coherently retain the picture of reality in flux. Facts, on his view, have no tense. This is a metaphysical view. If we wish to reconcile it to the tense-logical semantics, we must divorce the basic semantic units of the language from the propositions they express; the one does not correspond with the other. There is a strong impulse not to allow such a divorce, but to require that our semantic theory should take, as its basic units, whatever expresses a proposition. If we yield to this impulse, and also conceive of propositions as having immutable truth-values, specifications of time cannot be regarded as operators on the semantic units. The simplest way of construing them is then as arguments to two- or more-place predicates. Every expression for a transitory state of an object is, on such a theory, a two-place predicate, one argument being the object and the other a time, even if the temporal argument appears in the sentence only in the form of the tense of the main verb. What we call a transitory state, or the possession of a transitory property, is therefore, from the viewpoint of
58
Section 1: Logic
this semantics, in reality an enduring relation between an object and a time. There is no such one-place predicate as " . . . is bald" or " . . . is asleep"; there are only the two-place predicates " . . . is bald a t . . . " and " . . . is asleep a t . . . ", where the second argument-place is to be filled by a term denoting a time. Baldness is not, properly speaking, a property that someone may acquire, nor sleep a condition into which he may fall: both are relations a subject may have, absolutely, to certain times and not to others. If we adopt a tenseless semantics of this kind, a temptation arises to think that we should admit as well formed only those sentences in which the verbs have tense only as a matter of grammatical courtesy: those, namely, which are either in the tense of timelessness, or contain a non-indexical specification of time. This would involve a very radical reconstruction of natural language, not merely refashioning its sentences, but depriving them of much expressive power. From a strictly semantic standpoint, however, there is no need for so drastic a remedy, provided that it be allowed that a basic unit of the theory need not be a strictly linguistic item, but a pair consisting of a sentence and a time;1'* such a pair will, on this version of the theory, be what in general expresses a proposition. The semantics can then admit sentences containing at most an indexical indication of time. In order to establish the truthvalue links, an equivalence relation of expressing the same proposition may be defined over these pairs; pairs that express the same proposition must have the same truth-value. In the tenseless semantics, there can be no temporal qualification of the existential quantifier; times enter only as the arguments, explicit or implicit, of relational expressions. Nor can there be any such one-place predicate as " ... exists" that can apply to an object at one time and not at another: existence is not a transitory property, since, from the viewpoint of this semantics, there are no transitory properties, properly so called. There is, however, a relation between objects and times expressed by " ... exists at... ": this is an enduring, or, rather, a timeless relation, since it admits no further temporal qualification. To what, in a tensed existential statement, does the tense logically attach? If the statement is general, then, as we should ordinarily express the matter, it of course says that there are, at the time in question, objects having certain properties. When these are transitory properties, the tense may attach to the predicates by means of which they are ascribed. For instance, in "There is a member of the Department who speaks Malay", the present tense attaches to the predicate " . . . is a member of the Department and speaks Malay", since the
Or, to accommodate non-temporal indexicality, a triple of a sentence, a speaker and a time.
Michael Dummett: Existence, Possibility and Time
59
statement, if true, would not have been so if the Malay-speaker had resigned his post: to falsify it, no individual would have had to go out of existence. But in "There are no longer any dodos", it is existence, not dodohood, that is temporally qualified, since being a dodo is an enduring property; the sentence means "There are no dodos which exist at present". The tenseless semantics views objects, not as persisting through time, acquiring some properties and losing others, but as having temporal extension; every genuine property is possessed absolutely. The distinction between the two kinds of property nevertheless remains as sharp as ever. What we have been calling an enduring property is, from the standpoint of the tenseless semantics, a property involving no temporal specification: being the daughter of King Henry VIII, for example. What we have been describing as a transitory property, on the other hand, is not a property at all, but a relation between an object and a time: the relevant property is that of standing in that relation to a given time. In this semantics, the analogy between tensed and tenseless existence is lost. This does not vindicate Geach, however, since there remains a large difference between the property of being, say, bald at t and that of existing at t. An object that comes into being at one time and ceases to exist at a later time is being thought of as we think of a river as it is at any one time. We often speak of the river in temporal terms, saying that it is turbulent in one reach but becomes placid later (i. e. nearer its mouth). Though we may speak of it as losing the property of turbulence and acquiring that of placidity, the river, as such, is not, properly speaking, either turbulent or placid: it is turbulent in one reach, placid in another. Adjectives such as "turbulent" and "placid" characterise, not the river, but stretches of it. In the same way, we speak of an aging actress as losing her beauty; but, from the 'tenseless' viewpoint, she merely has the timeless properties of being beautiful at a certain period and of not being beautiful at a certain later one. The adjective "beautiful" characterises a temporal segment of the spatio-temporal object that, from this viewpoint, constitutes a woman (or perhaps we should say 'a woman's life'). The verb "exists", by contrast, does not characterise either a stretch of a river or a temporal segment of a person: in each of its stretches, the river exists, and a woman exists in every one of her temporal segments. A river has a certain course: certain places are on that course, others are not. We can express the fact that the river runs through one place, but not through another, by saying that the river exists at the one but not at the other; but we are not thereby describing the character of the river at the one, still less at the other. Likewise, on the tenseless' view, an object has a certain temporal extension, from one time to a subsequent one, and we shall say that the object exists at any period
60
Section 1: Logic
within that interval; but, in saying that, we are not describing the character of the object during that period, that is, of that temporal segment of it. According to this semantics, propositions are tenseless: one and the same proposition may be expressed, at different times, by sentences in different tenses. Hence, if facts are true propositions, the facts that constitute reality are tenseless in turn: though they involve times and places, they do not hold good at particular times any more than at particular places, but simply hold good, absolutely. We observe reality from shifting temporal perspectives; but in reality itself there is no distinguished temporal point of view - it embraces all there is, has been or will be without containing any now to distinguish past from present or present from future. The true account of tensed existence therefore appears to depend on which, if either, of the two semantic theories is correct. How is this to be judged? The primary task of a semantic theory is to deliver the right truthconditions for sentences of our language, given that we can agree what these are. The sketches given here of the two theories may leave certain problems unresolved, but there is little doubt that both could be made to yield a workable account of tensed sentences. If this conjecture is sound, neither theory can claim on this score to be more correct than the other. More may be required of a semantic theory than this, however. An epistemological demand may be made on it; a metaphysical demand may be made also. The epistomological demand is that it yield a correct representation of our understanding of our language and our way of arriving at that understanding. Tense-logic appears to fulfil this requirement, and the tenseless semantics to fail it. If no more can be demanded of a semantic theory than its delivery of correct truth-conditions and a correct representation of our grasp of the language, tense-logic must carry off the prize. But, it seems, it may also be demanded that it satisfy a metaphysical requirement, namely that the semantic theory should give a correct representation of reality as it is in itself - the reality that renders our statements true or false. Since the way we think need not correspond to the way things really are, it may be that the 'tenseless' semantics, though not accurately representing our unreflective understanding of our language, gives the better representation of reality. That can be so only if the metaphysics it suggests is coherent. It is unnatural to us because we always perceive the world from a particular temporal viewpoint. But, then, we never perceive the world save from a particular spatial viewpoint; yet the conception of objects as disposed in a three-dimensional space with no distinguished point of origin or axes comes very naturally to us. Indeed, the 'tenseless' metaphysics is often criticised as involving the error of "spatialising time". Whence this difference?
Michael Dummett: Existence, Possibility and Time
61
T h e truth that we perceive the world from a spatial viewpoint is not a genuine analogue to the truth that we perceive it from a temporal viewpoint. T h e one truth is that at any one time we perceive things from a particular position in space; the other that at any one time we perceive things only as they are at that time, and that is not a real analogue. N o r is it more than approximately true: the only accurate formulation involves both space and time at any one time we perceive only what has transmitted sensory stimuli (light, sound, smell) to wherever we are at that time. It is not analogy, but duality, that fails: for it does not hold that at any one place we perceive whatever has transmitted sensory stimuli to that place at any time that we were there. I will here interpose the first few exchanges in a debate between two imaginary philosophers, Professor A d a m and Dr. Bede. Adam: We view the world from different spatial perspectives at different times, and from different temporal perspectives at different times; but, to a restricted degree, it is up to us from which spatial perspective we view it at a given time, whereas our temporal perspective at that time is determined as being from that time. The tenseless metaphysics is incoherent if the picture of reality it embodies is that of a static four-dimensional universe through which our consciousness travels along the temporal dimension, for its whole point was to represent reality as tenseless. To represent reality as tenseless is to deny that it needs to be characterised by means of temporally indexical expressions: there is no fact that requires to be expressed by means of the adverb "now". But to travel along the temporal dimension is to be at one temporal location in the static four-dimensional universe at one experienced time and at another such location at a later experienced time; there would then be a fact about the temporal location we are occupying now. Bede: This is not the right image at all. Rather, we should compare our apprehension of reality from varying temporal perspectives to an array of objects photographed simultaneously from a variety of angles. Each camera has a different spatial perspective, determined by its own location; but there is no sense in which the location of any of the cameras constitutes a feature of the objective scene they record. Likewise, we observe reality from differing temporal perspectives, and these observations do not combine to form any unified perception of it, but occur at different times. These times, however, are merely locations along the same temporal dimension as all other events, rather than in an experienced time in which our perceptual faculty moves along the physical dimension. Adam: We cannot take a static four-dimensional structure to be more than a representation of the universe throughout its history. We cannot take it to be the universe, as it is in itself, precisely because it would not be in time: there would be no intrinsic difference between any one of the four dimensions and the other three. We can form the conception of a three-dimensional space
62
Section 1: Logic
in which we are not located by analogy with a two-dimensional space, such as the space of the heavens, in which we are not located. Here by "the space of the heavens" I mean the space shown on star maps, position in which is determined by right ascension and declination. But we can make no sense of the notion of observing a temporal process as occurring in a time in which we are not located. To observe it as it really is we must observe it as taking place in time, which means that our observations can be temporally correlated with the stages of the process we observe. We may of course be aware that the time in which we make our observations differs from that in which the process occurs, as when we observe a solar eclipse or watch a recording of an earlier event. We can even construct fantasies according to which the two times were not comparable with each other. But, if we are to observe the process as it really is or was, we must observe it as taking place in time - the time in which we observe it. The tenseless universe cannot be the universe as it really is. Bede: If a process is of sufficiently short duration, we can observe it as taking place in time, with one part of it preceding another, without our observation of it being divided into stages corresponding to the stages of the process. There is a clear difference between noticing that something has changed or moved and perceiving it change or move. If you see something, say an insect, make a sudden brief movement, you are aware of the direction of movement, just as you are when you see a stone hurtling towards you. You are therefore aware of the movement as a temporal process, since, if not, you could not tell the direction (let us suppose that the insect moves from one hidden spot to another); we are not here concerned with a case in which the movement is so rapid that you see only a blur. You observe the movement as a temporal process, but you observe it only as a whole; there is no passage of time of which you are conscious during the duration of the movement, and so your observation has no stages that can be matched to the stages of the movement. It is because we observe processes in this way that our present observations need sometimes to be reported by means of verbs expressing change or movement. I acknowledge that it is a giant leap indeed from such a case as this to the unimaginable conception of an apprehension not itself occurring in time of the entire history of the universe as a process unfolding in time; but, for all that, the case familiar to us provides a model for that which we cannot imagine. Since such a model exists, it cannot be said that a tenseless universe one for which the question "Which stage of its history is taking place now?' does not arise - would be an atemporal universe, and hence not the one we inhabit, but at best a representation of it. W e have plunged deep into metaphysical waters, and have considered only objections that might be made to the metaphysics that appears to accord with the tenseless semantics, not those that might be made to that yielded by the tenselogical semantics. About the latter we may pause to complain that it treats the
Michael Dummett: Existence, Possibility and Time
63
present, and indeed the segmentation of past and future history into times, as given, rather than as being constructed, as in fact it is. It is of course on this fact that relativity theory rests, although the fact yields that theory only with the aid of the postulate of the constancy of the speed of light. To complete our present line of investigation, we should need an entire philosophy of time; and that is too ambitious a project for our restricted initial enquiry into the tensed use of the verb "to exist". I have frequently argued - indeed at book length - that the determination of a correct semantics is the proper route to the resolution of metaphysical disputes. Here, however, we have reversed this direction. On the present suggestion, a semantic theory needs not merely to deliver the right truth-conditions for our utterances: it must also be faithful to our manner of grasping their meanings, and, in addition, to the character of the facts in virtue of which they have the truth-values that they have. Since how things are in themselves may diverge from the way we apprehend them, may it not be that no semantic theory can fulfil both requirements? To fulfil the second, we must argue from metaphysics to semantics: not from the structure of our language and hence of our thought to how we must conceive reality to be in itself, but from how we must conceive it to the correct representation of the structure of our language. Let us return from metaphysics to semantics, and then judge whether this is the right direction of derivation. We have seen that the semantics that treats adverbial indicators of time as arguments to the predicate need not debar the use of indexical indicators; but a distinction needs to be made among them. The word "now", and other indexical words and expressions such as "yesterday", "tomorrow", "last year", "next month" and "two weeks ago" are temporally rigid. The pronouncement "The hurricane that is nearest to the coast will be known as 'Archimedes'" is ambiguous: it could be taken to mean that, at any time, the word "Archimedes" was to be used to refer to whichever hurricane was then nearest to the coast. The ambiguity would be removed by the insertion of the word "now": "The hurricane that is now nearest to the coast will be known as Archimedes'", could only lay down that the name "Archimedes" was to be used to refer to the hurricane nearest to the coast at the time of speaking. If I truly say, "Margaret was asleep two hours ago", I utter a sentence which, if uttered in one hour's time, might result in my saying something false; but, in virtue of the rigidity of "two hours ago", it would not be correct to say, "In one hour's time it will not be the case that Margaret was asleep two hours ago". Even tense-logic will not admit this as correct: tense-logic does not deal in temporally rigid expressions. There is unquestionably a sense of "fact" in which, if it is now the fact that Margaret was asleep two hours ago, that will always remain a fact.
64
Section 1: Logic
A sentence containing a temporally rigid but indexical indicator of time thus expresses an immutable fact, even though which fact it expresses depends on when it is uttered. Tense-logic, by contrast, deals only in temporally flexible expressions such as "two hours earlier": I may be able truly to say, "One hour later it will not be the case that Margaret was asleep two hours earlier". Prior insisted that indicators of time have to be treated as sentential operators if they are to be able to be iterated, and that iteration is essential if we are to be capable of representing compound tenses such as the future perfect. 15 But the argument is fallacious. Treating temporal indicators as arguments of predicates does not exclude the use of flexible indexical indicators, either; it is only that they have to be regarded as functional expressions carrying a new argument-place in which a further temporal indicator can be inserted. So treated, they are capable of indefinite iteration. In the 'tenseless' semantics, all indexical indicators of time, whether rigid or flexible, may be regarded as denoting functions. The distinction between rigid and flexible ones is apparent only when they occur within the scope of another temporal indicator. Considered as complete utterances, therefore, the sentences "Margaret was asleep two hours earlier" and "Margaret was asleep two hours ago" both express a proposition true just in case the Margaret referred to was asleep two hours before the time of utterance. The sentence may supply the argument of a flexible indicator; if it does so by means of another flexible indicator, an argument must be sought for that. 16 If the sentence does not supply one, the time of utterance must be taken as argument. But the argument of a rigid but indexical indicator must always be taken as the time of utterance; any further temporal indicator is therefore as idle as it would be if it sought to supply an argument to a specific time denoted by a date or hour. The tenseless semantics is founded on the principle that the proposition expressed by an utterance may depend on the time of the utterance; but this does not of itself determine which utterances express the same proposition. Does "Margaret is asleep", said at a certain time, express the same proposition as "Margaret was asleep two hours ago", said two hours later? If a proposition is what Frege called a thought (Gedanke), the answer is "No". He took " 16
These include the pluperfect ("had happened"), the past future ("was going to happen") and the past future perfect ("would have happened" in one of its meanings). An example would be "Half an hour earlier, Margaret had been asleep two hours earlier than that"; a tense-logical regimentation of this is "It is the case half an h o u r earlier that [it is the case two hours earlier that (Margaret is asleep)]". N o t e that w h e n the temporal indicators are regarded as sentential operators, "two hours earlier" lies within the scope of "half an hour earlier", but, when they are regarded as denoting functions of times, "half an h o u r earlier" serves to specify the argument of the function denoted by "two hours earlier".
Michael D u m m e t t : Existence, Possibility and Time
65
as a necessary condition for two utterances to express the same thought the impossibility that anyone should suppose them to have different truth-values, given that he grasped the thought expressed by each; but obviously someone could doubt this of the two utterances in question, even if he had been, and remembered being, the speaker on both occasions, but doubted that the one occurred two hours before the second. It cannot plausibly be maintained that, to grasp the thought expressed by a tensed sentence he utters, a speaker must know what time it is. Now do metaphysical principles go to determine which semantic theory is correct?17 We have been treating the metaphysical consequences of a semantic theory as being mediated by the concept of a proposition and the principle that facts are true propositions. That concept formed our bridge from semantics to metaphysics; but the fact is that it is inessential to a semantic theory. Such a theory must lay down what is to be taken as a basic semantic unit within the theory, in the sense of that which the sentential operators govern. Such a unit is, however, a linguistic entity, regarded as having as semantic value a truth-value, absolute or varying from point to point of some space; the question when, if ever, the same proposition is expressed by different utterances of such linguistic units, the same or different, the semantic theory does not need, for its own purposes, to decide. The semantics must indeed stipulate the truth-value links; but the notion of a proposition is not needed for this. The demands of metaphysics may be sidestepped if the semantic theory declines to traffic in the notion of a proposition. Tense-logic could be expounded without appealing to this notion: the fundamental semantic units are statements, considered as expressed by type sentences, and these need not be identified with propositions; nothing need to be said about reality as it is in itself or about what constitutes the facts it comprises. In such a case, no more can be claimed for its treatment of temporal existence than that it represents the way we ordinarily think about it, in consequence of the manner in which we acquired our language. As for the tenseless' semantics, that appears threatening if we believe that it requires the extrusion from our language of all indexical indications of time; there then appear to be thoughts that it does not allow us to express. We have seen, however, that the belief is an illusion; what facts there are remains, in this regard, a question for metaphysics that semantics cannot settle. The notion of a proposition is either a metaphysical one or an epistemological one: it is not properly a semantic one. We did not after all discover a 17
I am indebted to an excellent article, ' O n Priors Analysis of Tense', by P. Percival, of which the author kindly sent m e a copy; I am afraid I do not know whether it has been published or not. Despite its great merits, the article suffers from being a salient example of the failure to draw any distinction between semantics and metaphysics.
66
Section 1: Logic
route from semantics to metaphysics, nor a requirement that metaphysics can impose on a semantic theory. If I say, "Margaret was asleep two hours ago", and you subsequently report my having said that at that time, you will do so in the words "He said that Margaret had been asleep two hours before". All will understand what my words had been, and all will know what thought I then expressed (in Frege's sense of "thought"); but none can any longer think that thought. 18 Memory is the retention of information; but the information is not always embodied in the same thought as that which embodied it when first acquired. Now if God is not in the time in which our history unfolds, he cannot ever think that thought, any more than he can ever think the thought I express by "I am lost"; his omniscience cannot consist in his thinking all true thoughts, but only in his knowing, of every thought, whether or not it is true. There are evanescent thoughts: thoughts that can be thought only at certain times. When such thoughts are true, do they constitute evanescent facts, or are all facts tenseless? Not all philosophers who have held that facts are true propositions have used the term "proposition", as Frege used "thought", as applying to something in the realm of sense: they have often meant something in the realm of reference, to which considerations about a speakers judgements of truth-value are quite irrelevant. And so we come back to a fundamental metaphysical question: in what sense of "proposition" is reality constituted by true propositions? We have not answered these questions; all we have discovered is that it does not appear to be within the power of semantics to answer them.
References
M.: Existence. In: Humans, Meanings and Existences, ed. D. P. Chattopadhyaya, Jadavpur Studies in Philosophy, V, Delhi 1983. Reprinted in D u m m e t t 1993. D U M M E T T , M . : The Seas ofLanguage, Oxford 1993. EVANS, G.: The Varieties of Reference, Oxford 1982. EVANS, G.: Does Tense Logic Rest on a Mistake? In: G. Evans: Collected Papers, Oxford 1985,343-363. GEACH, P. T.: W h a t Actually Exists. Proceedings of the Aristotelian Society, supplementary vol. XLIII (1968), 7 - 1 6 . KRIPKE, S.: Naming and Necessity, Oxford 1980. MACKIE, J. L.: The Riddle of Existence. Proceedings of the Aristotelian Society, supplementary vol. I (1976), 247-267. DUMMETT,
18
This is due to the indexicality of the phrase "two hours ago".
Michael D u m m e t t : Existence, Possibility and Time
67
G. E.: IS Existence a Predicate?, Proceedings of the Aristotelian Society, supplementary vol. XV (1936), 175-188. Q U I N N , W A R R E N : Abortion: Identity and Loss. Philosophy and Public Affairs 13 (1984), 24-54. S T I R T O N , W I L L I A M R . : The Logical Status of "Exists". Proceedings of the Aristotelian Society X C V ( 1 9 9 5 ) , 3 7 - 5 0 . MOORE,
ANDR£
FUHRMANN
Travels in Ontological Space*
1. 2. 3. 4.
Background and Introduction Contraction Finding (Good) Examples References
1.
Background and Introduction
Ontological spaces. Ontologies, in a pre-systematic sense, are possible collections of objects of a certain kind. To restrict attention to possible collections is a minimal attempt at shunning triviality. Thus, if A is a collection of objects, then the collection consisting of A together with some object b may not be possible because some objects in A may exclude the presence of b. By the same token, A may not be possible without containing c; the presence of some objects in A may require the presence of c. A relation of requirement arises in many contexts. For example, sets require their members, things require their parts, actions require preceding actions to establish necessary preconditions, the truth of certain sentences requires the truth of certain others, and so on. A collection of objects is in a natural sense incomplete and indeed impossible unless it contains all objects required for their joint existence. In other words: a collection of objects may fail to constitute a proper ontology unless it is closed under the requisite relation of requirement. Requirement, in this general sense, has always captured the attention of philosophers. A particularly deep study of this notion can be found in the third of Husserl's Logical Investigations (Husserl 1913). For a more recent study of requirement relations see e.g. Fine (1991). Requirement, as we shall use the term here, has also been investigated in computer science: in database theory requirement arises as a special case of the notion of functional dependency.
" Thanks are due to Peter Simons, Graham White and especially to Barry Smith for helping to improve an earlier version of this paper.
Andre Fuhrmann: Travels in Ontological Space
69
It does not take much formal machinery to fruitfully study the formal essence of requirement relations. The simple notion of a closure system will suffice for our purposes. Let J be a family of subsets of some set X. The family J is a closure system on X just in case it is closed under intersections and contains X: (Intersection)
P | Ά £ J, for every nonempty Ά C J
(Top) {Notation: Capital roman letters, A,B,C,.. ,,Χ ,Υ,Ζ, (sometimes decorated) denote subsets of some domain U; calligraphic capital letters, Λ, 'S, C, • • -,Χ,Ύ, are reserved for families of subsets of U; lower case roman letters, a,b,c,..., range variably over elements of the domain.) An operation : p(X) —> p(X) is a closure operation on a set X, if it satisfies three conditions (for all A, Β C X): (Reflexivity)
ACÄ
(Monotonicity)
A C B, if A C Β
(Idempotence)
Ac
A
Because of a well-known bijective connection between closure systems and closure operations (see e. g. Birkhoff 1967, ch. V, Theorem 1), it is purely a matter of convenience whether a family of sets is studied qua closure system or qua system of closed sets. We shall here give preference to the latter option. Closure systems are everywhere: they arise naturally not only in all branches of mathematics but in just about every field of inquiry. Here we use closure systems to represent matters of ontology. To tune our terminology to that purpose a closure system will be referred to as an ontological space·, an ontology is a point in ontological space, i. e. a closed set. (The terms are roughly due to Fine (1991).) Travelling in ontological space. Moves in ontological space - transitions from one ontology to another - proceed by expanding or by shrinking or a by mixtures of both. Transitions by expanding pose no problem. To expand a given ontology Λ by some object b, it suffices to form the union of A and b and then to close: A\j{b). Shrinking, i. e. contracting an ontology can pose a problem. To illustrate, consider a "small" ontology A=
{a\,a2}
70
Section 1: Logic
such that a\ and a-i jointly but not separately require some object b\ (*)
b e A but neither b € ü\ nor b € Hi
(We abbreviate {a} to a.) Which ontology should be the result of shrinking A just enough so as not to require & Should a\ or a2 or both be absent from the ontology that is the most like A except for not containing The situation described by (*) illustrates how the condition o f "maximal compactness" (of a closure operation), if be A, then 3a e A such that
bea
may fail. We shall observe below that contraction is as simple (and relatively uninteresting) an operation as expansion in any ontological space generated by a maximally compact closure operation. Accordingly, a theory of contractions will better be developed with a view towards closure operations that fail to be maximally compact. To resolve the resulting choice situations we need to assume further that the domain has some value structure, i. e. that some objects or collections of objects are more valuable than others. In recent years a number of researchers have investigated the problem of contraction with respect to a particular kind of ontologies, viz theories. Theories are sets of sentences closed under a relation of logical consequence. Most relations of logical consequence are not maximally compact; and in any given context of inquiry we may assume that some sentences are more valuable for the purpose of inquiry than certain others. Thus, here is a case where choice situations can arise and there is a prospect for resolving them in a reasoned manner. Another family of examples of not maximally compact ontologies are mentioned at the end of this paper and more fully described in Fuhrmann (1997b). The main task of the present paper is to transfer a representation theorem due to Carlos Alchourron, Peter Gärdenfors and David Makinson, "AGM", (Alchourron/Gärdenfors/David Makinson 1985) to the general setting of abstract ontologies. The transfer is a corollary to earlier work, reported in Fuhrmann/Hansson (1994), generalising the results of A G M . In nuce, the transfer becomes possible by suitably generalising the representation theorem of A G M such that the structural properties of propositional languages need not be tapped. In the present paper results are stated without proof; full arguments are given in Fuhrmann (1997b). The partial meet solution to the problem of contraction - as explained in a moment - rests on a simple idea. If an ontology A is to be contracted by some object b, then we start by considering the family of all inclusion-maximal
Andre Fuhrmann: Travels in Ontological Space
71
subsets of A that do not contain b. Each of these remainders is an ontology (a closed set) that fits the description "as much like A except for not containing b". If contraction is to be functional, one needs to press on and ask: which one of these is the "right" ontology? A choice has to be made. But unique choices are notoriously difficult. One should allow for the possibility, that more than one remainder is, in some sense, closest to the original ontology. Thus we propose that the new, contracted ontology consists of all those objects that are common to all closest remainders. It will be shown that this solution to the contraction problem can be completely characterised by a set of independently plausible conditions on contraction operations. Given an ontological space, any mapping in that space is called a transition fimction. Two transition functions τι and τ-χ are equivalent if τ\ (A) = X2(A), for every ontology A. The (unique) expansion operation together with a contraction operation satisfying the conditions mentioned in the Theorem below constitute a functionally complete set of transition functions for any ontological space. That is to say, for any transition function there exists an equivalent transition function which is a sequence of expansions and contractions. (In the "worst case" one can always contract to the empty ontology and then expand to the target ontology.) As pointed out earlier, expansions pose no problem beyond that of specifying a suitable closure operation; here we assume such an operation as given. Hence, for a complete theory of transition functions, it suffices to study contractions only. In general, there will be more than one transition function from a given ontology to some other ontology. Some of these equivalent transition functions will be more direct or efficient than others; others will be more roundaboutish. This opens the prospect of studying the domain of transition functions from the viewpoint of, say, computational complexity - a prospect of some practical importance which will be left unexplored here.
2.
Contraction
The partial meet representation. Whenever an object b is contained in the closure of a set A {b e A), we say that A requires b (the term is taken from Fine 1991) and from now on mostly write: A —> b. More generally, we shall make free use of the convention (Req)
A —• Β if and only if Ä η Β φ 0
(In the literature on relational databases one finds a preference for the "conjunctive" convention, Β C A, as encapsulated in the so-called Armstrong ax-
72
Section 1: Logic
ioms for functional dependencies; see e.g. Ullman 1988, 384.) Notation is further simplified by writing (A, B) (usually omitting brackets) for A U Β and (A, b) for (A,{b}) if these expressions occur as terms of the requirement relation; empty terms are omitted, as in —>A. Thus, —>a is another way of saying that a 6 0. Objects required by the empty set will be called ubiquitous because they are present in every ontology - in this sense they may also be called necessary. Note that the following two properties follow from the definition (Req) of the requirement relation: (Dilution) (Cut)
if A —• C, then
A,B—*C
if A, b —> C and A —> b, C, then A —> C
For each pair (A, B) of subsets of the domain we say that a set X of objects is a remainder ofA after completely removing Β from A in a minimal way (notation: X € ALB) if and only if (a) X C A, (b) X B, and (c) for all Y: if XcY CA then Y B. A short calculation reveals that every remainder of an ontology is itself an ontology. Further, a family of remainders is empty just in case some of the objects to be deleted are ubiquitous whence undeletable: A±B = 0 if and only if —>B Since the remainder operation leaves us with a family of ontologies to choose from, we need some means of representing such choice. The simplest and most general way of doing this is to introduce a selection function which picks out "preferred" ontologies from a family of remainders. By a selection function (for a set A) we shall mean any function sA : p(fp(A)) —• p(p(A)) such that 0 φ SA{X) C X if X is nonempty, and s^{X) = {A} otherwise. (In the sequel we omit subscripts to s wherever convenient.) Thus, in the principal case when the collection X to choose from is nonempty, the function will select some subset of X. When X is empty, which will happen exactly in the case governed by the failure condition (see below), Sjj will fall back to selecting A D E F I N I T I O N . An operation - : p(U) Χ @(U) —> @{U) is a partial meet (p.m.) contraction over A (in some domain U) if there exists a selection function s^
Andre Fuhrmann: Travels in Oncological Space
73
such that A-B
=
f\s[A±.B)
For the purpose of stating concisely the conditions in the Theorem below, we introduce one further piece of notation, standing for equivalence according to some ontology A: B=AC
iff VX C A:
X — • Β IFFX — • C
It follows that for all sets A, B, and C, ALB = A1C if and only if Β =A C. The following result provides a complete characterisation of contraction in terms of partial meets of selected remainders. T H E O R E M . For every ontology A, an operation — is a p.m. contraction over A if and only if it satisfies the following conditions for contractions of A:
(CI) (C2) (C3) (C4)
if Β =A C then A-B—A-C (Congruence) ( . A - B ) f \ B = 0 unless —>B (Success) A-BC A (Inclusion) if a €LA\A-B, then for some A' such that A- Β C A' C A: Ä Β while A', a —> Β (Relevance)
Some remarks on the C-conditions are in order. Congruence is a "technical" postulate which we pass over in silence here; see Fuhrmann/Hansson (1994) for detailed comments. Success expresses the condition that contractions achieve their purpose unless the set to be removed is badly chosen. Contractions completely remove the specified set from an ontology provided the set to be removed contains no ubiquitous elements. Though the temporal picture is not entirely accurate, one may think of ubiquitous elements as immediately reinstating themselves after they have been retracted. Inclusion requires that contractions do not add to the ontology to be contracted. Contracting an ontology results in a subontology of the original ontology. The condition of relevance is, perhaps, the least transparent of the conditions. Three remarks may provide some intuitive justification.
74
Section 1: Logic
First, given the notion of a remainder set, relevance may be more easily understood if one observes that it is directly equivalent to the condition: if a e A\AB, then there exists a remainder A' G A±B with A - Β C A' and a^j4'. In more words: if a gets removed from A (in the course of retracting B), then some remainder (maximal subontology o(A excluding B) cannot contain a - on pain of requiring B. The second remark continues the first: relevance is the only condition among the four postulates that requires a contraction operation to perform a minimal incision into the ontology to be contracted. If an element gets deleted from an ontology in the process of contraction, then this so because the element would otherwise contribute to requiring (bears some relevance to) the undesirable part of the original ontology. Third, relevance is a powerful principle which allows for a compact presentation of the theory of contractions. For example, the following two conditions (Vacuity)
if A
(Failure)
Β then AC
if — t h e n ^
A-Β
CA-B
are both derivable from relevance. Also, in the presence of relevance (and inclusion) there is no need for an extra requirement that contractions stay within the realm of a given ontological space; that condition, i.e. (Closure)
A- Β is an ontology if A is an ontology
is derivable. The last two observations combine to exactly identify the condition under which a contraction function degenerates to the identity function. For, it follows from inclusion, success and relevance that A = A - B if and only if
3.
or A - ^ B
Finding (Good) Examples
Describing examples of ontologies with contraction functions requires identifying (i) (ii)
a domain of objects to make up ontologies, and an appropriate relation of requirement.
Andre Fuhrmann: Travels in Ontological Space
75
These two steps set up an ontological space, as explained above, in which contraction functions are well-defined. However, contraction functions lose much of their interest if they are applied to domains in which no choice can arise or in which no differences of value are discernible. Such domains give rise to bad examples of our theory of contractions. Recall that we have motivated our abstract theory of contractions by considering examples of the kind where some set, say {a, b}, requires an element c without it being the case that the requirement can be traced down to any single elements of that set; thus, neither {a} nor {b} may require c. Obviously, such examples only arise if the underlying closure operation violates the condition (Maximal Compactness)
if A —> b, then a —> b for some a € A
(Here and in the rest of this paper we revert to the conceptually simpler notion of contracting by a single object. T h e above condition and the following results are easily extended to multiple contractions.) It can be shown that if the closure operation is maximally compact (m.c.) then contraction is definable - like expansion - purely in terms of set-operations and closure as follows: Define
A-b
= A\{x£D:
χ —» b}
where D is the domain of objects under consideration. Thus, in ontological spaces with a maximally compact closure operation contraction is trivialised: n o choice situation can arise and contractions are completely determined by the familiar set operations. Hence, to qualify as an interesting application of our theory, an ontological space will have to be generated by (iii)
a closure operation that is not maximally
compact.
A second source of trivialisation is an egalitarian domain. If the domain carries no value structure to make nonarbitrary selections a m o n g collections of objects, then the selection function degenerates to identity. In that case we have A-B
= [\Sa{ALB)
=
(\ALB)
for all subsets A and Β or the domain. This makes A — Β a very small subontology of A - indeed too small to pass the condition that contractions should perform minimal incisions into an ontology. (Cf. the observations on "full meet" contractions in A G M Alchourron/Gärdenfors/Makinson 1985.) T h u s there is a fourth condition for identifying good examples, viz. that the ontological space under consideration should be based on
76 (iv)
Section 1: Logic
a domain with a value structure.
Note that, in contrast to closure under what is required, there is no need to make that structure explicit - it suffices to assume the existence of such a structure. Thus guarded against bad examples of ontological spaces with contraction functions we finally mention some good ones. (For a full description of these and other examples, see Fuhrmann 1997a.) We have already mentioned sets of sentences closed under logical consequence ("theories"). Another family of good examples center around the notion of action. Some actions require that certain others be carried out. (For example, before potatoes can be boiled they need to be peeled or scraped.) Call an action performable only if all actions it requires are performable; and a set of actions is performable only if each of its elements are performable. The relation ... makes ... performable generates a closure operation. The ensuing ontological space is the collection of all performable sets of actions, taken from the domain D. There are at least two situations that lead to choice. First, the joint performance of a and b may require (scarce) resources, to be provided by some action c. If c cannot be performed either a or b - but not both! - may still be performable. Second, doing both a and b may require some coordinating action c which would not be required if only the one or the other of the two actions were performed. There are other requirement relations definable on a domain of actions that lead to different ontological spaces. Think, for example of a domain of programs and let the requirement relation be specified by the set of call procedures, program ... calls program ... Again, this relation induces a closure operation and, hence, an ontological space. Choice can arise, as before, in situations that require coordinating. For example, a and b may be programs which, if run in parallel, call a routine c that prevents interference. If routine c cannot be run, only one of a or b can be executed at a time.
Andre Fuhrmann: Travels in Ontological Space
4.
77
References
D . / G Ä R D E N F O R S , P.: On the Logic of Theory Change: Partial Meet Functions for Contractions and Revisions. JSL 50 (1985), 510-530. B I R K H O F F , G.: Lattice Theory, Providence (AMS), 3rd ed., 1967. F I N E , K . : The Study of Ontology. Nous 2 5 ( 1 9 9 1 ) , 2 6 3 - 2 9 4 . F U H R M A N N , Α.: An Essay on Contractions. Studies in Logic, Language and Information, CSLI, Stanford 1997a. F U H R M A N N , Α.: Everything in Flux: Dynamic Ontologies. In: Festschriftftir Wlodzimierz Rabinowicz, Uppsala 1997b. F U H R M A N N , A . / H A N S S O N , S. O . : ASurvey of Multiple Contractions. Journal of Logic, Language and Information 3 (1994), 36-76. G Ä R D E N F O R S , P.: Knowledge in Flux, Cambridge, Mass. 1988. H U S S E R L , E . : Logische Untersuchungen, 2nd rev. ed., Tiibingen 1 9 1 3 . U L L M A N , J. D.: Database and Knowledge-Base Systems, vol. 1, Rockville 1988.
ALCHOURRÖN, C . E./MAKINSON,
SIEGFRIED GOTTWALD
Fuzzy-Logik und approximatives Schließen - ein kurzer Überblick 1. 2.
Unscharfe M e n g e n Unscharfe Variable u n d unscharfe Relationen
3. 4.
Unscharfe Regeln u n d unscharfe Regler Approximatives Schließen
5. 6.
Mehrwertige Logik mit graduierter Konsequenzbeziehung Literatur
1.
Unscharfe Mengen
Auf modernen Konsumgütern oder im Zusammenhang mit ihnen taucht in jüngster Zeit immer öfter das Wort „fuzzy" oder die Formulierung „FuzzyLogik" auf. In jedem Falle beziehen sich diese Kennzeichnungen auf spezielle Leistungen der automatisierten Steuerung bestimmter Aufgaben und des besonders effektiven Computereinsatzes. Der fundamentale mathematische Begriff, auf dem die so verstandene Fuzzy-Logik und auch alle sonstigen mit der Kennzeichnung „fuzzy" versehenen Theorien beruhen, ist der Begriff der unscharfen Menge, der 1965 von dem US-amerikanischen Systemtheoretiker Lotfi A. Zadeh eingeführt worden ist. Grundlegend für den Begriff der unscharfen Menge ist, daß man zuläßt, daß Mengen Gegenstände nicht nur entweder als Element enthalten oder nicht enthalten, sondern daß sie Gegenstände zu gewissen Graden enthalten können. Im Sinne der klassischen Logik sind die Mengen die Umfänge von Begriffen, die Elemente einer Menge also diejenigen Gegenstände, auf die der (der Menge) entsprechende Begriff zutrifft. Zu einem analogen Zusammenhang zwischen unscharfen Mengen und (verallgemeinerten) Begriffen gelangt man, wenn man akzeptiert, daß Begriffe gewissen Gegenständen nur zu gewissen Graden zukommen bzw. daß Gegenstände Eigenschaften nur zu gewissen Graden haben können. Die traditionelle Auffassung betrachtet solche Abstufungen, solche Übergänge als mathematisch weder relevant noch faßbar. Sie setzt an deren Stelle feste, u. U. aber künstlich fixierte Abgrenzungen. Die neuartige, für unscharfe Mengen konstitutive Auffassung nimmt derartige Abstufungen aber auch ma-
Siegfried Gottwald: Fuzzy-Logik und approximatives Schließen
79
thematisch ernst und gelangt so zu einer Verallgemeinerung des gewöhnlichen Mengenbegriffs (vgl. Bandemer/Gottwald 1993). In natürlicher Weise kann man sich dazu mehrwertiger Logiken bedienen. Für die Behandlung unscharfer Mengen ist es am naheliegendsten, die Menge W der betrachteten Zugehörigkeitswerte als die Menge der Quasiwahrheitswerte eines zugehörigen Systems mehrwertiger Logik zu interpretieren. Dies ermöglicht es, die Zugehörigkeitswerte^A( x O) als Quasiwahrheitswerte dafür zu interpretieren, daß xo Element der unscharfen Menge Α ist. Dadurch gelangt man zur Einführung einer verallgemeinerten „mehrwertigen" Elementbeziehung ε derart, daß stets Ρα(χO) = Quasiwahrheitswert von „xo εΛ" ist. (Wir schreiben ,,ε" für diese neuartige Elementbeziehung, um die gewohnte Elementbeziehung „ 6 " daneben noch benutzen zu können.) Ahnlich wie die (prädikatenlogische) Sprache der gewöhnlichen Mengenlehre neben den rein logischen Ausdrucksmitteln, den Junktoren der Aussagenlogik und den Quantoren der Prädikatenlogik, lediglich Bezeichnungen für Elemente und Mengen sowie das Zeichen „ e " für die Elementbeziehung benötigt und alle weiteren mengentheoretischen Begriffe per Definition einführen kann, so reicht das Zeichen ,,ε" der verallgemeinerten Elementbeziehung zusammen mit Bezeichnungen für Elemente und unscharfe Mengen sowie den Junktoren der mehrwertigen Aussagenlogik und den Quantoren der mehrwertigen Prädikatenlogik aus, um in der so konstituierten formalen Sprache die Theorie unscharfer Mengen darzustellen. Wie man es von der klassischen Logik her gewohnt ist, so beschreiben auch in der mehrwertigen Logik die Ausdrücke der entsprechenden Sprache Quasiwahrheitswerte oder Funktionen, deren Funktionswerte Quasiwahrheitswerte sind, je nachdem diese Ausdrücke freie Variable enthalten oder nicht. Ist H{x) ein Ausdruck der angedeuteten Sprache mehrwertiger Logik für die Theorie der unscharfen Mengen und bezeichnet man mit [H(x)] den Q u a siwahrheitswert des Ausdrucks H{x), so kann man (hinsichtlich eines beliebigen Grundbereiches U) eine unscharfe Menge Β über U mittels H{x) beschreiben, indem man für jedes a ^ U die Bedingung μΒ{α) = [H(a)\ stellt. Diese unscharfe Menge Β soll weiterhin in ähnlicher Art mit Hilfe sogenannter Klassenterme beschrieben werden als B={x\\H{x)}
oder
Β = {χ e U || H(x)} .
80
Section 1: Logic
Die hier vermerkte Beziehung der unscharfen Mengen zur mehrwertigen Logik und diese Beschreibung unscharfer Mengen mit Hilfe von (verallgemeinerten) Klassentermen sind sehr hilfreich, um viele Analogien zwischen Vorgehensweisen für unscharfe Mengen und Verfahrensweisen der gewöhnlichen Mengenlehre leicht sichtbar zu machen (vgl. Gottwald 1989; 1993). Das Interesse und die Aufmerksamkeit, die mehrwertige Logik wegen dieses Zusammenhangs mit unscharfen Mengen bei den (potentiellen) Anwendern der unscharfen Mengen fanden, führten nicht nur zu einem Anwachsen der Untersuchungen zur mehrwertigen Logik, etwa im Umfeld der Ausdehnung von Untersuchungen der Schaltalgebra von der klassischen auf mehrwertige Logiken, sondern führten auch dazu, daß man oft von „fuzzy logic" statt einfach von mehrwertiger Logik sprach. Diese historisch erste Verwendung des Terminus „fuzzy logic" ist heute allerdings fast vollständig wieder außer Gebrauch gekommen.
2.
Unscharfe Variable und unscharfe
Relationen
Die Grundidee der Unschärfe, die bei Mengen als „unscharfe Abgrenzung" zwischen Zugehörigkeit und Nichtzugehörigkeit von Elementen zu (verallgemeinerten, d. h. unscharfen) Mengen auftritt, erscheint in natürlicher Weise bei Variablen einerseits in der Form „ungenauer" Werte und andererseits in der Form unscharfer Beziehungen zwischen (unscharfen oder auch gewöhnlichen) Variablen. Um solche „unscharfen" Wertangaben mathematisch ernst zu nehmen, kann man sie als (Namen für) unscharfe Mengen über dem Grundbereich U der „eigentlichen, präzisen" Werte der Variablen Τ betrachten. Arbeitet man mit solchen unscharfen Werten A e F(£7) für eine Variable T, dann nennt man Τ auch unscharfe Variable. Ist allgemein^ eine unscharfe Variable mit unscharfen Werten aus F(£/), d. h. mit „eigentlichen" Werten aus U, und ist A e F (U) der aktuelle unscharfe Wert dieser Variable X, dann deutet man für jedes a € U den Zugehörigkeitswert μ^{α) als Grad der Möglichkeit, daß α der aktuelle „eigentliche" Wert der Variablen X ist. Ähnlich wie die Werte von Variablen nur unscharf bekannt oder angegeben sein können, können Beziehungen zwischen den Werten verschiedener Variablen nur unscharf bekannt oder angegeben sein. Daß eine - evtl. unscharfe - Beziehung zwischen den Werten zweier (unscharfer) Variabler besteht, kann in unterschiedlicher Weise verstanden werden. Die beiden Variablen sollen hier mit X und Y bezeichnet werden, ihre je-
Siegfried Gottwald: Fuzzy-Logik und approximatives Schließen
81
weiligen Wertebereiche mit U bzw. V. Eine gewöhnliche, also nicht unscharfe Beziehung zwischen den Werten von X und Y wird formal durch eine Menge von geordneten Paaren (u, ν) mit u e U, ν 6 V, also durch eine gewöhnliche Relation dargestellt. Eine unscharfe Beziehung zwischen den Werten von X und Y wird entsprechend formal durch eine unscharfe Menge R von geordneten Paaren (u, ν) mit u € U, ν (zV darzustellen sein, also durch eine unscharfe Teilmenge von U χ V = {(u, v) | u Ε U, ν G V}. Solche unscharfen Mengen von geordneten Paaren nennt man unscharfe Relationen. Sind X und Y unscharfe Variable und besteht zwischen ihren „eigentlichen" Werten eine - gewöhnliche bzw. eine unscharfe - Beziehung, d. h. hat man neben den unscharfen Werten für X und Y eine unscharfe Relation R e F(U χ V), dann kann man leicht aus jedem unscharfen Wert Α von X eine unscharfe Schranke für die zugehörigen „eigentlichen" Werte von Y gewinnen. Hat man nämlich diesen unscharfen Wert A £ F( U) von X und damit für jedes a£ U den Grad μ^ {α) der Möglichkeit, daß α der „eigentliche" Wert von X ist, so erhält man anschaulich fur ein b € V den Grad der Möglichkeit, daß b der dem „eigentlichen" Wert α von X über die Beziehung R entsprechende „eigentliche" Wert von Y ist, aus dem Möglichkeitsgrad ftAi a ) und dem Grad ft/l(a,b), zu dem die Relation R auf (a,b) zutrifft. Eine unscharfe Schranke B(A) der „eigentlichen" Werte von Υ, die sich aus dem unscharfen Wert A von X und der unscharfen Relation R ergibt, erhält man dann aus der zusätzlichen Überlegung, daß der Möglichkeitsgrad, daß ein b e V „eigentlicher" Wert von Y ist, sich daraus ergibt, ob es irgendein a ^ U gibt, das zu einem gewissen Grade zu b in der Relation R steht und zugleich möglicher „eigentlicher" Wert von X ist; d. h. man setzt: B{A) = {b II Ξα(αεΑ & (a, b) εR)}. Ist nun diese unscharfe Schranke B(A) selbst ein unscharfer Wert von Y, so ist dieser unscharfe Wert B(A) von Y dem unscharfen Wert Α von X durch R zugeordnet. Ist dagegen B(A) keiner der in Betracht kommenden unscharfen Werte von Y, so wählt man als einend durch R zugeordneten unscharfen Wert von Y einen solchen, der mit der unscharfen Schranke B{A) möglichst gut übereinstimmt. Eine genauere Analyse zeigt, daß sich hinter dieser letzten Idee eine verallgemeinerte, nämlich selbst graduelle Gleichheitsbeziehung zwischen unscharfen Mengen verbirgt. Auf sie soll hier aber nicht genauer eingegangen werden (vgl. Gottwald 1993).
82
Section 1: Logic
3.
Unscharfe Regeln und unscharfe Regler
Gewöhnliche Beziehungen zwischen unscharfen Werten der unscharfen Variablen X und Y lassen sich jedenfalls dann recht einfach angeben, wenn X und Y je nur endlich viele unscharfe Werte haben, was eine in praxi sehr oft anzutreffende Situation ist. Daß in solch einem Falle etwa dem unscharfen Wert AQ von X der unscharfe Wert BQ von Y entspricht, kann man durch eine implikative Aussage der Gestalt (1)
wenn Wert (X) = A0,
dann Wert (Y) = B0
ausdrücken, die man oft sogar kürzer und prägnanter in der Form (2)
Ιΐ X = AQ
T H E N Y = BQ
aufzuschreiben pflegt. Aussagen der Form (1) bzw. (2) nennt man auch unscharfe Implikationen. Sie treten häufig in der Rolle von Regeln auf, weswegen man sie dann auch als unscharfe Regeln bezeichnet, und sind in solch einem Falle ausführlicher zu lesen als: hat X den (unscharfen) Wert AQ, so sorge man dafür, daß Y den (unscharfen) Wert BQ annimmt (vgl. Bandemer/Gottwald 1993). In der traditionellen Mathematik dienen (i. allg. endliche) Systeme von Regeln, die Werten einer Variablen, der Eingangs- oder Inputvariablen, Werte einer anderen Variablen, der Ausgangs- oder Outputvariablen, zuordnen, zur Formulierung von Algorithmen. In analoger Weise kann man endliche Systeme unscharfer Regeln der Form (1) bzw. (2) benutzen, um verallgemeinerte „unscharfe" Algorithmen zu formulieren. Von unscharfen Algorithmen spricht man dabei deswegen, weil die unscharfen Regeln zwar eine genaue Zuordnung unscharfer Werte der betrachteten unscharfen Variablen X und Y liefern, aber dadurch doch nur eine unscharfe Beziehung zwischen den „eigentlichen" Werten von X und Y konstituiert wird. In praktischen Anwendungen werden derartige endliche Systeme unscharfer Regeln sowohl als unscharfe Beschreibungen von Steueralgorithmen bei technischen Prozessen benutzt als auch zur angenäherten, „unscharfen" Beschreibung (des Verhaltens) solcher Prozesse. Im letzteren Falle realisieren sie Grobmodelle des betrachteten technischen Prozesses, im ersteren Falle Grobmodelle des nötigen Steuerverhaltens. Von hier aus öffnet sich ein weites und interessantes Anwendungsfeld für derartige Systeme von unscharfen Regeln, denn grobe Beschreibungen von Prozessen bzw. (steuernden) Verhaltensweisen sind in unserem Alltag recht häufig und für menschliches Handeln in sehr vielen Fällen völlig ausreichend.
Siegfried Gottwald: Fuzzy-Logik und approximatives Schließen
83
Voraussetzung ist natürlich, daß die über Grobmodelle der genannten Art zu beschreibenden oder zu steuernden Prozesse ausreichend robust sind. Aber auch dies ist vielfach der Fall.
4.
Approximatives Schließen
Spricht man im Zusammenhang mit aktuellen Anwendungen von FuzzyLogik, dann ist damit heute fast ausnahmslos der Verweis auf die im vorangehenden Abschnitt besprochenen unscharfen Regler und ihre Anwendung gemeint. Unter theoretischen Gesichtspunkten erwartet man von einer zukünftigen Fuzzy-Logik aber mehr. Da Logik im modernen, mathematisch geprägten Verständnis dieses Wortes immer eine auch normativ verstandene Theorie rationalen, korrekten Schlußfolgerns ist, soll Fuzzy-Logik (schließlich einmal) eine allgemeine Theorie des korrekten schlußfolgernden Umgehens mit unscharfen Informationen sein, die auch als theoretische Grundlage dienen kann für die Verarbeitung unscharfer Informationen in Datenbanken und in wissensbasierten Systemen der Künstlichen Intelligenz. Dieses Ziel ist momentan noch eine weitgesteckte Forschungsaufgabe, deren Bewältigung man sich erst in ersten Ansätzen zu nähern beginnt. Immerhin reicht das bisher erläuterte Begriffsinventar zu interessanten Überlegungen in dieser Richtung schon aus. Ein Ansatz geht dabei von der Vorstellung aus, daß unscharfe Informationen nicht als Mengen von Aussagen, sondern als unscharfe Mengen von Aussagen vorliegen. Die Zugehörigkeitswerte können in diesem Falle ζ. B. als Grade des Vertrauens in die bzw. der Glaubwürdigkeit der jeweiligen Aussage verstanden werden. Bei diesem Ansatz ist das zentrale Problem, in sachgemäßer Weise aus unscharfen Mengen von Aussagen unscharfe Mengen von Schlußfolgerungen zu gewinnen. Dies geschieht im wesentlichen dadurch, daß man zu aus der klassischen Logik bekannten Schlußweisen (Vertrauens-/ Glaubwürdigkeits-) Grade hinzunimmt, zu denen man die jeweiligen Schlußfolgerungen aus Prämissen gewinnen kann, die der jeweils gegebenen unscharfen Menge von Aussagen (zu einem gewissen Grade) angehören. Ein anderer, mehr im Zentrum des allgemeinen Interesses stehender Ansatz greift recht direkt auf die in Abschnitt 3 im Zusammenhang mit unscharfen Reglern erläuterten Ideen zurück. Schon im Spezialfall eines Regelsystems mit nur einer unscharfen Regel der Form (2) und einem unscharfen Input Wert(X) = Α kann man die Bestimmung der dadurch festgelegten unscharfen Schranke für die „eigentlichen" Werte von Y ansehen als einen „Schluß", der
84
Section 1: Logic
ausgehend von den „Prämissen (3)
Wert(Z) = A ,
(4)
wenn Wert(X) = A0, dann Wert(F) = ß0 u
Wert(F) = R"A = (A0 χ B 0 )"A führt, die allerdings die der „Prämisse" (4) entsprechende unscharfe Relation R = A o x B o benutzt. Immerhin ähnelt dieser „Schluß" von (3) und (4) auf (5) der Abtrennungsregel der gewöhnlichen Logik. Dies ist übrigens der Grund, weswegen unscharfe Regler in der englischen Terminologie auch als „fuzzy logic controller" bezeichnet werden. Diese Ähnlichkeit gibt aber andererseits Anlaß zu fragen, ob weitere Arten derartiger „Schlüsse" im Rahmen der Fuzzy-Logik akzeptabel erscheinen, die Schlußregeln der gewöhnlichen klassischen Logik analog sind. Diese Frage braucht sich nicht nur auf aussagenlogische Schlußweisen zu beziehen, sie kann auch auf prädikatenlogische Schlüsse zielen. Für diese prädikatenlogischen Schlüsse ist es typisch, daß die Quantifizierungen „für alle . . . " und „es gibt ein . . . " bei ihnen eine zentrale Rolle spielen. Für die FuzzyLogik interessant ist, nicht nur diese Quantifizierungen zu betrachten, sondern auch weitere „unscharfe Quantifizierungen" wie „für viele . . . " , „für sehr viele ... ", „für wenige ... ", „es gibt nicht sehr viele . . . " usw. Zur formalen Erfassung solch unscharfer Quantifizierungen fuhrt man jeweils geeignete unscharfe Variable ein, deren „eigentliche" Werte einer absoluten oder prozentualen Zahlenskala angehören und deren unscharfe Werte unscharfe Zahlenangaben wie „viele", „wenige", „nicht sehr viele" usw. sind. Dies ist im Rahmen der bisher in diesem Artikel eingeführten Begriffe ohne prinzipielle Schwierigkeiten möglich, soll aber in den Einzelheiten nicht genauer besprochen werden (vgl. Zadeh 1987). Dagegen m u ß man unbedingt erwähnen, daß es in dem gegenüber der klassischen Logik erweiterten Ausdrucksrahmen der Fuzzy-Logik zwar relativ leicht ist, „unscharfe Aussagen" der erwähnten Formen darzustellen und mit ihnen auch in einer Art umzugehen, die wie Schlußfolgern erscheint. Was allerdings gegenwärtig noch ein zentrales offenes Problem ist, das ist die Antwort auf die Frage danach, welche solcher Typen „unscharfer Schlußfolgerungen" im Rahmen der Fuzzy-Logik akzeptabel sind und welche es nicht sind. Im Sinne approximativen Schließens ist Fuzzy-Logik derzeit also noch kein auch nur annähernd fundiertes System formaler Logik. Im eingeschränk-
Siegfried Gottwald: Fuzzy-Logik und approximatives Schließen
85
ten Sinne einer Theorie der (automatisierten) Abarbeitung von Systemen unscharfer Regeln dagegen stellt die Fuzzy-Logik ein begriffliches und methodisches Instrumentarium bereit, das schon soweit perfektioniert ist, daß es einen allgemeinen Rahmen fur den Entwurf von Grobmodellen technischer Prozesse bzw. Steueraufgaben abgibt, der auf vielfältig unterschiedliche Anwendungssituationen gut paßt.
5.
Mehrwertige Logik mit graduierter Konsequenzbeziehung
Neben der Verwendung des Terminus „Fuzzy-Logik" einerseits zur Bezeichnung der mehrwertigen Logik in ihrer Rolle als Hintergrundtheorie zur Darstellung der Theorie der unscharfen Mengen und andererseits zur Bezeichnung der Methode der unscharfen Regler und des approximativen Schließens gibt es noch eine dritte Art, diesen Terminus zu gebrauchen: zur Benennung von Systemen der mehrwertigen Logik, in denen sowohl unscharfe Mengen von Prämissen zugelassen sind als auch dazu unscharfe Ausdrucksmengen als Konsequenzhüllen gehören können (vgl. Pavelka 1979; Novak 1989; 1992). Wie üblich für Systeme formaler Logik m u ß dazu sowohl eine semantisch zu fassende Folgerungsbeziehung als auch eine syntaktisch zu fassende Ableitungsbeziehung bestimmt werden. Und natürlich sollte diese Syntax genau im Sinne der Gültigkeit eines entsprechenden (starken) Vollständigkeitssatzes — zur Semantik passen. O h n e auf die interessanten Details hier näher eingehen zu können sei angemerkt, daß der Folgerungsbegriff im wesentlichen in der gewohnten Weise auf den Modellbegriff zurückgeführt wird. Allerdings betrachtet man eine Interpretation 3 dann als Modell einer unscharfen Menge Σ von Aussagen, wenn für jede Aussage Η der Zugehörigkeitsgrad [HzL] nicht größer ist als der Quasiwahrheitswert v a l ( / / ; 3 ) von Η in 3 . Die Folgerungshülle C(Z) wird dann definiert durch die Bedingung [tfeC(Z)] = inf{val(//;3) | 3 Modell von Σ}. Der Ableitungsbegriff nutzt wie üblich Schlußregeln. Da nun aber Prämissen nur zu einem gewissen Grade „gegeben" sein können, muß bei diesen Schlußregeln parallel zur Gewinnung einer Konklusion diesem Ausdruck ein Grad zugeordnet werden, zu dem er Konklusion ist. Der Grad eines Endausdrucks einer Ableitung ist dann der Grad, zu dem dieser Ausdruck mit dieser Ableitung gewonnen wurde. Der Ableitungsgrad schlechthin eines Ausdrucks Η aus einer Prämissenmenge Σ ist dann der „größtmögliche" (mathematisch prä-
86
Section 1: Logic
zise im Sinne der Supremumbildung) aller dieser Ableitungsgrade für Ableitungen von Η aus Σ. Man gelangt auf diese Weise zwar im Falle der Quasiwahrheits- und Zugehörigkeitswertmenge [0,1] nur zu einem infinitären Ableitungsbegriff, kann aber den gewünschten starken Vollständigkeitssatz beweisen, hat also Äquivalenz des semantischen Folgens und des syntaktischen Ableitens auch bezüglich der nur „partiellen", d. h. nur zu einem Grade < 1 „vorliegenden" Konsequenzen aus einer unscharfen Prämissenmenge Σ. Diese letzte Art des Gebrauchs des Terminus „fuzzy logic" erscheint aus der theoretischen Sicht der formalen Logik die konsequenteste. Die damit benannte Erweiterung der mehrwertigen Logik ist darüber hinaus auch noch eine sehr natürliche Erweiterung: man wird auf sie in naheliegender Weise gefuhrt, wenn man sich bemüht, in den Gesichtskreis der mehrwertigen Logik nicht nur die Abstufung des Wahrseins, also Quasiwahrheitswerte, zu nehmen, sondern dazu auch eine Abstufung der Eigenschaft der Korrektheit von Schlußregeln zu betrachten (vgl. Gottwald 1995).
6. BANDEMER,
Literatur
H A N S / G O T T W A L D , S I E G F R I E D : Einführung in Fuzzy-Methoden. Theorie und Anwendungen unscharfer Mengen, (4., überarb. u. erw. Aufl.) Berlin 1993. G O T T W A L D , S I E G F R I E D : Mehrwertige Logik, Berlin 1989. G O T T W A L D , S I E G F R I E D : Fuzzy Sets and Fuzzy Logic: Foundation of Application-from a Mathematical Point of View, Braunschweig/Wiesbaden/Toulouse 1993. G O T T W A L D , S I E G F R I E D : Many-Valued Logic with Partially Sound Rules of Inference. In: Logik und Mathematik, Frege-Colloquium Jena 1993, hrsg. I. Max/W. Stelzner, Berlin 1995. N O V A K , V I L E M : Fuzzy Setsand Their Applications, Bristol 1989. N O V A K , V I L E M : The Alternative Mathematical Model of Linguistic Semantics and Pragmatics, N e w York 1992. P A V E L K A , J A N : O n Fuzzy Logic. I, II, III. Zeitschrift fiir Mathematische Logik und Grundlagen der Mathematik 25 (1979), 4 5 - 5 2 ; 1 1 9 - 1 3 4 ; 4 4 7 - 4 6 4 . Z A D E H , L O T F I . Α . : Fuzzy Sets. Information and Control 8 (1965), 3 3 8 - 3 5 3 . Z A D E H , L O T F I . Α . : Fuzzy Sets and Applications. Selected Papers, hrsg. R. R. Yager et al., New York 1987.
VOLKER
HALBACH
Classical Symmetric Truth
1. 2. 3. 4.
Explications of Truth Classicality Classical Symmetric Truth References
1.
Explications of Truth
When giving an explication of an informally given notion in terms of formal logic we must take a decision whether to achieve this by semantical or syntactical means. In both cases a language containing a symbol for the notion has to be fixed. Then a semantical explication will consist of the exhibition of a suitable model or class of models, while for a syntactical explication a collection of syntactical principles (usually axioms) is required. In the case of truth of a language containing its own truth predicate philosophers seem to have preferred in recent decades semantical approaches, among these were Gupta, Herzberger, Kripke and Barwise. But there are good reasons to consider also syntactical proposals. I shall mention some of them. In the history of logic Tarski's equivalences form one of the most prominent and fundamental explications of truth. From this it may be seen that some basic priciples for truth are of syntactical and not semantical nature. There are also other syntactical principles already discussed by Tarski, e.g. one saying that the conjunction of two sentences is true, if and only if both sentences from which the conjunction is built up are true. If we are interested in such clauses it is also much more convenient to study combinations of such principles as axiomatic theories instead of constructing at first a model and checking afterwards whether these principles hold in this model. Another advantage concerns the paradoxes. When exhibiting a model a decision about the semantical status of the liar sentence has to be made. The usual considerations show that it is not quite plausible to assign the single truth value "true" (or "false") to it. If the liar is not assigned any truth value at all the so-called strengthened liar will still be a problem. The strengthened liar is a sentence maintaining of itself that it is not true. If the liar is assigned both truth values at the same time a similar argument may be made. In fact, I be-
88
Section 1: Logic
lieve that most "solutions" of the liar paradox may be shown to be not satisfactory by using sentences like the strengthened liar. In contrast, one is not forced to make a decision concerning the semantical status of the liar within a syntactical approach because one can simply choose syntactical principles not deciding it. O f course, such a approach will not provide a "real solution" to the liar paradox, but at least it is possible to work with a formal theory of truth without dedicating oneself to a special philosophical position concerning the paradoxes. The following three further points to be made for syntactical explications of truth will also show that an explication has some more interest than just the paradoxes. A good reason for seeking a language containing its own truth predicate is the search for a comprehensive "final" meta-language, such that there is no need of a further meta-language. Such a strong metalanguage can only be given as an axiom system, because a model for it could only be given in a further metalanguage. So the syntactical approach is here clearly preferable. In recent years there has been a growing interest into theories of truth by proof theorists (cf. Sheard 1994). In his influential paper (Feferman 1991) Feferman showed how axiom systems for truth may be used as a kind of very strong proof-theoretic reflection principles in order to obtain the so-called reflective closure of a theory. For every axiomatic theory there are by the Gödel incompleteness theorems unprovable principles which should be accepted if the theory itself is accepted. If these principles are added a new theory is obtained; this theory is now expanded again by principles unprovable in it. This iterated expansion of theories led to the transfinite recursive progressions (cf. Feferman 1962). The limit of (autonomous) progressions may be considered as the reflective closure of the initial theory. But the characterization of the reflective closure by means of axiomatic theories of truth like in Feferman (1991) has now superseded the rather cumbersome and intricate autonomous progressions. In papers like Friedman/Sheard (1987), Cantini (1990) or the already mentioned paper by Feferman it was also shown that very strong mathematical theories (like RA {TPt\ ,...,in)
Pt\... tn)\
The other axioms of classicality state that Τ commutes with the connnectives and the quantifier. (2)
Vtf[sent(#) -»• ( T ^ a
-Ta)]
This axiom may be considered as an axiom of completeness and consistency (see Halbach 1994a). Its left-to right direction is obviously equivalent to the Law of Contradiction: Vtf[sent(ö) -»•
-Ι(Τ^ΛΛΤΛ)],
while the other direction is the Law of Excluded Middle: V*z[sent(tf)
(T^vTä)]
The next axiom describes the semantics of conjunction within classical logic by saying that Τ commutes with conjunction. (3)
VaVb[sent(a) Λ sent(£)
(Tahb
Τ α Λ Tb))
The last axiom is an analogon for the quantifier of the two preceding. (4)
VaVi/[sent(*(Ö)) λvar(i/) -> ( T 3 v a ( v ) ο
3χΎa{x)}
Note that it is necessary to quantify into the scope of the truth predicate. Within arithmetical languages this does not cause problems, because for every number a numeral is available within the language. How this can be achieved for other languages and base theories Β was described in Feferman (1991) and Halbach (forthcoming).
3.
Classical Symmetric
Truth
If the base system Β is expanded by the rule of symmetry and the axioms of classicality, the system CS(5) is obtained. It has the following formal properties: 2
For more details see Halbach (forthcoming).
Volker Halbach: Classical Symmetrie Truth
(i) (ii) (iii) (iv)
(v)
91
Under quite general conditions CS (Β) is conservative over Β (and hence a fortiori consistent), if Β was. CS (Β) does not decide the liar sentence. CS(B) is ω-inconsistent (for non-arithmetical theories the notion of co-consistency has to be modified in a suitable way). CS(PA) plus full induction in the language Lj, which is equivalent to a system studied in (Friedman/Sheard), proves the same arithmetical statements as ramified analysis RA < ω up to CO. CS (Β) may be considered as an axiomatization of rule-of-revision semantics up to ω in the sense of (Belnap/Gupta 1993). By an argument involving the ω-inconsistency it may be shown that it is not sound as a system of supervaluational semantics. Hence Sheard s classification in Sheard (1994) of CS(PA) plus full induction in the language £τγ as an axiom system for supervaluations is not correct.
For an exact statement of these results and their proofs see Halbach (1994a; 1994b; forthcoming). By (i) CS (Β) cannot be used for ontological reductions or for a characterization of the reflective closure of B. But if we expand certain axioms schemes of the base theory to the full language £τγ stronger theories (iv) may be obtained. This situation is similar to that concerning other axiomatic theories of truth (cf. Feferman 1991). For a discussion of the ω-inconsistency see (Halbach 1994a).
4. BELNAP, N U E L / G U P T A , A N I L :
References
The Revision Theory of Truth,
M I T
Press, Cambridge
1993. Theory of Truth Formally Equivalent to I D Ι . Journal ofSymbolic Logic 55 (1990). F E F E R M A N , S O L O M O N : Transfinite Recursive Progressions of Axiomatic Theories. Journal of Symbolic Logic 27 ( 1 9 6 2 ) . F E F E R M A N , S O L O M O N : Hilberts Program Relativized: Proof-Theoretical and Foundational Reductions. Journal of Symbolic Logic 53 (1988). F E F E R M A N , S O L O M O N : Reflecting on Incompleteness. Journal of Symbolic Logic 5 6 (1991). F R I E D M A N , H A R V E Y / S H E A R D , M I C H A E L : An Axiomatic Approach to Self-Referential Truth. Annals of Pure and Applied Logic 33 (1987). H A L B A C H , V O L K E R : A System of Complete and Consistent Truth. Notre Dame Journal of Formal Logic 35 (1994a). CANTINI, ANDREA: A
92
Section 1: Logic
Tarski-Hierarchien, Dissertation, Centrum fur Informations- und Sprachverarbeitung, München, 1994b. H A L B A C H , V O L K E R : Tarski Hierarchies, Erkenntnis 4 3 (1995). H A L B A C H , V O L K E R : Klassische symmetrische Wahrheit, forthcoming. K R I P K E , S A U L : Outline of a Theory of Truth. Journal of Philosophy 11 (1975). M C G E E , V A N : H O W Truthlike Can a Predicate Be? Journal of Philosophical Logic 14 HALBACH VOLKER:
(1985).
Maximal Consistent Sets of Instances ofTarski's Schema (T). Journal of Philosophical Logic 21 (1992). S H E A R D , M I C H A E L : A Guide to Truth Predicates in the Modern Era, Journal of Symbolic Logic 59 (1994). T A R S K I , A L F R E D : Collected papers vol. 1, ed. S. Givant/R. McKenzie, Birkhäuser, Basel 1986. M C G E E , VAN:
H o NGOC
Due
On a Dilemma of Conditional Obligation*
Conditional obligations play an important role in normative argumentation. A large number, if not the majority of norms have a conditional form: ifρ then it ought to be that q. An important class among the conditional obligations are the so-called commitments, that is, sentences of the form 'the performance of (the action described by) ρ commits one person to perform q . The concept of conditional obligation has caused deontic logicians much trouble. Many proposals were made how to formalize the notion properly, but none of them has proved satisfactory. The dilemma can be summarized as follows: it seems necessary to have a form of detachment rule so that one can proceed from conditional to unconditional obligation, if the condition is satisfied. On the other hand, if the rule of detachment is allowed, then in many cases one can deduce too much: from intuitively consistent premisses one can deduce contradictory consequences. The best-known example for such counter-intuitive results is Chisholm's contrary-to-duty paradox. The aim of my paper is to propose a simple solution to this problem. I shall show that Chisholm's contrary-to-duty paradox can be solved in a very simple way. In monadic deontic logic, there are two natural candidates for formalizing the notion of conditional obligation. Some authors suggest the formula "0(p D q)", others the formula "p D Oq" as the formalization of the sentence: "q ought to be under the condition p". The first formula is favored, e. g., by von Wright (1951; 1953), and the second by, e. g., Chisholm (1963) and Weinberger (1977). Both suggestions have their own drawbacks. It is wellknown that the following formulae are valid in standard deontic logic (SDL): (1)
Fp
D
0(p
D
q)
(2)
Oq
D
0(p
D
q)
Thus, if "0(p D q)" is to be read as "p commits you to do q" then formula (1) suggests that doing something forbidden commits one to do anything, and I acknowledge my long-standing teacher Peter Steinacker for guidance over the last several years. The present paper has also profited much from my discussions with Werner Wolff and with Professor Georg Henrik von Wright.
94
Section 1: Logic
formula (2) that anything commits one to do one's duty. O n e may try otherwise and use "p D Oq to formalize the notion o f commitment. However, similar problems arise: the following formulae are valid for S D L : (3)
-./> D (p D Oq)
(4)
Oq D (p D Oq)
Formula (3) seems to say that whatever is not done (or is not the case) commits one to do anything, and formula (4) says that anything commits one to do one's duty. T h e above formulae (1—4) are quite unobjectionable as such. More serious problems arise when one tries to formalize concrete normative circumstances adequately. T h e following paradox was detected by R. Chisholm (1963) and has been discussed extensively in the literature. I shall discuss it in the form presented by Aqvist (1984). Let us consider the following four sentences: (I)
It ought to be that John does not impregnate Suzy Mae.
(II)
Not-impregnating Suzy Mae commits John to not marrying her.
(III)
Impregnating Suzy Mae commits John to marry her.
(IV)
John impregnates Suzy Mae.
Let "p" stand for the sentence "John impregnates Suzy Mae" and "q" for the sentence "John niarries Suzy Mae". T h e first and the fourth sentence seem to have a canonical formalization. They do not cause any difficulty: (I) and (IV) can be formalized as follows:
CHp
(la) (IVa)
ρ
T h e sentences (II) and (III) are conditional obligations. In the language of S D L , (II) can be formalized by either "->/> D 0->q" or "0(->p D ~~q)"· T h e former formula is a logical consequence o f (IVa), therefore it is not a suitable formalization o f (II), because intuitively (II) is not a consequence o f (IV). Analogously, from (la) one can prove (in SDL) the formula "0(p D q)", therefore the latter formula is not a suitable formalization o f (III), because (III) is not a consequence o f (I). Thus, the only suitable candidates for (II) and (III) are: (Ha) (Ilia)
0{rp
D ^q)
ρ D Oq
In standard deontic logic the following distribution principle is valid: (5)
0(A D B) D (OA D OB)
H o Ngoc Due: On a Dilemma of Conditional Obligation
95
Thus, from (la) and (IIa) we can deduce "0~>q". From (Ilia) and (IVa) we can deduce Oq, by detachment. From "O^q" one can infer "^Oq". Thus, one can deduce (in standard deontic logic) a contradiction from (Ia)-(IVa), although (I)-(IV) are perfectly consistent intuitively. Note that if the principle O^A D -i OA is not valid then we cannot deduce a formal contradiction from (Ia)(IVa). But in this case we can infer O^q and Oq, which is also paradoxical, and (I)-(IV) do not seem to suggest that both q and ->q are obligatory. The discussed paradox suggests that it is not possible to formalize adequately the notion of commitment in standard monadic deontic logic. Some authors have proposed a new primitive dyadic operator 0(q/p) with the intended meaning "q is obligatory in circumstances p". Unconditional obligation can be defined in the following way: let true be any tautology. Then one defines: Op =def
O(pjtrue)
With this new operator, the sentences (I)-(IV) above can be formalized as follows: (lb) (lib) (IHb) (IVb)
O^p O^qhp) 0(q/p) Ρ
Aqvist (1984) has shown that (Ib)-(IVb) are consistent in his strongest dyadic system. However, the price one has to pay for this consistency is too high: there is no rule of detachment available for conditional obligation. From 0(q/ρ) and ρ one cannot deduce Oq. This lack of detachment imposes a heavy restriction on the application of deontic logic: how can conditional obligations play their important role in normative argumentation if they cannot, by way of detachment, lead to unconditional obligations? The difficulties with Chisholm's paradox leads Aqvist to the question: "We seem to feel that detachment should be possible after all. But we cannot have things both ways, can we? This is the dilemma on commitment and detachment. " (Aqvist 1984, 658) My claim is that we can have things both ways, commitment and detachment. I shall argue that both formalizations above fail because they do not pay attention to the temporal (or situational) aspect of the sentences (I)-(IV). I shall suggest a simple temporal deontic logic and show that the discussed paradox can be solved in a simple way. In this system T D L it is possible to formalize these sentences correctly, and the intuitively valid inferences are also
96
Section 1: Logic
TDL-valid. T h e logic T D L turns out to be the bimodal system 5 5 / K D , where 5 5 is the logic of the modality 'at any time' and KD is the familiar standard logic of'ought'. Let us take a closer look at the sentences (I)-(IV). We consider what can be inferred from them by common-sense. We want to see which o f these intuitively correct inferences are also formally correct in S D L and in dyadic deontic logic, and which of the formally correct inferences are unintuitive from the standpoint of common-sense. Intuitively, from (III) and (IV) it follows "John ought to marry Suzy Mae", that is, Oq. This conclusion can be drawn from {Ilia) and ( I V a ) in S D L . However, it is not possible to infer Oq from {I I lb) and (IV b) in Aqvist dyadic systems. O n the other hand, the set { ( I ) , ( I I ) , ( I I I ) , (IV)} is perfectly consistent from an intuitive point of view. Thus, the sentence "John ought not to marry Suzy Mae" (O^q) should not be deducible from this set, because in case it is deducible we would have a contradiction. Clearly, it seems very odd if this inference should be valid: we would have the norm that John ought not to marry Suzy Mae, although he has impregnated her, and at the same time we have another norm saying that impregnating Suzy Mae commits John to marrying her. We saw above that 0—' ist in einem solchen zukünftigen Zustand der Fall, der zu seiner Zeit der wirkliche Zustand sein wird" bedeuten. In Anbetracht des Fehlens dieser Möglichkeit kann es jedoch in einem indeterministischen Kontext keine Interpretation von ,Fρ geben." (McArthur 1974, 287).
Gegen diese Position möchte ich zweierlei vorbringen:
102
Section 1: Logic
(1) Antaktualisten verhalten sich sprachlich abstinenter als umgangssprachlich nötig. So war in der Rhein-Neckar-Zeitung vom 13./14. August 1994 folgendes zu lesen: „Der Hilfseinsatz von C A R E Deutschland ftir die notleidenden RuandaFlüchtlinge hat begonnen. [...] An diesem Sonntag werden die ersten 260 Ärzte und Pflegepersonal nach Goma fliegen."
Ich gehe davon aus, daß der Verfasser dieser Meldung das Tempus Futur nicht gebraucht, um über etwas in allen möglichen Zukünften Eintretendes zu sprechen. Denn nichts ist einfacher, als sich einen alternativen Zukunftsverlauf auszudenken, der seine Meldung Lügen straft. Nicht weniger klar scheint mir, daß der Verfasser das Futur auch nicht gebraucht, um den Goma-Flug von 260 Ruanda-Helfern als eine von vielen zukünftigen Möglichkeiten darzustellen. Kurzum, er gebraucht dieses Tempus, um über die wirkliche Zukunft zu sprechen. (2) Mein zweiter Einwand gegen den Antaktualismus hat mit den Gründen dafür zu tun, daß sich überhaupt sagen läßt, was am Sonntag stattfinden wird. Der Hauptgrund besteht darin, daß 260 Helfer am Montag darauf in Goma sein wollten und sich daran gemacht haben, diesen Willen zu verwirklichen. Diese Verankerung von Wahrheiten über die Zukunft: in entsprechenden Entschlüssen und deren Verwirklichung ist so neu nicht. Schon Kant hat auf die Frage, ,,[o]b das menschliche Geschlecht im beständigen Fortschreiten zum Besseren sei" (Kant 1968, 79), geantwortet, das könne man durchaus wissen, nämlich ,,[a]ls wahrsagende Geschichtserzählung des Bevorstehenden in der künftigen Zeit: [... ] wenn der Wahrsager die Begebenheiten selber macht und veranstaltet, die er zum Voraus verkündigt." (Kant 1968, 80f.). Wenn wir die Chance haben wollen, etwas Bestimmtes über die wirkliche Zukunft zu sagen, was nicht schon deshalb zu ihr gehört, weil es in allen möglichen alternativen Zukünften enthalten ist, sollten wir es Kants Wahrsagern gleichtun: etwas Bestimmtes wollen und es in die Tat umsetzen. Es stellt ein metaphysisches Defizit des Antaktualismus dar, daß er für die autonome Bestimmung der wirklichen Zukunft blind ist. Die unnötige sprachliche Abstinenz und dieses metaphysische Defizit reichen für meine Begriffe aus, um den Antaktualismus als befriedigende Version des zeitlogischen Indeterminismus zu disqualifizieren.
Bertram Kienzle: „Es wird der Fall sein, daß"
103
Der Aktualismus In McKim/Davis (1976) treten Vaughn McKim und Charles Davis dem Antaktualisten McArthur entgegen, indem sie genau das tun, was dieser für unmöglich erklärt hatte: sie geben eine Semantik für das Tempus Futur in bezug auf eine verzweigte Zeitstruktur an. Dabei charakterisieren auch sie den Indeterministen als jemanden, der es fur prinzipiell unmöglich hält, im voraus auszumachen, welcher Zustand bzw. welche Folge von Zuständen verwirklicht werden wird. Das, so argumentieren sie dann gegen McArthur, lasse genügend Spielraum für die Annahme, es gebe eine wirkliche Zukunft. „Tatsächlich", so fügen sie erklärend hinzu, „gäbe es ohne diese Annahme nichts, von dem der Indeterminismus bestreiten könnte, daß wir es zu identifizieren vermöchten. Wenn dem aber so ist," fahren sie dann triumphierend fort, „so hat uns der Indeterminist alles Nötige gegeben, was wir für eine semantische Interpretation von ,Fp' brauchen." Da sie für ihre Formulierung der Wahrheitsbedingungen auf die wirkliche Zukunft zurückgreifen müssen, ohne sie jedoch im voraus ausmachen zu können, nehmen sie zu dem Ausweg Zuflucht, sie unter der Beschreibung „der Zweig, der die wirkliche Zukunft ist" auftreten zu lassen (McKim/Davis 1976, 234). Durch dieses vorgeblich „triviale" (McKim/Davis 1976, 234) Manöver stellen McKim und Davis die wirkliche Zukunft als etwas hin, das jetzt schon festliegt. Infolgedessen kann sie für sie zwar epistemisch, nicht aber ontisch indeterminiert sein. Allein, weswegen sollte sich ein Semantiker überhaupt für die ontische Festlegung der wirklichen Zukunft interessieren? Nun, solange sie nicht festgelegt ist, kann er sie auch nicht in seinen Modellen repräsentieren. Folglich kann er solange auch keine Wahrheitsbedingungen von Sätzen über sie formulieren - es sei denn, er lasse sich darauf ein, diese Wahrheitsbedingungen auf einen Zeitzweig zu beziehen, der die wirkliche Zukunft simuliert. Damit wäre er allerdings nicht weiter als McKim und Davis. Wie schneidet nun deren Aktualismus im Vergleich zum Antaktualismus ab? Mein erster Einwand gegen den Antaktualismus betraf dessen unnötige Abstinenz, was die Rede über die wirkliche Zukunft angeht. Da McKim und Davis über einen Operator für die Darstellung der wirklichen Zukunft verfügen, scheinen sie ihrem zeitlogischen Antipoden in diesem Punkt von vornherein überlegen. Allein, so wie sie die wirkliche Zukunft spezifizieren, können sie höchstens per Zufall über sie sprechen. Insofern ist ihr Aktualismus zwar syntaktisch auf der Höhe der Umgangssprache, bleibt aber semantisch aussichtslos hinter ihr zurück. Zweitens hatte ich eingewandt, daß Antaktualisten für die Spezifizierung der wirklichen Zukunft durch unseren autonomen Willen blind sind. N u n
104
Section 1: Logic
ordnen McKim und Davis jeder einzelnen Zeitstelle eine wirkliche Zukunft zu (vgl. McKim/Davis 1976,235). Da wir jedoch nicht an beliebigen Zeitstellen, sondern nur an solchen Zeitstellen, an denen wir existieren, etwas wollen (oder in die Tat umsetzen) können, kann die wirkliche Zukunft ä la McKim und Davis nicht oder doch wenigstens nicht ausschließlich auf unserem Willen (oder dessen Verwirklichung) beruhen. Das zeigt, daß ihr Aktualismus nicht weniger autonomieblind ist als der Antaktualismus.
Der
Autonomismus
Damit komme ich nun zu meinem eigenen Vorschlag für eine indeterministische Zeitlogik. Ich gehe davon aus, daß die wirkliche Zukunft die Zukunft ist, der wir jetzt entgegengehen. Darin liegt, (1) daß die wirkliche Zukunft auf die jetzige Zeitstelle bezogen ist und (2) daß es sich um unsere Zukunft handelt. So gesehen könnte die wirkliche Zukunft jetzt anders beschaffen sein als, sagen wir, vor dem Fall der Mauer; und ebenfalls anders beschaffen sein könnte sie, wenn es gewisse Zeitgenossen nicht gäbe. In Anbetracht dessen sollten wir uns darauf gefaßt machen, daß der Wahrheitswert eines Satzes der Form r F a n für soziale und historische Unterschiede in den Kontexten empfänglich ist, in denen er geäußert wird. Diese doppelte Empfänglichkeit bedeutet freilich nicht, daß ein solcher Satz indexikalisch konstruiert werden müßte. Wenn ich jetzt sage „Vor zwei Jahren war es der Fall, daß ich jetzt rede", so beziehe ich mich mit dem indexikalischen Ausdruck „jetzt" nicht auf eine zwei Jahre zurückliegende Zeitstelle; eine solche bildet nur den Umstand, unter dem das Gesagte mit wahr oder falsch zu bewerten ist. Worauf ich mich mit „jetzt" beziehe, ist vielmehr die Zeitstelle, an der ich diesen Satz äußere, also die jetzige Zeitstelle. Diese im Außerungskontext enthaltene Zeitstelle ist invariant gegenüber wechselnden Umständen, so daß das Gesagte in bezug auf eine Zeitstelle von vor zwei Jahren denselben Wahrheitswert hat wie in bezug auf die jetzige Zeitstelle. Entsprechendes müßte auch für Sätze der Form r Fa~ 1 gelten, wenn sie indexikalisch wären. Doch deren Wahrheitswert ist nicht invariant gegenüber wechselnden Umständen. Denn aus unserer jetzigen Perspektive gesehen, kann ich mit „Vor zwei Jahren war es der Fall, daß es der Fall sein wird, daß 260 Helfer morgen in Goma eintreffen" etwas Falsches sagen, während ich mit „Es wird der Fall sein, daß 260 Helfer morgen in Goma eintreffen" etwas Wahres sage. (Das könnte daran liegen, daß sich die 260 Helfer vor einigen Tagen entschlossen haben, alles zu tun, um morgen in Goma einzutreffen, wohingegen es dort vor zwei Jahren noch gar keine Ruanda-Flüchtlinge gab, denen sie
Bertram Kienzle: „Es wird der Fall sein, daß"
105
hätten helfen wollen können.) Trotz der Abhängigkeit ihres Wahrheitswertes von der jetzigen Zeitstelle einerseits und von uns andererseits scheint es also verfehlt, Sätze der Form r F a n indexikalisch zu konstruieren. Gleichwohl möchte ich die Wahrheitsbedingungen dieser Sätze anhand der Methode formulieren, die David Kaplan (1989) fur die semantische Analyse indexikalischer Ausdrücke verwendet. Denn diese Methode arbeitet mit dem Unterschied von Außerungskontexten und Bewertungsumständen, der für die richtige Auffassung des Wahrheitswertes von Sätzen der Form r F a n unverzichtbar ist. Für die Zwecke dieser Skizze möchte ich mich auf zweidimensionale Kontexte beschränken; die beiden Dimensionen sind wir selbst (und zwar alle zusammengenommen) sowie die Zeitstelle, an der einer von uns den zu bewertenden Satz äußert. Ein Umstand der Bewertung braucht sogar nur eine Dimension aufzuweisen: die Zeitstelle, in bezug auf die der Satz bewertet wird. Unter welchen Bedingungen ist nun also r F a _ l , aus unserer jetzigen (weil äußerungskontextuellen) Perspektive gesehen, an einer Zeitstelle t wahr? Halten wir zunächst fest: an Zeitstellen, die nicht auf demselben Zeitzweig wie die jetzige Zeitstelle - symbolisch: „ / ' - liegen, hat r F α π , aus unserer jetzigen Perspektive gesehen, den Wahrheitswert^z/rcA Denn solche Zeitstellen mögen zwar irgendwann einmal in einer möglichen Zukunft gelegen haben, können es aber, aus unserer jetzigen Perspektive gesehen, nie wieder tun. Sodann müssen wir berücksichtigen, daß in jeder möglichen Entwicklung der zukünftigen Weltgeschichte die logischen und mathematischen Gesetze sowie die Naturgesetze wahr sein müssen. Was aber in jeder solchen Entwicklung der Fall sein muß, wird auch wirklich der Fall sein. Zusammengefaßt heißt das: (1) j und t liegen auf demselben Zweig, und (2) α ist, aus unserer jetzigen Perspektive gesehen, auf jedem Zweig durch t an wenigstens einer Zeitstelle nach t wahr. Nun ist diese Klausel zwar hinreichend, aber nicht notwendig dafür, daß r F a n , aus unserer jetzigen Perspektive gesehen, an t wahr ist. Denn es gibt ja auch Sätze dieser Form, die, aus unserer jetzigen Perspektive gesehen, nur in einem Teil aller möglichen Zukünfte wahr sind. Und damit sind wir beim eigentlich interessierenden Fall der sog. Futura contingentia angelangt. Zweifellos genügt der „Zukunftsrahmen" (Castafieda 1975, 135), der von den logischen und mathematischen Gesetzen einerseits und den Naturgesetzen andererseits aufgespannt wird, um zusammen mit den jetzt vorliegenden Randbedingungen die Existenz einer wirklichen Zukunft sicherzustellen. Aber deren Eindeutigkeit kann er nicht garantieren. Daß die Zukunft nicht
106
Section 1: Logic
eindeutig bestimmt und d. h. indeterminiert ist, liegt vor allem an unserem Wollen. Wenn jemand am Freitag abend mit seiner Frau ins Kino gehen will, sie dagegen am Freitag abend Gäste nach Hause einladen will, so gibt es diesen „Stichtag" in zwei nicht simultan zu verwirklichenden Varianten. Solange es keine Präferenz fur eine dieser Varianten gibt, ist die Zukunft indeterminiert. Die Varianten eines Stichtags zeichnen sich dadurch aus, daß sie den gleichen Abstand von ein und derselben Zeitstelle in ihrer gemeinsamen Vergangenheit haben. Ich werde solche Zeitstellen isochron nennen und die Menge der Isochronen von s mit „Iso(i)" bezeichnen. Die Indeterminiertheit der Zukunft beruht also darauf, daß es zu jedem Stichtag mehrere Isochronen gibt, die sich nicht mit Hilfe des Zukunftsrahmens und der jetzt vorliegenden Randbedingungen allein, sondern erst mit Hilfe dessen, was wir wollen, voneinander unterscheiden lassen. Ziel des Autonomismus ist es, das Ausmaß dieser durch die Vielfalt unseres Wollens gegebenen „zukünftigen Zone der Indeterminiertheit" (Castafieda 1975, 135) so zu reduzieren, daß sich eine eindeutig bestimmte wirkliche Zukunft ergibt. Zu diesem Zweck greift er auf den autonomen Willen zurück. In dieser Skizze möchte ich eine Spielart des Autonomismus zugrunde legen, nach der ein autonomer Wille von uns allen zusammengenommen ausgeht, sich auf jeden einzelnen von uns erstreckt und ein realmögliches Szenario beinhaltet, dessen Realmöglichkeit invariant ist gegenüber jeder aktantengerechten Permutation von uns. 1 Was wir autonom wollen, ist nichts anderes als das, was für uns gut ist. In Übereinstimmung mit seiner gewöhnlichen Verwendungsweise können wir das Wort „gut" als Auswahlwort klassifizieren, genauer: als Bezeichnung einer Funktion, die einer Menge eine ihrer Teilmengen zuordnet. Wie diese Auswahlfunktion im einzelnen beschaffen ist, kann ich hier nicht diskutieren. Nur soviel sei angemerkt: eine der notwendigen Bedingungen ist, daß sie eine Ordnung des (fur uns) Besseren und Gleichguten induziert. 2 Ferner sollen die getroffenen Auswahlen keine kompletten Zukunftsverläufe, sondern nur relativ kurze Ausschnitte daraus enthalten. Wie kurz diese Ausschnitte sein dürfen, steht auf einem anderen Blatt. Im folgenden will ich einfachheitshalber annehmen, sie beständen nur aus einer einzigen Zeitstelle. Die Menge, aus der wir das für uns Gute auswählen, besteht aus den Isochronen eines gegebenen Stichtages. Klar, daß dieser Stichtag und seine Iso1
Z u diesen Begriffsbildungen vgl. Kienzle 1991.
2
Über Ordnungsrelationen u n d Auswahlfunktionen im Z u s a m m e n h a n g mit steigerbaren Adjektiven vgl. Kienzle 1983.
Bertram Kienzle: „Es wird der Fall sein, daß"
107
chronen in der Zukunft der Zeitstelle t liegen müssen, in bezug auf die wir r F a n bewerten. Die ausgewählte Zeitstelle selbst muß darüber hinaus auf demselben Zeitzweig liegen wie j. Denn wir können r F a n in bezug auf eine Zeitstelle in unserer Vergangenheit nicht mit wahr bewerten, relativ zu der die ausgewählte Zeitstelle zwar in der Zukunft liegt, aber in einer Zukunft, die j gar nicht enthält. Eine so beschaffene Zukunft könnte nämlich jetzt nicht mehr die wirkliche Zukunft sein. 3 Nennen wir die Zeitstelle, an der wir unsere Auswahl treffen, „a , so können wir die Auswahl selbst mit „gut(•wir, a, Iso(i))" bezeichnen. Diese Auswahl muß natürlich spätestens jetzt getroffen werden, wenn die wirkliche Zukunft von ihr abhängen soll. Ferner muß die Auswahlzeitstelle a auf demselben Zweig liegen wie j und die ausgewählte Zeitstelle. Denn j und die ausgewählte Zeitstelle sowie alle Zeitstellen dazwischen und davor gehören zur wirklichen Weltgeschichte, und wir können nun einmal nur in der wirklichen Weltgeschichte auswählen. Schließlich muß diese Auswahl die aktuellste sein. Denn autonom, wie wir sind, können wir unsere Auswahlen umstoßen, weshalb nur die letzte der zu einem Stichtag s gehörenden Auswahlen für die Bestimmung der wirklichen Zukunft maßgeblich ist. O b allerdings die von uns getroffene Auswahl auch tatsächlich Wirklichkeit wird, ist durch den Akt der Auswahl allein noch nicht ausgemacht. Unsere Auswahl bildet lediglich die Richtschnur für die Gestaltung der wirklichen Zukunft. O b diese dann so verläuft oder nicht, hängt letztlich davon ab, ob jeder einzelne von uns seinen Beitrag zur Verwirklichung dieser Auswahl leisten will. Das muß er natürlich auch schon vor dem Stichtag wollen können. Das zu wollen heißt aber nichts anderes als „schon im Begriff zu sein, es zu tun, und sei es bloß, daß man seine kausalen Kräfte auf die Handlung hin, die man tun will, neu ordnet" (Castafieda 1975, 41; vgl. 276; 310). Damit haben wir alle Bestandstücke für die Formulierung der Wahrheitsbedingungen eines Satzes im Futur zusammen und können definieren: r
F a n ist, aus unserer jetzigen Perspektive gesehen, an der Zeitstelle t wahr
=def
entweder
(1) j und t liegen auf demselben Zweig und (2) α ist, aus unserer jetzigen Perspektive gesehen, auf jedem Zweig durch t an wenigstens einer Zeitstelle nach t wahr
oder es gibt drei Zeitstellen s, α und ζ mit: (1) α ist, aus unserer jetzigen Perspektive gesehen, an ζ wahr 3
Das ist der Grundgedanke von Haradas Hemiaktualismus; vgl. Harada 1994.
108
S e c t i o n 1: L o g i c
(2) j , a, t und ζ liegen auf demselben Zweig (3) α ist nicht später als j (4) j und t liegen vor ζ (5) ζ e gut(wir, ci, Iso(i)) und für alle Zeitstellen b, die später als a, aber nicht später als j sind, gilt: wenn gut(wir,
Iso(I)) / 0, dann ζ E gut(wir, b, ISO(J)), und
(6) jeder von uns, der an t existiert, will an t seinen Beitrag zur Erfüllung von α an ζ leisten.
Literatur Thinking and Doing, Dordrecht 1 9 7 5 . Indeterministische Zeitlogik. In: Zustand und Ereignis, hrsg. Bertram Kienzle, Frankfurt a. M. 1994. K A N T , I M M A N U E L : Der Streit der Fakultäten. In: Kants Werke, hrsg. Preußische Akademie der Wissenschaften, Bd. VII, Berlin 1968. K A P L A N , D A V I D : Demonstratives. In: Themes From Kaplan, hrsg. Joseph Almog/John Perry/Howard Wettstein, Oxford 1989. K I E N Z L E , B E R T R A M : Der allgemeine Wille in Theorie und Praxis. In: Prinzip und Applikation in der praktischen Philosophie, hrsg. Thomas M. Seebohm, Mainz/ Stuttgart 1991. K I E N Z L E , B E R T R A M : Die semantische Form des Guten, Wiesbaden 1 9 8 3 . M C A R T H U R , R O B E R T P . : Factuality and Modality in the Future Tense. Noüs 8 ( 1 9 7 4 ) , CASTANEDA, H E C T O R - N E R I : HARADA, KIMIO:
283-288.
Temporal Modalities and the Future. Notre Dame Journal of Formal Logic 17 ( 1 9 7 6 ) , 2 3 3 - 2 3 8 .
M C K I M , VAUGHN R . / D A V I S , CHARLES C . :
KARL-HEINZ
KRAMPITZ
Negation und negative Existenzaussagen*
1. 2.
Einleitung Nichttraditionelle Prädikationstheorie
3. 4. 5.
Existenzannahmen der nichttraditionellen Prädikationstheorie Negative Existenzaussagen Literatur
1.
Einleitung
Einfache prädikative Aussagen der Form (1) „s ist / ' ' u n d (2) „s ist nicht Ρ', wo „/'ein elementarer Individuenausdruck und „P'cin Prädikatausdruck ist, werden als wahr angesehen, wenn das Subjekt s das Merkmal Ρ besitzt bzw. nicht besitzt. Dazu wird in beiden Fällen vorausgesetzt, daß s existiert. Aussagen, die diese Voraussetzung nicht erfüllen, scheinen Gesetze der klassischen Logik zu verletzen. Wenn das Subjekt s nicht existiert, so kann aufgrund der Existenzvoraussetzungen weder (1) noch (2) wahr werden. Folglich kann auch die Adjunktion von (1) und (2) als Einsetzung in das Gesetz vom ausgeschlossenen Dritten nicht wahr werden. Auswege werden darin gesehen, Aussagen mit leeren Individuenausdrücken als wahrheitswertlos aus der Betrachtung der Logik auszuschließen und im Bereich der Dichtung anzusiedeln (Frege) oder als konstant falsche Kennzeichnungsaussagen zu analysieren (Russell). Besonders problematisch wird die Situation jedoch bei negativen Existenzaussagen. Die Aussage „Pegasus existiert nicht" wird zwar allgemein als wahr angesehen. Beim Versuch, singulare Existenzaussagen vom Typ „s existiert" und „s existiert nicht" als einfache prädikative Aussagen zu deuten, entsteht aber die paradoxe Situation, daß „s existiert nicht" genau dann wahr sein müßte, wenn s nicht existiert, zur Wahrheitsbewertung dieser Aussage aber vorausgesetzt werden muß, daß s existiert. Das heißt, damit „s existiert nicht1 überhaupt wahr werden kann, muß s existieren. Die meisten Autoren haben mit Frege daraus die Konsequenz gezogen, Existenz als Prädikat zweiter Stufe zu betrachten, das sinnvoll nur von Begrif* Die Arbeit entstand im Rahmen des DFG-Projektes „Komplexe Logik". Ich danke der D F G an dieser Stelle für die guten Arbeitsmöglichkeiten.
110
Section 1: Logic
fen ausgesagt werden kann, und singulare Existenzaussagen keinesfalls als einfache prädikative Aussagen zu verstehen. Mit meinem Vortrag möchte ich im Rahmen der nichttraditionellen Prädikationstheorie von Alexander Sinowjew und Horst Wessel einen Weg aufzeigen, Aussagen mit leeren Individuenausdrücken, einschließlich der Existenzaussagen, als einfache prädikative Aussagen zu analysieren, ohne Gesetze der klassischen Logik zu verletzen oder in paradoxe Situationen zu geraten.
2.
Nichttraditionelle
Prädikationstheorie
Einfache Aussagen der Form (1) „s ist P' zerfallen bei dieser Analyse in den Subjektterminus „/', den Prädikatterminus „P' und den Prädikationsoperator des Zusprechens. Sie werden formal durch (1') (s P) dargestellt. Aussagen der Form (2) „s ist nicht P' können zum einen durch den Operator ψ- des Absprechens als (2') (s P), zum anderen mit Hilfe von (1') und der klassischen aussagenlogischen Negation ~ als (2") π2) (Implikation zweier Programme), so ergibt sich für Α(π) ein Ausdruck, der bemerkenswerterweise dieselbe Präsupposition hat wie eben
122
Section 1: Logic
und sich nur in der Assertion unterscheidet: Α(π) =ftA! : *Aj Präsupposition
: *Ai ->• *A2, Assertion
und die Geltung des Theorems fur π ergibt sich mit analoger Argumentation wie eben aus W(it) Ξ - ι Ε ( π ι ) λ ( W ( Ä I ) -> - Ε ( π 2 ) ) Λ (W(ni) -»• W(w 2 )), F W = -E(B,)A(W(«I) Ε(π) =
-»• W ( N 2 ) ) ,
E(«I)V(W(KI)AE(K2)).
Auf die Argumentation fiir die übrigen Teile des Rekursionsschrittes wird hier aus Platzgründen verzichtet. Soweit die Skizze des Beweises des Theorems. Es sei hier angemerkt, daß sich die Verknüpfungen von DPL-Programmen um eine (in den folgenden Beispielen verwendete) Verknüpfung ,:' ergänzen lassen, deren Bedeutung grob so umschrieben werden kann: Bei (πι : π 2 ) fungiert πι als Präsupposition, π 2 als Assertion. Der Zusammenhang, den das Theorem herstellt, ermöglicht es, in allgemeinerem Umfang als bisher mit Hilfe der Error-State-Semantik Präsuppositionen zu repräsentieren. Beispiele: Die durch kontrastierendes nicht, durch auch und durch nur ausgelösten Präsuppositionen. Nicht Hans schläft Präs:
Jemand schläft.
Ass:
Hans schläft nicht.
A = 3xSx : -.Sil DPL-Programm:
Wahrheitsbedingungen
*A = 3xSx Λ ->Sh
Falschheitsbedingungen
*—A = 3xSx Λ Sh
Error-Bedingungen
- f t A = ->3xSx
ηχ : Sx : —iSh
Herbert Küstner: Dreiwertige Logik und dynamische Semantik Auch Hans schläft Präs: Jemand außer Hans schläft. Ass: Hans schläft. Wahrheitsbedingungen Falschheitsbedingungen Error-Bedingungen
Α
Nur Hans schläft nicht Präs: Hans schläft nicht. Ass: Alle außer Hans schlafen. Wahrheitsbedingungen Falschheitsbedingungen Error-Bedingungen
Α
4.
Ξ
123
3x(x / h Λ Sx): Sh
DPL-Programm: ηχ : χ Φ h; Sx : Sh *A = 3x(x φ h Λ Sx) Λ Sh *-A =
3 x ( x Φ h Λ S x ) Λ —ISH
- f f A = ->3x(x φ h Λ Sx)
Ξ
-»Sh : - θ χ ( χ φ h Λ ->Sx)
DPL-Programm: —iSh : ->(ηχ : χ / h; -iSx) * A Ξ ->Sh Λ -Ι3Χ(Χ φ h Λ -iSx)
*—Α ΞΞ
-F|A
Ξ
-iSh Λ 3x(x Φ h Λ ->Sx) Sh
Literatur
Towards a Compositional Theory of Tense, Nijmegen 1988 (als Handout vervielfältigt). B O C H V A R , D . Α . : Ob odnom trechznannom iscisleniiiegoprimeneniikanalizaparadoksov klassiceskogo rassirennogofunkcional'nogo iscislenija. Matematiceskij sbornik
BIERWISCH, MANFRED:
4 (1939), VAN E I J C K , J A N :
287-308.
The Dynamics of Description. Journal of Semantics
10 (1993),
2 3 9 -
267. GROENENDIJK, JEROEN/STOKHOF,
Philosophy
14 (1991),
Dynamic Predicate Logic. Linguistics and
H E R B E R T : Semantische Mechanismen der Negation, Berlin (studia grammatica XXXI). P I E T E R A. M.: Discourse Semantics, Oxford/New York 1985.
JUNG, UWE/KÜSTNER,
SEUREN,
MARTIN:
39-100. 1990
UWE
MEIXNER
Ontologically Minimal Semantics for Intuitionistic Logic The main subject of this paper is not intuitionistic logic but ontologically minimal (logical) semantics (in short, O M S ) : this kind of semantics is merely illustrated by the example of its treatment of intuitionistic logic. As far as the meaning of the intuitionistic logical constants is concerned, I use by and large the standard interpretation(s) derived from Gödel's original result that intuitionistic logic can be embedded in various ways into S4-modal logic. And so do most model-theoretical semanticists: standard Kripke-style semantics for intuitionistic logic merely explicates Gödel's interpretation in the modeltheoretical way originally developed for modal logic. What's here important is not so much the interpretations of the intuitionistic logical constants, but rather the way in which they are presented: in an ontologically minimal way. Adopting a wording currently much used in other contexts, the slogan of O M S in general is this: "Lean Production in Logic". That is, O M S aims at cutting down the ontological costs of logic as far as possible. This means in particular: (1) Total rejection of model-theoretical, in particular set-theoretical means (not necessarily for any "ideological", i. e. nominalistic reason, but maybe simply out of an interest in how far you can get without them). (2) Metatheoretical quantification is restricted to linguistic entities: expressions. Thus, O M S goes further than the so-called "truth-value semantics" advocated by Hugh Leblanc and others. Truth-value semantics respects not only expressions, but also sets of expressions, and infinite sets of expressions (maximal-consistent sets of formulae), and truth-value-assignments, which (set-theoretically) are sets - often infinite - of ordered formula/truth-value pairs. This is altogether too much for O M S . But how does O M S treat a disguised modal logic, for example, intuitionistic predicate-logic? First, the operator " K " ("It is known that") is introduced into the metalanguage, and the appropriate S4-logical principles for " K " are added to the principles of first-order extensional (hence "if, then" and "iff" are truth-functional operators) predicate-logic (as used in the meta-language) and to the principles of complete syntactical induction (induction on the length
Uwe Meixner: Ontologically Minimal Semantics for Intuitionistic Logic
125
of expressions, the number of logical constants in them etc.). Then by using the otherwise unspecified truth-predicate "Tx" truth-laws are formulated for the logical constants of the object-language. In those truth-laws x, x', ... are variables for the formulae of the object-language (with or without free variables; in the latter case, formulae are called "sentences"), z, z ' , . . . variables for its variables, y, γ, ... variables for its standard-names; in case χ contains ζ as a free variable, x[z] is x; in case it does not, x[z] is the formula Fz—>Fz, where F is a particular monadic predicate-letter of the object-language; x[y] results from x[z] by replacing ζ everywhere where it is free in x[z] by y. Let me present three conjunctions of such truth-laws which, while not being logically equivalent to each other, nevertheless yield the same intuitionistic logical principles for the object language (as will be proved below): 77 K(all χ)(Τ-ιχ iff Knot Tx) and K(all x)(all x')(Tx&x' iff Tx and Tx') and K(all x) (all x')(Txvx' iff Tx or Tx') and K(all x)(all x ' ) ( T x - x ' iffK(if Tx, then Tx')) and K(all x)(all z)(T(z)x[z] iff K(all y)Tx[y]) and K(all x)(all z)(TVzx[z] iff (some y)Tx[y]) and K(all x)(if Tx, then KTx).
T2 K(all x)(T-x iff Knot KTx) and K(all x)(all x')(Tx&x' iffK(KTx and KTx')) and K(all x)(all x')(Txvx' iff K(KTx or KTx')) and K(all x)(all x')(Tx^x' iffK(if KTx, then KTx')) and K(all x)(all z)(T(z)x[z] iff K(all y)KTx[y]) and K(all x)(all z)(TVzx[z] iff K(some y)KTx[y]).
T3 looks just like T2 except that each "T" on the lefthand side of "iff" is replaced by "KT". Clearly, T2 and T 3 show a uniformity (thus exhibiting an underlying single conception of the logical constants concerned) that is not apparent
126
Section 1: Logic
in Τ 1 , which moreover has an extra principle which is not characterizing a logical constant but merely the truth-predicate. Clearly, T l , T 2 and T 3 are not logically equivalent to each other; in this sense they are three different interpretations of -i, & , v, ( ) and V. The central step in the O M S of intuitionistic logic (and in the O M S of any other logic) is the ontologically minimal definition of logical truth (or, more neutrally, logical validity): D L χ is N-logically true := χ is a sentence, and " T x " is logically derivable from T N (for " Ν " "1", " 2 " or " 3 " can be substituted). To be clear about this: '"Tx" is logically derivable from T N ' means the same as '"if T N , then T x " is logically provable'. The remark is necessary, since there is also a more general concept of derivability in which, for example, "KA" is derivable from "A"; but "if A, then KA" is of course not logically provable. ("KTx" can replace " T x " in the definition-schema DL, since, evidently, " T x " is logically derivable from T N iff " K T x " is thus derivable.) The defined concept of logical truth is as precise as is the concept of metatheoretical logical derivability that is invoked in its definition. If the latter concept is made precise by an exact specification of the metatheoretical logical means, so is the former. Notice that there is no talk in the definition of interpretations, models or structures, or even truth-value assignments. The entire set-theoretical machinery of standard semantics has simply been passed by. So we have an O M S of intuitionistic logic. But is it possible to work with this semantics and to obtain interesting semantical results while keeping within its strict ontological limits? I will demonstrate that this is possible by showing in an ontologically minimal way that the very same formulae are 1-, 2- and 3- logically true, and by describing the ontologically minimal proof for the soundness and completeness (with respect to 1-logical truth) of a (standard) object-language calculus for intuitionistic logic. Notice first that T 2 can be logically derived from T l (but not vice versa), and T 3 from T 2 (but not vice versa); this is a mere matter of S4-modal predicate-logic - metatheoretically applied. Hence we have by DL: (1) Every 2-logically true formula is 1-logically true. (2) Every 3-logically true formula is 2-logically true. Further: Let χ be a sentence (of the object-language). If " T x " is logically derivable from T l , then also from T 3 : For T 3 is logically equivalent (provably equivalent) to T 3 * , in which we have " K T x and K T x " ' instead of " K ( K T x and KTx')", " K T x or KTx"' instead of " K ( K T x or KTx')", "(some y)KTx[y]" in-
Uwe Meixner: Ontologically Minimal Semantics for Intuitionistic Logic
127
stead of "K(some y)KTx[y]"; but everything else in T3* is as in T3. "T*x" := "KTx"; given this definition T3* can be rewritten like this: K(all x ) ( T * - x iff Knot T*x) and K(all x)(all x')(T*x&x' iff T*x and T V ) and K(all x)(all x')(T*xvx' iffT*x or T V ) and K(all x)(all x')(T*x^x' i f f K ( i f T * x , then T V ) ) and K(all x)(all z)(T*(z)x[z] ifFK(all y ) T V [ y ] ) and K(all x)(all z)(T*Vzx[z] ifF(some y ) T V [ y ] ) and K(all x)(if T V , then KT*x)· (The last sentence is - by the definition of " T V ' - a metatheoretical logical theorem.) Since T3* can be written in this form, it is clear: if "Tx" is logically derivable from T l , " T V " is logically derivable from T3*; the derivation from T1 can be simply copied, replacing "T" everywhere by "T*". But if " T V " is logically derivable from T3*, "Tx" is logically derivable from T3. Hence we have what was to be proved: If "Tx" is logically derivable from T l , "Tx" is logically derivable from T3. Hence we obtain using DL: (3) Every 1-logically true formula is 3-logically true. Nothing further than (1), (2), (3) is needed for showing that the very same formulae are 1-, 2- and 3-logically true. Now let IPL be a standard object-language calculus of intuitionistic predicate-logic. The soundness of IPL with respect to 1-logical truth (hence also with respect to 2- and 3-logical truth) is shown by demonstrating that a given proof of a sentence χ in IPL (which exists if χ is provable in IPL) can always be transformed into a logical derivation of "Tx" from T l (which imparts that χ is 1-logically true). This is done by showing in the first place that for all axioms x' of IPL "Tx"' is logically derivable from T l , and in the second place that every (basic) rule of IPL is such that if the truth of its premises is logically derivable from T l , then also the truth of its conclusion. The completeness of IPL with respect to 1-logical truth is a more difficult matter to prove in an ontologically minimal way. The easiest way is the following: Assume χ is 1 -logically true, hence χ is a sentence, and "Tx" is logically
128
Section 1: Logic
derivable from T l , hence there is a logical derivation of "Tx" from T l . Reconstruct this derivation as an object-language proof of tr(x) in a calculus S4PL of S4-modal predicate-logic, where tr(x) is the translation of χ into the language of S4PL. T h e translation is inductively defined as subsequently specified: tr(p) = Np, for all (atomic formulae) p. For all x, x', z: tr(-ix)=N-itr(x), tr(x&x')=tr(x)&tr(x'), tr(xvx')=tr(x)vtr(x'), tr(x—i-x') =N(tr(x) —Hr(x')), tr((z)x[z])=N(z)tr(x[z]), tr(Vzx[z])= Vztr(x[z]). Since tr(x) is provable in S4PL, χ itself is provable in IPL (q.e.d). T h e lemma "For all sentences x: if tr(x) is provable in S4PL, then χ is provable in IPL" follows from a result which Kurt Schütte obtained in a purely syntactical, hence ontologically minimal manner (Schütte 1968, 33ff.)· T h e proof of the lemma having been taken care of by Schütte, the one difficult point remaining is how to reconstruct a logical derivation of "Tx" from T l as a proof of tr(x) in the calculus S4PL of S4-modal predicate-logic: (1) Bring the derivation into indirect form with minimal assumptions: Start with "not Tx" (other assumptions to be refuted may occur later), and, over all reducing the logical complexity of x, apply merely the relevant singular instance of the truth- law of T l concerned in each case as an assumption (and the inferences of metatheoretical S4-modal predicate-logic), until you have logically refuted "not Tx" on the basis of T l , or rather: on the basis of the singular instances of T l actually needed for the refutation (their n u m ber is finite). (This step eliminates the occurrences of variables for formulae and variables for variables from the derivation.) (2) For the name of every formula (which conveniently is the formula itself) in the system of derivations obtained in (1) (call this system "β") put the name of its translation (the translation-formula itself; often merely a part of a formula needs to be replaced by the relevant part of its translation), omit the truth-predicate from β, and for "not" put "->", for "K" put "N", r
u
ι»
«ο
Γ
«
»
«
»
Γ
«· r
1
»
«
»
Γ
« · ΓΓ»
«
»
J
Γ
II
tor and & , tor or ν , tor it, then —> , tor irr «->· ; and hnally: for "(all)" put " ( ) " , for "(some )" put "V", for y, y7, ... put an appropriate object-language-variable (preserving wellformedness and blurring no distinctions). This gives you β*: a system of (formally strict) S4PL-derivations, since ß-assumptions are copied as ß*-assumptions, and every metatheoretical logical step in β is copied in β* by the corresponding deductive step of S4PL (which can always be justified by an S4PL-theorem and Modus Ponens). T h e Τ1-based assumptions of β, however, have turned into trivial S4PL-theorems of the form N ( A o A ) (for example: if the following singular instance of the negation-law of T l is an assumption of ß: "K(T->Fa iff Knot TFa)", we have in ß* "N(tr(-iFa)oN-itr(Fa))", which is of course identical to " N ( N - i N F a Ή·
Uwe Meixner: Ontologically Minimal Semantics for Intuitionistic Logic
129
N-iNFa)"); hence they can all be eliminated from β*. This leaves in β* merely the copies of the assumptions of β which are reduced to absurdity in β; those copies, however, are also reduced to absurdity in β*. Hence β* is an indirect S4PL-argument for tr(x). (3) Being a system of S4PL-derivations, β* is not a formal S4PL-proof. However, by applying the relevant meta-theorems for the calculus S4PL (which can be proved in a purely syntactical manner), it can be shown that, given β*, there must exist an S4PL-proof of tr(x) - an S4PL-proof that can actually be constructed - although laboriously - using the material presented in β*. I presume at least some readers will feel dissatisfied with this way of proving a calculus of intuitionistic predicate-logic to be semantically complete — not for a lack of rigor in it, but because they feel that the proof is somewhat "uninteresting". They should first take a look at Schütte's proof of the lemma, which is by no means "uninteresting" (it is much more difficult to prove the Gödelian embeddability assertions for intuitionistic logic in a purely syntactical manner than by model-theoretical semantical means, and, indeed, not many logicians have tried their hand in this). But setting this apart: the greater the apparent distance between the syntactical concept of provability in a calculus and the semantical concept of logical truth (both for object-language formulae), the more interesting we are bound to find a proof which shows that they are after all co-extensional. In O M S , however, the apparent distance between the two concepts is as a rule (not only in the case of intuitionistic logic) small, and accordingly the way of proving them co-extensional seems pedestrian. O n the other hand, the way of defining logical truth in O M S (logical truth as logical derivability of truth from certain truth-laws) is just as intuitively satisfying as the usual model-theoretical manner of defining it (logical truth as truth in all interpretations, which are set-theoretical structures of a certain kind). (It's worth investigating how the two conceptions of logical truth or validity are in general related to each other; ontologically minimal logical truth always implies model-theoretical logical truth; but does model-theoretical logical truth always imply ontologically minimal logical truth?) And the idea that we don't really capture the meaning of a logical constant - especially a modal one, disguised or not - unless we reconstruct this meaning in modeltheoretical terms is just about as wellfounded as the idea of 19th-century physics that we don't really understand a physical phenomenon unless we provide a mechanical model for it. This suggests that the interestingness of modeltheoretical, say, Henkin-style proofs of semantical completeness is somewhat artificial in nature. It is the product of playing the game of logical semantics
130
Section 1: Logic
according to certain rules which, after all, are not absolutely forced on us. It's like going by helicopter - certainly an exhilarating experience - when you can reach your destination in no time by foot.
References LEBLANC, HUGH: On Dispensing with Things and Worlds. In: Lope and Ontology, ed. Μ. K. Munitz, New York 1973, 241-259. SCHÜTTE, KURT: Vollständige Systeme modaler und intuitionistischer Logik, Berlin 1968.
ULRICH
METSCHL
What Is A Logical Constant? A Topological Suggestion
1. 2. 3. 4. 5.
Introduction The Proof-Theoretic Account Epistemic Aspects of Logical Constants Topological Semantics References
1.
Introduction
O n e of the m o r e p r o m i n e n t questions in the philosophy of logic is: w h a t is a logical constant? I n t r o d u c t o r y texts, of course, o f t e n give a ready answer by presenting a finite list of expressions, typically consisting of t h e t r u t h f u n c tions a n d t h e quantifiers, which are called the logical constants. Equally often, however, this answer will n o t do. It is unsatisfactory because there is, in general, a close connection between a relation of logical consequence a n d a corresp o n d i n g set of logical constants. As there is a variety of consequence relations (e. g. classical, intuitionistic, or relevant) there can be n o u n i q u e set of logical constants. T h i s insight is largely d u e to A. Tarski w h o , in his 1 9 3 6 paper o n t h e semantic account of the n o t i o n of logical consequence, stressed that, dep e n d i n g o n w h a t expressions we take as logical constants, different sentences will c o m e o u t as logical truth a n d therefore different consequence relations will hold. Tarski's p o i n t is evident in his tentative f o r m u l a t i o n of logical consequence Ά follows logically f r o m A' (which in effect goes back to Bolzano): " (F) If, in the sentences of the class A' and in the sentence X , the constants apart from the purely logical constants - are replaced by any other constants (like signs being everywhere replaced by like signs), and if we denote the class of sentences thus obtained from Κ by "K"', and the sentence obtained from X by "X1", then the sentenced" must be true provided only that all the sentences of the class K ' are true." (Tarski 1956, 415) Now, if different classifications of t h e expressions of a given language into logical ones a n d extra-logical ones lead to different consequence relations, a n d if we insist t h a t not any relation between sets of formulas a n d formulas qualifies as a consequence relation, then w h a t exactly are t h e logical constants a n d h o w
132
Section 1: Logic
are they to be distinguished from extralogical ones? Tarski's attitude in this issue was a skeptical one. According to Tarski, there is no unique and unswaying line of demarcation separating the logical from the extralogical expressions. As Tarski concedes: "This division is certainly n o t quite arbitrary." (Tarski 1956, 418)
but he goes on to emphasize that "no objective grounds are k n o w n to m e which permit us to draw a sharp b o u n d a r y between the two groups of terms." (Tarski 1956, 4 1 8 - 4 1 9 )
The situation then may not seem too comfortable. For, on the one hand we must rely on a 'handy' list of logical expressions in order to succeed in an effective and clear characterisation of the consequence relation for a given language; on the other hand we seem to lack any clear criterion for determining what the logical constants are.
2.
The Proof- Theoretic Account
First aid in this predicament is provided by proof-theorists, who point out that the choice of logical constants must conform to prior assumptions about the consequence relation, at least if this is not to end up in triviality. For example, A. N. Prior's tonk-operator, provisionally characterised by the pair of rules (tonk-int) (tonk-elim)
A h /i-tonk-ß A-tonk-B h Β
is at odds with the assumption that the consequence relation is transitive. For, given transitivity, Β follows from A by first using tonk-int and the using tonkelim, for arbitrary formulas A, B, thus making the consequence relation trivial (everything follows from everything). Now, Prior's tonk-operator was meant as rebuttal of Gentzen's proposal to characterise logical operators by a pair of rules, where the 'introduction-rules should determine the meaning of the operators, and the elimination-rules were understood as, fundamentally, following from the introduction-rules, in the sense of a minimality condition. But despite Prior's doubts, and subsequent suggestions to understand logical constants only truth functionally, Gentzen's idea is basically right as long as we observe that in characterising operators by pairs of rules certain principles of harmony have to be obeyed. As N. Belnap has claimed, it is nonsensical to introduce a tonk-operator, assuming transitivity of the consequence relation,
Ulrich Metsehl: What Is A Logical Constant?
133
just as it is nonsensical to introduce an arithmetical function ? by putting a : b ? c: d := (a + c): (b + d), which would permit the proof of 2 : 3 = 3 : 5. Nevertheless, a proof-theortical characterisation of logical operators ä la Gentzen seems to admit only a relative characterisation as we have to rely on a previous understanding of the consequence relation. For the more philosophically minded this account is therefore somewhat unsatisfying. Accordingly, the prevailing question in this account has become functional completeness how can the set of admissible operators be completely characterised - instead of the question for a substantive criterion for logical constanthood.
3.
Epistemic Aspects of Logical Expressions
Substantive accounts of the logical constants are due, e. g., to P. Strawson and C. Peacocke.1 According to Strawson, for example, the logical constants may be characterised as meaningful operations on meaningful sentences of a given language. Following Wittgenstein's (tractarian) understanding of a meaningful sentence, Strawson takes it in essence to be able to inform. As sentences can inform they can be true, and as they can misinform they can be false. Given suitable conditions of accessibility of the domain we are to be informed about (these conditions amounting more or less to a realistic perspective), admissible operations on the informational value of meaningful sentences will satisfy Boolean equations, and, given sufficient expressive powers in our language, we end up with a set of truth functional logical constants (plus quantifiers), i. e. ordinary Booleans. Lack of space prevents a more thorough treatment of Strawson's and Peacocke's characterisation of logical constants. What is important, however, is the fact that both Strawson and Peacocke strongly favor a classical interpretation of the logical constants. While Strawson has no reservations about that, Peacocke, less resolute on this issue, admits that his epistemic characterisation faces difficulties under an intuitionistic interpretation which he sees no reason to reject outright. A similar but more abstract epistemic characterisation of logic in general and logical constants in particular was proposed by N. Belnap and, more recently, by P. Gärdenfors. Roughly speaking, they take propositions to be functions from states of information to states of information. The meaning of a sentence, the information it contains, has certain effects on our beliefs, i. e. our states of information. Logic then expresses informational dependencies between pieces of information, and the logical constants result from the efforts 1
Cf. Strawson 1982; Peacocke 1979.
134
Section 1: Logic
to map these dependencies in our language. For example, the change in our information state induced by two propositions A and Β (abstracting from the order in which they come) should equal the change induced by Β and A and may therefore be identified with the change induced by their 'fusion', vulgo conjunction A&cB. This approach is definitely not confined to the classical logical operators, but depending on the prior account of the admissible changes of information states the resulting operators are intuitionistic, as in the case of Gärdenfors, or, presumably, relevant, as in the case of Belnap.2 However, a still more general account might try to abstract from any particular conception of information and epistemic states. To this effect I propose a topological version of semantics with an intended epistemic interpretation, implicitly claiming that this semantics nicely merges the proof-theoretical account of logical operators with the more philosophical treatment refering to their epistemic role. It is well known that topological semantics provides for a convenient representation of intuitionistic logic and covers much of the intuitive background of D. Scott's domain semantics for programming languages. In the following I briefly try to motivate the topological rendering of formal semantics before G. Sambin's pretopological semantics for Linear Logic is sketched as sample evidence. Affinities to related work can only be hinted at.
4.
Topological Semantics
Intuitively, we may suppose that with each sentence is correlated a set of situations in which the sentence is definitely true. Let us call these situations 'verifying situations'. We may also suppose that with each sentence is correlated a set of situations, 'refuting situations', in which this sentence is definitely false. However, it is not clear that the union of verifying situations and refuting situations contains all possible situations. On the contrary, it seems quite convincing that there are, for 'normal' sentences in 'normal' languages, situations in which a sentence is neither definitely true nor definitely false. Sentences may be vague, expressions they contain may lack reference, they even may be paradoxical, just to name the standard trouble shooters of the philosophy of language. And, in a more constructive mood, we even might point out that often we are unable to identify the verifying or refuting situations for sentences. Concentrating then on the verifying situations these may be understood as the elements of an open set such that, together with its complement of refuting situations, these do not necessarily equal the set of all situations. However, 2
Belnap, however, does not present any proof for this.
Ulrich Metsehl: What Is A Logical Constant?
135
given for any sentence an open set of verifying situations not all logical reasoning is precluded, even when we insist on finite verifiability. For example, for sentences A, Β the verification of A and of Β is already a verification of A&cB. Similarily, given a verification of A, the infinite disjunction v,A1 is also verified. Moreover, verifying (A & ν is the same as verifying v,(A & ΒΪ), i. e. distribution of binary conjunction over infinite disjunction holds. On the other hand, there is no account of negation or (material) implication in terms of finite verification, as the negation of a verifiable sentence must not itself be verifiable, and likewise for implication. This logic is known in the theoretical computer science community as the logic of finite observations and is due to S. Abramsky.^ This logic of finite observations has an algebraic formluation in terms offrames, where a frame is a partially ordered set (X, C) such that (i) to each finite subset Y C X exists an infimum π Υ , (ii) to each subset (finite or not) Ζ c X exists an supremum UZ, and (iii) distribution of binary infima over arbitrary suprema holds, i. e. χ Π uY = U { x n j / : y e Y). An important result, linking Abramsky's logic of finite observations to intuitionistic logic, is that a partially ordered set is a frame iff it is a complete Heytingalgebra, Heyting-algebras providing the algebraic semantics for intuitionistic logic. Clearly, the logic of finite observations is epistemically motivated and so are the logical operations which are singled out as operations on finite observations preserving finite verifiability. It should be noted that topologies are an important type of frames and indeed frames are nothing but an abstraction of ordinary point set topologies. It is instructive, however, to have a look at another example of a basically topologically specified logic to appreciate the working of topological ideas in connection with logical constants. Girard's linear logic may be seen as a substructural logic without contraction and weakening. Deductions are therefore subject to the constraint that each premisse in a deduction is used exactly once in this deduction. Now, a topological semantics for linear logic faces the obvious difficulty that for open sets U,V,W w e h a v e i / n K n K C ^ ^ t / n K C ^ a n d i / E i r ^ i / n K c W , properties closely resembling contraction and weakening. To G. Sambin we owe a refinement of topological structures without these properties, so-called pretopologies. 4 A base 5 is a structure (S, ο, 1, _L) such that (5, ο, 1) is a commutative monoid, i. e. for a, b,c in S we have (i) ao(boc) = (aob)oc, (ii) ao b — boa, and (iii) 1 ο a = a, and _L is subset of S. Intuitively, Sambin proposes, S can be understood as a set of information pieces or, more generally, objects, ο is an 3 4
For a lucid account see Vickers 1989. cf. Sambin 1988.
136
Section 1: Logic
operation of glueing or putting together, and ± is the set of impossible objects or information pieces. A relation C is called a precover iff (for a € S and U C 5) (i) a G U => aQ U (Reflexivity), (ii) aQU StU QV atV (Transitivity), where U C V := (Vbe U)(bQ V),znd (iii) aQUStbQV=$>aobnUoV (Stability), where U oV := {ao b : a £ U and b Ε V}. The above intuition is continued by taking a C U to mean something like 'a follows from £/'. This idea is captured by the introduction of a consequence operator fU := {a e S : a C ί / } whence it follows that a e TU iff a Q U. As C is reflexive and transitive 7 is clearly a hull operator. The role of the stability condition for precovers is to account for the cut rule. Finally, a pretopology Τ is a structure (S.o. 1. _L. C) s. t. (i) (S, ο, 1, _L) is a base, (ii) C is a precover, and (iii) _L= fF(-L), i. e. the set of impossible objects is closed under logical consequence. Contraction and weakening do not hold in pretopologies, and the reason is that o, the glueing operator, has no lattice properties. More precisely, contraction and weaken0 ing do hold iff J{U) Π !F(V) = V). If this equation holds, then the logic of pretopologies is actually intuitionistic logic. If in neither of the directions the subset relation holds the logic of pretopologies is (some version) of Girard's linear logic. Now, in what sense can this improve our understanding of logical constants? As a closer inspection (which has to be omitted here) would show, the properties of pretopologies translate faithfully into the structural and logical rules of a sequent calculus for linear logic (without the exponentials 'of course' - ! - and 'why not' - ? - ) . They do so under a quite natural interpretation of the points in a pretopology as proof objects. Pretopologies show some resemblance to Scott domains and both develop their full strength in a categorial setting.-' Likewise, Sambin's pretopology semantics shows some resemblance to A. Koslow's 'structuralist theory of logic' which makes use of socalled 'implication structures' (cf. Koslow 1992). Taken together this vindicates the claim that a proper account of logical constanthood will demonstrate their indispensability for the processing of information in a general proof- theoretic setting.
5.
References
BELNAP, NUEL D . : T o n k , P l o n k a n d P l i n k . Analysis
2 2 (1962), 1 3 0 - 1 3 4 .
BELNAP, NUEL D.: A Useful Four-Valued Logic. In: Modem Uses of Multiple-Valued
Logic, ed. Dunn/Epstein, Dordrecht 1977, 8-37. 5
For more on this see Stoltenberg-Hansen/Lindström/GrifFor 1994.
Ulrich Metsehl: What Is A Logical Constant?
137
Knowledge in Flux, Cambridge, Mass. 1 9 8 8 . A Structuralist Theory of Logic, Cambridge 1992. C H R I S T O P H E R : What Is a Logical Constant? Journal of Philosophy
GÄRDENFORS, PETER: KOSLOW, A R N O L D : PEACOCKE,
(1976),
73
221-239.
N.: The Runabout Inference-Ticket. Analysis 21 (1961), 38-9. Intuitionistic Formal Spaces and their Neighbourhood. In: Logic Colloquium '88, Amsterdam 1989. S T O L T E N B E R G - H A N S E N , V . / L I N D S T R Ö M , I . / G R I F F O R , E . : Mathematical Theory of Domains, Cambridge 1994. S T R A W S O N , P E T E R F.: Logical Form and Logical Consequence. Javadpur Studies in Philosophy 4 (1982), 1-17. T A R S K I , A L F R E D : Über den Begriff der logischen Folgerung. In: Actes du Congres International de Philosophie Scientifique, Paris 1936. T A R S K I , A L F R E D : Der Aussagenkalkül und die Topologie. Fundamenta Mathematicae 31 (1938), 103-134. T A R S K I , A L F R E D : Logic, Semantics, andMetamathematics, Oxford 1 9 5 6 . V I C K E R S , S T E P H E N : Topology via Logic, Cambridge 1989. PRIOR, ARTHUR
SAMBIN, GIOVANNI:
HANS ROTT
Vom Primat der praktischen Vernunft Logische Regeln als Regeln rationaler Wahl* 1. 2. 3. 4. 5. 6.
Praktische und theoretische Vernunft Praktische Vernunft: Die rationale Wahl von Handlungen Theoretische Vernunft: Die Logik des alltäglichen Schließens Logische Prinzipien als Prinzipien rationaler Wahl Schlußbemerkungen Literatur
1.
Praktische und theoretische Vernunft
Nicht erst seit Kant (KrV, Β 833) haben sich Philosophen die Fragen „Was kann ich wissen?" und „Wie soll ich handeln?" gestellt, und sie haben diese Fragen füglich auseinander gehalten. Theoretische und praktische Vernunft sind vorderhand mit völlig verschiedenen Problemen befaßt. Wir werden versuchen zu zeigen, wie man trotzdem wichtige Ausschnitte beider Bereiche so miteinander verknüpfen kann, daß im theoretischen Teil Prinzipien der praktischen Rationalität zur Anwendung kommen. Im Bereich der theoretischen Vernunft konzentrieren wir uns auf die Logik. Logik verstehen wir als diejenige Disziplin, die Inferenzen oder Schlußfolgerungen studiert und beurteilt, wobei diese wiederum den (richtigen) Ubergang von als wahr akzeptieren Prämissen zu (dann ebenfalls zu akzeptierenden) Konklusionen, von expliziten Informationen zu darin implizit enthaltenen Informationen bezeichnen. Das zentrale Konzept der Logik ist eine Inferenzoder Konsequenzrelation Durch eine solche Relation wird unserem Wissen ein Rationalitätsstandard auferlegt: Es soll unter logischen Folgerungen abgeschlossen sein, ohne zu logischen Widersprüchen zu fuhren (beides bezüglich Nur solches logisch ausbalancierte Wissen ist wirklich kohärent. Im Bereich der praktischen Vernunft befassen wir uns ebenfalls mit abstrakten Rationalitäts- oder Kohärenzkriterien. Insofern wir handeln und nicht bloß ein Verhalten an den Tag legen, ist das, was wir tun, mit einer freien Entscheidung verbunden. Wir haben Willens- und Handlungsfreiheit, haben die freie Wahl, aus den uns offen stehenden Handlungsalternativen * Gewidmet dem ehrenden Gedenken an Lorenz Krüger (1932-1994).
Hans Rott: Vom Primat der praktischen Vernunft
139
eine solche auszuwählen, die uns am besten erscheint. Bei der Grundlegung der allgemeinen Handlungstheorie wird es also nötig sein, die Rationalität von Wahlentscheidungen zu charakterisieren. Diese Aufgabe wird zumindest zum Teil von der aus der Ökonomie kommenden Theory of rational choice wahrgenommen, die sowohl individuelle als auch gemeinschaftliche Wahlentscheidungen zum Gegenstand hat. Das zentrale Konzept dieser Theorie ist eine Auswahlfunktion γ, die aus jeder Menge S von Handlungsalternativen „die besten" auszeichnet. Rationales Wahlverhalten wird dann dadurch charakterisiert, daß γ quer über verschiedene Wahlsituationen hinweg konsistent oder kohärent bleibt. Logik und praktische Philosophie markieren die Enden im Spektrum des akademischen Fachs Philosophie. Dennoch sind immer wieder Zusammenhänge aufgedeckt worden. Ein für uns einschlägiges Beispiel stellt die induktive Logik dar, welche „die richtigen" Schlußfolgerungen von einzelnen, beobachteten Fällen auf zugrundeliegende Gesetze oder (wenigstens) auf zukünftige Fälle herauszufinden sucht. Zunächst wurde sie von Carnap ( 2 1962, §55B), ihrem hervorragendsten Vertreter, als eine Logik der partiellen Implikation konzipiert. Unter dem Eindruck einer sehr kritischen Rezeption betonte Carnap (1963; 1971) in späteren Arbeiten stärker die Einbettung seines probabilistischen Kalküls in die Theorie rationaler Entscheidungen insbesondere des kohärenten Wettens - auf der Grundlage subjektiver Wahrscheinlichkeiten und Wünsche. Zur Unterscheidung unseres Projekts von Carnaps Unternehmen der induktiven Logik sind vier wichtige Punkte anzuführen. (1) Carnaps Ansatz war ganz wesentlich quantitativ, probabilistisch. Wir werden qualitativ, nicht-probabilistisch vorgehen. (2) Carnap selbst und viele mit ihm haben es entschieden abgelehnt, die induktive Logik als eine Logik im oben definierten Sinn vorzustellen. 1 Denn es ist schwierig, im probabilistischen Rahmen Regeln des Akzeptierens anzugeben, die mit sinnvollen Schlußregeln (Regeln des Kombinierens von akzeptierten Prämissen zu akzeptablen Konklusion) zusammenpassen. Wir werden uns mit Logiken im schlußfolgernden Vollsinne befassen. (3) Mit dem Prinzip der Maximierung des erwarteten Nutzens gab Carnap eine materiale Entscheidungsempfehlung auf der Grundlage von - bzw. im kohärenten Zusammenhang mit - den (partiellen) Überzeugungen und 1
Carnap 2 1962, §44B; 1963,972; 1971, 29; siehe auch die Beiträge von Salmon und Kyburg mit Diskussionen in Lakatos ed. 1968, 24—165-
140
Section 1: Logic
Wünschen eines Handelnden. 2 Wir verpflichten uns auf keine inhaltliche Entscheidungsvorschrift und setzen allein formal faßbare Zusammenhänge zwischen Wahlen in verschiedenen Wahlsituationen an. (4) In den Augen sowohl von Carnapianern 3 als auch von Popperianern 4 hat Carnap in den letzten 20 Jahren seines Lebens eine fundamentale Abkehr von Problemen der theoretischen hin zu Problemen der praktischen Vernunft vollzogen. Wir haben die Einheit von theoretischer und praktischer Vernunft im Auge. Gleichzeitig vertreten wir die These vom Primat der praktischen Vernunft, indem wir die theoretische als eine Spezialisierung der praktischen Rationalität erweisen und zeigen, auf welche Weise sich zentrale Prinzipien logischen Schließens aus nicht minder zentralen Prinzipien rationaler Wahl herleiten lassen.
2.
Praktische Vernunft: Die rationale Wahl von Handlungen
Wir verwenden das Instrument einer Auswahlfunktion γ über einem endlichen Grundbereich X, welche fur jede beliebige Teilmenge S von X diejenigen Elemente von S liefert, die eine optimale Wahl in 5 darstellen. Es gilt y(S) C 5. Wir fordern nicht, daß eine solche Funktion immer eine Entscheidung liefert, d.h. daß y(S) φ 0. Von den vielen in der Literatur gängigen betrachten wir folgende vier zentralen Kohärenzbedingungen (Moulin 1985): (I)
Wenn ScS',
(II)
dann 5 η y(S') C γ(5") y(S)ny(S')Cy(SuS')
(III) (IV)
1
Wenn S C S und γ(5') C 5, dann y{S) C y{S') Wenn ScS'
und γ(5") Π 5 / 0 , dann y{S) C y(S')
Die Auswahl und Reihenfolge dieser Prinzipien ist bestimmt durch die Tatsache, daß sie die „Rationalisierung" einer Auswahlfunktion durch eine zugrundeliegende feste Präferenzrelation erlauben. Genauer nennen wir eine Auswahlfunktion γ (transitiv, modular) rationalisierbar, wenn es eine (transitive, 2 3
4
Carnap 2 1 9 6 2 , § § 50E; 51A; 1963, 9 6 9 - 9 7 1 ; 1971, 8. Stegmüller (1971, 14f.; 70ff.; 1972, 77; 90; 1973, 84f.; 540) argumentiert für eine strikte Trennung von praktischer und theoretischer Rationalität u n d sieht konsequent einen entsprechend großen Kontrast zwischen „Carnap I" u n d „Carnap II". Wie Lakatos (1968, 402; 404) diagnostiziert, gibt es bei Popper u n d Watkins eine „Unabhängigkeit", ja sogar eine „scharfe Trennung" von wissenschaftlicher u n d praktischer Rationalität.
Hans Rott: Vom Primat der praktischen Vernunft
141
modulare 5 ) Präferenzrelation < über X gibt, so daß für alle 5 gilt: γ(S) — {x e S: es gibt kein y 6 S derart, daß y < x] Rationalisierbarkeit wird nach dieser Konzeption also mit Relationalisierbarkeit identifiziert.6 Die Auswahl von optimalen Elementen ist kontextinsensitiv, denn die Präferenzrelation < hängt nicht von der konkret vorliegenden Wahlsituation S ab. Die folgenden Tatsachen sind wohlbekannt: (a) γ ist rationalisierbar gdw. γ durch die folgendermaßen definierte Präferenzrelation rationalisierbar ist: („Basispräferenzen")
x))] (2) Wenn S Gewißheit hat, daß alles, was S klar und distinkt wahr ist, dann hat S Gewißheit, daß Gott existiert und kein [kurz: G(yp(K{p) -> p)) G(e&b)}
ist, dann hat wahr ist. wahrnimmt, Betrüger ist.
Es steht außer Frage, daß wir in einen Begründungszirkel geraten, wenn (1) und (2) wahr sind. S kann nämlich nur dann Gewißheit darüber besitzen, daß alles, was S klar und distinkt wahrnimmt, wahr ist, wenn S Gewißheit hat, daß * Für hilfreiche Bemerkungen danke ich Peter Kügler. 1 Van Cleve 1979.
258
Section 2: Epistemology
Gott existiert und kein Betrüger ist. Um aber von der Existenz eines nicht betrügerischen Gottes Gewißheit zu haben, müßte S wiederum wissen, daß alles, was klar und distinkt wahrgenommen wird, auch wahr ist. Ein Ausweg aus diesem Zirkel bedarf einer Ablehnung von (1) oder (2). Zur Lösung des Zirkels führt Van Cleve folgendes epistemisches Prinzip an: (EP)
Wenn S klar und distinkt wahrnimmt, daß p, dann hat S Gewißheit, daß p.
[kurz: Vp{K{p) G(/>))] Ein derartiges epistemisches Prinzip müssen wir annehmen, um überhaupt von etwas sagen zu können, wir hätten Gewißheit darüber. Mit (EP) wird behauptet, daß eine Person, die etwas klar und distinkt wahrnimmt, hinsichtlich dessen immer Gewißheit hat. Van Cleves Lösung des Zirkelproblems besteht nun darin aufzuzeigen, daß wir keine Gewißheit dafür brauchen, daß alles, was eine Person klar und distinkt wahrnimmt, wahr sein muß, um die Existenz Gottes zu beweisen. Die Existenz Gottes kann durchaus gewiß sein, ohne daß Gewißheit darüber besteht, daß alles, was klar und distinkt wahrgenommen wird, wahr ist. Gewißheit um die Existenz Gottes erfordert nur eine klare und distinkte Wahrnehmung von der Existenz Gottes. Satz (2) kann somit abgelehnt werden. In diesem Fall ersetzen wir Satz (2) durch eine Spezifizierung des genannten epistemischen Prinzips und erhalten so folgenden Satz:
(2*)
K{e&cb)-^G{e&ib)·,
damit sind wir aus dem Zirkel ausgebrochen.
2,
Rechtfertigung von (EP)
Wenn (EP) tatsächlich gilt, dann ist alles, was S klar und distinkt wahrnimmt, auch gewiß. 2 Nun muß die Struktur eines solchen epistemischen Prinzips näher erläutert werden. Um einen Zirkel tatsächlich zu durchbrechen oder einen drohenden Regreß zu stoppen, ist es wichtig, daß das Antezedens von (EP) nicht als epistemischer Grund fur Gewißheit angesehen wird. Eine klare und distinkte Wahrnehmung stellt keinen epistemischen Grund dar, auf dessen Basis eine Person Gewißheit hat. Vielmehr stellen klare und distinkte Wahrnehmungen eine Quelle für unser Wissen dar. Dazu schreibt Van Cleve: 2
Vgl. Van Cleve 1 9 7 9 , 6 8 .
Kurt Koleznik: Meinungszirkel, epistemisches Prinzip und Supervenienz
259
„The fact that I clearly and distinctly perceive a proposition does not serve as a ground for accepting it. It is a source of knowledge, but not a ground."3 Was als Quelle der Rechtfertigung anzusehen ist, kann je nach Theorie der Erkenntnis variieren. Eine Rechtfertigungsquelle hat aber im Gegensatz zu Gründen keine semantischen Eigenschaften. Gründe sind hingegen immer Glaubenseinstellungen mit semantischem Gehalt, ftir die eine Rechtfertigung gefordert werden kann. Eine Quelle bedarf keiner epistemischen Rechtfertigung. Weiters ist (EP) selbst kein Prinzip, das ich anwenden muß, um Gewißheit zu erlangen, sondern ein Fall von Gewißheit muß lediglich diesem Prinzip unterliegen. Dieses epistemische Prinzip müssen wir nicht bewußt vor Augen haben, wenn wir es anwenden, was nicht gleichbedeutend damit ist, daß wir das epistemische Prinzip nicht angeben können, wenn wir dazu aufgerufen werden. Stattdessen folgen wir dem epistemischen Prinzip blind. 4 Um Gewißheit hinsichtlich einer Proposition zu haben, muß ich weder Gewißheit haben, daß ich eine klare und distinkte Wahrnehmung habe, noch muß ich Gewißheit haben, daß das Wahrgenommene auch tatsächlich der Fall ist. Es ist einfach der Fall, daß ich eine klare und distinkte Wahrnehmung habe; und daß dies der Fall ist, ist hinreichend für Gewißheit. Aufgrund dieser Betrachtungen können wir Van Cleve zustimmen, daß ein Weg aus dem Cartesianischen Zirkel heraus gefunden wurde und kein Rechtfertigungsproblem hinsichtlich der für gewiß erachteten Glaubenseinstellungen vorliegt, sofern wir die Unterscheidung Grund/Quelle akzeptieren.
3.
Supervenienz
Der bisherige Stand der Überlegungen ist folgender: etwas klar und distinkt wahrzunehmen, ist Quelle und nicht Grund für Gewißheit; „Wenn S klar und distinkt wahrnimmt, daß p, dann hat 5 Gewißheit, daß p" ist ein epistemisches Prinzip; diesem Prinzip folgen wir blind. Freilich müßten wir jetzt, um Skeptiker einigermaßen zufriedenzustellen, eine Rechtfertigung für die Gültigkeit des epistemischen Prinzips geben. Wir bewerten ein epistemisches Prinzip dadurch, daß wir sagen: „Wir sind gerechtfertigt im Glauben, daß (EP)", „Wir haben Gewißheit, daß (EP)" etc. Durch derartige Behauptungen geraten wir neuerlich in einen Zirkel. Um aus 3
Van Cleve 1979, 6 9 . Vgl. dazu Wittgensteins Auffassung des Regelfolgens, wonach wir einer Regel blind folgen (vgl. P U 1 9 5 8 , § 2 1 9 ) .
260
Section 2: Epistemology
dem Zirkel auszubrechen, muß die Gültigkeit des epistemischen Prinzips von etwas anderem als von einer weiteren epistemischen Bewertung abhängen. Im Anschluß will ich nun eine solche Möglichkeit aufzeigen. Wenn wir Probleme in der Rechtfertigungstheorie diskutieren, dann verwenden wir oftmals eine typisch ethische Terminologie. Wir können fragen, was unterscheidet eine gute Erklärung von einer schlechten Erklärung. Wir können sagen, daß wir Meinungen, die mit anderen Meinungen kohärieren, vertrauen sollen. Es wäre seltsam zu sagen, wir haben das Recht eine bestimmte Theorie zu akzeptieren, wenn wir wüßten, daß es eine andere gleichermaßen plausible Theorie gibt. Was fragen wir, wenn wir fragen, ob eine Meinung gerechtfertigt ist? Was wir wissen wollen, ist, ob wir mit Recht eine bestimmte Meinung für gerechtfertigt halten können. Epistemische Rechtfertigung hat somit einen normativen Charakter, weil im Zentrum eine Frage der Form „Wann ist es erlaubt zu glauben, daß />?" steht. Es besteht hier eine Parallele zwischen Fragen der Rechtfertigung in der Ethik und Fragen der Rechtfertigung in der Epistemologie. Eine naturalistische Analyse ethischer Begriffe weist ethische Sätze als Tatsachensätze aus. Die Wahrheit oder Falschheit solcher Sätze wird durch eine empirische Untersuchung bestimmt. Wenn wir „gut sein" definieren als „ein Gegenstand des Verlangens sein", dann läßt sich die Frage, ob χ gut ist, einfach durch eine empirische Feststellung, ob Λ: verlangt wird, beantworten. Ethische Begriffe werden somit durch nicht-ethische Begriffe definiert. Gegner derartiger Definitionen erheben gegen sie den Vorwurf des „naturalistischen Fehlschlusses" . Die Gegenposition zum Naturalismus ist der Intuitionismus. Für ihn sind die grundlegenden ethischen Prinzipien intuitiv gegeben oder in sich evident. Der Intuitionismus baut auf einer bestimmten Theorie der Bedeutung und der Natur ethischer Sätze auf. Intuitionisten bestreiten, daß die Eigenschaften, die fur Begriffe wie „gut", „sollen" etc. stehen, durch nicht-ethische Begriffe definierbar sind. Ethische Eigenschaften lassen sich nicht durch empirische oder natürliche Eigenschaften definieren, analysieren oder auf sie reduzieren. Die Rechtfertigungssituation in der Meta-Epistemologie ist parallel zu der in der Meta-Ethik. Auch hier können wir einen naturalistischen oder intuitionistischen Weg einschlagen. Eine naturalistische Erkenntnistheorie kommt gewöhnlich gänzlich ohne den Begriff der Rechtfertigung aus. Naturalistische Erkenntnistheorien sind um die Erklärung des Zustandekommens von Meinungen bemüht, jedoch nicht um die Rechtfertigung einer
Kurt Koleznik: Meinungszirkel, epistemisches Prinzip u n d Supervenienz
261
Meinung. 5 Wenn eine solche Theorie nur mit der Erklärung der Genese von Meinungen beschäftigt ist, dann wird der normative und evaluative Kontext epistemischer Rechtfertigung gänzlich auf den genetischen Kontext reduziert. Die Theorie der epistemischen Rechtfertigung scheint dann auf andere empirische Wissenschaften rückführbar zu sein. Eine moderatere Form der naturalistischen Theorie der Erkenntnis könnte allerdings auch so aussehen: es werden spezifische physische Bedingungen für epistemische Begriffe angegeben, ohne zu behaupten, daß epistemische auf physikalische Begriffe reduzierbar sind. 6 Das ist ein non-reduktives und non-eliminatives Programm; non-eliminativ in dem Sinne, daß epistemische Begriffe weiterhin bewahrt bleiben, und non-reduktiv in dem Sinne, daß epistemische Begriffe nicht synonym mit physikalischen Begriffen sind. Die intuitionistische Auffassung ist diesem moderaten Naturalismus in gewisser Hinsicht ähnlich. Auch fiir den Intuitionisten sind epistemische Eigenschaften nicht auf empirische oder physische Eigenschaften reduzierbar; diese epistemischen Eigenschaften können wohl aber Objekten mit physischen Eigenschaften zugeschrieben werden.7 Ontologisch betrachtet, sind aber epistemische Eigenschaften und physische Eigenschaften unterschiedliche Entitäten. Was die Beziehung zwischen den Eigenschaften betrifft, so scheint es doch wenigstens möglich zu sein, den moderaten Naturalismus mit dem Intuitionismus in Einklang zu bringen. Epistemische Eigenschaften sind in beiden Fällen abhängig von nichtepistemischen Eigenschaften bzw. werden durch nichtepistemische Eigenschaften determiniert. Eine solche Relation drückt das aus, was heute in der Philosophie als Supervenienz bezeichnet wird. Der Begriff der Supervenienz scheint das erste Mal von R. M. Hare explizit verwendet worden zu sein.8 Eine allgemeine Charakterisierung von Supervenienz würde lauten, daß Supervenienz eine Relation der Abhängigkeit und Determiniertheit zwischen zwei Familien von Eigenschaften ist, ohne daß dabei die eine auf die andere reduziert wird.9 Wir können den Supervenienzgedanken folgendermaßen definieren:
5
Ein Hauptvertreter der naturalistischen Erkenntnistheorie ist Q u i n e (vgl. Q u i n e 1975).
6
Vertreter einer moderaten naturalistischen Theorie sind u . a . K i m ( 1 9 9 3 ) und Kornblith
7
Vgl. C h i s h o l m 1979.
8
Vgl. dazu Hare 1952; Davidson 1970; K i m 1984; Aiston 1987; Sosa 1991.
(1980).
'J D a s Problem der Reduzierbarkeit wird besonders im Z u s a m m e n h a n g mit mentalen u n d physischen Eigenschaften diskutiert. Es ist nach wie vor eine Streitfrage, o b Supervenienz schlußendlich nicht doch eine ontologische Reduktion des Mentalen auf das Physische ausdrückt. Vgl. dazu u . a . Davidson 1970; K i m 1978; Marras 1993.
262
Section 2: Epistemology
^-Eigenschaften supervenieren auf Β-Eigenschaften gdw für jedes Objekt χ und jede /l-Eigenschaft Ε notwendigerweise gilt: wenn χ die Eigenschaft Ε besitzt, dann gibt es eine 5-Eigenschaft F, so daß (i) χ F besitzt und (ii) notwendigerweise gilt: wenn irgendein Objekt F besitzt, dann besitzt es auch Ε. Ein Beispiel aus der Moralphilosophie verdeutlicht, welcher Gedanke durch Supervenienz zum Ausdruck gebracht wird: wenn wir sagen, daß moralische Eigenschaften auf natürlichen Eigenschaften supervenieren, dann behaupten wir damit, daß keine Entität die Eigenschaft „gut zu sein" besitzt, ohne daß sie auch natürliche Eigenschaften, beispielsweise die Charakter- oder Verhaltenseigenschaft „mutig zu sein", „großzügig zu sein" oder „hilfsbereit zu sein" etc., besitzt. Es ist daher unmöglich (entweder logisch, metaphysisch oder nomologisch), daß zwei Personen hinsichtlich aller natürlichen Eigenschaften genau gleich sind, aber nicht beide die Eigenschaft „gut zu sein" besitzen; daher gilt: wenn ein Objekt natürliche Eigenschaften und darüber hinaus die Eigenschaft „gut zu sein" besitzt, dann ist alles andere, das diese natürlichen Eigenschaften besitzt, gut. 10 Will jemand bestreiten, daß eine Supervenienzrelation zwischen den zwei Eigenschaftsbereichen vorliegt, dann muß er den Standpunkt einnehmen, (i) daß es Objekte mit moralischen Eigenschaften gibt, aber diesen Objekten keine natürlichen Eigenschaften zukommen, oder (ii) daß ein Objekt zwar moralische und natürliche Eigenschaften besitzt, die beiden Eigenschaftsbereiche aber in keiner Beziehung zueinander stehen. Beide Möglichkeiten scheinen absurde Konsequenzen nach sich zu ziehen. Der ersten Möglichkeit zufolge gäbe es beispielsweise Handlungen, die zwar moralisch „gut" sind, aber die Handlung selbst wäre weder außermoralisch beschreibbar noch besäße sie eine natürliche Eigenschaft. Der zweiten Möglichkeit zufolge wäre mit der absurden Konsequenz zu rechnen, daß, wenn „gut sein" nicht die Folge von natürlichen Eigenschaften ist, ein anderes Objekt mit exakt den gleichen natürlichen Eigenschaften nicht ebenfalls die Eigenschaft „gut zu sein" besäße.
10
Das Beispiel aus der Moralphilosophie erfüllt jedoch nicht ganz unsere oben angegebene Definition. Das zweite Vorkommnis von „notwendigerweise" verlangt nämlich, daß die besagte Eigenschaft-Eigenschaft-Relation nicht nur innerhalb jeder möglichen Welt besteht, sondern auch quer durch alle möglichen Welten. Eine konkrete Beziehung, die zwischen moralischen und natürlichen Eigenschaften besteht, muß zwar innerhalb einer Welt bestehen, aber wir können diese spezifische Beziehung nicht einfach in andere Welten transferieren. Beispielsweise ist in dieser Welt jede Person, die die Eigenschaft G besitzt, ein guter Mensch, in einer anderen möglichen Welt ist niemand gut, dem die Eigenschaft G zukommt; im Gegenteil, ein solcher Mensch ist böse (vgl. Kim 1984, 159f.).
Kurt Koleznik: Meinungszirkel, epistemisches Prinzip und Supervenienz
263
Die Parallele zur Epistemologie liegt hier auf der Hand. Da der Begriff der Rechtfertigung ein normativer Begriff ist, supervenieren epistemische Eigenschaften auf nichtepistemische Eigenschaften. Unter Bezugnahme auf die Supervenienzdefinition können wir nun folgendes Konditional angeben, wobei wir die Modaloperatoren für unsere Zwecke unberücksichtigt lassen: Für jedes Objekt χ und jede epistemische Eigenschaft Ε gilt: Wenn χ Ε besitzt, dann gibt es eine nichtepistemische Eigenschaft F , so daß gilt: χ besitzt F, und wenn irgendein Objekt F besitzt, dann besitzt es auch Ε. Diese abgeschwächte Supervenienzbehauptung können wir folgendermaßen formalisieren: (Sup)
\/XVE£A{EX
- > 3FEB(FX&CVY(FY
->
EY)))
Wenn nun die Supervenienzbehauptung gültig ist, und es irgendein Objekt mit der epistemischen Eigenschaft „gewiß zu sein" gibt, dann folgt daraus das zu Beginn genannte epistemische Prinzip. Sei α das Objekt mit der Eigenschaft „gewiß zu sein" (G). Es gelten dann die folgenden beiden Prämissen: (PI)
(Sup)
(P2)
Ga
Daraus ergibt sich auf die folgende Weise ein epistemisches Prinzip: (1) (2)
Ga^3FeB(Fa&Vy{Fy^Gy)) 3Feß(Fa&Vy(Fy
-> Gy))
(3)
Ka&LVy{Ky ->• Gy)
(4)
yy{Ky -»· Gy)
[aus (PI)] [aus (P2) und (1)] [aus (2)] [aus (3)]
Aus der Supervenienzbehauptung folgt also, daß es ein epistemisches Prinzip gibt. Um welches es sich dabei handelt, hängt davon ab, wie das Prädikat „K" in den Zeilen (2) und (3) interpretiert wird. Liest man es als „klar und distinkt", dann erhält man das zu Beginn genannte epistemische Prinzip (EP). Andere Interpretationsmöglichkeiten für „K" wären etwa „Element eines kohärenten Meinungssystems zu sein" (wobei Kohärenz durch nichtepistemische Begriffe definiert werden müßte), „nützlich zu sein" (im Sinne des Pragmatismus) oder „zuverlässig zu sein" (Reliabilismus).
2 6 4
Section 2: Epistemology
4.
Literatur
P.: Zwei Arten von Fundamentalismus. In: Analytische Philosophie der Erkenntnis, hrsg. Peter Bieri, Frankfurt a. M. 1987, 217-238. C H I S H O L M , R O D E R I C K M.: Erkenntnistheorie, München 1 9 7 9 . D A V I D S O N , D O N A L D : Mental Events. In: Experience and Theory, hrsg. Foster, L./ Swanson, J. W„ Amherst 1970, 79-101. H A R E , R I C H A R D Μ.: The Language of Morals, London 1952. K I M , J A E G W O N : Supervenience and Nomological Incommensurables. American Philosophical Quarterly 15 (1978), 149-156. K I M , J A E G W O N : Concepts of Supervenience. Philosophy and Phenomenological Research 45 (1984), 153-176. K I M , J A E G W O N : Supervenience and the Mind, Cambridge 1993. K O R N B L I T H , H I L A R Y : Beyond Foundationalism and the Coherence Theory. Journal of Philosophy 72 (1980), 597-612. M A R R A S , A S U N I O : Psychophysical Supervenience and Nonreductive Materialism. Synthese 95 (1993), 275-304. Q U I N E , W I L L A R D V . O . : Ontologische Relativität und andere Schriften, Stuttgart 1 9 7 5 . S O S A , E R N E S T : Knowledge in Perspective, Cambridge 1991. V A N C L E V E , J A M E S : Foundationalism, Epistemic Principles, and the Cartesian Circle. The Philosophical Review 88 (1979), 55-91. V A N C L E V E , J A M E S : Epistemic Supervenience and the Rule of Belief. The Monist 68 (1985), 90-104. W I T T G E N S T E I N , L U D W I G : Philosophische Untersuchungen, Frankfurt a. Μ. 1982. ALSTON, WILLIAM
VERENA
MAYER
Logischer Holismus: Zur Erkenntnistheorie des Tractatus 1. 2. 3. 4. 5.
Logischer Atomismus vs. Holismus Russells Erkenntnistheorie und Wittgensteins Kritik Die „logischen Atome" des Tractatus Das Zeigen logischer Form Literatur
1.
Logischer Atomismus vs. Holismus
Die Grundidee des logischen Atomismus ist die Konstruierbarkeit der Welt aus einfachen Einheiten, die unabhängig voneinander existieren. So behauptet Russell, „that you can get down in theory, if not in practice, to ultimate simples, out of which the world is built, and that those simples have a kind of reality not belonging to anything else" (Russell 1956, 270). Diese einfachen Gegenstände heißen deshalb „logisch", weil sie Atome der logischen, nicht der physikalischen Analyse sind. Russell versteht darunter „zum einen Individuen — kleine Farbflecke, Töne, kurzlebige Dinge — zum anderen Prädikate, Relationen etc." (Russell 1918, 179).1 In Schriften, die um 1918 und später entstanden sind, und im Vorwort zum Tractatus schreibt Russell Wittgenstein die Entwicklung der Grundgedanken des logischen Atomismus zu. 2 Seither gilt der Tractatus als einer der Haupttexte dieser Lehre. Obwohl Wittgenstein weder von logischen Atomen noch von einem Aufbau der Welt aus solchen spricht, wird dem Text geradezu ein „offizieller Atomismus" unterstellt. 3 Wittgenstein war von Russells Vorwort zum Tractatus enttäuscht. In einem Brief an Engelmann schreibt er, es handle sich dabei um „ein Gebräu, mit dem ich nicht einverstanden bin", und er verzichtete sogar auf die Möglichkeit, den Text zu publizieren, da er ihn nicht mit Russells Erläuterung zusammen gedruckt sehen wollte. Welche Aspekte der Russellschen Interpretation er ablehnte, verschwieg er, sprach jedoch in einem Brief an Russell von 1
2 3
Im Jahr 1918 ist der Zusatz „etc." nicht mehr eindeutig; 1913 zählte Russell jedoch zu den logischen Atomen auch logische Formen, wie etwa die Form einer zweistelligen Relation (vgl. u.). Vgl. die Vorbemerkung Russells zu den Artikeln im Monist 1918/1919. Pears 1990, 167; für eine der zahlreichen Identifikationen von Russells Atomismus mit der Lehre des Tractatus vgl. Skyrms 1993-
266
Section 2: Epistemology
„Oberflächlichkeit und Mißverständnis", die in der deutschen Übersetzung des Vorworts zutage treten würden.4 Im Gegensatz zur verbreiteten Meinung läßt sich zeigen, daß es gerade der logische Atomismus war, den Wittgenstein an Russells TractatusInterpretation ablehnte. Die offizielle Lehre, die Wittgenstein im Tractatus vertritt, läßt sich besser als „logischer Holismus" kennzeichnen: Die einfachen Bestandteile des Tractatus sind nur in Abhängigkeit von einem logischen Holon, der Form der Welt, bestimmbar; umgekehrt kann die Welt nicht als aus einfachen Elementen zusammengesetzt gedacht werden. Wittgensteins Holismus zeigt sich in der historischen Auseinandersetzung mit Russell, läßt sich aber vor allem im Tractatus nachweisen.
2.
Russells Erkenntnistheorie
und Wittgensteins
Kritik
Während in historischen Darstellungen oft die enge philosophische Beziehung zwischen Russell und Wittgenstein betont wird, zeigt die Vorgeschichte des Tractatus eine zunehmende Entfremdung, die bis zum endgültigen Abbruch der philosophischen Auseinandersetzung im März 1914 führte. 5 Vieles deutet darauf hin, daß dieser Bruch durch einen philosophischen Streit zwischen Wittgenstein und Russell verursacht wurde. Um 1913 arbeitete Russell am Entwurf eines Buchs, das eine Art Principia mathematica für die Erkenntnistheorie darstellen sollte: eine Ableitung der verschiedenen Arten von Erkenntnissen auf einer möglichst minimalen Basis von Grundbegriffen. Russell hat das Buch damals aufgrund von Wittgensteins heftiger und vernichtender Kritik nicht publiziert - erst in jüngerer Zeit ist es unter dem Titel „Theory of Knowledge" zugänglich gemacht worden.6 Es gibt nur wenige überlieferte Äußerungen Russells und Wittgensteins, die sich direkt auf Wittgensteins Kritik an dem Manuskript beziehen. Eine davon findet sich in einem Brief Wittgensteins an Russell vom Juni 1913, in dem es heißt: 4 5
6
Vgl. die Briefe Nr. 128 (an Engelmann) und Nr. 129 (an Russell) in Wittgenstein 1980. Vgl. dazu Iglesias 1984, Pears 1989; im Brief Nr. 37 bezieht sich Wittgenstein auf einen Streit mit Russell „über den Wert eines wissenschaftlichen Werkes", der unter anderem Anlaß für den beabsichtigten Abbruch des Briefverkehrs sei. Im folgenden Brief schlägt Wittgenstein vor: „Machen wir einander Jvjitteilungen über unsere Arbeiten, unser Befinden und dergleichen, aber unterlassen wir gegen einander jedwedes Werturteil [ . . . ] . " (Brief Nr. 39) Seit diesem Zeitpunkt war die wissenschaftliche Diskussion zwischen beiden offenbar beendet. Wittgensteins briefliche Äußerungen zum Tractatus 1919 sind reine Erläuterungen aufVerständnisfragen Russells. Russell 1984; zur Reaktion Russells auf Wittgensteins Kritik vgl. Iglesias 1984.
Verena Mayer: Logischer Holismus: Zur Erkenntnistheorie des
Tractatus
2 67
„Meinen Einwand gegen Ihre Urteilstheorie kann ich jetzt genau ausdrücken: Wird der Satz "A urteilt, daß α (ζ. Β.) in der Beziehung R zu b steht,, richtig analysiert, so muß meines Erachtens offenkundig der Satz "aRb ν ->aRb„ unmittelbar und ohne den Gebrauch irgendeiner weiteren Prämisse folgen. Ihre Theorie erfüllt diese Bedingung nicht." (Wittgenstein 1980, Brief Nr. 15) In dem Manuskript Theory of Knowledge erklärt Russell die Erkenntnis von Komplexen als eine Relation zwischen dem Subjekt, den einfachen Gegenständen, deren jeweiliger Verknüpfung und der logischen Form dieser Verknüpfung. So wird die Erkenntnis einer zweistelligen Relation der Form aRb als eine fünfstellige Relation U (S, a, b. R, R(x,j/)) dargestellt, wobei S das Subjekt, α und b die Terme der Relation, R die α und b verknüpfende Relation und die Form dyadischer Komplexe darstellt (Russell 1984, 115ff.). Wie Russell selbst bemerkt ist die Relation U nicht homogen, da das Subjekt eine andere Beziehung zum Komplex hat, als etwa α oder R(x,j>); die Terme der Relation sind also von verschiedenem logischen Typ. Das Subjekt S, das ein Urteil aRb fällt, m u ß nach Auffassung Russells mit den Bestandteilen der Relation U bekannt sein; die Existenz des „logischen" Bestandteils R(x,j) wird also vorausgesetzt. Für den gültigen Schluß von „p" auf „p ν ->p" setzt die Russellsche Urteilsanalyse Bekanntschaft mit dem logischen Atom des (und damit ebenfalls dessen „Existenz") voraus. Dies sind einige der zusätzlichen Prämissen, die Wittgenstein in seinem Brief vom Juni 1913 erwähnt. Die Relation U und insbesondere die Relation R(*,jy) zeigt ein typisches Dilemma des Russellschen Atomismus. Russell war sich bewußt, daß logische Atome durch eine logische Form strukturiert sein müssen, um einen Komplex zu ergeben. Die Atome a, R und b der Relation aRb sind nicht bloß aneinandergereiht, sondern der Komplex aRb weist eine bestimmte Struktur auf, in der die Elemente a, R und b stehen. Russell faßt die Struktur R(x,jy) als ein logisches Atom auf, jedoch droht in diesem Fall ein infiniter Regreß, wie Russell durchaus erkannt hat: Auch die Verbindung des Struktur-Atoms mit den anderen Atomen des Komplexes müßte nun durch ein weiteres Atom garantiert werden. 7 Offenbar glaubte Russell, daß der drohende Regreß durch die Bekanntschaft des Subjekts mit dem platonischen Strukturobjekt bereits verhindert wird; plausibel ist dies jedoch nicht. Denn nun umfaßt nicht nur der Begriflf des einfachen Gegenstandes so verschiedene Kategorien wie Sinnesdaten und logische Formen. Auch der Begriff der Bekanntschaft wird erweitert: er soll nun nicht nur einfache Objekte der Erkenntnis liefern, sondern diese auch noch in strukturelle Zusammenhänge einordnen. Der Vermehrung der 7
Russell 1984, 183. Z u d e m Russellschen Dilemma vgl. auch die Darstellung von Iglesias 1984,293ff.
268
Section 2: Epistemology
Entitäten folgt eine Vermehrung der epistemischen Fähigkeiten. Es verwundert nicht, daß Russell schließlich den einzigen Ausweg in der Selbstevidenz formaler Zusammenhänge sieht (Russell 1984, 250; 319). Wittgenstein empfand keine Sympathie für die Russellsche Eigenart, je nach Bedarf Entitäten und Erkenntnismodalitäten zu postulieren. Russells Bastlermentalität widersprach seinem Bedürfnis nach unbedingter Klarheit und Strenge. In der Logik kann nichts zufällig sein (Tractatus 2.012), deshalb ist die Einführung eines neuen Behelfs in die Logik „immer ein folgenschweres Ereignis" (Tractatus 5.452). Dies gilt insbesondere für die Behandlung von logischen Formen als Objekten. Schon im Januar 1913 schrieb Wittgenstein an Russell: „Es ist jedoch nicht meine jetzige Analyse, deren ich mir am stärksten gewiß bin, sondern die Tatsache, daß die gesamte Typentheorie durch eine Theorie des Symbolismus beseitigt werden muß, die zeigt, daß die scheinbar verschiedenen Arten von Dingen durch verschiedene Arten von Symbolen, die unmöglich durcheinander ersetzt werden können, symbolisiert werden." (Wittgenstein 1980, Brief Nr. 11; Hervorhebung L. W.)
Auch in den Notes on Logic kritisiert Wittgenstein die Vermehrung der Gegenstände um Formen; „Es gibt kein Ding, welches die Form eines Satzes ist und keinen Namen, der eine Form bezeichnet. Dementsprechend können wir auch nicht sagen, daß eine in bestimmten Fällen zwischen Dingen bestehende Beziehung mitunter zwischen Formen und Dingen besteht. Dies richtet sich gegen Russells Theorie des Urteils." (Wittgenstein 1984, 204) Dieselbe Einsicht wird im Tractatus so formuliert: „4.0312
Mein Grundgedanke ist, daß die „logischen Konstanten" nicht vertreten. Daß sich die Logik der Tatsachen nicht vertreten läßt." (Wittgenstein 1989)
Das Problem des logischen Atomismus ist die epistemische Analyse logischer Formen. Russell betrachtete logische Formen als Gegenstände und verstrickte sich damit in ein erkenntnistheoretisches Dilemma. Wittgenstein lehnt daher die Russellsche Annahme ab: zwischen Formen und Gegenständen muß strikt unterschieden werden. Dies bedeutet zwar nicht, daß es keine logischen Atome geben kann, logische Formen dürfen jedoch keinesfalls wie Gegenstände behandelt werden. Auch die Idee, daß die Welt aus logischen Atomen „aufgebaut" ist, muß daher revidiert werden. Der Tractatus wird so geradezu ein Gegenentwurf zum logischen Atomismus Russells.
Verena Mayer: Logischer Holismus: Zur Erkenntnistheorie des Tractatus
3.
269
Die „logischen Atome" des Tractatus
Wittgensteins Kritik brachte Russell nicht davon ab, den logischen Atomismus weiter zu entwickeln und zu vertreten. Russell übernahm von Wittgenstein zwar die Einsicht, daß die Wahrheit einer molekularen Aussage „ρ ν q nicht von der Existenz eines logischen Atoms abhängt, das dem „ v" entspricht, sondern von der Wahrheit der Aussagen „p" und „q . Jedoch hatte er die Tragweite des Wittgensteinschen Einwands offenbar nicht erfaßt (Russell 1918, 207ff.). Wittgenstein selbst war von den Schwierigkeiten mit der Publikation des Tractatus enttäuscht; er überließ die Publikation daher Russell, der sein Vorwort hinzufügte. Auf diese Weise setzte sich das Mißverständnis in der Rezeptionsgeschichte des Tractatus fort. Der Tractatus gilt also bis heute als System des logischen Atomismus, jedoch besteht wenig Einigkeit darüber, was die eigentlichen logischen Atome des Tractatus sind. Mögliche Kandidaten sind Gegenstände, Sachverhalte, Tatsachen, Eigennamen und Elementarsätze. Das System des Tractatus wird etwa in der folgenden Weise als Konstruktion aus diesen Elementen dargestellt: Die Welt besteht aus Tatsachen, die in Sachverhalte zerlegbar sind. Die Sachverhalte sind aus Gegenständen zusammengesetzt. Sachverhalte und Tatsachen werden durch Sätze abgebildet, die in Elementarsätze analysierbar sind, die wiederum aus Namen bestehen. 8 Dieses Bild ist an sich noch nicht unbedingt atomistisch. Der Russellsche Atomismus bestand in der Behauptung, daß den logischen Atomen eine unabhängige Realität zukomme und daß die Welt aus ihnen zusammengesetzt sei. Im folgenden muß also gezeigt werden, daß Gegenstände, Sachverhalte etc. nicht unabhängige „platonische" Entitäten sind und daß die tractarianische Welt nicht als Zusammensetzung dieser scheinbaren logischen Gegenstände verstanden werden kann. Wenn als Gegenbegriff zum logischen Atomismus von logischem Holismus die Rede ist, scheint zunächst nur die eine Vagheit durch die andere ersetzt zu sein. Der Begriff „Holismus" wird oft wie ein selbst-evidenter Terminus ohne weitere Erläuterungen verwendet. 9 Erklärungen dazu wiederholen in vielen Fällen nur die Quine'sche Metaphorik. So ist von einem Netz von Begriffen oder einem Kraftfeld die Rede, von Neuraths Boot, das nur auf offener See umgebaut werden könne oder gar von Hypothesen, die gemeinsam vor das Tribunal der Erfahrung treten müssen. In ihrer umfassenden Kritik 8
9
Eine gar nicht seltene Kuriosität der 7ra 0 und 0 < i < τ (Ε) U = {U\,..., Um) ist eine Familie (galileisch) nichtidealisierter Universen, Ut / 0(7 = 1 , . . . , m) (F) U' = {U[,..., U^} ist eine Familie (galileisch) idealisierter Universen; Uj ψ 0(j = 1 , . . . , » ) (G) UηU = 0 (H) R'J C U ' χ U'j mit i < w u n d ; < « (I) G betrachtet die Entitäten in U\,..., Um als Ausgangspunkte von RI und die Entitäten in U U ' n als Ergebnisse der Idealisierung nach RII 0)
G intendiert Ug durch U'k oder (Us,...,Uh)
durch
(U^...M[)
zu idealisieren (1 < g < h < i\ 1 < k < / < j; (Ug, U'k) € R'J; Durch (A) und (B) werden die Relativierung des Idealisierungsvorganges auf Wissenschaftlergruppen, der Zeitbezug und die Zweckorientierung festgehalten. D a die alleinige Durchführung der deformierenden Vorgänge nicht hin1
Die Variable „ / ' steht für die Hinzufugung von Merkmalen, τ kann gleich i sein, wenn j > 0, d. h. wenn die Idealisierung nur in der Ergänzung mindestens eines Merkmals besteht. Für alle anderen Fälle gilt: wenn j = 0, dann i < τ.
Michaela Haase: Der Begriff Pragmatischer Idealisierung
369
reichend für Idealisierung ist, wird die in (C) geforderte Intention notwendig. Mit (E), (F), (G) und (H) wird die Idealisierungsrelation angegeben. Durch die Relation „ ... wird idealisiert m i t . . . " werden Universen bzw. Tupel von Universen, die (galileisch) nichtidealisierte Entitäten enthalten, mit Universen bzw. Tupeln von Universen verbunden, die (galileisch) idealisierte Entitäten enthalten. Dabei korrespondieren die nichtidealisierten Entitäten mit den Repräsentationen I und die idealisierten Entitäten mit den Repräsentationen II. Nach (I) beruht diese Korrespondenz auf den Überzeugungen der Wissenschaftlergruppe G. Durch (J) wird festgelegt, daß die nichtidealisierten Entitäten in den Universen in U nicht nur mit RI bzw. die idealisierten Entitäten in den Universen in U' nicht nur mit RII korrespondieren können, sondern daß G die Universen U[,...,U'n zur Idealisierung der Universen U\,..., Um einsetzt
bzw. benutzt.
3.
Idealisierungsbegriff und Theorienkonzeption
Oben wurde bereits erwähnt, daß der Idealisierungsbegriff nur in Verbindung mit der Theorienbildung expliziert werden kann. Damit das Explikat auch auf Theorien angewandt bzw. in der wissenschaftstheoretischen Analyse von idealisierten Theorien, ihren Anwendungen etc. praktisch relevant werden kann, ist es erforderlich, auf eine Theorienkonzeption zurückzugreifen. An eine solche Konzeption sind drei Anforderungen zu stellen: (i) (ii) (iii)
Es liegt eine umfangreiche rekonstruktive Praxis nicht nur im Bereich naturwissenschaftlicher Theorien vor. Pragmatische Aspekte und soziohistorische Aspekte werden berücksichtigt bzw. sind berücksichtigbar. Die Theorienkonzeption ist selbst epistemologisch neutral, um mit dem ebenfalls epistemologisch neutralen, pragmatischen Idealisierungsbegriff ohne Einschränkungen verbunden werden zu können.
Diese Anforderungen werden in der Gesamtheit gegenwärtig nur von der strukturalistischen TheorienaufFassung erfüllt, so daß diese die für den Versuch der Verbindung mit dem pragmatischen Idealisierungsbegriff präferierte Konzeption darstellt. In der nachfolgenden Darstellung werden die in der Literatur zum Strukturalismus gebräuchlichen Symbole verwandt: „K" bezeichnet den formalen Kern eines Theorie-Elementes, „/' die dazugehörige Menge Intendierter Anwendungen, „G" symbolisiert eine wissenschaftliche Generation, d. h. eine durch die Bezugnahme auf eine konkrete historische Periode h spezifizierte Teilgruppe einer wissenschaftlichen Gemeinschaft.
370
Section 3: Philosophy of Science
Zusätzlich eingeführt werden die Mengensysteme A, U und U'. Α enthält die Mengen der nur informell charakterisierten Anwendungsentitäten, U die Universen der (galileisch) nichtidealisierten, U' die Universen der (galileisch) idealisierten Entitäten. Die Verbindung eines Idealisierungsbegriffs mit einer Theorienkonzeption hat die Beantwortung folgender Frage zum Ziel: Was eine idealisierte Theorie? Die Antwort auf diese Frage muß zwei weiteren Bedingungen genügen: (iv)
(v)
Da für den Idealisierungsvorgang die Intentionen der mit einem Theorie-Netz oder -Element verbundenen wissenschaftlichen Generation entscheidend sind, müssen diese bei der Rekonstruktion der Theorie berücksichtigt werden. Es ist bei der Rekonstruktion zudem zu erfassen, daß und wie die Semantik idealisierter von derjeniger nichtidealisierter Theorien differiert.
(iv) wird dadurch berücksichtigt, daß die Idealisierungsintention in die Definition des idealisierten Theorie-Elementes aufgenommen und darüber ins Netz „transportiert"2 wird. Im Hinblick auf (v) sind zwei Aspekte relevant, einerseits der theorieinterne (formale), andererseits der theorieexterne Anwendungsaspekt (von F. Suppe3 auch als „physikalische Interpretation" bezeichnet). Im Hinblick auf die Modelle ist bekannt, daß bei der Rekonstruktion erfahrungswissenschaftlicher Theorien auf strukturalistischer Basis die folgende semantische Bedingung erfüllt sein muß: Die im Zusammenhang mit den Strukturen χ = {D\,..., D^, M\,..., Μ ι ,R\,...,R„) einer bestimmten Species angegebenen sog. Hauptbasismengen D\,.... D^ enthalten ausschließlich nichtmathematische Entitäten. Wird eine idealisierte Theorie rekonstruiert, tritt neben diese noch eine zweite semantische Nebenbedingung: D\,.. enthalten danach nicht nur nichtmathematische, sondern zudem idealisierte Entitäten. Die Idealisierungsvorgänge erfolgen im Hinblick auf die Theoriebildung und daher auch die Spezifikation der Universen nichtidealisierter wie idealisierter Entitäten durch die wissenschaftlichen Gemeinschaften. In der rekonstruierten Theorie schlagen sich diese Vorgänge dahingehend nieder, daß diese Universen fur die Theorie-Netze und -Elemente mittels einer sog. Idealisierungsfunktion angegeben werden können. Die Rekonstruktion einer idealisierten Theorie gibt daher an, welche idealisierten Entitäten von 2
3
In diesem Beitrag wird n u r auf das idealisierte Theorie-Element eingegangen. Eine Diskussion u n d Definition der idealisierten Theorie-Netze findet sich in Haase 1995. Suppe 1989, 15.
Michaela Haase: Der Begriff Pragmatischer Idealisierung
371
wissenschaftlichen Generationen im Hinblick auf eine konkrete Theorie verwandt werden. Zwischen den nichtmathematischen Hauptbasismengen und den Universen idealisierter Entitäten besteht zudem eine extensional spezifizierbare Beziehung. Die sog. physikalische Interpretation der Theorie steht in engem Zusammenhang mit ihren Anwendungen. Worauf Theorien angewandt werden sollen, ist nicht präzise festlegbar, weil Inhalt und Umfang bestimmter Grundbegriffe (wie beispielsweise „physikalisches" oder „ökonomisches System") offen ist. Was während bestimmter Zeitperioden nach Auffassung von Wissenschaftlergruppen unter die Grundbegriffe fällt, läßt sich jedoch ermitteln: Lehrbücher, Zeitschriften und insbesondere Antrittsvorlesungen leisten hier gute Dienste. Die auf diese Weise ermittelten „Anwendungsentitäten" sind jedoch im Hinblick auf die strukturalistische Konzeption nicht zu verwechseln mit den Elementen der Menge der Intendierten Anwendungen / , den intendierten Anwendungen. Die Elemente von / sind die Redukte formaler Konzeptualisierungen, der sog. potentiellen Modelle. Die Elemente von 1 sind Strukturen, die in den Mengen A \ , . . . , A i zusammengefaßten Anwendungsentitäten nicht. Letztere bilden den „Anstoß", die Grundlage von informellen Beschreibungen der Erfahrungswissenschaftler, die wiederum erst die Vorstufe der Entwicklung potentieller Modelle sind, deren Redukte dann in Verbindung mit den Anwendungsintentionen der wissenschaftlichen Generation in eine Menge Intendierter Anwendungen eingehen können. U m ein idealisiertes diachronisches Theorie-Element Τ anzugeben, wird ein diachronisches Theorie-Element um eine Funktion ζ für Elemente der Idealisierungsrelation (im folgenden „Idealisierungsfunktion" genannt), den Wert dieser Funktion für Τ sowie um eine „Absichtsergänzung" erweitert: Ergänzt wird die Absicht der wissenschaftlichen Generation G, Κ auf / anzuwenden, um - im einfachsten Fall - die Absicht, eine Menge U mit einer Menge U' zu idealisieren. Welche Mengen dies in bezug auf eine konkrete Generation G und ein konkretes Theorie-Element Τ sind, gibt der Funktionswert z(G, Τ) an. Die Elemente des Wertebereiches der Idealisierungsfunktion werden nachfolgend mit „u bezeichnet. Diese sind im Hinblick auf ein einzelnes Theorie-Element wenigstens geordnete Paare, deren erster Bestandteil ein Universum der nichtidealisierten und deren zweiter Bestandteil ein Universum der idealisierten Entitäten ist: z : G x 0 - > υ Ω . G ist der Wertebereich der oben erwähnten sog. Generationenfunktion, Θ eine Menge idealisierter Theorie-Elemente, υ Ω die Vereinigung des Mengensystems Ω = U { R ' ] | R'J e Ω} mit i < m und j < η enthält sämtliche Idealisierungsrelationen (Mengen von m+ «-Tupeln, bestehend aus m nichtidealisierten und η idealisierten Universen), die den Elementen von G zugeordnet werden können. Die nachfol-
372
Section 3 : Philosophy o f Science
gende Definition eines (galileisch) idealisierten Theorie-Elementes Τ sichert, daß zwischen den Universen der idealisierten Entitäten und den (potentiellen) Modellen von Τ eine systematische Beziehung vorliegt. Diese besteht im Grundsatz darin, daß die Objekte in den nichtmathematischen Basismengen der Strukturen Idealisierungen sind - und zwar genau jene, die in den idealisierten Universen zusammengefaßt sind: (2) Wenn ζ eine Idealisierungsfunktion ist, dann ist Τ ein (galileisch) idealisiertes Theorie-Element genau dann, wenn A, U, U' und D existieren und gilt
(A)
T = (K,I,G, A,U,U')
(Β) (C)
(Κ, I, G) ist ein diachronisches Theorie-Element U = {U\,..., Um) enthält Universen (galileisch) nichtidealisierter Entitäten; ΙΙιφ 0 (für alle i = \,,..,m) U' = {£//,..., U^} enthält Universen, deren Elemente mit (galileisch) idealisierten Repräsentationen II korrespondieren; Uj ^ 0
(D)
(für alle j — 1,...,«)
(E) (F)
UnU' = 0 A = {A\,...,/!/} enthält nichtleere Mengen von Anwendungsentitäten; ftir alle A e Α gibt es ein U 6 U, so daß A
+ 1
, . . R i , . . . ,
R„}
und
(Di,...,Dk,Mk+],- ,Mk+j,Rh --,Rn) ein beliebiger Tupel in 5*+l*+J>+», dann ist die Relation „D; ist die ήe Koordinate des Tupels (D\,.. .. . ,,R„)" eine funktionale Relation in A , die eine Abbildung pr, : Sk+'k+])+" S festlegt. D ist als Vereinigung der Wertebereiche von pr\,..., pr/, eine Teilmenge von 5 .
Michaela Haase: Der Begriff Pragmatischer Idealisierung
373
der (galileisch) idealisierten wie der (galileisch) nichtidealisierten Universen disjunkt. (F) bringt zum Ausdruck, daß das Konzept der Menge Intendierter Anwendungen auf formelle Repräsentationen beschränkt wird. Für die Entitäten, die mit den informellen Beschreibungen der Anwendungsentitäten korrespondieren, wird ein Mengensystem Α eingeführt. In (G) wird durch den Wert z(G, T) der Funktion ζ angegeben, mittels welcher (galileisch) idealisierter Universen die (galileisch) nichtidealisierten Universen idealisiert werden. Mittels (H) wird die Intention der Idealisierung festgehalten. Laut (I) ist für die potentiellen Modelle von Τ (für alle k + (k + j) + nTupel) eine Menge D festgelegt, in der die durch die Projektionsfunktionen pr\,.. .,prh aus dem Tupel „herausgelösten" nichtmathematischen Basismengen D \ , . . . , D k zusammengefaßt sind. Mittels (J) werden die Entitäten in den nichtmathematischen Bereichen der potentiellen Modelle von Τ als idealisierte Entitäten spezifiziert: Für alle potentiellen Modelle von Τ und alle De D existiert ein idealisiertes Universum U', so daß D eine Teilmenge bzw. gleich U' ist. U' ist Bestandteil des Tupels idealisierter Universen, mit dem G einen Tupel nichtidealisierter Universen idealisieren will. Wie sich an dem oben gegebenen Beispiel zeigt, sind das pragmatische Idealisierungskonzept und die strukturalistische Theorienkonzeption miteinander verbindbar. Diese Verbindung kann weiter ausgebaut werden.
4. BAI.ZER, W O L F G A N G / M O U L I N E S ,
Literatur
C . U L I S E S / S N E E D , J O S E P H D . : An Architectonic for Science: the Structuralist Program, Dordrecht/Boston/Lancaster/Tokyo 1987. B A R R , W I L L I A M F . : A Syntactic and Semantic Analysis of Idealizations in Science. Philosophy of Science 38 (1971), 2 5 8 - 2 7 2 . H A A S E , M I C H A E L A : Galileische Idealisierung: ein Pragmatisches Konzept, Berlin 1 9 9 5 . H E M P E L , C A R L G U S T A V : Typical Methods in the Natural and the Social Sciences. In: Aspects of Scientific Explanation, New York u.a. 1965, 155-171. N O W A K , L E S Z E K : On the (Idealizational) Structure of Economic Theories. Erkenntnis 30 (1989), 2 2 5 - 2 4 7 . N O W A K , L E S Z E K : Abstracts are not our Constructs: The Mental Constructs are Abstracts. In: Idealization I. General Problems, hrsg. Jerzy Brzezinski/Francesco Coniglione/Theo A. F. Kuipers/Leszek Nowak, Amsterdam 1990, 193-209. R U D N E R , R I C H A R D S.: Philosophy of Social Science, Englewood Cliffs, N . J . 1966. S U P P E , F R E D E R I C K : The Semantic Conception of Theories and Scientific Realism, Urbana u.a. 1989.
STEPHAN
HARTMANN
Verfolgt die Elementarteilchenphysik ein reduktionistisches Programm?*
Die Elementarteilchenphysik gilt weithin als eine Teildisziplin der Physik, die ein reduktionistisches Programm par excellence verfolgt. In dieser Arbeit soll versucht werden, unter Berücksichtigung einer Analyse neuerer Methoden der Elementarteilchenphysik, die Berechtigung dieser Behauptung zu klären. Die Reduktionismusproblemtik läßt sich in ontologische, epistemologische und methodologische Aspekte untergliedern. 1 Die ontologische Behauptung des Reduktionismus besteht darin, daß es in der Natur ein ontisches Substrat gibt, aus dem alle anderen Systeme beliebigen Komplexitätsgrades aufgebaut sind. Das Vorgehen der Elementarteilchenphysiker scheint im Einklang mit dieser metaphysischen Behauptung zu stehen; immer tieferliegende Konstituenten der Materie werden dingfest gemacht: Moleküle, Atome, Atomkerne, Nukleonen, Quarks, ... (?). Die epistemologische Annahme des Reduktionismus besteht in der Behauptung, daß es eine fundamentale Theorie gibt, die eine vollständige und einheitliche Beschreibung der Welt ermöglicht. Für eine derartige Theorie gibt es aus dem Bereich der Elementarteilchenphysik Kandidaten; man denke etwa an die Super-Gravity- und Superstring-Projekte. 2 Die methodologische Maxime des Reduktionismus besteht in einer konsequenten Verfolgung des Ziels, diese Fundamentaltheorie zu finden. Lange Zeit gab es zu einem solchen Vorgehen keine Alternative, die sich theoretisch rechtfertigen ließ. So n i m m t es nicht wunder, daß viele Elementarteilchenphysiker überzeugte Reduktionisten sind. 3 Ein derartiger, vom Programm der Elementarteilchenphysik motivierter Reduktionismus wurde in der Vergangenheit — nicht nur von Philosophen — stark kritisiert. Zu erwähnen sind an dieser Stelle die herausfordernden Ausführungen N . Cartwrights (Cartwright 1983), sowie die z.T. emotional ge* Ich danke P. Hoyningen-Huene u n d M. Stöckler für hilfreiche Bemerkungen. 1 Diese sinnvolle Unterscheidung wurde erstmals von F. Ayala (1974, viii) verwendet. 2 R. Hedrich (1990, 47ff.) diskutiert, ob diese Theorien als Kandidat für die F u n d a m e n taltheorie im Sinne des Reduktionismus in Frage k o m m e n . 3 Ein Kapitel in S. Weinbergs bislang letztem Buch trägt den bezeichnenden Titel „Lob des Reduktionismus" (1993, 59ff.).
Stephan Hartmann: Elementarteilchenphysik und Reduktionismus
375
färbten Einwände von Physikern mit anderem Arbeitsgebiet, wie etwa den Festkörperphysikern Ε Anderson (1972) und A. Leggett (1992). N . Cartwright versucht zu zeigen, daß die fundamentalen Gesetze der Physik lügen. Deshalb plädiert sie dafür, physikalische Untersuchungen auf phänomenologische Gesetze und Modelle zu gründen: „For Phenomenological Laws" lautet ihr einschlägiger Wahlspruch. 4 In der Welt von N . Cartwright gibt es keine im Sinne des Reduktionismus fundamentalen Entitäten, die die Welt konstituieren, sondern eine Vielfalt von nicht reduzierbaren Entitäten. P. Anderson und A. Leggett behaupten - sicher im Einklang mit Biologen wie E. Mayr - die Existenz von grundlegend neuen Gesetzen auf einer höheren Systemebene. S. Weinberg kritisiert diese Äußerungen mit dem Hinweis auf die erfolgreiche Reduktion der Thermodynamik auf die statistische Mechanik. 5 Außerdem ist, so Weinberg, bislang (noch?) kein einziges Gesetz bekannt, welches sich nachweislich nicht reduzieren läßt. In diesem Zusammenhang ist es interessant, zu untersuchen, welche Struktur derartige Gesetze, bzw. allgemeiner, welche Struktur anti-reduktionistische Argumente im allgemeinen haben (vgl. Hoyningen-Huene 1992). Waren es in der Vergangenheit vornehmlich Festkörperphysiker, die sich an dem an der gängigen Elementarteilchenphysik orientierten Reduktionismus rieben, so kommt die Kritik nun auch aus dem eigenen Lager. Ausgelöst wurde diese Kritik durch neue Entwicklungen auf dem Gebiet der Quantenfeldtheorie, die zu einer Neubewertung der Renormierungsproblematik geführt haben. Die allgemeine Quantenfeldtheorie liefert den begrifflichen und formalen Rahmen der Elementarteilchenphysik. 6 Als „Nebenprodukt" dieser Neubewertung ergeben sich Argumente, die einen methodologischen Antireduktionismus zu stützten scheinen. T. Cao und S. Schweber (1993) fordern sogar den epistemischen Reduktionismus heraus, konzedieren jedoch, daß der ontologische Reduktionismus noch vertretbar ist. 7 Im folgenden möchte ich mich mit den von Cao und Schweber vorgebrachten Argumenten kritisch auseinandersetzen. Zunächst muß jedoch auf den physikalischen Hintergrund des Gedankenganges von Cao und Schweber eingegangen werden. Die Forschung der letzten Jahre hat gezeigt, daß auch nichtrenormierbare Quantenfeldtheorien physikalisch sinnvoll sind. Lange Zeit galt die Forderung nach Renormierbar4 5 6
7
Cartwright 1983, lOOf. Weinberg 1993, 47f. Eine fiir Philosophen geschriebene Einführung in die Quantenfeldtheorie findet sich in Redhead 1983. Vgl. auch die Arbeiten Cao 1993 und Schweber 1993-
376
Section 3: Philosophy o f Science
keit als ein wesentliches Auswahlkriterium einer physikalischen Theorie (vgl. Weinberg 1980); zuweilen wurden nichtrenormierbare Theorien gar als inkonsistent verdächtigt.8 Das Problem der Renormierung trat erstmals im Rahmen der störungstheoretischen Behandlung der Quantenelektrodynamik auf; bestimmte Integrale hatten einen unendlichen Wert, obwohl die zu berechnenden physikalischen Größen offenbar endliche Werte besaßen. Mit Hilfe von trickreichen Renormierungsprozeduren gelang es Ende der 40er Jahre, diese Integrale durch Subtraktion anderer unendlicher Größen „endlich zu machen". Viele der beteiligten Physiker hatten ein schlechtes Gewissens bei diesem Vorgehen und so wollte die Physik-interne Kritik am Renormierungsprogramm nicht enden. Eine Neubewertung dessen, was Renormierung ist, ergab sich im Zusammenhang mit der durch Erkenntnisse aus der Festkörperphysik motivierten Entwicklung der Renormierungsgruppen-Gleichungen (K. Wilson u. a.). Es zeigte sich, daß Renormierung etwas mit Energieskalen zu tun hat. Sieht man einmal von der noch nicht gefundenen fundamentalen Theorie ab, so haben unsere physikalischen Theorien immer einen begrenzten Anwendungsbereich. Diese Begrenzung ist in der Hochenergiephysik eine Begrenzung der Energie, bis zu der die Theorie anwendbar ist. Die im störungstheoretischen Formalismus der Quantenfeldtheorie auftretenden Integrale laufen aber gerade über alle Energien, also auch über Energiebereiche, über die die Theorie nicht mehr sinnvoll sprechen kann. Das Programm der effektiven Quantenfeldtheorien berücksichtigt diesen Sachverhalt. 9 Effektive Quantenfeldtheorien sind nichtrenormierbare Theorien, die physikalische Phänomene auf einer bestimmten Energieskala durch effektive Freiheitsgrade (und deren Wechselwirkung) beschreiben. Diese Freiheitsgrade sind oftmals nicht fundamental in dem Sinne, in dem wir heute etwa das Elektron als fundamental ansehen. Beipiele sind etwa die in der Kernphysik gebräuchlichen Theorien zur Pion-Kern-Streuung oder die diversen Theorien zur Hadronenstruktur. Die mangelnde Renormierbarkeit äußert sich in dem Auftreten eines (realistisch interpretierten) Abschneideparameters Λ, der angibt, ab welcher Energie die Theorie unbrauchbar wird. Es zeigt sich, daß Prozesse, deren Energie Λ übersteigt, den Niederenergiebereich der Theorie, also den Bereich, der durch Energien kleiner als Λ gekennzeichnet ist, nicht beeinflussen; der Niederenergiebereich ist also vom Hochenergie-
8 9
Eine ausfuhrliche Diskussion findet sich in Stöckler 1997, vgl. auch Falkenburg 1994, 250f. Technische Details finden sich in Hartmann 1995b.
Stephan Hartmann: Elementarteilchenphysik und Reduktionismus
377
bereich vollständig entkoppelt („decoupling-theorem").10 Es ist möglich, von einer gegebenen effektiven Theorie (mit Abschneideparameter Ao) zu einer neuen zu kommen, die die Physik auf einer etwas höheren Energieskala beschreibt. Der neue Abschneideparameter sei Λι > Λο· Dies geschieht auf zweifache Weise: Zum einen werden die zwischen Λο und A\ neu auftretenden Teilchen effektiv modelliert und zum anderen werden die entsprechenden Kopplungskonstanten unter Berücksichtigung der RenormierungsgruppenGleichungen verändert („reskaliert"). Was sich so letztlich ergibt, ist eine Hierachie von aufeinanderfolgenden effektiven Quantenfeldtheorien, die so ist die Hoffnung - immer weniger „nicht-renormierbar" werden. Diese neuen Theorien haben verschiedene philosophische Implikationen. Neben den im folgenden zu klärenden Konsequenzen für die Reduktionismus-Debatte sei hier zunächst noch auf eine Frage der Forschungsstrategie eingegangen. Das bislang übliche Vorgehen in der Elementarteilchenphysik bestand - etwas vereinfacht - in einem t o p - d o w n Verfahren: Symmetrien oder ähnlich allgemeine Prinzipien werden - teilweise theoretisch motiviert - postuliert und die deduktiven Konsequenzen - wenn möglich - mit der Phänomenologie konfrontiert.11 In diesem Prozeß wird die Eigendynamik mathematischer Spekulation sehr deutlich. Gleichzeitig tritt die Bedeutung des Experimentes zurück. Oftmals ist es sogar unmöglich, bestimmte Theorien zu testen, man denke nur an die supersymmetrischen Theorien, die Aussagen über einen Energiebereich machen, der weit jenseits des experimentell Zugänglichen liegt. Verfolgt man jedoch das Programm der effektiven Quantenfeldtheorien, so braucht man nicht in der „Glashow-Wüste" nach Neuem zu suchen. Indes wird durch ein schrittweises Erhöhen der Energie (experimentell und theoretisch!) die jeweils passende Beschreibung angestebt. Dieses betont e m p i r i s t i sche Vorgehen hat eine stärkere Wechselwirkung von Experiment und Theorie zur Folge. Es ist weiterhin klar, daß effektive Quantenfeldtheorien große pragmatische Vorteile haben. Die Handhabung effektiver Quantenfeldtheorien ist i. a. sehr viel einfacher als die einer renormierbaren „Fundamentaltheorie"; ja, oftmals sind Berechnungen überhaupt nur für effektive Quantenfeldtheorien möglich. Es muß jedoch betont werden, daß effektive Quantenfeldtheorien grundsätzlich nur einen bestimmten (Energie-) Ausschnitt der Welt beschreiben. Sie stellen somit ein typisches Element vorläufiger Physik dar. 12 10
Vgl. Cao/Schweber 1993, 63f.; Huggett/Weingard 1995 sowie Robinson 1992, 395.
11
Diese Darstellung ist etwas vereinfacht. Zu einer genauen Analyse des Wechselspiels von Experiment, Phänomenologie und Theorie in der Elementarteilchenphysik vgl. die detailierten Ausführungen in Falkenburg 1994. Vgl. Audretsch 1989 sowie Hartmann 1995a.
12
378
Section 3: Philosophy of Science
Was bedeutet dies alles für die Reduktionismus-Debatte? Legen die neuen Erkenntnisse dessen, was Renormierung ist und die Praktikabilität effektiver Quantenfeldtheorien wirklich einen methodologischen Antireduktionismus nahe, wie dies T. Cao und S. Schweber behaupten? Zunächst einmal kann man feststellen, daß die Verwendung effektiver Quantenfeldtheorien und die theoretische Begründung, daß dies sinnvoll möglich ist, einen entscheidenden Vorteil fur die Forschungspraxis darstellt. Durch schrittweises Erhöhen der Energie bleibt die Verbindung zum Experiment immer erhalten; Hochenergiephysik ist somit mehr als „reine Philosophie". Müssen wir aber deshalb den „Traum von der Einheit des Universums" (S. Weinberg) aufgeben? Ich denke: Nein! Zunächst einmal ist klar, daß eine Analyse der Forschungspraxis kaum eine metaphysische Position wie den Reduktionismus erschüttern kann. Es mag sich heute herausstellen, daß man in der Forschung am besten Fortschritte erzielen kann, wenn man den durch effektive Theorien vorgezeichneten Weg geht. So mag die Welt als ein hierarchisch aufgebautes Ganzes erscheinen, dessen Teile in der Tat eine gewisse Unabhängigkeit haben. Auf der anderen Seite bringen vereinheitlichte Theorien 1 3 wie GUTs, Super-Gravity- und Superstring-Ansätze erhebliche Erklärungsvorteile mit sich. So kann man etwa verstehen, warum Elektronen und Protonen (betragsmäßig) die gleiche Ladung haben und vieles mehr. 1 4 Es scheint deshalb naheliegend zu sein, eine „friedliche Koexistenz" von Vereinheitlichungsversuchen und effektiven Quantenfeldtheorien zu propagieren. Es ist vorstellbar, daß aus einer Analyse bestimmter effektiver Quantenfeldtheorien eine neue Symmetrie extrahiert werden kann, die anschließend bei der Konstruktion einer verbesserten vereinheitlichten Theorie Verwendung findet. Andererseits treten in vereinheitlichten Theorien gewöhnlich Phasenübergänge auf. Die nach einem Phasenübergang entstehenden neuen kollektiven Felder1-' können meist leicht mit einer effektiven Quantenfeldtheorie modelliert werden. Auf diese Weise kann man hoffen, genauere Einsichten in das Verhalten der vereinheitlichten Theorie zu gewinnen. Abschließend kann gesagt werden, daß es in der Elementarteilchenphysik in jüngster Zeit neben dem bekannten reduktionistischen Programm auch ein antireduktionistisch orientiertes gibt. Durch die neue Sichtweise der Renormierung konnte ein derartiges Vorgehen theoretisch gestützt werden. Aufgrund der metatheoretischen Vorteile sollte jedoch das reduktionistische Pro13
14
"
Z u m Verhältnis von Reduktionismusproblematik und Einheit der Wissenschaft vgl. Vollmer 1984. Vgl. dazu auch Kanitscheider 1988. Physikalische Details zur „Emergenz" neuer Felder findet sich in Anderson 1984, 262fF.
Stephan Hartmann: Elementarteilchenphysik und Reduktionismus
379
gramm nicht aufgegeben werden, zumal aus einer methodologischen Analyse ohnehin keine ontologischen Folgerungen gezogen werden können. All dies läßt schließlich ein pluralistisches Verwenden beider Methoden als vernünftig erscheinen.
Literatur ANDERSON,
PHILIP:
More is Different. Science
ANDERSON,
PHILIP:
Basic Notions of Condensed Matter Physics, London 1984.
177 (1972),
393-396.
Vorläufige Physik und andere pragmatische Elemente physikalischer Naturerkenntnis. In: Handbuch pragmatischen Denkens, Bd. 3, hrsg. H. Stachowiak, Hamburg 1989, 373-392.
AUDRETSCH, JÜRGEN:
Introduction. In: Studies in the Philosophy of Biology. Reduction and Related Problems, hrsg. F. Ayala/T. Dobzhansky, Berkeley 1974, vii-xvi.
AYALA, F R A N C I S C O :
New Philosophy of Renormalization: From the Renormalization Group Equations to Effective Field Theories. In: Renormalization: From Lorentz to Landau (and Beyond), hrsg. L. Brown, New York 1993, 8 7 - 1 3 4 .
CAO, TIAN:
S I L V A N : The Conceptual Foundations and the Philosophical Aspects of Renormalization Theory. Synthese 97 (1993), 3 3 - 1 0 8 .
CAO, TIAN/SCHWEBER,
CARTWRIGHT, NANCY: FALKENBURG,
How the Laws of Physics Lie, Oxford 1983.
BRIGITTE:
Teilchenmetaphysik, Mannheim
1994.
Models as a Tool for Theory Construction: Some Strategies of Preliminary Physics. In: Theories and Models in Scientific Processes, Amsterdam 1995a. H A R T M A N N , S T E P H A N : Metaphysik und Methode. Strategien der zeitgenössischen Physik in wissenschaftsphilosophischer Perspektive, Konstanz 1995b. H E D R I C H , R E I N E R : Komplexe und fundamentale Strukturen: Grenzen des Reduktionismus, Mannheim 1990. HARTMANN,
STEPHAN:
P A U L : On the Way to a Theory of Antireductionist Arguments. In: Emergence or Reduction?, hrsg. Α. Beckermann/H. Flohr/J. Kim, Berlin
HOYNINGEN-HUENE,
1992,289-301. HUGGETT,
NICK/WEINGARD,
ROBERT:
Field Theories. Synthese
The Renormalization Group and Effective
102 (1995),
171-194.
Reduction and Emergence in the Unified Theories of Physics. In: Centripetal Forces in the Sciences, Vol. II, hrsg. G. Radnitzky, New York 1 9 8 8 , 8 9 - 1 1 0 .
KANITSCHEIDER,
BERNULF:
On the Nature of Research in Condensed-State Physics. Foundations of Physics 2 2 ( 1 9 9 2 ) , 2 2 1 - 2 3 3 .
LEGGETT, ANTHONY:
Quantum Field Theory for Philosophers. In: PSA 1982 Vol. 2, hrsg. P. Asquith/T. Nickles, East Lansing 1983, 57-99.
REDHEAD, MICHAEL:
380
Section 3: Philosophy of Science
Renormalization and the Effective Field Theory Programme. In: PSA 1992 Vol. 1, hrsg. D. Hull/M. Forbes/K. Okruhlik, East Lansing 1992, 393-403. S C H W E B E R , SILVAN: Changing Conceptualization of Renormalization Theory. In: Renormalization: From Lorentz to Landau (and Beyond), hrsg. L. Brown, New York 1993, 135-166. S T Ö C K L E R , M A N F R E D : Philosophische Probleme der Elementarteilchenphysik, München 1997. V O L L M E R , G E R H A R D : Reduction and Evolution - Arguments and Examples. In: Reduction in Science, hrsg. W. Balzer, Dordrecht 1984, 131-151. W E I N B E R G , S T E V E N : Der Traum von der Einheit des Universums, München 1993. W E I N B E R G , S T E V E N : Conceptual Foundations of the Unified Theory of Weak and Electromagnetic Interactions. Reviews of Modern Physics 52 (1980), 515-523. ROBINSON, D O N :
REINER HEDRICH
Fand eine „Revolution des Komplexen" statt?
Im Hinblick auf die Entwicklung der Komplexitätsforschung war in letzter Zeit des öfteren die Rede von einer „wissenschaftlichen Revolution". Die Ursprünge dieser Begrifflichkeit gehen bekanntermassen auf Thomas S. Kuhns Modell des Paradigmenwechsels zurück, wie er es 1962 in „Die Struktur wissenschaftlicher Revolutionen" 1 darstellte. U m der Frage nachgehen zu können, ob die Anwendung der Kuhnschen Terminologie einer „wissenschaftlichen Revolution" auf die Entdeckung der Komplexität durch die Naturwissenschaften gerechtfertigt ist, muss zuerst geklärt werden, was im folgenden unter „Komplexitätsforschung" verstanden werden soll. Dabei tritt das Problem auf, dass es sich bei der Komplexitätsforschung um keine klar abgrenzbare Disziplin handelt, die sich durch ein eindeutiges empirisches Bezugsfeld oder ein klar umrissenes Methodenarsenal auszeichnet. Auch lässt sie sich keinem klar definierten, wissenschaftlichen Ziel unterordnen. Vielmehr handelt es sich um ein interdisziplinäres, vernetztes Forschungsgebiet, dessen Komponenten zwar alle etwas mit den Phänomenen Komplexität, Nichtlinearität bzw. Rückkopplung zu tun haben, dies jedoch in gänzlich verschiedenen Kontexten und unter gänzlich verschiedenen Aspekten. Im folgenden soll auf der Grundlage ihrer historischen Entwicklung unter „Komplexitätsforschung" vor allem (i) die interdisziplinäre „Chaosforschung", (ii) die mathematische „Theorie dynamischer Systeme" sowie (iii) die Theorie komplexen Verhaltens in räumlich-diskreten Systemen also ζ. B. in zellulären Automaten und neuronalen Netzwerken - verstanden werden. 2 Das Kuhnsche Modell bezieht sich in seiner ursprünglichen Form auf die mittel- bzw. langfristige Dynamik kleinerer, abgeschlossener Forschergruppen, die Subbereiche innerhalb etablierter Disziplinen der empirischen 1
Kuhn 1988.
2
Der Kernbereich der Komplexitätsforschung entspricht der „Theorie dynamischer Systeme", die sich mit dem möglichen Verhalten der Lösungen von DifFerentialgleichungssystemen beschäftigt. Die Komplexitätsforschung trägt aufgrund dieser Basis deutlich mathematischstrukturwissenschaftlichen Charakter.
382
Section 3: Philosophy of Science
Wissenschaft repräsentieren. Bei der Komplexitätsforschung jedoch handelt es sich nicht um ein solches homogenes Feld oder den Subbereich einer klar definierten Disziplin. Bei den Beteiligten handelt es sich nicht um eine kleine, abgeschlossene, einheitliche Forschergemeinschaft, die eindeutig dem Unterbereich einer Disziplin zugeordnet werden könnte. Es handelt sich vielmehr um eine sich während der Entwicklung ständig verändernde Zahl von Einzelwissenschaftlern und Wissenschaftlergruppen, die in verschiedenen Bereichen schon bestehender, aber auch zum Teil sich erst herausbildender Disziplinen bzw. Subdisziplinen operierten. Inwieweit lässt sich also der Begriff der „wissenschaftlichen Revolution" auf die Entwicklung der Komplexitätsforschung anwenden? Welche Parallelen bestehen zum Kuhnschen Modell des Paradigmenwechsels? Welche Unterschiede lassen sich feststellen? Um diese Fragen erörtern zu können, ist es notwendig, die historische Entwicklung der Komplexitätsforschung zumindest in einigen wesentlichen Punkten zu skizzieren:3 Die Ursprünge der Komplexitätsforschung gehen bis etwa auf das Jahr 1880 zurück. Bis zu diesem Zeitpunkt war das der klassischen Mechanik inhärente Weltbild bis auf wenige punktuelle Ereignisse intakt geblieben. Man ging vom vollständig deterministischen Verhalten aller mechanischen Systeme aus - im weiteren Sinne vom vollständig deterministischen Verhalten des gesamten Universums. Die eigentliche These des Determinismus, dass aus gleichen Ursachen gleiche Wirkungen resultieren, wurde durch die implizite Annahme ergänzt, dass aus ähnlichen Ursachen ähnliche Wirkungen resultieren. Das Hauptaugenmerk im methodischen Instrumentarium der klassischen Mechanik lag auf linearen Zusammenhängen. 4 Grosse Bedeutung hatte im Rahmen der klassischen Mechanik die analytische Lösbarkeit der zugrundeliegenden Differentialgleichungssysteme. Die ersten ernstzunehmenden Zweifel am auf diese Weise umrissenen Weltbild der klassischen Mechanik - in der Kuhnschen Sprechweise: die ersten „Anomalien" 5 - traten um 1880 auf. James Clerk Maxwell 6 vermutete, dass es in bestimmten mechanischen Systemen zu dynamischen Instabilitäten und Irregularitäten kommen kann. Dies bedeutet, dass fur ähnliche Ursachen 3
Eine weitergehende Darstellung findet sich in Hedrich 1994. ^ Die A n n a h m e der Linearität dynamischer u n d kausaler Z u s a m m e n h ä n g e lässt sich in Bezug auf die Entwicklung der Komplexitätsforschung vielleicht als übergreifendes Ausgangsparadigma ansehen. 5
6
W e n n sich dieser Begriff auf Probleme anwenden lässt, die letztlich auf ungeklärte Aspekte der modelltheoretischen Grundlagen einer Disziplin zurückgehen! Maxwell 1877, Kap. 1, Abs. 19.
Reiner Hedrich: Fand eine „Revolution des Komplexen" statt?
383
völlig verschiedene Wirkungen resultieren können. Die schon lange schwelende Frage nach der Stabilität des Sonnensystems wurde immer brisanter und führte schliesslich 1885 zur Preisausschreibung für ihre Klärung durch den schwedischen König Olof II. 7 Die mathematischen Grundlagen der Modelle der klassischen Mechanik, die auf der Basis von Differentialgleichungen operieren, wurden einer intensiven Überprüfung ausgesetzt. Vor allem Henri Poincare 8 entwickelte in der Folge neue Methoden zur Behandlung nichtlinearer Zusammenhänge. Er erkannte die Nichtlinearität nomologischer Zusammenhänge als den allgemeineren Fall auch für die klassische Mechanik. Seine Methoden zielten nicht mehr auf eine exakte analytische Beschreibung des Systemverhaltens ab - ein Ziel, dessen Unmöglichkeit er für die meisten Problemstellungen erkannt hatte. Er versuchte vielmehr eine qualitative Beschreibung des Systemverhaltens auf der Grundlage geometrischer und topologischer Ansätze zu erreichen. Die in diesem Zeitraum durchgeführten Untersuchungen waren vor allem durch mathematische Innovationen geprägt, orientierten sich jedoch weiterhin an physikalischen Problemstellungen. Die Grundlegung der heutigen Komplexitätsforschung erfolgte im Fegefeuer zwischen Mathematik und Physik - vor allem im Rahmen der Mechanik Hamiltonscher Systeme. Nach Poincare kam es zu einer Schwerpunktverschiebung: Die von ihm und seinen Zeitgenossen begründete Tradition der Erforschung nichtlinearer Systeme wurde zwar weitergeführt, blieb aber nicht in der gleichen Weise für die Physik präsent. Die Arbeiten George David Birkhoffs 9 , die eine direkte Weiterflihrung der Ansätze Poincares darstellten, bewegten sich nun im Rahmen der reinen Mathematik. Die im Rahmen der Physik aufgetretenen Schwierigkeiten gingen im wesentlichen auf mangelnde Einsichten in die Implikationen der verwendeten strukturwissenschaftlichen Modelle zurück. Ein Uberdenken der strukturwissenschaftlichen und modelltheoretischen Grundlagen der empirischen Wissenschaften, insbesondere der Physik, wurde somit notwendig. Die Physiker dieser Zeit waren jedoch vor allem mit den Problemen beschäftigt, die zur Aüsformulierung der speziellen und der allgemeinen Relativitätstheorie sowie der Quantenmechanik führten. Für sie besassen die offenen Fragen in Bezug auf die klassische Hamiltonsche Mechanik keine grosse Relevanz. Die mathematischen Ausarbeitungen, die für diesen Themenkreis Bedeutung besessen hätten, waren zudem für die Physiker grösstenteils unverständlich, wenn sie ihnen überhaupt zu Augen kommen sollten. 7 8 9
Siehe Moser 1978. Siehe ζ. B. Poincare 1892-99. Siehe ζ. B. Birkhoff 1927; 1950.
384
Section 3: Philosophy of Science
Durch das „Abtauchen" der Problematik dynamischer Instabilitäten in die Mathematik zog sich die „Phase der Anomalien" - wenn man die Kuhnsche Sprechweise noch beibehalten möchte - sehr lange hin. Sie führte nicht direkt zu einer für die betroffenen empirischen Wissenschaften sichtbaren „Krise des alten Weltbildes", wie dies vom Kuhnschen Modell her zu erwarten gewesen wäre. Es kam nicht zu einer Phase der „ausserordentlichen Forschung". Konkurrierende Ansätze, wie sie im Kontext der empirischen Wissenschaften dem Kuhnschen Modell zufolge zu erwarten sind, spielten für die Entwicklung im Rahmen der Mathematik weniger eine Rolle als die stetige, aber langsame Weiterentwicklung in der Lösung der bestehenden Problempunkte. Dies ist vor allem auf Unterschiede im methodischen Vorgehen zwischen Mathematik und empirischen Wissenschaften zurückzuführen. Spätestens ab den dreissiger Jahren zeichnete sich in gewisser Hinsicht eine neue Entwicklung ab: Für den Bereich der Untersuchung nichtlinearer Differentialgleichungssysteme kam es zu einer Schwerpunktverschiebung von der europäischen und amerikanischen Forschung hin zur sowjetischen Forschung. Diese Schwerpunktverschiebung sollte für ungefähr zwei Jahrzehnte Gültigkeit besitzen. Einer der Gründe ftir diese Verlagerung besteht wahrscheinlich darin, dass neue Motivationselemente für die mathematische Grundlagenforschung in dieser Zeit vor allem aus Problemen der Theorie nichtlinearer Schwingkreise kamen, die grosse Bedeutung für die sich entwickelnde Radiotechnik besass. Die Verknüpfung zwischen theoretisch-mathematischen Ansätzen und technischer Anwendung gestaltete sich in der Sowjetunion wesentlich leichter als in der westlichen Forschung. In der Sowjetunion bestand nie eine restriktive Abgrenzung zwischen der Mathematik auf der einen Seite und der Physik und der Technik auf der anderen Seite. Die dortige Zusammenarbeit zwischen Mathematikern, Physikern und Ingenieuren hatte wegen des Fehlens einer jahrhundertealten Wissenschaftstradition nicht mit den althergebrachten Rivalitäten und Kontaktängsten zwischen den Disziplinen zu kämpfen. Zu den wichtigsten Beiträgen dieser Zeit zählt das auf den Physiker und Ingenieur Alexander Andronov und den Mathematiker Lev Pontriagin zurückgehende Konzept der strukturalen, topologischen Stabilität des globalen Phasenraumverhaltens dynamischer Systeme. 10 Erst in den funfeiger Jahren kam es dann zu einem neuen, durch physikalisch-technische Probleme ausgelösten Entwicklungsschub: Infolge von Schwierigkeiten mit der Stabilität der Teilchenbahnen in Hochenergiebeschleunigern, sowohl bei CERN in Genf als auch bei sowjetischen Beschleunigern, gewannen die ungeklärten Fragestellungen bezüglich der 10
Andronov/Pontriagin 1937.
Reiner Hedrich: Fand eine „Revolution des Komplexen" statt?
385
Hamiltonschen Mechanik auch für die Physik wieder Bedeutung. Es waren jedoch erst einmal vor allem Mathematiker, von denen man sich eine Klärung dieser Probleme erhoffte, da die Mathematik mit der „Theorie dynamischer Systeme" über das dafür adäquate Werkzeug verfugte. In den Rahmen der von der „Beschleunigerproblematik" ausgelösten Arbeiten gehören zum einen die Untersuchung stochastischer Schichten in nichtlinearen, nicht-integrablen Hamiltonschen Systemen durch Boris Chirikov 1 1 , zum anderen die Vermutung Andrej Kolmogorovs 12 über die Erhaltung der quasiperiodischen Bewegung in nahezu integrablen Hamiltonschen Systemen, die wenig später zur Ausformulierung des KAM-Theorems führte. Die sechziger Jahre können schliesslich eindeutig als das „Jahrzehnt der mathematischen Theorie dynamischer Systeme" angesehen werden:
Die
Erforschung komplexen, irregulären Verhaltens in den Lösungen nichtlinearer Differentialgleichungssysteme erlebte in dieser Zeit den entscheidenden Durchbruch.
Dieser ist nur mit dem anfänglichen Entwicklungsschub zur
Zeit Poincares und Birkhoffs zu vergleichen. Förderlich fiir die Entwicklung im Bereich Komplexitätsforschung waren vor allem zahlreiche internationale Mathematikkonferenzen, die zu einer schnellen Verbreitung der neuen Erkenntnisse führten. Besondere Bedeutung besass der Internationale Mathematikerkongress 1961 in Kiew, bei dem es erstmals zu einem regen Austausch zwischen Ost und West kam.
Bei der rasanten Entwicklung der Theorie
dynamischer Systeme in diesen Jahren dominierten vor allem drei Mathematikergruppen 1 3 , die in engem Kontakt standen und zum Teil Mitarbeiter untereinander austauschten.
Fast alle neuen Ideen zur „Theorie dynami-
scher Systeme" wurden in den sechziger Jahren von diesen drei Gruppen hervorgebracht. Nahezu alle Bereiche der zu dieser Zeit infolge neuer Entwicklungen schon ziemlich heterogenen Komplexitätsforschung befanden sich in den sechziger Jahren in einer Wachstumsphase. Sie entwickelten sich dabei jedoch noch nahezu unabhängig voneinander. Verbindungen bestanden nur in wenigen Bereichen: Zum einen zwischen der mathematischen Theorie dynamischer Systeme und der teils mathematisch, teils physikalisch ausgerichteten Analyse Hamiltonscher Systeme, zum anderen zwischen den Bereichen der Erforschung zellulärer Automaten und neuronaler Netzwerke,
11
Chirikov 1 9 6 0 .
12
Kolmogorov 1954.
13
(i) Steven Smale, University o f California, Berkeley; (ii) Mauricio Peixoto, Instituto de M a tematica Pura e Aplicada, Rio de Janeiro; (iii) Dimitri Anosov u. a„ Universität Moskau.
386
Section 3: Philosophy o f Science
der Kybernetik, der Automacentheorie und der Informationstheorie 1 4 . 1 5 Sowohl das Zusammenwachsen der verschiedenen Bereiche der sich formierenden Komplexitätsforschung in der ersten Hälfte der siebziger Jahre als auch das wiedererstarkte Interesse der Physik an diesem Bereich manifestierte sich beispielhaft im grossen Erfolg der von dem Physiker Joseph Ford initiierten Einrichtung eines Informationszentrums für „Chaosforschung" am Georgia Institute of Technology in Atlanta. Allein das Jahr 1975 brachte der Komplexitätsforschung schliesslich eine ganze Reihe singulärer Ereignisse: Benoit Mandelbrots Definition des „Fraktals" 16 , Siegfried Grossmanns und Stefan Thomaes sowie Mitchell Feigenbaums Entdeckung der metrischen Universalität eindimensionaler Iterationen 1 7 , Tien-Yien Lis und James Alan Yorkes 1 8 Prägung des Begriffes „Chaos" 1 9 im Rahmen einfacher mathematischer Systeme. Das neue Forschungsfeld „Deterministisches Chaos" formierte sich in diesen Jahren und wurde für die wissenschaftliche Öffentlichkeit präsent. Bis zur Herausbildung einer neuen Phase „normaler Wissenschaft" - wenn dieser Begriff hier Anwendung finden kann - dauerte es somit im Rahmen der Komplexitätsforschung schliesslich alles in allem fast ein Jahrhundert. 2 0 Die Etablierung einer neuen Begrifflichkeit, die ζ. B. die Konzepte Nichtlinearität, Rückkopplung, Komplexität, Fraktale, etc. umfasste, erfolgte dann aber sehr schnell. Sie fand in weit weniger als einer Generation statt, ohne dass eine Phase der „ausserordentlichen Forschung" für die empirischen Wissenschaften deutlich in Erscheinung getreten wäre. Dies ist vor allem darauf zurückzuführen, dass der für die Komplexitätsforschung bestimmende Wandel in den modelltheoretisch-strukturwissenschaftlichen Grundlagen der empirischen Wissenschaften sich erst in der Folge auf die empirischen Wissenschaften selbst auswirkte. 21 In diesem grundsätzlichen Zug der Entwicklung der Komplexitätsforschung liegt auch der Hauptunterschied zur Kuhnschen „wis14 15
A u f diesen Bereich soll hier nicht näher eingegangen werden. Der Einsatz des Computers gewann in der Entwicklung der Komplexitätsforschung ab den sechziger Jahren immer mehr an Bedeutung. Nicht nur die computergestützte numerische Umsetzung nichtlinearer Differentialgleichungen spielte hier eine wesentliche Rolle. Vor allem die neuen Möglichkeiten computergrafischer Darstellungsmethoden wirkten durch ihre Anschaulichkeit geradezu als Katalysator bei der Verbreitung der neuen Erkenntnisse.
16
Mandelbrot 1 9 7 5 .
17
Grossmann/Thomae 1977; Feigenbaum 1 9 7 8 .
18
Li/Yorke 1 9 7 5 .
"
„Chaos" bedeutet hierbei nur das nicht-periodische, irreguläre Verhalten einfacher Systeme mit wenigen Freiheitsgraden.
20
Paradigmenwechsel benötigen nach dem Kuhnschen Modell nur etwa eine Generation.
21
Dabei spielte die Vernetzung der verschiedenen, an den Prozess angekoppelten Disziplinen und Subdisziplinen, die im Kuhnschen Modell keine Entsprechung findet, eine entscheidende Rolle.
Reiner Hedrich: Fand eine „Revolution des Komplexen" statt?
387
senschaftlichen Revolution" begründet: Bei der Entwicklung der Komplexitätsforschung handelt es sich aufgrund des strukturwissenschaftlichen Charakters der zugrundeliegenden, auslösenden Probleme nicht um eine „wissenschaftliche Revolution" im Kuhnschen Sinne, sondern - wenn überhaupt um so etwas wie eine „strukturwissenschaftliche Revolution", deren modelltheoretische „Anomalien" zu einer längeren Problemlösungsphase im Rahmen der Mathematik führten, die sich erst in der Folge auf die empirischen Wissenschaften auswirkte. Die die Mechanismen des Wissenschaftswandels betreffenden Unterschiede zwischen „wissenschaftlicher" und „strukturwissenschaftlicher Revolution" gehen vor allem auf methodische Unterschiede zwischen empirischen Wissenschaften und Strukturwissenschaften zurück. Für die Phase nach der Formierung der Komplexitätsforschung traten dann jedoch verstärkt Parallelen zum Kuhnschen Modell auf. In dieser Phase dominierten die Folgeerscheinungen in den empirischen Wissenschaften: Die Konsolidierungsphase der Komplexitätsforschung ab der zweiten Hälfte der siebziger Jahre war vor allem durch eine rege interdisziplinäre wie internationale Konferenztätigkeit gekennzeichnet. Erstmals kamen Mathematiker, Physiker, Chemiker, Biologen und sogar Gesellschaftswissenschaftler zusammen, um Gemeinsamkeiten ihrer Arbeitsgebiete in Hinblick auf die neuen Erkenntnisse der „Chaosforschung" zu erörtern. 1980 erschien die erste zwar primär physikalisch ausgerichtete, aber eigentlich disziplinübergreifende Fachzeitschrift des neuen Forschungszweiges: „Physica D - Nonlinear Phenomena" . Konzeptionelle Vereinheitlichungstendenzen und die Anwendung der '„Chaosforschung" auf gänzlich verschiedene Disziplinen prägten das Bild dieser Phase. In rund zehn Jahren wurde der neue Kontext nicht nur einer eng umgrenzten Wissenschaftlergemeinschaft präsent, sondern dehnte sich auf gänzlich verschiedene Disziplinen aus. In dieser Phase „normaler Forschung" spielte die Etablierung und Systematisierung der neuen Konzepte die primäre Rolle. Die Zahl der Zeitschriftenartikel zur Komplexitätsforschung stieg wie die Zahl der an der neuen Strömung Beteiligten sehr schnell an. Die ersten Lehrbücher zur Komplexitätsforschung erschienen. Neben einer zunehmenden Popularisierung der Komplexitätsforschung, die sich sogar in den Massenmedien widerspiegelte, zeichneten sich die achtziger Jahre schliesslich durch eine ausgeprägte Detailarbeit aus. Gegen Ende der achtziger Jahre kamen aus dem Umfeld der Chaosforscher erstmals Zweifel 22 auf gegenüber einer zu weit gehenden Anwendung der Chaosforschung und ihrer populäreren Derivate.
22
Siehe ζ. B. Ruelle 1990.
388
Section 3: Philosophy of Science
Zusammenfassend lässt sich über die Entstehung der Komplexitätsforschung sagen: Es handelt sich - im Gegensatz zum Kuhnschen Modell - bei der Herausbildung der Komplexitätsforschung letztlich nicht um eine Umwälzung der Grundlagen einer wissenschaftlichen Disziplin oder Subdisziplin, sondern vor allem um einen Gestaltwechsel in den strukturwissenschaftlichen und modelltheoretischen Grundlagen der empirischen Wissenschaft. Diese „strukturwissenschaftliche Revolution", die in ihrem Kern vor allem die Mathematik und die Anwendung mathematischer Modelle auf die empirischen Wissenschaften betrifft, kann nur zum Teil und vor allem in ihren Folgeerscheinungen im Rahmen des Kuhnschen Modells verstanden werden. Die konstitutiven Phasen der für die Entwicklung der Komplexitätsforschung konstatierten „strukturwissenschaftlichen Revolution" sind: (1) Im Rahmen der empirischen Wissenschaften tauchen „Anomalien" auf und machen auf Defizite auf der Seite der strukturwissenschaftlichen Grundlagen der verwendeten Modellklassen aufmerksam. (2) Eine Untersuchung der Eigenschaften dieser System- bzw. Modellklassen beginnt im Rahmen der Strukturwissenschaften (vor allem der Mathematik). Die Problematik taucht in den Kontext der Strukturwissenschaften ab und wird für die empirischen Wissenschaften nahezu unsichtbar. (3) Eine stetige modelltheoretische Weiterentwicklung im Rahmen der Strukturwissenschaften folgt. (4) Nach Aufarbeitung der Defizite im Rahmen der Strukturwissenschaften werden sich die empirischen Wissenschaften zunehmend der neuen Erkenntnisse über die von ihnen verwendeten Modellklassen bewusst. Es kommt zu modelltheoretisch ausgelösten Folgereaktionen.
Literatur L E V : Sistemi grubie. DokladyAkademijaNa.uk SSSR 14 (1937), 2 4 7 - 2 5 0 . B I R K H O F F , G E O R G E D A V I D : Dynamical Systems, New York 1927. B I R K H O F F , G E O R G E D A V I D : Collected Mathematical Papers, Vol. 1 - 3 , Providence 1 9 5 0 . C H I R I K O V , B O R I S : Resonance Processes in Magnetic Traps. Journal of Nuclear Energy C 1 (1960), 2 5 3 - 2 6 0 . F E I G E N B A U M , M I T C H E L L : Quantitative Universality for a Class of Nonlinear Transformations. Journal of Statistical Physics 19 (1978), 2 5 - 5 2 . G R O S S M A N N , S I E G F R I E D / T H O M A E , S T E F A N : Invariant Distributions and Stationary Correlation Function of One-Dimensional Discrete Processes. Zeitschrift fur Naturforschung 3 2 A ( 1 9 7 7 ) , 1 3 5 3 . ANDRONOV, ALEXANDER/PONTRIAGIN,
Reiner Hedrich: Fand eine „Revolution des Komplexen" statt?
389
Die Entdeckung der Komplexität - Skizzen einer strukturwissenschaftlichen Revolution, Frankfurt a. M. 1994. K O L M O G O R O V , A N D R E J : Preservation of Conditionally-Periodic Motions for a Small Change in Hamilton's Function. Doklady Akademija Nauk SSSR 98 (1954), 527-530 (Engl. Übers, in: Hao Bai-Lin, ed.: Chaos, Singapore 1984). K U H N , T H O M A S S . : Die Struktur wissenschaftlicher Revolutionen. Frankfurt a. Μ . 1 9 8 8 . L I , T I E N - Y I E N / Y O R K E , J A M E S A L A N : Period Three Implies Chaos. American Mathematical Monthly 82 (1975), 985-992. M A N D E L B R O T , B E N O I T : Les objetsfractals:forme, hazard et dimension, Paris 1975. M A X W E L L , J A M E S C L E R K : Matter and Motion. London 1 8 7 7 . M O S E R , J Ü R G E N : IS the Solar System Stable? Mathematical Intelligence 1 ( 1 9 7 8 ) , H E D R I C H , REINER:
65-71.
Les methodes nouvelles de la mecanique celeste, Paris 1892-99,3 Bde. Deterministic Chaos: The Science and the Fiction. Proceedings of the Royal Society ofLondon A 4 2 7 (1990), 241-248.
POINCAR£, HENRI: RUELLE, DAVID:
KAY
HERRMANN
Zur Raum-Zeit-Konzeption der modernen Physik
1. 2. 3. 4.
Die Kantsche Raum-Zeit-Konzeption Die Bedeutungsebenen der Begriffe Raum und Zeit aus gegenwärtiger Sicht Über den ontologischen Status von Raum und Zeit Literatur
1.
Die Kantsche
Raum-Zeit-Konzeption
Viele wichtige wissenschaftstheoretische Arbeiten des 20. Jahrhunderts, die sich mit Raum und Zeit beschäftigen, nehmen auch Stellung zu Kants Konzept von Raum und Zeit. Physiker, Mathematiker und Wissenschaftstheoretiker wie Einstein, Weyl, Reichenbach, Carnap u. a. setzten sich mit Kants Position auseinander. Für Kant sind Raum und Zeit Formen unserer Anschauung. Er begreift den Raum als Form, in der die äußeren Empfindungen in uns repräsentiert werden. Die Zeit sieht er als Form innerer und äußerer Empfindungen an. Beiden kommt daher ein a priorischer Charakter zu. Sie sind nach Kant real, insofern sie notwendige Bedingungen der Möglichkeit aller Erfahrung darstellen. Darüber hinaus gesteht ihnen Kant keine Realität zu. Sie hängen seiner Ansicht nach also niemals den Dingen an sich als eine Bestimmung an. Auch die Struktur des Raumes liegt fur Kant a priori fest. So spricht er davon, daß „[...] die Sätze der Geometrie synthetisch a priori und mit apodiktischer Gewißheit erkannt werden" (Kant 1968, 68). Als Beispiel führt er an: „Nehmet nur den Satz, daß durch zwei gerade Linien sich gar kein Raum einschließen lasse, mithin keine Figur möglich sei [...]" (Kant 1968, 68). Entsprechend des mathematischen Erkenntnisstandes seiner Zeit nennt Kant Sätze der euklidischen Geometrie. Die von Kant gewählten Beispiele machen deutlich, daß der in den geometrischen Sätzen vorausgesetzte Anschauungsraum euklidisch ist. Infolge der Entdeckungen in der Mathematik, aber auch im Zuge der Relativitätstheorie wies man Kants „Bindung an die euklidische Geometrie" (Weyl 1954, 633) als zu naiv zurück. In der Mathematik des 19. Jahrhunderts wurden die nichteuklidischen Geometrien entdeckt. Bedeutsam sind in diesem Zusammenhang die Veröffentlichungen von Gauß, Lobatschewski, J.
Kay Herrmann: Zur Raum-Zeit-Konzeption der modernen Physik
391
Bolyai und Minkowski. Es konnte gezeigt werden, daß die euklidische Geometrie lediglich ein Spezialfall unter einer Vielzahl möglicher Geometrien des Raumes ist. Im Jahre 1854 hielt Riemann seine berühmte Habilitationsvorlesung „Über die Hypothesen, welche der Geometrie zugrunde liegen". Riemann entwickelt in seiner Habilitationsschrift das mathematische Fundament, auf dem Einstein seine Allgemeine Relativitätstheorie aufbaute, in der die Gravitation durch eine (nach den Gesetzen der Riemannschen Geometrie) gekrümmte Raum-Zeit erklärt wird. Inwiefern liegt dann noch a priori fest, daß der Raum als Form unserer Anschauung eine euklidische Struktur hat? Es ergibt sich folgender Widerspruch: Einerseits führt uns die Relativitätstheorie vermöge der Erfahrung zur Erkenntnis, daß sich das physikalische Geschehen in einem nichteuklidischen Raum abspielt, andererseits behauptet die Kantsche Philosophie, daß wir die Welt notwendigerweise in einem euklidischen Raum anschauen. Aber auch gegen sie Synthetizität der Geometrie wurden Einwände erhoben. Die Sätze der euklidischen Geometrie galten Kant als Paradebeispiele für synthetische Urteile a priori. Vom modernen Empirismus wurde der synthetische Charakter der Geometrie in Zweifel gezogen. Carnap wies darauf hin, daß Kant noch nicht zwischen einer mathematischen und einer physikalischen Geometrie unterschied. Die mathematische Geometrie ist eine rein mathematische Disziplin und als solche analytisch. Sie stellt nur ein deduktives System aus bestimmten Axiomen dar (wie beispielsweise in Russells „Principles of Mathematics" oder Hilberts „Grundlagen der Geometrie" dargestellt), das völlig unabhängig von jeder naturwissenschaftlichen Untersuchung ist. Dagegen beschäftigt sich die physikalische Geometrie mit der Anwendung der mathematischen Geometrie auf die Welt (Carnap 1986, 181). Eine ähnliche Unterteilung der Geometrie findet sich bei Hilbert. Auch Einstein trennt die Geometrie in einen reinen und einen angewandten Teil auf. Er unterscheidet zwischen einer „rein axiomatischen Geometrie" und einer „praktischen Geometrie". Die praktische Geometrie ist dadurch gekennzeichnet, daß „den leeren Begriffsschemen der axiomatischen Geometrie erlebbare Gegenstände der Wirklichkeit zugeordnet werden" (Einstein 1921, 125). Einstein faßt die axiomatische Geometrie als ein System an sich leerer Formen auf, das erst durch eine geeignete Interpretation mit der physikalischen Realität in Kontakt gebracht wird.
392 2.
Section 3: Philosophy of Science
Die Bedeutungsebenen der Begriffe Raum und Zeit aus gegenwärtiger Sicht
Das 2-Geometrien Modell schafft Klarheit in der Frage nach der Beziehung zwischen ~Ra.\im-7At-Struktur und Erfahrung. Eine Reihe von Problemen, die sich um die Thematik von Raum und Zeit ranken, bleibt undiskutiert. Geometrie hat es mit Strukturen, nicht aber mit Raum und Zeit schlechthin, zu tun. Die Einwände gegen Kant treffen daher nur das, was er zur euklidischen Raumstruktur und zu den Sätzen der euklidischen Geometrie sagt, weniger seine Äußerungen zu Raum und Zeit schlechthin. Auch für die gegenwärtige Wissenschaftsphilosophie ist die Frage nach der Rolle des Anschaulichen und der Rolle der Alltagsvorstellungen von Raum und Zeit bei der wissenschaftlichen Erfahrung noch wichtig. Kein Physiker denkt in Termini der nichteuklidischen Geometrie über die Welt nach. Eine vollständige Untersuchung zu Raum und Zeit muß auch eine Psychologie von Raum und Zeit einschließen. Gerade der Kantsche Ansatz bietet wichtige Ausgangspunkte, diesen Problemen besser gerecht zu werden. Für Kant heißt Konstruktion : Erzeugung des Gegenstandes nach den Prinzipien der euklidischen Geometrie. Vielleicht darf die Rolle der euklidischen Geometrie in der Kantschen Raum-Zeit-Lehre nicht überbewertet werden. Es geht primär um die Feststellung, daß bestimmte subjektive Bedingungen notwendig sind, wenn Erfahrung möglich werden soll. Denn aus der Mannigfaltigkeit der Sinnesdaten müssen zunächst nach bestimmten Prinzipien Gegenstände konstruiert werden. Aus heutiger Sicht kann der These, daß das Subjekt, um der Erfahrung fähig zu sein, über ein Raum-Zeit-Auffassungsvermögen verfugen muß, noch uneingeschränkt zugestimmt werden. Über die Struktur dieses Vermögens läßt sich nur durch die Analyse der biologischen und psychologischen Beschaffenheit des Erkenntnisapparates etwas in Erfahrung bringen. Welche Struktur den Gegenständen vom Raum-Zeit-Auffassungsvermögen aufgeprägt wird, liegt dann nicht in gleicher Weise a priori fest wie bei Kant. In Anknüpfung an die Kantsche Raum-Zeit-Lehre soll folgende Unterteilung in verschiedene Bedeutungen von Raum und Zeit vorgenommen werden: (1) (2) (3) (4)
menschliches Raum-Zeit-Auffassungsvermögen (Anschauungsraum) mathematische Strukturen (ζ. B. Minkowski-Raum, Riemann-Raum) Real-Raum-Zeit strukturiertes Raum-Zeit-Konzept der Physik, physikalischer Raum (ζ. B. Newtonscher Raum, Raum der Speziellen und der Allgemeinen Relativitätstheorie).
Kay Herrmann: Zur Raum-Zeit-Konzeption der modernen Physik
393
Diese verschiedenen Bedeutungskonzepte von Raum und Zeit stehen untereinander im Zusammenhang. Die aus der physikalischen Realität stammenden Sinnesdaten werden dem Menschen im Raum-Zeit-Auffassungsvermögen gegeben. Der Mensch bezieht sich daraufhin mit Hilfe mathematischer Strukturen auf die physikalische Realität. Auf diese Weise konstituiert er ein strukturiertes Raum-Zeit-Konzept der Physik, den physikalischen Raum. Der physikalische Raum ist sowohl Ausdruck der Real-Raum-Zeit, des RaumZeit-Auffassungsvermögens als auch der konstruktiv-mathematischen Tätigkeit des Subjekts. Die Struktur des Anschauungsraumes muß nicht mit der Struktur der physikalischen Raum-Zeit zusammenfallen. Der physikalische Raum trägt sowohl a posteriorische als auch a priorische Züge. Er ist a priori, weil er ein a priori-Raum-Zeit-Auffassungsvermögen des Subjekts voraussetzt und weil die mathematischen Strukturen, die zu seiner Beschreibung notwendig sind, a priorischen Charakter tragen. Α posteriori ist der physikalische Raum, weil die Auswahl der geeigneten mathematischen Darstellungsmittel eine Frage der Erfahrung ist. Der physikalische Raum tritt in zwei unterschiedlichen Bestimmungen auf, die im folgenden mit den Worten Meßraum und Darstellungsraum bezeichnet werden sollen. Der Meßraum ist der Raum, bezüglich dessen die Meßergebnisse formuliert und die Experimente geplant werden. Seine Struktur kommt wohl der des Anschauungsraumes am nächsten. Als Meßraum fungiert in der Physik das Raum-Zeit-Konzept der klassischen Mechanik. Der Raum der klassischen Mechanik hat in der Tat eine euklidische Struktur. In diesem Sinne läßt sich sagen, daß dem euklidischen Raum doch eine gewisse Sonderrolle zukommt. Dagegen dient der Darstellungsraum lediglich der eleganten Darstellung von physikalischen Zusammenhängen. In der Newtonschen Mechanik, der Speziellen Relativitätstheorie, der Allgemeinen Relativitätstheorie entspricht die Dimensionszahl des Meßraumes meist der Dimensionszahl des mathematischen Raumes, bezüglich dessen die Grundgleichungen formuliert sind. Ein deutliches dimensionsmäßiges Auseinanderfallen von Meß- und Darstellungsraum findet sich in der Quantentheorie, in der die Grundgleichungen bezüglich des (unendlichdimensionalen) HilbertRaumes dargestellt werden. Weitere Beispiele fur abstrakte Darstellungsräume sind: der Konfigurationsraum eines N-Teilchen Systems (3N Dimensionen), der Impulsraum eines N-Teilchen Systems (3N Dimensionen), der Phasenraum eines N-Teilchen Systems (6N Dimensionen), n-dimensionale differenzierbare Mannigfaltigkeiten. Die höherdimensionalen Räume waren bisher wenig Gegenstand wissenschaftstheoretischer Erörterungen. Aus diesem Grunde soll im folgenden stärker die Physik höherdimensionaler Räume in den Blickpunkt des Interesses
394
Section 3: Philosophy of Science
rücken. Ganz allgemein muß festgehalten werden, daß höherdimensionale Räume der koordinatenmäßigen Darstellung physikalischer Größen dienen, die von mehreren Parametern abhängen. Bei der Darstellung dieser Größen in einem Koordinatensystem übernehmen die betreffenden Parameter die Rolle der Koordinaten. Beispiele für solche Parameter sind: Temperatur, Impuls, Energie, Winkel, Ort. Bei der Klassifikation der Koordinaten höherdimensionaler Räume m u ß zwischen nicht-raum-zeitlichen und raum-zeitlichen Koordinaten unterschieden werden (Herrmann 1994, 101f.). Zu den nicht-raum-zeitlichen Koordinaten gehören Energie, Impuls usw. In solchen höherdimensionalen Räumen können die physikalischen Gleichungen sehr elegant aufgeschrieben werden, ohne daß der Rahmen der vierdimensionalen Physik dabei verlassen wird. Die moderne Physik (ζ. B. die Kaluza-Klein-Theorien, die meisten Superstringtheorien) hat aber auch Theorien hervorgebracht, bei denen mit der Einführung neuer raum-zeitlicher Koordinaten der Rahmen der vierdimensionalen Physik tatsächlich überschritten wird. Einigen spezifischen erkenntnistheoretischen Problemen, die dadurch aufgeworfen werden, wenden wir uns im folgenden Abschnitt zu.
3.
Uber den ontologischen Status von Raum und Zeit
Die Allgemeine Relativitätstheorie hat die erkenntnistheoretische Hypothese nahegelegt, daß die Raum-Zeit eine subjektunabhängige, ontologisch autonome Entität mit eigenen dynamischen Freiheitsgraden ist. Für Kant wäre es eine Absurdität gewesen, Raum und Zeit gleichberechtigt neben die materiellen Dinge zu stellen. Kant hätte wohl folgendermaßen argumentiert: Was den Empfindungen erst ihre Form gibt, kann nicht zugleich durch Empfindungen gegeben sein. Dieser Widerspruch löst sich schnell auf, wenn man sich der verschiedenen Bedeutungen, die Raum und Zeit zukommen, erinnert. Kant spricht über den Anschauungsraum (System subjektiver Bedingungen, das Erfahrung erst ermöglicht), die modernen Physiker sprechen aber über die subjektunabhängige Real-Raum-Zeit (Gegenstand der Erfahrung), auf die sie sich vermöge ihrer mathematischen Hilfsmittel beziehen. Eine subjektunabhängige Real-Raum-Zeit hat Kant nicht in Betracht ziehen brauchen. Erst die Allgemeine Relativitätstheorie zeigte, daß die Raum-Zeit durch Empfindungen gegeben sein kann. Mit diesem Argument läßt sich die ontologische Eigenständigkeit der Raum-Zeit rechtfertigten. Ein Ergebnis der Allgemeinen Relativitätstheorie war nämlich die Erkenntnis, daß die Raum-Zeit-Struktur ein nichteliminierbarer Aspekt der Wechselwirkung und Bewegung der materiel-
Kay Herrmann: Zur Raum-Zeit-Konzeption der modernen Physik
395
len Dinge ist. Raum-Zeit-Struktur und die Anordnung des felderzeugenden Materials sind engstens miteinander verknüpft. Die Art der Anordnung des Materials determiniert zwar die Raum-Zeit-Struktur, die Raum-Zeit-Struktur wirkt ihrerseits aber auf die Anordnung und Bewegung des Materials zurück. Es scheint daher sinnvoll, der Raum-Zeit den gleichen ontologischen Status wie den materiellen Dingen zuzuschreiben. Deshlab sollen einige Erkenntnisse aufgelistet werden, die für die ontologische Autonomie der Raum-Zeit sprechen: (1) Raum-Zeit-Struktur und Materieanordnung sind miteinander verflochten. (2) Es gibt Vakuumlösungen der Einsteinschen Gravitationsfeldgleichungen (ζ. B. de-Sitter-Räume), welche autonome Raum-Zeit-Strukturen mit einer eigenen Dynamik repräsentieren. (3) Eine quantenmechanische Näherungsbetrachtung hat gezeigt, daß sich das Vakuum unter extremen Bedingungen selbst mit Teilchen auffüllen kann. (4) Gravitationswellen - wenn es sie gibt - können sich durch reale Wirkungen (ζ. B. Verzerrung eines Teilchenmusters) äußern. Wie steht es aber um den ontologischen Status von höherdimensionalen Räumen, in denen bestimmte einheitliche Feldtheorien formuliert sind? Es wurde bereits erwähnt, daß eine Formulierung von physikalischen Gleichungen in höherdimensionalen Räumen nichts Ungewöhnliches ist. Oft können so physikalische Gleichungen vorteilhafter formuliert und die Physik handhabbarer gestaltet werden. Mit einer so verstandenen höherdimensionalen Formulierung der Physik sind keine neuartigen erkenntnistheoretischen Probleme verbunden. Es geht hier nur um die Wahl der geeigneten mathematischen Darstellungsmittel. Das physikalische Geschehen spielt sich weiterhin in der vierdimensionalen Raum-Zeit ab. Als Anfang unseres Jahrhunderts die Suche nach einer einheitlichen Theorie von Elektromagnetismus und Gravitation begann, wurden von den Physikern auch Theorien Betracht gezogen, in denen neben den vier Raum-Zeit-Koordinaten weitere räumliche Koordinaten auftreten. Zu diesen Theorien gehören die Kaluza-Klein-Theorien. Die originale Kaluza-Theorie ist eine 5-dimensionale Theorie. Sie wurde im Jahre 1921 erstmals vorgestellt, konnte 1926 von O . Klein in wesentlichen Zügen verbessert werden und wird heute als eigentlicher Ausgangspunkt der höherdimensionalen Vereinigung angesehen. Ursprünglich war die Kaluza-KleinTheorie der Versuch einer einheitlichen Theorie von Elektromagnetismus und Gravitation. Um neben dem Elektromagnetismus auch noch andere Wechselwirkungsarten mit berücksichtigen zu können, wurden mittlerweile schon
396
Section 3: Philosophy of Science
11-dimensionale Theorien entwickelt. Es ergibt sich die interessante Frage: Dient dieser höherdimensionale Raum lediglich der besseren Darstellung der physikalischen Gleichungen oder leben wir - vorausgesetzt, daß die Theorie wahr ist - tatsächlich in einer höherdimensionalen Welt? Um diese Frage beantworten zu können, muß man untersuchen, ob sich die Argumente, die bei der vierdimensionalen Raum-Zeit für deren ontologische Autonomie sprechen, auf höherdimensionale Raum-Zeiten übertragen lassen. W i e eine solche Übertragung geschehen könnte, soll im folgenden anhand der KaluzaKlein-Theorien skizziert werden. Eine umfangreichere Untersuchung der mit den höherdimensionalen einheitlichen Feldtheorien verknüpften erkenntnistheoretischen Probleme findet sich in (Herrmann 1994). Die höherdimensionalen einheitlichen Feldtheorien sind insbesondere auf zwei Eigenschaften zu überprüfen: (1) Es ist zu untersuchen, ob die zusätzlichen Dimensionen und die vierdimensionalen Raum-Zeit-Koordinaten semantisch gleichwertig sind (Frage der semantischen Gleichwertigkeit). Es kann gezeigt werden, daß die höherdimensionale Raum-Zeit der KaluzaKlein-Theorien und der Vierraum semantisch gleichwertig sind. Das folgt ζ. B. aus der Tatsache, daß die höherdimensionalen Raum-Zeit-Koordinaten die gleichen mathematischen Eigenschaften (ζ. B. Transformationseigenschaften) besitzen wie die Vierraum-Koordinaten, daß die Extradimensionen gleichwertig mit den Vierraum-Koordinaten als Parameter in physikalische Größen der vierdimensionalen Physik (ζ. B. Feldstärken) eingehen, aus der Existenz nichttrivialer Vakuumlösungen (ζ. B. Kasner-Lösung). Die KasnerLösung ist deshalb so interessant, weil sie zeigt, daß es auch höherdimensionale kosmologische Modelle gibt, in denen der höherdimensionale materiefreie Raum über eine eigene Dynamik verfügt. Es kann hier der Fall eintreten, daß die 5. Dimension zu einem Punkt zusammenschrumpft, während die vier restlichen Dimensionen expandieren. Die Dimensionsreduktion ist in diesem Fall ein echter physikalischer Prozeß; ein weiteres Argument für die semantische Gleichwertigkeit von Vierraum und 5. Dimension. (2) Es ist zu untersuchen, ob die Extradimensionen in irgendeiner Weise das physikalische Geschehen der vierdimensionalen Raum-Zeit beeinflussen können (Frage der empirischen Nachweisbarkeit). Die Kaluza-Klein-Theorien bieten durchaus Beispiele für einen Einfluß der Extradimensionen auf das vierdimensionale physikalische Geschehen. So ergibt sich in manchen höherdimensionalen kosmologischen Modellen ein Zusammenhang zwischen dem Beschleunigungsparameter des Kosmos und
Kay Herrmann: Zur Raum-Zeit-Konzeption der modernen Physik
397
der Zahl der Extradimensionen (Chodos/Detweiler 1980). Weitere Beispiele für die Verwicklung der Extradimensionen in die vierdimensionale Physik sind der sich aus der 5-dimensionalen Kaluza-Klein-Theorie ergebende Zusammenhang e ~ \/r zwischen dem numerischen Wert der Elementarladung (e) und dem Radius der 5. Dimension (r), aber auch die Existenz von Monopollösungen. Wir fuhren nun folgende Abkürzungen ein: Μ: S: Τ: R:
die Extradimensionen sind empirisch nachweisbar, höherdimensionale Raum-Zeit und 4-dimensionale Raum-ZeitKoordinaten sind semantisch gleichwertig, die Theorie ist wahr, die höherdimensionale Zeit ist ontologisch eigenständig.
Mit Hilfe dieser Symbole läßt sich folgende Aussage (A) formulieren, die fur jede höherdimensionale einheitliche Feldtheorie als wahr anzusetzen ist: (Α)
Τ D ((M d R)H(RD
S)).
An der Theorie können die Wahrheitswerte fur Μ und S abgelesen werden, damit läßt sich der fur R zu erwartende Wahrheitswert ermitteln. Allerdings zeigt sich, daß (A) nur notwendige, nicht aber zugleich auch hinreichende Bedingungen für die Realität der höherdimensionalen Raum-Zeit formuliert. Was ergibt sich nun für die Kaluza-Klein-Theorien? Es wird vorausgesetzt, daß Τ wahr. Dem Punkt (1) ist zu entnehmen S —> wahr und aus Punkt (2) folgt Μ —» wahr. Damit ergibt sich zwangsläufig R —> wahr. D. h. also, daß der höherdimensionalen Raum-Zeit der Kaluza-Klein-Theorien in gleicher Weise wie der vierdimensionalen Raum-Zeit der Status einer ontologisch autonomen Entität zugestanden werden muß.
4.
Literatur
CARNAP, RUDOLF: Einfiihrung in die Philosophie der Naturwissenschaften, Berlin 1986. CHODOS, ALAN/DETWEILER, STEVEN: Where Has the Fifth Dimension Gone? Physical Review D 2 1 ( 1 9 8 0 ) , 2 1 6 7 - 2 1 7 0 .
EINSTEIN, ALBERT: Geometrie und Erfahrung. Sitzungsberichte der Preußischen Akademie der Wissenschaften
(1921),
123-130.
HERRMANN, KAY: Einheit und Höherdimensionalität, Frankfurt a. M./Berlin/Bern/ N e w York/Paris/Wien 1994. KANT, IMMANUEL: Kritik der reinen Vernunft, Berlin 1968.
398
Section 3: Philosophy of Science
Erkenntnis und Besinnung (Ein Lebensrückblick). In: Gesammelte Abhandlungen, Berlin/Heidelberg/New York 1968, 631-649.
WEYL, HERMANN:
PAUL H O Y N I N G E N - H U E N E
„Die neuzeitliche Naturerkenntnis zerstört die Natur." Z u Georg Pichts Theorie der modernen Naturwissenschaften*
Georg Picht hat 1973/74 in Heidelberg eine zweisemestrige Vorlesung gehalten, die 1989 unter dem Titel Der Begriff der Natur und seine Geschichte publiziert wurde. Das zentrale Leitmotiv dieser Vorlesung lautet: „ D i e M e n s c h h e i t ist heute in Gefahr, d u r c h ihre W i s s e n s c h a f t v o n der N a t u r d e n Bereich der Natur, in d e m sie lebt u n d der ihrem Z u g r i f f ausgesetzt ist, zu zerstören. E i n e Erkenntnis, die sich d a d u r c h bezeugt, d a ß sie das, was erk a n n t werden soll, vernichtet, k a n n nicht wahr sein. D e s w e g e n s i n d wir heute gezwungen, die Wahrheit unserer Naturerkenntnis in Frage zu stellen" (Picht 1989, 80).
Pichts Leitmotiv soll im folgenden im Detail diskutiert werden. Im ersten Satz scheint eine Zweideutigkeit zu stecken. Es ist nämlich nicht klar, ob gemeint ist, daß durch die Wissenschaft selbst - im Sinne der wissenschaftlichen Aktivität des Forschens - die Natur zerstört wird oder durch die Anwendung der Wissenschaft, also etwa in der industriellen Produktion. Nun ist die Unterscheidung von Wissenschaft und ihrer Anwendung kontrovers, und Picht behauptet zu Beginn seiner Vorlesung die Untrennbarkeit von Wissen und seiner Realisierung. Das ist aber nicht in dem Sinn gemeint, daß Forschung und Anwendung ein und derselbe Prozeß seien, sondern nur, daß „die Zerstörung der Natur im experimentellen Verfahren schon vorprogrammiert sei" (Picht 1989, 115). Klar ist, welcher Prozeß nach Picht die Zerstörung tatsächlich bewerkstelligt: „Die angewandte Naturwissenschaft zerstört die Natur" (Picht 1989, 199). Nach Picht ist also der Bereich der Natur, in dem die Menschheit lebt, der Gefahr ausgesetzt, durch menschliche Aktivität zerstört zu werden. Ich glaube, daß diese Behauptung nicht kontrovers ist: die Böden, das Wasser, die Atmosphäre, erhebliche Teile der Biosphäre sind ernsthaft bedroht. In welcher Aktivität der Menschen hat diese Bedrohung ihren Ursprung? Pichts Eine ausführliche Fassung dieser Arbeit erscheint in der Zeitschrift für philosophische Forschung.
400
Section 3: Philosophy of Science
Antwort auf diese Frage, die ich soeben schon zitiert habe, ist eindeutig: „Die angewandte Naturwissenschaft zerstört die Natur" (Picht 1989, 199). Doch scheint mir diese Antwort streng genommen falsch zu sein, obwohl sie natürlich auch etwas Richtiges beinhaltet. Die meines Erachtens richtige Antwort m u ß lauten: Die anthropogene Naturzerstörung hat ihren Ursprung im technischen Handeln, genauer gesagt: in den unbeabsichtigten Nebenfolgen des technischen Handelns. Daß zwischen angewandter Naturwissenschaft und technischem Handeln ein Unterschied besteht, läßt sich an einem einfachen Beispiel illustrieren, nämlich der antiken Umweltzerstörung im Mittelmeerraum durch großflächige Abholzungen für den Schiffbau. Ganz offensichtlich ist die anschließende Verkarstung großer Landstriche die Nebenfolge eines technischen Handelns, das keineswegs angewandte Naturwissenschaft war. D e m kann man entnehmen, daß Picht implizit einer These, ja, man sollte sagen, einem Cliche über die Technik anhängt, das besagt, daß Technik angewandte Naturwissenschaft sei. Doch ist diese These zweifellos falsch, wie ζ. B. in der Technikphilosophie längst bekannt ist. Für erfolgreiche technische Realisationen m u ß das entsprechende naturwissenschaftliche Grundlagenwissen nicht bekannt sein, und die Technikgeschichte lehrt, daß es auch vielfach nicht bekannt war. Tatsächlich waren technischen Traditionen die längste Zeit ihrer Existenz von den Naturwissenschaften unabhängig; eine signifikant wissenschaftsfundierte Technik gibt es erst seit dem letzten Viertel des 19. Jahrhunderts. Für die Analyse unserer Problemsituation scheint es mir nicht unerheblich, die Diagnose hinsichtlich der Wurzeln unserer Misere genau zu stellen. Ich bestehe also auf dem Unterschied zwischen technischem Handeln, angewandter Wissenschaft und dem Forschungsprozeß. Natürlich leugne ich nicht, daß die heutige Technik zu großen Teilen wissenschaftsfundiert ist, und das ist der unbestreitbare Gehalt von Pichts Behauptung; aber dieses Fundierungsverhältnis ist nicht begrifflicher Art, hat also keinen Notwendigkeitscharakter, sondern ist historisch kontingent. Noch viel problematischer als der erste erscheint mir der zweite Satz des Picht-Zitats: „Eine Erkenntnis, die sich dadurch bezeugt, daß sie das, was erkannt werden soll, vernichtet, kann nicht wahr sein." Ich sehe hier drei problematische Punkte. Zunächst zeigt der zweite Satz die gleiche Zweideutigkeit wie der erste. Mit seiner Wendung „das, was erkannt werden soll" anstatt: „das, was erkannt worden ist" suggeriert Picht wieder, im Erkenntnisprozeß selbst werde vernichtet, womöglich sogar anstelle der Gewinnung von Erkenntnis, und nicht erst in der nach Abschluß des Erkenntnisprozesses einsetzenden Anwendung der Erkenntnis. Wie gesagt, andere Stellen des Buches belegen eindeutig, daß tatsächlich nur die Anwendung der Wissenschaft gemeint ist.
Paul Hoyningen-Huene: „Die neuzeitliche Naturerkenntnis zerstört die Natur."
401
Es gibt noch ein zweites Problem mit der Wendung „Eine Erkenntnis, die sich dadurch bezeugt, daß sie das, was erkannt werden soll, vernichtet." Was heißt eigentlich, daß sich eine Erkenntnis durch ein χ „bezeugt" ? Besagt das lediglich, daß das χ eine Konsequenz dieser Erkenntnis ist? In meinen Ohren klingt das „bezeugen" dazu zu pathetisch (um nicht etwas unfreundlicher zu sagen: es klingt etwas geschwollen). Das bezeugen scheint mehr zu besagen, als daß χ eine Konsequenz der Erkenntnis neben anderen Konsequenzen ist. Vielmehr soll χ doch wohl ein wahrhaftiger Zeuge fur die Erkenntnis sein, und das heißt so etwas wie: In χ kommt das Wesen der Erkenntnis auf angemessene Weise zum Ausdruck. Aber kommt das Wesen der naturwissenschaftlichen Erkenntnis denn wirklich durch Vernichtung des Erkenntnisgegenstands angemessen zum Ausdruck? Ist es wirklich so, daß das, was Gegenstand der wissenschaftlichen Erkenntnis wird, sich ipso facto auf dem Weg in die Vernichtung befindet, und daß gerade darin der Kern des ErkenntnisgegenstandSeins besteht? Das scheint mir doch, gelinde ausgedrückt, eine Fehlbeschreibung. Zunächst extremere Beispiele: Kosmologie, Astronomie, Paläontologie, Erdgeschichte, also die historischen Naturwissenschaften. In diesen Fällen ist der handelnde Zugriff auf den Erkenntnisgegenstand ohnehin unmöglich und daher keine Vernichtungsmöglichkeit gegeben. Aber auch in Fällen, wo der technische Zugriff eine Folge der naturwissenschaftlichen Erkenntnis ist, scheint mir dessen Beschreibung als Vernichtung (oder die Tendenz dazu) vielfach völlig unangemessen. Könnte man beispielsweise die kontinuierliche Steigerung der Lebenserwartung in den Industrieländern durch Hygiene und ärztliche Versorgung, die wesentlich auf Wissenschaft basieren, so ohne weiteres als „Vernichtung" bezeichnen? Ich sehe ja durchaus, daß die Steigerung der Lebenserwartung ein wesentlicher Faktor für das Bevölkerungsproblem auf diesem Erdball ist, und zwar insbesondere mittel- und langfristig auf außerordentlich gravierende Weise. Dennoch würde ich die Versuche, Hygiene und ärztliche Versorgung wissenschaftsfundiert zu verbessern, nicht als Ausdruck einer Vernichtungstendenz der modernen Wissenschaft beschreiben können. Damit will ich natürlich keineswegs leugnen, daß es als Konsequenz der massenhaften Anwendung von Wissenschaft auch Vernichtung von Natur gibt. Es weiß ja heute schon fast jedes Kind (unseres Kulturkreises), daß es eine anthropogene Ausrottung von biologischen Arten gibt, die in einem unbeschreiblichen Tempo fortschreitet. Aber ich bestehe auf dem Unterschied von Vernichtung als Ausdruck der Wesensqualität der Wissenschaft und von Vernichtung als höchst unerwünschter und prekärer Nebenfolge von Wissenschaft. Schließlich habe ich drittens noch erhebliche Probleme mit der Behauptung Pichts, daß die naturwissenschaftliche Erkenntnis aufgrund ihres Vernich-
402
Section 3: Philosophy of Science
tungspotentials nicht wahr sein kann. Betrachten wir ein Beispiel, bei dem die Vernichtung des Erkenntnisgegenstands tatsächlich gegeben sein könnte. Nehmen wir an, der Virologie würde es gelingen, den Stoffwechsel des HI-Virus so weit aufzuklären, daß ein wirksamer Impfstoff gegen AIDS entwickelt werden kann. Es ist klar, daß diese Erkenntnis selbst den Virus natürlich nicht vernichten würde, aber die massenhafte Anwendung des Impfstoffes könnte es vielleicht. Würde sich darin die Unwahrheit der virologischen Erkenntnis bezeugen, wie Picht dann wohl behaupten müßte? Müßte man aufgrund der Wirksamkeit des Impfstoffes, der den HI-Virus womöglich vernichten würde, die Wahrheit unserer Naturerkenntnis in Frage stellen, wie es im dritten Satz des Zitats heißt? Das klingt irgendwie recht merkwürdig. Mit Blick auf die Vernichtung der tropischen Regenwälder oder der schützenden Ozonschicht der Atmosphäre, die man trotz der Wirkung vieler nichtwissenschaftlicher Faktoren vielleicht in letzter Instanz der Existenz der modernen Wissenschaft anlasten mag, klingt das Picht-Zitat natürlich viel besser. Wir müssen, um uns hier Klarheit zu verschaffen, wohl zunächst fragen, worauf Picht mit seiner Behauptung von der Unwahrheit der wissenschaftlichen Erkenntnis eigentlich hinaus will. Picht geht es zentral darum, der Wissenschaft wohl einen Anspruch auf Richtigkeit zuzugestehen, aber einen Anspruch auf Wahrheit abzusprechen. Was versteht Picht unter Wahrheit, was unter Richtigkeit? Eine wahre Darstellung der Natur würde diese so repräsentieren, wie sie „von sich aus" beschaffen ist. Die Naturwissenschaft kann dagegen nur sagen: „auf diese oder jene Operationen reagiert Natur zwangsläufig so oder so" (Picht 1989, 304); sie zeigt Natur nur in der Hinsicht, „wie sie sich bei den Zwangsmaßnahmen, denen Wissenschaft sie unterwirft, darstellen muß" (Picht 1989, 304). Die naturwissenschaftliche Erkenntnis ist demnach, wie Picht in Anschluß an Nietzsche ausführt, „perspektivisch" (Picht 1989, 130f.). Was bedeutet das? „Wenn wir einen Gegenstand unter einer bestimmten Perspektive betrachten, sehen wir nicht ein Lügengebilde. Wir sehen einen wirklichen Aspekt des wirklichen Gegenstandes. Aber dieser Aspekt zeigt uns den Gegenstand verkürzt. Er zeigt ihn uns in verzerrter Gestalt." (Picht 1989, 130).
Demnach muß nach Picht der Naturwissenschaft der Anspruch abgesprochen werden, die Natur so darzustellen, wie sie von sich aus beschaffen ist; vielmehr erhalten wir von der Naturwissenschaft nur eine perspektivisch verkürzte Ansicht der Natur. Diese Ansicht der Natur hat durchaus ihre Richtigkeit, ist aber eben nicht das ganze, wahre Bild. Nach dem zweiten Satz des Zitats ist es ein wesentliches Indiz für die Unwahrheit der Naturwissenschaft, also für den
Paul Hoyningen-Huene: „Die neuzeitliche Naturerkenntnis zerstört die Natur."
403
perspektivischen Charakter ihres Wissens, daß die Anwendung dieses Wissens Natur vernichtet. Und dieses Faktum zwingt uns heute, so der letzte Satz des Zitats, die Wahrheit unserer Naturerkenntnis in Frage zu stellen. Eine kritische Diskussion dieser Behauptungen erfordert demnach die Klärung folgender drei Fragen: (1) Ist das wissenschaftliche Wissen perspektivisch? (2) Ist die wissenschaftsfundierte Naturzerstörung ein Indiz fur diese Perspektivität? Und (3): Sind wir deswegen heute gezwungen, die Wahrheit unserer Naturerkenntnis, d. h. ihren Anspruch auf Nicht-Perspektivität in Frage zu stellen? Zunächst zur ersten Frage, ob das wissenschaftliche Wissen perspektivisch ist. Die Antwort hierauf scheint mir eindeutig positiv zu sein, und zwar auch aus den Gründen, die Picht anfuhrt. In der Tat ist der wesentlich experimentelle Zugriff der neuzeitlichen Naturwissenschaft auf die Objekte der Erkenntnis eine bestimmte, eingeschränkte Perspektive. Viel gravierender erschiene mir zudem der Umstand, daß die wissenschaftlichen Grundbegriffe wohl nicht Abbilder der Grundcharaktere der Natur sind, sondern menschliche Erfindungen; aber dies ist ein weites Feld der Diskussion, zu weit, als daß ich es hier wirklich betreten könnte. Zur zweiten Frage: Ist die wissenschaftsfundierte Naturzerstörung ein Indiz für diese Perspektivität? Nehmen wir zur Diskussion dieser Frage zunächst wieder das Beispiel des HI-Viruses auf, der durch die Entdeckung bzw. Erfindung eines Impfstoffes und dessen massive Anwendung womöglich vernichtet würde. Ist es die Perspektivität des entsprechenden naturwissenschaftlichen Wissens, also seine nicht abschüttelbare experimentelle Herkunft, die die Vernichtung des HI-Viruses möglich machen würde? Nun ja, dazu müßte man dieses Wissen mit dem nichtperspektivischen Wissen über den HI-Virus vergleichen, also nach Picht mit dem Wissen, wie der HI-Virus von sich aus beschaffen ist. Nun haben wir dieses wahre Wissen über den HI-Virus zwar nicht, aber wir müssen annehmen, daß das perspektivische Wissen im wahren Wissen enthalten ist. Der Grund ist, daß das wahre, ganze Wissen ja alle Perspektiven auf den Gegenstand umfassen muß. Demnach würde sich auch das wahre Wissen eignen, den HI-Virus zu vernichten, ebenso wie das bloß richtige Wissen der Naturwissenschaft. Aus der Diskussion dieses Beispiels scheint zu folgen, daß auch das wahre, vollständige Wissen zur Zerstörung der Natur nutzbar wäre. Demnach ist die wissenschaftsfundierte Naturzerstörung kein Indiz flir die Perspektivität des wissenschaftlichen Wissens. Schließlich bleibt die dritte Frage: Sind wir wegen der Naturzerstörung heute gezwungen, die Wahrheit unserer Naturerkenntnis, d. h. ihren Anspruch auf Nicht-Perspektivität in Frage zu stellen, wie Picht das behauptet? Diese Frage muß auf dreifache Weise negativ beantwortet werden. Zum ersten habe ich bereits die in der Frage enthaltene Behauptung über den
404
Section 3: Philosophy of Science
Zusammenhang von Perspektivität der Wissenschaft und Naturzerstörung zurückgewiesen. Zum zweiten besteht die Nötigung, den bloß perspektivischen Charakter unserer Naturerkenntnis anzuerkennen, nicht erst heute, sondern zumindest seit dem Anfang dieses Jahrhunderts. Zum dritten besteht kein Zwang, die Wahrheit unserer Naturerkenntnis in Frage zu stellen, weil zumindest in bestimmten Fachöffentlichkeiten ein Anspruch der Wissenschaft auf Wahrheit in Pichts Sinn längst kontrovers geworden bzw. aufgegeben worden ist. Der Hauptgrund hierfür ist, daß die Physik in diesem Jahrhundert eine tiefgreifende Umorientierung erfahren hat, deren Kern gerade die Aufgabe des Anspruchs ist, die Natur so erfassen zu können, wie sie von sich her (oder an sich) ist. Und in der Wissenschaftsphilosophie ist mindestens seit den frühen 60er Jahren eine heftige Kontroverse über Realismus und Instrumentalismus im Gange, die alle Wissenschaften betrifft, nicht nur die Physik.
Literatur PICHT, GEORG:
Der Begriff der Natur und seine Geschichte, Stuttgart
1989.
M A X KISTLER
Zur Transfer-Theorie der Kausalität* 1.
Der Ursprung der Asymmetrie der Kausalbeziehung
2.
Die Unterscheidung von kausalen Prozessen und Pseudo-Prozessen
3.
Zusammenfassung
4.
Literatur
Statt eine Bestandsaufnahme sämtlicher Versuche 1 in Angriff zu nehmen, die seit den Attacken von H u m e (1978) und Russell (1912) unternommen wurden, u m dem Begriff der Kausalität als objektiver Beziehung zwischen Ereignissen wieder zu philosophischer Respektabilität zu verhelfen, möchte ich folgenden Vorschlag verteidigen: (K)
Zwei Ereignisse c und e sind genau dann wie Ursache und Folge miteinander verbunden, wenn es eine Erhaltungsgröße Ρ gibt, die in beiden Ereignissen vorhanden ist, und von der eine bestimmte Quantität Q von c auf e übertragen wird.
Der hier verwendete Ereignisbegrifif identifiziert ein Ereignis mit dem Inhalt einer Raumzeit-Zone. Ereignisse sind also konkrete Individuen, deren Identität aufgrund eines räumlichen und zeitlichen Kriteriums festgelegt ist. Dagegen hängt im allgemeinen die Identität eines Gegenstands, ζ. B. eines Tisches, nur von seinen räumlichen Grenzen ab. 2 D i e auf (K) aufbauende Transfer-Theorie, 3 d. h. die Theorie der Kausalität, die sie auf die Übertragung 4 einer Quantität einer Erhaltungsgröße zu* Ich danke meinen Zuhörern in Leipzig und Ansgar Simon fur ihre hilfreiche Kritik. 1 Zwei der wichtigsten modernen Versuche dieser Art wurden von Mackie ( 1 9 7 4 ) und Tooley (1987) unternommen. 2 3
Q u i n e (1985) vertritt einen ähnlichen Ereignisbegriff. Versionen einer solchen Theorie wurden von Aronson (1971a; 1971b; 1982), Q u i n e (1973), Fair (1979) und Dowe (1992a; 1992b) vorgeschlagen.
* U m zu vermeiden, daß die Transfer-Theorie in fast trivialer Weise zirkulär erscheint, müssen wir den Begriff der Übertragung so auffassen: Von einer Menge Q einer Erhaltungsgröße Ρ sagen wir also genau dann, daß sie von einem Ereignis c auf ein anderes Ereignis e übertragen wird, wenn dieselbe Menge Q in beiden Ereignissen auftritt. Diese Charakterisierung zieht starke Einschränkungen fiir die raumzeitliche Distanz nach sich, durch die zwei Ereignisse maximal von einander getrennt sein dürfen, u m noch kausal verbunden sein zu können. Aus Platzgründen können wir hier nicht auf folgenden Einwand eingehen: Q u i n e (1973), Sal-
406
Section 3: Philosophy of Science
rückfuhrt, soll nun am Beispiel der Erklärung des Ursprungs der Asymmetrie der Kausalität näher erläutert werden.
1.
Der Ursprung der Asymmetrie der Kausalbeziehung
Ist die Transfer-Theorie unverträglich mit einer kausalen Theorie der Zeit? Der Vorwurf, daß dem so sei, wird damit begründet, daß die Theorie keinen Ansatz enthalte, der es erlauben würde, den asymmetrischen Charakter der Kausalbeziehung direkt, d. h. aus der Natur dieser Beziehung selbst, abzuleiten. Im Folgenden soll herausgearbeitet werden, daß es in Wirklichkeit ein Vorteil der Reduktion (K) ist, daß die Asymmetrie zwischen Ursache und Wirkung in ihr nicht als begrifflicher Bestandteil der Kausalität erscheint. Dazu muß man sich zunächst die Grundidee der Übertragung klarmachen: Die zeitliche Dimension und die räumlichen Dimensionen haben in der Transfer-Theorie denselben Status. Insbesondere ist die Zeit an sich selbst genausowenig asymmetrisch wie der Raum. Wo Asymmetrie auftritt, liegt sie in den spezifischen Prozessen begründet, die in der Zeit und im Raum ablaufen. Eine ausgezeichnete Richtung in der Zeit gibt es nur aufgrund der ausgezeichneten Richtung asymmetrischer Prozesse. Soviel ist an dem Vorwurf, daß nach der Transfer-Theorie die Kausalbeziehungen selbst keine Grundlage für Asymmetrie bieten, richtig: Es ist in der Tat der Fall, daß es Kausalprozesse gibt, deren asymmetrischer Charakter indirekt bestimmt ist, d. h. durch die Beziehung des betreffenden Prozesses zu anderen Kausalbeziehungen, wobei die Asymmetrie der letzteren von ihrer physikalischen Eigenart herrührt. Das heißt folgendes: Gehen wir davon aus, daß es zwei grundsätzlich verschiedene Arten von kausalen Prozessen gibt. Die einen sind vollständig von reversiblen Naturgesetzen determiniert: Zu diesem Typ gehören die Bewegung der Planeten und die Bewegung von Billardbällen - unter der Voraussetzung, daß sie reibungsfrei vor sich geht. Die Prozesse der zweiten Gruppe sind irreversibel, das heißt sie besitzen eine intrinsische zeitliche Asymmetrie. Ein Spezialfall dieses Typs umfaßt praktisch alle Vorgänge, die auf der Erde ablaufen: Es ist der Fall der Entropie erzeugenden (oder dissi-
m o n (1984), Ehring (1986), Dieks (1986) u n d Dowe (1992a; 1992b) halten es entweder für unmöglich, den Begriff der Identität zweier Mengen einer Erhaltungsgröße ontologisch zu rechtfertigen oder sie halten eine Reduktion im Stil von (K) für erkenntnistheoretisch unzulänglich oder beides.
Max Kistler: Zur Transfer-Theorie der Kausalität
407
pativen) Prozesse.5 Diese Prozesse sind so zahlreich, daß sie eine ausreichende Basis fur die Asymmetrie aller kausalen Prozesse darstellen, und zwar auf die folgende Weise. Gehen wir davon aus, daß es keine Ereignisse gibt, die kausal vollständig isoliert sind, das heißt, die in überhaupt keiner kausalen Verbindung zu anderen Ereignissen stehen. Diese Annahme ist deshalb plausibel, weil die kausalen Auswirkungen eines Ereignisses überhaupt den einzigen Grund darstellen, seine Existenz anzunehmen. Was wäre ein Gegenstand oder ein Ereignis „ohne Eigenschaften"? Wir könnten nicht nur nichts von ihm wissen, sondern es bestünde kein guter Grund anzunehmen, daß er (oder es) existiert. Wenn ein Gegenstand aber Eigenschaften hat, dann steht er auch in Wechselwirkung mit seiner Umgebung. 6 Wir können uns nun die kausalen Verbindungen, die zwischen den Ereignissen bestehen, in der Form eines Netzes vorstellen, wobei die Knoten die Ereignisse repräsentieren. 7 Wir haben jetzt fast alle Voraussetzungen für die Schlußfolgerung, daß es möglich ist, allen kausalen Beziehungen eine eindeutige Richtung zuzuschreiben. Erstens sind alle Ereignisse und ihre Kausalverbindungen in ein Netz eingebunden. Zweitens gibt es in diesem Netz zumindest einige - und in unserer näheren Umgebung, auf der Erde, sogar zahllos viele - Verbindungen von Ursache und Wirkung, die aufgrund ihrer physikalischen Eigenart in sich selbst asymmetrisch sind. Wir wollen nun vorläufig zwei weitere Voraussetzungen machen: 8 Die dritte Voraussetzung ist, daß es nur ein solches Netz gibt, das heißt, daß alle Ereignisse tatsächlich in einem einzigen Netz eingebunden sind. Die vierte Voraussetzung ist, daß es in jeder Region der Welt eine klare Mehrheit von Kausalverbindungen gibt, deren intrinsische Asymmetrie (siehe Voraussetzung 2) in dieselbe Richtung weist. Auf der Erde scheint es zum Beispiel der Fall zu sein, daß die Richtung der Asymmetrie aller energetisch isolierten irreversiblen Prozesse dieselbe ist. Unter der Annahme, daß diese Voraussetzungen erfüllt sind, können wir nun das kausale Netz dazu benützen, um denjenigen Kausalbeziehungen, die keine intrinsische Asymmetrie aufweisen, die also in sich selbst symmetrisch sind, indirekt doch eine Richtung zuzuschreiben: Die vierte Voraussetzung 5
Diese Prozesse k ö n n e n auch zur Erklärung des Ursprungs der Asymmetrie der Zeit dienen (vgl. Reichenbach 1956; G r ü n b a u m 1973). Ein relativ seltenes P h ä n o m e n , das eine Verletzung der Zeitinvarianz (d. h. Invarianz in Bezug auf U m k e h r u n g der Zeitrichtung) beinhaltet u n d deshalb eine weitere objektive Basis für die Asymmetrie der Zeit darstellt, ist der Kaonen-Zerfall (vgl. Lee et al. 1957; Sachs 1987; Dowe 1992b).
6
W i r k ö n n e n die These, daß es keine absolut inerte intrinsische Eigenschaft gibt, hier nicht näher begrgünden.
7
Der Begriff eines kausalen Netzes wurde von Reichenbach (1956) entwickelt. W i r müssen es aus Platzgründen unterlassen zu untersuchen, wohin die Aufgabe dieser Ann a h m e n führt.
8
408
Section 3: Philosophy of Science
erlaubt es nämlich, die Richtung der Mehrheit der in sich asymmetrischen Prozesse dem ganzen Netz zuzuschreiben. Dann kann man die Richtung des Netzes einfach auf alle in ihm enthaltenen und in sich symmetrischen Kausalbeziehungen übertragen. Die Konstruktion eines kausalen Netzes erlaubt es der Transfer-Theorie, den Einwand (vgl. Dieks 1986, 95; Dowe 1992b, 181; Sosa/Tooley 1993, 3f.) zurückzuweisen, sie mache eine kausale Theorie der Zeit unmöglich. Sie kann einerseits daran festhalten, daß die Asymmetrie nicht zum Begriff der Kausalität selbst gehört. Dies ist in der Tat eine der zentralen Einsichten, die die Theorie möglich macht. So wie der Begriff der Übertragung in ihr verstanden wird, ist die Beziehung zwischen den beiden Ereignissen, zwischen denen die Übertragung stattfindet, vollständig symmetrisch. Sie kann deshalb die Asymmetrie einer bestimmten spezifischen Gruppe von Kausalverbindungen als eine kontingente Eigenschaft auffassen, die von ihrer physikalischen Eigenart herrührt. Andererseits, und das erlaubt es schließlich, den in Frage stehenden Einwand zurückzuweisen, gelingt es ihr, den anderen, das heißt in sich selbst symmetrischen Prozessen, einen asymmetrischen Charakter zuzuschreiben, ohne dabei auf die Asymmetrie der Zeit zurückgreifen zu müssen. Sie tut das, indem sie statt dessen auf die Asymmetrie des kausalen Netzes zurückgreift, die ihrerseits ebenfalls auf der Präsenz von intrinsisch asymmetrischen Prozessen beruht, deren Mehrheit in dieselbe Richtung ablaufen. Im Sinn einer kausalen Theorie der Zeit kann die „Richtung der Zeit" mit der Richtung des kausalen Netzes identifiziert werden. In diesem Rahmen hat die Zeit selbst als Dimension keine Richtung, sondern ist ebenso isotrop wie der Raum (vgl. Horwich 1987). Es ist korrekter, statt von der Richtung der Zeit, von der Richtung der Vorgänge, die in der Zeit ablaufen, zu sprechen. Es genügt natürlich auch, die geläufige Sprechweise auf die dargestellte Weise neu zu interpretieren, ohne sie gleich eliminieren zu müssen.
Ein weitverbreitetes Argument gegen die Akzeptabilität einer TransferTheorie beruht auf der Behauptung, diese schlösse die Möglichkeit rückwärtsgerichteter Kausalität aus (vgl. Ehring 1986, 255; Dowe 1992b, 181f.). Dieses Argument trifft aber nur solche Versionen der Theorie, die die Asymmetrie jeder einzelnen Kausalbeziehung direkt von der objektiven Zeitrichtung ableiten. Unter dieser Voraussetzung kann es allerdings wirklich per definitionem keine rückwärtsgerichtete Kausalität geben. Letzterer Begriff beinhaltet ja genau die Idee einer kausalen Beziehung, deren Richtung der der Zeit entgegenläuft, das heißt, in der die Ursache später stattfindet als die Wirkung.
Max Kistler: Zur Transfer-Theorie der Kausalität
409
Aber im Rahmen unserer auf dem Begriff des kausalen Netzes beruhenden Konzeption erscheint die Möglichkeit solcher rückwärts in der Zeit ablaufenden kausalen Prozesse nicht als paradox. Es könnte nämlich folgende Situation eintreten: In einer bestimmten Region der Welt läuft die große Mehrheit der irreversiblen, d. h. intrinsisch asymmetrischen, Prozesse in der gleichen Richtung ab. Das reicht aus, um dem ganzen Netz in diesem Gebiet eine Vorzugsrichtung zu geben, die man dann auch als die „positive Zeitrichtung" auffassen kann. Wenn es aber in demselben Netz auch solche Prozesse gibt, die einerseits intrinsisch asymmetrisch sind und die andererseits in die andere Richtung verlaufen, dann kann man von ihnen sagen, ihre Kausalrichtung sei „rückwärtsgerichtet", d. h. laufe der Haupt-Zeitrichtung entgegen. Ein solcher Fall könnte zum Beispiel dann eintreten, wenn das betreffende Gebiet der Welt thermodynamische Systeme enthält, in denen sich die Entropie spontan verringert (ohne daß dies auf einer entsprechenden Entropievermehrung der mit dem System in Kontakt stehenden Umgebung beruht). Kann unsere Theorie der Tatsache Rechnung tragen, daß man wahrheitsgemäß behaupten kann, ein Eiswürfel, der im Wasser schwimmt, kühle das ihn umgebende Wasser ab (vgl. Aronson 1971b, 425)? Diese Aussage drückt nur scheinbar ein Kausalurteil aus.9 Die in dem beschriebenen Vorgang ausgetauschte Energie fließt vom Wasser zum Eis. Daher berechtigt unsere Analyse zu dem Schluß, daß die umgekehrte Aussage, nämlich daß das Wasser die Erwärmung des Eiswürfels bewirkt, die einzige ist, die die Richtung von Ursache zu Wirkung korrekt widerspiegelt. Das erste Urteil ist trotzdem eine gültige Erklärung, nur ist es eine solche, in der die Richtung der Erklärung nicht mit der Richtung der Kausalität übereinstimmt. Man kann durchaus die Tatsache, daß sich das Wasser abkühlt, mit der Tatsache, daß sich der Eiswürfel erwärmt, erklären. Es handelt sich dabei aber nicht um eine kausale Erklärung in dem Sinn, daß darin das Explanans nicht die Ursache benennt und das Explanandum nicht die Wirkung. Sobald man versucht, es als Kausalurteil zu verstehen oder umzuformulieren, wird es falsch: Die Erwärmung des Eiswürfels bewirkt eben nicht die Abkühlung des Wassers.
9
Fair (1979, 243) kommt aufgrund der Analyse dieses Beispiels zu dem Schluß, daß der Unterschied zwischen Ursache und Wirkung keine objektive Tatsache ist, sondern von der Perspektive des Betrachters abhängt.
410
Section 3: Philosophy of Science
2.
Die Unterscheidung von kausalen Prozessen und Pseudo-Prozessen
Salmon charakterisiert kausale Prozesse durch ihre Fähigkeit, Kennzeichen übertragen zu können (Salmon 1984; vgl. Reichenbach 1928; 1956). Ich möchte nun zeigen, daß die Transfer-Theorie in diesem Zusammenhang einen Vorsprung an Erklärungskraft gegenüber den von Salmon u n d Dowe vertretenen Theorien besitzt (Dowe 1992a; 1992b). In Salmons Theorie erscheint die Eigenschaft kausaler Prozesse, Kennzeichen übertragen zu können, einfach als Teil ihrer Definition. Indem die Theorie ihnen diese Eigenschaft per Stipulation zuschreibt, ist die Möglichkeit, ihre Grundlage zu erklären, von vorneherein ausgeschlossen. Die Transfer-Theorie erlaubt genau das, und zwar auf die folgende Weise: 10 In der Transfer-Theorie ist die fundamentale Kategorie das Ereignis. Ein Kennzeichen ist dann eine Eigenschaft eines Ereignisses, genauer gesagt einer ganzen Serie von Ereignissen. Falls das Kennzeichen die Manifestation einer Erhaltungsgröße ist, kann sie auf andere Ereignisse innerhalb einer Weltlinie übertragen werden. Eine Weltlinie ist dabei als (räumlich und zeitlich) lückenlose Kette von Ereignissen definiert. Ein akustisches Signal besteht zum Beispiel typischerweise entweder in einem Schallwellenpaket oder in einer lokalen Modifikation einer kontinuierlichen Schallwelle. Beide stellen Manifestationen von Energie dar. Die Eigenschaft, die das Signal ausmacht, kann übertragen werden, weil die zugrundeliegende Erhaltungsgröße, nämlich die Energie, übertragen werden kann. Die Übertragung eines Kennzeichens erscheint folglich in diesem Rahmen als ein Spezialfall der Übertragung einer Menge einer Erhaltungsgröße. Ein besonders wichtiger Fall ist die „kausale Linie" (Russell 1948), auf der die „Genidentität" der physikalischen Gegenstände beruht. Ein Gegenstand besteht über die Zeit hinweg, weil die Kettenglieder der Ereignisse, aus denen er besteht, untereinander per Übertragung kausal verbunden sind. M a n kann also sagen, daß ein Gegenstand aus seinen zeitlichen Abschnitten besteht, bzw. daß er von diesen konstituiert wird. Nach Dowe ist ein Kausalprozeß eine „Weltlinie eines Gegenstands, die eine Erhaltungsgröße manifestiert" (Dowe 1992a, 210; 1992b, 184). N u n ist aber der Begriff der Manifestation zu schwach, um die Unterscheidung zwischen Prozeß und Pseudo-Prozeß zu rechtfertigen. Der Grund, warum Dowe auf den Begriff der Manifestation ausweicht, ist, daß er die Idee der diachronischen Identität von Mengen von Erhaltungsgrößen für unvertretbar hält.
10
Es handelt sich also um die „analytische" Erklärung einer Eigenschaft, in C u m m i n s ' (1983) Sinn.
Max Kistler: Zur Transfer-Theorie der Kausalität
411
Aber Dowes Voraussetzungen machen den Pseudo-Prozeß par excellence, nämlich die Bewegung des von einer zentralen Lichtquelle auf eine Zylinderwand projizierten Lichtflecks (vgl. Salmon 1984, I4lff.), zum Kausalprozeß. Es handelt sich erstens um eine Weltlinie, das heißt eine zeitlich und räumlich lückenlose Kette von Ereignissen. Das ist eine unabkömmliche Voraussetzung für einen Pseudo-Prozeß: Er muß ja den Anschein erwecken, kausal zu sein. Hätte er Lücken, würde dieser Anschein nicht entstehen. Zweitens dürfen wir dem Ausdruck „Gegenstand" (object) in Dowes Definition nicht dessen Standardbedeutung geben, weil Dowe die diachronische Identität von Erhaltungsgrößen, und damit auch die der aus diesen bestehenden Gegenständen ablehnt. In dem dieser Auffassung entsprechend schwachen Sinn kann man dann auch den Lichtpunkt, der die Wand entlangläuft, als „Gegenstand" bezeichnen. Drittens manifestieren alle Ereignisse, die durch das Erscheinen des Lichtpunkts auf der Wand zu einem bestimmten Zeitpunkt konstituiert sind, die gleiche Menge und Art von Energie. Demzufolge impliziert Dowes Reduktion, daß der Pseudo-Prozeß des Erscheinens des Lichtpunkts auf der Zylinderwand letztlich doch kausal ist. Diese Schlußfolgerung ist geeignet, Dowes Vorschlag den Boden zu entziehen.
3.
Zusammenfassung
Meine Darlegung zielt darauf ab, die Transfer-Theorie der Kausalität als einen vielversprechenden Versuch einer objektiven Reduktion der Kausalbeziehung zu verteidigen. Der erste Teil soll belegen, daß es ein Vorteil der Transfer-Theorie ist, daß sie die Asymmetrie der Kausalbeziehung nicht als Bestandteil des Begriffs der Kausalität auffaßt. Die Asymmetrie der Kausalbeziehungen in der realen Welt erscheint in ihr vielmehr als Folge der kontingenten Tatsache, daß es intrinsisch asymmetrische (nämlich irreversible) Vorgänge gibt. Dadurch wird es möglich, der ausgezeichneten Richtung (in) der Zeit dieselbe Grundlage zuzuschreiben wie der Asymmetrie der Kausalität, nämlich die Existenz der irreversiblen Prozesse. Die Transfer-Theorie ist also mit einer kausalen Theorie der Zeit nicht unvereinbar. Außerdem haben wir gesehen, daß die Transfer-Theorie die Möglichkeit rückwärtsgerichteter Kausalität nicht ausschließt, sondern im Gegenteil dazu beitragen kann, diesen Begriff zu präzisieren. In einem zweiten Teil habe ich versucht zu zeigen, daß die TransferTheorie bei der Erklärung des Unterschieds zwischen Prozessen und PseudoProzessen besser abschneidet als zwei alternative Theorien: zum einen die von
412
Section 3: Philosophy of Science
Salmon, in der die Fähigkeit der Kausalprozesse, Kennzeichen übertragen zu können, als Teil ihrer Definition einfach postuliert wird, zum anderen die von Dowe, die die Annahme einer diachronischen Identität von Mengen von Erhaltungsgrößen ablehnt. Die Transfer-Theorie kann nämlich zum einen erklären, warum ein kausaler Prozeß Kennzeichen übertragen kann, ein Pseudo-Prozeß aber nicht. Z u m anderen kommt nur die Transfer-Theorie in dem Fall des von Salmon konstruierten Pseudo-Prozesses zum richtigen Ergebnis, während die Theorie von Dowe diesen als kausal einstufen muß.
4.
Literatur
J. (1971A): On the Grammar of'Cause'. Synthese 22 (1971). (1971B): The Legacy of Hume's Analysis of Causation. Stud. Hist. Phil. Sei. 2 (1971). A R O N S O N , J E R R O L D J . : Unentangling Ontology from Epistemology in Causation. Erkenntnis 1 8 ( 1 9 8 2 ) . C U M M I N S , R O B E R T : The Nature ofPsychological Explanation, Cambridge, Mass. 1983. D O W E , P H I L ( 1 9 9 2 A ) : Wesley Salmon's Process Theory of Causality and the Conserved Quantity Theory. Phil, ofScience 5 9 ( 1 9 9 2 ) . D O W E , P H I L (1992B): Process Causality and Asymmetry. Erkenntnis 37 (1992). D I E K S , D . : Physics and the Direction of Causation. Erkenntnis 25 (1986). E H R I N G , D.: The Transference Theory of Causation. Synthese 67 (1986). F A I R , D A V I D : Causation and the Flow of Energy. Erkenntnis 1 4 ( 1 9 7 9 ) . G R Ü N B A U M , A D O L F : Philosophical Problems ofSpace and Time, Dordrecht 1 9 7 3 . H O R W I C H , P A U L : Asymmetries in Time, Cambridge, Mass. 1987. H U M E , D A V I D : A Treatise ofHuman Nature, ed. L. A. Selby-Bigge, Oxford 1978. L E E , T . / O E H M E , R E I N H A R D / Y A N G , C. N . : Remarks on Possible Noninvariance under Time Reversal and Charge Conjugation. Physical Review 106 (1957). M A C K I E , J. L.: The Cement of the Universe, Oxford 1974. Q U I N E , W I L L A R D V A N O R M A N : The Roots of Reference, LaSalle, 111. 1973. Q U I N E , W I L L A R D V A N O R M A N : Events and Reification. In: Actions and Events: Perspectives on the Philosophy of Donald Davidson, eds. Ernest LePore/Brian McLaughlin, Oxford 1985. R E I C H E N B A C H , H A N S : Philosophie der Raum-Zeit-Lehre, Berlin 1928. R E I C H E N B A C H , H A N S : The Direction of Time, Berkeley 1956. R U S S E L L , B E R T R A N D : OntheNotionofCause(1912). In: Mysticism and Logic, London 1986. R U S S E L L , B E R T R A N D : Human Knowledge: Its Scope and Limits ( 1 9 4 8 ) , London 1 9 6 6 . S A C H S , R . : The Physics of Time Reversal, Chicago 1987. S A L M O N , W E S L E Y : Scientific Explanation and the Causal Structure of the World, Princeton 1984. ARONSON, JERROLD
ARONSON, JERROLD J .
5
Max Kistler: Zur Transfer-Theorie der Kausalität
4 1 3
Introduction. In: Causation, eds. Ernest Sosa/ Michael Tooley, Oxford 1993. T O O L E Y , M I C H A E L : Causation, Oxford 1 9 8 7 . SOSA, E R N E S T / T O O L E Y , M I C H A E L :
BERNHARD LAUTH
c-Komplexität und exakte Identifikation
Lerntheoretische Untersuchungen haben in den letzten Jahren eine Reihe von interessanten neuen Einsichten über die Rolle von Komplexitätsproblemen bei induktiven Methoden ergeben. Die meisten Resultate besitzen jedoch einen (mehr oder weniger) eingeschränkten Anwendungsbereich, d. h., sie gelten nur für bestimmte Anwendungen, Lernziele oder Lernverfahren. Ein universelles (anwendungsunabhängiges) Komplexitätsmaß ist neuerdings von Kevin Kelly angegeben worden, nämlich die sogenannte Borel-Komplexität. Kelly hat gezeigt, daß eine Hypothese h genau dann im Limes entscheidbar ist, wenn die zugehörigen „Datenumgebungen" eine Δ2-Menge bilden (in der endlichen Borel-Hierarchie).1 Der Beweis beruht auf Techniken, die von Mark Gold und Hilary Putnam (zur Untersuchung von limes-rekursiven Prädikaten und Funktionen) entwickelt worden sind.2 Die Position in der endlichen Borel-Hierarchie ist (ähnlich wie andere Komplexitätsmaße, die in der Literatur diskutiert worden sind 3 ) ein AprioriMaß für die Komplexität einer Hypothese, weil die Komplexität nicht vom Lernprozeß selbst abhängig ist, also im Laufe der Zeit immer denselben Wert besitzt. Ich möchte hier nun eine andere Art von Komplexitätsmaßen vorschlagen, die ich als Aposteriori-Maße bezeichne, weil die Komplexität in diesem Fall eine Variable der Zeit ist (d. h., die Komplexität hängt ab von den Daten, die dem lernenden System zu einem bestimmten Zeitpunkt zur Verfügung stehen). Ein interessanter Aspekt dieser Betrachtungsweise ist, daß man eine präzise und allgemeine lerntheoretische Begründung für das „Ockhamsche Rasiermesser" erhält, d. h., für das methodologische Prinzip, immer die einfachste Hypothese zu wählen, die mit den jeweiligen Daten übereinstimmt. Zu diesem Zweck möchte ich an das Modell von Kelly in einer von mir leicht modifizierten Version anknüpfen. Grundlegend ist die folgende
1
Vgl. Kelly 1995.
2
Vgl. Putnam 1965; G o l d 1965.
3
Vgl. z . B . G o l d 1967; B l u m / B l u m 1975; Kelly/Glymour 1989; 1990; Lauth 1993; 1994; 1995.
Bernhard Lauth: c-Komplexität und exakte Identifikation
415
DefinitionEin Lernmodell ist ein Tripel s — (H, E, C), wobei Η ein topologischer Raum ist und C eine Abbildung C : Η —• Ρο( ω £). s heißt schwach separierbar, wenn C(h) Π C(h') = 0 fiir alle Hypothesen h φ y aus Η gilt. Die erste Komponente ( Η ) ist der Hypothesenraum des Modells. Intuitiv betrachten wir Η als eine Menge von konkurrierenden Hypothesen zusammen mit einer Metrik oder Topologie, mit deren Hilfe ein Konvergenzbegriff für Hypothesenfolgen definiert werden kann. Die zweite Komponente (Ε) ist der Datenraum des Modells. Der Lernprozeß wird in eine diskrete Folge t = 0,1, • •·,«, ·•• von Zeitintervallen unterteilt. Zu jedem Zeitpunkt erhält das System eine endliche Folge von Daten eo,e\,...,en,... (mit e,· e Ε für alle i = 0 , 1 , . . . ) , und m u ß versuchen, anhand dieser Informationen die richtige Hypothese zu „erraten" . Der Zusammenhang zwischen Hypothesen und Daten wird im Modell durch die dritte Komponente C hergestellt. Intuitiv repräsentiert C(h) die Gesamtheit aller Datenfolgen e = (eo, e\,..., e„,...), die mit der Hypothese h verträglich sind. Anknüpfend an einen etablierten Sprachgebrauch bezeichne ich die Elemente von C(h) auch als Datenumgebungen oder kurz: als Umgebungen für h. Ein Lernmodell heißt schwach separierbar, wenn die Datenumgebungen für konkurrierende Hypothesen disjunkt sind, d. h. wenn C{h) Π C(h') = 0 für alle h ψ h' gilt. Ich verwende die Buchstaben e, e',... als Variablen für Datenfolgen, d. h., e hat die Form e = (eo, e\,..., e„,...), wobei alle e, Elemente aus dem Datenraum sind. Das endliche Anfangssegment der Länge η sei e[n] — (eo,..., e„- \). Die Menge aller endlichen Anfangssegmente ist S E Q ; = {e[n]/e e ωΕ, η e Ν}. Definition: Ein Lernverfahren oder eine Lernfunktion für s = (H,E, C) ist eine Abbildung φ : SEQ. H. Seien eo, • •., e„-\ die Daten, die dem System zur Zeit t — η zur Verfügung stehen. Dann ist h„ = φ(?ο, · · · , e n - \ ) die Hypothese des Systems zur Zeit t = n. Wir erhalten auf diese Weise zu jeder Datenfolge eo,e\,... eine entsprechende Folge ho,h\,... von Hypothesen, die von dem Lernverfahren generiert werden. Das Lernziel besteht darin, die zunächst unbekannte gültige Hypothese (nennen wir sie einmal h*) zu identifizieren: 4
Vgl. Lauth 1994.
416
Section 3: Philosophy of Science
Definition: φ identifiziert h* genau dann, wenn 1ϊπι„^0 Ν für alle Datenumgebungen d £ C(h') für eine Hypothese h' φ h c-Maß
c : C(H)
mir.e'[N]^e[N\.
Wir bezeichnen ein Lernmodell s als c-separierbar, wenn ein c-Maß fiir das Modell existiert. Ebenso bezeichnen wir den zugehörigen Hypothesenraum Η als c-separierbar, wenn aus dem Kontext hervorgeht, welches Lernmodell gemeint ist. Jedes c-Maß mit den angegebenen Eigenschaften induziert in eindeutiger Weise ein Aposteriori-Komplexitätsmaß für die Hypothesen des Modells. Ich bezeichne die induzierte Funktion wieder mit c, da keine Verwechslungen zu 7
c-Maße sind nicht mit Carnaps r-Funktionen zu verwechseln. Der Buchstabe c steht hier fiir c wie complexity und nicht fiir confirmation.
418
Section 3: Philosophy o f Science
befurchten sind: Das induzierte Maß ist eine zweistellige Funktion c : Η χ S E Q j —> Ν U {«=} mit folgenden Eigenschaften: Für jedes Datensegment σ e S E Q j der Länge η und jede Hypothese he c(b,a)
Η ist
= die kleinste ganze Zahl Ν > 0, so daß Be e C(h) : Ν — c(e) und
e[n] = σ, falls so ein Ν existiert, und c{h, σ) = Wir bezeichnen c(b,a)
sonst.
als die Aposteriori-Komplexität
der Hypothese h in be-
zug auf das Datensegment σ, weil der numerische Wert c(h, σ) nicht nur von h, sondern auch von den Daten σ abhängt. Man beachte, daß c(h, σ) genau dann den Wert °° annimmt, wenn die Hypothese mit den Daten inkonsistent ist, d. h., wenn keine Datenumgebung e e C(h) existiert, so daß σ mit einem endlichen Anfangssegment von e übereinstimmt. Im Folgenden sei Min(/?, σ. c) eine Abkürzung für die Behauptung ->Bh' 6 Η : c(h',a)
< c(b, σ), d. h., daß h
minimale Aposteriori-Komplexität in bezug auf σ und c besitzt. Dann gilt das folgende Theorem:
Η ist exakt identifizierbar
Η ist c-separierbar.
Beweis: ()
Angenommen, Η ist c-separierbar. Wir wählen ein Lernverfahren φ mit folgenden Eigenschaften: Zu jedem Datensegment σ G S E Q , sucht σ eine Hypothese h von minimaler Aposteriori-Komplexität, so daß gilt: Min( c(e). Demzufolge ist c(h\e[n]) > c(h,e[n]), also ist φ (e{n\) = h für alle n>N. Sei umgekehrt φ ein Lernverfahren, das alle Hypothesen aus Η exakt identifiziert. Dann können wir ein Komplexitätsmaß c — ί·φ so konstruieren, daß für jede Datenfolge e e C(h) und alle h & Η gilt: c(e) = das kleinste A^ > 0 mit cp(f[»]) = h für alle η > N.So ein Ν existiert nach Voraussetzung ( Η ist exakt identifizierbar). Es ist leicht zu sehen, daß c = Γφ alle Eigenschaften von c-Maßen besitzt. Denn angenommen, e' G C(h') ist eine Datenumgebung für eine Hypothese h' φ h, die auf dem Anfangssegment der Länge Ν mit e koinzidiert, d. h., f'[7V] = f[7V], wobei Ν = c{e) ist. Da = = h ist, kann φ in e' erst zu einem späteren Zeitpunkt zu h' konvergieren, d. h., das kleinste TV' > 0 mit N' muß größer als Ν sein. Folglich ist c(e') > Ν = c(e).
Bernhard Lauth: c-Komplexität und exakte Identifikation
419
Der Beweis des Theorems macht deutlich, in welchem Sinne es sich bei den Funktionen c(e) um Komplexitätsmaße handelt: Sei nämlich e e C{h) eine Umgebung für h. Dann gibt der Wert c(e) eine obere Schranke für die Anzahl der Daten eo, e\,..., die erforderlich sind, um die Hypothese h zu identifizieren: Je komplexer eine Umgebung, desto mehr Daten sind erforderlich, um die korrekte Hypothese zu finden. Sei nun φ irgendein Lernverfahren mit den gewünschten Konvergenzeigenschaften und e e C(h). Mit TV? bezeichnen wir die kleinste ganze Zahl TV > 0, so daß o(e[n]) — h für alle η > N, falls so ein Ν existiert. Andernfalls sei N ? = Aus dem ersten Teil des Beweises des obigen Theorems folgt unmittelbar das folgende Korollar:
Für jedes Komplexitätsmaß c gibt es ein Lernverfahren φ, so daß Nf > c(e) für alle Datenumgebungen e £ C(H) gilt. •
Der Beweis des Theorems gibt aber nicht nur eine notwendige und hinreichende Bedingung fur die Existenz von Lernverfahren mit den gewünschten Konvergenzeigenschaften, sondern auch eine einfache Anleitung, wie solche Verfahren zu konstruieren sind, nämlich nach dem Prinzip der minimalen Komplexität: Wir konstruieren ein Lernverfahren, das zu jedem Datensegment eine Hypothese von minimaler Aposteriori-Komplexität wählt. Der Beweis zeigt, daß ein solches Verfahren die gewünschten Eigenschaften besitzt. Ich bezeichne Lernverfahren dieser Art als Ockham-Funktionen in bezug auf das zugrundeliegende Komplexitätsmaß c.8 Der erste Teil des Beweises zeigt, daß eine Ockham-Funktion im Limes alle Hypothesen identifiziert, also die gewünschten Konvergenzeigenschaften besitzt. Umgekehrt zeigt der zweite Teil des Beweises, daß man ausgehend von einem Lernverfahren mit den entsprechenden Konvergenzeigenschaften immer ein Komplexitätsmaß c finden kann, in bezug auf welches das Verfahren eine Ockham-Funktion darstellt. Daraus ergibt sich das folgende Korollar:
Η ist exakt identifizierbar durch ein Lernverfahren φ es gibt ein Komplexitätsmaß c, so daß gilt: φ ist eine Ockham-Funktion in bezug auf c. •
Literatur Toward a Mathematical Theory of Inductive Inference. Information and Control 28 (1975), 125-155.
BLUM, LENORE/BLUM, MANUEL:
8
D. h., φ ist eine Ockham-Funktion fur das Komplexitätsmaß c, wenn für alle Datenfolgen e e C{H) und alle Werte η > c{e) gilt: Μϊη(φ(ί[»],ί[»],ί·).
420
Section 3: Philosophy o f Science K . : Learnability and the Vapnik-Chervonenkis-Dimension. Journal of the ACM 36 (1989), 9 2 9 965. E . M A R K : Limiting Recursion. Journal of Symbolic Logic 3 0 ( 1 9 6 5 ) , 2 7 - 4 8 . E . M A R K : Language Identification in the Limit. Information and Control 1 0
BLUMER, Α./EHRENFEUCHT, A./HAUSSLER, D . / W A R M U T H , Μ .
GOLD, GOLD,
(1967),
447-474.
The Logic of Reliable Inquiry, forthcoming (1995). Convergence to the Truth and Nothing but the Truth. Philosophy of Science 56 (1989). K E L L Y , K E V I N / G L Y M O U R , C L A R K : Theory Discovery from Data with Mixed Quantifiers. Journal of Philosophical Logic 19 (1990), 1-33. K E L L Y , K E V I N / G L Y M O U R , C L A R K : Inductive Inference from Theory Laden Data. Journal of Philosophical Logic 21 (1992), 391-444. L A U T H , B E R N H A R D : Inductive Inference in the Limit for First Order Sentences. Studia Logica 52 (1993), 491-517. L A U T H , B E R N H A R D : An Abstract Model for Inductive Inference. Erkenntnis 4 0 ( 1 9 9 4 ) , KELLY, K E V I N :
KELLY, K E V I N / G L Y M O U R , C L A R K :
87-120.
Inductive Inference in the Limit of Empirically Adequate Theories. Journal of Philosophical Logic (1995). L A U T H , B E R N H A R D : Limiting Decidability and Probability. Erscheint in: Poznan Studies, Vol. ? (1995). OSHERSON, DANIEL N . / S T O B , MICHAEL/WEINSTEIN, SCOTT: Systems That Learn, Cambridge, Mass. 1986. O S H E R S O N , D A N I E L N . / W E I N S T E I N , S C O T T : Identification in the Limit of First Order Structures. Journal of Philosophical Logic 15 (1986), 55-81. O S H E R S O N , D A N I E L N . / W E I N S T E I N , S C O T T : Paradigms ofTruth Detection. Journal of Philosophical Logic 18 (1989), 1-42. P U T N A M , H I L A R Y : Trial and Error Predicates and a Solution to a Problem ofMostowski. Journal of Symbolic Logic 30 (1965), 49-57. S H A P I R O , E H U D Y.: Inductive Inference of Theories from Facts. Research Report 1 9 2 ( 1 9 8 1 ) , Department of Computer Science, Yale University. V A L I A N T , L E S L I E G.: A Theory of the Learnable. Communications of the ACM 27 (1984), 1134-1142. LAUTH, BERNHARD:
AGNIESZKA LEKKA-KOWALIK
Popper, Kuhn and Laudan on the Rationality of Science A Shared View*
1. 2. 3. 4. 5. 6.
Introduction Rationality in Poppers Falsificationism Paradigmatic Rationality in Kuhns Historicism The Reticulated Rationality of Larry Laudan Conclusions References
1.
Introduction
Rationality is an object of investigation in many domains - in psychology, sociology and decision theory. These disciplines, however, investigate how human rationality manifests itself in this or that situation. Any attempt to answer such a question presupposes that we understand what rationality is. Do we? Until the 1930s, philosophy seemed to have provided us with a satisfactory account of rationality. This, the so-called positivist view, held rationality to be that faculty of human reason which allows people to discover methods for achieving ends. Such methods are held to be intersubjective: any person should follow them, if she is to be rational. Thus, in a sense rationality was seen as embodied in methods. And until the 1930s there was no doubt as to where rationality had found its fullest realization: in the 'positive' sciences which are to provide us with a true world-view. To discover the scientific method was at once to discover the essence of rationality, since stating scientific rules amounted to stating the criteria of rationality as such. The challenge to this view came from two sides - first, from the philosophy of science itself. Popper attempted to prove that science indeed possesses the method, but that this method by no means leads to a true world view; at best, it leads to a world view which has relatively a better chance to be true than its predecessors. Thus, rationality does not consist in possessing the method of achieving a goal but only in the method of ever more closely approaching it. Kuhns later attempt to restore the attainability of scientific * This article was prepared as a part of the project "Ethical Dimensions of Science and Technology", supported by the Swiss National Foundation (FN 1114-037634.93).
422
Section 3: Philosophy of Science
goals came at a high price: in Kuhns view, science consists of separate traditions with their own methods and goals. Hence, if scientific methods provide criteria of rationality, each tradition has its own rationality. The second challenge came from anthropology and sociology. T h e most quoted case is Evans-Prichard's study of witchcraft among the Azande; on its basis Winch (1964) argued that we cannot condemn Azande beliefs as irrational, even if they seem to be such from the point of view of our Western scientific standards of rationality. The general conclusion drawn from anthropological studies was: there is no one rationality, there are only rationalities relative to time, culture and society. It seems, however, that conclusions of this sort are based on the presupposition that the essence of rationality is given by its criteria; and criteria are specified by methodological rules for achieving one's goal. I would like to challenge the above presupposition and make an attempt to answer anew the question of the essence of rationality. In order to restrict the scope of our investigation, let us presuppose that one of these rationalities is the rationality of science. I suggest that we analyze the predicate 'is rational', before we ask what rationality is. This starting-point allows us to distinguish three questions: (a) Of what beings can one predicate 'is rational'? (b) What is meant by 'is rational'? (c) What are the criteria of predication? In my paper I shall follow an indirect strategy of considering rationality through already existing philosophies of science, namely those of Popper, Kuhn and Laudan which are commonly recognized as the major competitors for an adequate explanation of scientific rationality. I shall investigate only the second question, i. e. how these three authors understand the predicate 'is rational'. I presuppose that an understanding of this predicate shall allow us to gain insight into what rationality as such consists in. Here I shall defend two claims: (a) Popper, Kuhn and Laudan share the same view concerning the meaning of the predicate 'is rational'. (b) Behind their agreement stands an important insight into the nature of rationality as such.
Α. Lekka-Kowalik: Popper, Kuhn and Laudan on the Rationality of Science
2.
423
Rationality in Popper's Falsificationism
Popper claims: "There is only one element of rationality in our attempts to know the world: it is the critical examination of our theories" (Popper 1972). For him the scientific tradition is a rational tradition precisely because science is developed through critical discussion: "I equate the rational attitude and the critical attitude" (Popper 1968, 16). Popper's main examples of critical discussion originate in scientific debates on the merits of alternative theories. He formulates two conditions for participating in a discussion: (a) a commitment to truth as the goal of science, and (b) some shared background considered as certain at the time of a discussion. Popper's later writings dismiss the second condition as "the myth of the framework" (Popper 1987). There is a kernel of truth in Popper's criticism. The so-called framework does not need to constitute any kind of unity or even to be stable (Shapere 1989, 43If.). Popper is also right that a discussion can be fruitful without any shared background; it may clarify, explain, show points of disagreement. Yet, Popper's own theory sees critical discussion as serving the evaluation of competing theories; how could scientists evaluate theories in the absence of some minimum agreement, as perhaps on the validity of experimental results? It seems then that we need the second condition after all. Let us see how scientific discussion is carried out. In the evaluation of a single hypothesis we face the following situation: a given hypothesis is claimed to solve adequately a scientific problem. Scientists try to overthrow this claim, to find arguments, or reasons supporting the metathesis: 'The claim: "this hypothesis constitutes an adequate solution of a problem" is false'. For Popper scientists, giving invalidity of induction, can debate only falsity of hypotheses. While no arguments can justify the claim "this hypothesis is true", there may be compelling arguments, involving application of the logical rule of modus tollens, supporting the claim "this hypothesis is false". Of course, logic leads to the conclusion that the negation of a falsified hypothesis is true. This inference, however, does not constitute a scientific result. Science aims at explanatory hypotheses; according to Popper, the negation of an explanatory hypothesis is not itself an explanatory hypothesis. In the case of choosing the best theory among those which withstood falsification scientists must try to justify the claim that "a theory Τ is the best we have". Again, discussion consists in providing reasons or arguments in favor of a certain hypothesis. Popper explicitly expresses this idea, in proposing his solution to the Humean problem of induction. According to Hume, we are
424
Section 3: Philosophy of Science
prone to reason irrationally because we cannot justify truth of our theories. Popper insists that we can act rationally because we have good reasons — "not of course good reasons for believing [our theories] to be true, but for believing them to be the best available from the point of view of a search for truth or verisimilitude" (Popper 1979, 95).
For Popper a scientific discussion should give a univocal result. Scientists make choices, which are expressed in evaluative judgements such as: "this theory is to be rejected" or "this is the best theory among rivals". Rationality of those judgements consists in the fact that scientists presented arguments in their favor. Of course, not all arguments are acceptable, only those which appeal to a common background of accepted knowledge, i. e. are somehow appropriate in science. Popper describes also a second element in the rational attitude as manifested in critical discussion: only a formulated theory makes criticism possible (Popper 1979, 31). And even more specifically, "the search for truth is only possible if we speak clearly and simply and avoid unnecessary technicalities and complications" (Popper 1979, 44). In other words, discussing a judgement with our interlocutors requires arguments expressed in an intersubjectively acceptable language. For Popper, the critical attitude manifested in scientific debate "is the highest form so far of the rational attitude, or of rationality" (Popper 1979, 247). Thus, within falsificationism the predicate 'is rational' as applied to a result of scientific debate means: interlocutors formulate a judgement in an intersubjectively acceptable language and provide each other with arguments, which are accepted in a given domain, for or against this judgement.
3.
Paradigmatic Rationality in Kuhn's Historicism
Kuhn is commonly objected as an advocate of relativism and irrationalism in science. Kuhn himself rejects such objections as misunderstandings. Let us see whether he is right. Since the basic concept of Kuhn's philosophy: paradigm, is notoriously ambiguous let me first introduce a piece of terminology. Taking into account Kuhn's later explanations (Kuhn 1977), the term 'paradigms' in its general sense should be understood as a net of shared commitments concerning: (a) the understanding of symbolic generalizations; (b) the metaphysical structure of the world: how entities look, what types of interaction we might expect, etc.
Α. Lekka-Kowalik: Popper, Kuhn and Laudan on the Rationality of Science
425
(c) the acceptance of certain values as features of a good theory, such as accuracy, consistency, simplicity, etc. Kuhn calls this net of commitments a disciplinary matrix'. I employ this concept in further analysis. Kuhns treatment of choice among competing disciplinary matrices, as much as Popper's treatment of choice among competing theories, is a crucial point in his thought on rationality. Kuhn claims: "The competition between paradigms is not the sort of battle that can be resolved by proofs" (Kuhn 1970, 148). And again: "There is no neutral algorithm for theory-choice, no systematic decision procedure which properly applied, must lead individuals in the group to the same decision" (Kuhn 1970,200). Changes of disciplinary matrices resembles conversion rather than compelling reasoning. Prima facie, these statements seem like advertisements for irrationality. Kuhn, however, explains: granted, logical proofs and experiments do not suffice to dictate uniform choices. Yet "to say that, in matters of theorychoice, the force of logic and observation cannot in principle be compelling is neither to discard logic and observation nor to suggest that there are no good reasons for favouring one theory over another" (Kuhn 1977, 234). By 'conversion' Kuhn means that, since there is no algorithm which can give an absolutely certain result, scientists must leap into a disciplinary matrix and start working within its rules. That we cannot prove the absolute superiority of a given matrix, Kuhn argues, does not glorify irrationality in science. There must be a basis for faith in the matrix chosen, a basis constituted by reasons or arguments. Yet, since "there is no single argument that can or should persuade them all" (Kuhn 1970, 158) scientists arguing in favor of different decisions can disagree without collapsing into irrationality. For Kuhn, then, the predicate 'is rational' means 'is based on reasons'. This is also Popper's understanding of the predicate 'is rational'; Popper sees critical discussion as the perfect instantiation of rationality precisely because arguments for and against theses are provided and disputed. Closer analysis shows that Kuhn and Popper also agree on the significance of arguments. According to Kuhn, any debate on disciplinary matrices addresses the question which matrix should guide scientific research in the future. Its various merits, like consistency, fruitfulness, etc. argue in its favor. A scientist who advocates a given matrix argues that it can really fulfil the aim of guiding research, and do so better than its rivals. Popper's reasoning exhibits the same structure: a given choice is rational insofar as arguments indicate that this choice picked out the 'right' theory, that is this theory which fulfils the aim of science - providing an explanation of a natural phenomenon - and does it better than its rivals.
426
Section 3: Philosophy of Science
Popper highlights another element in the definition of'is rational': the appropriate articulation of claims and arguments. Kuhn shares this intuition; indeed, it is much more important for Kuhn than it was for Popper. Kuhn insists that each disciplinary matrix has its own language, only partially translatable into languages of other matrices. At times, Kuhn talks as if discussion among adherents of different disciplinary matrices were impossible; where the meaning of the terms is determined by a matrix, communication across matrices is inevitably broken. Elsewhere, however, Kuhn allows for at least partial translation, appealing to common 'technical results' in explaining the meaning of a term. Nevertheless, whatever the worth of Kuhns restrictions on communication is, he rightly stresses the importance of articulation; for argumentation we need mutually comprehensible language. In short, for the choice of a disciplinary matrix, Kuhn accepts the same definition of 'is rational' as does Popper. Kuhn also poses two other conditions on rational debate which Popper mentioned: a shared goal and a common background. Scientists discuss, precisely because they ascribe the same goal - guiding research - to a disciplinary matrix. Suppose two matrices are in dispute among scientists; where one scientist seeks the best matrix for solving problems, and another for giving scientists more fun, their matrices do not properly compete; one could easily accept both, as suiting their respective purposes. Since Kuhn emphasizes the importance of disciplinary matrices, the common background condition is even more decisive for him than for Popper. For Kuhn full understanding of claims and arguments is possible only within the same matrix; only the practitioners of one matrix will share relevant methodological principles, factual statements and goals on which argumentation is to be based.
4.
The Reticulated Rationality of Larry Laudan
Also for Larry Laudan, debate is the embodiment of scientific rationality. For Laudan, science is a reticulated structure of mutually dependent factual claims, methodological rules and epistemic goals which are connected in such a way that: (a) methods justify theories and theories put constraints on methods available; (b) aims justify methods and methods exhibit realizability of aims; (c) theories and aims must harmonize.
Α. Lekka-Kowalik: Popper, Kuhn and Laudan on the Rationality of Science
427
According to Laudan neither theories, nor methods, nor even goals of scientific inquiry are immutable and scientific debates center around changes in these elements. In effect, this extends the problem of theory- or matrix-choice to other elements of science. Like Kuhn and unlike Popper, Laudan expects no univocal results from scientific debate. While scientists may come to agree, they may also be forced to accept differences of opinion. A theory founded in scientific debate must explain rationality of an individual choice, as well as both agreement and disagreement with the choices of others. But what does Laudan mean by the predicate 'is rational'? Kuhn argues that individual scientists might differ as to the weight they ascribe to confirming or falsifying instances. In response Laudan claims: "the rational assignment of any particular degree of probative significance to a problem must rest on one's being able to show that there are viable methodological and epistemic grounds for assigning that degree of importance rather than another" (Laudan 1984, 99).
In other words, scientists may evaluate problems differently, so long as they provide epistemic grounds for their decisions. Replace the word 'grounds' with 'reasons' or 'arguments' and one arrives at the understanding of rationality shared by Popper and Kuhn: the predicate 'is rational' as applied to a scientist's decision, means that 'epistemic arguments are provided in its favor'. Laudan's own writings justify this substitution; he explicitly claims: "At its core, rationality consists in doing (or believing) things because we have good reasons for doing so" (Laudan 1977, 123). Let us note also another point of agreement among the three philosophers. For Popper and Kuhn science is a teleological structure. For Laudan, too, science is teleological; in general goals of scientific inquiry, and particular aims of the structural elements are distinguished. Theories should solve problems and exemplify epistemic values chosen as goals of scientific investigation; methods should serve to construct such theories and show which cognitive values are realizable. Even a general goal of scientific inquiry has its own role in the reticulated model and serves to restrict a range of acceptable methods. Scientific debate concerns two questions: first, whether a proposed element fits the whole structure of science and is able to fulfil its aim; second, whether a new element fulfils its proper aim better than the existing one. That is, scientists are to make evaluative judgements which answer the above questions and to present arguments in their favor. No change in the elements of science, Laudan argues, can be absolute rational debate requires that some elements, some common background remain, to which participants can appeal in their argumentation. In this point
428
Section 3: Philosophy of Science
Laudan is in agreement with Popper and Kuhn, who also accept the existence of a common background as a condition of debate. The existence of a shared background does not however guarantee a univocal result of a debate. Scientists may differ in their opinions, Laudan claims, because of the underdetermination principle: the same method can be applied in pursuing different goals, the same theory can be reached by different methods, etc. Despite of these differences, Laudan agrees with Popper and Kuhn on one important point: the common background and arguments for scientific debate must belong to science as a structure. Not all shared convictions can form a background for scientific debate and not all arguments are permissible in such a debate. Laudan criticizes Kuhn as inconsistent in this respect since Kuhn at once trumpets epistemic values as arbiters of legitimacy in scientific choice and admits matrix-choice in objective and subjective factors. Popper and Kuhn add one more element to the definition of'is rational': an appropriate articulation of claims and arguments. Does Laudan assert this? Laudan never explicitly specifies proper articulation as constitutive to the essence of rationality; however, his conditions for rationality of possible scientific goals imply proper articulation. Laudan holds we can reject a suggested goal if its formulation is unclear or ambiguous. In science, however, arguments must not only be clear, they must also be expressed in scientific language. Laudan should accept this restriction: his own reticulated model of science requires argumentation to be based on various elements within science. This fact imposes scientific language on his model since we cannot appeal in our arguments to other elements of the edifice of science without using necessarily scientific language. From the above considerations we can see that Laudan understands 'is rational' much as did Popper and Kuhn: the predicate is 'rational' is applied to a scientist's judgement and it means that appropriate arguments are given in its favor. We noted also some other crucial points of agreement between these three authors. Thus, if Popper, Kuhn and Laudan ultimately differ in their understanding of scientific rationality, the difference between the three should lie in their respective understanding of what counts as 'appropriate arguments'.
5.
Conclusions
I suggest that for analyzing the problem of rationality we should distinguish the question of the essence of rationality from the question of its criteria. This allows us to discover that Popper, Kuhn and Laudan, who are usually seen as presenting three radically different views of scientific rationality, despite their
Α. Lekka-Kowalik: Popper, Kuhn and Laudan on the Rationality of Science
429
different understanding of science, all share the same insight regarding the essence of rationality. To sum up this insight: (a) Scientific debates are the embodiment of scientific rationality; (b) There are two conditions of any debate: a shared goal and a c o m m o n background of knowledge both accepted as certain in the time of debate; (c) T h e essence of rationality, as given by this shared analysis of the predicate 'is rational' consists in the following: there exists a scientific debate providing: (i) an evaluative judgement to the effect that an element of science under dispute fulfills a certain goal in the whole structure of science and does it better than its rivals, and (ii) appropriate scientific arguments supporting this judgement. and both judgement and arguments alike are formulated in a language accepted in science. In short, the essence of rationality consists in articulation and argumentation for scientists' judgements. In its core this insight is in fact the classical philosophical conception of rationality, which we find already in Plato and Aristotle as well as a commonsense understanding thereof. T h e above understanding of the essence of rationality sees rationality as a kind of relation between a well-formulated judgement and well-formulated arguments (and maybe some other terms of this relation should be indicated). To develop this idea would require a separate analysis. We cannot, however, infer from the essence of rationality as described above any specific criteria of rationality in science. In this respect rationality exhibits a structure similar to truth as classically understood: the essence of truth consists in the relation of correspondence between a given proposition and a state of affairs. This says nothing as to what might serve as criteria for recognizing this correspondence. Likewise, the above definition points to the essence of rationality as a kind of relation but does not prescribe the relevant criteria of establishing this relation; and we can at least conjecture that different domains of activity may have their own criteria while retaining the same essence of rational activity.
6.
The Structure of Scientific Revolutions, 2nd edition (enlarged), Chicago 1970. T H O M A S : The Essential Tension, Chicago 1 9 7 7 .
KUHN, THOMAS:
KUHN,
References
430
Section 3: Philosophy of Science
Progress and Its Problems, Berkeley/Los Angeles 1977. Science and Values: The Aims of Science and Their Role in Scientific Debate, Berkeley/Los Angeles 1984. P O P P E R , K A R L : Objective Knowledge: An Evolutionary Approach, Oxford 1979. P O P P E R , K A R L : Conjectures and Refutations, 3rd edition, London 1972. P O P P E R , K A R L : The Logic of Scientific Discovery, 5th edition, London 1968. P O P P E R , K A R L : The Myth of the Framework. In: Rational Change in Science, eds. Joseph Pitt/M. Pera, Dordrecht 1987. S H A P E R E , D U D L E Y : Evolution and Continuity in Scientific Change. Philosophy of Science 56 (1989). W I N C H , P E T E R : Understanding a Primitive Society. American Philosophical Quarterly 1 (1964). L A U D A N , LARRY: L A U D A N , LARRY:
THOMAS MORMANN
Repräsentation, Struktur, Quasianalyse Formale Aspekte einer Carnapianischen Konstitutionstheorie
1.
Einleitung
2.
Die Quasizerlegung von 1923
3.
Quasizerlegung als Repräsentation
4.
Strukturkonstitution
5.
Zusammenfassung
6.
Literatur
1.
Einleitung
Carnaps Quasianalyse hat den eigenartigen Status eines philosophisch ehrenhaft gescheiterten Unternehmens: auch wer sich nur oberflächlich mit Carnaps Der logische Außau der Welt (im folgenden kurz Aufbau) befaßt hat, kennt die Quasianalyse dem Namen nach. Sich ausführlicher mit ihr zu befassen, scheint jedoch überflüssig, da sie sich ja leider als eine aus prinzipiellen Gründen verfehlte Methode erwiesen hat. Ich möchte im folgenden zeigen, daß diese Einschätzung falsch ist. Dazu ist es zunächst notwendig, einiges zum Kontext der Quasianalyse zu sagen, also zumindest kurz auf den Außau einzugehen. Seit einiger Zeit ist der Außau Gegenstand reger interpretatorischer Bemühungen, die die herkömmliche Deutung dieses Werkes als eines grandios gescheiterten phänomenalistischen Empirismus fragwürdig erscheinen lassen (vgl. Cofifa 1991, Friedman 1992, Moulines 1991, Proust 1989). Man könnte deshalb vermuten, daß das neu erwachte Interesse am Außau auch seinen formalen Aspekten gälte. Das ist jedoch kaum der Fall. Einer ausführlicheren Diskussion der Quasianalyse gehen fast alle Autoren aus dem Wege. 1 Ich halte das für einen Fehler: die Quasianalyse ist kein technisches Detail, das für die allgemeine philosophische Einschätzung des Außau vernachlässigt werden könnte, sie ist der Schlüssel zum Verständnis dieses Werkes. Einen Beleg dafür liefert das folgende gut gesicherte Ergebnis der neueren Außau-Exegese (vgl. Friedman 1992): Die wesentliche Intention des Außau ist nicht die Darstellung eines speziellen phänomenalistischen Konstitutionssystems, sondern der 1
Ausnahmen sind Moulines 1991 und Proust 1989.
432
Section 3: Philosophy of Science
Entwurf einer allgemeinen Konstitutionstheorie als einer Theorie von Konstitutionssystemen. Unter einem Konstitutionssystem ist dabei eine stufenweise Ordnung der Begriffe oder Gegenstände des (wissenschaftlichen) Wissens der Art zu verstehen, daß die Begriffe oder Gegenstände einer jeden Stufe aus denen der niederen Stufen konstituiert werden (vgl. Aufbau §2). In einer Theorie von Konstitutionssystemen geht es deshalb um eine allgemeine Methodologie von Konstitutionssystemen (vgl. Proust 1989). Eine solche allgemeine Methodologie aber ist, da sie nicht auf die Besonderheiten der einzelnen Systeme eingeht, notwendig formal. Das Kernstück dieser formalen Konstitutionstheorie ist offenbar die Quasianalyse. Damit steht und fällt das Programm einer Konstitutionstheorie im Sinne des Auflau mit der Quasianalyse: erweist sich die Quasianalyse als verfehlt, ist es auch um den Auflau insgesamt geschehen. Im Folgenden möchte ich plausibel machen, daß der quasianalytische Ansatz keineswegs als grundsätzlich verfehlt abzutun ist, sondern als formales Kernstück einer modernen Konstitutionstheorie rehabilitiert werden kann. Ich gehe dabei historisch und systematisch vor: zunächst werde ich eine frühe Version der Quasizerlegung aus dem Jahre 1923 diskutieren. Anschließend soll dieser Ansatz als repräsentationale Theorie von Ahnlichkeitsstrukturen so reformuliert werden, daß er in den Rahmen einer „General Theory of Meaningful Representation" (vgl. Mundy 1986) eingebettet werden kann. Damit läßt sich die Quasianalyse als Kern einer allgemeinen strukturellen Konstitutionstheorie begreifen.
2.
Die Quasizerlegung von 1923
Die erste explizite Formulierung des quasianalytischen Ansatzes findet sich in einem Manuskript mit dem programmatischen Titel „Die Quasizerlegung. Ein Verfahren zur Ordnung nichthomogener Mengen mit den Mitteln der Beziehungslehre" (RC-081-04-01) (im folgenden Quasizerlegung). Dieses bis heute nicht veröffentlichte Manuskript enthält eine Version der Quasianalyse, die im Vergleich zu der des Auflau wesentlich neue Aspekte dieses Ansatzes zur Sprache bringt. In Quasizerlegung beschreibt Carnap die allgemeine Intention dieser Methode folgendermaßen: „Gegeben ist eine Menge von Elementen und für jedes Element die Angabe, mit welchen der übrigen es verwandt ist. Gesucht eine Beschreibung dieser Menge, die nur diese Angaben benutzt, aber den Elementen derart Quasibestandteile oder Quasimerkmale zuschreibt, daß es möglich wird, jedes
einzelne
Thomas Mormann: Repräsentation, Struktur, Quasianalyse
433
Element für sich, ohne Bezugnahme aufandere aufgrund seiner Quasibestandteile zu behandeln." [meine Hervorhebung] Diese Charakterisierung der Quasizerlegung (im Auflau dann Quasianalyse) macht klar, daß dieses Verfahren zunächst nichts mit dem Phänomenalismus zu tun hat. So wendet Carnap im Auflau die Quasianalyse auf Mengen von „Elementarerlebnissen" an, die weniger phänomenalistischer als vielmehr gestalttheoretischer Herkunft sind. Es ist zwar nicht ausgeschlossen, die Quasizerlegung auf Mengen anzuwenden, die etwas mit dem Phänomenalismus zu tun haben, aber das ist fur die Methode der Quasizerlegung nicht wesentlich. Die Quasizerlegung von 1923 ist eine rein formale Methode, die Carnap durch die folgenden Axiome charakterisiert: (Cl) (C2) (C3)
(C4)
Sind zwei Elemente verwandt, so stimmen sie in (mindestens) einem Quasibestandteil überein. Sind zwei Elemente nicht verwandt, so stimmen sie in keinem Quasibestandteil überein. Sind zwei Elemente α und b „verwandtschaftsgleich", (d. h. ist α mit allen und nur den Elementen verwandt wie b), so haben sie dieselben Quasibestandteile. Es kommt kein Quasibestandteil vor, nach dessen Wegnahme die Bedingungen (Cl)-(C3) noch erfüllt wären.
Die ersten beiden Bedingungen erscheinen ebenfalls im Auflau und charakterisieren dort die „Quasianalyse erster Art"; (C3) und (C4) kommen im Auflau nicht mehr vor, wohl (vgl. Proust 1989) weil es Carnap dort um möglichst einfache, leicht verständliche Beispiele von Konstitutionen ging, weshalb er auf die Darstellung komplizierterer technischer Details verzichtete.
3.
Quasizerlegung als Repräsentation
Eine repräsentationale Formulierung der Quasizerlegung hat zunächst den Vorteil der größeren Übersichtlichkeit und formalen Präzision. Darüber hinaus erlaubt sie, die wesentlichen epistemologischen und ontologischen Charakteristika dieses Ansatzes zu explizieren. Dazu zunächst einige terminologische Vorbereitungen. Ist 5 eine Menge von Elementen, auf der eine reflexive und symmetrische Ahnlichkeits- oder Verwandtschaftsrelation ~ C 5 x 5 definiert ist, bezeichnen wir (5, als eine Ähnlichkeitsstruktur. Für (x,y) e ~ schreiben wir immer χ ^ y. Die Menge {χ | χ ~ y} werde mit co(x) bezeichnet. Die Potenzmenge einer Menge Q wird mit bezeichnet. Durch P~P gdw PnP' φ 0 oder Ρ = Ρ' = 0 wird eine Ähnlichkeitsrelation
434 auf
Section 3: Philosophy of Science
definiert. Ist Q' C Q eine Teilmenge von Q, so sei die Abbildung
i*QQ : 2q
2q' definiert durch i*Q(y(P) :=PnQ',Pe
2 2 nicht alle Bedingungen ( C 1 ) ' - ( C 3 ) ' :
In dieser Axiomatisierung wird eine Quasizerlegung von (S, ~) beschrieben als eine strukturerhaltende Abbildung oder Repräsentation einer Ahnlichkeitsstruktur S in eine spezielle repräsentierende Ähnlichkeitsstruktur (2Q,~). 2 Der Begriff der Strukturerhaltung kann hier in mehrfachem Sinne verstanden werden, ζ. B. ist die Abbildung f: S —> strukturerhaltend hinsichtlich der Ähnlichkeitsstruktur „~", d.h., es gilt χ ^ y f{ x ) ~ f ( y ) . Außerdem ist f strukturerhaltend hinsichtlich der durch co induzierten Äquivalenzrelation ,,—co": co(x) = co(y) f (x) = f{y). Allgemein ist der Begriff „Strukturerhaltung" für die Quasizerlegung in einem offenen Sinne zu verwenden: es ist nicht ein für allemal und für alle quasianalytischen Repräsentationen festgelegt bezüglich welcher Strukturen sie strukturerhaltend sind. Dies ist vielmehr eine Frage, die von Fall zu Fall und für verschiedene Konstitutionssysteme verschieden zu beantworten ist. Eine interessante (von Carnap nicht betrachtete) Bedingung ist zum Beispiel Strukturerhaltung hinsichtlich der durch co 2
Die Ähnlichkeitsstruktur (2*2, ist in mehrfacher Hinsicht speziell: ζ. B. hat 2*2 die Struktur einer Booleschen Algebra, für zwei beliebige Elemente 0 / P,P" gibt es immer ein „verbindendes" Element F mit Ρ ~ F ~ F'. Dieser spezielle Charakter des repräsentierenden Bereichs findet sich bei den meisten Repräsentationen, ζ. B. auch in der numerischen Messung, wo der repräsentierende Bereich der reellen Zahlen R eine besondere Rolle spielt.
Thomas Mormann: Repräsentation, Struktur, Quasianalyse
435
induzierten Ordnungsstruktur: χ < c o y f ( x ) C f{y). Weitere strukturerhaltende Bedingungen können fiir spezielle Konstitutionssysteme formuliert werden. Es ist also eine empirische Frage, welche Strukturerhaltungsbedingungen für welche Konstitutionssysteme sinnvoll sind. Die Konstitutionstheorie als Theorie von Konstitutionssystemen ist deshalb durchaus nicht eine rein mathematische, sondern auch eine empirische Theorie, vergleichbar einer Theorie der mathematischen Naturwissenschaften. Versteht man eine Quasizerlegung als eine strukturerhaltende Repräsentation einer Ähnlichkeitsstruktur, stellen sich sofort die beiden folgenden Fragen: (i) Gibt es ftir jede Ähnlichkeitsstruktur (5, eine solche Repräsentation; (ii) Falls eine Repräsentation existiert, ist sie — in einem zu präzisierenden Sinne - eindeutig bestimmt? Wie schon Carnap wußte, ist die erste dieser beiden Fragen mit ja zu beantworten. Für eine gegebene (endliche) Ähnlichkeitsstruktur kann man folgendermaßen eine Quasizerlegung konstruieren: (2) Definition und Lemma. Sei (S, eine Ähnlichkeitsstruktur. Ein Ahnlichkeitskreis von (5, ~ ) ist eine Teilmenge Τ C S, die die beiden folgenden Bedingungen erfüllt: (i) (ii) (iii)
x,y e Τ => χ ~y, und χ £ Τ => es gibt einy £ Τ mit x / y. Die Menge der Ähnlichkeitskreise von (S, werde mit SC(S) bezeichnet. Definiert man eine Abbildung / : S 2SC^ durch f(s) := { j | s e T,Te SC(5)}, erfüllt / (C1)'-(C3)'. Durch Wegnahme überflüssiger Τ kann man aus f eine Abbildung erhalten, die außerdem noch (C4)' erfüllt.
Die Frage nach der Eindeutigkeit einer quasianalytischen Repräsentation einer eine Ähnlichkeitsstruktur (S, ~ ) läßt sich nicht ganz so einfach beantworten. 1963 wurde von Brockhaus der folgende Satz bewiesen: (3) Satz. Die Ähnlichkeitsstruktur (5, ~ ) hat genau dann eine einzige Quasizerlegung f : S -» 2Q , die die Bedingungen (C1)'-(C4)' erfüllt, wenn es eine Menge SC(S, 2) C SC(S) von Ähnlichkeitskreisen gibt, die die folgenden Bedingungen erfüllt:
(i) (ii)
uSC(S,2) = S ftir jedes Τ € SC(S, 2) gibt es (nicht notwendigerweise verschiedene) Elemente x t J t € T, so daß co(*7) n c o f j ^ ) - Τ.
Wie das folgende Beispiel zeigt, erfüllen keineswegs alle Ähnlichkeitsstrukturen diese Bedingungen. Der folgende Graph G(S) repräsentiere eine Ähnlich-
436
Section 3: Philosophy of Science
keitsstruktur (S,) in dem Sinne, daß die Elemente von S die Ecken von (7(5) darstellen und zwei (verschiedene) Elemente von S genau dann eine Kante des Graphen definieren, wenn sie zueinander ähnlich sind. Dann ist leicht zu sehen, daß die folgende Ähnlichkeitsstruktur genau zwei wesentlich verschiedene Quasizerlegungen hat, die die Bedingungen (C1)'-(C4)' erfüllen. Sie sind dadurch charakterisiert, daß bei der einen den Ecken des oberen großen Dreiecks D o eine gemeinsame Eigenschaft zugeordnet wird, den Elementen des unteren großen Dreiecks D u jedoch nicht, während es sich bei der anderen genau umgekehrt verhält:
Für Ähnlichkeitsstrukturen dieser Art - und das sind, wie man zeigen kann, die meisten (vgl. Mormann 1994) - gibt es daher mehrere Quasizerlegungen. Die Frage ist nun, ob diese Mehrdeutigkeit bedeutet, daß der quasianalytische Ansatz tout court gescheitert ist. Dieser Meinung sind Goodman 1954 und andere Kritiker der Quasianalyse. Wie wohl als erste Proust ausgeführt hat (vgl. Proust 1989), ist diese These bei näherem Besehen keineswegs stichhaltig: aus der Perspektive der quasianalytischen Konstitution gibt es keine vor anderen ausgezeichnete quasianalytische Repräsentation einer Ähnlichkeitstruktur (S,~). Wenn eine Ähnlichkeitsstruktur so beschaffen ist, daß sie mehrere Repräsentationen erlaubt, ist das genauso wenig beunruhigend als wenn eine empirische Datenstruktur mehrere theoretische Erklärungen zuläßt (vgl. Mormann 1994, 1995).
4.
Strukturkonstitution
Die Konstitution von (Quasi)merkmalen ist nur ein erster Schritt beim Aufbau eines Konstitutionssystems. Jedes Konstitutionssystem, gleich welcher Art, wird sicherlich noch viele andere Arten von Gegenständen umfassen als nur Eigenschaften der Grundelemente. Im Aufoau gibt Carnap solche Beispiele für ein phänomenalistisches Konstitutionssystem, indem er Konstitutionen für den Farbraum, den Gesichtssinn und andere Begriffe skizziert. Diese Beispielkonstitutionen sind zugeschnitten auf gerade dieses spezielle
Thomas Mormann: Repräsentation, Struktur, Quasianalyse
437
System und können nicht ohne weiteres auf andere übertragen werden. Es fragt sich daher, welche anderen Typen von Gegenständen, abgesehen von Quasieigenschaften der Grundelemente, fiir Konstitutionssysteme allgemein von Bedeutung sind. Auf dieses Problem kann hier nicht ausführlich eingegangen werden. Ich möchte deshalb nur die allgemeine Antwort geben, daß die für alle Systeme zu konstituierenden Gegenstände Strukturen (Mengen, Relationen etc.) sein werden. Dazu die folgenden Beispiele: (4) Konstitution von Strukturen. Sei (S, ~) eine Ahnlichkeitsstruktur. Dann lassen sich (unter anderen) die folgenden Strukturen konstituieren: (i)
(ii)
Konstitution einer Ordnungsstruktur: Eine partielle Ordnung „ Ρ in / with Prem C X. Theories of explanation in the tradition of Hempel (1965) are solely concerned with strong assimilation. 1.2. Approximative assimilation: A phenomenon Ρ is approximatively assimilated w. r. t. X if there exists a deductive inference Prem 6
Cf. Hempel 1968; Fetzer 1981; Schurz 1988; 1994b for technical explications of this condition. Here is a simple but basically correct explication: {Fa,p(G/F) = r) C KNOW [or, {Fa,Fa Gx} C KNOW, resp.] is max. spec, for Ga in C iff (i) -^Ga £ KNOW and (ii) for each nomological predicate Η in LAN logically independent from G such that Ha e KNOW and />(G{H) = q{^r)€ KNOW [or Hx^-^GxeKNOW, resp.], it holds that Vx{Hx -> Fx) e KNOW [or Ηχ => Fx e KNOW, resp.]. Condition (i) is unnecessary in contexts of explanation, since here, knowledge of the explanandum is presupposed.
484
Section 3: Philosophy of Science
P* in / with Prem C X such that P* approximates P. Approaches to theory reduction are typically concerned with approximative assimilation. 7 An actual assimilation basis of Κ is any subset X C Κ such that every phenomenon in {Κ - X) is assimilated w. r. t. X. Traditionally, X is identified with the unification basis (cf. Friedman 1974). Our theory, however, introduces certain important distinctions. 2. Potential assimilation: A phenomenon which is not actually assimilated may be assimilable at least in some indirect or heuristic way. 2.1. Random assimilation: Events which have low probability (w. r. t. C) are not 'puzzling' or 'surprising' if it is known in C that they are random events, without any futher 'hidden cause' - like a royal flush in a poker play, or the decay of a radioactive nucleus. Jeffrey (1971) and Salmon (1984, 109) have convincingly argued that low probability arguments also provide understanding if they are causally complete. We define a phenomenon P{a) in Κ as random assimilated w. r. t. Κ if there exists a low probability inference Prem => P(a) in / with Prem C Κ such that the probability law p(Px/Fx) = r in Prem is causally complete in the sense that no lawlike strengthening F*x of Fx changes the conditional probability of P(x) according to K's causal probability laws.8 As argued in Schurz (1988, ch. 1.6), random events are indirectly explained and hence assimilated by the fact that, if we repeat the random experiment, we obtain a sample frequency (the frequency of royal flushes during a poker evening, the measured decay rate of a radioactive nucleus) which can be explained with high probability. 2.2.
7
8
Heuristic assimilation: In heuristic assimilations, phenomena are inferred from theories Τ in Κ with the help of initial or boundary conditions Cd which are not known or believed but are at least 'imaginable' or 'plausible' w. r. t. Κ - or as we say, which are not in conflict with K. This kind of assimilation plays an important role in science. To borrow an example from Kitcher (1981, 512-515), the successs of Darwin's theory of evolution was not so much due to its actual capacity to provide explanations of the evolution pro-
There are two main kinds of approximation relations: closeness approximation concerns the approximative inference of quantitative empirical laws (cf. Niiniluoto 1982), limit approximation concerns the approximative reduction of theories (cf. Stegmüller 1986, 246-253). This is a much stronger condition than maximal specifity: the former excludes only statistically relevant strengthenings F"(a) known about a.
485
Gerhard Schurz: Unification and Understanding
cess, but rather to its promise to be able to produce such explanations if only the initial and boundary conditions would be known. To give a more stringent explication, we first define the notion of being in conflict with K. A singular phenomenon Ρ stands in conflict with Κ if it is not random-assimilated but there exists a low probability inference Prem => Ρ ml with Prem C K. A general phenomenon (a law) L stands in conflict with Κ if Κ contains a theory Τ which is much more general than L but contains an ad-hoc restriction (formally, an antecedent conjunct) such that without this ad-hoc restriction, L would be logically inconsistent with Τ ? Such a law describes a phenomenon which is exceptional w. r. to a general theory of K. The laws describing far distance correlations in quantum mechanics (the EPR paradox) in the context of special relativity theory are an example. - Now we define (theories are sets of elements of Κ): A phenomenon Ρ is heuristically assimilated w. r. t. Κ if there exists a theory Τ in Κ and a set of initial or boundary conditions Cd none of which stands in conflict with Κ such that Τ U Cd => Ρ is in I. 3. Dissimilatedphenomena: A phenomenon Ρ in A' is dissimilated w. r. t. Κ if it stands in conflict with K, and for every theory T in Κ and every set Cd of initial or boundary conditions such that Τ U Cd => Ρ is an inference in / , at least one statement in Cd is itself in conflict with K. Dissimilated phenomena are anomalies — even a 'how possible' explanantion cannot be found for them, they resist all attempts of assimilation into the accpeted theory. The EPR paradox is again an example. The significant role of heuristic assimilation and dissimilation has been overwhelmingly neglected in traditional theories of explanation. There are two exceptions: Heuristic assimilation corresponds to what Dray (1957, 158ff) has called a how-possible explanation; dissimilation comes close to what Bromberger (1965, 82f) has called a "p(uzzle)predicament". 4. Basic Phenomena are those phenomena of a given actual assimilation basis X which are neither potentially assimilated nor dissimilated (w. r. t. K). In scientifically developed cognitive corpuses, the only basic phenomena will be fundamental theories, because every fact or empirical law falls in 9
A formal example: Τ = ~ix(F Χ is more general than G.
R^Gx
Hx) and L
= VX(FXA
GXa
QX
->
-*Hx), where
F
486
Section 3: Philosophy of Science
the range of some theory and, hence, is either heuristically assimilated or assimilated or dissimilated. A unification classification of .AT is a partitioning of Κ into four (disjoint) subsets Ka,Kp,Kb,Kd such that X ·.= KpU Kf,U Kj is an actual assimilation basis of K, hence Ka(:= Κ - X ) is the set of actually assimilated phenomena, and Kp, Kf,, Kj is the (disjoint) partition ofX into the sets of phenomena which are potentially assimilated, basic and dissimilated (w. r. t. K). The unification classification of Κ is that unification classification of Κ which yields the greatest unification of K, according to the criteria developed in §4 below.
4.
A Comparative Concept of Unification
In order to avoid the arbitrariness of assigning numbers, unification is treated in a comparative manner: it is a partial but not complete ordering relation between cognitive corpuses. For unification is a weighted combination of several factors (simplicity, predictive power, causality), and often this weightening will involve 'subjective' considerations. But nevertheless there are some objective rules which enable one to compare the unification of two given cognitive corpuses in standard situations. The fewer the phenomena in Kj or K^ and the more the phenomena in Ka or Kp, the greater the unification of Κ will be. But for the estimation of unification it is not enough just to "count" the phenomena. We assume that every phenomenon Ρ is associated with a certain intrinsic weight w{P), which reflects its cognitive complexity. All one can assume is a partial ordering > among the weights of phenomena. As a minimal rule for w{P), we assume that the cognitive complexity of a general phenomenon is greater than that of a singular one, and that of a theoretical phenomenon is greater than that of an observational one. If a phenomenon Ρ is newly added to K^ its weight has to be payed as an intrinsic cost: —w{P) (i. e„ the negative weight). If, on the other hand, Ρ is assimilated, this cost is saved, either completely or partially, depending on the strength of the assimilation. If Ρ is dissimilated, its cost increases significantly. -wa(P), -wp(P) and — wj(P) denote the costs of an actually assimilated, potentially assimilated and dissimilated phenomenon P, respectively. Concerning the absolute values, we have tvj(P) u>{P) u>p(P) > wa(P) > 0; wa(P) is zero in the case of deductive assimilation, and small but nonzero in the case of high probability or approximative assimilation. If the cognitive corpus contains some general principles which distinguish causal from noncausal correla-
Gerhard Schurz: Unification and Understanding
487
tions between events (like foreward directness in time or locality), then wa(P) is also used to give causal assimilations a preference over noncausal ones. So far we have not taken care of an important requirement which distinguishes unification in science from unification in other areas, like religion or mystics. Science does not seek to unify just any kinds of phenomena; in the end, it seeks to unify the actually observed phenomena, called data. Unification of hypotheses is only of value if they themselves contribute to data unification. This requirement is met by giving only the data in Κ an intrinsic gain. Hypotheses have no intrinsic gain. Of course, they should have extrinsic gain, reflecting the unification increase due to their assimilation of phenomena. For reasons of simplicity, we identify the intrinsic gain of a datum D with its (positive) intrinsic weight, w(D). This implies that adding new and basic data to Κ costs and gains nothing, provided the new data do not affect other parts of K.
The unification of two cognitive corpuses C and C* (with corresponding unification classification) is compared by the method of s h i f t diagrams. We describe the transformation leading from ( K d , K j „ K p , K a ) to (Kd,K£,Kp,K*) as a sequence of one element shifts. There are three kinds of shifts: a phenomenon Ρ can be added to a set Kx (x € {d, b,p,a}), which is denoted by P+x; it can be subtracted from Kx, denoted by P-x, or it can move from Kx to Ky, denoted by Px^y. A move can be decomposed into a sequence of a subtraction and an addition: Px^,y = (P-x,P+y). The cost or gain of a shift: is called its unification value, in short its u-value. Costs are negative «-values, gains are positive ones, written unsigned. If a shift has both a cost and a gain, its «-value is identified with the sequence of the cost and the gain. More generally, the «-value of a sequence of shifts is the sequence of its «-values, u((s\,.. -,s„)) = (u(s ι ) , . . . , u ( s n ) ) . The «-values of shifts of data D and hypotheses Η are calculated from the above rules as follows (P stands for any phenomenon): Additions
for
data: (1 )u{D+d)
=
(-wj{D),w{D))
= -(wj(D),-w(D)),
which is negative. (2) u{D+b)
= {w{D)-w{D))
= 0.
(3) u(D+p) — (w(D),—Wp(D)), which is positive. (4) u(D+a] - w(D), or = ( w ( D ) , - w a ( D ) ) , respectively, which is positive and greater than u(D+p). hypotheses:
for (1)
u{H+d)
=
(2) u{H+b)
=
(3) u{H+h)
= -w
-wd{H). -w{H). h
(H).
488
Subtractions Moves
Section 3: Philosophy of Science
(4) u(H+a) = 0, or = -wa(H), respectively. are calculated from additions by: u{P-x) = -u{P+x). are calculated from additions by: u{Px^y) = {u{P-x),-u{P+y)).
For example, u(D_j) — (wj(D),-w(D)), in words: the «-value of subtracting a datum from K j is composed from the gain w^(D) and the cost — w(D), which is "in sum" positive because wj(D) w{D). Or, u (Pd-ih) = { u, d{P)^~ w p{P)) f° r both Ρ a datum and Ρ a hypothesis (because the additional effects of intrinsic gains in the case of a shift of a datum are w(D) and —w(D), which cancel out to zero. Given a sequence of shifts ,... ,s„) with a corresponding «-value («) := («1,..., u„) leading from C to C*, we can calculate the total unification effect according to the following rule. 10 If we can associate with each negative «-value - « , in («) one positive «-value Uj in («) in a unique manner such that Uj balances «,· (i.e., uj > «,·), then u{C*) > u(C), i.e. the unification has not been decreased. If, in addition, at least one of the associated positive u-values dominates its negative counterpart (i. e. uj > «,), or if at least one positive u-value has not been associated to a negative one, then w(C) > u(C), i. e. the unification has been increased. The third case, u(C) < u{C), is defined similarly (C* and C exchange their role). Otherwise, no comparison is possible. For example, if we know that u\ > ui, «4 > «3, «5 > 0, then we know that (u\, —«3, —«2, «4) > 0 and («1, —«2, »5) > 0. but we cannot evaluate («1, -«4). The most fundamental objection against unification approaches brought forward by several authors (cf. Salmon 1984, 260; Morrison 1990; Humphreys 1993) is this: why should unification always go hand in hand with closeness to the truth in a realistic sense? Now recognize how our unification theory avoids this objection. First, because of the inbuilt data priority, unification yields empirical confirmation as a byproduct. Second, because of the method of knowledge representation, not linguistic structures, but the real phenomena are unified. These two features guarantee that the search for unification can't produce more unification than there really exists in the world. In particular, they solve the problem of spurious unification relying on empirically contentless speculations.11 Third, our approach treats causality principles (like forward directness in time) as theory-relative (cf. 10
"
This follows from the fact that the set of κ-values together with the sequence-operation "," forms a commutative group, partially ordered by " > " , where " > " is strictly m o n o t o n i c with respect to ",". A proof is given in Schurz/Lambert 1994, appendix. Cf. Kitcher 1981, 26. This is demonstrated in detail in Schurz/Lambert 1994.
Gerhard Schurz: Unification and Understanding
489
van Fraassen 1980, 124), but nevertheless gives justice to Salmon's argument (1984, 260) that they are not always explainable in terms of unification success, insofar as causal assimilations are given a direct preference over noncausal assimilation in terms of intrinsic gains.
5.
Scientific Explanation and Understanding
An answer to an explanation-seeking why-question "Why P?" is an adequate explanation iff it provides understanding of Ρ (recall the first paragraph of this paper). Hence, modeling explanation and modeling understanding is essentially the same enterprise. The notion of explanation has been explicated in terms of predictability (Hempel 1965), in terms of probability increase (Gärdenfors 1980) or in terms of causality (Salmon 1984). But none of these approaches has solved the following problem: an answer to a why-question will be explanatory satisfying only if its explanans premises are not less in need of explanation than the explanandum. 12 For instance, "Peter is flying past the window in the third floor, because one second ago he was flying past the window in the fifth floor" is a causally and predictively adequate argument, but not an explanation, because the cause is here just as much in need of explanation as the effect. Similarly, predictively successful scientific laws are only explanatory if they are in conformity with the accepted background theory: an example of non-explanatory laws were Bohr's stability postulates for electrons in an atom in the year 1913, which predicted the hydrogen spectrum but were inconsistent with classical dynamics. According to the key idea of Schurz (1988, ch. II.3) and Schurz/Lambert (1994), an answer A to a why-question "Why P?" provides understanding of Ρ and thus explains P, relative to the cognitive corpus of the questioner Q, iff A assimilates Ρ to Q's cognitive corpus C in a way that increases the degree of unification of C. An explicit and minimal answer to a why-question Why P?" can be reconstructed in the form "PremÄ U Prem^ => P". It entails the claim that the inference is correct, the premises in Prem a are rationally acceptable, and those in Prem^, are not in conflict with the questioner's cognitive corpus. Prem^ is nonempty only in case of how possible explanations (i. e., heuristic assimilations), otherwise it is empty. Because the answer may include new information not known in C, either new descriptive knowledge in Prem^ or new inferential knowledge (namely Prem^ U Prem^ P), it will cause a development of the questioner's cognitive corpus C = (Κ, I) into some successor state 12
Cf. Stegmüller 1969, 770; Scriven 1975; Kutschera 1972, 331; Käsbauer 1976, 270.
490
Section 3: Philosophy of Science
C* = (K*,I*>. C* is given by the result of the addition of A to C, C* = C+A, where Κ* = K + Prem* and I* = IU {Prem* U Prem^ => P]. The 'addition of Prem* to Κ is defined similar as in the theory of belief revision (Gärdenfors 1988, ch. 3): if Κ U Prem* is consistent, then Κ + Prem* is the expansion of Κ by Prem,,, otherwise Κ + Prem* is the revision of Κ by Prem* which in turn is defined as the result of expanding the contraction of Κ by Prem,, with Prem*. However, the operations of expansion, contraction and revision must not be directly applied to Κ but, rather, to KNOW, because irrelevant consequences in Κ Ν OW may become relevant in contractions, and vice versa, relevant consequences in KNOW may become irrelevant in expansions. For X a set of statements, let (X)/ denote the closure of X under deductive and inductive high probability inferences in / , and let (X)r denote the set of relevant elements o f X . Then the definition of K+Prem* is as follows. Given Κ υ Prem* is consistent, Κ + Prem„ := ((KNOW U Prem a )/) r ; otherwise Κ + PremÄ := {{{KNOW \ PremJ υ Prem*) 7 ) r , where KNOW \ Prem,, the contraction of KNOW by Prem a , is defined as that subset of KNOW which is consistent with Prem,, and yields maximal unification for Κ + P r e n v 1 3 Summarized, the definition of explanation is this: An answer "Prem„ U Prernp => P" to a why-question "Why P?" explains P, i. e. provides understanding of P, relative to the cognitive corpus C = (K, /), iff u{C*) > u{C), where C* = (K + Prem*, I υ {Prem* U Prem^ ^>P}). This definition avoids the van Fraassen objection (1980, 109fF) that unification is a global notion but explanation and understanding of a phenomenon is a local matter. Notice that this definition combines a local component - the assimilation of the pheomenon Ρ with help of the inference Prem* U Prem^ Ρ - with a global component - the increase of C's total unification. It is exactly this global component which is missing in traditional approaches to explanation and understanding. Note also that u{C*) > u{C) can only hold if either Κ* φ Κ or J* φ / , hence at least some information in the answer must be new w. r. t. C.
6.
Application to some Examples
We demonstrate how the theory works at hand of two basic examples.14 Assume, while at a market, that you see an elephant walking around {Ρ). Ρ is 13
O u r concept of unification gives us a clear criterion for choosing a preferred ATVCW-subset a m o n g all those which are consistent with Prem„ - this is an advantage over the standard "AGM"-account to belief revision. An application to the historical development of the atomic model is given in Schurz/Lambert 1994.
Gerhard Schurz: Unification and Understanding
491
puzzling, or dissimilated. Suppose the first answer you receive to your question "Why FT is (Al): "Because the market was designated an animal park some moths ago". Though you are now able to infer Ρ from ( A l ) and your background theory (even in a causally adequate way), ( A l ) does not provide real understanding since it is itself at least as dissimilated as P. Suppose instead your question had evoked the answer (A2): "Because a movie is being made at the market". There is nothing puzzling about a movie being made at the market: though the event is not very likely, it has plausible 'how possible'explanations and thus is heuristically assimilated. Hence, the answer(A2) is completely satisfying. With help of the method of shift diagrams, the cognitive development underlying these two explaining episodes is illustrated as follows. We depict the unification classification of the knowlege systems (Κ^,Κ/,,Κρ,Κα) graphically, in a vertical notation: the more a phenomenon is assimilated, the nearer its distance to the bottom. This invokes the visual analogy with minimalization of potential energy - the less the 'potential energy' (cognitive cost) of the phenomena in C, the more 'stable' (unified) is C. The transition from C to C* is depicted by one-element shifts - only those phenomena which are involved in shifts during the transformation are mentioned. Each shift is associated with a positive or negative «-value. For simplicity, we assume that Ρ is a datum, the answers (AX) and (A2) are hypotheses, and that the assimilation is deductive. The cognitive development is illustrated in the shift diagrams 1 and 2 (page 492). In case of (/ll), the «-gain +wj(P) due to assimilating Ρ is balanced by the «-loss —u>j(Al), hence there is no unification increase. In case of (.A2), the «-gain +wj(P) dominates the «-loss -Wp(A2) significantly, hence there is a clear «-increase. The characteristic feature of the second answer is that its underlying cognitive development involves only additions (or moves) into Καοτ Kp, but no new basic or dissimilated phenomenon is obtained. We call such cognitive changes consonant, in distinction to dissonant changes, as in the case of (Λ1). Answers which produce dissonant cognitive changes, even if they lead to an «-increase, are never fully satisfying. Kuhns 'normal science' is characterized by consonant «-increasing changes, while a revolutionary stage, even if «-increasing, always involves dissonant changes. The next example demonstrates how our theory explains the cognitive change underlying a "sudden flash of insight" - an "Aha!" experience. It is a consonant change consisting of a cascade of parallel, strongly «-increasing moves. Since the shift diagram 3 below is self-explanatory, some hints are sufficient. The phenomenon in need of explanation is S. In the first state, S is strongly dissimilated, because of the facts Fl and F2. The answer Al, leading to the second state, assimilates S but is itself strongly dissimilated, moreover, in virtue oiA\,F\ becomes dissimilated and F2 looses its heuristic
492
Section 3: Philosophy of Science
+Ald -wd{Al)
c
d 'd->a b +wd(P) Ρ
Al C + Al
Shift Diagram 1: Ρ = There is an elephant walking around in the market -
Why?
A1 = Because the market was designated an animal park some months ago.
+A2„ Pd^a -Wp(A2) +wd(P) A2
C
C + A2
Shift Diagram 2: Ρ = There is an elephant walking around in the market A2 = Because a movie is being made at the market.
d S b Ρ FX F2 F3 a
d Fl Al F2 b F3 Ρ
d b Ρ
A2 Fl F2 F3 Al S
Shift Diagram 3: Example of an Aha!-experience F 1 = My friend seems to behave in a stable manner. F 2 = He seems to be extroverted. F 3 = Sometimes he is never around. 5 = His wrists are slashed - why? Al = He tried to kill himself - why? A2 = He has been manic-depressive for years.
assimilation. Hence the second state is even less unified than the first one. But then, the answer A2 provokes the "Aha!" experience: A2 assimilates S andy41 as well as F l , F2 and F3, because Fi now prevents Fl and F2 from being counterevidence to A2; moreover, A2 is itself heurisncally assimilated (since there are several plausible reasons for the onset of manic-depressive disease).
Why?
Gerhard Schurz: Unification and Understanding
7.
493
References
P.: The Nature ofExplanation, Oxford 1983. B R O M B E R G E R , S.: An Approach to Explanation. In: Analytical Philosophy. Second Series, ed. R. Butler, Oxford 1965, 72-105. D R A Y , W.: Laws and Explanation in History, Oxford 1 9 5 7 . ESS LER, W. K.: Zur Typologie von Verstehen und Erklären. Grazer Philosophische Studien 1 (1975), 127-142. F E I G L , H.: The Orthodox View of Theories: Remarks in Defense as well as Critique. In: Minnesota Studies in the Philosophy of Science, vol. IV. , Minneaolis 1970. F E T Z E R , J.: Probability and Explanation. Synthese 48 (1981), 71—408. F R I E D M A N , M . : Explanation and Scientific Understanding. Journal of Philosophy 7 1
ACHINSTEIN,
(1974), GÄRDENFORS,
5-19.
P.: A Pragmatic Approach to Explanation. Philosphy of Science
(1980),
47
404-423.
P.: Knowledge in Flux, Cambridge, Mass. 1988. P.: Kuhn, Lakatos and Laudan. Applications in the History of Physics and Psychology. American Psychologist 40 (1985), 755-769. H E M P E L , C. G.: Aspects of Scientific Explanation (and Other Essays), New York 1965. H E M P E L , C. G.: Maximal Specifity and Lawlikeness in Probabilistic Explanation. Philosophy of Science 35 (1968), 116-133. H E M P E L , C. G.: Nachwort 1976: Neuere Ideen zu den Problemen der statistischen Erklärung. In: C. G. Hempel, Aspekte wissenschaftlicher Erklärung, Berlin 1977, 98-123. H U M P H R E Y S , P . : Greater Unification Equals Greater Understanding? Analysis 5 3 , No GÄRDENFORS,
GHOLSON,
B./BARKER,
3 (1993), JEFFREY,
183-188.
R.C.: Statistical Explanation vs. Statistical Relevance. In: Salmon
(1971),
19-28.
Explanatory Unification. Philosophy of Science A8 (1981), 507-531. Explanatory Unification and the Causal Structure of the World. In: Kitcher/Salmon (eds., 1989), 410-505. K I T C H E R , P . / S A L M O N , W . , E D . : Scientific Explanation (Minnesota Studies in the Philosophy of Science Vol. XIII), Minneapolis 1989. v. K U T S C H E R A , F.: Wissenschaftstheorie, vol. I and I I , Munich 1972. M A C H , Ε . : Die Mechanik, Darmstadt 1 9 7 3 . M O R R I S O N , M . : Unification, Realism and Inference. British Journal for the Philosophy of Science 41 (1990), 305 -332. N I I N I L U O T O , I.: Truthlikeness for Quantitative Statements. PSA I (1982), 208-216. S A L M O N , W : Statistical Explanation and Statistical Relevance, Pittsburgh 1971. S A L M O N , W : Why ask 'Why?'? Proc. Adr. Amer. Phil. Assoc. 51 (1978), 683-705. S A L M O N , W.: Scientific Explanation and the Causal Structure of the World, Princeton 1984. KITCHER, P.:
K I T C H E R , P.:
494
Section 3: Philosophy of Science
G.: Was ist wissenschaftliches Verstehen? Eine Theorie verstehensbewirkender Erklärungsepisoden. In: Schurz, ed., 1988, 235-298. S C H U R Z , G., E D . : Erklären und Verstehen in der Wissenschaft, Munich 1988. S C H U R Z , G.: Relevant Deduction. From Solving Paradoxes Towards a General Theory. Erkenntnis 35 (1991), 391- 437. S C H U R Z , G . : Probabilistic Justification of Default Reasoning. In: KI-94: Advances in Artificial Intelligence, ed. Nebel, B./Dreschler-Fischer, L., Lecture Notes in AI 861, Berlin 1994a, 248-259. S C H U R Z , G . : Defeasible Reasoning Based on Constructive and Cumulative Rules. In: Philosophy and the Cognitive Sciences, Proceedings of the 16th International Wittgenstein Symposium, ed. Casati, R./Smith, B./White, Vienna 1994b, 297-310. S C H U R Z , G . / W E I N G A R T N E R , P.: Verisimilitude Defined by Relevant ConsequenceElements. In: What Is Closer-To-The-Truth, ed. Τ. Α. Ε Kuipers, Amsterdam 1987, 47-77. S C H U R Z , G./LAMBERT, K.: Outline of a Theory of Scientific Understanding. Synthese 101, No 1 (1994), 65-120. S C R I V E N , M.: Truisms as the Grounds for Historical Explanation. In: Theories of History, ed. P. Gardiner, New York 1959, 4 4 3 ^ 6 8 . S T E G M Ü L L E R , W . : Probleme und Resultate der Wissenschaftstheorie und Analytischen Philosophie. Band I, Wissenschaftliche Erklärung und Begründung, Berlin 1969. S T E G M Ü L L E R , W . : Probleme und Resultate der Wissenschaftstheorie und Analytischen Philosophie. Band II. Dritter Teilband: Die Entwicklung des neuen Strukturalismus seit 1973, Berlin 1986. T U O M E L A , R.: Explaining Explaining. Erkenntnis 1 5 ( 1 9 8 0 ) , 2 1 1 - 2 4 3 . V A N F R A A S S E N , B.: The Scientific Image, Oxford 1980. V A N F R A A S S E N , B.: Salmon on Explanation. JournalofPhilosophy 11 (1985), 639-651. W H E W E L L , W : The Philosophy of the Inductive Sciences, 2nd edition, 2 Volumes, London 1847. SCHURZ,
GERHARD TERTON
Beispiele in der methodologischen Erklärungsdiskussion 1. 2. 3. 4. 5.
Einleitung Beispiel und Begriff Beispielfunktionen in verschiedenen Erklärungskonzepten Abschließende Bemerkungen Literatur
1.
Einleitung
Die Diskussion über den Aufbau geeigneter Modelle wissenschaftlichen Erklärens (hier kurz als methodologische Erklärungsdiskussion bezeichnet) ist auch heute noch ein wichtiges Thema in der wissenschaftstheoretischen Forschungsarbeit. Es ist ein Charakteristikum dieser Diskussion, daß man sich hier von Anbeginn immer wieder auf Beispiele beruft. Dies soll uns als Anlaß dienen näher nachzufragen, von welcher Art diese Beispiele sind, welche Zielstellungen mit den Beispielen verfolgt werden und wovon der erfolgreiche Beispielgebrauch abhängt. All dies sind metamethodologische Fragen. Zu ihrer Beantwortung müssen wir das methodologische Vorgehen, wie es in den vorliegenden Erklärungsmodellen praktiziert wird, selbst näher untersuchen. Thematisiert wird die Frage nach der Methodologie des Beispielgebrauchs in der Erklärungsdebatte bisher lediglich von K. Lambert und G. G. Brittan, die in ihrer Darstellung der gegenwärtigen Hauptkonzepte von Ereigniserklärungen zugleich eine Übersicht über elementare Antworten auf typische Erklärungsfragen geben. Die Beispiele der Autoren entsprechen weitgehend einer durch die Wissenschaftlergemeinschaft akzeptierten Intuition von einer wissenschaftlichen Erklärung. Sie bilden somit Erklärungsstandards und sollen nach Auffassung von Lambert und Brittan als Datenbasis dienen, an der sich die methodologischen Erklärungskonzepte zu bewähren haben. 1 Diese Funktionsbestimmung beruht auf der Analogie zwischen einem Erklärungskonzept und einer empirischen Hypothese. Sie setzt einen relativ entwickelten Diskussionsstand in der Erklärungsdebatte voraus und beschreibt einen wichtigen und interessanten Fall des Beispielgebrauchs in dieser Debatte. Wir wollen im Anschluß 1
Lambert/Brittan 1991, 28f.
496
Section 3: Philosophy of Science
daran weitere Gebrauchsweisen von Beispielen erörtern. Dabei konzentrieren wir uns zunächst auf die Beispiel-Begriffsbeziehung, die uns als systematischer Ausgangspunkt fur die Analyse dienen soll.
2.
Beispiel und Begriff
Sofern ein methodologisches Erklärungskonzept mit definierten Begriffen arbeitet, lassen sich zu jedem dieser Begriffe immer zugleich Elemente des Begriffsumfanges angeben, die die Definition des jeweiligen Begriffsnamens erläutern. Wenngleich hierfür jedes der Elemente mit gleicher Berechtigung als Beispiel ausgewählt werden kann, ist nicht jedes Element gleichermaßen gut dafür geeignet. Die Erläuterungs- oder Illustrationsfunktion ist wesentlich pragmatisch bestimmt. Als gut ausgewählte Beispiele gelten insbesondere klare und eindeutige Fälle. Darüber hinaus müssen sie von der jeweiligen Zielgruppe, für die sie Beispiele sein sollen, verstanden werden. Diese Forderungen erfüllen die Illustrationsbeispiele flir D-N-Erklärungen, die zumeist Fälle von unproblematischen, elementaren physikalischen Ereigniserklärungen sind, die in der Regel an unser Erfahrungswissen anknüpfen. (Repräsentativ hierfür sind die Erklärung des Deweyschen Blasenphänomens, das Poppersche Beispiel des Abreißens eines Fadens bei Uberbelastung, das Hempelsche Beispiel der Erklärung des anfänglichen Absinkens der Quecksilbersäule beim Eintauchen des Thermometers in eine heiße Flüssigkeit.) 2 Beispiele im Sinne von Elementen einer Grundmenge oder eines Begriffsumfangs können auch eine Differenzierungsfunktion haben, wenn sie dazu verwendet werden, aus gegebenen Umfängen Spezialfälle auszugliedern oder wenn eine schon vorhandene grobe Begriffsgliederung über die Auswahl von Repräsentanten feiner aufgegliedert werden soll. Hierbei haben Beispiele eine begriffskonstituierende Funktion durch die mitunter auch eine Begriffspräzisierung oder eine Explikation eingeleitet werden. Am Abschluß dieses Verfahrens steht jedoch wiederum eine Definition. Davon ist der Fall zu unterscheiden, in dem die Beispiele an Stelle einer Definition stehen. Beispiele dienen hier als Muster zur Auffindung von weiteren Designaten eines Allgemeinnamens. Der Begriff reicht so weit wie die Beispiele reichen und er verändert sich durch jeden neu dazugekommenen Beispielfall. Wittgenstein hat diese Beispielverwendung durch das Verfahren der Begriffsbildung über Familienähnlichkeit recht detailliert beschrieben. 3 2 3
Hempel 1 9 7 0 , 2 2 1 . Wittgenstein 1990, 277f.
Gerhard Terton: Beispiele in der methodologischen Erklärungsdiskussion
3.
497
Beispielfunktionen in verschiedenen Erklärungskonzepten
Im Hempelschen Erklärungskonzept, das am Ausgangspunkt der methodologischen Erklärungsdiskussion steht, tritt der zuletzt genannte Beispiel typ nicht auf. Es überwiegt eindeutig der illustrative und der differenzierende Beispielgebrauch. Das Resultat dieses Vorgehens ist die Hempelsche Erklärungstypologie, nach der es neben den an der Folgerungsbeziehung orientierten Erklärungsarten (deduktiv-nomologische, deduktiv-statistische und induktiv-statistische Erklärungen) zugleich noch eine Aufgliederung nach verschiedenen Erklärungsprinzipien (in kausale, funktionale, genetische und rationale Erklärungen) sowie eine weitere gibt, die durch eine Variation der Forderung an die Grundmodelle des Erklärens zustandekommt. Hiernach gliedern sich die Modelle in vollständige und in unvollständige Erklärungen der verschiedenen Arten (wie partielle, elliptische und skizzenhafte Erklärungen). Es ist leicht nachweisbar, daß es insbesondere konkrete einzelwissenschaftliche Erklärungsfälle (wie die genetische Erklärung des Ablasses durch den Historiker Boehmer sowie implizite und unvollständige Erklärungen in Kultur- und Sozialwissenschaften) waren, die letztlich zu der genannten Unterscheidung geführt haben. 4 Das in sich differenzierte Konzept ermöglichte es dann wiederum Erklärungsbeispiele zu integrieren, die ursprünglich nicht zu den Hempelschen Grundmodellen paßten. Ich erwähne hier nur das Draysche Schema von rationalen Handlungserklärungen, die von diesem als nichtdeduktive und nichtnomologische Erklärungen eingeführt worden sind und die Hempel später als dispositionelle bzw. partielle Erklärungen deuten konnte. 5 Hempels Erklärungskonzept erwies sich darüber hinaus als Ausgangspunkt ftir einen argumentativen bzw. konstruktiven Beispielgebrauch. Dieser Gebrauch ist dadurch charakterisiert, daß unter Bezugnahme auf spezifische, mit dem Konzept unverträgliche Beispiele zugleich Hinweise fur die Weiterentwicklung der methodologischen Erklärungsmodelle geliefert worden sind. Ich nenne hier nur die sogenannten Pseudoerklärungen. Diese entstehen, wenn man Erklärungsargumente konstruiert, die gegen die Forderungen der deduktiven oder der prognostischen Relevanz verstoßen. Die intensive Beschäftigung mit den Pseudoerklärungen und mit ihren Argumentformen führte schließlich zur begrifflichen Neufassung der Relevanzkriterien und zur Aufgabe der isolierten Argumentformanalyse. 6 Sie erwies sich zugleich als ein wesentlicher Beweggrund, epistemisch-pragmatische Begriffe (wie 4 5 6
Hempel 1977, 170f. Hempel 1970, 227f. Schurz 1983, 245f.
498
Section 3: Philosophy o f Science
Hintergrundwissen, Wissenssituationen, Relevanzbeziehungen u. a.) in die Erklärungsdiskussion einzubeziehen. 7 Argumentative und konstruktive Bedeutung kommt auch den Beispielen zu, die aus der Erklärungspraxis bekannte Erklärungsphänomene wie die berechtigte und unberechtigte Zurückweisung einer Erklärung, ihre Entwertung infolge von Zusatzinformationen oder die verschiedenen Betonungen der Bestandteile einer Erklärungsfrage und die damit verbundenen Kontrastklassen der Frage beschreiben. Mit diesen Beispielen lassen sich zwar auch die Definitionen der Begriffsnamen: Zurückweisung, Entwertung, Betonung und Kontrastklasse illustrieren. Aber die hier genannte Beispielklasse hat darüber hinaus eine Funktion bei der Entwicklung von Erklärungsmodellen. Zu diesem Zweck modifiziert man eingeführte Beispiele oftmals, indem man sie mit hypothetischen Bedingungen verknüpft oder dadurch, daß sie in unterschiedliche Kontexte eingebunden werden. Auf diese Weise sind sie nicht selten Ausgangspunkt für gedankliche Experimente oder für Hypothesenbildungen in der Konzeptausformung. Ziel des Beispielgebrauchs ist es, das jeweils gemeinte Erklärungsphänomen möglichst prägnant zu charakterisieren und es in eine analytisch zugängliche Form zu bringen, wozu mitunter Situationsbeschreibungen genutzt werden, die einer gewissen Komik nicht entbehren. (Ich nenne hier nur Garfinkeis Beispiel vom Gefängniskaplan, der auf seine Frage an einen gefangenen Einbrecher, warum dieser denn eine Bank ausgeraubt habe, die Antwort erhält, daß eben dies der Ort sei, wo das Geld liege. Die Komik des Erklärungsdialogs kommt dadurch zustande, daß Fragender und Antwortender ganz verschiedene Kontrastklassen für das Explanandum benutzen.) 8 Die argumentative oder konstruktive Beispielfunktion beschränkt sich in der Regel auf einzelne Aspekte eines Erklärungskonzepts. Sie ist zugleich ein konstruktives Mittel eines Systemaufbaus, der sich letztlich an Forderungen der Erklärungspraxis orientiert, was die Beispiele nur vermittelt ausdrücken, denn es handelt sich keineswegs um echte Anwendungsbeispiele. Den anwendungsorientierten Beispielgebrauch findet man insbesondere in Form von Fallbeispielen, wie sie im Zusammenhang mit theoretischen Erklärungen auftreten. Bei Fallbeispielen handelt es sich um realistische theorierelevante Erklärungsfälle, die durch methodologische Erklärungskonzepte rekonstruiert werden, durch die die Fruchtbarkeit der Konzepte getestet wird. Die Beispielrekonstruktion dient mitunter auch der weiteren Ausformung eines erst in Umrissen vorliegenden Erklärungskonzepts. Auf Fallbeispiele von 7 8
Schurz 1988, 26f. van Fraassen 1988, 54.
Gerhard Terton: Beispiele in der methodologischen Erklärungsdiskussion
499
der genannten Art stützt sich insbesondere das auf die Modellierung theoretischer Erklärungen ausgerichtete Erklärungskonzept von Ph. Kitcher. Kitcher befaßt sich mit der erklärenden, bzw. vereinheitlichenden Funktion von Erklärungsmustern in den Forschungsprogrammen von Newton und von Darwin. Im Anschluß daran schlägt er einen Begriff des generellen Argumentmusters vor, der in beiden Forschungsprogrammen wiederum analytisch eingesetzt werden kann. Dabei wird im Falle von Darwin ein plausibler Grund angegeben, weshalb sein Programm trotz gering entwickelter Prognosefunktion sich von Anbeginn erfolgreich durchgesetzt hat. Kitcher erklärt dies durch die im Darwin-Programm von Anfang an vorhandenen Erklärungsskizzen. „Indem Darwin aufzeigt, wie ein spezifisches Merkmal für eine spezifische Art von Vorteil sein würde, deutet er die Erklärung der Entwicklung dieses Merkmals jener Art an und gibt damit den Entwurf eines Arguments, welches das allgemeine Muster instanziiert." 9 Auf diese Weise wird die Fruchtbarkeit des Kitcherschen methodologischen Erklärungskonzepts nachgewiesen, denn es liefert Antworten auf Fragen, die zuvor nur unzureichend geklärt waren. Die Bearbeitung eines Fallbeispiels fordert stets die Anwendung eines kompletten Erklärungskonzeptes. Aus allgemein methodologischer Sicht sind Fallbeispiele deshalb wohl am ehesten als intendierte Anwendungen des jeweiligen Konzepts, für die sie als Fallbeispiele ausgewählt worden sind, zu verstehen. Dabei konzentriert man sich zunächst auf paradigmatische Anwendungsfälle. Diese dienen dann als Muster bei der Erweiterung der Anwendungsmenge. Sie haben eine heuristische Funktion für das Auffinden weiterer Beispielfälle. Unabhängig davon läßt sich jedoch relativ klar entscheiden, ob ein ausgewählter Fall als Anwendung des Konzepts in Frage kommt oder nicht, denn jede Anwendung des Konzepts muß zugleich ein Modell dieses Konzepts sein. Insofern gibt es hier immerhin relativ klare Kriterien für die Zuordnung zur Beispielmenge. Beispielfunktionen im Wittgensteinschen Sinne findet man insbesondere im methodologischen Erklärungskonzept von St. Toulmin. Ein Grundbegriff des Toulminschen Konzepts ist der Begriff des Erklärungsideals. Erklärungsideale sind nach Toulmin undefinierbar und nicht weiter erklärungsbedürftig. Sie gelten als Standards der Verständlichkeit und leiten unsere Vorerwartungen beim Erklären. Nach Toulmin lassen sich Erklärungsideale ausschließlich paradigmatisch bestimmen. Im Falle des Aristotelischen Ideals der natürlichen Bewegung ist ein solcher Beispielfall durch das Bild eines von einem Pferd gezogenen Wagens repräsentiert, bei dessen Bewegung Widerstand zu überwinden ist. Damit ist Bewegung ein Vorgang bei dem sich Kräfte und 9
Kitcher 1988, 205.
500
Section 3: Philosophy of Science
Widerstände ausgleichen. Galileis Bewegungsideal orientiert sich am Paradigma eines Schiffes auf ruhiger See, von dem man sich vorstellen soll, daß der Widerstand gegen seine Bewegung langsam gegen Null geht, so daß es seine ursprüngliche Bewegung unverändert beibehält. Demgegenüber bestimmt Newton sein dynamisches Ideal durch das Paradigma eines Körpers „ ... der sich mit gleichmäßiger Geschwindigkeit auf einer euklidischen Geraden bewegt . . . " 1 0 Auf diese Weise zeigt sich, daß mit abstrakter werdenden Theorien die paradigmatischen Beispiele ebenfalls abstrakter werden, so daß die Anschaulichkeit keineswegs ein notwendiges Merkmal für eine Beispielfixierung im Erklärungskontext ist. Die paradigmatischen Fälle legen nach Toulmin fest, welche Art von Bewegung man aus der Sicht der Theorie von einem Körper erwartet. Sie dienen ihm zugleich zur Bestimmung der zu erklärenden Phänomene. Zum Zwecke der Beispielcharakteristik ist ein hoher rekonstruktiver Aufwand nötig. So ist es erforderlich, daß die in den Theorien üblichen Erklärungspraktiken genauer analysiert werden. Die paradigmatischen Beispielfälle lassen sich nur selten in vollendeter Form einfach aus dem theoretischen Kontext aussondern.
4.
Abschließende Bemerkungen
Damit beenden wir unseren Exkurs über den Beispielgebrauch in der methodologischen Erklärungsdiskussion. Bei Kitcher und Toulmin wurde deutlich, daß die Verwendung von Beispielen insbesondere durch den ErklärungsbegrifF geprägt ist, der den jeweiligen Erklärungskonzepten zugrunde liegt. Darüber hinaus wurde ersichtlich, daß die Beispielverwendung in den Konzepten zugleich allgemeinen methodischen Zwecken folgt. Solche Zwecke sind: (1) die illustrative Verwendung, (2) die argumentative bzw. die rekonstruktive Verwendung, (3) die begriffskonstituierende Verwendung (im Sinne von begrifflichen Differenzierungen und Präzisierungen sowie im Sinne von familienbildenden paradigmatischen Beispielen), (4) die anwendungsorientierte Verwendung (im Sinne von konzeptbegründenden Daten und von Fallbeispielen). Dabei treten echte Fallbeispiele erst in einer relativ späten Phase der Entwicklung der Erklärungsdiskussion auf, illustrative Beispiele begleiten die Diskussion von Anbeginn, argumentative Beispiele leiteten demgegenüber zumeist Richtungsänderungen in der Diskussion ein. Die Einteilung der Beispiele nach Arten ist eine Voraussetzung für eine sinnvolle Beispielbewertung, denn ein gutes oder weniger gutes Beispiel erhält diese Attributierung stets in 10
Toulmin 1981, 67.
Gerhard Terton: Beispiele in der methodologischen Erklärungsdiskussion
501
bezug auf d e n angestrebten Zweck. Eine solche B e w e r t u n g steht n o c h aus. Schließlich ist a n z u m e r k e n , d a ß bei einer genaueren A u s f ü h r u n g der hier n u r in Umrissen angedeuteten Beispieltypologie, die eingangs e r w ä h n t e ElementKlassebeziehung inhaltlich n o c h genauer aufgegliedert werden m ü ß t e , d e n n die als Beispiele interpretierten Elemente des Begriffsumfangs k ö n n e n in der Erklärungsdiskussion, wie sich zeigte, nicht n u r individuelle Gegenstände, s o n d e r n auch Fragen, Argumente, A r g u m e n t f o r m e n u n d sogar komplette, konkrete Erklärungstexte sein.
5.
Literatur
Die Pragmatik des Erldärens. In: Erklären und Verstehen in der Wissenschaft, hrsg. Gerhard Schurz, München 1988. H E M P E L , C A R L , G.: Erklärung in Naturwissenschaft und Geschichte. In: Erkenntnisprobleme in der Wissenschaft, hrsg. Lorenz Krüger, Köln/Berlin 1970. H E M P E L , C A R L , G . : Aspekte wissenschaftlicher Erklärung, Berlin/New York 1 9 7 7 . K I T C H E R , P H I L I P : Erklärung durch Vereinheitlichung. In: Erklären und Verstehen in der Wissenschaft, hrsg. Gerhard Schurz, München 1988. L A M B E R T , K A R E L / B R I T T A N , G O R D O N , G . : Eine Einfuhrung in die Wissenschaftsphilosophie, Berlin/New York 1991. S C H U R Z , G E R H A R D : Wissenschaftliche Erklärung, Ansätze zu einer logisch-pragmatischen Wissenschaftstheorie, Dissertation, Graz 1983. S C H U R Z , G E R H A R D : 40 Jahre nach Hempel-Oppenheim. In: Erklären und Verstehen in der Wissenschaft, hrsg. Gerhard Schurz, München 1988. T O U L M I N , S T E P H E N : Voraussicht und Verstehen, Frankfurt a. M . 1 9 8 1 . W I T T G E N S T E I N , L U D W I G : Philosophische Untersuchungen, Frankfurt a. M. 1990. VAN F R A A S S E N , B A S :
MAX
URCHS
Der Bruch der starken Kausalität Angesichts der These vom „Versagen der Kausalität in chaotischen Systemen" stellt sich die Frage nach dem Verhältnis der Paradigmata Kausalität und Chaos. Die kausale Analyse beansprucht zumeist universelle Verwendbarkeit bei der Beschreibung offener dynamischer Systeme, und auch Chaos wurde in den letzten Jahren so gut wie überall gesehen, von jeder Art physikalischer Bewegung, über alle möglichen Formen chemischer und biologischer Evolution bis hin zum Wetter, zur Entwicklung am Aktienmarkt und dem Verhalten kosmischer Gebilde. Würden nun ernstlich kausale Zusammenhänge in diesem gesamten Bereich in Frage gestellt, so hätte man es mit einem Putsch gegen die etablierte kausale Wissenschaftsauffassung zu tun. Aber selbst, wenn sich die Rede von der versagenden Kausalität als „nicht so gemeint" herausstellen sollte, ist es interessant, die Vereinbarkeit der „Universalität des Chaos" mit gleichfalls universell wirkenden kausalen Vermittlung zu untersuchen. Anknüpfend an die berühmte Passage in David Humes Inquiry spricht man mitunter von der Ursache als einem Ereignis, gefolgt von einem anderen, wobei alle dem ersteren ähnlichen Ereignisse von solchen gefolgt werden, die letzterem ähnlich sind. Dieses Prinzip, kurz als " ähnliche Ursache - ähnliche Wirkung" apostrophiert, dient Hume als (alternative) Charakteristik der kausalen Vermittlung, nicht als deren bloße Beschreibung. Dieses sogenannte „Prinzip der strengen Kausalität" scheint ein Wesensmerkmal der Realität auszudrücken, das allen menschlichen Strategien der Planung und rationalen Verhaltens zugrunde liegt. Die Chaos-Theorie behauptet, daß dieses anscheinend höchst plausible Prinzip nicht universell gültig sei. Mehr noch, die problematischen Bereiche liegen keinesfalls abseits des wissenschaftlichen Interesses: das Prinzip der starken Kausalität versagt für das typische Langzeitverhalten natürlicher Prozesse. Dies verdient, näher erläutert zu werden. Es ist keineswegs leicht zu sagen, was genau man unter chaotischem Verhalten eines Systems versteht. 1 Parallel 1
Es geht natürlich um „chaotisches Verhalten" im modernen Sinne des Wortes. Erstmals wurde „Chaos" in dieser speziellen Bedeutung wohl von Maxwell gebraucht, als er vom „Molekularen Chaos" sprach. In der Literatur zur später so genannten Chaos-Theorie tauchte der Begriff 1975 im Titel einer Arbeit von Li und Yorke auf: „Period Three Implies Chaos".
Max Urchs: Der Bruch der starken Kausalität
503
zur enormen, medienwirksamen (mitunter aber auch geradezu kompromittierenden) Popularisierung des Themas, sind die Grundlagen der Theorie Gegenstand intensiver Forschung. Will man sich nicht auf eine hausgemachte Definition beschränken, etwa „Chaos is the deterministic production of behaviour that is unpredictable over long time" und mag man sich nicht in die nach wie vor grundlegende mathematische Diskussion stürzen, so bleibt nur eine eingrenzende Charakteristik des Gegenstandes. -
-
Selbst einfache deterministische Systeme mit nur wenigen Elementen können wirklich zufälliges Verhalten generieren. Diese Zufälligkeit ist wesentlich: sie tritt nicht nur für spezifische Anfangsbedingungen, sozusagen in Ausnahmefällen, ein, sondern typischerweise. Sie ist kein Ausdruck der Unwissenheit über den Zustand des Systems. Sie verschwindet nicht, wenn genauere Informationen über das betreffende System vorliegen. Die unvermeidlichen kleinen Ungenauigkeiten beim Feststellen des Anfangszustandes und bei der Modellierung (beruhend auf in jeder praktischen Messung enthaltenen Fehlern, Rundungen der Werte beim Eingeben der Daten und bei der Verarbeitung im Computer, sowie ferner resultierend aus der gewählten Form der Bewegungsgleichungen) werden in einem Maße verstärkt, daß die Berechnung des Langzeitverhaltens des Systems hinter einem bestimmten Zeithorizont unmöglich wird, also künftige Zustände des Systems nicht prognostizierbar sind. Insbesondere iterative Prozesse führen zu einem exponentialen Anwachsen der anfänglichen Unterschiede. Wie Edward Lorenz, einer der Pioniere der Chaos-Forschung, formulierte, tritt Chaos dann auf, wenn die Entwicklung des Fehlers in der Zeit dieselbe Größeneinheit erreicht, wie das originale Signal (die Voraussage "Am Donnerstag wird es 2 4 ° C ± 18°C warm" ist nutzlos). Allerdings ist für chaotische Systeme nur die Prognose des Langzeitverhaltens unmöglich, nicht aber die kurzfristige Vorhersagbarkeit ihrer Entwicklung. Das unterscheidet sie von echten Zufallssystemen. Die überwältigende Mehrzahl realer Systeme, darunter viele streng deterministische, zeigen diese Art Verhalten (und nicht etwa, wie man zuvor glaubte, nur eine zu vernachlässigbar kleine Gruppe). Solche Systeme reagieren sensibel auf kleine Differenzen der Anfangswerte. Ähnliche Ursachen haben keine ähnlichen Wirkungen. Werden einzelne Fälle (im Unterschied zu Klassen von Vorgängen) untersucht, so darf nicht davon ausgegangen werden, daß kleine Störungen („variable causes") in der Langzeitentwicklung des Systems ausgewaschen werden. Im Gegegenteil, sehr oft werden sie zu deutlich wahrnehmbaren Effekten aufgebaut. So führen „unmerkliche" Modifikationen der Randbedingungen zu anscheinend zu-
504
Section 3: Philosophy of Science
fälligen Veränderungen. Damit laufen Determinismus und Prognostizierbarkeit, die oft als synonym angesehen worden waren, auseinander. Nur das Letztere läßt sich mit dem Ausgeschlossensein von Zufall assoziieren. Folglich gibt es auch keine Unvereinbarkeit zwischen Determinismus und Zufall. Die Chaostheorie läßt vermuten, daß die Bereiche der Ausgangswerte für chaotische Systeme, die auf jeweils gleiche Endzustände hinauslaufen, extrem komplexe und subtile selbstähnliche, sog.fraktale Strukturen haben. Man sieht einer Situation nicht mehr an, was sich aus ihr ergeben wird. Wer je eine „Videofahrt in die Strukturen des Apfelmännchens" unternommen hat, wird die klare Analogie sehen: genauer zu messen, heißt, den Maßstab zu vergrößern. Mit jeder Vergrößerung aber erhalten wir dasselbe Bild der filigranen Komplexität dieser selbstähnlichen Gebilde. Keine noch so genaue Messung fuhrt uns in „sichere" Bereiche: stets wird sich in unmittelbarer Umgebung des Meßwertes eine Grenze finden, jenseits derer das Verhalten des Systems sich signifikant ändert.
-
Natürlich ist es der zweite Punkt, der unser besonderes Interesse erweckt. Der Versuch der formalen Charakteristik kausaler Beziehungen in chaotischen Systemen führt jedoch sehr rasch zu ernsthaften Problemen. Stellen wir uns eine Runde beim Dart-Spiel vor. Bei einem Wurf die Mitte der Scheibe zu treffen und ein anderes Mal mit dem Pfeil den Wirt zu verletzen sind sehr verschiedene Ereignisse. Angenommen, der Abwurfwinkel sei in beiden Fällen fast gleich gewesen. Kann man daraufhin sagen, die Ursachen der beiden so unähnlichen Ereignissen seien überaus ähnlich? Bedeutet dieses Beispiel eine Verletzung des Hume sehen Prinzips von der Ahnlichkeitsinvarianz der Kausalbeziehung? Dergleichen Beispiele wurden diskutiert, noch ehe die Chaos-Theorie als eigenständige Disziplin entstand. Maxwell erörtert den Fall eines Weichenstellers, der durch minimale Veränderungen der Stellhebel auf seinem Pult so unterschiedliche Wirkung wie eine Eisenbahnkatastrophe oder eben deren Ausbleiben hervorbringt. Es war klar, daß diese Fälle für eine Analyse des KausalbegrifFes relevant sind. Sehr naheliegend ist zunächst der Gedanke, daß, wenn sich aus ähnlichen Situationen völlig Verschiedenes ergibt, etwas Wesentliches übersehen wurde, daß die Ähnlichkeit nur scheinbar war. Getreu der assumption of relevant differenced suche man den relevanten Faktor, der zuvor übersehen wurde. Auf diese Weise lassen sich die verursachenden Ereignisse möglicherweise als letztendlich doch so verschieden herausstellen, daß dies zur Begründung der 2
"If an effect occurs in one case and a similar effect does not occur in an apparently similar case, there must be a relevant further difference." Vgl. Anscombe 1971, 63.
Max Urchs: Der Bruch der starken Kausalität
505
Unterschiedlichkeit ihrer Wirkungen hinreicht. Findet sich aber beim besten Willen kein relevanter unterscheidender Faktor, dann scheint die Gültigkeit des Kausalprinzips verletzt. In dieser Situation ist man versucht, „zu retten, was zu retten ist". Man schlägt mitunter vor, diejenige Form des Kausalprinzips, von dessen universeller Gültigkeit der Laplace'sche Dämon lebt {gleiche Ursachen — gleiche Wirkung), das „Prinzip der schwachen Kausalität" zu nennend Da sich die Antezedensbedingungen des Laplace'schen Dämons nie realisieren, ist die ihn beschreibende Aussage tautologisch und - wie alle Tautologien - leer. Das Postulat der universellen Gültigkeit schwacher Kausalität wäre allenfalls darum nützlich, weil es „prinzipiell unerklärlichen Phänomenen", Wundern und dergleichen mythischen und irrationalistischen Konzeptionen den Eingang in wissenschaftliche Theorien verlegt. Der Dämon wäre also zwar kein Gentleman - an einem Gespräch über das Wetter könnte er nicht teilnehmen — aber eine Art Türhüter vor dem Tempel der reinen Wissenschaft. Demgegenüber stünde ein weit stärkeres, von der klassischen Physik stillschweigend zugrunde gelegtes Prinzip: Ahnliche Ursachen haben ähnliche Wirkungen. Kleine Abweichungen in den Anfangsbedingungen wirken sich auf spätere Zustände des betrachteten Systems nur geringfügig aus oder werden gänzlich nivelliert. Nur, diese bequeme Intuition läßt sich nicht länger aufrechterhalten. Möglicherweise aber wird man der Schwierigkeiten dadurch Herr, daß man eine entsprechend modifizierte Variante des Begriffes „Ähnlichkeit" konstruiert? Ein erster Gedanke geht dann auf die metrische oder geometrische Ubereinstimmung von Merkmalen. Es geht aber ganz offenbar nicht um die exakte Übereinstimmung der Merkmale, um die Nicht-Unterscheidbarkeit der gemessenen Werte. Dann würden nur gleiche Gegenstände als ähnlich herauskommen und der Begriff wäre für unsere Zwecke, nämlich Regularitäten festzustellen, gänzlich wertlos. („Ahnliche Gegenstände" sollen mehrfach vorkommen, sich in wiederkehrenden Sachlagen finden können.) Es geht aus ebendiesem Grunde auch nicht um bloße maßstabsgetreue Veränderung eines Objektes. Eine simple Übernahme des mathematischen Ahnlichkeitsbegriffes kommt deshalb nicht in Frage. Es geht vielmehr um eine „fuzzy Übereinstimmung", um Merkmale, deren Abweichungen innerhalb einer gewissen Toleranz liegen. Man versuche, diese „Toleranzschwelle" präzise zu fassen und man sieht sich sofort mit einem drohenden Zirkelschluß konfrontiert. Selbst wenn es gelingt, den Zirkel zu vermeiden, führt 3
Aufgrund der völligen epistemischen Fruchtlosigkeit dieser Kausalkonzeption scheint der dafür geprägte (wenngleich nicht durchgehend so benutzte) Name ganz passend.
506
Section 3: Philosophy of Science
dieser Ansatz rasch zu Problemen. Manche Merkmale eines Gegenstandes (etwa eines menschlichen Gesichtes) können sich beispielsweise unter wechselnder Beleuchtung und aus verschiedenen Blickwinkeln betrachtet bis zur Nicht-mehr-Wiedererkennbarkeit verändern. Der uns interessierende Ähnlichkeitsbegriff sollte aber zumindest gleiche Gegenstände als einander ähnlich herausstellen. Eine auf metrischer oder geometrischer Ähnlichkeit beruhende Definition von Ähnlichkeit wäre also zu eng. Der scheinbar naheliegende Ausweg, sich auf ausgewählte, relevante Merkmale zu konzentrieren, fuhrt jedoch wiederum in den Sumpf des circulus vitiosus, wenn auch erst nach Durchschreiten einer etwas längeren Schlucht. Wie nämlich will man „relevant" anders verstehen, als „Einfluß habend", „wirksam seiend", „effizient"? „Relevant" erhält also in diesem Zusammenhang eindeutig einen kausalen Aspekt. Das ist ausgesprochen unschön für einen Grundbegriff der angestrebten Explikation von Kausalität. Möglicherweise ist die Sache aber auch viel einfacher. Es wäre Hume vielleicht zuzutrauen, seine Abneigung gegen reale Kausalität in einer — aus seiner Sicht - witzigen Definition darzutun: Wer denn durchaus immer noch wissen will, was eine Ursache ist, wohlan, so hat er eine Definition, die seiner Halsstarrigkeit angemessen ist. Etwas besseres als diese zirkuläre Erläuterung bekommt er nicht.4 Warum also sollte man nicht das ganze Unternehmen schulterzuckend aufgeben und konstantieren: Die „Hume'sche Definition" funktioniert nicht. Ereignisse sind gerade dann ähnlich, wenn ihre Folgen zu ein und derselben Klasse gehören. Ähnlich ist, was dem gleichen Zweck dient, zum gleichen Effekt fiihrt. Der Begriff der Ähnlichkeit von Ereignissen ist wesentlich kausal gefärbt und mithin zur Explikation von Kausalität ungeeignet. Ähnlichkeit (von Ereignissen) bedeutet immer kausale Ähnlichkeit. Dann ist Humes These schlicht tautologisch, und ihr „Bruch" ist ein Mißverständnis. Ist man zu einer so radikalen Entscheidung nicht bereit, so sollte jedenfalls der berüchtigte wirbelsturmerzeugende Schmetterling am Amazonas, der in einer alternativen Welt gerade noch rechtzeitig von einer Spinne gefangen wird, die Problematik deutlich machen. Gesetzt, eine konkrete Kausalanalyse ergäbe, Der Spaß bestünde natürlich darin, daß Humes Nachfolger mit hohem intellektuellem Einsatz einen Sinn daraus zu machen suchten und dafür die aussichtslose Explikation von Ähnlichkeit individueller Ereignisse ohne Bezug auf kausale Momente in Angriff nahmen. Wie oft findet man in der Literatur den Vorwurf, der Autor laufe bei seiner Definition von .Ähnlichkeit" Gefahr, einen logischen Zirkel zu begehen, da er doch kausale Momente zur Beurteilung von Ähnlichkeit heranziehe, wobei er anschließend den Begriff .Ähnlichkeit" zur Explikation des Kausalnexus nutzen will.
Max Urchs: Der Bruch der starken Kausalität
507
daß der Schmetterling tatsächlich die letztendliche Ursache für den Wirbelsturm in Boston/Massachusetts wäre. Dann liegt hier offenbar so etwas wie ein „physikalischer Kategorienfehler" vor: Das Flugverhalten einzelner Schmetterlinge ist nie die Ursache konkreter Wirbelstürme, beide Typen von Ereignissen haben sozusagen nicht miteinander zu tun. Aber selbst mit einer so exotischen Kausalvorstellung dürfte es schwerfallen, das Hume'sche Prinzip zu bewahren. Der zu definierende Ähnlichkeitsbegriff müßte die Gesamtsituation auf den beiden amerikanischen Kontinenten einzig anhand einer Episode im Leben eines Schmetterlings hinreichend klar unterscheiden. Wir wollen versuchen, das Gefühl der Unangemessenheit zwischen dem Ereignis Wirbelsturm und seiner postulierten Ursache genauer zu fassen und nutzbar zu machen. Um einen solchen Zusammenhang kümmert sich weder der gesunde Menschenverstand, noch ist eine Naturwissenschaft für ihn zuständig. Die Meteorologie interessiert sich nicht ftir individuelle Schmetterlinge, und die Botanik hat nichts mit Wirbelstürmen auf entfernten Kontinenten zu tun. Ein Bild der Welt, in dem globale Wetterentwicklungen erfaßt sind, ist viel zu grobkörnig, um auch Schmetterlinge zu zeigen. Kausalzusammenhänge bestehen zwischen bestimmten Entitäten, welche im Allgemeinen - namentlich seit Hume - als Ereignisse verstanden werden. Überlegungen zur Begründung der kausalen Logik führen somit folgerichtig auf die Frage: „Was ist ein Ereignis?" Ein ftir unsere Zwecke passender Ereignisbegriff wurde in Urchs (1994, 387ff.) expliziert. Der Begriff „Ereignis" hat gemäß dieser Definition nur Sinn, wenn er als „Ereignis bezüglich eines bestimmten epistemischen Subjektes" verstanden wird. Wie zwischen Sachverhalten allgemein, so können auch zwischen Ereignissen bestimmte Beziehungen bestehen: raum-zeitliche, kausale und andere. Aus der strikten Bindung des Ereignisbegriffes an ein epistemisches Subjekt ergibt sich, daß auch alle Beziehungen zwischen Ereignissen auf epistemische Subjekte zurücklaufen. Insofern ist es aus dieser Sicht berechtigt, von einer „epistemischen Komponente kausaler Zusammenhänge" zu sprechen: gerade in dem Sinn, in welchem dann beispielsweise auch räumlichen Beziehungen eine epistemische Komponente zukommt. Eine solche Redeweise sagt also noch nichts über charakteristische Merkmale der kausalen Beziehung. Vor allem bedeutet sie nicht, daß kausale, zeitliche usw. Verhältnisse in der Wirklichkeit etwa gar nicht vorhanden seien, sondern nur vermittels des epistemischen Subjekts Existenz besäßen. All diese Beziehungen, auch die kausalen, existieren real. Sie kommen im Beobachtungsrahmen des epistemischen Subjekts aber sozusagen „an die Oberfläche". Kausalzusammenhänge werden nicht etwa vom epistemischen Subjekt zu Ordnungszwecken oder
508
Section 3: Philosophy of Science
wozu auch immer auf die Wirklichkeit projiziert - sie leuchten vielmehr aus der realen Welt heraus und erscheinen im Weltbild des epistemischen Subjekts. Innerhalb einer auf dieses Ereigniskonzept gestützten KausalaufFassung läßt sich auf natürliche Weise erklären, warum die Rolle des Kausalnexus im Laufe der historischen Entwicklung mancher Wissenschaftsdisziplinen sehr unterschiedlich eingeschätzt wird: Auf einem zunächst naiven Stand naturwissenschaftlicher Anschauung, d. h. bezüglich eines epistemischen Subjekts, dessen Beobachtungsraster durch schwache Filtrationen und wenige Fokussierungen charakterisiert ist, wird es mitunter unmöglich sein, über die im Weltbild chaotisch erscheinende Ereignisstruktur mehr als lediglich universelle Wechselwirkung zu konstantieren. Mit wachsender Abstraktion, also durch immer umfassenderes Vernachlässigen und Ausfiltern von Eigenschaften und Beziehungen der beobachteten Objekte „in der sich weiterentwickelnden Theorie" nimmt die Gerichtetheit und Ordnung in der Ereignisstruktur zu und bestimmte Zusammenhänge treten hervor, darunter auch kausale. Bei noch weiterem Anheben der Abstraktionsebene hat man es schließlich mit Objekten zu tun, deren Eigenschaften und Beziehungen durch — bezüglich des epistemischen Subjekts - analytische Sätze beschrieben werden. In einer derartigen Theorie, d. h. bezüglich eines solchen epistemischen Subjekts, gibt es keine empirischen Sachverhalte und folglich auch keine Ereignisse. Auf einer solchen Abstraktionsebene verschwindet auch die Kausalität. 5 Für manche Spezialfälle iterierter Prozesse läßt sich das Wesen des deterministischen Chaos anhand der Herstellung von Blätterteig verdeutlichen, in anderen Situationen ist der Bezug auf ästhetisch ansprechende Julia-Mengen hilfreich. In jedem Fall stehen im Hintergrund solide (und schwere) mathematische Theorien: die Ergodentheorie und die Theorie der dynamischen Systeme. Dazu wird ein dynamisches System durch geeignete mathematische Modellierung im Phasenraum anhand seines Attraktors, der seinerseits durch Differentialgleichungen beschrieben ist, charakterisiert. Chaotisches Verhalten des dynamischen Systems ist dann bestimmt durch Eigenschaften des beschreibenden Systems von (nichtlinearen) Differentialgleichungen. Wie immer auch die mathematischen Einzelheiten der Geschichte aussehen, wichtig ist, daß sich von chaotischem Verhalten dynamischer Systeme erst nach 5
Die Überzeugung mancher Physiker, der Kausalnexus sei ein nutzloses Rudiment überholter physikalischer Konzeptionen, weist so gesehen lediglich daraufhin, daß die von ihnen untersuchten Modelle der realen Strukturen des uns umgebenden Raumes hinreichend abstrakt sind, um sie allein mittels funktionaler Abhängigkeiten zwischen ihren Elementen beschreiben zu können.
Max Urchs: Der Bruch der starken Kausalität
509
entsprechender mathematischer Modellierung sinnvoll reden läßt. Von einem realen System zu sagen, es zeige chaotisches Verhalten, setzt also voraus, daß eine Beschreibung des Systems auf vergleichsweise hoher Abstraktionsstufe vorliegt. Erst auf dieser hohen Abstraktionsstufe „scheint Chaos a u f - während die Kausalität auf dieser Ebene der mathematisierten Darstellung bereits verloschen ist.
Literatur G. Ε. M .
ANSCOMBE:
Causality and Determinism,
E. Sosa, ed.: Causation and Conditionals, M . P.
URCHS:
Cambridge 1971. Reprinted in: Oxford 1975, 6 3 - 8 1 .
Causal Priority: Towards a Logic of Event Causation. In: Analyomen
Proceedings of the 1st Conference Perspectives in Analytical G. Meggle/U. Wessels, Berlin/New York 1994, 3 8 6 - 3 9 6 .
Philosophy,
1:
hrsg.
Appendix Bericht des Präsidenten
Erweiterter Bericht des Präsidenten* der Gesellschaft für Analytische Philosophie (GAP) vor der 2. Mitgliederversammlung (MV) am 9. 9.1994, Universität Leipzig, Hörsaal 19
1. 2. 3. 4.
Entwicklung der GAP Tätigkeitsschwerpunkte GAP's Verhältnis zu anderen Gesellschaften Persönlicher Nachtrag
Berichtszeitraum: Vom 10.10.1991 bis zum 9. 9.1994
1.
Entwicklung der GAP
1.1. Vorstand. In Saarbrücken wurden am 10.10. 91 auf der 1. Mitgliederversammlung nach der Gründung der GAP in deren Vorstand gewählt: Präsident: Georg Meggle (damals Saarbrücken) Vizepräsidenten: Carlos Ulises Moulines (damals Berlin) Hans Julius Schneider (damals Erlangen) Schriftführer: Peter Steinacker (Leipzig) Schatzmeister: Henning Kniesche (Saarbrücken) In den gleichen Funktionen hatten Georg Meggle und Carlos Ulises Moulines bereits dem vorhergehenden (Gründungs-) Vorstand angehört. Der folgende Bericht wird vom ganzen Vorstand getragen. 1.2. Mitgliederzahlen. Von den derzeitigen GAP-Mitgliedern sind 1/3 habilitiert, 2/3 promoviert. An dem schon auf der ersten Mitgliederversammlung vor 3 Jahren begrüßten und wie wir, der Vorstand, weiterhin meinen, gesunden Verhältnis von 1/3 Studenten, 1/3 Habilitierten und 1/3 derzeit ,nur' Promovierten hat sich also nichts geändert. Das gilt auch fur die folgenden Relationen: Etwa 15% der GAPianersind GAPianerinnen. Etwa 1/5 der * „Erweitert", weil dieser Bericht auf der MV selber aus Zeitgründen nur auszugsweise vorgetragen werden konnte - freilich in allen Teilen, die für die Vorstandsentlastung relevant waren.
514
Appendix
Mitglieder sind Professoren. Der Frauenanteil daran: Gerade 1%. Weiterhin kommen etwas über 90% der Mitglieder aus deutschsprachigen Ländern. Stark geändert hat sich hingegen erneut die Mitgliederzahl. Seit der letzten Mitgliederversammlung sind 182 neue Mitglieder hinzugekommen. Exakt heute Mittag um 12.00 Uhr hat die Mitgliederzahl der GAP eine weitere Grenze überschritten (Na ja, analytisch genau müßte ich natürlich sagen: erreicht): Die GAP hat in diesem Moment exakt 400 Mitglieder. Die Gründung der GAP war 1990. 1994 ist die GAP eine der größten philosophischen Gesellschaften Europas.
2.
Tätigkeitsschwerpunkte
2.1. ANALYOMEN 1 und 2. Zum Glück ist das nicht nur eine Größe in quantitativer Hinsicht. Für das Niveau der GAP gibt es klare Belege. Vor allem zwei: ANALYOMEN 1 (9.-12,Oktober 1991; Organisation: Georg Meggle und Ulla Wessels) und ANALYOMEN 2 (7.-10. September 94: Organisation: Georg Meggle und Peter Steinacker). Für den ersten dieser Belege gibt es seit Anfang '94 selbst wiederum zwei Belege von genau nachprüfbarem Gewicht: ANALYOMEN 1 - (Die) Proceedings of the 1st Conference „Perspectives in Analytical Philosophy", erschienen in der neuen de Gruyter Reihe Perspektiven der Analytischen Philosophie. Und zweitens: Den ebenfalls in dieser ßiP-Reihe erschienen Proceedingsband des von Julian Nida-Rümelin geleiteten Workshops von ANALYOMEN 1: Praktische Rationalität. Für ANALYOMEN 2 sind die entsprechenden Belege in Vorbereitung. Die Nachbereitung und Proceedingsedition zu ANALYOMEN 1 und die Vorbereitung und Organisation von ANALYOMEN 2 selbst und deren diversen Komponenten (im Fall von ANALYOMEN 2 also: der Rahmenkongreß mit ca. 200 Vorträgen in 8 Sektionen, der von Heinrich Wansing geleitete Workshop Negation, das Round Table Gespräch Perspektiven der Analytischen Philosophie in Europa (Schwerpunkt: Ost- und Ost-MittelEuropa), die Kunstausstellung GEDANKEN-EXPERIMENT 94 und die Verleihung der beiden Preise Wolfgang-Stegmüller-Preis und GAP-Kunstpreis GEDANKEN-EXPERIMENT 94) - das waren die Haupttätigkeitsschwerpunkte der jeweiligen Kongreßorganisatoren sowie des GAP-Vorstands als ganzem. Da Sie einige Resultate unserer Bemühungen in diesen Tagen selbst vor Augen haben, gibt es zu diesem Arbeitsschwerpunkt nichts weiter zu sagen. Allenfalls dies: Sie sehen, selbst wenn Sie noch so genau hinsehen, in diesen Tagen nur die berühmte Spitze des Eisbergs.
Erweiterter Bericht des Präsidenten
515
2.2. Wolfgang Stegmüller Preis. 1993 war erstmals der von Margret Stegmüller gestiftete Wolfgang-Stegmüller-Preis zur Förderung des wissenschaftlichen Nachwuchses in der Analytischen Philosophie (kurz: WSP) öffentlich ausgeschrieben worden. Das Echo war stark. Es gingen 32 Vorschläge bzw. Bewerbungen ein - querbeet durch alle Gebiete der analytischen Philosophie. Für die Jury dieses Preises hatte der Vorstand 14 Kandidaten vorgeschlagen. Aus diesen wählten die Mitglieder der GAP in geheimer Briefwahl 6 Jurymitglieder aus. Der Vorstand erarbeitete einen Entwurf zu einer Ordnung
zur Wahl und Verfahrensweise der Jury des WSP. Die Jury des ersten WSP hatte sich in ihrem Vorgehen an dieser vorgeschlagenen Ordnung bereits selbst weitestmöglich orientiert. Neben den gewählten Jurymitgliedern gehörte der Jury daher auch der Präsident der GAP kraft Amtes an. Zur Jury gehörten somit: -
Ansgar Beckermann Andreas Kemmerling Wolfgang Lenzen Georg Meggle Julian Nida-Rümelin Peter Simons Wilhelm Vossenkuhl
Die Vorbereitungs-Organisation der Jurierung hatte der GAP-Präsident übernommen. In der Vorrunde war jede der 32 eingereichten Arbeiten von in der Regel 3, aber auf jeden Fall von mindestens 2 Juroren getrennt begutachtet worden. (Nun schätzen Sie mal, was das bei 32 Arbeiten, manche 800 Seiten dick, alleine fiir Kopier- und Portikosten mit sich bringt!) In die engere Wahl sollten nur diejenigen Kandidaten kommen, bei denen das Votum von allen mit ihnen befaßten Juroren übereinstimmend positiv war. Die letzte und somit entscheidende Auswahlsitzung fand am 9. Juli 94 in München statt. Die Jury wählte dort Georg Meggle zu ihrem Vorsitzenden. Auf dieser Auswahlsitzung wurde die bis dahin getroffene Vorauswahl einer eingehenden Uberprüfung unterzogen. Sie hielt dieser stand. Ich kann und will hier ganz klar und deutlich erklären: Das gesamte Auswahlverfahren war so konzipiert und organisiert, daß von den der Jury bekannten - und von dieser im übrigen explizit diskutierten - besonderen Beziehungen (wie ζ. B. Verwandschaftsverhältnisse, Lehrer-SchülerBeziehungen etc.) keine einzige auf irgendeiner Verfahrensstufe eine Rolle spielen konnte. Die von der Jury getroffene Entscheidung kennen Sie:
516
Appendix
Die Gesellschaft: für Analytische Philosophie (GAP) verlieh im Jahre 1994 den Wolfgang Stegmüller Preis zur Förderung des wissenschaftlichen Nachwuchses in der Analytischen Philosophie in Höhe von insgesamt D M 20 000 zu gleichen Teilen (in alphabetischer Reihenfolge) an: Bernd Walter Buldt (Bochum) in Auszeichnung seiner Arbeit Die Sätze von Gödel. Logische und philosophische Perspektiven Andre Chapuis (Granges-Paccot) in Auszeichnung seiner Arbeit Circularity, Truth, and the Liar Paradox Angelika Krebs (Frankfurt) in Auszeichnung ihrer Arbeit Ethics of Nature Martine Nida-Rümelin (München) in Auszeichnung ihrer Arbeit Farben und phänomenales Wissen Die Preisverleihung fand im Rahmen der Eröffnungsveranstaltung von ANALYOMEN 2 vorgestern Abend statt. 2.3. Entwicklung in den neuen Bundesländern Die GAP war von Anfang an kein bundesrepublikanischer Verein. Bereits ihre Gründungsinitiative war von Mitgliedern aus dem Osten und dem Westen Deutschlands gleichermaßen aufgegriffen und vorangetragen worden. Fast jeder, der um 1989 herum in der ehemaligen D D R im Bereich der Analytischen Philosophie arbeitete, war von Anfang an dabei. Fast jeder, der in der Analytischen Philosophie in den alten Ländern etwas zu sagen hat, gehört inzwischen dazu. Die Gründung der GAP hatte rasch eine sehr enge Vernetzung der deutschen Analytischen Philosophenszene bewirkt. Eine Folge davon: Man lernte sich eben nicht erst im Kontext von Evaluierungskommissionen kennen. Andererseits war wohl gerade dies einer der Gründe, weshalb Analytische Philosophen nicht (bzw. nicht noch) stärker in eben solche Kommissionen berufen worden waren. Unsere frühe deutsch-deutsche Vernetzung hatte viele Folgen, auf die hier nicht einzugehen ist. Aber eine möchte ich (persönlich) doch erwähnen dürfen: Zur GAP gehören, wie die meisten von uns wissen, auch einige von den Kollegen, deren prima facie überzeugend erscheinender Entlassungsgrund einer näheren Einzelfallprüfung, wie sie ja von vielen vernünftigen Leuten gefordert worden war und hie und da immer noch wird, wohl kaum standgehalten hätte bzw. standhalten würde. Und schon dieses Wissen mag erklären, weshalb GAPianer gegenüber raschen Verdikten auch in dieser Sache sich eher zurückgehalten haben. Ein paar Mitglieder der GAP wie des GAP-Vorstandes selbst waren in einigen der für die Entwicklung der Analytischen Philosophie in den neuen Bun-
Erweiterter Bericht des Präsidenten
517
desländern zweifellos wichtigsten Evaluierungs- und Gründungskommissionen tätig. Von daher ist in Sachen Analytischer akademischer Philosophie die Lage in den neuen Bundesländern mit der in den alten inzwischen durchaus vergleichbar: Es gibt da und dort Analytiker; und es gibt ein paar analytische Schwerpunkte oder zumindest gute Ansätze zu solchen. 2.4, Treffen des Vorstands Der Vorstand traf sich im Berichtszeitraum 5 mal: 14.02.92 in Erlangen; 19.02.93 in Berlin-Dahlem; 28.01.94, 06.09.94 und 09. 09.94 in Leipzig. Diese Sitzungen waren durchwegs von den Themen 2.1-2. 3 dominiert. Kaum zu glauben, aber wahr: Alle Entscheidungen konnten nach intensiven und zum Teil durchaus kontroversen Diskussionen letztlich einvernehmlich getroffen werden.
3.
GAPs Verhältnis zu anderen Gesellschaften
Ich beschränke mich hier, wie im 1. Bericht, wiederum auf die beiden Gesellschaften AGPD und ESAP. Würde ich auf die Aufnahme bzw. Vertiefung von Kontakten zu weiteren Gesellschaften eingehen wollen, so müßte ich von dem reden, wovon hier nicht zu reden ist: Von unseren Desideraten. 3-1. GAP und AGPD. Die letzte Mitgliederversammlung hatte entschieden, die GAP möge die korporative Mitgliedschaft in der Allgemeinen Gesellschaft jur Philosophie in Deutschland e. V. beantragen. Am 28. September 92 teilt auf den erfolgten Antrag der damalige AGPD-Präsident Hans Lenk erfreut mit, „daß der Vorstand der Allgemeinen Gesellschaft für Philosophie in Deutschland in seiner Sitzung vom 21. September 1992 einstimmig beschlossen hat, den Aufnahmeantrag der Gesellschaft für Analytische Philosophie als korporatives Mitglied in der Allgemeinen Gesellschaft für Philosophie in Deutschland anzunehmen." Die damit institutionell zum Ausdruck gekommene Verbindung hält seitdem gut. Der Präsident der GAP war Gast auf der Vorstandssitzung der AGPD im Oktober 93 während deren Kongreß in Berlin. Hans Poser, der derzeitige Präsident der AGPD, war zur letzten Sitzung des GAP-Vorstands vor ANALYOMEN 2 geladen. Er ist der Hauptvortragende in der Sektion 8 dieses Kongresses - und war zugleich (wie ich nachtragen darf) einer der engagiertesten Diskutanten in der heutigen Mtgliederversammlung. Damit soll keineswegs unser GAPsches AGPD-Kernproblem verschwiegen werden: Wie kann die Analytische Philosophie in den GutachterGremien speziell der DFG, deren Kandidaten über die AGPD nominiert
518
Appendix
werden, adäquat repräsentiert werden? Meine eigene Antwort: Erstens, indem sich die Analytiker an den entsprechenden Wahlen beteiligen und entsprechend analytisch jurierende Kandidaten wählen. (Dies zur nötigen Aktivität der Analytiker, speziell also der GAPianer selbst.) Zweitens, indem die AGPD dem durch die GAP repräsentierten Gewicht Rechnung trägt und so bereits bei der Nominierung der Kandidaten eben dieses Gewicht zählen läßt. (Das ist die nötige AGPD-Aktivität.) Kooperation ist weiter vernünftig. 3.2. GAP und ESAP. Vor drei Tagen gab es die erste von beiden Gesellschaften gemeinsam organisierte Veranstaltung: Das Round Table Gespräch mit dem Schwerpunkt: Analytische Philosophie in Ost- und Ost-MittelEuropa. Hierzu nur dies: Peter Steinacker und ich waren über diese Möglichkeit einer Einbettung unserer GAPschen (also, und das ist nun mal einfach ein Faktum: einer größtenteils deutschsprachigen Gesellschafts-) ANALYOMEN-2-Aktivität in einen deutlich europäischen Kontext glücklich. Und genau so verlief denn auch der lange und fruchtbare Abend. Die GAP selbst braucht sich vor europäischen oder gar weltweiten Perspektiven der Analytischen Philosophie gewiß nicht zu furchten. Im Gegenteil: Sie ist ein wirksames Gegengift gegen jedwede nationale oder sonstige Begrenzung des Denkens. Die ESAP hatte Frühjahr 93 ihren ersten großen Kongreß in Aix en Provence veranstaltet. Der GAP-Präsident war dabei. ESAP wird längerfristig so etwas wie einen Dachverband der verschiedenen länder- bzw. sprachbezogenen analytischen Gesellschaften sein, von denen die GAP bislang die unvergleichlich gewichtigste ist. In Hinsicht darauf fand ich es gut, daß der GAP-Präsident in Aix erneut in das steering committee der ESAP gewählt wurde. Wie schon bei ANALYOMEN 1 hielt auch aufANA2 der ESAP-Präsident am EröfFnungsabend ein Grußwort. Probleme zwischen uns? Ich sehe keine. Ein paar kleinere wird es geben, sobald die ESAP demnächst von ihrer bisherigen Politik „Viele Mitglieder keine Mitgliedsbeiträge" abgehen wird. Sollen dann die ESAPschen GAPianer bzw. die GAPschen ESAPianer zweifach Beiträge bezahlen? Und wenn nicht voll, wieviel stattdessen? Tritt GAP korporativ der ESAP bei? Impliziert GAPmembership ESAP-membership, but, of course, not vice versa? Na ja, das wird sich schon finden. Ansonsten: Es geht uns gold. *
Erweiterter Bericht des Präsidenten
519
Einer unserer schärfsten anfänglichen Kritiker meinte heute: Gut, daß es die GAP gibt. Das meinen wir auch. Der bisherige Vorstand der GAP hat also seine Pflichten erfüllt, seine Aufgaben gemacht.
4. Nachtrag.
Nachträge
Der auf der 2. Mitgliederversammlung gewählte neue Vorstand:
Präsident: Julian Nida-Rümelin (Göttingen) Vizepräsidentinnen: Hans Kamp (Stuttgart) Carlos Ulises Moulines (München) Max Urchs (Torun) Christiane Schildknecht (Konstanz) Geschäftsführer: Dietmar von der Pfordten (Göttingen) Schatzmeister: Henning Kniesche (Saarbrücken) Da sich die GAP ausdrücklich nicht als eine nationalstaatliche Organisation versteht, sondern den wissenschaftlichen Austausch und die Förderung der analytischen Philosophie - insbesondere im deutschsprachigen Raum - zum Ziel hat, wurde der Vorstand auf der Vorstandssitzung am 18. November 1995 durch Kooptation um Mitglieder aus Österreich und der Schweiz erweitert. Aufgrund der Satzung gehören diese Mitglieder dem „erweiterten Vorstand" an. Die beiden kooptierten Mitglieder sind: Gerhard Schurz (Salzburg) und Eduard Marbach (Bern). Persönlicher Nachtrag. Ich danke meinen Kollegen und Kolleginnen aus dem ersten wie aus dem derzeitigen GAP-Vorstand für ihre prima Zusammenarbeit. Am meisten den dreien, die mit mir zusammen am meisten zu tun hatten: Ulla Wessels, Henning Kniesche und Peter Steinacker. Dito allen, die die beiden ersten Vorstände bei unserer Aufbauarbeit so oder so unterstützt haben. Schön, daß Ihr mitgemacht habt! Macht's gut - und lebt wohl!
Indices
Index of Names
This index refers to all of the three volumes of Analyomen 2, with the various volumes being specified by roman numerals {I, II, and III). Abel, G. I 460; II 3f., 6, 8, 1 If., 79, 84 Abramsky, S. I 135 Achinstein, P. I 343f. Ackrill, J. L. 1 1 3 7 1 - 3 7 3 Albert, Η. I 223 Alchourron, C. Ε. I 70, 75, 144 Alexander, S. II 443 Alexy, R. Ill 252, 254, 256, 258, 350f. Allais, Μ . Ill 339 Allen, W. Ill 27 Alston, W. P. I 2 6 1 ; I I I 3 6 8 Anderson, A. R. I 297 Anderson, P. I 375 Anduschus, Μ . II 13 Anscombe, G. Ε. Μ . I 504; II 224; III 43, 414 Apel, K.-O. II 211; III 468 Aqvist, L. I 94 Aristoteles I 24, 27, 160; II 31, 38, 270, 277, 3 6 9 - 3 7 5 , 427, 463; III 84-91, 235, 2 8 1 - 2 8 3 , 288, 290 Aronson, J. I 409 Augustinus I 18; III 230, 429 Austin, J. L. I 16, 2 2 6 - 2 2 9 ; II 161f. Ayer, A. J. II 219; III 553 Bachelard, G. Ill 543 Bacon, F. Ill 543f. Baker, G. P. II 29, 111 Balzer, W. I 361, 4 4 l £ ; III 519 Bandemer, Η. I 79, 82 Barr, W. F. I 366 Barry, B. 111322,381 Barwise, J. I 87, 183, 296; II 302f„ 306, 311 Baumann, P. Ill 4 1 3 ^ 1 8 Bayes, Τ. Ill 494 Bealer, G. I 297
Becke, C.-P. II 23, 29 Beckermann, Α. II 439 Bedford, Ε. Ill 367 Beitz, C. Ill 2 1 2 - 2 1 8 Bell, D. II 37 Belnap, N. D. I 132-134,230, 297; II 51 f. Benkewitz, W. I 292 Bennett, J. I 317; II 377 van Benthem, J. I 148; II 60, 353, 355 Bergmann, Ε. III 541 Berlin, I. III 320 Bernays, P. I 32, 220 von Bertalanffys, L. Ill 96 Beyer, C. 1 1 5 Bickerton, D. II 86, 90, 92f. Bierwisch, Μ . 1 1 1 6 Bigelow, J. II 460; III 189 Birkhoff, G. I 69 Bischof, Ν. II 93 Bittner, R. I 238 Black, Μ . II 254 Blackburn, S. II 165, 170 Block, Ν. Ill 50, 128 Bloomfield, L. II 283 Bochvar, D . A . 1 1 1 6 Bohr, Ν. I 351f., 445, 447f. Boltzmann, L. Ill 96 Bolzano, Β. 116, 19f., 24, 131, 1 4 8 - 1 5 5 ; II 427; III 4 9 0 - 4 9 8 Borges, J. L. 1 1 6 Boyd, R. I 440 Brachmann, R. J. Ill 452 Brandl, J. L. II 29 Brandt, R. 111 2 7 0 , 3 9 1 , 3 9 3 Bratman, Μ . Ill 173, 178, 269 Brendel, Ε. III 529 Brentano, F. II 228, 427; III 3f., 95 Bricker, P. 111381,385
524
Index of Names
Brittan, G. I 495 Broad, C. D. Ill 306 Bromberger, S. I 485 Brooks, V. Ill 570 Broome, J. Ill 340f. Brown, Η. I. I 443 Brüning, J. III 41