197 103 15MB
German Pages 564 [568] Year 1995
Logik und Mathematik
Perspektiven der Analytischen Philosophie Perspectives in Analytical Philosophy Herausgegeben von Georg Meggle und Julian Nida-Rümelin
Band 5
w DE
G Walter de Gruyter · Berlin · New York 1995
Logik und Mathematik Frege-Kolloquium Jena 1993 Herausgegeben von Ingolf Max und Werner Stelzner
w DE
Walter de Gruyter · Berlin · New York 1995
® Gedruckt auf säurefreiem Papier, das die US-ANSI-Norm über Haltbarkeit erfüllt.
Die Deutsche Bibliothek — CIP-Einheitsaufnahme Logik und Mathematik / Frege-Kolloquium, Jena 1993. Hrsg. von Ingolf Max und Werner Stelzner. — Berlin : de Gruyter, 1995 (Perspektiven der analytischen Philosophie ; Bd. 5) ISBN 3-11-014545-6 NE: Max, Ingolf [Hrsg.]; Frege-Kolloquium ; GT
© Copyright 1995 by Walter de Gruyter & Co., D-10785 Berlin Dieses Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Ubersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen Printed in Germany Druck: Arthur Collignon GmbH, Berlin Buchbinderische Verarbeitung: Lüderitz & Bauer, Berlin Einbandentwurf: Rudolf Hübler, Berlin
Vorwort Vom 6. bis 8. Oktober 1993 fand in Jena das Frege-Kolloquium „100 Jahre Grundgesetze der Arithmetik" statt. Dieses Kolloquium hat mit über 100 Teilnehmern aus 17 Ländern Europas, Amerikas und Asiens eine rege Beteiligung erfahren. Mit dem zweibändigen Werk Grundgesetze der Arithmetik (Band 1: 1893, Band 2: 1903) krönte Gottlob Frege seine Bemühungen um Realisierung des logizistischen Programms, die Mathematik (und als ersten Schritt dazu die Arithmetik) als Zweig der reinen Logik zu entwickeln. Grundlegung der Mathematik verstand sich für Frege nicht als Entwicklung einer philosophischen Attitüde zur Mathematik, sondern als Einlösung des Anspruchs, die Mathematik auf einen festen, unerschütterlichen Grund zu stellen, den der logizistischen Auffassung nach nur die Logik liefern konnte. Aber in Freges Hauptwerk Grundgesetze der Arithmetik fallen Vollendung und Scheitern eines bedeutenden Wissenschaftsprogramms in kaum zu übertreffender Tragik zusammen: Ist Frege im ersten Band der Grundgesetze unerschütterlich vom endgültigen Erfolg der von ihm gelieferten logizistischen Grundlegung der Mathematik überzeugt, muß er noch vor Erscheinen des zweiten Bandes 1903 die von Bertrand Russell entwickelte Zurückweisung dieses Anspruchs akzeptieren. Im Vorwort zum ersten Band der Grundgesetze feiert Frege die Unübertrefflichkeit und Unwiderlegbarkeit seiner logischen Begründung der Mathematik mit den Worten: „Und nur das würde ich als Widerlegung anerkennen können, wenn jemand durch die That zeigte, dass auf andern Grundüberzeugungen ein besseres, haltbareres Gebäude errichtet werden könnte, oder wenn mir jemand nachwiese, dass meine Grundsätze zu offenbar falschen Folgesätzen führten. Aber das wird Keinem gelingen." Die Betroffenheit Freges darüber, daß Russell gerade dies gelang, drückt Frege im Nachwort zum 2. Band der Grundgesetze folgendermaßen aus: „Einem wissenschaftlichen Schriftsteller kann kaum etwas Unerwünschteres begegnen, als dass ihm nach Vollendung einer Arbeit eine der Grundlagen seines Baues erschüttert wird. In diese Lage wurde ich durch einen Brief des Herrn Bertrand Russell versetzt, als der Druck dieses Bandes sich seinem Ende näherte." Und unzweifelhaft war es für Frege kein Trost, daß diese Widerlegung nicht lediglich eine von ihm persönlich zu verantwortende Schwäche seines logischen Systems betrifft: „Es handelt sich hierbei nicht um meine Begründungsweise im Besonderen, sondern um die Möglichkeit einer logischen Begründung der Arithmetik überhaupt."
VI
Vorwort
Die letzten 20 Jahre seines Lebens widmete Frege unterschiedlichen Versuchen, die erkannte Schwäche seines Begründungsversuchs zu beheben. Die Enttäuschung über die Erfolglosigkeit seiner Bemühungen hat Freges wissenschaftliches und persönliches Leben nach Erscheinen des zweiten Bandes der Grundgesetze entscheidend geprägt. Man würde der herausragenden Rolle Freges bei der Entwicklung von moderner Logik, Sprachphilosophie und Philosophy of Mind allerdings nicht gerecht, die Bewertung dieser Leistung allein unter dem Gesichtspunkt des Scheiterns seines logizistischen Programms vorzunehmen zu wollen. Gottlob Frege ist unzweifelhaft ein Wegbereiter auf bedeutenden Gebieten der Wissenschaftsentwicklung des 20. Jahrhunderts. Das gilt für die epochemachende Entwicklung der formalen Logik allgemein und speziell der philosophischen Logik, der Grundlegung und Philosophie der Mathematik, der Informatik und künstlichen Intelligenz, der modernen Linguistik und Sprachphilosophie sowie der in der analytischen Traditionslinie stehenden Philosophie, für deren Herausbildung und Entwicklung Freges Arbeiten unverzichtbare Quellen sind, Anregungen liefern und Maßstäbe für Begründungsstandards setzen. Daß Frege seine späten politischen Auffassungen diesen Begründungsstandards nicht unterworfen hat, sondern sich extrem nationalistischen, mitunter eindeutig antisemitischen, Zeitströmungen anschloß, ist sicher kein Argument gegen die von ihm entwickelte Logik, sondern eher Zeichen dafür, daß Frege nicht in der Lage oder nicht Willens war, seine überragenden analytischen Fähigkeiten gefühlsbetonter nationalistischer Frustration entgegenzustellen, die durch die Erfahrung des Scheiterns seines wissenschaftlichen Programms sicher noch gefördert wurde. Trotz seiner, für Vertreter der von ihm stark beeinflußten analytischen Philosophie so un typischen politischen Auffassungen, man denke nur an Bertrand Russell oder Freges Schüler Rudolf Carnap, bleibt Frege durch sein wissenschaftliches Werk untrennbar mit unser Jahrhundert prägenden logisch-philosophischen und wissenschaftlichen Entwicklungen verbunden, was auch durch die bemerkenswerte Beteiligung am Frege-Kolloquium 1993 dokumentiert wird. Mit dem Kolloquium 1993 ist im Vergleich zu den Kolloquien 1989 und 1991, deren Resultate in dem Band Philosophie und Logik. Frege-Kolloquien Jena 1989/1991 im Verlag Walter de Gruyter h Co. in der Reihe Perspektiven der analytischen Philosophie veröffentlicht wurden, eine veränderte logisch-philosophische Schwerpunktsetzung verbunden: Während auf den Kolloquien 1989 und 1991 sprachphilosophische Themen und die Philosophy of Mind dominant waren, setzte das Kolloquium 1993, ohne auf die genannten Themen zu verzichten, sowohl unter historischen wie auch systematischen Aspekten den Schwerpunkt auf das Gebiet der Grundlegung der
Vorwort
VII
Mathematik und der Philosophie der Mathematik. Unter systematischen Gesichtspunkten wird diese Schwerpunktsetzung durch die Behandlung moderner nichtklassischer Logiken in Verbindung mit der Diskussion logischphilosophischer Probleme der Formalisierung von Information ergänzt. Im Resultat kann auf ein Kolloquium mit außerordentlich hohem wissenschaftlichen Ertrag verwiesen werden, dessen Veröffentlichung breite Aufmerksamkeit von Philosophen, Logikern, theoretischen Linguisten, Informatikern, Grundlagenproblemen aufgeschlossenen Mathematikern und an der Entwicklung von Systemen künstlicher Intelligenz interessierten Wissenschaftlern beansprucht. Wir möchten dieses Vorwort nicht beenden, ohne uns für die durch den Verlag Walter de Gruyter, das Institut für Philosophie der Friedrich-SchillerUniversität Jena, die Deutsche Forschungsgemeinschaft und die Gesellschaft für analytische Philosophie (GAP) e.V. erhaltene Hilfe und Unterstützung zu bedanken. Unser Dank gilt allen Autoren für kooperative Zusammenarbeit bei der Gestaltung der Manuskripte und Herrn Torsten Heblack für Hilfe bei der Erstellung von Personen- und Sachwortregister.
Ingolf Max & Werner Stelzner Jena,
Februar
1995
Inhaltsverzeichnis TEIL I: Freges Logik und sein logizistisches Programm MICHAEL
DUMMETT
The Context Principle: Centre of Frege's Philosophy CHRISTIAN
3
THIEL
„Nicht aufs Gerathewohl und aus Neuerungssucht": Die Begriifsschrift 1879 und 1893 WOLFGANG
Uber die Architektonik von Freges Grundgesetzen die Entstehungszeit des zweiten Bandes HARTWIG
der Arithmetik
und
WILHELM
FRIEDRICH
WOLFGANG
68
LENZEN
Frege und Leibniz
82
SIMONS
A Theory of Complex Numbers in the Spirit of Grundgesetze
93
WOLENSKI
Logicism and the Concept of Logic JESÚS
112
PADILLA-GÁLVEZ
Die formale Arithmetik und die Begriifsschrift als Spiele RAINER
ULRICH
120
STUHLMANN-LAEISZ
Invarianztheoretische Überlegungen zu Freges Definition durch Abstraktion
130
MAJER
Frege's Non-Logical Basis of Arithmetic PAUL
58
NIEBEL
Gibt es einen Dualismus in Freges Quantifikationskonzeption?
JAN
49
STELZNER
Wahrheits- und Falschheitsfunktionen in der Begriffsschrift der Grundgesetze
PETER
38
FRANK
Freges Waagerechter und die Logik der BegrifFsumfänge WERNER
20
KIENZLER
138
RUSNOCK
Remarks on the Frege-Hilbert Dispute
150
χ
Inhaltsverzeichnis TEIL II: Philosophie und Semantik
H A N S JULIUS
SCHNEIDER
Begriffe als Gegenstände der Rede PAVEL
MATERNA
Logik und Begriff GERHARD
180
TERTON
Uber das Verhältnis von Beispiel und Begriff bei Frege und Wittgenstein ARTO
ROLF
201
GEORGE
Argument and Proof LOTHAR
211
KREISER
Freges außerwissenschaftliche Quellen seines logischen Denkens REINHARDT
MICHAEL-THOMAS
FERNÁNDEZ
249
TRETTIN
Frege und das Wahrheitsproblem VOLKER
JOCHEN
260
PECKHAUS
T h e Genesis of Grelling's Paradox
269
LECHNER
Ist Frege's Realitätsbegriff defizitär? WOLFGANG
281
KÜNNE
„Das Vorkommen des Wortes »ich« in einem Satze gibt noch zu einigen Fragen Veranlassung . . . "
291
KOTÁTKO
Frege's Sinn and Utterance Meaning MARIE
241
NOMOTO
Frege on Truth and Meaning
PETR
232
MORENO
Logical Laws and the Word "True"
KÄTHE
226
LISKE
Ist die Bedeutung einer Aussage ihr Wahrheitswert oder ein Sachverhalt?
KAZUYUKI
219
GROSSMANN
Frege's Fundamental Philosophical Mistakes
303
DUZÍ
Frege, Notational Attitudes, and the Problem of Polymorphism PETR
193
SIITONEN
Frege and Critical Thinking
Luis
165
314
KOLÁR
'Linguistic' Facts
324
Inhaltsverzeichnis
XI
TEIL III: Logik und Information J . MICHAEL DUNN
Gaggle Theory Applied to Intuitionistic, Modal, and Relevance Logics
335
M A X URCHS
Handling Inconsistent Information. Towards a Logic of Rational Discourse
369
SIEGFRIED GOTTWALD
Many-Valued Logic with Partially Sound Rules of Inference
385
G E R H A R D SCHURZ
Nonmonotonic Reasoning and its Relation to Probabilistic Reasoning
394
U W E SCHEFFLER
On the Ordering of a Causal Relation
408
KLAUS WUTTICH
Welche Negation vererbt die Wertlücke?
418
INGOLF MAX
Mehrdimensionale Gültigkeits- und Inkonsistenzbegriffe HELMUT
LINNEWEBER-LAMMERSKITTEN
Die vierwertigen Systeme der materialen Implikation DIETRICH
430 444
MARSAL
Formalization and Goedelization of Non-Circular Frege-Language ..
455
U W E MEIXNER
Nominalistischer Logizismus
460
P E T E R JANICH
Information als Konstruktion
470
T H O M A S ZOGLAUER
Der Informationsgehalt empirischer Modelle — zur Logik des semantischen Informationsbegriffs WITOLD
484
MARCISZEWSKI
Concepts-Processing as a Procedure of Analog-Digital Conversion and Digital-Analog Approximation
496
A N N A ZALEWSKA
An Interactive Prover for Gentzen-Like System
500
GIAN ARTURO MARCO
Data Dependencies for Grounded Fregean Logics
508
HEIKE WIESE
Zahl und Numerale. Analyse natürlichsprachlicher Numeralkonstruktionen
517
Personenregister
531
Sachregister
537
Autorenverzeichnis
551
TEIL I F R E G E S LOGIK UND SEIN LOGIZISTISCHES PROGRAMM
MICHAEL
DUMMETT
The Context Principle: Centre of Frege's Philosophy1 1
The Role of the Context Principle in Grundlagen
It is common among commentators upon Frege's work on the philosophy of arithmetic to express its aim as being to reduce arithmetic to logic; and this fits very well with his emphasis, in §4 of his first book on the subject, Die Grundlagen der Arithmetik, on the necessity, for his purpose, of defining arithmetical concepts, including that of number itself. In the opening words of Part I of his Grundgesetze der Arithmetik, Frege stated the aim of his Grundlagen slightly differently, namely as being to show that arithmetic is a branch of logic. That is certainly how he conceived it when writing the Grundlagen-, we shall see that it does not quite so aptly encapsulate the principal aim of Grundgesetze itself. In Grundlagen, Frege makes it plain that the context principle — the famous principle stated in §62 in the words "Nur im Zusammenhange eines Satzes bedeuten die Wörter etwas" — plays a central part in the argumentation of the book. The context principle is the most difficult idea in the whole of Frege's philosophy. It is picked out in the Introduction to Grundlagen as one of the three Grundsätze of the whole book; it is stated emphatically in §60; it figures in §62 as the key to the fundamental problem Frege announces at the opening o f t h a t section, the problem how a number can be given to us; and it is repeated in §106 as offering the only means whereby we can avoid a physicalist interpretation of number without falling into a psychologistic one. One might suppose at first that the context principle served as a justification for using contextual definitions. In fact, however, although he looks favourably on contextual definition in Grundlagen, he does not employ it in that book. In particular, he does not define the cardinality operator "die Anzahl, welche dem Begriffe F zukommt" contextually but explicitly, in terms of extensions of (second-level) concepts; it is, of course, by means of this cardinality operator that all terms for cardinal numbers (Anzahlen) are to be framed. The context principle serves, rather, as a guide to the 'This lecture stands on its own. In it I shall contradict a number of things I have said in print previously, some of them as recently as in Dummett (1991). It will therefore be pointless to try to reconcile what I say here with what I have written earlier.
4
Michael Dummett
conditions which must be satisfied by a correct explicit definition of the cardinality operator. We first seek a means of stating the condition for the truth of statements involving terms for cardinal numbers that does not presuppose an understanding of such terms — more specifically, of stating the truth-condition of identity-statements connecting them; it then becomes a criterion for a correct definition of the cardinality operator that that condition be derivable from it. The context principle also serves to supply an answer to the question "How are numbers given to us?". The question is framed in Kantian terms, but is not a purely epistemological one. If it were already clear that there are such objects as numbers, it would be proper to ask how we come to know of them; but at this stage Frege has yet to establish that there are such objects, and so the question is as much ontological as epistemological. How, then, can the context principle be used to answer it? According to that principle, in the formulation of §60, "es genügt, wenn der Satz als Ganzes einen Sinn hat; dadurch erhalten auch seine Theile ihren Inhalt". Frege equates the question concerning cardinal numbers with one concerning the content of terms for such numbers. His answer to the Kantian question is thus that it is in grasping the senses of sentences containing terms for numbers that numbers are given to us. The first of the two roles of the context principle is unproblematic. The second is much more debatable. How are we to evaluate it? The question demands an examination of the philosophical background to Frege's use of the context principle to justify reference to numbers, explain our knowledge of them and certify their existence.
2
The Distinction between Sinn and Bedeutung
Of the new ideas that Frege developed during the silent period from 1886 to 1890, and announced in the lecture Funktion und Begriff of 1891, virtually everyone would pick out as the most salient and the most important his distinction between Sinn and Bedeutung. The way he drew this distinction strikes us as displaying three significant features. These are: (i) that he ascribed Sinn to proper names strictly so called, as well as to other singular terms such as definite descriptions; (ii) that he extended the distinction to expressions of all logical categories, and followed a clear principle in deciding what their Bedeutungen should be taken to be: namely that the determination of the Bedeutung of any expression should be its contribution to the determination of the truth-value of any sentence in which it occurred; and (iii) that the systematic theory of Bedeutung provided a basis for explaining in what the Sinn of an expression should be taken to consist, namely the
The Context Principle: Centre of Frege's Philosophy
5
way in which its Bedeutung is given to a competent speaker of the language, and hence a means of distinguishing its Sinn from other ingredients of its linguistic meaning. These points strike us because Frege did not merely distinguish between Sinn and Bedeutung, but fashioned from these notions an articulated theory which amounted to the first serious theory of meaning in the history of philosophy. What we do not naturally regard as a significant feature of the theory, on the other hand, is that it draws a distinction between Sinn and Bedeutung for singular terms in general. Frege did not regard proper names, strictly so called, as belonging to a different logical category from definite descriptions, but classified both together under the general head of Eigennamen, or of what we may more cautiously call 'singular terms'; and that is the natural thing to do. It requires a special theory, such as that for which Russell is celebrated, to allow one to refuse to classify definite descriptions as singular terms; the natural thing is so to classify them, along with proper names in the strict sense. And, having so classified them, one is all but inevitably led to distinguish between the meaning or sense of a singular term and the object to which it refers. We need invoke no special explanation for anyone's doing this: it is, as it were, the default position. It is therefore no distinctive feature of Frege's theory that he should have drawn the distinction between Sinn and Bedeutung for singular terms in general, even if it be controversial to ascribe Sinn to proper names in the narrow sense — singular terms devoid of indexicality or logical complexity. Rather, the point from which it is natural to start an explanation of the distinction is as it applies to definite descriptions, as á preliminary to extending it to other expressions.
3
Significance and What Is Signified
This is undoubtedly a correct assessment of the contribution of Frege's theory of Sinn and Bedeutung to philosophy. It is therefore natural to see it as the way it presented itself to Frege himself when he originally arrived at it; but, in supposing this, we are gravely misled about how he had been accustomed to think before he made the Sinn/Bedeutung distinction. At no time in the period before 1891 had Frege in any way adopted what was called above the 'default position'. He did not make, even for definite descriptions, the distinction that seems so obvious to us between their meanings and the objects they are used to refer to; a distinction that is indeed obvious, and must, in some form or other, be acknowledged even by those who follow Russell in denying to definite descriptions membership of the category of singular terms. A Russellian must admittedly refuse to ascribe to a definite description the property of having an object as its Bedeutung, in the
6
Michael Dummett
Fregean sense; its contribution to the mechanics of the determination of the truth-value of a sentence in which it occurs does not, for a Russellian, consist in the simple identification of an object that it denotes, as does that of a genuine singular term. But, even for him, there will usually be such an object, and he will wish, even more resolutely than a follower of Frege's mature doctrine, as expounded in the period from 1891 to 1906, to differentiate both the object itself and the description's relation to that object from its meaning. Yet, obvious as the distinction is, Frege did not perceive it until after 1885. By the time of writing Grundlagen, he was insisting on a firm distinction between the sign and the thing signified, a distinction badly blurred in Begriffsschrift; but he was still quite oblivious to the distinction between the significance of an expression and the thing it signified. The two are run together in the single undifferentiated notion of Inhalt; that is why Frege said in Grundgesetze2 that he had formerly combined, under the title 'beurtheilbarer Inhalt', what he had subsequently learned to distinguish as truth-value and thought (the Bedeutung and Sinn of a sentence). In Grundlagen and in other early writings the words Inhalt and Bedeutung are in effect used interchangeably. Thus in §60 he first says that it is only in a complete sentence that the words have a Bedeutung, and then that it is through the possession of a sense by the sentence as a whole that its parts obtain their Inhalt. The word Sinn is a third near-synonym; Frege uses it particularly when he is speaking of definition or of fixing senses, but there is no distinction of principle between the Sinn of a sentence and its Inhalt. His arrival at the systematic distinction between Sinn and Bedeutung was his first recognition of the difference between significance and thing signified: his first recognition of any distinction between them. If we fail to grasp this, we shall not be hindered from understanding a large part of Grundlagen, but we shall misunderstand how Frege understood the context principle. The lucidity and cogency with which Frege wrote, the power of his intellect and the fruitful and innovative ideas he expressed make it extremely hard for us to recognise the presence in his thought before 1891 of this enormous flaw. One reason why we do not perceive this clearly is that Frege's failure to take account of what is for us a glaringly obvious distinction is very unobtrusive. There are very few passages in Grundlagen that provoke the immediate reaction, "Surely that confuses the meaning of the expression with the thing it is being used to refer to". And yet a careful examination of the book reveals that the distinction is utterly absent from Frege's manner of thinking. One indication is the fluctuating use of the word Begriff, apparently unnoticed by Frege. In many passages, he uses the term just as English speakers find it natural to use the word "concept", namely as applying to 2
Frege (1894), Volume I, §5, footnote 2; see also Preface, X.
The Context Principle: Centre of Frege's Philosophy
7
something that can be grasped and may be expressed by a word or phrase — in other words, to the sense of a linguistic expression; a well-known example occurs in §64, where Frege discusses how we attain the concept of a direction (of the direction of a line). But in equally many other passages, he uses it in a quite different way, as referring to a property possessed by external objects: that is, as applying to what, after 1891, he was to call the Bedeutung of a predicate or word for a property. An example of this occurs in §47, when he says that the sentence "All whales are mammals" states something objective and independent of our way of regarding things; not, however, about animals, but about Begriffe. He has earlier remarked (§26) that the botanist is stating something factual when he declares the number of petals that a flower has; and this, too, he is to classify as stating something about the Begriff petal of this flower. We have learned to adapt to the vagaries of Frege's use of the word Begriff in Grundlagen; it is with more of a shock that we read the footnote to §27. In that footnote, Frege emphasises the distinction between objective and subjective Vorstellungen, and complains that Kant used the term Vorstellung to refer to both. He remarks that he will himself subsequently use the term Vorstellung exclusively for the subjective variety; and we naturally, and quite correctly, understand him as meaning by "subjective Vorstellungen" what he normally called simply " Vorstellungen", namely items in the stream of consciousness such as mental images and sensations. We equally naturally understand him as meaning by "objective Vorstellungen" what he was later to call the Sinne of expressions, which he regarded as objective and not among the contents of the mind as are Vorstellungen. But, on this understanding, we receive a shock: for he then remarks that objective Vorstellungen can be divided into Gegenstände and Begriffe. That Begriffe can be considered by one who had not yet drawn the distinction between Sinn and Bedeutung as Vorstellungen in some 'objective' sense of the word " Vorstellung" is not too surprising; that would have been only natural in someone who as yet had no better than a tenuous grip upon the distinction between significance and thing signified. But that objects, Gegenstände, should be considered as objective Vorstellungen demonstrates that Frege did not then have even a tenuous grip on the distinction: either he had considered it and repudiated it, or he had never acquired a glimmering of it. He simply does not distinguish between an objective idea ( Vorstellung) and that of which it is the, or an, idea. That the remark is not merely a passing lapse is shown by what Frege says about numbers before and after reserving the word Vorstellung for its subjective sense from §27 onwards. In §12 he says that 100,000 might be called an Anschauung in the 'logical sense' he understands Kant as assigning to the term in his Logik; but he later speaks of numbers as Gegenstände (§56). The difference in terminology does not result
Michael Dummett
8
from Frege's having acquired an appreciation of the difference between an intuition (Anschauung) and what it is an intuition of: it is the consequence solely of his having decided to reserve the word Anschauung for a particular species of subjective Vorstellung, as the word Vorstellung had been reserved for subjective Vorstellungen in general. This great lacuna in Frege's thinking up to 1885 exposes the futility of the attempt to erect on the basis of the writings of Frege before 1891 a systematic theory of philosophical logic comparable to that which he subsequently elaborated and expounded in the celebrated essays from 1891 onwards and in Part I of Grundgesetze.3 No coherent philosophical system can ignore all distinction between significance and thing signified; the effect of doing so is to equate all things with meanings. In the terminology of Frege's mature (post1890) doctrine, it is indeed correct to say that all things are Bedeutungen. The theory has taken the sting out of the word "Bedeutung", however: all that is meant is that whatever we can speak of is a possible object of reference. In the untamed sense of "meaning", on the other hand, mountains are not meanings, people are not meanings, virtues are not meanings. It may certainly be coherently held that some expressions have significance but do not signify anything, because they are used for a different purpose: the concept of a syncategorematic expression is precisely that of a significant expression that does not serve to signify anything. The principle may be extended more widely than to expressions traditionally classified as syncategorematic. Those who inveigh against 'reification' are aiming to denounce the error of taking as signifying things words fulfilling a different function, though the term is less than happy, since it is difficult to say what ought to be allotted to the category of 'things'. Quine, contending that meanings ought not to be reified, was arguing that the word "meaning" should not be explained independently, but that certain phrases containing it, such as "has a meaning" and "has the same meaning as", needed to be explained as wholes. Russell's notion of 'incomplete symbols' demanded that the expressions so designated required a systematic account of their contributions to phrases in which they occurred. Some would deem it a mistake of Frege's mature logical theory, as advanced from 1891 onwards, that it assigned Bedeutungen to what he classified as 'incomplete' or 'unsaturated' expressions. But in no case can it be coherent to deny altogether that certain words or phrases serve to signify or refer to something non-linguistic, or to assimilate what they signify to the significance that they have in the language; and for this reason it is impossible to elicit from Frege's writings up to 1886 a system of philosophical logic comparable with that he expounded in the years after 1891, or even a tenable one. 3
Such an a t t e m p t is made by Baker/Hacker (1984), and by Shanker (1982) in his review of D u m m e t t (1981a) and (1981b).
The Context Principle: Centre of Frege's Philosophy
4
9
How Frege Interpreted the Context Principle in Grundlagen
The relation between the ideas Frege expounded in Grundlagen and the doctrines of the period from 1891 to 1906 has constituted the gravest problem for his interpreters. Above all, it has been the context principle that has troubled them most: the most various opinions have been voiced on the question. Since Frege never reiterated it after 1890 in anything like the same words, are we to suppose that nevertheless he maintained it, even though differently expressed? If he did, in which words are we to seek for its expression? Or should we conclude that he abandoned it? If he abandoned it, the whole architecture of his philosophy of arithmetic, in the form in which he held it at the time of writing Grundgesetze, must have differed totally from that which he had expounded in Grundlagen. At first sight, it seems that it must be so. Since, according to the context principle, if a sense is conferred on a sentence as a whole, its parts will derive their content from that, Frege was able in Grundlagen to equate the question how numbers are given to us with one concerning the content of numerical terms as they occur in sentences. His answer was thus that numbers are given to us in our grasp of the senses of sentences containing terms for numbers. The question how numbers are given to us has, as we saw, both an epistemologica! and an ontological force. If a distinction between significance and thing signified is acknowledged, the context principle would appear to answer only the epistemologica! question. If the 'Inhalt' of an expression were simply its sense, Frege's answer would explain how we come to attach senses to numerical terms, namely by attaching senses to sentences containing them; those component terms would then obtain their senses from our prior conferral of sense on each such sentence, taken as a whole. But, given a distinction between significance and thing signified, this would seem to get us no further than the endowment of numerical terms with senses. It would surely not justify us in assuming the existence of objects denoted by those terms; to answer the ontological question, some further argument would be needed. Frege saw no need for any further argument, however: he proceeded on the assumption that, once it had been shown how senses are to be conferred on sentences containing numerical terms, both the epistemological and the ontological questions had been answered. It follows, therefore, that he could make this assumption only because he did not distinguish between significance and thing signified. When Frege speaks in Grundlagen of either the 'Inhalt', or the 'Bedeutung' of an expression, he is referring simultaneously to what must be known in order to grasp what is said by means of a sentence
10
Michael Dummett
containing it and to its objective correlate in reality. In virtue of the context principle, a content or meaning can be secured for numerical terms by securing a sense for sentences containing them; and to secure them a content or meaning is to secure that there are numbers for them to mean or to be their contents.
5
Can There Be a Context Principle in
Grundgesetzel
If Frege's use of the context principle in Grundlagen rested on his failure to distinguish significance from thing signified, it lies to hand to conclude that in Grundgesetze, having distinguished them, he could no longer maintain the context principle. A number of specific arguments appear to support this conclusion. (A) The question whether Frege continued to maintain the context principle after 1891 appears on its face to be senseless. It seems natural to say that once he had split his earlier undiiferentiated notion of Inhalt into Sinn and Bedeutung, he could no longer adhere to the context principle as he had stated it in Grundlagen. He no longer meant by the words "Inhalt" and "Bedeutung", in terms of which he had formulated the principle in Grundlagen, what he had meant by them in that book: he could no longer mean by any expression what he had then meant by them. (B) If we do ask whether, in some modified form, the context principle survived Frege's drawing the distinction between Sinn and Bedeutung, our question appears to bifurcate, according as we concern ourselves with a partial survival of the principle as applied to Sinn or with a partial survival of it as applied to Bedeutung. (C) Once Frege had acknowledged that the possession by an expression of a Sinn did not guarantee it a Bedeutung, it seems that the most he could have maintained is that, by conferring a Sinn upon a range of sentences, we might thereby secure a Sinn for some constituent expression common to them: its possession of a Bedeutung would require a supplementary demonstration. (D) A striking feature of the context principle as Frege stated it in Grundlagen is the central role it allots to sentences. In the theory of Bedeutung as set forth in Grundgesetze, on the other hand, they do not form a distinct logical category, but are merely singular terms that happen to have t r u t h values as their Bedeutungen. This therefore appears to provide a conclusive reason why Frege could no longer maintain the context principle as one governing Bedeutung. (E) The most important objection of all is the following. The context principle, as it figures in Grundlagen, expresses a strongly internalist outlook. It implies that no question about the content of a linguistic expression can be posed or answered save from within language. We cannot stand in thought
T h e C o n t e x t Principle: Centre of Frege's Philosophy
11
outside language and from there view the relation of linguistic expressions to their correlates in reality, because our apprehension of the components of reality is always mediated by our thoughts as expressed in language; even when we refer demonstratively to what we perceive by the senses, our identification of the referent as an object depends upon the particular concept we are using to detach it from its environment. Any legitimate question in the formal mode concerning the content of an expression must therefore reduce to one in the material mode, that is, to a question about the t r u t h or falsity of one or more sentences containing the given expression. Hence, in determining what a term means or stands for, all that can or needs to be done is to settle the basis on which the truth or falsity of sentences in which it occurs is to be judged, rather than to establish a mental link between it and an object apprehended independently of language. However, whereas, in Grundlagen, Frege had been considering how terms for numbers could be introduced into an existing language, German, he had in Grundgesetze hit upon a means, not of standing outside language as such, but of standing outside the language of which he was treating. In the later book, he was discussing in a metalanguage, German, how to lay down the Bedeutungen of terms of a disjoint object-language, namely his symbolic language. In specifying in the metalanguage which objects the terms of the object-language refer to or denote, he was not mentally fastening on those objects independently of language, but employing the resources of the metalanquage to pick them out, and hence picking t h e m out independently of the object-language. The device of keeping o b j e c t language and metalanguage apart appears to remove the motivation for the internalist standpoint: questions about the Bedeutungen of terms of the object-language are metalinguistic questions, which need not reduce to ones about the truth of sentences of the object-language. (F) T h e characterisation of the context principle given under (E) appears to tally well with the thesis advanced by van Heijenoort and Hintikka, that, for Frege, semantics, and, with it, any proof of consistency, are impossibilities, as involving an account of language from outside language. 4 If this is a correct interpretation, how can Frege be thought to have maintained these 4 This interpretation was first advanced by van Heijenoort (1967). Characteristic passages from this essay are as follows. "Another important consequence of the universality of logic is that nothing can be, or have to be, said outside of the system. And, in fact, Frege never raises any metaystematic question (consistency, independence of axioms, completeness)" (p. 326). "Some statements that are (apparently) about concepts can easily be translated into the system . . . . The statements that resist such a translation are, upon examination, metasystematic" (note 5). "The universal formal language supplants the natural language" (p. 327). Hintikka (1988) expressed entirely similar views, an article deeply indebted to van Heijenoort, as its author acknowledges. "No general metalogic was, strictly speaking, possible for Frege", Hintikka states, and continues, "Likewise, model theory was impossible . . . . As metalogic is impossible, so is metalanguage" (p. 1);
12
Michael D u m m e t t
v i e w s at t h e t i m e o í Grundgesetzel
Admittedly, he did not, in that book
or e l s e w h e r e , a t t e m p t a n y p r o o f of t h e c o m p l e t e n e s s or e v e n s o u n d n e s s of h i s f o r m a l s y s t e m . N o t h a v i n g t h e c o n c e p t i o n of v a r y i n g i n t e r p r e t a t i o n s of s c h e m a t i c n o n - l o g i c a l c o n s t a n t s , a n d still less of v a r y i n g d o m a i n s , h e l a c k e d t h e m e a n s t o d e f i n e t h e s e c o n c e p t s . 5 B u t in P a r t I of t h e b o o k h e n o t o n l y e x p o u n d e d t h e s e m a n t i c s of h i s f o r m a l l a n g u a g e , b u t s e t it w i t h i n a g e n e r a l s e m a n t i c f r a m e w o r k , i n t h e f o r m of his t h e o r y of Bedeutung·, s e m a n t i c t h e o r y l a i d d o w n w h a t f o r m t h e Bedeutung
and this general
or s e m a n t i c v a l u e of
a n y e x p r e s s i o n of e a c h l o g i c a l t y p e w a s t o t a k e . If t h e F r e g e of
Grundgesetze
s t i l l h a d n o m o d e l t h e o r y , h e u n q u e s t i o n a b l y h a d a s e m a n t i c s of f o r m a l s y s tems.
M o r e o v e r , in V o l u m e I, §31, h e g a v e w h a t p u r p o r t e d t o b e a p r o o f
t h a t e v e r y w e l l - f o r m e d e x p r e s s i o n of h i s f o r m a l l a n g u a g e h a d a u n i q u e deutung;
Be-
if it h a d b e e n s o u n d , it w o u l d h a v e e s t a b l i s h e d t h e c o n s i s t e n c y of
the system.6
He thus appears to have repudiated the entire philosophical
f u r t h e r , "For Frege, there strictly speaking could not exist any problem of consistency" (p. 8). 'Strictly speaking, Frege made no use of schematic letters; what look like schematic letters in his logical formulas he explains as variables bound by tacit initial universal quantifiers. T h o u g h it is true t h a t the conception of varying interpretations is somewhat alien to Frege's general outlook, there would have been no inconsistency in his adopting it, contrary to Hintikka's statement t h a t for him "there is no sense in talking about . . . other models (interpretations) of our language" (op. cit., p. 2). Indeed, had Frege ever read Bernard Bolzano's celebrated definition of analyticity in §148 of his Wissenschaftslehre (1837), he would have heen naturally led to it. 6 Hintikka (1988, 8) quotes Frege's (1980, 37; German: 1976, 63) saying, in his letter to Hilbert of December 1899, "From the truth of the axioms it follows t h a t they do not contradict one another. There is therefore no need of further proof." T h e remark may easily· be jeered at; Hintikka's (1988, 10) ungrammatical observation "When Michael Resnik says . . . t h a t 'given the d a t a before him, Frege's criticism was completely justified', only establishes t h a t Resnik shares Frege's radical failure to appreciate Hilbert's way of thinking" is an example. Resnik is, however, quite right to view Frege's remark as in large degree defensible. Hilbert did not at that time conceive of a proof of consistency other t h a n one exhibiting a model. Frege's remark was to the effect t h a t consistency could be proved by appeal to the intended model. Some of his later remarks suggest t h a t he thought t h a t it could only be so proved; he could not accept Hilbert's idea of an a x i o m system t h a t h a d no intended model. There are, in any case, theories, such as elementary arithmetic, t h a t indisputably have an intended model. For them, no model could be more perspicuous than the intended one, to anyone who, like Frege, had no doubts, such as Hilbert later developed, about the meaningfulness of infìnitary quantification and hence of speaking of a model at all. But, however defensible Frege's remark, made only six years after Vol. I of Grundgesetze was published, does it not support the view of Hintikka and van Heijenoort t h a t he did not believe in the need for, or possibility of, consistency proofs? No, because axioms can be recognised as true only when the primitives involved in stating t h e m have been assured a Bedeutung. T h a t such a Bedeutung has been secured does in some cases require proof; and the purpose of the consistency proof in Grundgesetze was precisely to establish this for the primitives of that system. As Frege there presents the m a t t e r , a
The Context Principle: Centre of Frege's Philosophy
13
setting in which the context principle was framed. If the interpretation of van Heijenoort and Hintikka, according to which semantics is impossible, is correct for Grundlagen, it is surely wrong for Grundgesetze. (G) The thesis that questions of reference are internal to language invalidates all permutation arguments. If an account be given of the meanings of our words for natural numbers, it cannot be refuted by the observation, however sound, that the account would be equally satisfied if "0" meant 1, "1" meant 0, "2" meant 3, "3" meant 2 and so on; our only grasp on what the number 2 is derives from our understanding of the symbol "2" or the word "two", so that, if the account is correct, the fact that "2" does not mean 3 cannot be called in question. On the internalist view, all that determines the reference of the words of a language is contained in what the speakers of that language know; no external vantage-point can provide a deeper insight into it. In Grundgesetze, Volume I, §10, however, Frege uses a permutation argument to show that the Bedeutungen of value-range terms have not yet been fixed. This appears to imply that he had ceased to believe that questions of reference are internal to language. (A) to (G) make a formidable battery of arguments that the context principle did not survive as part of Frege's thought from 1891 onwards; 7 in face of them, who could be blamed for that conclusion? The conclusion is nevertheless quite mistaken.
6
The Grounds of Doubt Rebutted
In Grundlagen, Frege had used the context principle to justify treating the numbers as objective self-subsistent objects. No thesis maintained by him after 1890 would merit being called 'the context principle' unless, in his mind, it fulfilled a similar function. He did, however, maintain in Grundgesetze a thesis fulfilling just this function. That is the astonishing continuity in Frege's thinking from Grundlagen to Grundgesetze. In Grundlagen, his use of the context principle rested upon his ignoring the distinction between the significance of an expression and that which it signified. By introducing the differentiation between Sinn and Bedeutung, Frege made a whole-hearted acknowledgement of that distinction; and yet he continued to apply the context principle with the full force that it had had in Grundlagen. To describe Frege's aim as being to reduce arithmetic to logic obscures his central objective. He hoped to have attained a means of justifying the Bedeutung could be guaranteed to value-range terms only if every sentence containing t h e m could be shown to have a unique truth-value: and so a proof t h a t the semantic theory did, as claimed, fix an interpretation for all the primitive symbols could not fall short of demonstrating the c ansistency of the system as a whole. 7 M o s t of them I have myself propounded, at one time or another.
14
Michael Dummett
existence of abstract objects, and in particular those forming the domain of a fundamental mathematical theory (one whose objects are not given by some other more basic theory). In Grundlagen, the context principle is presented as supplying this means; but the objective is clouded, because it is left uncertain whether Frege thought he had the right to take the notion of the extension of a concept as given without the need for further justification. In Grundgesetze, the ambiguity is resolved. All mathematical objects are to be represented as value-ranges; the existence of value-ranges cannot be taken as given, however, but requires justification, which will depend upon a strong form of the context principle. T h e problem is one to which philosophers of mathematics have virtually ceased to pay any attention, perhaps as being insoluble: the intended interpretation of a formal theory is habitually stated in a manner assuming that we already know informally what its objects are. It is, however, a fundamental problem; without a solution to it, no philosophy of mathematics can be adequate. The problem is, indeed, only an aspect of a more general one, central to philosophy as a whole: how do we succeed in referring to objects? Frege did not succeed in solving the problem, as the inconsistency of his system shows; his attempt is interesting because he did at least address it. It is wrong to suppose that, in the presence of the Sinn/Bedeutung distinction, the context principle bifurcates. In Grundgesetze, Volume I, §32, Frege explained the Sinn of an expression of his symbolic language as determined by the stipulations specifying its Bedeutung. More precisely, he explained the Sinn of a sentence as being the thought that the condition is fulfilled for it to be true — for its Bedeutung to be the truth-value true — while characterising the Sinn of a subsentential expression as its contribution to the thought expressed by the sentence as a whole. This formulation is not a version of the context principle, understood as governing Sinn. It indeed expresses the primacy of sentences in respect of Sinn·, but it does not state that there can be subsentential expressions whose Sinne are derived from the Sinne of sentences of which they form part. The context principle, taken as governing Sinn, would say that we can, at least sometimes, fix the Sinn of a word, phrase or symbol by laying down the Sinne of sentences containing it; but Frege did not, in §32, maintain this. Rather, he represented the Sinn of any expression as given by the particular way in which its Bedeutung is determined, or, if it is being newly introduced, stipulated. It follows that whether the context principle holds for Sinn depends on whether it holds for Bedeutung: there are not two questions, but only one. In Grundgesetze, Frege no longer looked favourably on contextual definition, as he had in Grundlagen, but, in Volume II, §66, utterly repudiated it. T h e context principle is not concerned with principles of definition, however, but with how the primitive symbols of the system are to be explained:
The Context Principle: Centre of Frege's Philosophy by what means should the semantic theory stipulate their Bedeutungen thereby their Sinnel
15 and
Frege's later version of the context principle is stated in Grundgesetze, Volume I, §§10, 29 and 31, where he proposes that the Bedeutungen of terms for value-ranges can be determined by determining the values of the primitive functions for their Bedeutungen as arguments, and thus, in effect, by determining the Bedeutungen of more complex terms of which they are part. It is true that the new formulation fails to give a distinguished role to sentences, as the formulation of Grundlagen had done, and, in consequence, has a greater appearance of circularity. In practice, however, the difference between the old and the new formulations is not significant, since all the primitive functions that Frege has to consider are concepts or relations, so that the 'more complex terms' considered are all in fact sentences. It is hard to explain Frege's appeal to a permutation argument otherwise than as a temporary lapse: but his total failure to rebut it on its own terms reassures us that no conclusion can safely be drawn from it. On the contrary, if what he offers as a solution to the problem is adequate, the permutation argument can only have been fallacious from the start. Admittedly, Frege allowed that an expression of natural language might have Sinn but lack Bedeutung; but this is irrelevant, since his stipulations, founded on the context principle, related directly to the Bedeutungen of the primitive symbols, and he claimed that they secured a Bedeutung for every expression of his formal language. It is not at all that, after securing for a symbol a Sinn, a further enquiry is needed into whether it has a Bedeutung: rather, an expression will lack a Bedeutung only if the truth-value of certain sentences containing it has been left undetermined. Hence, if we have satisfied ourselves that our stipulations suffice to assign truth-values to all sentences, nothing further is needed.
7
The Rationale of the Context Principle
The reason why the question to which object a linguistic expression refers can be answered only from within language is not merely that we can pick out that object only by means of language. It is also that the word "refer" is itself a word that we have learned only in learning the language. We learned the word in connection with saying, by means of another word or phrase, to what a word refers, generally or as used on a particular occasion; it is in this sense that an assignment of reference is internal to language. When, in one language, we say what a word of another language refers to, it does not cease to be internal to the language which we are using: we are bound to
16
Michael Dummett
take it as referring to whatever we should take a translation of it into our language as referring to. 8 In Grundgesetze, Frege was neither explaining a language with an already established use, nor laying down its use by translating it into the metalanguage. He was setting out what its formuléis were to mean; not, however, from without but from within: although his explanations were given in the metalanguage, German, they made the meanings of expressions of the formal object-language internal to it, not to the metalanguage. He sought to describe, not how an understanding of the formal language could be attained from a knowledge of the metalanguage as a base, but what must be known by anyone in order to understand it; the explanation presupposed no prior understanding of language save an acquaintance with the two truth-values. That is why he could confine himself to deciding whether a truth-value could be a value-range, rather than whether a person such as Julius Caesar or a country such as England could be. One who understood the formal language would know nothing of people or countries; to object that one who understood the metalanguage would know about them is to mistake Frege's purpose. His strategy was to fix the Bedeutungen of the terms of the formal language indirectly, as it were, by stipulations determining the truth-values of all its sentences; because all that one who knows a language can be credited with knowing, Just in virtue of his knowing it, is what renders its sentences true or false. If direct stipulations stated in some already known language are ruled out, there can therefore be no other means by which the Bedeutungen of the basic terms of any language could come to be known. The context principle continued to occupy its central place in Frege's thinking, with the whole force that it had had in Grundlagen-, distinguishing between Sinn and Bedeutung had not weakened his faith in it in the least degree. Does it follow that semantics is impossible? Frege's thought was subtler than van Heijenoort and Hintikka give him credit for. I interpret it as follows. A theory of Bedeutung for a language must of course be stated in some language; if it is concerned to lay down the interpretation of the object-language, it must necessarily be stated in a metalanguage disjoint from the object-language, since the latter cannot yet be understood. Now if the theory is to display the existing or intended Sinne of the expressions of the object-language, it must embody only what anyone who has a mastery of the object-language will know. As far as possible, therefore, it must refrain from exploiting what can be known only by understanding the metalanguage. 8
Quine's thesis that a word may have equally admissible but non-co-referential translations is irrelevant. Whichever translation we decide upon will determine what we say it refers to. If whatever entails that the rival translations are not co-referential fails to select one as more correct than the others, it follows that none of them is a perfect translation.
The Context Principle: Centre of Frege's Philosophy
17
There is an inescapable exception to this. Anyone who makes a judgement knows what the two truth-values are; but this knowledge cannot be stated. Only one who can grasp a thought can make a judgement, and, among human beings, only one who can speak a language can grasp a thought; nevertheless, we can say what is known by someone who is master of a language only by presupposing the two truth-values as known. Our theory may accordingly specify outright the conditions for a sentence of a given form to be true or false, that is, to have one or other truth-value as its Bedeutung; but it cannot fix the Bedeutung of any term by specifying that it is to be any other object namable in the metalanguage. A mastery of the object-language consists in grasping the condition for each of its sentences to be true. It is only in doing so that one who knows that language knows the Bedeutungen of its terms; hence to stipulate in the metalanguage that certain terms are to denote certain objects is at best to take as understood what the theory should be explaining. The only way in which a speaker of the object-language can specify the Bedeutung of one of its terms is by using some co-referential term, which he recognises as such by his grasp of statements of identity. This is but part of his knowledge of what determines the t r u t h or falsity of sentences containing the term; it is the content of that knowledge which the theory of Bedeutung must exhibit. Frege not only believed in semantics, but constructed a general framework for it. He held, however, that a semantics for a language must be internal to that language: it must describe it as from within, not from some external viewpoint, by saying what is known by one who knows the language but may know nothing else. That is why Frege had no need to make any metalinguistic stipulations affecting whether Julius Caesar could be a valuerange, since Julius Caesar could not be referred to in the object-language. Van Heijenoort and Hintikka mistook this view for the cruder one that semantics is altogether impossible. Although in Grundlagen Frege had not yet constructed his general semantic theory, there is no difference in outlook between it and Grundgesetze; Frege's thought was indeed subtler than his commentators give him credit for.
8
Is Frege's Doctrine Tenable?
I do not wish to give the impression of believing that, by means of the context principle, Frege solved the fundamental problem he addressed. On the contrary: he failed to establish that his solution provided adequate support for his realism; still worse, he did not even show it to be coherent. If it is coherent, his execution of it was not, as the catastrophe of the Russell contradiction dramatically testified. The context principle appears to require t h a t , when laying down the interpretation of a formal language, we
Michael Dummett
18
should not attempt first to specify the domain of the variables and only subsequently to stipulate the Bedeutungen with respect to it of the primitive symbols, but need to accomplish the two tasks simultaneously. It is far from clear that this is possible; and it was certainly the circularity of the procedure that invalidated Frege's consistency proof and in fact led to the system's inconsistency. Frege supposed it sufficient, in order to guarantee a Bedeutung for value-range terijis, to specify the values of the primitive functions when applied to them. The purpose was to determine a truth-value ioievery sentence containing such terms; only if that were done could it be claimed that the Bedeutung of those terms had been fixed. It was, however, natural for Frege to suppose that an inductive argument would lead from the referentiality of terms formed by a single application of a primitive functor to that of all other terms, including sentences, of arbitrary complexity. His fallacious consistency proof was intended to constitute precisely such an inductive argument. The fallacy appeared at the very first step. The stipulations governing the primitive functors, including the criterion of identity for value-ranges embodied in Axiom V, could be determinate only if the domain, consisting wholly or largely of value-ranges, was determinate; but the domain was in process of being determined by fixing the Bedeutungen of the value-range terms, and so the procedure went round in a circle. It is far from evident that this fatal circularity can be avoided by any set of specifications that conform to the context principle by refraining from assuming the domain of quantification to be already understood. Even if it can, it is unclear that such a procedure will warrant a realist conception of its outcome. Because the context principle has an internalist character, Frege's realism is not the metaphysical (or external) realism against which Putnam has argued with such cogency, but a form of the internal realism that he would be prepared to sanction; 9 but that does not make it totally anodyne. To justify a realist interpretation of a given theory, even if it be an internal version of realism, it is not enough that we should be entitled to ascribe a reference to the terms of that theory; the notion of reference, as so ascribed, must be sufficiently robust to bear the weight of a realist interpretation. This surely requires that the notion of reference should play a genuine role within the semantic theory; that is, that determining the reference of a term should be a step in determining the truth-value of a sentence containing it. But, if the referentiality of the term was justified by appeal to the context principle, its reference is semantically idle, since it was secured by specifying the truth-value of sentences of which the term is part, or the reference of more complex terms of which the term is part, by some means not involving an identification of the referent of that term. 9
See, inter alia, Chapters 1 and 2 of Putnam (1990).
The Context Principle: Centre of Frege's Philosophy
19
T h e realist interpretation could be jettisoned without abandoning the context principle itself, but only if that principle, as here understood, can be shown to be coherent; and this remains in grave doubt. And yet it is hard to see how it can be abandoned, so strong is the motivation for it. The alternative is an apprehension of objects, including abstract objects, underlying, but anterior to, an understanding of reference to them, or, indeed, a grasp of thought about them; and this is a form of external realism too coarse to be entertained. I am therefore forced to conclude without either endorsing the central feature of Frege's philosophy or rejecting it; I can do no more than to say lamely that the issue is one whose resolution is of prime importance to philosophy.
References Baker, Gordon P./Hacker, Peter M. S. (1984), Frege: Logical Excavations, Oxford University Press, Oxford. Bolzano, Bernard (1837), Wissenschaftslehre, Seidel, Sulzbach. Dummett, Michael ( 2 1981a), Frege: Philosophy of Language, Duckworth, London. Dummett, Michael (1981b), The Interpretation of Frege's Philosophy, Duckworth, London. Dummett, Michael (1991), Frege: Philosophy of Mathematics, Duckworth, London. Frege, Gottlob (1884), Die Grundlagen der Arithmetik, Koebner, Breslau. Frege, Gottlob (1893), Grundgesetze der Arithmetik I, Pohle, Jena. Frege, Gottlob (1976), Wissenschaftlicher Briefwechsel, hrsg. v. Gabriel, Gottfried/Hermes, Hans/Kambartel, Friedrich/Thiel, Christian/Veraart, Albert, Felix Meiner, Hamburg. Frege, Gottfried (1980), Philosophical and Mathematical Correspondence, ed. by Brian McGuinness, Oxford. van Heijenoort, Jan (1967), Logic as Calculus and Logic as Language, Synthese 17, 324-330. Hintikka, Jaakko (1988), On the Development of the Model-theoretic Viewpoint in Logical Theory, Synthese 1988, 1-36. Putnam, Hilary (1990), Realism with a Human Face, MIT Press, Cambridge, Massachusetts. Shanker, St. (1982); Review of Dummett (1981a) and (1981b), Dialogue 21, 56571.
CHRISTIAN
THIEL
„Nicht aufs Gerathewohl und aus Neuerungssucht": Die Begriffsschrift 1879 und 1893 Am 20. Mai 1824 verliest Wilhelm von Humboldt vor der historisch-philologischen Klasse der königlichen Akademie der Wissenschaften zu Berlin seine Abhandlung Ueber die Buchstabenschrift und ihren Zusammenhang mit dem Sprachbau.1 Er vergleicht die Buchstabenschrift erst mit der Lautschrift, dann mit der Bilderschrift und schließlich mit einer „Figurenschrift, welche Begriffe bezeichnet". 2 Er nennt die letztere eine „Begriffsschrift". Den gleichen Ausdruck wird im Jahre 1856 Adolf Trendelenburg verwenden, als er zur Feier des Leibniztages vor dem gleichen Gremium seinen Festvortrag Uber Leibnizens Entwurf einer allgemeinen Charakteristik3 hält. Ein gutes Jahrzehnt später wird die Abhandlung im dritten Band von Trendelenburgs Historischen Beiträgen zur Philosophie4 erneut abgedruckt werden, und vermutlich von hier wird Gottlob Frege den Ausdruck in den Titel seiner ersten nicht als Hochschulschrift erschienenen Monographie übernehmen. 5 Daß Trendelenburg den Ausdruck „Begriffsschrift" überhaupt erst eingeführt habe, ist also ein Gerücht. Wer ihn im Deutschen zuerst gebraucht hat, wird sich auch schwer feststellen lassen, denn er ist wohl eine unmittelbare Ubersetzung des Fremdwortes „Ideographie", das in gleicher Bedeutung schon um 1800 z.B. in Schriften der „kombinatorischen Schule" Carl Friedrich Hindenburgs beliebt war, die sich betont in die Tradition der Leibnizschen ars combinatoria stellte oder besser, eine solche Tradition begründen wollte. 6 Vermutlich ist der Terminus weit älter, auch wenn ich ihn (in der deutschen, französischen oder lateinischen Form) weder bei Leibniz noch bei Lambert gefunden habe. 1
Humboldt (1826). Humboldt (1848, 532) und Humboldt (1963, 87). 'Trendelenburg (1856). Der Ausdruck „Begriffsschrift" auf S. 39, Zeile 6 v.u. 4 Trendelenburg (1867); der Ausdruck „Begriffsschrift" hier auf S. 4, Zeile 2. 5 Frege (1879). Die Vermutung, daß Frege den Ausdruck „Begriffsschrift" von Trendelenburg übernommen hat, stützt sich darauf, daß er im Vorwort (V) auf Trendelenburg (1867) verweist. 6 Vgl. etwa Hindenburg (1803), vor allem die Anmerkungen Hindenburgs zu der auf S. 1-28 abgedruckten Abhandlung Bürmanns „Essai de caractéristique combinatoire ou notation universelle déduite d'élémens simples systématiquement combinés", insbes. S. 132, 143 und 144. Die Variante „Ideographik" findet sich in Niethammer (1808) und als Stich wort in Krug (1833, 500f.). 2
.Nicht aufs Gerathewohl und aus Neuerungssucht"
21
Doch geht es mir hier nicht um Terminologiegeschichte, sondern um einen Vergleich der beiden Ausgestaltungen, die Frege seiner Begriffsschrift gegeben hat: der ersten in dem gleichnamigen Büchlein von 1879, und der durch Umgestaltung aus ihr hervorgegangenen zweiten, die Frege erstmals 1891 in Function und Begriff7 vorgestellt und in seinem Hauptwerk Grundgesetze der Arithmetik8 ausgeführt und angewendet hat. Um Gemeinsamkeiten und Unterschiede hervortreten zu lassen, werde ich in erster Linie die Charakteristika der beiden Fassungen der Begriffsschrift klar herauszuarbeiten versuchen, unter bewußter Vernachlässigung von Subtilitäten, an denen sich überwiegend die Fregeforscher des ausgehenden 20. Jahrhunderts erfreuen. Frege hat sich mit seinen Bemühungen, obwohl er weder mit Leibnizens Originalschriften noch mit der Leibniztradition besonders gut vertraut war, 9 im Vorwort zur Begriffsschrift ausdrücklich in die Linie der Versuche zu einer characteristica universalis gestellt. Allerdings unter vorläufigem Verzicht auf die Universalität; der Leibnizsche Gedanke eines calculus ratiocinator sollte erst einmal für eine ausgesuchte wissenschaftliche Disziplin durchgeführt werden. „Die Arithmetik", sagt Frege auf S. VIII des Vorwortes zur Begriffsschrift, „ist der Ausgangspunkt des Gedankenganges gewesen, der mich zu meiner Begriffsschrift geleitet hat". Er habe wissen wollen, „wie weit man in der Arithmetik durch Schlüsse allein gelangen könnte, nur gestützt auf die Gesetze des Denkens", 10 also ohne irgendwelche, evtl. unbemerkten, anschaulichen Zusatzprämissen. Um sie auszuschließen, mußte Frege „die Lückenlosigkeit der Schlusskette" sichern — auch dies eine Wendung Leibnizens, der in seiner erstmals in der Erdmannschen Ausgabe 1839 abgedruckten Skizze „De la sagesse" geschrieben hatte: „Pour tirer une vérité d'une autre il faut garder un certain enchaînement qui soit sans interruption". 11 Frege verzichtete deshalb „auf den Ausdruck alles dessen [ . . . ] , was für die Schlussfolge ohne Bedeutung ist", 12 um nur das auszudrücken, was er den „begrifflichen Inhalt" nannte. Dies sei auch der Grund gewesen für die Wahl des Terminus „Begriffsschrift" zur Bezeichnung einer „Formelsprache des reinen Denkens", die „fürs erste" nur Beziehungen zwischen Gegenständen überhaupt wiedergeben solle. „Der Arithmetik nachgebildet" sei sie lediglich in der Verwendung von Variablen, nicht etwa durch die Einführung einer „lo7
Frege (1891). Frege ( 1 8 9 3 / 1 9 0 3 ) . 9 So jedenfalls das Urteil von Günther Patzig in Patzig (1969). 10 Frege (1879), IV. Es scheint, daß die „Gesetze des Denkens" dabei nur die Schlüsse selbst s t ü t z e n sollen, nicht auch (zusammen mit rein logischen Begriffen) deren Prämissen, wie es die spätere „logizistische" These will. Auch der Anspruch, auf solchem Wege jeden arithmetischen Satz erreichen zu können, wird in der Begriffsschrifl von 1879 nicht erhoben. 8
11 12
Leibniz (1839, 674a). Frege (1879, IV).
22
Christian Thiel
gischen" Addition, Multiplikation usw. wie bei „jene(n) Bestrebungen, durch Auffassung des Begriffs als Summe seiner Merkmale eine künstliche Aehnlichkeit herzustellen". 1 3 Ohne Vergleich mit der Arithmetik bleibt eigenartigerweise Freges Ersetzung des Subjekt-Prädikat-Schemas der traditionellen Logik durch das Schema von Argument und Funktion, mit der schon hier (1879!) ausdrücklich ausgesprochenen Folge, daß Begriffe als Funktionen aufzufassen sind. Was darf man sich von all diesen Neuerungen versprechen? Frege hat sein Versprechen in einen rhetorischen Conditionalis gekleidet: 14 Wenn es eine Aufgabe der Philosophie ist, die Herrschaft des Wortes über den menschlichen Geist zu brechen, indem sie die Täuschungen aufdeckt, die durch den Sprachgebrauch über die Beziehungen der Begriffe oft fast unvermeidlich entstehen, indem sie den Gedanken von demjenigen befreit, womit ihn allein die Beschaffenheit des sprachlichen Ausdrucksmittels behaftet, so wird meine Begriffsschrift, für diese Zwecke weiter ausgebildet, den Philosophen ein brauchbares Werkzeug werden können. Von dieser Empfehlung hat nicht nur die analytische Philosophie bis heute ausgiebig Gebrauch gemacht. Doch möchte ich mich jetzt von dieser hohen philosophischen Warte auf die Ebene der Fregeschen Werkzeuge selbst hinunterbegeben und das begriffsschriftliche Werkzeug von 1879 charakterisieren. Lassen Sie mich zunächst daran erinnern, daß wir mathematische Beweise üblicherweise genauso wie normale, nichtmathematische Texte linear aufschreiben. Nur wenn es uns auf eine übersichtliche Darstellung der Beweisstruktur ankommt, ordnen wir die einzelnen Aussagen zweidimensional an, sei es in getrennt aufeinanderfolgenden Zeilen, sei es in sog. „Stammbäumen" mit der bewiesenen Aussage als Endformel. Die Formeln selbst schreiben wir meist als lineare Zeichenreihen, z.B. „ ( 2 + 3)-9 = 45" oder „a € Μ χ Nu; nur selten nehmen wir wie in „x 2 ", „ f " , „(o)'\ bei Kettenbrüchen oder bei Matrizen und Determinanten die zweite Dimension der Seite auf ähnliche Weise in Anspruch wie bei der Ausführung numerischer Rechnungen — beim Addieren, Multiplizieren oder Dividieren größerer Zahlen oder beim Wurzelziehen „mit der Hand". Wie Sie alle wissen, stellt Freges Begriffsschrift (in beiden Fassungen) auch die logische Verknüpfung zweier Aussagen oder Aussageformen durch den Subjunktor zweidimensional, nämlich als a bzw. —
13Frege (1879, IV). 14 Frege
(1879, VI).
fU
)
Nicht aufs Gerathewohl und aus Neuerungssucht"
23
dar. Nur der Verneinungsstrich und die Höhlung (Freges Allquantor) operieren horizontal (auch wenn natürlich ihr Wirkungsbereich zweidimensional ausgedehnt sein kann); der Bedingungsstrich dagegen operiert von vornherein als vertikaler Strich, indem er zwei übereinanderstehende Formeln verbindet, die durch vorgesetzte waagerechte Striche für diese Verknüpfung zugerichtet worden sind. Da die Subjunktion die einzige zweistellige junktorenlogische Grundverknüpfung der BegrifFsschrift ist, 1 5 ergeben sich bei mehrfacher Iteration gewaltige Formelgebilde, die Schröder in seiner Rezension der Begriffsschrift16 zu der spöttischen Bemerkung veranlaßt haben, Frege huldige „der japanischen Sitte einer Verticalschrift" und bringe auf einer Seite nur eine Zeile, maximal aber deren zwei unter. 1 7 Nun ist dies freilich keine bloße Sitte, und man kann sich durch eine heuristische Überlegung plausibel machen, was Frege dazu bewogen haben mag. Zahlreiche mathematische Sätze haben die Struktur eines Subjungats, also die Form „Wenn sowohl als auch A2 als auch A3 als auch A4 gilt, dann gilt auch C " . Eine mögliche schematische Darstellung ist die als
C
Ziehen wir die Antecedentien links tiefer als die Zeile der Konklusion C und dann so weit nach rechts, daß sie untereinander und zwar sämtlich unter C zu stehen kommen, so erhalten wir Freges
L-
A4
Λ3 A2 Λι , das sich dann etwa als „C, falls Αι, A2, A3 und A4" lesen läßt. Diese Schreibweise kommt dann nicht nur ohne Klammern aus (die allenfalls in den linearen Teilformeln erforderlich sind), sie hat auch einige technische Vorteile. Beispielsweise läßt sich I— Β als
t=Q
aber auch als
Ρ
C"
1 5 E i n e vergleichbare Funktion hat auch das Zeichen = der Inhaltsgleichheit, die Frege freilich als Beziehung zwischen Inhalten auffaßt und durch die wechselseitige Ersetzbarkeit der Zeichen „A" und „B" in „A = B" charakterisiert; vgl. Frege (1879, 1 3 - 1 5 ) . 1 6 Schröder (1880). l 7 Schröder (1880, 90).
24
Christian Thiel
lesen, wofür eine lineare Notation eigene Importations- und Exportationsgesetze benötigt, nach denen (Α Λ Β) —• C und A —• (Β —» C) logisch äquivalent sind. In den Grundgesetzen, wo Frege auf der Basis der Abtrennungsregel weitere zulässige Regeln einführt, führen manche derselben (wie etwa die sehr allgemeinen Kontrapositionsregeln oder die Regel des Einfügens oder Verschmelzens zweier aufeinanderfolgender Verneinungsstriche in jedem waagerechten Stück einer Begriffsschriftformel) zu einer gewissen deduktiven Eleganz. Trotzdem wirkt eine solche Deduktion auf die meisten Betrachter ausgesprochen abschreckend, 18 wenngleich sich dieser Effekt mit einer Seite aus den Principia Mathematica oder aus Quines Mathematical Logic fast ebensogut erreichen läßt. Unbestreitbar ist, daß die typographische Gestaltung von Begriffsschriftformeln (egal ob wie zu Freges Zeiten im Handsatz oder heute mit einem Graphiksystem am PC) derart mühselig und aufwendig ist, daß seit der Erstausgabe nur Reprintausgaben der Grundgesetze erschienen sind und nicht nur vollständige fremdsprachige Übersetzungen des Werkes fehlen, sondern auch eine kritische deutsche Ausgabe. Was das letztere angeht, so wird hier freilich neben den technischen Problemen auch die Mühsal der erforderlichen editorischen Arbeit potentielle Herausgeber auf Distanz gehalten haben. Zweifellos beginnt die moderne Quantorenlogik 1879 mit Freges Begriffsschrift. Für den heutigen Logikhistoriker ist es verblüffend, daß diese Revolution damals nicht nur von den philosophischen Logikern, sondern auch von den mathematischen Logikern überhaupt nicht wahrgenommen wurde. In seiner schon erwähnten Rezension der Begriffsschrift bemängelt Schröder nicht nur, daß Frege von der qualitativ besseren Vorwegnahme seiner Bemühungen durch Boole keine Notiz genommen habe, er behauptet auch, Freges Verwendung „gothische(r) Buchstaben in der Bedeutung von allgemeinen Zeichen" 19 lasse sich mühelos auch der Booleschen Behandlungsweise integrieren. Tatsächlich ist dies keineswegs der Fall, und der von Schröder skizzierte Vorschlag scheitert schon bei einfachen Fällen mit geschachtelten Quantoren. Mit Recht hat daher Frege in seinem Vortrag Ueber den Zweck der Begriffsschrift Schröder vorgehalten, dieser habe „den Kern der Sache, nämlich die Abgrenzung des Gebietes, auf das sich die Allgemeinheit erstrecken soll, nicht erfasst". 20 Diese ist aber gerade die Pointe der Verwendung von Quantoren mit Aussageformen als Wirkungsbereich, mit der Schröder anscheinend erst durch die Arbeiten von C.S. Peirce vertraut
18
Vgl. die Wiedergabe von S. 221 aus Frege (1903) als Abbildung 1 auf Seite 25. ' S c h r ö d e r (1880, 92). 20 Frege (1882/83, 9). Frege hat die Unzulänglichkeit des Schröderschen Vorschlags auch in der ausführlicheren Abhandlung Bootes rechnende Logik und die Begriffsschrifl dargelegt, die damals jedoch nicht erschien und erst 1969 gedruckt wurde, vgl. Frege (1969, 9-52, zur genannten Frage 21f. Anm.) 1
„Nicht aufs Gerathewohl und aus Neuerungssucht" —
,-
221
—
c^s
y*
b^s ds (X
p^s qr\S -y. I—>8 CnS JJ —^.e^s - d^s -
- 0"->s - ò" -
-
(λ
f
ΐΛ» y» L— L
— g—^á^e —
-rî^ï»"» —
0« Abbildung 1
26
Christian Thiel
geworden ist, der darin einer Idee seines Schülers O.H. Mitchell folgte. 21 Mit der knappen Erinnerung daran, daß in beiden Fassungen der Begriffsschrift die Theoreme durch einen vorangestellten Behauptungsstrich gekennzeichnet werden, wende ich mich jetzt der Beschreibung der wichtigsten Unterschiede zu, indem ich als erstes auf eine Besonderheit der Begriffsschrift von 1879 mit Bezug auf Funktion und Argument hinweise. Nach §10 und 11 der Begriffsschrift können wir ,,Φ(Α) als eine Function des Argumentes Φ auffassen", und daher „kann an die Stelle desselben [ . . . ] ein deutscher Buchstabe treten". 22 Dementsprechend darf man nun freilich Freges quantorenlogische Gesetze, allen voran sein Axiom 58,
nicht nur als Gesetze lesen, in denen über Individuen quantifiziert wird, sondern stets auch parallel als solche, in denen über Funktionen quantifiziert wird — wenn ich mich der heutigen Unterscheidung von Quantoren erster und zweiter Stufe bediene, die Frege selbst erst 1893 in der zweiten Fassung seiner Begriffsschrift vorgenommen hat. Freges Vorgehen in der Begriffsschrift von 1879 ist dem heutigen Denken in Stufen und Typen fremd geworden, und Jean van Heijenoort hat in seiner Einleitung zur Übersetzung der Begriffsschrift in seinem bekannten Source Book23 sogar behauptet, Frege habe aufgrund dieses Doppelcharakters seiner quantorenlogischen Formeln fehlerhafte Substitutionen vorgenommen (z.B. im Schritt von Formel 76 zu Formel 77 auf S. 62 der Begriffsschrift). Terrell Ward Bynum hat diesen Vorwurf freilich als ein Mißverständnis zurückweisen können. 24 Im Grunde müßte man jedoch bei der Zusammenstellung der Axiome der Begriffsschrift Freges Axiom 58 um sein Gegenstück mit dem Quantor über Funktionen ergänzen, so wie dies Frege dann in Band I der Grundgesetze durch Trennung der strukturell gleichen Axiome IIa und IIb getan hat:
Einschließlich des später von Lukasiewicz25 als abhängig erwiesenen Axioms 8 sind die Axiome der Begriffsschrift die folgenden: 21
Mitchell (1883, 72-106); Peirce (1883, 189-203). Frege (1879, 19). 23 van Heijenoort (1967), die Übersetzung von Freges Begriffsschrift dort auf S. 5 - 8 2 mit Einleitung van Heijenoorts auf S. 1-5; der Vorwurf der fehlerhaften Substitution dort auf S. 3. 24 B y n u m (1973, 285-287). 25 Lukasiewicz (1929). Für den deutschen Leser ist die Ableitung am leichtesten zugänglich in Lukasiewicz (1935, 126f.). 22
„Nicht aufs Gerathewohl und aus Neuerungssucht"
n
27
n n n
τ
-
28
α
I— d b
a
l— b
τ ~ a I— b — d 31
I—ι—α π"
α
V
l· (-ΓΓ
52
m "U m (c = d)
a
"
' "
=
a
)
58
M m
54 \- (c Ξ c) Zu der von Frege selbst vorgenommenen Zusammenstellung der Axiome seiner Grundgesetze möchte ich zunächst nur sagen, daß die ohne Wertverlaufsnamen und ohne Kennzeichnungsoperator formulierten unter ihnen aus den Axiomen der Begriffsschrift von 1879 ableitbar sind, und umgekehrt; der Nachweis ist wegen der Unterschiedlichkeit der Regelsysteme umständlich, aber nicht prinzipiell schwierig. Doch die engen Beziehungen der Folgerungsmengen und auch der Syntax beider Systeme dürfen nicht über die Unterschiede in der Semantik und im methodischen Aufbau hinwegtäuschen. Ich muß dazu etwas allgemeiner ansetzen. Frege glaubt, vierzehn Jahre nach Erscheinen der Begriffsschrift, „das Ideal einer streng wissenschaftlichen Methode der Mathematik erreicht zu haben". 2 6 Die Lückenlosigkeit der Schlußketten ist garantiert und hat zur 2 6 Frege
(1893, VI).
Christian Thiel
28
Folge, „dass jedes Axiom, jede Voraussetzung, Hypothese, oder wie man es sonst nennen will, auf denen ein Beweis beruht, ans Licht gezogen wird; und so gewinnt man eine Grundlage für die Beurtheilung der erkenntnisstheoretischen Natur des bewiesenen Gesetzes". 27 In der Begriffsschrift von 1879 hatte Frege die logizistische These höchstens als Frage ins Spiel gebracht, und im § 90 der Grundlagen der Arithmetik von 1884 hatte er versichert, er „erhebe nicht den Anspruch, die analytische Natur der arithmetischen Gesetze mehr als wahrscheinlich gemacht zu haben". 28 Dem ersten Band der Grundgesetze schickt er dagegen die Worte voraus: 29 Ich führe hiermit ein Vorhaben aus, das ich schon bei meiner Begriffsschrift vom Jahre 1879 im Auge gehabt und in meinen Grundlagen der Arithmetik vom Jahre 1884 angekündigt habe. Ich will hier durch die That die Ansicht über die Anzahl bewähren, die ich in dem zuletzt genannten Buche dargelegt habe. Auf der im § 46 der Grundlagen ausgesprochenen Einsicht, „dass die Zahlangabe eine Aussage von einem Begriffe enthalte", beruhe die nun vorgelegte Darstellung. Gestützt auf die durchgängige Kontrollierbarkeit seiner begriffsschriftlichen Ableitungen wagt Frege jetzt die Behauptung, „dass die Arithmetik nur weiter entwickelte Logik sei", dass ihr „nichts als Logik zu Grunde liegt" 30 — unter einer Voraussetzung, die sich später tatsächlich als entscheidend erweisen sollte: dass nämlich das „Grundgesetz der Werthverläufe (V)" gültig sei, das Frege für rein logisch hält, das aber für ihn „die Stelle bezeichnet, wo die Entscheidung fallen muß". 31 Zwei Gründe nennt Frege dafür, daß die Ausführung seines Planes so spät erfolgt. Der eine, von ihm an zweiter Stelle genannte ist die mangelnde Aufnahme seiner beiden vorausgegangenen Schriften bei den Mathematikern, zusammen mit „der Ungunst der wissenschaftlichen Strömungen", gegen die das neue Buch wohl zu kämpfen haben werde. Der andere Grund sind die „innern Umwandlungen der BegrifFsschrift",32 von denen Frege sagt, daß sie ihn „zur Verwerfung einer handschriftlich fast vollendeten Arbeit genöthigt haben". 3 3 Frege selbst hat einen Uberblick über diese Veränderungen gegeben. Die von ihm jetzt streng befolgte Unterscheidung von Zeichen und Bezeichnetem nötigt zur Abschaffung der durch ,,ξ" ausgedrückten Inhaltsgleichheit zugunsten der gewöhnlichen Gleichheit im Sinne der Identität des Bezeichneten (wobei Frege das kuriose Phänomen, daß zwei Zeichen „plötzlich ihr "Frege 28 Frege 29 Frege 30 Frege 31 Frege 32 Frege 33 Frege
(1893, (1884, (1893, (1893, (1893, (1893, (1893,
VII). 102). VlIIf.) VII). VII). IX). VII).
Nicht aufs Gerathewohl und aus Neuerungssucht"
29
eignes Selbst hervor[kehren], wenn sie durch das Zeichen der Inhaltsgleichheit verbunden werden", 34 durch die Unterscheidung von Sinn und Bedeutung eines Zeichens zum Verschwinden bringt). Die Begriffsschrift von 1893 trennt sorgfältig zwischen metasprachlichen Zeichen wie Variablen, schematischen Buchstaben und Klammern einerseits und pragmatischen Zeichen wie Behauptungsstrich, Definitionszeichen, Zeichen für Ableitungsschritte nach der Abtrennungsregel, der Kettenregel, der Kontrapositionsregel usw. andererseits; von beiden unterscheiden sich die eigentlichen Begriffsschriftzeichen, darunter die uns schon bekannten Arten von Strichen. Doch diese erfahren jetzt eine völlig neue Deutung. Der Inhaltsstrich verliert seinen unpassend gewordenen Namen und heißt nur noch „der Wagerechte", er sowie Verneinungsstrich, Bedingungsstrich, Gleichheitszeichen und Höhlung (der Allquantor) sind jetzt Funktionszeichen, an deren stets ausdrücklich anzugebende Argumentstellen Zeichen kategorial passender Argumente treten können; dabei entsteht immer ein Name des Funktionswertes, und dieser Wert ist stets ein Gegenstand. Die Kategorien von Argumenten werden auf das sorgfältigste unterschieden, die fundamentale Dichotomie ist die zwischen Gegenständen und Funktionen. Letztere aber zerfallen in ungleichstufige und gleichstufige, diese wieder in Funktionen erster, zweiter und dritter Stufe. Passende Argumente für Funktionen erster Stufe sind die Gegenstände (und jeder Name eines Gegenstandes ist zur Einsetzung zugelassen -— Unterkategorien gibt es nicht), passende Argumente von Funktionen zweiter Stufe sind Funktionen erster Stufe, entsprechend für die dritte Stufe. Eine Funktion zweiter Stufe ist der Allquantor, als neue Funktion zweiter Stufe kommt die Wertverlaufsfunktion hinzu. In die Argumentstelle ihres Namens ,,έ ψ(ε)α kann jeder korrekt gebildete einstellige Funktionsname ,,Φ(ξ)" erster Stufe eingesetzt werden, der entstehende Ausdruck ,,έΦ(ε)" ist dann ein Name des Wertverlaufes eben der Funktion erster Stufe, deren Name eingesetzt wurde. Funktionsnamen, die bei Einsetzung eines Gegenstandsnamens in ihre Argumentstelle in einen wahren oder falschen Satz übergehen, sind Begriffsausdrücke (in heutiger Terminologie Prädikatoren). Auch die entstehenden Sätze müssen Namen für etwas sein: Frege sieht sie als Namen von „Wahrheitswerten", „des Wahren" bzw. „des Falschen", die also eine besondere Sorte logischer Gegenstände sind, neben den Wertverläufen übrigens die einzigen von Frege in Betracht gezogenen, und im § 10 sogar mit zwei bestimmten Wertverläufen identifiziert. Hinter diesem ganzen Apparat mit seinen fein aufeinander abgestimmten Teilen steht ein grandioser Drang nach Einheitlichkeit, der gewissermaßen als übergeordnetes Prinzip den Aufbau aller Teilsysteme und ihr Zusammenwirken beherrscht. Was ein Name des Systems ist, wird streng geregelt. So wie in einem axiomatischen System ein Satz nur ist, was aus den Axiomen 34
Frege (1879, 13f.).
30
Christian Thiel
gemäß den Ableitungsregeln herleitbar ist, so ist ein Name, ein korrekt gebildeter Ausdruck, ein solcher, der nach präzise angegebenen Regeln aus Ausgangsausdrücken, den „Urfunktionsnamen" gewonnen werden kann. Mögen Gegenstände und Funktionen gleichberechtigt sein — das Fundament des Aufbaus der Begriffsschrift von 1893 bilden die Namen der Urfunktionen. Funktion aber ist alles, was ergänzungsbedürftig ist und bei Ergänzung zu einem Gegenstand wird, Gegenstand ist alles, was nicht Funktion ist. 3 5 Begriffe sind Funktionen eines Argumentes, die als Werte ausschließlich Wahrheitswerte haben; für jeden Gegenstand gilt, daß er unter einen gegebenen Begriff entweder fällt oder nicht fällt — „tertium non datur". Jeder korrekt gebildete Ausdruck in der Begriffsschrift von 1893 hat genau eine Bedeutung, aber auch genau einen Sinn. Der Sinn eines Namens eines Wahrheitswertes ist ein Gedanke — nicht das, was wir uns spontan darunter vorstellen würden, sondern der Gedanke, daß die Bedingungen erfüllt seien, unter denen der Satz, der diesen Sinn „hat", nach den Festsetzungen der Begriffsschrift das Wahre bedeutet. Entsprechend wird auch der Sinn des Behauptens vereinnahmt und verändert: nicht mehr das Wahrsein eines Satzes oder seines Inhalts ist der Gegenstand des Behauptens. Aufgrund der Erklärung des Wagerechten als Name der Urfunktion, deren Wert für das Wahre als Argument das Wahre, andernfalls aber das Falsche ist, heißt einen Satz behaupten j e t z t : behaupten, „dass dieser Name das Wahre b e d e u t e " . 3 6 Die Teile des Namens eines Wahrheitswertes „tragen dazu bei, den Gedanken auszudrücken, und dieser Beitrag des einzelnen ist sein Sinn. Wenn ein Name Theil des Namens eines Wahrheitswerthes ist, so ist der Sinn jenes Namens Theil des Gedankens, den dieser ausdrückt". 3 7 Selbst wenn all dies konsistent durchführbar wäre, man wird den Eindruck nicht los, daß sich das Ideal dieser Idealsprache fast uneinholbar entfernt hat von der Wirklichkeit nicht nur der „Sprache des Lebens", sondern auch von der Bildungssprache und den Fachsprachen, in denen das Behaupten, das Bezeichnen, das Wahrsein und das Sinn- und Bedeutung-Haben verständlich sind und vertraut erscheinen. Wenn die geschaffene Distanz eine Rechtfertigung hat — müßte sie nicht im Erfolg des Unternehmens liegen? Und ist dieser Erfolg nicht ausgeblieben? Hat nicht Frege im Nachwort zu Band II der Grundgesetze schreiben müssen: 3 8 Einem wissenschaftlichen Schriftsteller kann kaum etwas Unerwünschteres begegnen, als dass ihm nach Vollendung einer Arbeit eine der Grundlagen seines Baues erschüttert wird. In diese Lage wurde ich durch einen Brief des Herrn Bertrand Russell versetzt, als der 35
Frege Frege 3 7 Frege 38 'Frege 36
(1893, (1893, (1893, (1903,
7). 50). 51). 253)
Nicht aufs Gerathewohl und aus Neuerungssucht"
31
Druck dieses Bandes sich seinem Ende näherte. Es handelt sich um mein Grundgesetz (V). Ich habe mir nie verhehlt, dass es nicht so einleuchtend ist, wie die andern, und wie es eigentlich von einem logischen Gesetze verlangt werden muss. Und so habe ich denn auch im Vorworte zum ersten Bande S. VII auf diese Schwäche hingewiesen. [ . . . ] Doch zur Sache selbst! Herr Russell hat einen Widerspruch aufgefunden [ . . . ] . Diesen Widerspruch brauche ich Ihnen nicht vorzuführen; sein Inhalt und seine Herleitung gehören zum elementaren Wissensbestand jedes Logikers und Mathematikers der Gegenwart. Uberhaupt nicht elementar sind dagegen die Vermeidungsstrategien, von denen bislang keine einzige das Gütesiegel eines syntaktischen Widerspruchsfreiheitbeweises hat erhalten können. Für mein T h e m a sollte daran freilich nur relevant sein und zur Sprache kommen, Weis auf Freges begriffsschriftliches System Bezug hat. Und in der Tat hat Freges System — trotz und wegen seiner Inkonsistenz — eine zentrale Stellung in der Geschichte der mathematischen Logik inne. Mit Georg Cantors vermeintlicher Erschließung eines Reichs absoluter Unendlichkeiten sympathisierend, ist es dank der Begriffsschrift das erste formale System, das — in der Fassung von 1893 — einen axiomatischen Aufbau der Mengenlehre versucht. Der Versuch (ich möchte es festhalten, auch wenn es schon viele Male gesagt worden ist) übertrifft in Konzeption und Präzision spätere Systeme bei weitem, in manchem die Principia nicht ausgeschlossen. Es ist zugleich typisch für die modernen Versuche, durch Abänderung des Axiomensystems den- Widerspruch (oder besser, wie man binnen kurzem sagen mußte: die Wider Sprüche) zu vermeiden: Frege selbst hat durch Abänderung seines Grundgesetzes ( V ) einen heute als "Frege's Way Out" bezeichneten Ausweg aus der Inkonsistenz gesucht. Lesniewski hat ein Vierteljahrhundert später zeigen können, daß auch dieser Ausweg keiner ist, und wir wissen mittlerweile, daß auch raffiniertere Modifikationen in derselben Richtung keine Sicherheit bieten können. Frege hat sich auch vor diesen formal abgesicherten Ergebnissen nicht darüber getäuscht, sondern klar ausgesprochen, daß sein Versuch, durch das Grundgesetz ( V ) die traditionelle Auffassung des BegrifFsumfangs — also der Klasse oder Menge — formal zu charakterisieren, gescheitert war. Die Wert verlaufe zweier Funktionen Φ(£) und Ψ(£) sollten genau dann gleich heißen, wenn jeder Gegenstand, der die eine Funktion erfüllt, auch die andere erfüllt. Sind die betrachteten Funktionen insbesondere Begriffe, so heißt dies, daß der Umfang eines Begriffes Φ(£) genau dann dem Umfang eines Begriffes Ψ(£) gleich sein soll, wenn jeder Gegenstand, der unter den einen dieser Begriffe fällt, auch unter den anderen fällt. In einer solchen Situation hatte die Tradition in der Tat den beiden Begriffen Umfangsgleichheit bescheinigt. Aber daß aus der Umfangsgleichheit die Eigenschaft folgen
32
Christian Thiel
sollte, daß jeder unter den einen Begriff fallende Gegenstand auch unter den anderen fällt, war in der traditionellen Logik niemals so formuliert worden, und Frege war bereit, diese Richtung seines Grundgesetzes (V) zu opfern. Er war nach eingehender Analyse der Antinomie zu der Meinung gelangt, daß „der Begriffsumfang selbst den Ausnahmefall bewirkt, indem er nur unter den einen von zwei Begriffen fällt, die ihn als Umfang haben". 39 Frege schlug vor, das ursprüngliche Grundgesetz (V) μ ( i f ( e ) = < Μ α ) ) = -^¿r-
/(α) =
g(a))
zu ersetzen durch (V')
h (è/(e) =
àg(a))
= -Λα/η
/(α) = g(a) α = έ(/(ε) àjf(o) ,
woraus die Richtung von (V) von rechts nach links folgt, nicht aber die Richtung von links nach rechts, die vielmehr durch die Antecedentien eingeschränkt wird. Da wir heute dank Lesniewski wissen, daß dieser Ausweg nicht zum Ziel führt, ist seine Analyse weniger wichtig als die Frage nach den Einzelheiten, die hinter Freges Vorschlag stehen. Solche Detailüberlegungen gab es, und sie stecken in Freges Satz (χ) und dessen Konstruktion. Der Satz selber hat die Gestalt, Ι
τ
λ
ο
Ί
mtfw
-= '«(β)
I— Μρ(— Μβ ( — m )
= Mß(—
«(A)
was nach Freges Regeln äquivalent umformbar ist in
Κγλ0/τ)τλ^γτ4τλ& |V ι ι) I 3(a) = (25(a) Mß{—
${ß))
= Mß(—
Vo V G V F (-(f(a) = G(a)) Λ Mß(-
F(ß))
= Mp(-
«(/?))
,
in unserer Notation also G(ß)))
.
Der Satz hat zwei Besonderheiten. Erstens ist er ganz ohne Heranziehung der Wertverlaufsfunktion gewonnen worden, führt diese aber als unzulässig ad absurdum — nämlich zu dem bekannten Widerspruch —, wenn man für die Funktion zweiter Stufe Mß die Wertverlaufsfunktion è φ(ε) einsetzt. Zweitens aber ist Satz χ, wenn ich mit meiner Behauptung von der Gleichwertigkeit des um die Axiome (V) und (VI) verminderten Systems der Grundgesetze mit dem System der Begriffsschrift von 1879 Recht habe, bereits »Frege (1903, 262a).
Nicht aufs Gerathewohl und aus Neuerungssucht"
33
in dem System von 1879 herleitbar und hätte schon dort jeden Versuch zur Einführung der Wertverlaufsfunktion oder auch nur eines für Begriffe und BegrifFsumfänge formulierten Grundgesetzes vom Typ des Grundgesetzes (V) zum Scheitern gebracht. Solange eine solche Herleitung, die j a eine Art Diagonalkonstruktion erfordert, nicht wirklich in der Begriffsschrift von 1879 rekonstruiert worden ist, möchte ich mich weiterer Spekulationen aber enthalten. Interessanter ist das davon unabhängige und von Frege ganz klar ausgesprochene Ergebnis, daß nämlich „der Begriffsumfang im hergebrachten Sinne des Wortes eigentlich aufgehoben" ist. 40 Hier sind nun weniger die technisch versierten Logiker und Mathematiker gefordert als vielmehr die Philosoph(inn)en und Logikhistoriker(innen). Die letzteren hätten zu erforschen, seit wann überhaupt in der Geschichte der formalen Logik vom Umfang eines Begriffes als einer Entität die Rede gewesen ist, statt nur von einem Aspekt, wenn man Begriffe hinsichtlich ihres Umfangs (und ihres Inhalts) vergleicht, ohne darum gleich Begriffsumfänge als neue Gegenstände zu postulieren, deren Verhältnis zu den Begriffen es zu untersuchen gilt. Die Philosophen, zumindest die Expert(inn)en für Wissenschaftstheorie der Formalwissenschaften, hätten zu diskutieren, mit welchem Recht wir, Freges Satz χ als richtig unterstellt, in der heutigen Logik und Mengenlehre weiterhin solche Entitäten postulieren. Frege hat sich in den letzten beiden Jahren seines Lebens so geäußert, daß man bei einem solchen Vorgehen nur einer Täuschung der Sprache unterliege, die die Bildung von Eigennamen gestatte, denen gar kein Gegenstand entspricht. Kennzeichnungen der Form „der Umfang des Begriffes Fu galten ihm jetzt als typische und, wie er nun aus eigener Erfahrung zu wissen meinte, besonders gefährliche Ausdrücke dieser Art. In dem späten Aufsatz Erkenntnisquellen der Mathematik und der Naturwissenschaften41 bekennt er, „bei dem Versuche, die Zahlen logisch zu begründen, dieser Täuschung unterlegen" zu sein, indem er „die Zahlen als Mengen auffassen wollte". Und in einem Brief an Richard Hönigswald vom 26.4.-4.5.1925 erklärt er die Umwandlung eines Begriffes in einen Gegenstand für schlicht unzulässig. Diese Resignation als anachronistisch zu erklären angesichts des gleichzeitigen Aufblühens der Zermelo-Fraenkelschen und der von Neumannschen axiomatischen Mengenlehre, scheint mir eine zumindest logikgeschichtlich, ja vielleicht sogar philosophisch ganz unangebrachte Reaktion zu sein. Die Selbstkritik Freges verdient mindestens so ernsthafte Betrachtung wie der logizistische Ansatz, den sie in Frage stellt. Sie werden vielleicht mit Verwunderung bemerkt haben, daß ich über eine ganze Reihe technischer Probleme hinweggegangen bin, die die heutige Fre40 41
Frege (1903, 260b). In Frege (1969, 2 1983, 286-294, Zitat 288).
34
Christian Thiel
geforschung beschäftigen. Ich habe nichts gesagt über Peter Aczels These, f ü r die Inkonsistenz des Systems der Grundgesetze sei der Wagerechte verantwortlich (eine These, der ich mich für einige J a h r e angeschlossen habe). 4 2 Ich h a b e nicht Stellung bezogen zum Permutationsargument und zur These der Identifizierbarkeit der Wahrheitswerte mit bestimmten Wertverläufen, u n d ich h a b e nicht erkennen lassen, was ich von Freges Beweisversuch für die Bedeutungsdefinitheit 4 3 des Systems der Grundgesetze halte. So wichtig (und subjektiv faszinierend) ich die Klärung dieser Problemkomplexe finde, so glaube ich doch, daß sie auch nach ihrer erhofften Lösung in einer Darstellung der Geschichte der formalen Logik in, sagen wir: 100 J a h r e n , zwar e r w ä h n t , aber nicht als entscheidendes Kennzeichen der Fregeschen Erneuer u n g der mathematischen Logik verzeichnet werden m ü ß t e n . Lassen Sie mich auf die im Titel dieses Vortrags zitierte Stelle zurückkommen, die auf S. XI des ersten Bandes der Grundgesetze steht! Frege hat nicht aufs Geratewohl und aus Neuerungssucht gegenüber schon vorhandenen Systemen der Algebra der Logik seine Begriffsschrift von 1879 geschaffen, die den Beginn der modernen Quantorenlogik markiert. Er hat nicht aus Neuerungssucht im Sinn eines eilig auf den Markt gebrachten update die in den Grundgesetzen verwendete zweite Fassung ausgearbeitet, von der m a n , ohne Zermelo Unrecht zu tun und seine bedeutende Leistung irgendwie zu schmälern, sagen kann, daß mit diesem um die Wertverläufe und ihre Gesetze erweiterten System die moderne axiomatische Mengenlehre beginnt. Darin scheint mir das Entscheidende des gut überlegten Schrittes von der Begriffsschrift von 1879 zu der von 1893 zu liegen. Dieser Schritt ist auch für die Philosophie wichtig geworden, denn Frege h a t mit der Begriffsschrift nicht nur einen calculus ratiocinator geschaffen (einen Logikkalkül), sondern auch eine lingua philosophica in einem vielleicht nicht voll intendierten und vom Leibnizschen abweichenden Sinne. Mit ihr sind auch philosophische Probleme geblieben, und wir gehen sie heute, wenn auch zum Teil mit dem Werkzeug Freges, ganz anders an als dieser. So wird m a n dem rigorosen Einheitlichkeitskonzept Freges nicht mehr bedingungslos folgen wollen, und an der Nützlichkeit selbst der F u n k t i o n Argument-Unterscheidung ist neben vorschneller Kritik (etwa durch Baker u n d Hacker, 4 4 die sie für einen funktionentheoretischen Übergriff halten) 42
Vgl. Aczel (1979) und (1980) sowie Thiel (1983). Dies scheint mir die passendste Bezeichnung für die Eigenschaft eines formalen Systems zu sein, daß jeder nach seinen Regeln korrekt gebildete Ausdruck (1) eine Bedeutung hat, und (2) nur eine Bedeutung hat. In v. Kutschera (1989) findet sich dafür der Terminus „semantische Definitheit". Die Bezeichnungen „semantische Vollständigkeit" (vgl. v. Kutschera (1964)) und „Bedeutungsvollständigkeit" (vgl. Thiel (1975) und (1979)) bringen dagegen einseitig nur die erste Teileigenschaft, die Bezeichnung "referential uniqueness" (vgl. Resnik (1963)) nur die zweite Teileigenschaft zum Ausdruck. 44 Baker/Hacker (1984). 43
Nicht aufs Gerathewohl und aus Neuerungssucht"
35
auch wohlerwogener Zweifel betreffend ihre sprachphilosophische Fruchtbarkeit geäußert worden, auf eindrucksvolle Weise etwa in der neuen Monographie Hans Julius Schneiders. 45 In der Klärung dieser Probleme müssen wir philosophische Aufgaben der Gegenwart sehen; an der einzigartigen geistesgeschichtlichen Bedeutung der Begriffsschrift Freges werden die Antworten, wie immer sie ausfallen, meines Erachtens nichts ändern.
Literatur
Aczel, Peter (1979), The Structure of the Formal Language of Frege's Grundgesetze. 6th International Congress of Logic, Methodology and Philosophy of Science, Hannover, August 22-August 29, 1979. Abstracts, Sections 13/14,16-17. Aczel, Peter (1980), Frege Structures and the Notions of Proposition, Truth and Set. In: Barwise, Jon/Keisler, H.J./Kunen, K. (eds.), The Kleene Symposium, North-Holland, Amsterdam/New York/Oxford, 31-59. Baker, Gordon P./Hacker, Peter M. S. (1984), Frege: Logical Excavations, Oxford University Press, New York / Blackwell, Oxford. Bynum, Terrell Ward (1973), On an alleged contradiction lurking in Frege's Begriffsschrift. Notre Dame Journal of Formal Logic 14, 285-287. Frege, Gottlob (1879), Begriffsschrift. Eine der arithmetischen nachgebildete Formelsprache des reinen Denkens, Louis Nebert, Halle a/S. Frege, Gottlob (1882/83), Ueber den Zweck der Begriffsschrift. Jenaische Zeitschrift für Naturwissenschaft 16 (= N.F. 9), 1-10. Frege, Gottlob (1891), Function und Begriff. Vortrag gehalten in der Sitzung vom 9. Januar 1891 der Jenaischen Gesellschaft für Medicin und Naturwissenschaft, Hermann Pohle, Jena. Frege, Gottlob (1893/1903), Grundgesetze der Arithmetik. Begriffsschriftlich abgeleitet, I/II. Hermann Pohle, Jena. Frege, Gottlob (1969), Nachgelassene Schriften, Hermes, Hans/Kambartel, Friedrich/Kaulbach, Friedrich (Hrsg.), Felix Meiner, Hamburg 1969, 2 1983, 9-52. van Heijenoort, Jean (ed.) (1967), From Frege to Godei. A Source Book in Mathematical Logic. 1879-1931, Harvard University Press, Cambridge, Mass. Hindenburg, Cari Friedrich (1803), Uber combinatorische Analysis und Derivations-Calcul. Einige Fragmente gesammelt und zum Druck befördert, Schwikkert, Leipzig. Humboldt, Wilhelm v. (1826), Ueber die Buchstabenschrift und ihren Zusammenhang mit dem Sprachbau. Abhandlungen der historisch-philologischen Klasse der k. Akademie der Wissenschaften zu Berlin. Aus dem Jahre 1824• Berlin 1826, 161-188; zitiert nach Wilhelm von Humboldt's gesammelte Werke, Sechster Band, G. Reimer, Berlin 1848, 526-561 [die Uberschrift auf S. 526 hat irrtümlich „deren Zusammenhang"]. Die Datumsangabe des Vortrage nach «Schneider (1992).
36
Christian Thiel
dem Abdruck in Wilhelm von Humboldt, Schriften zur Sprachphilosophie (= Werke in fünf Bänden, Flitner, Andreas/Giel, Klaus (Hrsg.), Wissenschaftliche Buchgesellschaft, Darmstadt 1963, 6 1988, III, 82-112. Krug, Wilhelm Traugott (1833) Allgemeines Handwörterbuch der philosophischen Wissenschaften, nebst ihrer Literatur und Geschichte, 2. Aufl., F.A. Brockhaus, Leipzig. Kutschera, Franz v. (1964), Die Antinomien der Logik. Semantische Untersuchungen, Karl Alber, Freiburg/München. Kutschera, Franz v. (1989), Gottlob Frege. Eine Einführung in sein Werk, Walter de Gruyter, Berlin/New York (De Gruyter Studienbuch). Leibniz, Gottfried Wilhelm (1839), [God. Guil. Leibnitii] Opera Philosophica quae exstant Latina Gallia Germanica Omnia, ed. Joannes Eduardus Erdmann. Pars altera, G. Eichler, Berlin. Lukasiewicz, Jan (1929), Elementy logiki matematycznej, Warszawa (Universität Warschau, "Lecture Notes" bearbeitet von M. Presburger); P W N , Warszawa 2 1958. Lukasiewicz, Jan (1935) Zur Geschichte der Aussagenlogik. Erkenntnis 5,111-131. Mitchell, Oscar Howard (1883), On a new algebra of logic. In: Studies in Logic. By Members of the Johns Hopkins University [ed. Charles S. Peirce], Little, Brown, and Company, Boston, repr. [mit Einleitung von Max H. Fisch und einem Vorwort von Achim Eschbach] John Benjamins, Amsterdam/Philadelphia 1983, 72-106. Niethammer, Friedrich Immanuel (1808) Ueber Pasigraphik und Ideographik, Karl Fleißecker, Nürnberg Patzig, Günther (1969), Leibniz, Frege und die sogenannte „lingua characteristica universalis". Akten des Internationalen Leibniz-Kongresses Hannover, I4.-I9. November 1966. Band III. Erkenntnislehre, Logik, Sprachphilosophie, Editionsberichte, Franz Steiner, Wiesbaden (Studia Leibnitiana Supplemento), 103-112. Peirce, Charles Sanders (1883), Note Β [in der Kopfleiste als "The Logic of Relatives" bezeichnet). In: Studies in Logic. By Members of the Johns Hopkins University [ed. Charles S. Peirce], Little, Brown, and Company, Boston, repr. [mit Einleitung von Max Η. Fisch und einem Vorwort von Achim Eschbach] John Benjamins, Amsterdam/Philadelphia 1983, 189-203. Resnik, Michael David (1963), Frege's Methodology. A Critical Study, Ph. D. Thesis, Harvard University, Cambridge, Mass. Schneider, Hans Julius (1992), Phantasie und Kalkül. Uber die Polarität von Handlung und Struktur in der Sprache, Suhrkamp, Frankfurt am Main. Schröder, Ernst (1880), Rezension von Frege (1879). Zeitschrift für Mathematik und Physik 25, 81-94. Thiel, Christian (1975), Zur Inkonsistenz der Fregeschen Mengenlehre. In: ders. (Hrsg.), Frege und die moderne Grundlagenforschung. Symposium, gehalten in Bad Homburg im Dezember 1973, Anton Hain, Meisenheim am Glan (Studien zur Wissenschaftstheorie, Band 9), 134-159. Thiel, Christian (1979), Bedeutungsvollständigkeit und verwandte Eigenschaften deT logischen Systeme Fteges. In: „Begriffsschrift". Jenaer Frege-Konferenz,
Nicht aufs Gerathewohl und aus Neuerungssucht"
37
7.-11. Mai 1979, ed. Franz Bolck, Friedrich-Schiller-Universität, Jena, 483494. Thiel, Christian (1983), Die Revisionsbedürftigkeit der logischen Semantik Freges. Anuario Filosófico XVI/1 (Numero Monográfico dedicado al I Simposio de Historia de la Lògica, 14~15 de Mayo de 1981; Universidad de Navarra, Pamplona), 293-301. Trendelenburg, Adolf (1856), Uber Leibnizens Entwurf einer allgemeinen Charakteristik. Aus den Abhandlungen der Königl. Akademie der Wissenschaften zu Berlin, In Commission bei F. Dümmler, Berlin. Trendelenburg, Adolf (1867), Historische Beiträge zur Philosophie. Dritter Band. Vermischte Abhandlungen, G. Bethge, Berlin („Ueber Leibnizens Entwurf einer allgemeinen Charakteristik" auf S. 1-47).
WOLFGANG
KIENZLER
Über die Architektonik von Freges Grundgesetzen der Arithmetik und die Entstehungszeit des zweiten Bandes Die Architektonik von Freges Grundgesetzen ist bisher sehr wenig beachtet worden. Eine Ausnahme hiervon bilden D u m m e t t s Ausführungen in seinem Buch Frege. Philosophy of Mathematics.1 D u m m e t t nimmt die beiden B ä n d e von 1893 und 1903 nicht einfach als sukkzessive Lieferungen hin, sondern bemerkt: "the division of Grundgesetze into volumes bears no relation to t h e architecture of the book" 2 . Der erste Band enthält nämlich Teil I, Darlegung der Begiffsschrift, sowie den größten Teil von Teil II, Beweise der Grundgesetze der Anzahl, während der zweite Band den Rest von Teil II und "about three-quarters" von Teil III, Die reellen Zahlen, umfaßt. Teil III zerfällt wiederum in zwei Hälften, 111,1 Kritik der Lehren von den Irrationalzahlen, in Prosa, sowie 111,2, Größenlehre, die schließlich unvollendete Fortsetzung des in Teil II begonnenen Aufbaus. D u m m e t t s Analyse befaßt sich mit Teil 111,1 der Grundgesetze und gelangt zu dem Ergebnis, daß dieser Teil generell sehr unübersichtlich und schwach strukturiert ist, und daß die S t r u k t u r , die Frege dem Teil gegeben hat, logisch inkonsequent ist, weshalb D u m m e t t schließlich eine Neuordnung dieser Stücke vorschlägt. Diese Anregung aufgreifend möchte ich zeigen, daß die S t r u k t u r der Grundgesetze auf noch fundamentalere Weise problematisch, bzw. inkonsequent ist. Es paßt nämlich der gesamte Teil 111,1 nicht in die Architektonik von 1893. Es wird sich zeigen, daß aus dieser gewandelten Perspektive, die das Verhältnis beider Bände beachtet, der Teil 111,1 doch eine intern konsequente S t r u k t u r hat. Es ist aber eine andere als die, die D u m m e t t vermißt, wenn er sich a m Vorbild der Grundlagen orientiert. Daraus ergibt sich auch ein neuer Vorschlag zur Datierung der Entstehungszeit des zweiten Bandes. D u m m e t t s Ausgangsthese lautet: "In 111,1, Frege a t t e m p t e d to do for real numbers what he had done for natural numbers in Grundlagen, §§5-54." 3 Freges Vorgehen scheint in der Tat ähnlich zu sein: Auf die ausführliche Kritik (§§55-155) folgt ein Fazit aus der Kritik (§§156-159) und schließlich eine Skizze von Freges eigener Theorie (§§160-164). Die Umsetzung dieses Pla1
Dummett (1991, 241-251: Pari III of Dummett (1991, 241). 3 Dummett (1991, 242). 2
Grundgesetze).
Über die Architektonik von Freges Grundgesetzen der Arithmetik
39
nes fällt aber, so Dummett, sehr wenig zufriedenstellend aus; insbesondere im Vergleich mit der Stringenz und Eleganz der Grundlagen. Für die 101 kritischen Paragraphen beklagt Dummett: "the sections follow no logical sequence", und er schlägt vor, daß die Abschnitte nicht a - b - c - d - e gereiht gehören, sondern daß aus inhaltlichen Gründen die Folge a - d - c - b angebracht wäre, und daß e, der Abschnitt gegen Weierstrass ganz gestrichen h ä t t e werden sollen. 4 D u m m e t t faßt seine Strukturanalyse so zusammen: The Frege who wrote Volume II of Grundgesetze was a very different man from the Frege who had written Grundlagen; an embittered man whose concern to give a convincing exposition of his theory of the foundations of analysis was repeatedly overpowered by his desire for revenge on those who had ignored or failed to understand his work. The consequence is that the reader is not directed, as in Grundlagen, along a path appearing to lead irresistibly to Frege's own theory as the only surviving possibility.5 Wenn im Vergleich zum Frege der Grundlagen ein derart ungünstiges Bild entsteht, so ist zu prüfen, ob man in diesem umfangreichsten Prosatext, den Frege je verfaßt hat, nicht etwas Falsches sucht. Ich möchte im Folgenden plausibel machen, daß der gesamte Teil 111,1 der Grundgesetze eine Reaktion auf Ereignisse in der mathematischen Grundlagenforschung nach 1893 darstellt und daher auch eine polemisch-kritische Struktur aufweist. Er verfolgt gar nicht primär das Ziel, Freges eigene Theorie schrittweise überzeugend zu machen. Ein Großteil der Ausführungen in diesem Teil betrifft nämlich nicht die reellen Zahlen, sondern elementarere und grundlegendere Gegenstände, die ihren systematischen Ort im ersten Band des Werks hätten haben sollen. Frege setzt darum die Kenntnis und die Uberzeugungskraft seines eigenen Systems voraus, wenn er Gegner polemisch behandelt. Die Analogie zu den Grundlagen wäre dagegen eher in der Darlegung des ersten Bandes der Grundgesetze als in der Kritik des zweiten zu suchen. Die Reihenfolge der Abschnitte von Teil 111,1 ist nicht willkürlich, nur folgt sie nicht einem Problemzusammenhang, sondern dem Rang, den Frege seinen Kontrahenten zuerkennt. Deshalb wird, nach der definitionstheoretischen Einleitung, in der Frege sehr respektvoll (viel respektvoller als in seinen Briefen an ihn) auf Peano Bezug nimmt, zunächst Cantor behandelt, den Frege zumindest teilweise als Bundesgenossen einschätzt, und dann erst Heine und Thomae, obwohl gegen sie die längste und genaueste Kritik gerichtet ist. Danach folgen Hankel und Stolz, während Freges Kritik hier bezeichnenderweise kaum Dedekind trifft, den er ebenfalls nennt, aber gleich 4 5
Dummett (1991, 243; 247). Dummett (1991, 243).
Wolfgang Kienzier
40
in die Nähe von Cantor rückt (§138), und als Schlußlicht Weierstrass, bei dem Frege die Unklarheiten gleich gebündelt antrifft, die bei den anderen noch gesondert auftraten. 6 Die Folge der Abschnitte b, c, d und e ist also sachlich ein Nebeneinander (man vergleiche die Titel der Abschnitte!), das Wiederholungen einschließt, sie drückt aber eine Rangordnung der Gegner aus. Dummett beginnt seine Ubersicht mit dem ersten Abschnitt: It might well be thought that the first section ( . . . ) was quite out of place. It is written as if it were an afterthought that should have been included in Part I of the book; but it is not wholly so.7 Er weist dann auf eine Verbindung der Definitionsproblematik zur Einführung der reellen Zahlen hin, zugleich darauf, daß diese Verbindung eher schwach ist, aber er zieht nicht die Konsequenz, daß der Abschnitt tatsächlich nicht an diese Stelle gehört. Der Abschnitt ist im zweiten Band so sehr am falschen Ort, daß er geradezu als ein pragmatischer Selbstwiderspruch aufgefaßt werden kann: Frege präsentiert seine Erläuterungen zum Definieren in zwei auseinanderliegenden Portionen, während er zugleich wiederholt explizit darauf besteht, daß man um exakt vorzugehen, keineswegs in getrennten Teilen, stückweise definieren dürfe. 8 Wenn man Freges eigene Maßstäbe für die Strenge des Aufbaus zugrundelegt, hätte er sowohl die rein formal-symbolischen, wie auch die Definitionen „in den Wortsprachen" zusammen in Teil I einführen müssen. Als Antwort auf die Frage, warum Frege dies nicht getan hat, legt sich die Auseinandersetzung mit Peano nahe. Mit Peano stand Frege seit dessen Lektüre und Rezension des ersten Bandes der Grundgesetze im Briefwechsel, woraus 1896/97 einige Publikationen erwuchsen. Erst durch diese Auseinandersetzung, vor allem um Probleme des Definierens, erkennt Frege, daß selbst unter den anerkanntesten und sorgfältigsten Logikern, also nicht nur unter den Mathematikern, keine Einigkeit über die richtige Weise zu definieren besteht, ja daß Peano im Gegenteil Frege mit Gründen widerspricht. Wie die lange Fußnote zu §58 andeutet, geht der Anstoß zu Freges Ausführungen über den „Grundsatz der Vollständigkeit", der das stückweise Definieren unterbinden soll, auf dessen Infragestellung durch Peano zurück. Frege konnte 6
Diese Reihung nach der „Logik des Ranges des Kontrahenten" wird auch dadurch bestätigt, daß Frege auf Schubert, dem er 1899 eine umfangreiche Polemik widmet, den er aber am wenigsten von allen ernstnimmt, nur in einer einzigen Fußnote (zu §153) hinweist, die wiederum dem Weierstrassabschnitt angefügt ist. 7 Dummett (1991, 244). 8 Es handelt sich hier nicht im strengen Sinne um einen Selbstwiderspruch, weil Frege in den Abschnitten, gemäß seiner Terminologie, nur er läutert, was er unter einer korrekten Definition versteht, da es unmöglich ist, den Grundbegriff „Definition" exakt zu definieren.
Über die Architektonik von Freges Grundgesetzen der Arithmetik
41
diesen Abschnitt nicht in den ersten Band aufnehmen, weil ihm die Dringlichkeit der Problematik 1893 noch ganz fremd war; der Grund ist nicht, daß er vergessen hätte, die Definitionen in den Wortsprachen zu berücksichtigen. Dieser Abschnitt ist zugleich das einzige Beispiel einer Antwort Freges auf das Echo, das sein erster Band hervorgerufen hatte. Was an dieser Stelle allerdings unklar bleibt, ist, warum Frege nicht auf diesen Umstand hingewiesen und warum er diese Auseinandersetzung einfach kommentarlos in den Aufbau der Grundgesetze eingeschoben hat. Das Problem der Architektonik des zweiten Bandes der Grundgesetze beschränkt sich demnach nicht auf die innere Struktur dieses Bandes, sondern verweist auf die Problematik des Verhältnisses beider Bände zueinander. In diesem Sinne kann man sagen, daß die Bandaufteilung zwar nicht der systematischen Aufteilung in Teile entspricht, daß aber dennoch die Beachtung der Bandaufteilung von großer Bedeutung für ein angemessenes Verständnis des Werkes ist. Der Frege des zweiten Bandes der Grundgesetze ist nämlich nicht nur ein anderer als der Frege der Grundlagen, wie Dummett zu Recht betont, sondern er ist auch ein anderer als der Frege des ersten Bandes der Grundgesetze. Die zehn Jahre zwischen 1893 und 1903 sind an Frege nicht spurlos vorbeigegangen, vielmehr hat sich in vielem seine Situation und Perspektive geradezu umgekehrt: Während der Frege des ersten Bandes der Grundgesetze ruhig und umsichtig das in den Grundlagen erläuterte Aufbauwerk vertieft und seine Umsetzung beginnt, ist der Frege des zweiten Bandes ein Mann, der der bereits geleisteten Grundlegungsarbeit relativ wenig Neues hinzufügen kann, der vor allem den bereits existierenden Aufbau gegen Kritik, Mißverständnisse und ein Übergangenwerden schützen will, und der sich intensiv mit dem sich ändernden intellektuellen Klima, das sich einer Gegenpartei zuwendet, die Frege erst nach 1893 als solche erkennt, auseinandersetzt. Der Frege des ersten Bandes ist ganz konstruktiv, und insofern „derselbe" wie der der Grundlagen, aber der des zweiten Bandes ist überwiegend polemisch-defensiv, und darin eher dem Hilbertgegner der Aufsatzreihe Uber die Grundlagen der Geometrie zu vergleichen. Diese Lücke zwischen beiden Bänden, die einen Umschlag der Stimmung markiert, wird von Dummett kaum beachtet, und sehr gering veranschlagt, geradezu geleugnet: 9 It seems likely that most of Volume II was already written in 1893, or shortly afterwards. Most of Frege 's references are to works published before that year. 10 9
Dummett folgt darin der irreführenden Darstellung Freges, der im zweiten Band kommentarlos den Aufbau fortsetzt, ohne im Geringsten anzudeuten, daß der 1903 erscheinende zweite Band ein ganz anderer ist als derjenige zweite Band, der der Konzeption von 1893 entsprochen hätte. 10 Dummett (1991, 241 Anm.).
42
Wolfgang Kienzler
Im Gegensatz zu dieser Vermutung glaube ich, daß die Prosaabschnitte des zweiten Bandes ganz überwiegend als Reaktion auf Ereignisse und Eindrücke entstanden sind, die Frege erst Jahre nach der Veröffentlichung des ersten Bandes erreicht haben. Die im ersten Band entworfene Architektur der Grundgesetze hätte es nämlich verlangt, daß die Darlegung der Begriffsschrift sämtliche grundlegenden Erläuterungen enthielte, oder in Verweisen auf andere Schriften Freges bereitstellte, so daß danach, außer in den kurzen Paragraphen der „Zerlegung" , nur noch der Aufbau von Freges System ganz in Begiffsschriftzeichen folgte. Das Auftauchen von derart umfangreichen Prosaabschnitten deutet daher auf schwerwiegende Probleme hin, die seit 1893 neu hinzugekommen sind. Der systematisch korrekte Ort für solche Auseinadersetzungen wäre ein ausführliches Vorwort, ähnlich dem zum ersten Band, gewesen, in dem Frege aus dem Ablauf des Aufbaus heraustretend zu neu aufgetretenen Fragen hätte Stellung beziehen können. Das erste Beispiel für eine solche Irregularität ist Abschnitt a) über die Definitionen in den Wortsprachen. Dieser steht erstens am falschen Ort innerhalb des Werks, zweitens stellt er dort, wie schon erläutert, einen Selbstwiderspruch dar, und drittens sollte ein konsequenter begriffsschriftlicher Aufbau diesen Abschnitt eigentlich überflüssig machen. Die zweite und umfangreichste Irregularität ist Freges Auseinandersetzung mit der formalen Arithmetik. Mit 52 Paragraphen ist dieser Abschnitt so lang wie die gesamte Darlegung der Begriffsschrift im ersten Band. Frege setzt sich darin vor allem mit der Elementaren Theorie der analytischen Funktionen einer complexen Veränderlichen seines Jenaer Kollegen Thomae auseinander. Dieses Buch erschien 1880 in erster, danach 1898 in zweiter Auflage, in dej· Thomae seinen Ansatz einer formalen Deutung der Arithmetik deutlicher herausarbeitet. Offenbar erkennt Frege erst jetzt darin eine ernstzunehmende Theorie. 11 Der Umschlag ist frappierend: Im Vorwort von 1893 hatte Frege die formale Auffassung erwähnt, aber er schätzte sie zu diesem Zeitpunkt wohl derart unbedeutend ein, daß er an dieser Stelle nicht einmal auf seinen eigenen Vortrag von 1885 Uber formale Theorien der Arithmetik verweist, sondern nur kurz in einer Fußnote aus einer Abhandlung Heines von 1872 zitiert, wozu er lakonisch bemerkt: Wo man sich mit solchen Oberflächlichkeiten zufrieden gibt, ist für eine tiefere Anschauung freilich kein Boden.12 11
Die erste Auflage enthält entgegen Dummetts Angabe (Dummett 1991, 241 Anm.) die von Frege zitierten Passagen nicht, auch Frege führt die zweite Auflage als Quelle an. Durch diesen Irrtum fällt die Hauptbegründung für die frühe Datierung des zweiten Bandes weg. 12 Frege (1893, XIII).
Über die Architektonik von Freges Grundgesetzen der Arithmetik
43
Verglichen mit dem Psychologismus in der Logik, den er anschließend ausführlich behandelt, hält Frege offenbar den formalen Standpunkt in der Arithmetik für eine unbedeutende, überholte, 13 und daher keiner ernsthaften Kritik würdige Anschauung. Zur Zeit der Abfassung des zweiten Bandes hat sich dies gründlich geändert: Der Psychologismus kommt kaum noch vor und dem formalen Standpunkt widmet Frege die ausführlichste Kritik in seiner Laufbahn als wissenschaftlicher Schriftsteller. Dieser radikale Wandel aber wurde von einer ganzen Reihe von Phänomenen veranlaßt, wovon Thomaes Schrift nur ein Glied darstellt. Der wichtigste und auch historisch folgenreichste Anstoß ging dabei von Hilbert aus, der 1899 in seinen Grundlagen der Geometrie das erste durchgearbeitete formalistische System in der Mathematik vorlegte. Frege erkennt die epochale Bedeutung von dieser Leistung sofort und beginnt im Dezember 1899 darüber einen Briefwechsel mit Hilbert. Bereits in seinem zweiten Brief vom 6.1.1900 schlägt Frege Hilbert „im Hinblick auf die große Wichtigkeit der von uns behandelten Fragen für die ganze Mathematik vor, eine spätere Veröffentlichung unseres Briefwechsels ins Auge zu fassen". 14 Die Bedeutung „für die ganze Mathematik" schließt offensichtlich auch die Grundlegung der Arithmetik mit ein, wo in gewandelter Form ähnliche Probleme auftauchen. Daß zu dieser Zeit der zweite Band der Grundgesetze noch nicht abgeschlossen war, geht auch aus einem Brief vom 16.9.1900 an Hilbert hervor, wo Frege schreibt, daß er sich „gerade viel mit dem Problem des Irrationalen beschäftige". Frege erwähnt zwar Hilbert in den Grundgesetzen nicht, weil er erkerint, daß dessen Standpunkt in der Geometrie mit dem formalen Standpunkt in der Arithmetik keineswegs gleichzusetzen ist, 15 aber die Gemeinsamkeit beider ist nicht zu übersehen: Beide stellen die Frage, ob am Anfang der Mathematik Bedeutungen stehen, die in Zeichen ausgedrückt werden, oder ob die Zeichen, Figuren oder Schemata selbst das Erste und Grundlegende sind. Im Oktober 1899, zwei Monate vor dem ersten Brief an Hilbert, unterzeichnet Frege das Vorwort zu seiner Schrift Uber die Zahlen des Herrn H. Schubert. Darin geht er polemisch-parodistisch auf Schuberts im November 1898 erschienenen Beitrag Grundlagen der Arithmetik in dem angesehe13
Heines Schrift war 1893 schon 21 Jahre alt. Frege (1976, 76). Hilbert hat diesem Vorschlag nicht zugestimmt, so daß Frege in zwei Artikelreihen von 1903 und 1906 seinen Standpunkt der Öffentlichkeit zugänglich gemacht hat. 15 Im ersten Aufsatz von 1906 nennt es Frege einen „unglücklichen Gedanken, die Heinesche formaje Theorie der Arithmetik mit der Hilbertschen Lehre zu vermengen" (Frege 1906a, 296); und etwas später versucht er den Unterschied beider Richtungen zu erläutern, und schließt dann: „Regeln aufstellen für die Handhabung von Spielfiguren und die Bedeutung eines Zeichens festsetzen sind doch auf den ersten Blick ganz verschiedene Sachen." (Frege 1906b, 396). 14
44
Wolfgang Kienzier
nen Standardwerk Encyclopädie der mathematischen Wissenschaften ein. 16 Schubert vertritt, wie Frege feststellt, zwar keinen konsequenten formalen Standpunkt in der Begründung der Arithmetik; wie Frege feststellt, vertritt Schubert überhaupt keinen konsequenten Standpunkt, führt aber eine starke formalistische Strömung mit, auf die Frege vehement reagiert. In seiner Darstellung von Schuberts „Verdiensten" arbeitet er zwei Prinzipien heraus, die ihm die allgemeinen Ansichten über die Grundlagen der Arithmetik um das Jahr 1898 zu dominieren scheinen. Als erstes Prinzip präsentiert Frege eine parodistische Fassung der Abstraktionsvorstellungen der meisten Mathematiker, 1 7 und als zweites nennt er das Prinzip der Nichtunterscheidung des Verschiedenen. Es besteht — kurz gesagt — darin, daß zwischen dem Zeichen und dem Bezeichneten nicht zu unterscheiden ist. 18 Frege spricht weiter von der „großen Tragweite" dieses Prinzips, ganz ähnlich wie im zweiten Band der Grundgesetze (§137). Im Vorwort spricht Frege davon, daß er auf Schuberts Schrift gestoßen sei: Als ich mich wegen der Fortsetzung meiner Grundgesetze mit den Schriften anderer Mathematiker über diese Dinge beschäftigte. 19 Frege bestätigt damit ein weiteres Mal, daß er 1899 die Arbeit am zweiten Band noch nicht abgeschlossen hatte, er kündigt hier, wie ein Jahr später im Brief an Hilbert, auch keineswegs dessen baldiges Erscheinen an. Während Hilberts Beitrag Frege davon überzeugt, daß formale Ansätze nicht etwas Überholtes, sondern das Aktuellste in der Grundlagendiskussion überhaupt sind, zeigt ihm Schuberts Enzyklopädieartikel gerade in seiner Unzulänglichkeit, daß formalistische Strömungen dabei sind, kanonisiertes Allgemeingut zu werden. Frege sieht sich also von ganz verschiedenen Seiten in die Defensive gedrängt. Thomaes Schrift von 1898 fügt sich in dieses Muster.
16
Zum Erscheinungsdatum und zu Schubert vgl. Patzig (1966, 16). Frege faßt dabei, wie auch sonst in seinen Schriften, „Abstraktion" durchgehend als psychologischen Vorgang auf: Der erste Hauptfehler, den Frege überall begangen sieht, ist eine Spielart des Psychologismus. 18 Frege (1899, 17). Die beiden in der Schrift gegen Schubert formulierten und erläuterten Prinzipien können übrigens als Leitfaden für die Lektüre des Teils 111,1 dienen, wo Frege an keiner Stelle seine eigenen Grundgedanken derart klar ausspricht. (Zu beachten ist dabei die parodistische Form der Schubertschrift.) Die Anwendung dieser Leitgedanken könnte dazu beitragen, das von Dummett beklagte Chaos in Freges Darstellung zu strukturieren. 19 Frege (1899, IV). 17
Über die Architektonik von Freges Grundgesetzen der Arithmetik
45
Frege hat der formalen Arithmetik nicht zufällig weiten Raum gewidmet. Am Anfang seiner Kritik spricht er davon, daß deren „Grundgedanke" darin bestehe, daß „die Zeichen Alles sind" (§86), und er betont am Schluß noch einmal: Uber die Tragweite des Grundgedankens der formalen Arithmetik sind wohl viele Mathematiker im Unklaren. 20 Diesen Grundgedanken aber hat weder Heine noch Thomae klar herausgearbeitet, sondern erst Frege selbst in seiner Analyse und Kritik. Ohne darauf im Detail einzugehen, sei nur auf ein wichtiges Motiv für Freges Ausführlichkeit und Unerbittlichkeit hingewiesen: Entgegen seinen Beteuerungen steht Freges eigene Konzeption, gerade durch ihre rein begriffsschriftliche Durchführung, die auf alle Worte verzichtet, einer durchdachten formalistischen Auffassung außerordentlich nahe, so daß Frege an einer entscheidenden Stelle die Abgenzung nicht gelingt: Er gibt nämlich die Möglichkeit eines konsequent formalen Aufbaus der Arithmetik selbst zu: Seine eigene Auffassung ergibt bei konsequenter Durchführung eine formale Arithmetik, und sein einziges Argument gegen die Möglichkeit einer solchen Durchführung (und damit einer solchen Deutung) ist ein psychologistisches Hinweisen auf die Gedankenbegleitung beim mathematisch-logischen Tun: 2 1 Nun ist es ja ganz richtig, daß wir unsere Regeln des Schließens und die anderen Gesetze der Begriffsschrift auch hätten einführen können als willkürliche Festsetzungen, ohne irgend von der Bedeutung und dem Sinn der Zeichen zu sprechen. Die Zeichen würden dann eben als Figuren behandelt. Was uns als äußere Darstellung eines Schlusses galt, wäre dann einem Zuge des Schachspiels vergleichbar, nur der Ubergang von einer Figurenstellung zu einer andern, ohne daß dem ein Ubergang von einem Gedanken zu einem andern entspräche. Man könnte jemandem unsere Formeln I bis VI und die Definitionen A bis H des ersten Bandes als Ausgangspunkte geben — vergleichbar der Grundstellung der Schachfiguren —, ihm die Regeln sagen, nach denen er Umformungen vornehmen dürfte, und nun die Aufgabe stellen, unsern Satz (71) des ersten Bandes von jenen Ausgangspunkten zu erreichen; alles dies, ohne daß er eine Ahnung von Sinn und Bedeutung dieser Zeichen hätte, noch von den Gedanken, deren Ausdruck diese Formeln sind. Es wäre sogar denkbar, daß diese Aufgabe ebenso gelöst würde, wie wir es getan haben. Daß dabei geistige Arbeit geleistet werden müßte, versteht sich von selbst, ebenso wie bei 20
Frege (1903, §137). Auf die Möglichkeit und Bedeutung einer solchen Interpretation von Freges Ansatz h a t zuerst Wittgenstein (1967, 105; 124; 130; 138 und 150) hingewiesen. 21
Wolfgang Kienzier
46
einer ähnlichen Aufgabe des Schachspiels, von einer Grundstellung aus zu einer gegebenen Endstellung gemäß den Regeln des Spiels zu gelangen, wobei von Gedanken, die von verschiedenen Stellungen ausgedrückt würden, keine Rede wäre, und kein Zug als Schluß gedeutet werden könnte. Obwohl also geistige Arbeit geleistet würde, fehlte doch ganz der Gedankengang, der bei uns die Sache begleitet und ihr eigentlich erst Interesse verliehen hat. Möglich mag es sein, aber kaum vorteilhaft; dürfte die Aufgabe doch durch Abwehr der Gedankenbegleitung nicht leichter, sondern bedeutend schwerer geworden • 22 sein.
Frege geht in seinen Einwänden gegen die formale Arithmetik auf dieses Zugeständnis nicht weiter ein, aber es ist klar, daß es keine Kleinigkeit darstellt, u n d daß von hier aus gesehen mit der Möglichkeit gerechnet werden muß, daß Freges Einwände auch auf seine eigene Konzeption zurückfallen. Unter Berücksichtung der Architektonik der Grundgesetze sind also als Hauptabfassungszeit des zweiten Bandes die J a h r e nach 1895, vor allem aber seit 1898, über das J a h r 1900 hinaus, anzusehen, und es erscheint ziemlich wahrscheinlich, daß Frege große Passagen des Teiles 111,1 sehr schnell u m das J a h r 1900 herum geschrieben hat. 2 3 Während Freges Werk also in den J a h r e n von 1884 bis 1893 trotz mangelnder Resonanz reifte, geriet Frege seit 1895 mit seinem „inhaltlichen" Ansatz immer mehr in die Defensive gegenüber einem sich verändernden mathematisch-logischen „Klima" . Er reagiert auf seine Gegner einzeln, wodurch Teil 111,1 der Grundgesetze eine personenorientierte und keine sachlich strukturierte Gliederung erhält. Frege verknüpft dabei grundsätzliche Ausführungen mit spezielleren Überlegungen zu Theorien des Irrationalen. Es ist nicht in erster Linie die Konstruktion der Irrationalzahlen, womit sich Frege im zweiten Band der Grundgesetze befaßt, sondern die richtige Ansicht von der N a t u r der Zahlen, der Zeichen 24 und der Definitionen überh a u p t ; mit dem Versuch der Bewältigung dieser Aufgabe sprengt Frege die 1893 entworfene Architektonik: Keiner der Abschnitte von 111,1, mit der 22
Frege (1903, §90). Dies würde auch zum teilweise etwas hastig wirkenden Stil dieser Passagen passen. Ich halte es nicht für unmöglich, daß Frege nach dem ausbleibenden Echo auf den ersten Band den Gedanken an eine Fortsetzung zeitweise fast aufgegeben hatte. Ein Hinweis dafür wäre auch das 1897 entstandene ausführliche Fragment eines grundlegenden Werkes zur Logik im Nachlaß. 1898/1899 wäre dann ein ganz neuer Impuls in Freges Schaffen anzusetzen. Die beiden um 1897 und 1898 anzusetzenden Nachlaßstücke (Frege 1983, 164181), f ü r D u m m e t t "rejected additions to a text already substantially complete", ordnen sich so zwanglos in die Vorbereitungszeit des Bandes ein. D u m m e t t selbst bemerkt, daß sie gegen seine Datierungshypothese sprechen ( D u m m e t t 1991, 241 Anm.). 23
24 M a n beachte etwa die Paragraphen 98 bis 100 mit fundamentalen Ausführungen über den Begriff des Zeichens, die Frege in die Formalismuskritik eingeschoben h a t .
Über die Architektonik von Freges Grundgesetzen der Arithmetik
47
Ausnahme von f, gehört in den zweiten Band. Genau genommen gehören die meisten dieser Ausführungen auch nicht in den ersten Band, denn als Polemiken tragen sie zum eigentlichen Aufbau, der die erklärte Aufgabe der Grundgesetze ist, nichts bei. 25 Mehr noch als die den ersten Band begleitenden Aufsätze von 1891 und 1892 gehörten sie aus dem Werk systematisch ausgegliedert. Die Tatsache, daß die Architektonik der Grundgesetze so offensichtlich problematisch ist, konnte bisher nur deswegen so konsequent übersehen bzw. ignoriert werden, weil man Freges Werk als einen gescheiterten Versuch, als ein eigestürztes Gebäude betrachtete, das durch die Entdeckung der Antinomie nicht nur Fragment blieb, sondern als Bau vernichtet wurde. Die von der Antinomie ausgehende Faszination hat es auch immer verhindert, daß bemerkt wurde, in welch starkem Maße Freges Aufbauwerk schon vor dem Juni 1902 aus dem Lot geraten war; nur glaubte Frege bis dahin offenbar noch, eine überzeugende Antwort auf die Angriffe, Einwände und Gegenvorschläge gefunden zu haben. 2 6
Literatur Dummett, Michael (1991), Frege. Philosophy of Mathematics, Duckworth, London. Frege, Gottlob (1893), Grundgesetze der Arithmetik, 1. Band, Pohle, Jena. Frege, Gottlob (1899), Über die Zahlen des Herrn H. Schubert, Pohle, Jena. Frege, Gottlob (1903), Grundgesetze der Arithmetik, 2. Band, Pohle, Jena. Frege, Gottlob (1906a), Uber die Grundlagen der Geometrie I, in: Jahresbericht der Deutschen Mathematiker-Vereinigung XV, 293-309. Frege, Gottlob (1906b), Über die Grundlagen der Geometrie III, in: Jahresbericht der Deutschen Mathematiker- Vereinigung XV, 423-430. 25
M a n erinnere sich an den ersten Satz des Vorwortes: „Man findet in diesem Buche Lehrsätze, auf denen die Arithmetik beruht, mit Zeichen bewiesen, deren Ganzes ich Begriffsschrift nenne." (S. V) 26 E s sind insgesamt vier Phasen in Freges Arbeit an seinen Grundgesetzen zu unterscheiden: 1) Die „Ur-Grundgesetze" (1885 bis ca. 1890): Die formale Ausarbeitung von Freges ursprünglicher Konzeption von Logik und Arithmetik. „Innere Umwandlungen der Begriffsschrift" haben Frege dann „zur Verwerfung einer handschriftlich fast schon vollendeten Arbeit genötigt" (Frege 1893, IX). Von diesem Text ist nichts erhalten. 2) Der erste Band der Grundgesetze, ergänzt um einige grundlegende Aufsätze (1891-1893): Der Beginn der A u f b a u s von Freges neuem System. 3) Der zweite Band der Grundgesetze (ca. 1895 bis Juni 1902): Freges System weiter ausgebaut, neu erläutert und gegen formalistische Strömungen abgegrenzt. 4) Freges Deutung und anfanglicher Rettungsversuch im „Nachwort" (Juni bis Oktober 1902): Frege versucht sein System zunächst durch eine technisch-formale Änderung zu retten. Frege findet aber den Fehler an seinem System nicht und gibt den Versuch der Grundgesetze schließlich nach 1902 ganz verloren (vgl. Frege 1983, 298).
48
Wolfgang Kienzier
Frege, Gottlob (1976), Wissenschaftlicher Briefwechsel, hrsg. v. Gabriel, Gottfried et al., Meiner, Hamburg. Frege, Gottlob ( 2 1983), Nachgelassene Schriften, Meiner, Hamburg. Patzig, Günther (1966), Einleitung zu: Gottlob Frege, Logische Untersuchungen, Vandenhoek, Göttingen, 5-29). Thomae, Johannes (1880), Elementare Theorie der analytischen Funktionen einer complexen Veränderlichen, Nebert, Halle a. S. Thomae, Johannes ( 2 1898), Elementare Theorie der analytischen Funktionen einer complexen Veränderlichen, Nebert, Halle a. S. Wittgenstein, Ludwig (1967), Ludwig Wittgenstein und der Wiener Kreis, Suhrkamp, Frankfurt.
HARTWIG FRANK
Frege's Waagerechter und die Logik der Begriffsumfänge1 Auf dem Kleene-Symposium 1979 überraschte Peter Aczel2 mit der These, die Inkonsistenz des Systems der Grundgesetze der Arithmetik liege an einer sehr frühen Stelle in dessen Aufbau begründet, nämlich dort, wo Frege den Waagerechten und mit ihm die Funktion „ " einführt, die eine systeminterne Definition des Prädikats „wahr" sei und als solche die Inkonsistenz verursache. Christian Thiel hat im Anschluß an Aczels Ergebnis die Auffassung geäußert, nicht der Waagerechte selbst müsse geopfert werden, sondern seine Verwendung im Rahmen einer naiven Semantik, d.h. die Fregesche Ontologie. 3 Gemeint ist die von Frege für das Gebiet des logisch Sinnvollen als erschöpfend und absolut angenommene Gegenüberstellung von Begriffen (Funktionen), als für den ungesättigten Teil eines Satzes (Gedankens, Urteilsinhalts) stehend, und Gegenständen, die den ungesättigten Teil zu einem vollständigen Gedanken (Urteilsinhalt) machen können. Da Begriff und Gegenstand 4 als wohlunterschiedene und gleichberechtigte Voraussetzungen der Logik auftreten, kann Freges Logikprogramm, und zwar unabhängig von der Zielstellung der rein logischen Begründung der Arithmetik und Analysis, als Untersuchung der logischen Verhältnisse zwischen Begriffen, zwischen Gegenständen und zwischen Begriffen und Ge! D e r Vortrag ist der überarbeitete Teil einer Studie, die während eines sechsmonatigen Aufenthalts (von Juni bis November 1992) am Lehrstuhl von Prof. Christian Thiel am Institut für Philosophie der Universität Erlangen-Nürnberg entstand, der mir durch ein Stipendium der Alexander von Humboldt-Stiftung ermöglicht wurde. Bei der Alexander von Humboldt-Stiftung und bei Herrn Prof. Christian Thiel möchte ich mich für die erwiesene Unterstützung bedanken. 2 Vgl. Aczel (1980, 31ff.). 3 Vgl. Thiel (1983, 300); Thiel (1993, 8). 4 Wenn im folgenden von Gegenständen gesprochen wird, so sollen damit keine ontologischen Annahmen verbunden werden, sondern zu den Gegenständen ist alles das zu rechnen, was nicht Funktion (Begriff) ist und was als solches mit einem Namen (Eigennamen) bezeichnet werden kann, der syntaktisch so „gesättigt" dargestellt werden kann, wie es die Gegenstände selbst sind. (Vgl. Frege (1962a, I, 7)) „Vergegenständlichung" meint dann nichts weiter, als daß ein Ausdruck als Gegenstand aufgefaßt wird, d.h. mit einem Eigennamen bezeichnet werden kann. Zur Vereinfachung der Ausdrucksweise wird meistens von Begriff und BeqjrifFsumfang gesprochen, auch wo evtl. eher „Funktion" und „Wertverlauf' stehen sollten.
Hartwig Frank
50
genständen gekennzeichnet werden. Das logische Verhältnis zwischen Begriffen und Gegenständen ist das Fallen eines Gegenstandes unter einen Begriff (von Frege „Subsumtion" genannt), auf das sich alle Beziehungen zwischen Begriffen zurückführen lassen. 5 Beziehungen zwischen Begriffen waren nun das bevorzugte Untersuchungsfeld der Logik seit Aristoteles gewesen, und obwohl Frege durchaus an deren Ergebnisse anknüpfen konnte, geht seine Unterscheidung der Begriffsverhältnisse in solche der Begriffsunterordnung (Subordination) und solche des Fallens eines Begriffs in einen (anderen, und zwar höherstufigen) Begriff (Subalternation) über die Auffassung der Eigenart von Begriffsverhältnissen in der traditionellen Logik hinaus. 6 Zwischen Gegenständen (und nur zwischen Gegenständen) ist nach Frege als logisches Verhältnis die Gleichheit (Identität) möglich, weshalb Frege die Redeweise von der Identität von Begriffen, wie sie in der traditionellen Logik anzutreffen ist, verwirft. Die Gegenstandsgleichheit kann noch weiter danach unterschieden werden, ob ihr die Allgemeinheit einer Beziehung entspricht oder nicht; letzteres hat statt, wenn zwei Eigennamen ein und denselben Gegenstand bedeuten (und könnte als Gegenstandsidentität schlechthin bezeichnet werden), ersteres dagegen ist der Fall, wenn die Bedeutungen der Namen deshalb gleichgesetzt werden dürfen, weil ihnen (den Bedeutungen) gleiche Gegenstände entsprechen. In diesem Fall sind die Bedeutungen der Namen Begriffe, und Frege meint die Gleichheit von Begriffsumfängen. 7 In Freges Logik sind somit fünf Arten logischer Verhältnisse (die untereinander in einem Zusammenhang stehen) unterscheidbar: Subsumtion, Subordination, Subalternation, Gegenstandsidentität und Begriffsumfangsgleichheit (allgemeiner: Wertverlaufsgleichheit). 8 Außerdem fordert Frege scharf begrenzte Begriffe, d.h. bei einem jeden Begriff müsse für jeden Gegenstand bestimmt sein, ob er unter den Begriff falle oder nicht. 9 Frege hat seine Auffassung der Begriffsumfänge als logischer Gegenstände in Verfolgung seiner logischen und mathematischen Forschungen bestimmter gefaßt. Während er in den Grundlagen der Arithmetik (1884) noch meinte, voraussetzen zu können, „daß man wisse, was der Umfang eines Begriffes sei", 1 0 hat er in Funktion und Begriff (1891) u n d in Grundgesetze 5
der
Arith-
Vgl. Frege (1971, 25). Vgl. Angelelli (1975, 17ff.); zu in den Klammern stehenden Bezeichnungen vgl. Kreiser (1986, 61). 7 Deshalb warnt Frege: „Man könnte so leicht dahin kommen, den Begriffsumfang für die Bedeutung des Begriffswortes auszugeben; aber hierbei würde man übersehen, daß Begriffsumfänge Gegenstände und nicht Begriffe sind (vgl. meinen Vortrag Funktion und Begriff)." (Frege (1971, 26); zur Erläuterung vgl. auch Freges Brief an Husserl vom 24. Mai 1891, in: Frege (1980, 33-37)). 8 Hinzu kommt natürlich der von Frege begründete Aussagenkalkül. 9 Vgl. Frege (1962, 29); Frege (1962a, I, 9, n3). 10 Frege (1988, 76). 6
Frege's Waagerechter und die Logik der Begriffsumfänge
51
metik (Bd.l, 1893, Bd.2, 1903) Begriffsumfänge als Wertverläufe von Funktionen (Begriffen), die für jedes Argument den Wert das Wahre-oder das Falsche haben, interpretiert. Ich möchte im folgenden eine Art Gedankenexperiment anstellen, indem ich Freges Bestimmung von „Begriffsumfang" in den 90er Jahren unmittelbar mit einer früheren Auffassung Freges konfrontiere und frage, ob sich daraus Aufschlüsse für die spätere Bestimmung gewinnen lassen. In Funktion und Begriff beschreibt Frege einen Begriff „ x", den er den Waagerechten nennt, mit folgenden Eigenschaften: Der Begriff , xl hat den Wert das Wahre, wenn als Argument das Wahre genommen wird, und er hat den Wert das Falsche, wenn das Argument das Falsche oder wenn das Argument kein Wahrheitswert ist. 11 In den Grundgesetzen ist dieser Begriff, dort geschrieben als „ eine der Urfunktionen. Als Funktion kann dieser Begriff alles, was Gegenstand ist, zum Argument haben, und da Begriffsumfänge Gegenstände sind, insbesondere auch seinen eigenen Umfang. Für diesen Fall könnten drei Möglichkeiten erwogen werden: Ist der Ausdruck „der Umfang des Begriffs , " Name für das Wahre, so hat die Funktion den Wert das Wahre und der Umfang des Begriffs „ ξ" fällt unter diesen Begriff wie alle anderen Gegenstände auch, für die als Argument genommen die Funktion „ξ" den Wahrheitswert des Wahren hat. Bezeichnet der genannte Ausdruck aber das Falsche oder einen von Wahrheitswerten unterschiedenen Gegenstand, so hat die Funktion den Funktionswert des Falschen. Welche dieser Möglichkeiten zutrifft, läßt sich allein aufgrund dessen, daß Begriffsumfänge Gegenstände sind, nicht entscheiden. Frege hat die daraus resultierende Unbestimmtheit für den Aufbau seines Systems im §10 der Grundgesetze behoben. Bevor ich jedoch auf Freges Lösung eingehe, wage ich das angekündigte Gedankenexperiment. Frege hatte das funktionsdarstellende Zeichen schon früher, wenn auch in einem anderen Gebrauch verwendet. In Begriffsschrift (1879) nennt Frege dieses Zeichen Inhaltsstrich, und was in dem Ausdruck „ Au an die Stelle von A gesetzt werden darf, muß ein beurteilbarer Inhalt sein, d.h. ein Inhalt, der bejaht (behauptet) oder verneint werden kann. Wird der Inhalt behauptet, so hat Frege dafür als weiteres Zeichen einen senkrechten Strich, und die Kombination beider Zeichen | kennzeichnet den behaupteten Gedanken oder das Urteil. 12 Freges Auffassung des waagerechten Strichs ändert sich allmählich. 13 Ich schlage nun folgende, zugegeben der Fregeschen Intention nicht entsprechende 14 Überlegung vor: Man nehme den Inhaltsstrich " V g l . Frege (1962, 29f.). 12 Vgl. Frege (1973, 52f.). 13 Vgl. Thiel (1976, 290). 14 Frege meint 1891 ausdrücklich: „Ich habe diesen waagerechten Strich früher Inhaltsstrich genannt, ein Name, der nun nicht mehr passend scheint." Frege (1962, 30)) Was Frege meint, liegt natürlich nicht nur im Namen, sondern in der Sache begründet. Vgl.
52
Hartwig Frank
von 1879 und lese ihn wie den Waagerechten von 1891. Da ein beurteilbarer Inhalt (1879) mit einem Gegenstand (1891) gemeinsam hat, daß beide jeweils hinsichtlich der Funktion als ein abgeschlossenes Ganzes, als gesättigt, angesehen werden können, so sei der Begriff „ x" durch folgende Funktion gegeben: Die Funktion ist erklärt für alle beurteilbaren Inhalte und nur für diese. Steht an Argumentstelle ein beurteilbarer Inhalt, der wahr ist, so hat die Funktion den Wert das Wahre, für alle anderen beurteilbaren Inhalte als Argumente hat sie den Wert das Falsche. Es würden also gerade die wahren beurteilbaren Inhalte unter den Begriff „ x" fallen. Man könnte sich diese Funktion als eine umwandelnde und selektierende Operation veranschaulichen, die die beurteilbaren konkreten Inhalte in abstrakte Wahrheitswerte des Wahren und des Falschen verwandelt. Nun sei angenommen, der Umfang des Begriffs „ x" gehöre selbst zu den beurteilbaren Inhalten, welchen Wert hat dann die Funktion für ihn als Argument? Wäre ihr Wahrheitswert das Wahre, würde der Umfang des Begriffs „ x" unter diesen Begriff fallen, also in den Umfang der wahren beurteilbaren Inhalte gehören, den er selbst bildet. Da die Funktion „ z" bestimmt worden war als Zuordnung des Wahrheitswerts des Wahren zu den wahren beurteilbaren konkreten Inhalten, müßte die Zuordnung als vollzogen angenommen werden, bevor der Umfang des Begriffs „ x" Argument derselben Funktion sein kann, sein Wahrsein als beurteilbarer Inhalt würde aber heißen, daß sie nicht abgeschlossen gewesen ist. Man hätte es also in diesem Fall mit einem Begriffsumfang zu tun, der, um als Begriffsumfang bestimmbar zu sein, schon als bestimmter Begriffsumfang vorausgesetzt werden müßte, eine zirkelhafte Bestimmung. Wird dagegen angenommen, der Funktionswert sei das Falsche, so kommt es zu keinem Zirkel, da der Umfang in diesem Fall nicht unter seinen Begriff fällt und so nicht sich selbst angehört. Zu dem gleichen Ergebnis käme man, wenn beurteilbare Inhalte und Begriffsumfänge als logische Gegenstände aufgefaßt würden, deren Namen an Argumentstelle der Funktion eingesetzt werden können, zumindest solange, wie diese Namen die Eigennamen der jeweils noch inhaltlich unterscheidbaren logischen Gegenständen sind. Nun wird in dieser Argumentation die offensichtlich fehlerhafte Annahme unterstellt, Begriffsumfänge könnten als beurteilbare Inhalte angesehen werden, der aber ganz klar Freges Meinung über beurteilbare Inhalte von 1879 entgegensteht. Danach sind beurteilbare Inhalte eher Aussagen (im Sinne der Aussagenlogik), und Aussagen sind Begriffsumfänge ja in keinem Fall. Doch ein ähnliches Ergebnis läßt sich auch für Aussagen herleiten, wenn man mit Frege das Zeichen | als Ausdruck für „ist eine Tatsache" oder „ist wahr" versteht. Man kann nämlich fragen: Ist die Aussage „Alle hinter dem Urteilsstrich stehenden Aussagen (beurteilbaren Inhalte) sind wahr" ein beauch Hoche (1976, 92).
Frege's Waagerechter und die Logik der Begriffsumfänge
53
urteilbarer Inhalt? Wenn sie ein beurteilbarer Inhalt ist, dann kann sie hinter dem Inhaltsstrich stehen, d.h. sie ist entweder wahr oder falsch. Falsch kann sie aber nicht sein, da dann ihr Inhalt der festgelegten Bestimmung des Urteilsstrichs widersprechen würde. D.h. aber, wenn sie ein beurteilbarer Inhalt ist, dann ist sie allein schon deswegen wahr. Das ist natürlich kein Widerspruch, es ist aber bemerkenswert, daß damit eine Aussage (ein beurteilbarer Inhalt) gewonnen wäre, die (der) allein deshalb, weil sie (er) eine Aussage (ein beurteilbarer Inhalt) ist, wahr wäre. (Der hier in der Konstruktion enthaltene Zirkel wird vielleicht noch deutlicher, wenn man statt „Alle" „Jede" sagt.) Es bliebe andererseits die Möglichkeit anzunehmen, daß die obige Aussage kein beurteilbarer Inhalt ist. Dies könnte auf zwei Wegen geschehen: man könnte meinen, daß es außer beurteilbaren Inhalten auch unentscheidbare Inhalte gibt (also Aussagen, für die weder behauptet werden kann, daß sie wahr sind, noch behauptet werden kann, daß sie nicht wahr sind), oder man könnte die obige Aussage für eine Scheinaussage halten. Beide soeben vorgestellten Argumentationen treffen nun aber die Auffassung Freges von 1879 insofern nicht, als er zu dieser Zeit weder von Wahrheitswerten sprach noch Begriffsumfänge als logische Gegenstände ansah, und es auch nicht zugelassen hätte, daß der Ausdruck „ist wahr" in einem beurteilbaren Inhalt auftritt. Letzteres deshalb nicht, weil der Urteilsstrich für Frege um diese Zeit für die „That des Urtheilens" 15 steht, die als solche in einem beurteilbaren Inhalt gar nicht auftreten kann. Während also erstere Argumentation Frege deshalb nicht trifft, weil sie etwas unterstellt, was er um 1879 nicht vertrat, geht letztere fehl, weil sie nicht alles in Betracht zieht, was Frege zu jener Zeit für logisch wesentlich hielt. Dennoch scheinen mir diese Überlegungen mehr als bloße Spielerei zu sein. Sie fixieren zwei gedankliche Pole, zwischen denen die Evolution von Freges Auifassung des Waagerechten stattfindet: Um zu den Wahrheitswerten zu kommen, mußte Frege die Tat des Urteilens als Resultat, das Wahre, nehmen. Mit dieser Veränderung des Senkrechten vom Kennzeichen einer Tat zum Ausdruck eines Resultats mußte sich auch das Verständnis des Waagerechten ändern und zwar so, daß das Wahre nicht selbst zu einem beurteilbaren Inhalt werden kann (da damit die Möglichkeit einer zirkelhaften Bestimmung der oben aufgezeigten Art h ä t t e verbunden sein können), sondern Name des Wahren und das Wahre als Bedeutung unterscheidbar werden. War der Inhaltsstrich 1879 Ausdruck für die Bildung beurteilbarer Inhalte (wobei sowohl die Beurteilbarkeit, wie der Umstand, daß es sich um logisch unterscheidbare Inhalte handelt, wesentlich ist), so kennzeichnet der Waagerechte nach 1891, daß es sich um bedeutungsvolle Namen handelt. Dies erscheint mir eine wichtige Modifikation, deren eine Folge ist, daß Zirkelbestimmungen, wie die oben 15
Vgl. Frege (1964, 101).
54
Hartwig Frank
aufgezeigten, nicht mehr in Erscheinung treten. Frege behebt in den Grundgesetzen die Unbestimmtheit, die oben für den Fall, daß der Umfang des Begriffs „ Argument der diesem Begriff entsprechenden Funktion ist, angedeutet wurde, indem er sie allgemein faßt und dann festsetzt: der Umfang dieses Begriffs ist das Wahre. Ich skizziere kurz den Gedankengang. 16 Da Frege im systematischen Aufbau der Grundgesetze bis zu der Stelle, wo die Unbestimmtheit behoben wird (§10), nur Gegenstandsnamen für Wahrheitswerte und Wertverläufe (Begriffsumfänge) eingeführt hat, kann die Problemstellung im §10 auch so formuliert werden: Bezeichnen Wertverlaufsnamen dieselben logischen Gegenstände wie Wahrheitswertnamen, so daß alle bis zu dieser Stelle eingeführten Gegenstandsnamen nur die zwei logischen Gegenstände, den Wahrheitswert des Wahren (kurz: das Wahre) oder den Wahrheitswert des Falschen (kurz: das Falsche) bezeichnen, oder ist mit der Einführung der Wertverlaufsnamen die Annahme einer weiteren Art logischer Gegenstände verbunden. 17 Frege weist nun nach, daß ersteres der Fall ist, indem er zeigt, daß mit dem bisherigen Aufbau der Grundgesetze widerspruchsfrei eine Funktion vereinbar ist, die er so bestimmt: Die Funktion (Frege nennt sie ,,X(£)") hat (1) als Wert das Wahre, wenn an Argumentstelle ein bestimmter Name steht, der als Wertverlaufsname erkennbar ist (z.B. ,,άΛ(α)"), und sie hat eben den von diesem Namen bezeichneten Gegenstand als Wert, wenn ihr Argument das Wahre ist, (2) als Wert das Falsche, wenn an Argumentstelle ein anderer bestimmter Name steht, der als Wertverlaufsname erkennbar ist (z.B. ,,άΜ(α)"), und den von diesem Namen bezeichneten Gegenstand als Wert, wenn ihr Argument das Falsche ist, und (3) in allen anderen Fällen den Gegenstand als Wert, den der Name, der an Argumentstelle steht, bezeichnet. Durch die Funktion wird also einem bestimmten, als solcher auch erkennbaren Wertverlaufsnamen umkehrbar eindeutig der Name des Wahren und einem weiteren bestimmten und als solcher erkennbaren Wertverlaufsnamen umkehrbar eindeutig der Name des Falschen zugeordnet, d.h. die so einander zugeordneten Namen bedeuten jeweils dasselbe (die einen das Wahre, die anderen das Falsche). Da diese Funktion nun nicht im Widerspruch zu dem bis dahin vollzogenen logischen Aufbau steht, 18 die Wahl der oben verwendeten Wertverlaufsnamen aber willkürlich geschah, kann also ein beliebiger Wertverlaufsname als Name für das Wahre und ein beliebiger anderer als Name für das Falsche gewählt werden. Damit kann Frege die schon angedeutete Festsetzung machen, daß 16
Vgl. Frege (1962a, I, 16ff.); Thiel (1976, 287ff.). Vorausgesetzt ist natürlich, daß nur solche Gegenstandsnamen eingeführt werden, die einen Gegenstand bedeuten. „Bedeutungslose Namen dürfen in der Begriffsschrift nicht vorkommen." (Frege (1962a, I, 9)). 18 I n s b e s o n d e r e zu der Umsetzungsregel, zu n ä h e r e m vgl. die klare Analyse bei Thiel (1976, 287ff). 17
Frege's Waagerechter und die Logik der Begriffsumfänge
55
der Name des Wertverlaufs der Funktion „ das Wahre bedeuten soll, und ebenso setzt er fest, daß ein bestimmter Wertverlaufsname das Falsche bedeuten soll. Aus Freges Erläuterung folgt, daß alle bisher eingeführten Funktionen wertverlaufsdefinit sind, d.h. es kann für jeden Namen, der einen Gegenstand bedeutet, eindeutig bestimmt werden, welchen Wert die Funktion hat. Außerdem kann jede weitere Funktion so eingeführt werden, daß die Wertverlaufsdefinitheit aller Funktionen erhalten bleibt. 19 Zusammen mit der Voraussetzung, daß nur bedeutungsvolle Gegenstandsnamen zugelassen sind, dürfte somit gesichert sein, daß logisch korrekte Ableitungen immer zu bedeutungsvollen Namen führen, also zu Namen, die einen Begriff (eine Funktion) oder einen Gegenstand bedeuten. Ich möchte jetzt auf das obige Gedankenexperiment zurückkommen. Dessen Ergebnis war, daß ein Zirkel in der Bestimmung des Begriffsumfangs von „ x" vorliegt, wenn angenommen wird, dieser Umfang falle unter seinen Begriff. Man kann dies Ergebnis auch so formulieren, daß die Funktion „ xu für ihren eigenen Wertverlauf als Argument nicht definiert ist oder daß der Begriff „ x" nicht umfangsdefinit ist. Nun ist der in dieser Uberlegung verwendete Begriff „ z" ja nur die Rückversetzung des Begriffs „ aus den Grundgesetzen in Freges Argumentationsstand z.Z. der Begriffsschrift. In den Grundgesetzen macht Frege aber gerade das, was um 1879 zu einer zirkelhaften Bestimmung geführt hätte, er läßt den Umfang des Begriff „ unter diesen selbst fallen, und zwar als ausdrückliche, von ihm getroffene Festsetzung. 20 Aber ein Zirkel ist hierbei nicht sichtbar. Die Erklärung liegt in der Evolution von Freges logischen Anschauungen, insbesondere in Freges spätestens um 1890 ausgeprägter Überzeugung, daß Wahrheitswerte logische Gegenstände sind, wobei Gegenstand hier nichts anderes heißen soll, als Bedeutung eines Eigennamens zu sein und daher an Argumentstelle einer Funktion stehen zu können. Da Freges Ausgangsbasis in den Grundgesetzen die Voraussetzung von genau zwei logischen Gegenständen ist, des Wahren und des Falschen, so stehen an Argumentstelle in „ wenn die Funktion wahr ist, Namen des Wahren, d.h. in diesem Fall ordnet die Funktion einem Namen des Wahren einen anderen Namen des Wahren zu. Damit ist ein Zirkel an dieser Stelle tatsächlich ausgeschlossen, denn die Funktion sagt ja nur, wenn sie wahr ist, daß verschiedene Namen dasselbe bedeuten; das, was sie bedeuten, steht dabei nie in Frage, denn es wurde ja vorausgesetzt. Diese Voraussetzung aber scheint mir nicht trivial zu sein. Denn einen Wahrheitswertnamen als bedeutungsvoll vorauszusetzen, heißt für Frege vorauszusetzen, daß er einen Gegenstand bedeutet. Nun wird wohl kaum jemand bezweifeln, daß Wahrheitswerte, wenn sie denn überhaupt Ge19 20
Vgl. Frege (1962a, I, 18). Vgl. Frege (1962a, I, 17f.).
56
Hartwig Frank
genstände sind, abstrakte Gegenstände sind, und als solche werden sie auch von Frege vorausgesetzt. Aber Frege gibt nirgendwo, soweit ich sehe, eine systematische Einführung dieser Abstrakta. 21 Es fragt sich, ob eine solche nachgereicht werden könnte. Frege scheint nicht daran geglaubt zu haben. Dies vermute ich nicht nur deshalb, weil er sie sonst wohl selbst gegeben hätte, sondern auch, weil die Evolution seiner Auffassung in dieser Frage nahelegt, daß er der unangenehmen Eigentümlichkeit des Begriffs „wahr( )", nicht umfangsdefinit zu sein, ausweichen wollte und deshalb das Wahre als Gegenstand nahm. Hier könnte sich aber eine Schwierigkeit andeuten, die, falls sie sich als real erweisen sollte, Beachtung verdienen würde. Denn sollte der Vergegenständlichung des „ist wahr" zum Wahren der Sprung über eine zirkelhafte Bestimmung zugrundeliegen (wie das Gedankenexperiment nahelegen könnte), so scheint es mir fraglich, ob Frege, hätte er sich dies bewußt gemacht, einen solchen, aus einem Zirkel resultierenden Gegenstand als Bedeutung eines Gegenstandsnamens in den Grundgesetzen akzeptiert hätte. Zwar würde ein solcher Gegenstand nicht im Widerspruch mit Freges Anforderungen an das, was ein Gegenstand ist, stehen, doch vielleicht hätte er zusätzliche Vorsorge getroffen, damit das, was einmal überwunden war, nicht irgendwo doch wieder zutage treten könnte. 22 Beseitigt wäre die Schwierigkeit wohl dann, wenn es gelänge, die Wahrheitswertnamen so einzuführen, daß sie auch eliminierbar wären. Da Frege dies aber nicht macht, und er gezeigt hat, daß im Aufbau der Grundgesetze bis zum §10 Wertverlaufsnamen nichts anderes bedeuten als Wahrheitswerte, so dürfte Freges Behauptung, daß Wahrheitswerte, Begriffsumfänge und Wertverläufe Gegenstände sind, im Kontext der Grundgesetze mehr als eine Redeweise zu sein, vermutlich ist sie sogar eine logische Voraussetzung für das System der Grundgesetze.
21
In Sinn und Bedeutung sagt er: „So werden wir dahin gedrängt, den Wahrheitswert eines Satzes als seine Bedeutung anzuerkennen. Ich verstehe unter dem Wahrheitswert eines Satzes den Umstand, daß er wahr oder daß er falsch ist. Weitere Wahrheitswerte gibt es nicht." (Frege (1962, 46)). 22 Obwohl diese Überlegung von Thiels Untersuchung über Zirkelkonstruktionen in der Fregeschen Mengenlehre (vgl. Thiel (1975, 134ff.)) angeregt wurde, soll nicht behauptet werden, daß die Antinomie in Freges System an dieser Stelle begründet liege. Dazu wäre natürlich eine gründlichere Analyse notwendig.
Frege's Waagerechter und die Logik der Begriffsumfänge
57
Literatur Aczel, Peter (1980), Frege Structures and the Notions of Proposition, Truth and Set. In: Bárwise, J./Keisler, H.J./Kunen, K. (eds.), The Kleene Symposium, Amsterdam, New York, Oxford, 31-59. Angelelli, Ignacio (1975), Freges Ort in der Begriffsgeschichte. In: Thiel, Christian (Hrsg.), Frege und die moderne Grundlagenforschung, Meisenheim am Glan, 9-22. Frege, Gottlob (1962), Funktion und Begriff. In: Patzig, Günther (Hrsg.), Funktion, Begriff, Bedeutung. Göttingen, 18-39. Frege, Gottlob (1962a), Grundgesetze der Arithmetik, Darmstadt. Frege, Gottlob (1964), Ueber den Zweck der Begriffsschrift. In: Angelelli, Ignacio (Hrsg.), Begriffsschrift und andere Aufsätze, Darmstadt, 97-106. Frege, Gottlob (1971) [Ausführungen über Sinn und Bedeutung], In: Gabriel, Gottfried (Hrsg.), Schriften zur Logik und Sprachphilosophie. Aus dem Nachlaß, Hamburg, 25-34. Frege, Gottlob (1973), Begriffsschrift, eine der arithmetischen nachgebildete Formelsprache des reinen Denkens. In: Berka, Karel/Kreiser, Lothar (Hrsg.), Logik- Texte. Kommentierte Auswahl zur Geschichte der modernen Logik, Berlin, 48-106. Frege, Gottlob (1980), Brief an Edmund Husserl vom 24. Mai 1891. In: Gabriel, Gottfried/Kambartel, Friedrich/Thiel, Christian (Hrsg.), Gottlob Freges Briefwechsel mit D.Hilbert, E.Husserl, B.Russell, sowie ausgewählte Einzelbriefe Freges, Hamburg, 33-37. Frege, Gottlob (1988), Die Grundlagen der Arithmetik, Hamburg. Hoche, Hans-Ulrich (1976), Vom Jnhaltsstrich' zum ,Waagerechten'. Ein Beitrag zur Entwicklung der Fregeschen Urteilstheorie. In: Schirn, Matthias (Hrsg.), Studien zu Frege II. Logik und Philosophie der Mathematik, Stuttgart-Bad Cannstatt, 87-102. Kreiser, Lothar (1986), Deutung und Bedeutung, Akademie-Verlag, Berlin. Thiel, Christian (1975), Zur Inkonsistenz der Fregeschen Mengenlehre. In: Thiel, Christian (Hrsg.), Frege und die moderne Grundlagenforschung, Meisenheim am Glan, 134-159. Thiel, Christian (1976), Wahrheitswert und Wertverlauf. Zu Freges Argumentation im §/0 der „Grundgesetze der Arithmetik". In: Schirn, Matthias (Hrsg.), Studien zu Frege I. Logik und Philosophie der Mathematik, Stuttgart-Bad Cannstatt, 287-300. Thiel, Christian (1983), Die Revisionsbedürftigkeit der logischen Semantik Freges. In: Anuario filosofico, Universidad de Navarra, vol. XVI n.l, 293-301. Thiel, Christian (1993), Zum Verhältnis von Syntax und Semantik bei Frege. In: Stelzner, Werner (Hrsg.), Philosophie und Logik. Frege-Kolloquien Jena 1989/1991, de Gruyter, Berlin/New York, 3-15.
WERNER
STELZNER
Wahrheits- und Falschheitsfunktionen in der Begriffsschrift der Grundgesetze Gottlob Frege hat in der Begriffsschrift1 einen in seiner Systematik für die moderne Logik paradigmatischen Aufbau der klassischen Logik geliefert: Als elementare Basis dieser Logik wird die klassische Aussagenlogik aufgebaut. Uber Erweiterung der Ausdrucksmittel, der Semantik und der deduktiven Möglichkeiten wird über der Aussagenlogik die Prädikatenlogik eingeführt. Das klassisch zweiwertige aussagenlogische Fragment des Gesamtaufbaus wird bei Frege in der Begriffsschrift durch Funktionen bestimmt, die für Argumente definiert sind, die beurteilbare Inhalte ausdrücken, sich also auf Ausdrücke beziehen, denen Wahrheitswerte zukommen. Mit Inhaltsstrich ( ), Negation (—¡— ) und Implikation ( L. ) gibt Frege ein funktional vollständiges System von Grundfunktionen an, in dem sich in heute gewohnter Weise beliebige klassische aussagenlogische Funktionen definieren lassen. Die Unterscheidung zwischen Ausdrücken mit beurteilbarem Inhalt und solchen ohne beurteilbaren Inhalt (bzw. solchen Ausdrücken, die Wahrheitswerte ausdrücken und solchen, die das nicht leisten) ist für die Syntax der Begriffsschrift also zentral.
1
Propositionale und nichtpropositionale Gegenstände
Beim Aufbau der Begriffsschrift der Grundgesetze2 orientiert sich Frege an der fundamentalen Unterscheidung zwischen Funktion und Gegenstand, was u.a. beinhaltet, daß auch die den logischen Funktionen Negation und Implikation der Begriffsschrift entsprechenden Funktionen Negation und Implikation der Grundgesetze für Gegenstände beliebiger Art definiert werden: sowohl für Wahrheitswerte als auch für Gegenstände anderer Art. In diesem Rahmen erfährt auch der Inhaltsstrich der Begriffsschrift eine Neubestimmung: Ist der Inhaltsstrich der Begriffsschrift termbildender Operator, der aus einem Gebilde H mit beurteilbarem Inhalt den Terminus „der Umstand, daß / / " , „der Satz, daß / / " bildet, so ist der ihm syntaktisch entsprechende 'Frege (1879). 2 Frege (1893/1903).
59
Wahrheits- und Falschheitsfunktionen
Waagerechte der Grundgesetze zum Ausdruck einer Wahrheitsfunktion eingeführt, die genau dann den Wert wahr annimmt, wenn ihr Argument der Wert wahr ist. Ist das Argument der Wert falsch oder ein Gegenstand, der kein Wahrheitswert ist, so ist der Wert der Funktion der Wert falsch, d.h. der Waagerechte wird als Prädikator zum Ausdruck des Prädikats „ist wahr" eingeführt. H H
W
F
Ν
W
F
F
Ν steht hier und im folgenden für einen beliebigen von wahr (W) und falsch (F) verschiedenen Gegenstand als Argumentwert. Es wäre also inkorrekt, diese Tabellen als Wertetabellen einer dreiwertigen Logik aufzufassen. Ν ist kein Wahrheitswert, und Ν ist auch nicht mit dem durch Nuel Belnap 3 zur Interpretation der vierwertigen Tautological Entailments eingeführten Wert NONE (weder W, noch F) gleichzusetzen. Die durch Ν vertretenen Gegenstände werden im weiteren nichtpropositionale G e g e n s t ä n d e genannt, während W und F propositionale G e g e n s t ä n d e sind.
2
Propositionale Funktionen
Im folgenden sollen, diesem Ansatz entsprechend, als p r o p o s i t i o n a l e F u n k t i o n e n solche Funktionen verstanden werden, die als Funktionswerte nur die Wahrheitswerte {wahr, falsch} annehmen und beliebigen nichtpropositionalen Argumentwerten jeweils gleiche Funktionswerte zuordnen. Damit sind als propositionale Funktionen auch solche Funktionen charakterisiert, die dem propositionalen Argumentwert des Falschen andere Funktionswerte zuordnen als nichtpropositionalen Argumentwerten zugeordnet werden. Die von Frege eingeführten Funktionen Waagerechter, Negation und Implikation sind sämtlich propositionale Funktionen, die Fregesche Gleichheit aber ist keine propositionale Funktion im eingeführten Sinne. Um als Beispiel die acht einstelligen propositionalen Funktionen aufzuführen: H
Φ X TÌ
Φ2
H
φ3h
Φ
4
h
H
3
Φ SH —
Φ βΗ
Φ
7
h
Φ
H -ι-H
W
W
W
W
W
F
F
F
F
F
W
W
F
F
W
W
F
F
Ν
W
F
W
F
W
F
W
F
V g l . Belnap (1977) und Anderson/Belnap/Dunn (1992).
Werner Stelzner
60
Negation und Implikation, die in der Begriffsschrift ein funktional vollständiges System der klassischen Aussagenlogik bilden, werden in den Grundgesetzen ebenfalls auf Gegenstände beliebiger Art als Argumente bezogen. Die Negation von H steht jetzt für die Funktion „H ist nicht wahr" und nimmt den Wert wahr immer dann an, wenn H nicht den Wert wahr hat. Die Implikation „Wenn G, so Hu steht für die zweistellige Funktion, die den Wert falsch genau dann annimmt, wenn G den Wert wahr hat und H nicht den Wert wahr hat. Das in dieser Art im Rahmen der Grundgesetze eingeführte propositionale Fragment ist funktional unvollständig. Bezüglich des Systems von Grundfunktionen Implikation ( C ) , Negation (—ι—) und Wahrheitsfunktion ( ) erweist sich z.B. die Falschheitsfunktion, die genau dann den Wert wahr annimmt, wenn ihr Argument den Wert falsch hat, als nicht definierbar. Als funktional vollständig erweist sich dagegen das System mit den Grundfunktionen Alternative, Negation und Gleichheit, wobei jetzt aber zur Sicherung der funktionalen Vollständigkeit des aussagenlogischen Fragments der Grundgesetze mit der Gleichheit eine Funktion herangezogen wird, die nicht als rein aussagenlogische Funktion eingeführt ist. Die Falschheitsfunktion (in Erweiterung der Fregeschen Notation verwenden wir dafür das Symbol —1— ) läßt sich dann folgendermaßen definieren:4 -ι-H=d}
H=-!-{H
= H)
Damit ist aber in den Grundgesetzen die in der Begriffsschrift vollzogene Trennung des funktional und semantisch vollständigen Aufbaus der Aussagenlogik von der Prädikatenlogik nicht mehr gesichert. Obwohl Frege wahr und falsch als Gegenstände einführt, wird beim Aufbau der Grundgesetze in der skizzierten Form an der Argumentstelle systematisch lediglich zwischen wahr und nicht-wahr unterschieden. Der Wert (oder Gegenstand) falsch spielt in den dort eingeführten propositionalen Funktionen als Argument genommen die gleiche Rolle wie jeder andere Gegenstand auch (mit Ausnahme von wahr). Alle in den Grundgesetzen eingeführten propositionalen Funktionen sind also Normalfunktionen, die allen von wahr unterschiedenen Werten jeweils gleiche Funktionswerte zuordnen. Es gilt, daß jeder Ausdruck, der den Gegenstand falsch bezeichnet, mit jedem Ausdruck material äquivalent ist, der einen beliebigen vom Gegenstand wahr unterschiedenen Gegenstand bezeichnet. Die materiale Äquivalenz (=) zwischen G und H wird als Konjunktion aus den beiden Implikationen von G auf H und von H auf G eingeführt:
4
Vgl. Kutachera (1990, ).
61
Wahrheits- und Falschheitsfunktionen
H H
G
=
W F Ν
w
W F
F
F W W
Ν
F W W
F
Der als Argument genommene Gegenstand falsch hat auf der aussagenlogischen Ebene in diesem Fregeschen Aufbau offensichtlich keine selbständige Funktion neben den nichtpropositionalen Gegenständen. Sie werden sämtlich als nicht—wahr behandelt. Frege begründet damit auch den Verzicht auf die Einführung eines speziellen Zeichens für das Falsche: „Wir brauchen kein eigenes Zeichen, um einen Wahrheitswerth als das Falsche zu erklären, wenn wir nur ein Zeichen haben, durch welches jeder Wahrheitswerth in den entgegengesetzten verwandelt, das auch sonst unentbehrlich ist. Ich setze nun fest: Der Wert der Function soll für jedes Argument das Falsche sein, für das der Werth der Function Í das Wahre ist, und soll für alle andern Argumente das Wahre sein. Wir haben demnach in eine Function, deren Wert immer ein Wahrheits wert ist; es ist ein Begriff, unter den alle Gegenstände fallen mit einziger Ausnahme des Wahren." 5 Der durch die Negation eingeführte Begriff ist aber kein solcher Begriff, unter den nur propositionale Gegenstände fallen, d.h. solche Gegenstände, die Bedeutungen von Ausdrücken mit beurteilbarem Inhalt sind. Insbesondere ist es eben nicht nur das Falsche, das unter diesen BegrifF fällt, und ohne Hinzuziehung der nichtpropositionalen Identitätsfunktion ist weder der BegrifF des Falschen noch der Gegenstand falsch in den Grundgesetzen definierbar. Damit besteht auf dieser Basis zwar die Möglichkeit, solche Ausdrücke aufzubauen, die das Falsche unter sich fassen, aber es gibt keinen im Formalismus ausdrückbaren Begriff des Falschen. Die von Frege auf der Argumentebene vorgenommene Gleichsetzung der unter den BegrifF des Nichtwahren fallenden Gegenstände und des Gegenstandes falsch ist auf propositionaler Ebene im klassischen Verständnis 5
Frege (1893, 10).
62
Werner Stelzner
trivial, da dort lediglich die beiden Gegenstände wahr und falsch berücksichtigt werden. Sie ist aber nicht mehr trivial und auch nicht akzeptabel auf der Ebene des Gegenstandsbereiches der von Frege eingeführten Aussagefunktionen, da Frege von den beiden propositionalen Gegenständen W a h r e s und Falsches lediglich das Wahre als spezifischen, von nichtpropositionalen Gegenständen unterschiedenen Gegenstand berücksichtigt, während der propositionale Gegenstand des Falschen mit jedem beliebigen nichtpropositionalem Gegenstand als äquivalent betrachtet wird. Natürlich sind unter propositionalem Aspekt alle nichtpropositionalen Gegenstände identifizierbar, denn sie sind keine Bedeutungen von Ausdrücken mit beurteilbarem Inhalt.
3
Funktionale Unvollständigkeit des propositionalen Fragments der
Grundgesetze
Wie oben ausgeführt, spielt im klassischen Fregeschen Verständnis nur wahr als ' Argument eine von anderen Gegenständen unterscheidbare Rolle. Betrachtet man nun die propositionalen Funktionen, in denen auch der Wert falsch eine von anderen Gegenständen separierte Rolle als Argument spielen kann (Φ -¡Η, Φ3 Η, Φβ Η , Φ τ Η), so wird die funktionale Unvollständigkeit der Grundgesetze bezüglich derartiger propositionaler Funktionen deutlich: MTFU.
Das Fregesche System { III, —1—, } von Grundfunktionen bildet ein funktional unvollständiges System propositionaler Funktionen.
Beweis: a)
Alle Funktionen der Grundgesetze sind N o r m a l f u n k t i o n e n in dem Sinne, daß Falschheit und ohne Wahrheitswert sein (aber einen Gegenstand bezeichnend) zu den gleichen Funktionswerten führt. Auf Basis solcher Normalfunktionen sind nun wiederum lediglich Normalfunktionen definierbar.
b)
Die Falschheitsfunktion Φ^H, z.B., die genau dann den Wert wahr annimmt, wenn ihr Argument den Wert falsch hat, ist keine Normalfunktion und deshalb auch nicht unter ausschließlicher Verwendung von Normalfunktionen definierbar.
In analoger Weise könnte man neben den aufgeführten einstelligen Funktionen eine Vielzahl nichtnormaler zweistelliger propositionaler Funktionen nennen, die wegen ihrer Nichtnormalität mit den normalen propositionalen Funktionen der Grundgesetze nicht definierbar sind.
Wahrheits- utid Falschheitsfunktionen
63
4
Funktional vollständige Systeme propositionaler Funktionen
4.1
Falschheitsfunktion (—L— ) und materiale Implikation ( L_ )
Ein funktional vollständiges System unabhängiger propositionaler Grundfunktionen ist das System aus Falschheitsfunktion (Φ6) und Implikation. MTFV.
Das System { L_, — } von Grundfunktionen bildet ein funktional vollständiges System propositionaler Funktionen.
Beweis: Lemma 1.
Η
Η ~ , unterscheiden. Freges Auffassung läßt sich nun so zusammenfassen, daß die Leibnizsche Logik ebenso wie „Booles rechnende Logik" im Sinne des nachfolgenden Schemas zu interpretieren ist:
Elemente der Leibnizschen Logik
Freges Interpretation
A, B,C,... Produkt A • Β bzw. AB Negation (1 — A) bzw. Non-v4 1 bzw. „ens" 0 bzw. „non ens"
Begriffsumfänge Durchschnittsbildung Komplementbildung Universe of discourse leere Klasse Diagramm 1
3
Frege (1964, 98-99).
84
Wolfgang Lenzen
Ziel dieses Beitrags ist es, Freges Deutung der Leibnizschen Logik zu korrigieren und zu erweitern. Aus Zeitgründen kann ich dabei auf viele interessante Erweiterungen — insbesondere Leibnizens Verwendung von sog. „unbestimmten Begriffen" als Begriffsquantoren 4 — nicht eingehen. Ich werde mich hauptsächlich auf den Nachweis beschränken, daß dais Leibnizsche „ens" zwar einen wichtigen Bestandteil seiner „Algebra der Begriffe" darstellt, entgegen Freges Auffassung jedoch nicht als Boolesche Eins bzw. als Allklasse interpretiert werden darf. Als Bezugspunkt für die möglichen Interpretationen muß zunächst kurz auf Leibnizens Darstellung der kategorischen Satzformen eingegangen werden.
2
Begriffsalgebra und kategorische Satzformen
Der Großteil der logischen Arbeiten von Leibniz wurde bekanntlich erst posthum, und zwar im Jahre 1903, durch den französischen Mathematiker Louis Couturat herausgegeben. Die Opuscules et fragments in édite de Leibniz existierten bis dahin nur als ungedruckte Manuskripte im Leibniz-Archiv zu Hannover. Die einzige Edition, auf die Frege zurückgreifen konnte, war die sog. Erdmann- Ausgabe der Opera Philosophica aus dem Jahre 1840, die neben den bereits erwähnten Arbeiten hauptsächlich die sog. „Difficultates logicae" enthält. In dieser wichtigen Abhandlung finden sich die folgenden Ausführungen, die Frege offenbar vor Augen hatte, als er in dem früheren Zitat lakonisch bemerkte, daß „Leibniz die Worte ,ηοη' und ,ens' in seine Formeln eintreten läßt": „ Universalis affermativa: Omne A est Β; id est aequivalent AB et A seu A non Β est non ens. Particularis negativa: quoddam A non est Β seu non aequivalent AB et A seu A non Β est Ens. At universalis negativa: nullum A est B, erit AB est non-ens, et particularis afirmativa quoddam A est B, erit AB est Ens." 5 Um den Sinn dieser Bestimmungen verständlich zu machen, muß ich etwas weiter ausholen und zunächst schildern, wie Leibniz in den „Addenda ad Specimen Calculi Universalis" außer der Konjunktion von Begriffen, AB, einen weiteren, von Frege nicht explizit erwähnten begriffslogischen Operator einführt. Leibniz schreibt dort: „Termini sind A,B,AB,BCD wie z.B.: Mensch, Lebewesen, vernunftbegabtes Lebewesen, vernunftbegabtes sichtbares Sterbliches. 4
Vgl. dazu Lenzen (1984) oder Kap. 3 von Lenzen (1990). Leibniz (OP, 102).
5
Frege und Leibniz
85
Die universal affirmative Aussage stelle ich so dar: A est B, d.h. (Je)Der Mensch ist ein Lebewesen; ich will hier nämlich stets ein Zeichen der Allgemeinheit verstanden haben; A ist das Subjekt, Β das Prädikat; ,est' die Kopula." 6 Die „Kopula" ,est' dient Leibniz also als Begriffsoperator, der den Subjektbegriff A mit dem Prädikatbegriff Β zu der Satzform ,A est Bi verbindet. Diese Satzform ist stets als universal affirmative Aussage zu verstehen, also im Rahmen von Freges extensionaler Interpretation als mengentheoretische Inklusionsbeziehung zu deuten, derzufolge der Begriffsumfang A eine Teilmenge des Begriffsumfangs Β darstellt. In Leibnizens „intensionaler" Denkweise läuft ,A est Bi hingegen darauf hinaus, daß der Begriff A den Begriff Β enthält; deshalb kann diese Relation auch synonym durch continet Bi ausgedrückt werden. Leibniz selber illustriert den Unterschied zwischen Extension (Umfang) und Intension (Inhalt) von Begriffen anhand des folgenden Beispiels: „Zum Beispiel verhält sich der Begriff des Goldes zum Begriff des Metalls wie ein Ganzes zum Teil; denn im Begriff des Goldes ist der Begriff des Metalls sowie noch ein weiterer, z.B. des schwersten unter den Metallen, enthalten. Deshalb ist der Begriff des Goldes größer als der Begriff des Metalls. In den Schulen, wo man nicht die Begriffe, sondern die den universalen Begriffen unterworfenen Individuen betrachtet, spricht man anders. Dort sagt man, daß das Metall umfangreicher ist als Gold, denn es enthält mehrere Arten neben dem Gold; und wenn wir die einzelnen Stücke Gold einerseits und die einzelnen Stücke Metall andererseits zählen wollten, wären die ersteren [...] in den letzteren wie ein Teil im Ganzen enthalten. [...] Ich ziehe es jedoch vor, die universalen Begriffe, d.h. die Ideen und deren Zusammensetzungen zu betrachten [...]. Deshalb sage ich, daß das Gold größer ist als das Metall, denn für den Begriff des Goldes wird mehr verlangt als für den Begriff des Metalls [...] Somit widersprechen sich unsere Ausdrucksweise und die der Schulen in diesem Punkt zwar nicht, doch sind sie sorgfältig auseinanderzuhalten." 7 6 Vgl. Leibniz (OP, 98): „Terminus est a, b, ab, bed ut: homo, animal, animal rationale, rationale mortale visibile. Propositionem universalem affirmativam sic designo: a est b, seu (omnis) homo est animal, semper enim hie signum universalitatis intelligi volo, ubi a subjectum et b praedicatum. Est: copula." Die hier und im folgenden gegebenen Ubersetzungen stammen von mir. 7 Vgl. Leibniz (C, 53); vgl. auch Leibniz (C, 235): „Die Methode der Begriffe ist konträr zu der der Individuen, das heißt nämlich: Wenn alle Menschen einen Teil aller Lebewesen darstellen, bzw. wenn alle Menschen in allen Lebewesen [enthalten] sind, dann ist umgekehrt der Begriff des Lebewesens im Begriff des Menschen [enthalten]; und so wie
Wolfgang Lenzen
86
Aufgrund der hierdurch erläuterten Bedeutung läßt sich die ,est'-Relation mit Hilfe der Konjunktion auf die Identität bzw. Koinzidenz von Begriffen zurückführen: (1)
(A est B) «-» {A =
AB).
Dieses Prinzip hatte Leibniz z.B. in §83 der wichtigen Generales Inquisitiones von 1686 wie folgt formuliert: „Allgemein ist ,A est Β dasselbe wie ,A — AB ". Und eben dieses Prinzip hatte Frege im obigen Zitat vor Augen gehabt, als er davon sprach, daß die „Unterordnung eines Begriffes unter einen anderen" in der Form A = AB dargestellt werden kann. Im übrigen sei angemerkt, daß man die Identität oder Koinzidenz von Begriffen auch umgekehrt durch die Unterordnungs- bzw. ,est'-Relation definieren könnte gemäß dem Gesetz (2)
(A = B) 6; rational numbers allow one to solve for χ in an equation like (2)
α χ χ = b
where a and b are natural numbers or integers and a is not an integral divisor of b. Irrational numbers enable us to have solution to equations like (3)
z2 = 2
while the complex numbers complete the remaining task by yielding solutions for polynomials like (4)
χ2 + 1 = 0
and, as it turns out, allow solutions to any non-constant polynomial with complex coefficients (5)
anxn
+ a
n
_ +
. . . + 02X2 + α,χχ + o 0 = 0.
The new numbers may be justified in three respects: they are compatible with the old, their introduction leads to no contradictions, and they fulfil useful new tasks. Simply having new numbers for hitherto unfulfilled tasks is not enough, as Frege rightly points out. There are for instance no numbers solving the simultaneous equations (6)
χ + 1 = 2 and χ + 2 = 1.
Why not have some numbers that do this? In a famous passage, Frege states a credo: "Let us also create numbers that allow us to sum divergent 4
Mac Lane(1986, 114).
Peter Simons
96
series! No! t h e m a t h e m a t i c i a n too cannot just arbitrarily create something, any more t h a n t h e geographer; he too can only discover what is there, and give it a n a m e . " 5 Consistency must be assured, and as Frege never tires of pointing out, t h e only completely sure way to show a set of principles to be consistent is to exhibit something which satisfies them, to find a model. Frege also objects to the introduction of non-arithmetical elements into t h e consideration of number and numerical concepts. If the imaginary unit i were t h e Moon or a second, what could 1 + i be? T h e standard geometric representation of the complex numbers, admits Frege, at least allows a connection to emerge between 1 and i: "A complex number here indicates how t h e segment that is its representation may be obtained f r o m t h e given segment (unit segment) by multiplication, division and rotation (for t h e sake of simplicity I pass over incommensurables)." 6 Nevertheless, Frege is obviously dissatisfied with the geometrical representation of t h e (complex) numbers because they appear to make the propositions of complex arithmetic dependent upon geometric intuition and so degrade t h e m to the s t a t u s of the synthetic (albeit a priori), whereas Frege wished to show t h a t such propositions are analytic. Frege finally states what he expects of a general theory of the "higher numbers": 7 In the definitions of the fractions, complex numbers etc. everything will again depend on finding a judgeable content which can be transformed into an identity whose sides are precisely the new numbers [sic]. In other words, we have to settle the sense of a recognitionjudgement for such numbers. In doing so, we shall need to take account of the reservations which we discussed above in §§63-68 concerning such transformations [the Caesar Problem — PS]. If we proceed as we did there, then the new numbers will be given to us as . extensions of concepts.
3
Fregean Desiderata for a Theory of Complex Numbers
Frege pursued in his theory of real numbers, as indeed in the theory of n a t u r a l numbers, several desiderata which were not easy to combine. T h e first is t h a t t h e real numbers are not to be too intimately tied to a single application, for otherwise t h e laws of real arithmetic would again be threatened with a loss of their analytic status. For example, if the account of the reals had to be given via the geometry of segments in a line, then according to Frege 5
Frege (1884 §96). Frege (1884, §103). 7 Frege (1884, §104).
6
A Theory of Complex Numbers in the Spirit of
Grundgesetze
97
the t r u t h s of arithmetic would depend for their proof on intuition and so be synthetic. I call this the requirement of P U R I T Y . On the other hand, Frege's critique of formalism made it imperative for him to ensure that the general applicability of the reals be nevertheless somehow assured, since for Frege it is the applicability of mathematics that distinguishes it from a mere formal game. I call this the requirement of A P P L I C A B I L I T Y . Frege in fact goes a step further in this direction. Not only must applications be possible for the real numbers, logicistically determined; this applicability must be built into their very definition. Every possible application must already be prefigured in the definition. It cannot happen that a new application comes along later and we have to determine ad hoc that the relevant numbers apply there. Applications cannot, as Frege vividly puts it, be patched on from outside. I call this the requirement of INTERNALITY.
Finally, in order for the numbers to satisfy Frege's logicistic requirement, their existence has to be independent of empirical fact (call this N E C E S S I T Y ) and they have indeed to be specifically logical objects ( L O G I C A L I T Y ) . I shall assume that these five conditions, where the third of course implies the second and the fifth implies the fourth, must be fulfilled for a theory of complex numbers to be satisfactory from a Fregean point of view. As we shall see, they pose some difficulties. Let us recall briefly how the theory of real numbers was going to satisfy these desiderata.
4
How the Reals Were Won
T h e A P P L I C A B I L I T Y of real numbers consists in the fact that magnitudes such as lengths, areas, speeds, intensities etc. are comparable and stand in proportion to one another. Length usually serves as a prime example, but length is not allowed to have any intrinsic priority over other kinds of magnitude, since otherwise the condition of P U R I T Y is violated. T h a t is why it is necessary to make the definition of real numbers independent of a specific magnitude. A real number, as Eudoxus long ago realised, and Newton later also clearly stated, 8 expresses a ratio or proportion 9 between two comparable magnitudes. So if r is the number of such a proportion, as applied to certain magnitudes we can have one line which is r times longer than another, an area which is r times greater than another, a mass which 8
For a clear account of the relationship between magnitudes, proportions and real numbers, based on Whitehead rather than Frege, but very similar to Frege's and recognizing the connections with Eudoxus and Newton, see Bigelow (1988, 70 ff.). 'Although the word 'ratio' is in some ways preferable to 'proportion', in view of its historical associations with fractional or aliquot proportions, as attested in the words 'rational' and 'irrational', we shall talk of proportions.
Peter Simons
98
is r times greater than another etc. The number r thus expresses or is a measure of a certain relationship between (comparable) magnitudes, the relationship is r times greater than. Frege expresses this in the form of a relationship between extensions. To allow an interpretation for negative numbers, the magnitudes must be susceptible of some kind of reversal. Here Frege makes use of an insight of Gauss and understands the magnitudes themselves as relations. So if we take as a relational magnitude for example lies 3 Km north of (where the North/South axis is not that of the local surface but that of the Earth's axis of rotation) then the converse or opposite is lies 3 Km south o f , that is, the same distance in the opposite direction. Or if the magnitude is is moving at a speed of 200 Km/h in the direction from point A to point Β then its converse magnitude is is moving at a speed of 200 Km/h in the direction from point Β to point A. For this reason no real number can be a natural or counting number for Frege, because counting numbers are extensions of concepts whereas the reals will turn out to be extensions of relations (in fact, extensions of relations between extensions of relations). Frege draws the conclusion that the natural numbers are not embedded in or a subset of the reals; the reals, even the non-negative whole reals, are completely different objects from the naturals. A theory of real numbers fulfilling the condition of A P P L I C A B I L I T Y thus has to guarantee the existence of at least one such infinite collection of onedimensionally comparable magnitudes. In order to avoid an extra kind of magnitude being added in later (INTERNALITY), Frege confronts the problem directly and simply enunciates the general conditions that a suitable magnitude space (Größengebiet) has to fulfil. In this way any magnitudes forming a magnitude space that is discovered in the future to have the right properties will automatically be covered. But since these conditions alone do not guarantee the existence of a suitable magnitude space, Frege proceeds to conjure one out of the logical objects at his disposal, thus fulfilling the condition of LOGICALITY. Frege intended to do this (he did not complete the task) by making use of the natural numbers as a countably infinite collection of logical objects. A proof of the existence of a magnitude space adequate to ensure the existence of the relevant extensions proceeded effectively via the construction of infinite binary fractions. Since Frege needed only (what he considered as) logical objects for this, both LOGICALITY and P U R I T Y are assured. 1 0 Frege's construction is ingenious and this route to a logicistic foundation for analysis would have been open had not the contradiction raised its ugly head. In the meantime it is known that a similar construction can be effected with much more modest means. 10
F o r details, see S i m o n s (1987).
A Theory of Complex Numbers in the Spirit of Grundgesetze
5
99
Alternatives and Obstacles
Frege could however have proceeded quite differently. He could for instance have defined first of all the positive and negative integers via the concept of directed or relative numerical difference between concepts, i.e. the difference between the number of F s and number of Gs. This might have gone essentially as follows: we know from Grundlagen how to define There are as many F s as there are Gs and There is one more F than there are Gs. The finite relative differences will correspond to second-order relations (relations between concepts) of the form There are η more F s than there are G s, Negatives are obtained by considering the converse relations There are η fewer F s than Gs obviously defined as There are η more Gs than F s. One way to move up and down these relations will be to define the four-place relation expressible as The relative difference between F s and Gs is one more than that between H s and Ks enabling the successor on the relative differences to be defined. The integers could be defined one at at time and the integer associated with F, G (in that order) defined as The extension of the relation: being as many more or less Xs than Vs as there are F s than Gs. This would give the integers as corresponding to pairs of concepts; one could then leave these behind and go on to look at ratios and· then to proportions, or straight to proportions. Or one might have chosen first undirected (unsigned) rational and irrational magnitudes (as exemplified say by mass or speed) and define the signed reals in terms of pairs of these analogously to how we showed the integers could be obtained in terms of concepts. Frege chose instead to leave the natural numbers behind and go straight to the reals in one move. The point is that there are several equally natural ways, at least six or seven, to arrive at the reals from the natural numbers.
Peter Simons
100
Such problems are less noticeable in the case of the complex numbers. In fact more than one way is possible, but only one is natural, which is to go straight from the reals to the full complex numbers. A detour via the Gaussian integers G = {α + ib | α, 6 G Ζ} offers neither conceptual nor technical advantages. I shall assume Frege would have gone straight from R to C. It is debatable whether the reals would be defined so as to be a subset of the complex numbers or whether they would be simply isomorphic to a subset of these, the complex numbers being different logical objects than the reals, as the reals are completely different objects than the natural numbers for Frege. Both alternatives seem to be technically possible, but it is easier to have the complex numbers as new objects. Whereas in the case of the real numbers Frege had no trouble in finding plenty of applications but did have to overcome the technical problems of negativity and especially continuity, with the complex numbers the situation is reversed. The standard arithmetical interpretation of complex numbers as ordered pairs of reals is open to Frege (allowing for his extravagant and inconsistent definition of ordered pairs), but apart from the standard geometric application of the complex numbers as directed line segments in a Euclidean plane, real-life applications were much thinner on the ground in Frege's day than they are now. A single application, that to geometry, would leave us with a non-analytic theory. The arithmetic construction via pairs gives us the assurance that there is more than just the geometric interpretation, but the assurance of P U R I T Y is firmer if we can give a natural but neutral account of the structures complex numbers represent, and see that both the geometric and the arithmetic interpretations are clear special cases.
6
The Arithmetic and Geometric Representations
Let us summarize very briefly the two standard representations of the complex numbers, the algebraic/arithmetic one via pairs of reals, and the geometric. Let { ( x , y ) I x,y € R } be the set of all pairs R x R = R 2 and define operations φ, g) on R 2 as follows (x, y) φ (u, ν) := (χ + u, y + ν) (χ, y) ® (u, ν) := (xu - yv, xv + yu) Then it is easy to check that these operations are well-defined, commutative, associative, that φ distributes over that (0,0) is an additive neutral element and (1,0) a multiplicative neutral element, that the algebraic structure so defined is a field, that {x,y) =
(x,0)®((y,0)®(0,\))
A Theory of Complex Numbers in the Spirit of
Grundgesetze
101
and that the mapping E : R — • R 2 given by E(x) = (z,0) is a field monomorphism. The complex numbers are then interpreted as this field defined on R 2 with R represented as the image of E. T h e geometrical representation takes a straight line RL in the Euclidean plane to represent the real numbers, two points on this line to be designated as Ό' and Ί ' , a line through 0 orthogonal to RL to be the imaginary axis IL, a point on IL which is as far from 0 as is 1 to be designated V . Call the plane with these lines and points fixed the marked plane. The points on the marked plane may now be taken to represent the complex numbers. The sum of points ζ and w is the fourth vertex of the parallelogram constructed on z, w and 0. Multiplication is much less obvious in the geometric interpretation and is most easily presented when we have considered the connection between the arithmetic and the geometric interpretations. This is to represent the pair ( x , y ) as the point on the marked plane for which the pair gives the Cartesian coordinates, taking RL as the χ axis and IL as the y axis. Such a point can also be represented by polar coordinates [r, Θ], where r is the distance of the point from 0 taking the distance 0 to 1 as unit and θ is the angle of rotation of the line from 0 to the point from RL, taking the direction of rotation of the segment 01 into the segment 0¿ as positive. Then the result of multiplying two points ζ with polar coordinates [r, θ] and w with polar coordinates [s, φ] is the point with polar coordinates + T h e connections between the arithmetic and geometric interpretations are standard basic fare in the theory of complex numbers. Alternatively, the complex numbers could be taken as not the points on the marked plane but as the directed line segments from 0 to said points, or again as equivalence classes of directed finite line segments on the plane under the equivalence relation of congruence (preserving length, orientation and direction) under translation. The line segment of each such equivalence class with its first end at 0 is just then one of the segments of the second alternative, its end-point is the point which represents the complex number under the first geometric interpretation. In all of these cases the relevant algebraic structure is preserved.
7
Complex Magnitude Spaces
7.1
General
Frege dealt with the real numbers by laying down what conditions a family of relations must meet to be a real magnitude space. We shall do the same for complex magnitude spaces. Real magnitude spaces have all their members linearly comparable in the sense that any two magnitudes from a single space are such that if they have the same direction, sense or polarity then either
102
Peter Simons
they are the same relation or one is bigger than the other, and if they do not have the same polarity then either is directly comparable in this way with the converse of the other. The linearity of the real line consists logically in precisely this comparability. Further the magnitudes have to satisfy the Archimedean condition that any two having the same polarity are such that some whole number multiple of the one is greater than the other (this rules out infinities and infinitesimals). Addition in numbers corresponds to the relative product of two relations in the magnitude space, so the Archimedean condition means that for any two non-null relations R and S in a space, some some finite power of Ft is greater than S or the converse of S. Linear comparability is lost with complex magnitudes. Nevertheless, there have to be aspects of complex magnitude domains allowing any two to be compared in respect of size (corresponding to the modulus or absolute value of a complex number) and in respect of something else which, for want of a better word, we can call orientation. Recall the intuitive idea of complex numbers as plane vectors or line segments, with reals correspondingly vectors or segments in a line. Any two non-null real relations from a single space differ at most in respect of size and polarity, so one is obtainable from the other by stretching or shrinking, and perhaps reversing direction. In the case of complex relations in a space any two non-null ones must be such that one is obtainable from the other by stretching or shrinking (as before) plus another operation intuitively understandable as "rotation", so that the magnitudes must form something like an "angle", corresponding to how much one must "rotate" the one to obtain the orientation of the other. But — and here is the most difficult conceptual hurdle for the Fregean understanding of complex numbers — these aspects of orientation, rotation and angle must be given a neutral', formal, non-geometrical interpretation, otherwise PURITY and LOGICALITY are not satisfied. We may let our intuitions be guided by the geometry, and perhaps we are conceptually constrained to do so, but the final definitions may contain nothing inescapably geometric. So we shall start with a set of binary relations and successively impose logical conditions on these to give us a complex magnitude space.
7.2
Modulus
W e let 5 be a set of binary relations (in extension) which is closed under converse and relative product, each element of S is one-one on the right (and hence also on the left). There is an equivalence relation « defined on S with the additional characteristic that for all A, Β £ S: Α κ Cnv(y4), A I Cnv(i4) « Β I C n v ( ß ) and A « Β \ C n v ( B ) iff A = Β | C n v ( ß ) . W e call the relation A | Ο η ν ( Λ ) 'Λ': it is the neutral or null relation in S. Further, the equivalence classes of the non-null members of S form what
A Theory of Complex Numbers in the Spirit of Grundgesetze
103
Frege calls a positive class,11 that is, they have the structure of the positive real numbers. Intuitively, these equivalence classes represent the moduli or absolute sizes of the members of S. We denote the size or modulus of A, its equivalence class under » , by '| A Note that size is an undirected quantity, in that IA \ — | Cnv(A) |. | Λ | forms the zero of the space of moduli. 7.3
Direction
Now we need to consider how to formally define the idea that any two complex magnitudes in a complex magnitude space stand at some planar "angle" to one another. We require that there be a set of relations on the elements of the space which we shall call the relative orientations of the members. Two pairs members of S will be intuitively at the same angle and direction with respect to one another if and only if their relative orientations are the same. However it is much easier to work not with the relations in S themselves but with their equivalence classes under another equivalence relation written || , which we require to hold over S. Ά ||| ¿?' is the generalization of the geometric notion that A and Β have the same orientation or direction, that is, are parallel and have the same sense (Λ and Cnv(A) will be parallel but with opposite senses.) However, we cannot use these geometric ideas themselves except as a guide to the formal requirements on ||. We exclude Λ from the field of ||| and require that for all A € S — {Λ}, it is not the case that A I Cnv(v4). The equivalence classes of S— {Λ} under ||| (the directions) will be denoted by small letters a, 6, c , . . . , and the direction of A by '[A]'. If a = [A] we write ' a " for [Cnv(y4)]. The whole set of directions associated with S we call
7.4
Betweenness
There are two interrelated ternary relations defined on D(S) capturing the intuitive notion of betweenness. We read iRabc' as '6 is between a and c going to the right' and ' L a t e ' as '6 is between a and c going to the left'. The notions right and left have no inescapably spatial meaning — we could just as well have called the two ideas 'red' and 'green' or 'Max' and 'Moritz' — but they help us keep the intuitive link in mind. We require that for all a, b, c 6 D(S) Rabc D α φ c Λ α φ b Ab φ e Rabe " Leba 11
Frege (1903, §197, 190) cf. Simons (1987, 36).
Peter Simons
104
The following further conditions on R and L hold for all a, 6, c G D(S): Rabc D ~ Labe Rabe D Lab'c (6 φ a A b φ a!) D (Raba' V Laba') Rabc = Rcab
(herein lies the cyclic nature of the directions)
We also require that betweenness be dense: between any two directions going either way there is another: α φ b-D (3c e D(S).RacbA
3d G D(S).Ladb)
This means that there are relations in S having these intermediate directions, since we require that no member of D(S) be the null set. 7.5
Continuity
Finally we want the directions to be not just densely spread around a circle but continuously so. Of the several ways of putting this condition, the following is closest to the way Frege defines continuity in Grundgesetze. Let a G D(S) and let Β C D(S) have the following properties: α€ Β 3 ceD(S).c 0 . This is a bounded monotone increasing sequence and so has a limit μ as k —* oo. We take the size of A to be μΗ, where again 0 < μ < 2. If A is any angle, we denote its size in half turn units by '(A)\ where 0 < (A) < 2. This size applies, as we said, to both angles to the left and angles to the right. In fact if the size of ΖR{ab) = ZL(ba) = α φ OH then the size of ZL(a6) = Zß(6a) is the complement (2 — a)H. Having a measure of angle size enables us to compare across complex magnitude spaces and so define the complex numbers neutrally in the spirit of Frege.
8
The Complex Numbers
Let A, B, be relations in a complex magnitude space and T, U be relations in a possibly different complex magnitude space where neither Β nor U is Λ. If μ| / \B\ = \T\ / \U\ and (Λ([Λ][β])> = (Λ'([Γ][ί/])>, where R gives the local sense of 'right' in 91 and R' gives the local sense of 'right' in 9t' (one case is where this is merely the sense of 'left' in ΣΗ) then we say that the complex relation of A to Β is the same as that of Τ to U and write AB Ξ TU so Ξ is a four-place relation among relations, which, it can be checked, is the 4-place analogue of an equivalence relation (like = and =*). Finally we may define the complex number belonging to the pair of relations R, S as the extension of a two-place relation (in Frege's case this would be a double course-of-values) CxNo(R,S)
9
=D¡. {ρσ I
RSSpa}.
Instances
To complete the work we need an existence proof, to show this structure is realized. For logicistic purposes it behoves us to show that we can define a complex relation space on R 2 . The ordered pairs alone will not do as they
A Theory of Complex Numbers in the Spirit of Grundgesetze are simply objects, not binary relations. [(x,y)] on R 2 given by (a, b)[(x,y)](c,d)
=Df, c = a + xAd
109
So let us consider the relations
= b+ y
It can be checked that these relations determined by pairs of reals form a complex magnitude space on R 2 as required. (There is of course a typecrossing bijection between the pairs ( x , y ) and the relations [(x,i/)].) The geometrical interpretation, where the complex relations are the vectors between points in the Euclidean plane, corresponding to the Cartesian representation via the pairs of reals just given, is naturally a further instance. A much more daunting task, analogous to one Frege set himself in Grundgesetze for the reals, but never carried out, would be to show that the complex numbers defined as here yield a complex magnitude space. The main problem with this is that because of the inconsistency in the means at Frege's disposal, a more modest construction would need to be employed from a reliable mathematical theory such as set theory, which would however not necessarily encompass all the possible applications as Frege desired. The more modest and to my mind correct approach is the one standardly applied today, namely that of having one or several standard constructions with the desired algebraic properties. Rather than identify the complex numbers with any of these however, we might incline to the structuralist view that the complex numbers (so far as there are any such entities per se) are the abstract structure inherent in all of these examples and any more we might come across which can be shown isomorphic to them. But that takes us into issues of philosophy of mathematics. The entities nominally made use of in this construction, namely the extensions of logically definable properties and relations, would all have counted as logical objects for Frege, so that this construction, or something like it (more elegant, if possible), could have satisfied him as a logicistically acceptable theory of complex numbers. 12
Appendix:
Proofs
L e m m a (Equals added to equals are equal.) If ab S cd then Zñ(aó) + Ζ R ( e f ) = ΖR{cd) + ZÄ(e/) Proof (for Ζ/ϊ only) If ab cd then ¿R(ab) = ΖR(cd). ZÄ(a6) + Zfi(e/) = ZR(ag), where ef = bg ZR(cd) + ¿R(ef) = ¿R(ch), where ef = dh. 1 2 M y thanks for assistance and helpful comments go to Hans Czermak, Michael Dum· mett and O. Neumann.
110
Peter Simons
bg 5Ë dh, so ¿R(ch) = ΖR(cd) + ¿R(bg) = ΖR(ab) + ¿R(bg) = ¿R(ag)
•
Theorem (Associativity of Angle Addition) ¿(ab) + (¿(cd) + Z(e/)) = (Ζ(αδ) + Z(cd)) + Z(e/) (Since the proofs for ¿R and ¿L are exactly alike, in the proof we omit the letter.) Proof ¿(ab) + Ζ (cd) = Ζ(α5), where = ( ζ ( α £ > ) + ¿(cd)) + Z(e/) = ¿(ah), where gh = ef (¿(cd) + Z(e/)) = Z(c¿), where di ^ e / Ζ(α6) + (Z(cd) + Z(e/)) = Z(aj), where 6j = c¿. Now £(bh) = Ζ(δ^) + ¿(gh) = (adding to equals) ¿(cd) + ¿(gh) = Z(cd) + ¿(ef) = ¿(cd) + ¿(di) = ¿(ci) = ¿(bj), therefore ¿(aj) - ¿(ab) + ¿(bj) - ¿(ab) + ¿(bh) = ¿(ah) • Theorem (Commutativity of angle addition) ¿(ab) + ¿(cd) = ¿(cd) + ¿(ab) Proof Here we need to use the letters, so we shall prove the case for ¿R ¿R(ab) + ¿R(cd) = ¿R(ae), where be = cd. Now consider directions / and g, where fa = ab and gf S be. So by transitivity of gf = cd. The whole string of segments [g,f], [/, a], [a, 6], [6, e] is symmetrical about a, and the proof essentially turns on the fact that angle size is preserved under reflection (carrying R into L and vice versa), which is encapsulated in our definitions of R and L. ¿R(ae) = ¿R(ab) + ¿R(cd) = ¿R(fa) + ¿R(gf) = ¿L(af) + ¿L(fg) - ¿L(ag) = ΖR(ga) = ¿R(gf) + ¿R(fa) = ¿R(cd) + ¿R(ab) m (It is crucial that the addition or composition of angles (or rotations) is commutative in two dimensions but not in three or more. Starting from the horizontal an eighth turn (45°) to the left followed by a quarter turn (90°) upwards gives us a vertical upwards direction, whereas the reverse order gives us a line along the original axis at 45° to the vertical. It is effectively this special property of the two-dimensional case which allows the complex numbers to be a field with commutative multiplication, whereas Hamilton's quaternions for example do not multiply commutatively.)
A Theory of Complex Numbers in the Spirit of
Grundgesetze
111
References Bigelow, J. (1988), The Reality of Numbers, Clarendon Press, Oxford. Frege, G. (1884), Die Grundlagen der Arithmetik, Koebner, Breslau. Frege, G. (1903), Grundgesetze der Arithmetik, II., Pohle, Jena. Mac Lane, S. (1986), Mathematics: Form and Function, Springer, New York. Simons, P. (1987), Frege's Theory of Real Numbers, History and Philosophy of Logic 8, 25-44. Veraart, A. (1976), Geschichte des wissenschaftlichen Nachlasses Gottlob Freges und seiner Edition. Mit einem Katalog des ursprünglichen Bestands der nachgelassenen Schriften Freges. In: Schirn, Matthias (ed.), Studien zu Frege I , Frommann-Holzboog, Stuttgart, 49-108.
JAN WOLENSKI
Logicism and the Concept of Logic In Frege's view: "Arithmetic [... ] becomes simply a development of logic, and every proposition of arithmetic a law of logic, albeit a derivative one." 1 Russell describes logicism in an apparently different manner: "[... ] we find that there is no point at which a sharp line can be drawn, with logic to the left and mathematics to the right. If there are still those who do not admit the identity of logic and mathematics, we may challenge them to indicate at what point, in the successive definitions and deductions of Principia Mathematica, they consider that logic ends and mathematics begins. It will than be obvious that any answer must be quite arbitrary." 2 The difference seems this. For Frege, mathematics is an extension of logic, but for Russell both are theoretically indistinguishable: no matter whether one will call a + 6 = 6 + a a theorem of logic or mathematics. Russell's view could be equally well called "mathematicism" and decribed as a claim that logic is reducible to mathematics. However, Russell's practical realization of his foundational program clearly shows that, on his view, mathematics is, like for Frege, an extension of logic. The first fully precise account of logicism was offered by Carnap. 3 On the Carnapian characterization, the fundamental thesis of logicism thesis can be split into two parts: (LI) mathematical concepts are definable by logical concepts through explict definitions; (L2) mathematical theorems are derivable from logical axioms through purely logical rules of inference. The subsequent discussion of logicism showed that both (LI) and (L2) are plausible under a broad conception of logic on which set theory is a genuine part of logic.4 Thus, (LI) is correct if the membership relation is counted between logical concepts, and (L2) is defensible if standard logic is supplemented by a sufficiently strong (e. g. ZF) system of set theory. Frege's version of logicism failed when Russell discovered his antinomy of the class of those classes which are not elements of themselves. Russell himself pointed out difficulties of his own project based on the theory of 'Frege (1884, 99e); page reference to Eng. tr. Russell (1919, 194-195). 3 Carnap (1931, 41); page reference to Eng. tr. 4 See for example Church (1962) and Wagner (1992) for reports on this discussion. 2
Logicism and the Concept of Logic
113
types. In particular, he had very serious reservations about the axiom of infinity and the axiom of reducibility. Both are necessary for deriving mathematics from logic, and, for Russell, both are not perfect from the logical point of view for making existential assumptions (the axiom of infinity) or being contingent (the axiom of reducibility). In order to overcome these doubts, Russell proposed a view which is usually labelled "if-thenism". On this view, every mathematical proposition is conditional and establishes a deductive connection between its antecedent and consequent. For their conditionality, mathematical propositions are entirely independent of existence of mathematical entities. Although if-thenism rather contradicts mathematical practice, it is defensible from the logical point of view. Assume that A is an axiom and Β its logical consequence, e.i. Β € Cn{A}. Then, using the deduction theorem, we obtain that A Β is a logical theorem. This reasoning also holds for those axioms which are responsible for difficulties of the theory of types. A new situation for logicism arose, when Godei discovered that every consistent formal system sufficiently strong for arithmetic is incomplete. The problem is this.5 Assume that A is conjuction of arithmetical axioms and Β an undecidable proposition. Hence, our formal machinery does not decide which is correct: A =Φ· Β or A => Β. Moreover, due to the second incompleteness theorem, no proof of consistency of a system covering arithmetic is available inside this system. This argument clearly assumes that logic must be complete and prove its own consistency. However, this proviso was recently criticized.6 The criticism points out that Russell did not demand that logic should be complete. Now, the question seems be this: which metalogical properties define the "right" logic? Or, putting this in another way: is set theory a part of logic under the assumed metalogical properties taken as essential attributes of logic? My answer is negative, and if it is correct, logicism fails. One might say that our choice of metalogical properties of logic as its attributes is conventional and relative to some extent. Take decidability for example. Propositional calculus possesses this property, but first order logic does not. However, it would be quite artificial if logic were identified with propositional calculus for its decidability. The view that set theory belongs to logic has a partial justification in pointing out that metalogical properties are rather contigently distributed over various formal system. Thus, if logicism needs a convention about logic, on which set theory forms its part, why should it not be made? I agree that concrete metalogical properties of formal systems depend on various factors, for instance on cardinalities of languages or the length of formulas. Let me make the first choice at the point. I 5 6
See Henkin (1962). See Sternfeld (1976), Rodríguez-Consuegra (1993).
114
Jan Woleñski
am only interested in logicism based on logic with countable languages and finitely long formulas. 7 My motivation is this: if logic is to provide an effective deductive machinery (i.e. if the concept of proof is recursive), it must be limited to countable languages with finitely long expressions. Taking this for granted, instead of discussing which metalogical properties are naturally logical, I will first select an intuitive feature of logic, and then ask how to charaterize it from the metalogical point of view. The universality is that property of logic which seems to be behind any reasonable doubt. 8 First, let me observe that for Frege arithmetic is a part of logic, because it is universal. 9 Second, Russell's observations on axioms of reducibility and infinity seem be based on a conviction that he assumed UP. In fact, the claim that logic should not make any existential claim is understable, if it is stricly universal. Similarly, if UP is assumed, no contingent proposition should be a logical axiom. Thus, historically speaking, the Fathers of logicism had a strong feeling that logic is universal. The universality of logic can mean at least four quite different things: 10 (a) that logic is universally applicable, (b) that logic is universally valid; (c) that logic is topically neutral, (d) that logic provides conceptual frameworks with a great expressive power. Ad (a) This meaning is nicely captured by the opening dictum of Petrus Hispanus' Summulae Logicales: "dialéctica est art artium et scientia scientiarum ad omnium aliarum scientiarum methodorum principia viam habent." Alhough the precise scope of methodorum principia on Hispanus' view is not quite definite, we certainly can count the deductive rules as universally applicable. Ad (b) The universal validity of logic requires that theorems of logic are true in all possible models. This understanding of UP is perhaps the most commonly shared attribute of logic. Ad (c) This means that logical rules are completely independent of concrete subject-matters or topically neutral. 1 1 Ad (d) This understanding sees logic as a lingua characteristica for science, particularly for mathematics. Clearly, universality in this sense assumes that the language of logic has an extensive expressive power. Ad (a)-(d). The understandings of UP pointed out by (a)-(d) are related in this way. Take (b) for a start. Our primary intuition is that UP consists in the universality of logical truth (validity). We immediately note a perfect correspondence of (a)-(c): the universal applicability and the topicneutrality are "twins" of universal validity of logic. Thus, (a)-(c) capture various sides or aspects of UP. Matters look quite diiferently, when we com7
See Degen (1993) for logicism based on stronger logics. "UP" will abbreviate "the universality property of logic". 9 See Frege (1886). 10 1 follow here my (1994). u R y l e (1954, 115). 8
Logicism and the Concept of Logic
115
pare (a)-(c) with (d). The amount of expressive power (EP for brevity) of logic is, so to speak, reversely proportional to its universality in the sense (b); UP is negatively correlated with EP. This simply means that if logic is universal under (a)-(c), it cannot provide a strongly expressive language. 12 Almost every introductory definion of logic regards it as a codex of correct deductive inferences. This rather vague idea can be make precise by taking a pair (L, Cn) as a formal representation of logic with a language L and the consequence oparation Cn. Now, if we look for a metalogical characterization of UP, we must ask for formal properties of Cn which mirror UP. The usual axiomatic approach to the first-order Cn selects its four general properties: reflexivity ( X Ç CnX), idempotence ( C n C n X Ç CnX), monotonicity (if X Ç Y, CnX Ç CnY), and finiteness (if A £ CnX, Α £ CnY, for some finite Y, Y Ç X).13 If the consequence operation is associated with classical logic, we also have the deduction theorem (if Β £ C n ( X U {Λ}), A => Β £ CnX, where A, Β are closed formulas);
Cn{A, ~*A} = L, Cn{ A} Π Cn{^A}
= Cn0; A(v/t) € Cn{VvA(v)},
if the
term t is correctly substituted for the variable υ; if Λ £ CnX and for every Β £ Χ, ν is not free in B, VvA(v) £ CnX. The deduction theorem enables us to define logic as the set of consequences of the empty set: (1)
L O G = Cn0
This definition is equivalent to several other statements, particularly to 14 (2)
(a) A £ L O G iff ->A is inconsistent, (b) L O G = the intersection of all maximal consistent systems.
Of course, it is true that (1) is conventional to some extent. On the other hand, things look differently when (2) comes. In fact, we are justified to regard negations of logical theorems as internally inconsistent and logic as the intersection (common part) of all maximal deductive systems. These properties of logic are not only very intuitive but also highly desirable, because we expect that denials of theorems of logic produce contradictions as well as that logic equally belongs to various, even mutually contradictory deductively organized pieces of knowledge. So, if (2) expresses a sound property of logic, the same also concerns (1). The fact established by (2b) implies that L O G is a part of every maximal deductive system. The condition of maximality can be even omitted. Define a theory as a deductive system: X is a theory iff it is closed under Cn. In formal terms, 12
For this reason, UP referes below to the universality property defined by (a)-(c). I remind that we consider countable languages with finitely long formulas. 14 See Surma (1981).
13
Jan Woleñski
116 (3)
X is a theory iff CnX Ç X.
Let Τ be a theory. So C n T C T . Since for every X , 0 C X, then 0 C T . Using monotonicity of Cn and the deduction theorem, we immediately obtain (4)
L O G C Τ , for every T .
Logic is, therefore, a component of every theory. The intuition captured by (1) is additionally supported if we pass to semantics. Let Τ be a theory and M its model. Thus, for every A £ T , A is true (valid) in M . Hence, since the traditional view regards logic as consisting exclusively of universally valid propositions, we have a strong motivation for (5)
A e L O G iff for every M , A is valid in M .
Now (5) is related to (1) by the completeness theorem15 (6)
A € Cn0 iff for every M , A is true in M .
The completeness theorem assures that derivability from the empty set of premises and logical validity (the validity in all models) are equivalent. Although (6) as a formal metalogical result does not itself provide any definition of logic, it directly suggests that (1) is a sound explication of the concept of logic, provided that (5) is such. Now let me turn to UP. Logic is basically applied as a stock of inferencerules, that is via Cn. The universal applicability of logic is precisely indicated by (4). Then, (5) is a formal exposition of the universality of logic as universal validity. Since to say that logic is topically neutral is equivalent to the statement that it is independent of any particular model, we have a motivation in order to suggest that topic-neutrality is related to the definition of logic as Cn0: to say that logic is topically neutral is to say that no specific premises are necessary to obtain logical truths. Now we see that the completeness theorem integrates of all aspects of UP on the semantic as well syntactic level. Hence, semantic completeness is certainly a natural property of logic, if UP is seriously taken. There is another metalogical theorem which also contributes to the formal account of UP, specifically to the topical neutrality of logic. I mean here the theorem which says that logic as such does not distinguish any extralogical item (individual constant or predicate letter). Let A(c,//c¿) be a result of replacing of the individual constant c¿ by the individual constant Cj in A, and let A(Pi//Pj) be a result of replacing the predicate letter P, by the predicate letter P} in A. We have 15The
term "completeness" referes here to semantic completeness.
Logicism and the Concept of Logic
(7)
117
(a) if A{a) e L O G , then Afaf/cj) £ L O G , (b) if A(Pi) e L O G , then A{Pi//Pj) € L O G .
Let di be the denotation of 'c,'and Ri — the denotation of 'P,'. The intuitive content of (7) is this: if A is an assertion on di or Ri made on purely logical grounds, then A is also true on any other individual or relation. We conclcude from (5) and (7) that logic as such does not favour any specific model or entity. The foregoing analysis provides a strong motivation for the so called first-order thesis (i.e. the thesis which identifies the logic with first-order logic): (8)
L O G = the first-order logic (FOL).
The crucial point is that my main intention is to determine a logic with UP. So far we know that L O G possesses it. What about other systems considered as logics? Are they universal? An answer is provided by the Lindström characterization theorem ( " « " stands for the equivalence of systems) (9)
(a) if a system S is complete and has the Löwenheim-Skolem property (LSP, if a system has model, it has a countable model), then S ss F O L , (b) if a system S is compact (if every finite subsystem of S has a model, S has a model) and has LSP, then S « FOL.
If (9) is applied to Τ = Cn0, (9a) and (9b) say the same in principle. Hence, completeness together with LSP as well as compactness together with LSP define UP. The matter essentially changes when we pass to extralogical theories. In this case, (9) concerns rather EP than UP and says: if a system S having LSP is complete or compact, then its expressive power does not exceed means which are accessible in first-order languages. It is a wellknown fact that first-order languages have a limited expressive power, for example the concept of finiteness is not definable inside them. From the point of view of EP, (9) informs on prices for stronger expressive devices. For example, S with a generalized quantifier "there are non-denumerably many" although complete, does not possess LSP.16 This fact confirms that UP is negatively correlated with expressive strength. The Lindström theorem leads to another formulation of (8), namely (10) the class of logic with UP = {FOL}. The consequences of (8) or (10) for logicism are immediate. If F O L is the logic, mathematics is not derivable from it, because logic with UP cannot be a lingua characteristica 16
for mathematics and, a fortiori, for t h e whole science.
Completeness means here: A is derivable from S iff A is true in every model of S. This is a generalization of the concept of completeness defined by (6).
118
Jan Wolenski
On the other hand, formal languages with powerful expressive devices, for example set theory, are logics in another sense than FOL is. Now, it seems that logicism is based on a confusion of UP and EP. In particular, (LI) and (L2), i.e., subtheses of the main thesis of logicism on Carnap's description concern different things. In order to define mathematical concepts we need powerful expressive languages. But in order to codify deductive inferences we need universally valid inference rules. Those authors who note that Gödel's results are not especially relevant for logicism are fully right, because on the original Frege-Russell project, incompleteness of the whole logicomathematical edifice does not devastate logicism. Matters mirrored by the Lindström theorem are much more serious.
References Carnap, Rudolf (1931), Die logizistische Grundlagen der Mathematik, Erkenntnis - 2, H. 2/3, 91-105; Eng. tr. in: Banacerraf, Paul/Putnam, Hilary (eds.), Philosophy of Mathematics Selected Readings, Cambridge University Press 1983, 41-51. Church, Alonzo (1962), Mathematics and Logic, in: Nagel, Ernest/Suppes, Patrick/ Tarski, Alfred Logic, Methodology, and Philosophy of Science Proceedings of the 1960 International Congress, Stanford University Press, Stanford, 181186.
Degen, J. W. (1993), Two Formal Vindications of Logicism, in: Czermak, Johannes (ed.), Philosophy of Mathematics Proceedings of the 15th International Wittgenstein Symposium, Hölder/Pichler/Tempsky, Wien, 243-250. Frege, Gottlob (1884), Die Grundlagen der Arithmetik, Koebner, Breslau; Eng. tr. by Austin, J. L., Basii Blackwell, Oxford 1950. Frege, Gottlob (1886), Über formale Theorien der Arithmetik, Jenaische Zeitschrift für Naturwissenschaften 19 (Supp.-Heft), 94-104 Henkin, Leon (1962), Are Mathematics and Logic Identical?, Science 138, 788794. Rodríguez-Consuegra, Franzisco (1993), Russell, Gödel, and Logicism, in: Czermak, Johannes (ed.), Philosophy of Mathematics, Proceedings of the 15th International Wittgenstein Symposium, Hölder/Pichler/Tempsky, Wien, 233242. Russell, Bertrand (1919), Introduction to Mathematical Philosophy, Allen k Unwin, London. Ryle, Gilbert (1954), Dilemmas, Cambridge University Press, Cambridge. Sternfeld, R. (1976), The Logicist Thesis, in: Schirn, Matthias (ed.), Studien zu Frege/ Studies on Frege, vol. I, Frommann-Holzboog, Stuttgart, 139-160. Surma, Stanislaw (1981), The Growth of Logic Out the Foundational Research in the Foundations of Mathematics, in: Agazzi, Evandro (ed.), Modern Logic, Reidei, Dordrecht, 15-33.
Logicism and the Concept of Logic
119
Wagner, Steven (1992), Logicism, in: Detlefsen, M. (ed.), Proof and Knowledge in Mathematics, Routledge, London, 65-109. Wolenski, J a n (1994), In Defense of the First-Order Thesis, in: Svoboda, Vladimir (ed.), Logica'93, Academy of Science of Czech Republic, P r a h a .
JESÚS
PADILLA-GÁLVEZ
Die formale Arithmetik und die Begriffsschrift als Spiele 1
Einführung
In Grundgesetze der Arithmetik hat sich Gottlob Frege mit der Einführung der irrationalen Zahlen beschäftigt. Um dieser Frage nachzugehen, unterscheidet er zwei Richtungen, in denen sich die Versuche bewegen: die formale und die inhaltliche Auffassung. Er beginnt mit einer kritischen Rekonstruktion der formalen Stellung, die Zahlen als Zahlzeichen bestimmt. Die Zahlzeichen bezeichnen nichts, sondern sind bloße Figuren. Die Figuren werden nach willkürlichen Regeln behandelt. 1 Diese Auffassung hat immer mit folgenden Schwierigkeit zu kämpfen: Bei der Einführung einer neuen Art von Figuren muß sie zugleich neue Regeln für deren Handhabung aufstellen, und zwar sowohl verbietende als auch erlaubende. Für Frege kann nur eine inhaltliche Arithmetik in Betracht kommen, obwohl er erkennen muß, daß die auf diesem Boden angestellten Versuche auf Schwierigkeiten treffen. Für die inhaltliche Arithmetik sind diese Figuren nur Zeichen ihrer eigentlichen Gegenstände, Zahlzeichen, äußere Hilfsmittel. Dabei steht er vor großen Schwierigkeiten, da entweder nicht zwischen Begriff und Gegenstand unterschieden wird und dann geglaubt wird, daß man damit zugleich den Gegenstand mit den gewünschten Eigenschaften bekommt, indem ein Begriff aufgezeigt wird, oder man erkennt, daß ein Begriff auch leer sein kann, und von ihm verlangt, daß er widerspruchsfrei sei. Frege entscheidet sich für eine bestimmte Lösung, indem er zeigt, daß bewiesen werden muß, daß kein Widerspruch besteht. 2 Er versucht ein metalogisches Prinzip auffindbar zu machen, das die Widerspruchsfreiheit beweist. Sein Standpunkt wird dialogisch durch die Erarbeitung der entgegengesetzten Position entwickelt. Die Arbeit befaßt sich mit einer derartigen Rekonstruktion.
*Zur Polemik über die formale Arithmetik: Frege (1886, 94ff.); Frege (1967 [1906], 324ff.); Frege (1966 [Bd. II, 1903], §§86ff.); Frege (1967 [1908a], 329ff.); Frege (1967 [1908b], 33) und Frege (1969 [1924/25], 295). 2 Leopold Löwenheim konnte in seinem verschollenen Briefwechsel mit Frege diesen überzeugen die formale Arithmetik einwandfrei aufzubauen. (Frege (1976, 157-161)).
Die formale Arithmetik und die Begriffsschrift als Spiele
2
121
Die „Newtonsche" Wende
N a c h d e m einige besondere Sätze bewiesen worden sind, untersucht Frege im zweiten Band der Grundgesetze der Arithmetik einige übliche m a t h e m a t i sche Fragestellungen und Formulierungen. 3 Ausgehend von G r u n d s ä t z e n des Definierens geht er zu der Betrachtung der irrationalen Zahlen über. 4 Danach behandelt er die Vorschläge Georg Cantors. 5 Er entwickelt die Theorie der irrationalen Zahlen von einem formalen 6 S t a n d p u n k t aus, der T h e m a unserer Arbeit sein wird, und gelangt zu einer neuen Auffassung, wie sie von Richard Dedekind, Hermann Hankel und O t t o Stolz vertreten wird. 7 Als nächstes behandelt er die Vorschläge Weierstrass 8 und schließlich den Begriff der „Größe". Diesen letzteren benutzt er zu Ausarbeitung eines neuen thematischen Bereichs, der für uns hier nicht weiter von Interesse ist. 9 Die Newtonsche Wende,10 die Frege in seiner Theorie der realen Zahlen einschlägt, hat ihre Ursache vor allem im folgenden zusammengefaßten Gedanken: „Wir haben die reelle Zahl als Grössenverhältnis aufgefasst und so die formale Arithmetik ... ausgeschlossen. Damit haben wir auf die Grössen hingewiesen als auf die Gegenstände, zwischen denen ein solches Verhältnis stattfindet." 1 1 In der polemischen Auseinandersetzung Freges mit der Theorie der irrationalen Zahlen Ernst Heines 1 2 und Johannes Thomaes 1 3 wird nach und nach sein Verständnis der inhaltlichen Arithmetik systematisch geklärt. 1 4 Sein Vorwurf gegen die formalisten läßt ersehen, welches die theoretischen Voraussetzungen sind, auf die er seine Definition der irrationalen Zahlen a u f b a u t . 1 5 Er selbst sagt hierzu: 3
Frege (1966 [Bd. I, 1893]). "Frege (1966 [Bd. I, 1893 und Bd. II, 1903]). 5 Frege (1966 [Bd. II, 1903], 88 ff.). 6 Die formale Auffassung, die wir behandeln werden, ist nicht diejenige, die den logischen Charakter der Arithmetik betont und folglich daraus ausgeht, daß die Zahlzeichen Figuren sind, die ohne Inhalt sind und nach willkürlichen Regeln vorgehen. Diese Auffassung wird von Frege insofern akzeptiert als die Regeln in direkten Ergebnis der Bedeutung der Symbole sind und eben diese Bedeutung eigentlicher Gegenstand der Arithmetik ist. Frege (1966 [Bd. II, 1903], 156). 7 Frege (1966 [Bd. II, 1903], 140 ff.). 8 Frege (1966 [Bd. II, 1903], 149 ff.). 9 Frege (1966 [Bd. II, 1903], 156 ff.). 10 Frege (1966 [Bd. II, 1903], 155 Anm. 2). 11 Frege (1966 [Bd. II, 1903], 155). 12 Heine (1872, 172 ff.). 13 T h o m a e (1898; 1906, 434 ff. und 1908, 56). 14 Frege (1908, 52 ff.). 15 Frege (1966 [Bd. II, 1903], 96 ff.).
122
Jesús Padilla-Gálvez „Ich habe in meinen Grundig. und in dem Vortrage Über formale Theorien der Arithmetik gezeigt, dass es für gewisse Beweise durchaus nicht gleichgültig ist, ob eine Zeichenverbindung — z.B. 1 — eine Bedeutung habe oder nicht, dass vielmehr die ganze Beweiskraft damit steht und fällt. So erweist sich überall die Bedeutung als das für die Wissenschaft Wesentliche."16
Wir haben es folglich hier mit einer kritischen Uberprüfung bestimmter in dieser Zeit geläufiger mathematischer Begriffe und Formeln zu tun. Seine Kritik geht vor allem von der simplen Feststellung aus, daß sich die Mathematiker nicht einmal über das Vorhandensein eines einheitlichen mathematischen Systems, das auf soliden Boden gegründet werden sollte, Gedanken gemacht haben. Dies kommt daher, daß die allgemeinen Problemstellungen die Frage nach den Grundsätzen nicht berücksichtigen. Freges Untersuchung behandelt vor allem bestimmte Mängel in den üblichen Formulierungen der Axiome, Definitionen und Beweise ohne selbst die Werke der bekanntesten Mathematiker von seinen Kritiken auszuschließen. Wir möchten die Art seiner Kritik an einzelne grundsätzliche Unterscheidungen untersuchen. 17 Wie wir wissen, entwickelt Frege ein Kalkül erst, nachdem er eine ausgearbeitete semantische Rechtfertigung der Grundregeln geliefert und diese syntaktisch formuliert hat. 1 8 Wie bei ihm üblich, folgt jedem Grundgesetz ein Hinweis auf den vorhergehenden Paragraphen, in den seine semantische Rechtfertigung zu finden ist. Thema dieser Arbeit ist nun die Untersuchung der Mängel der formalen Auffassung und der Vermutungen Freges, die uns erlaubt seinen Forschungsgang besser nachzuvollziehen und zu verstehen.
3
Vorläufige Kennzeichnung einer Theorie der Irrationalen
Die Auseinandersetzung mit den verschiedenen Theorien der irrationalen Zahlen führt die Behandlung der Abhängigkeiten zu den Grenzen mit sich. Alle Theorien, die im 19. Jahrhundert aufgestellt wurden, wiesen ein Axiom auf, das weder eines Arguments noch einer philosophischen oder einer mathematischen Begründung bedarf. Frege übernimmt die Aufgabe logische Einwendungen zu entwickeln, nachdem er eine semantische Begründung aufgestellt hat. Sein Beitrag besteht aus dem Hinweis auf die Bedeutung, die F r e g e (1969 [1892-1895], 134). D i e s e Unterscheidungen wurden in einen anderen Schrift vorgenommen. Er untersuchte z. B . zwischen S y m b o l und Symbolisiertes, einem logischen Konzept und ein Bild oder einem G e d a n k e n und zwischen einer Funktion und ihrem Wert. 1 8 T h i e l (1982, 201). 16 17
Die formale Arithmetik und die Begriffsschrift als Spiele
123
der Einsicht in die logische Notwendigkeit zukommt, die eine arithmetische Theorie der irrationalen Zahlen unabdingbar macht. 1 9 Die formale Auffassung gründet auf dem Vorurteil, daß man die Extensionen des Zahlensystems mittels der einfachen Postulierung der Allgemeingültigkeit der arithmetischen Regeln erhalten kann. Die Extension der rationalen wird also mit Hilfe der irrationalen Zahlen zu erhalten versucht. Die Widerlegung dieses Arguments ist gar nicht so einfach. Frege schlug als erstes vor, daß den formal festgelegten Zahlenzeichen nicht mittels eines einfachen Postulats ein Inhalts zugewiesen werden kann, sondern nur durch die Sicherung des Inhalts nach einem Existenz-Beweis. Die erste Problemstellung, die gerade zu dieser Zeit behandelt wurde, war folgende: Welches Recht haben wir die Existenz irrationaler Zahlen anzunehmen? Um dieses Problem zu lösen, sollten die algebraischen oder geometrischen Schwierigkeiten, die von den irrationalen Zahlen zu überwinden sind, nicht in Betracht gezogen werden. Die Existenz der irrationalen Zahlen ist nichts anderes als eine Folge dieser Schwierigkeiten. Es geht also darum zu wissen, ob die Gleichung: (1)
z 2 — 2 = 0,
eine Wurzel haben muß, da mit dem Anwachsen von χ (von 0 auf 2) auch x2 — 2 anwächst und zunächst negativ ist, jedoch dann positiv wird. Wenn sich χ kontinuierlich ändert, ist dies auch für χ — 2 der Fall und folglich muß χ2 — 2 beim Ubergang vom negativen zum positiven Wert den Wert 0 annehmen. Dieser Argumentationsgang ist nur ein erster Schritt für den Beweis, daß χ nun wirklich eine Zahl ist, denn es bereitete lediglich neue Forschungswege, die auf der Grundlage der Vermutungen, die aus dem obigen Argumentationsgang hervorgingen, beruhten. Alle diese Themen werden in der formalen Theorie Heines aufgegriffen, in der vorgeschlagen wird, jegliche Zahl als Objekt unzweifelbarer Existenz anzusehen. Aus diesem Grunde verschiebt Frege die Problemstellung, und weist darauf hin, daß nun, wenn wir von der Existenz der irrationalen Zahlen ausgehen, die Art und Weise, auf die diese bestimmt werden, in Frage zu stellen ist. Daher untersucht er die einzelnen Elemente, aus denen die Definition der genannten Zahlen besteht.
1 9 E s ist zu berücksichtigen, daß die Definition der irrationalen Zahlen zuvor normalerweise mittels geometrischer Betrachtungen durchgeführt wurde. Dieser Vorgang war einerseits insofern unlogisch als die Erklärung der Zahlen durch geometrische Begriffe in eine Tautologie enden konnte wenn nicht diese Zahlen unabhängig definiert werden. Andererseits gab es, wenn man nicht anders konnte als sich auf eine geometrische Definition zu beziehen, keine arithmetischen Gegenstände wie sie nach der Definition bestimmt wurden.
124
4
Jesús Padilla-Gálvez
Formale Arithmetik versus inhaltliche Arithmetik
Die formale Arithmetik entsteht als direkte Antwort auf den Piatonismus von Cantor und hat daher vor allem zum Ziel jegliche metaphysische Voraussetzungen zu überwinden. Thomae weist mit Recht darauf hin: der „...formale Standpunkt hebt uns über alle metaphysischen Schwierigkeiten hinweg, das ist der Gewinn, den er uns bietet." 2 0 Der formale Standpunkt stellt also eine gegensätzliche Auffassung zu den Vorschlägen der Theorie Cantors dar. Daher versucht er die eigentlichen Zahlen aufzunehmen und ihr Vorhandensein zu beweisen. Aus diesem Grunde geht die wichtigste These der formalen Theorie davon aus, daß die Spielregeln nicht rechtfertigt werden müssen. Es genügt bestimmte Figuren einzuführen, für deren Gebrauch besondere Regeln angegeben werden, anstatt zu beweisen, daß die Zahlen bestimmte Eigenschaften aufweisen. Diese Regeln werden als Eigenschaften der Figuren angesehen, derart, daß willkürlich, ausgehend von bestimmten Eigenschaften, Objekte geschaffen werden können. 21 In Analogie zum Schachspiel können wir sagen, daß wir, nach Regeln vorgehend, von bestimmten Stellungen der Figuren zu anderen Figurenstellungen übergehen. Im Spielkalkül gehen wir von Figurengruppen auf andere über, indem wir festgesetzten Regeln folgen. Wenn wir also in einer Theorie des Schachs Sätze bilden können über mögliche Züge, mögliche Stellungen und ähnliches, so gibt es folglich in einer Theorie des Spielkalküls Theoreme, die z. B. festlegen, daß man, wenn man die Spielregeln beachtet, von einer bestimmten Figurengruppe auf eine andere übergehen kann. Frege ist der Meinung, daß die oben dargelegten Überlegungen nur sinnvoll seieii, wenn deren Anwendungsmöglichkeiten außerhalb der formalen Arithmetik betrachtet werden. Andernfalls sind die gesagten Regeln nicht so willkürlich wie im Schach. Wenn ihre Anwendung auch nicht zufällig ist, so ist die formale Arithmetik doch auch nicht daran gebunden „...Rechenschaft zu geben, warum wir die Regeln grade so und nicht anders aufstellen." 2 2 Auf einer polemischen Weise fragt Frege nach dem Unterschied zwischen formaler Arithmetik und einem bloßen Spiel. Wahrscheinlich stellt er diese Frage, da zwar die Zahlensymbole etwas bedeuten, die Schachfiguren jedoch nicht. Sollte die Arithmetik einen höheren Wert besitzt, täte sie das aufgrund externer Kriterien, die nicht in der eigentlichen Arithmetik zu finden sind. Die inhaltliche Arithmetik betrachtet die Figuren als Symbole. Sie handelt von Zahlensymbolen, insofern sie externe Darstellungen sind. Es kommt 20
T h o m a e (1898, §§1-11). Zitiert nach: Frege (1966 [Bd. II, 1903], 98). ' F r e g e (1966 [Bd. II, 1903], 99). " F r e g e (1966 [Bd. II, 1903], 99). 2
Die formale Arithmetik und die Begriffsschrift als Spiele
125
die Schwierigkeit auf, neue Regeln für die Einführung neuer Figurentypen aufzustellen, und zwar sowohl erlaubende als auch verbietende Regeln.
5
Die formale Arithmetik und die Begriffsschrift als Spiele
Frege spielt mit dem Gedanken, daß es vielleicht angebracht wäre, die Schlußregeln und die weiteren Gesetze der BegrifFsschrift mittels willkürlicher Voraussetzungen einzuführen, ohne auf die Bedeutung und den Sinn der Symbole einzugehen. 2 3 Folglich wären die Symbole als Figuren zu behandeln. Auf diese Weise wird die externe Darstellung des Schließens dem Zug gleichgestellt, den wir beim Schach machen. 24 Die formale Arithmetik ist mit den Stellungen vergleichbar, in die sich die Figuren des Schachs befinden. Ihre Stellungen können, bestimmten Regeln folgend, geändert werden, ohne deren Sinn zu berücksichtigen. Würde man auf den Sinn Rücksicht nehmen, so könnten die Regeln nicht willkürlich aufgestellt werden. Aus denjenigen Formeln, die einen Gedanken ausdrücken, müßten Formeln abgeleitet werden, die einen wahren Gedanken einschließen. In diesem Moment hätten wir jedoch bereits die formale Arithmetik verlassen und befänden uns in einem anderen Bereich. In der inhaltlichen Arithmetik werden diejenigen Sätze als solche angesehen, die Gleichheit oder Ungleichheit beinhalten, da diese Gedanken ausdrücken. Frege ist folgender Meinung: „... ohne einen Gedankeninhalt wird auch keine Anwendung möglich sein." 25 Aus diesem Grunde kann man allein aus der Stellung einer Schachfigur nicht auf ihre Anwendung schließen, da diese keinen Gedanken ausdrückt. In seiner ersten Reinschrift von Was sind und was sollen die Zahlen h a t t e Richard Dedekind darauf hingewiesen, daß die Anwendung erlaubt infinite Systeme zu definieren. 26 Er entwickelte zwei charakteristische Vorgehensweisen: Die Beweisführung der vollständigen Induktion und die rekursive Definition. Die Anwendung einer arithmetischen Gleichheit wird durch das Ausdrücken eines Gedankens verursacht. Daher übernimmt die Anwendung eine besondere Rolle und bedingt, daß die Arithmetik den Charakter einer Wissenschaft annimmt. Aus diesem Grunde kommt Frege zu der Überlegung, daß die Überbrückung zwischen éiner arithmetischen Formel und ihrer Anwendung nur dann möglich ist, wenn man davon ausgeht, die Formeln drücken einen Sinn aus und die Regeln gründen auf die Bedeutung der Ausdrücke. 23
Frege (1967). Padilla Gálvez (1990, 463 f.) und Padilla Gálvez (1991, l l l f f . ) . 25 Frege (1966 [Bd. II, 1903], 100). 26 Dedekind (1969). 24
126
6
Jesús Padilla-Gálvez
Axiom, Beweis und Definition in der Theorie eines Spiels
Ein Spiel, daß aus bestimmten Figuren besteht, beinhaltet keine Lehrsätze und Beweise. Die formale Arithmetik, die als ein Schachspiel aufgefaßt wird, kann nicht die Stellung einer Wissenschaft einnehmen. Es können zwar bestimmte Axiome in einer Theorie des Schachspiels vorhanden sein, trotzdem brauchen diese nicht im Schachspiel selbst aufzutauchen. Dies kommt daher, weil die formale Arithmetik lediglich Regeln kennt. Dieser Gedankengang schließt jedoch nicht die Möglichkeit aus uns eine Theorie der formalen Arithmetik vorzustellen, in der es Axiome gibt und in der man von einer bestimmten Figurengruppen, im Einklang mit den Spielregeln, zu einer anderen Figurengruppen gelangen kann. Nach Frege sind Axiome wahre Sätze, die nicht bewiesen werden können, 2 7 da sie einer von der Logik verschiedenen Quelle entstammen, die als intuitiv bezeichnet werden kann. 28 Axiome sind folglich Sätze, „... die wahr sind, die aber nicht bewiesen werden, weil ihre Erkenntnis aus einer von der logischen ganz verschiedenen Erkenntnisquelle fliesst, die man Raumanschauung nennen kann. Aus der Wahrheit der Axiome folgt, dass sie einander nicht widersprechen. Das bedarf also keines weiteren Beweises." 29 Diesem Gedankengang folgend kommen wir zu dem Ergebnis, daß die Wahrheit der Axiome aus dem Fehlen von Widersprüchen zwischen Ihnen zu schließen ist. Folglich ist die Widerspruchsfreieheit ein direktes Ergebnis der angenommenen Wahrheit der Axiome, die in einem formalen System bestimmt werden. Die Beweisführungen werden als Schlussketten dargestellt, die zu einem Theorem führen. Eine Beweisführung geht also von Axiomen aus und führt mittels einer Kettenbildung zu einem Theorem. Die Beweisführung hat zwei Funktionen zu. erfüllen: einerseits muß sie die Wahrheit des Bewiesenen garantieren und andererseits hat sie die logischen Zusammenhänge der Wahrheit offenzulegen. Wenn wir davon ausgehen, daß die Definitionen in der formalen Arithmetik die Bedeutung der arithmetischen Zeichen nicht berücksichtigen, sondern die Ausdrücke erklären, mitdenen die Axiome der Theorie bestimmt werden können, so verstehen wir ihre vermeintliche Unwesentlichkeit. 30 Der wichtigste Unterschied zwischen der formalen Arithmetik und dem Schach ist der, daß erstere neue Figuren mittels neuer Regeln einführen kann, während letzterer einen festgesetzten Bereich besitzt. 31 Bestimmte Definitionen mit 27
Frege (1969, 221). Das Wahrheitskriterium ist den Axiomen eigen. Er wird energisch behaupten, daß es keine falsche Axiome gibt und daß wir keine axiomatischen Vorschläge anerkennen können, deren Ziele zweifelhaft sind. 28 Padilla Gálvez (1992, 141ff.). 29 Frege (1976, 63). 30 Frege (1969, 225). 31 Frege (1866 [Bd. II, 1903], 102 f.).
Die formale Arithmetik und die Begriffsschrift als Spiele
127
Aussagecharakter heißen Axiome. Jede Definitionskette expliziter Definitionen endet in axiomatisch festgesetzten Begriffen, die ihrerseits nicht des Rückbezugs auf die Definition bedürfen. In Folge der hier dargestellten Überlegungen kann Frege kaum kritischer sein, wenn er feststellt: „Für uns kann nur eine inhaltliche Arithmetik in Betracht kommen. Aber auch die auf diesem Boden angestellten Versuche sind, wie wir gesehen haben, erfolglos geblieben, wenigstens sofern sie rein arithmetisch sein wollen." 32
7
Schluß
In Grundgesetze der Arithmetik hat sich Frege mit der Einführung der irrationalen Zahlen beschäftigt. Um dieser Frage nachzugehen, unterscheidet er zwei Richtungen in denen sich die Versuche bewegen: die formale und die inhaltliche Arithmetik. Gemäß seiner Auffassung beginnt er mit einer kritischen Rekonstruktion der formalen Stellung. Er weist den Zahlen gewisse Figuren zu, die nach willkürlichen Regeln behandelt werden können. Sie hat immer mit folgenden Schwierigkeit zu kämpfen: Bei der Einführung einer neuen Art von Figuren muß sie zugleich neue Regeln für deren Handhabung aufstellen, und zwar sowohl verbietende als auch erlaubende. Die Frage, warum sich Frege mit der Polemik der arithmetischen Formalisten auseinandersetzt ist auf zweierlei Weise zu beantworten: 3 3 Einerseits können die arithmetischen Untersuchungen nicht durchgeführt werden, wenn die Aussagen der Arithmetik Zeichen gebrauchen, die keine Bedeutung aufweisen. Andererseits ergibt sich die Notwendigkeit die Gründe zu kennen, die zu der Wahl einer bestimmten Regel des Spielkalküls führen. Ich bin jedoch der Meinung, daß der eigentliche Beitrag an anderer Stelle vollzogen wird. Frege findet sich nicht damit ab, daß wir es in der Arithmetik ständig mit Beweisführungen zu tun haben, die auf nicht nachprüfbaren Intuitionen beruhen. Die Untersuchung des inhaltlichen Vorschlags liefert eine reichhaltige Logik, die weder mechanisch noch irrational ist und die von der formalen Sicht her nicht anerkannt oder gar hervorgerufen werden kann. Freges Ziel ist die Ausarbeitung einer allgemeinen argumentativen Strategie, die auf einer Verbesserung der Vorschläge, dank seiner Kritik an der formalen Auffassung, beruht und sich der Logik des Beweises und der Widerlegung bedient. Für Frege kann nur eine inhaltliche Arithmetik in Betracht kommen, obwohl er erkennen muß, daß die auf diesem Boden angestellten Versuche auf Schwierigkeiten treffen. Für die inhaltliche Arithmetik sind diese Figuren nur Zeichen ihrer eigentlichen Gegenstände, Zahlzeichen, äußere Hilfsmittel. 32 33
Frege (1966 [Bd. II, 1903], 154). Thiel (1965, 1.2.).
128
Jesús Padilla-Gálvez
Dabei steht er vor großen Schwierigkeiten: entweder wird nicht zwischen Begriff und Gegenstand unterschieden und dann geglaubt, daß m a n d a m i t zugleich den Gegenstand mit den gewünschten Eigenschaften b e k o m m t , ind e m ein Begriff aufgezeigt wird, oder man erkennt, daß ein Begriff auch leer sein kann, und von ihm verlangt, daß er widerspruchsfrei sei. Frege entscheidet sich für eine b e s t i m m t e Lösung, indem er zeigt, daß bewiesen werden muß, daß kein Widerspruch besteht. Er versucht ein metalogisches Prinzip auffindbar zu machen, das die Widerspruchsfreiheit beweist.
Literatur
Cantor, Georg ( 2 1980), Gesammelte Abhandlungen mathematischen und philosophischen Inhalts, Springer, Berlin/Heidelberg/New York. Dedekind, Richard ( 7 1969a), Stetigkeit und irrationale Zahlen [1872], Vieweg, Braunschweig. Dedekind, Richard ( 7 1969b), Was sind und was sollen die Zahlen [1887], Vieweg, Braunschweig. Frege, Gottlob (1886), Ueber formale Theorien der Arithmetik. Jenaische Zeitschrift für Naturwissenschaft XIX, 94-104. Frege, Gottlob (1906), Antwort auf die Ferienplauderei des Herrn Thomae. Jahresbericht der Deutschen Mathematiker-Vereinigung XV, 586-590. In: Frege, Gottlob (1967, 324-328). Frege, Gottlob (1908a), Die Unmöglichkeit des Thomaeschen formalen Arithmetik aufs Neue nachgewiesen. Jahresbericht der Deutschen MathematikerVereinigung 17, 52-55. In: Frege, Gottlob (1967, 329-333). Frege, Gottlob (1908b). Schlußbemerkung. Jahresbericht der Deutschen Mathematiker- Vereinigung XVII, 56. In: Frege, Gottlob (1967, 333). Frege, Gottlob (1966), Grundgesetze der Arithmetik. Begriffsschriftlich abgeleitet, [Bd. I, 1893 und Bd. II, 1903], Olms, Hildesheim. Frege, Gottlob (1967), Kleine Schriften, hrsg. von Angelelli, Ignacio Wissenschaftliche Buchgesellschaft, Darmstadt. Frege, Gottlob (1969), Nachgelassene Schriften, hrsg. von Hermes, Hans/Kambartel, Friedrich/Kaulbach, Friedrich, Felix Meiner, Hamburg. Frege, Gottlob (1976), Wissenschaftlicher Briefwechsel, hrsg. v. Gabriel, Gottfried/Hermes, Hans/Kambartel, Friedrich/Thiel, Christian/Veraart, Albert, FeUx Meiner, Hamburg. Frege, Gottlob (1977a), Begriffsschrift, eine der arithmetischen Nachgebildete Formelsprache des reinen Denkens, [1879], Olms, Hildesheim. Frege, Gottlob (1977b), Die Grundlagen der Arithmetik. Eine logisch-mathematische Untersuchung über den Begriff der Zahl, [1884], Olms, Hildesheim. Heine, Ernst (1872), Die Elemente der Functionslehre. Journal für die reine und angewandte Mathematik (Crelle's Journal) 74, 172-188.
Die formale Arithmetik und die Begriffsschrift als Spiele
129
Kambartel, Friedrich (1969), Zur Formalismuskritik und zum Logikbegriff Freges. In: Frege, Gottlob (1969, XVII-XXV). Padilla Gálvez, Jesús (1990), Pueden aplicarse los argumentos informelles contra el punto de vista formalista? In: Diaz Ausin (Hrsg.), Structures in Mathematical Theories. Univ. del Pais Vasco, San Sebastián, 461-467. Padilla Gálvez, Jesús (1991), El origen de la controversia acerca de la noción de regia. Arbor 138, 111-128. Padilla Gálvez, Jesús (1992), El método axiomático revisado. Mathesis 8, 141— 152. Thiel, Christian (1965), Sinn und Bedeutung in der Logik Gottlob Freges. Anton Hain, Meisenheim. Thiel, Christian (1983), Madrigueras para las antinomias: Una nueva consideración de la llamada lógica superior de Frege. Teorema XIII/1-2, 201-212. Thomae, Johannes ( 2 1898), Elementare Theorie der analytischen Functionen einer complexen Veränderlichen. Halle a. S. Thomae, Johannes (1906), Gedankenlose Denker. Eine Ferienplauderei. Jahresbericht der Deutschen Mathematiker-Vereinigung 15, 434-438. Thomae, Johannes (1908), Bemerkung zum Aufsatze des Herrn Frege. Jahresbericht der Deutschen Mathematiker-Vereinigung 15, 434-438.
RAINER
STUHLMANN-LAEISZ
Invarianztheoretische Überlegungen zu Freges Definition durch Abstraktion
0
Vorbemerkungen
In §10 der Grundgesetze der Arithmetik führt Frege die „Werthverläufe" von Funktionen ein. Der Sache nach handelt es sich dabei um eine Anwendung seines Verfahrens der Definition durch Abstraktion. Der Paragraph macht exemplarisch die invarianztheoretischen Aspekte dieses Definitionstyps deutlich» Christian Thiel spricht in seiner Abhandlung „Gottlob Frege: Die Abstraktion" von dem „bei Interpreten gefürchteten §10 der ,Grundgesetze'". 1 In der Tat liegen zur Thematik des Paragraphen sehr scharfsinnige Untersuchungen von P. Schroeder-Heister, T. Parsons und Thiel selber vor. 2 Ich glaube jedoch, daß es auch eine einfachere Seite des Fregeschen Projektes gibt, die es als einen Spezialfall der Einführung von Invarianten unter Objekten erkennen läßt, die zueinander in bestimmten Aquivalenzbeziehungen stehen. Dies ist ein sehr elementares Kapitel der Mengenlehre. In der vorliegenden Arbeit will ich versuchen, Freges Argumentation unter Verwendung von Invarianten und Aquivalenzrelationen als einfachen mengentheoretischen Hilfsmitteln zu rekonstruieren. Meine Überlegung bezieht auch den Beginn des §3 der Grundgesetze mit ein, denn hier präsupponiert Frege die für den Gedankengang des §10 substantielle Existenz von Wert verlaufen.
1
Einige mengentheoretische Tatsachen
Ich führe zunächst einige einfache Tatsachen der elementaren Mengenlehre (nach Zermelo-Fraenkel) an, die Aquivalenzrelationen und Invarianten bezüglich dieser Relationen betreffen. (1)
Sei A eine Klasse und = eine Aquivalenzrelation auf A. Dann gibt es eine Funktion / auf A, so daß für alle x,y £ A: x = y gdw. f(x) = f(y). 'Thiel (1972, 36). 2 Schroeder-Heister (1987), Parsons (1987), Thiel (1976).
Invarianztheoretische Überlegungen
131
Eine solche Funktion nenne ich eine Invarianzfunktion für die Aquivalenzstruktur [A, = ) . — Die Aussage (1) beschreibt die Situation, die man erhält, wenn m a n Objekte mittels der Fregeschen Definition durch Abstraktion einführt: Die neuen Objekte sind immer die Werte einer Invarianzfunktion. (la)
Für jedes (A, = ) gibt es unendlich viele Invarianzfunktionen.
( l a ) folgt unmittelbar aus (1) mittels der Induktion: f°(x) := / ( x ) ; fn+1(x) := { / " ( z ) } . — Diese Aussage wirft allerdings das Problem der Unbestimmtheit der Invarianten auf (siehe unten). Wenn f eine Invarianzfunktion für eine Äquivalenzstruktur (Α, = ) ist, dann heiße { f ( x ) \ χ € A} die Klasse der ¡-Invarianten bezüglich (A, = ) , bezeichnet durch F(A,=). Ich werde diese Klasse jedoch in der Regel einfach als Klasse der /-Invarianten bezeichnen und sie durch F symbolisieren. Im folgenden ((2), (Def) und (3)) wird gezeigt, daß die unendlich vielen nach ( l a ) existierenden Invarianten in bestimmter Hinsicht untereinander gleichwertig sind. Darin besteht ihre Unbestimmtheit. (2)
Seien f,g zwei Invarianzfunktionen für (/4, = ) . Dann ist durch die Abbildung σ ( / ( χ ) ) := g(x) eine eineindeutige Funktion aus der Klasse der /-Invarianten in die Klasse der ^-Invarianten gegeben.
(2) beschreibt die Aquipollenz der Klassen von Invarianten sämtlicher Funktionen zu einer Äquivalenzstruktur. (Def)
Sei ( Λ , = ) eine Äquivalenzstruktur. Die ra-stellige Funktion φ(χι,..., xn) auf A ist zulässig bezüglich = gdw. für alle xu... ,xn,yu... ,yn gilt: wenn = y ¡(i = 1, · ·., η), dann φ{χ ι,...,ζ„) = φ(αΛ,... ,yn).
Durch die vorangehende Definition werden Funktionen auf A — insbesondere Prädikate (als Wahrheitswertfunktionen) — ausgezeichnet, die dazu dienen können, Funktionen (Prädikate) auf einer Klasse von Invarianten einzuführen. Eine Funktion φ ist genau dann zulässig, wenn äquivalente Elemente von A denselben φ-Wert haben. (3)
Sei (Λ, = ) eine Äquivalenzstruktur mit einer Invarianzfunktion / . Sei weiter Fn die Klasse aller n-stelligen Funktionen auf F(A,=), und sei M die Klasse aller n-stelligen Funktionen auf Α, die zulässig bezüglich = sind. Die Abbildung τ : M >-* Fn, definiert durch ( τ » ( / ( χ , ) , . . . , / ( χ η ) ) := $ ( / ( ! ! ) , . . . , f(xn)) := φ(Χϊ,..., i „ ) , ist eine eineindeutige Funktion von M nach Fn.
132
Rainer Stuhlmann-Laeisz
Aussage (3) besagt, daß jede zulässige Funktion auf A eine Funktion auf den invarianten Abstrakta festlegt; umgekehrt gilt: Jede Funktion auf den neu gewonnenen Objekten ist auf eine Funktion auf A reduzierbar. (3a)
Gegeben tionen / , auf F(A, g von Fn
sei eine Aquivalenzstruktur (A, = ) mit zwei Invarianzfunkg. Es seien Fn,Gn die Klassen der n-stelligen Funktionen = ) und G{A, = ) . Dann gibt es eine eineindeutige Funktion nach Gn, so daß für alle Φ in Fn gilt:
Mit (3a) liegt eine Art Identifikation der Invarianten vor: Jede von ihnen ist mit jeder anderen gleichwertig, und es ist gleichgültig, ob man / oder g als Invarianzfunktion und die entsprechenden Objekte aus F oder aus G als Invarianten wählt. (4)
Sei (Λ, = ) eine Aquivalenzstruktur, und seien α, β zwei beliebige Objekte. Dann gilt für alle α, 6 S A mit α ψ b: Es gibt eine Invarianzfunktion / für ( / 4 , = ) , so daß f(a) = a und f(b) — ß.
Aus (4) folgt, daß, wenn eine Invarianzfunktion g gegeben ist (was nach (1) immer der Fall ist), und wenn Objekte α, β, die keine (/-Invarianten sind, gegeben sind, man immer eine andere Invarianzfunktion / finden kann, so daß α, β /-Invarianten (d.h. Werte von / ) sind. (5)
Sei (A, = ) eine Aquivalenzstruktur, und seien α, β zwei beliebige Objekte. Dann gibt es eine Invarianzfunktion / für (v4, = ) , so daß . / ( α ) φ a und / ( α ) φ β für alle α Ε Α.
Aussage (5) besagt, daß man es immer vermeiden kann, gegebene Objekte als Invarianten auszuzeichnen.
2
Anwendung auf Freges Einführung von Wertverläufen
Zu Beginn des §3 der Grundgesetze schreibt Frege: „Ich brauche die Worte ,die Function Φ(£) hat denselben W e r t h verlauf wie die Function Ψ (ξ)' allgemein als gleichbedeutend mit den Worten ,die Functionen Φ(£) und Ψ(£) haben für dasselbe Argument immer denselben Werth'." 3 Diese Aussage erlaubt es, den oben angeführten mengentheoretischen Apparat anzuwenden: Immer denselben Wert für dasselbe Argument zu haben, 3
Frege (1893, 7).
Invarianztheoretische Überlegungen
133
ist eine Äquivalenzrelation auf der Klasse der Funktionen. Also bildet diese Klasse zusammen mit dieser Relation eine Äquivalenzstruktur. Was erlaubt nun Frege zu sagen, ,,Φ(£) hat denselben Werthverlauf wie die Funktion Φ(£)"? Dieser Satz gibt ja vor, sich auf eine existierende Entität, nämlich einen Wertverlauf, zu beziehen. Die Antwort lautet: Die Erlaubnis ist durch die mengentheoretische Aussage (1) gegeben. Dieser Aussage zufolge gibt es eine Abbildung auf der Menge der Funktionen, die es ermöglicht, jeder beliebigen Funktion ein neues Objekt als Invariante gegenüber der genannten Äquivalenzrelation zuzuordnen. Dieses Objekt nennt Frege dann den „Werthverlauf" der Funktion. Obwohl kein expliziter Hinweis dafür vorliegt, daß Frege das Theorem (1) bekannt war, möchte ich annehmen, daß er es stillschweigend vorausgesetzt hat — hier und selbstverständlich auch in anderen Kontexten. Ich gebe hier einige einfache Teilschritte eines mengentheoretischen Beweises für (1) an: (i) (ii) (iii)
3=1BVz[z 6 Β ζ Ε ΑΛφ(ζ)} 3 = 1 f î Vz[z G Β ζ € ΑΛΖ * χ] f ( x ) := {Ζ I 2 G ΑΛΖ S χ}
Man erhält (i) aus dem Axiomenschema der Separation zusammen mit dem Extensionalitätsaxiom; (ii) folgt aus (i) durch Substitution von ζ = χ für φ(ζ). Die Funktion / in (iii) ist aufgrund von (ii) wohldefiniert. Nun weiß man, daß die Funktion / , die χ auf seine Äquivalenzklasse abbildet, eine Invarianzfunktion ist. Woher weiß man aber, daß diese Äquivalenzklasse existiert? Soweit ich sehe, ist die einzige Basis für diese Annahme das Axiomenschema der Separation, welches unter gewissen Einschränkungen die Transformierbarkeit von Begriffen in ihre Extensionen fordert. Daher erweist sich der Fregesche Weg, die Extension (den „Umfang") eines Begriffs als Sonderfall eines Wertverlaufs einzuführen, wie es am Ende von §3 geschieht, als zirkulär. 4 Ich wende mich nun dem §10 zu. Dabei möchte ich die oben angeführten mengentheoretischen Aussagen auf Freges Argumentation zu den folgenden drei Punkten anwenden, die in dieser Reihenfolge auch im Text des Paragraphen behandelt werden: (a) die „Unbestimmtheit" der Wertverläufe, (b) Freges Versuch, diese Unbestimmtheit zu überwinden und (c) die Frage: Ist irgendein Wertverlauf identisch mit einem Wahrheitswert? (ad a) Frege argumentiert für die Unbestimmtheit der Zuordnung von Wertverläufen zu Funktionen im Sinne von Aussage (la). Sein Argument setzt 4
D e m n a c h muß die Interpretation von Freges Definition durch Abstraktion insofern modifiziert werden, als man lediglich sagen kann, Frege habe diese Methode auf der Basis einer A n n a h m e wie Aussage (1) entwickelt.
134
Rainer Stuhlmann-Laeisz
voraus, daß m a n mindestens eine solche Zuordnung, d.h. eine Invarianzfunktion, wie sie durch (1) gegeben wird, hat; er b e h a u p t e t dann: Wenn m a n des weiteren eine eineindeutige Funktion hat, welche für jeden Wertverlauf, d.h. f ü r jedes Element einer gegebenen Menge von Invarianten, verschieden ist von der identischen Abbildung, dann können auch die Werte dieser Funktion die Rolle von Wertverläufen annehmen. Die vorliegende Situation ist also ein Modellfall der oben angeführten Aussagen ( l a ) und (2). Mit Bezug auf diese Situation stellt Frege dann die Frage: „Wie wird nun diese U n b e s t i m m t h e i t aufgehoben?". Diese Frage leitet zum zweiten P u n k t über. (ad b) Frege beantwortet die Frage ganz allgemein: Die Unbestimmtheit kann aufgehoben werden „dadurch, dass für jede Function bei ihrer Einführung b e s t i m m t wird, welche Werthe sie für Werthverläufe als A r g u m e n t e erhält, ebenso wie für alle anderen Argumente. T h u n wir dies f ü r die bisher b e t r a c h t e t e n Functionen!" Das beschriebene Verfahren beruht auf Freges Auffassung von Identität, welche er von Leibniz ü b e r n o m m e n h a t . Dieser Auffassung zufolge identifiziert man ein Objekt, indem man die Begriffe, unter welche es fällt, bestimmt, d.h. indem man die Werte von Wahrheitswertfunktionen (Begriffen) für das gegebene O b j e k t als Argument b e s t i m m t . Freges Vorschlag ist allerdings nicht sehr hilfreich: Denn durch Einführung einer Funktion und Festlegung ihrer Werte für Wertverläufe als A r g u m e n t e kann die beschriebene Unbestimmtheit nicht aufgehoben werden. Das folgt aus den Aussagen (3) und (3a): Das Verfahren würde auf Festlegungen des Typs Φ(ίο) = 7 (mit fo 6 F und einem beliebigen O b j e k t 7) f ü r die einzuführenden Funktionen hinauslaufen. Aber indem m a n den Wert der neuen Funktion φ f ü r das Argument /o in einer solchen Weise festlegt, b e s t i m m t m a n pari passu Funktionen auf jeder anderen Klasse von Invarianten durch die Festlegung: Φ(9ο) = 7 gdw. für irgendein x0 6 A : f0 = f{x0)
und g0 -
g{x0)·
Durch E i n f ü h r u n g einer neuen Funktion auf der Klasse der / - I n v a r i a n t e n b e s t i m m t m a n daher ebenso auf jeder anderen Klasse von Invarianten eine entsprechende Funktion, welche dieselben Werte für die entsprechenden Arg u m e n t e h a t , wie die ursprüngliche Funktion. Daher hebt das von Frege vorgeschlagene Verfahren die Unbestimmtheit nicht auf. — Nun steht aber das, was Frege tatsächlich t u t , im Gegensatz zu dem, was er sagt: Er f ü h r t nämlich keine neuen Funktionen ein, sondern wendet die bereits vorliegenden Funktionen auf die neuen Objekte, nämlich die Wert Verläufe, an. Es bezeichne F wiederum die Klasse der Invarianten. Dann sind drei Funktionen auf die O b j e k t e in F anzuwenden: der Begriff der Identität, „der
Invarianztheoretische Überlegungen
135
Waagerechte" und die Verneinung ( ¡ ). Wegen der Reduzierbarkeit der beiden letztgenannten Funktionen auf die erstgenannte muß Frege allerdings nur die Identität betrachten. Da diese Funktion intensional bereits bekannt ist, kann man ihre Werte für gegebene Objekte, wie die Invarianten in F, nicht einfach willkürlich festsetzen. Hier hat m a n eine Möglichkeit, die U n b e s t i m m t h e i t der Wertverläufe zu einem gewissen Grade aufzuheben. Solange m a n allerdings daran festhält, die Identitätsfunktion nur auf diese O b j e k t e anzuwenden, wird man wiederum fehlgehen; denn auf diese Weise erhält m a n lediglich Identitäten von der Art: f(x)
= f ( y ) (ist das Wahre) gdw. χ = y (ist das Wahre),
weis, wenn m a n / durch g ersetzt, für jede andere Klasse G von Invarianten bezüglich der Äquivalenzrelation = ebenso gilt. (Ich erinnere daran, daß in Anwendung auf Freges Problem χ und y für Fregesche Funktionen stehen und „ = " die Relation, stets denselben Wert für dasselbe Argument anzunehmen, repräsentiert.) Somit bleibt die Unbestimmtheit bestehen. Daher ist m a n gezwungen, die (Wahrheits-)Werte der Identitätsfunktion f ü r die Obj e k t e in einer Klasse zu bestimmen, welche nicht nur Wertverläufe e n t h ä l t . Da die einzigen O b j e k t e , die Frege bis zum §10 eingeführt hat, die Wahrheitswerte und die Wertverläufe sind, betrachtet er nun die Klasse genau dieser E n t i t ä t e n . Wir bezeichnen diese Klasse mit H . Damit besteht j e t z t die Aufgabe, die Werte der Identitätsfunktion für Argumente aus H zu bes t i m m e n , d.h.: Frege muß für alle O b j e k t e a , ß aus H entscheiden, ob die Gleichung „ α = β " wahr ist oder falsch. Dabei sind drei Fälle zu unterscheiden: (1) α ist ebenso wie β ein Wahrheitswert, (2) α ist ebenso wie β ein Wertverlauf und (3) α ist ein Wertverlauf und β ein Wahrheitswert (oder u m g e k e h r t ) . In den ersten beiden Fällen steht der Wahrheitswert der fraglichen Gleichung schon fest, denn erstens ist jeder Wahrheitswert mit sich selbst identisch und von dem jeweils anderen verschieden, und zweitens gilt f ü r Wertverläufe: „ a = /3"ist wahr genau dann, wenn α und β Wertverläufe von Funktionen Φ und Φ sind, die für jedes Argument denselben Wert haben. Der d r i t t e Fall hingegen wirft die Frage auf, „ob einer der Wahrheitswerthe etwa ein Wertverlauf sei", d.h.: ob die Klasse der Wahrheitswerte mit der Klasse der Wertverläufe einen nicht-leeren Durchschnitt hat. Und mit der Beantwortung dieser Frage hat man die Möglichkeit, die Unbestimmtheit der Invarianzfunktion Wertverlauf zumindest partiell zu überwinden: Wenn es möglich ist, die Zuordnung von Wertverläufen in einer solchen Weise zu konstruieren, daß das Wahre einer Funktion zugeordnet würde und das Falsche einer anderen Funktion, dann könnte man diese (oder eine gleichwertige) Zuordnung auswählen und alle anderen, welche ü b e r h a u p t keinen Wahrheitswert als Wertverlauf irgendeiner Funktion auszeichnen, beiseite lassen. Und wenn die Klasse der letzteren Zuordnungen nicht leer ist, dann erhält
Rainer Stuhlmann-Laeisz
136
man mittels dieser Methode eine nicht-triviale Disjunktion der Klasse aller Invarianten bezüglich der in Frage stehenden Aquivalenzrelation. Die Frage, ob die erste der beiden Bedingungen dieses Vorgehens erfüllt ist, fällt mit P u n k t (c) zusammen. (ad c) Wir stehen jetzt vor einem Anwendungsfall für die Aussage (4). Aus ihr folgt ja, daß man, wenn zwei nicht-äquivalente Funktionen, Φ, Φ gegeben sind, tatsächlich eine Zuordnung von Wertverläufen zu Funktionen in der Weise konstruieren kann, daß das Wahre und das Falsche mit Φ bzw. Φ verbunden werden. — Damit erweist sich im Übrigen P. Schroeder-Heisters „Identifizierbarkeitsthese" als ein Spezialfall von Aussage (4). 5 — Des weiteren folgt aus (5), daß es auch solche Zuordnungen gibt, die keinen Wahrheitswert als einen Wertverlauf auszeichnen. Daher sind die beiden Bedingungen für eine nicht-triviale Unterscheidung in der Klasse aller möglichen Zuordnungen von Wertverläufen zu Funktionen erfüllt, und man kann die Unbestimmtheit der Wertverläufe partiell überwinden, indem man bestimmten Funktionen eben die Wahrheitswerte als ihre jeweiligen Wertverläufe zuweist. Das Wahre und das Falsche sind nach Frege bestimmte und für sich existierende Gegenstände. Deshalb ist auf die beschriebene Weise gewissermaßen von außen ein Stück Bestimmtheit in die Definition der abstakten Wertverläufe gebracht. Dies war möglich, weil die Sachlage hier ein Modellfall der invarianztheoretischen Aussagen (4) und (5) ist. Die Vermutung, daß Frege so einfache mengentheoretische Tatsachen vor Augen hatte, wie wir sie hier zur Rekonstruktion seines Gedankenganges benutzt haben, mag manchen angesichts des diffizilen Textes des §10 verwundern. Vielleicht hatte Frege aber eine so klare Vorstellung von der Struktur der Definition durch Abstraktion und ihrer Anwendung bei der Einführung von Wert Verläufen, daß er in der Erwartung ebenso deutlicher Einsichten bei seinen Lesern nicht viel Mühe auf eine leichter verständliche Darstellung seines Vorhabens verwandt hat.
Literatur
Frege, Gottlob (1893), Grundgesetze der Arithmetik, begriffsschriftlich abgeleitet. 2 Bände; Jena 1893 und 1903. Neudruck Hildesheim 1962. Parsons, Terence (1987), On the Consistency of the First-Order Portion of Frege's Logical System. Notre Dame Journal of Formal Logic 28, 161-168. 5
Schroeder-Heister (1987).
Invarianztheoretische Überlegungen
137
Schroeder-Heister, Peter (1987), A Model-Theoretic Reconstruction of Frege's Permutation Argument. Notre Dame Journal of Formal Logic 28, 69-79. Thiel, Christian (1976), Wahrheitswert und Wertverlauf. Zu Freges Argumentation im §10 der „Grundgesetze der Arithmetik". In: Schirn, Matthias, Studien zu Frege I. Logik und Philsophie der Mathematik, Stuttgart-Bad Cannstatt. Thiel, Christian (1972), Gottlob Frege: Die Abstraktion. In: Speck, Josef (Hrsg.) Grundprobleme der großen Philosophen. Philosophie der Gegenwart /, Göttingen, 36.
ULRICH
MAJER
Frege's Non-Logical Basis of Arithmetic I suppose t h a t most philosophers would take the following confession of Hilbert as an outlandish remark of an arch-formalist. Hilbert maintains t h a t as a precondition for the foundation of logic and arithmeic something must already be given to us in our faculty of representation: certain extra-logical
discrete objects, which are intuitively present as
an immediate experience prior to all thinking. [ . . . ] While taking this point of view, for me the objects of number-theory are — in
exact
opposition to Frege and Dedekind — the signs themselves.1 This remark seems quite unfair in spite of Frege's semantic achievements — achievements which Frege had gained in the course of his effort to construct a purely logical foundation for arithmetic, and which have survived even t h e proof of t h e inconsistency of his Grundgesetze.2 Contrary to this widespread opinion, I think Hilbert was completely correct in maintaining not only t h a t arithmetic needs an extra-logical basis, as he p u t it, btyt also t h a t Frege's efforts were doomed to fail exactly because Frege ignored the basic principle: "Out of nothing comes nothing". This last remark is a bit provocative, because Frege always insisted t h a t his "logical calculus" is not a mere formalism but has a content·, hence t h e n a m e Begriffsschrift. So, why should it not be possible to develop arithmetic out of t h a t content? But still, Hilbert's opposition to Frege points in the right direction because — with or without content — it faces him with t h e following dilemma: Either arithmetic is based on some extra-logical content, or Frege's Grundgesetze
have no basis at all — which means in any case that
logicism fails.3 'Hilbert (1922, 162), the translation and the italics are mine. AImost every philosopher today dealing with Frege feels obliged to utter some such remark; even such a careful and moderate reviewer as C. Parsons judges Hilbert's critique of Frege as "unqualified"; Parsons (1965, 202) — Abbreviations are explained at the end. 3 By logicism, I mean the hypothesis that all concepts, laws, and theorems specific for arithmetic can be inferred exclusively from the concepts and laws of logic. 2
Frege's Non-Logical Basis of Arithmetic
139
Now, Frege himself was the first to acknowledge this. When he could not find a substitute for his law V of Grundgesetze regarding the sameness of "value-courses", he gave up logicism as misconceived. In this respect, most philosophers followed him although they did not want to give up the other achievements of Frege's foundational work, particularly bis conception of "semantics" with its celebrated distinction of sense and reference, of thoughts and truth-values. Thus we have today the rather schizophrenic situation wherein we reject one of Frege's main doctrines, logicism, and retain the other, the semantics of sense and reference, as if both were completely independent of each other. 4 However, it seems to me that philosophers have been mislead by Frege's abandonment of logicism, because they have overlooked two important aspects of Frege's way out of Russell's paradox. First, Frege did not simply abandon logicism without substituting something different in place of it. He proposed instead geometry as another, and he hoped more profound, source of arithmetical knowledge. 5 This shows, in my opinion, that in Frege's view, logicism and the semantic foundation of logic were interrelated, because once he had to give up axiom V, he not only dispensed with logicism but also tried to find another, more reliable source of mathematical knowledge than the semantic notion of "Werthverläufe". 6 Second, and more important, Frege was aware that the kind of semantics he had proposed only had a pragmatic — or aesthetic if you like — but not a logical justification: it was proposed only in order to simplify the foundation of arithmetic. 7 This remarkable admission either has been forgotten or deliberately ignored today. I think the main reason why it has been left out is this: truth-value-semantics seems to be indispensable not only for a foundation of logic including arithmetic, but also for a proper understanding of language. Because Frege argued in the same direction, many philosophers believe they can dispense with logicism and preserve Frege's semantics as innocent with respect to the occurrence of inconsistencies.
4 A notable exception is Currie (1986,365), who separates the thesis of referentiality (1), t h a t to every concept corresponds an object, from that of logicism(2), t h a t our knowledge of arithmetic has a different source than that of geometry. He then suggets t h a t the rejection of (1) implies the rejection of (2), however not vice versa. 5 C f . Frege Erkenntnisquellen der Mathematik und der mathematischen Naturwissenschaften (1924/25). This late article never become published. But even if it had been published, it vould have been ignored by most mathematicians because it did not fit into the mathematical landscape of the time, the reduction of analysis to arithmetic, the so called arithmetization of analysis. In fact, it was rather the opposite, a geometrization of arithmetic. 6 I will explain in the next section why this notion was introduced and how it is related with the other semantical notions. 7 T h i s is witnessed by remarks in the preface to Grundgesetze, which are quoted at the end of this paper.
Ulrich Majer
140
It is one of the aims of this paper to change this impression by showing that Frege's system of logic and arithmetic was based primarily on "extralogical" notions and epistemological considerations, notions and considerations which, like axiom V, have lost their innocence by now, if they ever possessed it.
1
The transition from the Foundations to the Basic Laws of Arithmetic
To begin with, it is well known that Frege did not always hold a semantic position in the peculiar sense of the distinction between of sense and reference. In the Begriffsschrift he still had a more combinatory or syntactic approach. Therefore the questions arise: (i) When did Frege's semantics, in particular his distinction between sense and reference, occur for the first time? (ii) Why was it invented? And last but not least (iii) How was it justified? Let me deal with the first question quikly, because its answer is relatively uncontroversial, and then approach the more difficult questions, (ii) and (iii), simultaneously. They cannot be separated completely, because the cause of the semantic distinction is also part of its justification. T h e period in which Frege developed his distinction between sense and reference, between thought and truth-value, can be fixed rather precisely. It must have been after his book Die Grundlagen der Arithmetik appeared in 1884, and at most two or three years before the publication of his famous essays Function und Begriff and Uber Sinn und Bedeutung in the years 1891/92, because the years before Function und Begriff and Uber Sinn und Bedeutung we do not find the slightest trace of the distinction — neither in his published nor in his unpublished writings. Both the upper and lower bound are confirmed by Frege: 1) In a letter from Frege to Husserl from May 24. 1891, he says "In the Grundlagen I had not made still the distinction between sense and reference." 8 2) In the preface to the Grundgesetze Frege remarks that its late publication is due to "internal changes in my Begriffsschrift, which forced me to discard an almost completed manuscript." 9 With regard to the second question, why Frege has invented the distinction between sense and reference, we have to distinguish between those reasons named by Frege himself, and those which have been identified by later interpreters as part of Frege's development from Begriffsschrift to Grundgesetze. With respect to the latter there is relatively high agreement that it was Frege's failure to offer a definition of the, notion "Begriffsumfang" in pure logical terms which prompted the later development. Because Frege was 8 9
Frege 1983, Bd. 2, 76). Frege (1893, IX).
Frege's Non-Logical Basis of Arithmetic
141
aware that the lack of an appropriate definition undermined his a t t e m p t s to reduce cardinal numbers to extensions of concepts, and in this way to prove the thesis of logicism that numbers are nothing but logical objects 1 0 he introduced the notion of "Werthverlauf" to accomplish the definition. I call this the inner, objective cause for the later development of semantics, in particular Frege's distinction between sense and reference, and distinguish it from the reasons offered by Frege himself. With regard to this, Frege offers at the beginning of his essay Uber Sinn und Bedeutung a story about the relation of equality which — to my mind — leads the reader astray, insofar as Frege presents a reason for the distinction between sense and reference which is not the original cause — which came to him only later, after he had invented the distinction. The argument is roughly this: in an equation of the form "a = 6", the sense of a is different from that of 6, supposing α and b are different names, whereas their reference is the same, if the equation is true. Most readers, especially epistemologists, have accepted the story eagerly because it fits so nicely into the picture of Frege as a great philosopher. However, Frege was firstly a mathematician who would not have invented such a far reaching distinction just for epistemological reasons. Indeed, there was no need for such a distinction from a logical point of view, because Frege had already developed a well working theory of equality within the framework of his Begriffsschrift: if a and b are different names, designating a conceptual content, the equation "a = 6" says that a and b designate the same content independently of the distinctness of the names. 1 1 This theory, simple as it is, does essentially the same work as the later, more sophisticated theory of equality. This is not to say that the later theory is not an improvement on the former under an epistemological perspective. Indeed, the former has a weakness in this respect, because it can not explain why we use different names for the same content. The explanation had to be given quite separately. In fact, in Begriffsschrift, Frege gave three different explanations! The first muddled the difference between sign and content almost completely 12 ; the second offered an epistemological argument for the 10
Cf. Parsons (1965,183 ff), Brandom (1986, 279ff.) and Resnik (1986,178). C f . Frege (1879, 13-15). 12 The first explanation begins: "Die Inhaltsgleichheit unterscheidet sich dadurch von der Bedingtheit und Verneinung, dass sie sich auf Namen, nicht auf Inhalte bezieht." Once Frege has made this first mistake he tries to correct his error by an even greater absurdity: "Während sonst die Zeichen lediglich Vertreter ihres Inhaltes sind, so dass jede Verbindung, in welche sie treten, nur eine Beziehung ihrer Inhalte zum Ausdruck bringt, kehren sie plötzlich ihr eignes Selbst hervor, sobald sie durch das Zeichen der Inhaltsgleichheit verbunden werden" — the critics of Frege could not have argued in a more confused manner, but finally Frege's logical instinct gets the upper hand for he continues — "denn es wird dadurch der Umstand bezeichnet, dass zwei Namen denselben Inhalt haben." (italics are mine; Frege (1879, 13). u
142
Ulrich Majer
necessity of different names; the third pointed to the arbitrariness of names, given by definitions. In the theory of equality, as stated in Uber Sinn und Bedeutung, the explanation for the necessity of different names is built in as an immediate consequence of the distinction between sense and reference: objects can be identified in different ways and to every way we attach a name. This explanation is basically the same as the second explanation in Begriffsschrift. But once more, from a logical point of view there is no need for a distinction between sense and reference because first, the distinction between a sign and its designatum is sufficient to grasp the relation of equality, and second, there is no syntactical difference between the later and former theory of equality. Third, the epistemologicai consideration that we need different names for the same thing should play no role for Frege as a logician. The upshot of all this is that there must exist other reasons for the distinction between sense and reference than those put forward in the epistemologicai argument regarding equality.
2
The identification of concepts with functions
T h e true reasons come into sight when we take seriously what Frege says in the preface to the Grundgesetze, where he mentions the "progressions" of the Grundgesetze with respect to Begriffsschrift. After having indicated some minor changes with respect to the equality sign (changes which confirm my reading 1 3 ) he continues: The introduction of the course-of-values of functions is a vital advance, thanks to which we gain far greater flexibility. The former derivative signs can now be replaced by other, simpler ones, [...]. But the courses of values are also extremely important in principle; 13
Frege mentions that he has substituted the sign = of Begriffsschrift by the usual equality sign = of arithmetic. He justifies this with the remark: "Ich gebrauche nämlich das Wort 'gleich' in derselben Bedeutung wie 'zusammenfallend mit' oder 'identisch mit', und so wird das Gleichheitszeichen auch in der Arithinetik wirklich gebraucht". Next, he anticipates an objection relying on the difference between the right and left sign of an equation, and he rejects it with the remark "Der Widerspruch der sich hiergegen erhebt,wird wohl auf mangelhafter Unterscheidung von Zeichen und Bezeichnetem beruhen. Freilich ist in der Gleichung, 2 2 = 2 + 2 das links stehende Zeichen verschieden von dem rechts stehenden; aber beide bezeichnen oder bedeuten dieselbe Zahl." This last remark shows that a twofold distinction between sign and reference [instead of a treefold distinction among sign, sense and reference] is sufficient for the foundation of arithmetic. The lack of distinction between sign and designatum which Frege alludes to was his own mistake in Begriffsschrift ·, cf. previous footnote.
Frege's Non-Logical Basis of Arithmetic
143
in fact, I define Number itself as the extension of concept, and extension of concepts are by my definitions courses-of-values. Thus we cannot get on without them. 14 Here we approach the heart of the matter. In the Grundlagen Frege had argued that a number statement is a proposition about a concept, roughly that the number that belongs to a concept F is the extension of the concept "equal-numeral to F", but still he lacked a simple and precise characterization, what the extension of a concept is. "Extension" was, so to speak, an undefined primitive concept. But now, with the means of "Werthverläufe", he can give this definition in a straightforward manner: the extension of a concept F is uniquely determined by its valuecourse in the way that all and only those objects belong to the extension of a concept F for which the thought "a is F" is true, or — what means the same — for which the sentence "a is F" denotes the value true, where a is the name of an object. However, in order to form the idea of "Werthverläufe" Frege had to make a number of fundamental changes in his conception of judgement and judgemental-content, function and argument, and last but not least his meta-logical conception of concept and object. Although we do not know in which time-order these changes occurred to Frege, we can try to find out in which systematic order they stand. From a mathematical point of view the most important step is without doubt the identification of concepts and relations 15 with a certain type of functions, the so called truth-value functions. Today we have accepted these functions as the simplest and most elegant means for expressing the laws of logic, and we teach them to our students as an integral part of logic. But this was not the case in 1891 when Frege published Funktion und Begriff. One begins to imagine how strange the step was when one considers the unbelievable consequences that the identification of concepts with truth-value functions had. Not only did True and False became objects like numbers 1 6 but also the common sense meaning of concept-words was completely altered. T h e word "horse" does not designate the set of properties that horses typically posses, but a discrete two-valued function whose value is True if you put a real horse in its argument place and False otherwise. Isn't that a nice theory? But it becomes even more incredible if you think of functions, like mathematicians do, as unique projections or co-ordinations of all elements of one domain onto those of the same, or some other, domain, of horses onto truth-values. How do concepts do that (if they do it at all)? In 14
Frege (1893, I X / X ) . In f u t u r e I will only speak of concepts — instead of concepts and relations — regarding relations as 2-(or more)place concepts. 16 For a mathematician this is no problem, because he is prepared anyway to deal with ideal objects; cf. Majer (1993). But that concepts are functions is unusual even for him. 15
144
Ulrich M a j e r
the case of mathematical functions like addition or multiplication, we know how the projection is effected: there is a certain operation, like addition or finding the root of a number, of which a function is a general abstract description. But which operation is at work in the case of concepts? What should we do to find the truth-values of the concept "greater than"? Fill in some arguments, for example 5 and 4? This is not enough, neither for mathematical functions nor for concepts taken as truth-value functions! In any case, an additional operation is needed in order to obtain the value of a function for a given argument. But what operation is needed in the case of concepts? Frege claims we have to make a judgement! But, how is it possible in the case of descriptive concepts? 17 According to Frege, the action of judgement is the same for all sentences, regardless of which concept they entail. It is the transition from a thought (expressed by a sentence) to its truth-value. Hence, we have first to grasp the thought, before we can judge it. But how do we grasp the sense of the concepts "horse" or "greater than"? 1 8 Aha you argue, we have to compare the arguments 3 and 4 according to certain "rules". But which rules? In order to know the rules we must already know the meaning of the word "greater than". But its meaning — we are told by Frege — is not the traditional one but the truth-value function in question. Hence, we have gone full circle. Now one may object, my critique of the identification of concepts with truth-value functions is quite unfair, because Frege did not simply dismiss the traditional meaning of concept-words in favour of truth-value functions, but instead introduced a new semantic distinction, that between thought and truth-value. This enabled him to deal with both and to substitute the old meaning of conceptwords by the new category of sense, which in turn could be used to determine their reference. I cannot exclude this possibility, but I am utterly sceptical for two reasons. First, Frege does not say so! All he admits is that the former judgemental content has fallen apart into thought and truth-value. 19 But this is far less than maintaining that the new category of sense is a replacement for the old category of meaning. Second, 17 0 n e should be clear that the problem only exists for descriptive concepts like "horse" or "greater than". For logical concepts like negation or conjunction the problem does not arise, because these concepts have been defined as total functions from truth-values (and all other objects) to truth-values. Hence, once the truth-values are given, we know the value of the sentence by definition. But in the case of descriptive concepts, the situation is completely different, because we have no definitions in purely logical terms. 18 I suppose that the mathematical relation "greater than" is a descriptive logical concept. To do otherwise is to presuppose what has to be proven.
and not a
19 C f . Frege's letter to Husserl from May 24, 1891: "Was ich früher beurtheilbaren Inhalt nannte, habe ich nun in Gedanken und Wahrheitswert zerlegt" Frege (1983, Bd. 2, 96).
Frege's Non-Logical Basis of Arithmetic
145
even if Frege did say so, this does not prove that the distinction between sense and reference is "justified". How week its justification really is can be seen from the following arguments. First, the distinction between sense and reference is from a logical perspective superfluous, with one apparent exception, to which I will come in a moment. This is vindicated by the fact that most text-books of logic do not even mention the distinction, but only use what Frege calls the Bedeutung of an expression, that is objects and truth-value functions designated by names and concept-words — nothing else! Second, Frege never developed a "theory of sense" (again with one apparent exception) which could do real work, that is, which could be used to determine the reference of a descriptive expression. 20 He only offered some vague descriptions such as "der Sinn ist die Art des Gegebenseins" (of a reference), but never stated precisely what the kind of giveness for words like "horse" or "greater than" in fact is. How is the truth-value function named "greater than" given to us? T h e standard answer is by its truth conditions. But (1) this is not Frege's answer — except for logical concepts — and (2) this does not work for descriptive concepts like "greater than". What other possibilities exist? I myself have a certain opinion which I will explain later, but it is not relevant here. Yet what is relevant is the fact that Frege does not present an answer for descriptive concepts. From both arguments I conclude that the distinction between sense and reference, thought and truth-value, is, contrary to what one expects, not a logical but an epistemological one. This contradicts Frege's assertion in the preface of Grundgesetze that the distinction between sense and reference is the "result of a thoroughgoing development of my logical views." 21 We will consider in a moment what that "thoroughgoing development" is. For the time being it is sufficient to remark that Frege has indeed a very strong argument for his assertion that the distinction between sense and reference is a consequence of the development of his views on logic. His argument is linked with the phenomenon of indirect speech: indirect speech can only be grasped correctly if we distinguish between sense and reference, between thought and truth-value, because "the thought which is otherwise the sense of the sentence, becomes in indirect speech its reference." 22 I must admit that this argument had me convinced for a long time, because it seemed to rest on an undubitable linguistic fact: 20
This is denied by R. Brandom, who in a certain way defends the opposite view: Frege's theory of sense, properly interpreted, is exactly that the sense of an expression is determined by the the role of that expression in logical deductions — its "contribution to the inferential potential of sentences containing it". [Brandom (1986, 279 ff.)] Althoug, I find this proposal very interesting, I doubt that Frege held this view once he had made the distinction between sense and reference. 21 Frege (1893, X). 22 Frege (1893, Χ).
146
Ulrich Majer
a change of the object we are talking about in direct and indirect speech. There is a clear difference whether I use or mention a thought or a sentence. Take for example the sentences "the orbits of the planets are circles" and "Kopernicus believed that the orbits of the planets are circles." T h e first is definitively false whereas the second is true — given what we know of Kopernicus. And this is so quite independently of the truth-value of the that-clause; the sentence "Kopernicus believed that . . . " remains true — if it is true — independent of what Kopernicus believed is true or false. This seems to show that not the truth-value but the "content" of the that-clause, the thought, is the object we are talking about in indirect speech. But does the distinction of sense and reference really follow from this argument with logical necessity? Is the distinction forced on our minds with inevitable consequence? I think not. In order to see why not, one has to become aware that Frege's argument depends on a presupposition which is basically woven into his semantic considerations. Once Frege had made the decision to identify concepts with truth-value functions, and consequently the reference of sentences with truth-values, he was forced to introduce a new type of referential objects, because truth-values and truth-value functions were obviously not the right kind of objects in indirect speech, as Frege himself had argued so convincingly. Hence, Frege introduced the thought expressed by a sentence as that to which we refer in indirect speech.
3
The non-logical character of the distinction
So far so good. But what is the force of the argument of indirect speech if one does not share Frege's presupposition that the meaning of a concept word is a truth-value function and, hence, the meaning of a sentence is a t r u t h value? If one instead supposes in good old fashion that the meaning of a sentence is a thought and, accordingly, that the meaning of a concept word is a concept in the traditional sense, i. e. a concept-word designates a "bundle of properties" characteristic for the objects falling under the concept? I suspect that in this case the force of the argument almost crumbles to zero because it is the same thought or sentence that we use in direct and mention in indirect speech. There is no need for switching the object of reference as in Frege's case, because the difference is only a difference of explicitness with respect to the propositional attitude of the speaker (or somebody else): if I assert "2 + 2 = 4" or if I say "I assert that 2 + 2 = 4", the object of the assertion is the same in both cases; only the grammatical form of assertion is different. In the second sentence, I say explicitly what I do implicitly in the first. Frege was mislead by the fact that in most languages(?) assertions have a special grammatical form of their own, the indicative sentence. But this
Frege's Non-Logical Basis of Arithmetic
147
does not essentially separate assertions from other prepositional attitudes like belief and doubt. Now, one might object that Frege's aim was a foundation of logic and that for this reason he had to ignore propositional attitudes and to take truth-values as the proper objects of indicative sentences. This, however, is precisely the question: whether truth-values and truth-value functions belong to the meaning of sentences and concept-words or only to the act of judgement. The first choice cannot be justified by introducing a further distinction — that between sense and reference, between thought and t r u t h values. T h a t would be question begging, because the later distinction is only a consequence of the former very problematic decision to use t r u t h values and truth-value functions as the meaning of sentences and conceptwords. But no decision can be justified by its consequences alone if no independent evidence for the consequences is available. Hence, the question arises, of whether Frege has arguments for the distinction between sense and reference which are independent of his decision in the first place to identify the meaning of sentences with truth-values? At first glance it seems as if Frege has such an argument, because he links the distinction of sense and reference with a change in his view of logic, the already mentioned "thoroughgoing development" of his logical views. W h a t is the nature of this development, and does it entail an argument for the distinction between sense and reference, which is really independent of the first presupposition? I do not think so, because the "thoroughgoing development" which Frege mentions is just the decision to identify concepts with truth-value functions and, hence, the reference of sentences with t r u t h values. Earlier I had distinguished two components in that whose external form is an assertive sentence: 1) the acknowledgement of the truth, 2) the content which is acknowledged as true. The content I called judgeable content. This has fallen apart now for me into that which I call thought, and that which 1 call truth-value. 23 There is no further justification — at least I was unable to find one — than the pragmatic or aesthetic argument of simplicity and distinctness, that this step (together with the introduction of value-courses), facilitates and sharpens the foundation of arithmetic. How much simpler and sharper everything becomes by the introduction of truth-values, only detailed acquaintance with this book can show. These advantages alone put a great weight in the balance in 23
Frege (1893, X); my translation.
Ulrich Majer
148
favor of my own conception, which indeed may seem strange at first sight. 24 In order to prevent possible misunderstandings let me close with the following remark: there is nothing wrong with Frege's p r a g m a t i c argument. Indeed, simplicity is a merit of a theory! But one should be aware t h a t simplicity entails a conventional element. Once this is clear, we are free to change Frege's semantic foundation of logic and arithmetic in favour of other proposals, for example a "proof-theoretic" approach — without any semantics in Frege's style. This is exactly what Hilbert did, because he correctly recognized t h a t Frege's semantic approach was only a means to an end — not a logical necessity.
References Brandom, Robert (1986), Frege's Technical Concepts. In: Haaparanta, Leila/Hintikka, Jaakko (eds.) (1986), Frege Synthesized, Reidel, Dordrecht, 253-295. Currie, Gregory (1986), Continuity and Change in Frege's Philosophy of Mathematics. In: Haaparanta, Leila/Hintikka, Jaakko (eds.) (1986), Frege Synthesized, Reidel, Dordrecht. 345-373. Frege, Gottlob (1879), Begriffsschrift. Eine der arithmetischen nachgebildete Formelsprache des reinen Denkens, Louis Nebert, Halle a. S. Frege, Gottlob (1884), Die Grundlagen der Arithmetik, Koebner, Breslau. Frege, Gottlob (1891), Function und Begriff. Vortrag gehalten in der Sitzung vom 9. Januar 1891 der Jenaischen Gesellschaft f ' u r Medicin und Naturwissenschaft, Hermann Pohle, Jena. Frege, Gottlob (1892a), Uber Sinn und Bedeutung. Zeitschrift für Philosophie und philosophische Kritik 100, 25-50. Frege, Gottlob (1892b), Über Begriff und Gegenstand. Vierteljahrsschrift für wissenschaftliche Philosophie 16, 192-205. Frege, Gottlob (1893), Grundgesetze der Arithmetik, 1. Band, Pohle, Jena. Frege, Gottlob (1969), Funktion, Begriff, Bedeutung, In: Patzig, Günther (ed.), Vandenhoeck & Ruprecht, Göttingen; contains Funktion und Begriff, Uber Sinn und Bedeutung, Uber Begriff und Gegenstand. Frege, Gottlob ( 2 1983), Hermes, Hans/Kambartel, Friedrich/Kaulbach, Friedrich (Hrsg.), Frege, Gottlob, Nachgelassene Schriften, Meiner, Hamburg 1983. Haaparanta, Leila/Hintikka, Jaakko (eds.) (1986), Frege Synthesized, Reidel, Dordrecht. Hilbert, David (1922), Neubegründung der Mathematik, Abhandl. aus dem Math. Seminar der Hamburger Universität, Bd. 1, 157-177. Majer, Ulrich (1993), Hilberts Methode der idealen Elemente und Kants regulativer Gebrauch der Ideen, Kant-Studien 84, Heft 1, 51-77. 24
Frege (1893, X).
Frege's Non-Logical Basis of Arithmetic
149
Parsons, Charles (1969), Frege's Theory of Numbers, in: Black, Max (ed.) Philosophy in America, George Allen k Unwin, London. Resnik, Michael (1986), Frege's Proof of Referentiality. In: Haaparanta, Leila/ Hintikka, Jaakko (eds.) (1986), Frege Synthesized, Reidel, Dordrecht, 177-196.
PAUL RUSNOCK
Remarks on the Frege-Hilbert Dispute The impact of Hilbert's Foundations of Geometry , like that of Euclid's Elements before it, has been so great that it has relegated most of its competitors to obscurity. Among the casualties of this has been Frege, who from the beginning strongly opposed many of Hilbert's formulations. Because Frege's understanding of geometry incorporated certain Kantian elements, his criticisms of Hilbert have frequently been dismissed with disbelief, impatience, or abuse. Toretti, surveying the exchanges with Hilbert, finds in Frege "a lack of understanding of the nature of logical consequence that is indeed astounding in the founder of modern logic."1 Coffa writes that Frege, due to his logical and semantic commitments, fundamentally misunderstood the nature of geometry. 2 And Freudenthal, less charitably inclined, classes Frege among the "Boetians," "conceited people who claimed to prove that Gauss, Riemann, and Helmholtz were blockheads." (He adds: "I have never understood why he is so highly esteemed today.") 3 Frege's opinions on geometry are indeed something of a mixed bag. On the one hand we find claims that Euclidean geometry ( EG) is synthetic, a priori, founded on pure intuition, and applies to physics via the mechanisms of transcendental idealism. 4 It is notorious that these opinions can be maintained only at a great price; it is perhaps not so well known that Frege himself had in his hands the means to overturn them. That he did not do so may have some hidden meaning, but a plausible conjecture is that he simply never examined them with the same care shown in his investigations of arithmetic. Frege's criticisms of Hilbert's project are, however, primarily methodological, and are entirely separable from his properly geometrical opinions. Once this separation has been effected, his methodological points are eminently reasonable given only a single assumption, namely, that the concepts of successful scientific theories are perfectly definite. 5 *
'Toretti (1978, 251). Coffa (1986; 1991, Ch. 7). 3 Freudenthal (1962, 618, 613). See also Scholz(1961, 222); More pointed still, Toth (1984, 107). 4 See e.g. Frege (1959, 101, 20, 35-6, ); Frege et al. (1971, 6-7, 14, 15, 23, 81, 141); Frege(1979, 168-9, 204, 205, 244, 247). 5 Cf. Frege (1966, II, §56). 2
Remarks on the Frege-Hilbert Dispute
151
In the Foundations of Arithmetic, Frege acknowledges his debt to Kant: "by calling the truths of geometry synthetic and a priori, he revealed their true nature." The truth of the axioms of geometry is grounded in the pure intuition of space, the appeal clearly being to what "everyone sees." 6 Space, moreover, "belongs to appearance," and not only is everything actual subject to the laws of E G , so too is the merely imaginable (which confirms E G ' s a priori status). The axioms, and hence the propositions, of E G are synthetic, because any one of them can be denied without engendering a conceptual contradiction. 7 One can therefore think consistently about non-Euclidean geometries ( N E G s ) ; but since these cannot be intuited, they fail to hold for any possible experience, and thus are of only limited importance for science. On one important point, the two differ: Kant had maintained that intuition was necessary throughout geometry because geometrical concepts alone could not support the inferences customarily made. For Frege, the role of intuition is much more restricted: intuition establishes the truth of the axioms, but the rest follows from strictly logical inference. 8 Later, in the course of his dispute with Hilbert, Frege would modify his understanding of the independence of axioms. Apart from this point, though, I am aware of no evidence that he ever questioned his basic commitments on geometry. At the same time, there are numerous indications that he held to this understanding throughout his life.9 While Frege's views reflect the conventional wisdom of his time, they are surprising in light of his other writings. He had, after all, produced decisive criticisms against the appeal to intuition in arithmetic, and many of these apply with only minor changes to geometry. He had argued, for example, against the use of intuition to establish individual arithmetic formulae because intuition fails us for large numbers and because a firm line cannot be drawn between the large and the small. 10 Such arguments of scale are effective against the appeal to intuition in geometry as well: Euclidean lines may be produced or divided ad infinitum, but no intuition will support all such constructions: who could intuit a polygon of 2 1000 sides, or a triangle whose legs stand in the ratio 1 : 2 1000 ? The Archimedean axiom may seem plain to the eye for some magnitudes, but it is far from being so for all. And, as Gauss had noticed almost immediately upon acquaintance with Bolyai-Lobachevsky geometries, the difference between a flat space and one of suitably small curvature would be undetectable by our eyes and instruments. 11 Infinitely many different geometries are thus compatible with the deliverances of intuition — hardly the 6
Frege (1959, 20; 1984, If). Frege (1959, 101, 20); Frege et al. (1971, 141). 8 Frege (1959, 23-4; 1979, 204f). 9 See, e.g., Frege et al. (1971, 6-7, 14, 15, 23, 81; 1979, 168-9, 204, 205, 244, 247). 10 Frege (1959, 5-6). "Toretti (1978, 63f). 7
Paul Rusnock
152
univocal result claimed. The question of intersubjectivity poses even greater problems, ones which Frege had himself described with great precision. He asserts that space intuition is purely subjective. Yet E G is claimed as an objective science, the same for all. Frege had argued that ...it is impossible to ascribe to every person his own number one; for in that case we should first have to investigate the extent to which the properties of these ones agreed, and if one person said "one times one is one" and the next said "one times one is two", we could only register the difference and say: your one has one property, mine has another. There could be no question of agreement as to who was right, or any attempt to correct anyone; for they would not be speaking of the same object. 12 T h e same, he writes elsewhere, holds for geometrical objects: When a straight line intersects one of two parallel Unes, does it always intersect the other? This question, strictly speaking, is one that each person can only answer for himself. I can only say: so long as I understand the words "straight line", "parallel", and "intersect" as I do, I cannot but accept the parallels axiom. If someone else does not accept it, I can only assume that he understands these words differently. Without pausing, however, he continues: Hence a thought which contradicts the axiom of parallels cannot be taken as a premise of an inference. But a true hypothetical thought...could be taken as a premise. 13 How is this passage from merely subjective conviction to objective validity to be justified? Frege does not present arguments to this effect, and indeed, he had elsewhere indicated his desire to steer clear of such questions. 14 Instead, he contents himself with the supposed universal assent of all humans to the propositions of E G . This may be attested by words, but also by actions: ...there is something objective in [space] all the same; everyone recognizes the same geometrical axioms, even if only by his behaviour, and must do so if he is to find his way about the world. 15 12
Frege Frege 14 Frege 15 Frege 13
(1964, (1979, (1964, (1959,
16). 247) 15). 35-6).
Remarks on the Frege-Hilbert Dispute
153
The appeal to experience is unpromising: to find one's way about, one need not subscribe to any theory about the structure of astronomical or submicroscopic space, only to some rough ideas about the parts which are relatively accessible and medium sized in relation to one's body. To develop the science of day-to-day human navigation is an interesting problem — but it is clear from the start that this project would never lead one to EG. Much more hopeful, at least initially, is the possibility of achieving intersubjectivity through verbal communication. Sufficiently developed, such communication would give us an exhaustive account of the properties of space. Two additional problems arise from this, however. First, the conceptual content would have to be sufficient to determine a unique model—and in this case, by "unique" one cannot mean up to isomorphism. For one seeks to determine a unique object or set of objects. Short of this, it could not be said for certain that the various parties were speaking of the same things. Frege recognized this possibility. Suppose two people agree an a set of sentences which involve the predicate names Pi, P[, P^, ..., Pn, P'n j with the following property: the dual of every accepted sentence (i.e. the sentence obtained by substituting P¡ for P¡, i=l,...n, and vice versa, is also an accepted sentence (Frege's example is from projective geometry).16 Then there is no means of telling, given only this conceptual apparatus, if the two attach the same names to the same objects. In general, the goal of attaining intersubjectivity by this means eludes us as long as a class of agreed upon sentences admits of more than one model. Second, even supposing ( per impossibile) an absolutely categorical characterization to be agreed upon, one may justly ask what purpose intuition serves?17 It is clear from the foregoing that Frege was himself in a position to produce decisive criticisms against his own opinions on geometry. If this were not enough, certainly the sterility of Kant's theory of space should have been. Frustrated perhaps with what seemed to be idle speculation from areas of successful science, Kant had aimed to bar conceptual tinkering from the foundations of geometry. Whether or not this impulse was a salutary one in his circumstances might be disputed; by Frege's time, however, it had revealed its emptiness. Geometry was not so lightly to be passed over as a settled matter; investigations, even at preliminary stages, of the conceptual links between physics and geometry had produced much more of interest than the appeal to intuition and the highly implausible transcendental idealism which accompanied it could ever hope to. No wonder, then, that Frege's contemporaries were in increasing (if still small) numbers com16
Ibid. Indeed, at this point the existence of distinct, subjective, space intuitions would contradict the principle of the identity of indiscernibles. 17
154
Paul Rusnock
ing to reject this widely received view. For his part, Frege does not appear to have absorbed enough of the new developments to lose faith in the traditional account; not noticing, either, the internal incoherence of his own opinions, he could only see his contemporaries' interest in non-Euclidean geometries as the height of confusion, perversity, or even madness (in a draft from around the turn of the century, he likens N E G s to alchemy). 18 Various explanations, psychological, historical, political, might be offered for Frege's steadfast belief in E G . Let us simply note that Frege apparently did not examine his opinions on geometry very closely, and that these views were carried into his dispute with Hilbert, to which I now turn. *
Hilbert's approach to E G in the Foundations is so familiar that little comment is required. Although the axioms are said to "express fundamental facts of our intuition," Hilbert from the start abjures any appeal to what is seen. The primitive terms ("point", "between", etc.), rather than being presupposed as known, are said to be "defined" by the axioms in which they occur. The intention is clearly that the objects and relations described should be thought to have no properties other than those attributed to them by the axioms. The consistency of the entire axiom set is shown by specifying an interpretation of the primitive terms in which all the axiom statements are valid. The independence of a given axiom from the others is shown by similar means: if A\, ..., An are the axioms, one shows that Ak is independent from the rest by specifying an interpretation in which -»A^and 1 < i < τι, i fc, are all valid; this result, combined with the proof of the consistency.of the whole set, establishes the claim. At the same time, each one of these interpretations shows the consistency of a non-standard geometry. These geometries are said to be "true", and the objects defined by them are said to "exist" in a sense specific to mathematics. 19 Finally, the adequacy of the axiom set is indicated by proving certain important well known results within the system. Frege's reactions to Hilbert's work were rooted in his conviction that the primitive terms of E G had fixed referents and that its propositions were true. Given this understanding, he could not accept Hilbert's innovations. Perhaps the clearest way to see his objections is through a discussion of definitions. Hilbert had claimed that his axioms defined the terms which occurred in them. In Frege's view, they failed to do this in three important ways. First, the axioms fail to define the terms in isolation from one another. 20 If the terms "point", "line", "between", etc. were defined by the axioms, then it should be evident from these whether a 18 Frege
(1979, 169). et al. (1971, 12). 20 Frege et al. (1971, 18). 19 Frege
Remarks on the Frege-Hilbert Dispute
155
given object falls under the concepts so defined. But, as Frege notes, nothing of the kind occurs with Hilbert's axioms. How is one to determine, for example, given only the axioms, whether a given object is a point? The first axiom states that two distinct points determine a straight line. So we need to know also of some other object that it too is a point. Then we must also known what "straight line" means. If we could do all this, then we might be in a position to say of some object that it is a point. But it is not clear that this can be done, for in order to know if something is a "straight line", we will first have to know what "points" are. At best, the axioms define a complete system of objects and relations. 21 But here a second problem arises, for the axioms do not suffice to define a unique structure. If his axioms defined the terms "point", "line", "between", etc., then the references of these terms would be completely determined. Since the axioms are said to express facts of intuition, then perhaps they define that intuition. Yet Hilbert later stipulates that "point" is to be understood as an ordered pair of a certain subset of reals Ω. If the reference of the term "point" were already fixed by the defining axioms, such a stipulation would be superfluous. 22 Furthermore, by Hilbert's own admission, his axioms are satisfied by more than one system — for instance, in the case of plane geometry, by R2o. Unless it could attain absolute categoricity, Hilbert's attempt to define a unique system via a set of axioms cannot succeed. Finally, no partial set of Hilbert's axioms suffices to define the terms occurring in it. If, for example, one omits the parallels axiom, the term "straight line" acquires a different sense than would otherwise be the case. 23 Hilbert conceded this: After all, each axiom contributes something to the definition, and therefore each axiom alters the concept. "Point" is always something different in Euclidean, non-Euclidean, Archimedean, and nonArchimedean geometry respectively.24 For Frege this meant that Hilbert's independence proofs could not establish what Hilbert had claimed. For if the axioms define the concepts occurring in them, then his independence results can only be understood as showing that the concepts "point," "line", etc. which are defined by certain partial sets of his axioms are not the same concepts defined by the full set. To be sure, this is a sort of independence. But it is not the result sought, namely, the independence of the axioms of E G , i.e. those (if we follow Hilbert) defined by the complete set of 2
'Frege Frege 23 Frege 24 Frege 22
et et et et
al. al. al. al.
(1971, (1971, (1971, (1971,
12); cf. Resnik(1974, 393f.), Toretti(1978, 249f.). 36-37). 27f.). 13).
156
Paul Rusnock
axioms. Frege accordingly could not accept Hilbert's project as an adequate account of E G . But he was far from rejecting it outright. Instead, he proposed a reinterpretation of the Foundations as a higher-order, purely logical structure. E G is assumed to be a body of true propositions whose concepts are perfectly definite. Because of the objections noted above, Hilbert's axioms cannot define these primitive terms. But what, if anything, do they define? Hilbert's practice of "interpretation" shows that his concepts "point", "between", etc. are second level concepts, under which particular firstlevel concepts fall. 25 When, for example, he "constructs a geometry" which satisfies all the axioms, he does not specify a class of objects, but rather a collection of first-level concepts — for example, the first level concept "ordered pair of elements of Ω" is shown to fall under the second level concept "point" as defined by Hilbert's axioms. 26 (As noted above, one must also specify first-level concepts for "line", "between", etc.) In Frege's view, Hilbert's system is constructed in the following manner. One first begins with E G in the traditional sense. Each primitive concept, e.g. "point", applies to objects. For each of these one now substitutes a variable, whose allowable inputs are of the same semantic type as the replaced concept. A proposition of E G , for instance, that for any two distinct points, there is a straight line which contains them, is thus transformed into the following: V x V y ( ( P x APy
Α(χφ
y)) -y 3 z{Lz Λ Ixz Λ I y ζ))
The concepts "point", "line", and "lies on" (P,L,I) occur as free variables. Thus Hilbert's axioms are not propositions. Instead, they are "pseudopropositions", with free variables among "point", "between", etc. 27 A theorem in Hilbert's usage is a pseudo-proposition containing free variables among "point", "line", etc. which has been proved from the pseudo-axioms. Frege notes that, since the axioms contain free variables, they cannot be used to discharge antecedents in conditional propositions.28 Hilbert's theorems do indeed correspond to theorems in Frege's sense, but in this case logical ones. Hilbert's claim that a proposition Τ is a theorem of E G is therefore interpreted as stating that, for all first-level concepts substituted for the variables P, L, I,..., if they satisfy the conjunction of the pseudo-axioms, then they satisfy T . Hilbert's E G is the collection of the provable universal closures of such conditional formulas with the conjunction of the complete
2 5 Frege et al. (1971, 83f.); for Frege's views on higher order concepts see Frege et al.(1971, 19); Frege(1959, §53); Frege(1964, §§21-22). 2 6 I t is assumed here that real numbers are objects in Frege's sense. 2 7 C f . Hilbert and Bernays (1968, 7). 2 8 Frege et al. (1971, 86).
Remarks on the Frege-Hilbert Dispute
157
set of pseudo-axioms as antecedent.29 With this interpretive apparatus in hand, Frege is able to state Hilbert's consistency and independence results as theorems of logic. The consistency proof establishes that some set of first-level concepts satisfies the axioms, and from this it is inferred that the second-level axioms will not allow a contradiction to be derived, i.e. that no universal closure of a conditional with the axioms as antecedent and (0=1) as consequent is provable. The independence proofs show that, for each pseudo-axiom A^, there exists a system of first-level concepts which upon substitution satisfies ->Ak and Ai, 1 < i < η, i φ k. ¿From this, and the consistency result, one infers that the universal closures of the conditionals with the remaining axioms as antecedent and the given axiom (or its negation) as consequent are unprovable. One can also now understand Hilbert's use of the terms "truth" and "existence": a set of pseudo-axioms is said to be "true" in Hilbert's sense if some set of first-level concepts, when substituted for the free variables in the pseudo-axioms, renders the entire set valid. Hilbert's notion of "existence" applies to sets of first-level concepts which upon substitution render a set of pseudo-axioms true, and only indirectly to the objects and relations falling under these first-level concepts. Seen in this light, Hilbert's results are not geometrical at all, but concern only the purely logical second-level analog of EG. Frege accordingly rejects Hilbert's claims to have proved something about EG itself. In the case of consistency, for example, Hilbert shows that the second level system is satisfied by some set of first-level concepts other than those of EG. This establishes the consistency of the second-level system, but not of the first-level system EG. To show that, Frege thought, could only be done by establishing the existence of objects which fall under the first- level concepts of EG. Hilbert's independence proofs fare no better in his opinion. They establish the independence of the second, but not the first-level axioms. To show the independence of a firstlevel axiom of EG by Hilbert's method, one would have to adduce objects falling under the first-level concepts "point", "line", etc. which do not satisfy the axiom. But this is impossible, he argues, because the axioms are true. 30 In a final note, Frege suggests another way to approach the problem.31 We suppose, first of all, a perfect language, in which each word has a definite sense. We also suppose that whenever a word is substituted in a proposition for a word of the same type, a proposition results. Suppose now that we have a mapping from the set of words onto itself (with preservation of type), in which logical words are mapped to themselves. This, mapping induces a mapping of propositions onto propositions, and of sets of propositions onto sets of propositions. A true proposition G will then be independent of a set 29
Frege et al. (1971, 28f., lOOf.). Frege et al. (1971, 15). 31 Frege et al. (1971, 103f.). 30
158
Paul Rusnock
of true propositions Ω if under some such mapping all the members of Ω are sent to true propositions, but G to a false one. Apparently Frege did not pursue these ideas any further. But the new framework provided a way for him to understand the relative consistency proofs so prominently used for N E G s without abandoning his methodological commitments or his belief in the t r u t h of E G . He was able to maintain some of Hilbert's most fruitful techniques without accepting what were for him the more dubious elements of formalist mathematics. *
Hilbert's Foundations of Geometry suggests that the primary goal of foundational studies (at least for the case of geometry) is to precisely specify an abstract structure which captures all the significant content of a science. Judging by the reception of his work, we must conclude that many have thought that Hilbert did precisely that for the case of E G . But, since Hilbert's system does not pin down a unique object (and, in particular, does not isolate either intuitional or physical space), we must conclude that the traditional views on geometry as somehow concerning physics do not form part of the significant content of E G . This is not to say that applications were irrelevant to Hilbert—he obviously understood the centrality of E G in classical physics. Rather, it seems that for him the search for a perfect fit between geometry and physics must be abandoned as fruitless: ...the application of a theory [of mathematics] to the world of appearances always requires a certain measure of goodwill and tact: that for points, one substitute bodies as small as possible; for straight lines, lines as long as possible, perhaps light rays, etc. Nor can one be too exacting in examining the propositions, for after all, they are only propositions of the theory. 32 In other words, conceptual analysis can proceed only so far and no further: at some point, an informal mediation will be required to establish contact with an intended interpretation. For Frege, such views were not tenable: the notioñ of "pure" mathematics, independent of applications, is based on a misidentification—what is mistakenly called pure mathematics is nothing other than a part of logic. Foundational studies should rest on concepts which are perfectly definite, and the applications of a branch of mathématics should become clear from its foundations. 3 3 If one were to fall short of this, 32
Frege et al. (1971, 14). Dummett (1991, 293f.) foundations. 33
has properly stressed this aspect of Frege's views on
Remarks on the Frege-Hilbert Dispute
159
one would have to conclude that one did not have in hand the conceptual resources to secure the foundations of the given science. It is clear that Frege did not feel this to be the case concerning geometry. Accepting, by and large, Kant's account of the foundations of geometry and its applications, he saw no reason to doubt a perfect fit between E G and physical space. Accordingly, he never saw fit to question his judgment that N E G s were of vanishingly small importance for science. These views, and what follows from them (i.e. the summary dismissal of large parts of his contemporaries' work on geometry as worthless), have tended, I believe, to put commentators squarely against Frege. His logical acumen might be granted, and some of his points acknowledged as improvements on Hilbert's less precise statements, but because of his implacable opposition to formalist mathematics and to N E G s , he comes across as one who stood in the way of the progress of science. These views seem strained. Certainly Frege was tethered much too firmly to Kant's account of geometry, an account which cannot survive the scrutiny which his own methodology could provide. And doubtless because of this he was led to underestimate the extent to which geometry was still a very much open question, and thereby the importance of framework that Hilbert was working to describe. Frege's Kantian commitments on geometry have been examined above and found wanting. But these views are entirely separable from his substantive logical contributions to the understanding of Hilbert's project. Here, precisely where one would expect it, Frege's views bear considerable weight. His understanding of the logical structure of Hilbert's Foundations—his distinction between first and second level concepts, his description of abstract axiomatics, his versions of the independence results, and his sketch of a logic of semantic consequence— is in many points more advanced than that which Hilbert himself possessed, and indeed, some of his distinctions point to areas of important research (for example, the problem of determining relations between various types of consequence). 34 Frege's reconstruction of Hilbert's project can be worked through to save all the relevant phenomena, and there is no intrinsic mathematical reason to prefer Hilbert's formulation to his. To be sure, once the traditional faith has lapsed, and the belief that we all have a direct grasp of geometry as a body of somehow necessary truths has been abandoned, the search for certainty may well be abandoned as fruitless, and the first level of Frege's structure seen as so much metaphysical underbrush whose clearance can only be desirable. Hilbert's understanding can then be applauded as drawing attention to just those areas where mathematical methods can succeed. 1 have nothing to say here concerning this view — I merely point out that this choice belongs not to the realm of fact, but to that of convention. If the logical views of Frege are rejected along with the geometrical, 34
Cf. Resnik (1974, 393; 1980, 105f.); also Kambartel (1976, 216).
160
Paul Rusnock
perhaps it is because they are somehow felt to be part and parcel of an outmoded picture of science 35 — but if there is a connection here, it is surely a psychological and not a logical one.
References
Coffa, A. (1986), From geometry to tolerance: sources of conventionalism in nineteenth century geometry, in: Colodny, R. (ed.), From Quarks to Quasars: Philosophical Problems of Modern Physics , Pittsburgh, University of Pittsburgh Press. Coffa, A. (1991), The Semantic Tradition From Kant to Carnap: to the Vienna Station , Cambridge University Press, Cambridge. Dummett, M. (1991), Frege: Philosophy of Mathematics, Duckworth, London. Frege, G. (1959), The Foundations of Arithmetic, J.L. Austin (tr.), Basil Blackwell, Oxford. Frege, G. (1964), The Basic Laws of Arithmetic, M. Furth (ed. and tr.), Univ. California Press, Berkeley. Frege, G. (1966), Grundgesetze der Arithmetik, Olms, Hildesheim. Frege, G. et al. (1971), On the Foundations of Geometry and Formal Theories of Arithmetic, E.-H. W. Kluge (tr.), Yale Univ. Press, New Haven. Frege, G. (1979), Gottlob Frege: Posthumous Writings, Hermes, H./Kambartel, F./Kaulbach, F. (eds.), P. Long/R. White (tr.), Basil Blackwell, Oxford. Frege, G. (1984), Collected Papers on Mathematics, Logic, and Philosophy, B. McGuiness (ed.), M. Black et al. (tr.), Basil Blackwell, Oxford. Freudenthal, H. (1962), The main trends in the foundations of geometry in the 19th century, in: Nagel, E./Suppes, P/Tarski, A. (eds.) Logic, Methodology and Philosophy of Science Proc. of 1960 Intl. Congress, Stanford Univ. Press, Stanford, 619-20. Hilbert, D. (1902) The Foundations of Geometry [1899], 1st ed., E. Townsend (tr.), Open Court, La Salle, D. Hilbert, D./Bernays, P. (1968), Grundlagen der Mathematik I, 2nd ed., Springer, Berlin. Kambartel, F. (1976), Frege und die axiomatische Methode. Zur Kritik mathematikhistorischer Legitimationsversuche der formalistischen Ideologie, in: Schirn, M. (ed.), Studies on Frege I: Logic and Philosophy of Mathematics, Fromann-Holzboog, Stuttgart/Bad Cannstatt, 215-228. Resnik, M. (1974), The Frege-Hilbert controversy, Philosophy and Phenomenological Research 34, 386-403. Resnik, M. (1980), Frege and the Philosophy of Mathematics, Cornell Univ. Press, Ithaca. 35
Cf. Coffa (1991, 132-33; 1986, 8f., 37f.).
Remarks on the Frege-Hilbert Dispute
161
Scholz, H. (1961), Mathesis Universalis: Abhandlungen zur Philosophie als strenger Wissenschaft, Hermes, H./Kambartel, F. (eds.), B. Schwabe, Basel/Stuttgart. Toretti, R. (1978), Philosophy of Geometry from Riemann to Poincaré, Reidei, Dordrecht. Toth, I. (1984), Three errors in the Grundlagen of 1884: Frege and non-Euclidean geometry, Proceedings of the international Frege conference 1984 ed· G. Wechsung, Akademie Verlag, Berlin.
T E I L II PHILOSOPHIE UND SEMANTIK
HANS
JULIUS
SCHNEIDER
Begriffe als Gegenstände der Rede Das T h e m a meines Vortrage werden wohlbekannte Schwierigkeiten sein, in die sich Frege dort hineinmanövriert, wo er erläutert, was es heißt, über Begriffe zu sprechen. Worum es sich dabei handelt, läßt sich a m leichtesten ins Gedächtnis rufen mit Hilfe des folgenden kürzen Zitats aus seinem Aufsatz Uber Begriff und Gegenstand (1892). Dort heißt es: Es kann ja nicht verkannt werden, daß hier eine freilich unvermeidbare sprachliche Härte vorliegt, wenn wir behaupten: der Begriff Pferd ist kein Begriff, während doch z.B. die Stadt Berlin eine Stadt und der Vulkan Vesuv ein Vulkan ist. 1 Ich gehe davon aus, daß schon viele Leser vor mir das Gefühl h a t t e n , es müsse sich u m ein Scheinproblem handeln, in das sich Frege hier verwickelt habe, auch wenn es weder von ihm selbst noch seither auf eine einhellig als befriedigend akzeptierte Weise aus der Welt geschafft worden ist. Ich möchte hier nun zwei Dinge tun. Ich möchte erstens die Gelegenheit wahrnehmen, einen Vorschlag zur Auflösung dieses Problems (wenn Sie so wollen: zur Therapie' im Sinne Wittgensteins) in diesem Kreis zur Diskussion zu stellen. Einige Überlegungen dazu sind kürzlich zwar bereits publiziert worden, sie stehen aber im Kontext einer größeren sprachphilosophischen Untersuchung, von der ich nicht annehmen kann, daß sie der Mehrheit dieses Auditoriums bekannt ist. 2 Ich werde das Skelett meines Vorschlags hier also herauspräparieren und Ihren Einwänden aussetzen. Und ich möchte zweitens eine Reihe von Anschlußüberlegungen daran knüpfen, die über den Versuch einer Auflösung eines auf Frege beschränkten Spezialproblems hinausgehen und vielleicht erst die eigentliche Pointe, den Witz der ins Auge gefaßten Lösung deutlich machen. Ich hoffe, daß auf diese Weise auch meine Leser auf ihre Kosten kommen. Vorgreifend möchte ich Ihnen meine beiden Hauptthesen nennen: Ich werde erstens zu zeigen versuchen, daß die Probleme verschwinden, wenn m a n sich konsequent eine pragmatische' oder genauer, eine f u n k t i o n a l syntaktische' Lesart der Ausdrücke ,für einen Begriff stehen' und ,für einen Gegenstand stehen' zueigen macht. Und ich möchte zweitens aufzeigen, 1 2
Frege (1990a, 170 f.; Orig. Pag. 196 f.). Schneider (1992 a), vgl. Schneider (1992b) und Schneider (in Vorbereitung).
166
Hans Julius Schneider
wie sich daraus ein sehr weites Verständnis des Ausdrucks ,Gegenstand der Rede' ergibt, nach dem in vielen Fällen nicht die Sprache die Gegenstände benennt, die es unabhängig von ihr ,gibt', sondern nach dem die Verständlichkeit von innersprachlichen Verfahrensweisen darüber entscheidet, ob es bestimmte Gegenstände gibt oder nicht. Bei einer ,Analyse' der Sprache wäre die kritische Beurteilung solcher Verfahrensweisen entsprechend ein zentrales Thema.
1
Die Einteilung sprachlicher Ausdrücke unter begriffsschriftlichen Gesichtspunkten
Frege mußte es bei seinem Projekt der Entwicklung einer Begriffsschrift darum gehen, sprachliche Ausdrücke nach anderen als den herkömmlichen schulgrammatischen Gesichtspunkten einzuteilen. Er hatte gesehen, daß grammatisch gleichartige Ausdrücke semantisch-strukturell verschieden funktionieren können, und daß auch umgekehrt grammatisch verschiedene Ausdrücke semantisch manchmal gleichwertig sind. Die begrifflich-logische Ordnung komplexer sprachlicher Ausdrücke, um deren explizite und eindeutige Darstellung durch geeignete Zeichenformen es ihm ging, weicht also von der grammatischen Ordnung häufig ab. Wer in diesem Sinne eine Differenz zwischen der grammatischen und der begrifflich-logischen Struktur natürlichsprachlicher Sätze wahrnehmen kann, so sollte man meinen, müßte auch in der Lage sein, Kriterien zu formulieren, nach denen Ausdrücke unter begrifflich-logischen Gesichtspunkten klassifiziert werden müssen. Es gibt nun im Verlauf der Entwicklung von Freges Sprachphilosophie drei Ansätze dazu, solche Klassifikationen vorzunehmen und zu erläutern. Diese Ansätze sehe ich nicht als drei verschiedene nacheinander vertretene ,Theorien' an, sondern eher als verschiedene Akzentsetzungen, die allerdings nach meinem Verständnis auch eine zunehmende Klärung bringen. Den ersten Ansatz könnte man als den formal-syntaktischen' bezeichnen. Frege benutzt ihn in seinem Buch Begriffsschrift (1879) z.B. an einigen Stellen, wo er seine Unterscheidung zwischen ,Argument' und ,Funktion' erläutert, die die grammatische Unterscheidung zwischen Subjekt und Prädikat ersetzen soll. Sein Gesichtspunkt ist hier die Frage, welcher Teil eines Ausdrucks als veränderlich und welcher als fest betrachtet wird. Der erste heißt das Argument, der zweite die Funktion, und die Betrachtungsweise läßt sich frei wählen. Aber schon in der Begriffsschrift wird es im selben Zusammenhang deutlich, daß es ihm um mehr geht als auf diesem rein formalen Weg zu fassen ist. Dies zeigt sich daran, daß er sagt, das Argument stehe für einen Gegenstand, während die Funktion die Gesamtheit der Beziehungen
Begriffe als Gegenstände der Rede
167
ausdrücke, in der der Gegenstand stehe. 3 Der zweite Ansatz, Klassifikationsgesichtspunkte zur Sprache zu bringen, kann ,referenzsemantisch' heißen. Frege selbst hebt diese Art der Unterscheidung von der ersten durch seine Aussage ab, er habe früher nicht streng genug zwischen Zeichen und Bezeichnetem unterschieden und habe Aussagen, in denen es eigentlich um die Bedeutungen von Zeichen gehe, auf die Zeichen selbst bezogen. Aber wie ist dieser Unterschied präzise zu fassen? Es ist sofort plausibel, daß es bei Freges Fragestellung (nach den logischen Formen einer zu entwickelnden Begriffsschrift) nicht um ,bloße Zeichen' im Sinne von Spuren aus Druckerschwärze auf einem Stück Papier gehen kann. So soll man z.B. bei der Unterscheidung zwischen Argument und Funktion nicht auf willkürliche Weise eine Lücke in einem komplexen Ausdruck schaffen; soll dies sinnvoll geschehen, dann müssen dabei auch inhaltliche Gesichtspunkte eine Rolle spielen. Es geht also bei der Ausarbeitung einer Begriffsschrift u m mehr als um das, was Morris und Carnap später ,Syntax' nennen, nämlich um mehr als nur um formale Nachbarschaftsverhältnisse von als grafische Figuren betrachteten Zeichen, von deren Bedeutungsaspekt man in der Syntax (in diesem späteren Sinn) gerade absieht. Insofern geht es um semantische Fragen. Man könnte auch sagen: Es geht um komplexe Ausdrücke, insofern sie Zeichen sind. Ob diese Intention aber angemessen getroffen wird durch die traditionellen Vorstellungen folgende Formulierung, es gehe um ,das Bezeichnete' oder es gehe um das, ,wofür ein Ausdruck steht', wird im Verlauf der Entwicklung von Freges Gedanken für ihn selbst zunehmend fragwürdig. Wo Frege diese Ausdrucksweisen benutzt (auch wenn es nach seiner Terminologie um den Sinn, nicht um die Bedeutung geht), will ich von einem ,referenzsemantischen' Ansatz sprechen. Daraus ergibt sich nun die dritte und letzte Stufe auf dem Weg der Klassifikation von Ausdrücken. Ich möchte hier von einem ,pragmatischen' oder genauer von einem ,funktional-syntaktischen' Verständnis der Klassifikation sprechen. Es bleibt dabei, daß es bei der Herausarbeitung der Formen einer Begriifsschrift um inhaltliche Unterscheidungen geht, die erst in einem zweiten Schritt durch Formen sichtbar gemacht werden sollen. Insofern geht dies Verständnis hinter die zweite Stufe nicht zurück. Frege gewinnt auf ihr aber eine zunehmend sichtbare Distanz zu seinen referenzsemantischen Formulierungen. Wenn er nämlich davon spricht, daß es ihm bei der Erfassung begrifflich relevanter Unterschiede zwischen den Zeichen auf inhaltliche' und nicht nur ,formale' Gesichtspunkte ankommt, drückt er dies nicht mehr so selbstverständlich durch die Formulierung aus, es gehe um das, wofür das Zeichen steht. Ich denke hier nicht in erster Linie an die Unterscheidung von ,Sinn' und ,Bedeutung', sondern an die zunehmend pragmatische' Deutung der Seite des ,Sinns'. Deutlich sichtbar wird sie an einer Stelle in seinem 3
Frege (1964, 15).
168
Hans Julius Schneider
Aufsatz Gedankengefüge (1923), an der er über die so wichtige Eigenschaft der Ungesättigtheit mancher Zeichen sagt, sie zeige sich „in ihrem Gebrauch als Zeichen" 4 . Dieser Rekurs auf den Gebrauch, der von manchen FregeKritikern unterschlagen wurde5, kann es rechtfertigen, hier allgemein von einer pragmatischen' Weise der Klassifikation zu sprechen. Ein für die Klassifikation im Hinblick auf eine Begriffsschrift entscheidender Aspekt des Gebrauchs ist nun die Kombinierbarkeit eines Zeichens, also die Rolle, die es mit Bezug auf andere Zeichen desselben Satzes spielt. Daher läßt sich dieser Klassifikationsgesichtspunkt genauer auch als funktionalsyntaktisch' bezeichnen: Er unterscheidet Ausdrücke danach, welche (inhaltlich verstandene) Rolle sie im Satz spielen können. Um sichtbar zu machen, daß dieser Gesichtspunkt im traditionellen Sinn ,syntaktisch' ist (nämlich auf Fragen der Satzbildung bezogen), nicht aber syntaktisch im Sinne von Morris und Carnap, tritt das Wort funktional' vor ,syntaktisch' und wir sprechen vom funktional-syntaktischen Ansatz im Verständnis der Klassifikation begriffsschriftlicher Ausdrücke. Es ist nun meine These, daß die Schwierigkeiten, in die Frege bei seiner Erläuterung der Unterscheidung zwischen Begriff und Gegenstand gerät, auf einem Schwanken zwischen der referenzsemantischen und der funktionalsyntaktischen Beschreibungsweise der verschiedenen Rollen sprachlicher Ausdrücke beruht. Da ich die funktional-syntaktische Sicht, die Frege in der Auseinandersetzung mit Kerry zu verteidigen sucht, für die fortgeschrittenere, die angemessenere halte, wird mein Vorschlag zur Auflösung der Schwierigkeiten darin bestehen, zu zeigen, daß ihre konsequente Bevorzugung die Probleme löst.
2
Die funktional-syntaktische Lesart der Unterscheidung zwischen Begriff und Gegenstand
Nach dieser Lesart geht es Frege mit seiner Unterscheidung zwischen Gegenstandsnamen und Begriffsausdrücken um zwei grundverschiedene Rollen, die Ausdrücke bei der Bildung eines Satzes spielen können. Die Unterscheidung ist für ihn deshalb von zentraler Bedeutung, weil sie verständlich machen soll, warum es überhaupt Sätze geben kann und nicht nur Namenslisten. Wären alle Wörter Namen (von konkreten Einzeldingen, von immateriellen Dingen wie Zahlen oder Begriffen, oder von was für Entitäten auch immer), so wären alle Zusammenfügungen von Wörtern nur Listen von Namen, deren Teile, wie Frege sich bildhaft ausdrückt, nicht aneinander haften' würden. Ein Satz wäre auf der Ebene des Sinns keine Einheit, sondern ein Aggregat 4 5
Frege (1990b, 381; Orig. Pag. 39). S o z.B. von Baker/Hacker 1984.
169
Begriffe als Gegenstände der Rede von Einzelteilen.
Wenn dies so ist, dann heißt die Aussage, ein Ausdruck gehöre der Kategorie ,Gegenstandsname' an, zunächst und in erster Linie, daß er eine b e s t i m m t e Rolle im Satz spielen kann.
Will man dies erläutern und die
Möglichkeit von Sätzen an einfachen Beispielen klarmachen, kann m a n als leicht zugängliche Beispiele
für Gegenstände materielle Einzeldinge wie
Schiffe heranziehen oder man kann auf Personen verweisen, die wir vielleicht zuerst vor Augen haben, wenn es um Namen geht.
M a n kann also
an Sätzen wie ,Peter ist blond' einen ersten Schritt dazu tun, zu verdeutlichen, u m welche Unterscheidung es geht.
Durch solche Beispiele ist die
Kategorie ,Gegenstandsname' aber nicht für alle Zeiten referenzsemantisch festgelegt auf Fälle, in denen wir handhabbare Dinge schon vorsprachlich zugänglich haben, denen wir dann in einem zweiten Schritt ein Namenstäfelchen umhängen. Dies wird bei der Behandlung der Begriffe als Gegenstände der Rede von Bedeutung sein, wo es darum gehen wird, wie denn auf andere Weise Gegenstandsnamen verständlich gemacht werden können. Entsprechend heißt die Aussage, ein Ausdruck gehöre der Kategorie der Begriffsausdrücke an, daß er eine auf charakteristische Weise andere Rolle im Satz spielt als ein Ausdruck aus der Kategorie der Gegenstandsnamen. Nach Frege sind solche Ausdrücke ,ungesättigt', sie führen eine leere Stelle mit sich, eine Lücke, in die ein Gegenstandsname eingefügt werden kann. W i e d e r u m kann man sich an sehr einfachen Fällen, z . B . an Sortierhandlungen klarmachen, was es in einem ersten Schritt heißen kann, Begriffsausdrücke zu verwenden. Und wie wirkliche Sortierhandlungen nur ausgeführt werden können, wenn sie sich auf Gegenstände richten, die sortiert werden, so sind auch die Begriffsausdrücke für sich allein unvollständig; sie enthalten Leerstellen, an die die Namen derjenigen Gegenstände treten können, die sprachlich sortiert, d.h.
unterschieden werden.
A u f diese Weise wird
die Einheit des Satzes verständlich, der im einfachsten denkbaren Fall aus genau zwei notwendigerweise verschiedenartigen Teilen besteht, einem Gegenstandsnamen und einem Begriffsausdruck.
Ich brauche das hier nicht
näher auszuführen. Mein Vorschlag zur Lösung von Freges Schwierigkeiten besteht nun darin, überall dort, wo er sich mit der referenzsemantischen Ausdrucksweise, ein Ausdruck ,bedeute einen Begriff oder ,stehe für' diesen, Probleme schafft, die Interpretation zugrundezulegen, er meine damit nichts anderes als die Aussage, der Ausdruck sei erstens bedeutungsvoll, und zweitens, er sei es auf die für Begriffsausdrücke charakteristische Weise. Diese zweite Aussage heißt, er sei geeignet, in Sätzen die für Begriffsausdrücke typische Rolle zu übernehmen. Entsprechend ist zu prüfen, ob es in manchen Fällen weiterhilft, die referenzsemantische Formulierung, ein Gegenstandsname ,bedeute' oder ,stehe für' einen Gegenstand zu lesen als: er hat auf die für Gegen-
170
Hans Julius Schneider
standsnamen charakteristische Weise Bedeutung, was wiederum heißt, er ist geeignet, eine bestimmte Rolle im Satz zu spielen. Die Scheidung dieser beiden Rollen, die Frege für ein Verständnis der Einheit des Satzes besonders wichtig war, könnte auf diese Weise aufrecht erhalten werden. Man sieht bereits, daß bei diesem Vorgehen solche Sätze ein besonderes Augenmerk verlangen, in denen Ausdrücke, die wir wegen ihrer Art, bedeutungsvoll zu sein, funktional-syntaktisch als Begriffsausdrücke klassifizieren, dieser Klassifikation zum Trotz an die in der traditionellen Schulgrammatik so genannte Subjektstelle eines Satzes geraten, oder mit Frege gesprochen: an die Stelle im Satz, wo von ihrer Funktion her die Gegenstandsnamen hingehören. Eric Stenius gibt ein besonders einfaches, wenn auch in seiner grammatischen Wohlgeformtheit zweifelhaftes Beispiel mit dem Satz (1)
(*?) Red is not an object.6
Wenn man solche Sätze zuläßt, legen sich genau diejenigen Züge als nächste Schritte nahe, die Frege in die hier zu erörternden Schwierigkeiten bringen. Sie ergeben sich aus zwei in der natürlichen Sprache als selbstverständlich erscheinenden Notwendigkeiten: (a) Man muß angeben können, worüber in einem solchen Satz gesprochen wird, denn ein Satz dieses Typus scheint die einfache Form des ,Etwas über etwas Sagens' zu haben. (b) Der an der Subjektstelle stehende Begriffsausdruck ist bedeutungsvoll, er ist keine bloße Zeichenform, auf deren Bedeutung es bei der Beurteilung der Rechtmäßigkeit der Prädikation nicht ankäme. Angesichts dieser beiden Notwendigkeiten ist es bequem und naheliegend, die referenzsemantische Ausdrucksweise, ein Begriffsausdruck ,bedeute' oder ,stehe für' einen Begriff in dem Sinne wörtlich zu nehmen, daß sie den Ubergang vom Zeichen zu einem ,Bezeichneten' gestattet, nämlich zur Aussage ,es gibt eine als Begriff klassifizierbare Entität, für die dieser Begriffsausdruck steht'. Wenn es legitim ist, eine solche Entität zu unterstellen (man wird wie erwähnt darauf hinweisen, daß es ja nicht um bedeutungslose Zeichen gehen soll), dann liegt die Aussage nahe, diese Entität sei der Gegenstand, von dem der fragliche Satz spreche, an dessen Subjektstelle der Begriffsausdruck steht. Also stehe hier ein Begriffsausdruck für einen Gegenstand und Freges strikte Trennung kann nicht gelten. Doch sehen wir zunächst an Freges Text, wie weit die Strategie führt, die funktional-syntaktische Lesart konseqüent als die von Frege intendierte zugrundezulegen und in der referenzsemantischen Ausdrucksweise nur eine façon de parier zu sehen.
«Stenius (1960, 212ff.).
171
Begriffe als Gegenstände der Rede
3
Freges Verteidigung gegen Kerry im Lichte der funktional-syntaktischen Lesart
Frege läßt in seinem Aufsatz Uber Begriff und Gegenstand deutlich erkennen, ihm sei bewußt, daß er den Ausdruck ,Begriff auf eine Weise gebrauche, die von manchen anderen seinerzeit üblichen Gebrauchsweisen abweiche, und es kommt ihm in erster Linie darauf an, zu zeigen, daß die Widersprüche, die Kerry zu sehen meint, nicht entstehen, wenn man sich konsequent an den von ihm (Frege) zugrundegelegten Gebrauch hält. Läßt sich dieser nun im Sinne der funktional-syntaktischen Lesart verstehen? Wenn Frege sagt „der Begriff . . . ist prädikativ" und in einer Fußnote erläutert „er ist nämlich Bedeutung eines grammatischen Prädikats" 7 , dann läßt sich das deuten als: Begriffsausdrücke fungieren (grammatisch gesprochen) als Prädikate; Begriffsausdruck zu sein, heißt, auf die damit genannte charakteristische Weise bedeutungsvoll zu sein, wozu insbesondere die ,Ungesättigtheit' gehört, die Ergänzungsbedürftigkeit durch einen Gegenstandsnamen als Subjekt. Wenn Frege umgekehrt wenig später vom Gegenstandsausdruck ,Venus' sagt, er könne (allein) nicht Prädikat sein und folglich könne „die Bedeutung dieses Wortes . . . nie als Begriff auftreten, sondern nur als Gegenstand" 8 , können wir ganz folgerichtig paraphrasieren: Die Art, auf die ein Gegenstandsname wie ,Venus' bedeutungsvoll ist, die funktionalsyntaktische Rolle, die dieses Wort spielen kann, ist eine andere als die Rolle, die für Begriffsausdrücke charakteristisch ist. Nach dieser Erläuterung seiner Terminologie wendet sich Frege in einem nächsten Schritt den problematischen Fällen zu, die diesem Befund zu widersprechen scheinen, indem hier Begriffe vorzuliegen scheinen, die zugleich auch Gegenstände sein können. Er greift das Beispiel von Kerry auf, den Satz (2)
Der Begriff
ist ein leicht gewinnbarer
Begriff.
Kerry sieht hier einen Widerspruch: Auf der einen Seite steht die sich vom Deutschen her naheliegende These, der Ausdruck ,der Begriff < P f e r d > ' stehe für einen Begriff, ganz so, wie der Ausdruck ,die Stadt Berlin' für eine Stadt steht. Auf der anderen Seite legt es sich ebenfalls nahe, zu sagen, der Ausdruck ,der Begriff < P f e r d > ' bezeichne als Subjekt des ganzen Satzes den Gegenstand, von dem die Rede sei. Also sei hier ein Begriff zugleich Gegenstand. Dem widerspricht Frege nun, indem er sich gegen einen Teil dessen wendet, was die natürliche Sprache nahelegt, nämlich das erste Horn des Dilem7 8
Frege (1990a, 168; Orig. Pag. 193). A.a.O., 169 (195).
Hans Julius Schneider
172
mas für falsch erklärt. Mit dieser Wahl bestätigt er die funktional-syntaktische Lesart. Er schreibt: Ganz recht! Die drei Worte ,der Begriff ' bezeichnen einen Gegenstand, aber eben darum keinen Begriff, wie ich das Wort gebrauche. 9 Daß der Ausdruck ,der Begriff < P f e r d > ' die Funktion des Subjekts hat, ist also bereits hinreichend für die Aussage, er ,bezeichne einen Gegenstand' (und also: er bezeichne keinen Begriff, in Freges Terminologie). Weil der Aufweis eines Referenzobjekts für eine Begründung dieser Aussage in Freges Augen offenbar unnötig ist, bemüht er sich zunächst gar nicht um einen unabhängigen Nachweis für die Existenz eines solchen Objekts, zu dem der fragliche Ausdruck in einer Namensbeziehung zu stehen hätte. Gleichwohl sagt er vom Ausdruck, er ,bezeichne einen Gegenstand'. Dies bestärkt die These, die referenzsemantische Ausdrucksweise habe eine sekundäre Bedeutung, sie werde im Konfliktfall als ,bloße' Ausdrucksweise, als façon de parier behandelt. Als Ergebnis haben wir zunächst die einfache Tatsache, daß der dreigliedrige Teilausdruck ,der Begriff < P f e r d > ' mit Bezug auf den ganzen Satz (,der Begriff < P f e r d > ist ein leicht gewinnbarer Begriff) der Gegenstandsname in Freges Sinn ist; er bildet das Subjekt des Satzes. Dies gilt unbeschadet der Tatsache, daß ein Teilausdruck dieses komplexen Ausdrucks, nämlich der in Anführungszeichen stehende Ausdruck ,Pferd' ein Begriffsausdruck ist. Wie ist nun aber unserer Neigung zu begegnen, zu sagen, der Satz handle von einem Begriff, die durch die scheinbare Parallelität zwischen ,der Begriff < P f e r d > ' und ,die Stadt Berlin' unterstützt wird? Welche Rolle spielt das Wort ,Begriff hier, so daß sich eine Differenz zum Ausdruck ,die Stadt Berlin' aufweisen läßt? Und schließlich: Wie ist die Aussage des ganzen Satzes zu verstehen, wenn nicht als Aussage über eine Entität, die sich als Begriff klassifizieren läßt (so wie Berlin eine Entität ist, die sich als Stadt klassifizieren läßt)? Frege weist zunächst darauf hin, daß die Anführungszeichen um den Ausdruck < P f e r d > schon einen Unterschied signalisieren zu Ausdrücken der Art ,die Stadt Berlin' (und es ist genau die Tatsache, daß solche Anführungszeichen im Satz (1) von Stenius nicht vorkommen, die die grammatische Wohlgeformtheit von (1) zweifelhaft erscheinen läßt). Nimmt man hinzu, was er an anderer Stelle über seinen Gebrauch der Anführungszeichen bzw. der gesperrten oder kursiven Schreibweise gesagt hat, dann liegt die Aussage nahe, in Kerrys Beispielsatz werde über einen Ausdruck gesprochen, über den Ausdruck < P f e r d > . Als eine erste Paraphrase von Kerrys Satz, die dem Rechnung zu tragen versucht, bietet sich daher die Formulierung an: 9
Ebd.
Begriffe als Gegenstände der Rede (3)
Was der Begriffsausdruck Begriff.
bedeutet, ist ein leicht
173 gewinnbarer
Hier wird bereits der Ausdruck zum Thema gemacht, aber auch noch das, ,was er bedeutet'. Unterstellen wir nun als Motiv für die dabei noch benutzte referenzsemantische Terminologie (,was A bedeutet') die Absicht, ,Zeichen und Bezeichnetes nicht zu verwechseln', also nicht nur im formalsyntaktischen Sinn über Zeichen zu sprechen, dann können wir unter Beachtung dieses Motivs Kerrys Satz durch eine Paraphrase ersetzen, die die referenzsemantischen Formulierungen durch funktional-syntaktische ersetzt: (4)
Der Ausdruck , der auf die für Begriffsausdrücke charakteristische Weise bedeutungsvoll ist, ist (als Ausdruck einer Sprache, d.h. mitsamt seiner Verwendung) leicht gewinnbar (d.h.: leicht zu erwerben, zu verstehen).
Das Wort ,Begriff verweist bei dieser Deutung auf eine Rolle des Ausdrucks, es klassifiziert nicht einen Gegenstand, für den der Ausdruck steht (wie der Teilausdruck ,die Stadt' den Gegenstand klassifiziert, für den der Ausdruck ,Berlin' steht). Kehren wir nun zu Freges Text zurück, dann erscheint das von ihm angesprochene „Bedürfnis, etwas von einem Begriffe auszusagen" als die Absicht, etwas von einem sprachlichen Ausdruck auszusagen, insofern er eine bestimmte (u.a. funktional-syntaktisch bestimmte) Funktion hat. Die Sätze (3) und (4) machen eine solche Aussage, und sie machen sie, wie Frege sagt, in der gewöhnlichen Form, „daß nämlich die Aussage Inhalt des grammatischen Prädikats wird." Frege fährt fort: „Danach würde man als Bedeutung des grammatischen Subjekts den Begriff erwarten". 1 0 Die Herkunft dieser Erwartung wurde oben schon angesprochen und wird auch in der Formulierung (3) noch einmal deutlich sichtbar. Die dort benutzte referenzsemantische Terminologie legt es nahe, den gesamten Subjektausdruck, den ,Gegenstandsnamen', als für diejenige Entität stehend aufzufassen, für die auch (ebenfalls im Rahmen der referenzsemantischen Terminologie) der Ausdruck ,Pferd' für sich allein genommen steht. Legt man die Vorstellung zugrunde, das Bedeutungsvollsein von Begriffsausdrücken bestehe im Stehen-für-etwas, dann scheint die Kennzeichnung ,was der Ausdruck < P f e r d > bedeutet' für dasselbe zu stehen wie der Ausdruck ,Pferd' selbst, wenn er in einem Satz wie ,Flicka ist ein weibliches Pferd' vorkommt. Da nun die ,Aussagen von einem Begriff, die den Logiker interessieren, den Bedeutungsaspekt der Begriffswörter einschließen sollen (traditionell ausgedrückt: nicht das Zeichen sondern ,das Bezeichnete' treffen sollen), lassen 10
A.a.O. 171 (197).
Hans Julius Schneider
174
sie als Subjekte Ausdrücke für Begriffe erwarten. Und der in der Formulierung (3) benutzte Ausdruck ,was der Begriffsausdruck < P f e r d > bedeutet' scheint ebenso wie das prädikativ verwendete Wort ,Pferd' (wie man sagt) / ü r einen Begriff zu stehen'. Dies ist aber nur so, solange man die referenzsemantische Terminologie wörtlich nimmt, d.h. so versteht, als würde damit auf Entitäten verwiesen, auch wenn diese ,Begriffe' und nicht g e g e n s t ä n d e ' heißen. Dem widersetzt sich Frege durch die Aussage, der Begriff könne wegen seiner prädikativen Natur nicht ohne weiteres als Bedeutung des grammatischen Subjekts erscheinen. Nach der funktional-syntaktischen Interpretation heißt dies, in ,Aussagen von einem Begriff wird gar nicht über Entitäten gesprochen, für die BegrifFsausdrücke (angeblich) stehen. Dies zeigt sich für Frege schon daran, daß eine ,Begriff zu nennende Entität durch die unveränderte Benutzung des Begriffsausdrucks keineswegs zum Gegenstand einer sich anschließenden Prädikation gemacht werden könnte. Der Satz (5)
* Pferd
ist leicht
gewinnbar
ist, ähnlich wie der Satz (1) von Stenius, auch nach Maßstäben der Schulgrammatik nicht wohlgeformt. Positiv formuliert bedeutet das, daß im Sinne des Satzes (4) über einen Begriffs ausdruck gesprochen wird, allerdings unter dem Gesichtspunkt seiner Bedeutung, d.h. seiner Funktion in der Sprache. Will man über diesen ,Ausdruck, insofern er auf charakteristische Weise bedeutungsvoll ist' sprechen, dann muß man für ihn einen Gegenstandsnamen haben. Diesen bildet man üblicherweise mit Hilfe von Anführungszeichen. Wenn Frege dann sagt, der Begriff, über den nicht durch das Einsetzen eines Begriffsausdrucks an die Subjektstelle éines Satzes gesprochen werden könne, müsse „durch einen Gegenstand vertreten werden" 11 , dann heißt das nach der hier vorgetragenen Lesart: Wenn von Begriffsausdrücken unter dem Gesichtspunkt ihrer Verwendung (traditionell ausgedrückt: wenn von Begriffen) gesprochen werden soll, dann können diese Begriffsausdrücke nicht selbst als Gegenstandsnamen fungieren, vielmehr müssen erst Namen für sie gebildet werden. Dies geschieht mit Hilfe von Anführungszeichen oder der kursiven Schreibweise, und mit vorangestellten Wendungen wie ,der Begriff. Ein prädikativer Ausdruck wie ,Pferd' wird also nicht selbst zu einem Gegenstandsnamen; was nach bisherigem Verständnis ,für einen Begriff steht' steht also nicht plötzlich ,für einen Gegenstand'. Vielmehr wird ihm ein Gegenstandsname zugeordnet, der als Name nicht prädikativ ist, der also ,für einen Gegenstand steht'. Bei konsequent funktional-syntaktischer Lesart taucht also der Widerspruch, den Kerry zu sehen meinte, in der Tat nicht auf. 11
Ebd.
Begriffe als Gegenstände der Rede
4
175
Gegenstände der Rede
Ich möchte dieses schöne Ergebnis nun nicht so stehen lassen, sondern einen Schritt weiter gehen und die vielleicht trivial erscheinende Frage stellen, ob überhaupt klar ist, was wir meinen, wenn wir sagen, wir würden Ausdrükken Namen geben. Daß dies problemlos möglich und verständlich ist, war eine stillschweigende Voraussetzung der bisherigen Argumentation. Auf die Möglichkeit, daß diese Frage nicht wirklich trivial ist, deutet bereits die Tatsache hin, daß Frege in seiner Beschreibung schwankt: Im Aufsatz Uber Begriff und Gegenstand sagt er zunächst, damit eine ,Aussage von einem Begriff in der gewöhnlichen sprachlichen Form erscheinen könne, müsse der Begriff „in einen Gegenstand verwandelt werden". Er fügt dann aber hinzu (und dies ist die zweite Auskunft, die wir von ihm bekommen) „genauer gesprochen, er muß durch einen Gegenstand vertreten werden." 1 2 In der Nachlaßschrift „Logik in der Mathematik" (1914) schließlich erhalten wir eine dritte Version, er sagt dort nämlich, es scheine nur so, daß ein Ausdruck wie ,der Begriff ' (in einem Satz der Form ,der Begriff ist erfüllt') ein Eigenname wäre. Er bezieht sich dann auf seine vorher ebenfalls benutzte inhaltsgleiche Formulierung ,es gibt eine positive Zahl' und fährt fort: In der Tat haben wir aber hier gar keinen Gegenstand. Die Sprache nötigt uns hier zu einem schiefen Ausdrucke; aber eine Analogie liegt in ,der Tat vor. Was wir mit ,eine positive Zahl' bezeichnen, verhält sich zu dem, was wir mit ,es gibt' bezeichnen, analog wie ein Gegenstand (z.B. die Erde) zu einem Begriffe (z.B. Planet). 13 Betrachten wir die angebotenen Formulierungen in der genannten Reihenfolge: Verwandeln wir einen Begriff in einen Gegenstand, haben wir einen Gegenstand, der den Begriff vertritt, oder haben wir gar keinen Gegenstand, sondern nur eine Analogie zwischen zwei Ausdrucksformen? Wenn wir wie oben unterstellen, daß ,Aussagen von einem Begriff von einem Begriffsausdruck handeln, und wenn wir die übliche Praxis und ihre Beschreibung, den Namen eines Ausdrucks bilde man, indem man ihn hinschreibe und mit Anführungszeichen umschließe, nicht zum Problem machen, dann ist Freges erste Formulierung, der Begriff werde in einen Gegenstand verwandelt, gar nicht unpassend: Ein Begriffsausdruck wird (wie es auch mit jedem anderen Ausdruck möglich ist) in einen Gegenstandsnamen verwandelt (nämlich in den ,Namen des Ausdrucks'), indem er auf beiden Seiten je ein weiteres Zeichen angehängt bekommt; der Ausdruck 12 13
Ebd. Frege (1969, 269).
176
Hans Julius Schneider
bleibt bestehen, wird aber, bildlich gesprochen, verkleidet. Indem er etwas angehängt bekommt, wird deutlich, daß das verkleidete Resultat eine andere Rolle spielt, — so wie sich ein Kind in Rotkäppchen oder in den Wolf verwandeln kann. Dies stimmt zur funktional-syntaktischen Lesart der Unterscheidung der Kategorien der Ausdrücke: Ein Begriffsausdruck wechselt seine Kategorie und wird (in der seinen Rollenwechsel deutlich anzeigenden Verkleidung) zum Gegenstandsnamen. Aber wie ist diese Rollenveränderung möglich; warum kann sie stattfinden? Ist die Auskunft, der Ausdruck sei die Entität, die den Namen bekomme, befiedigend? Zunächst können wir rekapitulierend feststellen, daß Frege der referenzsemantisch verstandenen Deutung, eine Entität vom Typus Begriff verwandle sich in eine Entität vom Typus Gegenstand, sofort widerspricht; sie; genügt weder seinem Interesse an einer strengen Scheidung noch der hier favorisierten funktional-syntaktischen Deutung; insofern ist es verständlich, daß Frege den Ausdruck ,Verwandlung' zurücknimmt. Es ist nicht so, daß eine Entität der Klasse der Begriffe sich in einen Gegenstand verwandelt. Und unsere neue Lösung hieß entsprechend: Ein Begriffsausdruck, der, wenn er verwendet wird, andere Dinge klassifiziert und nicht für eine Entität steht, benennt im vorliegenden Fall sich selbst. Aber diese gängige Erklärung, ein Anführungszeichen-Ausdruck sei ein Name für sich selbst, wird ebenfalls problematisch, sobald wir genauer nachfragen und wissen wollen, wofür denn der neue Name ein Name ist. Der in die Anführungszeichen eingeschlossene Ausdruck benenne sich selbst, müßte wörtlich heißen, es sei die Inskription, die hier benannt werde, das raumzeitlich spezifische Vorkommnis. Dies kann aber dort, wo wir von sprachlichen Ausdrücken unter dem Aspekt ihrer Verwendung sprechen, nicht gemeint sein. Wir würden eher sagen, er benenne einen zugeordneten abstrakten Gegenstand wie ein ,Schema' oder ein den einzelnen Inskriptionen, den tokens zuzuodnender ,type'. Obwohl die Redeweise von den ,Schemata' oder ,types' gängig ist, haben wir doch in ihnen nicht problemlos verfügbare Gegenstände vor uns, denen wir im referenzsemantischen Sinne nur noch ein Namenstäfelchen umzuhängen brauchen. Schemata haben hier keinen besseren Status als die traditionellen Begriffe oder ,Universalien'. Wir haben die Verwandlung eines Begriffswortes in einen Gegenstandsnamen, aber wenn wir Schemata oder Typen in ihrem Gegenstandsstatus für ebenfalls zweifelhaft halten müssen, dann haben wir zum Gegenstands warnen nicht ohne weiteres auch einen Gegenstand. Folglich läßt die Beschreibung des Vorgangs als eine Verwandlung' auch dann noch Fragen offen, wenn nicht (wie in Freges erster Formulierung) sich Begriffe in Gegenstände verwandeln, sondern nur Begriffsausdrücke in Gegenstandsausdrücke: Wie sind die Gegenstandsausdrücke zu verstehen, wenn nicht als Namen wohlbekannter Gegenstände? Freges zweite, als präziser angebotene Formulierung lautete, der Begriff
Begriffe als Gegenstände der Rede
177
„muß durch einen Gegenstand vertreten werden". Legen wir auch hier wieder die funktional-syntaktische Lesart zugrunde (und sehen in Freges Impuls zur Korrektur gerade das Bestreben, Abstand zur referenzsemantischen Deutung zu bekommen), dann haben wir auch hier nichts anderes als die Aussage: Der Begriffsausdruck muß, wenn eine ,Aussage von einem Begriff gemacht werden soll, durch einen zugeordneten Gegenstandsnamen (d.h. durch einen Ausdruck, der eine bestimmte funktional-syntaktische Rolle spielen kann) ersetzt werden. Denn wir wissen nur, daß der zu formulierende Satz in diesem Sinne einen Gegenstandsnamen verlangt, wir haben mit diesem Wissen noch keinen unabhängig zugänglichen ,Vertretergegenstand', dem wir diesen Namen in einem referenzsemantischen Sinne zuordnen können, solange ,das Wort selbst' als Schema oder Typus nicht als unproblematisch faßbarer Gegenstand zur Verfügung steht. Der Vertretergegenstand erscheint daher als ein deus ex machina, als das Resultat einer speziell für den vorliegenden Zweck gemachte Fiktion. So kommen wir zu Freges dritter Formulierung, wir hätten hier gar keinen Gegenstand, sondern nur eine Analogie zwischen zwei Ausdrucksformen. Die funktional-syntaktische Deutung des Ausdrucks ,für einen Gegenstand stehen' kann sich mit der Tatsache, daß es gar keinen Gegenstand gibt, insofern leicht anfreunden, als sie diesen Ausdruck im Sinne der Paraphrase versteht ,im Satz an Subjektstelle stehen'. Es muß nach diesem Verständnis (anders als es die referenzsemantische Deutung erfordern würde) nicht unbedingt einen unabhängigen, vor der Zuordnung des Referenzausdrucks verfügbaren Gegenstand geben, damit man von einem Ausdruck sagen kann, er sei ein Gegenstandsname. Was wir nach Freges dritter Formulierung allein zu verstehen hätten, wäre die sprachliche Tatsache, daß ein Ausdruck, der sonst eine prädikative Rolle spielt, an die Subjektstelle eines Satzes rückt, an der er dann keine prädikative Funktion mehr hat, und daß der so gebildete Satz sinnvoll ist. Der an ungewöhnlicher Stelle auftauchende Ausdruck hat, bezogen auf den zugehörigen Prädikatausdruck (d.h. auf einen Begriffsausdruck zweiter Stufe), eine Rolle, die analog ist zu der eines Gegenstandsnamens gegenüber einem Begriff erster Stufe. Auf Freges Beispiel bezogen: Der Subjektausdruck ,der Begriff ' hat gegenüber dem Begriffsausdruck zweiter Stufe ,ist erfüllt' eine Rolle, die analog ist der Rolle, die der Ausdruck ,die Erde' gegenüber dem Begriffsausdruck erster Stufe ,ist ein Planet' hat. Wenn wir Freges Aussage, es gebe (ich interpretiere: im referenzsemantischen Sinn) hier keinen Gegenstand, ernst nehmen, dann kann eine Aufklärung des Sinnes der ,Aussagen von einem Begriff nicht so erfolgen, daß wir erst den zugehörigen Gegenstand ausfindig machen, um auf dieser Basis die Ähnlichkeit oder Unähnlichkeit zum Fall erster Stufe (und also den Sinn von ,analog') zu verstehen. Vielmehr muß die Reihenfolge des Ver-
178
Hans Julius Schneider
stehens genau umgekehrt sein: In einem ersten Schritt muß der Witz der analogen Ausdrucksweise verstanden werden, der Sinn des Schrittes, einen Begriffsausdruck (mit Anführungszeichen, die das Ungewöhnliche signalisieren) an die Subjektstelle eines Satzes zu stellen, — und wir verstehen j a sogar Sätze wie ,Rot ist kein Gegenstand'. Der Begriffsausdruck kommt damit an einen Ort, an den er streng genommen nicht hingehört, und worin der pragmatische Sinn dieses Zuges besteht, muß in einem ersten Schritt deutlich gemacht werden. Wenn die so eigentlich ,unzulässig' gebildeten Sätze als nützlich akzeptiert und in ihrem ,Witz' verstanden sind, dann können wir nun, in einem zweiten Schritt, auch davon sprechen, wir hätten besondere g e g e n s t ä n d e der Rede' vor uns. Das Zwischenglied wäre hier die funktional-syntaktisch verstandene Ausdrucksweise, der neuartige Ausdruck an Subjektstelle sei ein Gegenstandsname. Es wäre also in einem analogen, übertragenen Sinn, daß wir davon sprechen können, es sei da von gewissen g e g e n s t ä n d e n ' die Rede. Einen ,Gegenstand der Rede' in diesem Sinne kann es folglich auch dort geben, wo es sprachunabhängig verfügbare Gegenstände nicht gibt. Und wenn dies erst einmal klar und akzeptiert ist, dann kann man das Wort ,Gegenstand' natürlich so weit verstehen, daß es sowohl referenzsemantisch zuordnungsgeeignete Personen, Schiffe, etc. umfaßt als auch g e g e n s t ä n d e der Rede', zu denen dann insbesondere auch (wie wir jetzt wieder etwas sorgloser sagen dürfen) ,die Begriffe' gehören. Was demnach zu verstehen ist, ist der praktisch-kommunikative Sinn sprachlicher Bildungen, die wir als ,Aussagen von einem Begriff oder A u s sagen über Wörter als types' bezeichnen. Dieser praktisch-kommunikative Sinn ist uns, wenn wir an das Geschäft der Analyse gehen, durch die natürlichen Sprachen erschlossen. Wir verstehen den ,Witz' selbst des nicht so ganz wohlgebildeten Satzes (1) ,Rot ist kein Gegenstand'. Frege spricht von einer ,Analogie' zwischen dem Fallen eines Gegenstandes unter einen Begriff und dem Fallen eines Begriffs erster Stufe ,in' einen Begriff zweiter Stufe. Stenius spricht von einer syntaktischen Metapher': es wird eine Satzbildungsform benutzt, die eigentlich inadäquat ist, aber es steht (in der von ihm erörterten Sprache) keine andere Form zur Verfügung. 14 Es kommt m.E. darauf an, dieses sprachliche Verfahren der Analogiebildung zu durchschauen und im Einzelfall legitime von illegitimen Bildungen und Fortsetzungs-Sprachspielen zu unterscheiden. Ich möchte aus dem vorgetragenen Verständnis, wie Begriffe zu g e g e n s t ä n d e n der Rede' werden können, also den Schluß ziehen, daß solche Metaphern legitim sind und daß es folglich darum geht, sie zu verstehen, sich von ihnen nicht auf falsche Fährten locken zu lassen, was, wie der besprochene Fall zeigt, oft keineswegs einfach ist. Es geht nicht darum, die metaphorische Ausdrucksweise wegzuanalysieren.
14
Stenius (1960), vgl. Schneider (1993).
Begriffe als Gegenstände der Rede
179
Literatur Baker, Gordon P./Hacker, Peter M. S. (1984), Frege: Logical Excavations, Oxford University Press, Oxford. Frege, Gottlob (1964), Begriffsschrift, eine der arithmetischen nachgebildete Formelsprache des reinen Denkens. In: Angelelli, Ignacio (ed.), Gottlob Frege, Begriffsschrift und andere Aufsätze, Olms, Hildesheim etc. 2. Aufl., IV-99. Frege, Gottlob (1969), Logik in der Mathematik. In: Hermes, Hans/Kambartel, Friedrich/Kaulbach, Friedrich (Hrsg.), Gottlob Frege, Nachgelassene Schriften, Meiner, Hamburg 1969, 219-270. Frege, Gottlob ( 2 1990 a), Uber Begriff und Gegenstand. In: Angelelli, Ignacio (ed.) Frege, Gottlob, Kleine Schriften, Olms, Hildesheim etc., 167-178. Frege, Gottlob (1990b), Gedankengefüge (^Logische Untersuchungen, dritter Teil). In: Angelelli, Ignacio (ed.) Frege, Gottlob, Kleine Schriften, Olms, Hildesheim etc., 378-394. Schneider, Hans Julius (1992a), Phantasie und Kalkül. Uber die Polarität von Handlung und Struktur in der Sprache. Suhrkamp, Frankfurt a.M. Schneider, Hans Julius (1992b), Wörter und Handlungen als abstrakte Gegenstände, Deutsche Zeitschrift für Philosophie 40, 1141-1154. Schneider, Hans Julius (1993), ,Syntaktische Metaphern' und ihre begrenzende Rolle für eine systematische Bedeutungstheorie, Deutsche Zeitschrift für Philosophie 41, 477-486. Schneider, Hans Julius (in Vorbereitung), Wahrheitsansprüche ohne Entitäten. Die Einführung des ,Redens über Abstrakta' auf der ersten Stufe. In: Gethmann, Carl Friedrich/Siegwart, Geo (Hrsg.), Einführung durch Abstraktion, Bibliographisches Institut, Mannheim. Stenius, Eric (1960), Wittgenstein's Tractatus. A Critical Exposition of its Main Lines of Thought, Blackwell, Oxford.
PAVEL MATERNA
Logik und Begriff
1
Kennt moderne Logik den Begriff des Begriffs?
Es ist auffallend und ein bißchen erstaunlich, daß das Kapitel Begriff, das in den traditionellen Logik-Lehrbüchern eine so wichtige Rolle spielte, aus der zeitgenössischen Logik-Literatur fast verschwunden ist. Diese Tatsache hat wohl ihre Gründe. Meiner Meinung nach hat die moderne (mathematische sowie „philosophische") Logik Interesse am Begriff verloren, da die traditionellen Theorien meistens sehr unbestimmt, sehr vage waren, was den logischen Charakter des Begriffs betrifft, und da das, was diese Theorien als eigentlichen rigorosen, logisch interessanten Apparat angeboten haben, eine gar triviale Lehre war, die nur elementare mengentheoretische Beziehungen zwischen „Begriffsumfängen" studierte. Auch die Lehre über Inhalt und Umfang des Begriffs war nicht allzu befriedigend: wenn man nicht genau weiß, was eigentlich das ist, was einen Inhalt und einen Umfang hat, dann sind die scheinbar exakten Lehrsätze der Lehre vom Inhalt und Umfang verdächtig. Das zeigte sich übrigens schon 1837, als Bolzano seine wohlbekannte Kritik an dem Kanon des umgekehrten Verhältnisses zwischen Inhalt und Umfang übte. 1 Die obenerwähnte Unbestimmtheit machte auch aus der traditionellen Begriffslehre eine Theorie, die am wenigstens imstande war die psychologistischen Tendenzen abzulehnen. So geschah es, daß der Begriff manchmal als eine mentale, psychische Entität aufgefaßt worden ist. Wenn man diese psychologistische Auffassung ernst nimmt, dann kann m a n sich nicht wundern, wenn die zeitgenössische Logik ihr Interesse an solcher Entität verliert. Wir wollen hier zeigen, daß eine logische Begriffslehre möglich ist, und zwar daß eine solche Lehre auf rigorose Weise aufgebaut werden kann. Das kann gezeigt werden, auch ohne in technische Detaile einzugehen. 2
Bolzano (1837). Was diese betrifft, siehe z.B. Materna (1992).
2
Logik und Begriff
2
181
Philosophische Ausgangspunkte
Es gibt zwei philosophische Probleme, die man in der Geschichte der Begriffslehre als Grundprobleme bezeichnen kann 3 ; beide hängen mit dem Realismus-Nominalismus-Streit zusammen. a)
Das erste Problem kann auf zweierlei Weise formuliert werden:
i)
Sind Begriffe mental, oder
ii)
Sind Begriffe subjektiv,
außermental?
oder objektiv?
Da die Weise, auf welche wir den Ausdruck Begriff meistens verstehen, die Begriffe den Vorstellungen gegenüberstellt, kann man wohl begreifen, daß ich als philosophischen Ausgangspunkt den realistischen Standpunkt annehme. Es seien also Begriffe außermentale, objektive Entitäten. 4 b)
Das zweite Problem hängt mit dem berühmten nominalistischen Spruch Universalia sunt flatus vocis zusammen. Dieses Problem, das noch im Zusammenhang mit Linguistic Turn 5 verschärft worden ist, können wir folgenderweise formulieren: Gibt es nur Sprache und Objekte, oder müssen wir noch ,Jconzeptuale" Entitäten voraussetzen, die die Beziehung Sprachausdruck-Objekt vermitteln ?
Eine nominalistische Antwort finden wir bei J. St. Mill: To say...that we think by means of concepts, is only a circuitous and obscure way of saying that we think by means of general or class names. 6 Mills Meinung, daß es nur Ausdrücke und Objekte (wenn auch abstrakte Objekte wie Klassen) gibt, kann nicht konsequent begründet werden. Mill selbst spricht eigentlich nicht nur von zwei Kategorien von Entitäten, d.h. von Ausdrücken und Gegenständen (z.B. Klassen); er spricht von significations der Ausdrücke. Was ist jedoch signification? Es kann nicht der „besprochene" Gegenstand selbst sein - das wäre absurd: z.B. ist der „Gegenstand", auf welchen sich die Ausdrücke gleichseitiges Dreieck und gleichwinkliges Dreieck beziehen, ein und derselbe, aber wir möchten doch sagen, 3
Vgl. Weitz (1988). D a ß dies nicht allgemeine Meinung in der Geschichte der Begriffslehre war, kann m a n z.B. in Weitz (1988) finden. 5 Siehe dazu Tichy (1988). 6 Weitz (1988, 185). 4
182
Pavel Materna
daß es sich um zwei Begriffe handelt (das wußte schon Bolzano). Dann jedoch was durch Tür gejagt worden war, kehrt sich durch Fenster zurück: es ist gleichgültig, ob wir von Begriffen, oder von significations der Ausdrücke sprechen. Es gibt noch eine Weise, wie auf Begriffe verzichtet werden könnte. Ich meine die Ideologie des späten Wittgensteins, die Quinesche Philosophie und alle verwandte Strömungen. Da haben wir Ausdrücke und (vielleicht) Gegenstände, außerdem jedoch noch etwas: „Sprachverhalten", das durch gesellschaftlichen Konsensus reguliert wird. Ich meine, daß diese Ideologie, die nur Syntax und Pragmatik kennt, nicht imstande ist die wichtigsten Fragen der Sprache zu erklären. Beispielweise ist der gesellschaftliche Konsensus selbst etwas, was erklärt werden sollte; als das letzte Erklärungsprinzip ist er unannehmbar. Alle diese nur oberflächlich skizzierten Erwägungen lassen es erkennen, daß ich der Meinung bin, daß die Begriffe keine Sprachausdrücke sind und daß sie im gewissen metaphorischen Sinn „zwischen" den Ausdrücken und Gegenständen (im weitesten Sinn) stehen. Die Punkte a) und b) ergeben, daß meine Auffassung durchaus „objektivistisch", ja „realistisch" (d.h. antinominalistisch) ist: Begriffe sind objektive (außermentale), von Ausdrücken verschiedene Entitäten. Diese wesentlich negative Charakteristik soll nun positiv ergänzt werden.
3
Rolle der Begriffe
Für einen Realisten gibt es unbestimmt viele Arten von solchen Entitäten, die außermental und von Ausdrücken verschieden sind. Solche Entitäten sind z.B. Zahlen. Doch werden wir Zahlen nicht für Begriffe halten. Womit unterscheiden sich also Begriffe von anderen abstrakten, „platonischen" Entitäten ? Meiner Meinung nach spielen Begriffe eine spezifische Rolle: sie sollen Objekte (im weitesten Sinn) identifizieren. Sehr oft wird diese Rolle explizit formuliert, wenn nämlich von dem Begriff eines Objekts gesprochen wird. So sprechen wir von einem Begriff des Morgensterns, des Präsidenten von U.S.A., des französischen Königs, der Katze, der Primzahl u.s.w.. Manchmal geschieht es dabei, daß „der Versuch" etwas zu identifizieren scheitert: vgl. den Begriff der größten Zahl. Doch auch solche „leere" (oder, nach Bolzano, „gegenstandslose") Begriffe sind sicher Begriffe. Unsere Aufgabe besteht nun darin, eine solche Explikation des Ausdrucks Begriff zu geben, die folgende Prinzipe in Bezug nehmen würde:
Logik und Begriff i)
Begriffe sind objektiv (nicht mental, nicht
ii)
Begriffe dienen zum Identifizieren
iii)
Begriffe sind Jogisch behandelbar"
183 sprachlich);
der Objekte; („tractable").
Was ii) betrifft, dieser Punkt ist sehr breit zu fassen: ein Begriff kann auch einen anderen Begriff identifizieren („Begriff eines Begriffs"). Zuerst jedoch einige historisch relevante Bemerkungen.
4
Bolzano, Frege, Church
Es kann gezeigt werden, daß Bolzanos Begriffstheorie 7 die Prinzipe i)-iii) erfüllt. Was i) betrifft, es ist ganz selbstverständlich, daß der Begriff für Bolzano eine objektive, nicht mentale und außersprachliche Entität ist. Diese platonische Einstellung beginnt schon bei der Bolzanoschen Herleitung der Kategorie der Sätze an sich, denn diese sind, was übrig bleibt, wenn man von der Tatsache absieht, daß der gegebene Satz gesprochen, geschrieben oder gedacht wird. Die Begriffe sind dann diejenigen Entitäten, die den einzelnen (sinnvollen) Teilen des Satzes entsprechen (mit der Ausnahme der sogenannten Anschauungen und derjenigen Teile des Satzes, die wieder Sätze an sich sind). Die Begriffe, ebenso wie die Sätze an sich, „haben keine Wirklichkeit", Wils jedoch bei Bolzano nur das bedeutet, daß sie nicht raumzeitlich sind (was freilich von jeder Abstraktion gilt). Daß die Begriffe zum Identifizieren der Gegenstände dienen,ist für Bolzano auch selbstverständlich. Daher spricht er von Einzelbegriffen, Allgemeinbegriffen und sogar von „gegenstandslosen" Begriffen. Bolzanos größter Verdienst besteht jedoch darin, daß er der logischen Behandelbarkeit der Begriffe weitere Möglichkeiten eröffnet hat, als die durch die traditionelle Logik angebotenen waren. Ich meine vorerst die Tatsache, daß Bolzanos Theorie des Begriffsinhalts wesentlich mehr besagte als die traditionelle Lehre: diese setzte voraus, daß - wenn überhaupt die Begriffe strukturiert sind - die Zusammensetzung der Teilbegriffe auf „konjunktive" Zusammensetzung zurückführbar sei. Bolzanos Kritik des Kanons des umgekehrten Verhältnisses des Begriffsinhalts und des Begriffsumfangs läßt uns begreifen, daß die Struktur des Begriffs für Bolzano nicht notwendigerweise „konjunktiv" ist: die einzelnen Teilbegriffe können auf beliebige (obgleich logisch behandelbare) Weise so verknüpft sein, daß ein neuer Begriff entsteht. Diese Eigenschaften der Bolzanoschen Theorie, d.h. die Forderung der Strukturiertheit der Begriffe und die Voraussetzung, daß die Struktur eines Begriffs nicht auf Konjunktion (Durchschnitt) der einzelnen Teilbegriffe 7
Vgl. Bolzano (1837).
184
Pavel Materna
zurückführbar sei, sondern daß das führende Kriterium die semantische Autonomie der einzelnen Teilausdrücke des gegebenen Ausdrucks sei, beweisen, daß Bolzanos Theorie mehr „progressiv" als die Fregesche Theorie war. Was Frege über Begriff explizit gesagt hat, ist meiner Meinung nach nicht so wichtig wie das, was er über Sinn gesagt hat 8 . Seine Auffassung der Begriffe führt Begriffe im wesentlichen auf Klassenbegriffe zurück. In dieser Hinsicht hat Bolzano mehr gewußt. Es ist z.B. für Bolzano selbstverständlich, daß dem Ausdruck der größte Berg (ja sogar goldener Berg) ein Begriff entspricht. Für Frege dagegen wären diese Ausdrücke keine Begriffsworte, da sie nicht prädiziert werden können. Das dagegen, was Frege über Sinn sagt - es sei (1)
die Art des
Gegebenseins
der (Fregeschen) „Bedeutung", ist für eine logische Begriffstheorie viel nützlicher als das, was er in beiden Artikeln 9 , die explizit über Begriffe sprechen, geschrieben hat. Die Formulierung (1) sollte die Forderungen i)-iii) erfüllen: die Objektivität des Sinnes ist eine triviale Konsequenz der Fregeschen Philosophie, der zweite Punkt ist durch (1) fast definiert, und logische Behandelbarkeit kann garantiert werden, wie die Fregeschen Beispiele 10 zeigen: insbesondere das Beispiel mit verschiedenen Bestimmungen desselben Durchschnittpunktes der Geraden, die die Ecken eines Dreiecks mit den Mitten der Gegenseiten verbinden: die Tatsache, daß wir verschiedene Begriffe desselben Gegenstandes unterscheiden können, beweist nämlich, daß das Problem der Äquivalenz der Begriffe logisch relevant ist. Was übrig bleibt, ist eine Explikation des Ausdrucks Sinn. Eine Verallgemeinerung der Fregeschen Theorie finden wir bei Church 1 1 . Das Churchsche Schema ist: ein Ausdruck drückt seinen Sinn aus, bezeichnet seine Bedeutung („denotation"), und der Sinn des Ausdrucks ist ein Begriff („concept") der Bedeutung. Einer der Unterschiede zwischen Frege und Church besteht darin, daß insbesondere zwei Kategorien von Ausdrücken, die für Frege keinen Begriff bezeichneten, für Church einen Begriff ausdrückten: einerseits sind das „bestimmte Beschreibungen" (definite descriptions), wie der König von Frankreich (oder auch Pegasus), andererseits sind das Sätze, da auch „Propositionen", die durch Sätze ausgedrückt werden, für Church eine Art von 8
Vgl. Frege (1892a). Frege (1891, 1892b). 10 Siehe Frege (1892a). "Church (1956). 9
Logik und Begriff
185
Begriffen sind. (Diese letztgenannte Churchsche Verallgemeinerung würde Bolzano nicht annehmen: er machte immer einen prinzipiellen Unterschied zwischen Sätzen an sich und Vorstellungen an sich.) In den folgenden Sektionen werden wir eine ganz allgemeine Auffassung der Begriffe voraussetzen, also eine Auffassung, die gemeinsam der Bolzanoschen und der Churchschen Philosophie wäre, würden wir vom letzten Unterschied (Sätze und Begriffe) absehen. Das werden wir auch tun: wir bleiben in dieser Hinsicht neutral, wobei die entworfene Theorie immer so konkretisiert oder modifiziert werden kann, daß der Sinn eines Satzes als eine Art von Begriffen aufgefaßt wird oder nicht wird.
5
Begriff als Intension?
Die Art des Gegebenseins kann zuerst so interpretiert werden, daß der Sinn (und eo ipso der Begriff) als Intension definiert wird. Intensionen sind — der üblichen (und wahrscheinlich der besten) Auffassung nach — durch solche Funktionen modellierbar, deren Definitionsbereich die Menge der möglichen Welten (oder eine Untermenge dieser Menge) ist, wobei unter einer „möglichen Welt" eine logisch mögliche Verteilung (evtl. während einer Zeitspanne) einiger basalen („prätheoretischen") Eigenschaften über Gegenstände entsprechender Typen zu verstehen ist 12 . Wir brauchen in diesem Zusammenhang nur „nicht-pragmatische" Montagues indices 13 in Betracht zu nehmen, d.h. nur mögliche Welten und Zeitmomente. Dann sind typische Intensionen als Funktionen aufzufassen, die jeder möglichen Welt eine „Chronologie" zuordnen, wo Chronologie eine Funktion ist, deren Definitionsbereich die geordnete Menge von Zeitmomenten (oder: von reellen Zahlen) ist.Wenn die Menge der möglichen Welten mit W, die Menge der Zeitmomente mit Z, die Menge der Individuen (der Elemente des „Universums") mit I und die Menge der Wahrheitswerte mit 0 bezeichnet wird, dann sind Intensionen Funktionen: Fa : W
(Z
a)
wo a eine Menge von Gegenständen einer bestimmten Kategorie ist, wobei a auch eine Menge von Intensionen sein kann.(Das alles kann genauer im Rahmen der Typentheorie erklärt werden.) So haben wir z.B. folgende wohlbekannte Arten von Intensionen: Propositionen: F„ d.h. W ^ ( Z ^ O ) 12 13
Vgl. Tichy (1988). Vgl. Montague (1974).
186
Pavel Materna
Eigenschaften der Individuen: d.h. W -» (Z
(/ — O))
Eigenschaften der Klassen von Individuen: ο)—Οι d-h. IV
(Z - » ( ( / - » 0 ) -
O))
„Individuelle Begriffe" (Churchs „individual concepts", Tichy's „individual offices"): F¡, d.h.
W ( Ζ I )
n-gliedrige (empirische) Beziehungen zwischen Individuen: Í/X...X/—0, d.h. W
(Z -> ((/ χ ... χ /) -
0))
u.s.w. Die Theorie der Intensionen ermöglicht uns z.B. zwischen Wahrheitswerten und Propositionen ( = Wahrheitsbedingungen), Klassen und Eigenschaften, Individuen und „individuellen Begriffen", mathematischen und empirischen Beziehungen zu unterscheiden. Daher können wir wohl sagen: Eine Proposition ist eine Art des Gegebenseins eines Wahrheitswertes, eine Eigenschaft ist eine Art des Gegebenseins einer Klasse, ein „individueller Begriff" ist eine Art des Gegebenseins eines Individuums, im allgemeinen dann: Die Funktionen Fa sind Begriffe der Gegenstände der Kategorie a. Begründung: Wenn Begriff eine Art des Gegebenseins eines Gegenstandes ist, dann bedeutet das, daß der Begriff etwas ist, was „zwischen" dem Ausdruck und dem Gegenstand steht und was den Gegenstand „zu identifizieren strebt". (Diese Identifizierung kann nämlich scheitern — z.B.der Begriff der größten natürlichen Zahl ist doch ein Begriff, obgleich er keinen Gegenstand — hier: keine Zahl — identifizieren kann.) Wir könnten daher davon ausgehen, daß die Intensionen auch „zwischen" dem Ausdruck und dem Gegenstand stehen und im gewissen Sinn den letzteren zu identifizieren „versuchen". So die Eigenschaft S C H W A R Z identifiziert die Klasse der aktuell schwarzen Gegenstände: es sei eine mögliche (speziell: die „aktuelle") Welt im bestimmten Augenblick gegeben — der Wert der genannten Eigenschaft in dieser Welt-Zeit ist eben eine Klasse von Individuen, nämlich von solchen, die in dieser Welt-Zeit schwarz sind. Dasselbe kann von jeder Intension gesagt werden: Jede Intension, als eine Funktion von möglichen Welten in die Chronologien von Gegenständen, kann als „identifizierendes Mittel" aufgefaßt werden. Der Gegenstand, der mittels einer Intension identifiziert wird, ist einfach der Wert dieser Intension in der aktuellen Welt (im gegebenen Augenblick). Eine Intension kann natürlich ein „gegenstandsloser
Logik und Begriff
187
Begriff" (Bolzano) sein, wenn sie nämlich in der aktuellen Welt im gegebenen Augenblick nicht definiert ist, z.B. der Begriff des (heutigen) französischen Königs; gegenstandslos könnte man auch eine solche Eigenschaft (Begriff) nennen, deren Wert in der aktuellen Welt-Zeit eine leere Menge ist, z.B. der Begriff des Wassermannes u.s.w. Leider gibt es ernste Argumente, die zeigen, daß die Auffassung, deren nach Begriffe Intensionen wären, unhaltbar (oder mindestens wesentlich kontraintuitiv) ist. Einer dieser Argumente kann vom wohlbekannten Paradox der Analyse oder vom Paradox der Allwissenheit abgeleitet werden 14 . Um nur diese letztere anzuführen, stellen wir uns vor, daß der folgende Satz wahr ist: (2)
X weiß, daß 2 = 2.
Nun wissen wir, daß folgendes gilt: (3)
2 = die erste
Primzahl,
Wenn (3) eine Gleichheit ist, deren Glieder den Begriff der Zahl 2, bzw. den Begriff der ersten Primzahl bezeichnen, dann is es klar, daß falls diese Begriffe Intensionen sein sollten, nur ein Begriff da ist, nämlich die Funktion, die jeder Welt-Zeit die Zahl 2 zuordnet. Da also der Ausdruck die erste Primzahl mit demselben Begriff verbunden ist wie der Ausdruck 2, kann man in (2) die entsprechende Substitution für eines der Vorkommnisse des Ausdrucks 2 durchführen und eine Form des Paradoxes der Allwissenheit wird unvermeidlich. Dieses Beispiel kann nur als Anfang einer allgemeinen Kritik jener Auffassung dienen, deren nach Begriffe Intensionen seien. Wir fühlen nämlich, daß der Ausdruck zwei wirklich mit einem anderen Begriff verbunden ist als der Ausdruck die erste Primzahl. Wenn wir den Begriffen die Charakteristik (1) geben, dann ist es klar, daß was nur diese Art des Gegebenseins im Falle des Begriffs ZWEI ist, ist sie doch nicht mit der Art identisch, auf welche die Zahl 2 mittels der Begriffe DAS ERSTE und PRIMZAHL „gegeben" ist. Daraus folgt, daß der Grund der Tatsache, daß ein Begriff nicht einfach eine Intension sein kann, darin besteht, daß Intensionen keine Teile haben. B e m e r k u n g : Wir dürfen nicht vergessen, daß Intensionen hier als Funktionen (in dem Sinn Abbildungen) aufgefaßt werden. Daher können wir nicht von einer Struktur einer Intension sprechen, mindestens nicht in dem Sinne, daß z.B. die Proposition, daß Berlin größer als Jena ist, solche „Teile" enthielte, die den Begriffen von Berlin, Jena und dem Begriff GROßER ALS entsprechen würden. Das ist schon daraus klar, daß die Proposition, daß 14
Vgl. z.B. Bealer (1982).
Pavel Materna
188
Jena kleiner als Berlin ist, genaue dieselbe Proposition ist, obgleich hier ein anderer Begriff (KLEINER ALS) vorkommen sollte.-
6
Begriffe als strukturierte Entitäten
Die Problematik der Begriffe hängt eng mit der Problematik der Bedeutung oder des Sinnes zusammen. Wie wir schon festgestellt haben, sie sollen Teile haben, also strukturiert sein, ebenso wie meaning15. Diese Forderung war übrigens schon für Bolzano selbstverständlich; für ihn waren die „nicht-einfachen" Begriffe immer zerlegbar, und zwar nicht nur „konjunktiv" in die traditionellen „Merkmale", sondern ganz allgemein, wobei der Begriff selbst sich von seinem Inhalt so unterschied, daß er die Komponenten des Inhalts auf eine bestimmte Weise kombinierte (vgl. EIN GELEHRTER SOHN DES NICHTGELEHRTEN VATERS gegenüber EIN NICHTGELEHRTER SOHN DES GELEHRTEN VATERS). Bealer 16 sieht den Unterschied zwischen Intensionen (die er jedoch nicht als Funktionen auffaßt) und Begriffen darin, daß ein Begriff eindeutig und nicht zirkulär definiert wird; für uns ist dieser Unterschied sekundär, da er eine Konsequenz der Strukturiertheit der Begriffe ist. Es fragt sich dann, wie man am besten die geforderte Strukturiertheit der Begriffe erzielt, um die logische Behandelbarkeit der Begriffe zu sichern. Uns scheint es optimal den Apparat der transparenten intensionalen Logik17 zu benutzen, wo der Schlüsselbegriff der Konstruktion definiert wird. Hier werden wir nicht diesen Apparat definieren — dies würde einen neuen Vortrag erfordern. Wir begnügen uns daher mit einer globalen Intuition. Es sei folgender arithmetischer Ausdruck gegeben: (4)
6+ 3
Es wird häufig angenommen,daß (4) die Zahl 9 bezeichnet („denotational semantics"18). In diesem Fall wird es unbegreiflich, warum die folgende Gleichheit doch interessant ist: (5)
6 + 3 = λ/8Ϊ
Die obenangeführte Auffassung der Semantik führt hier zu einer Analogie des Fregeschen Problems: (5) besagt nämlich — dieser Auffassung nach — daß 9 = 9. 15
Vgl. Vgl. 17 Vgl. 18 Vgl. 16
Cress (1985). z.B. Bealer (1982). Tichy (1988). Girard (1990).
Logik und Begriff
189
In der Wirklichkeit besagt (5) etwas anderes: daß nämlich das „Rechnungsschema", das durch 6 + 3 kodiert ist, zu demselben Ergebnis führt wie das durch \ / 8 Ï kodierte „Rechnungsschema". So können wir sagen, daß (4) eine außersprachliche „Prozedur" kodiert, und zwar als eine Sequenz von (mathematischen, nicht sprachlichen) Schritten: Identifizierung der Zahlen 6 und 3, Identifizierung der Funktion + , und Anwendung dieser Funktion an das geordnete Paar der beiden Zahlen. (Diese abstrakte „Prozedur" hat wenig zu tun mit der wirklichen mentalen Tätigkeit.) Demgegenüber ist die durch \/8T kodierte „Prozedur" eine gänzlich verschiedene: diesmal handelt es sich um Anwendung der Funktion ^ an die Zahl 81. Also gibt es zwischen dem Ausdruck (z.B. 6 + 3) und dem „Ergebnis" (oder: „Gegenstand", hier: die Zahl 9) noch eine außersprachliche Entität, deren Struktur auf irgenwelche Weise mit der Struktur des Ausdrucks verbunden ist („Kodieren"). Diese Entitäten werden wir Konstruktionen nennen und sie global folgenderweise charakterisieren:
Konstruktionen sind außersprachliche nicht mentale Entitäten, die aus η „Schritten" bestehen, η > 0, und die zu höchstens einem Objekt führen. (Sie können auch zu keinem Objekt führen, wie das Beispiel 3 : 0 zeigt.) Was hier ein bißchen metaphorisch charakterisiert wurde, kann mit mathematischer Exaktheit definiert werden 19 . Es zeigt sich, daß die Konstruktionen zur semantischen Deutung der Ausdrücke der natürlichen Sprache dienen können; was für den Fall der einfachen arithmetischen Ausdrücke gezeigt worden ist, kann in dieser Richtung verallgemeinert werden. Da wir den erwähnten Apparat hier nicht definieren können, gebe ich nur ein Beispiel einer logischen Analyse eines Satzes mittels dieses Apparats zusammen mit einer verbalen Erklärung: Der Satz sei:
(6)
Die Hauptstadt chien.
von Osterreich ist größer als die Hauptstadt
von Tsche-
Der Einfachheit wegen setzen wir voraus (was wahrscheinlich nicht ganz adäquat ist), daß die Städte und Länder (Staate) Individuen sind (d.h., daß deren Typ I ist). Die typentheoretische Analyse ergibt dann:
19
Vgl. z.B. Tichy (1988), Materna (1992).
Pavel Materna
190 Gegenstand:
Typ:
Ö(sterreich)
/
Variablen:
T(schechien)
I
w
W
t
Ζ
H(auptstadt) W -» (Z G(rößer als)
(/ -» /))
W -» (Z -» ( / χ /
0))
Die zugehörige Konstruktion ist dann (7)
Au>Af[[K7u>]]*]«Ö] [[[·Ηιν]ί] ·Τ]]
oder verkürzt XwXt[*Gwt·0][rf^
·Γ]]
Kommentar: i) Die Konstruktionen · Χ , wo X ein Gegenstand (im breitesten Sinne) ist, sind sog. Trivialisierungen, die eben den Gegenstand X konstruieren („primitive Begriffe"). ii) XwXtA, wo A eine Konstruktion ist, konstruieren („global", nicht exakt formuliert) eine Funktion, die jeder möglichen Welt (w !) eine Chronologie (t !) jener Gegenstände zuordnet, die — im allgemeinen von Wert Verteilung abhängig — durch A (in der gegebenen Welt-Zeit) konstruiert werden. iii) Die „Schritte", die in (7) durch die nach XwXt folgende Konstruktion gegeben („vorgeschrieben") sind, können ungefähr folgenderweise beschrieben werden: Der Begriff (s.i)) der Beziehung 'größer als' wird an das Paar der Begriffe a) HAUPTSTADT VON ÖSTERREICH und b) HAUPTSTADT VON TSCHECHIEN abhängig von Welt- und Zeitvariablen angewendet, wobei a) ( b) ) als eine ähnliche Anwendung des Begriffs HAUPTSTADT and das „Individuum" ÖSTERREICH (TSCHECHIEN) entsteht. Das Ergebnis dieser komplexen Anwendungen ist ein von den Variablen w,t abhängiger Wahrheitswert. Zusammen mit Punkt ii) heißt das, daß (7) eine Proposition konstruiert, die in solchen Welten und Zeitpunkten wahr ist, wo das Individuum, das die Hauptstadt von Österreich ist, größer ist als das Individuum, das die Hauptstadt von Tschechien ist. Die exakt definierte Struktur von (7) definiert eben die Wahrheitsbedingungen, die wir mit dem Satz (6) intuitiv verbinden, iv) Merken wir wohl, daß in (7) jedem Ausdruck aus (6), der 'semantisch selbständig' ist, ein 'Begriff' entspricht, d.h. eine Konstruktion, die keine freien Variablen enthält. (Um dies genau zu sehen, müßte man jedoch (7) als eine 'Reduktion' einer mehr komplizierten Konstruktion ansehen. Die einzelnen Begriffe sind dann:
Logik und Begriff • G , ·Η, «Ö, ·Τ, XwXt[»Hwtä],XwXt[»Hwt
191 ·Τ]
und - vielleicht - die ganze Konstruktion (7). Was hier noch wichtig ist, ist die Tatsache, daß die resultierende, mit (7) bezeichnete Konstruktion logisch behandelbar ist und daß die Weise, auf welche wir sie erhalten, prinzipiell als durch eine Menge von Regeln vorstellbar ist. Diese Regeln sind verschieden für verschiedene Sprachen ( „ G r a m m a t i k Abhängigkeit"); die Konstruktion selbst ist jedoch eine logische, nicht eine sprachliche Konstruktion. Nun können wir unseren Definitionsvorschlag formulieren:
Vorläufige Definition Ein Begriff * ist eine Konstruktion ohne freie Variablen. — (So z u m Beispiel XwXt[tfwtä] ÖSTERREICH.)
ist der Begriff DIE H A U P T S T A D T VON
Es zeigt sich jedoch, daß diese Definition nicht befriedigend ist: z.B. wenn wir andere (durch λ) gebundene Variablen benutzen, erhalten wir eine andere Konstruktion, aber intuitiv wird es sich um denselben Begriff handeln. So z.B. wenn w' eine Variable der möglichen Welten ist, die verschieden von w ist, d a n n würden wir doch sagen, daß die Konstruktion Xw' Xt[»Hw>t*O] wieder dieselbe Rolle spielt wie die obenangeführte. Nun ist es möglich eine reflexive, symmetrische und transitive Beziehung zu definieren, die eben solche Konstruktionen verbindet, deren Unterschied vom S t a n d p u n k t der BegrifFsdefinition irrelevant ist. Diese Beziehung ( „ Q u a s i - I d e n t i t ä t " , „Quid" 2 0 ) ermöglicht uns den Begriff folgenderweise zu definieren:
Definition Ein Begriff ist die Menge von solchen Begriffen*, die untereinander in der Beziehung Quid stehen. — So z.B. der Begriff DIE H A U P T S T A D T VON Ö S T E R R E I C H wäre d a n n die Menge { λ ι υ λ ί [ » H w t « Ö ] , Au)Ai'[«// W (-«Ö],
Xw'Xt[*Hw,t*Ö],
Xw'Xt'[»Hw.fÖ],
...}
XwXt"[•Hwt»«Ö],
Ein (sinnvoller) Sprachausdruck repräsentiert einen Begriff (d.h. bezeichnet ein beliebiges Element der zugehörigen Menge von Begriffen*) oder - falls er h o m o n y m ist - eine Menge von Begriffen 21 . 20 21
Vgl. Materna (1992). Vgl. Materna (1992).
192
Pavel Materna
Die ganze logische (logisch-semantische) Analyse der natürlichen Sprache kann dann von dem Begriff des Begriffs ausgehend aufgebaut werden.
Literatur Bealer, George (1982), Quality and Concept Clarendon Press, Oxford. Bolzano, Bernard (1837), Wissenschaftslehre /., Seidel, Sulzbach. Church, Alonzo (1956), Introduction to Mathematical Logic /., Princeton University Press, Princeton. Cresswell, Max J. (1985), Structured Meanings: The Semantics of Prepositional Attitudes, MIT Press, Cambridge, Mass. Frege, Gottlob (1891), Funktion und Begriff, Pohle, Jena. Frege, Gottlob (1892a), Uber Begriff und Gegenstand, Vierteljahrschrift für wissenschaftliche Philosophie, 16, 192-205. Frege, Gottlob (1892b), Uber Sinn und Bedeutung, Zeitschrift für Philosophie und philosophische Kritik, 100, 25-50. Girard, Jean-Yves (1990), Proofs and Types, Cambridge University Press, Cambridge, Mass. Materna, Pavel (1992), Meanings are Concepts, From the Logical Point of View, 2, 76-89. Montague, Richard (1974), formal Philosophy, ed. by Thomason, Richmond H., Yale University Press, New Haven. Tichy, Pavel (1988), The Foundations of Frege's Logic, de Gruyter, Berlin/New York. Weitz, Morris (1988), Theories of Concepts, Routledge, London/New York.
G E R H A R D TERTON
Über das Verhältnis von Beispiel und Begriff bei Frege und Wittgenstein 0
Einleitung
Sowohl Frege als auch Wittgenstein haben sich ausführlich mit dem Verhältnis von Beispiel und Begriff beschäftigt. Die dabei angebotenen Lösungsvorschläge sollen nachfolgend dargestellt und miteinander verglichen werden. Ein Ausgangspunkt für beide Denker war die Behandlung dieses Verhältnisses durch die traditionelle BegrifFsauffassung. Nach dieser Auffassung werden Allgemeinbegriffe über die Merkmale der nächst übergeordneten G a t t u n g und über die artbildenden Unterschiede einer Begriffspyramide näher bestimmt. Das Definiens der Definition eines Allgemeinnamens nennt mehrere gemeinsame Merkmale, die allen Gegenständen, die durch den Namen bezeichnet werden und nur diesen, gemeinsam zukommen. Dabei bilden diejenigen Gegenstände, auf die der Name anwendbar ist, Beispiele für den Begriff. Beispiele sind dabei vorwiegend illustrativ zu verstehen. Sie tragen nichts zur Bestimmung des Begriffs bei. Letztere ist durch die Definition gegeben. Die Beispiele erläutern und illustrieren lediglich den begrifflichen Anwendungsfall. Dabei ist es mehr oder weniger belanglos, welchen der bezeichneten Gegenstände man als Beispiel auswählt. Als Beispiele für den Begriff sind sie alle durcheinander ersetzbar, sofern es sich um einen klar bestimmten Begriff handelt.
1
Freges Bestimmung des Verhältnisses von Beispiel und Begriff
Frege präzisiert die traditionelle Begriffsauffassung. Für ihn ist die prädikative Funktion eines Begriffswortes das Wesentliche am Begriff. Beispiele für einen Begriff sind demnach durch alle Einsetzungen gegeben, die aus einer den Begriff repräsentierenden Aussagefunktion eine wahre Aussage machen. Analog dazu können Eigenschaftsbegriffe als Beispiele für einstellige Funktionen und Relationsbegriffe als Beispiele für mehrstellige Funktionen gelten. Aus dieser Sicht scheinen Beispiele keine andere Funktion zu haben als das schon innerhalb der traditionellen Auffassung der Fall war.
Gerhard Terton
194
Darin erschöpft sich jedoch nicht Freges Auffassung zum Verhältnis von Beispiel und Begriff, denn Frege benutzt neben der illustrativen Beispielverwendung auch argumentativ relevante Beispiele. In solchen Fällen werden Beispiele zumeist für Widerlegungszwecke genutzt. In diesem Zusammenhang sei an Freges Kritik der Weierstraß'schen Definition der Zahlen als „Reihen gleichartiger Dinge" erinnert. 1 Das Weierstraß'sche Kriterium des Zahlbegriffs erfüllen nach Frege als Beispiele sowohl ein Eisenbahnzug als auch ein Bücherbord. Es entsteht dann die Frage, wie man mit solchen Beispielen die Operation der Multiplikation ausführen soll, die doch von Zahlen wiederum zu Zahlen, also zu einer Reihe gleichartiger Dinge führen soll, wofür es unter Beibehaltung der Weierstraß'schen Definition keine positive Lösung gibt. Darüber hinaus liefert diese Definition auch keine Antwort auf die Frage, wie Zahlen bzw. Zahlengrößen entstehen, obwohl sie das zu leisten vorgibt. 2 Auch dies wird am Beispiel der Entstehung eines Eisenbahnzuges (als einer bestimmten Weierstraß'schen Zahl) ad absurdum geführt. 3 Das Beispiel wurde von Frege bewußt so ausgewählt, daß es aufzeigt, daß wichtige operative Leistungen, die der ZahlbegrifF in der Arithmetik zu erbringen hat, mit dieser Definition nicht zu erbringen sind. Es bezieht sich somit auf einen Begriff, der als ein theoretisches Konstrukt zu verstehen ist und der sich damit von der traditionellen Auffassung des Begriffs als bloßes Klassifikationsinstrumentarium unterscheidet. Es gibt bei Frege einen weiteren Fall von Beispielanwendung, der ebenfalls über die bloße Illustration hinausgeht. Gemeint ist hier der Beispielgebrauch zum Zwecke der näheren Bestimmung von Grundbegriffen und von logisch einfachen Gegenständen (wie Wahrheitsprädikat, Funktionsbegriff, Gedanken oder die Beziehung zwischen Begriff und Gegenstand sowie zwischen Sinn und Bedeutung). Für Begriffe, die sich auf das logisch Einfache beziehen, gibt es nach Frege keine exakten Definitionskriterien. Es handelt sie hierbei um etwas Ursprüngliches, dessen Zurückführung auf anderes nicht mehr möglich ist. Vielmehr ist das Eigentümliche dieser Prädikate nur „... durch Vergleichung mit anderen ins Licht zu setzen." 4 Konkret geht es ihm um Unterscheidungen und Abgrenzungen zwischen dem Schönheitsund dem Wahrheitsprädikat, zwischen Gedanken, Vorstellungen und Gegenständen, die ihrerseits Vorstellungen auslösen, zwischen Gedanken und Scheingedanken. Zur Begriffsbestimmung benutzt Frege Beispiele und Gleichnisse, die normalsprachlich formuliert sind, die Unterschiede und Übereinstimmungen, erläutern und verdeutlichen, die uns „Winke" geben, wie ein Ausdruck zu Frege Frege 3 Frege "Frege 1
2
(1914, (1914, (1914, (1897,
111). 116 f.). 119 f.). 41 f.).
Über das Verhältnis von Beispiel und Begriff
195
verstehen ist. Dabei appelliert er an das Sprachgefühl, bzw. an die Sprachkompetenz. So weist er darauf hin, daß man von zwei Gegenständen, die man schön findet, wohl sagen kann, daß man den einen schöner findet als den andern, während man dies von zwei wahren Gedanken nicht sagen kann. 5 Ahnlich ist Freges Vorgehensweise beim Vergleich von Vorstellungen und von wirklichen Dingen oder von Vorstellungen und Gedanken. Um zu verdeutlichen, daß man Vorstellungen nicht sehen kann wie wirkliche Dinge, bemerkt er: „Ich mache mit einem Begleiter einen Spaziergang. Ich sehe eine grüne Wiese; ich habe dabei den Gesichtseindruck des Grünen. Ich habe ihn, aber ich sehe ihn nicht." 6 Vorstellungen zählen nach Frege nicht zu den logisch einfachen Gegenständen, aber sie stehen dem logisch Einfachen sehr nahe, so daß sie leicht mit diesem verwechselt werden können. Deshalb ist die Abgrenzung von ihnen ein notwendiges Mittel zur genaueren Charakterisierung von logischen Gegenständen. Der Zugang zu diesen Gegenständen erfolgt über die normale Sprache, die jedoch, wie Frege des öfteren bemerkte, nicht nach dem „logischen Lineal" gemacht ist. Deshalb muß man die Sprache „reinigen", wenn man zu den logisch einfachen Gegenständen gelangen will. Soll etwa der gleiche Gedanke in verschiedenen sprachlichen Umhüllungen oder in den verschiedenen emotiven Einbettungen wiedererkannt werden, darf man sich nicht „... durch anhängende Verunreinigungen dazu verleiten lassen, da Unterschiede zu sehen, wo keine sind." 7 Verschiedenheiten sind nur dort in Betracht zu ziehen, wo sie wesentlich für Gesetzmäßigkeiten sind, auf die man in der logischen Forschung abzielt. Das bedeutet jedoch keineswegs, daß von den Verschiedenheiten in undifferenzierter Weise abstrahiert wird. Anhand der Beispielsätze „Dieser Hund hat die ganze Nacht geheult" und „Dieser Köter hat die ganze Nacht geheult", die den gleichen Gedanken ausdrücken, spricht Frege über „Winke", sich den Gebrauch des Wortes „Köter" in einer bestimmten Weise vorzustellen. Er spricht davon, daß sich Worte „gleichgültig" oder „nicht gleichgültig" gegenüber gewissen Gefühlen verhalten können. Er verweist auf emotiv wertende Komponenten im Wortgebrauch. 8 Auf diese Weise wird die sprachliche Hülle nicht einfach „abgestreift", sondern sie wird auf ihre Komponenten hin analysiert und in ein semantisches und pragmatisches Hintergrundwissen eingeordnet, zu dessen Strukturierung die Diskussion der Beispiele beiträgt. Darüber hinaus tragen die Beispiele zur Abgrenzung der Grundbausteine seines theoretischen Konzepts bei. Sie beziehen sich also auch hier auf theoretische Konstrukte und bilden ein zwar unvollkommenes aber auch das einFrege Frege 7 Frege 8 Frege 5
6
(1897, (1918, (1897, (1897,
45). 351). 61). 58).
Gerhard Terton
196
zig mögliche sprachliche Charakterisierungsmittel für abstrakte Objekte, die im weiteren Verlauf der Forschung zum Ausgangspunkt für die idealisierende und axiomatische Vorgehensweise werden. (Die Bestimmung der Grundbausteine geht bei Frege bekanntlich dem Systemaufbau voraus.) Insofern unterscheidet sich Freges Beispielgebrauch in der Zielstellung von der des späten Wittgenstein, der mit seinem Beispielgebrauch den Rahmen der Normalsprache nicht zu überschreiten gedenkt.
2
Beispiel und Begriff beim späten Wittgenstein
Die normale Sprache ist für Wittgenstein nicht hintergehbar. Es geht ihm insbesondere darum, herauszufinden wie unsere Sprache „arbeitet", um auf diese Weise Einsichten über die sprachlichen Quellen begrifflicher Verwirrungen zu gewinnen, die für Wittgenstein der Ausgangspunkt für traditionelle philosophische Probleme sind. Zentrale Begriffe der Wittgensteinschen Sprachphilosophie wie der Begriff der Sprache selbst und der Begriff des Spiels, die zugleich stellvertretend für Allgemeinbegriffe angesehen werden können, werden nicht durch Definitionskriterien sondern über Beispiele eingeführt. Dies wird u. a. damit begründet, daß die übliche Vorgehensweise, Allgemeinbegriffe zu bilden, uns von vornherein dazu verpflichtet, nach gemeinsamen Merkmalen zu suchen, weil wir dazu aufgefordert werden, davon auszugehen, daß allen etwas gemeinsam sein muß, was tatsächlich oft gar nicht der Fall ist. Die unmittelbare Folge eines solchen Vorgehens ist eine verächtliche Haltung gegenüber dem Konkreten und dem Einzelfall, eine oft unzulässige Nivellierung des Konkreten und Besonderen sowie die vorschnelle Verallgemeinerung in Verbindung mit der Annahme unbegründeter Wesenheiten. 9 All dies erweist sich bei näherer Analyse als Ausgangspunkt für philosophische Verwirrungen und Fehleinschätzungen, die Wittgenstein vermeiden will. So ist seine Kritik an der traditionellen Begriffsauffassung hauptsächlich philosophisch motiviert und nicht wissenschaftstheoretisch wie bei Frege. Für Wittgenstein ist es nun generell nicht das Allgemeine, das den Begriff konstituiert, sondern es sind die Beispiele, die diese Funktion haben, wobei hier mit Beispielen die verschiedenen Gebrauchsweisen eines Allgemeinnamens gemeint sind, die nicht im Hinblick auf ihre Gemeinsamkeiten, sondern unter Beachtung ihrer sich mannigfach überkreuzenden Ähnlichkeiten und Verwandtschaftsbeziehungen zu einer begrifflichen Einheit zusammengefaßt werden. Wittgenstein verwendet hierfür (mit Blick auf die durch Verwandtschaft hervorgerufenen Ähnlichkeiten der Mitglieder einer Familie) den Namen FaWittgenstein (1980, 37 f.).
Über das Verhältnis von Beispiel und Begriff
197
milienahnlichkeit. Das Exemplifizieren der Beispiele und das Beschreiben der Ähnlichkeit ist hier, wie Wittgenstein in seinen „Philosophischen Untersuchungen" (PU) hervorhebt, keineswegs ein indirektes Mittel der Erklärung in Ermangelung eines Besseren (etwa einer Definition), sondern vielmehr ein eigenständiges und adäquates Beschreibungsmittel des Gebrauchs. 1 0 Somit sind es in der Tat die Beispiele, die bei ihm den Begriff konstituieren. Der Begriff reicht zunächst so weit wie die Beispiele reichen. Neu hinzugefügte Beispiele bereichern den Begriff, da sie uns veranlassen, die bisherigen Beispiele auch im Lichte des jeweils neu Hinzugefügten zu sehen, was auf zusätzliche Überlappungen und Verwandtschaftsbeziehungen hindeuten kann. Insofern wird in der „Philosophischen Grammatik" im §36 der Begriff (oder die Bedeutung eines Allgemeinnamens) durch die Facetten des Namengebrauchs bestimmt, wobei erläuternd hinzugefügt wird: „Es ist aber gerade der Zusammenhang dieser Facetten, ihre Verwandtschaft, was hier einen Begriff erzeugt." 1 1 Wenn man die Gebrauchsweisen als Beispiele beschreibt und wenn man hinzufügt, man solle sie in einem bestimmten Sinn verstehen, so gibt man damit zugleich Hinweise zur potentiellen Erweiterung der Beispielfälle, d. h. aus gegebenen Beispielen sollen weitere entwickelbar sein. Dadurch wird angezeigt, daß sich hinter den Beispielfällen stets Regeln des Gebrauchs verbergen, die im Sprachspiel eingeübt werden. Diese Regeln sind aber nicht so beschaffen, daß sie den Gebrauch eindeutig regeln. Die Familienähnlichkeitsbegriffe sind nicht nur offen und damit zur Beispielerweiterung fähig; sie sind zugleich unscharf, weil der Gebrauch es ebenfalls ist. Dennoch bemerkt Wittgenstein, daß dies keineswegs ein Mangel ist. „Zu glauben, diese Begriffe wären darum unbrauchbar, oder doch ihrem Zweck nicht ganz entsprechend, wäre ebenso, als wollte man sagen: „... die Wärme, die dieser Ofen gibt, ist nichts nutz, weil man nicht weiß, wo sie anfängt und wo sie aufhört." 1 2 Auch sei es völlig unangemessen, scharfe Grenzen zu ziehen, da sich diese zum natürlichen Sprachgebrauch verhalten würden „... wie scharfe Konturen in einer Federzeichnung zu den allmählichen Übergängen von Farbflecken in der dargestellten Wirklichkeit." 1 3 Die begriffliche Unschärfe hat ihre Grundlage in den Lebensumständen, in denen es viele Situationen gibt, die durch Unschärfe gekennzeichnet sind. Eine Sprache, deren Gebrauch auf die Tätigkeit und auf die Lebensumstände bezogen ist, muß demzufolge Unschärfephänomene als normal ansehen, was Grenzziehungen nicht ausschließt, falls es die Zwecke erfordern. Freges Begriffsauffassung erfüllt aus Wittgensteins Sicht einen solchen speziellen Zweck. Den allgemeinen Geltungsanspruch dieser Begriffsauffassung lehnt
"Wittgenstein 11 Wittgenstein ^Wittgenstein ''Wittgenstein
(1990, (1991, (1991, (1991,
277). 77). 120). 120).
198
Gerhard Terton
Wittgenstein jedoch ab, zumal er diese Auffassung für essentialistisch belastet hält. Der Fregeschen Metapher vom Begriff als „einem scharf begrenzten Bezirk" setzt Wittgenstein analoge, den umgangssprachlichen Gebrauch charakterisierende Wendungen wie „Halte Dich ungefähr hier auf!" oder von den „ineinander fließenden Farben" entgegen, die den BegrifFsumfang ebenfalls metaphorisch umschreiben sollen. 14 Inzwischen ist vieles über Wittgensteins Familienähnlichkeit geschrieben worden. Die Analyse dieser Arbeiten wäre ein Gegenstand für eine gesonderte wissenschaftliche Untersuchung. Die meisten dieser Arbeiten sind jedoch dadurch gekennzeichnet, daß sie die Forderungen, die Wittgenstein an Familienähnlichkeitsbegriffe stellt, nicht genau genug erfüllen oder daß nur Spezialfälle von Familienähnlichkeit herausgegriffen werden, die dann ziemlich präzise erfaßt werden, während andere Fälle von Familienähnlichkeit unberücksichtigt bleiben. 15 Solche Präzisierungen sind sicherlich zulässig. Ihre Fruchtbarkeit muß an speziellen begrifflichen Ordnungsleistungen nachgeprüft werden. Sie haben jedoch weder zu einem adäquateren Verständnis von Wittgensteins Begriff der Familienähnlichkeit geführt, noch haben sie zusätzliche Informationen über die Beziehung von Beispiel und Begriff erbracht. Auf einen bislang unbeachteten Gesichtspunkt dieser Beziehung verweist demgegenüber Joachim Schulte in seinem 1990 erschienenen Buch „Chor und Gesetz". Hierin wird Wittgensteins Vorgehensweise in der Begriffsbildung und in der begrifflichen Ordnung mit Goethes morphologischer Methode verglichen, was eine sachliche Berechtigung hat, denn Goethe und Spengler haben nachweislich einen Einfluß auf Wittgensteins Denken ausgeübt. 1 6 Nachweisbar ist auch, daß in Wittgensteins begrifflichen Untersuchungen Vergleichsverfahren, die auf Ähnlichkeiten und Verwandtschaftsbeziehungen beruhen ebenso eine Rolle spielen wie Gruppierungen um Musterformen, wobei ein Muster in der Regel ein herausgehobener Beispielfall ist, der stufenhöher angesiedelt ist als die begriffsinternen Beispiele und der als Maßstab oder als Norm für die Eingruppierung konkreter Fälle dient. 1 7 Zugleich gibt es solche Vergleichsobjekte wie das Sprachspiel, das als Grundphänomen bzw. als Maßstab und Ordnungskriterium der Sprachanalyse und des Sprachvergleichs dient. Im ordnenden Denken von Wittgenstein spielen auch Ableitungen nach Gestaltprinzipien, die Suche nach hypothetischen Zwischengliedern in einer Reihenordnung eine herausragende Rolle, die alle im morphologischen Denken Goethes (insbesondere in dessen Metamorphosenlehre sowie der Typenlehre und in der Lehre von den Urphänome14
Wittgenstein (1991, 120). Pawlowski (1980, 199 f.), Koj (1969, 141f.). 16 Schulte (1990, 33 f.). 17 Wittgenstein (1952, 281 f.). 15
Über das Verhältnis von Beispiel und Begriff
199
nen) ihre Entsprechung haben. Eine stichhaltige Begründung für eine solche Entsprechung hat Joachim Schulte in seinem oben genannten Buch geliefert.
3
Abschließende Bemerkungen
Wenn m a n aus dieser Sicht die sog. G r u n d p h ä n o m e n e (Sprachspiel, Lebensform, Sprache), die begriffliche Bausteine des Wittgensteinschen Denkansatzes sind, mit dem Logischeinfachen bei Frege vergleicht, so läßt sich in beiden Fällen sagen, daß sie nicht weiter reduzierbar sind, was im Detail Verschiedenes bedeutet. Freges Begriffe für Logischeinfaches sind nicht auf Einfacheres zurückzuführen und d a m i t nicht definierbar. Wittgensteins G r u n d p h ä n o m e n e stehen a m E n d e jeden Vergleichs. Man kann zu ihrer Beschreibung nicht in sinnvoller Weise auf andere Vergleichsobjekte zurückverweisen. Die Funktion der G r u n d p h ä n o m e n e erschöpft sich weitgehend in der Erstellung begrifflicher Ordnungen. Ihre Charakteristik bleibt auf dem Niveau der normalen Sprache, die für Wittgenstein nicht zu hintergehen ist. Freges Begriffe, die sich auf das Logischeinfache beziehen, haben eine andere Funktion. Sie liefern elementare Bausteine zur Konstituierung von Theorien, und sie führen zu abstrakten Gegenständen, die mit den Mitteln der normalen Sprache nicht mehr ausreichend charakterisiert werden können. Der Beispielgebrauch ist in diese Funktionen eingebunden. Bei Frege weisen die Beispiele, sofern es um Beispiele zur Verdeutlichung des Logischeinfachen geht, den Weg zu den idealisierten Objekten. Bei Wittgenstein dienen sie der Ubersicht und der Durchschaubarkeit der normalen Sprache sowie der Konstituierung begrifflicher Ordnungen. Dabei wird deutlich, daß sowohl Frege als auch Wittgenstein eine kritische Position gegenüber der traditionellen Begriffsauffassung und dem d a m i t verbundenen Beispielgebrauch einnehmen. Zur Uberwindung dieser Position beschreiten beide Denker aber verschiedene Wege.
Literatur Frege, Gottlob (1914), Logik in der Mathematik. In: Schriften zur Logik, Akademie-Verlag, Berlin 1973, 93-165. Frege, Gottlob (1897), Logik. In: Schriften zur Logik, Akademie-Verlag, Berlin 1973, 37-74. Frege, Gottlob (1918), Der Gedanke. Eine logische Untersuchung. In: Kleine Schriften, hrsg. v. Angelelli, Ignacio, Wissenschaftliche Buchgesellschaft, Darmstadt 1967.
200
Gerhard Terton
Koj, Leon (1969), On defining meaning families. Studia Logica XXV, 141-150. Pawlowski, Tadeusz (1980), Begriffsbildung und Definition, Berlin/New York. Schulte, Joachim (1990), Chor und Gesetz, Suhrkamp, stw 899, Frankfurt a. M. Wittgenstein, Ludwig (1980), Das Blaue Buch. Eine philosophische Betrachtung. Rhees, Rush (ed.), Suhrkamp, stw 313, Frankfurt a.M. Wittgenstein, Ludwig (1990), Philosophische Untersuchungen. In: Werkausgabe Bd. 1, Suhrkamp, stw 501, Frankfurt a. M. Wittgenstein, Ludwig (1991), Philosophische Grammatik. In: Werkausgabe Bd. 4, Suhrkamp, stw 504, Frankfurt a. M.
A R T O SIITONEN
Frege and Critical Thinking
1
Introduction
A hundred years ago, in 1893, Gottlob Frege published the first volume of his most extensive and ambitious work, Die Grundgesetze der Arithmetik. T h e second volume appeared ten years later; the planned third volume was never completed. In Grundgesetze, Frege gave a new account of his logical calculus, previously presented in Begriffsschrift (1879) and applied in Die Grundlagen der Mathematik (1884). Frege introduced in Grundgesetze a theory of classes which, unfortunately, contained a contradiction, as was m a d e clear to Frege by Bertrand Russell in a letter which Frege received when t h e second volume was already in print. In Grundgesetze Frege also m a d e use of his theory of sense and reference, which he had developed in his article Uber Sinn und Bedeutung, published in 1892. In this article, Frege used t h e term ' WahrheitswerV (truth-value) — which he had introduced one year earlier in his article Funktion und Begriff — and in fact initiated a new branch of semantics. T h e idea of Grundgesetze is to show how arithmetic can be developed from purely logical premises. The machinery needed for the accomplishment of this task consists of definitions, basic laws and rules of inference. T h e definitions introduce the concepts to be employed in the basic laws, t h e latter being propositions not derived from other propositions. T h e rules of inference specify how to advance from one proposition to the next. Frege's work makes heavy reading — not least because of its cumbersome symbolism. But the long preface is written in an enjoyable style. It contains fresh insights into mathematical, logical and philosophical thinking. Frege strongly argues in favour of logical objectivism: 'to be true' is different from 'taken to be true', and 'to follow from given premises' is not t h e same as 'taken to follow from them'. He characterizes his method as a "gapless procedure" — which means that there should not be gaps in t h e chains of inference which carry on t h e reasoning. He explains an i m p o r t a n t distinction which is made throughout the book: paragraphs entitled "Construction" and those entitled "Analysis." T h e former contain the proofs whereas t h e latter preliminarily outline the proofs and are thus "meant to facilitate understanding."
202
Arto Sii tonen
Also the gapless procedure is intended by Frege to serve the purpose of making understandable. All of Frege's books and articles can be seen as exercises in critical thinking. It is true that they have not been written for pedagogical purposes, but through them one can learn precise reasoning and accurate analysis. Begriffsschrift can instruct one how to build up a formalized system of logic and how the basic ideas of modern symbolic logic actually developed. Grundlagen tells how to ask fundamental questions of definition and how to evaluate the answers. Grundgesetze, finally, introduces an idea as simple as can be: how to make reasoning transparent. T h a t there nevertheless — in spite of all carefulness of its author — was a contradiction in the system, shows that even the most pedantic reasoning may result in an impasse. Not only modern logic but also modern theories of argumentation are based on the ideas which Frege developed. Below, the main concern will be the relation of Grundgesetze and of other works by Frege to the critical thinking courses which belong to the curriculum of many universities and which have an interdisciplinary character. First, Frege's idea of a scientific method in mathematics will be analysed and generalized. Then a far from exhaustive but not unrepresentative survey of the standard literature on critical thinking and argumentation is made, to the effect of finding out how Frege's contributions have been considered in it. Finally, some themes are discussed and questions posed.
2
An Idea and its Applications
Frege argued in his Grundgesetze and elsewhere in favour of "the ideal of a strictly scientific method in mathematics." This ideal or idea is more general than the program of logicism — of deriving mathematics from logic — and does not fall if the requirements of logicism are given up. In the philosophy of mathematics, logicism has been challenged by formalism and intuitionism, the dispute being still unsettled. The fruitful effects of the logicist program on the foundational studies of mathematics are undeniable. T h e program showed mathematical reasoning in a new light. Mathematics was seen and can still be seen as a well advanced application of logical procedures. Whether it is "nothing but logic", is debatable, however. Frege characterizes his ideal as follows: The ideal of a strictly scientific method in mathematics, which I have here attempted to realize, and which might indeed be named after Euclid, I should like to describe as follows. It cannot be demanded that everything be proved, because that is impossible; but we can require that all propositions used without proof be expressly declared
Frege and Critical Thinking
203
as such, so that we can see distinctly what the whole structure rests upon. After that we must try to diminish the number of these primitive laws as far as possible, by proving everything that can be proved. Furthermore, I demand — and in this I go beyond Euclid — that all methods of inference employed be specified in advance; otherwise we cannot be certain of satisfying the first requirement. 1 With his characteristic modesty, Frege continues: "This ideal I believe I have now essentially attained. Only in a few points could one be any more exacting." 2 To sum up, the Grundgesetze proclaims the strictly scientific method as a threefold undertaking; one has to (i)
name the axioms (the unproven assumptions)
(ii)
reduce the number of axioms as much as possible
(iii) specify all methods of inference to be used in research The connexion between (iii) and (i) is that if you tacitly assume and use some inference pattern which has not been listed under your "rules of inference", you may not notice whether you rely on some further basic assumption than those which you have explicated as axioms. The reduction task (ii) contributes to an economy of thinking. After a mathematician has conscientiously done the tasks (i)-(iii), he (she) has a firm tool kit to work with and can proceed to deriving theorems and proving them. The proven theorems make up the proven assumptions. Accordingly, we have here a picture of the so-called hypothetico-deductive method. It is a truth-preserving procedure which concludes proven assumptions from unproven assumptions. T h e program (i) - (iii) can be generalized as an explication claim: (EC) It is desirable to make explicit the premises, the conclusions, and the methods of reasoning. As simple as EC may sound, it is often as complicated in practice to simplify the field in accordance with the claim. Critical comments have been made to Frege's own success in his undertaking to unravel the basic laws of arithmetic. Frege himself was one of the hardest critics of the system presented in Grundgesetze when he admitted that the basic law (V) is disputable. It was precisely this law which turned out to be vulnerable, as Russell was able to show in his 1902 letter to Frege. Frege conceded in the Appendix II to the second volume of his book that the law lacks "self-evidence which the others possess." 3 'Frege (1964, 2). Frege (1964, 2). 3 Frege (1964, 127). 2
204
Arto Siitonen
As can be seen in the generalized form of Frege's claim, the EC above, there is nothing that would require the restriction of his idea to mathematics. Rather, EC makes sense in all fields of research and argumentation. It may be noted that Frege had published already in 1882 an article Uber die wissenschaftliche Berechtigung einer Begriffsschrift, in which he says that logical relations reappear everywhere. He claims that a concrete presentation of forms of thought has a significance which surpasses the limits of mathematics. 4 Frege also says of his work in Grundgesetze: "And that which is not its least value, the rigorous avoidance of gaps in the chains of inference, will, I fear, win it little thanks." 5 He claims that "my gapless procedure even facilitates understanding, once the obstacle of the novelty of the signs is overcome." 6 This obstacle, we now know, proved harder than Frege might have thought, but one has to concede to Frege that the gapless procedure really deserves a high rating. Chains of deductive inference can be inspected in comparing them to the idea (ideal) of gapless procedure. As to the claim concerning understanding, one may generalize it and say the following: Logical understanding means seeing how the propositions making up a chain of inference are connected to each other. Making logically understandable is to show how the transition from premises to conclusions is justifiably made. Improved logical understanding is reached by way of filling up the possible gaps in chains of inference.
It is not necessary to restrict the idea of gapless procedure to deductive reasoning. In all cases in which a given evidence sustains conclusions to be drawn on the basis of it, one may try to tighten the connexion between what is supposed and what is concluded. A valid deduction can be called a strictly gapless inference, while non-deductive reasoning procedures can be more or less cogent according to the degree of probability which is preserved in them. The logical problem of induction may be expressed as a question of determining cogency in respect to validity, the latter being strict gaplessness in the Fregean sense.
3
On Critical Thinking Courses and Literature
Critical thinking, argumentation analysis and informal logic form an interconnected area of research and practice which has grown expansively during the last decades. The aim of the critical thinking courses is to improve the 4
Frege (1975a, 97). Frege (1964, 7). 6 Frege (1964, 9). 5
Frege and Critical Thinking
205
reasoning skills of the students and to teach them how to identify and evaluate arguments. Critical thinking programs promise to build up a bridge to connect the so-called "two cultures" of the modern world, science and technology on the one hand, social and cultural studies on the other hand. T h e numerous works and textbooks on critical thinking and argumentation are more or less based on the innovations in modern symbolic logic. Even if Frege's name would not appear in such a book, the spirit of his work is recognizable. Take for instance Max Black's book Critical Thinking. It does not mention Frege, although it pays much attention to conditional argument, interpretation of universal and particular propositions, deductive and other types of argument, definition, truth-value, and to the problem of making arguments explicit. Another example is the book Clear Thinking by Hy Ruchlis. The author is a mathematics teacher; thus one would expect that he speaks of Frege, but he does not. But his themes include logical reasoning (deduction, induction), language and reasoning, definition, semantics. Robert J. Fogelin's book Understanding Arguments does not contain Frege's name, although Fogelin studies in two chapters the formal analysis of argument. His book begins with an analysis of language and of the language of argument. His main sources of inspiration are Austin's theory of speech acts and Grice's theory of conversational implication. In Anthony Flew's Thinking about Thinking, Frege's name does not appear, but his "basic equipment" at the beginning of the book and his reflexion on language contain Fregean ideas. In Merrilee H. Salmon's book Logic and Critical Thinking, Frege is not mentioned, although she studies deductive reasoning, conditional arguments, hypothetico-deductive method. Interestingly and unconventionally, she starts with induction and only after that proceeds to deduction. One may say that all these books are systematically oriented and do not pay much attention to historical questions. Examples of critical thinking books which mention or even discuss Frege's contributions are the following: Robert Blanche, Raison et Discours, Dagfinn F0llesdal/Lars Wall0e/Jon Elster: Rationale Argumentation, Peter Geach: Reason and Argument, Wilhelm Kamlah/Paul Lorenzen: Logische Propädeutik, and Christopher Kirwan: Logic and Argument. Blanche distinguishes between formalistic, operationalistic and reflexive logics. F0llesdal & Co mention Frege when they discuss the foundations of logic and mathematics, logical languages, semantics, speech acts, propositional logic and predicate logic. Kamlah and Lorenzen do not accept the use of the word 'Bedeutung'1 (meaning) in the sense in which it has been taken over from Frege's 1892 article Uber Sinn und Bedeutung-, neither do they accept that the truth-value semantics is called semantics. But they accept Frege's distinction between functions and objects from Frege's 1891 article Funktion und Begriff. They attribute to Frege the invention of the expression " t r u t h -
206
Arto Siitonen
value." When they treat the question how the sense of expressions is affected by their context, they point out to Frege's article Uber Sinn und Bedeutung, to a passus in which Frege makes the same point. 7 In Karel Lambert's and William Ulrich's work The Nature of Argument — of the books mentioned here perhaps the most "Fregean" one — Frege's introduction of quantifiers is analysed and appreciated. The authors say that Frege was one of the first to notice that although such sentences as ( 1 ) "All men are mortal" and (2) "Socrates is a man" have the same grammatical form, they differ from each other in respect to their logical forms. Viz., if you negate (1) and (2), the negation behaves differently in respect to (1) than in respect to (2). The sentences "It is not the case that all men are mortal" and "All men are not mortal" have different truth conditions. Frege suggested that the reason for this anomaly is that, appearances to the contrary, unlike 'Socrates' in 'Socrates is mortal', it is not the function of 'AU men' in 'All men are mortal' to refer to anything at all. Because the truth of 'All men are mortal' does not depend on 'all men' referring to something that is asserted to belong to the set of mortals, then, he said, there is no reason to think that these two different ways of negating the sentence should have the same truth conditions. Frege suggested that 'All men are mortal' is really conditional in form — what it says is that if something belongs to the set of men, then it belongs to the set of mortals. In other words, 'All men are mortal' is true if and only if the set of men is a subset of the set of mortals. 8 T h e title of the chapter in which Lambert and Ulrich discuss Frege's innovation is: "Expansion of the Official Idiom: Syntax." They mean with the expression 'the official idiom' a symbolic language into which arguments presented in colloquial language are paraphrased in order to display the formal relations among premises and conclusions. Expansion of this idiom is needed where the question is not of relations between sentences but rather of the internal structure of the constituent propositions. Lambert and Ulrich show dramatically how Frege was able to penetrate thoughts behind their linguistic expressions and revealed a logical difference which turned out to have revolutionizing consequences. They localize Frege's innovation to his article Uber Sinn und Bedeutung (1892); however, in this article one does not find it. It is true that Frege confronts in the article what he calls "imperfections of language" to a "logically perfect language." But the ambiguity of "all" in respect to negation is presented by him in the article Uber Begriff und Gegenstand, which was written by him in the same year as Uber Sinn 7
K a m l a h / L o r e n z e n (1967, 32 f, 68, 90, 116); Frege (1975b, 42). ' L a m b e r t / U l r i c h (1980, 128).
Frege and Critical Thinking
207
und Bedeutung, and the introduction of quantifiers and their arguments can be d a t e d already to t h e Begriffsschrifl (1879). T h e r e is a movement in argumentation theory which questions whether m o d e r n deductive logic applies, or is applicable, to real-life arguments. One of t h e representatives of this movement is Stephen Toulmin in his book The Uses of Argument. He thinks t h a t formal logicians on the one hand want to systematise principles of sound reasoning and on the other hand subscribe to t h e ideal of logic presented as a mathematized theory, which is sometimes even understood as a system of eternal truths. He considers Frege and Frege's pupil C a r n a p as typical spokesmen for this ideal. T h e relevance of formal logic for our everyday disputes is unclear; there is too deep a difference between working logic and idealised logic. T h e m a t h e m a t i c a l model is t h e questionable ideal of the modern symbolic logicians — indeed, " m a n y logicians probably regard the mathematical ideal of logic as more imp o r t a n t t h a n its practical applicability". 9 For Toulmin, logic is generalized jurisprudence r a t h e r t h a n generalized mathematics. Correspondingly, Ralph H. Johnson and J . Anthony Blair maintain in their book Logical Self-Defense t h a t t h e r e has been a hegemony of formal logic which, however, has been broken with the emergence of informal logic. " W h a t formal logic did teach was t h e ability to work within formal systems, with little thought about t h e applicability of such systems. Slowly some logicians began to question this approach, and one result was the recovery of the informal logic tradition." 1 0 T h e authors speak of good and bad arguments, but refuse to use t h e characterizations 'good deductive argument' and 'good inductive a r g u m e n t ' , i. e. 'valid' and 'cogent' argument respectively. To challenge the customary theoretical foundations of critical thinking a d m i t t e d l y suits the spirit of critical thinking. It is true t h a t symbolic logic has been studied in abstraction from the thinking habits and reasoning powers of individual persons. Thoughts have been distinguished from thinking, as well as from their linguistic expressions. This is how Frege saw logic. B u t he also stressed t h a t logical relations are instantiated in concrete cases: in m a t h e m a t i c s , in our thinking, utterances, disputes. He underlined t h a t logical clarification facilitates and improves understanding. He concentrated on t h e basic theoretical work, and his main concern was m a t h e m a t i c a l reasoning. B u t , to begin with this, is not "a real-life argument" involved, when a m a t h e m a t i c i a n proves a theorem? Moreover, one who would disagree with Frege's interpretation of mathematics may nevertheless apply his s t a n d a r d s of deductive rigour in judging arguments. Perhaps rational procedures can be profitably analysed on t h e basis of jurisprudence, but some of t h e m require considerations of validity. When people draw conclusions and intend 9 10
Toulmin (1974, 177). Johnson/Blair (1983, xiv).
208
Arto Siitonen
them to be the consequences of given or implicit premises, how else to judge their reasoning than by recourse to considerations of validity? Idealizations are built on the basis of factual occurrences, and idealizations can be applied back to practice. Toulmin speaks of data, warrants and conclusions, and of patterns of arguments. He may idealize arguments in a different way than formal logicians do, but he cannot avoid idealizations. For the evaluation of arguments, the question is whether and how the transition from premises, or from data, to conclusions is justifiably made. T h e renovation of the old topics tradition (cf. Aristotle) can only be greeted with enthusiasm. Why be formal, where it is possible to be informal? Johnson and Blair distinguish between premises and conclusion of an argument and speak of inferences. Their only reason against the classical dichotomy between deductive arguments and inductive arguments is that they are "not happy with it". 1 1 This is not a good argument — if one is allowed to use their characterization in assessment; in fact, it is not an argument at all. Moreover — to continue this ad hominem attack — if we are supposed to supply intellectual weapons in order to improve our logical self-defense, why should we voluntarily give up the old well-tested criteria of validity, soundness and cogency, and leave them to the disposal of our opponents?
4
Some Themes and Questions
Arguments are presented in rational discourse in order to back the views of those who construct them, to persuade others and to find agreement on the theme being discussed. Truth may occasionally find its way by itself through the maze of prejudices, opinions and guesses, but it can be helped in this when independent analysis and evaluation of reasons are cultivated. This is also true of the disagreement concerning how to analyse arguments which people actually use in order to make their opinions acceptable. It was Frege's aim in the Grundgesetze to "split up" the transitions which occur in proofs "into logically simple steps". 12 Such division into parts does not entail any claim to the superiority of mathematics among intellectual disciplines. Reasoning consists in transitions; to analyse it is to identify its constituents. Analysis can be accomplished from various points of'view, and constituents may be different in one analysis than in another. There are numerous kinds of reasoning, performed for diversified reasons. You may formalize an argument by means of'symbolic logic, but you can also express it in so many words of colloquial language. Which way is chosen, depends 11
Johnson/Blair (1983, 34). Cf. Frege (1964, 3): "Only if these transitions are split up into logically simple steps can we be persuaded that the root of the matter is logic alone." 12
Frege and Critical Thinking
209
on whether you need a microscope or whether your plain eyes can show you what you want to see. (This is a metaphor of Frege's.) In t h e light of Frege's philosophy, following themes have a special importance for critical thinking: (1)
Colloquial Language and Symbolic Language
One may see in Begriffsschrifl and Grundgesetze an intriguing interplay between natural language expressions and formal language formulae. Formalization of colloquial expressions and interpretation of formalism are not only means of critical thinking but also its objects. T h e challenge posed by informal logicians concerns the adequacy of formalizations for understanding arguments. How far can one "present trains of inference without a d m i x t u r e of words"? 1 3 (2)
T h e Explication Claim and Paraphrasis of Arguments
Regardless of formalizability, the explication claim (EC), introduced above in Sec. 2, is universally applicable. To interpret argumentative prose is to identify in it p a t t e r n s consisting of premises, chains of reasoning and conclusions. According to Frege, logical relations reappear everywhere. But how to display t h e m in concrete cases? And how detailed may those instructions be, which are given in general for the activity of paraphrasing? (3)
Intuition and Calculation
Frege thought t h a t in Grundgesetze he had managed to create a m a t h e m a t i cal calculus which is based on logic alone, without requiring anything known by intuition. Nevertheless, he admitted that his fifth basic law may lead to disputes. Later he was compelled to say that the law is not self-evident like t h e other five laws. To speak of self-evidence — does it not m e a n a concession to intuition? Correspondingly, where Frege speaks of improved understanding, does he not claim t h a t our original intuitions be replaced by b e t t e r intuitions? Moreover, the realm where the chain of definitions and the chain of proofs s t a r t , is not the sphere of calculating reason b u t of intuitive insight. How is t h e latter related to the former?
13
Cf. Frege (1964, 105).
210
Arto Siitonen References
Black, Max (1952), Critical Thinking, Second Edition (First published 1946), Prentice-Hall, Englewood Cliffs, N.J. Blanché, Robert (1967), Raison et Discours, J. Vrin, Paris. Flew, Anthony (1978), Thinking about Thinking, Third Impression (First published 1975), Fontana/Collins, Glasgow. Fogelin, Robert J. (1978), Understanding Arguments, Harcourt Brace Jovanovich, New York. F0llesdal, Dagfinn/Wallöe, Lars/Elster, Jon (1988), Rationale Argumentation, German Edition by Kaiser, Matthias & Meggle, Georg (Originally published as Argumentasjonsteori og vitenskapsfilosofi, Oslo 1977), Walter de Gruyter, Berlin/New York. Frege, Gottlob (1893 and 1903) Grundgesetze der Arithmetik. Begriffsschriftlich abgeleitet, I & II, Verlag von Hermann Pohle, Jena. Frege, Gottlob (1964), The Basic Laws of Arithmetic: An Exposition of the System, partial translation of Grundgesetze by Furth, M., University of California Press, Berkeley. Frege, Gottlob (1975a) Uber die wissenschaftliche Berechtigung einer Begriffsschrift, in: Patzig, G. (ed.): Gottlob Frege, Funktion, Begriff, Bedeutung, Vandenhoeck L· Ruprecht, Göttingen, 91-97 (originally published in 1882). Frege, Gottlob (1975b) Uber Sinn und Bedeutung, in: Patzig, Günther (ed.): Gottlob Frege, Funktion, Begriff, Bedeutung, Vandenhoeck & Ruprecht, Göttingen, 40-65 (originally published in 1892). Geach, Peter (1976), Reason and Argument, Basii Blackwell, Oxford. Johnson, Ralph H./Blair, J. Anthony (1983), Logical Self-Defense Second Edition (First published 1977), McGraw-Hill Ryerson Ltd, Toronto. Kamiah, Wilhelm/Lorenzen, Paul (1967), Logische Propädeutik, Bibliographisches Institut AG, Mannheim. Kirwan, Christopher (1978), Logic and Argument, Duckworth, London. Lambert, Karel/Ulrich, William (1980), The Nature of Argument, Macmillan, New York. Ruchlis, Hy (1962), Clear Thinking, Harper & Row, New York/Evanston. Salmon, Merrilee H. (1989), Introduction to Logic and Critical Thinking, Second Edition (First published 1984), Harcourt Brace Jovanovich, San Diego. Toulmin, Stephen (1974), The Uses of Argument (First published 1958), Cambridge University Press, Cambridge.
ROLF
GEORGE
Argument and Proof Logic can teach us much about validity and proofs, but not much about the n a t u r e of argument. Frege, for instance, remarks t h a t "logical relations are almost always only adumbrated in language, left to guesses, not really expressed." T h e remedy is a carefully developed Begriffsschrift which defines a "strictly circumscribed domain of forms of inferring" and does not, like ordinary language, cover up the difference between "seamless" argumentative progress and argumentative jumps. 1 We see at once t h a t Frege (like most logicians) is interested only in valid arguments, or proofs, t h a t he wants to eliminate enthymemes from precise argumentation. He has no patience with, or even an account of, invalid arguments. It is common logical practice, starting with Aristotle, not even to define "argument", but only "valid argument" or "proof'. A syllogism, says Aristotle, "is a logos in which, certain things having been laid down, something other t h a n what has been laid down follows of necessity from their being so." 2 This practice can be defended. If we were to define first "argument" as a genus, and then "valid argument" as a species, we would invite psychology into t h e very heart of logic. As it is, a well drawn up logic will have clear and precise accounts, both proof and model theoretic, of validity. If we want to cast a wider glance, at enthymemes and fallacies, we think of t h e m as degenerate cases, counterfeits or defective versions of valid arguments. It is at this point t h a t psychology comes in: We ask why it is that certain fallacious arguments manage to deceive, or why we allow certain invalid arguments, i.e. some enthymemes, to have merit. The function of these exercises is to drive a wedge between arguments in the broad sense, and other small literary items, like sonnets and jokes, which on the logician's account all fall into t h e broad class of linguistic forms that are not valid arguments. This broad picture conforms to logical theory, but not to logical practice. Beginning with Aristotle, logicians and others have wanted to talk about invalid arguments and fallacies, not as texts that are not valid arguments, but as arguments t h a t are not valid. In all but the most austere t r e a t m e n t s of logical systems one will find discussions of arguments that fail. When it is claimed, for example, t h a t the disjunctive syllogism is not valid, it is neither 'Frege (1966, 93). 2
APr. 24 b 18.
212
Rolf George
meant (a) that it is not derivable in the system being developed, which is a foregone conclusion, since the system was set up that way, nor (b) that it falls into the broad class of speech acts that are not valid arguments. We find, rather, strategies of rebuttal, argument against argument, which means that (in this case) the disjunctive syllogism is seen as an argument, though not a valid one. It appears, then, that even in rigorous contexts we may wish to speak of arguments in a broader than the official sense. Perhaps speech act theory or linguistics can tell us what an argument is. Here we are told that the unit of linguistic significance is the sentence, or else the uttered sentence or statement. It seems obvious, though, that there are also "argument acts", which appear not to be reducible to sentential speech acts, and indeed do not seem to be discussed in linguistics or the speech act literature. It seems that if we want to know what an argument is, in the broad and generous sense that includes not only valid ones, but enthymemes and fallacies, we find help neither in the definitions of logicians, since they focus on valid arguments, nor in speech act theory or linguistics, since they concentrate on sentences. But perhaps arguments are sentences. Some philosophers have thought so, and have maintained that uttering or grasping an argument is much like understanding a sentence. According to Patzig, "an Aristotelian inference is [...] a proposition having the form of an 'if...then' implication." 3 Kant thought that syllogisms are "indirect judgments", having in mind the first figure, with the minor written first, where one goes "indirectly", by way of the middle term, from the minor to the major term. 4 As often in Kant, no generalization is suggested or, apparently, possible. Brentano subscribed to a similar theory, claiming that there are no cognitive acts other than representing,judging and valuing. He has no account of inferring, concluding, reasoning. His attempt to torture syllogisms into subject-predicate form is a failure. Arguments are sentences neither formally nor psychologically. The former need not be argued; as to the latter: we can understand every sentence in an argument without understanding the argument. Luria has claimed, and Sylvia Scribner has collected evidence, that certain pre-literate peoples find it difficult to grasp any argument whatever, even though they had understood every sentence in it and, indeed, seemed to have no difficulty with understanding sentences. 5 Nor do we understand an argument if we know some additional sentence, viz. that the conclusion follows. We can, in fact, know that something is a valid argument without understanding it. This is, in any case, a familiar enough occurrence, and needs no further elaboration. 3
Patzig (1968, 3). Kant (1762, 48). 5 Cf. Scribner (1977).
4
Argument and Proof
213
Indeed, there is the well known sense in which the point of an argument can be grasped without an understanding of its sentences. One can, however, transfer to arguments some of the techniques of the Austin/Searle analysis of sentential speech acts. Such acts, we are told, have three components: "(a) the uttering of words (morphemes, sentences); (b) referring and predicating; (c) stating, questioning, commanding, promising, etc. 6 Then there are the effects of utterances: someone is persuaded, alarmed, bored. In long familiar terminology these are utterance, prepositional content, illocutionary act, and perlocutionary effects. If we construct analogues of these for arguments, we can ask which of them give arguments their special character: is it content, illocution, or their perlocutionary force? T h e last of these has been popular, sometimes maintained with extravagant exaggeration. Here is the mathematician G.H. Hardy: There is, strictly speaking, no such thing as mathematical proof. [...] We can, in the last analysis, do nothing but point. [...] Proofs are what Littlewood and I call gas, rhetorical flourishes designed to affect psychology...devices to stimulate the imagination of pupils. 7 Others have spoken of the illative force of arguments, a kind of perlocutionary force that moves the mind from premisses to conclusion. Peirce thought of arguments as portraying "a process whereby the premisses bring forth the conclusion." 8 Arguments often have such a force, as well as power to persuade; they are the typical instruments of persuasion. Indeed, it is odd to list persuasion as the perlocutionary effect of sentential speech acts, as Austin and Searle seem to do. Isolated sentences are rarely persuasive, or boring for that matter. In any case, focusing on the illative and persuasive force of arguments does not distinguish them as grammatical entities from other persuasive devices. W h a t about illocution, then? Austin claimed that there are over a thousand English expressions denoting illocutionary acts. One of them is "to argue". 9 But this verb can occur in two types of context: (a) "Samuel Butler argued that Homer was a woman", and (b) "Jevons argued that iron being the cheapest metal and also the most useful, it followed that the most useful metal is also the cheapest." The first of these evidently refers to some other text where Butler issued arguments, so that something like this might be meant: "Butler argued somewhere [in The Authoress of the Odyssey] that Homer was a woman." By contrast, had it been claimed that Butler asserted that Homer was a woman, that sentence might have been all he ever said 6
Searle Hardy 'Peirce 9 Searle 7
(1969, (1929, (1933, (1969,
23). 18). 4.572). 23).
214
Rolf George
on the subject. The distinction between (a) and (b) can be brought out through parataxis, (a) can be put as "Butler argued that: Homer was a woman," but (b) has to be "Jevons argued thus: Iron is the cheapest metal, etc." Only in the latter is the second position of the parataxis occupied by an argument. Thus even if the illocutionary act of someone who presents (and does not just quote) an argument is arguing, the received speech act theory gives an account at best of (a), but not of (b). Just as other illocutionary verbs require grammatical forms appropriate unto themselves, so does "to argue" in sense (b). What then is that form? Sentential speech acts are built upon propositions. Just so an argument (or argument act, if you will) is built upon an argumentative content. I shall suppose that the sentential speech acts involved in uttering an argument are sufficiently well understood; that is, I shall assume that the nature of the sentential acts contained in the argument is clear enough, and that we know what it is to refer, to predicate, and also that we understand what it means for the premisses to be asserted, merely entertained, conjectured. Following tradition, we may set aside the latter issue, since the merit of an argument as argument is not influenced by the illocutionary riders placed on its component sentences. By the text of an argument I shall mean the sentences it contains, focusing only on their propositional content. The text thus consists of sentences and some indication that some of them serve as premisses, another as the conclusion. Evidently a further "grammatical act" comes into play, beyond the individual propositional acts, which determines what the argument is. To illustrate, let A —• A, A .-. A A stand for some text. It could evidently be meant as a case of modus ponens, or of iteration, or perhaps even of the fallacy of asserting the consequent; there is a fair number of yet other possibilities. We take someone to have argued in modus ponens, if we assume that he used the rule "from a conditional and the antecedent of that conditional conclude the consequent of the conditional". This is perfectly definite, but a text of the form A —• B , A .·. Β is not, since it can be derived, by substitution, from several propositional schemata, or be the product of some weird rule other than m.p. Our guesses what argument is intended are often justified. But consider the text "If both Castor and Pollux are in Corinth, then at least one of them is. One of them is not in Corinth, therefore it is false that both of them are." This text does not tell us whether modus tollens is meant, or a predicate logical form. In contrast to the propositional content of sentential speech acts (which can be, but need not be, and as a rule are not, ambiguous) argument texts are essentially ambiguous, in both formal and informal contexts. This can easily be shown. In a formal system, a proof relying on derived rules and theorems
Argument and Proof
215
must be reducible to one that does not. But there is not always a unique primitive version to which it will reduce. Further, primitive proofs, too, can be ambiguous: our example A —• A, A :. A, is primitive if both modus ponens and iteration are primitive rules of the system, and yet ambiguous. Further, any proof can be blown up, furnished with unnecessary steps that make it ambiguous, but don't deprive it of the character of a proof. Such proofs are merely thought inelegant. This ambiguity is a side effect of defining "proof' and "valid argument" in such a way that being a proof is a property of texts. When we say that a sequence of sentences is a proof, we do not claim to have discovered an intended argument, but only that the text can be used to convey some valid argument (one of possibly several). This ambiguity is not worrisome in well constructed formal systems, which are safe, as it were, if they observe the ancient ideals, adumbrated by Frege in the above quotation, of allowing only gapless and cautious proofs. The possibility of ambiguity, in the sense that the reasoner could have meant one of several arguments, will be cheerfully accepted as long as one of them is valid and obvious. The mathematician responds to this ambiguity of proofs with profound lack of interest, even if an argument instantiates dozens or even hundreds of forms (most of them invalid). This tolerance makes it unnecessary to inquire into the argumentative practice of the reasoner, his mental habits, into what was really meant. Logic and mathematics are thus purged of psychology, and allowed to travel the sure path of science, to use Kant's phrase. But the question what determines the precise form of an argument does not quite go away. Outside the noble task of establishing theorems, or laying the foundations of mathematics, there are many contexts in which we want to have arguments disambiguated. Here is a case study: Michael B. Burke, in an article forthcoming in Informal Logic, has combed through numerous logic texts for examples of "denying the antecedent". He discovered that (with one debatable exception) they were all of the form "If A, then B. Not A, so [therefore, etc] not B," the conclusion indicator linking the categorical premiss with the conclusion. They are never of the form "Not A; If A, then B, therefore not B" or variants thereof, leading him to conclude, rightly, that only the categorical sentence is meant to be linked to the conclusion. Burke found the following (which I have slightly changed): Total pacifism is a good principle if everyone follows it. everyone follows it. Therefore it is not a good principle. 10
But not
T h e textbook authors claim that this must be read as a fallacy of denying the antecedent, but to accept this, one must first disabuse oneself of the sense 10
Copi/Cohen (1990, 224).
216
Rolf George
of conviction this text engenders. It surely looks meritorious, if not formally valid. Unless this persuasiveness points to a universal weakness of human reason, there should be another construal of the text. W h a t is the argument? Burke makes the ingenious suggestion that this is an enthymeme with the categorical sentence as the only premiss, the conditional playing a nonpremissary role. My understanding of this (which differs somewhat from Burke's) is as follows. The enthymemic premiss and conclusion share a term "pacifism". It would seem that the enthymeme is valid if every substitution on "pacifism" that makes the premiss true makes the conclusion true. 1 1 But this can't be, since there are many good principles, like giving correct change, that are not followed by everyone. Enter the conditional, which acts as a delimiter. Its import is to allow as substitution instances only principles that are good if everyone follows them, for instance universal trust, universal altruism, and some others. The enthymeme then relies on the unstated, but recoverable, premiss - not that all principles tout court, but all principles of this sort - are such that if not everyone follows them, then they are not good principles. Similar considerations apply to other examples cited by Burke, like "If capital punishment deters murder, then it is justified. But it doesn't and therefore it is not justified." In cases like these we are not interested in finding a proof for some theorem, but in discovering what was argued. What we do discover is the form of the intended argument. The text has been disambiguated when it is determined to which class or form, of arguments it belongs. This disambiguated text stands to the argumentative speech act as the propositional content to the sentential speech act. It is the argumentative content. Several methods of disambiguation can be devised, amongst which the conventional is the most acceptable. That is, we think of arguments as derivable from schemata, and we take the specific form of an argument to be represented by the schema to which it is in fact thought to belong. An argumentative content (I think now only of simple deductive cases) is not just a set of premisses and a conclusion, but a set of premisses and a conclusion understood as derived from a schema. Alternatively, but less satisfactorily, an argumentative content is a set of premisses and a conclusion in which certain extralogical terms are appointed as "variants" - this is the suggestion of Bolzano. 12 But why harp on a point that seems old and familiar, and that everyone must have expected from the beginning of this discussion? Because it is not as familiar as it seems. Consider, for instance, the so-called asymmetry thesis, argued by Massey 13 and others viz. that it is true that arguments 11
George (1972, 114). Cf. George (1992). 13 Cf. Massey (1981). 12
Argument and Proof
217
of valid f o r m are valid, b u t false t h a t a r g u m e n t s t h a t have an invalid f o r m a r e invalid (since they may also have a valid form, and, indeed, every valid a r g u m e n t has some invalid form). In t h e u n d e r s t a n d i n g I propose here this holds only of texts, not of arguments. A disambiguated text, or a r g u m e n t a t i v e c o n t e n t , will have a unique form, and t h e a r g u m e n t will be invalid if t h a t f o r m is invalid. Massey suggests t h a t a reasoner might be vindicated by t h e discovery of forms h i t h e r t o unknown, even to him. I t h i n k , on t h e contrary, t h a t if this were to h a p p e n , a new a r g u m e n t , different f r o m his a r g u m e n t , would be discovered. A final t h o u g h t : I d o n ' t think t h a t determining t h e a r g u m e n t a t i v e content is t h e s a m e as discovering what was meant all along. It is here as with a m b i g u o u s sentences: W h e n Lincoln said "You can fool some of t h e people all of t h e time," did he mean t h a t t h e r e are some people, always t h e s a m e , w h o m you can always fool, or, r a t h e r , t h a t at all times you can find some people you can fool? Most likely, he had neither version specifically in m i n d . J u s t so it is with a r g u m e n t s . To say t h a t an text is seen as belonging to, or derived f r o m , a schema, is not to claim t h a t t h e schema was in t h e m i n d of t h e reasoner before t h e a r g u m e n t was f r a m e d . In t h e ideal case, when I a m face t o face with him, we may take on t h e common job of nailing down t h e a r g u m e n t , not indeed in t h e sense of discovering what was in his m i n d , b u t as an effort of laying down, fixing t h e a r g u m e n t a t i v e t e x t . In o t h e r words, when I say t h a t a r g u m e n t s in t h e narrow sense are fully d i s a m b i g u a t e d , I d o n ' t m e a n to imply t h a t anyone who argues has a perfectly d i s a m b i g u a t e d a r g u m e n t in mind. T h e a r g u m e n t may be not gegeben, b u t aufgegeben. A f t e r some critical remarks, four points have been claimed: (a) W h e n we t h i n k of a r g u m e n t s as speech acts, we take t h e a r g u m e n t a t i v e content to b e fixed in a way t h a t goes beyond t h e text; hence a r g u m e n t s are not j u s t t e x t s , (b) Proofs are texts, (c) T h e a s y m m e t r y thesis does not hold for a r g u m e n t s as here u n d e r s t o o d , (d) Determining t h e a r g u m e n t m e a n t by a t e x t is an interlocutory task, not a psychological discovery. To this m a y b e a d d e d as a final observation (e) t h a t it is a cultural, p e r h a p s a h u m a n , failing t h a t , as a rule, a r g u m e n t s are not unambiguously presented. Bolzano was t h e only logician I know who thought t h a t univocity of a r g u m e n t s should be mandated.
218
Rolf George References
Copi, Irving/Cohen, Charles ( 8 1990), Introduction to Logic, Macmillan, New York. Frege, Gottlob (1966), Logische Untersuchungen, ed. by Patzig, Günther, Vandenhoeck & Ruprecht, Göttingen. George, Rolf (1972), Enthymematic Consequence, American Philosophical Quarterly 9, 113-116. George, Rolf (1992), Concepts of Consequence. In: Olschki, Leo S. (ed.) Bernard Bolzano, Florence, 3-26. Hardy, G.H. (1929), Mathematical Proof, Mind XXXVIII. Kant, Immanuel (1762), Die falsche Spitzfindigkeit der vier syllogistischen Figuren, Akademieausgabe, Vol. 2. Massey, Gerald (1981), The Fallacy behind Fallacies. In: French, P.A./Vehling, Τ.E./Wettstein, H.K. (eds.), The Foundations of Analytic Philosophy, University of Minnesota Press, Minneapolis, 499-518. Patzig, Günther (1968), Aristotle's Theory of the Syllogism, Reidel, Dordrecht. Peirce,. Charles Sanders (1933), Prolegomena to an Apology for Pragmaticism. In: Hartshorne, Charles/Weiss, Paul (eds.), The Collected Papers of Charles Sanders Peirce, Vol 4, Harvard University Press, Cambridge MA. Scribner, Sylvia (1977), Modes of Thinking and Ways of Speaking. In: JohnsonLaird, P.N. and Wason P.C. (eds.), Thinking. Cambridge University Press, Cambridge, 483-500. Searle, John R. (1969), Speech Acts, Cambridge University Press, Cambridge.
LOTHAR KREISER
Freges außerwissenschaftliche Quellen seines logischen Denkens*
Unter außerwissenschaftlichen Quellen werden alle äußeren Beeinflussungen der logischen Komponenten des Denkens eines Wissenschaftlers verstanden, die nicht durch sein Studium und seine wissenschaftliche Forschungs- und Lehrtätigkeit bedingt sind. Zu den außerwissenschaftlichen Quellen zählen in erster Linie Elternhaus und Schule. Ich beschränke mich in diesem Vortrag auf Freges Elternhaus. Freges Eltern gehörten dem Berufsstand des Lehrers an. Sein Vater, Karl Alexander Frege, leitete eine höhere Mädchenschule in Wismar. Seine Mutter, Auguste Wilhelmine Sophia Frege, geb. Bialloblotzky, wirkte ebenfalls als Lehrerin an dieser höheren Mädchenschule. Der Name „höhere Mädchenschule" deutet an, das schon elementar vorgebildeten Mädchen weiterführender Unterricht erteilt worden ist. Da das Mindestalter bei Anmeldung 8 J a h r e betrug, kann man von sehr mäßigen Wissensvoraussetzungen ausgehen. Zu den Unterrichtsgegenständen gehörte auch die G r a m m a t i k der neuhochdeutschen Sprache. Über das Ziel des Sprachunterrichts gibt eine im Februar 1840 erschienene Information K. A. Freges an die Bürger der Stadt Wismar Auskunft; er soll „die Schülerin zum Bewußtsein der Sprachgesetze führen, wodurch für das richtige Sprechen und Schreiben eine sichere Grundlage gegeben und was mehr ist, zum richtigen Denken und zur richtigen Darstellung der Gedanken und Empfindungen der Weg gebahnt wird." [Gedruckt in der Rathsbuchdruckerei von J. G. W. Oesten; Verwendung mit freundlicher Erlaubnis von Herrn Dr. A. Goetze, Wismar.] Genauere Auskunft darüber, wie K. A. Frege seine Schülerinnen und wohl auch seine beiden Söhne in die Grammatik der neuhochdeutschen Schriftsprache eingeführt hat, gibt sein Hülfsbuch zum Unterrichte in der deutschen Sprache für Kinder von 9 bis 13 Jahren, das mir in der offensichtlich seit seiner 1. Auflage unveränderten 3. Auflage aus dem Jahr 1862 vorliegt. Es erschien im Druck und Verlag der Hinstorff'schen Hofbuchhandlung, Wis*Ich bin Frau Prof. Dr. Anita Steube zu besonderem Dank für ihre Interpretation des nachfolgend behandelten Hülfsbuch von K. A. Frege verpflichtet. Von ihr mache ich unmittelbaren Gebrauch bei der sprachwissenschaftlich-historischen Beurteilung dieses Büchleins.
220
Lothar Kreiser
mar und Ludwigslust, mit einem Umfang von 164 Seiten, davon 2 Seiten Vorrede. Um einem Verdacht vorzubeugen: Es liegt mir vollkommen fern, auf entwicklungspsychologischer Ebene eines Individuums das methodologisch Fehlerhafte zu wiederholen, was man auf ideengeschichtlicher Ebene als Extrem kennt, nämlich alles, was einem Wissenschaftler als sein Erkenntnisbeitrag zugeschrieben wird, so in eine Vorgeschichte der betreffenden Einsichten aufzulösen, daß der Wissenschaftlicher nur noch als der — vielleicht sogar eher verwirrende — Verknüpfer an sich schon vorliegender Ideen erscheint. Ich werde mehr Gewicht darauf legen, auf historisch Vorliegendes zu verweisen, das gewisse Einflüsse gehabt haben könnte, nicht aber wie mit dem Lineal eine Linie so ziehen, daß der sachliche Grund für eine bestimmte Auffassung Freges sich aus Kindheits- oder Jugenderlebnissen von ihm ergibt. Es gibt aber — allgemein gesprochen — sehr wohl ζ. B. didaktische Einübungen von Denkweisen, die Konsequenzen für logische Auffassungen haben, wie etwa die ausschließliche Einübung des klassischen Definitionsschemas (Oberbegriff, Artbegriff), weil sie zu nur schwer überwindbaren Denkschematismen führen. Freges Hülfsbuch folgt weder in der Sprachauffassung noch im methodischen Aufbau der durch Karl Ferdinand Becker (1775 - 1849) und Raimund Jakob Wurst (1780 - 1845) begründeten und im Deutschunterricht damals vorherrschenden Richtung an deutschen Gymnasien. Ihr gemäß schritt man am Leitfaden der Formalen Logik vom Satz, dem Satzgefüge und dann der Satzperiode analytisch hin zu den Satzbestandteilen (Wortarten, Wortteilen) und behandelte abschließend die Orthographie. Die Theoretisch-praktische Anleitung zum Gebrauche der Sprachdenklehre von R. J. Wurst aus dem Jahre 1836 (1. Auflage) gibt dafür folgende Begründung: Erkennen gehe vom Erfassen des Allgemeinen aus, das es dann in seiner gliedernden Struktur zu fassen sucht. „Der Satz, als Ausdruck des Gedankens, ist als das organisch gegliederte Ganze anzusehen. Der Unterricht in jeder Sprache muß darum mit dem S a t z e beginnen, und jede andere Belehrung über Einzelnes in der Sprache an die Glieder des Satzes knüpfen; denn der Schüler gelangt nur dadurch zu einer wahrhaften und lebendigen Erkenntnis des Gedankens und der Rede, daß er jedes Besondere nicht als Einzelnes, sondern als G l i e d eines Ganzen (des Satzes) anschauen lernt. Ein Wort hat eigentlich gar keinen Sinn, wenn es bloß als Einzelnes für sich betrachtet, und nicht als Glied eines Satzes oder Satzverhältnisses angeschaut wird." (IV/V) Ganz natürlich erinnert das an G. Freges Kohärenzprinzip: „Nach der Bedeutung der Wörter muß im Satzzusammenhang, nicht in ihrer Vereinzelung gefragt werden." (Die Grundlagen der Arithmetik, Breslau 1884, S. 10)
Freges außerwissenschaftliche Quellen
221
Ganz anders das in zwei Teile untergliederte Hülfsbuch. In die Grammatik führt der erste Teil ausgehend vom Wort über Wortbeugung und Wortart zu Gliederteilen eines einfachen Satzes hin ein. Uber attributive Bestimmungsmöglichkeiten wird der einfache Satz erweitert und die Einführung der Präpositionen erlaubt dann die Erzeugung von Satzgefügen durch Bildung von Nebensätzen. Als letzte Wortart werden die Konjunktionen eingeführt, mit deren Hilfe sich Satzgefüge zu Satzperioden, der Rede, zusammenfügen lassen. Wortbildungslehre, Morphologie und Syntax, das sind die drei großen Bereiche der Fregeschen Grammatik. Die beiden Teile unterscheiden sich aus der Sicht Κ. A. Freges ihrem Schwierigkeitsgrade nach. Der zweite Teil ist teils vertiefende Wiederholung, teils Weiterführung des grammatischen Lehrstoffes (ζ. B. Einführung der Konjunktionen); insgesamt aber ist der Kurs höchst anspruchsvoll und führt ihm zu folgen vermögende Schülerinnen zu einer soliden Kenntnis der Grammatik des Neuhochdeutschen. Bis auf 4 von den 5 Paragraphen des Anhangs (über den Wohllaut) beginnt jeder der 236 Paragraphen mit einem Lehrsatz oder einer Art Regel. Als Anregung für ein aktives Durcharbeiten des gebotenen Stoffes bedient sich K. A. Frege einer damals verbreiteten Methode, dem Aussparen des neu zu lernenden grammatischen Begriffs oder Terminus. Mitunter gelingt einem Leser bereits die Ergänzung aufgrund der folgenden Übungen; im allgemeinen aber muß man den 2. Teil und das Inhaltsverzeichnis heranziehen. In Einzelfällen entstehen doch noch Deutungsschwierigkeiten. Die Terminologie der Schulgrammatik wich von der sprachwissenschaftlichen an den Universitäten jener Zeit erheblich mehr ab als heute. Deutsch als Muttersprache im Unterricht an Volksschulen (einschließlich bürgerlicher Privatschulen) ist anerkanntes Schulfach allgemein erst Ende des 18., Anfang des 19. Jahrhunderts. Zwei, in ihrer Ausfüllung interessante Beispiele aus K. A. Freges Hülfsbuch. Der Paragraph 9 des 1. Teils: „Daß ein Name ein nur nach seinen Gattungsmerkmalen gedachtes Wesen bezeichne, deutet das davorgesetzte Wörtchen „ein" an, welches man - nennt." Die, soll man mit Frege jun. sagen „sättigende Ausfüllung"? lautet: unbestimmter Artikel. Der Paragraph 10 führt u. a. aus: „Wenn ein Gattungsname ein nach seiner Besonderheit gedachtes einzelnes Wesen, also eine Anschauung bezeichnen soll wie ein Eigenname, so wird dies durch Vorsetzen des bestimmten Artikels oder eines Demonstrativs angedeutet." Bei Frege sen. wie bei Frege jun. bedeutet ein Begriffsausdruck zusammen mit dem bestimmten Artikel einen Gegenstand, wenn auch nicht denselben. Ich möchte hier wie auch sonst in diesem Beitrag auf diese Ähnlichkeiten in der Sprach- und Auffassungsweise nichts gründen, außer eben verdeutlichen, welche Richtungsweiser des Denkens G. Frege durch Erziehung mit auf den Weg gegeben worden sind. Manches war
222
Lothar Kreiser
ihm wohl einfach deshalb naheliegend, weil es etwas von ihm schon Bedachtes gewesen ist. Die Macht der Sprache über das Denken setzt eben schon mit dem Spracherwerb ein. Nachfolgend soll nicht auf innerhalb der Grammatik liegende Vorzüge bzw. Nachteile des Hülfsbuches im Vergleich zu anderen seiner Zeit eingegangen werden. Nur das sei vermerkt, daß ζ. B. die Verben nicht die schon in jener Zeit erkannte Stellung unter den Wortarten finden; dafür aber läßt er schon damals üben, was heute erst unter „Valenz eines Verbs" behandelt wird. Daß die Verkleinerungsform allein etwas über die Meinung des Sprechers aussagt (nämlich über seine Sichtweise der Quantität), war jedoch schon zur Zeit von K. A. Frege eine einseitige Auffassung. Ein unmittelbarer Bezug auf das Vortragsthema ist wieder hergestellt, wenn K. A. Frege im Indikativ den Sprachausdruck des Behauptens und im Konjunktiv die Sprachform des Aussprechens von nur Vorgestelltem sieht. (Man vergleiche dazu G. Freges Unterscheidung der Behauptung eines beurteilbaren Inhalts und seines Gedachtseins als bloßer Vorstellungsverbindung im Paragraph 2 seiner Begriffsschrift von 1879.) K. A. Frege behandelt diese Verschiedenheit in der Sprachpraxis unter der Überschrift: Beziehung des Sprechenden zum Satzverhältnisse, und genau in diesem Zusammenhang (unter der Bezeichnung: Einstellungsoperatoren) ist das Thema in der Sprechakttheorie wieder aufgegriffen worden, nun aber unter dem Einfluß von Frege jun. Die Verschiedenartigkeit des Meinens kann anhand grammatischer Unterschiede der Sätze sichtbar gemacht werden; in beiden Fällen liegen Sätze vor, denn (§77): „Jede Darstellung eines Gedankens durch Wortverbindungen behufs der Mitteilung heißt ein Satz." Daß der Satz sprachlicher Repräsentant eines Gedankens ist, war durchgängige Meinung der deutschen Schulgrammatik des 19. Jahrhunderts. Um den Terminus „Gedanke" eingeschränkt auf Aussagesätze aufzugreifen, bedurfte es für G. Frege keines philosophiehistorischen Exkurses; er lag einfach im oben genannten Sinne nahe. K. A. Frege hält eine genaue Unterscheidung der folgenden Ebenen durch: Gegenstandsebene Gegenstände Eigenschaften
Vorstellungsebene Hauptvorstellungen Nebenvorstellungen
Sprachebene Nomen Attribute
und ist bemüht, Regeln für Wortformungen und Wortfügungen, Regeln zur Erzeugung von Redeformen (das sind Sätze, Bitten, Fragen, Aufforderungen) als Sprachzwang zur korrekten Darstellung von Gedanken zu begründen. Seine Sprachsemantik ist nicht sensualistisch, sondern rationalistisch. Die grammatischen Formen folgen nicht im Grundsatz den uns gegebenen Vorstellungen und ihren Verbindungen, sondern um das, was wir meinen,
Freges außerwissenschaftliche Quellen
223
eindeutig für uns und andere versteh- und mitteilbar machen zu können, muß Sprache in einer der jeweiligen uns möglichen Weltsicht angepaßten Weise konstruiert werden. Wir schauen gedankenformend auf die Welt und um unsere Sicht mittels Gedanken mitteilbar zu machen, müssen die Gedanken sprachlich eindeutig fixiert werden. Welt ist, was von ihr praktisch bestätigt gedacht wird. Sprache wird uns nicht in ihren Gesetzen von außen aufgezwungen, sondern unseren Bedürfnissen praktischer Lebensbewältigung folgend durch uns geformt. Im Kontext eines solchen Sprachverständnisses ist nachvollziehbar, daß K. A. Frege von einer Grammatik verlangt, daß sie den Lernenden befähige, „die sämtlichen Sprachgesetze als in einem Grundgesetze enthalten und daraus sich ergebend zu erkennen und so dahin führen, überall im Mannichfaltigen Eins zu suchen und zu sehen, und es in Einem als ein gegliedertes Ganzes zu denken" (Vorwort). Das nicht zu leisten, ist für ihn Hauptmangel aller gängigen Schulgrammatiken und somit der wesentliche Grund für die Abfassung seines Hülfsbuches. Hier liegt wohl der stärkste psychologische, weil imperative Einfluß des Elternhauses auf die Denkweise des heranwachsenden G. Frege: Ordne Wissen nach einem ihm innewohnenden Prinzip! Er erlebt diese Suche im Bemühen der Eltern, Sprache als ein Ganzes zu fassen, das ein nach einem Gesetz entwickeltes System ist. Da das eine Grundgesetz ihr wesensetzend eigen ist, muß alles abgewiesen werden, was nicht auf dieses Grundgesetz bezogen an Begründung für Grammatisches vorgebracht wird. Diese auf ein System gehende und aus einem Prinzip begründende Wissensauffassung hat den Privatdozenten Frege empfänglich gemacht, gleiches an der Mathematik zu versuchen, nachdem er merkte, daß vor allem in ihren Grundlagen vieles nicht mehr einem durchgängigen Prinzip des Beweisens aus einem Grund folgt. Ich sage ausdrücklich: Er wurde empfänglich oder auch aufgeschlossen für etwas, nicht aber: Die durch das Elternhaus am Beispiel der Grammatik eingeübte Denkweise, ein Wissensganzes nach einem ihm eigenen Prinzip zu ordnen, ist die Wurzel des Fregeschen Logizismus. Er hat aufgrund seiner Vorbildung in der Arithmetik einen systematischen Mangel empfunden. Um ihn zu beheben, kam er der Natur der Sache nach auf die Logik, und er kam wohl erst um 1874 auf diese Spur, denn während seines Studiums schien er kein Bedürfnis zu spüren, eine Logik- Vorlesung zu belegen. Gelegenheit dazu hatte er, und ob er nicht doch in Göttingen eine davon wahrgenommen hat, wie G. Patzig vermutet, kann nicht mit Bestimmtheit ausgeschlossen werden. Zur damaligen Zeit waren zudem die Erkenntnis eines logischen Problems und der gefühlte Drang, zu dessen Lösung eine Logik-Vorlesung zu besuchen, mehr als heute zwei verschiedene Bedürfnisse. Im Unterricht an den Schulen und in den Vorlesungen an den Universitäten Deutschlands wurde unter „Logik" ein Gemisch von Metaphysik, Erkenntnistheorie, Me-
224
Lothar Kreiser
thodologie, Psychologie und Didaktik verstanden, dessen mehr oder minder größeres Gemeinsames die Aristotelische Logik war. Statt des Besuches einer Vorlesung genügte die Durchsicht eines Buches, das die unmittelbare Universitätsgemeinschaft als besonders gut lobte. Die Vermutung von G. Patzig kann daher auch in der Weise zutreffen, daß G. Frege ein Buch Lotzes über Logik las. Wollte man bei K. A. Frege näher erfahren, welches dieses eine, allen anderen grammatischen Gesetzen der deutschen Sprache zugrunde liegende Gesetz ist, so findet man dazu keine Angaben. Weder ist der Aufbau seiner Grammatik axiomatisch, noch gibt er Grundsätze an, denen eine grammatische Regelbildung zu genügen hat. Daß aber ein solches Grundgesetz leitende Idee war, erkennt man an scheinbaren Eigenwilligkeiten. So zählt z. B. K. A. Frege unter dem Titel „Beziehung des Sprechenden zum Satzverhältnis" als prädikative Satzverhältnisse auf: Meldung (Behaupten, Nichtbehaupten), Aufforderung, Modalsätze, direkte und indirekte Frage, Konzessivsätze und — merkwürdigerweise — Qualität des Urteils (Negation, Limitation). Im §112 bestimmt er Negation als die Nichtanerkennung der Zusammengehörigkeit von Satzgliedern, also als Wiedergabe einer Sprechermeinung zu einem Satzverhältnis. Er bleibt innerhalb seiner Sprachauffassung: Was ein Sprecher gedanklich meint, muß er sprachlich eindeutig ausdrücken. Die Negation ist seine Meinung über einen sprachlich ausgedrückten Gedanken, also muß sie auch als sprachlicher Akt verstanden und definiert werden. K. A. Frege bedient sich auch des Mittels bildlicher Darstellung ( „Buchstabenbilder") grammatischer Zusammenhänge. In dem Satz „Alles rennet, rettet, flüchtet" kommen drei gleichrangige Verben vor, die zusammengenommen durch „alles" näher bestimmt werden. Frege sen. stellt das wie folgt dar: a: Β = C = D (§67). Den höchsten Rang im Satz hat das Verb. Es ist allen anderen Satzgliedern übergeordnet. Die Ordnung der Satzglieder (wie des Hauptwortes, des Adjektivs, des Adverbs) wird festgelegt und von den Schülerinnen eine Ubersetzung von Sätzen in Buchstabenbilder verlangt. Frege sen. bedient sich dabei auch der zweidimensionalen Darstellung, so für die beigeordnete Unterordnung von Adverbien unter ein Verb, wie in: Gieb gern und bald, durch A b = c (§90). Auf die buchstabenbildliche Darstellung von Satzgefügen und Satzperioden soll hier bloß referierend eingegangen werden, denn wiederum soll lediglich auf den bewußten Ansatz zu einer Pasigraphie bei K. A. Frege hingewiesen und damit nur die Feststellung verbunden werden, daß seinem ältesten Sohn die Idee einer (auch zweidimensionalen) Symbolschrift nicht
Freges außerwissenschaftliche Quellen
225
unbekannt war. Die reiche Tradition der Pasigraphie in Jena bekommt G. Frege durch K. Fortlage (1806 - 1881) vermittelt, der sich selbst an einer symbolischen Darstellung der Hegeischen Philosophie versucht hatte und dazu offenbar durch den von ihm sehr geschätzten Karl Christian Friedrich Krause (1781 - 1832) angeregt worden ist.
REINHARDT
GROSSMANN
Frege's Fundamental Philosophical Mistakes It is one of the most surprising features of Frege's philosophy t h a t he, who correctly analyzed t h e structures of quantified states of affairs, insisted on treating definite description expressions ('the birthplace of Mozart') like n a m e s ('Salzburg') and names like definite description expressions. 1 I shall argue t h a t Frege's original mistake leads to a string of further mistakes. It leads him to hold t h a t names, like definite description expressions, have b o t h a sense and a reference and, eventually, to the view t h â t sentences n a m e truth-values. In short, it results in his much admired sense-reference theory of meaning. I Frege's famous sense-reference distinction for names, it must be emphasized, is quite different from his earlier distinction, in the Begriffsschrift, between "different ways in which a content can be determined". 2 There he argues t h a t we need a sign of identity, because one and the same content can be "determined" in different ways. His example of a geometric point which is given once directly in intuition and once as described in a certain way makes clear what he has in mind. We can put things in a nutshell by saying t h a t Frege calls attention to the important fact that one and the same thing can be described in different ways, so that one has to distinguish between a thing and its description. It is this fact which makes the notion of identity significant. If there were no descriptions, and if there were just one n a m e for every thing, then all true identity statements would simply reduce to the trivial instance of the law of identity A = A.
II This original insight acquires tremendous importance for Frege's later att e m p t to show t h a t arithmetic is analytic. His refutation of Kant rests, among other things, on a number of fundamental identity statements; for ' T h i s mistake, by the way, is perpetuated by the unfortunate current practice of referring to b o t h names and definite description expressions as singular terms. 2 Frege (1967).
Frege's Fundamental Philosophical Mistakes
227
example, on the claim that the number of the concept F is identical with the extension of the concept similar to the concept F . But a statement of this sort is obviously not a mere instance of the law of identity. Rather, it is informative and extends our knowledge. Frege is therefore forced to take another look at his earlier view on identity. 3 This reconsideration leads eventually to his sense-reference distiction. Since one and the same thing can be described in diiferent ways, it is clear, as I said, that one must distinguish between a thing and its descriptions. It is further obvious that one must distinguish between descriptions and the corresponding description expressions. Finally, it is evident that names like 'Salzburg' are not definite description expressions like 'the birthplace of Mozart'. Yet, for a reason that is hard to fathom, Frege treats names and definite description expressions alike in his new discussion of identity. This is his first and most fundamental mistake. I do not think that a satisfactory account of the nature of identity statements is possible, unless one distinguishes sharply, in the spirit of Russell's theory of descriptions, between the following five kinds of fact: (1) A = B, (2) Ά ' represents the same thing as ' f î ' , (3) T h e thing F and the thing G are the same (identical), (4) A is the same as the thing F , (5) T h e description the thing F is the same as the description the thing
G.
Since Frege thinks of definite description expressions as names, he mistakenly comes to believe that they, just like names, represent ("refer") what in reality they do not represent, but describe. According to him, 'the birth place of Mozart', for example, represents, just like 'Salzburg', the city in Austria. But this expression does not represent the city. It represents, rather, the description the birthplace of Mozart. And through this description, it describes the city in Austria. But Frege also realizes that something else is "associated" with the description expression, namely, the description. He therefore concludes that the description expression, in addition to representing the city, also expresses what he calls a "sense". If we assume, for the sake of throwing light on Frege's view, that this sense is the description, then Frege's fundamental mistake consists in assigning to the expression what it describes as its referent. What it in reality refers to, the description, is then said to be "expressed" by the expression. From our point of view, it is not surprising that Frege's relationship between a name and its sense lnust remain rather obscure in his philosophy. Nor is it surprising that he can 3
Frege (1952).
Reinhardt Grossmann
228
claim that names, like description expressions, express a sense in addition to referring to something. Ill Having claimed that names as well as definite description expressions both have a sense and a reference, Frege turns to declarative sentences. This leap from "names" (ordinary names as well as definite description expressions) to whole sentences is suggested by Frege's basic ontological distinction between saturated and unsaturated entities and the corresponding distinction between saturated and unsaturated expressions: Sentences, like "names", are saturated expressions. If sentences, too, are "names", since they are saturated expressions, Frege argues, then they, too, must have a sense and a reference. This is Frege's second fundamental mistake. What is true for description expressions, namely, that we must distinguish between the description represented by the expression, on the one hand, and the thing described, on the other, is neither true for ordinary names nor is it true for declarative sentences. Frege adds to his mistake of extending the sensereference distinction to names the mistake of extending it even further to sentences. As a result of this second extension, Frege now has to find a sense and a reference for declarative sentences. He has at least one obvious kind of entity at his disposal, namely, the complex formed by senses of the expressions in the sentence, that is, what Frege calls a thought. The question then becomes whether this complex is the sense or the reference of the sentence. At this point, Frege presents a straightforward argument: (1)
'2 3 — 1'· and '3 + 4' have the same reference.
Therefore: (2)
'2 3 — 1 > 2' and '3 + 4 > 2' have the same reference.
But these two senteces do not have the same sense, since a person may believe one but n o M h e other. Therefore: (3)
T h e senses expressed by the two sentences cannot be their referents.
Frege's earlier mistake of thinking that what a description expression describes is its referent (is what it represents) has come home to roost. How far Frege has strayed from the truth can best be seen if we contrast Frege's argument with a sound one based, not on the view that a sentence has a sense and a reference, but on our view that it represents a state of affairs which consists of what the expressions in the sentences represent:
Frege's Fundamental Philosophical Mistakes (1)
229
'2 3 — 1' and '3 + 4' describe the same number, but represent different descriptions.
Therefore: (2)
'2 3 — 1 > 2' and '3 + 4 > 2' are about the same number, b u t
represent
different states of affairs. Since they represent different states of affairs, a person may believe the one but not the other. Therefore: (3)
The states of affairs represented by the two sentences are not what the sentences are about, namely, the number 7.
IV What corresponds to our complex state of affairs, very roughly, is Frege's complex sense (his so-called thought). But while we hold that this state of affairs is what the sentence represents, Frege concludes that the complex sense is what the sentence expresses. He must therefore now search for a referent for the sentence. And this leads him, finally, to the rather bizarre view that there are two objects, the true and the false, to which sentences refer. He argues that as soon as we are interested in whether or not a sentence is true, we must turn our attention to the referents of the names in the sentence. This fact, he maintains, indicates that we generally expect that the sentence has a reference. And since it is only in connection with inquiries after the truth-value of a sentence that the question of the reference of names becomes relevant, we are "driven into accepting the truth-value of a sentence as constituting its reference". 4 This, of course, is not a very convincing argument for the contention that sentences refer to truth-values. What it shows is merely that the so-called referents of expressions are important if we inquire into the truth of sentences. In our terminology: The truth or falsehood of a sentence depends on what the words in the sentence represent. Not only is Frege's argument unconvincing, its conclusion clashes with Frege's own thoughts in another context. When Frege considers the question of whether or not concept words, just like names, have a reference, he concludes that they must have a reference "if the whole thought is to be located in the realm of truth". 5 I think that what Frege has in mind is that it stands to reason that the truth-value of a sentence cannot be a function merely of the referents of the names in the sentence. Whether or "Frege (1952, 34). 5 Frege (1969).
Reinhardt Grossmann
230
not a sentence is true cannot depend solely on the objects mentioned in the sentence, but must also depend on what is said about these objects. This consideration seems to be quite reasonable. But it obviously clashes with Frege's claim that sentences refer to truth-values. If the truth-value of a certain sentence depends on what object falls under which concept, then it stands to reason that the sentence refers, not to a truth-value, but to the circumstance, state of affairs, or whatever else you may wish to call it, that the object falls under the concept. How close Frege comes in this unpublished paper to repudiate the view that sentences refer to truth-values can be seen from the following quotation: If we conceive of a singular sentence as being composed of a proper name and the rest, then the proper name has as reference an object, the rest has as reference a concept, and object and concept appear here as in a special connection or relation which we call subsumption. The object is subsumed under the concept. 6 But there is another argument by Frege that clearly shows that his sensereference distinction has been reduced to absurdity when it is applied to declarative sentences. Consider the sentence 'Jupiter is bigger than Mars'. W h a t is this sentence about? Obviously, it is about the referents of 'Jupiter' and of 'Mars'. What it states is that Jupiter and Mars stand in a certain relation to each other. Therefore, according to Frege's reasoning, this relation, too, must belong to the realm of referents. This argument for the contention that relation words (concept words) must have a referent, seems to me to be perfectly sound. Unless relation words have referents, objects cannot be related. But objects are related. Therefore, relation words must have referents in addition to senses. Relations cannot be the senses of relation words, for then they could only connect senses with each other. If the relation of being bigger than were a sense, then it would have to told between the senses of 'Jupiter' and 'Mars' and could not hold between the two planets. But this sound argument also shows that the referents of sentences, what these sentences represent, must be circumstances (states of affairs) rather than truth-values. It clearly shows that what the sentence is about is neither the Fregean thought expressed by it, nor is it the truth-value referred to by it. It cannot be the latter, because truth-values do not consist of planets. But a theory of the meaning of sentences which has no room for what these sentences are about, for example, relations between planets, cannot be correct.
6
Frege (1969).
Frege's Fundamental Philosophical Mistakes
231
References Frege, Gottlob (1952), Über Sinn und Bedeutung, in: Geach, Peter/Black, Max (eds.), Translations from the Philosophical Writings of Gottlob Frege, Oxford, 56-78. Frege, Gottlob (1967), Begriffsschrift, in: Heijenoort, Jan van, From Frege to Goedel. A source Book in Mathematical Logic, 1879-1931, Harvard University Press, Cambridge, 1-82. Frege, Gottlob (1969, 2 1983), Einleitung in die Logik. In: Nachgelassene Schriften, Hermes, Hans/Kambartel, Friedrich/Kaulbach, Friedrich (eds.), Gottlob Frege, Nachgelassene Schriften, Meiner, Hamburg.
MICHAEL-THOMAS
LISKE
Ist die Bedeutung einer Aussage ihr Wahrheitswert oder ein Sachverhalt? So wie sich die singulare Aussage nach Frege in einen ergänzungsbedürftigen Teil, das Prädikat, und einen in sich vollständigen Teil, den Eigennamen, der das ungesättigte Prädikat zu einer Aussage vervollständigt, analysieren läßt, müßte auch die Bedeutung des Satzganzen, das Wahre, eine Analyse in entsprechende -Teile zulassen. Der vom Satzganzen bezeichnete Wahrheitswert müßte also zu seinen Teilen den vom einen Satzteil (dem Eigennamen) bezeichneten bestimmten Gegenstand und den vom anderen Satzteil bezeichneten Begriff haben. Wie soll das beim allumfassenden Wahren möglich sein? Frege hat diese Schwierigkeit gesehen1 und glaubt, eine solche Zerlegung erfordere den „Rückgang zum Gedanken". Erst dieser liefert einen bestimmten Inhalt, der uns einen bestimmten Gegenstand und Begriff zu ermitteln erlaubt. Das aber bedeutet, daß jeder der unzähligen Gedanken, die wir dem Wahren zuordnen können, eine andere Zerlegung erforderlich macht. Wäre nicht viel angemessener, als Bedeutung einer Aussage etwas anzusetzen, das sich für sich genommen in einen einzigen Gegenstand und Begriff zerlegen läßt? Weshalb müssen wir bei der Analyse der Bedeutung auf den Sinn zurückgreifen, der die Sache nicht als solche, sondern nur in einem besonderen Gesichtspunkt erfaßt? Warum sollen wir nicht annehmen, eine Singuläraussage habe zu ihrer Bedeutung einen singulären Sachverhalt, den wir im Geiste Freges als das Subsumtionsverhältnis bestimmen können, daß dieser Gegenstand unter diesen Begriff fällt? Hier müssen wir zunächst prüfen, welche Erwägungen Frege zu der Annahme geführt haben, ein Aussagesatz bezeichne einen Wahrheitswert als seine Bedeutung. Sinn und Bedeutung des Aussagesatzes als eines zusammengesetzten Eigennamens hängen offenbar von Sinn und Referenz seiner Bestandteile ab. Diese Abhängigkeit prüft Frege durch von Substitutionen und läßt sich dabei von der Regel leiten: Worin sich die ersetzten einzelnen Termini unterscheiden, in dem muß auch bei den sie enthaltenden Aussagesätzen ein Unterschied vorliegen. Worin sich die substituierten Bestandteile dagegen nicht unterscheiden, das muß auch bei der Gesamtaussage konstant erhalten bleiben. Zwei einzelne Termini mögen sich lediglich in den Vorstellungen unter1
Frege (1892, 35 f.).
Ist die Bedeutung einer Aussage ihr Wahrheitswert oder ein Sachverhalt?
233
scheiden, die die Hörer — subjektiv verschieden — mit ihnen assoziieren und nicht im Sinn als einem objektivierbaren, d.h. grundsätzlich von mehreren einnehmbaren Erkenntnisstandpunkt. (Wegen dieser Objektivität können wir den Sinn auch als einen Teilaspekt der Sache selbst bewerten, unter dem sie sich dem Erkennenden präsentiert, als eine bestimmte Weise ihres Gegebenseins.) Tausche ich in einer Aussage Eigennamen oder auch Begriffswörter gegeneinander aus, die sich lediglich (wie etwa ,Roß' und ,Gaul') in solchen subjektiven Konnotationen, nicht aber im Sinn unterscheiden, dann bleibt auch der Sinn der Aussage erhalten. Beide Sätze drücken denselben Gedanken aus. Selbstverständlich bleibt bei dieser Substitution auch der Wahrheitswert erhalten. Aber das interessiert nicht so sehr; denn offenkundig kommt es darauf an, das Spezifischste herauszufinden, in dem beide Sätze übereinstimmen. Dies wird wichtig, wenn wir nun in der wahren Aussage „Der Morgenstern ist ein Planet mit einer kürzeren Umlaufzeit als die Erde" für ,Morgenstern' den bedeutungsgleichen, aber sinnverschiedenen Eigennamen ,Abendstern' substituieren, der dasselbe Einzelding bezeichnet, es aber in einer verschiedenen Gegebenheitsweise erfaßt. Beide Aussagen drücken zweifellos einen verschiedenen Gedanken aus, der Wahrheitswert bleibt derselbe. Wir sind aber nur dann legitimiert, kraft dessen den Wahrheitswert als Bedeutung der Aussage zu betrachten, wenn sich nichts Spezifischeres ausmachen läßt, das bei dieser Substitution erhalten bleibt. Offensichtlich bleibt hierbei aber auch der Sachverhalt, wie wir ihn definiert haben, derselbe. In beiden Sätzen sagen wir von derselben Sache (bei der es nicht darauf ankommt, unter welcher Erkenntnisperspektive sie uns gegeben ist), daß sie unter denselben Begriff fällt. Damit dürfen wir nicht wie Frege sagen: Bei Aussagesätzen gibt es dieselben drei Unterschiedsmöglichkeiten wie bei Eigennamen: in der Färbung, im Sinn oder in der Bedeutung. Vielmehr ist ein noch weitergehender Unterschied möglich. Bei zwei Aussagen, die sich in ihrer Bedeutung unterscheiden, also verschiedene Sachverhalte bezeichnen, bleibt zu fragen, ob sie denselben oder verschiedene Wahrheitswerte haben. Wir müssen nämlich bereits bei dem anderen, ungesättigten Satzteil, dem Begriffswort, eine weitere Stufe des Unterschieds annehmen, wenn wir den Fregeschen Ansatz folgerichtig zu Ende führen. Man ist zwar versucht zu sagen: Zwei generelle Termini unterscheiden sich in ihrem Sinn, wenn ihre Definitionen einen verschiedenen Inhalt ausdrücken; sie unterscheiden sich in ihrer Bedeutung, wenn sie verschiedene Klassen als Begriffsumfänge festlegen. Diese Festsetzung ist einwandfrei, wenn wir (wie Carnap) annehmen, ein genereller Terminus bezeichne als seine Bedeutung eine Klasse. Weil eine Klasse nun aber gesättigt, mithin ein Gegenstand ist, glaubt Frege bekanntlich, die Bedeutung eines Begriffswortes im Begriff als einer unvollständigen Entität ansetzen zu müssen. Zwar betont er 2 , der Begriff gehe seinem Um2
Frege (1895, 455).
234
Michael-Thomas Liske
fang voran, d.h. lege den Umfang fest und resultiere nicht bloß aus ihm. Weil er aber glaubt, vom Sinn, auf den er den Inhalt zu reduzieren tendiert, zur Bedeutung vordringen zu müssen, bekennt er sich zur Umfangslogik und ist geneigt, die Identität zweier Begriffe durch ihre Umfangsgleichheit zu definieren. „Was zwei Begriffswörter bedeuten, ist dann und nur dann dasselbe, wenn die zugehörigen Begriffsumfänge zusammenfallen." 3 Dies geht aber bei einem Fregeschen Ansatz nicht an. Weis den Inhalt eines Begriffes ausmacht, können wohl nur seine Merkmale sein. Diese aber sind ihrerseits Begriffe, also Entitäten derselben Art wie der Begriff, dessen Merkmale sie sind. Damit müssen sie als Konstituentien dieses Begriffes gelten und nicht bloß als seine Gegebenheitsweise, d.h. irgendein akzidenteller Teilaspekt, unter dem eine bereits konstituierte Entität in Erscheinung tritt. Zwei Begriffswörter können sich also in ihrer Bedeutung unterscheiden, weil sie zwei durch verschiedene Inhaltsmerkmale konstituierte Begriffe bezeichnen, aber sich doch umfangsmäßig gleichen. Hier ist die Frage berechtigt: Wenn ein unterschiedlicher Begriffsinhalt ein Unterschied der Bedeutung ist, was. ist dann ein bloßer Sinnunterschied? Zu denken ist hier etwa daran, daß ein Mensch als Mann oder als Frau gegeben ist, ein Unterschied, der sicher nicht den Inhalt des Begriffes Mensch berührt, andererseits aber auch nicht bloß subjektiv assoziierte Konnotationen. Bei Begriffswörtern müssen wir demnach über den Bedeutungsunterschied hinaus den Unterschied in der Extension annehmen. Dies bedingt, daß wir auch bei den Aussagesätzen die bereits besprochene weitere Unterscheidungsstufe einführen müssen. Wenn ich zwei kraft der Inhaltsmerkmale bedeutungsverschiedene, aber extensionsgleiche Begriffswörter durcheinander ersetze, bezeichnen die entsprechenden Aussagen verschiedene Sachverhalte, haben also eine verschiedene Bedeutung, der Wahrheitswert aber bleibt in einem referentiellen Kontext erhalten. Daß wir bei der Annahme, ein Sachverhalt sei die Bedeutung des Aussagesatzes, die Identität von Begriffen nicht als ihre Umfangsgleichheit auslegen, ist noch aus einem anderen Grund erforderlich, damit wir die Identität in jedem Fall von der Äquivalenz unterscheiden können. Frege vermag überhaupt nicht, diese Unterscheidung zu vollziehen. Wenn zwei Aussagen den gleichen Wahrheitswert haben, dann haben sie für ihn auch die gleiche Bedeutung, sind mithin identisch zu setzen. Daß alle notwendig wahren Aussagen Identisches bezeichnen, läßt sich bei der Annahme rechtfertigen, nur eine tautologische Aussage könne notwendig sein. Danach stellen alle notwendigen Aussagen gleichermaßen eine Tautologie dar und sind deshalb identisch. Daß jedoch ein logisches Gesetz, das unter allen möglichen Umständen wahr sein muß, mit einer empirischen Tatsachenaussage gleichgesetzt werden darf, die faktisch zwar wahr ist, die aber ebensogut hätte falsch sein können, läßt sich m.E. nicht rechtfertigen. Da das Wahrsein einer Aussage auf so prinzipiell 3
Frege (1969, 133).
Ist die Bedeutung einer Aussage ihr Wahrheitswert oder ein Sachverhalt?
235
verschiedenen Gründen basieren kann wie der logischen Struktur der Aussage selbst und den Tatsachen der Außenwelt, ist die Annahme des Wahren als eines einheitlichen Gegenstandes kaum aufrechtzuerhalten. Die Äquivalenz als gleicher Wahrheitswert ist von der Identität als Gleichheit der bezeichneten Sachverhalte zu trennen. Die Äquivalenz ist nämlich eine wahrheitsfunktionelle Aussagenverknüpfung; wird sie behauptet, so wird wie bei den übrigen aussagenlogischen Funktionen ein Verhältnis zweier verschiedener Sachverhalte (daß sie zusammen bestehen oder beide nicht bestehen), nicht ihre Identität behauptet. Der Sachverhalt, dessen Eigenname der Aussagesatz ist, ist durch den Inhaltsstrich wiederzugeben. Von diesem Bezeichnen eines Sachverhalts ist das Urteil darüber, ob dieser Sachverhalt besteht oder nicht, oder (äquivalent) ob die entsprechende Aussage wahr ist oder nicht, zu trennen. Die Behauptung, der Sachverhalt bestehe (oder dieser Satz sei wahr), die umgangssprachlich dadurch zustandekommt, daß ich ihn innerhalb eines nicht fiktionalen Redekontextes in einem Hauptsatz für sich (und nicht als Teil eines Satzgefüges) aussage, ist durch den Urteilsstrich zu symbolisieren. Bekanntlich hat Frege später 4 den Terminus Inhaltsstrich verworfen, weil in der Konzeption eines beurteilbaren Inhalts das vermengt werde, was er jetzt als Sinn und Bedeutung unterschied. Wenn eine Aussage aber das Wahre oder Falsche bezeichnet, wie soll dann über dieses Bezeichnete geurteilt werden können? Einen bestimmten Inhalt kann ich dadurch auf seine Richtigkeit hin beurteilen, daß ich prüfe, was alles aus seinem Wahrsein folgt. 5 Ein Urteil setzt offenkundig einen einzelnen Inhalt voraus, über den dann nach allgemeinen Urteilskriterien entschieden werden kann. Das Wahre, in dem alles Einzelne verwischt ist, scheint dazu denkbar ungeeignet. Ein bezeichneter Sachverhalt demgegenüber liefert uns einen solchen bestimmten Inhalt; zugleich ist die Differenzierung von Sinn und Bedeutung gewahrt, da er von dem ausgedrückten Gedanken unterschieden ist. Die Teilsätze einer aussagenlogischen Satzverknüpfung bezeichnen den jeweiligen Sachverhalt nur; die durch den Urteilsstrich symbolisierte Behauptung bezieht sich allein a u f das ausgedrückte Verhältnis der beiden Sachverhalte: Zusammenvorliegen (bei der Konjunktion), Vorliegen mindestens eines Sachverhalts (bei der Disjunktion) usw. Ein Sachverhalt läßt sich durch präzise Identitätsbedingungen vom Gedanken einerseits und vom Wahrheitswert andererseits abgrenzen. Für einen Gedanken als eine intensionale Entität gilt folgerichtig auch ein intensionales Identitätskriterium. Sollen zwei Aussagen denselben Gedanken bezeichnen, dann müssen sie auch in allen intensionalen Kontexten wie den epistemischen (abhängig von Ausdrücken des Glaubens usw.) gleichwertig sein. Es muß also ausgeschlossen sein, daß jemand die eine Aussage für wahr, die "Frege (1891, 21), (1893, §5). 5 Frege (1879, §2).
236
Michael-Thomas Liske
andere für falsch hält. 6 Diese Bedingung läuft auf die strikte Äquivalenz hinaus, daß die Gleichheit der Wahrheitswerte sich bereits aus den logischen und semantischen Gesetzen ergibt, die jeder wenigstens implizit in seinem Sprachgebrauch befolgen muß, der einen Gedanken will ausdrücken können. Kraft jener Kenntnisse, die einen allererst befähigen, in (logisch äquivalenten) Aussagen einen Gedanken zu formulieren, ist ihm unmittelbar gewahr, daß sie denselben Wahrheitswert haben müssen, wenn er auch nicht weiß, welchen. Wenn zwei Aussagen (auf Grund logischer Äquivalenz) denselben Gedanken ausdrücken, bezeichnen sie immer auch denselben Sachverhalt. Aber nicht umgekehrt. Wie das Beispiel von Morgen- und Abendstern zeigt, bedarf es zuweilen echter Sachkenntnisse, die über die logische und sprachliche Kompetenz hinausgehen, um festzustellen, daß zwei Aussagen denselben Sachverhalt bezeichnen. Die Identitätskriterien für einen Sachverhalt sind demgemäß eher extensional. Für die Grundtypen der elementaren Sachverhalte (deren Bezeichnung keine wahrheitsfunktionelle Verknüpfung enthält) lauten sie: Ein singulärer prädikativer Sachverhalt ist bei einem identischen Subsumtionsverhältnis derselbe, wenn derselbe Gegenstand unter denselben Begriff fällt. Ein genereller prädikativer Sachverhalt ist derselbe, wenn zwischen denselben beiden Begriffen ein Subordinai ions Verhältnis besteht. Man bezeichnet denselben relationalen Sachverhalt, wenn man dieselbe Beziehung zwischen denselben beiden Gegenständen oder die konverse Relation zwischen diesen beiden Relaten in vertauschter Stellung bezeichnet. Denn bei konversen Relationsausdrücken geht es letztlich um dasselbe reale Verhältnis, das nur von zwei verschiedenen Ausgangspunkten her betrachtet wird. Ob zwei Eigennamen (unter denen Frege auch definite Beschreibungen versteht) denselben Gegenstand bezeichnen, wird in der Regel nur kraft einer nicht-logischen Sachkenntnis gewußt. Ob dagegen zwei generelle Termini für denselben Begriff oder zwei Relationsausdrücke für dieselbe Beziehung analytisch identisch sind, hängt davon ab, ob wir ihre Identität intensional oder wie Frege extensional verstehen. Daß wir die Identität eines Begriffs nicht umfangslogisch verstehen sollten, wird bedeutsam, wenn wir die Allgemeinheit der Äquivalenz zwischen zwei offenen Sätzen aussagen: (Vx)(x ist A = χ ist Β) Hier wird behauptet: Die Einsatzinstanzen der beiden offenen Sätze „ χ ist Au und „x ist £?" bezeichnen, ganz gleich welchen Eigennamen für χ ich einsetze, immer zwei Sachverhalte, die entweder beide bestehen oder beide nicht bestehen. Alle Einsatzinstanzen ergeben zwei Aussagen desselben Wahrheitswerts, weil genau dieselben Individuen unter die von A und Β bezeichneten Begriffe fallen. Wäre die Identität eines Begriffes nun umfangslogisch definiert, dann wären A und Β derselbe Begriff. Die Einsatzinstanzen von „x ist Au und von „x ist Bu bezeichneten für alle χ jeweils «Vgl. Frege (1892, 32), (1918, 65).
Ist die Bedeutung einer Aussage ihr Wahrheitswert oder ein Sachverhalt?
237
denselben Sachverhalt, daß ein und dasselbe Individuum χ unter denselben Begriff fällt. Es bestünde auch Allgemeinheit der Identität, die folglich mit der Allgemeinheit der Äquivalenz zusammenfiele. Was aber ist ein Sachverhalt, den wir (etwa durch eine Teilaussage einer wahrheitsfunktioneilen Aussageverknüpfung) bezeichnen können, ohne ihn als bestehend anzunehmen? Man könnte versucht sein, ihn im Sinne des possibile logicum als etwas in sich Widerspruchsfreies zu verstehen, das in irgendeiner möglichen Welt der Fall ist. Eine Tatsache oder ein bestehender Sachverhalt demgegenüber wäre etwas, das in der wirklichen Welt der Fall ist. Bei diesem Verständnis würden aber auch die dichterischen Aussagen einen Sachverhalt bezeichnen, ohne ihn freilich zu behaupten, und nicht bloß (wie Frege annimmt) einen verstehbaren Gedanken ausdrücken. Sachverhalt und Gedanke könnten auch hier noch durch verschiedene Identitätsbedingungen voneinander geschieden werden. Denn ein Gedanke betrachtet sein Subjekt in einer jeweils bestimmten Gegebenheitsweise. Ein Sachverhalt (der Einfachheit halber beziehen wir uns vor allem auf singuläre prädikative Sachverhalte) demgegenüber betrifft einen individuellen Gegenstand als solchen, ganz gleich unter welcher Beschreibung er gegeben ist. Wenn wir unter Sachverhalten nun jede in sich mögliche Sachlage verstehen, müssen wir sie damit auf mögliche Individuen beziehen — bei Fregeschen Prämissen zumindest ein äußerst problematischer Begriff. Wir sollten einen Sachverhalt vielmehr so fassen, daß er beiden Bedingungen genügt, die Frege 7 an einen Kandidaten für die Bedeutung eines Aussagesatzes stellt, (i) Er soll zu jedem Satz gehören, bei dem es darauf ankommt, daß seine Bestandteile etwas bedeuten, (ii) Er soll bei Ersetzen bedeutungsgleicher Termini erhalten bleiben. Daß ein Sachverhalt der Substitutionsbedingung genügt, ist durch unsere Identitätsbedingungen eines Sachverhalts gewährleistet. Damit auch (i) erfüllt ist, müssen wir ihn als einen Zusammenhang eines wirklichen Gegenstands und eines wohldefinierten Begriffs auffassen. Ein Sachverhalt konstituiert sich nie bloß aus konkreten Gegenständen, sondern aus einem Gegenstand und Begriff, aus zwei Gegenständen und einer zweistelligen Beziehung oder aus mehreren Begriffen. Da er notwendig mindestens eine abstrakte Entität unter seinen Elementen enthält (Begriff, Beziehung), ist der Sachverhalt selbst eine abstrakte Entität und kann im Gegensatz zum Ereignis niemals ein unmittelbarer Bestandteil der konkreten Wirklichkeit sein. Der Unterschied Sachverhalt-Ereignis spiegelt sich denn auch in der sprachlichen Bezeichnung. Während ein Sachverhalt das ist, was von einem Aussagesatz bezeichnet und u.U. behauptet wird, wird ein Ereignis wie ein Gegenstand im engeren Sinn von einem einzigen (scholastisch formuliert) kategorematischen Terminus bezeichnet. Ein konkreter 7
Frege (1892, 35).
238
Michael-Thomas Liske
Gegenstand als etwas, das eine Zeitlang bei allem Wandel in beiläufigen Bestimmungen identisch fortbesteht, wird durch ein echtes Nomen; ein Ereignis als etwas, das sich in einer Aufeinanderfolge von Phasen zeitlich ereignet, wird durch ein nominalisiertes Verb bezeichnet. Wie ein Gegenstand (im engeren Sinne) ist auch ein Ereignis zunächst ein individuelles Ereignis, z.B. der Ausbruch des Vesuv im Jahre 79. Gleichartige Einzelereignisse lassen sich wie artgleiche Gegenstände zu Klassen von Ereignissen zusammenfassen (Vulkanausbrüche). Weil demgegenüber auch ein singulärer Sachverhalt eine abstrakte Entität ist, können wir bestehende und nichtbestehende Sachverhalte als grundsätzlich gleichberechtigt behandeln (ein nichtbestehender Sachverhalt kommt von vornherein nicht als konkrete Entität in Frage); beide sind aus der Wirklichkeit abstrahierte Zusammenhänge von Gegenstand und Begriff. (Auch ein nicht bestehender Sachverhalt ist bei dem entwickelten Sachverhaltverständnis aus der Wirklichkeit abstrahiert, weil er sich zumindest in seinen Elementen auf Wirkliches (existierende Individuen) bezieht, auch wenn der behauptete Zusammenhang nicht in der Wirklichkeit gegeben ist.) Nur weil er eine solche logische Abstraktion ist, kann der Sachverhalt eine logische Funktion erfüllen, die ihn behauptende Aussage wahr oder falsch zu machen, je nachdem ob er sich als bestehend oder nicht bestehend erweist. Der Status einer logischen Abstraktion wird auch an dem sprachbezogenen Charakter des Sachverhalts greifbar. Wir haben den singulären und den generellen Sachverhalt als eine Subsumtion und Subordination respektive bestimmt. Von einer Subsumtion oder Subordination kann man aber nur im Hinblick auf eine prädikative Aussage reden, auch wenn sich nicht rein sprachimmanent entscheiden läßt, ob ein SubsumtionsVerhältnis besteht. — Und so wie ein fiktiver Eigenname bloß ein fiktives Individuum benennt, d.h. bei Lichte besehen gar nichts bezeichnet, sondern dies nur vorgibt, bezeichnen Sätze, die solche bedeutungslose Eigennamen enthalten, überhaupt keinen genuinen Sachverhalt, sondern der Sprecher fingiert dies bloß oder bildet es sich vielleicht auch ein. Frege ist gehalten, das Wahre und das Falsche als Gegenstände zu behandeln. Zum einen, weil er sie als die Bedeutung von Aussagen betrachtet. Als vollständige (gesättigte) Ausdrücke müssen Aussagen auch etwas in sich Geschlossenes bezeichnen, eben einen Gegenstand im Unterschied zum Begriff. Zum anderen ergibt sich dies aus seinem Verständnis des Begriffs als einer speziellen Funktion, die unabhängig vorgegebenen Gegenständen (den Argumenten), je nachdem ob sie unter den jeweiligen Begriff fallen oder nicht, als Funktionswert das Wahre oder das Falsche zuordnet (wenn wir allein singuläre Aussagen in den Blick nehmen). Werte einer solchen Funktion erster Stufe können aber nur Gegenstände sein. Dem einen „Gegenstand" des Wahren entspräche nach unserem Vorschlag das Gesamt aller Einzeltatsa-
Ist die Bedeutung einer Aussage ihr Wahrheitswert oder ein Sachverhalt?
239
chen, die die verschiedenen Begriffe jeweils den Gegenständen zuordnen, auf die sie zutreffen (die unter sie fallen). Dieses Universum all dessen, was je der Fall ist, ist aber insofern unabgeschlossen, als beliebig neue Tatsachen dazukommen können. Erst recht ist das Falsche unbestimmt und unendlich. Bezeichnet ,wahr' dann einen Begriff, unter den sämtliche wahren Aussagen oder Gedanken als Gegenstände fallen? Frege 8 betrachtet dies als einen trügerischen Schein, der entsteht, weil wir von einem Gedanken prädizieren können, er sei wahr. Da Subjekt und Prädikat als Gedankenteile beide der Schicht des Sinns angehören, könne aber durch ein Prädizieren von ,ist wahr' niemals der Ubergang vom Sinn (Gedanken) zur Bedeutung (Wahrheitswert) vollzogen werden. Der Wahrheitsanspruch liege in der behauptenden Kraft, die wir normalerweise der logischen Form eines Aussagesatzes verleihen. Damit sage ich nicht mehr als in der wahren Aussage „2 ist eine Primzahl", wenn ich von dem entsprechenden propositionalen Gehalt explizit ,ist wahr' prädiziere. „2 ist eine Primzahl" ist folglich logisch äquivalent zu jeder der drei Aussagen: (1) „Es ist der Fall, daß 2 eine Primzahl ist", (2) „Es ist wahr, daß 2 eine Primzahl ist", (3) „,2 ist eine Primzahl' ist wahr". In (1) bezeichnet der daß-Satz einen Sachverhalt (ohne ihn als bestehend zu behaupten), in (2) einen Gedanken. Daß wir unterscheiden müssen, ob ein daß-Satz einen Gedanken oder Sachverhalt bezeichnet, wird an Folgendem deutlich. Wird in einem daß-Satz eine indirekte Rede wiedergegeben, oder allgemeiner, hängt der daß-Satz von einem intensionalen Operator ab wie einem Modaloperator, einem epistemischen Operator oder Ausdruck der propositionalen Einstellung (ich glaube, daß), einem deontischen Operator usw., so haben wir einen referentiell dunklen Kontext; die Ausdrücke haben ihre ungerade Bedeutung, so daß wir Ausdrücke, die gewöhnlich dasselbe bedeuten (bezeichnen), nicht immer unbeschadet der Wahrheit gegeneinander austauschen können. Der daß-Satz muß hier also eine intensionale Entität, eben einen Gedanken (propositionalen Gehalt) bezeichnen. In einem daßSatz, der von ,es ist der Fall' abhängt, ist diese Austauschbarkeit von Bedeutungsgleichem salva veritate hingegen stets gewährleistet; der daß-Satz bezeichnet daher keinen Gedanken, sondern einen Sachverhalt. Dessen eher extensionale Identitätskriterien gestatten, wie wir gesehen haben, einen derartigen Austausch. Der daß-Satz bezeichnet also einen bestimmten (einzelnen) Sachverhalt. Das von ihm prädizierte ,es ist der Fall' subsumiert diesen (logischen) Gegenstand unter den Begriff bestehender Sachverhalt oder Tatsache; das Prädikat ,ist nicht der Fall' subsumiert ihn unter den Begriff nicht bestehender Sachverhalt. Da Wahrheit nicht von einem Sachverhalt ausgesagt werden kann, muß der daß-Satz in (2) einen Gedanken bezeichnen. Sonst aber ist alles ganz entsprechend. Das Prädikat ,ist wahr' oder 8
Frege (1892, 34), (1969, 133).
240
Michael-Thomas Liske
¿st falsch' besagt: Der vom daß-Satz bezeichnete Gedanke fällt unter den Begriff wahrer bzw. falscher Gedanke.
Analog subsumiert in (3) ,ist wahr'
die Aussage ,2 ist eine Primzahl', die durch ihr Zitat (in Anführungsstrichen) bezeichnet wird, unter den Begriff wahre
Aussage.
Diesem Ergebnis: Das Wahre ist ein Begriff, unter den einzelne wahre Aussagen oder Gedanken als Gegenstände fallen, ebenso das Falsche, widerstreitet keineswegs Freges richtige Beobachtung: Der Wahrheitsanspruch komme nicht durch ein Prädizieren von ,ist wahr' zustande, sondern dadurch, daß ich (in einem nicht fiktionalen Kontext) eine Aussage bilde. Hiernach können wir das Behauptungsmoment am Prädikat festmachen. Weil das Prädikat kraft seiner ungesättigten Natur den Zusammenhang der Satzteile in einer Aussage garantiert, können wir in ihm (unter den Satzteilen) die Ursache sehen, daß eine Aussage gebildet und damit etwas behauptet wird. In Sätzen mit Prädikatsnomen liegt die Behauptung der Wahrheit in der Kopula ,ist'. Beim Ubergang von gewöhnlichen Aussagen zu Wahrheitsprädikationen vom Typ (3) geschieht daher folgendes. Von dem ersten (objektsprachlich einen Gegenstand (die Zahl 2) unter den Begriff der Primzahl subsumierenden) ,ist', das hier bloß innerhalb eines ohne behauptende Kraft ausgesprochenen Zitats vorkommt, ist der Wahrheitsanspruch auf das zweite metasprachliche ,ist' übergegangen, das die vom Zitat bezeichnete Aussage unter den Begriff des Wahren fallen läßt.
Literatur
Frege, Gottlob] (1879), Begriffsschrift. Eine der arithmetischen nachgebildete Formelsprache des reinen Denkens, Louis Nebert, Halle a. S. Frege, Gottlob (1891), Function und Begriff. Vortrag gehalten in der Sitzung vom 9. Januar 1891 der Jenaischen Gesellschaft für Medicin und Naturwissenschaft, Hermann Pohle, Jena. Frege, Gottlob (1892), Uber Sinn und Bedeutung. Zeitschrift für Philosophie und philosophische Kritik 100, 25-50. Frege, Gottlob (1893), Grundgesetze der Arithmetik, 1. Band, Pohle, Jena. Frege, Gottlob (1895), Kritische Beleuchtung einiger Punkte in E. Schröders Vorlesungen über die Algebra der Logik. Archiv für systematische Philosophie 1, 433-456. Frege, Gottlob (1918), Der Gedanke. Eine logische Untersuchung. Beiträge zur Philosophie des deutschen Idealismus 1, 58-77. Repr. in: Frege (1967), 342362. Frege, Gottlob (1969, 2 1983), Nachgelasse ne Schriften, Hermes, Hans/Kambartel, Friedrich/Kaulbach, Friedrich (Hrsg.), Felix Meiner, Hamburg.
Luis
FERNÁNDEZ
MORENO
Logical Laws and the Word "True" 1
Frege's Claims on the Importance of the Word "True" for Logic
In the first lines of his paper from 1918 Der Gedanke Frege assigns to logic the task of discerning the laws of truth. This agrees with his identification in this paper of logical laws with the laws of truth, suggested by his use in the first paragraph of the expressions "laws of truth" and "logical laws" as equivalent. The paragraph ends with the following statement: The meaning of the word 'true' is spelled out [entwickelt] in the laws of t r u t h [i.e. in the logical laws — L.F.M.] 1 Previously, in one of his posthumous writings entitled Logik, dated by the editors of these writings between 1879 and 1891, 2 Frege had expressed himself in a similar way, although in part more cautiously. There he says: It would not perhaps be beside the mark to say that the laws of logic are nothing other than an unfolding [Entwicklung] of the content of the word "true". 3 Such passages seem to justify the importance of the word "true" for the characterization of logical laws and therefore of logic itself, but other statements by Frege seem to question this impression, particularly the following in his posthumous piece from 1915 Meine grundlegenden logischen Einsichten: [The word — L.F.M.] "true" only makes an abortive attempt to indicate the essence of logic, since what logic is really concerned with is not contained in the word "true" at all but in the assertorie force with which a sentence is uttered." 4 'Textual references of Frege's writings are given, as in this footnote, both by the original German editions and by their English translations. Frege (1918, 59), Frege (1984, 35). 2 Other authors date this paper a little more precisely, e.g. Sluga (1980, 112) around 1884 and Dummett (1991, 75) about 1882. 3 Frege (1969, 3), Frege (1979, 3). 4 Frege (1969, 272), Frege (1979, 252).
242
Luis Fernández Moreno
There is an obvious tension between this passage and the two others quoted, since if the word "true" does not indicate the essence of logic, it would not be proper to characterize logical laws by means of this word. One could perhaps emphasize the fact that the third passage quoted is from an unpublished piece from 1915, while in the paper Der Gedanke, published three years later, Frege supports the importance of the meaning of the word "true" for logical laws and hence for logic; accordingly one might perhaps claim that Frege's position in this paper represents his definitive view on the relations between logical laws — and hence logic itself — and the word "true". On the contrary, I shall argue that Frege's only consistent position on this subject is that expressed in the passage quoted from Meine grundlegenden logischen Einsichten, and that Frege should have regarded his characterization of logical laws by means of the word "true" as irrelevant and even wrong. I shall take as the starting point of my argument Frege's conception of logical laws and laws of truth, and of the relation between them.
2
Logical Laws and Laws of Truth
According to Frege, sciences consist of true thoughts; among these thoughts laws occupy a particularly important position, as laws are general thoughts and contain because of their generality many true thoughts which can be inferred from them. The laws of a science can be regarded as laws of truth about the subject matter of that science. The reason is that every science must consist of true thoughts and the laws of science, whose truth is presupposed, determine which thoughts about its subject matter are true or can be true. In this way every thought about the subject matter of a science which can be regarded as true must agree with the laws of that science. Logical laws differ from the laws of other sciences because they are more general; indeed logical laws are the most general laws, as they hold for every subject matter. In the third part of his paper from 1906 Uber die Grundlagen der Geometrie Frege asserts that logical laws are truths about the references of certain expressions; in this context Frege does not present an exhaustive enumeration of such entities, but limits himself to asserting that logic has its own references and mentions as examples negation, identity, subsumption (of an object under a concept) and the subordination of concepts. 5 These entities are peculiar to logic in the sense that the object of logic is to discover the laws about them; logical laws are true thoughts about such entities and thus laws of truth about them. But these references are not peculiar to logic in the sense that such entities are referred to only in logic 5
Frege (1906, 428), Frege (1984, 338).
Logical Laws and the Word "True"
243
and not in other sciences. These entities are common to every science, as expressions which designate these references occur in the linguistic expressions of the true thoughts which constitute every science;6 such expressions are, in a current terminology, topic-neutral. In contrast to the laws of the other sciences, which so to spèak are only specific laws of truth, i.e. laws of truth about an specific subject matter, logical laws are general laws of truth and indeed the most general laws of truth,7 as logical laws are the most general truths with which every true thought on whatever subject matter has to agree. This characterization of logical laws does not quite agree however with Frege's suggested identification in Der Gedanke of logical laws with the laws of truth. In my opinion, Frege's use of the expression "laws of truth" in this paper is somewhat imprecise. According to the aforementioned characterization of logical laws, these are only a proper subset of the laws of truth, indeed the most general of such laws. As logical laws and laws of truth are identified in Der Gedanke, it is to be assumed that here Frege means by the expression "laws of truth" only the most general laws of truth. The question I want to examine is therefore whether one may maintain, as Frege does in Der Gedanke, that in logical laws, i.e. in the most general laws of truth, the meaning of the word "true" is unfolded or spelled out.
3
The Redundancy of the Word "True"
This raises the question of what Frege understands in the passage quoted from Der Gedanke by "the meaning of the word 'true'". On the one hand, the word "meaning" occurs here as the translation of the German word "Bedeutung" which in its technical use by Frege is traditionally translated into English as reference. However, from the context it is quite clear that Frege does not in this case use the word "Bedeutung" in its technical sense, but in the usual sense of the word in German, which corresponds to the usual sense of the word "meaning" in English. Given this, one could argue that reference, as understood by Frege, is not an ingredient of the intuitive notion of meaning; 8 this makes it plausible to conclude that Frege's statement in 6 Here I argue on the basis of the linguistic expressions of thoughts and not of the thougths themselves because Frege proceeds in the same way in the aforementioned passage of (1906). The corresponding argument concerning the thoughts themselves, with independence of their linguistic expressions, is easily formulated: logical entities like negation, identity, etc. are common to every science, because the parts of thoughts to which these entities correspond occur as components in the true thoughts which constitute every science. 7 Frege (1897, 139), Frege (1979, 128). Cf. Frege (1893, XV), Frege (1964, 12). 8 Cf. Dummett (1973, 84; 91).
244
Luis Fernández Moreno
Der Gedanke amounts to the characterization of logical laws as the spelling out or unfolding of the sense of the word "true" .9 Nevertheless, on the other hand, logic like every science must consist of true thoughts about its subject matter and, as I have already pointed out, according to Frege at least some references, e.g. negation, identity, etc., belong to the subject matter of logic. Furthermore, Frege asserts that "the laws of logic are first and foremost laws in the realm of references [Reich der Bedeutungen] and only relate indirectly to sense." 10 So from a logical point of view the main feature of a word cannot be its sense, but has to be its reference. Applied to our case this amounts to the characterization of logical laws as the spelling out or unfolding "first and foremost" of the reference of the word "true" rather than of the sense of this word. In any case, I will now show that Frege should have regarded the word "true" as irrelevant for the characterization of logical laws. A short comment on the sense and the reference of the word "true" and particularly on their peculiarity is enough to support my thesis. The sentences "The thought that ρ is true" and "p" express the same thought, to wit, the thought that p; from here Frege infers that the sense of the word "true" does not at all contribute to the sense of the sentence in which it appears as a predicate, 11 and the same holds for the reference of that word, namely the reference of "true" contributes nothing to the reference of the expression of which it is predicated. Furthermore, it should be added that the sentences "the thought that ρ is true" and "p" also contain the same assertion, i.e. the assertion of the truth of the thought that p. Hence the use of the word "true" does not contribute to the assertion of the truth of a thought either; the reason is that the assertion is expressed by the assertorie force, which lies in the form of the assertorie sentence, and the assertorie force is not at all influenced by the use of the word "true". We must conclude therefore that the word "true" is quite redundant and for this reason neither its sense nor its reference can play an important role in the characterization of logical laws. One can strengthen the plausibility of this conclusion through the following remark. Frege says hardly anything about the reference of the word "true", but as this word is from a grammatical point of view a predicate, its 9
Another component of the meaning of a word, besides the sense of the word, is its tone, but it is obvious that Frege in the passage quoted from Der Gedanke does not mean the tone of the word "true". 10 Frege (1969, 133), Frege (1979, 122). In the English translation the expression "realm of meanings" appears instead of "realm of references", but this conflicts with the established English translation of the Fregean expressions "Sinn" and "Bedeutung": when "Bedeutung" is contrasted with "Sinn", as in this passage, "Bedeutung" is traditionally translated as reference, not as meaning. 11 Frege (1969, 272); Frege (1979, 252).
Logical Laws and the Word "True"
245
reference must be a concept or property. 12 If the reference of this word were to make any essential contribution to the reference of the sentences in which it appears, then in sentences such as "the thought that ρ is true" it would be ascribed to the thought that ρ the property designed by the word "true". Nevertheless, Frege disputes that in such sentences a property is ascribed to a thought; according to Frege in such sentences it is not the relation of a thought to a property which is expressed but that of a thought to a t r u t h value, i.e. to an object. 1 3 In sentences of that kind it is acknowledged that the truth-value of the thought that ρ is the True, but, as we already know, the acknowledgment of the truth of that thought is also expressed by the sentence "p", i.e. by a sentence that does not contain the word "true". So it is consistent to maintain the following thesis: one must concede that the predicate "true" has a sense and a reference, because otherwise the sentences which contain this predicate would have no sense and no reference; however, one should not characterize logical laws by means of the word "true", as this word is quite redundant.
4
Logical Laws, Truth and the Word "True"
Although the word "true" is redundant and hence irrelevant for the characterization of logical laws, the truth however is not at all irrelevant. Logic, like every science, has the truth as its aim, but there is a closer relation between logic and truth. Firstly, logical laws are not only true thoughts but also the most general truths and hence the most general laws of t r u t h , with which the other truths must agree. Secondly, truth-values have an important role in logic; Frege distinguishes two truth-values, the True and the False, which he conceives as objects, and it is to bè assumed that the t r u t h is also an object. Although Frege often expresses himself as if truth were a property designed by the predicate "true", he also sometimes disputes that t r u t h is a property; 1 4 in any case, as the truth is doubtless the reference of the expression "the truth" and this expression is according to Frege's criterion a proper name, i.e. the name of an object, 1 5 the t r u t h has to be regarded as an object. So it is plausible to identify the t r u t h with the True. This identification is furthermore insinuated by Frege's identification of the acknowledgment of the truth of a thought with the acknowledgment that the truth-value of that thought is the True. 1 6 12
Frege (1892b, 193 note 1), Frege (1984, 183 note 1). Cf. Frege (1892a, 34 f.), Frege (1984, 164), and Frege (1969, 211; 251 f.), Frege (1979, 194; 233 f.). 14 Frege (1969, 252), Frege (1979, 234). 15 Frege (1892b, 195), Frege (1984, 184). 16 Frege (1893, X), Frege (1964, 6f.). 13
246
Luis Fernández Moreno
T h e alleged importance placed on the word "true" in the characterization of logical laws depends on its presumed connection with the truth, but in this respect it should be pointed out that in the same way as the assertion of the truth is not expressed by the word "true", the truth is not the reference of this word either, as "true" is a predicate; hence its reference must be a concept and cannot be an object. W h a t Frege probably meant and, if my interpretation is right, what he should have said is that in the logical laws the truth is spelled out. In my opinion, this thesis would have to be interpreted in the following way. In the different sciences we discover truths about different subject matters, but there is a science in which, because of its generality, we can discover something about the truth about every subject matter, about the truth, so to speak, par excellence; this science is logic. 17 Frege considers that t r u t h is indefinable; 18 thus We cannot have a definition which tells us what t r u t h is and with whose help we could find out which thoughts are true, but logic provides us with the most general truths and hence with the norms with which every true thought must agree. Nevertheless, even if one would maintain in this sense that in logical laws the t r u t h is spelled out, this would still not imply that it would be adequate to characterize logical laws by means of a determinate linguistic expression, not even through an expression whose reference is the truth. For the argument which shows the redundancy of the predicate "true", and hence its irrelevance for logic, is also applicable to at least some tokens of the expressions "the truth" or "the True". For example, the sentence "The truth-value of the thought that ρ is the True" (or "The reference of the sentence 'p' is the True") asserts the same as the sentence "p". In this way the expression "the True" — and a similar argument holds for the expression "the truth" — is in such contexts as redundant as the predicate "true". If we want to characterize logical laws by means of the reference of certain expressions, it would be more appropiate to say that in such laws the references of the negation sign, of the identity sign, etc. are spelled out. But, on the one hand, this determination of logical laws would only be philosophically satisfactory if we had a precise and general definition of logical sign or of logical constant, which Frege has not given. On the other hand, it is to be assumed that Frege would have considered that the aforementioned characterization of logical laws would not be so fundamental as one on the
17
Cf. Ricketts (1986, 80) and Bürge (1986, 140). I do not regard Frege's arguments against the definability of truth as unobjectionable, but I cannot argue this point here. On this topic see especially Dummett (1973, 442fF.) and Carruthers (1981, 19ff.). 18
Logical Laws and the Word "True"
247
basis of t r u t h , as Frege gives the reference of such logical signs with the help of t r u t h . 1 9 In any case, our particular way of asserting the truth of a thought does not consist in joining a certain word to the name of the thought or of the sentence which expresses that thought, but in uttering this sentence with assertorie force, and the assertorie force is not expressed by a word, but by the form of the assertorie sentence. For that reason, even if it were accepted that t r u t h can be essential for the characterization of logical laws, it would be wrong to characterize logical laws as the spelling out of the meaning of a word, especially of the word "true".
References Bürge, Tyler (1986), Frege on Truth. In: Haaparanta, Leila/Hintikka, Jaakko (eds.), Frege Synthesized, Reidel, Dordrecht, 97-154. Carruthers, Peter (1981), Frege's Regress. Proceedings of the Aristotelian Society 82, 17-32. Dummett, Michael (1973), Frege — Philosophy of Language, Duckworth, London, 2 1981. Dummett, Michael (1991), Frege and Other Philosophers, Clarendon Press, Oxford. Frege, Gottlòb (1879—1891), Logik. In: Frege (1969), 1-8. Frege, Gottlob (1892a), Uber Sinn und Bedeutung. Zeitschrift für Philosophie und philosophische Kritik 100, 25-50. Repr. in Frege (1967), 143-162). Frege, Gottlob (1892b), Uber Begriff und Gegenstand. Vierteljahrsschrift für wissenschaftliche Philosophie 16, 192-205. Repr. in: Frege (1967), 167-178. Frege, Gottlob (1893), Grundgesetze der Arithmetik, begriff'sschriflieh abgeleitet, vol. I, Jena; second ed., Olms, Hildesheim, 1962. Frege, Gottlob (1897), Logik. In: Frege (1969), 137-163. Frege, Gottlob (1906), Über die Grundlagen der Geometrie. III. Jahresbericht der Deutschen Mathematiker-Vereinigung 15, 423-430. Repr. in: Frege (1967), 317-323. Frege, Gottlob (1915), Meine grundlegenden logischen Einsichten. In: Frege (1969), 271-272. Frege, Gottlob (1918), Der Gedanke. Eine logische Untersuchung. Beiträge zur Philosophie des deutschen Idealismus 1, 58-77. Repr. in: Frege (1967), 342362. Frege, Gottlob (1964), The Basic Laws of Arithmetic, ed. by Montgomery Furth, University of California Press, Berkeley. Frege, Gottlob (1967), Kleine Schriften, ed. by Angelelli, Ignacio, Wissenschaftliche Buchgesellschaft, Darmstadt, (21990) Olms, Hildesheim. I9
See Frege (1893), Frege (1964).
248
Luis Fernández Moreno
Frege, Gottlob (1969, 2 1983), Nachgelassene Schriften, ed. by Hermes, Hans/Kambartel, Friedrich/Kaulbach, Friedrich, Meiner, Hamburg, 1983. Frege, Gottlob (1979), Posthumous Writings, Basil Blackwell, Oxford. Frege, Gottlob (1984), Collected Papers on Mathematics, Logic, and Philosophy, ed. by Brian McGuinness, Basil Blackwell, Oxford. Ricketts, Thomas G. (1986), Objectivity and Objecthood: Frege's Metaphysics of Judgement. In: Haaparanta, Leila/Hintikka, Jaakko (eds.), Frege Synthesized, Reidel, Dordrecht, 65-95. Sluga, Hans D. (1980), Gottlob Frege, Routledge & Kegan Paul, London.
KAZUYUKI
NOMOTO
Frege on Truth and Meaning In this paper I would like to clarify Frege's truth-concept, which satisfies distinct versions of the so-called "equivalence thesis". I would further like to show how his composition principle depends upon his primacy thesis of a sentence, including the context principle, in his theory of sense and denotation.
1
Frege's Notion of Truth and his Equivalence Thesis
According to Frege, neither a nominal nor an analytic definition of t r u t h is possible, and hence the t r u t h concept is indefinable, simple and primitive. Nevertheless Frege proposes certain constraints for the t r u t h theory which may be called "the equivalence thesis" 1 : from a satisfactory definition of t r u t h , t h e equivalence formula 'v4 is true if and only if A' must be derived. It is interesting, however, that Frege's equivalence thesis is not equivocal, but articulated into the stronger and weaker versions. 1.1 Frege admits t h a t 'true' could be taken as a predicate, which fulfills t h e following condition 2 : ( T l ) T h e thought expressed by a sentence ' T h e thought t h a t A, is true' is t h e same as the thought A itself, and nothing new has been added. T h e t r u t h concept which satisfies this stronger version is taken to be t h e identity-function between thoughts. The weaker version requires, however, only t h e identity of truth-values or material equivalence and hence the word ' t r u e ' can be interpreted either as a truth function, or as an intensional concept, or as a meta-linguistic notion. Now Frege introduces the horizontal stroke as a primitive sign into his concept-script of Grundgesetze [GGA], and calls a sentence-like complex term ' A' a t r u t h - v a l u e name. The first weaker version is as follows: 3 (T2)
A if and only if A.
^ u m m e t t (1973, Ch.13). Frege (1892, 34). 3 Frege (1893, Sect.5); cf. Bürge (1986). 2
Kazuyuki Nomoto
250
T h e horizontal stroke ' ( )' may be thus read as '( ) is true' and represents the truth-concept taken as a truth-function mapping from the truth-value True alone to the True, otherwise to the False. Further Frege identifies the truth-value True with a specific value-range( Wertverlauf) of the t r u t h concept: ( ). 4 Hence (T2) can be formulated as follows: ( the value-range of the truth concept) = the value-range of the truth concept. 1.2 Frege further explains the weaker version of "the equivalence thesis" as follows 5 : (T3)
If F(a) is the True, then the object a falls under the concept F( ).
There could be at least three distinct interpretations of (T3). The first is similar to (T2) as follows: (T3-1)
—
F (a) if and only if F (a).
Nevertheless if the truth bearer is properly to be a thought, and thus the relation between thought and truth is regarded as an advance from sense to denotation, then the denotation of 'true' may be taken as an intensional function mapping from thoughts or the senses to truth-values as follows: (T3-2)
[F(a)]i if and only if F (α). ('Λι' represents the sense of Ά ' )
Nevertheless, one must be aware that ( T l ) and (T3-2) presuppose the notion of sense, and hence it is circular to construct a theory of sense based on those notions of truth. Furthermore the truth-functional notion of t r u t h represented in (T2) will face the liar paradox. Now if one takes (T3) as expressed in a meta-language, then the resulting interpreted version (T3-3) of the equivalence thesis is akin to Tarski's wherein ' ^ ( a ) ' on the left hand side is a meta-linguistic name for a certain sentence in the object language, and the sentence on the right hand side is its translation in the meta-language. Thus the predicate 'true' represents a meta-linguistic notion providing a meta-linguistic name for a sentence in the object language with its translation. In that case, however, to get at sense one must adopt a Davidsonian strategy which is the reverse of Tarski's, namely, to consider truth to be the central primitive concept. 6 Frege's constraint on the truth-concept is hence not equivocal, but one may distinguish distinct versions of the equivalence thesis and the weaker one can be articulated into at least three distinct formulations. It is, however, only in accordance with a Davidsonian strategy based on the primitive t r u t h concept satisfying a Tarskian version of the equivalence thesis that will Frege enable to construct his truth conditional theory of sense. "Frege (1893, 31). 5 Frege (1893, Sect.4). 6 Davidson (1984, xiv).
Frege on Truth and Meaning
2
251
A Tension in Frege's Theory of Meaning
Frege introduces 'the principle of bivalence' as the most fundamental semantic principle of his mature logical system: 7 (PB)
A truth-value name denotes (bedeutet) the truth-value True or False.
The truth-value of a sentence is identified with its denotation. In terms of the context principle, the sense or the denotation of a word in a sentence is taken as its contribution to the sensé or the truth-value of the sentence. Furthermore the sense of a sentence is identified with its thought which is intimately connected with its truth condition. 8 Frege's theory of sense and denotation is thus closely related to the truth-concept. At the same time, Frege insists on the composition principle, i.e. that the sense and denotation of a complex term is the function of those of its constituent terms. 9 Nevertheless it has often been argued that the context principle does not appear in Frege's later works, and furthermore it is doubted whether the context principle is compatible with the composition principle because the former approach "starts with the complex(sentences, at any rate) and abstracts out the parts", while the latter suggests the "atomistic" or "buildingblock method". 1 0 I will confirm that Frege holds at least 'the primacy thesis of a sentence' till his last period including the context principle and 'the method of deçomposition or analysis'. Further I would like to claim that the primacy thesis of a sentence does not contradict the composition principle.
2.1
T h e Composition Principle
As mentioned above, the composition principle about sense and denotation claims that the sense and denotation of a complex term is respectively determined by the senses and denotations of its constituent parts. 1 1 It is noteworthy that Frege has already recognized the so-called "creativity" of language and Evans's "Generality Constraint" 1 2 , and explains them in terms of his composition principle as follows: "It is remarkable what language can achieve. With a few sounds and combinations of sounds it is capable of expressing a huge number of thoughts, and, in particular, thoughts which have not hitherto been grasped or expressed by any man." 1 3 "The possibil7
Frege (1893, 48). Frege (1893, Sect.32). 9 cf. Ibid. '"Davidson (1984, 221). n c f . Frege (1976, 156). 12 Evans (1982, lOOf.). 13 Frege (1969, 243). 8
252
Kazuyuki Nomoto
ity of our understanding sentences which we have never heard before rests evidently on this, that we construct the sense of a sentence out of parts that correspond to words. If we find the same word in two sentences, e. g.'Etna', then we also recognize something common to corresponding thoughts, something corresponding to this word. Without this, language in the proper sense would be impossible." 14 Our question is whether Frege's composition principle really contradicts his context principle. Now we must take notice of the fact that Frege's composition principle in the end presupposes ultimate constituents of thoughts and denotations of simple constituent terms since otherwise it is hard to effectively explain the creativity and learnability of language. Frege does not appear to simply adopt the 'atomistic' method in semantics according to which the semantic value is assigned to each of the primitive signs in isolation. On the contrary his composition principle presupposes an analysis or decomposition of a thought into its constituents.
3
The Function-Theoretic Decomposition and Analysis — The Primacy Thesis of a Sentence(l)
Frege's analysis or decomposition of a thought and metaphorically of t r u t h value corresponding to that of a sentence might be taken as a form of the primacy thesis of a sentence over its components. Dummett contrasts "analysis" to "decomposition" the former of which reveals the unique analysis of a sentence and its thought into their ultimate constituents, while in the latter case there may be distinct ways of splitting it up into its components in order to explain the validity of an inference or to exhibit such an inference as exemplifying sòme general pattern. 1 5 Let us try to discriminate decomposition from analysis in Frege's own texts.
3.1
Decomposition (Zerfällung)
In his earlier period Frege has already maintained, "Instead of putting a judgement together out of an individual as subject and an already previously formed concept as predicate, we do the opposite and arrive at a concept by decomposing[zerfallen] the content of possible judgement." 1 6
14
Frege (1976, 128). Dummett (1981, Ch. 15). 16 Frege (1969, 18). 15
Frege on Truth and Meaning
253
Frege claims t h e primacy thesis of thought and t r u t h and mentions t h e decomposition of t h e former in his later period, too, as follows: " W h a t is distinctive about my conception of logic is that I begin by giving pride of place to the content of the word 'true', and then immediately go on to introduce a thought.[...] So I do not begin with concepts and p u t t h e m together to form a thought or judgement; I come by the p a r t s of a thought by decomposing t h e thought." 1 7 At the same time, however, Frege declares explicitly and constantly that there may be distinct ways of splitting up the thought and t h e denotation in terms of decomposing the relevant sentence as follows: "We must notice, however, that one and the same thought can be split up [zerlegbar] in different ways and so can be seen as put together out of p a r t s in different ways." 1 8 T h e composition principle is taken to presuppose t h e unique analysis of a sentence, its thought, and figuratively its t r u t h value into its u l t i m a t e constituents, while Frege insists t h a t there may be distinct ways of splitting t h e m up. How can this apparent inconsistency be resolved?
3.2
T h e Syntactic Distinction between "Function" and "Argument"
In Begriffsschrift, Frege's distinction between "function" and "argument" is purely syntactic, and hence "This distinction has nothing to do with the conceptual content, but only with our way of viewing it[...], so long as function and argument are completely determinate." 1 9 In GGA Frege formulates more clearly such a syntactic way of obtaining a f u n c t i o n - n a m e by removing [ausschliessen] a component word from the complex expression as follows: "If from a proper n a m e we remove a proper name[or a n a m e of a first-level function][...] at some or all of the places[...], then[...]we obtain[...]a n a m e of a first-level function of one argument [or a name of a second-level function of one argument]." 2 0 By the m e t h o d of decomposing a complex term the syntactic categories are obtained: the basic categories are 'proper n a m e ' and 'sentence', while ' f u n c t i o n - n a m e ' or 'predicate' is derivative in the removal process though t h e latter category is primitive from the compositional point of view. 2 1 As t h e result of decomposition, however, one cannot always get an ultimate, simple constituent, but often still a complex one since decomposition concerns only one single stage of an inference. 2 2 Furthermore decomposing is not unique especially in the case of a non-quantified sentence. 17
Frege (1969, 273). Frege (1969, 218). 19 Frege (1879, Sect.9). 20 Frege (1893, Sect. 26); cf. Dummett (1973, Ch. 3). 2 'Frege (1893, 48). " D u m m e t t (1981, Ch.15). 18
254
Kazuyuki Nom oto
Can we get at simple constituents of contents corresponding to syntactic simples and logical forms of sentences by recursively decomposing in many stages ?
3.3
Analysis (Zerlegung) of a Thought
Frege notices in his early period that the distinction between function and argument acquires a substantive[inhaltlich] significance when the argument becomes indeterminate. 2 3 In a quantified sentence a way of splitting does not only accord with our way of looking at it, but with the analysis of its content. If we analyze a sentence into a proper name and a predicate, then the thought of the sentence is accordingly split into the saturated and the unsaturated senses, while the denotation (truth-value) of the sentence is metaphorically split into an object and an unsaturated predicative concept. 2 4
4
The Context Principle The Primacy Thesis of a Sentence(2)
A sentence occupies a privileged position in Frege's semantic theory. An analysis of a sentence results, however, only in specifying its logical form and characterizing the semantic categories of words in it, but not enough to specify the sense and the denotation of each word in it. It is the context principle that will be expected to do this task.
4.1
T h e Context Principle
4.1.1 The so-called context principle about sense and denotation is most clearly declared in GLA as follows though they are not yet definitely distinguished from each other: "Never to ask for the denotation of a word in isolation, but only in the context of a sentence." 25 "It is enough, if the sentence taken as a whole has a sense; it is this that confers on its parts also their content." 2 6 Frege's central problem in GLA is to answer the question: "What is the natural number?" He transforms this epistemologicalontological question into the linguistic one. " How, then, are numbers to be given to us, if we cannot have any ideas or intuitions of them? Since 23
Frege Frege 25 Frege 26 Frege 24
(1879, (1969, (1884, (1884,
Sect.9). 210; also 217, 275). X; 71). 71).
Frege on Truth and Meaning
255
it is only in the context of a sentence that words have any denotation, our problem becomes this: To define the sense of a sentence, in which a number word occurs." 27 This is often called the locus classicus of the so-called "linguistic turn". Furthermore the sentences, the senses of which are to be explicated, are " Those which express our recognition of a number as the same again.[...]When we have thus acquired a means of arriving at a determinate number and of recognizing it again as the same, we can assign it a number word as its proper name." 2 8 The context of a sentence to be explicated is thus "a recognition statement" 2 9 which is the left hand side of the following equivalence relation(E): (E)
The number of the concept F = the number of the concept G if and only if F is equinumeral with G.
The right hand side of (E) gives the truth-condition of the left hand side recognition-statement so that it provides the criterion of identity for numbers. Thus in accordance with the context principle, the denotation of a numeral term, its criterion of identity, is expected to be determined through determining the sense or truth-condition of its recognition-statement. 3 0 Nevertheless in GL A Frege gives the following explicit definition (D): (D)
The number of the concept F =) in order to facilitate its comparison with =>. Then (60) 6 < a —• 6
(pmi)
clearly follows from α Λ b < 6 by right residuation. What distinguishes modal from intuitionistic logic then is the inequality that says that a o b is a lower bound of the right argument 6: (61) aob we get the paradox of strict implication for =>·, but not the paradox of material implication. Of course if we postulate that —• is both a left and a right residual we get both paradoxes, and from these we can deduce the commutativity of o, from which it follows that a o b < b after all. I like this way of looking at things, for it splits the properties of the intuitionistic implication into those of two different residuals.
J. Michael Dunn
354
6
Identity Elements
While we are tidying up, let us observe that there is a more general way of looking at the inequalities (Ibi) and (Ibr), which is helpful in generalizing the framework to relevance logic. Let us assume that we have a distinguished element e. The following two inequalities say that e has half of the properties of a left and right identity, respectively: < a
(lid),
(66) a o e < a
(rid).
(65) eoa
T h e postulates (lid) and (rid) are of course just special cases of (Ibr) and (Ibi) respectively, and they lead by right residuai ion to (67) a < e —y a, (68) e < a —+ a. Identity elements are important because they give us an algebraic way of saying that a proposition is "true", to wit, e < a. Thus we can not merely say that a implies a (which is said in "algebraese" as a < a), but we can also say with (68) that the proposition "if a then a" is true. When e satisfies the properties (lid) or (rid) we shall talk of "lower" (left or right) identities. But there are sometimes good reasons to require that e be a full identity. Thus, e.g., if it is a full right identity (a o e — a) then one can derive what Dunn (1993a) calls: (69) "Push and Pop": a < 6 i f f e < a - » 6 . Left-to-right of (69) pushes the implication down into the object language, and right-to-left pops it out again. With e being only a lower right identity, one gets only the "push" half of this and not the "pop". But there are good reasons for sometimes not requiring "pop", and so we do not always require that e be a full right identity. Thus e.g., it fails for strict implication in the modal logic K . Let us consider what happens when e is the top element in the structure, i.e., a < e for every element a (when it is we will often denote it by 1). For the cases of modal and intuitionistic logic we can make that assumption. Then, because of isotonicity, (lid) implies (Ibr), and (rid) implies (Ibi). We illustrate with the first implication. Since 1 o 6 < b and a < 1, it follows (isotonicity) that aob< b. Thus (lid) and (Ibr) are equivalent, when e = 1, and similarly for (rid) and (Ibi). So the "fundamental" difference between
G a g g l e T h e o r y Applied to Intuitionistic, Modal, and Relevance Logics
355
modal and intuitionistic logic is whether e is a left, or both a left and right, lower identity element. 25 Let us say a word about how to define identity elements on a frame. As is made clear in Dunn (1993a) the best way is to work with articulated ternary frames (U, R, Ç), where R Ç U3, and C is a partial-order satisfying: Raßf and a' Ç a imply Ra' βη, Raßf and β' Ç β imply Raß'f, Raß7 and 7 Ç 7' imply Raß7'. We think of Ç as an "information order", and define a proposition A (a representing set) to be a hereditary subset of U, i.e., a subset that is closed upward under Ç (a € A and a Ç a' imply a' € A). This corresponds to requirements familiar from intuitionistic and relevance logics. It is easy then to see that if Ζ C U satisfies the following condition, then it is a left lower identity with respect to propositions (Ζ 0 A Ç A): (70) 3C G Z{R(aß)
iff α Ç β.
Also Ζ is a right lower identity (Ζ 0 A Ç A) if it satisfies: (71) EC € Z(Ra(ß)
iff α Ç β.
By a left assertional frame we shall mean a structure (U, R,Q,Z), where (U, R, E) is an articulated frame and Ζ satisfies (70). A right assertional frame is defined similarly, but with Ζ satisfying (71), and in a doubly assertional frame Ζ must satisfy both.
7
Representation of Positive Binary Gaggles
We codify some of the observations made above in the following framework. Definition 3 A binary gaggle (BG) is a structure (G, Λ, V,o,—y,e), where (i) (G, Λ, V) is a distributive lattice, (ii) l o f t / V z ) = (xoy)V (xo z), (y V ζ) ο χ — (y ο χ) V (ζ ο χ)(ο distributes, over V) (iii) χ ο e < χ (e is a right lower-identity), (iv) —> is a right residual with respect to o, i.e. it satisfies χ o y < ζ i f f y, e) so G is the collection of all hereditary subsets of U, A is 0 , V is U, e is Z, and if A and Β are hereditary subsets of U, Α ο Β, A —> Β, are defined as in (18) and (19). T h e o r e m 2 Every BG is embeddable in the full BG induced on some right assertional frame (U, Ç, R, Z). P r o o f . The proof is a special case of the result for general gaggles of Dunn (1991), but we run through in this special case so that the reader can understand both why the official representation of a binary operation in gaggle theory uses a 3-placed accessibility relation Raßf, and also how it can be resolved that the ordinary Kripke-style representation uses only a 2-placed one. The representation of a BG proceeds along, the path started by Stone (1936, 1937) for distributive lattices and Boolean algebras, as extended by Jónsson/Tarski to Boolean algebras with linear operators, and uses ideas from the semantics of relevance logic due to Routley/Meyer (1972-73), Meyer/Routley (1972). An element a of the BG is mapped into the set of all prime filters Ρ of the BG such that a E P . Meet is thus carried into set intersection, join into set union (as with Stone), the operation o is the generalized image operation defined above (as in Jónsson/Tarski), and —> is also as defined above (as in Routley/Meyer). Of course those definitions above of o, and —> assume we are given a 3-placed accessibility relation on the prime filters, and we next show how this is canonically defined. 26 As indicated above, this is equivalent to requiring that o be commutative. It should be mentioned t h a t in the general theory of gaggles, it is permitted t h a t the structure have b o t h a left and a right residual, where these might not be the same, but we have chosen to simplify here to be closer to the applications discussed.
Gaggle Theory Applied to Intuitionistic, Modal, and Relevance Logics
357
Thus in the canonical frame, the set UG is the set of all prime filters of G, ZQ is the set of all prime filters of G containing e, and RGP\PÏQ holds iff for all a, b 6 G, if a (E P\ and b (Ξ P2 then α o 6 € Q. We will not here work through the details of the proof that this representation works. The interested reader can work out the details from the sources cited above. Corollary 1 Every MBG is embeddable in the full MBG induced on some right assertional commutative frame. Proof. We have already observed that if the accessibility relation is commutative, so is the induced fusion operation defined by (18). Conversely, if the fusion operation is commutative, then the accessibility relation on the canonical frame is commutative, as the reader can easily see.
8
Implication
We can now see the problem of relating the representation of gaggles to the usual Kripke semantics by way of a crude "dimension analysis". The gaggle representation of a binary operation such as implication uses a 3-placed accessibility relation, whereas the Kripke semantics for either intuitionistic or strict implication uses a 2-placed accessibility relation. While, as we shall see, a 3-placed accessibility relation fits perfectly into the analysis of implication in the Routley/Meyer semantics for relevance logic, there are stories to be told regarding intuitionistic and strict implication. 27
8.1 Implication in Relevance Logic The positive fragment of the relevance logic R can be characterized algebraically as a BG (G, Λ, V, o, — e ) , where o is associative, commutative, and "square-increasing" (α < a o a). (Since o is commutative this makes it an MBG). We shall call such an algebra a positive De Morgan monoid.26 A positive Routley/Meyer frame can be taken to be a right assertional frame (U,Q,R, Z). 29 Other properties match the various other algebraic 27 For intuitionistic logic there is a related and even more dramatic problem in that the gaggle representation of o also uses a 3-placed accessibility relation, whereas the Kripke one does not use an accessibility relation at all (o is just intersection). 28 In various papers Meyer has called these "Dunn monoids", but modesty forbids its use here. 29 The reader familiar with the relevance logic literature will notice that we have taken some liberties. First, for Routley/Meyer, Ζ = {0}. This is because (cf. Meyer/Routley (1972)) they in effect represent only prime De Morgan monoids (those where e < a V 6 implies e < a or e < 6), getting a prime De Morgan monoid by dividing out the
358
J. Michael Dunn
properties. Thus for an R + frame we require the following (labeled to show their correspondences to algebraic properties): Associativity: Commutativity: Square
3χ(ϋαβχ Raß7
increasingness:
a n d R\ηδ) implies
iff 3 χ ( β α χ < 5 a n d
Rß-yx),
Rßa~f,
Raaa.
Indeed, one gets various relevance logics depending on which properties one adds, but we do not need to get into that here. We simply note here that it must be checked that the canonical accessibility relation defined on the space of prime filters has the corresponding properties. 30 The chief point is that Routley/Meyer define (72) χ |= φ
φ iff Va, β if Ra\ß
and α\=ψ,
then β μ φ.)
And this definition (modulo the choice of the first or second positions of R as the "fulcrum") perfectly matches the definition (19) in the representation of a BG. Also the semantical clause for the fusion connective is a perfect match for the definition (19). Indeed, a large part of the original inspiration for developing gaggle theory was to get these out as special cases.
8.2 Implication in Intuitionistic Logic As already indicated, (72) is not so straightforward in its application to intuitionistic implication. Some of what we say here has already been said in Dunn (1993a), but we repeat it in somewhat different words for the sake of clarity and completeness. Let us consider the case where G is a positive Heyting algebra. It is easy to see that the appropriate notion of a frame is obtained by adding to the postulates on a positive Routley/Meyer frame ({/, Ç, R, Z) the further requirement that Ζ = U. The reader can easily check that this assures that for A, Β Ç U, Α ο Β is a lower bound of Β in the sense that Α ο Β Ç Β, or equivalently Β Ç A —• Β (because of commutativity also A ο Β Ç A). Lindenbaum algebra of R by a prime filter that excludes the given proposition that one wants to falsify. Second, they do not have an explicit partial order, but instead define one from ROaß, giving them in effect a left assertional frame. We have chosen to work with right assertional frames, choosing the second position of the accessibility relation R (and not the first) as our "fulcrum", in order to get the proper match to our use of —» as the right residual. Note finally that we have built in certain properties that Routley/Meyer explicitly require of R by connecting it with the partial order Ç, e.g., RaΟα follows from
α Ç a. 30 Details can be worked out by consulting one or more of Routley/Meyer (1972-73), Meyer/Routley (1972), Dunn (1986), Anderson/Belnap/Dunn (1992), or Dunn (1993a).
Gaggle Theory Applied to Intuitionistic, Modal, and Relevance Logics
359
Conversely, it is easy to see that in the canonical f r a m e of a positive Heyting algebra, the set U of all prime filters is the s a m e as the set of p r i m e filters containing the identity element e. T h i s is b e c a u s e the identity element e = 1. Since o is j u s t meet, we shall see that RP^P^Q iff Pi Ç Q and Pi Ç Q. Let us a s s u m e then that RP\ P2Q· We show that Pi Ç Q, a n d of course P2 Q Q follows symmetrically. S u p p o s e then that α € P i . Since 1 G P2, aAl = a€.Q,as desired. Now for the converse let us a s s u m e Pi Ç Q and P2 Ç Q, and we shall show that RP1P2Q. To this end let us s u p p o s e that a £ Pi a n d 6 G P 2 - Since both Pi and P 2 are subsets of Q, both of a and b are in Q. B u t since Q is a filter and filters are closed under meet, α Λ 6 G Q, as needed. (73) For intuitionistic logic: Raßf
iff both q C ) and β Ç 7 .
We have now justified this definition (73). Now let us observe that the g a g g l e representation of implication employing (73) reduces to the usual definition in t e r m s of the 2 - p l a c e d relation Ç . T h u s for the intuitionistic D, the plugging in of (73) to (19) gives us (74) χ € A D Β iff V a , β (if a Q β and χ Q β and α € A, then β G Β). Here m o r e fiddling is required. Let us a s s u m e the right-hand side, (75) V a , β (if a Ç β and χ Ç β and α € A, then β G Β ) , a n d now show the usual Kripke meaning of intuitionistic 3 : (76) V a (if χ Ç a and and α € A, then α G Β ) . Given the reflexiveness of R, this follows immediately, instantiating β to a. T h e converse is only slightly trickier. Let us a s s u m e (76) and the antecedent of (75), α Ç β and χ Q β and α G A. We must now show that β G Β. Since a G A and α Ç β, it follows from the Hereditary Condition that β E A. B u t since the antecedent of (75) also contains χ C β, we can i n s t a n t i a t e (76) to obtain β G Β as desired.
8.3 Modal logic Let us next e x a m i n e the case where G is a m o d a l algebra. To m a k e things easy we shall s u p p o s e that the underlying distributive lattice is a Boolean algebra, so as to utilize the well-known fact that then prime filters are the s a m e as m a x i m a l filters. It would be interesting to explore in more detail
J. Michael Dunn
360
what happens if say we had only => and o as primitives, but it would take us longer to develop the conceptual point, which is, as we shall see, that RP1P2Q iff Pi = Q and c'P2 Ç Q. Let us assume then that RP1P2Q. If χ G c'P2, then χ = c'a for some a G P2. Again 1 G Pi and so 1 Λ c'a = c'a — χ Ç Q, and so C'PÌ Ç Q as desired. We next show that Pi Ç Q as an initial step in showing that P\ = Q. Thus if 6 6 Pi, then (since 1 € P2), c ' l Λ b e Q. But c ' l Λ 6 < b, and so be Q. Now since Pi C Q, and Pi is a maximal filter, it must be the case that Pi = Q. But we can define the 3-placed relation in terms of the two placed one as follows: (77) For modal logic: Raß7
iff both α = 7 and
Rß7.
Thus plugging into (19) the above definition of the 3-placed R in terms of the 2-placed one, we get for the modal =>: (78) χ e A => Β iff Va, β (if a = β and Rxß and a Ç A, then β ζ Β) i.e., after fiddling with (79) by substituting identicals, the usual Kripke definition: (79) χ € A =>· Β iff Va(if β χ α and α € A, then a € B). One can also show conversely that (79) implies (78), again by fiddling using substitution of identicals. We leave to the reader a similar verification for o (showing that in effect AoB = AnOjß).
9
Negation
There are two more puzzles about the gaggle way of representing logical operations, one having to do with intuitionistic negation, and the other having to do with the De Morgan negation of relevance logic. The reader is advised to consult Dunn (1993b) to see some of the issues surrounding the definitions of negation in a more systematic context.
9.1 The Gaggle Treatment of Negation Let us first quickly review the gaggle treatment of negation. The idea is to treat negation as a galois connection on an underlying (distributive) lattice. Thus we require:
Gaggle Theory Applied to Intuitionistic, Modal, and Relevance Logics
361
(80) χ < ~ j / i f f y < ->x. The first problem, as the reader must have immediately recognized, is that we have two "negations". But if we simply require that and ~ be the same operation we get all the properties of what is called "minimal negation". To get the intuitionistic negation we must also add the property that (81) α Λ ~ α < 6. The idea is that to represent negation one uses a binary frame (£/, -L),31 and for a A Ç U, one can give the following definitions: (82) ~ A =
= {χ : ,4 1 χ } = {χ : Va € Λ, a 1 χ}.
(83) ^A = M = {χ : χ 1 A} = {χ : Va G Α,χ 1 a}, The reader can verify that for Χ,Υ
Ç U,
(84) Χ < ~ Y iff Y < -,Χ. To assure that ~ A = - Ά , it clearly then suffices to require that J. be a symmetric relation, and to get (81) one simply adds the requirement that J. be irreflexive, which assures that there can be no χ G Α Π A 1 . 3 2 In the canonical representation of gaggles, where U is the set of prime filters, the canonical embedding is defined by h(a) = {P G U : a G Ρ} and Ρ X Q is defined as 3x (x G Ρ and ~ x G Q). It is easy to see that h(~a) = h ( a f , i.e. ~ a G Ρ iff VQ(a G Q implies Q 1 P). Left-to-right is immediate. For right-to-left, one proceeds contrapositively, assuming that ~ a ^ P. We now must show 3Q(a G Q and Q / P). We consider the principal filter determined by a, [a) = {x : a < x}. It is easy to see that [a) is "compatible" with Ρ in the sense that [a) / P . Thus otherwise 3q G [a), G Ρ· But then a < q, and so < ~ α . But then ~ a G Ρ, contrary to our assumption. We next consider the set of all filters that contain a and are compatible with P , order it by inclusion, and a standard argument shows that the union of any chain in this set is also a filter containing a and compatible with P . This is the hypothesis of Zorn's Lemma, and so we can apply it to show that there is a maximal such filter Q, and by another standard argument (using distribution) it can be shown that Q is prime. One might have chosen instead the definition PL'Q as 3x (x G Ρ and -ix G Q), but as the reader can easily verify U is just the converse of _L 31 Actually for intuitionistic and relevance logics, the frame should be articulated with a partial order ÇJ, and we should only be considering subsets A that are hereditary with respect to C. But we suppress this level of detail at this moment to facilitate exposition. Cf. Dunn (1993b). 32 This is essentially the semantics of Goldblatt (1974) for orthologic.
362
J. Michael Dunn
because of (80), and this explains why one represents one negation using L A and t h e other using A1. It is also clear that if the two operations -· and ~ are identical, then the relation _L on filters is symmetric. Also observe t h a t if ~ satisfies (81), then the relation _L on filters is irreflexive, for if o, ~ a € F, t h e n α Λ ~ a G F, and so every b € F, contradicting the fact t h a t we have (implicitly) taken "filters" to be proper
9.2 Negation in Intuitionistic Logic Having set t h e general context, we now examine the intuitionistic case, where t h e familiar Kripke definition of negation on a binary f r a m e (Í/, R) is as follows: (85) χ 6 ~Ά iff for all α, χϋα
implies a £ A.
T h e standard gaggle representation of negation also involves a binary f r a m e (U, X), so this time at least the "dimension analysis" is o.k. Negation is a 1 placed operation, and so the gaggle representation uses a binary relation in representing it. But so does the Kripke semantics. So far there is no problem. T h e problem is t h a t the gaggle definition uses the binary operation in an apparently different way: 3 3 (86) χ € -A iff for all α, η^ϋαχη
implies a £ A),
in t h e c a n o n i c a l m o d e l , where a and β are p r i m e
i.e., filters,
(90)
χ G -A would be false not only on the gaggle account, but also on Kripke's. T h e converse is trivial since if -x is false on Kripke's account), then a fortiori x would show up in a prime filter compatible with χ (and be false on the gaggle account).
9.3 Negation in Relevance Logic There is also a problem about how to "gaggleize" the standard semantical treatment of De Morgan negation in relevance logic. "De Morgan monoids" were introduced in Dunn (1966) as a way of characterizing the relevance logic R . A De Morgan monoid is a structure (G, Λ, V, o, —• , e), where (G, Λ, V, 0, —>, e) is a positive De Morgan monoid and ~ is an antitone operation of period 2 satisfying (93)
ao6(-·! Ad (s o t(H) A -H) G D2. 21
This solves an open problem raised by Kotas and da Costa.
380
M a x Urchs
This result can be generalized in order to cover the Jaskowski-style systems, too. To put it more precisely, let CMS be the inference relation based on the M-5-acceptance property. (C'M-S is actually a consequence operation fulfilling Cjv/_s(0) = M-S.) Then the following theorem holds true for regular 5 containing S3. Theorem 4 (Urchs (1990, 7f.)) Let S contain S3. \/H € FORd VG e FORm VX C FORd WY Ç FORm: Γ
H £ Cns(X)
2°
G € CMS{X)
t{H)
€
S(G) €
CM-S(X); Cns{X);
3° d(G —» t o s(G)) Λ • (< o s(G) —> G) e Cm-s(0); 4o - ( - i . Aj {H A - s o t(H)) Λ -ι(->± Ai {s o t(H) A H) G Cn s (0). What happens, if we change the modal logic underlying the construction of discussive calculi? According to the above theorem, the results concerning discussive calculi on the one hand and M-counterparts on the other are mutually interchangeable to a very large extent. In other words, instead of investigating discussive calculi directly, one can equally well study Mcounterparts of modal systems. Theorem 5 (Perzanowski (1976)) D Κ φ 0(H Η) is the smallest normal system with non-empty Mcounterpart. Therefore, no normal system below D gives rise to non-trivial discussive Jaskowski-style systems. Theorem 6 (Furmanowski (1975)) VS4QSÇ S5: M-S - M-S5 S4 is not the least system which obtains this property. Theorem 7 (Blaszczuk/Dziobiak (1976)) Τ* :— Τ φ OOΗ \ OH is the least system which M-counterpart equals M-S5. What about non-normal based systems? Kotas and da Costa expressed the conjecture that such systems would be too weak to be interesting. But, as we'll see, there are good reasons to take a closer look on discussive calculi based on non-normal modal systems. Let us slightly generalize the notion of an M-counterpart. For k > 1, let Mk-S = {H e FORm; OH £ M^-S} {M°-S = S). Theorem 8 (Dziobiak (unpublished)) M2-S3 = M-S5. Proof: According to Halldén22, we have the following intersection: S3 — S4 Π 57. It is easy to calculate that M2-S3 = M2-S4 Π M 2 -S7. However, the second M-counterpart of 57 vanishes, because OOp €57. Hence the considered equation follows immediately from M 2 -5^ = M-S4· 2
Cf. Halldén (1949).
Handling Inconsistent Information
381
This property is typical for the investigated systems. Let S'/v be the "normal variant" of S, i.e. its closure w.r.t. H \ OH. T h e o r e m 9 VS3 Ç S: M 2 - S =
M-SN.
P r o o f : We may assume that S φ Sn- (Otherwise there is obviously nothing to prove.) Let Η € M-Sν \ M2-S. Then OOH is falsified in some point ζ ' of a model Λ4\ All points accessible from χ' falsify Off (because of transitivity) and so does x' (because of reflexivity). Therefore all of t h e m are normal and we thus infer that Oil is falsified in a substructure of A4' without any nonnormal worlds — a contradiction! However, the assumption in theorem 9 is essential: it does not work for S2.
Theorem 10 VS3 Ç S ÇS5: Mk+2S= k
M-S5, for all
k
Proof: MS 4 = M -(M-S4) Ç M -(M-SN) C Mk+i-S5 - M-S4.
k
k£u. 2
= M -{M -S)
C
Consequently the manifold of discussive systems based on regular systems between S3 and S5 collapses into D2 for higher dimensions. W h a t happens on the first level? Here is a partial answer:
Theorem 11 WS ÇS3.5: Mk+2S¿ Proof: MS
ç MS3.5
2
MS, for alike
φ M S3.5
= MS5
inequation is established by • • ( / > —• p) G M2S3.5 3.3
ω.
= Mk+2S. C
The inner
MS3.5.
In Defence of the Non-Adjunctive Approach
A constitutive property of all discussive Jaskowski-systems is the rejection of Adjunction: none of the systems accept the rule
H, G h H A G . This is essential for these systems, because very weak assumptions about the underlying modal system allow to prove both the law of excluded contradiction —>(// Λ -Ή) and the Conjunctive Spread
H A ->H —*i G. Therefore Adjunction would lead from inconsistency to triviality and should be ruled out consequently. But worse luck, the superintendent of paraconsistent logic disagrees:
382
Max Urchs Given a choice of rejecting one or other of Adjunction and Conjunctive Spread to avoid paradoxes and catastrophic spread from an inconsistency, the rejection of Adjunction is the wrong choice.23
Priest offers several serious objections to Jaskowski's construction. In his opinion the discussive consequence operation is too strong, it is only "halfheartedly" paraconsistent (because of accepting the ex contradictione quodlibet principle) and therefore totally unsuitable as the underlying logic of naive set theory [.. .and] of naive semantics. 24 One of his arguments seems really unpleasant for the non-adjunctive approach to paraconsistency: The other side of this objection to discursive logical consequence is that it is too weak. To be exact, let be a non-null set of zero degree formulas and let A be a first degree formula. Then if 52 \=j A there is some Β € 51 such that Β A. To see this, suppose for reductio that there is no Β € Σ s u c ^ Β Ná A. Then for every Β we can find a model MB such that, for some world w in MB, Β is true in w, whilst for no world w, A is true in w. Let M be the collection of worlds in every MB- Then M is countermodel to 52 hrf ^ · 2 5 Therefore, whenever it is possible to deduce A from a set 52 premiss, A can be obtained from one single element of 52· I n such a system, Priest concludes, nothing new will be gained by combination of information or knowledge bases of two or more participants in a discussion. This shows, that as a logic for drawing inferences in real life situations, discursive logic is useless.26 and . . . the non-adjunctive approach to paraconsistency should be dismissed. 27 23
Priest/Routley (1989, 48). Ibid., 160 f. 25 Ibid., 161. 26 Ibid., 161. 27 I b i d , 162. 24
Handling Inconsistent Information
383
Priest's argument looks quite convincing — however, it is not true. Example For any H,G € FORd: H, G \=d -(// d ->F), but neither H \=d ->F) nor G |=d ->d ->F). What is more, Jaskowski's discussive systems respect the discussive Adjunction H,G \=j H Ad G, and this is not dangerous because of H Ad
ψΛ G.
To conclude, the class of Jaskowski's discussive systems consists of well behaved paraconsistent calculi with excellent philosophical justification. Yet, not all paraconsistent calculi behave so nice. Some of them fulfil the condition of paraconsistency (it is impossible to derive every formula from inconsistent premiss) in letter: Definition 7 A logic L is paraconsistent if there are sentences H and F such that H, ->H \/L F . Nevertheless, they are not "really paraconsistent". Take Johansson's minimal calculus as an example. 28 In this system one can obtain any negated formula ->G from H and ->// , although H, ->H l· ->G . Therefore Urbas introduced a modified notion of "strict paraconsistency" 29 to characterize those systems that are paraconsistent in spirit and not only in letter. Definition 8 (Urbas (1990, 348)) A logic L is strictly paraconsistent if there is some sentence F obtained from a non-theorem, of L by uniform substitution such that H, l/¿ F . He argues, that strictly paraconsistent inferences from contradictory premiss satisfy (except in the case of conclusions which are theorems) the relevancy requirement of shared variables. On the other hand, it is not difficult to observe, that the following holds true. Theorem 12 No Cns fulfils that requirement. Thus, according to Urbas' criterion the Jaskowski discussive systems would not be paraconsistent in the strict sense and therefore somewhat deficient. However, I disagree: these systems lie on the proper side of the Rubicon ''Johansson (1936). 29 Urbas (1990).
384
Max Urchs
of paraconsistency — they should be accepted as reasonable paraconsistent calculi. Therefore it seems to m e that Urbas' criterion is too strong. T h e class of consequence operations, designating the manifold of discussive Jaskowski systems contains excellent raw material for discursive logics purposes. Therefore, paraphrasing Barwise and Etchemendy, logicians abhor contradiction — but they may still love inconsistencies.
References Blaszczuk, J./Dziobiak, W. (1976), An axiomatization of M^-counterparts for some modal calculi, Reports on Mathematical Logic 6, 3-6. da Costa, N. C. A./Kotas, J. (1978), The problem of Jaskowski and the logic of Lukasiewicz, in: Arruda; Α. I. et al. (eds.) Mathematical Logic. Proceedings of the First Brazilian Conference, Marcel Dekker, New York, 127-139. Furmanowski, T. (1975), Remarks on discussive propositional calculus, Studia Logica 34, 39-43. Halldén, S. (1949), Results concerning the decision problem of Lewis' calculi S3 and S6, Journal of Symbolic Logic 14, 230-236. Jacquette, D. (1991), Contradiction, unpublished script. Jaskowski, St. (1948), Rachunek zdan dia systemów dedukcyjnych sprzecznych, Studia Societatis Scientiarum Torunensis vol. 1, No 5, Sectio A, 57-77. Jaskowski, St. (1949), 0 konjunkcji dyskusyjnej w rachunkach zdan dia systemów dedukcyjnych sprzecznych, Studia Societatis Scientiarum Torunensis vol. 1, No 8, Sectio A, 171-172. Jaskowski, St. (1969), Propositional Calculus for Contradictory Deductive Systems, Studia Logica 24, 143-160. [English version of Jaskowski (1948)] Johansson, I. (1936), Der Minimalkalkül, ein reduzierter intuitionistischer Formalismus, Compositio Mathematica 4, 119-136. Kotas, J. (1974), The axiomatization of S. Jaskowski's discussive system, Studia Logica 33, 195-200. Lukasiewicz, J. (1987), O zasadzie sprzecznosci u Aristotelesa, Panstwowe Wydawnictwo Naukowe, Warszawa. Perzanowski, J. (1976), On M-fragments and L-fragments of normal propositional logics, Reports on Mathematical Logic 5, 63-72. Priest, G./Routley, R. (1989a), First Historical Introduction: A Preliminary History of Paraconsistent and Dialethic Approaches, in: Priest, G. et al. (eds.), Paraconsistent Logic. Essays on the Inconsistent, Philosophia, München, 3-75. Priest, G./Routley, R. (1989b), Systems of Paraconsistent Logic, in: Priest, G. et al. (eds.), Paraconsistent Logic. Essays on the Inconsistent, Philosophia, München, 151-186. Urbas, I. (1990), Paraconsistency. Studies in Soviet Thought 39, 343-354. Urchs, M. (1990), Parakonsistenz in schwachen Modalkalkülen. Konstanzer Berichte zur Logik und Wissenschaftstheorie 11.
SIEGFRIED
GOTTWALD
Many-Valued Logic with Partially Sound Rules of Inference
1
Introduction
We start from the naive idea behind many-valued logic1 that the truth degrees which in many-valued logic take over the role of truth values of classical two-valued logic formalize some graduation of truth. Formulas of many-valued propositional logic thus describe propositions which may be only partially true (or partially false), i.e. which may have a truth degree different of one and zero. The same is the case for closed formulas of many-valued first order logic. Additionally, there formulas which contain free individual variables describe properties which hold for the objects, of which they are properties, only to some (truth) degree. As all standard systems of logic, many-valued logic has a syntactic and a semantic aspect. The semantic considerations for many-valued logic are based (i) in the propositional case on valuations, i.e. mappings ν : V —> V from the set V of propositional variables into the set T> of truth degrees and completed by a consequence operation Cn s '• Ρ (Τ Olí) —• P(TOV.) over subsets of the class TOH, of all (well formed) formulas, and (ii) in the first order case on interpretations A which map individual constants into a given universe of discourse |.4| and predicate letters (of arity n) to (n-ary) functions from |.4| into the set V of truth degrees and again completed by a consequence operation Cn^ : Ρ(ΡΟΊΖ) —> P{TOH). The syntactic considerations for many-valued logic are based on suitable calculi fixed by their respective sets of axioms and sets of inference rules. (Inferences in any case are finite sequences.) In any case, one of the main goals of those calculi is the axiomatization of the set of logically true formulas or of the logical part of elementary theories.
'Cf. Gottwald (1989) and Bolc/Borowik (1992).
Siegfried Gottwald
386
2
The problem of this paper
Of course, not every inference schema is accepted as an inference rule: a necessary restriction is that to sound inference schemata, i.e. to inference schemata which led "from true premisses only to a true conclusion". For many-valued logic this actually shall mean either that in case all premisses have t r u t h degree 1, which we suppose to be the only designated one, also the conclusion has truth degree 1 or that the conjunction of all premisses has a truth degree not greater then the truth degree of the conclusion. Now, looking back at the basic ideas we mentioned, one recognizes that many-valued logic although generalizing traditional truth values to t r u t h degrees and thus graduating them, i.e. allowing for partially true sentences, does not at all discuss some graduation of the soundness condition. Thus we here look at the problem: What about partial soundness for inference
schemata?
Is it possible to consistently discuss such a notion of partial soundness? And if possible: how such a notion can be integrated into many-valued logic? Regarding applications of partially sound rules of inference, it is quite obvious that an analysis of the heap paradox or the bold man paradox or other types of paradoxes may, instead of referring to the use of implications with a t r u t h degree a little bit smaller then 1, become based upon the use of inference schemata which are "not completely sound".
3
Approaching the problem
As already in the preceding remarks we will restrict the considerations here to Lukasiewicz type many-valued systems: truth degrees are a subset of the real interval [0,1], bigger truth degrees are the "better" ones, and 1 is the only (positively) designated truth degree. As the inference schema under discussion let us consider the schema , .
(R)
Ηι,..., —
Ηη Ή
—
with η premisses Η \ , . . . , Η η and the conclusion Η . Furthermore, we use ¡G] to denote the truth degree of the formula G. The dependence of | G ] from the supposed interpretation and a valuation of the (free) individual variables can be supposed to be clear from the context. The usual soundness condition for (R) we shall consider is the inequality (1)
[#!&...„] one should have (4)
[G,] H]| O
\={H1B...BHN->H).
These equivalences give another way to approach partial soundness instead of (3). D e f i n i t i o n 1 For a schema of inference R its degree of soundness shall be (6)
K{R)
=DEF
i
n
f
(
[
H
J
)
with the infimum taken over all interpretations individual variables.
and all valuations
Corollary 1 With —* the Lukasiewicz implication, characterized truth degree function seqL(u,v) = min{l, 1 — u + v}, one has K(R)
=
1-
S(R)
of the by the
Siegfried Gottwald
388
and thus (6) as a suitable generalization
of the idea which led to (3).
For K(R) the degree of soundness of inference rule ( R ) , one thus always has K(R)
u for some truth degree u. In this second sense confidence itself is graded in some sense, and this is in very interesting coincidence with the basic idea of many-valued logic, i.e. with the graduation of truth. Soundness condition (1) now can be read as allowing only such inference schemata as sound ones which transfer the "common confidence" in the premisses, i.e. the confidence in the conjunction of the premisses into a suitable confidence in the conclusion. This reading of soundness shows that and why soundness condition (1) seems to be preferable over soundness condition (2). And this reading is based on a kind of identification of truth degrees with degrees of confidence (in the sense that degree u of confidence in H means | / / ] > u) - and this does not seem completely unreasonable. Yet, here this interpretation of truth degrees as (lower bounds of) confidence degrees either refers to an identification of truth degrees with degrees of confidence - or it can simpler be seen as an addition of confidence degrees to classical logic.
Many-Valued Logic with Partially Sound Rules of Inference
389
Up to now the discussion was related simply to soundness. What about partially sound rules of inference? Of course, depending on their degree of soundness the confidence in the conclusion, given the confidences in the premisses, should be smaller than in case of a completely sound rule of inference (with the same premisses) — and becoming as smaller as the degree of soundness is becoming smaller. Looking again at schema ( R ) and first assuming full confidence in the premisses, i.e. assuming [ / / , ] = 1 for 1 < i < η or |= H, for 1 < i < τι, it seems reasonable to assume k(R)
< confidence in / / ,
i.e. to assume (7)
IF
[ / / , ] = ... = [HN] = l
THEN
k(R) 0 for 1 < i < η as well as β > 0; furthermore β has to be a function of Q j , . . . , an: β =
/?( / ? ( « ! , . . . , a n ) . Taking (fi) = ( R , y n , R s e m ) with now (Rsyn) for (R), because (R) describes the "syntactic part" of (fi), one h ELS (10) ( f i )
corresponds to
( Ηι>·"'Ηη V Η
;
α ΐι···>αη j p(ai,...,an)/
Moreover, starting a deduction from a set Σ of "premisses" using inference rules of t y p e ( f i ) needs premisses which have the form of ordered pairs (formula; degree), i.e. one in such a case has to assume (11)
Σ = {(Hi,αχ),
(Η2,α2),...}.
B u t this exactly means to consider this set of premisses as a mapping (12) Σ : T ö n
Τ>
if one "completes" this set Σ of (12) with all pairs (H, 0) for which Η £ {HI,H2,...}.
W i t h T> = [0,1] or V Ç [0,1] as was always supposed up to now, (13) means t h a t Σ is a fuzzy subset of the set Τ Olí of all well-formed formulas.
5
Embedding the problem into fuzzy logic
This last remark opens the door for an interesting and more general point of view to look at our problem. To make this point, we first have to refer to the basic ideas of fuzzy sets and fuzzy logic. From a m a t h e m a t i c a l point of view a fuzzy set A over some given universe of discourse X is just a function A : X —> [0,1]. T h e basic ideas are t h a t (i) a fuzzy set is a generalized characteristic function and (ii) t h a t each value A(a) is t h e degree of membership of the object α w.r.t. the fuzzy set A. Having in mind t h a t traditional sets — crisp sets in the jargon of t h e fuzzy sets people — formalize properties of (some given class of) objects, it is easy to see t h a t fuzzy sets describe properties which suitable objects, i.e. t h e elements of some given universe of discourse, may have only partially, i.e. only to some degree. This degree is just the membership degree. By fuzzy logic — in the sense of the word we use it here — an extension of m a n y - v a l u e d logic is understood which allows to infer not only from usual, i.e. crisp sets of premisses, but also from fuzzy sets of premisses. Fuzzy logic
392
Siegfried Gottwald
in this sense first was studied by J . Pavelka. 3 Fuzzy logic, thus, combines the idea of a logical calculus as a formal system for inferring formulas from given (sets of) premisses with the idea of fuzzy sets in the way that fuzzy logic allows for only partially "given" premisses, i.e. for fuzzy sets of premisses. In the background there is the understanding that the membership degrees of the fuzzy sets have to be understood just as and identified with the truth degrees of some suitable system of many-valued logic: as truth degrees especially of the property of "being a member of". The semantic considerations for fuzzy logic are based (i) on the valuations ν : V —• V which map the set of propositional variables V into the set T> of membership degrees and completed by a consequence operation C n J : F (TOH) -ν F (ΤOil) over the fuzzy subsets (with membership degrees in T>) of the class TOH. of formulas, and (ii) in the first order case on interpretations A which map individual constants into the universe of discourse |.4| and predicate letters (of arity τι) to (n-ary) fuzzy relations in |.4| and completed again by a consequence operation C n £ : F ( T O T V ) —> F [ T O T V ) over the fuzzy subsets (with membership degrees in T>) of the class J-Ö1Z of formulas. On the syntactic side, in fuzzy logic each inference rule R with k premisses splits into two parts R = (Rl,R2) such that R1 is a (partial) fc-ary mapping from J-ΌΤΖ into TOH. and R2 is a k-ary mapping from V into T>. The idea is that R2 associates with the degrees to which actual premisses of R are given a degree to which the actual conclusion of R is given. Formally that means that the rules of inference in fuzzy logic usually 4 are given in the form of an ordered pair and written down as (R)
r«m(û1,...,an)j
with r'yn(Hi,..., Hn) € 7011 and r " m ( a ! , . . . , a „ ) € V a truth and membership degree. Therefore, now it is obvious that our approach shows that looking at partial soundness of inference rules via their formulation in the form (R) leads immediately into the field of fuzzy logic: the sets of premisses to start a deduction from become fuzzy subsets of the set of all formulas, and the inference schemata become in a natural way the form those schemata have in fuzzy logic. Hence the natural way to treat the problem of our paper is to embed the traditional approach to many-valued logic into the more general approach which characterizes fuzzy logic. Having done this, each partially sound rule of inference can equivalently be transformed into some fuzzy set of premisses. 3 4
C f . Pavelka (1979). A s e.g. in Novak (1989), (1992).
Many-Valued Logic with Partially Sound Rules of Inference
393
And applying that partially sound rule has the same effect as to infer from its corresponding fuzzy set of premisses.
References Bole, Leonard/Borowik, Piotr (1992), Many-Valued Logics, /., Springer, Berlin. Gottwald, Siegfried (1989), Mehrwertige Logik. Akademie-Verlag, Berlin. Novak, Vilem (1989), Fuzzy Sets and Their Applications. A. Hilger, Bristol. Novak, Vilem (1992), The Alternative Mathematical Model of Linguistic Semantics and Pragmatics. Plenum Press, New York. Pavelka, Jan (1979), On fuzzy logic. I, II, III Zeitschrift für Mathematische Logik und Grundlagen der Mathematik 25, 45-52, 119-134, 447-464.
G E R H A R D SCHURZ
Nonmonotonic Reasoning and its Relation to Probabilistic Reasoning Abstract: After an introduction to nonmonotonic reasoning I try to give a probabilistic validation of it which is based on ε-semantics. Whenever a consequence is derived from a defeasible law and a fact in the presence of f u r t h e r facts, a default assumption is generated claiming that these further facts are probabilistically irrelevant. Each extension E¡ of a knowledge base Κ (in Reiter's sense) corresponds to a set of default assumptions Dt generated by E{. It is proved t h a t if Reiter's original definition is modified, then for each extension Ei, Di will be ε-consistent with K , and E, will contain exactly those sentences which are ε-entailed by Κ plus Dt. As a result, we obtain a method of calculating lower probability bounds of the consequences in Ei from t h e default assumptions Di and some given (nonextreme) lower probability bounds associated with the defeasible laws. Finally, a m e t h o d of deriving one single and preferred extension E is introduced which is based on a solution of the problem of collective defeat and gets probabilistically justified in the same way.
1
Introduction
A great p a r t of human reasoning is based on uncertain (1)
laws like
"Birds normally can fly" formalized as: Bird(x) =>· Can-Fly(a;)
(=>· for uncertain implication). Nonmonotonic reasoning starts from t h e observation t h a t ' f r o m the uncertain law (1) plus the instantiated antecedent Bird(tweety) ("Tweety is a bird") we are allowed to derive the instantiated consequent Can-Fly(tweety) only as long as nothing else is derivable from our knowledge base Κ which implies that Can-Fly(tweety) is false, i.e. t h a t Tweety is an "exceptional" bird w.r.t. flying. For instance, if we also know Penguin(tweety) and the strict law Penguin(x) —» C a n ' t - F l y ( x ) (—• for material implication), then the detachment from (1) is no longer allowed. We also say, t h a t law (1) is defeated, and call uncertain laws like (1) defeasible laws. Thus, inference from defeasible laws is nonmonotonic: additional knowledge may make previously derived concequences underivable.
Nonmonotonic Reasoning
395
Various different systems of nonmonotonic reasoning have been developed — nonmonotonic logic 1 , default reasoning 2 , defeasible reasoning 3 — but the problems seem to be still greater than the success which has been reached. 4 The most important task is to give clear criteria for the justification of default reasoning systems, which presupposes a clear definition of the correctness of a nonmonotonic inference. In deductive logic, correctness coincides with truth-preservation: if the premises are true, then the conclusion is certainly true. But what is — or better: should be — preserved in a nonmonotonic inference? One most plausible suggestion is probability: given the premises are true, then the conclusion is true with high probability (in the statistical sense). The practical reason for this demand is clear: if the demand is satisfied, and the assumptions of an expert system. < L, F > are true or at least highly probable, then the expert system applied to a representative sample of applications will produce correct predictions in a high percentage of cases, and hence is reliable.5 Unfortunately, to establish a satisfactory connection between default reasoning and probability theory is rather difficult. This paper is one more step in this direction. I base the following considerations on ε-semantics developed by Adams 6 and suggested by Pearl 7 as the basis for a probabilistic justification of nonmonotonic reasoning. First some terminology. In what follows, χ (y...) stand for sequences of individual variables ( < £,· | i < η > for some η > 1) and a (b...) for sequences of individual constants; Ax (Bx ...) are open formulas of the first order language C containing the variables in χ free; Aa is the closed formula resulting from Ax by substituting a¿ for Xi (1 < i < η). Formulas of the form Aa are also called 'facts'. ('Proper' facts have to be quantifier-free; but we don't need this assumption). A defeasible law has the form Ax => Bx (note that is not an expression of C). A knowledge base is a tuple Κ = < L, F > with L a finite set of defeasible laws and F a finite set of facts, "h" stands for logical (first order) inference, and "|~¿" stands for (indexed) notion(s) of nonmonotonic inference. ε-semantics interprets defeasible laws Ax => Bx as 'high' conditional probability statements of the form p(Bx/Ax) > 1 — ε, for e a small but nonzero number. For purposes of application the probabilities are assumed to be statistical ones (established by experts in some reliable way). As in Goldszmidt et al 8 we extend the usual definition of conditional probability 'McDermott/Doyle (1980). Reiter (1980), Poole, (1988), Delgrande (1988). 3 Nute (1992), Schurz (1994). "Cf. Poole (1991). Similarly argues Adams 1975, ch. III, §4. 6 Adams (1975). 7 Pearl (1988, ch. 10.2). 8 Goldszmidt et al (1990, 647). 2
396
Gerhard Schurz
by putting p(Bx/Ax) = 1 if p(Ax) = 0; this simplifies several definitions. A set L of defeasible laws is called ε-consistent iff (if and only if) for every (arbitrarily small) ε > 0 there exists a probability distribution ρ which is proper for L such that p(Bx/Ax) > 1 — ε for every defeasible law Ax =>• Bx € L Thereby, ρ is called proper for L iff for each Ax => Bx € L with consistent Ax, p(Ax) > 0 holds. 9 L ε-entails a defeasible law Cx Dx, in short L |~E Cx Dx, iff for every (arbitrarily small) S > 0 there exists an ε > 0 such that for all probability distributions ρ which are proper for L and satisfy p(Bx/A) > 1 — ε for all Ax =>· Bx e L, p(DxJCx) > 1 — δ holds. 10 The definition of ε-entailment of factual conclusions Ca is given by: < L, F > |~ e Ca iff L |~E F x Cx, where F x stands for the conjunction of all the facts in F with constants α replaced by variables χ. 1 1 This is nothing but the old 'principle of total evidence' for direct inferences. 12 For sake of simplicity we did not introduce a separate set of deterministic laws L d of the form Ax —> Bx, with associated probabilities p(Bx/Ax) = 1, though such an enrichment could easily embedded in our framework. 13 Does ε-semantics yield the intended justification of default reasoning? Two arguments seem to speak against that. First, ε-semantics deals with extreme probabilities, arbitrarily close to 1, but in practical applications (e.g. expert systems) we reason with high but nonextreme probabilities. 14 For instance, a medical expert system typically tells us that the probability of a desease, given certain symptoms, is is high, say > 0.9 or 0.95, but not arbitrarily close to 1. But this argument is not really serious because of the following theorem: 15 T h e o r e m 1 (Adams) If {L\,..., Ln} |~ £ F x =>· Cx, and ρ is a probability distribution associating the conditional probability 1—ε, with each Li (\ < i < τι), thenp(Cx/Fx) > 1 - ( e ! + . . . + e„). This gives an easy way to calculate lower probability bounds of the conclusions of an expert system from (high but nonextreme) lower probability bounds associated with its defeasible laws, just by summing up the uncertainties ε; of the laws Li used in the proof of the conclusion, provided 9
Cf. Adams (1975, 51); Pearl (1988, 487). Adams simply excludes conditionals with inconsistent antecedents (1975, 46). 10 Cf. Adams (1975, 57); Pearl (1988, 484). 11 Cf. Pearl (1988, ch. 10.22). 12 Cf. Carnap (1962, 211); Bacchus et al (1993, 563). 13 We have then to understand h as logical derivability from Ld and consistency as consistency w.r.t. Ld. Truth valuations (cf. theorem 3) have to be restricted to those verifying Ld. Cf. also Geffner/Pearl, (1990, 71). 14 Cf. Pearl (1988, 494f). 15 Cf. Adams (1975, 57, Th. 3.1). Note that theorem 1 does noi presuppose that the facts in F are probalistically independent.
Nonmonotonic Reasoning
397
< L , F > ε-entails Ca. Of course, it must be presupposed that the lower probability bounds associated with the laws in L are probabilistically consistent. We will assume slightly more, namely that L is ε-consistent: this is a reasonable condition which implies probabilistic consistency for any nonextreme lower bounds and can easily be decided by theorem 2. A defeasible law Ax => set Γ of defeasible laws is defeasible law. Ax Bx valuation ν if v(Ax) = 1 respectively]. Theorem 2
Β χ is nontrivial if Ax is logically consistent; a nontrivial if it contains at least one nontrivial is verified [falsified] by a (propositional) truth and v(Bx) = 1 [w(Aa:) = 1 and v(Bx) = 0,
(Adams)16
L is ε-consistent i f f for every nontrivial subset Γ Ç L there exists a truth valuation falsifying no element of Γ and verifying at least one element ο/Γ. The really serious problem of ε-semantics — and this is the second argument — is that ε-entailment is much weaker than the typical entailment relations of nonmonotonic reasoning. The following theorem is the core of Adams' results: 17 T h e o r e m 3 (Adams
3.1)
I f L is finite, then L ε-entails following rules of inference:
A
Β i f f A =>· Β is derivable from L by the
(L):
Infer A => Β from Al· Β
(Logical
(C)
Infer A
(Cautious
(M)
Infer A A Β => C from A =>· Β and A =» C
(V )
Infer AM Β
(L*)
Infer A => Β from C =• D, 1/ ->C and C Η
C from Α
Β, A AB => C
Inference) Cut)
(Cautious Monotonicity)
C from A => C and Β
C
(Disjunction) (Logical Contradiction)
(Adams 3.2) The following inference rules are derivable: (A)
Infer A
Β A C from A
(LE)
Infer Β =» C from l· A
Β and A =• C Β and A =• C
(Conjunction) (Left logical equivalence)
(RW) Infer Λ => C from A => Β and Β l· C
16 17
(Right
Weakening)
Adams (1975, 52, th. 1). Adams (1975, 61f, th. 4); cf. also Geffner/Pearl (1990, 71); Pearl (1988, 485).
398
Gerhard Schurz
L has to be finite because ε-entailment is noncompact. 1 8 Defeasible laws derivable from an ε-consistent finite L are always derivable without (L*). 19 It follows from theorem 3 that |~ e is L-monotonic (< L, F > |~ e A, L Ç L* implies < L * , F > |~ e A). These inference rules alone (though reasonable 20 and safe) are too weak as a basis for nonmonotonic reasoning, because they do not allow the default moves which are characteristic for nonmonotonic reasoning — namely to infer Ba from Aa 6 F and Αχ Bx G L as long nothing else is known in Κ which implies ->Ba. For example, Can-Fly(tweety is inferred from Κ =< {Bird(x) =>• Bird(tweety)},{Bird(tweety),Female(tweety)} > because K ' s additional fact Female(tweety does not imply Can — Fly(tweety — it is irrelevant for the conclusion Can — Fly(tweety. But this step is not allowed in ε-semantics: < {Αχ Bx},Aa,Ca >\ft Ba, because Ax => Bx does not ε-entail _Ax A Cx Bx. So, what we need for a probabilistic justification of nonmonotonic reasoning are additional probabilistic assumptions which correspond to these 'default moves'. Goldszmidt et al 21 and in a similar way Bacchus et al 22 overcome this problem as follows. Instead of referring to all probability distributions with p(Bx/Ax) > 1 — ε for Ax => Bx S L (in the definition of ε-entailment), they pick out just one single probability distribution p*. In the maximal entropy approach of Pearl 2 3 and Goldszmidt et al 24 , ρ* is that probability distribution (among those satisfying the ε-constraints) which yields maximal entropy, in Bacchus et al 25 it is that which gives equal probability to all possible worlds compatible with what is known in the knowledge base. In the latter paper 2 6 it is proved that both approaches are equivalent for monadic languages. The justification does its job insofar Ba is now derivable from Ax Bx and Aa even in the presence of irrelevant additional facts. One problem of both approaches is their high computational complexity. 27 The bigger problem, I think, is that their additional assumptions are unnecessarily strong. Why should one make the — rather improbable — assumption t h a t the real world's entropy is maximal (among all possible and knowledge18
Adams (1975, 52). . . .whence Geffner/Pearl (1990, 71) and Pearl (1988, 485) omit this rule. Adams has two further rules (1975, 60f): his (R2) is derivable (see our theorem C.2, (LE), cf. also Geffner/Pearl (1990, 72); his ( R l ) is superfluous. 20 E.g., they correspond exactly to the basic axioms of cumulative logic after Kraus et al (1990). 21 Goldszmidt et al (1990), cf. also Pearl (1988, ch. 10.2.3). "Bacchus et al (1993). 23 Pearl (1988, ch. 10.2.3). 24 Goldszmidt et al (1990, 648f). 25 Bacchus et al (1993, 565f). 26 Bacchus et al (1993, 568). J7 Cf. Pearl (1988, 493). 19
Nonmonotonic Reasoning
399
compatible worlds) - if all what one needs to derive Ba from Ax => Bx and Aa Λ Ca is to asume that Cx is probabilistically irrelevant for Bx, given ΑχΊ I think the assumption of these two approaches is even too strong. For instance, it validates contraposition Ax =*· Bx Bx =Φ·~ Ax as a correct inference 28 , which intuitively is not generally correct on various reasons, for instance, because it does not preserve high probability. 29 Another undesired result is that sometimes inferrability depends on how (logically equivalent) defeasible laws are formulated. 3 0 In particular, if nonextreme probabilities are associated with the defeasible laws the approach implies too strong results since the fixed probability distribution p* will imply a definite probability value for every formula of the language. I what follows I give a minimal probabilistic justification of nonmonotonic reasoning, making only those probabilistic assumptions which directly correspond to default moves. Whenever a nonmonotonic reasoning system (with inference relation |~) infers a conclusion Β a from a law Ax Βχ £ L and an already derived antecedent Aa [< L, F > (~ Aa] it has implicitly assumed that the (remainder) facts in F are probabilistically irrelevant for Aa — i.e. that p(Bx/Ax) and p(Bx/Ax Λ F x ) are approximately equal; hence it has made the implicit default assumption F x Λ Ax Bx. We say that F x Λ Ax Bx has been generated by this inference step, and we associate the (nonextreme) lower probability bound associated with Ax Bx also with the default assumption F x Λ Ax => Bx. This idea is similar to the relevance-based approach of Geffner/Pearl, 3 1 who add irrelevance assumptions to knowledge bases; but their approach remains syntactical and gives no ε-semantical justification. Our main questions of §2 will be: First, is the set of implicit default assumptions D generated by a nonmonotonic reasoning system during the production of an extension of < L, F > always ε-consistent with L — and if no, under which conditions? Of course, the e-consistency of L U D is a minimal condition for regarding the generated default assumptions as justified. Second, can a correspondence be established between some relevant nonmonotonic reasoning system (|~) such that < L, F > Aa iff Aa is ε-entailed by < L U D , F > ?
2
Multiple Extensions and Generated Default Assumptions
Defeasible laws Ax => Bx correspond to Reiter's normal defaults of the form (Aa : M Ba/Ba).32 How are the nonmonotonic consequences of a knowledge 28
Cf. Goldszmidt et al (1990, 652). Cf. Pearl (1988, 847). 30 Goldszmidt et al (1990, 651). 31 Geffner/Pearl (1990). 32 Reiter (1980, 95). 29
400
Gerhard Schurz
base defined? According to the basic idea underlying Reiter (1980) and Poole (1988), one may derive nonmonotonic consequences as long as the resulting consequence set remains consistent. If a set of consequences derived in this manner is maximal, i.e. if every consequence derivable from it is contained in it, it is called an extension of the knowledge base. Each consistent normal default theory has an extension, 33 , but as is-well known, there may be multiple extensions. To illustrate it by an example, assume (2)
L = {Quaker(x) => Pacifist(x), Conservative(x) => ->Pacifist(x)} F = {Quaker(nixon),Conservative(nixon)}.
If we detach first Pacifist(nixon) from the first law and its instanciated antecedent, we obtain F U {Paci fist (ni χ on)} (plus classical consequences) as a fixed point, in which the second law is 'blocked'. If we detach first -ι Pacifist (nixon) from the second law and its instantiated antecedent, we obtain F U { - < P a c i f i s t ( n i x o n ) } (plus classical consequences) as a second fixed point, in which the first law is 'blocked'. Let C range over sets of fact-like ^-formulas, and Cn( C) {A | C h A} denote the classical closure of C. C is consistent iff ρ Λ ~>p $ Cn(C). Then, we may define the notion of an extension as follows. Definition 1 Let Κ = < L , F > be α fixed knowledge
base.
(1.1) < L , C > ( i Aa iff for some Bx Ax € L, (i) Ba € Cn(C) and (ii) Aa£Cn( C). (1.2) For f : ui^£[f(i) := Ai\ any enumeration of C's formulas, we define: (i) C0 = Cn(F), (ii) C ¡ + 1 = Cn(C\ U { Λ + ι }) if < L, C¡ > f i A ,·+1, else Q + l = C¡, finally (Hi) C f = U { C ¡ | i € ω). (1.3) C f is called an F-extension of Κ for each Aa with < L, C f > Aa, Aa £ C f holds. We write E f : = E f ( K ) for a Cf which is an F-extension of K. means "derivability in one step." It is easily seen that this definition of an F-extension of Κ is equivalent to Reiter's definition of K-extensions for normal defaults. 34 It is also clear that each E f ( K ) is consistent, provided F is consistent. Definition 1 takes into consideration that not any formula enumeration / will produce an extension. For example, if L = {Ax Βχ,Βχ Cx}, F = {v4a}, and Ca comes before Ba in the enumeration, then Ca will not be derived after Ba has been derived because it never appears once again in the enumeration. So, in this case Cf will not be closed under On the other hand, every extension will be produced by 33 34
Rei ter (1980, 95, th. 3.1). S e e Reiter (1980, 95, proof for Th. 3.1.).
Nonmonotonic Reasoning
401
some formula enumeration. That such an enumeration exists is important for the following. Also note that the reflexive and transitive closure of the inference relation |~ satisfies reflexivity and cut, but as a result of multiple extensions, neither cautious monotonicity nor conjunction. For each step i where some A,a was added to C; with help of Bx => A,χ € L, the default assumption generated by step i is F x Λ Bx =>· AiX. Df denotes the set of all default assumptions generated in deriving the extension E f (of a given < L, F >). We call L U Df the L-extension of Κ corresponding to E f . For the (most liberal) definition of |~ in def. 1, L U Df will not always be ε-consistent. Consider the example (3)
L = {Ax => Bx,Cx -·Βχ,Οχ Ax) F = {Aa,Ca} Illustration: "Λχ" for "x is an Adult", " 5 x " for "x is employed", " C x " for "x is a student".
< L, F > has two F-extensions E l = {Aa, Ca, Ba} and E 2 = { A a , Ca, ~*Ba}, with the corresponding sets of generated default assumptions D 1 = {Αχ Λ Cx =>· Bx} and D 2 = {Αχ Λ Cx ->ßx}. Only L U D 2 is ε-consistent, while L U D 1 is ε-inconsistent, since Ax A Cx => Bx is ε-entailed by Cx => Bx and Cx =Φ· Ax via (M). Hence, by theorem 1, E l is an example where def. 1 of an extension leads to probabilistically incorrect results: E l contains Ba though p(Bx/Fx) is low given the conditional probabilities of the laws are high. The example is a case of the well-known specifity rule: Ca gives more specific information than Aa about a since almost all C's are .A's but not vice versa, hence the law Cx Bx is preferred over Ax =>· Bx. Several recent approaches to nonmonotonic reasoning include this specifity rule as a means for selecting 'preferred' extensions.35 It is important to note, however, that ε-semantic does not give a general validation of the specifity rule, but only in the case where there are no further irrelevant facts. Take for example L as above and put F = {Aa,Ca,Da}. Then Α Λ Cx Λ Dx =>· Bx is again ε-consistent with L : = {Ax => Bx,Cx => ~^Bx,Cx =>• Ax], whence {Aa, Ca, Da, Ba} is ε-entailed by F together with an ε-consistent (and thus, probabilistically not incorrect) L-extension of Κ by default assumptions. To obtain the intended justification we must eliminate probabilistically incorrect extensions. We can do that simply by redefining the start set in def. 1 as follows: Definition 2 An "F-extension of K " is defined as in def. 1 except that the start set C 0 is defined as: C 0 := C £ ( K ) := {Aa E C | < L , F > |~£ A~\}. 3 5 C f . Poole (1988), Delgrande (1988), Nute (1991), Schurz (1994); see Schurz (1992) for applications to explanation.
Gerhard Schurz
402
If the start set contains all ε-consequences of < L , F > , we can prove that the standard process of forming a maximal consistent extension will generate only default assumptions ε-consistent with L. The proof proceeds through several lemmata. Γ, Δ range over finite sets of defeasible laws. h 0 means inference of propositional logic. L e m m a 1: (Adams 3 6 ) Γ υ { Λ χ => Bx} is ε-inconsistent iff Γ |~ £ Ax
->Bx.
L e m m a 2: If Γ is ε-consistent, then: Γ (~ e Ax Bx iff there exists some subset Δ := {Aiχ ß , x | i < η} Ç Γ such that: (a) V M · 1 | i < η } Λ Λ Η · * ~~* Β>χ M — η} ^ο AxhBx, and (b) AxA-'Bx h 0 \J { A Í X A ^ B Í X \ i < η). Proof: From A d a m s ' l e m m a 3 7 about 'yielding' in the 'proof of 4.1' and propositional logic. If D = Fa; Λ Ax => Bx, we define D" := Fa; assumption) and := {D* | D € D f } .
Bx (the 'reduced' default
L e m m a 3: ( 3 . 1 ) If Aa € E f ( < L , F > ) (according to def. 2), then < L U D f > |~ e F x => Ax. ( 3 . 2 ) L U D f and L U Djf are ε-interderivable. Proof: ( 3 . 1 ) : Straightforward induction on step numbers i in d e f . 2, using (C), (Λ) and {RW). ( 3 . 2 ) : For each F x Λ Ax => Β χ € D f , Aa € E f , whence F x => Ax is ε entailed by L U D f by l e m m a ( 3 . 1 ) . From F x Ax and F x Λ Ax =>· Bx, F x =Φ· Bx is ε-inferrable by (C); and vice versa, F x Λ Ax =$> Bx is ε inferrable from F x => Bx and F x => Ax by (M). L e m m a 4: Let D* be a finite set of default assumptions of the form Fx Bx and let L U D* be ε-consistent. Then: L U D* |~ e F x =• Ax iff L |~ £ F x ( Λ X -> Ax) for X a subset of {Bx | F x =>• Bx € D * } (f\X the conjunction of X's elements). Proof : Direction · Bx is in D*; hence D* |~ e F x =>'f\X by ( Λ ) · T h u s . L U D * Κ F x (/\X Ax) A f\X by (A), from which L U D* (~ e F x =>• Ax follows by (RW). Direction =ϊ: By l e m m a 2 L U D* |~ e F x =*· Ax iff there exists some finite subset L' := A¡x => fî.x | i < η} of L and D ' := { F x C¿x | i < m } of D* such that (a) ( V Í A * I i < η) V F x ) Λ ( A M ¿ * BiX \ i < η) A F x f\{C{x \i < m } ) ho F x Λ Αχ, and (b) F x Λ ->Αχ ho A --BiX \ i < η) V \ / { F x Λ ->C,x | i < m } . From (a) we obtain by propositional logic: 36
Adams (1975, 58, th. 3.5). Adams (1975, 61).
37
403
Nonmonotonic Reasoning (a') (VMiX m) —> (Fi ρ Λ (q —• r), (a") (VM.z
I i < η}) Λ BiX | i < η} h0 (Fx f\{CiX \ i < Λ Α χ ) ) , and since (ρ —ι• q) —.y (ρ Λ r) is logically equivalent with we obtain: I i < η}) Λ AM¿x -» BiX \ i < η} Η0 Fx Λ (/\{C,x | i < m}
Αχ).
Propositional transformation of (b) gives us: (b') Fx Λ t\{CiX I i < m } Λ - ~Άα) is in Co and hence also in C n , whence -*Aa must be contained in C n . But according to def 2, this contradicts the assumption that Fx Ax is added in step n. So LUDJI1+1 is e-consistent. — It remains to show that L U DJ is e-consistent. Since L is finite, DJ must be finite, too (each D G DJ corresponds uniquely to a law in L — of course, D may be used several times). So for some n, DJ = D J n ; so L U D* is e-consistent. Q.E.D. We are finally able to prove that each F-extension of < L, F > has the intended probabilistic justification via the L-extension L U Df. T h e o r e m 5 For any F-extension Ef < L U D f , F > |~ £ Aa.
o/ < L , F >
: Aa
€
Ef i f f
Proof: Again we may replace Df by DJ (lemma 3). Direction =>: By l e m m a (3.1). Direction Assume < L U D J , F > |~ £ Aa, hence LU DJ |~£ Fx Ax, and so L |~£ Fx =s> {f\X —» Ax) for some (finite) set of consequences of default assumptions in DJ ( l e m m a 4). So λ"[a] is in Ef (argued as for t h e o r e m 4), and Λ^Ία] —* Aa is Co and thus also in Ef, whence Aa w i l l be in Ef. Q.E.D.
404
Gerhard Schurz
C o r o l l a r y 1 If {1 — ε ι , . . . 1 — εη} ability
bounds
are nonextreme
1 — ( e i + . . . + ε η ) is a lower bound of p{Ax/Yx) theorem tions
from
these lower
associated
A e Ef.
lower
(conditional)
with the laws used in the proof
associated
which follows
bound plus the probabilistic
with the default
assumptions
prob-
of A £ E f ,
then
by
probability
irrelevance
assump-
generated
during
the proof
of
( P r o o f : T h e o r e m s 1 and 5.
It is certainly promosing to implement the content of c o r o l l a r y 1 into an e x p e r t system based on defeasible laws.
W i t h hardly any
computational
e f f o r t this system would be able to tell the user, for each of its predictions, its e x a c t lower probability bound f o l l o w i n g f r o m its defeasible laws and default assumptions. Herein I see the practical significance of this result.
3
Choosing a Single Extension: The Problem of Collective Defeat
T h e specifity rule is a basic tool for ordering conflicting laws (and their res p e c t i v e default assumptions) w.r.t. their plausibility. 3 8 G i v e n L = Bx,
Cx
-· Ax}
and { A a , C a }
C
F (F
ther f a c t s ) , then the default assumption Cx Λ F x => ->Bx Αχ Λ Fa; =>• Bx. tion
Bx
< L,F >
only
over
preserva-
if e v e r y formula Φχ inferrable f r o m F x v i a L
Φα] can be considered as irrelevant for Ax
if f o r no such Φ χ , L ε - e n t a i l s \Phix
=> ->Bx.
v i o l a t e d because L ε - e n t a i l s Αχ Λ C x ==> -'Bx. a single
is preferred
T h i s rule has its justification in the f o l l o w i n g
for irrelevance: F x is considered as irrelevant for a defeasible
principle
law Ax
{Ax
m a y contain fur-
Bx,
[hence
too —
i.e.,
In the a b o v e e x a m p l e this is O n e m a y c o n j e c t u r e that
extension can be produced as follows: if t w o laws are in conflict
and one is m o r e specific than the other, w e prefer the m o r e specific one, else b o t h laws are 'blocked'. and {Aa,Ca}
For e x a m p l e , if L =
{Ax
Bx,
Cx
->Bx}
C F w e d e r i v e nothing, since there is no priority b e t w e e n the
conflicting laws. Is this enough to produce a single consistent extension? T h e answer is no, because of the problem of collective
defeat
(so-called
a f t e r P o l l o c k . 3 9 Here, the consequents of m o r e than t w o laws taken together are inconsistent, but no proper subset of t h e m is inconsistent. Consider the following example:
3 8 Cf.
Brewka (1991, §5.4). (1988).
39 Pollock
Nonmonotonic Reasoning (4)
L
=
{Axx
=>· Βχχ,
Βχχ Λ
A2x
B2x,
405 D-^x, C2x
C\X
(Όχχ
—»
Β2χ)}
F = {Α\α,
Α2α,
CÍA,
C2A}.
Αχ = evidence for being married (Βχ),
Illustration:
A2
=
evidence
for being a priest ( B 2 ) , C\ = evidence for being catholic (£>1), C2 — evidence that the person obeys catholic laws. According to above proposal, the instantiated consequents of all four laws will be inferrable, but the result {B\a,B2a,D\a,D\a is logically inconsistent.
—> ~ Β,χ in L such that the corresponding set of instantiated law.consequents { f î , a | i < η } is inconsistent with Ce(K), no proper subset of { β , α | i < τι} is inconsistent with
though
Ce(K).
D e f i n i t i o n 3 /Abbreviation: Ba is less specific than Aa w.r.t. L iff < L , {Aa}
>(~
Ba, but not < L , {Ba}
>(~
Aa.]
Κ : = < L , F > ^ Ca iff (1) either Ca € C e ( K ) or (2) there exists Cx {Da}
€ L with < L , F > U {Aia
Da
{Aia
each collectively
\ i < η } it holds that either (2a) Κ
or (2b) some element of {Da} another
and for
U {Aia
defeating
Dx Κ -set
\f> A¡a for some i
|~ Aa, Ax
=> Bx
€ L but Aa is member of
a collectively defeating < L , F > - s e t each of which members is < L , F > inferrable, then the inference of Ba is blocked except that the collective defeat is undercutted (clause 2b). Our final task is to give the probabilistic justification of the inference relation of def. 3. Assume a knowledge base Κ : = < L , F > , let Ε κ : = { A a | Κ 4 0 Pollock 4 1 Nute
(1988, 493). (1992).
η,
\ i < η } is less specific w.r.t. L than
Λ } be its unique F-extension (ac-
Gerhard Schurz
406 cording to def.
3) and D r the corresponding set of default assumptions
generated during the derivation of Ε κ · We show that given L is ε-consistent, then L U D r will be ε-consistent (theorem 6), and < L U D r , F > |~e Aa iff Aa G E r will hold ( t h e o r e m 7). As an important corollary we obtain the consistency guarantee for E r (which, in distinction to the previous def. 2, is not obvious from the def. 3). T h e o r e m 6 Assume Κ = < L , F > .
If L is ε-consistent,
then L U D r
is
Proof : W e proceed be induction on the derivation of Ε κ (def. 3). D r
=
ε-consistent. is finite (cf. th. 4); assume 1 , . . . ,n is the ordering in which
{ D i , . . . , Dn}
the Di were generated. Let E j be the set of all consequences derived before £),·+1 was generated. By ind. hyp., L U D ¡ : = { D i , . . . , D , } is ε-consistent; we have to show that L U D j U { A + i } is ε-consistent, with Ex
Gx,
1 := F ζ Λ
Ex =>• Gx E L and Ea £ E¡. If not, then by l e m m a 1 (and
because Fx A Ex
Gx is ε-equivalent in L U D ¡ with Fa; =Φ· Gx, l e m m a 3),
L U D ¡ |~E F x =*· - ι G x ; and so by l e m m a 4, L X := {Bix,...,
Bmx}
F => (/\ X - » ->Gz) for
a (finite) set of consequences of default assumptions
in D ¡ . Each β , α is in E¡, and so by def 3 there must be laws AiX
BiX in
L and Λ,α must be in E ¡ for each i < η. But then, { Λ ; α | i < m} U
{Ea}
is a collectively defeating set, since {B¿a | i < m} U { G a } is inconsistent with / \ X [ a ] —y ->Ga, which is in C E ( K ) (and we choose X so that no subset of {Bia
I i < τη} U {Ga}
is inconsistent with Λ ^ Μ
~ Y*eYx Proof.
Ax iff Aa e E K . —
As for t h e o r e m 5.
C o r o l l a r y 2 Ε κ is logically consistent.
— Proof. By theorems 6 and 7.
References Adams, E. W . (1975): The Logic of Conditionals, Reidel, Dordrecht. Bacchus, F. et al (1993): Statistical Foundations for Default Reasoning, in: Proc. 13th IJCAI1993, Vol I, 563-569. Brewka, G. (1991): Nonmonotonic Reasoning. Logical Foundations of Commonsense, Cambridge University Press, Cambridge, Mass. Carnap, R. (1962): Logical Foundations of Probability, 2nd ed., Univ. of Chicago Press, Chicago, Illinois.
Nonmonotonic Reasoning
407
Delgrande, J. P. (1988): An Approach to Default Reasoning Based on a F i r s t Order Conditional Logic: Revised Report, Artificial Intelligence 36, 63 - 90. Geffner, H./Pearl, J. (1990): A Framework for Reasoning with Defaults, in: Kyburg, H.E. et al (eds.), Knowledge Representation and Defeasible Reasoning, Kluwer, The Netherlands, 69-87. Goldszmidt, M. et al (1990): A Maximum Entropy Approach to Nonmonotonic Reasoning, in: Proc. Nat. Con}, on AI (AAAI-90), 646-652. Kraus, S./Lehmann, D./Magodor, M. (1990): Nonmonotonic Reasoning, Preferential Models and Cumulative Logics, Artificial Intelligence 44, 167 - 207. McDermott, D./Doyle, J. (1980): Non-Monotonic Logic I, Artificial Intelligence 13, 41-72. Nute, D. (1992): Basic Defeasible Logic, in: Farinas-del-Carro, L./Pentonnen, M. (eds.), Intentional Logics for Programming, Oxford University Press, Oxford, 125-154. Pearl, J. (1988): Probabilistic Reasoning in Intelligent Systems, Morgan Kaufmann, Santa Mateo, California. Pollock, J. L. (1987): Defeasible Reasoning, Cognitive Science 11, 481-518. Poole, D. (1988), A Logical Framework for Default Reasoning, Artificial Intelligence 36, 27-47. Poole, D. (1991): The Effect of Knowledge on Belief: Conditioning, Specifity and the Lottery Paradox in Default Reasoning, Artificial Intelligence 49, 281-307. Reiter, R. (1980): A Logic for Default Reasoning, Artificial Intelligence 13, 81132. Schurz, G. (1992): Erklärungsmodelle in der Wissenschaftstheorie und in der Künstlichen Intelligenz, in: Stoyan, H. (ed.), Erklärung im Gespräch — Erklärung im Mensch-Maschine-Dialog, Informatik Fachberichte 310, Springer, Berlin, 1-42. Schurz, G. (1994): Defeasible Reasoning Based on Constructive and Cumulative Rules, in: Casati, R./Smith, B./White, G. (eds.), Philosophy and the Cognitive Sciences, Hölder-Pichler-Tempsky, Vienna 1994.
U W E SCHEFFLER 1
On the Ordering of a Causal Relation 1
Introduction
T h e main assumption of the paper consists in the claim that causation is a relation on (singular, first) events. According to this assumption, a causal relation settles a double matter: it picks out pairs of events being causally dependent, and it fixes the causal order of the dependent events. Hence, it is not surprising that causation is often treated as a dependence relation ordered by some ordering criterion. Following this approach, the underlying dependence relation is responsible for the essential causal properties. Such a dependence relation is, for example, certainly not a logical or mereological relation. It may be ontological (in a sense of generation, connectedness by laws, . . . ), or epistemic (connecting sense data, forcing h u m a n expectations, . . . ), or a combination; the validity of a causal modus ponens, the treatment of overdetermination, the choice of whether only full causes are allowed, and many other such questions are answered in the context of the concrete understanding of dependence. The ordering criterion serves to distinguish causes and effects inbetween the pairs of causally dependent events, it fixes causal priority. Usually, this results from requiring material conditions on causes and effects guaranteeing structural properties of the causal relation. In terms of properties of relations: the problem consists in answering the question how the ordering relation looks like with respect to reflexivity, symmetry, and transitivity. There seems to exist a clear answer by the vote of the majority, expressed in philosophical principles like: (i)
Nothing is cause of itself.
(ii)
An effect cannot cause it's cause.
(iii)
A cause of a (further) cause is cause of the effect.
These are, of course, irreflexivity, asymmetry, and transitivity. T h e first principle denies the possibility of a causa sui, the second principle prevents ' I a m indebted to the Deutsche Forschungsgemeinschaft for their support during the work on the topic of the paper. Most of the ideas addressed here were results of a common project of Max Urchs and me; I am grateful to Max for numerous discussions and valuable criticisms.
On the Ordering of a Causal Relation
409
backtracking, and the third principle requires the transitive closeness of the causation relation. Altogether, they prevent the existence of all kinds of causal loops and form a partial order. Despite of the vote of the majority two of the principles deserve a remark by the minority: (i)
Some authors mentioned, that it is not exactly clear why the causal relation cannot be reflexive. 2
(iii) There are very good intuitive arguments against transitivity. 3 As will be shown soon, both the majority vote and the minority remarks find their explanation in a relationship between the dependence relation and the ordering relation expressed by a result of graph theory: Irreflexivity must be guaranteed, and — despite of the counterexamples — transitivity plays an important role. It will be also shown that weaker variants (less objectionable) of transitivity would do the same job. In order to prepare the philosophical surrounding, the following section reminds of the main conceptions of dependence and priority in causal analysis. The concluding observations of the paper aim to answer a question as striking as the mentioned ones: Why do people mostly prefer to use temporal notions in order to induce causal priority, although probably almost all of them know the a r g u m e n t " P o s t hoc is not propter
hoc"?
2
Dependence and Priority
2.1
Dependence
The following attempts to explicate a causal dependence are chosen because they are widespread, rather than because they are the only promising ones. On the contrary, all of them were subject to numerous revisions and stimulated more developed and completely different conceptions. The first idea is due to Hume, who started with singular (token) causation. On the token level there is nothing more than the co-occurrence of two events, hence the analysis is forced to pass on to the general (type) level. On the type level some kind of connection, of force is presupposed, which works with necessity and certainty. But this is, as Hume argues, only a seeming experience. In reality, all what is left even on the type causation level are constant conjunctions: D e f i n i t i o n (Constant conjunction) An event token c causes a token e if and only if c is of type C and e is of 2 3
Cf. Hart (1987, 179). Cf. Urchs (1994, 391).
410
Uwe Scheffler
type E, and all events of type C are constantly conjoined with events of type E. There are well known criticisms of this conception, it is not the aim of the paper to spread about them. The only interesting point is that constant conjunctions obviously demand further ordering properties in order to guarantee irreflexivity and asymmetry (in case of Hume's original ideas, one of t h e m is temporal preceding). Regularity analysis, which takes it's starting point here, succeeds in guaranteeing irreflexivity by requiring the conditional c D e to be not logically valid. Another idea of Hume was developed mainly by D. Lewis: effects depend counterfactually on their causes. Roughly speaking, not only the occurrence of the cause influences the effect, but also the absence of the cause makes a difference for the effect — the world would be another one, if the cause would not occur. A summarizing sketch of this approach is represented by the following definition: 4
Definition (Counterfactual causality) Lete ande denote distinct token events and (for simplicity) sentences, claiming the occurrence of these events. Let •—• be a Lewis-style counterfactual conditional. Then e depends causally on c if and only if both of the counterfactuals cD—>e and ~cD—• ~e hold. Causation is the transitive closure of causal dependence. Again, the aim of the paper allows for leaving out closer inspection of the conception. Nevertheless, note the following facts: (i)
Irreflexivity is introduced as a supplementary requirement by defining c and e being distinct (•—• is reflexive).
(ii)
Transitivity is introduced by transitive closure (because •—» is not transitive) so that there may be cases of causation without causal dependence.
(iii)
Causal dependence (and, therefore, causation) is not asymmetric. It is not symmetric (for O—> contraposition does not do), but in case of c, e occurring in the actual world and both ~c, ~e occurring in the (only one) closest one, c and e are mutually causally dependent.
The third a t t e m p t to be mentioned here deals with probabilities. The main idea came into use from Reichenbach who claimed that causation means: the probability of the effect given it's cause is higher than that of the effect 4
Cf. Lewis (1986, 164ff.).
411
On the Ordering of a Causal Relation
event alone. This easy idea gave raise to lots of tricky formalizations. One of the most well known is the starting point of Suppes: 5 D e f i n i t i o n (Probabilistic causation) Let ct>, et denote events at t', t respectively, and P, as usual, a probability measure. Then, ct> is prima facie cause of et if and only if: (i) t' < t,
(ii) P(ct') > 0, and
(Hi) P(e(|c(
P(et).
As in the cases above the following remarks concentrate on the properties which allow an ordering: (i)
Irreflexivity is introduced by requiring strong temporal precedence of the cause event (otherwise, causal dependence would be obviously reflexive).
(ii)
Probabilistic causal dependence is not transitive. Formal reasons show, for instance, if in a causally connected triple the first event is sufficient for the second, this being a cause of the third (hence, P(e\c2,cx) = ^(elc 1 )). The lack of transitivity fits with our intuitions expressed in the counterexamples mentioned above (see below).
(iii) Asymmetry is due to strong temporal precedence, too. "Raising the probability" alone is not asymmetric, as a nice example from everyday life shows: being pregnant raises the probability of giving birth to a child, as well as giving birth to a child raises the probability of being (previously) pregnant (even to 1). Until now, only time was mentioned as providing the possibility to guarantee irreflexivity and asymmetry. Particularly because of the uPost hoc is not propter hoc" argument and of the ambitions to define time as the (predominant, may be) direction of causation, other criteria were suggested: marks and actions. 2.2
Marks and Actions
Causal analysis based on the notions of Marks and Actions contain some essential asymmetry in themselves. The first of the approaches mentioned here is due to Reichenbach and developed further on by Salmon. A mark is a material result of a change made in one of the events, and if it shows in the other, the former is cause, and the latter effect. Of course, a mark in the effect should not show in the cause. Reichenbach, consequently, defines first a causally between, and then formulates assumptions regulating the relations 5
Cf. Suppes (1970, 12).
412
Uwe Scheffler
between causally between and marking.6 An example of marking might be changing the color of light in a light source leading to a different color of the reflection: in this direction it works, but in the opposite direction it does not — because changing the color of the reflection (perhaps, by changing the reflecting surface) does not change anything in the light source. The existence of marks of such behavior forces asymmetry. Obviously, marking in this sense guarantees irreflexivity, too, because of the negative condition of the mark's not showing in the cause if made in the effect. Unfortunately, marking is not transitive. The reason becomes clear after the observation t h a t there well may be material changes in the cause which do not change the effect at all (suppose, for instance, the possibility to move the light source a bit without changing the reflection). Marking requires only the existence of some or other mark and not that all changes in a cause are marks which show in the effect. Hence, there is no necessity to suppose the existence of a mark in case of < c 1 , e > , if there are (possibly different) marks in case of < c 1 , c2 > and < c 2 , e > . The only way of obtaining transitivity consists in artificially requiring some kind of transitivity from outside. T h e other idea to be mentioned here is that of bringing about, von Wright defended the view that causation is not only closely related to acting, but also conceptually dependent on the latter. According to the direction of causation he claims the following: 7 Suppose there is a causally connected pair of events. If one of them is produced by an action or caused by an event which does not cause the other, it is the cause. In short, if an agent is able to bring about an event by producing another event, the former is effect and the latter is cause. Difficulties with transitivity (and common causes) are evident. Moreover, as von Wright mentioned by himself, if none of the considered events is produced or caused, the analysis is at a dead end. It is forced either to require some kind of determinism, or to abandon asymmetry, or to recognize causal relations without causes and effects. As von Wright deals with type causation, but considers instantiations of types in space and time in reflecting on causal order, he is able to exclude reflexivity. 2.3
Time
Temporal order is the most common criterion for causal order. Usually a relation of "earlier than" is used to order the causal relation. According to time points, there is no difficulty to interpret the "earlier than": m a p the time points to the set of real numbers, and use the relation "less than" on numbers. However, then events have to be related to time points — and this seems to be rather unnatural. Events are rather lasting entities, 6 7
Cf. Reichenbach (1956, 198f., 201f.). Cf. von Wright (1974, 44 ff.).
On the Ordering of a Causal Relation
413
have a duration. The more natural candidates to which they are related are intervals. But in case of intervals the relation "earlier than" is not as simple as it may seem. Consider the (complete) 13 possibilities of how two temporal intervals might be related in figure 1.
TIME t2 i1 t2 t1 t2 t1 t2 t* t2
!• t2 !> t2 f1
t2 t1
8
t2 t1
9
t2 t*
10
t2
11
— * —
12
iJ13
t2 !• t2
—
1
t
Figure 1 : Location of temporal intervals
If a philosopher requires an event to be earlier than another, which of the relations depicted from 1 to 13 she intends? Let t1 and t2 be the intervals in question and < be the relation "earlier than" — when does hold? It can easy be shown that at least all the relations on the left — from 2 to 7 — have suggestive natural language examples confirming their claim to be a kind of "earlier than". Besides, there are several possibilities to define i 1 < t2 with the help of more than one of the basic relations of figure 1. Except 3 and 7, all relations from 2 to 7 are irreflexive, asymmetric, and transitive; 3 and 7 are not transitive. Usually people would understand by "earlier than" something like 2U3U7, which guarantees partial order. The questions posed in the introduction will be answered by showing that a condition on 7 alone will do the job. The spell is formulated in graph theoretic notation.
414
3
Uwe Scheffler
Graphs
The following are some notions of graph theory and a basic theorem (without proof). They can be found in any textbook of graph theory. 8 Definition ( G r a p h ) G —< X, ~> is a graph iff X is a finite set, and ~ is a (irreflexive) on X.
relation
Definition ( P a t h s ) {xo, Χ χ , . . . , x m } is a path in G iff x, 6 X, and Vi(0 < i < m) : χ,· ~ x 1+ χ. {ζο, Χ\, . . . , Xm — \ , χ 0 } is a cycle iff {χ0, χ χ J . . . ) x-tn—i} is α path, and i m _ i ~ x0. {xj,Xi+2}j {im-2,io}, and {xm_x,xx} all are triangular chords in the cycle {xo, X\, . . . , Xm—1 ) x 0 } iff they are paths. As usual, elements of X are called vertices and depicted by "points", any pair of related vertices is called an edge and depicted by connecting the vertices with a line. Consider the graph in figure 2.
Figure 2: A graph with cycles and triangular chords Observe that {α2, α 5 , a 8 , ag, αγ, 02} is a cycle (of length 5), and { is a comparability graph iff there is a partial order < such that Vx, ydX: x~y&x 1,
z.B. Φ|: - , (3)
,
(4)
V)
i > 1,
(5)
( ) ^
Φ|: Λ, Φ]: V, Φ*: 3 ,
Φ?: ξ ,
Φ*0: ψ.
Operator, der n-Tupel klassischer Formeln bildet 1 < ; < (2n)p2) A p2 Η (-ιρι Λ -ip2) A Pi und damit
l· (-.p! V -7J2) Vpi Ρι
Ρι
V»
Ρ2
Ρ2
T h e o r e m 4 No ÁÍh bzw. No
( vollständige Reduktion von AÍ) gdw A?" Η bezüglich des ausgezeichneten Wertes 2 bzw. 10 gültig ist. Die Darstellbarkeit
beliebiger ausgezeichneter
Wahrheitswerte
in 2J
Im folgenden gebe ich für den 4-wertigen/2-dimensionalen Fall tabellarisch die Entsprechungen zwischen ausgezeicheten Werten und Gültigkeitsbegriffen in 2J wieder: Γ A ausgezeichnete Werte Symbol Definition von H, B D = {11,10,01,00}
HT
h
D = {11,10,01}
Ην
h (A V B)
((AV^A)A(BV^B)
D = {11,10,00}
He
\-{AcB)
D = {11,10}
h
h A
D = {11,01,00}
Hd
h (A C B)
D = {11,01}
Ν
h B
D = {11,00}
h=
l· (A = B)
D = {11}
I-a/Nl
h (A
AB)
D = {10,01,00}
h
D = {10,01}
\-{ΑφΒ)
D = {10,00}
l·-*
D = {10}
H-,2
D
- {10,00}
D = {01} D = {00} D =
(-.AV-B)
h
h (A Λ ->B) No ( N . ) h -A N, h (-,ΑΛΒ) Νλ h (->AA-i4) Λ ( ß Λ ->Β))
Ingolf Max
438
Diese Vorgehensweise läßt sich für beliebige 2 " - w e r t i g e Logiken verallgemeinern. T h e o r e m 5 Es seien
1 , 2 , . . . , 2 " die
sich auch als τι-dimensionale — auffassen Weise
lassen.
l_
3
Werte
2"-wertigen
einer
die
Dualzahlen
Für jedes D G { 1 , 2 , . . . , 2 " } läßt sich auf
naheliegende
aMh
— geschrieben
Logik,
als η-stellige
eine Entsprechung
Werte
der folgenden g¿w
Art
Η bezüglich
finden:
D gültig
ist.
Weitere Gültigkeitsbegriffe
N u n könnte es scheinen als seien trotz dieser enormen Ausdrucksstärke des Systems 2J die M ö g l i c h e r e n zur Einführung spezieller G ü l t i g k e i t s b e g r i f f e erschöpft. Ich möchte nun skizzieren, daß d e m nicht so ist. Eine naheliegende M ö g l i c h k e i t , die bei einer ausschließlich 1-dimensionalen Lesart der W e r t e m e h r w e r t i g e r Logiken verborgen bleibt, erschließt sich, wenn wir nunmehr nicht weiterhin eine funktionale Verknüpfung objektsprachlicher Ausdrücke voraussetzen. W i r erhielten zwar im 2-dimensionalen Fall der
konjunktiven
V e r k n ü p f u n g ein Zusammenfallen beider Betrachtungsweisen: 4 κ
X 2 gdw hA X 2 .
Betrachten w i r j e d o c h die disjunktive tion:
Verknüpfung, so ändert sich die Situa-
A\ gdw h A\ oder l· Ai
Definition 7 An. Beispielsweise erha ten wir W e n n |= v X,
so H v X,
oder ... oder h Ρ
, aber
An.
; es gilt nur:
aber nicht die Umkehrung.
D . h . welche ausgezeichneten W e r t e wir auch wählen, keine M e n g e b z g l . dieser W e r t e gültiger Formeln ist identisch mit der durch f = v charakterisierten. W i r können auch einen Begriff der i n n e r e n d i s j u n k t i v e n G ü l t i g k e i t definieren,
der nur f o r d e r t , daß die Disjunktion der E l e m e n t e der E - F o r m e l n
K - g ü l t i g ist, j e d e einzelne K - F o r m e l dagegen nicht: ι
D e f i n i t i o n 8 |=/
gdw Η Αλ V A2 V ... V An,
\f Alt
I/ A2r
..
j
An.
An D a n n ergibt sich beispie sweise
Κ
np
wenn [=/ X , so h v X .
A u c h den umgekehrten Fall können wir konstruieren, wobei wir uns auf den 2 - d i m e n s i o n a l e n Fall beschränken: 4 Auch
generell gilt: |=¿A gdw h A X .
Mehrdimensionale Gültigkeits- und Inkonsistenzbegriffe Ai
Definition 9 |= 3
gdw (wenn l· A\, dann l· Α·χ).
A2 Beispielsweise erhal
439
Ρ
hi
, aber
1
Ρ
; es gilt nur
r p . Wenn l·^ X, so 1=3 X, aber nicht die Umkehrung. Andere interessante Gültigkeitsbegriffe im 2-dimensionalen Fall sind:
Definition 10 (=c A h,
Β
A Β
gdw (wenn l· Β, dann h A);
gdw (h A gdw l· B);
h-v
gdw (1/ A oder 1/ B);
Ni
gdw nicht (h A gdw h B).
Empirische
Gültigkeit
Ein besonders spannender Fall ist die Definition des Begriffs e m p i r i s c h e G ü l t i g k e i t unter Verwendung von Quantoren: Αι
Al D e f i n i t i o n 11 Die
E-Formel
ist E—gültig [ symb.:
E
An J gdw (i) 3Ai h Ai (ii) 3A,· l/A, (\\ï)VAkjAk (1 M, zusammen mit einer Auszeichnung einiger Elemente von M als ausgezeichneter Werte 3 — eine vierwertige Matrix zu einem n-stelligen Junktor ist entsprechend eine Abbildung vom n-stelligen Kreuzprodukt der Menge M in M (mit einer Angabe ausgezeichneter Werte). Legen wir einige Werte als ausgezeichnet fest und ordnen den Junktoren der Implikation und Negation vierwertige Matrizen zu, so sind durch die Definitionen der übrigen Junktoren deren Matrizen eindeutig festgelegt. Ich nenne die Gesamtheit dieser Matrizen ein „Matrizensystem MS" und die Menge bestehend aus der Implikations- und Negationsmatrix „Basis des Matrizensystems MS". In ähnlicher Weise kann man nach Maßgabe eines Matrizensystems MS auch jeder Formel H mit η verschiedenen Propositionsvariablen eine Matrix zuordnen, wenn man zuvor eine Reihenfolge der Propositionsvariablen festlegt: die Formel Η läßt sich dann verstehen als Anwendung eines n-stelligen Junktors auf ein n-Tupel von Propositionsvariablen. Ich setze im folgenden eine auf der alphabetischen Reihenfolge aufbauende Ordnung voraus — jeder Formel H mit η verschiedenen Propositionsvariablen ist somit eindeutig ein n-Tupel von Propositionsvariablen und — in Abhängigkeit von diesem — eine n-dimensionale Matrix zugeordnet, z.B. der Formel (ç&p) D s das Tripel ( p , q , s ) zusammen mit der Matrix M ( p , q , s ) := C(K(q,p),s). Auf dieser begrifflichen Basis können wir definieren, was es heißt, daß ein Matrizensystem eine Formel oder Kalkülregel (bzw. umgekehrt) „erfüllt1. Sei FOR die Menge der (wohlgeformten) Formeln („WFFs") von L, THEcFOR die Menge der Thesen (i.e. Axiome oder Theoreme) des AK, und TAUT(MS)CFOR die Menge der „MS-Tautologien" i.e. derjenigen Formeln, deren Matrix nur ausgezeichnete Werte aufweist. Ein Matrizensytem MS erfüllt eine Formel H, gdw. H eine MS-Tautologie ist (i.e. H G T A U T ( M S ) ) , MS erfüllt die Abtrennungsregel gdw. für alle Formeln X und X D Y, die MS-Tautologien sind, auch Y eine MS-Tautologie ist (i.e. X G T A U T ( M S ) k X DY e TAUT(MS) Y G TAUT(MS)), MS erfüllt die Einsetzungsregel gdw. für alle MS-Tautologien X auch alle Einsetzungsergebnisse von X MS-Tautologien sind (i.e. X G T A U T ( M S ) = > Y G T A U T ( M S ) falls Y Einsetzungsergebnis von X). Ein Matrizensystem MS erfüllt demnach alle Thesen des AK, wenn die Menge der Thesen T H E eine Teilmenge der MS-Tautologien TAUT(MS) ist, und das ist dann der Fall, wenn das Matrizensystem MS alle Axiome und die beiden Regeln erfüllt.
solche Schachtelungen wie C(C(p,q),q) sind wir jedoch interessiert. 3 Ich verwende den Terminus „Matrix" insofern etwas anders als gewöhnlich, als ich jeweils nur einen Junktor betrachte — in dieser Einschränkung fallt der hier gebrauchte Begriff mit dem von Tarski und Lukasiewicz (1930) zusammen. Geht es um mehrere J u n k t o r e n so spreche ich s t a t t von „einer Matrix" von einem „Matrizensystem".
Die vierwertigen Systeme der materialen Implikation
447
Die Berücksichtigung von vier Werten soll im folgenden nicht als Abweichung vom Bivalenzprinzip in dem Sinne verstanden werden, daß gleichberechtigt neben resp. zwischen die Wahrheitswerte wahr und falsch weitere Wahrheitswerte treten (quasi als Abstufungen zwischen dem Wahren und dem Falschen), die Grundforderung der Bivalenz, daß jede Proposition genau eins von beiden — entweder wahr, oder aber falsch ist — soll vielmehr erhalten bleiben. Durch die Berücksichtigung von vier Werten soll lediglich innerhalb des Wahren bzw. Falschen eine Unterscheidung ermöglicht werden, so daß an die Stelle des einen Wahrheitswertes wahr zwei ausgezeichnete Werte („1", „2") treten, und an die Stelle des einen Wahrheitswertes falsch zwei nicht-ausgezeichnete Werte („3", „4"). Das Kriterium der Differenzierung innerhalb des Wahren resp. Falschen bleibt dabei offen, die Quasiwahrheitswerte ( „ l " - „ 4 " ) bleiben uninterpretiert. Die Unterscheidung von Wahrheitswerten („w"/„f" resp. von „ausgezeichnet"/,, nicht ausgezeichnet") und Quasiwahrheitswerten induziert eine Unterscheidung zweier (metasprachlicher) Begriffe der logischen Äquivalenz: zwei Formeln X und Y (die hinsichtlich ihres Propositionsvariablentupels übereinstimmen) können zum einen schon dann logisch-äquivalent genannt werden, wenn die Werte ihrer Matrizen hinsichtlich der Wertart („ausgezeichnet" oder „ n i c h t ausgezeichnet") übereinstimmen, i.e. wenn die materiale Äquivalenzformel X = Y eine MS-Tautologie ist (schwacher semantischer Aquivalenzbegriff:: „X äquii V") — oder aber man stellt die stärkere Bedingung, daß sie dieselbe Matrix besitzen (starker semantischer Aquivalenzbegriff:: „ X äqui 2 V").
2
Vorüberlegungen zur Struktur vierwertiger Matrizen der Negation und der materialen Implikation
Welche strukturellen Eigenschaften sollte eine vierwertige Negationsmatrix respektive materiale Implikationsmatrix aufweisen, damit wir sie als Verallgemeinerung der entsprechenden zweiwertigen Matrizen ansehen können? Betrachten wir den zweiwertigen Fall: daß wir ein triviales Matrizenpaar, das alle Thesen des AK erfüllt — etwa (N(p)—(w,w), C(p,q)=(w,w,w,w)) oder (7V(/>)=(w,f), C(p, ç)=(w,w,w,w)) — nicht ernsthaft als einen besonderen Fall von Negation und materialer Implikation ansehen, liegt daran, daß eine solche Lösung mit unserem vorwissenschaftlichen Verständnis kollidieren würde: es gäbe keine einzige Proposition, deren Negat falsch ist, bzw. wäre ihr Wahrheitswert mit dem ihres Negats identisch, und es gäbe in beiden Fällen keine einzige falsche Implikationsaussage. Halten wir diese drei P u n k t e in etwas verschärfter Form als Postulate für den vierwertigen Fall fest:
448
Helmut Linneweber-Lammerskitten
( W l ) E s gibt zu jedem Wahrheitswert eine Proposition, deren Negat diesen Wert annimmt. (W2) Kein Negat stimmt in seinem Wahrheitswert mit der negierten Proposition überein. (W3) Keine Implikation ist wahr, deren Antecedens wahr, deren Konsequens aber falsch ist. Ferner sind neben den beiden Postulaten der Existenz eindeutiger Negate und Implikationen, i.e. daß es zu jeder Proposition überhaupt ein Negat und genau eines gibt und ebenso, daß es zu zwei Propositionen ρ und q eine Implikation gibt und genau eine gibt (wobei zunächst offen bleibt ob eine solche Negation ein solche Implikation eine Proposition ist oder nicht) dem Propositionsstatus der Negate und Implikationen, i.e. daß das Negat einer jeden Proposition, die Implikation gebildet aus beliebigen Propositionen wiederum eine Proposition ist. vor allem die folgenden unverzichtbar: (W4)die Wahrheitsdefinitheit einer jeden Proposition] i.e. daß jeder Proposition überhaupt ein Wahrheitswert und genau einer (unter wie vielen möglichen auch immer) zukommt, (W5)die Wahrheitsfunktionalität der Negation und Implikation, i.e. daß der Wahrheitswert des Negates einer Proposition ρ ausschließlich vom Wahrheitwert von p, der Wahrheitswert der Implikation ρ D q ausschließlich von der Wahrheitswertkombination von ρ und q abhängig ist. (W6)die Bivalenz aller Propositionen, i.e. daß es genau zwei Wahrheitswerte gibt. Wenn wir von der zweiwertigen zu einer vierwertigen Betrachtung übergehen, und die Mehrwertigkeit nicht als eine Korrektur, sondern als eine Verfeinerung der bivalenten Sichtweise verstehen, so können alle Forderungen (einschließlich der der Bivalenz) übernommen werden, wenn wir zwischen „Wahrheitswerten" („w", „f") und „Quasiwahrheitswerten" („1", „2") als Verfeinerungen von „w" und („3", „4") als Verfeinerungen von „f" unterscheiden und nach Maßgabe der Forderungen ( W l ) — ( W 6 ) für Wahrheitswerte zusätzlich entsprechende Forderungen für Quasiwahrheitswerte formulieren. ( Q l ) es gibt zu jedem Quasi wahrheitswert eine Proposition, deren Negat diesen Wert annimmt; (Q2) kein Negat stimmt in seinem Quasiwahrheitswert mit der negierten Proposition überein;
Die vierwertigen Systeme der materialen Implikation
449
(Q3) keine Implikation hat einen ausgezeichneten Wert, deren Antecedens einen ausgezeichneten, deren Konsequens aber einen nicht-ausgezeichneten Wert besitzt; (Q4) jeder Proposition kommt überhaupt ein Quasi wahrheitswert und genau einer zu, (Q5) der Quasiwahrheitswert des Negates einer Proposition ρ hängt ausschließlich vom Quasi wahrheitwert von p, der Quasiwahrheitswert der Implikation ρ D q ausschließlich von der Kombination der Quasiwahrheitswerte von ρ und q ab. (Q6) es gibt genau vier Quasiwahrheitswerte. Welche Konsequenzen ergeben sich daraus für die vierwertigen Matrizen der Negation und Implikation? Betrachten wir zunächst die Matrix der Negation. Aus (Ql) ergibt sich die Forderung, daß die Negationsmatrix jeden der vier Quasiwahrheitswerte genau einmal enthalten muß: Ν aufgefaßt als eine Abbildung N : {1,2,3,4} —> {1,2,3,4} sollte bijektiv sein, i.e. falls N(x) = N(y), dann ist χ = y für alle x,y € {1,2,3,4}. Aufgrund dieser Forderung bleiben von den insgesamt (4 4 = 256) möglichen vierwertigen Matrizen monadischer Junktoren die (4! = 24) möglichen Permutationen der Zahlen von 1 — 4 übrig. Aus (Q2) ergibt sich die Forderung, daß es nicht vorkommen darf, daß in der x - t e n Zeile der Wert χ vorkommt, denn anderenfalls würde çine Proposition mit dem Wert χ ein Negat mit ebendemselben Wert besitzen: Ν aufgefaßt als eine Abbildung N : {1,2,3,4} -> {1,2,3,4} sollte fixpunktfrei sein, i.e. N{x) / χ für alle χ € {1,2,3,4}. Gemäß dieser zusätzlichen Forderung verbleiben 9 mögliche Matrizen. Aus (W2) ergibt sich, daß in den ersten beiden Zeilen nur die Werte 3 und 4 und in den letzten beiden Zeilen nur die Werte 1 und 2 vorkommen können: Für Ν aufgefaßt als eine Abbildung N: {1,2,3,4} -> {1,2,3,4} gilt N{{1,2}) = {3,4} und TV({3,4}) = {1,2}. Gemäß dieser Forderung verbleiben 5 mögliche Matrizen. Nehmen wir als eine weitere Forderung hinzu, daß
(Q7) das Negat des Negats einer Proposition ρ nicht nur im schwachen Sinn (diese Forderung steckt schon in (W2), sondern im starken Sinn mit ρ äquivalent sein soll, so ergibt sich, daß die Matrix für alle Werte die Bedingung erfüllen muß, daß sie in der x - t e n Zeile den Wert y besitzt, falls sie in der j/-ten Zeile den Wert χ besitzt: Ν aufgefaßt als eine Abbildung N: {1,2,3,4} —» {1,2,3,4} sollte involutorisch sein, i.e. N ( N ( x ) ) = χ für alle x, y € {1,2,3,4}. Somit bleiben noch zwei Matrizen übrig („3412" und „4321") — man kann sich aber leicht überlegen, daß sich die erste Negationsmatrix von der zweiten strukturell nicht wesentlich unterscheidet: die beiden Werte „3" und „4" haben lediglich ihre Rollen vertauscht — da die „natürliche" Ordnung aber hier keine Rolle
450
Helmut Linneweber-Lammerskitten
spielt (wir hätten statt der Ziffernsymbole z.B. auch Farbsymbole wählen können), können wir uns im folgenden auf die Berücksichtigung der zweiten Matrix beschränken. Soviel zur Negation — wenden wir uns nun den Implikationsmatrizen zu. Es gibt insgesamt 4 16 = 4.294.967.296 verschiedene 4 · 4 Matrizen mit vier verschiedenen Werten. Von diesen scheiden diejenigen von vorneherein aus, für die die Grundbedingung der Implikation (Q3) nicht erfüllt ist, i.e. bei denen an irgendeiner Stelle im rechten oberen Viertel ein ausgezeichneter Wert vorkommt. Aufgrund derselben Bedingung ist nach Maßgabe der Axiome ferner ausgeschlossen, daß in einer der restlichen Viertel ein nichtausgezeichneter Wert vorkommt. Damit reduziert sich die Anzahl der in Frage kommenden Matrizensysteme auf 2 16 = 65536 und alle diese Systeme erfüllen die genannten Axiome und Regeln. Viele dieser Systeme sehen jedoch Unterscheidungen zwischen Propositionen vor, für die es (normalerweise) keinen Bedarf gibt. Z.B. gibt es normalerweise keinen Grund zwischen der Behauptungverdopplung php und der einfachen Behauptung ρ zu unterscheiden, mithin sollte die redundante Proposition (php) mit der Proposition ρ gleichwertig sein. Ferner sollte im allgemeinen auch die Reihenfolge von zwei oder mehreren Konjunkten in einer konjunktiven Behauptung keine Rolle spielen, mithin sollten phq und qhp einerseits und (phq)hr und ph(qhr) andererseits gleichwertig sein. Fassen wir dies in den folgenden Postulaten zusammen: (Q8) php äqui 2 ρ
(Q9) phq äqui 2 qhp
(Q10) ( p h q ) h r äqui 2
ph(qhr)
Welche der möglichen Matrizensysteme diese 3 Forderungen erfüllen, läßt sich leicht durch ein BASIC-Programm abtesten, dessen Kern die folgenden Zeilen bilden: KV=0: REM Kontrollvariable = 0 FOR p—1 TO 4: FOR q=l TO 4 FOR r=l TO 4 IF K(K(p,q),r)K(p,K(q,r)) THEN KV=1 NEXT r IF K(p,q)oK(q,p) THEN KV=1 NEXT q
IF K(p,p)op THEN KV=1 NEXT ρ IF KV=0 THEN PRINT JÍS erfüllt die Forderungen 13" IF KV—1 THEN PRINT JAS erfüllt mind, eine der Forderungen 1-3 NICHT"
Man kann die benötigte Rechenzeit durch zwei Vorüberlegungen reduzieren, die es gestatten, die Menge der abzutestenden Implikationsmatrizen vorab einzuschränken: Die Forderung (Q8) (ldempotenz der Konjunktion) bedeutet für die K-Matrix, daß die Nordwest-Südost-Diagonale mit dem Werteverlauf von p, bzw. für die C-Matrix, daß die Nordost-Südwest-Diagonale mit dem Werteverlauf von N(p) übereinstimmen muß — aufgrund dieser Einschränkung bleiben 2 12 = 4096 mögliche Systeme übrig. Die Forde-
Die vierwertigen Systeme der materialen Implikation
451
rung (Q9) ( K o m m u t a t i v i t ä t der Konjunktion) bedeutet für die K - M a t r i x eine Achsensymmetrie bezüglich der Nordwest-Südost-Diagonale, bzw. für die C - M a t r i x eine Achsensymmetrie bezüglich der Nordost-Südwest-Diagonale — aufgrund dieser Einschränkung bleiben 2 6 = 64 mögliche Systeme übrig. Wenden wir uns nun den Computerergebnissen zu.
3 Auswertung der Computerergebnisse IV) I) III) Π) l = ( w , + ) 2=(w,-) l = ( w , + ) 2=(w,-) l=(w,-) 2=(w,+) l=(w,-) 2=(w,+) 3=(f,+) 4=(f,-) 3 = ( f r ) 4=(f,+) 3=(f,-) 4 = ( f , + ) 3=(f,+) 4=(f,-) System 7
System 4
System 3
System 11
1234 2233 3333 4334
1234 2244 3434 4444
1144 1234 4334 4444
1133 1234 3333 3434
System 10
System 1
System 2
System 12
1233 2233 3333 3334
1244 2244 4434 4444
1144 1244 4434 4444
1133 1233 3333 3334
System 5
System 6
System 9
System 8
1234 2234 3334 4444
1234 2234 3333 4434
1134 1234 3333 4434
1134 1234 3334 4444
Abb. 1
Konjunktionsmatrizen der zwölf Systeme, (Q8)—(QW) erfüllen
die die
Forderungen
Nur 12 der 64 möglichen Matrizensysteme erfüllen auch die dritte Forderung ( Assoziativität der Konjunktion) — in Abb. 1 sind diese 12 Systeme 4 in eine O r d n u n g gebracht, der die folgende Überlegung zugrundeliegt. Sei φ eine Eigenschaft, die eine jede Aussage ρ entweder besitzt oder nicht besitzt, dann gibt es zwei logisch interessante Fälle: einmal kann die Eigenschaft φ von der Art sein, daß sie immer dann, wenn sie ρ als Eigenschaft z u k o m m t , auch dem Negat von ρ zukommt und umgekehrt — oder φ ist von der Art, daß sie ~ ρ gerade nicht zukommt, wenn sie ρ zukommt, und umgekehrt. 4 Angegeben ist jeweils nur die Konjunktionsmatrix, die Negationsmatrix ist für alle Systeme gleich („4321"), die Matrix der materialen Implikation läßt sich aus beiden mit Hilfe der Gleichung C(p, q) = N(I q darf einen ausgezeichneten Wert haben, deren Antecedens einen ausgezeichneten, deren Konsequens aber einen nichtausgezeichneten Wert besitzt. Welche Bedingungen sollte ein strengerer Implikationsbegriff zusätzlich erfüllen? Darüber gibt es bekanntlich verschiedene Ansichten 8 — m.E. sollte er mindestens die folgenden Bedingungen erfüllen: (Z3) ( p - p ) (Z4) (p q) -> (~ q - > ~ p)
(Z5) ((p -
q)k(q
(Z6) ( ( p - > î ) & ( p
-» r)) r)) -
(Z7) (p — ( 9 — r ) ) - > ((pkq)
(Z8) (p -> 9)
(p -> r) (p -
(qkr)) r)
(p& ~ q)
Welche vierwertigen nicht-wahrheitsfunktionalen Matrizen jeweils bei Zugrundelegung eines der 12 Systeme alle diese Bedingungen erfüllt, läßt sich durch ein Computerprogramm ermitteln. Man kann die benötigte Rechenzeit auch hier durch Vorüberlegungen reduzieren: Die Forderung (Z3) (Identität) bedeutet für die CO-Matrix, daß in der Nordwest-Südost-Diagonale nur ausgezeichnete Werte vorkommen dürfen, die zweite Forderung (Konversion) eine Achsensymmetrie bezüglich der Nordost-Südwest-Diagonale. Aus (Z2) folgt, daß im oberen rechten Viertel keine ausgezeichneten Werte vorkommen dürfen, aus (ZI) und den bisher gemachten Überlegungen, daß die CO-Matrix entweder an der Stelle (1,2) oder an der Stelle (2,1) (oder an beiden) einen nicht-ausgezeichneten Wert haben muß. Als Resultat des Computertests ergibt sich, daß sich nur 6 der zwölf Systeme der materialen Implikation als Ausgangspunkt für eine solche Erweiterung eignen und daß es insgesamt nur 66 solcher Erweiterungen gibt. Abb. (2) zeigt nur die C0Matrizen: die ersten 12 bilden zusammen mit System 4, die folgenden 18 zusammen mit System 5 und die folgenden 3 mit System 8 eine geeignete Erweiterung, ferner die 12 ersten der dritten Zeile mit System 11, die folgenden 18 zusammen mit System 9 und die folgenden 3 mit System 6. Die Symmetrie dieses Ergebnisses beruht darauf, daß die Konjunktionsmatrizen der Systeme 4 und 11, der Systeme 5 und 9, sowie 6 und 8 durch konsequente Vertauschung der Werte 1 und 2, sowie 3 und 4 ineinander überführt werden können. Fassen wir zusammen: von den 65536 möglichen vierwertigen Systemen der materialen Implikation (zur Negationsmatrix „4321") erfüllen nur zwölf die Forderungen (Q8)-(Q10) und von diesen sind nur 6 als Basis für eine 6 Z u s a m m e n mit (Z3) ergibt sich daraus die Forderung für die EO-Matrizen, daß a lie und nur die Werte der Nordwest-Südost-Diagonale ausgezeichnete Werte sind. 8 V g l . Linneweber-Lammerskitten (1994).
Helmut Linneweber-Lammerskitten
454
Erweiterung zu e i n e m S y s t e m m i t strengerem ImplikationsbegrifF g e m ä ß den Forderungen ( Z 1 ) - ( Z 8 ) geeignet. 11434 1444 1444 1444 2444 2444 2444 2444 2444 2444 2444 2444 1444 1444 1444 1444 2444 1133 1144 1234 1244 1234 1234 1244 1244 2234 2234 2244 2244 1234 1234 1244 1244 1234 1414 1414 1424 1424 2424 2424 2424 2424 2424 2424 2424 2424 1224 1424 1224 1424 2224 Uli
Uli
Uli
IUI
1212 2212 1212 2212 1222 2222 1222 2222 U l i
Uli
Uli
Uli
1212
2444 2444 2444 2444 2444 2444 2444 2444 2444 2444 2444 2444 2444 2444 2444 2444 1234 1234 1234 1244 1244 1244 1244 2234 2234 2244 2244 2244 2244 2234 2244 2244 2224 2424 2424 2224 2224 2424 2424 2224 2224 2224 2224 2424 2414 2224 5224 2424 2212 1212 2212 1212 2212 1212 2212 1222 2222 1222 2222 1222 2222 2222 2222 2222 1133 1133 1134 1134 1233 1233 1233 1234 1234 1234 2233 3133 3133 3133 3133 3133 3133 32332 3133 3133 3233 3233 I U I 1211 U l i 1211 1112 1212 222 1112 1212 2222 2222 3131 3131 3131 3131 3131 3131 3231 3131 3131 3231 3232
2244 1133 1133 1133 1133
3232 1131 3131 1131 3131 1131
1134 1233 1233 1233 1233 1233 1233 1234 1214 1234 1234 1234 1234 1133 1133 1134 3133 3133 3133 3133 3133 3233 3233 3133 3133 3133 3133 3233 3233 3133 3133 3133 1211 1112 1112 1212 1212 2222 2222 1112 1112 1212 1212 2222 2222 U l i U l i U l i 1131 1131 3131 1131 3131 1231 3231 1131 3131 1131 3131 1231 3231 1131 3131 1131
Abb. 2
Matrizen für strengere 9 und 6
Implikationsbegriffe
1134 I
3234 3133 3133 3133 3133 3133 2222 U l i I I ! ) 1211 1211 I U I
in den Systemen
1
4, 5, 8, 11,
Literatur
Bergmann, Merrie (1981), Presupposition and two-dimensional logic. Journal of Philosophical Logic 10, 27-53. Epstein, Richard L. (1990), The Semantic Foundations of Logic. Volume 1: Propositional Logics, Kluwer, Dordrecht. Gottwald, Siegfried (1989), Mehrwertige Logik, Akademie-Verlag, Berlin. Linneweber-Lammerskitten, Helmut (1994), A Survey of the Derivability of Important Implicative Principles in Alternative Systems of Propositional Logic. In: Meggle, Georg /Wessels, Ulla (eds.), Analyomen 1, de Gruyter, Berlin, 76-87., Lukasiewicz, Jan/Tarski, Alfred (1930), Untersuchungen über den Aussagenkalkül. Comptes Rendues des Séances de la Société des Sciences et des Lettres de Varsovie 23, 30-50. Rautenberg, Wolfgang, (1979), Klassische und nichtklassische Aussagenlogik, Vieweg Verlag, Braunschweig/Wiesbaden. Kreiser, Lothar/Gottwald, Siegfried/Stelzner, Werner ( 2 1990), Nichtklassische Logik, Akademie-Verlag, Berlin. Rosser, J. Barkley/Turquette, Atwell R. (1952), Many-Valued Logics, NorthHolland, Amsterdam.
DIETRICH MARSAL
Formalization and Goedelization of Non-Circular Frege-Language Frege has shown of how to create powerful but simple meaningful systems of definitions such that no circular definition can occur. Every system of such a type may be called a "Frege language". Frege language may be used to build-up sciences (such as mathematics) or part of sciences (such as a theory of meaning) without reference to the mother tongue which is a circular language. In this text it is shown that sufficiently rich Frege languages can be formalized and goedelized and may contain undecidable sentences the correctness of which cannot be proven. 1 The Goedelization (arithmetization) of a system by assigning so-called Goedel numbers to its signs and expressions seems so far to be restricted to logical and mathematical systems such as predicate logic, finite logic, real number theory, group theory etc. In this paper Goedelization will be extended to a vast family of meaningful languages that were introduced essentially by Gottlob Frege and Blaise Pacsal 2 and may be called "Frege-languages". All words of a Frege-language C are defined by words ("prime words") that do not belong to C. An example is the definition of English words by French words whereby the set of defined English words constitutes a Fregelanguage with French words as prime words. This is a typical example of a Frege-language with many prime words. An opposite example is the build-up of mathematics from eight prime words. 3 In any case each prime word must have a meaning because Frege-languages are supposed to be meaningful languages. The meaning of the prime words must be known independently of C to avoid circular definitions. The definition of the words of C runs according to the following scheme: D e f i n i t i o n 1 Word 1 is defined by prime words D e f i n i t i o n 2 Word 2 is defined by prime words and/or word 1 (replacing word 1 by its definiens, word 2 is defined completely by prime words) ' T h i s investigation was suggested by Wilhelm F. Niebel, Frankfurt/Main University. K u t s c h e r a (1967, 3 5 4 - 3 6 6 , 3 6 2 - 3 6 5 ) . 3 M arsa! (1987), Marsal (1991), Marsal (1993). 2
Dietrich Marsal
456
D e f i n i t i o n 3 Word 3 is defined by prime words and/or word 1 and/or word 2 (defining word 2 completely by prime words, word 3 can be defined completely by prime words) etc. A language is called a "Frege-language" if all its defined words are defined according to that scheme, i. e., if each defined word is defined by prime words and/or words defined previously in words of the language. So the definiens of word k may contain the words 1 , 2 , 3 , . . . , k — 1 but must not contain the words k, k+1,... It can be proven 4 that each Frege-language is a noncircular system where no circular definition can occur. On the other hand, a language C is not a Frege-language if all or some words of £ are explained by words of £ (as in Webster's dictionary of the American language). Then a system of circular definitions results. A typical example of a non-Frege language is the mother tongue. It is our highest meta-language. All its abstract words are explained in terms of the mother tongue itself. There are no prime words. Consequently there results a complex system of circular definitions with collusions of meaning. For instance in some dictionary the word "example" is explained as an instance serving to illustrate a rule whereby the verb "to illustrate" means to make clear by giving examples. So the word "example" is explained by itself. As a consequence the mother tongue as a whole cannot be formalized or Goedelized in a correct manner. Whereas every mother tongue is a highest meta-language, a Frege-language may be a highest meta-language or not. The first case is more interesting: a carefully built-up highest Frege-language may substitute a large part of the mother tongue thereby clarifying its logical construction and avoiding collusions of meaning and circular definitions. To understand of how to formalize and goedelize a meaningful Fregelanguage of any kind we must know more about the properties of prime words. So far we just know that prime words have a meaning and are the building blocks of a Frege-language C. Quite obviously the prime words must already exist prior to C in the same sense as the bricks of a house already exist prior to the house. Additionally we may note that in general the total meaning of a prime word may be split up into two parts. First, a prime word may stand for some notion or object. This meaning may be called the "pre-linguistic meaning" of the prime word, because the meaning is pre-linguistic with respect to the Frege-language. Secondly, the prime word MAY have additionally an AXIOMATIC meaning. In this case the prime word is also part of a formula, a rule or an axiom etc. that is composed entirely of prime words and possibly 4
Marsal (1987,14-19), Marsal (1993), Marsal (1994).
Formalization and Göedelization of Non-Circular Frege-Language
457
variables. These axioms etc. can only be understood if the pre-linguistic meaning of the prime words is known and sufficiently rich. Obviously the axioms etc. enhance the pre-linguistic meaning of the prime words. It may be that the pre-linguistic meaning of the prime words is sufficient and no axioms etc. do occur. For instance, if the English word "woman" is explained by the known French word "femme" then in general no axiom is required. In most cases however a sufficiently rich Frege-language needs axioms to describe relations between two or more prime words. E x a m p l e . Let the prime words be L· and ( )E( ). Without sufficient p r e linguistic information no axiom such as (x&x)E(x) can be understood and used. If, however, the pre-linguistic meaning of & is togetherness and if ( )E( ) stands for "replaced by", then (x&x)E(x) means "x and χ replaced by x". The axiom is understood and enhances the meaning of two prime words. These considerations indicate that Frege-languages must be built-up as follows: Step 1 Formulation of prime words as meaningless signs. Step 2 Assignment of pre-linguistic meaning to the prime words to establish the pre-linguistic roots of the language. Step 3 Enhancement of the meaning of the prime words by axioms etc. that are composed of prime words. These axioms can be used if the pre-linguistic roots of the language are understood and sufficiently rich. Step 4 Non-prime words are defined by prime words or previously defined non-prime words of the language according to the scheme: wordl is defined by prime words. word2 is defined by prime words and/or wordl word3 is defined by prime words and/or wordl and/or word2 etc. Step 5 Build-up of a grammar from definitions, axioms, rules etc. There results a meaningful Frege-language C that may contain a meaningful representation of some topic such as mathematics or a theory of meaning. 5 As a consequence of the hierarchical build-up the formalization of this language C is simple and will lead immediately to Goedelization. Formalization. All prime words must be stripped from pre-linguistic meanings that cannot be stated in words of £ , i.e., step 2 must be omitted. There results a formal axiomatic system of signs that begins with axioms of meaningless signs and is the object language ÖC of the meaningful language 5
Marsal (1987, Part 4).
458
Dietrich Marsal
C. To talk about OC the meta-language C must be used and C must be sufficiently rich. G o e d e l i z a t i o n . The object language OC can be goedelized if meta-language C is sufficiently rich and satisfies essentially the following conditions: • C is finite in the sense that each word of C is composed of a finite number of signs and that each sentence (formula) of C is composed of a finite number of words. • C contains a predicate logic and some elementary number theory • If £ includes a powerful set theory then C must also include the Peano arithmetic or some weaker system that may also be E S S E N T I A L L Y undecidable. If however C contains some essentially undecidable theory then the object language of C is also undecidable. 6 Each axiom and every other formula of OC is composed of prime words (that are stripped from any meaning) and may also contain placeholders ("variables"). Consequently prime words and placeholders are the primitive symbols of OL and may be mapped into the odd numbers 3,5,7,9,11,... to start Goedelization. For instance, the primitive symbols of the example may be assigned to odd numbers as follows: sign: assigned number:
χ
k
(
3
5
7
) 9
)E( 11
Then the formula (x&x)E(x) may get a Goedel number in some familiar manner for instance by fixing the position of every sign by prime numbers according to the natural order of primes: position: assigned prime: There results
1 2
2 3
3 5
4 7
5 11
6 13
for the formula
(a:&a;)E(i)
the Goedel number
27335s731111133179 .
7 17
6 Definition: Theory Τ is essentially undecidable iff for every consistent theory S that contains T , S is undecidable; Pollock (1990,105).
Formalization and Göedelization of Non-Circular Frege-Language
459
References
Kutschera, Franz von (1967), Elementare Logik, Springer, W i e n / N e w York. Marsal, Dietrich (1987), Logik, Bedeutung und Mathematik. Die Konstruktion einer Fundamentalsprache der Wissenschaften, Schweizerbart, S t u t t g a r t . Marsal, Dietrich (1991), Ein Aufbau der Mathematik aus acht Zeichen. Zeitschrift für Semiotik 13, 257-271. Marsal, Dietrich (1993), Building Up Mathematics from eight Signs. Cognitive Systems 3, 350-367. Marsal, Dietrich (1994), Development of Symbolic communication. In: Dalenoort, G . J . (ed.), The Paradigm of Self-Organization II, Gordon and Breach, London, 202-218. Pollock, John L. (1990), Technical Methods in Philosophy, Westview Press, Boulder; Col.
UWE
MEIXNER
Nominalistischer Logizismus
Der das Anliegen dieses Aufsatzes sehr treffend charakterisierende u n d griffige T i t e l w u r d e mir von A r t o Siitonen vorgeschlagen; Ursprünglich — als V o r t r a g — hieß er, etwas u m s t ä n d l i c h , „Ontologisch m i n i m a l e S e m a n t i k f ü r die A r i t h m e t i k " . Doch n u n zur Sache. N a c h gewöhnlicher Auffassung ist die A r i t h m e t i k — d a r u n t e r v e r s t e h e ich hier allein die A r i t h m e t i k der natürlichen Zahlen — eine T h e o r i e ü b e r spezifische O b j e k t e ( O b j e k t e seien hier per se nichtsprachliche I n d i v i d u e n ) , e b e n die n a t ü r l i c h e n Zahlen. ( S t a t t „natürliche Zahl" sage ich i m folgenden k u r z „ Z a h l " ) . Auch Frege war dieser Auffassung. U m so ü b e r r a s c h e n d e r ist es, daß er a u ß e r d e m Logizist war. Ist nämlich die A r i t h m e t i k ein Zweig der Logik, so sollte sie eigentlich nicht von spezifischen O b j e k t e n h a n d e l n , d e n n die Logik t u t das j a insgesamt nicht. In ihr geht es u m die analytischen G e s e t z e f ü r die logischen K o n s t a n t e n , und der Sinn der logischen K o n s t a n t e n h a t doch nichts m i t einem b e s t i m m t e n O b j e k t b e r e i c h zu t u n . Freilich, so klar ist das nicht. Denn a n g e n o m m e n es gibt N a m e n , die logische K o n s t a n t e n sind ( N a m e n seien hier per se N a m e n f ü r O b j e k t e , O b j e k t n a m e n : N a m e n , deren intendierte Funktion es ist, O b j e k t e zu bezeichnen); n e n n e n wir sie „logische N a m e n " . Wenn nun die Logik die analytischen Gesetze f ü r die logischen K o n s t a n t e n angibt, so d e m n a c h auch die a n a l y t i s c h e n G e s e t z e f ü r die logischen N a m e n . Wo aber ein Name, d a wenigstens p r i m a facie — u n d b e i n a h e zwingend, wenn der N a m e in wahren singulären Aussagen figuriert —: d a auch ein durch ihn bezeichnetes O b j e k t . Es h a n d e l t also die Logik d a n n doch von gewissen besonderen O b j e k t e n , nämlich denjenigen O b j e k t e n , die von logischen N a m e n bezeichnet werden: d e n logischen Objekten. Bekanntlich h a t Frege Zahlennamen als logische K o n s t a n t e n aufgefaßt u n d Zahlen d e m e n t s p r e c h e n d — vom N a m e n z u m bezeichneten O b j e k t überg e h e n d — als logische O b j e k t e (er spricht von „logischen G e g e n s t ä n d e n " ) . Er h a t das nicht einfach bloß b e h a u p t e t , sondern in wohlmotivierter Weise d a d u r c h belegt, daß er die Z a h l e n n a m e n — sowie die anderen a r i t h m e t i s c h e n K o n s t a n t e n — durch K o n s t a n t e n , die er als unstreitig logische K o n s t a n t e n a n s a h , definierte. D a m i t w u r d e für ihn die A r i t h m e t i k zu einem Zweig der Logik, u n d die Logik befaßte sich für ihn in diesem Zweig allerdings mit spezifischen O b j e k t e n , nämlich denjenigen logischen O b j e k t e n , die, wie es
Nominalistischer Logizismus
461
scheint, durch die Zahlennamen bezeichnet werden. Der eben referierte Gedankengang, der dazu führt, daß der Logik ein ihr eigentümliches nichtsprachliches Sachgebiet, nämlich eins von logischen Objekten, verschafft wird, kann in zweierlei Weise in Frage gestellt werden: (a) Man könnte bestreiten, daß Zahlennamen logische Konstanten sind. (b) Man könnte darlegen, daß Zahlennamen zwar logische Konstanten sind, aber daß sie ihrem Sinn nach keine bestimmten Objekte bezeichnen (obwohl sie in wahren singulären Aussagen vorkommen!). Mit (a) verläßt man den Logizismus; mit (b) verbleibt man in ihm — allerdings in einem Logizismus, der das Spezifikum der Logik, daß sie zwar eine Wissenschaft, aber in keinem ihrer Zweige eine Wissenschaft von irgendeiner speziellen Art von Objekten ist, bewahrt. Ich möchte mich hier einmal auf (b) einlassen. — Die erste Frage, die nun zu beantworten ist, lautet: Was besagt dies, „daß ein Name seinem Sinn nach kein bestimmtes Objekt bezeichnet"? - Es beinhaltet (1), daß der Bezug des Namens dem Sinn des Namens gemäß abhängig vom Äußerungskontext ist (wie bei „ich" z.B.) und also mit dem Außerungskontext variiert; es beinhaltet darüberhinaus (2), daß der Sinn des Namens (anders als bei „ich") auch keinerlei Hinweis auf die Art des Objekts enthält, das der Name — im Äußerungskontext - bezeichnet; er stellt eine bloße Marke dar, und zwar gemäß (1) eine indexikale Marke. Ich werde dementsprechend Namen, deren Sinn kéinerlei Hinweis auf die Art des Objekts enthält, das sie jeweils bezeichnen, „Marken" nennen. Die meisten Namen in der Umgangssprache — indexikale wie nichtindexikale — sind keine Marken. Ich halte allerdings hier dafür, daß die sogenannten „Zahlennamen" ( „Eins", „Zwei", „Drei" etc.) tatsächlich gewisse Marken sind und daher die eingebürgerte Titulierung „Zahlennamen" irreführend ist; denn sie suggeriert, daß diese Namen ihrem Sinn nach jeweils ein Objekt einer gewissen — einheitlichen — Art bezeichnen. — Jedoch bedarf die These, daß „Zahlennamen" Marken sind, und zwar indexikale, der eingehenden Begründung, der ich mich nun zuwende. Ob in der Umgangssprache Marken vorkommen, oder nicht — es ist kein Problem, Marken in sie einzuführen, und es gibt gute sprachpraktische Gründe dafür, sie einzuführen. Jedenfalls dann, wenn es sich um indexikale Marken handelt. Es ist nämlich nützlich, über einen Vorrat von ihrem Sinn nach „artneutralen" Namen zu verfügen, die man von Kontext zu Kontext neu zur Benennung von beliebigen Objekten, die gerade zuhanden sind, einsetzen kann. (Der Bezug indexikaler Marken ist kontextabhängig, und zwar in extremer Weise: er setzt immer einen im jeweiligen Kontext erfolgten expliziten Benennungsakt voraus.) — Ich will mich nun auf die Betrachtung indexikaler Marken beschränken — die einzigen Marken, deren Einführung in die Umgangssprache, meine ich, ohne weiteres motiviert ist. Unter „Mar-
462
Uwe Meixner
ken" verstehe ich daher im folgenden immer indexikale Marken. Führt man Marken in die Umgangssprache — nennen wir sie „ £ " — ein, so ist es praktisch, sie syntaktisch einheitlich (in der Verschiedenheit) zu gestalten, in einer Weise, die sie von den schon vorhandenen Namen deutlich abhebt und die eine gewisse Reihenfolge ihrer Verwendung impliziert. Außerdem ist es naheliegend, sich einen unbegrenzten Vorrat von ihnen zu verschaffen; man weiß ja nicht von vornherein, wieviele von ihnen man einmal brauchen wird. Ζ. B. könnte man Marken folgendermaßen einführen: (i) „m" ist eine Marke von C. (ii) Ist μ eine Marke von C, so auch μ*. (iii) Marken von C sind nur Ausdrücke nach (i) und (ii). Mittels dieser rekursiven Definition verfügt man nun in der Umgangssprache über einen unbegrenzten Vorrat von Marken, die syntaktisch einheitlich gestaltet sind, in einer Weise, die sie von den vorhandenen Namen deutlich abhebt und die eine gewisse Reihenfolge ihrer Verwendung nahelegt: „m", „m*", „m**", ... . Das läßt sich freilich auch auf unendlich viele andere Weisen erreichen; (i) - (iii) ist jedoch eine der einfachsten. Die Marken von C so wie eben eingeführt - werde ich als paradigmatische Marken betrachten; unter „Marken" verstehe ich also im folgenden paradigmatisch die Marken von C. Können Marken als logische Konstanten gelten? Ihre Indexikalität ist dafür kein prinzipielles Hindernis. Mit logischen Konstanten wie „und", „nicht", „für alle", „ist identisch mit" haben „m", „m*", „ m " " etc. gemeinsam, daß ihrem Sinn keinerlei Hinweis zu entnehmen ist, über spezifisch welche Objekte in C gesprochen werden soll. (In C wird natürlich über „alle Objekte" gesprochen — daneben auch über gewisse — aber nicht alle — sprachliche Entitäten —, aber logische Konstanten implizieren keine nähere Spezifizierung dessen, was zum „All der Objekte" dazugehört.) Anders verhält es sich mit dem Namen „Fritz Müller" oder dem Prädikat „x sinkt"; weder dieses Prädikat noch jener Name sind logische Konstanten; denn derp Sinn von „Fritz Müller" können wir entnehmen, daß in C zumindest über eine gewisse Person gesprochen werden soll; dem Sinn von „x sinkt" können wir entnehmen, daß in L zumindest über Objekte gesprochen werden soll, von denen man sinnvoll (wenn auch nicht unbedingt wahrheitsgemäß) sagen kann, daß sie sinken. Beide Ausdrücke beinhalten eine Spezifizierung der Objekte, über die in C gesprochen wird, und das disqualifiziert sie als logische Konstanten. Wenn es überhaupt logische Namen gibt, dann gehören Marken sicherlich zu diesen. Sind nun Marken logische Konstanten, so ist zu erwarten, daß es für sie — wie für alle logischen Konstanten — analytische Gesetze des Wahrseins gibt. Aber bislang habe ich den Sinn von Marken nur gewisser-
Nominalistischer Logizismus
463
maßen negativ charakterisiert, nämlich dadurch, daß sie ihrem Sinn nach keine bestimmten Objekte bezeichnen. Aufgrund dieser Charakterisierung allein lassen sich noch keine analytischen Gesetze des Wahrseins für Marken ausmachen. Ich definiere nun aber: μ ist eine Nummer (von C) : = μ ist eine Marke (von £ ) , und für alle Marken (von C) μ', die verschieden sind von μ: (der Satz) μ „ = " μ ' (von C) ist nicht wahr. ( „ = " ist kurz für das ¿ - P r ä d i k a t „ist dasselbe wie"; die Relativierung auf den gegebenen Außerungskontext lasse ich der Kürze halber weg.) Der Sinn der Marken sei nun so beschaffen, daß jede von ihnen (in jedem Außerungskontext) eine Nummer ist; im übrigen soll das objektsprachliche Identitätsprädikat seinen normalen Sinn haben. Wir können also als metasprachliches analytisches Wahrheitsgesetz (das als solches nicht zur Umgangssprache C gehört) setzen: Al
Für alle Marken μ und μ': μ „ = " μ ' ist wahr genau dann, wenn μ identisch mit μ' ist.
Die Gültigkeit von Al erfordert nicht, daß im gegebenen Außerungskontext alle Marken ein Objekt bezeichnen. Wenn es kein Objekt gibt, das die Marke μ im Kontext bezeichnet, dann bezeichne sie eben in diesem Kontext sich selber (das hebt ihren Status als Objektnamen nicht auf, denn ein Objekt zu bezeichnen, ist nach wie vor ihre intendierte — wenn auch momentan nicht erfüllte — Funktion, und darum heißt sie „ein Objektname"). Die Gültigkeit von Al bleibt so gewahrt — auch wenn man das Identitätsprädikat in seinem klassischen Sinn nimmt —, selbst wenn im Äußerungskontext keine einzige Marke ein Objekt bezeichnet, sondern jede sich selbst. Und solche Äußerungskontexte werden nicht selten sein, denn oftmals werden wir von Marken j a keinerlei Gebrauch machen. Ich sage, daß eine Entität (im gegebenen Äußerungskontext) durch μ markiert wird, wenn und nur wenn μ eine Marke ist, die die Entität (im gegebenen Äußerungskontext) bezeichnet. Und ich sage, daß eine Entität durch μ numeriert oder gezählt wird, wenn μ eine Nummer ist, die sie markiert. Da alle Marken Nummern sind, ist eine Entität genau dann markiert, wenn sie numeriert ist. Wenn man Marken gebraucht, so möchte man gewiß objektsprachlich ausdrücken können, daß etwas für alle markierten Entitäten gilt. Zu diesem Zweck führt man zugleich mit den Marken einen substitutioneilen Marken— Allquantor [ ] in L ein, für den das folgende analytische Wahrheitsgesetz gilt: A2
[x]/4(x) ist wahr genau dann, wenn für alle Marken μ Α(μ) wahr ist.
Es sei darauf hingewiesen: Bei Α(μ) handelt es sich für jede Marke μ um einen Satz von C, und quantifiziert wird mit [ ] nicht über alle Marken, sondern über alle markierten Entitäten.
464
Uwe Meixner
M i t h i l f e des M a r k e n - A l l q u a n t o r s läßt sich objektsprachlich ausdrücken, daß eine E n t i t ä t χ markiert ist, nämlich durch „nicht [y](nicht χ = y ) " . Das Verhältnis zwischen M a r k e n - A l l q u a n t o r und n o r m a l e m A l l q u a n t o r ( ) ( d e m der klassischen P r ä d i k a t e n l o g i k ) stellt sich folgendermaßen dar: A u s ( x ) ( [ y ] ( nicht χ =
y ) oder Α ( χ ) ) kann man analytisch schließen auf [χ]/1(χ), und
u m g e k e h r t . D a m i t ergibt sich nach den logischen Gesetzen für den normalen Allquantor:
A u s (a;)A(a;) kann man analytisch schließen auf
aus
[x]/4(a;) und „(a;)nicht[y](nicht χ = y ) " kann m a n analytisch schließen auf (•x)A(x)·_ D a , w i e gesagt, die markierten Entitäten genau die numerierten sind, lesen wir „nicht[y](nicht χ =
y ) " auch im Sinne von „ x ist n u m e r i e r t " und
schreiben f ü r es (d.h ersteres: das objektsprachliche P r ä d i k a t ) kurz „./V(x)". ,,ZV(x)" ist ein indexikales Prädikat, denn es hängt v o m Äußerungskontext ab, welche E n t i t ä t e n numeriert sind und welche nicht. Z . B . m a g b z g l . einen Äußerungskontexts ,,./V(Fntz M ü l l e r ) " wahr sein, bzgl. aber nicht. Ν(μ),
des
des anderen
w o μ eine beliebige M a r k e ist, ist aber bzgl. jedes Äuße-
rungskontextes wahr, und darum auch , , [ x ] A r ( i ) " .
Das können wir aus A l
und A 2 herleiten, wenn wir die Definition von ,,/V(x)" berücksichtigen und das n o r m a l e analytische Wahrheitsgesetz für die N e g a t i o n (Für A:
(nicht
A)
ist wahr genau
dann, wenn A nicht
wahr ist)
alle
Sätze
verwenden.
D i e M a r k e n von C sollen zur Numerierung, d.h. zur eineindeutigen Benennung von Entitäten dienen.
M a n wird die sinnvolle, weil zeitsparende
K o n v e n t i o n aufstellen, daß in einem Benennungsakt die M a r k e n in der Reih e n f o l g e ihrer syntaktischen K o m p l e x i t ä t zu verwenden sind ( j e d e nur einm a l ) : zuerst die einfachste M a r k e „ m " , dann die nächstkomplexe „ m * " , dann „ m * * " usw. Diese K o n v e n t i o n m o t i v i e r t das f o l g e n d e analytische Wahrheitsgesetz f ü r das neue objektsprachliche Prädikat „ k o m m t numerisch v o r " : A3
Für alle M a r k e n μ, μ':
μ„="μ'
ist wahr genau dann, wenn μ kürzer
als μ' ist. M a n beachte, daß in A 3 ( w i e auch in A l ) objektsprachliche und metasprachliche E b e n e nicht e t w a unzulässigerweise miteinander vermischt werden; eine gewisse Beziehung zwischen markierten Entitäten wird nicht syntaktischen Beziehung zwischen Marken Kiirzer-als
e t w a m i t der
identifiziert, sondern
die syntaktische Ordnung der Marken nach ihrer L ä n g e induziert
nur g e m ä ß
A 3 v i a der eineindeutigen A b b i l d u n g zwischen ihnen und den m a r k i e r t e n E n t i t ä t e n eine O r d n u n g von diesen letzteren, die aufgrund der beschriebenen K o n v e n t i o n eine Ordnung der Numerierung ist. Jene ( s t r e n g e ) O r d n u n g läßt sich objektsprachlich durch „nicht[z][2r']nicht(x = ζ und y =
z' und 2
k o m m t numerisch vor z ' ) " ausdrücken, was wir kurz als „ χ < y " schreiben. D i e eineindeutige A b b i l d u n g zwischen Marken und markierten O b j e k t e n e r m ö g l i c h t es auch, daß syntaktische Funktionen in den Marken Funktionen
Nominalistischer Logizismus
465
in den markierten Entitäten induzieren. Folgende syntaktische Funktionen in den Marken ragen heraus: F ü r alle Marken μ, μ':
β[μ\
ist identisch mit
identisch m i t
ίί
2
μ*, β [μμ'} ist identisch mit ,,τη"(*(μ)*(μ')), /? Λ [μμ'] i
,,τη (*(μ)ο*(μ')).
β ordnet jeder Marke μ die Marke zu, deren Sternsequenz um einen Stern länger ist; ß2 ordnet beliebigen Marken μ und μ' die Marke zu, deren Sternsequenz ( * ( μ ) * ( μ ' ) ) : die Konkatenation der Sternsequenzen von μ und d.h. von *(μ) und *(μ'), ist; ßA ordnet beliebigen Marken μ und μ' die Marke mit der Sternsequenz (*(μ)ο*(μ')) zu, die wie folgt zustande kommt: ( * ( μ ) ο * ( μ ' ) ) ist die leere Sequenz, sofern *(μ) oder *(μ') die leere Sequenz ist; sonst schreibe man *(μ) so oft Zeile für Zeile untereinander, bis in der Spalte *(μ') erscheint; dann verbinde man alle Zeilen in einer Zeile.
μ',
ß, ß2 und ßA induzieren drei Funktionen in den markierten Entitäten gemäß dem folgende Wahrheitsgesetz für drei in C neueingeführte Funktionskonstanten „71", „ s " , „p": A4
F ü r alle Marken μ, μ': (die Sätze von £ , die wie folgt aufgebaut sind)
η(μ)
=
β[μ],
θ(μ,μ') =
β2[μμ'}, ρ(μ,μ') = β*[μμ'ί
sind wahr.
(Ich verwende in A4 der Übersichtlichkeit halber objektsprachliche Zeichen als ihre eigenen metasprachlichen Namen; so auch im folgenden in der Darstellung anderer objektsprachlicher Prinzipien.) Die induzierten Funktionen werden aber durch „ n " , ,,.s" und „p" noch nicht ausgedrückt; ihre objektsprachliche Formulierung macht vielmehr vom Kennzeichnungsoperator „dasjenige" Gebrauch (für den Bezug von Kennzeichnungen, deren — im Sinne der klassischen Q u a l i f i k a t i o n aufzufassende — Normalbedingung nicht erfüllt ist, sei durch eine Festlegung Sorge getragen); dabei kürze „ W „nichtfzjnicht" ab: „dasjenige y, so daß Vz(x = ζ und y = n ( ¿ ) ) " , kurz: , , n / ( i ) " ; „dasjenige u y s o daß VzVz'(x = ζ und y = ζ' und y' = s(z,z')) , kurz: „(x + ?/)"; „dasjenige y', so daß VzVz'{x = ζ und y — z' und y' = p ( z , z ' ) ) " , kurz: „(*.y)"· Was ist nun der intuitive Gehalt der neugewonnenen objektsprachlichen ii Prädikate und Funktionsausdrücke „N(x) , „x < y", , , n / ( x ) " , „(x + y ) " , u u „ ( x . y ) " ? Ich rekapituliere: „N(x) besagt, daß χ numeriert ist, „x < y besagt, daß χ vor y numeriert ist. Aufgrund der oben getroffenen Konvention bzgl. der Reihenfolge der Verwendung der Marken in einem Benennungsakt ist auch der intuitive Gehalt von „nf(x)" klar: , , n / ( x ) " bezeichnet, wenn χ numeriert ist, diejenige E n t i t ä t , unmittelbar vor der χ numeriert wird, mit anderen Worten: den unmittelbaren Nachfolger von χ in der Numerierung. Der intuitive Gehalt von „(x + y)u und „(x.y)" jedoch läßt sich auf den von , , n / ( x ) " rekursiv reduzieren. Das ersieht man aus den nachfolgend
466
Uwe Meixner
angeführten objektsprachlichen Prinzipien P4-P7, deren Wahrheit — wie die von P 0 - P 3 — aus den Wahrheitsgesetzen Al, A2 und A4 herleitbar ist: PO
Ν (μ) (für alle Marken μ)
PI
[x][y](nicht n f ( x ) = n f ( y ) oder χ — y)
P2
[x] (nicht m =
nf(x))
P3
[x](x = m oder Vy(x —
P4
[x]((x + m) = x)
P5
[x][y]{(x + n / ( y ) ) = n / ( ( x + y))}
P6
[x]((x.rn) = ra)
P7
[ x M ( x . n / ( y ) ) = ((x.j/)
nf(y)))
+
x)}
Bei der Herleitung vorausgesetzt sind neben Al, A2 und A4 die üblichen analytischen Wahrheitsgesetze für die aussagenlogischen Verknüpfungen, für Identität, für normale (klassische) Q u a l i f i k a t i o n und Kennzeichnung. (Den metasprachlichen logischen Hintergrund bildet die elementare Pädikatenlogik mit Identität, Funktionskonstanten und Kennzeichnung, plus dem Prinzip der vollständigen Induktion über Marken nach ihrer Länge.) Aufgrund des oben erwähnten analytischen Zusammenhangs zwischen normalem Allquantor und Marken-Allquantor ([x]A(x) ist wahr gdw. (x)(nicht7V(x) oder J 4 ( X ) ) wahr ist) lassen sich P 1 - P 7 auch mit den klassischen Quantoren und dem Prädikat ,,7V(x)" formulieren (das wir hier freilich schon mittels des Marken-Allquantors definiert haben). In dem seltenen Fall, daß „(x)iV(x)" wahr ist ( ,,[x]./V(x)" ist dagegen unweigerlich analytisch wahr!) koinzidieren Markenquantifikation und normale Q u a l i f i k a t i o n . (In jedem Fall haben wir aber, daß sich aus der Wahrheit von (x)A(x) analytisch die Wahrheit von [x]/4(x) ergibt, und daher aus der Wahrheit von Vxv4(x) analytisch die Wahrheit von nicht(x)nichtA(x).) Im objektsprachlichen System P 0 - P 7 (plus entsprechender Prädikatenlogik) lassen sich alle rekursiven Funktionen darstellen; andererseits ist dieses System auch wieder derart schwach, daß nicht einmal ,,[x][y]((x + y) = (y + x))" in ihm bewiesen werden kann. 1 Aufgrund der aufgestellten Wahrheitsgesetze läßt sich nun aber auch das objektsprachliche Prinzip der vollständigen Induktion P8
A(m) und [x](nicht A{x) oder A(nf(x)))
impliziert material [x]¿4(x)
als wahr erweisen. Beweis: Für „(der Satz von C) S ist wahr" schreibe ich kurz ,,W[S]"; W[P8] genau dann, wenn für alle Marken μ gilt: W[.4(m)] und W[[x](nicht A(x) ' V g l . B o o l o s , G . S . / J e f f r e y , R . S . (1987), ComputabilHy sity P r e s s , C a m b r i d g e , 158f.
and Logic, C a m b r i d g e U n i v e r -
Nominalistischer Logizismus
467
oder Λ ( η / ( χ ) ) ) ] impliziert material \Υ[/1(μ)] — gemäß Α2 und der Wahrheitsgesetze für die aussagenlogischen Satzoperatoren (die materiale Implikation sei wie üblich durch „nicht" und „oder" definiert); Induktionsbasis: W[¿(m)];
W[j4(m)] und W[[i](nicht A(x) oder A(nf(x)))]
imp. m a t .
Induktionsschritt: sei nun μ' eine Marke, die verschieden ist von „ m " , und es gelte für alle Marken μ, die kürzer sind als μ': W[,4(m)] u. W[[a:](nicht A(x) oder A(nf(x)))} imp. mat. W[,4(/¿)] (Induktionsvoraussetzung: IV); μ" sei die Marke, von der gilt β[μ"] ist identisch mit μ' (es gibt genau eine solche Marke, denn μ' ist verschieden von „m"); ang. W[v4(m)] u. W[[x](nicht A{x) oder Λ ( η / ( τ ) ) ) ] ; also gemäß IV W[4(/¿")]; gemäß A2 und der Wahrheitsgesetze für die aussagenlogischen Satzoperatoren: nicht W[i4(ft")] oder W[A(n/(/i"))]; also W[A(n/(/
Inf(p).
Daher gilt die Regel (6)
I n f ( p V